|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Использование доменно-состязательного обучения для распознавания текстовых капч
Д. О. Кущукa, М. А. Рындинb, А. К. Яцковb, М. И. Варламовb a Московский физико-технический институт
b Институт системного программирования им. В.П. Иванникова РАН
Аннотация:
Несмотря на появление более продвинутых вариантов публичных тестов Тьюринга, в настоящее время текстовая капча является достаточно распространённой, поэтому создание методов ее автоматического решения актуальны и сегодня. Современные алгоритмы успешно справляются с этой задачей, однако, обладают рядом ограничений, таких как: неспособность работать с изменяющейся длиной текста на изображении, медленное и сложное обучение. В данной работе представлен алгоритм атак на текстовые капчи, не требующий априорного знания длины текста на изображении. Экспериментально показано, что использование данного алгоритма совместно с методом состязательного обучения позволяет добиваться высокого качества на реальных данных, используя 200-500 размеченных примеров для обучения. Экспериментальное сравнение разработанного метода с современными аналогами показало, что при использовании одинакового числа реальных примеров для обучения наш алгоритм показывает сравнимое или более высокое качество, при этом он имеет более высокую скорость работы и обучения.
Ключевые слова:
машинное обучение, решение капчи, OCR, состязательное обучение.
Образец цитирования:
Д. О. Кущук, М. А. Рындин, А. К. Яцков, М. И. Варламов, “Использование доменно-состязательного обучения для распознавания текстовых капч”, Труды ИСП РАН, 32:4 (2020), 203–216
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp535 https://www.mathnet.ru/rus/tisp/v32/i4/p203
|
Статистика просмотров: |
Страница аннотации: | 82 | PDF полного текста: | 31 | Список литературы: | 22 |
|