|
Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)
Использование синтетических данных для тонкой настройки моделей сегментации документов
О. В. Беляеваa, А. И. Перминовb, И. С. Козловa a Институт системного программирования им. В.П. Иванникова РАН
b Московский государственный университет имени М.В. Ломоносова
Аннотация:
В рамках задачи автоматического анализа документов мы решаем задачу сегментации изображений документов DLA (Document Layout Analysis). Целью работы является сегментация изображений документов в условиях ограниченного набора реальных данных и использование для обучения искусственно созданных данных. В качестве данных рассматривается PDF-документы сканированных договоров, коммерческих предложений и технических заданий без текстового слоя. В работе мы обучаем известную высокоуровневую модель FasterRCNN сегментировать текстовые блоки, таблицы, печати и подписи на изображениях рассматриваемых данных. Работа направлена на генерацию синтетических данных схожих с реальными. Это обусловлено потребностью модели в большом наборе данных для обучения и высокой трудозатратностью их подготовки. В работе приведено описание этапа постобработки для устранения артефактов, полученных в результате сегментации. В работе приводится тестирование и сравнение качества модели, обученной на разных наборах данных (с/без синтетических данных, малом/большом наборе реальных данных, с/без этапа постобработки). В итоге мы показываем, что генерация синтетических данных и использование постобработки увеличивает качество модели при малом обучающем наборе реальных данных.
Ключевые слова:
анализ физической структуры документа, сегментация документа, анализ макета документа, обнаружение объектов на изображении, тонкая настройка модели, активное обучение.
Образец цитирования:
О. В. Беляева, А. И. Перминов, И. С. Козлов, “Использование синтетических данных для тонкой настройки моделей сегментации документов”, Труды ИСП РАН, 32:4 (2020), 189–202
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp534 https://www.mathnet.ru/rus/tisp/v32/i4/p189
|
|