Вестник Южно-Уральского государственного университета. Серия «Математика. Механика. Физика»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. Южно-Ур. ун-та. Сер. Матем. Мех. Физ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Южно-Уральского государственного университета. Серия «Математика. Механика. Физика», 2018, том 10, выпуск 3, страницы 59–66
DOI: https://doi.org/10.14529/mmph180307
(Mi vyurm384)
 

Математика

Methods of speech and text databases development for QA-systems
[Методы создания речевых и текстовых баз данных вопросно-ответных систем]

A. L. Ronzhin, A. A. Zaytseva, S. V. Kuleshov, K. V. Nenausnikov

Saint-Petersburg Institute for Informatics and Automation of Russian Academy of Science, Saint-Petersburg, Russian Federation
Список литературы:
Аннотация: Работа посвящена проблемам построения речевых вопросно-ответных систем (QA-систем). Предметом исследования являются подходы к автоматическому наполнению базы данных вопросно-ответной системы путем анализа неструктурированных текстовых источников, имеющихся в настоящий момент времени в открытом доступе в сети Интернет.
В результате анализа выявлено, что выделяют следующие способы реализации QA-систем: на основе логического вывода по онтологиям, правилам и на основе синтаксиса, с использованием искусственных нейронных сетей.
В исследовании разработаны и протестированы методы автоматического выделения вопросно-ответных пар на основе структуры предложений и на основе ассоциативно-онтологического анализа.
Метод на основе анализа структуры предложений эффективен для текстов типа списков часто задаваемых вопросов (FAQ), а также художественных текстов, содержащих диалоги, прямую речь, основан на предварительной обработке текста, выраженный в виде эвристического правила.
Метод на основе ассоциативно-онтологического анализа ориентирован на класс справочных и словарных текстов и основан на предположении о том, что в тексте описательного характера имеется предложение (или группа предложений), содержащее основную мысль текста. В этом случае заголовок текста может считаться вопросом, а это предложение (или группа предложений) — ответом. Для автоматизации выделения смыслообразующих предложений за счет семантической редукции текста применяются алгоритмы реферирования на основе ассоциативно-онтологического подхода к обработке текстов на естественном языке.
Для экспериментальной проверки возможности создания открытой вопросно-ответной системы на базе автоматического сбора вопросно-ответных пар из сети Интернет был разработан прототип модуля сбора базы данных вопросно-ответной системы.
Ключевые слова: вопросно-ответная пара, ассоциативно-онтологический подход, текст на естественном языке, автоматическая обработка текста, распознавание речи.
Поступила в редакцию: 16.05.2018
Реферативные базы данных:
Тип публикации: Статья
УДК: 51-7, 004.89
Язык публикации: английский
Образец цитирования: A. L. Ronzhin, A. A. Zaytseva, S. V. Kuleshov, K. V. Nenausnikov, “Methods of speech and text databases development for QA-systems”, Вестн. Южно-Ур. ун-та. Сер. Матем. Мех. Физ., 10:3 (2018), 59–66
Цитирование в формате AMSBIB
\RBibitem{RonZayKul18}
\by A.~L.~Ronzhin, A.~A.~Zaytseva, S.~V.~Kuleshov, K.~V.~Nenausnikov
\paper Methods of speech and text databases development for QA-systems
\jour Вестн. Южно-Ур. ун-та. Сер. Матем. Мех. Физ.
\yr 2018
\vol 10
\issue 3
\pages 59--66
\mathnet{http://mi.mathnet.ru/vyurm384}
\crossref{https://doi.org/10.14529/mmph180307}
\elib{https://elibrary.ru/item.asp?id=35234077}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vyurm384
  • https://www.mathnet.ru/rus/vyurm/v10/i3/p59
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Статистика просмотров:
    Страница аннотации:167
    PDF полного текста:122
    Список литературы:36
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024