RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Модел. и анализ информ. систем, 2018, том 25, номер 4, страницы 435–458 (Mi mais640)  

Тезаурусы

Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке

Н. С. Лагутина, К. В. Лагутина, А. С. Адрианов, И. В. Парамонов

Ярославский государственный университет им. П.Г. Демидова, ул. Советская, 14, г. Ярославль, 150003 Россия

Аннотация: В работе выполнен обзор существующих электронных русскоязычных тезаурусов и методов их автоматического построения и применения. Авторы провели анализ основных характеристик тезаурусов, находящихся в открытом доступе, для научных исследований, оценили динамику их развития и эффективность в решении задач по обработке естественного языка. Были исследованы статистические и лингвистические методы построения тезаурусов, которые позволяют автоматизировать разработку и уменьшить затраты на труд экспертов-лингвистов. В частности, рассматривались алгоритмы выделения ключевых терминов из текстов и семантических тезаурусных связей всех типов, а также качество применения получившихся в результате их работы тезаурусов. Для наглядной иллюстрации особенностей различных методов построения тезаурусных связей был разработан комбинированный метод, генерирующий специализированный тезаурус полностью автоматически на основе корпуса текстов предметной области и нескольких существующих лингвистических ресурсов. С использованием предложенного метода были проведены эксперименты с русскоязычными корпусами текстов из двух предметных областей: статьи о мигрантах и твиты. Для анализа полученных тезаурусов использовалась комплексная оценка, разработанная авторами в предыдущем исследовании, которая позволяет определить различные аспекты тезауруса и качество методов его генерации. Проведённый анализ выявил основные достоинства и недостатки различных подходов к построению тезаурусов и выделению семантических связей различных типов, а также позволил определить потенциальные направления будущих исследований.

Ключевые слова: тезаурус, семантические отношения, автоматическое построение тезауруса, автоматическое выделение связей, выделение ключевых слов.

DOI: https://doi.org/10.18255/1818-1015-2018-4-435-458

Полный текст: PDF файл (637 kB)
Список литературы: PDF файл   HTML файл

Реферативные базы данных:

Тип публикации: Статья
УДК: 004.912
Поступила в редакцию: 01.08.2018

Образец цитирования: Н. С. Лагутина, К. В. Лагутина, А. С. Адрианов, И. В. Парамонов, “Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке”, Модел. и анализ информ. систем, 25:4 (2018), 435–458

Цитирование в формате AMSBIB
\RBibitem{LagLagAdr18}
\by Н.~С.~Лагутина, К.~В.~Лагутина, А.~С.~Адрианов, И.~В.~Парамонов
\paper Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке
\jour Модел. и анализ информ. систем
\yr 2018
\vol 25
\issue 4
\pages 435--458
\mathnet{http://mi.mathnet.ru/mais640}
\crossref{https://doi.org/10.18255/1818-1015-2018-4-435-458}
\elib{http://elibrary.ru/item.asp?id=35452930}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/mais640
  • http://mi.mathnet.ru/rus/mais/v25/i4/p435

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles
  • Моделирование и анализ информационных систем
    Просмотров:
    Эта страница:128
    Полный текст:310
    Литература:13
     
    Обратная связь:
     Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2019