RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ЛИЧНЫЙ КАБИНЕТ
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Модел. и анализ информ. систем, 2018, том 25, номер 6, страницы 726–733 (Mi mais659)  

Тезаурусы

Векторное представление слов с семантическими отношениями: экспериментальные наблюдения

М. С. Каряеваa, П. И. Браславскийb, В. А. Соколовa

a Ярославский государственный университет им. П.Г. Демидова, ул. Советская, 14, г. Ярославль, 150003 Россия
b Уральский федеральный университет, г. Екатеринбург, ул. Мира, 19, 620002 Россия

Аннотация: Возможность идентификации семантической близости между словами сделала модель word2vec широко используемой в NLP-задачах. Идея word2vec основана на контекстной близости слов. Каждое слово может быть представлено в виде вектора, близкие координаты векторов могут быть интерпретированы как близкие по смыслу слова. Таким образом, извлечение семантических отношений (отношение синонимии, родо-видовые отношения и другие) может быть автоматизировано. Установление семантических отношений вручную считается трудоемкой и необъективной задачей, требующей большого количества времени и привлечения экспертов. Но среди ассоциативных слов, сформированных с использованием модели word2vec, встречаются слова, не представляющие никаких отношений с главным словом, для которого был представлен ассоциативный ряд. В работе рассматриваются дополнительные критерии, которые могут быть применимы для решения данной проблемы. Наблюдения и проведенные эксперименты с общеизвестными характеристиками, такими как частота слов, позиция в ассоциативном ряду, могут быть использованы для улучшения результатов при работе с векторным представлением слов в части определения семантических отношений для русского языка. В экспериментах используется обученная на корпусах Флибусты модель word2vec и размеченные данные Викисловаря в качестве образцовых примеров, в которых отражены семантические отношения. Семантически связанные слова (или термины) нашли свое применение в тезаурусах, онтологиях, интеллектуальных системах для обработки естественного языка.

Ключевые слова: векторное представление слов, word2vec, семантические отношения, тезаурус, гипонимы, гиперонимы, синонимы.

Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 16-07-01180_а
16-06-00497_а
Исследование выполнено при финансовой поддержке РФФИ в рамках научных проектов №16-07-01180 и №16-06-00497.


DOI: https://doi.org/10.18255/1818-1015-726-733

Полный текст: PDF файл (668 kB)
Список литературы: PDF файл   HTML файл

Тип публикации: Статья
УДК: 004.912
Поступила в редакцию: 01.09.2018
Исправленный вариант: 20.11.2018
Принята в печать:25.11.2018

Образец цитирования: М. С. Каряева, П. И. Браславский, В. А. Соколов, “Векторное представление слов с семантическими отношениями: экспериментальные наблюдения”, Модел. и анализ информ. систем, 25:6 (2018), 726–733

Цитирование в формате AMSBIB
\RBibitem{KarBraSok18}
\by М.~С.~Каряева, П.~И.~Браславский, В.~А.~Соколов
\paper Векторное представление слов с семантическими отношениями: экспериментальные наблюдения
\jour Модел. и анализ информ. систем
\yr 2018
\vol 25
\issue 6
\pages 726--733
\mathnet{http://mi.mathnet.ru/mais659}
\crossref{https://doi.org/10.18255/1818-1015-726-733}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/mais659
  • http://mi.mathnet.ru/rus/mais/v25/i6/p726

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles
  • Моделирование и анализ информационных систем
    Просмотров:
    Эта страница:26
    Полный текст:10
    Литература:3

     
    Обратная связь:
     Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2019