|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
Комбинирование тезаурусных и корпусных знаний для извлечения оценочных слов
Н. В. Лукашевич, И. И. Четверкин НИВЦ Московского государственного университета
им. М. В. Ломоносова
Аннотация:
Описан комбинированный подход к извлечению оценочных слов в заданной предметной области. На первом этапе упорядоченный список оценочных слов извлекается из текстов предметной области на основе методов машинного обучения. На втором этапе полученный список уточняется за счет привлечения лексических знаний, описанных в тезаурусе русского языка. Данная комбинированная модель была обучена на предметной области отзывов о фильмах, а затем была перенесена на другие предметные области. Кроме того, на основе объединения оценочных списков данных предметных областей был получен улучшенный список оценочных слов в широкой области товаров и услуг ProductSentiRus+.
Ключевые слова:
анализ тональности текстов; автоматическая обработка текстов; отзывы пользователей; тезаурус русского языка.
Поступила в редакцию: 20.01.2015
Образец цитирования:
Н. В. Лукашевич, И. И. Четверкин, “Комбинирование тезаурусных и корпусных знаний для извлечения оценочных слов”, Системы и средства информ., 25:1 (2015), 20–33
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi391 https://www.mathnet.ru/rus/ssi/v25/i1/p20
|
| Статистика просмотров: |
| Страница аннотации: | 658 | | PDF полного текста: | 223 | | Список литературы: | 128 |
|