|
|
Записки научных семинаров ПОМИ, 2024, том 540, страницы 61–81
(Mi znsl7544)
|
|
|
|
Exploring the effectiveness of methods for persona extraction
[Эффективность методов извлечения персон]
K. Zaitsev Higher School of Economics, Moscow, Russia
Аннотация:
В работе представлен анализ методов извлечения информации о участниках диалога и оценка их производительности на русском языке. Для обучения моделей для данной задачи набор данных Multi-Session Chat был переведен на русский язык с использованием нескольких моделей перевода, что привело к улучшению качества данных. Представлена метрика, основанная на концепции F-меры, для оценки эффективности моделей извлечения. Метрика использует обученный классификатор для определения участника диалога, которому принадлежит персона. Эксперименты проводились на моделях MBart, FRED-T5, Starling-7B, основанной на Mistral, и моделях Encoder2Encoder. Результаты показали, что все модели продемонстрировали недостаточный уровень полноты в задаче извлечения персон. Включение функции NCE Loss улучшило точность модели за счет уменьшения полноты. Кроме того, увеличение размера модели привело к улучшению извлечения персон. Библ. – 31 назв.
Ключевые слова:
извлечение персон, диалоговые датасеты, seq2seq модели, датасет машинного перевода, сопоставление персон.
Поступило: 15.11.2024
Образец цитирования:
K. Zaitsev, “Exploring the effectiveness of methods for persona extraction”, Исследования по прикладной математике и информатике. IV, Зап. научн. сем. ПОМИ, 540, ПОМИ, СПб., 2024, 61–81
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/znsl7544 https://www.mathnet.ru/rus/znsl/v540/p61
|
| Статистика просмотров: |
| Страница аннотации: | 90 | | PDF полного текста: | 34 | | Список литературы: | 42 |
|