|
|
VI Международная конференция «Суперкомпьютерные технологии математического моделирования» (СКТеММ’25)
16 июля 2025 г. 14:40–15:10, Секция 3. Вычислительные методы, машинное обучение, суперкомпьютерные технологии и их приложения, г. Москва, МИАН, ауд. 110 (ул. Губкина, 8)
|
|
|
|
|
|
|
Особенности применения машинного обучения в задаче оценки сложности текста (для русского и английского языков)
О. Ю. Гавенкоab a Институт динамики систем и теории управления имени В.М. Матросова Сибирского отделения Российской академии наук, г. Иркутск
b Федеральный исследовательский центр информационных и вычислительных технологий
|
|
Аннотация:
Оценка сложности текста традиционно рассматривается как вопрос классификации текста и может применяться в широком круге задач обработки естественного языка; в качестве
классов, как правило, выступают уровни академического образования и CEFR. Использование методов машинного обучения и моделей на основе нейронных сетей позволяет эффективно анализировать большие объемы данных и учитывать различные группы признаков текста, давая, в свою очередь, возможность применения модели к текстам различных тематик,
стилей и жанров. В работе представлен аналитический обзор подходов к оценке сложности
текста, ключевых особенностей построения моделей для русских и английских текстов в зависимости от языковых различий, выбора алгоритмов и отбора признаков текста, а также
показаны результаты проведенных авторами работы экспериментов по оценке сложности текста классическими методами машинного обучения на специфичном наборе количественных
признаков.
|
|