Видеотека
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Видеотека
Архив
Популярное видео

Поиск
RSS
Новые поступления






VI Международная конференция «Суперкомпьютерные технологии математического моделирования» (СКТеММ’25)
16 июля 2025 г. 14:40–15:10, Секция 3. Вычислительные методы, машинное обучение, суперкомпьютерные технологии и их приложения, г. Москва, МИАН, ауд. 110 (ул. Губкина, 8)
 


Особенности применения машинного обучения в задаче оценки сложности текста (для русского и английского языков)

О. Ю. Гавенкоab

a Институт динамики систем и теории управления имени В.М. Матросова Сибирского отделения Российской академии наук, г. Иркутск
b Федеральный исследовательский центр информационных и вычислительных технологий

Аннотация: Оценка сложности текста традиционно рассматривается как вопрос классификации текста и может применяться в широком круге задач обработки естественного языка; в качестве классов, как правило, выступают уровни академического образования и CEFR. Использование методов машинного обучения и моделей на основе нейронных сетей позволяет эффективно анализировать большие объемы данных и учитывать различные группы признаков текста, давая, в свою очередь, возможность применения модели к текстам различных тематик, стилей и жанров. В работе представлен аналитический обзор подходов к оценке сложности текста, ключевых особенностей построения моделей для русских и английских текстов в зависимости от языковых различий, выбора алгоритмов и отбора признаков текста, а также показаны результаты проведенных авторами работы экспериментов по оценке сложности текста классическими методами машинного обучения на специфичном наборе количественных признаков.
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025