Искусственный интеллект и принятие решений
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Искусственный интеллект и принятие решений, 2023, выпуск 4, страницы 103–114
DOI: https://doi.org/10.14357/20718594230410
(Mi iipr52)
 

Анализ текстовой и графической информации

Автоматическая классификация русскоязычных Интернет-текстов по жанрам

К. В. Лагутинаa, Е. И. Бойчукb, Н. С. Лагутинаa

a Ярославский государственный университет им. П. Г. Демидова, Ярославль, Россия
b Ярославский государственный педагогический университет им. К. Д. Ушинского, Ярославль, Россия
Аннотация: Статья посвящена применению современных языковых моделей на основе BERT и трех типов лингвистических характеристик текста для автоматического определения жанра, а также сравнительному анализу данных моделей с точки зрения компьютерной и классической лингвистики. Собран корпус из русскоязычных Интернет-текстов восьми жанров: посты ВКонтакте, комментарии, статьи с портала Хабр, описания компаний, новости, научные статьи, реклама, отзывы на фильмы с сайта Кинопоиск. Каждый текст представлен в виде вектора числовых характеристик с помощью каждой из выбранных моделей: пяти вариаций BERT и лингвистических характеристик уровней символов, структуры и ритма.
Ключевые слова: стилометрия, обработка естественного языка, ритмические характеристики, жанры, классификация текстов, BERT.
Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации СП-2109.2021.5
Работа поддержана стипендией Президента Российской Федерации для молодых ученых и аспирантов, осуществляющих перспективные научные исследования и разработки по приоритетным направлениям модернизации российской экономики: № СП-2109.2021.5.
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: К. В. Лагутина, Е. И. Бойчук, Н. С. Лагутина, “Автоматическая классификация русскоязычных Интернет-текстов по жанрам”, Искусственный интеллект и принятие решений, 2023, № 4, 103–114
Цитирование в формате AMSBIB
\RBibitem{LagBoyLag23}
\by К.~В.~Лагутина, Е.~И.~Бойчук, Н.~С.~Лагутина
\paper Автоматическая классификация русскоязычных Интернет-текстов по жанрам
\jour Искусственный интеллект и принятие решений
\yr 2023
\issue 4
\pages 103--114
\mathnet{http://mi.mathnet.ru/iipr52}
\crossref{https://doi.org/10.14357/20718594230410}
\elib{https://elibrary.ru/item.asp?id=56928433}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/iipr52
  • https://www.mathnet.ru/rus/iipr/y2023/i4/p103
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Искусственный интеллект и принятие решений
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025