Информатика, телекоммуникации и управление
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика, телекоммуникации и управление:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика, телекоммуникации и управление, 2022, том 15, выпуск 2, страницы 43–62
DOI: https://doi.org/10.18721/JCSTCS.15204
(Mi ntitu315)
 

Моделирование вычислительных, телекоммуникационных, управляющих и социально-экономических систем

Разработка и исследование моделей многоклассовых классификаторов для рекомендательной системы подготовки заявок на портале единой информационной системы в сфере закупок

Я. А. Селиверстовa, А. А. Комиссаровb, А. А. Лесоводскаяb, П. Г. Бовыкинb, А. В. Подтиховb, С. С. Торсионовb, Д. А. Цирковb, С. А. Орловc

a Институт проблем транспорта им. Н.С. Соломенко Российской академии наук
b Университет Национальной технологической инициативы 2035, Москва
c Национальный исследовательский Томский государственный университет
Аннотация: Обоснована актуальность разработки сервисов, способствующих подготовке тендерной документации, в части определения кода ОКПД 2 к формируемой заявке. Для решения задачи автоматической классификации заявок в соответствии с ОКПД 2 разработан алгоритм системы сравнительного анализа моделей классификаторов, осуществлена предобработка и запись в базу данных собранной информации в формате json. Разметка и подготовка данных для обучения моделей классификаторов осуществлена в среде PolyAnalyst. В качестве моделей многоклассовых классификаторов из библиотеки Scikit-Learn выбраны наивный байесовский классификатор, SVM-классификатор и классификатор на основе случайного леса. В качестве векторизаторов выбрана модель tfidf и word-haching. В качестве четвертого классификатора выбрана нейросетевая модель ruBert-base. Проведено обучение классификаторов и оценено качество их работы. По результатам валидации и тестирования лучшими оказались две модели: ruBert-base и модель наивного байесовского классификатора с векторизатором word-hashing. На основе результатов произведена тестовая классификация заявок.
Ключевые слова: рекомендательные системы, многоклассовая классификация, SVM, naive Bayes, ruBert-base, векторизаторы.
Поступила в редакцию: 25.08.2022
Тип публикации: Статья
УДК: 004.912, 004.85, 004.41
Образец цитирования: Я. А. Селиверстов, А. А. Комиссаров, А. А. Лесоводская, П. Г. Бовыкин, А. В. Подтихов, С. С. Торсионов, Д. А. Цирков, С. А. Орлов, “Разработка и исследование моделей многоклассовых классификаторов для рекомендательной системы подготовки заявок на портале единой информационной системы в сфере закупок”, Информатика, телекоммуникации и управление, 15:2 (2022), 43–62
Цитирование в формате AMSBIB
\RBibitem{SelKomLes22}
\by Я.~А.~Селиверстов, А.~А.~Комиссаров, А.~А.~Лесоводская, П.~Г.~Бовыкин, А.~В.~Подтихов, С.~С.~Торсионов, Д.~А.~Цирков, С.~А.~Орлов
\paper Разработка и исследование моделей многоклассовых классификаторов для рекомендательной системы подготовки заявок на портале единой информационной системы в сфере закупок
\jour Информатика, телекоммуникации и управление
\yr 2022
\vol 15
\issue 2
\pages 43--62
\mathnet{http://mi.mathnet.ru/ntitu315}
\crossref{https://doi.org/10.18721/JCSTCS.15204}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ntitu315
  • https://www.mathnet.ru/rus/ntitu/v15/i2/p43
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика, телекоммуникации и управление
    Статистика просмотров:
    Страница аннотации:99
    PDF полного текста:88
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025