|
Моделирование вычислительных, телекоммуникационных, управляющих и социально-экономических систем
Разработка и исследование моделей многоклассовых классификаторов для рекомендательной системы подготовки заявок на портале единой информационной системы в сфере закупок
Я. А. Селиверстовa, А. А. Комиссаровb, А. А. Лесоводскаяb, П. Г. Бовыкинb, А. В. Подтиховb, С. С. Торсионовb, Д. А. Цирковb, С. А. Орловc a Институт проблем транспорта им. Н.С. Соломенко Российской академии наук
b Университет Национальной технологической инициативы 2035, Москва
c Национальный исследовательский Томский государственный университет
Аннотация:
Обоснована актуальность разработки сервисов, способствующих подготовке тендерной документации, в части определения кода ОКПД 2 к формируемой заявке. Для решения задачи автоматической классификации заявок в соответствии с ОКПД 2 разработан алгоритм системы сравнительного анализа моделей классификаторов, осуществлена предобработка и запись в базу данных собранной информации в формате json. Разметка и подготовка данных для обучения моделей классификаторов осуществлена в среде PolyAnalyst. В качестве моделей многоклассовых классификаторов из библиотеки Scikit-Learn выбраны наивный байесовский классификатор, SVM-классификатор и классификатор на основе случайного леса. В качестве векторизаторов выбрана модель tfidf и word-haching. В качестве четвертого классификатора выбрана нейросетевая модель ruBert-base. Проведено обучение классификаторов и оценено качество их работы. По результатам валидации и тестирования лучшими оказались две модели: ruBert-base и модель наивного байесовского классификатора с векторизатором word-hashing. На основе результатов произведена тестовая классификация заявок.
Ключевые слова:
рекомендательные системы, многоклассовая классификация, SVM, naive Bayes, ruBert-base, векторизаторы.
Поступила в редакцию: 25.08.2022
Образец цитирования:
Я. А. Селиверстов, А. А. Комиссаров, А. А. Лесоводская, П. Г. Бовыкин, А. В. Подтихов, С. С. Торсионов, Д. А. Цирков, С. А. Орлов, “Разработка и исследование моделей многоклассовых классификаторов для рекомендательной системы подготовки заявок на портале единой информационной системы в сфере закупок”, Информатика, телекоммуникации и управление, 15:2 (2022), 43–62
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ntitu315 https://www.mathnet.ru/rus/ntitu/v15/i2/p43
|
Статистика просмотров: |
Страница аннотации: | 99 | PDF полного текста: | 88 |
|