Записки научных семинаров ПОМИ
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Зап. научн. сем. ПОМИ:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Записки научных семинаров ПОМИ, 2024, том 540, страницы 252–275 (Mi znsl7554)  

Применение синтаксических парсеров для турецкого языка в задаче разметки кыргызских синтаксических корпусов

А. Алексеевabcd, А. Тиллабаеваe, Г. Дж. Кабаеваb, С. И. Николенкоaf

a Санкт-Петербургское отделение Математического института им. В. А. Стеклова РАН, 191023, наб.р. Фонтанки, 27, Санкт-Петербург, Россия
b КГТУ им. И. Раззакова, 720044, пр. Ч. Айтматова, 66, Бишкек, Кыргызстан (Киргизия)
c КФУ, Хим. институт им. А.М. Бутлерова, 420008, ул. Кремлёвская, 18, Казань, РТ, Россия
d СПбГУ, Факультет МКН, 199178, 14-ая линия ВО, 29, Санкт-Петербург, Россия
e Бишкек, Кыргызстан (Киргизия)
f Университет ИТМО, Санкт-Петербург, Россия
Список литературы:
Аннотация: Кыргызский (киргизский) язык, как один из малоресурсных, требует значительных усилий для создания качественных синтаксических корпусов. В данной работе предложен вариант подхода, упрощающего процесс разработки синтаксического корпуса для кыргызского языка. В настоящей работе представлен инструмент для переноса синтаксической разметки с турецкого языка на кыргызский, основанный на методе машинного перевода трибанков. Эффективность предложенного инструмента была оценена с использованием трибанка TueCL. Результаты исследования показывают, что данный подход обеспечивает более высокую точность синтаксической разметки по сравнению с моноязычной моделью, обученной на кыргызском трибанке KTMU. Кроме того, в работе предлагается метод оценки сложности ручного аннотирования полученных синтаксических деревьев. Библ. – 45 назв.
Ключевые слова: грамматика зависимостей, обработка естественного языка, языки с малым количеством ресурсов, машинный перевод, обработка кыргызского языка.
Финансовая поддержка Номер гранта
Российский научный фонд 22-11-00135
Работа была поддержана грантом Российского Научного Фонда #22-11-00135, «Исследование и разработка технологий обработки и анализа мультимодальных неструктурированных данных из различных источников и их применимости для решения экономических и социальных задач».
Поступило: 15.11.2024
Тип публикации: Статья
Образец цитирования: А. Алексеев, А. Тиллабаева, Г. Дж. Кабаева, С. И. Николенко, “Применение синтаксических парсеров для турецкого языка в задаче разметки кыргызских синтаксических корпусов”, Исследования по прикладной математике и информатике. IV, Зап. научн. сем. ПОМИ, 540, ПОМИ, СПб., 2024, 252–275
Цитирование в формате AMSBIB
\RBibitem{AleTilKab24}
\by А.~Алексеев, А.~Тиллабаева, Г.~Дж.~Кабаева, С.~И.~Николенко
\paper Применение синтаксических парсеров для~турецкого языка в~задаче разметки кыргызских синтаксических корпусов
\inbook Исследования по прикладной математике и информатике.~IV
\serial Зап. научн. сем. ПОМИ
\yr 2024
\vol 540
\pages 252--275
\publ ПОМИ
\publaddr СПб.
\mathnet{http://mi.mathnet.ru/znsl7554}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/znsl7554
  • https://www.mathnet.ru/rus/znsl/v540/p252
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Записки научных семинаров ПОМИ
    Статистика просмотров:
    Страница аннотации:218
    PDF полного текста:68
    Список литературы:61
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2026