Информатика и её применения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и её применения, 2021, том 15, выпуск 1, страницы 30–41
DOI: https://doi.org/10.14357/19922264210105
(Mi ia709)
 

Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)

Методы обнаружения переводных заимствований в больших текстовых коллекциях

Р. В. Кузнецоваa, О. Ю. Бахтеевba, Ю. В. Чеховичc

a Московский физико-технический институт
b Компания Антиплагиат
c Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук
Список литературы:
Аннотация: Рассматривается задача обнаружения переводных заимствований. Для решения предлагается использовать моноязыковой подход — свести задачу обнаружения заимствований к одному языку, используя машинный перевод. В связи со спецификой рассматриваемой задачи предлагаемый алгоритм обнаружения должен быть устойчив к неоднозначностям перевода. Предлагается декомпозировать задачу на несколько этапов. Сначала отбираются документы-кандидаты, устойчивость к неоднозначности перевода достигается за счет замены слов на метки кластеров, полученных с помощью дистрибутивной модели. Затем происходит сравнение найденных кандидатов и рассматриваемого документа, для этого используется отображение текстовых фрагментов документов в векторное пространство высокой размерности. Вычислительный эксперимент проводится для языковой пары «русский–английский» на двух выборках — синтетическом корпусе и на статьях из журналов, входящих в Российский индекс научного цитирования (РИНЦ).
Ключевые слова: автоматическая обработка текстов, машинный перевод, глубокое обучение, переводные заимствования, обнаружение переводных заимствований, дистрибутивная семантика.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 18-07-01441_а
Фонд содействия развитию малых форм предприятий в научно-технической сфере 44116
Работа выполнена при поддержке РФФИ (проект 18-07-01441) и Фонда содействия развитию малых форм предприятий в научно-технической сфере (проект 44116).
Поступила в редакцию: 19.03.2020
Тип публикации: Статья
Образец цитирования: Р. В. Кузнецова, О. Ю. Бахтеев, Ю. В. Чехович, “Методы обнаружения переводных заимствований в больших текстовых коллекциях”, Информ. и её примен., 15:1 (2021), 30–41
Цитирование в формате AMSBIB
\RBibitem{KuzBakChe21}
\by Р.~В.~Кузнецова, О.~Ю.~Бахтеев, Ю.~В.~Чехович
\paper Методы обнаружения переводных заимствований в~больших текстовых коллекциях
\jour Информ. и её примен.
\yr 2021
\vol 15
\issue 1
\pages 30--41
\mathnet{http://mi.mathnet.ru/ia709}
\crossref{https://doi.org/10.14357/19922264210105}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ia709
  • https://www.mathnet.ru/rus/ia/v15/i1/p30
  • Эта публикация цитируется в следующих 3 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и её применения
    Статистика просмотров:
    Страница аннотации:189
    PDF полного текста:109
    Список литературы:32
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024