|
Интеграция электронного словаря с текстами параллельного корпуса: новый теоретический подход
Д. О. Добровольскийabc, И. М. Зацманc a Институт русского языка Российской академии наук
b Институт языкознания Российской академии наук
c Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Аннотация:
Рассматривается проблема интеграции электронного словаря с текстами параллельного корпуса в рамках лексикографической информационной системы (ЛГИС), включающей три компонента: (1) электронный многоязычный словарь; (2) корпус как хранилище параллельных текстов; (3) базу данных (БД) аннотированных переводных соответствий (АПС) и две базы знаний. Предлагаемый подход к интеграции обсуждается на примере немецко-русского словаря и представляет собой синтез ряда концептуальных положений, таких как применение принципа многоуровневой структуризации текстов словарных статей, формирование АПС для многозначных слов и устойчивых словосочетаний и их переводов, установление связей между электронным словарем и хранилищем параллельных текстов по значениям многозначных слов и устойчивых словосочетаний. До настоящего времени подобные ЛГИС создавались только для одноязычных словарей с формированием связей только по леммам. Цель статьи — описать предлагаемый подход к интеграции многоязычного электронного словаря с текстами параллельного корпуса как теоретическую основу создания ЛГИС.
Ключевые слова:
лексикографическая информационная система, параллельные тексты, электронный многоязычный словарь, корпус, база данных аннотированных переводных соответствий.
Поступила в редакцию: 14.10.2024 Принята в печать: 15.02.2025
Образец цитирования:
Д. О. Добровольский, И. М. Зацман, “Интеграция электронного словаря с текстами параллельного корпуса: новый теоретический подход”, Системы и средства информ., 35:1 (2025), 111–124
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi967 https://www.mathnet.ru/rus/ssi/v35/i1/p111
|
Статистика просмотров: |
Страница аннотации: | 38 | PDF полного текста: | 15 | Список литературы: | 7 |
|