RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информ. и её примен., 2017, том 11, выпуск 4, страницы 118–125 (Mi ia509)  

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Approaches to annotation of discourse relations in linguistic corpora

[Подходы к аннотации дискурсивных отношений в лингвистических корпусах]

M. G. Kruzhkov

Institute of Informatics Problems, Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation

Аннотация: Рассматривается надкорпусная база данных (НБД), разработанная на основе корпуса параллельных текстов для описания русских коннекторов и их переводов на французский и другие языки. В рамках данной НБД аннотируется внутренняя структура и семантика коннекторов русского языка, а также их переводных соответствий на других языках. Описание семантики коннекторов подразумевает описание соответствующих дискурсивных отношений между соединяемыми ими фрагментами текста. Используемый в НБД подход к описанию дискурсивных выражений, передаваемых коннекторами, сравнивается с новейшими существующими подходами к аннотации дискурсивных отношений: рассматривается аннотированный корпус дискурсивных отношений Penn Discourse Treebank (PDTB) и проект стандарта по аннотации дискурсивных отношений ISO 24617-8. Отмечается, что PDTB и ISO 24617-8, в отличие от НБД, позволяют аннотировать как эксплицитные (выраженные коннекторами и другими языковыми единицами), так и имплицитные дискурсивные отношения. Кроме этого, в рамках данных подходов имеется возможность аннотировать аргументы дискурсивных отношений, включая их источники, типы и роли (для ассиметричных отношений). С другой стороны, преимущество НБД состоит в том, что она позволяет одновременно аннотировать коннекторы и их переводные соответствия в параллельных корпусах, что открывает для исследователей новые возможности в области лингвистического контрастивного анализа. В то время как в рамках других подходов для аннотации дискурсивных коннекторов используется формат XML, НБД представляет собой реляционную базу данных, что повышает эффективность системы при работе с кросслингвистическими объектами и доступность для пользователей. Также рассматривается теоретическая и практическая значимость семантической аннотации коннекторов и выражаемых ими дискурсивных отношений.

Ключевые слова: дискурсивные отношения; коннекторы; корпусная лингвистика; параллельные корпуса; надкорпусные базы данных.

Финансовая поддержка Номер гранта
Российский научный фонд 16-18-10004
Работа выполнена в Институте проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук при финансовой поддержке РНФ (проект № 16-18-10004).


DOI: https://doi.org/10.14357/19922264170415

Полный текст: PDF файл (549 kB)
Список литературы: PDF файл   HTML файл

Реферативные базы данных:

Тип публикации: Статья
Поступила в редакцию: 07.09.2017
Язык публикации: английский

Образец цитирования: M. G. Kruzhkov, “Approaches to annotation of discourse relations in linguistic corpora”, Информ. и её примен., 11:4 (2017), 118–125

Цитирование в формате AMSBIB
\RBibitem{Kru17}
\by M.~G.~Kruzhkov
\paper Approaches to annotation of discourse relations in linguistic corpora
\jour Информ. и её примен.
\yr 2017
\vol 11
\issue 4
\pages 118--125
\mathnet{http://mi.mathnet.ru/ia509}
\crossref{https://doi.org/10.14357/19922264170415}
\elib{http://elibrary.ru/item.asp?id=30794549}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/ia509
  • http://mi.mathnet.ru/rus/ia/v11/i4/p118

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles

    Эта публикация цитируется в следующих статьяx:
    1. И. М. Зацман, “Стадии целенаправленного извлечения знаний, имплицированных в параллельных текстах”, Системы и средства информ., 28:3 (2018), 175–188  mathnet  crossref  elib
    2. И. М. Зацман, “Целенаправленное развитие систем лингвистических знаний: выявление и заполнение лакун”, Информ. и её примен., 13:1 (2019), 91–98  mathnet  crossref  elib
  • Информатика и её применения
    Просмотров:
    Эта страница:111
    Полный текст:45
    Литература:8
     
    Обратная связь:
     Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2019