RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Системы и средства информ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Системы и средства информ., 2018, том 28, выпуск 4, страницы 168–181 (Mi ssi616)  

Метод описания структуры неоднословных коннекторов в надкорпусных базах данных

О. Ю. Инькова, М. Г. Кружков

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Представлен новый информационно-компьютерный метод описания структуры неоднословных коннекторов, реализованный в рамках Надкорпусной базы данных (НБД) коннекторов. На сегодняшний день структура коннекторов мало изучена, отсутствуют критерии для определения линейных границ коннекторов и их компонентов. В основе предлагаемого метода лежит когнитивно-семантический подход, при котором неоднословные коннекторы считаются более или менее свободными сочетаниями. При аннотировании коннекторов предлагается использовать двухуровневую фасетную классификацию, где аннотированию подлежат, с одной стороны, употребления коннекторов в тексте (контекстное аннотирование), с другой стороны — собственно внутренняя структура коннекторов (структурное аннотирование). Структурное аннотирование осуществляется по двум основаниям: определяются структурный тип и структурные составляющие коннекторов. Предлагаемая схема аннотации позволяет реализовать систему «перекрестных» кластеров, значительно расширяющую поисковые и статистические возможности НБД коннекторов. Кроме того, данный метод позволяет избегать субъективности при аннотировании неоднословных коннекторов в электронных лингвистических корпусах и заполнять лакуны в лингвистических знаниях: например, получать новые данные о сочетаемостных возможностях коннекторов русского языка.

Ключевые слова: надкорпусные базы данных, компьютерная обработка естественного языка, коннекторы, структура языковых единиц, вариативность языковых единиц, корпусная лингвистика, аннотирование, фасетная классификация.

Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 16-06-00070_а
Работа выполнена при финансовой поддержке РФФИ (проект 16-06-00070).


DOI: https://doi.org/10.14357/08696527180416

Полный текст: PDF файл (771 kB)
Список литературы: PDF файл   HTML файл

Реферативные базы данных:

Тип публикации: Статья
Поступила в редакцию: 05.09.2018

Образец цитирования: О. Ю. Инькова, М. Г. Кружков, “Метод описания структуры неоднословных коннекторов в надкорпусных базах данных”, Системы и средства информ., 28:4 (2018), 168–181

Цитирование в формате AMSBIB
\RBibitem{InkKru18}
\by О.~Ю.~Инькова, М.~Г.~Кружков
\paper Метод описания структуры неоднословных коннекторов в~надкорпусных базах данных
\jour Системы и средства информ.
\yr 2018
\vol 28
\issue 4
\pages 168--181
\mathnet{http://mi.mathnet.ru/ssi616}
\crossref{https://doi.org/10.14357/08696527180416}
\elib{http://elibrary.ru/item.asp?id=36511795}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/ssi616
  • http://mi.mathnet.ru/rus/ssi/v28/i4/p168

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles
  • Системы и средства информатики
    Просмотров:
    Эта страница:67
    Полный текст:18
    Литература:11
     
    Обратная связь:
     Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2020