|
|
Тр. СПИИРАН, 2007, выпуск 4, страницы 388–404
(Mi trspy292)
|
|
|
|
Двухуровневый морфофонемный префиксный граф для декодирования русской слитной речи
А. Л. Ронжинa, Ан.Б. Леонтьева, И.А. Кагиров, Ал.Б. Леонтьева a Санкт-Петербургский институт информатики и автоматизации РАН
Аннотация:
Описан новый способ компактного хранения словаря слов и их транскрипций в виде фонемного графа, учитывающего дифференциальные морфологические признаки слов. Сокращение словаря особенно актуально для флективных языков, где богатая морфология сильно затрудняет анализ текста и речи. Для повышения производительности декодера русской речи с большим словарем предлагается использовать двухуровневый морфофонемный префиксный граф. Выделение одинаковых основ и окончаний в различных словах существенно сокращает пространство поиска гипотез распознавания. Использованная статистическая модель языка учитывает встречаемость комбинаций основ, а не целых слов, что уменьшает сложность декодирования слитной речи и требует для обучения значительно меньшего объема текстовых ресурсов. По сравнению с базовыми моделями фонетического представления словаря сложность топологии предложенного графа оказалась в 17 раз меньше.
УДК:
681.3
Образец цитирования:
А. Л. Ронжин, Ан.Б. Леонтьева, И.А. Кагиров, Ал.Б. Леонтьева, “Двухуровневый морфофонемный префиксный граф для декодирования русской слитной речи”, Тр. СПИИРАН, 4 (2007), 388–404
Цитирование в формате AMSBIB:
\RBibitem{Ron07}
\by А.~Л.~Ронжин, Ан.Б.~Леонтьева, И.А.~Кагиров, Ал.Б.~Леонтьева
\paper Двухуровневый морфофонемный префиксный граф для декодирования русской слитной речи
\jour Тр. СПИИРАН
\yr 2007
\vol 4
\pages 388--404
\mathnet{http://mi.mathnet.ru/trspy292}
Образцы ссылок на эту страницу:
http://mi.mathnet.ru/trspy292 http://mi.mathnet.ru/rus/trspy/v4/p388
Полный текст:
PDF файл (1399 kB)
Citing articles on Google Scholar:
Russian citations,
English citations
Related articles on Google Scholar:
Russian articles,
English articles
|
| Просмотров: |
| Эта страница: | 21 | | Полный текст: | 7 |
|