RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB
Общая информация
Последний выпуск
Архив
Импакт-фактор
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Автомат. и телемех.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Автомат. и телемех., 2014, выпуск 12, страницы 125–138 (Mi at14166)  

Эта публикация цитируется в 5 научных статьях (всего в 5 статьях)

Интеллектуальные системы управления

Реализация автоматической системы многомодального распознавания речи по аудио- и видеоинформации

А. А. Карповab

a Санкт-Петербургский институт информатики и автоматизации РАН
b Университет ИТМО, Санкт-Петербург

Аннотация: Представлена математическая модель и программная реализация автоматической системы распознавания русской речи с применением методов цифровой обработки и анализа аудиовизуальных сигналов от микрофона и видеокамеры. Приведено описание вероятностного моделирования аудиовизуальной речи на основе математического аппарата сдвоенных скрытых марковских моделей, методов объединения информации с применением весовых коэффициентов аудио- и видеомодальностей речи и параметрического представления сигналов. Количественные результаты по многомодальному распознаванию слитной русской речи свидетельствуют о высокой точности и надежности работы автоматической системы.

Полный текст: PDF файл (523 kB)
Список литературы: PDF файл   HTML файл

Англоязычная версия:
Automation and Remote Control, 2014, 75:12, 2190–2200

Реферативные базы данных:

Тип публикации: Статья
Статья представлена к публикации членом редколлегии: А. В. Бернштейн

Поступила в редакцию: 28.03.2012

Образец цитирования: А. А. Карпов, “Реализация автоматической системы многомодального распознавания речи по аудио- и видеоинформации”, Автомат. и телемех., 2014, № 12, 125–138; Autom. Remote Control, 75:12 (2014), 2190–2200

Цитирование в формате AMSBIB
\RBibitem{Kar14}
\by А.~А.~Карпов
\paper Реализация автоматической системы многомодального распознавания речи по аудио- и видеоинформации
\jour Автомат. и телемех.
\yr 2014
\issue 12
\pages 125--138
\mathnet{http://mi.mathnet.ru/at14166}
\transl
\jour Autom. Remote Control
\yr 2014
\vol 75
\issue 12
\pages 2190--2200
\crossref{https://doi.org/10.1134/S000511791412008X}
\isi{http://gateway.isiknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=PARTNER_APP&SrcAuth=LinksAMR&DestLinkType=FullRecord&DestApp=ALL_WOS&KeyUT=000346402900008}
\scopus{http://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-84919360128}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/at14166
  • http://mi.mathnet.ru/rus/at/y2014/i12/p125

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles

    Эта публикация цитируется в следующих статьяx:
    1. A. Karpov, A. Ronzhin, I. Kipyatkova, “Automatic analysis of speech and acoustic events for ambient assisted living”, Universal Access in Human-Computer Interaction: Access To Interaction, Pt II, Lecture Notes in Computer Science, 9176, eds. M. Antona, C. Stephanidis, Springer-Verlag Berlin, 2015, 455–463  crossref  isi  scopus
    2. И. С. Кипяткова, А. А. Карпов, “Исследование нейросетевых моделей русского языка для систем автоматического распознавания слитной речи”, Автомат. и телемех., 2017, № 5, 110–122  mathnet  mathscinet  elib; I. S. Kipyatkova, A. A. Karpov, “A study of neural network Russian language models for automatic continuous speech recognition systems”, Autom. Remote Control, 78:5 (2017), 858–867  crossref  isi
    3. D. Ivanko, A. Karpov, D. Fedotov, I. Kipyatkova, D. Ryumin, D. Ivanko, W. Minker, M. Zelezny, “Multimodal speech recognition: increasing accuracy using high speed video data”, J. Multimodal User Interfaces, 12:4, SI (2018), 319–328  crossref  isi  scopus
    4. N. Radha, A. Shahina, P. Prabha, P. B. T. Sri, N. A. Khan, “An analysis of the effect of combining standard and alternate sensor signals on recognition of syllabic units for multimodal speech recognition”, Pattern Recognit. Lett., 115, SI (2018), 39–49  crossref  isi  scopus
    5. М. П. Фархадов, Н. В. Петухова, С. В. Васьковский, М. Э. Фархадова, “Повышение эффективности речевого интерфейса с применением когнитивных и лингвистических знаний”, УБС, 81 (2019), 90–112  mathnet  crossref
  • Автоматика и телемеханика
    Просмотров:
    Эта страница:355
    Полный текст:65
    Литература:28
    Первая стр.:45
     
    Обратная связь:
     Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2020