RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB
Общая информация
Последний выпуск
Архив
Импакт-фактор
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Журн. СФУ. Сер. Матем. и физ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Журн. СФУ. Сер. Матем. и физ., 2016, том 9, выпуск 4, страницы 518–523 (Mi jsfu514)  

Speech-based emotion recognition and speaker identification: static vs. dynamic mode of speech representation

[Распознавание эмоций и идентификация спикера по речевым сигналам: сравнение статического и динамического подходов к представлению речевых сигналов]

Maxim Sidorova, Wolfgang Minkera, Eugene S. Semenkinb

a Institute of Communications Engineering, Ulm University, Albert-Einstein-Allee, 43, Ulm, 89081
b Informatics and Telecommunications Institute, Reshetnev Siberian State Aerospace University, Krasnoyarskiy Rabochiy, 31, Krasnoyarsk, 660037, Russia

Аннотация: В статье рассматривается применение различных алгоритмов машинного обучения для задач распознавания эмоций и идентификации говорящего на основе речевых сигналов. Мы исследуем статический и динамический режимы представления речевого сигнала. Для проведения численных экспериментов и апробации рассмотренных подходов мы использовали 7 баз данных на немецком, английском и японском языках. Более 45 алгоритмов машинного обучения были применены для решения указанных задач в двух режимах представления речевого сигнала. В статье представлены результаты численных исследований и проведен их анализ.

Ключевые слова: распознавание эмоций и идентификация говорящего по речевым сигналам, алгоритмы машинного обучения, адаптивная процедура распознавания эмоций по речевым сигналам.

DOI: https://doi.org/10.17516/1997-1397-2016-9-4-518-523

Полный текст: PDF файл (87 kB)
Список литературы: PDF файл   HTML файл

Реферативные базы данных:

Тип публикации: Статья
УДК: 519.87
Получена: 28.12.2015
Исправленный вариант: 24.02.2016
Принята: 15.09.2016
Язык публикации: английский

Образец цитирования: Maxim Sidorov, Wolfgang Minker, Eugene S. Semenkin, “Speech-based emotion recognition and speaker identification: static vs. dynamic mode of speech representation”, Журн. СФУ. Сер. Матем. и физ., 9:4 (2016), 518–523

Цитирование в формате AMSBIB
\RBibitem{SidMinSem16}
\by Maxim~Sidorov, Wolfgang~Minker, Eugene~S.~Semenkin
\paper Speech-based emotion recognition and speaker identification: static vs. dynamic mode of speech representation
\jour Журн. СФУ. Сер. Матем. и физ.
\yr 2016
\vol 9
\issue 4
\pages 518--523
\mathnet{http://mi.mathnet.ru/jsfu514}
\crossref{https://doi.org/10.17516/1997-1397-2016-9-4-518-523}
\isi{http://gateway.isiknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=PARTNER_APP&SrcAuth=LinksAMR&DestLinkType=FullRecord&DestApp=ALL_WOS&KeyUT=000412010800016}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/jsfu514
  • http://mi.mathnet.ru/rus/jsfu/v9/i4/p518

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles
  • Журнал Сибирского федерального университета. Серия "Математика и физика"
    Просмотров:
    Эта страница:114
    Полный текст:35
    Литература:18
     
    Обратная связь:
     Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2019