Доклады Российской академии наук. Математика, информатика, процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Докл. РАН. Матем., информ., проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 124–130
DOI: https://doi.org/10.31857/S2686954324700449
(Mi danma594)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Обзор мультимодальных сред для обучения с подкреплением

З. А. Воловиковаab, М. А. Кузнецоваa, А. А. Скрынникbc, А. И. Пановabc

a Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
b AIRI - научно-исследовательский институт искусственного интеллекта, Москва, Россия
c Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
DOI: https://doi.org/10.31857/S2686954324700449
Аннотация: В данной статье представлен обзор и сравнительный анализ мультимодальных виртуальных сред для обучения с подкреплением. Рассмотрены семь различных сред, включая HomeGrid, BabyAI, RTFM, Messenger, Touchdown, Alfred и IGLU, с акцентом на их особенности и требования к агентам. Основное внимание уделено таким параметрам, как сложность текстовых инструкций, динамичность среды. Проведенный анализ выявляет сильные и слабые стороны каждой среды, позволяя определить оптимальные условия для эффективного обучения агентов, а также подчеркивает необходимость создания более сбалансированных сред, сочетающих высокие требования как к пониманию языка, так и к взаимодействию с окружением.
Ключевые слова: мультимодальное обучение, граундинг языка, обучение с подкреплением.
Финансовая поддержка Номер гранта
Российский научный фонд 20-71-10116
Работа выполнена при финансовой поддержке Российского научного фонда, проект № 20-71-10116.
Поступило: 01.10.2024
Принято к публикации: 07.10.2024
Англоязычная версия:
Doklady Mathematics, 2024, Volume 110, Issue suppl. 1, Pages S110–S116
DOI: https://doi.org/10.1134/S1064562424602166
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.5
Образец цитирования: З. А. Воловикова, М. А. Кузнецова, А. А. Скрынник, А. И. Панов, “Обзор мультимодальных сред для обучения с подкреплением”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 124–130; Dokl. Math., 110:suppl. 1 (2024), S110–S116
Цитирование в формате AMSBIB
\RBibitem{VolKuzSkr24}
\by З.~А.~Воловикова, М.~А.~Кузнецова, А.~А.~Скрынник, А.~И.~Панов
\paper Обзор мультимодальных сред для обучения с подкреплением
\jour Докл. РАН. Матем., информ., проц. упр.
\yr 2024
\vol 520
\issue 2
\pages 124--130
\mathnet{http://mi.mathnet.ru/danma594}
\elib{https://elibrary.ru/item.asp?id=80287442}
\transl
\jour Dokl. Math.
\yr 2024
\vol 110
\issue suppl. 1
\pages S110--S116
\crossref{https://doi.org/10.1134/S1064562424602166}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/danma594
  • https://www.mathnet.ru/rus/danma/v520/i2/p124
    Исправления
    Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Доклады Российской академии наук. Математика, информатика, процессы управления Доклады Российской академии наук. Математика, информатика, процессы управления
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025