|
Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 124–130 DOI: https://doi.org/10.31857/S2686954324700449
(Mi danma594)
|
|
|
|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Обзор мультимодальных сред для обучения с подкреплением
З. А. Воловиковаab, М. А. Кузнецоваa, А. А. Скрынникbc, А. И. Пановabc a Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
b AIRI - научно-исследовательский институт искусственного интеллекта, Москва, Россия
c Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
DOI:
https://doi.org/10.31857/S2686954324700449
Аннотация:
В данной статье представлен обзор и сравнительный анализ мультимодальных виртуальных сред для обучения с подкреплением. Рассмотрены семь различных сред, включая HomeGrid, BabyAI, RTFM, Messenger, Touchdown, Alfred и IGLU, с акцентом на их особенности и требования к агентам. Основное внимание уделено таким параметрам, как сложность текстовых инструкций, динамичность среды. Проведенный анализ выявляет сильные и слабые стороны каждой среды, позволяя определить оптимальные условия для эффективного обучения агентов, а также подчеркивает необходимость создания более сбалансированных сред, сочетающих высокие требования как к пониманию языка, так и к взаимодействию с окружением.
Ключевые слова:
мультимодальное обучение, граундинг языка, обучение с подкреплением.
Поступило: 01.10.2024 Принято к публикации: 07.10.2024
Образец цитирования:
З. А. Воловикова, М. А. Кузнецова, А. А. Скрынник, А. И. Панов, “Обзор мультимодальных сред для обучения с подкреплением”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 124–130; Dokl. Math., 110:suppl. 1 (2024), S110–S116
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/danma594 https://www.mathnet.ru/rus/danma/v520/i2/p124
|
|