|
Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 131–140 DOI: https://doi.org/10.31857/S2686954324700450
(Mi danma595)
|
|
|
|
Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)
СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Построение мультимодальных 3D-карт для интеллектуальных роботов с применением нейросетевых методов
Д. А. Юдинabc a Московский физико-технический институт, Научно-образовательный центр когнитивного моделирования, Долгопрудный, Россия
b Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
c Институт искусственного интеллекта AIRI, Москва, Россия
DOI:
https://doi.org/10.31857/S2686954324700450
Аннотация:
Для систем навигации роботов все большую значимость набирают методы построения мультимодальных трехмерных карт. В таких картах каждая 3D-точка или объект содержат помимо информации о цвете и семантической категории, еще и сжатые векторные представления текстового описания или звука. Это позволяет решать задачи движения до объектов по сформулированным на естественном языке запросам, даже не содержащим упоминание объекта в явном виде. В настоящей статье предложена оригинальная таксономия методов, позволяющих строить мультимодальные 3D-карты с применением нейросетевых методов. Показано, что разреженные методы, использующие представление сцены в виде графа объектов и большие языковые модели для поиска ответа на сложные пространственные и семантические запросы, демонстрируют наиболее многообещающие результаты на существующих открытых бенчмарках. На основе проведенного анализа выявлены ограничения по выбору тех или иных методов для решения практических задач интеллектуальной робототехники.
Ключевые слова:
трехмерная карта, мультимодальный метод, нейронная сеть, большая языковая модель, сегментация изображений, интеллектуальная робототехника.
Поступило: 20.08.2024 Принято к публикации: 02.10.2024
Образец цитирования:
Д. А. Юдин, “Построение мультимодальных 3D-карт для интеллектуальных роботов с применением нейросетевых методов”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 131–140; Dokl. Math., 110:suppl. 1 (2024), S117–S125
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/danma595 https://www.mathnet.ru/rus/danma/v520/i2/p131
|
|