Записки научных семинаров ПОМИ
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Зап. научн. сем. ПОМИ:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Записки научных семинаров ПОМИ, 2023, том 529, страницы 176–196 (Mi znsl7426)  

Blending of predictions boosts understanding for multimodal advertisements
[Объединение предсказаний улучшает понимание мультимодального рекламного контента]

A. Alekseeva, A. Savchenkob, E. Tutubalinacd, E. Myasnikove, S. Nikolenkoa

a Steklov Institute of Mathematics at St. Petersburg, Russia
b Sber AI Lab, Russia
c Sber AI, Russia
d Kazan Federal University, Russia
e Samara National Research University, Russia
Список литературы:
Аннотация: Рекламная индустрия использует несколько модальностей контента для доставки подразумеваемых сообщений: изображения, видео, текст, музыка, и все это вместе взятое. “Декодирование” сообщения, подразумеваемого в мультимодальном контенте, часто требует анализа как текстовых, так и визуальных его компонентов. Мы изучаем задачи распознавания мультимодального символизма, обнаружения тем и классификации тональности. Руководствуясь разницей в частях сообщения, передаваемых разными модальностями в рекламных объявлениях, мы обучаем отдельные модели для изображений и текстов и значительно улучшаем результаты, смешивая прогнозы на основе изображений и текста (с автоматически распознанным текстом), что дает экспериментальное подтверждение нашего подхода. Библ. – 69 назв.
Ключевые слова: мультимодальное машинное обучение, понимание рекламного контента, распознавание тематики, тональность текста, классификация тональности.
Финансовая поддержка Номер гранта
Российский научный фонд 23-11-00358
The work has been supported by the Russian Science Foundation grant # 23-11-00358.
Поступило: 12.10.2023
Тип публикации: Статья
УДК: 004.852
Язык публикации: английский
Образец цитирования: A. Alekseev, A. Savchenko, E. Tutubalina, E. Myasnikov, S. Nikolenko, “Blending of predictions boosts understanding for multimodal advertisements”, Исследования по прикладной математике и информатике. II–1, Зап. научн. сем. ПОМИ, 529, ПОМИ, СПб., 2023, 176–196
Цитирование в формате AMSBIB
\RBibitem{AleSavTut23}
\by A.~Alekseev, A.~Savchenko, E.~Tutubalina, E.~Myasnikov, S.~Nikolenko
\paper Blending of predictions boosts understanding for multimodal advertisements
\inbook Исследования по прикладной математике и информатике.~II--1
\serial Зап. научн. сем. ПОМИ
\yr 2023
\vol 529
\pages 176--196
\publ ПОМИ
\publaddr СПб.
\mathnet{http://mi.mathnet.ru/znsl7426}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/znsl7426
  • https://www.mathnet.ru/rus/znsl/v529/p176
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Записки научных семинаров ПОМИ
    Статистика просмотров:
    Страница аннотации:110
    PDF полного текста:55
    Список литературы:27
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025