Информатика и автоматизация
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и автоматизация, 2025, выпуск 24, том 1, страницы 302–328
DOI: https://doi.org/10.15622/ia.24.1.11
(Mi trspy1357)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Искусственный интеллект, инженерия данных и знаний

Heverl – viewport estimation using reinforcement learning for 360-degree video streaming
[Оценка области просмотра с использованием обучения с подкреплением для потоковой передачи видео в формате 360 градусов]

N. V. Hung, P. T. Dat, N. Tan, N. A. Quan, L. T. N. Trang, L. M. Nam

East Asia University of Technology
Аннотация: Видеоконтент в формате 360 градусов стал ключевым компонентом в средах виртуальной реальности, предлагая зрителям захватывающий и увлекательный опыт. Однако потоковая передача такого комплексного видеоконтента сопряжена со значительными трудностями, обусловленными существенными размерами файлов и переменчивыми сетевыми условиями. Для решения этих проблем в качестве перспективного решения, направленного на снижение нагрузки на пропускную способность сети, появилась адаптивная потоковая передача просмотра. Эта технология предполагает передачу видео более низкого качества для периферийных зон просмотра, а высококачественный контент – для конкретной зоны просмотра, на которую активно смотрит пользователь. По сути, это требует точного прогнозирования направления просмотра пользователя и повышения качества этого конкретного сегмента, что подчеркивает значимость адаптивной потоковой передачи просмотра (VAS). Наше исследование углубляется в применение методов пошагового обучения для прогнозирования оценок, требуемых системой VAS. Таким образом, мы стремимся оптимизировать процесс потоковой передачи, обеспечивая высокое качество отображения наиболее важных фрагментов видео. Кроме того, наш подход дополняется тщательным анализом поведения движений головы и лица человека. Используя эти данные, мы разработали модель обучения с подкреплением, специально предназначенную для прогнозирования направлений взгляда пользователя и повышения качества изображения в целевых областях. Эффективность предлагаемого нами метода подтверждается нашими экспериментальными результатами, которые показывают значительные улучшения по сравнению с существующими эталонными методами. В частности, наш подход повышает метрику прецизионности на значения в диапазоне от 0,011 до 0,022. Кроме того, он снижает среднеквадратичную ошибку (RMSE) в диапазоне от 0,008 до 0,013, среднюю абсолютную ошибку (MAE) – от 0,012 до 0,018 и оценку F1 – от 0,017 до 0,028. Кроме того, мы наблюдаем увеличение общей точности с 2,79 до 16,98. Эти улучшения подчеркивают потенциал нашей модели для значительного улучшения качества просмотра в средах виртуальной реальности, делая потоковую передачу видео на 360 градусов более эффективной и удобной для пользователя.
Ключевые слова: движение головы и глаз, обучение с подкреплением, глубокое обучение, машинное обучение, потоковая передача видео, видео на 360 градусов.
Поступила в редакцию: 26.05.2024
Тип публикации: Статья
УДК: 006.72
Язык публикации: английский
Образец цитирования: N. V. Hung, P. T. Dat, N. Tan, N. A. Quan, L. T. N. Trang, L. M. Nam, “Heverl – viewport estimation using reinforcement learning for 360-degree video streaming”, Информатика и автоматизация, 24:1 (2025), 302–328
Цитирование в формате AMSBIB
\RBibitem{HunDatTan25}
\by N.~V.~Hung, P.~T.~Dat, N.~Tan, N.~A.~Quan, L.~T.~N.~Trang, L.~M.~Nam
\paper Heverl – viewport estimation using reinforcement learning for 360-degree video streaming
\jour Информатика и автоматизация
\yr 2025
\vol 24
\issue 1
\pages 302--328
\mathnet{http://mi.mathnet.ru/trspy1357}
\crossref{https://doi.org/10.15622/ia.24.1.11}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy1357
  • https://www.mathnet.ru/rus/trspy/v24/i1/p302
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025