|
Искусственный интеллект и машинное обучение
Нейросетевая классификация видеороликов по малому числу кадров
А. В. Смирновa, Д. Д. Парфеновb, И. П. Тищенкоa a Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия
b ГУМРФ имени адмирала С.О. Макарова, Санкт-Петербург, Россия
Аннотация:
В статье предложен метод нейросетевой классификации коротких видеороликов. Задача классификации рассматривается с точки зрения уменьшения числа требуемых операций для категоризации видеороликов. Предлагаемое решение заключается в использовании небольшого числа кадров (не более 10) для выполнения классификации при помощи самой лёгкой нейросетевой архитектуры семейства моделей ResNet. В ходе исследования создан собственный набор данных для обучения, состоящий из трёх классов: «animals», «cars» и «people». В результате получена точность классификации, равная 79%, а также сформирована база данных классифицируемых видеороликов и разработано приложение с элементами GUI для взаимодействия с классификатором и просмотра результатов.
Ключевые слова и фразы:
Классификация видео, набор данных, нейронные сети, графический интерфейс пользователя.
Поступила в редакцию: 01.10.2024 Подписана в печать : 04.11.2024
Образец цитирования:
А. В. Смирнов, Д. Д. Парфенов, И. П. Тищенко, “Нейросетевая классификация видеороликов по малому числу кадров”, Программные системы: теория и приложения, 15:4 (2024), 79–96
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ps457 https://www.mathnet.ru/rus/ps/v15/i4/p79
|
Статистика просмотров: |
Страница аннотации: | 23 | PDF полного текста: | 8 | Список литературы: | 12 |
|