Компьютерные исследования и моделирование
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерные исследования и моделирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерные исследования и моделирование, 2024, том 16, выпуск 3, страницы 615–631
DOI: https://doi.org/10.20537/2076-7633-2024-16-3-615-631
(Mi crm1181)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

МОДЕЛИ В ФИЗИКЕ И ТЕХНОЛОГИИ

Сверточные нейронные сети семейства YOLO для мобильных систем компьютерного зрения

С. Г. Небаба, Н. Г. Марков

Национальный исследовательский Томский политехнический университет, Россия, 634050, г. Томск, пр. Ленина, д. 30
Список литературы:
Аннотация: Работа посвящена анализу известных классов моделей сверточных нейронных сетей и исследованию выбранных из них перспективных моделей для детектирования летающих объектов на изображениях. Под детектированием объектов (англ. — Object Detection) здесь понимаются обнаружение, локализация в пространстве и классификация летающих объектов. Комплексное исследование выбранных перспективных моделей сверточных нейронных сетей проводится с целью выявления наиболее эффективных из них для создания мобильных систем компьютерного зрения реального времени. Показано, что наиболее приемлемыми для детектирования летающих объектов на изображениях с учетом сформулированных требований к мобильным системам компьютерного зрения реального времени и, соответственно, к лежащим в их основе моделям сверточных нейронных сетей являются модели семейства YOLO, причем наиболее перспективными следует считать пять моделей из этого семейства: YOLOv4, YOLOv4-Tiny, YOLOv4-CSP, YOLOv7 и YOLOv7-Tiny. Для обучения, валидации и комплексного исследования этих моделей разработан соответствующий набор данных. Каждое размеченное изображение из набора данных включает от одного до нескольких летающих объектов четырех классов: «птица», «беспилотный летательный аппарат самолетного типа», «беспилотный летательный аппарат вертолетного типа» и «неизвестный объект» (объекты в воздушном пространстве, не входящие в первые три класса). Исследования показали, что все модели сверточных нейронных сетей по скорости детектирования объектов на изображении (по скорости вычисления модели) значительно превышают заданное пороговое значение, однако только модели YOLOv4-CSP и YOLOv7, причем только частично, удовлетворяют требованию по точности детектирования (классификации) летающих объектов. Наиболее сложным для детектирования классом объектов является класс «птица». При этом выявлено, что наиболее эффективной по точности классификации является модель YOLOv7, модель YOLOv4-CSP на втором месте. Обе модели рекомендованы к использованию в составе мобильной системы компьютерного зрения реального времени при условии увеличения в созданном наборе данных числа изображений с объектами класса «птица» и дообучения этих моделей с тем, чтобы они удовлетворяли требованию по точности детектирования летающих объектов каждого из четырех классов.
Ключевые слова: детектирование летающих объектов на изображениях, сверточная нейронная сеть, YOLO, мобильная система компьютерного зрения
Поступила в редакцию: 17.10.2023
Исправленный вариант: 19.02.2024
Принята в печать: 19.02.2024
Тип публикации: Статья
УДК: 004.93’12
Образец цитирования: С. Г. Небаба, Н. Г. Марков, “Сверточные нейронные сети семейства YOLO для мобильных систем компьютерного зрения”, Компьютерные исследования и моделирование, 16:3 (2024), 615–631
Цитирование в формате AMSBIB
\RBibitem{NebMar24}
\by С.~Г.~Небаба, Н.~Г.~Марков
\paper Сверточные нейронные сети семейства YOLO для мобильных систем компьютерного зрения
\jour Компьютерные исследования и моделирование
\yr 2024
\vol 16
\issue 3
\pages 615--631
\mathnet{http://mi.mathnet.ru/crm1181}
\crossref{https://doi.org/10.20537/2076-7633-2024-16-3-615-631}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/crm1181
  • https://www.mathnet.ru/rus/crm/v16/i3/p615
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерные исследования и моделирование
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025