|
Научный отдел
Информатика
Метод автоматического поиска структуры и параметров нейронных сетей для решения задач обработки информации
А. Д. Обухов Тамбовский государственный технический университет, Россия, 392000, г. Тамбов, ул. Советская, д. 106
Аннотация:
Нейронные сети активно применяются при решении различных прикладных задач анализа, обработки и генерации данных. При их использовании одним из сложных этапов является подбор структуры и параметров нейронных сетей (количество и типы слоев нейронов, функции активации, оптимизаторы и т. д.), обеспечивающих наибольшую точность и, следовательно, успешность решения поставленной задачи. В настоящее время данный вопрос решается путем аналитического подбора архитектуры нейронной сети исследователем или разработчиком программного обеспечения. Существующие автоматические инструменты (AutoKeras, AutoGAN, AutoSklearn, DEvol и др.) недостаточно универсальны и функциональны. Поэтому в рамках данной работы рассматривается метод автоматического поиска структуры и параметров нейронных сетей различного типа (многослойных плотных, сверточных, генеративно-состязательных, автоэнкодеров и др.) для решения широкого класса задач. Представлена формализация метода и его основные этапы. Рассмотрена апробация метода, доказывающая его эффективность относительно аналитического решения при подборе архитектуры нейронной сети. Проведено сравнение метода с существующими аналогами, выявлено его преимущество по точности сформированных нейронных сетей и времени поиска решения. Результаты исследования могут использоваться при решении большого класса задач
обработки данных, для которых требуется автоматизировать подбор структуры и параметров
нейронной сети.
Ключевые слова:
нейронные сети, машинное обучение, оптимизация структуры нейронных сетей, анализ и обработка данных, сверточные нейронные сети, автоэнкодеры, генеративно-состязательные сети.
Поступила в редакцию: 26.07.2021 Принята в печать: 12.09.2022
Образец цитирования:
А. Д. Обухов, “Метод автоматического поиска структуры и параметров нейронных сетей для решения задач обработки информации”, Изв. Сарат. ун-та. Нов. сер. Сер.: Математика. Механика. Информатика, 23:1 (2023), 113–125
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/isu972 https://www.mathnet.ru/rus/isu/v23/i1/p113
|
Статистика просмотров: |
Страница аннотации: | 106 | PDF полного текста: | 48 | Список литературы: | 32 |
|