|
Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 57–70 DOI: https://doi.org/10.31857/S2686954324700383
(Mi danma588)
|
|
|
|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Раскрытие Гессиана: ключ к плавной сходимости поверхности функции потерь
Н. С. Киселев, А. В. Грабовой Московский физико-технический институт, Москва, Россия
DOI:
https://doi.org/10.31857/S2686954324700383
Аннотация:
Поверхность функции потерь в нейронных сетях является критическим аспектом их обучения, и понимание ее свойств важно для улучшения их эффективности. В данной работе исследуется изменение поверхности функции потерь при увеличении размера выборки. Проводится теоретический анализ сходимости поверхности функции потерь в полносвязной нейронной сети, доказывается верхняя оценка на абсолютную разность значений функции ошибки при добавлении одного объекта в выборку. Эмпирический анализ показывает справедливость полученных теоретических результатов на различных наборах данных, демонстрируя сходимость поверхности функции потерь для задачи классификации изображений. Результаты исследования открывают новые свойства локальной геометрии поверхности функции потерь в нейронных сетях и имеют применение в развитии методов определения достаточного размера выборки.
Ключевые слова:
нейронные сети, поверхность функции потерь, гессиан, анализ сходимости, классификация изображений.
Поступило: 28.09.2024 Принято к публикации: 02.10.2024
Образец цитирования:
Н. С. Киселев, А. В. Грабовой, “Раскрытие Гессиана: ключ к плавной сходимости поверхности функции потерь”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 57–70; Dokl. Math., 110:suppl. 1 (2024), S49–S61
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/danma588 https://www.mathnet.ru/rus/danma/v520/i2/p57
|
|