|
|
Семинар И. В. Воловича, В. В. Козлова, С. В. Козырева и А. С. Трушечкина "Квантовая математическая физика"
27 ноября 2024 г. 18:45–19:30, г. Москва, МИАН, комн. 430 (ул. Губкина, 8)
|
|
|
|
|
|
Гроккинг в теории обучения
С. В. Козырев |
Количество просмотров: |
Эта страница: | 41 |
|
Аннотация:
Обсудим несколько недавних работ, обсуждающих явление гроккинга (отложенного обобщения) в теории обучения, при котором исчезает переобучение, то есть нейросеть выучивается обобщать. Основным рассматриваемым в данных работах примером является обучение алгоритмам модулярной арифметики (сложению и другим операциям в поле вычетов по модулю простого числа). При этом удаётся из набора параметров нейросети восстановить алгоритм, который реализует арифметические операции. Это обсуждается как явление возникновения структуры (emergent phenomenon) для нейросети.
|
|