RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB
Ближайшие семинары
Календарь семинаров
Список семинаров
Архив по годам
Регистрация семинара

Поиск
RSS
Ближайшие семинары





Для просмотра файлов Вам могут потребоваться








Стохастический анализ в задачах
27 апреля 2013 г. 11:00, г. Москва, Большой Власьевский переулок, дом 11
 


Алгоритмы зеркального спуска в задачах о многоруком бандите

А. В. Назин

Институт проблем управления им. В. А. Трапезникова РАН, г. Москва
Материалы:
Adobe PDF 226.3 Kb

Количество просмотров:
Эта страница:423
Материалы:74
Youtube Video:





Аннотация: Рассматриваются две стохастические задачи о многоруком бандите. Одна «классическая», с конечным числом действий и со случайными потерями (в частном случае, бинарными, принимающими значения 0 или 1). Другая задача, как обобщение предыдущей, содержит потери, зависящие еще и от состояния наблюдаемой стационарной конечной марковской цепи. На основе оптимизационного подхода получены рекуррентные алгоритмы зеркального спуска. Доказаны верхние границы превышения средних потерь над их минимальным значением. Обсуждаются также и нижние границы для этих задач. Доказывается, что верхние и нижние границы совпадают с точностью до логарифмического множителя.

Материалы: mnu_27_04_2013.pdf (226.3 Kb)

ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru
 
Обратная связь:
 Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2020