RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ЛИЧНЫЙ КАБИНЕТ
Ближайшие семинары
Календарь семинаров
Список семинаров
Архив по годам
Регистрация семинара

Поиск
RSS
Ближайшие семинары





Для просмотра файлов Вам могут потребоваться








Большой семинар кафедры теории вероятностей МГУ
19 октября 2011 г. 16:45, г. Москва, Ауд. 16-24
 


Робастное параллельное управление в случайной среде (задаче о двуруком бандите)

А. В. Колногоров

Новгородский государственный университет
Материалы:
Adobe PDF 2.4 Mb

Количество просмотров:
Эта страница:138
Материалы:19

Аннотация: Задача о поведении в случайной среде, известная также как задача о двуруком бандите, рассматривается в робастной (минимаксной) постановке. Минимаксные стратегия и риск ищутся как байесовские, соответствующие наихудшему априорному распределению. Для сред с доходами, имеющими нормальные распределения с единичной дисперсией и математическими ожиданиями, зависящими только от выбираемых вариантов, это распределение может быть выбрано симметрическим и асимптотически однородным.
Предложена стратегия параллельного управления, которая обеспечивает управление, сколь угодно близкое к оптимальному. Получено инвариантное рекуррентное уравнение для нахождения минимаксных стратегии и риска методом динамического программирования. Это позволяет улучшить известные оценки минимаксного риска Фогеля (W. Vogel). Численный анализ показывает, что стратегия хорошо функционирует в средах с распределениями, отличающимися от нормальных, например, в бинарных.

Материалы: normal.pdf (2.4 Mb)

ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru
 
Обратная связь:
 Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2017