RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ЛИЧНЫЙ КАБИНЕТ
Ближайшие семинары
Календарь семинаров
Список семинаров
Архив по годам
Регистрация семинара

Поиск
RSS
Ближайшие семинары





Для просмотра файлов Вам могут потребоваться








Большой семинар кафедры теории вероятностей МГУ
15 марта 2017 г. 16:45, г. Москва, ГЗ МГУ, ауд. 12-24
 


Оптимальная остановка для процессов Леви со случайными наблюдениями

С. И. Боярченко, С. З. Левендорский
Материалы:
Adobe PDF 344.8 Kb

Количество просмотров:
Эта страница:115
Материалы:14

Аннотация: В стандартных проблемах оптимальной остановки возможность действовать обычно приурочена к моментам получения новых данных о затратах и выгодах проекта. В стандартной литературе по экспериментированию и машинному обучению, основанной на так называемых двуруких Пуассоновых бандитах, допускается возможность действовать в период отсутствия наблюдений. Однако, в этой литературе не принимается во внимание, что принятие решений зависит не только от того, с какой частотой прибывает новая информация о затратах и прибылях, но и от реализации стохастических процессов, моделирующих затраты или прибыли, в момент наблюдения. Наша статья показывает, что для принятия решений имеют значение как представления о частоте случайных поломок или прорывов, так и величина затрат в случае поломок или прибылей в случае прорывов. Мы предлагаем две модели: одна рассматривает экспериментирование с новой технологией, подверженной случайным поломкам; другая — оптимальное инвестирование венчурного капитала в проект со случайными прорывами. Время, когда случаются поломки или прорывы моделируется как процесс Пуассона, чей параметр может принимать одно из двух значений. Истинная величина этого параметра изначально неизвестна. Дано априорное распределение для этого параметра; апостериорное распределение корректируется по правилу Байеcа. Стохастические затраты или прибыли моделируются как процесс Леви , независимый от процесса Пуассона. Наша модель показывает, что, если в момент наблюдения действовать не оптимально, то оптимально фиксировать время $T(x)$, зависящее от последней реализации стохастического процесса $x$, и погасить опцион в момент времени $T(x)$, если новое наблюдение не случится раньше. Мы исследуем регулярность решения задачи и формулируем следующую дихoтомию: либо функция $T(x)$ непрерывна на свободной границе, и выполняется принцип гладкой склейки; либо в функции $T(x)$ наблюдается скачок, и целевая функция имеет излом на границе.

Материалы: mgu_march17c.pdf (344.8 Kb)

ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru
 
Обратная связь:
 Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2017