Семинары: Д. В. Беломестный, Обучение с подкреплением на основе предпочтений

Loading [MathJax]/jax/output/SVG/config.js

Семинары

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Календарь
	Поиск
	Регистрация семинара

	RSS
	Ближайшие семинары

Семинар «Математические основы искусственного интеллекта»
2 октября 2024 г. 17:00–18:00, г. Москва, МИАН, конференц-зал, 9 этаж + Zoom

Обучение с подкреплением на основе предпочтений

Д. В. Беломестный^ab

^a University of Duisburg-Essen
^b Национальный исследовательский университет "Высшая школа экономики", г. Москва

*Видеозаписи:*
	MP4	1,167.9 Mb
*Дополнительные материалы:*
	Adobe PDF	645.6 Kb

Количество просмотров:
Эта страница:	624
Видеофайлы:	283
Материалы:	19
Youtube:

Фотогалерея

https://vk.com/video-222947497_456239034

https://youtu.be/vA94_4TfoWI

Аннотация: Алгоритмы обучения с подкреплением (RL) нацелены на максимизацию накопленной награды для подходяще выбранной функции вознаграждения. Однако разработка такой функции вознаграждения часто требует предварительных знаний о конкретной задаче, которые могут быть недоступны в явном виде. Чтобы снять эти проблемы, были предложены алгоритмы обучения с подкреплением на основе предпочтений, которые могут напрямую обучаться на основе предпочтений эксперта. В этом докладе я дам обзор алгоритмов обучения с подкреплением на основе предпочтений и проиллюстрирую их основные принципы на примерах из математических финансов.

Дополнительные материалы:

Беломестный.pdf (645.6 Kb)

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы