RUS  ENG ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Препринты ИПМ им. М. В. Келдыша:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Препринты ИПМ им. М. В. Келдыша, 2018, 170, 21 страниц (Mi ipmp2529)  

Решение задачи распознавания блефа в игре «верю – не верю» с помощью алгоритмов обучения с подкреплением

С. А. Князятов, Г. Г. Малинецкий


Аннотация: В работе исследуется возможность построения алгоритма на основе обучения с подкреплением для задачи распознавания и использования блефа в карточной игре «верю — не верю». Построенный алгоритм обладает «интеллектуальной способностью» перестраивать свою стратегию поведения и оценивать возможные ходы, основываясь на предыдущем опыте. Данный класс алгоритмов используется для принятия решений в быстроменяющихся средах. Описаны способ и результаты сравнения алгоритмов между собой, результаты игр лучших алгоритмов с реальным соперником. Обнаружен эффект «переобучения» — увеличение количества обучающих партий в ряде случаев не улучшает, а ухудшает качество работы алгоритма.

Ключевые слова: обучение с подкреплением, математическое моделирование, $Q$-обучение, метод SARSA($\lambda$), алгоритм распознавания блефа, имитация блефа, нейронные сети, высокоскоростное принятие решений.

Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 16-01-00342_а
Работа выполнена при поддержке РФФИ проект 16-01-00342.


DOI: https://doi.org/10.20948/prepr-2018-170

Полный текст: PDF файл (911 kB)
Полный текст: http:/.../preprint.asp?id=2018-170&lg=r
Список литературы: PDF файл   HTML файл

Реферативные базы данных:

Тип публикации: Препринт

Образец цитирования: С. А. Князятов, Г. Г. Малинецкий, “Решение задачи распознавания блефа в игре «верю – не верю» с помощью алгоритмов обучения с подкреплением”, Препринты ИПМ им. М. В. Келдыша, 2018, 170, 21 с.

Цитирование в формате AMSBIB
\RBibitem{KnyMal18}
\by С.~А.~Князятов, Г.~Г.~Малинецкий
\paper Решение задачи распознавания блефа в игре «верю – не верю» с помощью алгоритмов обучения с подкреплением
\jour Препринты ИПМ им.~М.~В.~Келдыша
\yr 2018
\papernumber 170
\totalpages 21
\mathnet{http://mi.mathnet.ru/ipmp2529}
\crossref{https://doi.org/10.20948/prepr-2018-170}
\elib{http://elibrary.ru/item.asp?id=35458678}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/ipmp2529
  • http://mi.mathnet.ru/rus/ipmp/y2018/p170

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles
  • Препринты Института прикладной математики им. М. В. Келдыша РАН
    Просмотров:
    Эта страница:83
    Полный текст:37
    Литература:4
     
    Обратная связь:
     Пользовательское соглашение  Регистрация  Логотипы © Математический институт им. В. А. Стеклова РАН, 2020