Информационные технологии интеллектуальной поддержки принятия решений, Информационные технологии интеллектуальной поддержки принятия решений 2019

Размер шрифта: 
Использование методов машинного обучения для реализации поведения игроков
Д. Р. Богданова, А. И. Каспранская

Изменена: 2019-11-05

Аннотация


В статье проведен анализ рынка индустрии компьютерных игр и их социальной значимости. Поставлена задача разработки поведения игроков посредствам машинного обучения, т.е. создания игрового бота. Проведен обзор моделей машинного обучения и выбрана модель для решения поставленной задачи.

Ключевые слова


машинное обучение; компьютерные игры; обучение с учителем; обучение с подкреплением; обучение без учителя; алгоритмы

Литература


1.            Игровая индустрия в России и мире. Исследования Mail.Ru Group  URL: https://gamestats.mail.ru/

2.            Машинное обучение. URL: www.machinelearning.ru/wiki/index.php?title=Машинное_обучение

3.            Теория случайных процессов / А. В. Булинский, А. Н. Ширяев. — Физматлит, 2005. — 408 с. — ISBN 5-9221-0335-0.

4.            Википедия. Генетический алгоритм URL: https://ru.wikipedia.org/wiki/Генетический_алгоритм

5.            Ю.И.Еременко, Е.Г.Доронина «Модель адаптивного поведения агентов мультиагентной системы управления экологической безопасность» // Прикладная информатика 2010. № 2(26) Стр. 71-82.

6.            А.П. Еремеев, А.А. Кожухов «Реализация методов обучения с подкреплением на основе темпоральных различий и мультиагентного подхода для интеллектуальных систем реального времени» // Программные продукты и системы 2017. № 1 Стр. 28-33.

7.            Д. Б. Рохлин, “Q-обучение в стохастической игре Штакельберга между неинформированным лидером и наивным ведомым”// Теория вероятн. и ее примен., 2019. №64:1 Стр.53–74

8.            Гурьянов А.К. Стратегии исследования окружений в обучении с подкреплением с непрерывными пространствами состояний: дис. магистр — Москва, 2017. — С. 38.

9.            Д.А .Коробов, С.А. Беляев «Современные подходы к обучению интеллектуальных агентов в среде ATARI» // Программные продукты и системы 2018. № 2 Стр. 284-290.

10.          Рудь М.Н. Разработка системы управления роботом-гексаподом: дис. магистр — Томск, 2016. — С. 103.

11.          С. А. Князятов, Г. Г. Малинецкий, “Решение задачи распознавания блефа в игре «верю – не верю» с помощью алгоритмов обучения с подкреплением” // Препринты ИПМ им. М. В. Келдыша. 2018.  №170. Стр. 21.


Полный текст: PDF