Изменена: 2019-11-05
Аннотация
Ключевые слова
Литература
1. Игровая индустрия в России и мире. Исследования Mail.Ru Group URL: https://gamestats.mail.ru/
2. Машинное обучение. URL: www.machinelearning.ru/wiki/index.php?title=Машинное_обучение
3. Теория случайных процессов / А. В. Булинский, А. Н. Ширяев. — Физматлит, 2005. — 408 с. — ISBN 5-9221-0335-0.
4. Википедия. Генетический алгоритм URL: https://ru.wikipedia.org/wiki/Генетический_алгоритм
5. Ю.И.Еременко, Е.Г.Доронина «Модель адаптивного поведения агентов мультиагентной системы управления экологической безопасность» // Прикладная информатика 2010. № 2(26) Стр. 71-82.
6. А.П. Еремеев, А.А. Кожухов «Реализация методов обучения с подкреплением на основе темпоральных различий и мультиагентного подхода для интеллектуальных систем реального времени» // Программные продукты и системы 2017. № 1 Стр. 28-33.
7. Д. Б. Рохлин, “Q-обучение в стохастической игре Штакельберга между неинформированным лидером и наивным ведомым”// Теория вероятн. и ее примен., 2019. №64:1 Стр.53–74
8. Гурьянов А.К. Стратегии исследования окружений в обучении с подкреплением с непрерывными пространствами состояний: дис. магистр — Москва, 2017. — С. 38.
9. Д.А .Коробов, С.А. Беляев «Современные подходы к обучению интеллектуальных агентов в среде ATARI» // Программные продукты и системы 2018. № 2 Стр. 284-290.
10. Рудь М.Н. Разработка системы управления роботом-гексаподом: дис. магистр — Томск, 2016. — С. 103.
11. С. А. Князятов, Г. Г. Малинецкий, “Решение задачи распознавания блефа в игре «верю – не верю» с помощью алгоритмов обучения с подкреплением” // Препринты ИПМ им. М. В. Келдыша. 2018. №170. Стр. 21.