作者 github Wiki
[1]Rasmussen, Carl Edward, and Malte Kuss. “Gaussian Processes in Reinforcement Learning.” In NIPS, vol. 4, p. 1. 2003.
这篇论文主要提及了高斯过程在强化学习中的实现,并没有涉及深度神经网络,需要比较良好的概率论和线性代数基础才能读懂。文中提到的使用高斯过程去拟合状态价值函数的方法还是很值得一看的,同时也对经典的山路车问题做了比较详细的描述
[2]Goumiri, Imene R., Benjamin W. Priest, and Michael D. Schneider. “Reinforcement Learning via Gaussian Processes with Neural Network Dual Kernels.” In 2020 IEEE Conference on Games (CoG), pp. 1-8. IEEE, 2020.
这篇paper可以看成是上一篇paper的延伸版,在利用高斯过程在预采样的状态值初始化动态系统变量与价值函数时采取了更高的维度和较少的点。也对不同的核函数CK,NTK进行了分析,不过对核函数的应用这一块并没很看懂,第二部分的概率论也一度让我很崩溃,但是到了第三部分开始会更加流畅。最重要的思想个人感觉还是利用高斯过程生成的状态会比0或完全随机来的更有效率
[3]Ariyurek, Sinan, Aysu Betin-Can, and Elif Surer. “Enhancing the monte carlo tree search algorithm for video game testing.” In 2020 IEEE Conference on Games (CoG), pp. 25-32. IEEE, 2020.
通篇论文读下来绝对是酣畅淋漓,里面提及了多种MCTS的加强方法,并且新颖的将该方法用于bug检测上,该份应用具有更多的商业价值,但测试平台是GVGAI,因此如何推广利用AI进行bug检测到现代游戏中值得进一步的探索和开发。
[4]Ariyurek, Sinan, Aysu Betin-Can, and Elif Surer. “Automated video game testing using synthetic and human-like agents.” IEEE Transactions on Games (2019).
因为在读上一篇文章时,里面的一些算法没有十分详尽的描写,我去读了一趟原作者在2019年发表的原始方法。因为内容十分详实,我花了三天才陆陆续续读完这一篇paper。对于想了解如何利用AI进行游戏测试,寻找bug的朋友们,这篇paper绝对是不可错过的精品。文章定义了humanlike和Synthetic目标和agent,定义了需要输入的特征向量,该文章实现了2D情况下的bug调试,文章的末尾也提及了后续的研究也将涉及到3D游戏的普及。
[5]Vaswani, Ashish, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, ?ukasz Kaiser, and Illia Polosukhin. “Attention is all you need.” In Advances in neural information processing systems, pp. 5998-6008. 2017.
这篇paper即大名鼎鼎的Attention奠基之作,attention在CV,语音,NLP等各个DL领域已经广泛应用而且是目前的主流趋势,在游戏AI领域,attention最近也涌现出了各式各样的模型应用。虽然这一篇没有讲游戏应用,但是对AI学习者来讲看一下绝对是有必要的(虽然我之前也没看过)。看得时候可以跳着看,重点看二三四章,相关结论和实验因为涉及NLP(知识盲区),我在看paper的时候没怎么关注。
[6]Torrado, Ruben Rodriguez, Ahmed Khalifa, Michael Cerny Green, Niels Justesen, Sebastian Risi, and Julian Togelius. “Bootstrapping conditional gans for video game level generation.” In 2020 IEEE Conference on Games (CoG), pp. 41-48. IEEE, 2020.
该篇paper采用了conditional embedding self-attention GAN来生成新的地图,paper里比较简单的使用了2D的GVGAI框架,但是对于GAN结构的改进和实验结果都令人眼前一亮,attention机制的加入使得GAN的输出变得相对稳定,里面提到的条件嵌入模型使输出地图的可玩几率得到提升,同时将可玩与冗余度低的输出作为数据添加到训练集中一定程度上缓解了游戏数据集不足的问题,同时从实验例子上可以学习游戏数据的representation。K-means也在paper中扮演对输出地图分级的角色。另外,对于如何检测该地图是否可玩,作者也在例子中粗略提出了自己的算法。但如何应用该算法到如今越发复杂的游戏中仍然值得讨论,例如如何使得一个复杂的3D游戏拥有一种简单的representation值得学者们和开发者更进一步的研究。
[7]Green, Michael Cerny, Luvneesh Mugrai, Ahmed Khalifa, and Julian Togelius. “Mario level generation from mechanics using scene stitching.” In 2020 IEEE Conference on Games (CoG), pp. 49-56. IEEE, 2020. 这篇paper研究了使用遗传算法实现马里奥地图的生成,100多个预先定义的场景片段语料库data被相应的运动轨迹(游戏机制)去represent,作为遗传算法的基因片段去生成新的地图,并定义了基因变异方法与评估函数,但是个人认为这种方法生成的地图多样性将过于依赖初始的场景语料库。当然好处也显而易见,这种生成途径与GAN相比稳定性有很强的保障。 **
|