DeepMind开源游戏强化学习框架:OpenSpiel

近年人工智能技术在棋牌和游戏领域强势崛起,围棋、星际争霸以及德州扑克这些人类主场相继沦陷,而针对游戏的人工智能技术——强化学习(Reinforcement Learning)也越来越受到重视,在自动驾驶等领域也有广泛的应用前景。

近日,Alphabet 旗下的 DeepMind 公开了自己的杀手锏—— OpenSpiel 游戏强化学习框架的论文和源码(论文地址GitHub地址),为增强学习的研究者的开源工具库增添了一样大杀器。

OpenSpiel 一个强化学习环境和算法的集合(其中大部分环境和算法已经进行了全面测试),可以用于通用强化学习的研究和游戏的搜索/规划研究;它还为分析学习动态和其他常见评估指标提供了工具。
OpenSpiel 框架中包含了28 款游戏和 24 种算法。支持多种博弈方式的游戏,包括常和博弈、零和博弈、协调博弈和一般博弈。在编程语言方面,OpenSpiel 的游戏通过 C++ 来实现、算法则通过 C++ 和 Python 来实现,代码的一个子集也被移植到 Swift。
目前,OpenSpiel 只在 Linux 系统上进行了测试(Debian 10 和 Ubuntu 19.04),但由于 MacOS 和 Windows 上可自由使用代码,Openspiel 在这些平台上编译和运行时应该也不会出现问题。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者