python|让机器人智能体自己学会玩游戏,强化学习库gym很开放

这个人工智能界的强化学习工具包很open开放,因为它就是Open AI推出的。Open AI这个用于研发和比较强化学习算法的工具包叫Gym。既然是强化学习包,那么理所当然支持智能体(或者以机器人为核心)不断完善学习。据官网介绍,Gym可是支持训练智能体(agent)做任何事的,比如从行走到玩乒乓球、弹球或围棋之类的游戏,都可以。

由于是强化学习包,因此Gym提供了多种多样的虚拟环境,比如机器人控制,2D盒,经典控制,还有游戏界面和第三方环境,从简单到困难,覆盖多种不同类型的数据。机智客认为,我们可以根据自己的强化学习算法的需要,选择不同的环境。我们要使用的时候,比如在Ubuntu这样的Linux发行版系统下,可以用Python语言。
python|让机器人智能体自己学会玩游戏,强化学习库gym很开放
文章插图

这个开源的强化学习包,还和其他的深度学习库或数值计算库兼容,比如TensorFlow。在GitHub已经开源,当然为了便于开发,官方主要支持python语言,也将其上传到了python官方的第三方仓库包里。我们可以从GitHub上clone,也可以直接用pip来安装使用。

很自然,我们要学习这款强化学习工具包,理所当然要创建虚拟环境了。鉴于以前我们已经尝试过多次不同的AI深度学习应用的demo了。虚拟环境准备工作已经做好了,就不介绍如何安装conda了。

需要说明的是python的版本号,看网上有的兄弟说这个需要python3.5版本以及以上,而最新的页面上,机智客看到GitHub官方上介绍是,支持Python 3.7, 3.8, 3.9 and 3.10。因此最好用python3.7以上版本比较合适。创建一个Gym的虚拟环境,用condacreate--name gym37jzkpython=3.7命令创建一个叫gym37jzk的虚拟环境。创建后激活进入虚拟环境,就可以clone或者install Gym了。

安装成功Gym强化学习工具包后,就可以在终端或者代码编辑器里import gym来开展强化学习的学习了。由于gym内置了很多函数和环境,所以我们可以通过方法来完成一些简单的演示操作。比如创建一个小车倒立摆模型,比如env = gym.make(‘CartPole-v0’)。初始化刷新,这就可以玩了。更多有趣的函数和功能,我们可以学习其中的文档和API。
【 python|让机器人智能体自己学会玩游戏,强化学习库gym很开放】