OpenAI Gym4
来源:互联网 发布:程序员面试宝典5下载 编辑:程序博客网 时间:2024/06/13 09:32
记录和上传结果
前面三篇博文介绍了OpenAI Gym安装、使用以及基本环境。接下来介绍如何在OpenAI Gym平台测试自己的强化学习的算法,可以轻松地记录自己算法在环境中的表现,以及拍摄自己算法学习的视频,只需使用Monitor Wrapper包装自己的环境,如下所示:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
在提供的目录将记录自己算法的性能。 Monitor是相当复杂的,并支持写入单个目录的环境的多个实例。
然后,可以将结果上传到OpenAI Gym:
- 1
- 2
输出应如下所示:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
评估
每次上传都会导致OpenAI Gym的服务器上的评估对象,然后,自己应该创建一个Gist,显示如何重现自己算法的结果,评估页面将具有如下您可以通过Gist网址的框:
或者,也可以通过传递写入参数在上传时提供Gist:
- 1
- 2
评估将自动得分,并有一个漂亮的页面。在大多数环境中,您的目标是尽量减少达到阈值级别的性能所需的步骤数。(每个环境定义阈值)在某些环境(特别是非常困难的环境)下,尚不清楚该阈值是什么,此时,目标是使最终的表现最大化。
到这里OpenAI Gym的学习就告一段了,接下来就是验证相关的强化学习算法了。
阅读全文
0 0
- OpenAI Gym4
- OpenAI教程
- OpenAI gym
- OpenAI Gym1
- OpenAI Gym2
- OpenAI Gym3
- openAI gym5
- OpenAI gym: 'Copy-v0'
- OpenAI:generative-models blogs
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI Gym使用
- OpenAI Gym介绍
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI gym入门
- 字节序总结
- OpenAI Gym3
- 嵌套查询 别名使用
- 51nod 1179 最大的最大公约数
- 矩阵积分某主页
- OpenAI Gym4
- 判断浏览器是否用微信访问
- Javaweb中的cookie与session
- Emacs搭建开发环境(ECB+Cedet)
- Python语言入门(一)字符串操作
- jzoj 1769 islands and bridge
- 小波变换教程(九)
- HTTP请求报文和响应报文
- "java文件-class文件-JVM显示" 编码执行过程