OpenAI gym入门
来源:互联网 发布:查看ip的端口是否打开 编辑:程序博客网 时间:2024/05/21 06:42
OpenAI gym入门
安装
使用pip安装gym:
pip install gym
运行 CartPole 的环境来验证安装成功:
import gymenv = gym.make('CartPole-v0') # 环境导入env.reset()for _ in range(1000): env.render()env.step(env.action_space.sample()) # 随便动一动~~~
增强学习基本原理
agent:智能体,也就是机器人,你的代码本身。
environment:环境,也就是游戏本身,openai gym提供了多款游戏,也就是提供了多个环境。
action:行动,比如玩超级玛丽,向上向下等动作。
state:状态,每次智能体做出行动,环境会相应地做出反应,返回一个状态和奖励。
reward:奖励:根据游戏规则的得分。智能体不知道怎么才能得分,它通过不断地尝试来理解游戏规则,比如它在这个状态做出向上的动作,得分,那么下一次它处于这个环境状态,就倾向于做出向上的动作。
阅读全文
0 0
- OpenAI gym入门
- OpenAI gym
- OpenAI gym: 'Copy-v0'
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI Gym使用
- OpenAI Gym介绍
- OpenAI Gym学习
- OpenAI Gym学习
- OpenAI Gym 入门与提高(一) Gym环境构建与最简单的RL agent
- 基于OpenAI Gym学习强化学习
- OpenAI Gym 关于CartPole的模拟退火解法
- Play with OpenAI Gym in Ubuntu 16.04: Hello World
- OpenAI Gym:给恶意软件穿上“隐身衣”
- 马斯克的AI野心——OpenAI Gym系统深度解析
- Ubuntu安装Pyenv+Anaconda2+PyCharm+OpenAI-gym+Cuda+TensorFlow (一)
- Unity中创建攻击Slot系统
- AR表
- 霸王链小程序开发源码分析
- springMVC注解@RequestParam解析
- Java 实现 UDP
- OpenAI gym入门
- 查看mysql表结构和表创建语句的方法
- HTML总结
- [Java]JDK1.8 ArrayList源码剖析(二)
- solr5全量索引配置
- LeetCode-Count of Smaller Numbers After Self
- 理解-MFCC梅尔倒谱系数
- KendoGrid 动态显示/隐藏列(Column)
- ie浏览器下删除父元素的父元素(祖父元素)-----remove()方法在ie下失效的解决方法