增强学习中mode_Free 的意思
来源:互联网 发布:淘宝首页装修图片尺寸 编辑:程序博客网 时间:2024/06/06 18:24
深度学习中模型用数学来表示:
S_,R= Model(S,A)
model可以是概率性的,也可以是确定性。
现行的大多数算法都是model_free的,因为model不容易取的,
model_free不是不和model打交道,相反,必须和model交互,交互的方式也是这个公式:
S_,R= Model(S,A)
关键在于,agent只能把S,A发送给环境(environment)才能获得S_,R,而并非model_Free的方法,比如动态规划,agent自己就知道的model的内容, 不需要跟环境打交道。
阅读全文
0 0
- 增强学习中mode_Free 的意思
- jquery中#的意思
- 学习笔记之JQuery 的$("#nav > li")中>的意思
- 学习/记忆力的增强
- 菜单中"..."省略号的意思
- Javascript中$符号的意思
- Javascript中$符号的意思
- VC中AFX的意思
- VC中AFX的意思
- C++中^符号的意思
- 路径中 符号的意思
- ARM7TDIMI中TDMI的意思
- Javascript中$符号的意思
- Javascript中$符号的意思
- printf中#号的意思
- linux中各$的意思
- C# 中SocketShutdown的意思
- Spring中PROPAGATION_REQUIRED的意思?
- Can't create handler inside thread that has not called Looper.prepare()
- 数据库链接报异常Communications link failure.Last packet sent to the server was 0 ms ago.
- 【编程素质】活动安排问题(会场安排问题、图着色问题)
- js获取地址栏参数,分离并保存为对象
- spring-security中的csrf防御机制
- 增强学习中mode_Free 的意思
- 托福考试的一些建议
- DFM弹幕库在直播中的使用
- Android 资源混淆
- 调用startactivityforresult后,onactivityresult立刻返回RESULT_CANCELED
- VB 实现VC TAbControl控件
- cocos 配置问题
- VMware 12 安装 macOS Sierra 0.12.4
- Tensorflow 04_: tensorboard或者tensorflow的一个"异常"