增强学习中mode_Free 的意思

来源:互联网 发布:淘宝首页装修图片尺寸 编辑:程序博客网 时间:2024/06/06 18:24

深度学习中模型用数学来表示:
S_,R= Model(S,A)

model可以是概率性的,也可以是确定性。
现行的大多数算法都是model_free的,因为model不容易取的,

model_free不是不和model打交道,相反,必须和model交互,交互的方式也是这个公式:
S_,R= Model(S,A)
关键在于,agent只能把S,A发送给环境(environment)才能获得S_,R,而并非model_Free的方法,比如动态规划,agent自己就知道的model的内容, 不需要跟环境打交道。

原创粉丝点击