斯坦福机器学习公开课随笔16

来源:互联网 发布:月经不调 知乎 编辑:程序博客网 时间:2024/04/29 20:47

回忆强化学习的思想:回报函数概念,运用某种方式来寻找事先定义好的一个好的行为与一个坏的行为,来让算法实现控制自己获得更多的积极回报和更少的惩罚。

这里写图片描述

这里写图片描述

这里写图片描述

0 0