举例说明强化学习以及监督学习的区别
来源:互联网 发布:世纪证券交易软件 编辑:程序博客网 时间:2024/04/29 21:11
可以分为两方面看:
种西瓜的例子
强化学习是一个多次决策的过程,可以形成一个决策链,即西瓜书上种西瓜的例子;监督学习只是一个一次决策的过程。
摇杠赌博机的例子
强化学习:赌徒没有初始数据集,只能通过用某种策略取测试摇杠,期望能在整个测试过程得到最好的收益;
监督学习:赌徒一开始就统计了所有用户在赌博机上的收益情况,然后进行监督学习得到模型。等赌徒操作摇杠赌博机时直接利用模型得到该摇哪个摇杠。
这里面也隐含着:强化学习在测试收集数据的过程中是有代价的,而监督学习是一开始就给定了数据集,收集数据集的代价是其他人所承担的,所以监督学习不用考虑这部分的代价。
阅读全文
0 0
- 举例说明强化学习以及监督学习的区别
- 监督学习、无监督学习、强化学习
- 监督学习、无监督学习、半监督学习、强化学习
- RL笔记_强化学习与监督学习的一些区别
- 监督,非监督和强化学习
- 斯坦福大学机器学习笔记——机器学习基础以及有监督学习和无监督学习举例说明
- 【机器学习 基本概念】监督学习、无监督学习、半监督学习与强化学习
- 机器学习分类:监督学习、无监督学习、半监督学习、强化学习
- 有监督学习和无监督学习的区别
- 监督学习和非监督学习的区别
- 监督学习与非监督学习的区别
- 监督学习和无监督学习的区别
- 有监督学习和无监督学习的区别
- 机器学习中的有监督学习,无监督学习,半监督学习的区别
- 监督学习和无,监督学习区别
- 监督学习or无监督学习 区别
- 机器学习之非监督学习与强化学习
- 监督学习--分类与回归的区别
- Jquery的相关操作
- Spring入门(Spring对JSR支持的说明)
- MySQL5.7 group by新特性,报错1055
- 对带缓存区的标准IO的理解
- 乱码
- 举例说明强化学习以及监督学习的区别
- python正则表达式flags标志位
- pinpoint实现分布式系统的监控
- hdu 2829 斜率DP 板子
- Qt下SeetaFace算法测试
- 人难管事难做,管理怎么办
- 使用360修复电脑后,GitLab无法使用的解决办法
- 串口中怎样接收一个完整数据包的解析
- 引用单元测试模块unittest框架(四)