机器学习基石-03-2-learning with different Data Labels

来源:互联网 发布:怎么恢复网络默认设置 编辑:程序博客网 时间:2024/05/21 06:37

1.supervised learning监督学习:每一个xn都有对应的yn

2.unsupervised learning无监督学习,没有yn



3.Semi-supervised半监督学习: Coin Recognition with Someyn

4.Reinforcement Learning强化学习


当你很难定义yn="坐下"的时候,可以找另一个yn="撒尿是不对的行为”进行惩罚punish;

此时狗狗听指令坐下了,但是yn="坐下"还是很难定义,再找一个新的yn="坐下是好的行为"进行奖励reward。

reinforcement learning:

1.不是在原有的输出yn=“sit”做评价,而是在新的yn上面进行“punish惩罚”或者“reward奖励”;

2.不是大批量输入的而是sequentially一次一次地逐次输入的。


总结


阅读全文
0 0