机器学习名词

来源:互联网 发布:淘宝美工首页一般多久 编辑:程序博客网 时间:2024/06/03 03:55

训练,测试,验证

交叉验证数据集:验证集

验证集:假设不知道结果,进行多次验证

测试:机器学习模型只能在测试集上跑一次


过拟合 (overfit) 和欠拟合 (underfit)

过拟合:拟合的过于精确,没什么用

欠拟合:不够

 accuracy? precision? recall?

比喻:你回答真但答案是假,这是假阳性;你回答为假但是答案为真,则为假阴性。很明显,阳性阴性是对应着你的回答。



 learning rate

计算完梯度以后,模型就需要更新它的参数了。梯度指出了一个让 loss 提升最快的方向(没错是提升),学习率控制我们应该朝反方向走多远,学习率太大了可能会越过最低点,变得难以收敛甚至会发散。学习率调低一般就能回避 overshoot 的问题了,但是调太低会让模型半天不挪窝,于是模型会收敛得很慢。这对小规模的机器学习问题影响不大

找一个合适的学习率很重要