机器学习基本概念

来源:互联网 发布:硕士毕业论文 知乎 编辑:程序博客网 时间:2024/06/06 10:40

概念学习:指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。

训练集/训练样例:用来进行训练,也就是产生模型或算法的数据集。

测试集/测试样例:用来专门进行测试已经学习好的模型或者算法的数据集。

特征向量:属性的集合,通常用一个向量来表示,附属/一个实例。

标记:实例类别的标记(结果)。

分类(classification):目标标记为类别型数据。

回归(regression):目标标记为连续性数值。

机器学习类型:
1)有监督学习(supervised learning):训练集有类别标记。
2)无监督学习(unsupervised learing):无类别标记。
3)半监督学习(semi-supervised learning):有类别标记的训练集+无类别标记的训练集。

机器学习步骤框架:
1) 把数据拆分为训练集和测试集
2) 用训练集和训练集的特征向量来训练算法
3) 用学习来的算法运用在测试集上来评估算法

机器学习中分类和预算算法的评估:
1) 准确率
2) 速度
3) 强壮化
4) 可规模性
5) 可解释性

原创粉丝点击