深度学习 1

来源:互联网 发布:数据库与服务器 编辑:程序博客网 时间:2024/06/11 21:48

基本概念
训练集,测试集、特征值、监督学习、非监督学习、半监督徐熙、分类、回归
概念学习:从某个布尔函数的输入输出训练样例中推断出该布尔函数
实例集合X
X:样例
x:每一个实例
C(x):目标概念
学习目标 f:X->Y

训练集 training set/data 训练样例training example
:用来专门训练,也就是产生模型或者算法的数据集。
测试集 testing set/data 测试样例 testing example
:用来专门测试已经学习好的模型或者算法的数据集
特征向量 feature/feature vector
:属性的集合,通常用一个向量表示,附属一个实例
标记
:实例的标记类别
正例、反例

分类classification :目标标记为类别型数据 (category)
回归regression :目标标记为连续性数值 (continuous number value)

例子:研究肿瘤良性,恶性于尺寸,颜色的关系
特征值:肿瘤尺寸 …
标记:良性、恶性 (分类:目标标记为类别型数据)

有监督学习(supervised learning):训练集有类别标记 (class label)
无监督学习(unsupervised learning):无类别标记
半监督学习(semi-supervised learning):有类别标记的训练集+无标记的训练集

机器学习框架

1:把数据拆分为训练集和测试集
2:用训练集和训练集的特征向量来训练算法
3:用学习来的算法运用在测试集上来评估算法(涉及到调整参数(parameter tuning)用验证集(validation set))

原创粉丝点击