机器学习基本概念

来源:互联网 发布:057188157858是淘宝网 编辑:程序博客网 时间:2024/05/17 04:13

机器学习基本概念:
假设有一批关于西瓜记录的数据:
记录的集合称为“数据集”
每条记录是关于西瓜的描述称为“样本”
机器学习包括训练和测试两部分,根据训练数据是否拥有标记信息,学习任务大致分为两类“监督学习”和“无监督学习”分类和回归是前者的代表,聚类是后者的代表。
学得模型适用于新样本的能力,称为“泛化”能力
通常假设样本空间中全体服从一个未知“分布”,我们获得的每个样本都是独立地从这个分布上采样获得的,即“独立同分布”
过拟合:在训练集上效果很好,但在测试集上效果很差
非参数学习算法:参数的数目会随着训练数据的大小线性增大
参数学习算法:有一些固定的参数,用来进行数据拟合的算法
机器学习算法在学习过程中对某种类型假设的偏好,称为”归纳偏好“
论文中一些专业术语:
Proposal:使用特定算法提取出的可能是目标的区域
Groundtruth:监督学习中标记的样本的正确位置
Bounding box:使用特定算法提取出的样本的位置
ROI和proposal是一样的。

0 0
原创粉丝点击