程序博客网 > 明星网络暴力

机器学习笔记一

来源：互联网发布：明星网络暴力编辑：程序博客网时间：2024/05/22 11:48

机器学习笔记

刚刚接触机器学习，在看周志华那本西瓜书，做了一些笔记。
机器学习符号以及读法

基本术语

取值为：=
样本： 每条记录是关于一个对象的描述
数据集： 一组数据的集合
特征/属性： 反映事件或对象在某些方面的表现或性质的事项
属性值： 属性上面取值
样本空间： 属性张成的空间
数据集： D = {x1,x2...xm}
向量： Xi = (Xi1;Xi2;...Xid)
学习/训练： 从数据中学得模型的过程
训练数据： 训练过程使用的数据
训练样本： 每个样本
假设 学得模型对应了关于数据的某种潜在的规律
真相/真实： 潜在规律自身
分类：预测的是离散值好/坏
回归： 预测的是连续值
涉及两个类别的“二分类”任务通常称其中一个类为“正类”另一个类为“反类”
测试：学得模型后进行预测的过程
测试样本：被预测的样本
泛化能力：“学得模型适用于新样本的能力


学习任务：
监督学习: 分类; 回归
无监督学习: 聚类

学习过程就是为了找出或逼近真相
机器学习的目标是使得学得的模型能很好的适用于“新样本”

假设空间

科学推理
归纳->从特殊到一般的“泛化”过程
演绎->从一般到特殊的“特化”过程

归纳学习：
广义上定义：从样例中学习
狭义上定义：从训练数据中学得概念

概念学习中最基本的是布尔概念学习

版本空间：可能有多个假设与训练集一致，即存在着一个与训练集一致的“假设集合”（学得的结果）

归纳偏好

机器学习算法在学习过程中对某种类型假设的偏好

奥卡姆剃刀——引导算法确立“正确的”偏好
（若有多个假设与观察一致，则选择最简单的那个）

没有免费的午餐定理（NFL定理）

无论学习算法ξa多么聪明，ξb多笨拙，他们的期望性能相同
前提：所有“问题”出现的机会相同，或所有问题同等重要
结论：由于对所有可能函数的相互补偿，最优化算法的性能是等价的
暗指：没有其他任何算法能够比搜索空间列举或者纯随机搜索算法更优

阅读全文

0 0

明星网络暴力

明星网络暴力

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子买防化服防化服品牌防化服价格防化护目镜化学防化服二级防化服进口防化服防化陆军防化学院防化学院是重点军校吗全密封防化服重型防化服价格防化服一年多少钱防卫过当地球防卫军假想防卫正当防卫四偶然防卫无限防卫权无限防卫地球防卫军5 防卫地球防卫女子队正当防卫4手游下载正当防卫3配置防卫过当认定标准地球防卫女子队在线播放正当防卫2安卓版下载正当防卫三下载手机版地球防卫少年正当防卫3下载正当防卫四下载被打还手算正当防卫吗别人打我怎么算正当防卫多人打一人还手算正当防卫么防嗮喷雾能带上飞机吗防嗮喷雾防嗮如何防晒夏天如何防晒物理防晒