西瓜书笔记

来源:互联网 发布:复印纸品牌 知乎 编辑:程序博客网 时间:2024/05/02 11:49

西瓜书笔记


  • 西瓜书笔记
    • 1绪论
      • 基本术语
    • 2模型评估与选择
    • 3线性模型
    • 4决策树
    • 5神经网络
    • 6向量机
    • 7贝叶斯分类
    • 8集成学习
    • 9聚类
    • 10降维与度量学习
    • 11特征选择与稀疏学习
    • 12计算学习理论
    • 13半监督学习
    • 14概率图模型
    • 15规则学习
    • 16强化学习


1、绪论


基本术语

  1. 数据集data set):一组数据记录的集合;
  2. 每一条记录代表一个事件或对象的描述,称为一个“示例”(instance)或样本sample);
  3. 反映事件或对象某方面的表现或性质的事项,称为属性attribute)或特征feature);
  4. 属性上的取值称为属性值attribute value), 属性构成的空间称为属性空间attribute space)、样本空间sample space)或输入空间
  5. 将“色泽”“根蒂”“敲声”作为三个坐标轴,它们张成一个用于描述西瓜的三维空间,每个西瓜都能在坐标找自己的坐标位置,由于空间的每个点对应一个坐标向量,因此也把一个示例称为一个“特征向量”(feature vector
  6. 一般地,令
    D={x1+xx++xm}
    表示包含m个示例的数据集,每个示例由d个属性描述(例如上面的西瓜数据使用了3个属性),则每个示例
    xi=(xi1;xi2;;xid)
    是d维样本空间χ中的一个向量,xiχ其中xijxi在第j个属性上的取值(例如第三个西瓜的第2个属性的值是”硬挺”),d称为样本xi的”维数”(dimensionality).
  7. 7.

2、模型评估与选择

3、线性模型

4、决策树

5、神经网络

6、向量机

7、贝叶斯分类

8、集成学习

9、聚类

10、降维与度量学习

11、特征选择与稀疏学习

12、计算学习理论

13、半监督学习

14、概率图模型

15、规则学习

16、强化学习

0 0
原创粉丝点击