《Machine Learning in&…

来源:互联网 发布:淘宝 618 大促 销售额 编辑:程序博客网 时间:2024/05/20 05:52

第一部分 分类http://blog.csdn.net/u012005313/article/details/49151341


监督学习一般使用两种类型的目标变量:标称型和数值型

标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类)

数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等(数值型目标变量主要用于回归分析)


知识表示可以采用规则集的形式,也可以采用概率分布的形式


在无监督学习中,将寻找描述数据统计值的过程称之为密度估计


目的->预测目标变量的值|是->监督学习算法|->离散性->分类器算法

--------------------------|-------------------|->连续性->回归算法

--------------------------|否->无监督|->仅仅只需要将数据化为几个离散的组->聚类算法

--------------------------------------|->还要估计数据与每个分组的相似程度->密度估计算法

1.5 开发机器学习应用的步骤

(1)收集数据(2)准备输入数据(3)分析输入数据(4)训练算法(5)测试算法(6)使用算法

 

科学函数库Scipy Numpy 可以与绘图工具Matplotlib协同工作。