机器学习实战之决策树
来源:互联网 发布:servlet 返回json数据 编辑:程序博客网 时间:2024/05/17 17:54
理论基础:信息论
1. 熵(entropy)H(S)用来测量一个数据集S的不确定程度。
-
- X -S中类别的集合
-
在ID3中,对每一个属性熵,熵最小的属性在本次迭代中用来划分数据集。
2. 信息增益(information Gain)
信息增益
- H(S):集合S的熵
- T:数据集S被属性A划分后产生的子集 的集合
-
-
- 在一次迭代中信息增益最大的属性用来划分数据集
学习内容
2. 常用的获取列表的方法:
f=[exmaple[0] for exmaple in myDat],返回一个list
myDat=[ [0,1,2] , [1,1,2] , [1,3,2] ]
f=[0,1,1]
3. matplotlib.pyplot.subplot(*args,**kwargs)
subplot(nrows,ncols,plot_number):把一个图分成nrow*ncols个子图,在plot_number中画图
如果这三个参数都小于10,可以写成subplot(211)
4. matplotlib.pyplot.annotate(*args,**kwargs)
创建注释:
5. 函数特殊属性:__dict__
__dict__用来存储一个对象的属性的字典或映射
经常会看到在一个函数中出现另一个函数的属性,如:在plottree中会出先plottree.yoff=…..,在其他函数中也会出现plottree.xoff=….
这样就可以添加plottree函数的属性,也可以利用__dict__来添加属性plottree.\_\_dict\_\_['mul']=mul ##其中mul可以是一个函数
通过dir(functionname)
可以查看函数的属性
6. pickle模块中dump函数 pickle.dump(obj,file[,protocol])
将对象obj写入打开的文件对象file中,文件对象必须具有写属性。
fw=open(filename,'w')pickle.dump(inputTree,fw)fw.close#####从文件中载入时:fr=open(filename)tree=pickle.load(fr)
7. 列表list中append和extend的区别:
a=[1,2,3]b=[4,5,6]a.append(b)a=[1,2,3,[4,5,6]]a.extend(b)a=[1,2,3,4,5,6]
- 机器学习实战之决策树
- 机器学习实战之决策树
- 机器学习实战之决策树
- 机器学习实战之决策树
- 《机器学习实战》之决策树
- 机器学习实战之决策树
- 机器学习实战之决策树
- 机器学习实战之决策树
- 机器学习实战之决策树
- 《机器学习实战》之决策树
- 《机器学习实战》之ID3决策树算法
- 3.机器学习实战之决策树
- 机器学习实战之决策树ID3算法
- 《机器学习实战》之决策树-笔记2
- Python机器学习实战之决策树分类
- 机器学习实战---决策树
- 机器学习实战-决策树
- 机器学习实战---决策树
- 机器学习实战之KMean
- 编译Android平台的OpenCV生成动态库
- IIS Express 启用目录浏览
- iOS 判断字符串中含有某个字符串 rangeOfString
- Image,zImag与uImage
- 机器学习实战之决策树
- MVC使用脚本刷新部分页面
- ArrayBuffer:类型化数组
- RasSetCustomAuthData
- Android的生命周期
- Android基础之四层架构
- Pandas中resample方法详解
- the request was rejected because no multipart boundary was found??求解
- 树 facetest