machine Algorithm总结
来源:互联网 发布:对电影台词软件 编辑:程序博客网 时间:2024/06/05 04:01
构造决策树的思路如下;
(1)选择属性放在根结点,为每个可能的属性值产生一个分支
(2)将样本集划分为多个子集,每个子集对应一个分支
(3)在每个分支上递归重复这个过程,仅使用真正到达这个分支的样本
(4)如果在一个节点上所有样本拥有相同的类别,即停止该部分树的扩展
构造决策树的方法如下:ID3&C4.5&CART
构建决策树的算法所用的策略:ID3(information gain)、C4.5(Gain Ration)、CART(Gini Index)
构造决策树停止的时间如下:one:定义一个停止树进一步生长的条件;two:生成完全的树后再进行剪枝。
其中算法ID3根据信息增益多的属性进行划分数据集,选择好分裂属性后就开始进行构造决策树
信息量的计算公式:
I(x)=-log p(x)
信息熵的计算公式如下:
H(x)=求和从1到n(p(xi)I(xi))
KNN(K nearest Neighbor)k最近邻算法
其中K表示接近自己的k个样本
算法思路:
(1)计算已知类别数据集中每个点与当前点的距离
(2)选取与当前点距离最小的k个点
(3)统计前k个点中每个类别的样本出现的频率
(4)返回前k个点中出现频率最高的类别作为当前点的预测类别
0 0
- machine Algorithm总结
- Machine Learning Algorithm
- Machine Learning—AdaBoost algorithm
- Sort Algorithm 总结
- Algorithm--排序算法总结
- algorithm库函数总结
- 《Machine-Learning》课程总结
- machine learning-model总结
- Support Vector Machine Algorithm(SVM)算法详细解析
- Support Vector Machine Algorithm For Regression(SVR)算法详细解析
- [文献阅读] Decoding Algorithm in Statistical Machine Translation
- Machine Learning—The k-means clustering algorithm
- Machine Learning—Mixtures of Gaussians and the EM algorithm
- PLA Percentron Learning Algorithm #台大 Machine learning #
- [Machine Learning] Generative learning algorithm-GDA and NB
- [Machine Learning]--Improving classification with the AdaBoost meta-algorithm
- 斯坦福公开课Machine Learning笔记(四)--Generative Learning Algorithm
- [Machine Learning & Algorithm] 随机森林(Random Forest)
- ObjC第四节:继承
- 删除两个双向链表中重复元素
- iOS应用架构谈 网络层设计方案
- mac book air 安装win10
- 最短摘要生成
- machine Algorithm总结
- uva 313 - Intervals(几何)
- Maven2的配置文件settings.xml解析
- 美素数(hdu 4548)打表
- JMS基础知识
- 软件生命周期
- poj 3450 Corporate Identity 【暴力KMP】
- LeetCode之Validate Binary Search Tree
- 第一章-Linux系统安装