数据挖掘几个入门级的算法的总结(优缺点)
来源:互联网 发布:兔子 网络意思是什么 编辑:程序博客网 时间:2024/04/30 05:09
监督学习算法是指需要样本空间进行训练后才能作出预测或分类的算法,典型的例子有贝叶斯分类器、决策树和神经网络
非监督学习算法的代表有聚类算法和特征矩阵
可以从以下几个方面来比较算法:
1.支持增量式训练:在收录新的数据后能自行调整,修正判断,提高准确率而不需要重新训练
2.特征组合:能够响应特征组合,作出更精确的判断
3.是否是黑盒技术:指算法的中间过程是否易于理解,决策树算法易于理解,而SVM则像天书
按照上述角度比较监督学习算法,在括号内还会备注算法的其他特点:
1.朴素贝叶斯网络:支持,不支持,否(典型用途:垃圾邮件分类)
2.决策树:不支持,支持,否(不擅长对数值结果进行预测,典型用途:用户行为分析)
3.神经网络:不支持,支持,是(难于判断训练的比率,典型用途:根据用户点击结果优化搜索引擎)
4.SVM:不支持,支持,是(适用于高维和大数据样本,难点在于寻找最佳核变换函数,典型用途:社交网站的用户分类)
5.KNN:支持,不支持,否(确定各个特征的比重即缩放因子很复杂,典型用途:预测价格)
非监督学习算法:
1.层次合并:不停地合并相近项,产生树,对于大规模数据可以先抽取部分数据进行层次合并,然后把其余的数据根据距离分配到各个簇中去。
2.K均值聚类:不断修正聚类点的位置直到收敛(聚类点的位置不变),种子的数目和初始位置的选择很重要
3.特征矩阵:利用矩阵的因式分解获取特征和特征的权重
推荐阅读《集体智慧编程》,《Web数据挖掘》
- 数据挖掘几个入门级的算法的总结(优缺点)
- 数据挖掘几个入门级的算法的总结(优缺点)
- 数据挖掘分类算法的优缺点总结
- 数据挖掘--分类算法的优缺点
- 数据挖掘——各种分类算法的优缺点
- 数据挖掘算法总结--核心思想,算法优缺点,应用领域,数据挖掘优缺点
- 数据挖掘的入门
- 数据挖掘的几个基本概念
- 几个常用算法的适应场景及其优缺点(非常好)
- 数据挖掘常用算法优缺点分析
- 数据挖掘常用算法优缺点分析
- 数据挖掘十大算法总结--核心思想,算法优缺点,应用领域
- 数据挖掘十大算法总结--核心思想,算法优缺点,应用领域
- 数据挖掘算法总结
- 数据挖掘算法总结
- 几个正在进行的数据挖掘竞赛
- 几个免费的数据挖掘软件
- 关于数据挖掘的几个概念
- C/C++堆和栈介绍
- cocos2d-x屏幕适配原理分析
- 网页编码就是那点事
- Cocos2d-X对常用Object-C特性的替换
- MySQL查询缓存设置
- 数据挖掘几个入门级的算法的总结(优缺点)
- iOS 5编程 内存管理 ARC技术概述
- 开发者需知的10类工具
- cocos2d-x 2.0版本 自适应屏幕分辨率
- 方法覆盖子类不能抛出比父类范围更大的异常
- Android 反射调用方法并利用此方法展开android通知栏(兼容4.2及以上)
- 用C++品尝Vista美味:界面的毛玻璃效果
- 驻颜有术 郭德纲 林志颖
- 扫描sd卡