数据挖掘之分类

来源:互联网 发布:零基础学算法进制 编辑:程序博客网 时间:2024/05/22 08:22

分类:
分类是这样的过程:使用类标签已知的样本建立一个分类函数或分类模型(也常常称作分类器),应用分类模型,能把数据库中的类标签未知的数据进行归类

分类在数据挖掘中是一项重要的任务
分类是过程,预测是目的

分类算法
决策树
逻辑回归
神经网络
支持向量机
贝叶斯分类
KNN
随机深林

典型应用:
流失预测
精确营销
客户获取
个性偏好
信用分析
欺诈预警

分类—决策树
决策树是描述分类过程中的一种数据结构,从上端的根节点开始,每一层节点依照某一属性值向下分为子节点,待分类的实例在每一个节点处与该节点相关的属性值进行比较,根据不同的比较结果想相应的子节点扩展,这一过程在到达决策树的叶节点结束

决策树算法有ID3、C5.0、CHAID、QUEST、C&R TREE
决策树算法位列10大算法之首

基础
《深入浅出数据分析(美)》 Michael Milton(著) 李芳(译)
《excel图表之道》 刘万祥
《统计学方法与数据分析引论》 R.L.奥特/M.朗格内克(著) 张忠占(译)

理论
《商务与经济统计》 安德森等(著) 王国成(译)
《数据挖掘导论》 Pang-Ning Tan等(著) 范明等(译)

案例
《数据挖掘实践》 Olivia Parr Rud(著) 朱扬勇等(译)
《数据挖掘与数据化运营实战:思路、方法、技巧与应用》 卢辉(著)

软件
《Clementine数据挖掘方法及应用》 薛薇、陈欢歌(著)
《SPSS统计分析基础教程(第2版) 》 张文彤(著)
《SPSS统计分析高级教程》 张文彤(著)
《SAS应用统计分析(第5版)》 罗纳德.科迪等(著) 辛涛(译)

文本挖掘
《智能Web算法》 Haralambos Marmanis(著) 阿稳等(译)

大数据
《大数据:互联网大规模数据挖掘与分布式处理》 Anand Rajaraman等(著) 王斌(译)

0 0
原创粉丝点击