07数据挖掘原理-数据挖掘
来源:互联网 发布:java web编程宝典 pdf 编辑:程序博客网 时间:2024/06/05 17:13
数据挖掘的发展过程。 1关系型数据库 -》2数据仓库 -》3数据挖掘-》4大数据挖掘。
xx网北京地区2013年1月份的注册数是多少, 关系型数据库的解决方案:查询单个数据库,mysql,特点一个数据库。
xx网北京地区,上海地区,广州地区2013年1月份的注册数个是多少 , 数据仓库的解决方案:数据仓库,OLAP,多个数据库,特点多个数据库,或者大型的数据仓库。
对xx网北京区的用户为注册的性别的用户划上性别,以便按这个特定人群推销特定的产品 , 数据挖掘的解决方案:单机聚类算法,分类算法等高级算法,特点注重算法,在单机上。
对xx网北京地区,上海地区,广州地区的用户为注册的性别的用户划上性别,以便按这个特定人群推销特定的产品 , 大数据挖掘的解决方案:分布式的聚类算法,分类算法等高级算法,特点注重算法,分布式的集群跑同一个算法。
数据挖掘的场景,分为客户场景,产品场景,营销场景,基础场景。
客户场景(分为以下几种需求)
1:客户细分 ,适合聚类模型,算法:kmeans,canopy
2:价值评估 ,适合指标估计模型,算法:层次分析
3:客户识别 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树
4:满意度评估 ,适合指标估计模型,算法:结构方程
5:客户偏好 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树
产品场景(分为以下几种需求)
1:产品定价 ,适合定价模型,算法:价格弹性,PSM
2:健康度评估 ,适合指标估计模型,算法:主成分分析,层次分析
3:分类 ,适合聚类模型,算法:kmeans,canopy
营销场景(分为以下几种需求)
1:精准营销 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树
2:交叉营销 ,适合关联模型,算法:apriori
3:内容营销 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树
基础场景(分为以下几种需求)
1:KPI诊断 ,适合异常分析,趋势分析模型,算法:方差分布和时间序列
2:网络选址 ,适合数据分析模型,算法:交叉分析
3:指标预测 ,适合预测模型,算法:时间序列,线性回归,aprima
数据挖掘的算法,按照任务类型,分为分类算法,聚类算法,关联算法,预测算法。
分类算法的应用场景:
1客户流式预测
2精准营销
3客户获取
4个性偏好
5信用分析
6欺诈预警
聚类算法的应用场景:
1客户细分
2客户研究
3市场细分
4价值评估
5精准营销
预测算法的应用场景:
1用户数量预测
2收入预测
3目标制定
4业务发展分析
关联算法的应用场景
1交叉销售
2套餐销售
3网页设计
4目录设计,类型设计
数据挖掘的十大算法
1:C4.5 (决策树,判别数,属于分类算法)
2:K-means (K-平均值法,属于聚类算法)
3:SVM(支持向量机,属于分类算法)
4:Apriori(关联规则挖掘,属于关联算法)
5:EM(期望最大值算法,属于聚类算法与参数估计)
6: PageRank(网页价值评估算法,google的页面评价算法)
7:Adaboost(积弱为强的分类算法,属于分类算法)
8:KNN(以近邻为楷模的分类算法,属于分类算法)
9:navie bayes(朴素贝叶斯,属于分类算法)
10:CART(二分递归的判别树,属于分类算法)
数据挖掘的步骤:1商业理解 - 2数据理解 - 3数据准备 - 4建立模型 - 5模型评估 - 6模型发布.
- 07数据挖掘原理-数据挖掘
- 数据挖掘--序列挖掘
- 数据挖掘--文本挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 数据挖掘
- 状态(state) in Java
- 委托和事件的使用
- js本地缓存的生成和读取
- python base64 encode and decode image
- 空对象(null Object) in Java
- 07数据挖掘原理-数据挖掘
- Linux内核驱动学习
- C++ primer 习题笔记第10~12章
- iOS开发的兼容和适配问题
- 时间表示
- 备忘录(memento) in Java
- oracle-over函数
- ubuntu下apt-get安装和彻底卸载mysql (http://blog.163.com/anonymous_ch/blog/static/206824190201391141636949/)
- 使用Linq时,根据特定的字符串名称,找到对应字段并获取值