07数据挖掘原理-数据挖掘

来源:互联网 发布:java web编程宝典 pdf 编辑:程序博客网 时间:2024/06/05 17:13

数据挖掘的发展过程。 1关系型数据库 -》2数据仓库 -》3数据挖掘-》4大数据挖掘。


xx网北京地区2013年1月份的注册数是多少,                                             关系型数据库的解决方案:查询单个数据库,mysql,特点一个数据库。


xx网北京地区,上海地区,广州地区2013年1月份的注册数个是多少 ,    数据仓库的解决方案:数据仓库,OLAP,多个数据库,特点多个数据库,或者大型的数据仓库。


对xx网北京区的用户为注册的性别的用户划上性别,以便按这个特定人群推销特定的产品 ,    数据挖掘的解决方案:单机聚类算法,分类算法等高级算法,特点注重算法,在单机上。


对xx网北京地区,上海地区,广州地区的用户为注册的性别的用户划上性别,以便按这个特定人群推销特定的产品 ,   大数据挖掘的解决方案:分布式的聚类算法,分类算法等高级算法,特点注重算法,分布式的集群跑同一个算法。


数据挖掘的场景,分为客户场景,产品场景,营销场景,基础场景。


 客户场景(分为以下几种需求)

           1:客户细分 ,适合聚类模型,算法:kmeans,canopy

           2:价值评估 ,适合指标估计模型,算法:层次分析

           3:客户识别 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树

           4:满意度评估 ,适合指标估计模型,算法:结构方程

           5:客户偏好 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树


 产品场景(分为以下几种需求)

           1:产品定价 ,适合定价模型,算法:价格弹性,PSM

           2:健康度评估 ,适合指标估计模型,算法:主成分分析,层次分析

           3:分类 ,适合聚类模型,算法:kmeans,canopy


 营销场景(分为以下几种需求)

           1:精准营销 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树

           2:交叉营销 ,适合关联模型,算法:apriori

           3:内容营销 ,适合分类模型,算法:朴素贝叶斯,逻辑回归,决策树


 基础场景(分为以下几种需求)

           1:KPI诊断 ,适合异常分析,趋势分析模型,算法:方差分布和时间序列

           2:网络选址 ,适合数据分析模型,算法:交叉分析

           3:指标预测 ,适合预测模型,算法:时间序列,线性回归,aprima


数据挖掘的算法,按照任务类型,分为分类算法,聚类算法,关联算法,预测算法。


分类算法的应用场景:

          1客户流式预测

          2精准营销

          3客户获取

          4个性偏好

          5信用分析

          6欺诈预警


聚类算法的应用场景:

        1客户细分

        2客户研究

        3市场细分

        4价值评估

        5精准营销


预测算法的应用场景:

        1用户数量预测

        2收入预测

        3目标制定

        4业务发展分析


关联算法的应用场景

        1交叉销售

        2套餐销售

        3网页设计

        4目录设计,类型设计 


数据挖掘的十大算法

        1:C4.5  (决策树,判别数,属于分类算法)

        2:K-means (K-平均值法,属于聚类算法)

        3:SVM(支持向量机,属于分类算法)

        4:Apriori(关联规则挖掘,属于关联算法)

        5:EM(期望最大值算法,属于聚类算法与参数估计)

        6: PageRank(网页价值评估算法,google的页面评价算法)

        7:Adaboost(积弱为强的分类算法,属于分类算法)

        8:KNN(以近邻为楷模的分类算法,属于分类算法)

        9:navie bayes(朴素贝叶斯,属于分类算法)

        10:CART(二分递归的判别树,属于分类算法)


数据挖掘的步骤:1商业理解 - 2数据理解 - 3数据准备 - 4建立模型 - 5模型评估 - 6模型发布.




0 0
原创粉丝点击