数据挖掘中常见的分析项目类型

来源:互联网 发布:淘宝评价达人什么意思 编辑:程序博客网 时间:2024/05/21 19:43

1.目标用户的特征分析
在目标用户的典型特征分析钟,业务场景可以是试运营之前的虚拟特征探索,也可以是试运营之后来自真实运营数据基础上的分析、挖掘与提炼
虚拟特征探索:由于目标用户在真实的业务场景中还没有产生,并没有与真实业务环境一致的数据来源可以用于分析目标用户特点,因此只能通过简化、类比等方法寻找与真实业务环境相近的数据来源,然后进行模拟和探索,并从中发现一些可以借鉴和参考的目标用户特征,然后放到真实的业务环境中进行试运营,然后根据真实的效果反馈数据,修正我们的目标用户特征
2.目标用户的预测(响应、分类)模型
目标用户的预测(响应、分类)模型包括流失预警模型、付费预测模型、续费预测模型、运营活动响应模型等
响应模型的核心就是响应概率
预测(响应、分类)模型基于真实业务场景产生的数据进行搭建,主要的数据挖掘技术包括逻辑回归、决策树、神经网络、支持向量机等
响应模型包括普通响应模型和稀有事件响应模型,一般来说,如果响应比例低于1%,则判定为稀有事件响应模型,核心就是抽样,通过抽样技术认为放大分析数据样本里面的响应时间的比例,增加响应事件的浓度,从而在建模过程中更好的捕捉、你和其中自变量和因变量之间的关系
3.运营群体的活跃度定义
两个基本点:1.活跃度的组成指标应该是该业务场景中最核心的行为因素 2.衡量活跃度的定义合适与否的重要判断依据是其是否能有效回答业务需求的终极目标
活跃度的定义设计的统计技术:主成分分析、数据的标准化
主成分分析的主要目的:把多个核心行为指标转化为一个或者少数几个主成分,并最终转换成一个综合的分数,同时,取第一个主成分还是前几个主成分,主要是由主成分分析的特征根和累计方差贡献率决定的
4.用户路径分析
主要是分析用户在网页上流转的规律和特点,发现频繁访问的路径模式
用户路径分析的主要用途:提炼特定用户群体的主流路径、网页设计的优化和改版、用户可能浏览的下一个页面的预测、特定群体的浏览特征
路径分析所用的数据主要是Web服务器中的日志数据
路径分析常用的分析技术有两类:1、有算法支持 2、严格按照步骤顺序遍历主要路径
路径分析的主要用途:监控运营活动、通过路径分析,提炼新的有价值的频繁路径模式
5.交叉销售模型
交叉销售模型主要是通过对用户历史消费数据的分析挖掘,找出有明显关联性质的商品组合,然后用不同的建模方法,去构建消费者购买这些关联商品组合的可能性模型,然后再用其中优秀的模型,预测新客户中购买特定组合的可能性
构建交叉销售模型:1.按照关联技术,也就是购物篮分析,发现那些有较大可能被一起采购的商品,将它们进行有针对性的促销和捆绑,这就是交叉销售2.借鉴响应模型的思路,为某几种重要商品建立预测模型,对潜在消费者使用模型进行过滤,然后针对最有可能的钱50%用户进行精确地营销退关 3. 让重要商品两两组合,找出那些最有可能消费的潜在客户 4.通过决策树的树状规则,发现基于具体数据资源的具体规则
建模分析的技术:关联分析、序列分析、即在关联分析的基础上,加入先后顺序、预测(响应、分类)模型
6.信息质量模型
信息质量模型应用的场合主要包括商品Offer质量优化、网上店铺质量优化、网上论坛的发帖质量优化、违禁信息的过滤优化
构建信息质量模型的主要数据挖掘技术:回归算法、决策树等
如果没有明确的来自实际数据的目标变量,可以通过专家打分、模型拟合是一个比较合适的变通策略,通过专家对标题长度、图片质量、属性选填的比例等的打分,然后取得每种商品offer的具体分数,然后作为目标变量,然后利用数据挖掘的各种模型去拟合这些要素和总分数的关系,形成一个合适的模型,同时,为了更加准确,还可以加上客户挑檐,然后对专家的打分和各要素的权重进行修正,最后在修正的基础上进行模型的搭建和拟合
7.服务保障模型
服务保障模型主要站的是客户的角度,出发点是为了让客户更好的做生意,达成更多的交易,比如让卖家购买合适的增值产品,续费合适的增值产品,卖家商业信息的违禁过滤,卖家社区发帖的冷热判断等,凡是可以更好的武装卖家,可以让卖家更好的服务买家的错事,都属于服务保障的范畴
8.用户(卖家、买家)分层模型
分层模型是介于粗放运营与基于个体概率预测模型之间的一种折中和过渡模型,既兼顾了精细化运营的需要,又不需要太多的资源投入到预测模型的构建和维护中
分层模型主要应用的场景:1、客户服务团队需要根据分层模型来针对不同的群体提供不同的说辞和响应的服务套餐 2、企业管理层需要基于在线交易买家数量来形成以其为核心的卖家分层金华师徒 3、运营团队需要根据分层模型来制定响应的运营方案
分层模型常用的技术:统计分析技术(相关性分析、主成分分析等)、预测(响应、分类)模型
9.卖家(买家)交易模型
主要目的是为买卖双方服务,帮助卖家获得更多的买家反馈,促进卖家完成更多的交易
10信用风险模型
信用风险模型包括欺诈预警、纠纷预警、高危用户判断
其中欺诈识别模型的时效更短,需要更新的频率更高,因为行骗的手段变化很大程度上是随机性的,因此对欺诈预警模型的及时性和准确性有严重的挑战
11.商品推荐模型
规则模型,常用的算法有Apriori算法,支持度和置信度
协同过滤中,有K最近邻居算法、因子模型等
协同过滤:基于用户的协同过滤(User-Based CF)、基于物品的协同过滤(Item-Based CF)