数据分析基础

来源:互联网 发布:淘宝冻结账户开通 编辑:程序博客网 时间:2024/05/22 02:15

所有的分析要从结果出发,没有结论的数字罗列并不是分析
结果:发现问题和解决问题
数据分析建立在业务模型的基础上
数据分析是基于数据严谨的分析过程

数据分析是使用统计方法对收集的大量数据进行分析、理解,达到业务分析的目的
数据分析是为了获取有用的信息和结论而对数据进行分析和研究的过程

数据分析需要用业务的思维去使用技术
摒弃唯技术论
业务思维很重要
简洁的模型普适性更好

数据分析有时候是一门艺术
同样的数据会有不同的解读
优秀和平庸的差异,有时候差在一种灵感

数据分析的工作内容
分析思路的4W模式:发生了什么,为什么发送,未来如何发展,应如何决策
八个等级:常规报表,即席查询,多维分析,报警,统计分析,预报,预测性模型,优化
四类报告:描述性报告,探索性报告,预测性报告,咨询性报告
两个阶段:描述阶段,挖掘阶段

如何做数据分析:
想清楚:做什么,能否做,怎样做
做正确:数据正确,方法正确
又结论:有图,有结论

想清楚
业务问题是什么:业务知识,业务现状,业务需求,业务问题
我们能否做:复杂性,有用性,可行性
我们怎么做:数据,人员,方案

做正确
数据:数据的获取,数据的审核,数据的处理,数据的加工
方法论:逻辑树,5w2h,pest
方法:基础数据分析方法,高级数据分析方法挖掘模型

数据分析、数据挖掘软件

spss,statistical package for social science

数据分析师需具备的素质
严谨的态度,强烈的兴趣,专业的知识,业务的理解

数据分析师专业要求:
统计学,多元统计学,时间序列,数据挖掘原理,流程,任务和主要算法,熟练使用excel、spss,熟练clementine,sas,r

数据的来源:
直接获取(调研,设备采集,人工输入)和间接获取(各类文档,外部数据库)

抽样方法
概率抽样:
简单随机抽样,分层抽样(总体分成不同的层,然后在每一层内抽样),整群抽样(将每一组被调查者作为一个抽样单位),等距抽样
非概率抽样
便利抽样
判断抽样 通过某些条件过滤来选择被调查者
配额抽样(选择一群特定数目】满足特定条件的被调查者)

数据审核
审核什么:
是否按需求提取目标用户
是否按需求提取目标字段
字段的数据是否有缺失,缺失的原因是什么
字段的数据是否有错误,错误的原因是什么

怎么审核:
统计工具
业务知识
责任心

0 0
原创粉丝点击