数据库分析的简单步骤

来源:互联网 发布:linux 高性能网络库 编辑:程序博客网 时间:2024/06/01 10:14

第一步 大概看一下

拿到一张表,首先看一下它的字段

第二步 确定数据规模

确定数据规模 几行几列count

第三步 确定分类字段对应的数据规模

count(*) ..group by  order by

比如会员类型,性别,地点,时间

地点城市

如果字段中含有城市,一般不在Mysql中切割
因为耗时间,比如每个市名字字数不一样,语句会很复杂
通常找一张城市表进行多表查询

按照年月(时间)

日期格式化

DATE_FORMAT(date,format)select * from test group by DATE_FORMAT(date,'%Y-%m')

格式化参数说明

ymdwhis
Y完整年,y取年后两位,M英语月份,m数字型月份
D 英语日,d数字日。H 24进制小时,h 12进制小时
I 等同于h,i 分钟。S 等同于s 代表秒
W 英语星期,w 数字形式星期

#例如:'20150711''%Y%m%d''150711''%y%m%d'小写的对应不完整的年份,自动脑补前面两个

字符串转化为时间(将生日转化为时间)

STR_TO_DATE(date,format)select STR_TO_DATE('2015+07+11','%Y+%m+%d')##将生日转化为时间进行分组:select * from test group by DATE_FORMAT(STR_TO_DATE(Birthday,'%Y%m%d'),'%Y-%m')

根据出生年月日,转化为星期,用英文显示周几出生的人比较多

select count(week_name),week_name from (select DATE_FORMAT(STR_TO_DATE(Birthday,'%Y%m%d'),'%W') as week_name from test ) as agroup by week_nameorder by count(week_name) desc limit 1;

注意如何既显示中文同时排序,因为可能用中文排序不行

先通过英文字段排序,再将结果作为一个表,select..as 中文