数据分析(入门篇)-第四章-三心二意——数据处理

来源:互联网 发布:极光世界辅助软件 编辑:程序博客网 时间:2024/06/05 03:38

本章全是干货,“玩数据”的人就靠这些技能吃饭了大笑


“三心二意”处理数据:信心、细心、平常心+诚意、合意

数据处理的步骤:数据原表——》整齐的数据表——》我要的数据表

重复数据的处理:

1. 函数法(比较繁琐)

2. 高级筛选法(菜单操作)

3. 条件格式法(比较直观,可实时显示重复项,比较直观,可用于编辑词条时的辅助(即,如果某个新录入的词条在之前已录入过,则该词条实时变色,提示用户该词条已存在,不用新建,只需更新))

4. 数据透视表法(此方法不太实用,不方便获取不重复值列表(unique value list))

5. 通过“删除重复项”按钮删除重复数据(最简单、直观的方法)

缺失数据的处理:

定位缺失值(CTRL+G)、批量输入(CTRL+ENTER)、查找替换(CTRL+F,CTRL+H)

检查数据逻辑错误:

利用IF函数检查错误、利用条件格式标记错误

数据加工:

1. 数据抽取(字段分列(text to column)、函数法(LEFT(), MID(), RIGHT())、字段合并(CONCATENATE(), & (字符连接符))、字段匹配(VLOOKUP()))

2. 数据计算(简单计算(加减乘除) 、函数计算(SUM(), AVERAGER(), TODAY(), NOW(), DATE(), YEAR(), MONTH(), DAY(), DATEDIF(), EDATE()(次函数在创建“人生格子”模板时发挥了核心作用))

数据分组:利用VLOOKUP函数模糊匹配进行分组(需设定阈值)

数据转换:行列转换(转置)、函数法(IF(),ISNUMBER(),SEARCH(),HLOOKUP())

数据抽样:利用RAND()、VLOOKUP()函数


阅读全文
0 0