绪论

来源:互联网 发布:excel怎么合并数据 编辑:程序博客网 时间:2024/06/07 01:11

大数据--21世纪的原油

for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications

规模大

数据类型多样:结构化数据--先有模式后有数据、半结构化数据--先有部分模式(可扩展的标签)、非结构化数据--现有数据后有模式,非结构化数据占主体

生命周期:获取记录、抽取清洗、集成聚合、分析建模、解释展示

深度加工:raw data->information->knowledge->insight

处理方式:批量、在线、实时

质量:精确性、完整性、一致性、时效性








0 0
原创粉丝点击