绪论
来源:互联网 发布:excel怎么合并数据 编辑:程序博客网 时间:2024/06/07 01:11
大数据--21世纪的原油
for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications
规模大
数据类型多样:结构化数据--先有模式后有数据、半结构化数据--先有部分模式(可扩展的标签)、非结构化数据--现有数据后有模式,非结构化数据占主体
生命周期:获取记录、抽取清洗、集成聚合、分析建模、解释展示
深度加工:raw data->information->knowledge->insight
处理方式:批量、在线、实时
质量:精确性、完整性、一致性、时效性
0 0