大数据

来源:互联网 发布:专业解封淘宝店铺 编辑:程序博客网 时间:2024/04/29 00:17


大数据作为时下最火热的IT行业的词汇之一,我们几乎每天都能听到或者谈及,甚至正在应用,那么究竟什么是大数据呢。通常大数据具有4V的特征:

Volume:大量的海量的数据;

Variety:多样性,结构化、半结构化、非结构化数据;

结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)
非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等
所谓半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。 

Velocity: 速度性,例如传感器源源不断产生的数据,这类数据通常具有时效性;

Veracity:但真实性是数据分析的基础;

hadoop:是一个能够对大量数据进行分布式处理的软件框架

  流计算

数据仓库(传统)

刚刚接触大数据,还处于概念阶段,写此文做记录。


原创粉丝点击