大数据相关

来源:互联网 发布:林非比淘宝模特 编辑:程序博客网 时间:2024/06/05 05:28
从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。
 
大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume,Variety,Value,Velocity。
物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。[3]
 
例子包括网络日志,RFID,传感器网络,社会网络,社会数据(由于数据革命的社会),互联网文本和文件;互联网搜索索引;呼叫详细记录,天文学,大气科学,基因组学,生物地球化学,生物,和其他复杂和/或跨学科的科研,军事侦察,医疗记录;摄影档案馆视频档案;和大规模的电子商务 。
 
换算关系
最小的基本单位是Byte,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB,
  它们按照进率1024(2的十次方)来计算:
  1Byte = 8 bit
  1 KB = 1,024 Bytes
  1 MB = 1,024 KB = 1,048,576 Bytes
  1 GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes
  1 TB = 1,024 GB = 1,048,576 MB = 1,073,741,824 KB = 1,099,511,627,776 Bytes
  1 PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes
  1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes
  1 ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes
  1 YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes
  1 DB = 1024 YB = 1,237,940,039,285,380,274,899,124,224 Bytes
  1 NB = 1024 DB = 1,267,650,600,228,229,401,496,703,205,376 Bytes
 
详细内容:http://baike.baidu.com/view/6954399.htm
http://baike.baidu.com/view/9424571.htm

--------------------------------------------
NoSQL,是not only sql,是非关系数据库,不同于oracle等关系数据库。hadoop,是分布式解决方案,即为Mapreduce(计算的)和HDFS(文件系统),使用Hadoop和NoSQL可以构造海量数据解决方案。
NoSQL是非关系型数据库,Hadoop框架中的HBase即为NoSQL数据库。Hadoop是分布式软件框架,他有很多子模块,包含HDFS、MapReduce以及HBase。
参考:http://zhidao.baidu.com/link?url=aomDPqKtV71K0EbpdlHsVreWxGHCwijlrU0iS_619yL15Ly938Sw21HwzhS-7sBMlXK0FlWdq9Bjh-y9dQuc9_
 
 
----------------------
老式鼓风机、手风琴
一个软件系统类似一个社会,有不成熟慢慢变的成熟,健壮。