大数据的前世今生
来源:互联网 发布:软件版权说明 编辑:程序博客网 时间:2024/06/05 03:27
提出大数据:1996年SGI公司的首席科学家John Mashkey提出大数据
2001年Gartner在评论中首先定义大数据的三个维度:数据容量,速度和种类。业界把3v扩展到了11V但主要包括Volume,Velocity,Variety和Value
大数据概念:指无法在可承受的时间内用软硬件进行捕捉,管理和处理的数据集合,需要新处理模式才能将该数据集合成为具有更强的决策力,洞察力和流程优化能力的海量,多样化的信息资产。
数据构成:
结构化数据:可以储存在数据库,用二维表结构来逻辑表达实现的数据。
非结构化数据:不方便用数据库中的二维表结构来表达的数据
半结构化数据:html就属于半结构化数据
大数据价值:1.卫星测绘:海量数据存储
2.金融证券:盘活归档数据
3.油气勘探:潜力分析
4.媒体娱乐:高清制博
大数据关乎未来:
企业:竞争能力
决策及时
成本控制
事业:科学探索
知识服务
社会安全
大数据特征:1.体量大:存储大,计算量大
2.样式多:来源多,格式多。
3.速度快:生成速度快,处理速度快
4.价值:价值密度低
大数据带来的挑战:
1.传统网络架构不适应“大数据”时代
2.数据中心将面临巨大的压力
3.数据仓库架构不适应高速反应的要求
非结构化数据无法处理
电信大数据应用:
- 大数据的前世今生
- 大数据的前世今生
- 商务智能与大数据分析的前世今生
- 数据产品的前世今生
- 大数据学习-Spark前世今生
- 大数据的前世今生-大数据特征与发展历程
- 数据产品经理的前世今生
- 浅谈数据分析师的前世今生
- Java数据对象(JDO)的前世今生
- 浅谈数据仓库、商业智能、数据挖掘、大数据、云技术的前世今生。
- 前世今生的缘
- 互联网的前世今生
- 救世主的前世今生
- 3G的前世今生
- Gentoo的前世今生
- Mozilla的前世今生
- Java的“前世今生”
- unix的前世今生
- List Leaves
- QT学习中遇到的问题
- Nginx配置详情-配置说明-参数优化(一)
- 二叉搜索树的后序遍历序列
- oracle 查询单表某个字段 数据是否有重复
- 大数据的前世今生
- Spring入门(Bean的Aware接口)
- 多态
- 移动架构06_设计模式二:抽象工厂模式
- Redis常考面试题
- 一文搞懂各种 Docker 网络
- HDU——1020 Encoding
- Ubuntu硬盘只读文件系统
- 使用两个栈实现一个队列