Big data大数据

来源:互联网 发布:淘宝pc端图片轮播尺寸 编辑:程序博客网 时间:2024/04/30 09:29

大数据和云计算

老师说这个工资贼理想。。表示确实也有很多人在做数据分析这一块。有点动心~
那让我们来了解下大数据是什么吧。说实话这概念太抽象了~通俗点讲就是很多数据,你再如何处理分析的过程。。。设计到数据就有算法,数据分析,数据显示等问题了

大数据

掌握庞大的数据,进行专业化的处理,对数据进行加工,通过“加工”实现数据的增值。大数据必然采用分布式架构。

与云计算的关系-硬币的正反面Saas 分布式数据挖掘Paas 分布式处理Iaas 云存储 虚拟化(不设置绝对地址) 云盘比如游戏  你会选择大区 --给你分配服务器 

有MapReduce框架
大数据的分析可以概括为5个V
数据量大Volume
速度快Velocity
类型多Varity
价值Value
真实性Veracity

数据仓库
数据安全
数据分析
数据挖掘
——————数据分析师

前端展现

前端的开源工具
JasperSoft
Pentaho
Spagobi
Openi
Birt

分析工具有
Style
Intelligence
RapidMiner Radoop
Cognos
Bo
Microsoft
Oracle
Microstrategy
QlikView
Tableau
__这都是国外的
国内的有FindBi

数据仓库

数据相当于一个统包

数据集市是他的子集
QlikView
Tableau

数据分析

语义预测
分词器和语义分析
——我怎么感觉像编译原理。。
数据质量和数据管理
取样点,抽样调查

发展状况

.开源大数据
有hadoop生态圈,Hadoop2.0改名为spark
Hypertable是另类

.一体机数据仓库
IBM PureData(Netezza)
OracleExadata
SAP Hana全球第一的做erp(企业资源管理)的公司

插讲金蝶公司是什么?

》Hadoop小黄象
》Hpcc 数据高速通道
》Storm 处理hadoop的高量数据
Mapreduce +Hadoop+storm这一套
ETL 数据抽取 例如淘金币
》Apache Drill
java服务器都是Apache
大型服务器分析系统
服务器可以装一下

2015国内大数据应用案例Top100

Neo4j
云仓库等

数据之美
一,航线星云
还有很多很多。。

0 0