Hadoop生态系统图
来源:互联网 发布:网络女神思瑞 编辑:程序博客网 时间:2024/06/05 06:22
当下 Hadoop 已经成长为一个庞大的生态体系,只要和海量数据相关的领域,都有 Hadoop 的身影。下图是一个 Hadoop 生态系统的图谱,详细列举了在 Hadoop 这个生态系统中出现的各种数据工具。
这一切,都起源自 Web 数据爆炸时代的来临。Hadoop 生态系统的功能以及对应的开源工具说明如下。
MapReduce
HDFS
Pig和Hive
、
Pig:是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件)。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。
Hive:在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS(hive superimposes structure on data in HDFS),并允许使用类似于SQL语法进行数据查询。与Pig一样,Hive的核心功能是可扩展的。
阅读全文
0 0
- Hadoop生态系统图
- hadoop生态系统
- Hadoop生态系统
- hadoop生态系统
- Hadoop生态系统
- hadoop生态系统
- Hadoop生态系统
- hadoop生态系统
- Hadoop生态系统
- hadoop生态系统
- HADOOP生态系统
- hadoop生态系统
- Hadoop生态系统
- Hadoop 生态系统
- Hadoop生态系统
- Hadoop生态系统
- Hadoop生态系统
- Hadoop生态系统
- VueJs2.0建议学习路线
- 安装SQL SERVER2016或者2017时 安装程序无法与下载服务器联系 Microsoft R Server
- opus编解码的使用
- Java中常用的查找算法
- LinuxC编写TCP,HTTP中转SOCKET服务器(模拟)
- Hadoop生态系统图
- BZOJ 2434 浅谈Trie树构建Fail树DFS离线线段树查询
- CentOS7下解决yum install mysql-server没有可用包的问题
- MAVEN IDEA SSM框架搭建《二》
- Result从select count(0)中获取结果
- Oracle 开启异步IO
- Java EE开发第四章:JDBC的基本使用
- 小猴子下落
- linux tail命令的使用方法详解