大数据查询引擎 PrestoDB
来源:互联网 发布:方正尚酷简体 mac 编辑:程序博客网 时间:2024/04/28 07:26
原文链接 http://www.oschina.net/p/facebook-presto
Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。
PrestoDB 是 Facebook 推出的一个大数据的分布式 SQL 查询引擎。可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。
Presto 可以查询包括 Hive、Cassandra 甚至是一些商业的数据存储产品。单个 Presto 查询可合并来自多个数据源的数据进行统一分析。
Presto 的目标是在可期望的响应时间内返回查询结果。Facebook 在内部多个数据存储中使用 Presto 交互式查询,包括 300PB 的数据仓库,超过 1000 个 Facebook 员工每天在使用 Presto 运行超过 3 万个查询,每天扫描超过 1PB 的数据。此外包括 Airbnb 和 Dropbox 也在使用 Presto 产品。
Presto 是一个分布式系统,运行在集群环境中,完整的安装包括一个协调器 (coordinator) 和多个 workers。查询通过例如 Presto CLI 的客户端提交到协调器,协调器负责解析、分析和安排查询到不同的 worker 上执行。
此外,Presto 需要一个数据源来运行查询。当前 Presto 包含一个插件用来查询 Hive 上的数据,要求:
Hadoop CDH4
远程 Hive metastore service
Presto 不使用 MapReduce ,只需要 HDFS
要求:
Mac OS X or Linux
Java 7, 64-bit
Maven 3 (for building)
Python 2.4+ (for running with the launcher script)
- 大数据查询引擎 PrestoDB
- PrestoDB 大数据查询引擎
- PrestoDB 来自Facebook的开源分布式查询引擎
- Wing-新一代百度大数据查询引擎
- 大数据分析查询引擎Impala
- Facebook 正式开源其大数据查询引擎 Presto
- Apache Calcite:Hadoop中新型大数据查询引擎
- Presto Facebook 开源的大数据查询引擎
- 分布式大数据sql查询引擎Presto初识
- Apache Calcite:Hadoop中新型大数据查询引擎
- 数据查询引擎
- 大数据-计算引擎
- 大数据--计算引擎分类
- 大数据SQL交互查询 presto/spark/mapreduce 计算引擎对比
- 大数据查询
- 文本文件大数据查询
- NC57查询引擎-数据交叉技术
- 开源大数据查询分析引擎现状
- linux netstat命令使用收集,查看80端口连接数
- Android之四大组件之一-Service(一)
- Java中的反射总结
- 在java中 == 与 equals的区别
- 【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示
- 大数据查询引擎 PrestoDB
- 字符与数字的转换方式
- linux vim编辑器配置及使用经验
- Yarn的原理与资源调度
- App打包失败!Rebuild和Clean均无效
- NFS部署
- jstl表达式使用介绍
- 迭代器的一般用法
- 京东618技术解析之高可用多中心交易平台