Spark大数据学习资源汇总

来源:互联网 发布:怎么买备案的域名 编辑:程序博客网 时间:2024/06/04 19:58

Spark  resource

1官方资料

Spark官网及文档

AMPLab官网

Databricks博客

2Spark生态系统资源分享

2.1Spark

Spark hans on 教程

2.2Spark SQL and Shark

2.3GraphX

2.4Spark Streaming

2.5MLlib

3Spark相关技术博客友情链接

csdn Spark社区

淘宝技术部

jerryshao

张包峰

fxjwind

徽沪一郎

http://www.anzhan.me/

彩色蚂蚁

http://www.flickering.cn/点击打开链接

斯巴克

http://blog.csdn.net/oopsoom

http://www.kemaswill.com/category/

http://blog.csdn.net/book_mmicky

https://github.com/JerryLead/SparkInternals/tree/master/markdown

http://www.cnblogs.com/cenyuhai

http://homepage.cs.latrobe.edu.au/zhe/ZhenHeSparkRDDAPIExamples.html

4视频音频

Spark Summit 2013 video 

Spark Summit 2014

Spark Summit csdn ppt




Scala  resource

(1)Web page

scala官网doc

Effective Scala

专题:Scala编程语言

Scala Days2014
(2)Book
快学scala

Scala程序设计:Java虚拟机多核编程实战

Scala in Action
Scala编程
Programming  Scala
Beginning Scala
Testing in Scala


AKKA
http://dirlt.com/akka.html

Sql on Hadoop resource

(1)总览对比

SQL-on-Hadoop结构化大数据分析系统性能评测

SQL on Hadoop的最新进展及7项相关技术分享

实战为王 梁堰波解SQL-on-Hadoop疑难杂症

大数据分析(Big Data OLAP)引擎Dremel, Tenzing 以及Impala

SQL卷土重来 成就炙手可热的大数据

开源大数据查询分析引擎现状

(2)Shark

Spark SQL组件源码分析

Spark SQL和Shark在架构上有哪些区别?将来会合并吗?

(3)Hive

大数据时代的技术hive:hive介绍

h​a​d​o​o​p​的​h​i​v​e​框​架​简​介

H​a​d​o​o​p​数​据​仓​库​工​具​-​-​h​i​v​e​介​绍

Hive调优实战

(4)Impala

Impala:新一代开源大数据分析引擎

大数据提速:Impala能否取代Hive

大数据新选择 Impala取代MapReduce

什么是impala,如何安装使用Impala

基于Impala构建实时大数据查询系统实践

大数据分析:在AWS上的HANA vs HADOOP IMPALA | SCN

(5)Stinger

Stinger Initiative:让Hive提速100倍

平均比Hive快24倍,Impala剑指Stinger


(6)Hawq

EMC讲解Hawq SQL性能:左手Hive右手Impala

EMC推进Hadoop在SQL数据库Hawq中的应用

(7)Presto

Facebook 正式开源其大数据查询引擎 Presto

Facebook亮出Presto引擎 查询250PB数据仓库




0 0
原创粉丝点击