Spark SQL介绍

来源:互联网 发布:vr拼接软件 编辑:程序博客网 时间:2024/06/06 16:53

spark SQL会成为spark的未来,spark以后的框架、其他的框架都会架构在spark SQL的基础之上!

1.大数据为什么要使用 SQL

  1. 与我们已有的BI等数据分析系统集成在一块

  2. 多数人都会SQL而且习惯了用SQL做数据分析

  3. 开发速度快

2.大数据为什么要使用 spark SQL

  1. 与直接基于RDD编程相比,写 spark SQL代码更少,编写更快,更容易修改和理解

  2. 相比于直接进行RDD编程而言,spark SQL会自动地进行性能优化

  3. 更有效地使用必要的数据,提高内存的使用价值

3.有了SQL为什么还要DataSet

SQL可以快速实现你的简单的想法,但是复杂的不行,总而言之:SQL虽然强大,但是表达能力不行。如类型检查,机器学习

4. 局限性

RDD的局限性:RDD的本身内部是一条一条的record,没有每个record的schema,不能像谓词下推等优化,不能方便地读取不同类型的数据,如读取parquet,想合并数据源时也不简单。

DataFrame的局限性:Dataframe是函数式的编程风格,不支持领域对象,运行时才类型检查。

DataSet是在DataFrame的基础上的发展出来的,是一种OO风格的接口,编译时就类型检查。

杂记

  1. Tungsten的开发计划是五年,钨丝计划针对的是CPU、内存、磁盘、网络。网络的优化已经做得很好了,网络、磁盘的优化提升的效果并不是很明显,所以第一阶段的优化是内存,第二阶段是CPU。

  2. spark在大数据中某些方面不是最好的技术, Fink在某些理念和实现上都比spark好,但是由于某些原因最火爆的还是spark

  3. spark SQL的理解:spark SQL会在spark的未来中成为中流砥柱的角色,它连通了上面的流处理、机器学习和下面的内核。

  4. DSL:领域专用语言

以上内容部分来自[DT大数据梦工厂]首席专家Spark专家王家林老师的课程分享。感谢王老师的分享,更多精彩内容请扫描关注[DT大数据梦工厂]微信公众号DT_Spark

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 寄美国的快递客人拒绝清关怎么办 国际e邮宝几天没物流信息了怎么办 石家庄小学网上报名填错了怎么办 去医院看病不知道挂什么科怎么办 深水井深水泵埋了2米怎么办 请问我捡的手机不是我的指纹怎么办 宝宝把塑料子弹塞到了鼻子里怎么办 坐便池上面的小孔不出水怎么办 还没离职已经找好工作怎么办 因火车晚点而耽误下趟火车怎么办 在广州坐的士丢了东西怎么办 找兼职的话他要求交押金怎么办 08vip不给提现了怎么办 点击订阅号所收到内容字太大怎么办 我的小叶栀子花老是黄叶该怎么办? 联币金融倒闭了我投资的钱怎么办 新单位交养老保险不接收档案怎么办 高铁发车十小时没赶上怎么办 饿了么被阿里收购员工怎么办? 爱疯4s密码忘了怎么办 研究生论文盲审一直不出结果怎么办 查重报告有疑似剽窃观点怎么办 成绩考的不好怎么办读技校有用吗 孩子大学挂科太多家长应该怎么办 中专升大专的入学考没考上怎么办 小孩摔跤额头出了个包怎么办 小孩摔跤后脑勺出了个包怎么办 结婚后疏于关心老婆寒心了怎么办 江苏取消小高考高二学生怎么办 上海学而思家长陪读听不懂怎么办 高考报名的电话号码填错了怎么办 高考报名用的电话号码变换了怎么办 弟媳妇一个月就大闹一次怎么办 丈夫出轨我亲弟媳妇我怎么办 被山西博大泌尿医院坑了怎么办 家长反应孩子学校受欺负老师怎么办 白色衣服和牛仔裤洗变色了怎么办 生完孩子肚子上的松皮怎么办 xp电脑玩cf进入地图黑屏怎么办 爸妈吵架妈妈走了爸爸哭了该怎么办 总担心旅馆被拍视频传上网怎么办