spark中各种连接操作以及实用方法
来源:互联网 发布:数据库如何自动生成id 编辑:程序博客网 时间:2024/05/16 05:44
val a = sc.parallelize(Array(("123",4.0),("456",9.0),("789",9.0)) val b = sc.parallelize(Array(("123",8.0),("789",10))) val c = a.join(b) c.foreach(println) /* (123,(4.0,8.0)) (789,(9.0,10)) */ val d = a.cogroup(b) d.foreach(println) /* (456,(CompactBuffer(9.0),CompactBuffer())) (123,(CompactBuffer(4.0),CompactBuffer(8.0))) (789,(CompactBuffer(9.0),CompactBuffer(10))) */ val e = a.leftOuterJoin(b) e.foreach(println) /* (456,(9.0,None)) (123,(4.0,Some(8.0))) (789,(9.0,Some(10))) */ val f = a.fullOuterJoin(b) f.foreach(println) /* (456,(Some(9.0),None)) (123,(Some(4.0),Some(8.0))) (789,(Some(9.0),Some(10))) */ val g = a.cartesian(b) g.foreach(println) /*((123,4.0),(123,8.0))((123,4.0),(789,10))((456,9.0),(123,8.0))((456,9.0),(789,10))((789,9.0),(123,8.0))((789,9.0),(789,10)) */ /*val h = a.coalesce(6,true) h.foreach(println) a.dependencies.foreach(println)*/ val i = a.keyBy{case (k,v)=>("haha",234)} i.foreach(println) /* ((haha,234),(123,4.0)) ((haha,234),(456,9.0)) ((haha,234),(789,9.0)) */
0 0
- spark中各种连接操作以及实用方法
- Linux各种实用操作
- spark中transformation操作的各种算子(java版)
- spark中各种transformation算子操作(scala版)
- Linux中date命令的各种实用方法
- Linux中date命令的各种实用方法
- Linux中date命令的各种实用方法
- Java中连接各种数据库的方法
- iOS中NSArray的各种遍历以及各种排序方法
- C#中各种异步操作的方法
- jquery各种实用小方法
- Django 模版 各种实用方法
- Spark 中Transformation 、Action操作 以及RDD的持久化
- Spark连接数据库方法
- java各种连接数据库与操作数据库方法
- jquery中操作数组非常实用的方法
- android中各种图标尺寸以及多分辨率支持方法
- android中各种图标尺寸以及多分辨率支持方法
- hdu - 5236 Article(2015上海大都会赛)概率dp
- P124.39
- hdn2050(递推之画直线求区域个数)
- Hibernate inverse属性与cascade属性
- 浅谈c++多态性
- spark中各种连接操作以及实用方法
- 用户界面View之ScrollView:个人学习之路(4)
- 移动端开发 根据html的字体大小来设置布局
- 查询评论接口优化案例
- wordpress开启多站点 (Multisite)功能。
- 图像基本噪声添加函数
- thinkPHP 无刷新分页
- Couchbase的高速来自于各种tricky
- 使用Python扫描端口情况