spark-sql like查询
来源:互联网 发布:php应用 编辑:程序博客网 时间:2024/05/21 14:48
当时遇到使用两个表,需要用到like的时候,建议使用map side join或者使用spark sql的broad cast join
sqlContext.sql( """ |select * from left A,right B where A.url like contact(B.url,'%') """.stripMargin)
val importantBroad = sc.broadcast(important) val primary = leftRdd.map( x =>{ var flag : Boolean = false var importantDomain : String = "" for(s<-importantBroad.value;if(!flag)){ if(x._3.contains(s)){ flag = true importantDomain = s } } (x._1,x._2,x._3,x._4,x._5,importantDomain) }).toDF("id","age","domain","userId","time","importantDomain")```这个和spark rdd使用的map side join 是类似的原理,都是把小的集合通过广播,将数据这里写代码片在每个executor上共享一份数据。spark sql的broad join
import org.apache.spark.sql.functions.broadcastdataFrame.join(broadcast(idDF),"id")
“`
阅读全文
0 0
- spark-sql like查询
- SQL like 查询注意事项
- sql like 参数查询
- SQL like 模糊查询
- SQL like 模糊查询
- SQL like 模糊查询
- SQL like 模糊查询
- SQL like模糊查询
- SQL like 模糊查询
- SQL like子查询
- SQL like 模糊查询
- SQL like 模糊查询
- SQL like模糊查询
- SQL模糊查询语句(like)
- SQL模糊查询语法LIKE
- SQL 模糊查询(like)
- SQL模糊查询中的Like
- SQL中LIKE模糊查询LIKE关键字匹配语句
- Android流媒体开发-服务端搭建
- 运维之Linux基础知识(三)
- Linux内核0.11——内核体系结构
- jqrey表单提交及回显
- 获取文件路径
- spark-sql like查询
- ST.Plot.NodeTypes定义和提供树节点的形状类型
- Java Runtime
- MDC--FORM--Update
- POJ1185(状压dp)
- PAT 1026. Table Tennis (30)
- np.newaxis——np.ndarray增加维数
- CCNA小总结
- centos 升级gcc