Spark DataFrame中基于List的排序UDF
来源:互联网 发布:守望先锋低配优化补丁 编辑:程序博客网 时间:2024/06/05 05:35
DataFrame中支持的类型如 Struct此类型我们是用对象进行的封装,但是要对strcut里的数据进行排序,个人想到的办法还是把struct转位Json,然后反解析Json
sqlcontext.udf.register("stuSort", (stuList: Seq[String]) => { val rs = Option(conponList) match { case None => "" case Some(c) => { val couponInfoList = ArrayBuffer[CouponInfo]() conponList.foreach(x => { couponInfoList.append(readAsBeanByJson4s[CouponInfo](x)) })
//基于Ordering的隐式参数 implicit object CouponOrdering extends Ordering[CouponInfo] { override def compare(s1: CouponInfo, s2: CouponInfo): Int = { if (s1.coupon_bank == s2.coupon_bank) if (s1.coupon_list == s2.coupon_list) s1.coupon_st.compareTo(s2.coupon_st) else s1.coupon_list.compareTo(s2.coupon_list) else s1.coupon_bank.compareTo(s2.coupon_bank) } } couponInfoList.sorted.mkString(",") } } rs.toString})
0 0
- Spark DataFrame中基于List的排序UDF
- Spark MLlib中基于DataFrame的 pipeline介绍
- 基于Spark DataFrame的数据仓库框架
- spark 中rdd与dataframe的合并
- Spark与Pandas中DataFrame的对比
- Spark中DataFrame的schema讲解
- Spark SQL中DataFrame API 的解析
- spark--DataFrame处理udf操作和一些聚合操作
- Spark注册UDF函数,用于DataFrame DSL or SQL
- 基于Alluxio系统的Spark DataFrame高效存储管理技术
- SparkMLLib中基于DataFrame的TF-IDF
- Spark(Hive) SQL中UDF的使用(Python)
- Python: Pandas的DataFrame如何按指定list排序
- 关于spark中dataframe数据处理
- Spark与Pandas中DataFrame的详细对比
- Spark与Pandas中DataFrame的详细对比
- 如何理解spark中RDD和DataFrame的结构?
- Spark 中 DataFrame的三种创建方式
- Android中WebView的JavaScript代码和本地代码交互的三种方式
- git 查看未传送到远程代码库的提交
- ionic之Facebook原生登录
- 使用Intent跨Activity传值
- 字符流的应用于文件的拷贝
- Spark DataFrame中基于List的排序UDF
- MathType输入框如何调整
- spring data jpa 事务控制
- 百度统计的异步代码
- Adaboost +HOG/LBP/HAAR 训练问题
- 退出界面,优雅的关闭软键盘。
- mysql 查询最大连接
- java 生成xml文件
- RecyclerView的用法