SparkSQL语句归纳总结

来源:互联网 发布:程控切纸机编程表 编辑:程序博客网 时间:2024/06/15 12:26




1,求分组TOPN常用语法

ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN)

语法解析:row_number() OVER (PARTITION BY COL1 ORDER BY COL2) 表示根据COL1分组,在分组内部根据 COL2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的)

rank() over(partition by subject order by counts desc)

语法解析:用法与row_number()over()用法类似,可以在求topn时使用



原创粉丝点击