Hive 窗口函数(Windowing Functions)

来源:互联网 发布:数据分析合同 编辑:程序博客网 时间:2024/05/17 21:49

窗口函数对点击流处理,和类似的时间序列/滑动窗分析很有用。最近在做时间序列分析,希望趁这个机会对窗口函数有进一步深入的了解。

  • Lead & Lag
    Lead 和Lag是金融方面的术语,意思是提前和延期。

  • 按照时间段统计时,有些时间段没有对应数据,造成这个时间段不出现在SQL统计的结果中,但是我们又需要这些行,怎么解决?
    调研了一些方案:Generate a set or sequence without loops – part 1

参考

  • https://issues.apache.org/jira/browse/HIVE-896
  • LanguageManual WindowingAndAnalytics