Hive的collect_set使用详解
来源:互联网 发布:彩弹枪淘宝有么 编辑:程序博客网 时间:2024/06/11 12:39
有这么一需求,在Hive中求出一个数据表中在某天内首次登陆的人;可以借助collect_set来处理sql:
上面中的
会按照id分组,因为一个id可能对应一天也可能对应多天,对应多天表示有多天都有登陆,所以一个id会对应多个日期time,通过collect_set会把每个id所对应的日期构建成一个以逗号分隔的数组返回。上述SQL返回:
所以我们就可以按照这个返回的数组做文章,即为
表示某id所对应的数组长度为1 并且第一个时间为20150906的id表示为该天首次登陆。总结:
- Hive不允许直接访问非group by字段;
- 对于非group by字段,可以用Hive的collect_set函数收集这些字段,返回一个数组;
- 使用数字下标,可以直接访问数组中的元素;
阅读全文
1 0
- Hive 的collect_set使用详解
- Hive 的collect_set使用详解
- Hive 的collect_set使用详解
- Hive的collect_set使用详解
- Hive 的collect_set使用详解
- Hive中列转行函数collect_set详解
- 用spark实现hive中的collect_set函数的功能
- hive列转行 (collect_set())
- hive列转行 (collect_set())
- Hive sql 使用group by 字段被限制使用 collect_set/collect_list处理
- Hive中的explode()函数和collect_set()函数
- HIVE中关于collect_set与explode函数妙用
- hive collect_set,lateral view,explode 实现行列转换
- HIVE RegexSerDe使用详解
- Hive JOIN使用详解
- Hive JOIN使用详解
- Hive JOIN使用详解
- Hive JOIN使用详解
- ASP.NET、.NET和C#的关系
- yolo v2之车牌检测后续识别字符(二)
- HDU 1156 Brownie Points II
- POJ2243 Knight Moves(A*算法)
- An error occurred while collecting items to be installed session context was:(profile=epp.package.je
- Hive的collect_set使用详解
- ListView保存并还原焦点
- Python笔记:迭代器、生成器、修饰器
- 前端工程师必须收藏的 CSS 资源大全
- 热血沸腾的小文章,总能给我鼓励
- 迅捷CAD转换器怎么把pdf文件转为CAD文件
- Android相对布局 layout_marginBottom无效
- 雷达图
- Assign the task (并查集)