MongoDB系列之分组topN
来源:互联网 发布:centos 伪文件系统 编辑:程序博客网 时间:2024/05/22 17:17
来源:https://groups.google.com/forum/#!topic/mongodb-user/Rjv6lyUCe1s 。
Collction last3有两个字段:variable和timestamp,需要先按variable分组,选出每组文档中timestamp最晚的3个,再从这些文档中找到timestamp最早的1个。
last3的部分数据如下:
集算器代码:
A1:连接MongoDB,连接字格式为mongo://ip:port/db?arg=value&…
A2:使用find函数从MongoDB中取数并排序,形成游标。collectoin是last3,过滤条件是空,取出_id之外的所有字段,并按variable排序。集算器的find函数和mongdb的find+sort+limit函数类似,过滤条件的写法遵循mongodb规范。
A3:循环从游标读数,每次取variable字段相同的一组文档。A3的作用范围是缩进的B3到B4,其间可以用A3来引用循环变量。A3是内存数据,某次取数的结果如下:
B3:选出本组文档中timestamp最晚(大)的3个。
B4:将B3不断地追加到B2中。B2如下:
A5:选出B2中timstamp最早(小)的那个文档,即:
A6:关闭mongodb连接。
0 0
- MongoDB系列之分组topN
- Hive TopN+分组TopN
- Hive TopN+分组TopN
- Spark--分组TopN
- hive 分组topN
- mysql 分组topN
- Spark Scala TopN分组排序
- 46.top10活跃session之分组取TopN算法获取top10活跃session
- 阿里云大数据利器Maxcompute学习之--窗口函数实现分组TopN
- 使用RDD解决spark TopN问题:分组、排序、取TopN
- MapReduce之topN
- Storm实战之TopN
- Spark之TopN
- Scala之TopN
- MapReduce之TopN
- golang之TopN算法
- 高级编程之topn
- hive 分组+组内排序 , 求topN
- 第13周项目4 Floyd算法的验证
- 没有进步,意味着你退步了,生活不允许你退步
- prim算法的验证
- 数据库oracle for update of和for update区别
- 安装 fcitx
- MongoDB系列之分组topN
- “知原理”检验题目——第14周
- SignalR实现服务器与客户端的实时通信
- zabbix安装后服务器启动问题
- 第九周:特殊矩阵的压缩存储
- 第14周项目3-是否二叉排序树?
- java监听事件“接口的妙用”
- 第十三周-Prim算法的验证
- 练习5 面向对象基础(含答案)