MongoDB高级查询用法大全 - 程序猿_哲

来源:互联网 发布:手机听歌软件 编辑:程序博客网 时间:2024/05/21 18:39

转载 http://blog.163.com/lgh_2002/blog/static/440175262012052116455/

详见官方的手册: 

http://www.mongodb.org/display/DOCS/Advanced+Queries#AdvancedQueries-ConditionalOperators%3A%3C%2C%3C%3D%2C%3E%2C%3E%3D 
版本一: 
1 ) . 大于,小于,大于或等于,小于或等于 
$gt:大于 
$lt:小于 
$gte:大于或等于 
$lte:小于或等于 

db.collection.find({ "field" : { $gt: value } } );   // greater than  : field > valuedb.collection.find({ "field" : { $lt: value } } );   // less than  :  field < valuedb.collection.find({ "field" : { $gte: value } } );  // greater than or equal to : field >= valuedb.collection.find({ "field" : { $lte: value } } );  // less than or equal to : field <= value

如查询j大于3,小于4:

db.things.find({j : {$lt: 3}});db.things.find({j : {$gte: 4}});

也可以合并在一条语句内:

db.collection.find({ "field" : { $gt: value1, $lt: value2 } } );    // value1 < field < value

2) 不等于 $ne

例子:

db.things.find( { x : { $ne : 3 } } );

3) in 和 not in ($in $nin) 

db.collection.find( { "field" : { $in : array } } );

例子:

db.things.find({j:{$in: [2,4,6]}});
db.things.find({j:{$nin: [2,4,6]}});


4) 取模运算$mod 

db.things.find( "this.a % 10 == 1")

可用$mod代替:

db.things.find( { a : { $mod : [ 10 , 1 ] } } )


5)  $all 
$all和$in类似,但是他需要匹配条件内所有的值: 
如有一个对象: 

{ a: [ 1, 2, 3 ] }

下面这个条件是可以匹配的:

db.things.find( { a: { $all: [ 2, 3 ] } } );

但是下面这个条件就不行了:

db.things.find( { a: { $all: [ 2, 3, 4 ] } } );


6)  $size 
$size是匹配数组内的元素数量的,如有一个对象:{ a:["foo"] },他只有一个元素: 

db.things.find( { a : { $size: 1 } } );

官网上说不能用来匹配一个范围内的元素,如果想找$size<5之类的,他们建议创建一个字段来保存元素的数量。

You cannot use $size to find a range of sizes (for example: arrays with more than 1 element). If you need to query for a range, create an extra size field that you increment when you add elements.

7)$exists

$exists用来判断一个元素是否存在:

如:

db.things.find( { a : { $exists : true } } ); // 如果存在元素a,就返回db.things.find( { a : { $exists : false } } ); // 如果不存在元素a,就返回

8)  $type

$type 基于 bson type来匹配一个元素的类型,像是按照类型ID来匹配,不过我没找到bson类型和id对照表。

db.things.find( { a : { $type : 2 } } ); // matches if a is a stringdb.things.find( { a : { $type : 16 } } ); // matches if a is an int

9)正则表达式 

db.customers.find( { name : /acme.*corp/i } ); // 后面的i的意思是区分大小写

10)  查询数据内的值 

db.things.find( { colors : "red" } );

11) $elemMatch 

> t.find( { x : { $elemMatch : { a : 1, b : { $gt : 1 } } } } ) { "_id" : ObjectId("4b5783300334000000000aa9"),  "x" : [ { "a" : 1, "b" : 3 }, 7, { "b" : 99 }, { "a" : 11 } ]}
$elemMatch : { a : 1, b : { $gt : 1 } } 所有的条件都要匹配上才行。

注意,上面的语句和下面是不一样的。

> t.find( { "x.a" : 1, "x.b" : { $gt : 1 } } )

$elemMatch是匹配{ "a" : 1, "b" : 3 },而后面一句是匹配{ "b" : 99 }, { "a" : 11 } 

db.postings.find( { "author.name" : "joe" } );

注意用法是 author.name ,用一个点就行了。更详细的可以看这个链接: dot notation

举个例子:

> db.blog.save({ title : "My First Post", author: {name : "Jane", id : 1}})

如果我们要查询 authors name 是Jane的, 我们可以这样:

> db.blog.findOne({"author.name" : "Jane"})

如果不用点,那就需要用下面这句才能匹配:

db.blog.findOne({"author" : {"name" : "Jane", "id" : 1}})

下面这句:

db.blog.findOne({"author" : {"name" : "Jane"}})

是不能匹配的,因为mongodb对于子对象,他是精确匹配。

13) 元操作符 $not 取反

如:

db.customers.find( { name : { $not : /acme.*corp/i } } );
db.things.find( { a : { $not : { $mod : [ 10 , 1 ] } } } );

mongodb还有很多函数可以用, 如排序,统计等,请参考原文。 
mongodb目前没有或(or)操作符,只能用变通的办法代替,可以参考下面的链接: 
http://www.mongodb.org/display/DOCS/OR+operations+in+query+expressions 
版本二:

shell 环境下 的操作:

    1.   超级用户相关:

          1. # 进入数据库 admin

             use admin

         2. # 增加或修改用户密码

          db.addUser('name','pwd')

         3. # 查看用户列表

            db.system.users.find()

         4. # 用户认证

          db.auth('name','pwd')

         5. # 删除用户

            db.removeUser('name')

            6. # 查看所有用户

           show users

          7. # 查看所有数据库

            show dbs

           8. # 查看所有的 collection

            show collections

           9. # 查看各 collection 的状态

            db.printCollectionStats()

        10. # 查看主从复制状态

            db.printReplicationInfo()

        11. # 修复数据库

            db.repairDatabase()

        12. # 设置记录 profiling , 0=off 1=slow 2=all

            db.setProfilingLevel(1)

        13. # 查看 profiling

           show profile

          14. # 拷贝数据库

           db.copyDatabase('mail_addr','mail_addr_tmp')

         15. # 删除 collection

            db.mail_addr.drop()

        16. # 删除当前的数据库

            db.dropDatabase()

   2 . 增删改

         1. # 存储嵌套的对象

             db.foo.save({'name':'ysz','address':{'city':'beijing','post':100096},'phone':[138,139]})

         2. # 存储数组对象

             db.user_addr.save({'Uid':'yushunzhi@sohu.com','Al':['test-1@sohu.com','test-2@sohu.com']})

         3. # 根据 query 条件修改,如果不存在则插入,允许修改多条记录

               db.foo.update({'yy':5},{'$set':{'xx':2}},upsert=true,multi=true)

         4. # 删除 yy=5 的记录

              db.foo.remove({'yy':5})

         5. # 删除所有的记录

              db.foo.remove()

   3. 索引

          1. # 增加索引: 1(ascending),-1(descending)

         2. db.foo.ensureIndex({firstname: 1, lastname: 1}, {unique: true});

         3. # 索引子对象

         4. db.user_addr.ensureIndex({'Al.Em': 1})

         5. # 查看索引信息

         6. db.foo.getIndexes()

         7. db.foo.getIndexKeys()

         8. # 根据索引名删除索引

         9. db.user_addr.dropIndex('Al.Em_1')

    4. 查询

          1. # 查找所有

         2. db.foo.find()

        3. # 查找一条记录

         4. db.foo.findOne()

         5. # 根据条件检索 10 条记录

         6. db.foo.find({'msg':'Hello 1'}).limit(10)

         7. #sort 排序

        8. db.deliver_status.find({'From':'ixigua@sina.com'}).sort({'Dt',-1})

         9. db.deliver_status.find().sort({'Ct':-1}).limit(1)

        10. #count 操作

        11. db.user_addr.count()

        12. #distinct 操作 , 查询指定列,去重复

        13. db.foo.distinct('msg')

        14. #”>=” 操作

        15. db.foo.find({"timestamp": {"$gte" : 2}})

        16. # 子对象的查找

        17. db.foo.find({'address.city':'beijing'})

   5. 管理

          1. # 查看 collection 数据的大小

         2. db.deliver_status.dataSize()

         3. # 查看 colleciont 状态

         4. db.deliver_status.stats()

         5. # 查询所有索引的大小

         6. db.deliver_status.totalIndexSize()

6.   高级查询

条件操作符   
$gt : >  
$lt : <  
$gte: >=  
$lte: <=  
$ne : != 、 <>  
$in : in  
$nin: not in  
$all: all  
$not: 反匹配 (1.3.3 及以上版本 )  
查询 name <> "bruce" and age >= 18 的数据   
db.users.find({name: {$ne: "bruce"}, age: {$gte: 18}});  
查询 creation_date > '2010-01-01' and creation_date <= '2010-12-31' 的数据   
db.users.find({creation_date:{$gt:new Date(2010,0,1), $lte:new Date(2010,11,31)});  
查询 age in (20,22,24,26) 的数据   
db.users.find({age: {$in: [20,22,24,26]}});  
查询 age 取模 10 等于 0 的数据   
db.users.find('this.age % 10 == 0');  
或者   
db.users.find({age : {$mod : [10, 0]}});  
匹配所有   
db.users.find({favorite_number : {$all : [6, 8]}});  
可以查询出 {name: 'David', age: 26, favorite_number: [ 6, 8, 9 ] }  
可以不查询出 {name: 'David', age: 26, favorite_number: [ 6, 7, 9 ] }  
查询不匹配 name=B* 带头的记录   
db.users.find({name: {$not: /^B.*/}});  
查询 age 取模 10 不等于 0 的数据   
db.users.find({age : {$not: {$mod : [10, 0]}}});  
# 返回部分字段   
选择返回 age 和 _id 字段 (_id 字段总是会被返回 )  
db.users.find({}, {age:1});  
db.users.find({}, {age:3});  
db.users.find({}, {age:true});  
db.users.find({ name : "bruce" }, {age:1});  
0 为 false, 非 0 为 true  
选择返回 age 、 address 和 _id 字段   
db.users.find({ name : "bruce" }, {age:1, address:1});  
排除返回 age 、 address 和 _id 字段   
db.users.find({}, {age:0, address:false});  
db.users.find({ name : "bruce" }, {age:0, address:false});  
数组元素个数判断   
对于 {name: 'David', age: 26, favorite_number: [ 6, 7, 9 ] } 记录   
匹配 db.users.find({favorite_number: {$size: 3}});  
不匹配 db.users.find({favorite_number: {$size: 2}});  
$exists 判断字段是否存在   
查询所有存在 name 字段的记录   
db.users.find({name: {$exists: true}});  
查询所有不存在 phone 字段的记录   
db.users.find({phone: {$exists: false}});  
$type 判断字段类型   
查询所有 name 字段是字符类型的   
db.users.find({name: {$type: 2}});  
查询所有 age 字段是整型的   
db.users.find({age: {$type: 16}});  
对于字符字段,可以使用正则表达式   
查询以字母 b 或者 B 带头的所有记录   
db.users.find({name: /^b.*/i});  
$elemMatch(1.3.1 及以上版本 )  
为数组的字段中匹配其中某个元素   
Javascript 查询和 $where 查询   
查询 age > 18 的记录,以下查询都一样   
db.users.find({age: {$gt: 18}});  
db.users.find({$where: "this.age > 18"});  
db.users.find("this.age > 18");  
f = function() {return this.age > 18} db.users.find(f);  
排序 sort()  
以年龄升序 asc  
db.users.find().sort({age: 1});  
以年龄降序 desc  
db.users.find().sort({age: -1});  
限制返回记录数量 limit()  
返回 5 条记录   
db.users.find().limit(5);  
返回 3 条记录并打印信息   
db.users.find().limit(3).forEach(function(user) {print('my age is ' + user.age)});  
结果   
my age is 18  
my age is 19  
my age is 20  
限制返回记录的开始点 skip()  
从第 3 条记录开始,返回 5 条记录 (limit 3, 5)  
db.users.find().skip(3).limit(5);  
查询记录条数 count()  
db.users.find().count();  
db.users.find({age:18}).count();  
以下返回的不是 5 ,而是 user 表中所有的记录数量   
db.users.find().skip(10).limit(5).count();  
如果要返回限制之后的记录数量,要使用 count(true) 或者 count( 非 0)  
db.users.find().skip(10).limit(5).count(true);  
分组 group()  
假设 test 表只有以下一条数据   
{ domain: "www.mongodb.org"  
, invoked_at: {d:"2009-11-03", t:"17:14:05"}  
, response_time: 0.05  
, http_action: "GET /display/DOCS/Aggregation"  
}  
使用 group 统计 test 表 11 月份的数据 count:count(*) 、 total_time:sum(response_time) 、 avg_time:total_time/count;  
db.test.group(  
{ cond: {"invoked_at.d": {$gt: "2009-11", $lt: "2009-12"}}  
, key: {http_action: true}  
, initial: {count: 0, total_time:0}  
, reduce: function(doc, out){ out.count++; out.total_time+=doc.response_time }  
, finalize: function(out){ out.avg_time = out.total_time / out.count }  
} );  
[  
{  
"http_action" : "GET /display/DOCS/Aggregation",  
"count" : 1,  
"total_time" : 0.05,  
"avg_time" : 0.05  
}  
]

MongoDB 高级聚合查询

MongoDB 版本为: 2.0.8 

系统为: 64 位 Ubuntu 12.04

先给他家看一下我的表结构 [Oh sorry, Mongo 叫集合 ]

MongoDB 高级聚合查询

如你所见,我尽量的模拟现实生活中的场景。这是一个人的实体,他有基本的 manId , manName , 有朋友 [myFriends] ,有喜欢的水果 [fruits], 而且每种水果都有喜欢的权重。

很不好的是你还看见了有个 “_class” 字段? 因为我是 Java 开发者, 我还喜欢用 Spring ,因此我选用了 Spring Data Mongo 的类库 [ 也算是框架吧,但是我不这么觉得 ]。

现在有很多人 Spring 见的腻了也开始烦了。是的, Spring 野心很大,他几乎想要垄断 Java 方面的任何事情。没办法我从使用 Spring 后就离不开他,以至于其他框架基本上都不用学。我学了 Spring 的很多,诸如: Spring Security/Spring Integration/Spring Batch 等。。。不发明轮子的他已经提供了编程里的很多场景,我利用那些场景解决了工作中的很多问题,也使我的工作变得很高效。从而我又时间学到它更多。 Spring Data Mongo 封装了 mongodb java driver ,提供了和 SpringJDBC/Template 一致编程风格的 MongoTemplate 。

见: http://static.springsource.org/spring-data/data-mongodb/docs/current/api/org/springframework/data/mongodb/core/MongoTemplate.html

不说废话了,我们直接来 MongoDB 吧。

  • Max 和Min

我和同事在测试 Mongo 时,索引还写了不到一半,他想查询某个字段的最大值,结果找了半天文档也没找到关于 max 的函数。我也很纳闷这是常规函数啊怎么不提供? 后来经过翻阅资料确定 Mongo 确实不提供直接的 max 和 min 函数。但是可以通过间接的方式 [sort 和 limit] 实现这个。

要查询最大值我们只需要把结果集按照降序排列,取第一个值就是了。

如我的例子,我想取得集合中年龄最大的人。

1db.person. find ({}). sort ({ "age" : -1}).limit(1)

相反如果想要年龄最小的人,只需要把 sort 中改为 {“age” : 1} 就可以了。

当然我们使用了 sort ,对于小数量的文档是没问题的。当对于大量数据需要给 age建立索引,否则这个操作很耗时。

  • distinct

MongoDB的destinct命令是获取特定字段中不同值列表的最简单工具。该命令适用于普通字段,数组字段[myFriends]和数组内嵌文档[fruits].

如上面的图片,我认为 fruits 和 myFriends 字段是不同的。网上很多资料和例子都没说到这个情景,因为我们也业务是 fruits 这样的模型,我测试了。对于 fruits.fruitId他也是可行的。

如上面的表结构,我想统计所有的喜欢的水果。

db.person.distinct("fruits.fruitId") // 查找对象里引入对象的值,直接加.

 他成功执行了。输出如:

[ "aaa", "bbb", "ccc", "www", "xxx", "yyy", "zzz", "rrr" ]

 我想统计集合中共有多少个人 [ 按名字吧 ]

db.person.distinct("manName")

 我想统计指定个数的人的共同关注的朋友。

db.person.distinct("myFriends", {"manName" : {"$in" : ["ZhenQin", "YangYan"]}})

 输出如:

[ "234567", "345678", "456789", "987654", "ni", "wo" ]

那么我使用 Java 呢? 我只是在演示 Mongo 的命令,用 Spring Data Mongo 是怎么操作的?

Spring Schema :

<beans xmlns="http://www.springframework.org/schema/beans"       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"       xmlns:context="http://www.springframework.org/schema/context"       xmlns:mongo="http://www.springframework.org/schema/data/mongo"       xsi:schemaLocation="http://www.springframework.org/schema/beans          http://www.springframework.org/schema/beans/spring-beans-3.0.xsd          http://www.springframework.org/schema/context          http://www.springframework.org/schema/context/spring-context-3.1.xsd          http://www.springframework.org/schema/data/mongo          http://www.springframework.org/schema/data/mongo/spring-mongo-1.0.xsd">    <context:property-placeholder location="classpath:mongo.properties" />    <!-- Default bean name is 'mongo' -->    <mongo:mongo id="mongo" host="${mongo.host}" port="${mongo.port}" />    <mongo:db-factory id="mongoDbFactory"                  mongo-ref="mongo"                  dbname="mongotest" />    <bean id="mongoTemplate" class="org.springframework.data.mongodb.core.MongoTemplate">        <constructor-arg name="mongoDbFactory" ref="mongoDbFactory"/>    </bean></beans>

  max 和 min 的测试 :

@Test    public void testMaxAndMinAge() throws Exception {        Query q = new BasicQuery("{}").with(new Sort(new Sort.Order(Sort.Direction.ASC, "age"))).limit(1);        Person result = mongoTemplate.findOne(q, Person.class);        log.info(result);        q = new BasicQuery("{}").with(new Sort(new Sort.Order(Sort.Direction.DESC, "age"))).limit(1);        result = mongoTemplate.findOne(q, Person.class);        log.info(result);    }

  distinct 的测试:

@Test    public void testDistinct() throws Exception {        List result = mongoTemplate.getCollection("person").distinct("myFriends");        for (Object o : result) {            log.info(o);        }        log.info("==================================================================");        Query query = Query.query(Criteria.where("manId").is("123456"));        result = mongoTemplate.getCollection("person").distinct("myFriends", query.getQueryObject());        for (Object o : result) {            log.info(o);        }        log.info("==================================================================");        result = mongoTemplate.getCollection("person").distinct("fruits.fruitId");        for (Object o : result) {            log.info(o);        }    }

 输出的结果为:

12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 23456712-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 34567812-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 45678912-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 98765412-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] ni12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] wo12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 12345612-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(75)] ==================================================================12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 23456712-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 34567812-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 45678912-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 98765412-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(82)] ==================================================================12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] aaa12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] bbb12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] ccc12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] www12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] xxx12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] yyy12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] zzz12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] rrr12-22 14:13:45 [INFO] [support.GenericApplicationContext(1020)] Closing org.springframework.context.support.GenericApplicationContext@1e0a91ff: startup date [Sat Dec 22 14:13:44 CST 2012]; root of context hierarchy

 这里我要特别说明一下, 当使用了Spring Data Mongo,如上面的findOne(query, Person.class)它就会把查询的结果集转换成Person类的对象。Spring Data Mongo的很多API中都这样,让传入了一个Bean的class对象。因为distinct的测试是输出list<String>的,我 使用的mongo-java-driver的api。他们都很简单,唯一的是Query这个Spring提供的对象,希望读者注意,他几乎封装了所有条件 查询,sort,limit等信息。

0 0
原创粉丝点击