Mongodb采用$in方式提升操作效率

来源:互联网 发布:淘宝购物比价软件 编辑:程序博客网 时间:2024/05/17 06:19
  Mongodb操作里许多人喜欢采用PHP的循环操作,这种方式效率非常低下,可以优化。
1、 查询:
    有两种方式,在PHP里循环查询和使用$in的方式。做一个查询1000条数据的示例如下:
view plain
  1. // 循环查询  
  2. for($i = 0; $i < count($array); $i++) {  
  3.          $item = $collection -> findOne(array("_id" => new MongoId($array[$i])));  
  4.          echo $item["profile"]["name"] . "<br />";  
  5. }  

    运行时间:0.52035784721375

view plain
  1. // 采用$in的方式  
  2. $mongoIds = array();  
  3. for($i = 0; $i < count($array); $i++) {  
  4.          $mongoIds[] = new MongoId($array[$i]);  
  5. }  
  6. $cursor = $collection -> find(array("_id" => array('$in' => $mongoIds)));  
  7. while($item = $cursor-> getNext()){  
  8.          echo $item["profile"]["name"] . "<br />";  
  9. }  

    运行时间:0.15661716461182
    结果采用循环方式的运行时间为$in方式的3倍以上。
2、 更新:
    还是两种方式,在PHP里循环更新和使用$in的方式。做一个查询1321条数据的示例如下:
view plain
  1. // 循环更新(目前删除blog时采用的方式)  
  2. foreach ($fans as $fan)  
  3. {  
  4.          $feed = $db -> command(array("findAndModify" => $MONGO_DB_FEED,  
  5.                    "query" => array('_id' => new MongoId($fan)),  
  6.                    "update" => array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count"=>-1)),  
  7.                    "new" => true  
  8.                    )  
  9.          );  
  10. }  
    运行时间:28.02441906929
view plain
  1. // 采用$in的方式  
  2. $mongoIds = array();  
  3. foreach ($fans as $fan) {  
  4.          $mongoIds[] = new MongoId($fan);  
  5. }  
  6. $feed -> update(array('_id' => array('$in' => $mongoIds)), array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count" => -1)), array('multiple' => true));  
    运行时间:0.011945962905884
    结果采用循环方式的运行时间为$in方式的2335倍!
    第一种方式非常容易出现运行的超时的情况造成操作不成功,而第二种方式在提高效率的同时避免了这种问题的出现。
    造成这样问题的原因是1、循环里的网络请求时间消耗太多时间2、$in操作可以进行查询优化,也不需要多次编译。
原创粉丝点击