solr StatsComponent(聚合统计)

来源:互联网 发布:windows vista是什么 编辑:程序博客网 时间:2024/06/06 04:41

StatsComponent

转载请出自出处:http://eksliang.iteye.com/blog/2169134

http://eksliang.iteye.com/

一、概述

       Solr可以利用StatsComponent 实现数据库的聚合统计查询,也就是min、max、avg、count、sum的功能

 

二、参数

参数含义stats是否开启stats(true/false)stats.field添加一个字段来统计,可以有多个stats.facet 在给定的面返回值的子结果。

 

三、参考实例

参考实例一:查询参数

 

q=*:* &stats=true&stats.field=price&stats.field=popularity&rows=0

 返回结果如下:

 

 

<lst name="stats"> <lst name="stats_fields">  <lst name="price">    <double name="min">0.0</double>        --最小值    <double name="max">2199.0</double>     --最大值    <double name="sum">5251.2699999999995</double> --总和    <long name="count">15</long>                   --记录数,也就是多少行记录    <long name="missing">11</long>                 --结果集中,有多少条记录是空值    <double name="sumOfSquares">6038619.160300001</double> --平方和(x1^2 + x2^2+xn^2)    <double name="mean">350.08466666666664</double>        --平均数(x1+x2+xn)/n    <double name="stddev">547.737557906113</double>        --标准差  </lst>  <lst name="popularity">    <double name="min">0.0</double>    <double name="max">10.0</double>    <double name="sum">90.0</double>    <long name="count">26</long>    <long name="missing">0</long>    <double name="sumOfSquares">628.0</double>    <double name="mean">3.4615384615384617</double>    <double name="stddev">3.5578731762756157</double>  </lst> </lst></lst>

 参数含义如下:

返回字段字段含义min最小值max最大值sum总和count记录数,也就是多少行记录missing结果集中,有多少条记录是空值sumOfSquares平方和(x1^2 + x2^2+xn^2)mean 平均数(x1+x2+xn)/nstddev标准差

 

 

参考实例二:查询参数如下

 

q=*:* &stats=true&stats.field=price&stats.field=popularity&stats.facet=inStock&rows=0

返回结果如下所示:

 

 

<lst name="stats"> <lst name="stats_fields">  <lst name="price">  <double name="min">0.0</double>  <double name="max">2199.0</double>  <double name="sum">5251.2699999999995</double>  <long name="count">15</long>  <long name="missing">11</long>  <double name="sumOfSquares">6038619.160300001</double>  <double name="mean">350.08466666666664</double>  <double name="stddev">547.737557906113</double>  <lst name="facets">   <lst name="inStock">    <lst name="false">  --统计的是:在返回结果中inStock等于false部分,price的统计      <double name="min">11.5</double>   --在inStock等于false的记录中pirce的最小值      <double name="max">649.99</double> --在inStock等于false的记录中pirce的最大值      <double name="sum">1161.39</double>--在inStock等于false的记录中pirce的总和      <long name="count">4</long>        --inStock等于false的记录数      <long name="missing">0</long>      --在inStock等于false的记录中pirce等于空的记录      <double name="sumOfSquares">653369.2551</double>--在inStock等于false的记录中pirce的平方和      <double name="mean">290.3475</double>--在inStock等于false的记录中pirce的平均值      <double name="stddev">324.63444676281654</double>--在inStock等于false的记录中pirce的标准差    </lst>    <lst name="true">      <double name="min">0.0</double>      <double name="max">2199.0</double>      <double name="sum">4089.879999999999</double>      <long name="count">11</long>      <long name="missing">0</long>      <double name="sumOfSquares">5385249.905200001</double>      <double name="mean">371.8072727272727</double>      <double name="stddev">621.6592938755265</double>    </lst>   </lst>  </lst> </lst></lst>

  

 

温馨提示:如果统计的列不是数字类型。而是字符串,那么统计的结果中只有如下列

参考实例如下:查询参数

q=*:*&stats=true&stats.field=CAR_NUM&rows=0

 返回结果如下所示:

 

<lst name="stats">  <lst name="stats_fields"><lst name="CAR_NUM"><str name="min">08449</str><str name="max">黑ZZ6T8警</str><long name="count">9999999</long><long name="missing">0</long><lst name="facets"/></lst>   </lst></lst>

 

 官方API地址:http://wiki.apache.org/solr/StatsComponent

 

0 0