《The query-flow graph: model and applications》

来源:互联网 发布:运营优化方案 编辑:程序博客网 时间:2024/05/05 14:30

  1. Query graphs:

Baeza-Yates 指出有5种不同类型的图。在所有的方法中,结点是query;边被引入两个结点间。

word graph:两个query有共同的term

session graph:同一个session内的query。

url conver graph:用户点击了搜索结果中的相同的url。

url link graph:两个被点击的url直接有边

link graph:如果两个url有共同的term。


         2 Query Segmentation.

                    这里的query分割,不是对query的分词,而是对用户联系输入多个query,按照意图分割为多个session。

         3.基本概念:

Query log:一个query log,必须包含的,user id(cookie),time,query,click url,browser,refer url

Session:特定用户在具体时间限制内的Query

构建THE QUERY-FLOW GRAPH(查询流图)

根据Query-Query的转义概率统计得到 query flow graph。由于某些query之间无法统计,因此另外一种方法是构造模型来计算query pair之间的相关性。模型特征包括3种特征:文本特征,session特征,时间相关的特征。

计算方法:

变为TSP问题求解。

原创粉丝点击