关于腾讯2010的划词搜索的思考

来源:互联网 发布:域名重新解析 编辑:程序博客网 时间:2024/04/29 18:39

       腾讯2010里新推出的划词搜索,让我非常激动。这项功能可能会大大提升soso的访问量,而且基于这项功能,可以做很多上下文相关搜索和广告推荐的改进。

    目前想到的有这么几点: 1.在用户划词搜索时,他选取的应该是在一段话中的一部分内容。而他没选取的内容,并不是没有用的。这些未选取的内容,可以帮助提高检索结果的相关性,使搜索结果更加精确。比如,用户搜索“苹果”,他可能希望搜索的是水果苹果,也有可能想搜索的是苹果公司。这样的查询在一般的网页搜索中是难以准确判定用户查询意图的(也有研究使用用户之前输入的内容帮助消歧的,但如果搜索引擎要保留使用用户之前输入内容,需要额外的开销)。而在划词搜索这个场景下,可以得到很多的额外信息。比如在搜索时,搜索者正在和别人聊,让别人均衡营养,多吃水果。那么他划词搜索时应该是查的水果“苹果”。而如果他在和别人聊最新推出的iphone,ipad什么的,那他查“苹果”应该是在查苹果公司。 2.用户查询时,搜索引擎会保留用户的查询日志,新推出的划词查询功能,最大的贡献应该会是在这个查询日志中加入一个QQ号这个重要信息!这个作用就大了,以前做个性化查询时,判断搜索者是不是同一个人是很难的,只能从用户的访问IP和查询行为来做判断,而从这些方法判断,是很难的,我们大家都知道,局域网的用户都是使用的同一个IP,他们的查询习惯都是不一样的,而且用户经常在不同的地方用不同的IP访问搜索引擎,如果换了IP,那么系统无法知道用户之前的搜索行为,使得个性化搜索难以进行。而QQ号这个信息就非常有用,共用同一个QQ号的用户很少,绝大部分用户都是使用的一个常用的QQ,那么搜索日志里就可以记录到他大量之前搜索情况,非常适合做个性化的搜索和广告推荐。

    不过上面两种都有可能设计到隐私的问题,一是用户可能不希望你能获取到他聊天的除了划词之外的其他内容,二是用户不希望qq号被记录到日志中去。

    暂时想到的只是这么多,如果充分利用好这些信息,可以大大提高搜索的相关性和排序结果的质量,特别是个性化的搜索结果和广告推荐。最重要的是这些数据和资源是其他的不基于用户的传统搜索引擎如百度、google等想要都拿不到的,也将成为日后soso超越他们的重要武器。