搜索新技术分享

来源:互联网 发布:java语言是一个系列吗 编辑:程序博客网 时间:2024/05/01 04:15


   搜索引擎是互联网领域的兵家必争之地,内有
3QSB大战,外有GMY三足鼎立,斗得不亦热乎。争得虽然热闹,但从一个用户的直观感受来看,搜索结果已经很长时间没有突破性的进展了。以百度为例,虽然框计算在热门搜索上表现出众,但在学术、长尾搜索上,一直没有什么惊喜。Google的英文搜索应该是当前搜索领域的最高水准了,偏偏它要在中国市场抽风。


作为一个搜索重度用户,我对这个领域有着很多期待。长远来看,是希望它可以进化为一个问题解答器,而不再是搜索引擎。已经出来的WolframAlpha智能搜索引擎让我看到了希望。当然,真的要做到这一步,应该还需要很久。而在当下,搜索大致可以分为三块:普通搜索、移动搜索以及实时社交搜索。普通搜索就是我们日常在PC端的搜索,移动搜索是指在移动设备上的搜索,社交搜索是指在社交平台上进行的搜索。第一块还在不断的探索改进,而后两者也已经在迅猛的发展当中。接下来,我分享一下自己了解到的一些新兴搜索技术。

 

普通搜索

 

搜索的基本框架分三块:利用爬虫收集数据、建立索引、为网页打分。在为网页打分时,网页本身的质量以及网页与query的相关性是两个重要因素。PageRank就是对网页质量进行打分的技术。

在收集数据这一块,由于信息的爆炸式增长,问题变得越来越有挑战性。用户可以通过键盘输入、语音甚至图片做为关键词。而需要收集的信息也不再只有普通网页,图书、视频、新闻甚至社交平台上的信息都要收纳进来。如何有效的处理它们呢?

举两个简单的例子。1)news搜索当中,资源质量参差不齐,于是在保守状况下,搜索引擎只愿意收录一些大的新闻网站上的新闻。这样的话,搜出来的结果会很少。如何扩大收录资源的范围又能够保证资源质量,是个很有挑战性的问题。2)同样在news搜索当中,如果搜索结果较多,则需要将一些内容相似的文章进行聚类。每一个cluster只呈现一篇给用户。其中,如何有效的进行聚类就是需要优化的问题。

在判断网页和query的相关性时,好的搜索引擎应该提供个性化服务。也就是说,要根据用户的特点、搜索上下文来计算网页和query的相关性。比如,可以根据浏览器中存储的cookies来分析用户的特性,针对性的提供搜索结果。再比如,很多搜索是从用户在网页上点击右键后转过来的,这样的query就有了天然的上下文,所提供的搜索结果也需要把上下文环境考虑进去。

 

移动搜索

 

哪怕是如我这样迟钝的人,都已经意识到移动互联网时代的到来。智能手机、平板逐渐成为我随身携带的娱乐工作中心。事实上,现在人们在移动设备上使用搜索引擎的体验是比较糟糕的,继续依循PC上从网页到网页再到网页的思路,这在移动设备上有一些先天性的问题:小屏幕、速度慢等。因此大家更多的会选择APP,因为APP带来了一种全新的体验模式,它无需你从这到那,一键式就可以获得自己需要的东西。因此,如今在移动搜索上,需要大幅度的改进用户体验。

搜索新技术分享

个人认为移动搜索有几个非常明显的特点:用户目的性强、实时性和社交化、本地化。针对这几个特点,移动搜索可以做出相应的改进。

(1)      目的性强

调查显示,60%的消费者在购物前都会掏出手机搜一下这个品牌。这是个非常惊人的比例,既蕴藏了巨大的商机,也充分体现了移动用户的强目的性。既然用户目的性这么强,移动搜索引擎就需要在最短的时间内提供给用户最好的结果。也许可以从以下几个方面来考虑。

A. 搜索引擎本身最好做成APP的形式,而不是需要打开浏览器才能够找到。

B. 如果搜索结果能够用应用来满足,就提供应用。比如搜索某首歌曲、某个品牌的信息,可以提供给用户WebAPP

C.整合APP Store,以满足用户在搜索引擎中搜索APPGoogle就已经整合了苹果的APP StoreAndroid应用商店。

D. 更多的搜索交互方式。Bing SearchAPP中的新功能visual scanning,可以直接扫描物体的条形码或者封面,便可以获得该物体的信息。

E.敦促有合作关系的站点尽快适合移动设备的展示,如果可能的话,最好用WebAPP的形式来实现。百度有一种新的技术,会将站点自动转化为APP形式。

 

(2)      实时性和社交化

由于手机和平板的移动特点,其搜索内容会更注重实时性和社交性。在实时性上,能搜到社交平台上内容就显得非常重要。百度和新浪微博,FacebookTwitterBing的合作,也体现了各个公司对于这点的重视程度。Bing SearchAPP中,甚至直接嵌入了Facebook/Twitter的状态信息。

 

3)本地化

可以想象,很多时候,我们拿出手机来搜,是希望能够搜到和当前位置信息相关的信息。这一块的搜索非常重要。Bing Search APP中就有两个非常好的栏目:本地和出行,将多种位置相关的资源整合进了搜索引擎。

 

 

实时社交搜索

 

整天泡在各种社交平台上的我们已经开始习惯到人人网、新浪微博上去搜一些新玩意,“实时社交搜索”也因此变成一个越来越热门的话题。但实际上还没有一个真正有影响力的“社交搜索引擎”。在现阶段,它还是个在探索的东西。

Mark是怎么看社交搜索的呢?“Facebook用户每天大约发起十亿次搜索,大部分是寻找好友,但也有相当一部分是针对Facebook上的商业活动、品牌以及应用。与传统搜索不同的是,在Facebook搜索的内容大多是网友的提问,而Facebook庞大的用户基数显然具有天然的优势。未来搜索的发展趋势是,用户需要得到搜索问题的具体答案,而不是大量结果。比如说,过去6个月我的Facebook好友去过纽约的哪些寿司店,其中有哪些是他们喜欢的?通过Facebook搜索就能得到想要的答案,这是其他搜索引擎无法做到的。Facebook团队正专研于在客户有疑问时,能够转出一组靠谱的回答给用户参考。”

著名网址缩略服务Bitly已经发布消息了实时社交搜索平台并推出基于此平台的第一项服务“声誉监测”的Beta版。Bitly每天要缩略8000万个链接,积累了互联网上每天源源不断产生的各类链接的详细数据。分析这些链接的内容,Bitly可以相当程度上掌控互联网上的热点和它们的发展趋势。凭借这种先天的优势,Bitly的实时社交搜索平台应运而生。

搜索新技术分享

Bitly在缩略每个链接的过程中会建立对应的索引。通过索引中记录的相关信息,用户可以对互联网上的正在“病毒式”传播的热门内容有一个全方位的了解。输入一个搜索关键词后,Bitly社交搜索工具将反馈24小时内Bitly预测的、最可能成为热点的内容。用户还可以用Bitly的链接分析工具进一步优化实时预测的结果。Bitly实时社交搜索工具当然不会使用类似PageRank的技术,而是依赖最有价值的预测手段:点击数。

推出新平台的同时,Bitly还发布了基于此平台的服务——“声誉监测”。这项服务主要针对企业用户,监测对象是互联网上人们对产品、品牌的讨论内容。Bitly为入库的搜索结果增加了“感情分析”,以此判断人们对产品、品牌的态度和感情变化。掌握了这些数据后,Bitly为企业用户建立的预警系统将实时地监测跟踪关键词的变化,向企业用户及时反馈客户对品牌的态度和感情变化。

现在我们在人人、微博上使用的搜索引擎也已经将时间属性、帖子热门程度、发帖人的权威程度等的权重考虑了进去,是一个好的开端。

 

 

搜索引擎里的广告

 

搜索里还有一项重要的业务是“广告”。在搜索引擎中做广告是件很有趣的事情,既要不伤害用户体验,又要最大化广告主的利益,是一个需要反复balance的问题。

提升用户的广告体验呢?Google提出了“个性化广告”。首先,可以根据用户的搜索记录、网络历史记录以及Google广告客户网站的访问情况,来个性化广告。例如,如果先搜了“酒店”,然后搜了“旅行”,接着又搜了“北京”,则最后一次搜索的结果可能会包含北京酒店的广告。再举个例子:如果用户通过笔记本电脑在 Google 上搜索了“北京”,后来又用同一个Google账户通过移动设备搜索了“烤鸭”,那么可能就会看到“北京烤鸭”的广告。同时,也可以根据网络历史记录特别是Google广告点击记录,来分析用户的喜好,提供个性化的广告。第二,Google还有一个广告偏好设置管理器,用户可以主动选择自己的兴趣爱好,甚至可以关闭某些类型的广告。应该说,在广告投放上给与了用户最大的空间和尊重。

为广告主所做的事情可以称为搜索领域的BI:用数据挖掘等技术,对数据表象进行深入的分析和统计,更好为广告主进行服务。比如,给广告主推荐关键词,确定广告展现形式以及播放策略等。再比如,如果广告的点击率出现了一定的波动,就需要对数据进行分析,找出波动的原因,及时为客户发现和解决问题。

 

未来的搜索引擎

 

Google的产品经理Menzel谈到他对于搜索引擎的展望,他表示,“希望让搜索变得更加自然”。现在对于用户来说,还有搜索技巧这一说,希望以后的搜索引擎能够像朋友一样,不再存在技巧之说。个人认为,百度的框计算,Google之前的所做的庞大的“知识图谱”,都是在向这个方向所作的努力。从这样的愿景出发,有两种新型搜索引擎是很值得期待的:可视搜索引擎Oolone,智能式搜索引擎Wolfram Alpha。有兴趣的可以到以下两个链接去了解:

http://www.36kr.com/p/88005.html

http://www.alibuybuy.com/posts/70342.html##jtss-tsina