我想从事搜索行业,应该选择谁?

来源:互联网 发布:nginx http1.1配置 编辑:程序博客网 时间:2024/04/28 07:31

一片短小的老文章 "我想从事搜索行业,应该选择谁?" 想从事搜索同学可以读读,尤其是在移动互联网时代,选择搜索,何去何从:

每次聊产品的时候,我的第一个问题总是:这个产品要提供给用户的核心价值是什么?其次的问题是:要达到这个目的,需要解决哪些关键的问题?接下来的问题是:别人是如何解决这些问题的?最后的问题是:你打算如何解决这些问题?


以搜索引擎来说吧。很多在学校里修得武功的工程师,觉得做出一个搜索引擎也不是什么难事。无非就是爬取数据,建立索引,向用户提供检索而已。而每个环节,学术界也都是有通行的理论和算法。那么剩下的,就是比拼谁的投入更大,谁更聪明,更能想得出点子了。

但是,如果沿我上面所提的问题,拓开考虑一下,问题就出来了。

第一个问题是,核心价值是什么?这不是明知故问吗?搜索引擎么,自然是提供精确的结果,满足搜索需求了。那么我问,搜索需求有哪些?对于这些需求,理想的状态是什么?这是一个目标设定、以及评估标准设定的问题。我估计这就能难倒一堆人。

最近丹尼·苏利文撰文批评Google的相关性不好,在我看来,苏利文说的某些细节也许是对的,但整体上,他需要更新一下对搜索引擎的价值和评价认知了。那种要十个来自不同网站的绝对伟大的结果的思路指引,是上个时代的学术界的搜索观念。实际上,主流搜索引擎对搜索结果的理想状态构思,已远在苏利文的想象范畴之外了。但这对于一个不在工程第一线的人来说,要认识到这一点有十分的难度,所以苏利文的评述能到这等程度,我以为已经是非常可贵了。

我借这个case想说明一点,没有切身的和最广泛的用户需求做过亲密接触,从而无法将含糊的核心价值分解为若干可实施、可衡量的具体目标,实际是很多踌躇着要进入某个领域的人和团队的最大障碍。对新入行者而言,这往往意味着高昂的试错成本。对于新领域,可以有足够多的试错机会;对于竞争激烈的领域而言,来回试错也许意味着与领先者差距的渐行渐远。

第二个问题是,要解决哪些关键问题?这似乎也是明知故问。不就是资源抓取和存储,数据索引,权重排序,以及结果呈现吗?很多都是现成的。

但现实是很残酷的。首先的问题,早年算法的基础,无论是链接结构(自动链接,劣质链接),还是信息结构(富媒体,以及网站的数据库化),都随着互联网的变化,而发生了巨大的变化。用传统的逻辑去处理现代的互联网,会碰得头破血流。其次,是后进者的数据获取门槛问题。如果你仅能贡献不足1%的用户流量,却要求和80%市场的领先者同样的网站抓取压力,这会遇到怎样的反弹?而且如果是初阶的抓取算法,其有效率会远低于成熟的算法,这更加会导致站长的抵制。第三,是随着互联网的发展,有大量新的可被搜索引擎利用的因子涌现。而先行者已经对这些因子有了充分的实验和利用,后进者仍然停留在对传统因子的迭代试错中,这个何时是个尽头?最后一点,也是很要命的一点,是先行者利用市场地位优势,通过”互动可编辑以及个性化“的方式优化搜索结果,这更是新入行者难以逾越的门槛,因为它不是一个纯技术问题。

简言之,手段越来越丰富,且越来越”妖“了,绝非限于教科书上的介绍。产业界的进展,远快于学术界的理论和技术积累。

第三个问题,别人都是如何解决这些问题的?就搜索而言,通过挖角,可以暂时的了解某个时间横断面上的解决思路,但较难建立长久性的应对机制,这是由于某些关键性的数据和机制的匮乏所致的。面对google这个庞然大物,bing对此大概最有发言权吧。即便知道又怎样?知道了也缺乏实施的基础,或者试错的时间,除非领先者自己犯下致命的错误。

最后一个问题,what will you do?这个行业已不是一个靠”点子“或者”专利“致胜的年代了。每一个方向,都是有一群聪明到”绝顶“的兄弟在啃。如果真对搜索感兴趣,无外乎两种选择:

第一种选择,是进入这个行,但选择领先者,以实践自己的聪明才智。
第二种选择,是进入这个行,但选择挑战者,以见证奇迹的诞生,但要冒极高的风险——若五年不成怎么办,和选择一的兄弟可能会产生巨大差距。

有一个问题是,搜索这个领域是否有足够多的施展机会,以实现”我要做出点名堂来"的想法吗?我的看法是,互联网的变化有多大,这个领域的施展空间就有多大,任何时候都不晚。

我总是期望能有越来越多的杰出者加入到搜索这个领域中,并使之愈来愈完美。无他,这是一个挑战个人智商和能力的领域,也是对社会有足够大的影响、关乎社会责任和理想的领域——整天责怨,何如自己去改造?
0 0
原创粉丝点击