在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!

来源:互联网 发布:游戏自动签到软件 编辑:程序博客网 时间:2024/04/24 14:12

一直琢磨,譬如:谷歌通过一个外链<a href="">seo</a>进入这个网站,然后抓取网站里面的内容,在这个抓取过程中的流程,和抓取后的结果,谷歌是怎么处理的,怎么分析这个网站,我得到那些数据,谷歌怎么从这些数据信息中析构出那些关键词,这些关键词怎么评的分,评分后怎么处理,在数据库中是怎么一个结构,琢磨的遇到了瓶颈,怎么也过不去,细想了一下,从搜索方面考虑,姑姑大哥的终极理念不就是给搜索用户得到用户想要的信息吗?怎么判断,可以通过自己写一些搜索的内容,看搜索结果的数据,分析这些数据,毕竟可控,可以看到,可以看到一些自己可以分析的数据,这样的话,也是一种逆向的不错的方法,自己就瞎琢磨了这些流程,用来解释我搜索的想象。

1

我搜索的现象:

1.1

不正常的内容太多,谷歌会拒绝查询,譬如:d:/fdf/fdfw/g/h/gh/g//v/cxg/fd/gf/h/fd/g,在谷歌查询,谷歌拒绝查询

1.2

在打入单词,只要每一个单词都是英文正规单词,譬如:

nate strategic Majority Leader  good Increased  the Sales Majority Leader  good Increased  prioritize made that Dick Durbin Niche Retail a Reports   Neglect Majority Leader  good Increased   Crucial Majority Leader  good Increased  Survival Tool move its Majority Leader  good Increased  loyalty to Partner has

无论这个问题多么的杂乱五章,语句多么的不通顺,字母多么的多,总之,只要每一个单词是合法的,就会出结果来

3

有一些搜索中没有我写的关键字,譬如:我搜索magento  wiki   how to  get a featrured  product,出来一个网站没有wiki这个单词,但是排在了第4名,这个站是一个在magento方面很有权威性的站点,关键词匹配不全面,照样出来,

 

看来谷歌在研究这个需要什么样的信息方面,的确,牛逼,不和百度似的,技术达不到这个要求,有时候我就想了,百度的搜索结果不全面,所以推出了一个百度百科,百度知道,然后累计大家经常遇到的问题,然后让大家上谷歌找资料,解答这个问题。百度做的是中国的搜索引擎,所以可行性蛮高的,慢慢的,百度不是一个搜索引擎,而是一个查询库,靠中国人上谷歌搜索资料,进行累积的库,技术不行,也有牛逼的理由,因为,我的方式牛逼!!

 

自己猜的流程:

 

内容查询--->分析内容里面的信息是否合法,如果不合法,查看不合法的比例,然后不合法的信息进行查询,是否有结果,如果没有,则定位不合法信息,如果不合法信息过高,则拒绝继续查询

--->信息满足谷歌的合法分析后,然后对每个单词进行匹配,按照一个匹配比例值,譬如:90%,单词匹配。这样将,带有搜索内容的网站都给查询出来了,然后根据“单体”匹配度评分。

--->在按照语法方面的匹配度,进行评分,譬如:magento  how to get a featured product,如果how to get a featured product,直接在某个网页直接匹配,这样获得的分值会高!

--->该页面的权重评分,权重高的网页相当于专家,分值高

--->在搜索内容中的关键词划分,然后查看划分后的关键词在该网页中的地位,譬如是在内容中,还是在title,keyword,description中,等然后在给一个分值,也有可能该步骤没有,直接权重搞定,猜把。

--->在没有完整匹配的情况下,就要把这个内容拆分成几个关键字,这里应该看该关键字对应的网站的一个综合得分把,包括该关键字的外链情况,也就是这个关键字对应的这个URL网页,谷歌给定的分值,然后换算成该算法中的分值,然后在打分。 

--->也许有条件符合评分,譬如权重高的站,匹配度高,带来的复合条件评分,等,这些应该都是有可能的吧!

然后根据这个分值,然后排列出来

猜的,没权威性!!

原创粉丝点击