科普文章--解剖Google

来源:互联网 发布:windows.onload 编辑:程序博客网 时间:2024/05/12 01:04

引言~

現代人生活中遇到了許許多多的問題,通常大家第一個想到的不會是問人、找書…,而是上網查詢,對於全世界的使用者,所有的搜尋引擎當中又以Google最為常用。

正文~

相信許多人都跟orz有相同的疑惑:

orz:“為甚麼Google可以幫助我在極短暫的時間當中找到我所需要的資料?”
@^@:這個答案很難,卻也很簡單。Google要在極短暫的時間中找到全世界所有資料並呈現出來幾乎是不可能的,所以Google在你搜尋關鍵字之前就已經為你整理了相關的資料、網站。
orz:為什麼Google會知道我未來要搜索什麼,難道Google是全知全能的神嗎?

@^@:不不,Google當然不是全知全能的,他只是養著一群爬蟲,讓這些蟲子到各地去蒐集資料,蒐集到的資料再進行分類歸檔,最後匯總到Google的資料庫中。
orz:分類歸檔要幹嘛?
@^@:就跟我們在圖書館一樣呀,你覺得你在以下兩種情境下找資料,哪以個會比較有效率?
  A一堆沒有經過整理排序的書中

  B在整理過後可以清楚知道某類型資料集中在某一區域、某個書架

歸檔到Google暫存的資料庫中,只要你輸入關鍵字,那麼就可以立刻將整個資料庫的資料都呈現給你,因為那都已經整理好了。而且,雖然搜尋的是Google在過去(相對於搜索的瞬間)就已經儲存的暫存,但是因為爬蟲更新速度太快了,所以相對於我們人類來說幾乎就是最新的。
orz:可是我去圖書館查資料,常常因為同義詞或是錯字而找不到書,Google為什麼不會這樣?
@^@:因為當你輸入關鍵字之後,Google會先檢查你拼字是否正確,然後辨識相關資料(同義詞、多義詞…),最後依照PageRank來決定給予你的資料的排序。
**orz:**PageRank是什麼?
@^@:這是一種網頁排名的要素之一(Google以此為主),藉由超連結來進行投票計算,例如:”中山大學首頁”可以連結到”中山大學招生辦”,那麼便視為”中山大學首頁”投了一票給”中山大學招生辦”。甚至,”中華人民共和國教育部”可以連結到”中山大學首頁”,就視為給”中山大學首頁”、”中山大學招生辦”各投了一票。~~~網頁排名亦受點擊率…等其他因素影響。

結論~

orz:所以…
  Google爬蟲將資料存入Google暫存~
  我去搜尋資料~
  Google從暫存資料庫中找出相關結果~
  呈現結果(結果依照排名順序呈現)~
  是這樣嗎?
@^@:沒錯,大致上是這樣。