科普文章--解剖Google
来源:互联网 发布:windows.onload 编辑:程序博客网 时间:2024/05/12 01:04
引言~
現代人生活中遇到了許許多多的問題,通常大家第一個想到的不會是問人、找書…,而是上網查詢,對於全世界的使用者,所有的搜尋引擎當中又以Google最為常用。
正文~
相信許多人都跟orz有相同的疑惑:
orz:“為甚麼Google可以幫助我在極短暫的時間當中找到我所需要的資料?”
@^@:這個答案很難,卻也很簡單。Google要在極短暫的時間中找到全世界所有資料並呈現出來幾乎是不可能的,所以Google在你搜尋關鍵字之前就已經為你整理了相關的資料、網站。
orz:為什麼Google會知道我未來要搜索什麼,難道Google是全知全能的神嗎?
@^@:不不,Google當然不是全知全能的,他只是養著一群爬蟲,讓這些蟲子到各地去蒐集資料,蒐集到的資料再進行分類歸檔,最後匯總到Google的資料庫中。
orz:分類歸檔要幹嘛?
@^@:就跟我們在圖書館一樣呀,你覺得你在以下兩種情境下找資料,哪以個會比較有效率?
A一堆沒有經過整理排序的書中
B在整理過後可以清楚知道某類型資料集中在某一區域、某個書架
歸檔到Google暫存的資料庫中,只要你輸入關鍵字,那麼就可以立刻將整個資料庫的資料都呈現給你,因為那都已經整理好了。而且,雖然搜尋的是Google在過去(相對於搜索的瞬間)就已經儲存的暫存,但是因為爬蟲更新速度太快了,所以相對於我們人類來說幾乎就是最新的。
orz:可是我去圖書館查資料,常常因為同義詞或是錯字而找不到書,Google為什麼不會這樣?
@^@:因為當你輸入關鍵字之後,Google會先檢查你拼字是否正確,然後辨識相關資料(同義詞、多義詞…),最後依照PageRank來決定給予你的資料的排序。
**orz:**PageRank是什麼?
@^@:這是一種網頁排名的要素之一(Google以此為主),藉由超連結來進行投票計算,例如:”中山大學首頁”可以連結到”中山大學招生辦”,那麼便視為”中山大學首頁”投了一票給”中山大學招生辦”。甚至,”中華人民共和國教育部”可以連結到”中山大學首頁”,就視為給”中山大學首頁”、”中山大學招生辦”各投了一票。~~~網頁排名亦受點擊率…等其他因素影響。
結論~
orz:所以…
Google爬蟲將資料存入Google暫存~
我去搜尋資料~
Google從暫存資料庫中找出相關結果~
呈現結果(結果依照排名順序呈現)~
是這樣嗎?
@^@:沒錯,大致上是這樣。
- 科普文章--解剖Google
- 解剖Google搜索原理
- socket 科普文章
- socket 科普文章
- Break Google ReCAPTCHA: ReCAPTCHA科普
- 如何写好科普文章?
- GIT科普系列 文章列表
- Android 之Google认证GMS详细解剖
- 科普:MapReduce/Hadoop/Google之间的关系
- 介绍几篇很有意思的计算机科普文章
- 【科普文章】我的MP3拆解分析
- theano的scan的大概科普文章。。。
- 机器学习最好的科普文章
- 搜索算法科普型入门文章--Bfs,Dfs和回溯
- 科普文章-人脸识别发展历史介绍
- EJB是什么,作用, 科普,难得的好文章
- 小波科普文章精粹:看森林,也看树木
- 佛教与人生(了解学习佛法的科普文章)
- 深入理解Java虚拟机(一)-----Java内存区域和内存溢出
- 设计模式—单例设计模式总结
- Android组件学习笔记(ListView结构操作)
- 淘宝 NPM 镜像
- MySql5.7 建立全文索引
- 科普文章--解剖Google
- struts自定义拦截器及其执行流程
- 笔记三:嵌入式板子读写寄存器的方法
- 让你快乐的20个习惯
- php正则表达式详解
- 百度地图 点聚合 maker 定时刷新。。时间久后的卡顿问题解决
- 你的前端
- C语言中的单引号和双引号的区别
- NOIP 模拟题 天上掉馅饼