Internet Archive:10PB的数据看起来像什么?

来源:互联网 发布:淘宝在哪查送货地址 编辑:程序博客网 时间:2024/04/28 02:46

日期:2013-5-31  来源:GBin1.com

Internet Archive:10PB的数据看起来像什么?

Internet Archive(互联网档案),也称作“网站时光倒流机”Wayback Machine,定期收录并永久保存全球网站上可以抓取的信息。对网站不同时期的历史资料进行研究,是互联网档案最大的价值。

网站时光倒流机Wayback Machine看上去很简单 - 不过是一个安装在网站上的插件,并且随时间推移,你可以看到它的副本。

但 是你只是看到了它简单的表面,并没有看到它为了维护这些档案,保存副本所必须的超大数量数据以及存储。导演Jonathan Minard的纪录片Internet Archive记录了在幕后是它如何(以及为何)努力的维护着我们如今看到的Internet Archive。

纪录片采访了Internet Archive的奠基者Brewster Kahle,讲述了关于档案背后的主意,以及让我们看到了存储了10PB数据的服务器,这些数据包括当前Internet Archive上存储的网站,书籍,电影,音乐以及电视广播的存档。

想要了解更多Internet Archive,请登陆Vimeo,观看更多视频介绍。

via Nelly@极客社区

来源:Internet Archive:10PB的数据看起来像什么?