设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

Internet Archive:10PB的数据看起来像什么?

2013-6-4 10:32| 发布者: joejoe0332| 查看: 723| 评论: 0|原作者: 开源中国社区|来自: 开源中国社区

摘要:   Internet Archive(互联网档案),也称作“网站时光倒流机”Wayback Machine,定期收录并永久保存全球网站上可以抓取的信息。对网站不同时期的历史资料进行研究,是互联网档案最大的价值。   网站时光倒流机Wa ...

  Internet Archive(互联网档案),也称作“网站时光倒流机”Wayback Machine,定期收录并永久保存全球网站上可以抓取的信息。对网站不同时期的历史资料进行研究,是互联网档案最大的价值。

Internet Archive:10PB的数据看起来像什么?

  网站时光倒流机Wayback Machine看上去很简单 - 不过是一个安装在网站上的插件,并且随时间推移,你可以看到它的副本。

  但是你只是看到了它简单的表面,并没有看到它为了维护这些档案,保存副本所必须的超大数量数据以及存储。导演Jonathan Minard的纪录片Internet Archive记录了在幕后是它如何(以及为何)努力的维护着我们如今看到的Internet Archive。

  纪录片采访了Internet Archive的奠基者Brewster Kahle,讲述了关于档案背后的主意,以及让我们看到了存储了10PB数据的服务器,这些数据包括当前Internet Archive上存储的网站,书籍,电影,音乐以及电视广播的存档。

  想要了解更多Internet Archive,请登陆Vimeo,观看更多视频介绍。


酷毙
1

雷人

鲜花

鸡蛋

漂亮

刚表态过的朋友 (1 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部