首先,让我们消除一个误解:二十八年来,互联网档案馆一直没有运行,也没有出现过服务或连接中断的情况。
Archive.org 网站最初是一个在线资料归档项目,最初对如何处理大规模数据有很多设想,网站在早期的托管地点也不断变化。它的利润微薄,同时还要与当时各种知名的网站进行硬件和软件方面的竞争;它引导员工朝着模糊而宏伟的目标前进,同时尽量不耗尽资源。
退后一步,我们不确定这个档案库将会变得多大。
2001 年 10 月,Wayback Machine 在伯克利班 店铺 克罗夫特图书馆的一次仪式上向世界推出,很多事情都发生了变化,网络自发地开发出了一种以前从未有过的东西:记忆。
记忆从一项功能变成了互联网的一个核心实用程序。
普雷林格图书馆和现场音乐档案馆等馆藏也随之涌现,为人们提供了一种获取优质内容的途径,而不必面对网络横幅和弹出广告,只需从不断增长的来源聆听和观看文化,甚至可以追溯到更早的时代,甚至网络出现之前。
向数量激增的受众提供海量数据成为一个工程和成本问题,而最终的问题是 — — 如何检索并提供数 TB、数百 TB、PB、数十 PB的数据给你的用户,而不会再次陷入上千个潜在问题?
照片由美联社的本·马戈特 (Ben Margot) 于 2006 年拍摄。
简短的回答是,你与一群有着共同愿景的非常敬业的团队一起努力工作,但更长的回答是,有时,问题会出现。
很多问题。