互联网档案馆(英语:Internet Archive)是一个非营利性的数字图书馆组织,总部位于旧金山。它由Alexa的创始人布鲁斯特·卡利在1996年创立。互联网档案馆提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费存储及获取。迄至2012年10月,其信息储量达到10PB。
互联网档案馆的数据是由自带的网络爬虫自动搜集的,其网站典藏档案馆网站时光机,抓取了超过1500亿的网页。其年度预算约为1000万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会。总部位于旧金山里奇蒙德区,此地雇员只有数十人,大部分雇员工作于书籍扫描中心,在红木城也有数据中心。该数据库是国际互联网保存联盟成员,2007年被加利福尼亚州选为官方指定图书馆。
互联网档案馆收集了世界各地的数字化图书以及各大图书馆和文化遗产机构的特殊藏品。互联网档案馆在5个国家经营着33个图书扫描中心,其活动受图书馆和基金会的财政支持。截至2013年7月,档案馆共收集了440万本书,每月的下载量超过1500万。
除了上述内容之外,互联网档案库还收集了大量的数字媒体,这些数字媒体均匹配美国公共领域或CC授权协议。这些媒体文件均会根据媒体类型(moving images、audio、text、etc.)被组织成集合,并根据各项标准被分入子集合。每个主集合都含有一个“社区”子集合(以前被称为“开源”)用于存储公众的贡献。
官网链接:点我跳转