vlambda博客
学习文章列表

GitHub 完成北极代码保存项目,21TB 的数据,可保存 1000 年

GitHub 是全球最大的开源代码托管平台,2018 年 6 月 被微软以 75 亿美元股票交易收购。被收购后的 GitHub 显现出了活力,陆续推出各种新功能,获得了开发者的好评。

去年 GitHub 开发者大会上,GitHub 首席执行官 Nat Friedman 首次介宣布了一项代码存档项目(GitHub Archive Program),他们计划将 GitHub 上面托管的代码保存到一个很安全的地方,用胶卷保存,供后人使用。这个“代码保险库”的位置悬在北极,他们宣布该项目已经于 7 月 8 日正式完成。

过去几个月,GitHub 与 Piql(数字存储提供商)合作,将 21 TB 的 GitHub 存储库数据写入了 186 卷的 piqlFilm 数字光感档案胶片中。2 月 2 日,GitHub 对托管的所有公开代码仓库进行了快照,并将数据交给了合作伙伴 Piql,他们将这些数据写入到自家的 piqlFilm,一种数字光敏存档胶片上。档案中还包含一个单独的胶卷,其中以书面形式解释了档案内容的历史和文化背景。所谓的技术树旨在提供现代软件开发、开源和各种应用程序以及流行编程语言的详细介绍。

GitHub 完成北极代码保存项目,21TB 的数据,可保存 1000 年

21TB 数据使用了 186 卷 piqlFilm,随后这些胶卷被送上飞机,从挪威首都奥斯陆飞往位于欧洲大陆往北约 1000 公里的斯瓦尔巴群岛(Svalbard)。GitHub 团队原本计划亲自前往挪威,护送这些存档胶卷前往北极,但受疫情影响,他们不得不修改了该计划。

存档胶卷最后到达了岛上一个只有几千人的小镇 Longyearbyen,当地的一家物流公司被委托处理这些存档胶卷。经由中间安全仓库一夜的存放,在第二天早上,这批档案胶卷被送往当地山上的一个已经被关闭了的煤矿,然后被送进一个位于永冻层、有着 250 米深度的保险库中。

普通机械硬盘,只有有效保存数据几十年。Github 认为,存储在现代设备中的信息在几代之后很可能会消失,因此需要用不同的形式和平台进行存储备份,这样才能留存于后世。或许,1000 年后这些代码早已过时,但就像历史书籍一样,它们是反映人类社会进步和技术发展历程的宝贵财富。