找回密码
 立即注册
首页 业界区 业界 这两个网站,一个可以当时间胶囊,一个充满了赛博菩萨。 ...

这两个网站,一个可以当时间胶囊,一个充满了赛博菩萨。

边书仪 昨天 21:20
你好呀,我是歪歪。
前两天不是发了这篇《可怕,看到一个如此冷血的算法。》嘛。
文章中有这样的一个链接:
我当时放这个链接的目的是为了方便大家直达吃瓜现场。
但是,由于这个帖子最终被证实是假的,所以被官方给“夹”了:
幸好,原文本来就不长,所以我在我的文章中把原文全部给截下来了。
也算是以另外一种形式保留了吃瓜现场。
如果这个“爆料”的帖子再长一点,按照我的习惯,我可能就不会把整个帖子搬运过来了,只会留取我认为关键的部分。
但是这种“我认为关键的部分”是非常主观的,有的人就是想看原贴长什么样,但是原贴又被删除了,怎么办?
我教你一招,老好用了。
时间胶囊

在万能的互联网上,有这样一个仿佛是时间胶囊一般存在的神奇的网站:
https://archive.org/
这个网站是叫做"互联网档案馆"(Internet Archive),于 1996 年成立的非营利组织维护的网站。
自 1996 年以来,互联网档案库与世界各地的图书馆和合作伙伴合作,建立了一个人类在线历史的共享数字图书馆。
这个网站有一个非常宏大的愿景:
捕捉大小不一的网站,从突发新闻到被遗忘的个人页面,使它们能够为子孙后代保持可访问性。
所以里面收藏了的内容有免费书籍、电影、软件、音乐、网站等。
截至目前,该网站收集了这么多的数据:
其中网站的数量是最多的,有 1T,超过 1T 的时候,官方还发文庆祝了一下:
这个 1T 中的 T 指的是什么呢?
Trillion。
一个非常小众的词汇啊,歪师傅也不认识,所以我去查了一下:
这个图片上一眼望去全是 0。
1 Trillion 就是 1,000,000,000,000
反正是数不过来了。
感觉成都都没有这么多 0。
这个网站怎么用呢?
很简单。
拿前面 reddit 中被“夹”了的帖子举例。
我不是给了吃瓜现场的链接嘛。
你把链接往“时光机”的这个地方一粘:
你就会看到这个有一个时间轴的页面:
把鼠标浮到有颜色的日期上,就能看到各个时间点的页面快照了。
颜色越深代表那一天的快照越多:
比如,我们看一下这个网站收集到的第一个快照:
点进去,就是我们要找的吃瓜现场。
发帖后的两小时就被收集到了,速度还是挺快的。
从数据上看,这个时候已经有 3.7k 个点赞和 255 个评论,已经有要起飞的预兆了。
换个时间的快照,还可以看到点赞和评论的数据变化,比如发帖一天后:
点赞量已经是 71k,评论数来到了 3.8K,直接就是一个起飞的大动作。
这里只是用这个帖子举个例子。
再举一个例子。
也是我的真实使用场景。
有一次我在研究平滑加权轮询负载均衡策略算法为什么是平滑的。
和各类 AI 讨论了半天,它们也给出了各种参考文献。
我在其中一个参考文献中看到了这样一个链接:
https://tenfy.cn/2018/11/12/smooth-weighted-round-robin/
我知道这个链接的内容就是我要找的内容,但是这个链接跳转过去已经是 404 了:
于是,时间胶囊就派上用场了。
我直接把这个链接扔它:
找到了这个网页在 2019 年 12 月 10 日的快照:
通过这种方式就找到了原本已经被 404 的网页内容。
在看一些时间比较久远的文章的时候,参考链接打不开的情况,还是比较常见的。
所以这个方式是我最常用的一个场景。
此外,还有另外一个场景,就是偶尔去怀旧一下。
比如,中文互联网的一滴眼泪:天涯论坛。
这是 20 年前,2006 年 1 月的天涯论坛首页,一股浓烈的早期互联网风格:
在图片的右下角你还能看到“2006 天涯春晚”的字样。
另外,你不要觉得这只是一个静态页面。
里面的部分链接还是可以正常跳转的。
比如,这个链接:
点进去,你可以看到最最古早的一种直播形式:文字直播。
2006 年 1 月 2 日,《武林外传》开播。
天涯这个文字直播的时间是 2006 年 1 月 19 日,《武林外传》当时正在全国热播。
天涯网友在这个页面下提出自己关于《武林外传》的问题,作为天涯的知名写手,宁财神本人会选择部分问题进行回复。
我截取了几个我觉得有意思的回复:
这种行为这算不算是官方剧透了?
当年祝无双这个角色是真的不让人讨喜啊。幸好当时的网络还不发达,不然我觉得真有可能“网爆祝无双”。
DVD,一个多么具有年代感的词。
写文章的时候,我本来是想截几张图就走的,最多五分钟搞定。
结果我竟然一页页的翻完了这个帖子,看完之后才发现在这个帖子里面待了半个多小时。
时间过的还是很快的。
站在 2026 年,看 2006 的帖子,中间有 20 年的光阴。
但是就像是 2006 年佟掌柜对要给她干二十年工才能还清债务的小郭说的那样:不要怕,二十年快得很,弹指一挥间。
前几天小郭在微博上还回应了正式赎身这个梗。
去了六里桥、去了同福夹道、去了左家庄站、还去了祥蚨瑞,最后在人来人往的北京街头,一个猝不及防的回眸:
这是我的童年回头看了我一眼。
十几岁的不了解佟掌柜的这句话,三十出头了,一下就理解了:20 年,真的很快呀。
看到 2006 年的天涯的时候,我依稀想起了一些当年的往事。
那个时候我才 12 岁,看电视剧是真的在电视机上看,我还记得家里的电视机都是这样的“大屁股”电视机:
还记得《武林外传》每集开始,唱主题曲的时候,电视上面会显示一个电脑的桌面:
所以每次开头的时候,我就会叫表妹过来,对她说:你看,我等下把电视变成电脑。
那个时候表妹才 7 岁,我这个 12 岁的哥哥当然是把她唬的一愣一愣的。
那个时候电脑也还是一个稀奇的物品,虽然是乡下的学校,但是也还是有一个微机室,去微机室上课必须要带鞋套的那种。
所以 2006 年的天涯,我肯定是没有看过的,但是在 2026 年看到 2006 的天涯,我还是想起了很多童年往事。
对了,前几天才给表妹过完 27 岁的生日:
看着这张照片,再想起 7 岁时那个相信哥哥可以把电视变成电脑给她看《武林外传》的妹妹。
“二十年快得很,弹指一挥间”。
你说这不叫时间胶囊,叫什么?
再看一下 10 年前,2016 年 1 月 1 日的天涯,彼时的天涯可以说是如日中天,非常多的网友天天泡在论坛里面,谈古论今,激扬文字。
这是那天的天涯首页截图:
热帖榜第一的是一个关于纯电动汽车的帖子,我进去看了一下:
这个帖子的点击量是 10w,有 816 个回复。
可见这确实是当时的一个非常热门的话题。
按照作者的观点,纯电汽车代替燃油汽车,还很长的路要走。
站在 10 年后的今天,其实我们已经知道答案了。
但是,当我看到这个回复的时候,我还是佩服天涯网友的眼光:
除了天涯,还可以考古很多其他的网站。
比如,B 站:
从 2011 年开始有了网页快照,我随便点开一看,满满的历史感:
而这是 2016 年,10 年前的 B 站首页:
当时还有一个专门的鬼畜区:
而这里的一些视频甚至还是可以播放的。
比如这个“启蒙作品”:
现在在 B 站有 160w 的播放:
在这个视频的评论区,你能找到大量来“考古”的人:
二十年都弹指一挥间了,别说区区十年了。
从 B 站怀旧完成后,随便,我也去磨房、马蜂窝、穷游网看了一圈,随便选了 2012 年到 2016 年间的一些页面,感谢它们陪我度过了一整个美好的大学生活。
是我当时认识、感知、体验这个的广阔世界的一个重要窗口。
感谢磨房 4 年的陪伴:
感谢马蜂窝 4 年的陪伴:
感谢穷游网 4 年的陪伴:
如果你也有想要寻找的记忆,可以尝试在这个网站上去找一找。
存档

既然已经聊到“archive”了,那就顺便再分享一个“archive.today”。
https://archive.ph/
这个网站和前面的“互联网档案馆”最大的一个差异是“互联网档案馆”是它主动去做“网页快照”,什么时候做,什么页面做,并不一定。
而“archive.today”是一个你可以去主动存档的网站。
比如,还是说回 reddit 上的那个帖子。
帖子下面有这样的一个回复:
这个回复中的超链接就是回复者找到的关于这个“爆料”是 AI 生成的证据。
点过去是这样的:
他提供的是一个网页存档。
为什么他要这么做呢?
你想想,如果他提供一个原始链接,但是这个原始链接突然有一天找不到了,岂不是很尴尬?
但是先在“archive.today”上存档一下,然后把这个存档后的链接贴出来,就稳当多了。
以后你要保存证据的话,你就可以使用这个网站。
另外,这个网站还有一个骚操作。
反而是骚操作让这个网站的打开率更高一点。
国外的一些网站可能有些文章是要付费才能看到的。
比如纽约时报:
但是,如果你一不小心把付费文章的链接贴在这个网站上去搜索。
有一些“好事之人”已经帮你把文章在这个网站上做了快照了,这些人可以称之为“赛博菩萨”,因为这些“菩萨”,你就可能看到免费的原文了:
在这里叠个甲啊,偶尔看到一两篇的话可以这样操作一下,就当时是试看了。
如果经常要看的话,还是充点钱吧。
对了,多说一句,上面提到的神奇的网站既然叫做时光胶囊,还有一些赛博菩萨,这些魔法世界中才有的东西,那肯定需要你会对应的魔法咒语才能访问到。如果你不会魔法,强行访问,那你肯定要撞到墙上。

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册