|什么是 Link Rot,它如何威胁 Web?

|什么是 Link Rot,它如何威胁 Web?

【|什么是 Link Rot,它如何威胁 Web?】
如果您一直在浏览网页并遇到404 错误页面或意外重定向 , 那么您已经看到链接失效了 。 随着时间的推移 , 将网络连接在一起的链接会破裂 , 威胁到我们共同的文化历史 。 下面来看看为什么会这样 。
什么是链接腐烂?链接腐烂是指网站中的链接随着时间的推移而中断 , 从而产生损坏或死链接 。 “断开的链接”是指从首次建立链接时不再指向其预期目标的链接 。 当您单击这些损坏的链接之一时 , 您会收到404 错误 , 或者您看到错误的页面或网站 。
链接腐烂很常见 。 哈佛大学2021 年的一项研究检查了 1996 年至 2019 年 550000 多篇《纽约时报》文章中的超链接 , 发现 25% 的特定页面链接无法访问 , 衰减率急剧增加 , 具体取决于链接的时间长短(例如 , 大约 6 2018 年链接的百分比是无效的 , 而 1998 年链接的 72%) 。 另一项研究发现 , 在 1995 年收集的一组 360 个链接中 , 只有 1.6% 的链接在 2016 年仍然有效 。
为什么会发生链接腐烂?网络是一种流动的、去中心化的媒体 , 没有集中控制 , 因此内容随时可能在没有警告的情况下变得不可用 。 服务器来来去去 , 网站关闭 , 服务迁移到新主机 , 软件得到更新 , 出版物转移到新的内容管理平台而不迁移内容 , 域过期等等 。
网络上还有一个相关的问题 , 称为“内容漂移” , 即链接仍然有效 , 但链接中包含的内容与原始链接相比发生了变化 , 这可能会造成麻烦 , 因为链接的原始作者打算指向不同的信息 。
丢失旧网站有什么不好?事物的衰败和消失是世界的本质 。 保持信息的活力是一个需要时间、精力和努力的主动过程 。 因此 , 链接失效的主要问题并不一定是我们需要永远存储所有信息 , 而是电子信息和参考资料可能变得比过去主要使用的纸质信息更加脆弱和易受攻击 。
许多新闻文章、学术论文甚至法院判决的作者都使用网络链接作为引用机制 , 为所呈现的信息提供重要的上下文来源 。 这也是维基百科的问题 。 正如 Jonathan Zittrain 在2021 年为The Atlantic撰写的关于链接失效的文章中所解释的那样 , “采购是将人类知识凝聚在一起的粘合剂 。 这使您可以了解更多有关仅在此类文章中简要提及的内容 , 并让其他人可以仔细检查我所代表的事实 。 ”
如果链接中断并且来源变得不可用 , 那么读者就很难判断作者是否诚实准确地代表了原始信息来源 。 甚至除了链接之外 , 一些网站还提供其他任何地方都找不到的在线信息 。 丢失这些页面会在人类的集体知识中造成差距 , 并在我们共同的文化结构中造成漏洞 。
Link Rot的解决方案是什么?专家认为链接腐烂和内容漂移是当前设计的网络特有的 。 这意味着它是网络基本性质的一部分 , 除非我们尝试积极纠正或减轻它 , 否则它不会消失 。
迄今为止 , 解决链接失效问题的最有效解决方案之一是 1996 年出现的 Internet 档案馆 , 该档案馆在过去 25 年中一直维护着数十亿个网站的公共档案 。 如果您发现一个损坏的链接 , 请访问 Internet Archive 的Wayback Machine并将该链接粘贴到其搜索栏中 。 如果该站点已被捕获 , 您将能够浏览结果 。 或者 , 如果该站点最近出现故障 , 则可以从Google 存储的缓存副本中查看原始内容 。
除了互联网档案馆之外 , 哈佛领导的一个名为Perma.cc的项目捕获了网站的永久版本 , 目的是进行长期的学术和法律引用 。 一个图书馆联盟维护着这些链接 , 所以他们应该坚持一段时间 。 目标是创建不会腐烂的链接——只要 Perma.cc 存档被维护 , 它们就应该持续存在 。