编辑导语:虽然互联网不是法外之地,但还是有很多投机者试图钻技术和规则的空子。新闻中很多超链接点击后显示无效,然后跳转到其他网站。超链接怎么了?谁在用“死”的超链接?
在网络新闻中,超链接经常作为补充材料出现,用户可以点击超链接阅读媒体引用的原始材料。
但是随着信息和数据的积累,互联网上的很多超链接其实已经失效了。比如有时候点击一篇十几年前的文章链接,会回一个类似“页面已经消失”的提示。
大多数用户并不会特别关注一个超链接是否仍然有效,但在互联网上,有人会像盗墓贼一样搜索这些沉睡已久的超链接,并利用它们牟利。
超链接怎么了?谁在用“死”的超链接?本期全媒体派将聚焦那些无效超链接,整理分析国外媒体在无效超链接被篡改时所经历的麻烦,试图揭示当前新闻存档存在的问题以及无效超链接背后巨大的灰色利益。
根据哈佛法学院的一个团队对《纽约时报》的调查,他们发现报纸上553693篇文章中的170多万个Deeplink中有25%完全无法使用。当用户点击这些深层链接时,之前的页面已经变成空白。[1]
这种情况称为linkrot,页面上会出现“404”提示。
深度链接是指可以通向外部网站页面的渠道,用户可以通过这个链接进入特定的外部页面。如果不使用深度链接技术,用户需要自行搜索相关内容。深度链接大大缩短了用户的使用路径。在图文内容消费的场景下,深度链接基本可以理解为我们更熟悉的超链接。
超链接成为无效链接的主要原因是原内容消失、改变或改变位置,导致服务器无法返回有效页面。
例如,《好莱坞报道》为华特迪士尼前首席执行官罗伊迪斯尼的妻子发布了一则讣告,并附上了一个纪念网站的链接,读者可以向慈善机构捐款,以纪念死者。后来他家把网站关了。虽然网站已经不存在,但是《好莱坞报道》引用的超链接仍然可以跳转,这个超链接就变成了无效链接。
微信官方账号中超链接的无效呈现会随着超链接年限的积累而越来越普遍,因为随着时间的推移,开头引用的大量网站可能已经不再使用。
《纽约时报》本次调查结果显示,2018年发表的文章中有6%的超链接无效;而2008年的文章有43%的无效超链接;到1998年,这一指数已经高达72%。整体来看,53%的文章至少有一个无效超链接,即两篇文章中至少有一篇有无效链接。
超链接的失效还与文章类型有关,不同版块的文章之间的无效链接比例存在差异。比如健康板块无效率最低,比超链接平均无效率低17个百分点;旅游部门的无效比例最高,比平均水平高出17个百分点。
事实上,这种超链接故障在网络生活中并不少见。全媒体文章都讨论过“数字仓鼠”现象,就是很多网友喜欢囤积各种素材,包括各种链接。你一定有过这样的经历。打开喜欢的文章,有些已经被作者或者平台删除了。
在微博中,这种现象比较普遍。笔者惊讶地发现,自己曾经点赞或转发的内容,几乎有一半都变成了无效链接,只显示“此微博已删除”。
“对不起,此微博已被作者删除。”
另一种类似无效链接的情况是内容漂移。
当超链接的内容被转移时,意味着当用户点击超链接时,服务器返回的页面不是原来的内容。
同样,随着时间的推移,内容转移的情况也会越来越频繁。调查显示,2019年发表的文章中,只有4%的超链接发生了变化;2009年,四分之一的超链接发生了变化。
只有这种情况吗?虽然团队只调查了13年《纽约时报》的文章,但以存档专业著称的《纽约时报》,其文章的超链接失效或内容转移的情况非常普遍,其他规模较小的新闻机构的情况就更不乐观了。
保存新闻不仅仅是保存原始的新闻文本或音频和视频资料,因为这些内容往往保存在新闻机构自己的服务器上。
比之下,更为棘手的是保留文章中所引用的外部信息,也就是超链接。
超链接所导向的外部网站并不受相关新闻机构的管理,这些网站的内容能够被第三方所修改或者删除。其带来的后果不只是新闻失去参考的信息来源或者新闻情境丧失,更严重的影响是,这些超链接可能会被用来导向无关的内容,或被用于一些不正当的牟利行为。
凯瑟琳·汉森和诺拉·保罗在他们《给未来的新闻:保留历史的第一稿》中表现出对于当前新闻存档现状深深的担忧。
在他们看来,新闻所发挥的作用远不仅仅只是传递当下的信息,更为重要的是完整表现出时代的特征和人们的生活。[2]但随着新闻行业数字化进程不断深入,新闻业大力推进革新向前进的同时却忽视了往后面看一看。
超链接之“死”暴露出两个问题:一是新闻的储存无法得到百分百妥善处理,另一方面则是超链接背后隐藏着巨大的地下市场。
因为版权问题,新闻网站需要用超链接标注所引用的资料来源,但这使得新闻网站对于超链接所指向的内容缺乏控制,这就为投机者利用无效超链接埋下了隐患。基于内容转移等原理,非法供应商可以将原本失效的超链接进行偷换,重新连接到新的网站中,以此来吸引流量、谋取利益。
相较于报纸、录像带等传统的信息储存形式,电子新闻的储存无疑更加具有便利性。那为什么新闻储存在电子时代反而会成为一个问题?
要回答这个问题,我们必须首先了解在传统媒体时代新闻是如何进行储存的。
在数字化流行之前,新闻的主要形式是报纸、广播以及电视。广播和电视节目主要由新闻机构自行进行储存,一般媒体都会设有专职人员对这些新闻原件进行归档,其作用类似于图书管理员。
报纸的保存则涉及到更为复杂的过程。由于各种机构和个人都会订阅报纸,人们在购买报纸的过程中也同时保留了新闻原件。虽然个人可能出于兴趣保存有一定量的报纸,但这样的行为往往也并不具有系统性。
主要的第三方保存机构是大大小小的图书馆。图书馆具有更为宽敞的空间以及专业的图书管理员,因此可以相对更为完整地保存报纸。可以说,报纸的储存更为弥散化,除了新闻机构本身,第三方机构也会有所参与。
但随着新闻业数字化程度不断提高,互联网成为新闻传播的重要途径。电子化的新闻似乎不再需要归档,因为它原本就被安放在服务器的不同文件夹中。
但实体的文档和数字文档毕竟存在差异,一份报纸一旦发行就难以再做改动,而数字文档则始终保持着可变动性。尤其是诸如超链接等导向外部网站的渠道,其是否进行修改或删除取决于第三方机构,媒体无法对其进行直接管理。
另一方面,对于新闻归档的忽视也显示出新闻业整体的发展趋势——追求速度。正如周睿鸣老师在论文中指出那样,新闻业陷入与自我赛跑的泥淖,新闻生产成为不断提速的过程。[3]在这样不断往前看的过程中,重视过去的新闻似乎有些不合时宜。
尽管人们开始意识到问题所在,但对于新闻机构而言,完整、独立地保存新闻依然存在诸多问题,版权问题无疑位于核心。如何既能够尊重第三方资料来源的版权,同时又能够防止其不被居心叵测者所利用,这成为解决问题的关键。
一种可能的处理方式是备份第三方机构的超链接页面,如果无法一比一复制,还可以考虑截图的形式。但这可能赋予新闻媒体过大的权力,使其能够直接复制其他内容来源;再者,这也促成了独立、封闭的网络生态体系的形成,使得流量始终在新闻网站内部循环。
第三方机构一般不会允许媒体借用它们所生产的内容来增强媒体的用户黏性。而一旦超链接导向外部网站,媒体就无法对其内容进行控制。因此,这一切处理起来并不容易。
如果媒体发布文章中的超链接导向的是一个完全无法控制的网站,那对于媒体公信力而言是存在风险的,美国的媒体正饱受这种无效超链接被篡改之苦,而这背后就有一片巨大的灰色市场。
通常这些超链接的地址会被导向某些具有盈利性质的网站,大多类似于广告引流。
其运作逻辑大致如下:正如前文提到的,新闻网站中大量的超链接内容已然失效,但这些链接依然存在且可点击;某些供应商则将此作为契机,寻找到新闻网站中的无效链接,将其替换成为客户所需要的网站内容。
这些被篡改的外部网站大多具有广告性质,诸如推销廉价酒店、在线咨询、在线支付甚至包括网络赌博等。
虽然人们对于过去新闻的兴趣会逐渐下降,但互联网中的新闻并不会因此完全被遗忘。通过搜索引擎,用户能够随时调用过去的新闻报道。当过去的“记忆”被唤醒时,伴随着这些旧新闻一起重建天日的还有那些已经被偷偷掉包的超链接。
当用户第一次发现超链接被篡改为毫无相关的广告时,他也许只会感慨互联网中的广告真是无孔不入。但第二次、第三次呢?他可能就会对新闻网站的专业性产生质疑了。更何况无效超链接的比例如此之高,谁也不知道下一个被点开的链接是否是其原本的内容。
BuzzFeed新闻对于美国各大主要新闻网站以及BBC的调查发现,这些新闻网站都深受超链接内容篡改之苦,其中福布斯新闻所受影响尤其明显。[4]
福布斯发言人在一次公开声明中表示,网站已经删除这些被修改内容的超链接,并且积极寻找能够规避超链接被篡改的措施。BBC则在其网站上发布免责声明,称其对外部网站的内容不承担任何责任。
提供这些篡改服务的供应商大多避开了来自美国或欧洲国家的直接监管,其服务费往往十分高昂,替换一条超链接内容的服务费从200到500美金不定。
替换超链接的行为是诸多黑帽SEO技术中的一种。SEO(Search Engine Optimization)指的是搜索引擎最优化技术,它主要用于分析搜索引擎如何进行排名的规律,通过了解搜索引擎如何抓取互联网页面、怎样确定特定关键词等技术来提高网页在搜索引擎中的排名已增加浏览量。[5]而黑帽SEO则是通过作弊的方式来提高网站的浏览量,以图谋取短期、快速的经济效益。
为了以假乱真,供应商有时甚至会模仿原有网站发布者的身份以图迷惑用户。例如,位于德里的一家SEO机构曾替换了福布斯网站中梅根·梅森(Megan Mason)于2015年所发表文章中的某些无效链接。替换者用梅根·马特(Megan Matt)的名义重新发布了一篇文章,并将其连接到圣地亚哥一家地毯清洁公司的网站。
新闻网站并非这些非法牟利者的唯一受害者,各大搜索引擎网站也饱受其苦,毕竟黑帽SEO会使得搜索结果无法满足用户的需求。当用户在搜索引擎中搜索某个关键词所返回的都是无关的广告甚至垃圾信息,用户势必会对搜索引擎所能提供的服务产生质疑。
从大大小小的灰色产业服务商到他们为篡改超链接内容所提出的高额报酬,看似不起眼的无效超链接背后潜藏着巨大的利益空间。那为何不索性取消超链接?这样就能从根本上遏制投机者用非法的渠道进行牟利。
首先依然是版权问题。
超链接存在之初便是为了媒体能够合法地使用外部网站中的内容,使用超链接不但能够标注资料的出处,还能够用最便捷的方式寻找到原初的资料。尽管通过增加尾注或者其他方式也能够注明版权,但超链接无疑是更合适的方式。
被篡改的超链接也折射出媒体对于版权的重视。即使深受黑帽SEO之扰,多数媒体也并没有想要取消超链接,而是试图用技术弥补当前存在的不足。
其次也折射出媒体对于网络生态的态度。
正如笔者在前文中指出,没有超链接的文章形成了封闭的网络生态,用户只能在网站中浏览该媒体内部的信息,不同网站之间也没有任何联系。
而超链接恰恰提供了连接的可能,只需要轻轻一点,用户即可浏览其他渠道的页面。不同新闻之间,甚至不同新闻网站之间都能通过超链接进行关联。
这样带来的一个好处是,不同媒体之间依靠内容质量来吸引受众,技术本身并不成为壁垒,甚至双方都乐见对方生产更加优质的内容。
总而言之一句话,尽管失效超链接背后潜藏着巨大的灰色市场,尽管第三方投机者的行为给新闻网站带来了棘手的问题,但行业也并没因噎废食,媒体机构依旧试图通过提升技术手段来降低潜在风险。
被篡改的超链接也提醒我们,尽管互联网不是法外之地,但是试图钻技术和规则漏洞的投机者依然大有人在。如《纽约时报》这些在内容存储上相对专业的新闻媒体所引用的超链接都有可能被第三方所盗用,其他网站中可能存在的“陷阱”无疑会更多。而这些,都有待平台、媒体和相关监管机构合力形成更严密的预防和处理机制。
参考链接:
https://www.cjr.org/analysis/linkrot-content-drift-new-york-times.phphttps://www.cjr.org/tow_center_reports/the-dire-state-of-news-archiving-in-the-digital-age.php周睿鸣.锚定常规:“转型”与新闻创新的时间性[J].新闻记者,2020(02):21-31.https://www.buzzfeednews.com/article/deansterlingjones/links-for-sale-on-major-news-wesbites马晓玲,吴永和.对于搜索引擎优化(SEO)的研究[J].情报杂志,2005(12):119-121.作者:法夏;公众号:全媒派(ID:quanmeipai)
本文由 @全媒派 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/177740.html