般若珠轩网
般若珠轩网

AI,正在纵容传染中文互联网

时间:2024-11-16 18:03:15 来源:

滥用AI,AI也毁了AI

编者案 :本文来自微信公共号 量子位 (ID :QbitAI),正纵作者 :金磊 尚恩,容传染中守业邦经授权转载 ,文互头图来自摄图网

传染中文互联网,联网AI成为了“罪魁罪魁”之一。AI

使命是正纵这样的。

最近巨匠不是容传染中都热衷于向AI咨询嘛 ,有位网友就问了Bing这么一个下场:

Bing也是文互有问必答,给出了看似挺靠谱的联网谜底 :

在给出确定的回覆之后 ,Bing还知心地附带上了票价、AI歇业光阴等细节信息。正纵

不外这位网友并无直接接管谜底 ,容传染中而是文互顺藤摸瓜点开了下方的“参考链接”。

此时网友觉察到了一丝丝的联网不同过错劲——这人的回覆奈何样“机里机气”的 。

于是他点开了这位叫“百变人生”的用户主页,蓦然觉察 ,介是个AI啊 !

由于这位用户回覆下场速率可能说是极快,差未多少每一、2分钟就能搞定一个下场 。

致使能在1分钟之内回覆2个下场 。

在这位网友加倍子细的审核之下,发现这些回覆的内容都是没经由核实的那种……

而且他以为,这便是导致Bing输入过错谜底的原因 :

那末被网友发现的这位AI用户 ,如今奈何样样了?

从当初服从来看 ,他已经被被知乎“判处”为禁言形态  。

但尽管如斯 ,也有其余网友闪灼其辞地展现:

若是点开知乎的“等你回覆”这个栏目 ,随机找一个下场 ,往下拉一拉,简直是能碰着良多“机言机语”的回覆。

好比咱们在“AI在生涯中的运用途景有哪些?”的回覆中便找到了一个 :

不光是回覆的语言“机言机语”,致使回覆直接打上了“搜罗AI辅助创作”的标签。

而后假如咱们把下场丢给ChatGPT ,那末患上到回覆……嗯,挺换汤不换药的。

事实上 ,诸如斯类的“AI传染源”不止是在这一个平台上有 。

就连重大的科普配图这事上 ,AI也是一再侵蚀 。

网友们看完这事也是蚌埠住了 :“好家伙 ,不一个配图是河蚌”。

致使种种AI天生的假往事也是不够为奇。

好比前一段光阴 ,便有一则危言耸听的新闻在网上疯传,问题是《郑州鸡排店惊现血案,女子用砖头砸去世女子 !》。

但事实上 ,这则往事是江西女子陈某为吸粉引流,运用ChatGPT天生的。

不够为奇 ,广东深圳的洪某弟也是经由AI技术,宣告过《今晨 ,甘肃一火车撞上修路工人 , 致9人降生》假往事。

详细而言 ,他在全网搜查近多少年的社会热门往事,并运用AI软件对于往事光阴 、地址等妨碍更正编纂后 ,在某些平台赚取关注以及流量妨碍正当牟利。

警方均已经对于他们接管了刑事欺压措施  。

但着实这种“AI传染源”的天气不光仅是在国内存在,在外洋亦是如斯。

挨次员问答社区Stack Overflow即是一个例子 。

早在去年年尾ChatGPT刚火起来的时候,Stack Overflow便猛然宣告“临时禁用”。

当时民间给进去的理由是这样的 :

Stack Overflow进一步论述了这种天气 。

他们以为从前用户回覆的下场,都是会有业余知识布景的其余用户浏览,并给出精确与否 ,至关于是核实过。

但自打ChatGPT泛起之后 ,泛起了大批让人感应“很对于”的谜底;而有业余知识布景的用户数目是有限 ,无奈把这些天生的谜底都看个遍。

加之ChatGPT回覆这些个业余性下场,它的过错率是实着真实摆在那边的;因此Stack Overflow才抉择了禁用 。

一言蔽之 ,AI传染了社区情景。

而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块 、话题 :

良多用户在这种栏目之下会提出林林总总的下场 ,ChatGPT bot也是有问必答。

不外,仍是老下场,谜底的精确性若何,就不患上而知了 。

但这种天气眼前,着实还潜在着更大的隐患。

AI模子取良大批互联网数据 ,却无奈很好地分说信息的着实性以及可信度。

服从便是 ,咱们不患上不面临一大堆快捷天生的低品质内容,让人眼花凌乱,头晕眼花。

很难想象ChatGPT这些大模子假如用这种数据磨炼 ,服从会是啥样……

而如斯滥用AI,反以前也是一种自噬。

最近 ,英国以及加拿大的钻研职员在arXiv上宣告了一篇问题为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文 。

品评辩说了如今AI天生内容传染互联网的现状,而后宣告了一项使人耽忧的发现,运用模子天生的内容磨炼其余模子,会导致服从模子泛起不可逆的缺陷。

这种AI天生数据的“传染”会导致模子对于事实的认知发生扭曲,未来经由抓取互联网数据来磨炼模子会变患上愈加难题 。

论文作者,剑桥大学以及爱丁堡大学清静工程教授Ross Anderson绝不避忌的直言 :

对于虚伪信息满天飞的情景 ,Google Brain的低级钻研迷信家达芙妮 · 伊波利托(Daphne Ippolito)展现:想在未来找到高品质且未被AI磨炼的数据,将难上加难。

假如满屏都是这种无营养的劣质信息 ,如斯周而复始,那之后AI就不数据磨炼 ,输入的服从尚有啥意思呢。

基于这种情景,斗果敢胆想象一下。一个成长于剩余、虚伪数据情景中的AI,在进化成人前 ,可能就先被拟分解一个“智障机械人” 、一个神思扭曲的神思智障 。

就像1996年的科幻笑剧片子《丈夫一箩筐》 ,影片陈说了一个艰深人克隆自己,而后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数着落,蠢笨水平添添。

那个时候,咱们可能将不患上不面临一个荒唐顺境 :人类缔造了具备惊强人干的AI ,而它却塞满了无聊蠢笨的信息 。

假如AI被喂进的只是虚伪的剩余数据 ,咱们又能期待它们缔造出甚么样的内容呢 ?

假守光阴到那个时候 ,咱们约莫都市思念以前 ,向那些真正的人类智慧致敬吧。

话虽如斯,但也不全坏新闻。好比部份外容平台已经开始关注AI天生详尽内容的下场 ,并推出相关纪律加以限度 。

一些个AI公司也开始搞能分说AI天生内容的技术 ,以削减AI虚伪 、剩余信息的爆炸。

参考链接  :

[1]https://www.v2ex.com/t/948487

[2]https://twitter.com/oran_ge/status/1669160826186633219

[3]https://www.qbitai.com/2022/12/40167.html

[4]https://arxiv.org/abs/2305.17493v2

[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250

[6]https://futurism.com/ai-generates-fake-news

本文为专栏作者授权守业邦宣告,版权归原作者所有。文章系作者总体意见  ,不代表守业邦态度 ,转载请分割原作者。若有任何疑难 ,请分割[email protected] 。

更多内容请点击【知识】专栏