图片|文本转图片的危险算法“达利”降临:“造假”程度绝了( 二 )


图片|文本转图片的危险算法“达利”降临:“造假”程度绝了
文章图片

这个图像输入Dalle的搜索文字是:“一辆未来汽车在雾中滑行”
不过,从Dalle2这个名字就能看出,OpenAI曾在此前推出过向大众开放的第一代版本,然而我在试用后,严重怀疑第一代达利,可能仅仅装了一个印象派画风滤镜 。
譬如,当我输入“马斯克是个‘吹牛逼大王’”,出来的都是脸部扭曲的马斯克大头照:
图片|文本转图片的危险算法“达利”降临:“造假”程度绝了
文章图片

歪脸的马斯克
但短短2年,第二代达利就取得了惊人的进步,而这取决于算法模型的重新设计,因为初代版本或多或少是GPT-3的一种扩展 。
当然,新版本也有不少问题 。
譬如,输入“把艾菲尔铁塔送上月球”后,出现的图像仅仅是一张“夜晚下的埃菲尔铁塔” 。所以,OpenAI的科学家们还在输入更多数据改进它 。另外,仔细观察这些生成的图像,你会发现一些“弱点”:
像很多刚“出生”的算法模型一样,达利在描绘“手脚”等细节上仍然非常吃力 。很明显,宇航员的手脚,以及猫的爪子都有一点不自然 。
图片|文本转图片的危险算法“达利”降临:“造假”程度绝了
文章图片

输入文字:骑着马的宇航员 。很明显手脚细节有问题
但无论如何,达利都是个值得让我们赞一声“牛逼”的技术进步 。甚至于,由于这波能力表现突出,它引发的恐慌,不亚于此前文字生成模型GPT3带来的文字造假争议 。
亚利桑那州立大学计算机科学教授苏巴拉奥的话直言不讳:“你可以用它来做好事,但你肯定可以用它来做更加疯狂的事情,包括深度伪造的照片和视频 。”
没错,虽然工程师展示出的这些作品,看起来艺术创造水平非凡,但与所有人工智能系统的典型特征相同,它一定会从训练自己的大量数据属性中继承某种“偏见” 。
譬如,当你输入“律师”,系统结果都是这样的:
图片|文本转图片的危险算法“达利”降临:“造假”程度绝了
文章图片

所有律师都是男性,且大多看起来是白人
算法的性别与人种偏见问题,自诞生之日便在欧美地区争议多年,迄今都无法解决,甚至有愈演愈烈之势 。这也是导致包括亚马逊、谷歌等公司无法大规模部署人脸识别系统的关键原因之一 。
另外,试想一下,当初在“换头”算法盛行,外网网友喜欢把特朗普等领导人的头像移植到某个搞笑电视剧里,引发捧腹大笑;而达利的出现,是否有能力让我们不费吹灰之力,便可以做到任意输出大量政治造假照片 。
甚至于,当输入“某某吸毒、打架斗殴”这类显然足以陷害他人,改变他人命运的关键词,如果都会出现毫无违和感的图像,那么会带来什么后果?
与工程师对技术的痴迷不同,纽约时报的读者们对达利算法的评价极为犀利,思考深度不可小觑,甚至可以说直击人类的灵魂:
人们将不得不对他们在网上看到的几乎所有东西持怀疑态度 。
这个系统的出现,会让“天平”向一个更加奇异与危险的世界倾斜 。
人类还没有在哲学上发展到能够负责任地使用技术的程度 。就像加密货币一样,骗子似乎也总是被技术那“厌恶人类”的一面所吸引 。