算法|危险算法“达利”，开启“图片造假”新高度 openai

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

值班作者| 宇多田
出品| 虎嗅科技组
头图来自OpenAI ，图片含义为“以牛油果形状来呈现GPU ，数码艺术形式” 。
论算法创新， OpenAI好像永远都不会让我们失望。
这个世界最牛逼的人工智能实验室之一，推出过包括GPT2、GPT3等极为强大的自然语言处理模型，威震人工智能圈。而在创始人马斯克退出，微软数十亿美金重金接手后，他们便开始逐步向技术商业化之路做出妥协。
但这并没有影响他们在“无人之境”的奔跑速度。
这一次，我们又在MIT技术评论、纽约时报和VOX等不同领域一流期刊杂志上，看到了OpenAI的名字。这一次与他们名字同时出现的，是大量色彩斑斓到让人心生愉悦，但却似真非真、似假非假的图片。
以及图片背后一个具有致命创造力和吸引力的新算法。
OpenAI新算法生成的图像，这些图像未曾在现实中出现
这个算法的名字叫DALL-E2（达利），据说是为了致敬2008年的动画电影《机器人瓦力》和超现实主义画家萨尔瓦多·达利而取的。这就意味着，算法可能具备了一些超出人类想像的能力。
简单来说，它是一个可以将文本描述转换为图像的系统——只要写下你想看到的东西，达利就会为你绘制出来，非常像一个二维版的3D打印机。
举个例子，当你在达利搜索栏里，输入“长得像牛油果的茶壶” ，它会在大约5秒时间内，生成多达10张与“牛油果茶壶”词义相符的图片。
挺萌的…GIF来自纽约时报
【算法|危险算法“达利”，开启“图片造假”新高度】结果显然100%扣题。而且因为分辨率很高，所以这些图像看起来更像是真实的照片。
但这个例子其实非常“现实主义” ，因为牛油果形状的茶壶，我们极有可能在创意商店中买到。但是“会下棋的猫”呢？OpenAI工程师Alex Nichol在输入“会下棋的猫”后，生成了这样一张图片：
老夫的少女心……看起来毫无违和感
还有难度更高的文字描述词，譬如“一个雨夜，一个超级英雄栖息在城市上空，风格就像一本漫画书” ，输出结果没有一处不符合词义：
而输入“ 位于城市中心的巴比伦空中花园，达利画风” ，输出的艺术效果简直妙不可言：
此外，达利系统还输出了很多文字描述复杂，但输出结果不仅精准，而且堪称艺术品的图片，都被放在了 OpenAI 的instergram上：
想想我们平时在百度里搜图时出来的垃圾结果，就隐约能明白达利的强大创造力意味着什么。