d用企鹅做出的炸鸡什么样?“毕加索”给出了答案

由“企鹅”构成的“炸鸡”长什么样?用“长颈鹿”组成的“鸡”是什么鬼...长颈鸡吗?
你或许觉得这种并不存在的事物过于荒诞,而且靠自身的想象力有点难以描述,但最近,
有AI能把这些东西画出来了。
例如当你给出设定,用“大象”构成的“鸡”,一般人还在愁鸡头应该安排在哪,这款最新的AI已经画完了,而且一口气画了几十张:


d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

情不自禁的想来一个“看懂,掌声”。没错,OpenAI又整活了,今天要介绍的这位AI界的新晋毕加索正是他们最近训练出的图像生成器,DALL·E。


d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

关于会画画的AI,狂丸之前没少介绍过,但DALL·E有点特别,在一定的框架下,它能按照人类的文字描述,给出画面图像,无论这段描述有多不着调。如果让你画一幅“一个小白菜宝宝穿着芭蕾舞裙遛狗”,你可能会一脸懵,但DALL·E直接就整出来了:


d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

主角换成皮卡丘也没问题,而且每只狗子都不一样:

d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

所以,这看起来就是一个可以利用文本描述生成图像的AI。人类的指令就是像是完成填空题,有一些可选选项,模式类似:绘制一个“xxx”的“xxx”,比如下图中,选取了“绿色”,得到了绿色的表。

d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

(绿色,六边形,钟表)于是,不同的关键词就组成了千奇百怪的东西,虽然看着有一丝丝沙雕,但其实这款AI在制图方面有着比较全面的功能。
DALL·E都能“画”些什么?
比较基础的就是“控制属性”。我们刚才介绍过,例如“立方体”的“老虎”,通过两个简单的关键词构成的一组词汇,然后生成画面:


d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

“环面”的“水”,很有美感:

d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

还可以“绘制多个对象”,包括他们的空间关系,像是下图:一个“小”的“红色”的方块,“立”在一个大的“绿色”方块上。


d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

此时AI不仅要将词组正确组合,而且要形成正确的关联,避免混淆。下图是“一只绿色的大象坐在一只红色老鼠身上”,可以感受一下AI的抽象画法:

d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

另外还可以根据“画面的视角”生成图片。如“美洲狮”“坐在山上”的“鸟瞰图”,当然也可以选择平视或者特写等多个视角选项:


d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

根据“画面风格”变动生成图片,“狐狸”“坐在森林里”的“3D渲染图”:

d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图

类似的关键词,还可以换成前几年比较火的低多边形风格,也可以改成像素风格:

d用企鹅做出的炸鸡什么样?“毕加索”给出了答案
文章插图


d用企鹅做出的炸鸡什么样?“毕加索”给出了答案