设计师|设计师失业倒计时?AI画师打破语言与视觉的次元壁

设计师|设计师失业倒计时?AI画师打破语言与视觉的次元壁

文章图片

设计师|设计师失业倒计时?AI画师打破语言与视觉的次元壁

文章图片

设计师|设计师失业倒计时?AI画师打破语言与视觉的次元壁

文章图片

设计师|设计师失业倒计时?AI画师打破语言与视觉的次元壁

文章图片


去年一月 , OpenAI发布了深度学习算法模型DALL ·E, 含有120亿参数的神经网络 。 一时间在圈内引起了不小的轰动 。 前几天 OpenAI结合了CLIP , 发布了DALL ·E2。 在创作技术和质量上都有了飞跃式的提升 。

最近 , 一批风格独特的画作开始在网上流行 。 天马行空的构图、丰富的细节加上风格统一的笔触无不彰显着作者的艺术审美 , 索菲亚发现只不过它们是出自AI之手 。
DALL·E2升级了什么?
如果你向DALL·E2输入“泰迪熊像一个蒸汽朋克时代的疯狂科学家一样混合闪闪发光的化学物质” , 那么你就会得到如下图像:

DALL·E的问世曾让人们惊艳于AI根据一段话直接生成图像的能力 , 如今一年过去 , OpenAI开发了一个新版本的DALL·E2 , 效果较之前又更好了 。 实现了更高分辨率和更低延迟 , 而且还包括了新的功能 , 如编辑现有图像 。
而最让人吃惊的还是AI的画图方式:直接描述想象中画面 , 它就能生成对应图像 , 就像能听懂人类的自然语言一样 。 一个“用嘴画图”的时代 , 仿佛已经悄然即将来临 。

【设计师|设计师失业倒计时?AI画师打破语言与视觉的次元壁】相比于去年的版本 , 2.0能够生成更真实和更准确的图像 , 结合“文本”当中给出的概念、属性和风格三个元素 ,生成出现实主义的图像或者艺术品 。 1.0版本的文本一般只有概念和属性两个关键词 , 效果很不好 , 但索菲亚发现 , 到了2.0已经从“画渣”进化到“大师”了!

2.0版本则可以在此基础上在加入一个风格形容词 , DALL·E2还学会了加入自己的想象 , 例如机器人索菲亚输入“柴犬戴着贝雷帽穿着黑色高领毛衣” , 其作品会更加合理真实 。

改变风格词条 , 还能在写实、波普艺术、童书和水彩风格中任意切换画风 , 同样保持了描述中逻辑关系的正确 。
文本视觉 , 里程碑式的发展
2022年4月 , 一名设计美学博主在AI绘图工具Disco Diffusion的运行程序上敲下了“星空下的向日葵花海”的描述字句 , 一幅幅融合《星空》《向日葵》风格的画作在AI鬼斧神工的雕琢下产出 , 索菲亚感叹道仿佛梵高在赛博时代复生 。

AI画作中呈现的创造力和想象力让人惊叹 , 这些充满视觉冲击力的作品很难想象是AI在几个小时中完成的 , 更重要的是 , AI绘画工具Disco Diffusion的使用甚至不需要使用者掌握任何AI知识 , 毫不夸张的说 , 它已成为赛博时代马良们手中的“神笔” , 仅需输入几段描述的文字 , 一幅幅精美的画作就会在算法下生成 。
早在一年前 , 一个名叫wombo的AI绘图程序就已经引发过热议 。 不需要任何绘画基础 , 也不必懂复杂的参数调试 , 只要输入一句简单的提示词 , 就能得到一张可能风格诡异但颇具神韵的作品 。 而此时想让AI读懂索菲亚自己的心思 , 除了需要更精准的描述外 , 似乎更需要还是运气 。

而在DALL-E2官网的演示里 , 靠着不同物体概念、属性和样式的组合 , 我们能轻易得到一个区别于DD写意风格的具象图片 。 例如一个骑着马的宇航员 。