国产AI作画神器火了,更懂中文,竟然还能做周边( 二 )


懂中文 , 也懂“懒人”用起来 , 并不复杂 。
我们从操作界面、提示词要求和性能要求几方面 , 对DiscoDiffusion和文心·一格等AI画画产品进行了简单对比 。
操作界面上 , DiscoDiffusion开放的接口不能说很复杂 , 但确实有点门槛 。
它直接在谷歌Colab上运行 , 需要申请账号后使用(图片生成后保存在云盘) , 图像分辨率、尺寸需要手动输入 , 此外还有一些模型上的设置 。
好处是可更改的参数更多 , 对于高端玩家来说可操作性更强 , 只是比较适合专门研究AI算法的人群:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
相比之下 , 文心·一格的操作只需三个步骤:输入文字 , 鼠标选择风格&尺寸 , 点击生成 。
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
前文已经提到 , 文心·一格同样也具备DiscoDiffusion的“高级自定义”功能 , 随后便会开放 , 对于想拥有更多“参数自由”的小伙伴们来说 , 同样是个不错的选择 。
至于提示词 , DiscoDiffusion的设置还要更麻烦一些 。
除了描述画面的内容以外 , 包括画作类别和参考的艺术家风格也都得用提示词来设置 , 通常大伙儿会在其他文档中编辑好 , 再直接粘过来 。
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
关键一旦提示词设置得不好 , 生成的效果就不尽如人意 , 需要反复尝试、不断细化 , AI最终才能生成合适的画面效果 。
相比之下文心·一格倒是没有格式要求 , 输入150字的句子或词组都可以:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
当然 , 输入画家名字如莫奈 , 也能输出对应风格:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
最后是性能要求上 , DiscoDiffusion是有GPU使用限制的 , 每天只能免费跑3小时 。 抱抱脸(HuggingFace)上部分AI文生图算法的Demo虽然操作简单些 , 但一旦网速不行 , 就容易加载不出来:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
△测试miniDALL·E时加载就失败过
相比之下 , 文心·一格除了使用高峰期以外 , 基本上都是2分钟就能生成 , 对使用设备也没有要求 。
总体来看 , 同样是文字生成图片AI , 实际相比文心·一格的“真·一句话生成图片” , DALL·E和DiscoDiffusion的生成过程都不太轻松 。
所以在这背后 , 文心·一格生成图像 , 究竟是基于一个怎样的逻辑?
我们以输入“云深不知处”为例 , 希望能输出一幅中国风的画作 。 当接收到这几个字词(query)后 , AI的脑细胞就开始“运作”了起来 , 从语法、词法、语义等角度对文本进行分析 。
如果将生成过程可视化 , 这个阶段还看不出什么效果 , 处于AI理解文本的阶段:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
很快 , AI“拆解”文本后 , 理解要怎么画这幅画了 , 于是在特定尺寸(用户可选)的画纸上 , 构思出整体的轮廓 , 兼具云的元素和中国画的风格:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
随后 , 基于扩散生成模型的原理 , 迭代地完善并修正画面细节 , 不断提高清晰度、反复检查图文描述一致性 , 用更精确的配色替代噪声:
国产AI作画神器火了,更懂中文,竟然还能做周边