国产AI作画神器火了,更懂中文,竟然还能做周边( 三 )


文章图片
最后 , 生成名为《云深不知处》的完整画作:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
看似“一句话生成图片”不难 , 其实对AI语义理解和图像生成能力提出了进一步要求 。
为了能更好地理解文本、提升输出效果 , 文心·一格还在百度文心的图文生成跨模态模型ERNIE-VilG的基础上 , 进行了更详细的优化 。
为了提升图文理解能力 , 在知识增强的基础上 , 引入跨模态多视角对比学习;
为了降低输入要求同时提升效果 , 采用基于知识的文本联想能力 , 让模型学会自己扩展提示词的细节和风格;
为了提升图像生成能力 , 采用渐进式扩散模型训练算法 , 让模型来选择效果最好的生成网络 。
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
此外 , 在训练和数据上 , 文心大模型的产业级能力也进一步给文心·一格提供了帮助 , 例如AI训练数据和平时在产业实践中积累的经验 , 都能应用到文心·一格的模型中去;至于百度知识图谱的算法能力 , 则进一步提升了模型通用性 。
值得一提的是 , 如果开发者想将文心·一格的能力用到产品中 , 直接调用ERNIE-VilG的API接口就行 , 可以说是非常方便了 。
OneMoreThing我们在试玩文心·一格的时候 , 还发现了左下角这些有意思的应用场景 , 一键就能生成预览:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
例如 , 颇有自如风格的装饰画:
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
老板批量发年货时印的编织袋(手动狗头):
国产AI作画神器火了,更懂中文,竟然还能做周边
文章图片
其实 , 这也是文心·一格区别于DiscoDiffusion、OpenAI的DALL·E2的另一个特点——更强的实用性 。
不仅普通玩家可以用来生成自己想画但画不出来的内容 , 绝不会有两幅相同的画作 , 脑洞再放大点 , 就连媒体作者等文字内容创作者 , 也能用它高质量高效率配图 。
(嗯 , 以后你看量子位的文章 , 说不定有些配图就是用AI生成的)
专业画师、或是设计师和艺术家 , 更可以用它来启发灵感、辅助创作 。
当然 , 从官网看来 , 这个产品还在更新迭代、进一步优化中 。
至于未来是否会在更多数字藏品、插画、海报和电影动漫中 , 看见文心·一格的画作?
我们拭目以待 。
—完—
量子位QbitAI·头条号签约