英伟达|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了( 二 )


?当然 , 除了通过文本生成之外 , GauGAN 2.0同样也支持1.0版本的使用涂鸦、和导入图片生成的方式 , 而且还支持几种方式的混合使用 。
在通过文字生成了图片之后 , 你可以进一步使用涂鸦功能对细节进行调整 。 比如你先用文本生成了一张沙漠里的太阳的图片 , 你想将其衍生呈现出《星球大战》里沙漠里升起两个太阳的场景 , 那么 , 你只需要在已生成图片的基础上再画一个小圆圈 , 图片里就会升起两个太阳 。
?
再比如 , 你先导入一张海边风景的图片 , 然后使用快速擦除的功能擦去不想要的部分 。 接着 , 你再输入文本“极光” , AI就会自动给你加上特效 , 一张由你创作的极光大片就此产生 。
英伟达表示 , GauGAN 2.0背后的AI模型使用了NVIDIA Selene 超级计算机对超过1000万张高质量风景图像进行了训练 , 从而让AI理解单词以及单词之间的联系 , 并进一步将自然语言描述成风景图像 。
同时GauGAN还是是多模式软件 , 也就是说 , 即便是你和别人输入了同样的涂鸦或文本 , 软件中内置的随机数也能确保你们最终的生成的作品是不同的 。 因此 , 每个人所产出的图片都是独一无二的 。

GauGAN 2 “魔法”之初体验 虽然英伟达把GauGAN 2的能力宣传得如此神奇 , 但本着对科学负责任的态度 , 硅星人还是决定要亲自上手“验验货” 。
此次英伟达免费为大众开放了一个GauGAN 2的体验平台 。 整个平台的构成很简单:左边是绘画区 , 右边是图片生成区 , 上方是文本输入栏和绘画工具栏 。 打开该平台后 , 会有一个简单的使用指南 , 教你如何使用文本和绘画工具生成和修饰图片 。
一开始 , 硅星人的体验还是非常顺利的 , 一度为AI创作出来的效果而惊叹 。
硅星人首先尝试使用了简笔涂鸦转换图片的功能 。 目前GauGAN系统内提供了建筑、土地、景观和植物四大类别的涂鸦选择 , 每个大类下设置了一些子类 。
硅星人以先“海山礁石”为主题来做了一幅画 , 分别选择了“海”、“石头”的选项 , 然后在画布上涂鸦画了一通 。
点击生成后 , 左侧就立马出现了一幅跟画布上格局一样的风景画 , 同时还生成了落日、星空等不同种类的天空背景选项 。 接着 , 硅星人在天上画了一块云 , 在海上画了一颗树 。 左侧就立马生成了令人惊叹的云彩效果和一颗棕榈树 。
接着 , 硅星人尝试在文本区域分别尝试输入了Rainy的天气描述 , 令人惊喜的是 , 整个画面也会瞬间变成阴雨天 。
在体验了涂鸦功能后 , 硅星人也单独尝试了此次重点更新的文本输入功能 。
【英伟达|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了】在输入“Endless tall mountains in a sunny day(晴天下连绵的高山)”之后 , 左侧立刻就生成了符合文本描述的景象 。
自此 , 硅星人的整个体验都处于“哇”的状态 。 但就在硅星人准备将GauGAN称之为魔法之时 , 随着更多的尝试 , 画风开始逐渐走偏 。

AI也有翻车的时候 在按照英伟达给出的范例、测试了最简单的转换之后 , 硅星人尝试按照自己的想法 , 输入比描述性短句更加复杂的文本 。 而这时 , 返回的作品就开始凌乱了 。
当硅星人在文本框输入“一座坐落在宁静湖边的房子(A house near the peaceful lake)”时 , 系统并没有返回正常的湖泊或者房子的图像 , 而是呈现了一些非常抽象的图 。
这是啥?黑暗城堡、长在天上的树 , 还是云端的战舰?怎么看都跟湖边小屋没啥关系 。
此外 , 硅星人还发现 , 目前GauGAN 2的文本识别好像是只局限在建筑、土地、景观和植物这四大类之中 。 比如 , 当我们输入“一顿感恩节火鸡大餐(A Thanksgiving turkey dinner)”时 , 系统返回的图像仿佛是什么外星来物 , 跟火鸡、甚至晚餐根本都不沾边 。