Netflix|AI比我懂中文?BAT的新战争进行中( 二 )


事实上 , 不管是上半年大火的 DALL·E 2(AI 生成图片) , 还是 ChatGPT(AI 生成文本)都衍生自 GPT-3 大模型 。 除此之外 , GPT-3 还通过付费 API 的形式支持了 300 多个应用 。
GPT-3 的推出也引发了全球范围 AI 大模型的爆发 , 全球各大科技巨头和研究所开始了一场声势浩大的 AI 军备竞赛 , 谷歌就在去年推出了万亿级参数的 AI 大模型—— Switch Transformer , 微软和英伟达烧坏了 4480 块 CPU 后 , 也完成了完成了 5300 亿参数的自然语言生成模型 MT-NLG(威震天-图灵) 。
国内的巨头自然也不甘落后 。 百度也在去年发布了「鹏城-百度·文心」 , 并于今年升级为文心·行业大模型 。 阿里则在今年 9 月推出了「通义」大模型系列 , 第一个在 CLUE 测评中得分超越人类的 AI「通义- AliceMind」正是来自该模型系列 。

图/阿里
科技巨头角力 AI 大模型的背景 , 是AI在下游应用层面出现了碎片化、多样化的产业趋势 。 华为昇腾计算业务总裁张迪煊指出 , 过去在单一的AI应用场景 , 其实是通过多个AI支撑一个场景来完成多个任务 。
传统AI模型只有较为单一的能力 , 如 AlphaGo 用于下围棋 , AlphaFold 专注蛋白质结构预测 。 而大模型如 GPT-3 已经可以实现多个任务 , 服务多个场景 , 「这是生产效率的提升 。 」
百度移动生态负责人何俊杰就表示 , AIGC 可以实现以十分之一的成本 , 以千倍百倍的生产速度 , 创造出有独特价值和独立视角的内容 , 让内容生产和传播进入 AI 发电的阶段 。
事实上 , 百度已经推出了 AI 作画平台「文心一格」 , 腾讯也有写稿机器人「梦幻写手」 , 阿里巴巴则有旗下的 AI 在线设计平台 Lubanner , 字节跳动则推出剪映提供 AI 生成视频功能 。
但未来的 AI 创作会是什么样?
AI创作 , 还是辅助创作?在 ChatGPT 展现自己超强的自然语言生成能力之后 , 有网友就想象未来可以用 ChatGPT 生成文案并输出为语音 , 同时再用 Stable Diffusion(文本生成图像)生成图片素材 , 甚至是直接使用谷歌的 Imagen Video , 或是 Meta 的 Make-A-Video 生成视频 。

AI生成的视频 , 图/谷歌

AI 生成文本和图片今天已经比较成熟了 , 但距离 AI 生成视频的实际应用还有明显的差距 。 阿里资深技术专家、达摩院基础视觉团队负责人赵德丽判断 , 大概两年左右时间 , AI 生成视频也有望能达到文生图级别的效果 。 她还指出目前的困难点在于 , 不论是质量还是数量都和文生图的数据有较大差距 。
在 9 月的万象大会上 , 百度发布了一个「创作者 AI 助理团」 , 其中包括了文案、插画师、视频制作等AI助理 , 实现一个人就是一个制作团队 。
几乎可以确信 , 未来 AI 将彻底改变现有的内容生产模式 , 但 AI 带来的内容革命还很难说是好是坏 。
ChatGFT 的训练方式主要通过语料库进行自然语言处理的训练 。 首先将大量的对话记录和语料库分词并处理成可供模型识别的格式 。 接着通过使用自然语言处理技术 , 如深度学习等对模型进行训练 , 让模型能够通过对语料库的学习 , 模拟人类的聊天行为 , 并能够回答用户提问 。
本质上 , AI 生成内容的基础是互联网上海量的语料库 , 既不能凭空创造出新的内容 , 也无法实时收集最新产生的语料数据 , 只是在一定的参数范围收集已经存在的信息 , 包括那些「有毒的」 。
OpenAI 去年就指出他们所做的改进并不能消除大型语言模型中固有的毒性问题 , GPT-3 接受了超过 600GB 网络文本的训练 , 其中一部分来自具有性别、种族、身体和宗教偏见的社区 。 与其他大型语言模型一样 , 它会放大训练数据的偏差 。