百度版ChatGPT迷雾:做不做、怎么做以及为什么做?( 二 )


3)商业模式问题 。 此前 , 根据TechCrunch估计 , 拥有100万用户的ChatGPT每天就要花费10万美元 , 若应用于Bing后经历高频度的搜索查询 , 商业运营成本极高 。
最新的消息是 , OpenAI发布了ChatGPT的试点订阅计划 , 订阅者以20美元/月的价格即可获得比免费版本更稳定、更快的服务 , 及尝试新功能和优化的优先权 。
怎么做?
尽管百度对推出类ChatGPT产品的消息不做回应 , 但在多家媒体的详细爆料和资本的狂欢中 , 似乎已经是板上钉钉的事实 。
爆料称 , 该项目在百度内部由搜索(MEG)和技术中台(TPG)团队牵头 , 呈现形式将会是生成式搜索 , 也就是将搜索和ChatGPT结合 。
生成式搜索是百度2019年就发布的一项服务 , 其具体形式类似ChatGPT , 比如「北京GDP和上海GDP谁高」的问题 , 百度会直接给出答案 , 相当于省去了用户分别搜索再自行计算的步骤 。
百度版ChatGPT迷雾:做不做、怎么做以及为什么做?
文章图片
今年1月初 , 百度搜索杰出架构师辜斯缪曾在一次小范围的媒体沟通会上透露 , 百度预计在3月会做一个比较大的升级 , 同时今年百度搜索在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统 。
如今根据媒体的爆料信息 , 预计百度版ChatGPT大概率将会是这种形式 。
生成式搜索可以看作是生成式AI的一个版本(ChatGPT就是生成式AI的一种) , 而后者被认为是搜索引擎的未来:不仅仅是索引网页与链接 , 而是为每一个查询生成相应的摘要、回答 。
用生成式搜索来回应ChatGPT , 似乎是中美两大搜索巨头不约而同的选择 。 这种看似战略防御做法的背后 , 也有搜索引擎无法回避的苦衷 。
虽然ChatGPT组织信息的方式更加简练 , 能够帮助整合信息、梳理段落要点 , 但当前搜索引擎给出的链接往往更加全面 , 因此使用方面ChatGPT并不具备压倒性的替代优势 。
并且 , 从ChatGPT本身来说 , 像百度、谷歌这样的大公司要为数亿甚至数十亿用户提供高可靠性的搜索服务 , 不能仅仅因为一个东西似乎会成为未来 , 因为人人都为之疯狂 , 就把一个不可信的、未经严格测试的新技术嵌入进来 。
就像谷歌其实在2021年5月就展示了人工智能系统LaMDA , 尝试用聊天机器人的技术来增强搜索引擎的使用体验 。
但直到现在谷歌仍不愿向公众发布LaMDA 。 部分原因在于 , LaMDA存在较高的误差 , 且容易对用户造成伤害 , 这也是ChatGPT类人工智能的通病 。
而生成式AI对搜索引擎最大的威胁还不是来自技术不完善 , 而是对搜索引擎盈利模式的威胁 。
一旦引入生成式AI搜索引擎 , 用户就会减少在链接间跳转、浏览的时间 , 也就减少了广告投放的空间 , 这会使搜索引擎的盈利模式发生根本性的变化 。
以广告为主要收入的搜索引擎自然要谨慎 。 2022年前三季度 , 广告营收占谷歌总收入的80% 。 百度也同样如此 , 据其2022年Q3财报 , 广告占百度当季营收的57.4% 。
换言之 , 即便是百度将ChatGPT嵌入到搜索 , 其服务范围也一定是谨慎的有选择性的 , 更多是类似「秦始皇和汉尼拔谁年纪大」这种封闭式问题 。
为什么做?
OpenAI在2019年拿了微软的10亿美金投资 , 代价是只能使用微软的云计算服务 。 当然这并非是微软的强盗逻辑 , 而是OpenAI确有苦衷 。
小公司根本承担不起数千亿数据的喂养以及大算力芯片的消耗 , 以StableDiffusion为例 , 它在4000台A100显卡集群上训练了一个月时间、学习了近59亿条图片数据才真正开发出来 。