chatgpt|火爆全网的 ChatGPT,还干不掉 Google 搜索( 二 )



不过 , ChatGPT 被吐槽最多的还是它的准确性 , 列对了鸡兔同笼方程却解错 , 硬说豆瓣的创始人不是阿北 , 脑洞大开胡编乱造西游记结局 , 一本正经地胡说八道就罢了 , 偏偏语气十分自信 , 也不提供资料来源 。 你使用搜索引擎时 , 至少可以凭借多个信源交叉验证 。
12 月 4 日 , 马斯克透露 ChatGPT 可以访问 Twitter 数据库 , 这意味着 ChatGPT 必然学习了许多缺少事实核查的数据 。 正因为垃圾答案泛滥 , 程序员问答网站 Stack Overflow 从 12 月 5 日开始 , 暂时禁止用户分享 ChatGPT 生成的内容 。

另外 , ChatGPT 的回答混入了不少片汤话 , 被调侃为「水文神器」 。 OpenAI 解释 , 这主要是因为训练数据偏差(训练者更喜欢看起来更全面的、更长的答案)和过度优化 。
种种不足摆在台面上 , ChatGPT 暂时不会威胁到搜索引擎 。
▲《2001 太空漫游》的 AI 杀人事件.
虽然 ChatGPT 比其他 AI 更像人了 , 本质上还是「随机鹦鹉」 , 离不开大模型、大数据、大算力 , 它的知识来自训练数据中的统计规律 , 并不理解自己所说的话 。 12 月 5 日 , 《时代》杂志「专访」了 ChatGPT , 在被问到「大型语言模型有哪些限制」时 , ChatGPT 回答道:
大型语言模型的一个限制是 , 我们无法理解我们生成的单词的上下文或含义 。 我们只能根据给定的训练数据 , 根据某些单词或单词序列一起出现的概率来生成文本 。 这意味着我们无法为我们的回答提供解释或推理 , 并且我们可能不会总是生成完全连贯或在对话上下文中有意义的回答 。
但 ChatGPT 回避了一个问题:什么是理解?「理解」是属于人类的概念 , 它能否用在 ChatGPT?如果能用 , 它的理解是否约等于「生成有意义的回答」这个结果 , 论迹不论心?

至少在未来一段时间内 , 我们或许更需要担心 , 当越来越多的网络内容由类似的模型生成 , 搜索引擎给出的结果 , 质量是会提高还是降低 。
我还问了问 ChatGPT 本尊 , 它的态度十分谦虚 , 不觉得应该拿它和 Google 比较:
我是一个大型语言模型 , 无法与 Google 或任何其他搜索引擎进行比较 。 我的目的是通过回答用户的提问来帮助用户获得信息 , 而不是提供搜索功能 。 与搜索引擎相比 , 我的优势在于能够回答复杂的问题 , 并且可以提供更加个性化和详细的信息 。 相比之下 , 我的劣势在于无法提供搜索功能 , 也无法提供最新的信息 。
AI 可能是搜索引擎的未来 虽然 ChatGPT 仍在起步 , 没有在搜索上比 Google 做得更好 , 但它可能改变我们在线搜索信息的方式 , 让搜索技术更上一层楼 。
眼下就有一个简单的例子 , 现在已经有大量将 ChatGPT 嵌入 Google 的插件出现 , 其中有些插件将 ChatGPT 的结果显示在网页右侧 , 一次搜索兼顾两种体验 。
再参照 ChatGPT 和图像生成模型 Stable Diffusion 的联动(可能是因为 AI 更懂 AI , ChatGPT 的描述更容易被 Stable Diffusion 提取 , 最终的图片质量更高) , ChatGPT 或许也可以用于解释、指导关键词 , 帮助我们更好地用搜索引擎查找信息 。

此外 , ChatGPT 的时效性、准确性不足 , 也并非是无解的 。
一方面 , 知乎答主、自然语言处理专家@张俊林指出 , 近乎实时地将新知识融入大规模语言模型 , 非常有挑战性 , 一种解决办法是 , 把它存到传统搜索引擎的索引里 , ChatGPT 如果回答不了时效性的问题 , 可以转向搜索引擎抽取对应的答案 。
另一方面 , 彭博社报道 , OpenAI 正在开发一个名为 WebGPT 的 AI 系统 , WebGPT 将能够更准确地回答问题 , 甚至还能说明引用的来源 。