《降临》作者特德·姜：ChatGPT是网上所有文本的模糊图像( 四 ) 2月9日

即使有可能限制大语言模型参与制作，我们应该使用它们来生成万维网内容吗？只有当我们的目标是重新打包网络上已有的信息时，这才有意义。有些公司就是这么做的，我们通常称它们为内容工厂。也许大语言模型的模糊性对他们来说是有用的，它可以作为一种避免侵犯版权的手段。不过，一般来说，我想说的是，任何对内容工厂有好处的东西都不适合搜索信息的人。这种重新包装的兴起使我们现在更难在网上找到我们想要的东西。大型语言模型生成的文本在网络上发布得越多，网络本身就变得越模糊。
关于OpenAI即将推出的ChatGPT继任者GPT-4的信息非常少。但是我想做一个预测：当收集用于训练GPT-4的大量文本时， OpenAI会尽一切努力排除由ChatGPT或任何其他大语言模型生成的材料。若事实果真如此，那么将大语言模型与有损压缩进行类比是有用的。反复保存JPEG会产生更多的压缩制件，因为每次都会丢失更多的信息。这就相当于过去不断复制副本的做法，图像质量只会越来越差。
事实上，衡量大语言模型质量的一个有用标准可能是，公司是否愿意使用它生成的文本作为新模型的训练材料。如果ChatGPT的输出对GPT-4来说不够好，我们或许会认为它对我们来说也不够好。相反，如果一个模型生成的文本非常好，可以用来训练新的模型，那么我们应该对文本的质量有信心。（我怀疑这样的结果需要在用于构建这些模型的技术上取得重大突破。）如果我们开始看到模型产生的输出和输入一样好，那么有损压缩的类比将不再适用。
大语言模型能帮助人类创作原创作品吗？要回答这个问题，我们需要明确这个问题的含义。有一种艺术类型被称为影印艺术，在这种艺术中，艺术家们利用复印机的独特特性作为创作工具。在ChatGPT复印机上，沿着这些路线的事情肯定是可能的，所以，在这个意义上，答案是肯定的。但我认为没有人会说，复印机已经成为艺术创作中的必备工具。绝大多数艺术家在创作过程中不会使用它们，没人会认为他们的这种选择会让自己处于不利地位。
所以让我们假设，我们并不是在谈论一种类似于“施乐艺术”的新的写作类型。鉴于这一规定，大语言模型生成的文本能否成为作家在创作原创作品时有用的起点，无论是小说还是非虚构？让一个大语言模型来处理样板文件，能让作者把注意力集中在真正有创意的部分吗？
显然，没有人能代表所有的作家，但我想说的是，以一份模糊的非原创作品作为起点，并不是创作原创作品的好办法。如果你是一个作家，在你写原创作品之前，你会写很多非原创的作品。花在非原创工作上的时间和精力不会被浪费。相反，我认为正是它让你最终能够创作出原创的作品。花在选择正确的词汇和重新排列句子以更好地遵循彼此上的时间，教会了你如何通过文章传达想要表达的意思。让学生写论文不仅仅是一种测试他们对材料掌握程度的方法，这给了他们表达自己想法的经验。如果学生从来不用写我们都读过的文章，他们就永远不会获得写我们从未读过的东西所需的技能。
这并不是说，一旦你不再是学生，你就可以安全地使用大语言模型提供的模板。想要表达自己想法的挣扎并不会在你毕业后消失。每当你开始起草一篇新文章时，这种挣扎就会出现。有时候，只有在写作的过程中，你才能发现自己最初的想法。有些人可能会说，大语言模型的输出看起来与人类作家的初稿没有太大不同，但是，我认为这只是表面上的相似。你的初稿不是一个明确表达的非原创想法；这是一个原始想法的拙劣表达，它伴随着你无定形的不满，你意识到它所说的和你想说的之间的距离。这是在重写时能够指导你的东西，这是当你开始使用人工智能生成的文本时所缺乏的东西之一。