《降临》作者特德·姜:ChatGPT是网上所有文本的模糊图像( 四 )
即使有可能限制大语言模型参与制作 , 我们应该使用它们来生成万维网内容吗?只有当我们的目标是重新打包网络上已有的信息时 , 这才有意义 。 有些公司就是这么做的 , 我们通常称它们为内容工厂 。 也许大语言模型的模糊性对他们来说是有用的 , 它可以作为一种避免侵犯版权的手段 。 不过 , 一般来说 , 我想说的是 , 任何对内容工厂有好处的东西都不适合搜索信息的人 。 这种重新包装的兴起使我们现在更难在网上找到我们想要的东西 。 大型语言模型生成的文本在网络上发布得越多 , 网络本身就变得越模糊 。
关于OpenAI即将推出的ChatGPT继任者GPT-4的信息非常少 。 但是我想做一个预测:当收集用于训练GPT-4的大量文本时 , OpenAI会尽一切努力排除由ChatGPT或任何其他大语言模型生成的材料 。 若事实果真如此 , 那么将大语言模型与有损压缩进行类比是有用的 。 反复保存JPEG会产生更多的压缩制件 , 因为每次都会丢失更多的信息 。 这就相当于过去不断复制副本的做法 , 图像质量只会越来越差 。
事实上 , 衡量大语言模型质量的一个有用标准可能是 , 公司是否愿意使用它生成的文本作为新模型的训练材料 。 如果ChatGPT的输出对GPT-4来说不够好 , 我们或许会认为它对我们来说也不够好 。 相反 , 如果一个模型生成的文本非常好 , 可以用来训练新的模型 , 那么我们应该对文本的质量有信心 。 (我怀疑这样的结果需要在用于构建这些模型的技术上取得重大突破 。 )如果我们开始看到模型产生的输出和输入一样好 , 那么有损压缩的类比将不再适用 。
大语言模型能帮助人类创作原创作品吗?要回答这个问题 , 我们需要明确这个问题的含义 。 有一种艺术类型被称为影印艺术 , 在这种艺术中 , 艺术家们利用复印机的独特特性作为创作工具 。 在ChatGPT复印机上 , 沿着这些路线的事情肯定是可能的 , 所以 , 在这个意义上 , 答案是肯定的 。 但我认为没有人会说 , 复印机已经成为艺术创作中的必备工具 。 绝大多数艺术家在创作过程中不会使用它们 , 没人会认为他们的这种选择会让自己处于不利地位 。
所以让我们假设 , 我们并不是在谈论一种类似于“施乐艺术”的新的写作类型 。 鉴于这一规定 , 大语言模型生成的文本能否成为作家在创作原创作品时有用的起点 , 无论是小说还是非虚构?让一个大语言模型来处理样板文件 , 能让作者把注意力集中在真正有创意的部分吗?
显然 , 没有人能代表所有的作家 , 但我想说的是 , 以一份模糊的非原创作品作为起点 , 并不是创作原创作品的好办法 。 如果你是一个作家 , 在你写原创作品之前 , 你会写很多非原创的作品 。 花在非原创工作上的时间和精力不会被浪费 。 相反 , 我认为正是它让你最终能够创作出原创的作品 。 花在选择正确的词汇和重新排列句子以更好地遵循彼此上的时间 , 教会了你如何通过文章传达想要表达的意思 。 让学生写论文不仅仅是一种测试他们对材料掌握程度的方法 , 这给了他们表达自己想法的经验 。 如果学生从来不用写我们都读过的文章 , 他们就永远不会获得写我们从未读过的东西所需的技能 。
这并不是说 , 一旦你不再是学生 , 你就可以安全地使用大语言模型提供的模板 。 想要表达自己想法的挣扎并不会在你毕业后消失 。 每当你开始起草一篇新文章时 , 这种挣扎就会出现 。 有时候 , 只有在写作的过程中 , 你才能发现自己最初的想法 。 有些人可能会说 , 大语言模型的输出看起来与人类作家的初稿没有太大不同 , 但是 , 我认为这只是表面上的相似 。 你的初稿不是一个明确表达的非原创想法;这是一个原始想法的拙劣表达 , 它伴随着你无定形的不满 , 你意识到它所说的和你想说的之间的距离 。 这是在重写时能够指导你的东西 , 这是当你开始使用人工智能生成的文本时所缺乏的东西之一 。
- 《霍格沃茨之遗》同时在线破48万 / 2月国产游戏版号公布
- 电视剧|ChatGPT续写《狂飙》安欣的结局:结果意外 有3点让我害怕
- 侵权|关于《网易,好好做个人吧》一文的道歉声明
- 著名导演大卫?芬奇在电影《本杰明?巴顿奇事》中讲述了一位越活越年轻的男人本杰明?巴顿充满...|qq24岁,不止是年轻人的app
- 乐视|乐视视频大气宣布将限免全部独家会员剧:情人节先放《白鹿原》
- 三体|《流浪地球2》全球爆火背后!《三体》导演:中国科幻的内核是文化自信
- 巨人|史玉柱重返一线 再造《征途》 巨人网络回春不是梦?
- 地震|《非正式会谈》唐小强地震中遇难:一路走好
- 字节跳动ai实验室或为pico提供技术支持
- 宠粉行动!免费送价值49.9元的《FANUC机器人》专栏教程