大数据|你听说过大数据和云计算,那你听说过“巨信息”和“霾计算”吗?


2021年4月 , 期刊文章中的一系列怪异短语引起了一群计算机科学家的兴趣 。 由法国图卢兹大学的纪尧姆·卡巴纳克(Guillaume Cabanac)领导的团队无法理解 , 为什么有研究人员会使用 \"人造意识\"、\"泛神经组织 \"和 \"巨信息 \"等术语来代替被广泛认可的 \"人工智能\"、\"深度神经网络 \"和 \"大数据\"?
进一步的调查显示 , 这些奇怪的术语——他们称之为 \"瞎折腾术语\"——可能被用于对抗查重软件 。 而且现在 , 它们在计算机科学论文中似乎已随处可见 。
研究诚信调查员说 , 卡巴纳克和同事发现了一种新型的论文编造手段 , 他们的工作(7月12日在arXiv上发布) , 可能只是暴露了冰山一角 。
为了了解有多少涉事论文 , 研究人员在引文数据库Dimensions索引的期刊文章中搜索了30个瞎折腾术语 。 他们发现860多篇出版物至少包括其中一个术语 , 其中500篇发表在同一本期刊上——《微处理器和微系统》Microprocessors and Microsystems 。
\"这损害了科学 。 我们不能相信这些论文 , 所以需要找到并撤回它们 。 \"卡巴纳克说 。
在计算机科学论文中发现的瞎折腾术语
Big data(大数据) = Colossal information
Artificial intelligence (著名的缩写AI)= Counterfeit consciousness
Deep neural network (深度神经网络)= Profound neural organization
Remaining energy = Leftover vitality
Cloud computing(云计算) = Haze figuring(霾计算)
Signal to noise(信噪比) = Flag commotion
Random value(随机值) = Irregular esteem(无规则值)
为了深入挖掘 , 该团队下载了2018年至2021年期间发表在《微处理器和微系统》上的所有论文;他们选择这个时间范围是因为(文本生成AI)GPT的升级版在2019年发布 。 分析显示 , 2021年2月之后发表的论文的接受时间平均比该日期之前发表论文少了80% 。 这些论文中有很大一部分来自中国的作者 。 还有一部分论文有相同的提交、修改和接受日期 , 其中大多数出现在该杂志的特刊上 。 作者们说 , 这很可疑 。 与由主编监督的标准期刊不同 , 特刊通常由客座编辑提出和监督 , 并专注于一个特定的研究领域 。
在卡巴纳克和他的同事们注意到这些术语后 , 《微处理器和微系统》的出版商爱思唯尔(Elsevier)启动了一项调查 。 调查仍在进行中 , 但在7月中旬 , 出版商对出现在该杂志六期特刊中的400多篇论文给予特殊关注声明 。
出版商补充说 , 该杂志的 \"编辑系统的配置错误\" 意味着主编和被指定处理这些论文的编辑都没有像他们应该做的那样对论文进行审查 。 \"
爱思唯尔的一位发言人告诉《自然》 , 微处理器和微系统的调查发现 , 论文作者可能使用了反向翻译软件来掩盖剽窃行为 , 这可能是那些怪异术语的来源 。
以善于发现论文中的重复图像而闻名的加利福尼亚研究诚信分析师Elisabeth Bik说 , Cabanac的研究结果是 \"令人震惊的\" 。 \"她补充说:\"这是一种非常新的和令人不安的论文类型 。
澳大利亚悉尼大学的分子肿瘤学研究员Jennifer Byrne也致力于揭发造假论文 , 她说这可能是冰山一角 , 因为研究人员只深入调查了一家出版商的一份期刊 。 这些论文被发现也是因为它们的质量很差 , 但是在文献中可能有更多可信的人工智能生成的论文 , 这些论文更难发现 。 ”
【大数据|你听说过大数据和云计算,那你听说过“巨信息”和“霾计算”吗?】doi: https://doi.org/10.1038/d41586-021-02134-0