样本|巨量模型时代,浪潮不做旁观者:2457亿,打造全球最大中文语言模型( 三 )



源1.0 更“博学”了吗?图灵测试一直被认为是人工智能学术界的”北极星“,也是检验机器是否具有人类智能的唯一标准。以GPT-3为代表的巨量模型出现后,机器开始在多项任务中逼近图灵测试,但直到源1.0之前,没有任何大模型突破30%的关卡。
在“源1.0”的图灵测试中,将模型生成的对话、小说续写、新闻、诗歌、对联与由人类创作的同类作品进行混合并由人群进行分辨,测试结果表明,人群能够准确分辨人与“源1.0”作品差别的成功率已低于50%。


样本|巨量模型时代,浪潮不做旁观者:2457亿,打造全球最大中文语言模型
文章插图

如图,受访者的平均误判率为50.84%,在新闻生成领域误判率高达57.88%。
而抛开数据,源1.0的诗歌、对联的作品确实让人惊艳
五湖四海皆春色,三江八荒任我游
春来人入画,夜半月当灯
和风吹绿柳,细雨润青禾
三江顾客盈门至,四季财源滚滚来.
疑是九天有泪,
为我偷洒。
滴进西湖水里,
沾湿一千里外的月光,
化为我梦里的云彩。
巨量模型的潜力炼大模型热潮的兴起,离不开谷歌微软、OpenAI、智源研究院等全球顶级科技企业和研发机构的追逐和热捧,在它们看来,巨量模型代表了实现通用人工智能最具潜力的路径,代表了当前传统产业实现智能化转型的新机遇.
而这次,浪潮重磅发布中文单体大模型源1.0,通过图灵测试和小样本学习能力再次印证了业界对超大模型潜力的普遍期望. 前者为模型推理\\走向认知智能提供了可能性,后者降低了不同场景的适配难度,提升了模型的泛化应用能力。相信未来这股\"浪潮\"还会越来越汹涌.

雷锋网雷锋网雷锋网