电子商务|OPPO登顶CLUE与MUGE,刷新中文自然语言理解与图文多模态双榜记录

电子商务|OPPO登顶CLUE与MUGE,刷新中文自然语言理解与图文多模态双榜记录

文章图片


2022年11月9日 , OPPO语音语义研究部融智团队提出的中文预训练大模型CHAOS, 在中文自然语言理解测评基准CLUE上登顶 , 以30亿参量同时刷新了CLUE总排行榜、CLUE分类任务排行榜和CLUE阅读理解排行榜的最好成绩 。 其中在“AFQMC , TNEWS , CSL , CHID1.1”4个赛道的成绩超过了人类识别精确准确度 , 总成绩距离超越人类表现仅差0.1 。
同期 , 在业界首个大规模中文多模态评测基准MUGE上 , 该团队自主训练的中文多模态预训练模型也在综合“图文检索、看图说话、文本到图像生成”三个赛道的总成绩上位列总榜第一名 。

【电子商务|OPPO登顶CLUE与MUGE,刷新中文自然语言理解与图文多模态双榜记录】OPPO 中文预训练大模型CHAOS登顶CLUE

OPPO中文多模态预训练模型登顶MUGE
CLUE (Chinese Language Understanding Evaluation) 是中文自然语言理解最权威测评榜单之一 , 包含了文本分类、阅读理解、句间关系等众多语义分析和语义理解类子任务 , 旨在推动NLP(自然语言处理)训练模型技术的不断进步和突破 , 对学术界和工业界都产生了较大的影响 。
MUGE(Multimodal Understanding and Generation Evaluation)是业界首个大规模中文多模态评测基准 , 由达摩院联合浙江大学、阿里云天池平台联合发布 , 中国计算机学会计算机视觉专委会(CCF-CV专委)协助推出 , 旨在帮助中文多模态研究人员全方位评估算法模型 。
NLP(自然语言处理)技术是人工智能领域的一个核心研究方向 , 其目的是使得计算机具备人类的听、说、读、写等能力 , 并利用知识和常识进行推理和决策 。 而图文融合的多模态能力的建设 , 目前工作主要集中在建立图像模态和文本模态的联系 , 相关能力的构建能够广泛落地到搜索、推荐、服饰设计、智能文案等真实场景中 。
“融合多种智能 , 研发统一的基础模型”是OPPO语音语义研究部融智团队的目标 , 也是“融智”二字的含义 。 未来融智团队将在推进感知认知融合 , 更可控/可编辑的视觉生成 , 及促进工业化落地转化的模型小型化等方向上继续突破 。