智源研究院|全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型( 二 )


智源研究院|全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型
文章插图

继今年6月份超越DALL·E取得MS COCO榜单第一后,CogView也进行了全新升级。CogView可以根据文本提示生成对应图像,优化后其图像生成能力实现了4倍提速,4倍清晰。CogView的绘画能力可应用于服装、海报等设计行业。
对话模型EVA是智源悟道团队的最新研发成果,作为一款生成式对话系统,EVA模型主打高情商,能够借鉴心理咨询助人理论,实现深度情绪安抚,让人机聊天更有温度。除了心情聊天外,它还支持大模型在线群聊等多类趣味对话应用,有望推动“人与物”交流的现在时代迈进到“物与物”交流的人机共融未来时态。
智源研究院|全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型
文章插图

基于以上能力,悟道大模型将在医疗、金融、新闻传播等行业有着广泛的应用空间。例如在金融、法律、零售等传统行业领域,大模型能提供高性能的智能信息解析和提取、智能数据整合、自动机器翻译、辅助决策等功能,提升业务流程效率和水平。在新闻传播领域,基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用。

大模型应用:助力OPPO小布助手升级在大会现场,OPPO小布助手技术总监杨振宇发布了与智源研究院合作的首款应用——基于悟道大模型的“生成式问答系统”,大模型黑科技加持,小布助手在一定程度上解决行业共通的长尾问题。
智源研究院|全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型
文章插图

AI语音技术在智能助手应用有着较为成熟的落地方案,智能家居、智能车载、新闻播报、智能终端等场景也有广泛的应用案例。但现阶段,“检索式回答”是大多虚拟助手的主要人机交互方式之一,对话内容局限于模型自建库和互联网数据,这意味着,诸如长江长还是黄河长这类问题,如果无法在数据库中找到答案,在度秘、搜狗助手、阿里夸克等途径也无法查询到的话,虚拟助手就无法做出回答。
智源研究院|全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型
文章插图

从长尾问题来看,小布助手以及整个行业普遍存在的以下难题:

  • 大量用户提问(至少有1亿),AI语音助手无法回答
  • 长尾单个问题命中率低、体量大且无法穷尽
  • 自建语料库周期长,人工数据标注成本高
针对这些问题,悟道开放平台提供了两套解决方案:一是针对小布助手现有用户已经提出的问题生成回答。“悟道”大模型具有强大的小样本学习以及文本的理解与生成能力。
二是针对用户未来可能问到的问题,通过“悟道”大模型结合知识图谱,持续学习,形成持续知识预训练模型,进而生成问答QA语料库。目前每台机器每天生成10万左右的待审核答案,单条回答的建设成本降低了99%。
智源研究院|全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型
文章插图

智源研究院学术副院长、清华大学教授唐杰与OPPO数智工程系统总裁刘海峰接受媒体采访
在会后采访中唐杰教授表示,他希望打造出更加智能的知识型、交互型、聊天式的智能助手,在回答人类提问时能够更开放,风格更多样化。当然,人性化的互动目标对模型的自然语言理解和生成提出了更高的要求,目前还没有更好的解决方案,但悟道大模型正在朝着这个方向迈进。
智源研究院|全球最大智能模型“悟道”首次落地:数字人+终端AI助手,支持NVIDIA GTX单卡机运行百亿大模型
文章插图

另外,此次发布的基于悟道大模型的冬奥手语播报数字人,将在北京冬奥会期间正式投入应用,提供全流程智能化的数字人手语生成服务,方便听障人士也能收看赛事专题报道。