智源研究院|全球最大智能模型“悟道”首次落地：数字人+终端AI助手，支持NVIDIA GTX单卡机运行百亿大模型( 二 ) 绘制|基本功|能力|个人|方案

文章插图

继今年6月份超越DALL·E取得MS COCO榜单第一后，CogView也进行了全新升级。CogView可以根据文本提示生成对应图像，优化后其图像生成能力实现了4倍提速，4倍清晰。CogView的绘画能力可应用于服装、海报等设计行业。
对话模型EVA是智源悟道团队的最新研发成果，作为一款生成式对话系统，EVA模型主打高情商，能够借鉴心理咨询助人理论，实现深度情绪安抚，让人机聊天更有温度。除了心情聊天外，它还支持大模型在线群聊等多类趣味对话应用，有望推动“人与物”交流的现在时代迈进到“物与物”交流的人机共融未来时态。

文章插图

基于以上能力，悟道大模型将在医疗、金融、新闻传播等行业有着广泛的应用空间。例如在金融、法律、零售等传统行业领域，大模型能提供高性能的智能信息解析和提取、智能数据整合、自动机器翻译、辅助决策等功能，提升业务流程效率和水平。在新闻传播领域，基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用。

大模型应用：助力OPPO小布助手升级在大会现场，OPPO小布助手技术总监杨振宇发布了与智源研究院合作的首款应用——基于悟道大模型的“生成式问答系统”，大模型黑科技加持，小布助手在一定程度上解决行业共通的长尾问题。

文章插图

AI语音技术在智能助手应用有着较为成熟的落地方案，智能家居、智能车载、新闻播报、智能终端等场景也有广泛的应用案例。但现阶段，“检索式回答”是大多虚拟助手的主要人机交互方式之一，对话内容局限于模型自建库和互联网数据，这意味着，诸如长江长还是黄河长这类问题，如果无法在数据库中找到答案，在度秘、搜狗助手、阿里夸克等途径也无法查询到的话，虚拟助手就无法做出回答。

文章插图

从长尾问题来看，小布助手以及整个行业普遍存在的以下难题：

大量用户提问（至少有1亿），AI语音助手无法回答
长尾单个问题命中率低、体量大且无法穷尽
自建语料库周期长，人工数据标注成本高

针对这些问题，悟道开放平台提供了两套解决方案：一是针对小布助手现有用户已经提出的问题生成回答。“悟道”大模型具有强大的小样本学习以及文本的理解与生成能力。
二是针对用户未来可能问到的问题，通过“悟道”大模型结合知识图谱，持续学习，形成持续知识预训练模型，进而生成问答QA语料库。目前每台机器每天生成10万左右的待审核答案，单条回答的建设成本降低了99%。

智源研究院|全球最大智能模型“悟道”首次落地：数字人+终端AI助手，支持NVIDIA GTX单卡机运行百亿大模型

文章插图

智源研究院学术副院长、清华大学教授唐杰与OPPO数智工程系统总裁刘海峰接受媒体采访
在会后采访中唐杰教授表示，他希望打造出更加智能的知识型、交互型、聊天式的智能助手，在回答人类提问时能够更开放，风格更多样化。当然，人性化的互动目标对模型的自然语言理解和生成提出了更高的要求，目前还没有更好的解决方案，但悟道大模型正在朝着这个方向迈进。

文章插图

另外，此次发布的基于悟道大模型的冬奥手语播报数字人，将在北京冬奥会期间正式投入应用，提供全流程智能化的数字人手语生成服务，方便听障人士也能收看赛事专题报道。