达摩院、浙大和上海人工智能实验室,还进一步将这一技术路线总结为端云协同AI范式:
云端大模型作为超级大脑,拥有庞大的先验知识,能进行深入的“慢思考”。
而端侧小模型作为四肢,能完成高效的“快思考”和有力执行。
两者共同进化,让AI向具有认知力和接近人类水平的智能迈进。
文章插图
基于这样的思考和实践经验,三方联合研究团队最新推出了端云协同平台洛犀。
该平台旨在将端云两侧的最佳实践以文档、算法组件、平台服务的形式沉淀下来,为开发者提供一站式端云协同模型训练、部署、通信能力。
具体而言,洛犀平台可拆解为端侧、云侧、端云链路三部分。
其中,端侧以Python/js package的形式提供服务,称为Luoxi-lite,包含表征、文本理解、图计算等能力。
端云链路侧,平台提供实现端云协同关键的通信能力,包括方案分发链路、数据通信链路。
端云协同的模型训练沉淀在云端,称为Luoxi-cloud,包含端模型训练等。
文章插图
目前,除了前文提到的部署于搜索场景的M6模型、排序模型,研究团队还借助洛犀完成了图神经网络、强化学习等技术在端云协同范式下的部署。
值得一提的是,1月12日,洛犀平台中云上大模型核心技术“超大规模高性能图神经网络计算平台及其应用”,获得了2021年中国电子学会科学技术进步奖一等奖。
芥子纳须弥,加速大模型落地应用说了这么多,简单总结一下就是,大模型展现的效果再怎么惊艳,对于业界而言,终归是落地应用方为真。
因此,对于大模型发展的下一阶段来说,比拼的将不仅仅是谁烧的GPU更多、谁的模型参数规模更大,更会是谁能把大模型的能力充分应用到具体场景之中。
在这个大模型从拼“规模”到拼“落地”的过渡时期,达摩院、浙大、上海人工智能实验室三方此番提出的“须弥藏芥子、芥子纳须弥”的思路,便格外值得关注。
“庞大的须弥山如何纳入极微小的种子中?”
对于当下大模型、小模型的思辨而言,解决了这样一个问题,也就在充分利用大模型能力、探索下一代人工智能系统的路途上更进了一步。
结合历史上计算形态的变化,随着物联网技术的爆发,在当下,尽管云计算模式已经在通信技术的加持下得到了进一步强化,但本地计算需求也在指数级持续涌现,将全部的计算和数据均交由集中式的云计算中心来处理并不符合实际。
就是说,发展既发挥云计算优势、又调动端计算敏捷性的计算模式,才是当下的需求所在。
也正是在这样端云协同的趋势之下,大小模型的协同演进有了新的范式可依:云侧有泛化模型,端侧有个性化模型,两个模型相互协作、学习、推理,实现端云双向协同。
而这,正解决了我们在开头提到的,大模型落地过程中面临的性能与能耗平衡之困。
正如浙江大学上海高等研究院常务副院长吴飞教授所言,从大模型到终端可用的小模型,关键在于“取其精华、化繁为简”,实现高精度压缩;而在端云协同框架之下,小模型的实践积累对于大模型而言,将是“集众智者无畏于圣人”。
你觉得呢?
【 研究团队|万亿大模型怎么落地?产学研三界联手给出新答案:大小模型协同进化】— 完 —
量子位 QbitAI · 头条号签约
- 元宇宙发展研究报告2.0版发布:AR庞大C端市场尚待启动也是下一
- 元宇宙发展研究报告2.0版:媒介载体等五大产业板块或将受到资
- 元宇宙发展研究报告2.0版:应加大核心技术扶持力度 实现产业链
- 元宇宙发展研究报告2.0版发布:网民讨论的越来越多 舆情逐渐趋
- 元宇宙发展研究报告2.0版发布:推进基础数字技术研究是现阶段
- 科技|百度研究院发布2022十大科技趋势,大模型位列榜首
- 苹果汽车|果粉们再等等吧!首席工程项目经理又跳槽,苹果汽车团队再次全灭
- 巴斯|苹果汽车团队软件工程主管离职,此前管理团队几乎全部离职
- 微信|英伟达正在研究进一步提高GPU光线追踪性能,提升幅度最高可达20%
- 农业信息与经济研究所开展春节慰问活动