达摩院|达摩院决定交出家底儿( 三 )


\r这些算法工程师们开始快速投入魔搭的建设中 , 微妙的变化也开始发生:
\r“随着魔搭在内部试运营 , 大家看到有一些模型会得到开发者的认可 , 他们开始有非常好的成就感 。 ”赵德丽说 。 有的开发者甚至为一个模型写了万字长文的评测文章 , 让开发它的算法工程师很受鼓舞——在过往的模式下 , 往往只有那些最明星的算法模型 , 才可能享受这般热烈的讨论 。
\r目标统一后 , 达摩院原本较为轻松的科研氛围也开始变得有些紧张 。 “我们现在一周有三次会 , 靖人直接参加对规划和质量把关 , 解决各种问题 。 ”赵德丽说 。
\r达摩院许多小组在负责开发不同领域的模型 , 而在魔搭基本准备好后 , 各小组也开始同时忙起来 , 改造模型 , 尽可能快和稳定的把它们放到平台上 。
\r而模型放上去只是个开始 , 更重要的是更新和维护 。 “让用户一行代码完成工作的背后 , 靠的是我们在后端建起的完善的模型存储和版本管理等一系列机制 , 把模型的自动发现、自动获取与加载 。 都在一行代码后默默实现 。 ”陈颖达说 。
\r平台上的各种不同模态的模型越来越多 , 魔搭需要把它们可能遇到的不同使用方式 , 微调方式 , 都做好分层的设计 , 这是一个十分精细的工作 , 在给初级用户提供非常友好的封装接口的同时 , 还要保持整个系统的超强开放性 。 “10行代码实现调优训练 , 是我们为模型开发者迅速上手而降低的门槛 , 但对于高阶开发者 , 我们同样允许他们在魔搭框架接口 , 和底层AI框架API之间 , 自由寻找合适的切入点 。 框架要做的是 , 提供丰富的必要的组件 , 供开发者自由选择 。 ”
\r工具体系是否足够完善也是影响体验的关键 。 “我们这次也做了一个Python的包 , 对接到今天各种机器学习框架 , 让它们能快速引入 , 快速自动进行模型的下载 , 能在本地进行二次开发 。 ”周靖人说 。
\r平台搭好了 , 更重要的是吸引更多的人一起来创造 。 牵头者呈现出的诚意究竟怎样就十分关键 , 所有人都在关注 , 达摩院放出来的模型是什么水平 , 是小打小闹还是动真格 。
\r“我把我们挑选的标准 , 称为叫好又叫座的模型 。 ”鄢志杰解释 , 叫好指的就是把今天学术研究领域达摩院最新的成果直接分享出来;而叫座指的则是将达摩院当前在应用侧承接业务流量的、真刀真枪的那些模型开放出来 。
\r“有些是正在公共云上按调用次数收费的模型 , 通过魔搭现在变成了开箱即用、大家都可以接触到的模型 。 ”
\r“今天模型要能够真正做到开源 , 做到免费使用 , 这个方面还是要有一定的决心 , 才能一起把生态激励起来 , 让更多的人参与进来 。 ”周靖人说 。 据他在发布会上公布的数据 , 目前已上架的中文模型超过100个 , 包括了一批探索人工智能前沿的中文大模型 , 如阿里通义大模型系列、澜舟科技的孟子系列模型、智谱AI的多语言预训练模型等 。 这些都是炙手可热的模型 。
\r“我们的计划是接下来每个月都会有新的模型上线 。 预期很快模型的数量就可以翻倍 , 覆盖到今天主要领域的方方面面 。 ”
\r
\r回归初心的达摩院
\r魔搭是一个很达摩院的设计 。
\r对比另一个在今年巨额融资后声名大噪的模型开源平台HuggingFace , 更能感受到达摩院的做事风格 。
\rHuggingFace鼓励人们去更活跃的参与 , 甚至带有很强的玩的属性 。 但如果要真实的产业应用 , 更多时候还是需要再次回到老的路上 。 而魔搭做的更彻底 。
\r“我们想的更多是 , 今天如何能够快速把你的模型从一个开发的环境变成一个生产的环境 , 怎么跟一系列前端的机器有效结合?提供一个完整的模型服务?”周靖人说 。 “甚至跟你的线下应用 , 跟你的线上服务一系列交互也要有效的联合在一起 , 从而真正意义上建立起以模型为中心的整个生命周期的管理 , 只有做到了所有的这些环节 , 才真正意义上叫做MaaS 。 ”