CSDN创始人蒋涛:“重应用轻生态”的AI开源模式非长久之计( 二 )


其次 , 在开发者对AI开源技术的偏好方面 , 目前增长最快的AI开源框架为Pytorch , 其搜索指数在2019年超越TensorFlow , 且后续涨势凶猛 。 原因是使用简单、API好用、性能优越 。 中国的AI开源框架和美国AI开源框架相比 , 大众感知也存在较大差距 , 当前美国的AI开源框架在市场上具有更高的认知度 。
在CSDN开发者调查报告中也对AI领域的热词进行了排序 , 然而当前热议的Transformers、Bert等框架未能进入CSDN博文总量的热点词TOP20 。 其中主要原因是 , CSDN社区主要聚集的是大批应用层面的开发者 , 这也表明以上两个框架的应用层面仍在发展中 。 从CSDN关于AI开源框架的热度排名中也可以看到 , 老牌的OpenCV排名第一 , 主要是因为实用性较高 。 但在认知和使用上TensorFlow还是排名第一 , 只不过较去年的48%的适用人群下降到今年的37% 。
我曾在四五年前提出了一个“技术社区三倍速定律” , 即一个技术要真正进入到应用领域中 , 首先要得到学术界的认可 , 接着进入工程界 , 最后才会进入大众视野 。
什么样的技术才能够真正落地?要看开发者是否会自发地、主动地去研究这项技术 , 并且在工作中去应用它 。 因此 , 如CSDN一类的技术社区能一定程度上反映出未来的技术趋势 。 报告中 , 可以看到人工智能“三倍速增长”的时间点大约是2016年至2018年间 , 受AlphaGo的影响 , 这个概念于2016年得到广泛关注 , 并在2018年达到最高峰 , 大量VC的资金狂热涌入 , 现在稍有回落 。
来源:CSDN网站
除AI开源框架的应用 , 从全球AI开源框架的贡献角度来看 , 中美仍有差距 。 在CSDN联合OSSInsight(PingCAP出品)提供数据支持的全球AI开源框架Star数月榜TOP20中 , 尽管6个是中国开源项目 , 但无一进入Star数总榜前十 , 好在它们的发展势头十分迅猛 。
截至2021年12月 , 百度“飞桨”深度学习平台(即PaddlePaddle) , 已经冲破了过去在中国市场上Google、Facebook(Meta)的垄断局面 , 成为中国深度学习平台综合市场份额第一 , 但TensorFlow与PaddlePaddle的Star数差距接近10:1 。 同时 , TensorFlow与PaddlePaddle的Commits数量 , 中美差距近3倍 。 尽管从AI发展历程上 , 国外具有一定的先发优势 , 但开源框架Star数和Commits数的欠缺仍能反映出中国开源生态中存在的些许问题 , 后面我将为大家详细说明 。
CSDN创始人蒋涛:“重应用轻生态”的AI开源模式非长久之计
文章图片
全球AI开源框架Star数4月、5月榜TOP2 , 来源:OSSInsight数据
据前瞻产业研究院报告指出 , 中国AI的发展更偏向于应用层 , 且中国在应用层上也有一些优势 , 但是要想取得真正的成功还得靠构建完整的生态 。 “重应用 , 轻生态”的AI开源模式并非长久之计 。
那么如何衡量开源生态是否良好呢?我认为要有以下三点 , 首先是项目社区的契合度;其次是产品市场的契合度;最后是价值市场契合度 。 其实人工智能已经经历过好几轮春天与冬天了 , 而我认为AI在价值市场契合度方面还没有完成闭环 。 现在真正的机会是把这三个闭环都完成 , 而这里面都对应有具体的指标 。
项目契合度指标:包括GitHub上的Star数、协作者数量和拉取请求数量 。
产品市场契合度指标:以下载次数衡量的自然采用率 。
价值市场契合度指标:RAS(可靠性、可用性、安全性);工具、插件;表现;审计;服务 。
中国的现状让我们看到的问题是:项目契合度方面 , Star数不够、Commit数不足且过于集中在几个主导开源项目的公司;产品市场契合度方面 , 用户的贡献与下载使用未形成完整闭环;价值市场契合度方面 , 商业化还有待发展 。