智东西内参|上海只排第五!IDC发布2021-2022中国 模型( 四 )


整体而言,人工智能算法模型发展愈加复杂,大规模成发展趋势,巨量模型将是规模化创新的基础。全球范围内,人工智能模型参数大小逐渐递增,在 2011 年至 2021 年间从千万级增至千亿级。2020 年,OpenAI 在发布 GPT-3 深度学习模型后,人工智能在大众的视野实现进一步“扩圈”。GPT-3 模型使用云计算分析学习海量数据后,凭借 1750 亿个参数,在文本分析、机器翻译、机器写作等自然语言处理应用领域表现出色。
除了 GPT-3 之外,2021 年中国“源 1.0”、美国 Switch Transformer 等“巨量”机器学习模型的出现,让构建大模型、提升人工智能处理性能,成为时下非常流行的模型发展趋势。其中,中国“源 1.0”的单体模型参数值达 2457 亿,借助文本分析模型,获取 5TB 高质量中文数据集,其作为语言模型可较好完成尤其针对中文的阅读、理解、推理、逻辑判断等任务。此外,通过算法和算力的协同优化,提升 GPU 性能发挥,提升计算效率;其还具有出色的零样本学习和小样本学习等模型泛化应用能力,可为实际场景中的快速应用带来可能。
尽管对于人工智能发展而言,在实现理想泛化能力的基础上,越小的模型,将会更加广泛与灵活地适配应用场景。但是在这条通向理想的道路上,第一步则需要使用大模型、通过海量有价值数据进行充分训练,在调优至理想效果后,再进行蒸馏、量化等缩小模型的工作。通过大模型实现最优效果,在当下看来是人工智能更通用、高阶化应用的必经之路。
巨量模型为实现创新带来机会,算力是实现创新的基础。 在通过大模型不断探索人类庞大的自然语言体系的同时,训练门槛提高,调优和应用创新的算法模型需要强大算力的支持,计算能力的不断提升与云平台的高速发展,无疑对“巨量”模型的发展是一个重要利好。计算硬件设备的不断升级、云计算服务的持续优化,为更多企业以更低的成本享受到更强算力带来可能,从而能够在更大的机器学习模型支持下,实现更加精确的分析、预测。拥有较高算力基础建设能力的企业 / 组织或国家,将更有可能在人工智能带来的红利中更多的获利。在中国,由各地政府主导的智算中心等算力基础设施的建设可很大程度上解决对高算力的需求。
目前,人工智能算力平台建设与行业用户之间的鸿沟仍是应用落地的阻碍因素之一,根据 IDC 调研,超过 50% 的企业认为其行业应用场景需要更加精确的算法模型。由于人工智能应用场景正在不断深入和细化,从通用场景到行业碎片化场景的下沉趋势愈加显著,围绕人工智能的生态建设依然是未来需要关注的重点。如何构建产业生态,为更多上下游供应商提供整合的平台,为行业用户输出理想的解决方案依然至关重要。
5、应用场景应用的丰富程度体现出人工智能算力转化为生产力的能力大小。随着人工智能技术发展,已经跨越概念阶段,完成 POC 阶段,逐步实现在生产、经营环境的落地部署甚至是规模化应用,辅助各行各业向更加智能化、绿色化、综合化以及多元化方向发展。
从人工智能单点技术应用来看, 根据 2021 年 IDC 针对企业对于人工智能技术的应用现状调研的结果来看,计算机视觉目前仍为最主要的应用技术类型,视频监控、图像识别、智能摄像头、人脸识别以及图像处理等企业应用率位居前列。预计未来,企业在持续增加计算机视觉应用的同时,也会加深语音识别、自然语言处理等技术场景的应用。
智东西内参|上海只排第五!IDC发布2021-2022中国 模型
文章插图
企业已部署及未来三年计划部署的人工智能场景,2021