文章插图
【 商汤为什么要建 AI 计算中心】「商汤科技人工智能计算中心」(AIDC)
02
用大模型,降低创新成本
作为 AI 领域的头部企业,商汤一路走来历时 7 年多。杨帆表示,AI 产业经历了五、六年发展,新的趋势是产业链的分化。当 AI 进入不同的场景落地,经过了初期,面对更多分化的场景、中深度的需求。「创新的成本高」,成为了新阶段遇到的问题。其它行业期待以更低的成本获得匹配的算法,以解决问题。
从这个角度理解,AIDC 便是商汤在新阶段,降低创新成本,提高服务能力的「解法」:解决对多任务、多长尾场景覆盖的核心瓶颈问题。
比如,在传统的工业生产线上,客户希望 AI 算法能够检测钢铁的焊缝是不是符合标准。这个行业本来没有与之匹配的智能软件和平台,应用的矛盾就在于,以尽可能小的预算去解决这个问题。这样才是真正实现了降本增效。如果「一个算法本身要花几十万、上百万,算法确实有用,但是太贵了。」
如今,面对这样的需求时,商汤「通过 AIDC 的支撑和加持,能够让算法的生产成本下降到过去的 1/10。」
要实现成本下降,就要充分利用大模型带来的优势。AIDC 支持万亿参数大模型训练,可以衍生出超过 2 万多个商用模型,帮助产业界以极低的下游数据采集成本,快速验证多个新场景。
AI 行业里近年来出现了「大模型」的趋势。「用预训练大模型,去指导小模型的训练,实现跨场景应用方向。」杨帆介绍,AIDC 能够更好地支持大模型,再用大模型指导长尾模型的自动化生产、自动化训练,从而能够提高效率,降低成本。
大模型如何帮助实现长尾的细分场景呢?例如,有地方提出需求,希望算法能够检测到有人落水,然后发出通知,相关人员接到通知后第一时间前往救助。
解决这个长尾场景的难点在于,落水的视频素材本身就不多,样本数据就不多。那么采用大模型的思路,不是单独训练识别落水素材的算法,而是先用各种人类行为的视频素材作为数据。在更广泛的范围收集大量数据,训练出大模型。再用这个模型作为「老师」,训练出一个只会识别落水行为的「学生」。这样,只需要较少的样本数量,就能够得到比较好的识别结果。
使用大模型作为支撑的好处在于:遇到频率低,不常见的应用需求时,基于少量的专有数据,使用小样本达到结果。
03
助力国产芯片产业化
预计到 2024 年,所有服务器全部到位时,AIDC 国产化的硬件比例将超过 50%。
文章插图
人工智能是软件硬件一体化的产业进程,芯片厂商也需要拥有解决软件适配问题的能力。而商汤搭建的 AI 基础设施的综合角色,可以使其在硬件、软件、应用的产业链上起到重要的沟通的作用。
作为 AI 基础通用设施,本身就包含了硬件层、平台层以及软件系统,同时连接着下游应用厂商。商汤与硬件、芯片厂商做适配,拉通应用侧需求的同时,也帮助节约其研发费用和时间成本。「整体上,加速了他们的市场化进程,帮助降低整体成本。」杨帆说。
除了促进国产芯片的市场化进行,商汤也正在探索从芯片、服务器、训练框架、算法到行业落地的 AI 生态。
2021 世界人工智能大会上,商汤与中国电子技术标准化研究院、中国信息通信研究院、清华大学、复旦大学、上海交通大学及多个行业伙伴共同成立了「人工智能算力产业生态联盟」。整个生态的探索分为前、中、后期。
- 雷蛇|为什么大多消费者都喜欢入手顶级旗舰,而不是高性价比次旗舰呢?
- 科技股|移动支付为什么只在中国流行,而欧美并不流行呢?
- 拆单|OMS订单拆单的流程中,要做哪些工作?
- 一加科技|喜欢打游戏要不要入手一加10 Pro?各平台用户评价说明一切
- 荷兰:苹果虽允许第三方支付 仍不满足裁决要求
- iPhone14|iPhone 14升级没意义?果粉最想要的都没了
- 腾讯|去腾讯实习要交钱?腾讯:解聘多名员工 永不录用
- 抖音想要做你的莫妮卡莫妮卡我目不转睛望着你脸颊迷人侧影像幅画精致短发是什么歌 歌曲分享
- CPU处理器|下代EUV光刻机要来了 炬光科技:是ASML核心供应商的重要供应商
- realme|拒绝Type-c接口共用,想要3.5mm耳机孔,这三款手机很不错!