gpu|亚洲最大!上海“巨无霸”AI计算中心投用,支持万亿参数大模型训练

gpu|亚洲最大!上海“巨无霸”AI计算中心投用,支持万亿参数大模型训练
文章插图
智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影
智东西1月24日消息,今日,位于上海临港新片区的商汤科技人工智能计算中心(AIDC)正式投入使用。
商汤从2018年4月开始布局人工智能(AI)计算原型机研制项目,到2020年3月,AIDC项目正式立项启动。从开工建设到主体结构封顶,AIDC仅用时168天,刷新了临港建设的新纪录。
这是亚洲最大的超算中心之一,也是华东地区首个落地运营的超大型人工智能计算中心,具有开放、大规模、低碳、节能等特点。
该计算中心建筑面积13万平方米、项目总投资约56亿元、一期共5000个等效8000瓦的机柜,满载运行时算力可达3740PetaFLOPS(1PetaFLOPS为每秒千万亿次浮点运算),二期正在规划中,大体会是一期体量的1~2倍。
截至2021年6月30日,商汤已经战略性地在主要区域市场建立了23个人工智能超级计算集群,拥有超过20000块GPU,总算力达到每秒1.17百亿亿次浮点运算。AIDC投入使用后,商汤总算力将超过每秒4.91百亿亿次浮点运算。
近日,商汤科技联合创始人、副总裁杨帆接受智东西等媒体的采访。杨帆透露道,AIDC的目标是在2025年成为商汤的支撑性业务之一。
据悉,AIDC当前可完成10000亿参数模型的完整训练。未来商汤内部研发体系都将架设在AIDC上,预计到2024年所有服务器到位时,AIDC的国产化硬件比例将超过50%。
gpu|亚洲最大!上海“巨无霸”AI计算中心投用,支持万亿参数大模型训练
文章插图
一、对内支撑AI大装置,对外提供三类业务AIDC能做什么?
对内,AIDC是商汤通用AI基础设施SenseCore商汤AI大装置的算力底座,AI大装置所囊括的所有软件平台及服务均运行在AIDC的物理实体上。
对外,AIDC可以独立提供算力支撑。商汤将通过AIDC把AI大装置的技术能力开放给产学界合作伙伴,让更多客户在商汤的云平台上获取AI-as-a-Service服务,灵活订阅各种预训练AI模型,从而降低各行业大规模AI应用的准入壁垒。
从计算能力来看,AIDC堪称“巨无霸”。
其总算力达3740PetaFLOPS,1天内可处理时长相当于23600年的视频,等同于从旧石器时代晚期不间断录制到今天的长度。
当前AIDC在1天内可完成10000亿参数视觉领域大模型的完整训练。基于这一超大模型,可以衍生出超过2万多个商用模型,帮助产业界以极低的下游数据采集成本,快速验证多个新场景。
此外,基于超大规模弹性可扩展算力,AIDC可保障对外运营的AI模型训练大规模算力需求。
作为底层支撑,AIDC运行后主要提供三类业务路线:第一类,向医疗蛋白质折叠、量子科学等AI+Science基础科研提供算力支持;第二类,提供整合能力,帮助企业建设一整套生产工具体系;第三类,提供端到端的智慧化服务。
杨帆称,通过AIDC的支撑,一个算法的生产成本可能下降为过去的1/10,甚至更低。
gpu|亚洲最大!上海“巨无霸”AI计算中心投用,支持万亿参数大模型训练
文章插图
通过直连新型互联网交换中心,AIDC不仅能够为客户提供就近接入服务,解决跨网访问等难题,还可以提高企业间信息交互效率、降低传输成本,提升传输质量和稳定性,实现多点、多用户的快速网间互联。
据悉,在正式建成前,商汤已有潜在的客户和合作伙伴在AIDC上进行了一些试运行。春节后,AIDC将进入正式使用状态。
比如商汤在上海做的一网统管,为上海政府的公共服务提供了涉及垃圾满溢、井盖丢失、灯箱损坏、自行车乱停乱放、违章占道等各种城市服务管理的约上百种AI算法应用,这些算法的迭代生产,依赖的即是AIDC这样的基础设施。