墨芯发布32倍稀疏AI计算卡,性能对标英伟达 | 甲子首发( 二 )
在可持续性方面 , 王维觉得 , 随着AI模型参数越来越大 , 算力增长得越来越快 , 模型的稀疏性也将越高 , 未来的模型可以稀疏50倍甚至100倍 。
在可商业化方面 , 墨芯做了更多前置思考 。
2.降低算力TCO , 做面向应用的AI计算卡
文章图片
随着AI芯片赛道的逐渐成熟 , 除了技术与产品性能方面的竞争 , “商业化落地”方面的考量变得愈发重要 。
具体来说 , 墨芯希望通过降低客户的TCO(单位算力的硬件拥有成本) , 让客户更愿意使用 。 TCO主要可以分为两个方面 , 包括硬件购买成本和使用的能耗成本 。
互联网及科技企业对于数据中心的需求非常大 , 大型的互联网公司每年在数据中心建设方面的投入能够达到数十亿的规模 。 由于墨芯的计算卡拥有目前GPU的5~10倍的等效算力 , 在单卡价格相当的情况下 , 可以大幅降低客户整体的采购成本 。
除此之外 , 客户的使用和迁移成本也较低 。 墨芯开发的编译器已适配其计算卡 , 支持通用的AI开发平台TensorFlow、PyTorch或MXNet等 。 在具体的应用 , 墨芯软件栈MoffettNNKit中特有的MoffettNNCompressor为客户模型提供4-32倍稀疏化压缩能力 , 客户依旧可以在熟悉的TensorFlow或PyTorch环境里进行开发 , 方便迁移与交付 。
在使用成本方面 , 墨芯更关注能效比 。 王维介绍 , 相较于市场旗舰产品 , S-100运行ResNet50时 , 每FPS的能效TCO可以降低6倍;运行BERT时 , 每SPS的能效TCO可以降低10倍 , 可以有效地降低能耗 。
文章图片
更进一步 , 在面向业务的使用方面 , 由于客户能够便捷地使用墨芯的编译器 , 同时稀疏化算法又具有通用性 , 在具体场景下 , 客户往往只需要改几行代码 , 就能适配新的计算卡 , 完成优化 。
目前 , 墨芯的主要客户面向数据中心AI推理应用 , 在互联网、运营商、安防、生物制药和FinTech等场景下已有了具体的实践 。
对于互联网客户来说 , 墨芯高性能芯片能够帮助客户提高内容推荐精准度、广告投放精准度 。 普通消费者在日常生活中经常需要AI芯片提供算力 , 高性能的芯片能够让社交媒体更懂你心、更精准推荐;在线翻译场景中 , 墨芯高性能芯片可以让翻译更实时更精准 。
【墨芯发布32倍稀疏AI计算卡,性能对标英伟达 | 甲子首发】在三年多的发展过程中 , 墨芯受到了产业资本和财务资本的共同助力 。 王维告诉「甲子光年」 , “产业资本、财务资本的助力 , 帮助墨芯产品能更好地落地 。 但同时 , 一家科技企业 , 核心还是将技术创新转化为生产力 , 水到自然渠成 。 ”王维相信 , 稀疏化计算将为墨芯带来无限的发展空间和机遇 。
- 钉钉|钉钉转向:从要规模到要价值,发布品牌新主张“让进步发生”
- 潜规则|《不懂就问》机圈大乱斗,3月有哪些新手机发布?
- 维信诺|维信诺发布全球首个低频LTPS-TFT低功耗解决方案
- 安卓|UI界面媲美iOS,Android 13正式版官宣,将于5月中旬发布
- realme|1999元的天玑8100旗舰电竞手机?realme真我GT Neo3正式发布
- realme|起售价1999!真我GT Neo3正式发布,这几项参数是真的香
- 红米手机|比Redmi K50还便宜!第二款天玑8100手机发布,1999元起!
- 在今晚的新品发布会上|支持全自动起降!大疆首款机场发布:顶配套装卖14.98万
- 「旗舰射门员」真我 GT Neo3 发布:150W 快充加持,1999 元起
- 索尼在2020年的11月份|性能强1倍!曝索尼PS5 Pro最早明年发布:光追加强