墨芯发布32倍稀疏AI计算卡，性能对标英伟达 | 甲子首发( 二 ) 搭载墨芯首款芯片ANTOUM

在可持续性方面，王维觉得，随着AI模型参数越来越大，算力增长得越来越快，模型的稀疏性也将越高，未来的模型可以稀疏50倍甚至100倍。
在可商业化方面，墨芯做了更多前置思考。
2.降低算力TCO ，做面向应用的AI计算卡

文章图片
随着AI芯片赛道的逐渐成熟，除了技术与产品性能方面的竞争， “商业化落地”方面的考量变得愈发重要。
具体来说，墨芯希望通过降低客户的TCO（单位算力的硬件拥有成本），让客户更愿意使用。 TCO主要可以分为两个方面，包括硬件购买成本和使用的能耗成本。
互联网及科技企业对于数据中心的需求非常大，大型的互联网公司每年在数据中心建设方面的投入能够达到数十亿的规模。由于墨芯的计算卡拥有目前GPU的5~10倍的等效算力，在单卡价格相当的情况下，可以大幅降低客户整体的采购成本。
除此之外，客户的使用和迁移成本也较低。墨芯开发的编译器已适配其计算卡，支持通用的AI开发平台TensorFlow、PyTorch或MXNet等。在具体的应用，墨芯软件栈MoffettNNKit中特有的MoffettNNCompressor为客户模型提供4-32倍稀疏化压缩能力，客户依旧可以在熟悉的TensorFlow或PyTorch环境里进行开发，方便迁移与交付。
在使用成本方面，墨芯更关注能效比。王维介绍，相较于市场旗舰产品， S-100运行ResNet50时，每FPS的能效TCO可以降低6倍；运行BERT时，每SPS的能效TCO可以降低10倍，可以有效地降低能耗。

文章图片
更进一步，在面向业务的使用方面，由于客户能够便捷地使用墨芯的编译器，同时稀疏化算法又具有通用性，在具体场景下，客户往往只需要改几行代码，就能适配新的计算卡，完成优化。
目前，墨芯的主要客户面向数据中心AI推理应用，在互联网、运营商、安防、生物制药和FinTech等场景下已有了具体的实践。
对于互联网客户来说，墨芯高性能芯片能够帮助客户提高内容推荐精准度、广告投放精准度。普通消费者在日常生活中经常需要AI芯片提供算力，高性能的芯片能够让社交媒体更懂你心、更精准推荐；在线翻译场景中，墨芯高性能芯片可以让翻译更实时更精准。
【墨芯发布32倍稀疏AI计算卡，性能对标英伟达 | 甲子首发】在三年多的发展过程中，墨芯受到了产业资本和财务资本的共同助力。王维告诉「甲子光年」， “产业资本、财务资本的助力，帮助墨芯产品能更好地落地。但同时，一家科技企业，核心还是将技术创新转化为生产力，水到自然渠成。 ”王维相信，稀疏化计算将为墨芯带来无限的发展空间和机遇。