产品&解决方案
墨芯的核心技术是基于动态稀疏化算法的AI计算加速架构,通过软硬协同设计实现自适应稀疏计算。该技术能根据输入数据动态调整神经网络的计算图和稀疏比,实时去除冗余计算操作,支持高达32倍的稀疏化率。创新点在于解决了传统静态稀疏化(如剪枝)的局限性,避免了预定义稀疏规则的需求,实现硬件级别的并行优化,显著提升计算效率。核心创新包括动态数据流管理和低功耗稀疏引擎设计,能在神经网络推理过程中自适应地优化FLOPs(浮点运算量),大幅降低计算复杂度。
墨芯为快手部署了AI加速解决方案,利用稀疏化技术优化其用户行为分析模型和内容推荐算法。在2022年实施后,墨芯芯片通过减少不必要的计算开销,将推荐系统的推理延迟缩短了30%,同时保持高准确率,显著提升了快手的用户体验和平台用户参与度。这一合作在公开报道中被验证为提升了平台处理海量短视频数据的高效性和效率。
墨芯与腾讯云合作,为其云服务平台提供基于稀疏化算法的Antoum AI芯片,专注于优化AI推理任务。在2022年公开的合作中,墨芯芯片被集成到腾讯云的AI推理平台,通过动态稀疏化技术减少计算冗余,在ResNet-50和BERT等标准模型上实现了处理速度提升2倍以上,同时功耗降低50%。这一优化使得腾讯云在图像识别、自然语言处理等服务中提升了实时响应能力,并降低了运营成本。
墨芯的核心解决方案是利用其突破性的动态稀疏化算法(如双稀疏算法)设计的AI加速芯片及配套软件栈。该方案通过在芯片硬件层面原生支持细粒度的权值激活稀疏性,在保证模型精度的前提下,显著减少实际计算量和内存访问,从而大幅提升AI推理任务(尤其是Transformer类大模型)的计算效率和能效比。其代表性产品如Antoum™芯片,即采用了此稀疏化架构。
墨芯推出的ANTUM系列是其核心AI芯片产品,基于公司自研的稀疏化算法架构(Sparsity Architecture)。该芯片专为云端和边缘计算场景设计,主打AI推理优化,支持主流AI模型如大型语言模型(LLMs)和视觉模型。技术特点包括:采用INT8和FP16精度模式,计算密度比传统GPU提升10倍以上,能耗降低50%,同时减少计算冗余;支持高吞吐量和低延迟运行,适用于数据中心部署、服务器加速、自动驾驶和IoT设备等应用。产品线包括ANTUM X系列(如ANTUM X40),支持多框架部署包括TensorFlow和PyTorch,提供SDK工具链以简化模型迁移。
融资次数
7
员工数量
50-99人
专利数量
3
公司简介
墨芯是一家致力于颠覆式创新的AI芯片设计商,采用领先于世界的稀疏化算法,旨在打造世界下一代人工智能芯片,成为AI芯片2.0时代的全球领跑者。2018年,墨芯人工智能在硅谷创立,目前总部位于深圳。创始团队来自于卡内基梅隆大学顶尖AI科学家、世界顶尖半导体公司 (如Intel、Marvell和Oracle等) 核心高量产芯片研发团队。
经营范围
一般经营项目是:人工智能芯片的设计、开发、应用和销售;人工智能技术的开发、应用及销售;可编程门阵列芯片的设计、开发、应用及销售;专用集成电路和系统集成芯片的设计、开发、应用和销售;人工智能技术在云端和边端产品的应用、开发和销售;人工智能软件服务;提供以算法、软件、模块、设备和系统相结合的全方位人工智能解决方案;进出口及相关配套业务。,许可经营项目是:
主营业务
AI芯片设计
墨芯人工智能科技(深圳)有限公司
有限责任公司(港澳台投资、非独资)
¥4,364万
2018-08-10
王维
0755-86700313
ranran.wei@moffett.ai
深圳市南山区粤海街道高新区社区高新南九道55号微软科通大厦24D