「刹那®」TPU AI 芯片

中昊芯英

集成电路设计制造商

+关注

已关注

已点赞

已收藏

中昊芯英推出的「刹那®」TPU 架构高性能 AI 专用算力芯片，拥有完全自主可控的 IP 核、全自研指令集与计算平台。该芯片采用专为 AI/ML 而生的 TPU 芯片架构，在 AI 大模型计算场景中，算力性能超越海外著名 GPU 产品近 1.5 倍，能耗降低 30%。同时，通过采用 Chiplet 技术与 2.5D 封装，实现了同等制程工艺下的性能跃升，并支持 1024 片芯片片间互联，实现千卡集群线性扩容，支撑超千亿参数大模型运算需求。

微信图片_20251128170610.png

中昊芯英「刹那®」TPU AI 芯片适配的百度开源的 ERNIE-4.5-VL-28B-A3B 模型（以下简称 ERNIE-4.5-VL）是百度文心开源大模型 ERNIE-4.5 系列中的一款多模态 MoE 大模型，于 2025 年 6 月 30 日随文心 4.5 系列一同开源。该模型总参数量为 28B，激活参数量为 3B，采用异构混合专家架构（MoE），在跨模态理解与生成、长文本处理等领域表现卓越，适用于智能导览、视觉客服等多种场景。

文心 4.5 系列模型均基于飞桨深度学习框架进行高效训练、推理和部署，在大语言模型的预训练中，模型 FLOPs 利用率（MFU）达到 47%。实验结果显示，该系列模型在多个文本和多模态基准测试中达到 SOTA 水平，在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。

在此次的技术适配方面，中昊芯英凭借「刹那®」TPU AI 芯片强大的并行处理能力，与 ERNIE-4.5-VL 的架构设计实现了深度融合。芯片的可重构多级存储、近存运算设计以及流水线式的时空映射，有效提升了大模型计算速度和精度，为模型在复杂任务中的运行提供了高效支持。同时，针对 ERNIE-4.5-VL 的多模态特性，「刹那®」TPU 芯片在处理视觉、文本等多模态数据时，展现出了出色的兼容性和运算性能。