联系我们
回到顶部
「刹那®」TPU AI 芯片
中昊芯英
集成电路设计制造商
+关注
已关注
已点赞
点赞
转发
已收藏
收藏

中昊芯英推出的「刹那®」TPU 架构高性能 AI 专用算力芯片,拥有完全自主可控的 IP 核、全自研指令集与计算平台。该芯片采用专为 AI/ML 而生的 TPU 芯片架构,在 AI 大模型计算场景中,算力性能超越海外著名 GPU 产品近 1.5 倍,能耗降低 30%。同时,通过采用 Chiplet 技术与 2.5D 封装,实现了同等制程工艺下的性能跃升,并支持 1024 片芯片片间互联,实现千卡集群线性扩容,支撑超千亿参数大模型运算需求。

微信图片_20251128170610.png

中昊芯英「刹那®」TPU AI 芯片适配的百度开源的 ERNIE-4.5-VL-28B-A3B 模型(以下简称 ERNIE-4.5-VL) 是百度文心开源大模型 ERNIE-4.5 系列中的一款多模态 MoE 大模型,于 2025 年 6 月 30 日随文心 4.5 系列一同开源。该模型总参数量为 28B,激活参数量为 3B,采用异构混合专家架构(MoE),在跨模态理解与生成、长文本处理等领域表现卓越,适用于智能导览、视觉客服等多种场景。

文心 4.5 系列模型均基于飞桨深度学习框架进行高效训练、推理和部署,在大语言模型的预训练中,模型 FLOPs 利用率(MFU)达到 47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到 SOTA 水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。

在此次的技术适配方面,中昊芯英凭借「刹那®」TPU AI 芯片强大的并行处理能力,与 ERNIE-4.5-VL 的架构设计实现了深度融合。芯片的可重构多级存储、近存运算设计以及流水线式的时空映射,有效提升了大模型计算速度和精度,为模型在复杂任务中的运行提供了高效支持。同时,针对 ERNIE-4.5-VL 的多模态特性,「刹那®」TPU 芯片在处理视觉、文本等多模态数据时,展现出了出色的兼容性和运算性能。

image.png

推荐
来自中昊芯英