IC China2025 | GPNPU架构创新,引领AI算力基建2.0时代
2025年11月23日,第二十二届中国国际半导体博览会(IC China 2025)在北京国家会议中心启幕。在24日举办的 “人工智能及大模型芯片论坛” 上,云天励飞智算研究院副院长沈宇亮发表主题演讲,深度解析大模型时代推理算力变革趋势,分享以 GPNPU 创新架构为核心的全场景产品布局。
时代变局:推理需求爆发,国产芯片迎战略机遇
从AlexNet 开启深度学习,到 ChatGPT 引爆大模型革命,AI 已从感知智能迈入认知智能,成为第四次工业革命核心驱动力。中国凭借数据规模、场景开放与工程化创新三重优势,正紧跟全球技术前沿,在AI赛道形成独特竞争力。
2025年作为“AI Agent 落地元年”,大模型迭代周期压缩至周甚至小时级,国内外主流模型密集升级,开源低成本模型推动 AI 推理规模化发展,Token 消耗量指数级增长,算力需求重心从训练全面转向推理。沈宇亮指出,AI 基础设施已进入以“高效推理”为核心诉求的算力基建2.0 时代,叠加海外高端 GPU 供应受限与 “人工智能 +” 政策支持,国产推理芯片迎来前所未有的机遇。
技术破局:GPNPU架构实现“百万 Token”极致性价比
针对云端推理的性能、成本、精度挑战,云天励飞创新提出GPNPU(General-Purpose Neural Processing Unit)架构,核心路径是融合 GPU 通用性与 NPU 高能效。以 “算力积木” 设计和 3D 堆叠存储为核心创新,聚焦提升 “资本开支 Token 转化率” 与 “运营开支 Token 转化率”,通过全栈协同优化,为大模型组合应用与复合智能体部署提供核心算力支撑,实现 “百万 Token 的极致性价比”。
全场景布局:赋能AI 规模化落地
架构创新是国产芯片差异化突破的关键。深耕AI芯片十余年的云天励飞,已商用四代 NPU 架构芯片,构建起覆盖云边端全场景的推理芯片矩阵:面向云端大算力推理的“深穹”系列,为互联网大厂与企业级用户提供国产算力支撑;面向边缘计算的“深界”系列,已应用于家庭计算主机等产品开发;面向具身智能的“深擎”系列,服务新兴智能机器人领域。
正在研发的NOVA 500系列将全面升级 GPNPU 架构,通过3D堆叠存储与软硬协同设计,实现生态兼容性、性能与能效三重提升;NOVA 600系列将探索光电一体化互联,构建高性价比算力网络,力争将每百万 Token 推理成本降低百倍以上,降至分级成本水平。
未来,云天励飞将持续深耕GPNPU 架构迭代与产品创新,聚焦推理算力的性能突破与成本优化,携手产业链伙伴深化生态合作,构建覆盖“架构-芯片-方案-应用”的高效 AI 推理生态,助力中国在第四次工业革命中抢占全球 AI 算力制高点。