袁进辉:AI Infra 的演进与产业机遇
近日,在华兴资本主办的 2025 进博会上海会议活动“人工智能赋能产业发展论坛”上,硅基流动创始人袁进辉围绕“AI Infra 的演进与产业机遇”进行了深度分享。
他指出,AI Infra 并不是传统意义上的软件行业,也不仅是算力硬件的附庸,它是支撑智能经济时代的基础设施,真正的长期价值来自于连接硬件供给与应用需求之间的“技术鸿沟”。
以下为袁进辉的演讲内容,经编辑(有删减):
1. 人工智能产业链的发展趋势
过去两年,人工智能在模型、算力需求与算力供给三条主线上均经历了明显演进。
在模型侧,头部模型能力仍在提升,但增速已从早期的跃迁式变化趋向稳定。2023—2024 年的闭源模型呈现一骑绝尘之势,而 2025 年开始,开源体系呈现出快速追赶的态势,尤其是由中国团队主导的若干开源模型,已在部分任务中逼近甚至局部超越闭源模型。
今年年初 DeepSeek 的突破被视为开源生态信心明显增强的拐点,而近期发布的 Kimi K2 Thinking 模型进一步显示,开源模型在推理与规划等复杂任务上具备与闭源体系直接对标的实力。开源模型的成熟意味着底层模型趋于多样化,企业的部署路径不再单一,同时也对 AI Infra 的适配能力提出更高要求。
在算力需求侧,每一次模型能力的提升都解锁了新的应用品类。过去一年间,从语言生成到知识整合,再到具备推理、规划与工具调用能力的 Agent,大模型真正从“理解语言”走向“执行任务”。这样的能力扩展带来真实使用量的快速增长。据行业公开信息,全球多家 AI 云服务商的 Token 调用量在一年内增长了数十倍。随着应用进入早期爆发期,推理成本与效率成为企业竞争的核心变量,也使得算力供给侧的变化更加关键。
在算力供给侧,英伟达依旧在全球范围内保持绝对优势,但中国由于产业链安全要求与地缘环境的影响,正在形成一套独特的发展路径。
过去几年,国产芯片厂商在架构设计能力上已经达到国际领先水平,未来,一方面是解决芯片生产制造的问题,另一方面在于如何让多元算力实现“可用、可调度、可规模化”。参与算力建设的主体也呈现“多元并举”的态势,从互联网大厂扩展到国资、地方政府与民营资本,但这些算力主要以裸金属形态面向市场,这是中国AI Infra 创业公司能够创造独特价值的地方。
2. AI Infra 的发展机遇
AI Infra 的机会来自于行业面临的三大需求:更方便地使用模型、让国产芯片更加好用,以及更灵活地算力调度。
首先,在模型部署层面,越来越多企业在完成验证后选择从闭源模型转向开源模型,后者成本更可控、数据更安全、部署更加灵活。但开源模型“能跑”并不等于“跑得好”,从推理速度、上下文长度、并发能力,到数百上千个超参数的优化,再到大规模使用时的成本控制,这一系列环节都对工程能力提出极高要求。对于大量企业而言,自行优化模型并不现实,这使得模型部署优化成为清晰的创业机会。
其次,在国产芯片方面,许多讨论常聚焦于硬件性能及制造工艺瓶颈,但真正的短板往往来自软件生态。英伟达的成功不仅仅是因为芯片本身,而是其长期构建的系统级软件优势。国产芯片的编译器、推理引擎、驱动适配等底层软件生态仍不完整,这大大降低了国产 GPU 的可用性,也使得企业在实际生产环境中面临兼容性、稳定性及成本的压力。正因此,基础软件公司在这一环节拥有不可替代的价值空间。
最后,算力需求正在从“训练”向“推理”转移。推理处理 Token 的数量远远高于训练处理的 Token 数量,因此,模型训练阶段的算力需求像一个有边界的“水池”,而推理阶段随着真实应用的扩大,更像是一条没有上限的“河流”。
OpenAI 在近期提到其日均推理 Token 已达百万亿量级,这意味着未来算力消耗的大头将来自推理而非训练。由于这种迁移,算力从过去服务少数大模型公司,变成要服务海量企业与开发者,需求高度波动、多样化,而算力销售也将从“整租”走向“零售”,需要支持多租户、弹性扩缩容与异构调度能力。这类基础能力也正在催生新的 AI Infra 创业公司。
无论从芯片、算力还是模型看,硬件供给与应用需求两端存在一条明显的“鸿沟”。在中国,这条鸿沟更复杂:国产芯片仍在追赶,虽然算力快速铺开,但要真正变成能稳定、弹性、规模化提供服务的能力,还需要中间层的软件基础设施来打通。谁能在这一环节构建能力,谁就掌握了极为稀缺的产业价值。
3. 硅基流动的发展与目标
硅基流动正是围绕这条“鸿沟”展开。我们已经构建了由下至上的四层能力体系:底层是国产芯片优化,通过高性能推理引擎提升国产 GPU 的可用性;其上是 FaaS 异构算力纳管,统一管理和调度不同架构的算力资源;第三层是 MaaS 模型平台,提供开箱即用的模型服务;最上层是开发者工具链,为模型微调、应用构建与工作流提供工具化支持。其中,国产芯片优化与 MaaS 体系已在国内开发者生态和产业链中形成显著影响。
硅基流动的 MaaS 平台通过集成国内外主流开源模型,为开发者提供便捷的调用入口。平台注册用户超过 800 万,每天有数十万开发者或企业用户活跃使用平台服务。在第三方工具链 Dify 的公开数据中,硅基流动的使用量长期位居前列,成为国内最活跃的开源模型服务平台之一。
硅基流动在国产算力优化方面也取得一系列重要进展,包括在华为昇腾 910B 及其最新超节点平台上实现领先的推理性能,并与沐曦、摩尔线程等国产 GPU 厂商形成深度合作,持续推动国产芯片在真实推理场景中的规模化落地。
我认为,AI 基础设施的长期价值来自把算力、模型、开发者与应用真正连接起来。目前,在 AI 底层投入已达如此规模的背景下,即便 AI 基础软件公司只创造整个链路 10% 的新增价值,市场空间都极其可观。中国的 AI 产业正在迎来关键发展节点,谁能够跨越这条“鸿沟”,谁就能在未来产业版图中占据核心位置。
近期更新
扫码加入用户交流群