芯片级高效协同液冷散热系统
为应对服务器高度集成且需严格控制功耗,采用直接接触芯片Die或热源的高效液冷方案。设计精准的微流道散热器置于CPU/GPU/加速芯片等核心热源上,通过低导热损耗、高流量的冷却液直接带走芯片热量。系统集成功耗/散热控制算法,动态调节泵速和流量,确保散热效率与能耗最优匹配。
稀疏计算与动态精度调度
深度优化支持模型固有的稀疏性(如Pruned/Quantized模型激活稀疏、权重稀疏)。硬件层面设计高效处理稀疏张量操作的专用单元和指令集。运行时系统动态监测输入数据和模型激活的稀疏度,结合任务要求,自适应地在不同精度的运算模式(如FP8, INT8, INT4, Binary)间切换,以最小化计算量和能耗。
参数动态分层卸载技术
系统根据实时负载、模型结构特征(如注意力机制、MoE结构)以及硬件资源状态,动态决策将模型的部分层或专家网络卸载到相邻节点或专用加速单元执行。结合高性能、低延迟的互连技术(如NVLink, CXL),实现层间/专家间高效协同计算,避免单一节点处理全量参数。
存算一体加速器 (Processing-in-Memory Accelerator)
针对大模型参数巨大导致内存墙问题,采用近内存计算或存内计算技术。将特定计算操作(如向量矩阵乘)直接放置在存储单元附近或内部执行,避免频繁在内存和处理单元间搬运海量模型参数,极大缓解内存带宽瓶颈和搬运功耗。
计算型网络架构 (Computational Networking Architecture)
该架构将计算能力深度嵌入网络传输路径,在数据传输过程中就近进行预处理或关键计算操作,而非传统方式将数据全部拉回中央服务器处理。这大幅减少了因数据长距离迁移造成的延迟和功耗,是'算网一体'的核心。通过在交换机或智能网卡层部署轻量化计算单元实现。
经营范围
一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;网络技术服务;软件开发;人工智能基础软件开发;计算机软硬件及辅助设备批发;信息咨询服务(不含许可类信息咨询服务);信息系统集成服务;工业控制计算机及系统销售;计算机系统服务;人工智能行业应用系统集成服务;云计算装备技术服务;人工智能通用应用系统;人工智能硬件销售;计算机软硬件及辅助设备零售;人工智能应用软件开发;信息技术咨询服务;数字技术服务。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
主营业务
提供高效节能的AI服务器解决方案,专注于支持大规模人工智能模型的推理需求。