无问芯穹
未融资
技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广
关注
已关注
模型轻量化与压缩
无问芯穹开发了一套先进的模型压缩技术,主要采用知识蒸馏(Knowledge Distillation)和动态量化(Dynamic Quantization)方法。该技术通过对大模型进行有监督的模型蒸馏训练,生成轻量级版本,并结合动态精度调整机制,依据输入数据特征实时优化比特精度(如从FP32到INT8)。创新点在于场景自适应压缩策略,根据应用负载动态平衡速度和精度,提升在异构硬件上的通用性。
大模型推理优化技术
无问芯穹专注于基于混合专家(Mixture of Experts, MoE)架构的大规模语言模型推理优化技术。该技术通过动态路径选择机制(Dynamic Path Selection)对模型进行轻量化处理,结合硬件感知(Hardware-aware)的量化压缩算法,在不损失模型精度的前提下显著降低计算开销和延迟。创新点包括自适应专家激活策略,根据输入上下文智能调度子模块资源,以及端到端的推理加速框架,实现模型在资源受限环境中的高效运行。
员工数量
-
经营范围
一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;软件销售;软件外包服务;人工智能理论与算法软件开发;信息系统集成服务;信息技术咨询服务;信息系统运行维护服务;计算机软硬件及辅助设备批发;数据处理服务;人工智能基础软件开发;人工智能应用软件开发;计算机系统服务;计算机软硬件及辅助设备零售;专业设计服务;社会经济咨询服务;互联网数据服务。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
主营业务
人工智能软件开发及相关技术服务,包括算法设计、应用开发和数据处理等核心内容。
公司全称
北京无问芯穹科技有限公司
公司类型
有限责任公司(法人独资)
成立时间
2023-05-08
法定代表人
夏立雪
邮箱
wangxichun@infini-ai.com
地址
北京市海淀区中关村东路8号东升大厦AB座群楼三层SA301、302、303、304、321、322、323、324、325单元