DeepSeek - 公司详情 - 产品&解决方案

稀疏专家大语言模型架构

已收藏

产品详情

DeepSeek的核心技术创新在于采用Mixture of Experts (MoE)架构实现大语言模型的稀疏激活机制，通过专有路由算法动态选择和激活少量相关专家模型处理输入，显著降低计算资源消耗。该技术优化了模型扩展性和推理效率，支持大规模并行训练和高效推理，同时保持高精度。创新点包括精细化的专家路由策略和低开销激活机制，与传统密集模型相比，在资源有限环境下实现高性能部署。

新一代信息技术人工智能

融资次数

公司简介

深度求索（DeepSeek）成立于2023年，是由中国知名量化投资机构幻方量化孵化的人工智能研究机构，总部位于杭州。作为通用人工智能（AGI）领域的先锋探索者，公司致力于突破AI技术的认知边界，以“让机器像人类一样思考”为核心理念，专注于大语言模型与多模态技术的底层创新。创始团队由量化专家梁文锋领衔，集结了来自浙江大学、清华大学等顶尖高校的科研人才，以及具备Google Brain、微软亚洲研究院等国际机构经验的技术专家。团队规模不足200人，却创造了多项行业标杆成果，展现出极强的工程化落地能力。

经营范围

一般项目：工程和技术研究和试验发展；技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广；软件开发；计算机系统服务；信息系统集成服务；人工智能应用软件开发；信息技术咨询服务；电子产品销售；通讯设备销售；仪器仪表销售；数据处理服务；互联网数据服务；计算机软硬件及辅助设备零售；人工智能硬件销售；专业设计服务(除依法须经批准的项目外，凭营业执照依法自主开展经营活动)。

主营业务

研发并开源大语言模型及多模态AI系统，推动通用人工智能底层技术突破和应用落地。

公司全称

杭州深度求索人工智能基础技术研究有限公司

公司类型

其他有限责任公司

注册资本

￥1,000万

成立时间

2023-07-17

法定代表人

裴湉

电话

0571-85377238

邮箱

service@deepseek.com

网址

https://deepseek-zh.com/

地址

浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室