稀疏专家大语言模型架构
收藏
已收藏
产品详情
DeepSeek的核心技术创新在于采用Mixture of Experts (MoE)架构实现大语言模型的稀疏激活机制,通过专有路由算法动态选择和激活少量相关专家模型处理输入,显著降低计算资源消耗。该技术优化了模型扩展性和推理效率,支持大规模并行训练和高效推理,同时保持高精度。创新点包括精细化的专家路由策略和低开销激活机制,与传统密集模型相比,在资源有限环境下实现高性能部署。
融资次数
1
公司简介
深度求索(DeepSeek)成立于2023年,是由中国知名量化投资机构幻方量化孵化的人工智能研究机构,总部位于杭州。作为通用人工智能(AGI)领域的先锋探索者,公司致力于突破AI技术的认知边界,以“让机器像人类一样思考”为核心理念,专注于大语言模型与多模态技术的底层创新。创始团队由量化专家梁文锋领衔,集结了来自浙江大学、清华大学等顶尖高校的科研人才,以及具备Google Brain、微软亚洲研究院等国际机构经验的技术专家。团队规模不足200人,却创造了多项行业标杆成果,展现出极强的工程化落地能力。
经营范围
一般项目:工程和技术研究和试验发展;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;计算机系统服务;信息系统集成服务;人工智能应用软件开发;信息技术咨询服务;电子产品销售;通讯设备销售;仪器仪表销售;数据处理服务;互联网数据服务;计算机软硬件及辅助设备零售;人工智能硬件销售;专业设计服务(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)。
主营业务
研发并开源大语言模型及多模态AI系统,推动通用人工智能底层技术突破和应用落地。
杭州深度求索人工智能基础技术研究有限公司
其他有限责任公司
¥1,000万
2023-07-17
裴湉
0571-85377238
service@deepseek.com
浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室