无限光年
关注
已关注
产品&解决方案
DeepSeek-V2是无限光年公司于2024年发布的开源大型语言模型,参数规模达2360亿(236B),是目前其旗舰产品。采用混合专家架构(Mixture of Experts,MoE),支持大规模并行推理和高效计算。模型性能在多领域基准(如MMLU、数学问题)上超越GPT-4等模型,强调成本效率(能耗降低约50%)和高精度文本生成。提供预训练模型、推理API(通过官方平台访问)及企业级解决方案,适用于复杂对话系统、内容创作和研究用途。模型代码在GitHub开源,支持中英文语言处理。
DeepSeek-Coder是无限光年公司针对编程和代码生成任务优化的开源大型语言模型。该模型于2023年发布,参数规模为67亿(或根据版本有6.7B/33B等变体),支持Python、Java、C++等多种编程语言。其核心功能包括代码自动补全、错误修复、代码转换及文档生成。模型在公开数据集(如HumanEval)上取得高分,强调高性能和低延迟推理,提供预训练权重和微调指南,可集成到IDE工具或AI驱动开发平台中。
DeepSeek-7B是无限光年公司于2023年发布的开源大型语言模型,参数规模为70亿(7B)。该模型基于Transformer架构,支持中英文等多种语言处理,在自然语言任务如文本生成、问答、摘要和翻译中表现优异。具体特点包括:推理高效、开源代码在GitHub提供免费下载,可在多种硬件环境部署。基于公开基准测试(如MMLU和GSM8K),DeepSeek-7B在同等规模模型中领先,适合开发者和研究者在AI应用中集成和使用。
融资次数
2
专利数量
-1
公司简介
无限光年(上海)技术有限公司成立于2022年5月,是在通用人工智能时代围绕大模型全栈,展开技术研发和产品创新的人工智能公司。致力于打造AI-Native的创新技术和专业产品,为用户提供卓越的服务。无限光年的团队由来自阿里、蚂蚁、微软、字节、腾讯、甲骨文等知名科技公司的技术及行业专家组成,均毕业于MIT、Cornell、Berkeley、UCSD、UMICH、UCL、NUS、清华、北大、复旦、交大等国内外知名高校,硕博占比70%+。
经营范围
一般项目:软件开发;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;信息技术咨询服务;人工智能应用软件开发;人工智能行业应用系统集成服务;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能公共数据平台;人工智能通用应用系统;人工智能基础资源与技术平台;人工智能公共服务平台技术咨询服务
主营业务
专注于大模型驱动的人工智能技术研发与产品创新,开发和部署AI-Native解决方案,以提供卓越的用户体验和企业级服务。
公司全称
无限光年(上海)技术有限公司
公司类型
有限责任公司(港澳台法人独资)
注册资本
$9,000万
成立时间
2022-05-29
法定代表人
陆梦雪
电话
021-61675108
邮箱
bd@inftech.ai
地址
上海市浦东新区张衡路666弄1号楼703