文本到语音模型
音频合成模型,结合Tacotron或WaveNet结构,实现文本转自然语音输出。模型可能采用端到端流式处理,集成情感韵律控制模块,创新点包括多说话人语音个性化技术,以及通过迁移学习优化小规模语音数据训练,确保低资源消耗下的高保真语音生成。核心是情感语音渲染,模仿人类语调以增强沉浸体验。
文本到视觉模型
多模态视觉生成模型,基于Diffusion架构或类似技术,将文本描述转化为高质量图像。模型集成文本编码器和图像解码器,通过自注意机制对齐跨模态语义,创新点包括动态参数共享机制以提升文本-图像对齐精度,以及轻量级设计适应移动端部署。在训练中可能使用大规模中文数据集增强本地化内容生成,提高细节处理能力。
文本到文本模型
基于Transformer架构的文本到文本生成大模型,专注于上下文理解、对话控制以及情感融入的生成能力。支持序列到序列任务,包括问答、聊天和文本总结,模型可能采用类似BERT的双向编码-解码结构,并在训练中融入情感建模以优化人类反馈强化学习(RLHF)。创新点在于通过低成本微调实现高度情感化输出,区别于传统百科全书式模型,适用于社交互动场景。
融资次数
4
专利数量
3
经营范围
一般项目:计算机系统服务;信息系统集成服务;信息系统运行维护服务;人工智能基础软件开发;人工智能应用软件开发;计算机软硬件及辅助设备批发;计算机软硬件及辅助设备零售;通讯设备销售;通信设备销售;互联网数据服务(增值电信除外);数据处理和存储支持服务;互联网安全服务;互联网销售(除销售需要许可的商品);企业管理咨询;信息咨询服务(不含许可类信息咨询服务)。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)
主营业务
MiniMax的主营业务是开发和运营基于多模态大型语言模型的AI产品与服务,包括面向消费者的情感社交应用和面向企业的模型API接口解决方案。
名之梦(上海)科技有限公司
有限责任公司(港澳台法人独资)
$2,000万
2021-11-03
魏伟
021-60702590
leana@minimax-ai.com
上海市徐汇区虹漕路25-1号2层896室