基于人类反馈的强化学习(RLHF)微调
该技术通过整合人类反馈进行模型微调,创新点包括高效偏好奖励模型设计和安全约束算法,确保生成内容的可靠性和伦理合规性。
大规模Transformer模型预训练
智象未来采用基于Transformer架构的大模型预训练技术,创新地结合高效分布式训练框架和动态tokenization方法,优化中文语料的处理能力,支持长序列上下文理解。
融资次数
1
专利数量
8
经营范围
一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;数据处理服务;软件开发;信息技术咨询服务;数字技术服务;社会经济咨询服务;广告设计、代理;广告制作;广告发布;电子产品销售;机械设备销售;计算机软硬件及辅助设备批发;家用电器销售;仪器仪表销售;文具用品批发;体育用品及器材批发;厨具卫具及日用杂品批发;计算机系统服务;机械设备租赁。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
主营业务
开发通用人工智能大模型并提供相关技术服务和解决方案