水木分子
关注
已关注
产品&解决方案
该技术基于统一的多模态大模型框架,整合生物医药领域的文本文献、分子结构数据(如SMILES表示)、蛋白质序列、基因测序数据和知识图谱。创新点在于通过特定的嵌入方法将这些异构数据压缩到Transformer神经网络中,实现跨模态联合学习,而无需任务特定的调整。模型通过端到端训练,使生物医药知识在单一框架内高度融合,提升任务的泛化性和预测精度。
基于基础模型能力开展垂直领域应用开发。具体包括:分子性质与药物敏感性预测、药物-靶点亲和力智能评估、分子结构-文本信息跨模态检索与生成等专业场景解决方案。核心技术已通过实验验证在多项生物医药研发任务中超越传统单一功能模型,提供端到端的AI辅助研发能力。
专注于构建面向生物医药行业的统一多模态大模型技术底座。通过整合文献、分子结构、蛋白质数据、基因测序、知识图谱等跨领域数据,研发具备融会贯通能力的基础模型框架。该技术框架已在BioMedGPT系列开源模型中实现技术验证,重点突破跨模态数据压缩与联合表征等核心问题。
水木分子基于AIR聂再清教授团队开源的BioMedGPT1.6B模型,构建用于生物医药领域的统一多模态大模型框架。该解决方案通过整合文献、分子结构、蛋白质序列、基因测序数据和知识图谱等异构数据源,使模型具备跨模态融合能力。核心功能包括分子性质预测、药物-靶点亲和力预测、药物敏感性预测、分子-文本跨模态检索和分子-文本跨模态信息生成,已在研究层面验证其任务性能优于传统单一专用模型。
这是一款由AIR(清华大学智能产业研究院)聂再清教授团队于2023年4月开源的轻量级科研大模型,专为生物医药领域设计。该模型将文献、分子、蛋白、测序数据和知识图谱集成到统一的多模态框架中,显著提升了模型在多种任务中的表现。具体功能包括:分子性质预测(如预测化合物的稳定性或毒性)、药物-靶点亲和力预测(评估药物与靶点结合强度)、药物敏感性预测(分析药物对不同病理状态的反应)、分子-文本跨模态检索(基于关键词查询相关分子数据)和分子-文本跨模态信息生成(自动生成分子描述或报告)。实验证明,该模型在这些任务上的性能优于传统的单一专用模型,尤其在研究层面验证了多模态数据融合的技术可行性。目前,它作为一款开源工具,可供学术界和科研人员免费用于实验性研究,但尚未大规模商业化部署。
融资次数
2
员工数量
-
专利数量
1
公司简介
水木分子专注于生物医药垂直行业大模型的研发与应用。AIR聂再清教授团队于今年4月开源了轻量科研版BioMedGPT1.6B,从研究层面验证了将文献、分子、蛋白、测序、知识图谱等数据压缩到统一的多模态大模型框架内,可使模型具备“融会贯通”的能力,在分子性质预测、药物-靶点亲和力预测、性质预测、药物敏感性预测、分子-文本跨模态检索、分子-文本跨模态信息生成等多项任务上优于单一专用模型,从研究层面验证了技术可行性。水木分子将与AIR研发团队合作构建行业可用的基础模型底座。
经营范围
一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;人工智能理论与算法软件开发;人工智能应用软件开发;医学研究和试验发展;自然科学研究和试验发展;科技中介服务;工程和技术研究和试验发展;专用化学产品制造(不含危险化学品);生物基材料技术研发;第一类医疗器械销售;技术进出口;货物进出口。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
主营业务
生物医药垂直领域大模型的基础技术研发与行业应用解决方案
公司全称
北京水木分子生物科技有限公司
公司类型
有限责任公司(自然人投资或控股)
注册资本
¥118万
成立时间
2023-06-02
法定代表人
胡瑞豪
电话
17701038593
地址
北京市海淀区中关村南大街乙12号院1号楼3层3-037