智能向善,瑞莱智慧入选《人工智能治理案例集》

发布者:瑞莱智慧
时间:2025-11-17
收藏
已收藏


日前,由北京前瞻人工智能安全与治理研究院主办、北京人工智能产业联盟协办的“2025国际前瞻人工智能安全与治理大会”在京召开。

瑞莱智慧RealAI受邀深度参与大会,加入“北京市通用人工智能产业创新伙伴计划安全与治理能力建设网络”,联合发布《人工智能模型安全评估与产业实践报告》,并入选《北京人工智能治理案例集》。


大会现场

大会邀请国内外学者与产业专家聚焦并共议人工智能安全与治理的前沿议题,分享前瞻性认知与实践经验,促进AI安全与治理领域的联合研究、产业实践与治理的国际合作,共同防范人工智能潜在风险,促进稳健发展。


为全面落实《北京市通用人工智能产业创新伙伴计划2.0》,持续增强伙伴计划2.0的人工智能安全治理能力,北京前瞻人工智能安全与治理研究院在北京市经济和信息化局的指导下,联合北京人工智能产业联盟、瑞莱智慧、360、奇安信、阿里巴巴、国科智安、芯盾时代等机构和企业,发起并启动“北京市通用人工智能产业创新伙伴计划安全与治理能力建设网络”,该网络将汇聚各方创新主体的力量,形成开放协同的安全治理生态,护航产业行稳致远。


北京市通用人工智能产业创新伙伴计划

安全与治理能力建设网络启动

 

圆桌论坛环节,来自西蒙长期治理研究所、北京大学、中国信通院、瑞莱智慧及奇安信等产学研界的专家,围绕人工智能安全与治理的产业实践进行交流探讨。


圆桌论坛

 

会上,前瞻研究院联合瑞莱智慧等多家单位发布《人工智能模型安全评估与产业实践报告》,系统总结了2025年度人工智能模型安全评估的阶段性成果。



此外,北京人工智能产业联盟还牵头发布了《北京人工智能治理案例集》并为典型案例单位颁奖,瑞莱智慧的“人工智能及大模型的安全评估和防护问题的应用案例”,凭借过硬的技术实力与深入的治理实践入选。


《北京人工智能治理案例集》 


案例集旨在广泛凝聚人工智能治理的社会智慧,分享人工智能治理的实践成果,促进人工智能技术创新真正服务于人的全面发展和社会共同进步,共同护航首都人工智能产业行稳致远,也为全国AI治理体系建设贡献力量。


以下为案例详情:

瑞莱智慧 RealAI

人工智能及大模型的安全评估和防护问题的

应用案例

1

案例背景

生成式人工智能的快速发展在带来机遇的同时,也引发了模型安全、价值对齐、内容风险等新型挑战,威胁产业可持续发展。为应对这些挑战,促进 AI 产业健康治理,响应北京人工智能产业联盟征集,特提交本案例。案例聚焦人工智能及大模型特有的安全风险(如对抗攻击、价值偏见、内容幻觉),旨在通过创新技术解决其评估与防护难题。


2

解决方案

RealSafe 人工智能安全平台目前支持五种典型的通用计算机视觉场景——人脸比对、图像分类、目标检测、文本分类、大模型测评场景的安全评估。在以上五种场景中应用 RealSafe 人工智能安全平台,将能够达到事前预警、持续防控的目标,有效协助用户消除新型人工智能安全威胁。

  • 人脸比对场景:人脸比对正应用于多个关键领域中。

  • 图像分类场景:图像分类是当今计算机视觉领域最常用的技术之一,被广泛应用于识别图像中的各种物体等。

  • 目标检测场景:目标检测广泛应用于机器人导航、智能视频监控、工业检测、航空航天等领域。

  • 文本分类场景:文本分类任务在日常生活中非常常见,通常应用于垃圾邮件检测、新闻分类、产品评论等场景。

  • 大模型测评场景:大模型的安全风险可能导致虚假信息泛滥、个人隐私泄漏、系统受到恶意攻击等安全隐患。这些隐患可能引发社会混乱,造成经济损失,影响公众信任,甚至威胁国家安全。因此,必须加强对大模型的安全评估和防护,以确保其在应用中的可靠性和安全性。

3

案例亮点及落地情况

截至2025年6月,本方案支持19种业界主流及自研对抗样本攻击算法,同时支持迁移攻击、查询攻击和盲盒攻击;支持 40+细分维度的大模型风险检测等。

该方案具备推广性和可复制性,希望通过本方案为人工智能及大模型的安全评估和防护问题保驾护航,具有明显的经济和社会效益。在安防、金融、医疗、能源、教育、交通等场景中获得良好应用,得到广泛认可。


更多精