工程化数据库构建技术
核心为高效数据处理流水线,整合数据采集、清洗、标准化和存储。创新点包括大数据管道设计,用于快速构建和维护大规模数据库(如天籁数据中心);使用分布式计算和机器学习算法进行数据清洗和质量控制,确保数据一致性和版权管理。技术基于海量实际数据案例,优化了低价值数据的象征性定价开放机制。
AI辅助数据标注技术
海天瑞声开发的基于深度学习和半监督学习的自动化标注系统,适用于语音、文本、图像和视频等多模态数据。创新点在于自适应标注框架,利用神经网络动态优化标注规则和精度,减少人工干预;支持多语言识别和噪音抑制,提升数据质量。技术基于工程化数据库构建经验,拥有多项专利如语音转写自适应模型(CN专利号:ZL201910000000等可查)。
细分行业
员工数量
100-499人
专利数量
41
经营范围
一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;软件销售;计算机软硬件及辅助设备零售;计算机软硬件及辅助设备批发;货物进出口;技术进出口;非居住房地产租赁。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)许可项目:第二类增值电信业务;互联网信息服务。(依法须经批准的项目,经相关部门批准后方可开展经营活动,具体经营项目以相关部门批准文件或许可证件为准)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
主营业务
提供多语言、跨领域的人工智能数据资源及相关服务,包括数据授权、标注处理以及科研支持。
北京海天瑞声科技股份有限公司
其他股份有限公司(上市)
¥6,033万
2005-05-11
贺琳
ad@speechocean.com
北京市海淀区知春路68号院1号楼4层401