定制化行业数据服务解决方案
根据不同行业需求(如医疗、金融或零售),定制数据采集、清洗和标注方案,提供领域专业知识支持。例如,医疗图像标注或金融文本处理,确保数据符合行业标准和合规性。
语音数据处理解决方案
提供多种语言和方言的语音数据采集、降噪、转录及标注服务,用于训练和优化语音识别模型。包括噪声环境录音处理和口音覆盖,确保数据兼容主流识别引擎如Kaldi。
计算机视觉数据集构建解决方案
针对计算机视觉任务提供图像和视频数据的采集、标注及预处理服务,支持物体检测、图像分割、目标追踪等任务。采用专业工具进行像素级标注,并结合AI辅助提高效率,适用于构建高精度视觉模型。
AI大模型训练数据解决方案
提供大规模、高质量的文本、图像和语音数据集,用于训练和优化大型语言模型(如GPT类模型)和生成式AI。服务包括数据采集、清洗、标注,覆盖多语言和多模态数据源,确保数据集多样化、标签精准,并适配开源框架如PyTorch和TensorFlow。
细分行业
员工数量
100-499人
经营范围
技术开发、技术服务;基础软件服务、应用软件服务;市场调查;货物进出口、技术进出口;人工智能系统服务;数据处理(数据处理中的银行卡中心、PUE值在1.4以上的云计算数据中心除外);互联网信息服务(除新闻、出版、教育、医疗保健、药品、医疗器械和BBS以外的内容);涉外社会调查。(市场主体依法自主选择经营项目,开展经营活动;依法须经批准的项目,经相关部门批准后依批准的内容开展经营活动;不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
主营业务
为人工智能及机器学习领域提供全面的数据采集、标注和处理服务,聚焦于交付高质量、定制化的数据集以赋能AI研发落地。
数据堂(北京)科技股份有限公司
股份有限公司(非上市、自然人投资或控股)
¥1.5199亿
2010-08-26
齐红威
guoyanzhen@datatang.com
北京市海淀区宝盛南路1号院11号楼1层101-01