产品&解决方案
状态层深度集成云服务(如AWS S3、Azure Blob Storage),作为数据持久化基础,支持ACID事务和高可用性设计。创新点在于抽象化存储层,实现池化管理,使计算单元无需持久化本地存储;结合元数据服务和数据分区策略,优化数据访问性能,确保一致性和容错能力。
使用Rust语言从头构建的分布式SQL查询引擎,采用向量化执行模型和列式存储格式(如Apache Arrow和Parquet),支持多线程并行处理。创新点在于利用Rust的内存安全特性优化执行器性能,减少系统开销,同时通过向量化技术实现高效数据处理,适应大规模并发查询需求。
Datafuse平台的核心技术是基于计算资源(CPU和内存)与状态数据(包括存储、元数据等)的严格分离设计。与传统的计算存储分离不同,这一架构将状态抽象化为池化云资源(如对象存储服务),实现轻量级计算单元的按需部署和动态伸缩。创新点在于通过状态层的高可用性和弹性,结合计算层的精细化调度(例如使用容器化技术如Kubernetes),显著优化资源利用率,同时支撑高性能SQL查询处理。
提供Data Cloud托管服务,利用云资源的弹性和池化优势,精细化调度计算资源,为用户提供低成本、高性能的云数据存储、处理和分析服务,强调一站式易用平台。
基于Rust语言开发Datafuse开源数据云平台,专注于云原生架构设计,强调计算和状态(如存储)的分离,以实现资源的弹性和池化管理,支持大数据处理和实时分析。
Databend是一个开源的云原生数据仓库平台,由Datafuse Labs基于Rust语言开发,专注于处理大规模数据集。核心特性包括高性能的分布式SQL查询引擎,支持标准SQL语法和MySQL协议兼容性,能轻松处理PB级别数据;其架构实现计算、存储和控制平面完全分离,充分利用云资源的弹性优势,支持自动伸缩资源管理;支持多种云存储后端如Amazon S3、Azure Blob Storage、谷歌云存储等,并集成了数据湖技术,支持Parquet、CSV等常见数据格式;还提供数据分区、优化器、索引和分布式事务功能,适用于实时分析、数据湖查询和机器学习工作负载。
融资次数
2
员工数量
小于50人
专利数量
6
公司简介
Datafuse Labs是一家开源Data Cloud服务商,Datafuse Labs团队使用 Rust 从零开始打造一个完全面向云架构的新式开源数据云平台 Datafuse。在架构上,Datafuse 不仅仅是计算和存储分离,而是更加专注计算和状态(存储只是状态的一种)的分离。状态层充分利用云资源的弹性和池化优势,计算层按需、按量使用,从而实现对资源的精细化管理和调度,为用户提供更低成本、更高性能、更加易用的一站式平台 。
经营范围
计算机软件领域内的技术开发、技术咨询、技术服务、技术推广、技术转让;销售自行开发的产品、计算机、软件及辅助设备(不得从事实体店铺经营);软件开发;应用软件服务;基础软件服务;会议服务;承办展览展示活动;组织文化艺术交流活动(不含营业性演出);货物进出口;技术进出口;代理进出口;产品设计。(市场主体依法自主选择经营项目,开展经营活动;依法须经批准的项目,经相关部门批准后依批准的内容开展经营活动;不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
主营业务
作为开源Data Cloud服务商,Datafuse Labs通过开发和支持其开源Datafuse平台,为企业提供高效、低成本、可扩展的云数据解决方案,核心包括数据仓库和实时分析服务。
北京数变科技有限公司
有限责任公司(自然人投资或控股)
¥1,024万
2021-03-05
张雁飞
13718113897
13699248276@163.com
北京市海淀区中关村大街18号11层1129-64