Oushu Database

Oushu Database(简称OushuDB)是由Apache HAWQ创始团队打造的新一代数据仓库(New Data Warehouse),采用了MPP和Hadoop结合的创新MPP++技术架构,高可扩展,遵循ANSI-SQL标准,具有极速执行器,提供PB级数据交互式查询能力。并且提供对主要BI工具的描述性分析支持和高级机器学习功能。兼容Oracle,GPDB和PostgreSQL,可以轻松取代传统数据仓库和其他SQL-on-Hadoop引擎。并且原生支持Kubernetes容器平台,帮助企业无缝迁移到最新的云计算平台。OushuDB已在金融、电信、制造、医疗和互联网等行业得到广泛的部署和应用。

Oushu Database对Apache HAWQ的增强

  • 全新执行引擎,充分利用硬件的所有特性,比Apache HAWQ性能高出5-10倍
  • C++可插拔外部存储
    • 替换JAVA PXF,性能高数倍,无需安装部署PXF额外组件,极大简化了用户安装部署和运维
    • 原生支持CSV/TEXT外部存储
    • 可以用于不同集群之间共享数据,比如数据仓库和集市之间共享及传输数据
    • 可以用于高速数据加载和数据导出
    • 可以实现高速备份和恢复
    • 可以实现可插拔文件系统:比如S3, Ceph等
    • 可以实现可插拔文件格式:比如ORC,Parquet等
  • 支持ORC/TEXT/CSV作为内部表格式,支持ORC作为外部表格式 (通过C++可插拔外部存储)
  • 支持Master节点的HA
  • 支持Lava AI云平台
  • 对PaaS/CaaS云平台的原生支持
    • 世界上首个可以原生运行与PaaS容器平台中的MPP++分析型数据库
    • 支持Kubernetes集群容器编排与部署
  • csv和text文件格式中对非ASCII字符串或长度大于1的字符串作为分隔符的支持
  • 关键Bug fixes

下面我们主要从六个方面介绍Oushu Database 。