Databend 开源周报第 133 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

了解对开放表格式的引擎支持

Databend 通过表引擎支持不同类型的开放表格式,以满足不同技术栈数据湖方案的高级分析需求。

目前 Databend 通过表引擎提供对 Apache Iceberg 和 Delta 两种目前最受欢迎的开放表格式的支持。参考使用方式如下:

sql 复制代码
--Set up connection
CREATE CONNECTION my_s3_conn 
STORAGE_TYPE = 's3' 
ACCESS_KEY_ID ='your-ak' SECRET_ACCESS_KEY ='your-sk';

-- Create table with Open Table Format engine
CREATE TABLE test_engine 
ENGINE = [Delta | Iceberg]
LOCATION = 's3://testbucket/admin/data/' 
CONNECTION_NAME = 'my_s3_conn';

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

TPC-H Benchmark: Databend Cloud vs. Snowflake

TPC-H 基准测试是评估决策支持系统的标准,专注于复杂查询和数据维护,包含 22 条查询。在这项分析中,我们使用 TPC-H SF100(SF1 = 600万行)数据集比较了 Databend Cloud 和 Snowflake 的性能和成本。

类别 数据载入 冷启动 热启动
Databend Cloud 446s, $0.25 166s, $0.09 124s, $0.07
Snowflake 695s, $0.77 207s, $0.23 138s, $0.15

如果你对测试具体细节和复现步骤感兴趣,可以阅读 TPC-H Benchmark: Databend Cloud vs. Snowflake 获取详细信息。

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持函数 div0divnull
  • 支持创建包含 GEOMETRY 类型的表。
  • 支持 VACUUM TEMPORARY FILES [RETAIN <number> SECONDS|DAYS] [LIMIT <number>]; 语句,以清除临时文件。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

支持 DESC[RIBE] [TABLE] <name>

Databend 已经支持 DESC[RIBE] <name> 语句,用于描述表的相关信息。

现在希望对此语法进行扩充,改进为 DESC[RIBE] [TABLE] <name>,一方面保持与其他数据库系统惯用语法一致,另一方面可以进一步明确描述的对象类型。

在此改进后,我们预期可以同时支持以下两种方式获取表 t1 的相关信息:

sql 复制代码
desc t1;
desc table t1;

Issue #14713 | feat: DESC[RIBE] [TABLE]

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 link.databend.rs/i-m-feeling... 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:github.com/datafuselab...

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

相关推荐
小陈工12 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
科技小花16 小时前
数据治理平台架构演进观察:AI原生设计如何重构企业数据管理范式
数据库·重构·架构·数据治理·ai-native·ai原生
一江寒逸16 小时前
零基础从入门到精通MySQL(中篇):进阶篇——吃透多表查询、事务核心与高级特性,搞定复杂业务SQL
数据库·sql·mysql
D4c-lovetrain16 小时前
linux个人心得22 (mysql)
数据库·mysql
阿里小阿希17 小时前
CentOS7 PostgreSQL 9.2 升级到 15 完整教程
数据库·postgresql
荒川之神17 小时前
Oracle 数据仓库雪花模型设计(完整实战方案)
数据库·数据仓库·oracle
做个文艺程序员17 小时前
MySQL安全加固十大硬核操作
数据库·mysql·安全
不吃香菜学java17 小时前
Redis简单应用
数据库·spring boot·tomcat·maven
一个天蝎座 白勺 程序猿18 小时前
Apache IoTDB(15):IoTDB查询写回(INTO子句)深度解析——从语法到实战的ETL全链路指南
数据库·apache·etl·iotdb
不知名的老吴18 小时前
Redis的延迟瓶颈:TCP栈开销无法避免
数据库·redis·缓存