Databend 开源周报第 123 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

支持统计和显示合并状态

Databend 现在支持统计和显示 MERGE INTO 的状态,在执行合并之后,会返回受更新/删除/插入影响的行数:

sql 复制代码
🐳 :) create table t1(a int);
🐳 :) create table t2(b int);
🐳 :) insert into t1 values(1),(3);
🐳 :) insert into t2 values(1),(3),(4);
🐳 :) merge into t1 using t2 on t1.a = t2.a when matched and t2.a = 1 then update * when
matched then delete when not matched then insert *;
+-------------+-------------+-------------+
| insert_rows | update_rows | delete_rows |
+-------------+-------------+-------------+
|           1 |           1 |           1 |
+-------------+-------------+-------------+

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

使用 clippy.toml 添加自定义 Clippy 规则

rust-clippy 是 Rust 官方提供的代码检查工具,通过静态分析来发现问题或不符合规范的代码。

通过配置 clippy.toml 文件,可以制定项目 Clippy 规则,统一代码开发规范,提供最佳实践指引。

例如,可以使用下面的 lints 提示开发者使用 std::sync::LazyLock 来代替 lazy_static::lazy_static

toml 复制代码
disallowed-macros = [
    { path = "lazy_static::lazy_static", reason = "Please use `std::sync::LazyLock` instead." },
]

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

为 INFER_SCHEMA 添加更多数据文件类型支持

Databend 支持 infer_schema 表函数,可以推断数据文件的模式,方便数据载入和分析流程。

用法参见下面的示例:

SQL 复制代码
SELECT * FROM INFER_SCHEMA(location => '@infer_parquet/data_e0fd9cba-f45c-4c43-aa07-d6d87d134378_0_0.parquet');
+-------------+-----------------+----------+----------+
| column_name | type            | nullable | order_id |
+-------------+-----------------+----------+----------+
| number      | BIGINT UNSIGNED |        0 |        0 |
+-------------+-----------------+----------+----------+

目前,infer_schema 只支持对 Parquet 类型数据文件的模式推断,我们希望为其添加 CSV 、JSON 等更多常用数据文件类型的支持。

Issue #13959 | INFER_SCHEMA supports more file types

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 link.databend.rs/i-m-feeling... 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:github.com/datafuselab...

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

相关推荐
mpHH13 小时前
postgresql源码阅读 search_path
数据库·postgresql
humstone14 小时前
基于xml 和sql 实现自定义报表查询
xml·数据库·sql
运维行者_14 小时前
PostgreSQL 十大性能问题及解决方案
运维·服务器·网络·数据库·postgresql·智能路由器·snmp
从零开始学习人工智能14 小时前
从反复报错到稳定运行:麒麟与Ubuntu时间同步服务部署全解析
服务器·数据库·ubuntu
xcLeigh14 小时前
数据库迁移:Oracle至KingbaseES迁移最佳实践
数据库·oracle·数据迁移·kingbasees·金仓数据库
nandao15814 小时前
Linux环境通过YUM仓库源码安装PostgreSQL 数据库
数据库
IT布道14 小时前
MongoDB性能调优之--关闭THP
数据库·mongodb
程序猿_极客14 小时前
MySQL 从入门到实战:DQL 查询语言详解(附案例 + 练习)
数据库·mysql·mysql入门
无奈笑天下16 小时前
银河麒麟桌面OS使用分区编辑器将/backup分区删除并扩容至根分区参考教程
linux·数据库·经验分享·编辑器
tzhou644521 天前
MySQL备份与恢复
数据库·mysql·adb