Databend 开源周报第 123 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

支持统计和显示合并状态

Databend 现在支持统计和显示 MERGE INTO 的状态,在执行合并之后,会返回受更新/删除/插入影响的行数:

sql 复制代码
🐳 :) create table t1(a int);
🐳 :) create table t2(b int);
🐳 :) insert into t1 values(1),(3);
🐳 :) insert into t2 values(1),(3),(4);
🐳 :) merge into t1 using t2 on t1.a = t2.a when matched and t2.a = 1 then update * when
matched then delete when not matched then insert *;
+-------------+-------------+-------------+
| insert_rows | update_rows | delete_rows |
+-------------+-------------+-------------+
|           1 |           1 |           1 |
+-------------+-------------+-------------+

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

使用 clippy.toml 添加自定义 Clippy 规则

rust-clippy 是 Rust 官方提供的代码检查工具,通过静态分析来发现问题或不符合规范的代码。

通过配置 clippy.toml 文件,可以制定项目 Clippy 规则,统一代码开发规范,提供最佳实践指引。

例如,可以使用下面的 lints 提示开发者使用 std::sync::LazyLock 来代替 lazy_static::lazy_static

toml 复制代码
disallowed-macros = [
    { path = "lazy_static::lazy_static", reason = "Please use `std::sync::LazyLock` instead." },
]

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

为 INFER_SCHEMA 添加更多数据文件类型支持

Databend 支持 infer_schema 表函数,可以推断数据文件的模式,方便数据载入和分析流程。

用法参见下面的示例:

SQL 复制代码
SELECT * FROM INFER_SCHEMA(location => '@infer_parquet/data_e0fd9cba-f45c-4c43-aa07-d6d87d134378_0_0.parquet');
+-------------+-----------------+----------+----------+
| column_name | type            | nullable | order_id |
+-------------+-----------------+----------+----------+
| number      | BIGINT UNSIGNED |        0 |        0 |
+-------------+-----------------+----------+----------+

目前,infer_schema 只支持对 Parquet 类型数据文件的模式推断,我们希望为其添加 CSV 、JSON 等更多常用数据文件类型的支持。

Issue #13959 | INFER_SCHEMA supports more file types

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 link.databend.rs/i-m-feeling... 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:github.com/datafuselab...

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

相关推荐
两个蝴蝶飞几秒前
Java量化系列(十二):收盘自动存K线图!日K/分钟K一键抓取,复盘再也不用翻软件
java·数据库·oracle
TDengine (老段)15 分钟前
TDengine Go 连接器入门指南
大数据·数据库·物联网·golang·时序数据库·tdengine·涛思数据
CC.GG16 分钟前
【Qt】常用控件----按钮类控件
开发语言·数据库·qt
小北方城市网19 分钟前
第 6 课:全栈项目性能 & 安全双进阶 ——Redis 缓存 + JWT 认证(打造高并发高安全后端)
开发语言·数据库·redis·python·安全·缓存·数据库架构
java干货29 分钟前
拒绝应用层循环!用 MySQL 8.0 JSON_TABLE 一键把 JSON 数组“变”成表
数据库·mysql·json
蜗牛~turbo31 分钟前
云星空 应收款账龄分析取数SQL
数据库·sql·金蝶·云星空·k3 cloud
l1t34 分钟前
一个用SQL Sever求解数独的SQL
数据库·sql·sql server·数独·sudoku
未来之窗软件服务1 小时前
数据库(四)MySQL 数据表修复——东方仙盟练气
数据库·mysql·仙盟创梦ide·东方仙盟·数据库修复
P-ShineBeam1 小时前
知识图谱-结构化数据的通用LLM推理框架-StructGPT
数据库·人工智能·语言模型·自然语言处理·知识图谱
rchmin1 小时前
PostgreSQL数据库详细介绍
数据库·postgresql