Databend 开源周报第 148 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

支持 ORC 文件加载

ORC(Optimized Row Columnar)格式是一种高效的列存储格式,广泛应用于数据分析领域。

Databend 现已支持对 ORC 文件进行查询、加载和转换,帮助用户获得更快的查询性能和更高的压缩率。

下面的示例展示了如何查询位于 Stage 中的 ORC 格式文件:

sql 复制代码
-- Create a ORC file format
CREATE OR REPLACE FILE FORMAT orc_ff TYPE = 'ORC';


SELECT * 
FROM @orc_data_stage (
    FILE_FORMAT => 'orc_ff', 
    PATTERN => '.*[.]orc'
) t 
LIMIT 10;

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Beyond the Code

一起来探索 Databend 社区和周边生态中的新鲜事。

Toco 使用 Databend Cloud 应对大数据挑战

随着 Toco 业务在欧洲的扩展,面临的数据处理需求急剧增加。Toco 希望数据库解决方案能够访问 S3 Buckets 处理数据文件,并具备计算与存储分离架构,以提供灵活和可靠的数据分析方案。

Databend Cloud 以其卓越的计算与存储分离架构和全面的对象存储服务支持(超过 20 种)被 Toco 选中。此外,Databend Cloud 的 STAGE 支持使得用户可以轻松地加载和导出数据,进行查询,无需复杂的表创建或数据导入过程。

目前 Databend Cloud 为 Toco 提供从数据获取与处理到数据访问与展示的全面支持。

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Blog | Customer Success Story: Toco Chooses Databend Cloud to Tackle Big Data Challenges

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持 task_history 函数。
  • 为 show indexes 增加倒排索引相关信息。
  • 新增 databend-metaverifier 实用程序。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

RFC:使用 error-stack 增强错误处理

当前流行的错误处理主要是通过枚举类型树和 From trait 实现,这导致难以追踪源自同一错误源的不同错误,缺乏错误跟踪信息,并且错误类型通常局限于单个 crate 的层面。

我们计划用 error-stack 替换现有的错误处理实践。这个 crate 能够详细追踪错误所有细节,并且能够在多线程或异步环境中跟踪错误,无需 async-backtrace

下面是 error-stack 的错误消息示例:

vbnet 复制代码
Error: a fatal error has occurred in the main loop
├╴at src/main.rs:11:51
│
├─▶ failed to read index file: index.txt
│   ╰╴at src/main.rs:29:35
│
╰─▶ No such file or directory (os error 2)
    ╰╴at src/main.rs:29:3

Issue #15741 | RFC: Enhancing Error Handling in Rust with error-stack

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 link.databend.rs/i-m-feeling... 来挑选一个随机问题,祝好运!

New Contributors

一起认识社区中的新伙伴,Databend 因你们而变得更加美好。

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:github.com/datafuselab...

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

相关推荐
Omics Pro43 分钟前
首个针对生物医药LLM智能体的全流程过程级评测框架
数据库·人工智能·windows·redis·量子计算
要开心吖ZSH1 小时前
MVCC 进阶:快照读 vs 当前读、幻读与 Next-Key Lock
java·数据库·sql·mysql·mvcc
水木流年追梦1 小时前
agent面试必备31- AI Agent 核心进阶:工具路由(Tool Routing)
数据库·人工智能·oracle·面试·职场和发展·embedding
xcLeigh1 小时前
KES运维自动化与脚本体系实战
运维·数据库·自动化·脚本·数据迁移·kes
大气的小蜜蜂2 小时前
领域层的服务
java·前端·数据库
翔云1234562 小时前
简单概括主库上 Executed_Gtid_Set 是什么时候更新的
数据库·mysql
火星校尉2 小时前
一场数据基建与消费场景的跨界实验
java·前端·数据库·python·php
平安的平安2 小时前
从“云端排队“到“边缘上岗“:DolphinDB 云边协同如何重塑工业现场的实时智能
数据库
懒鸟一枚2 小时前
为什么 useradd -rs /bin/false service 创建的用户无法用 su 切换?
linux·服务器·数据库
爱喝热水的呀哈喽2 小时前
hypermesh两个网格参数解析
服务器·数据库·mysql