Databend 开源周报第 128 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

使用 Databend 查询位于 HuggingFace 文件系统上的数据

HuggingFace 是目前最火热的 AI 社区。Databend 现已支持直接查询和分析存储在 HuggingFace 文件系统中的海量数据和模型,帮助您释放数据潜能。

URI格式:hf://{repo_id}/path/to/file,其中repo_id 类似 fka/awesome-chatgpt-prompts

支持的配置包括:

  • repo_type: HuggingFace 仓库类型,默认为 dataset,可用选项有 dataset, model
  • revision: HuggingFace 修订版本,默认为 main。可以是仓库中的分支、标签或提交。
  • token: HuggingFace 的 API 令牌。

下面示例使用 Databend 查询 fka/awesome-chatgpt-prompts ,列出其中 CSV 文件第一列的 5 条数据。

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

了解 Databend 与 MySQL,Oracle 之间的类型对照

Databend MySQL Oracle
TINYINT TINYINT NUMBER(3,0)
SMALLINT SMALLINT NUMBER(5,0)
INT INT NUMBER(10,0)
BIGINT BIGINT NUMBER(19,0)
FLOAT FLOAT FLOAT
DOUBLE DOUBLE FLOAT(24)
DECIMAL DECIMAL FLOAT(24)
DATE DATE DATE
TIMESTAMP TIMESTAMP NUMBER
DATETIME DATETIME DATE
YEAR INT NUMBER
VARCHAR VARCHAR VARCHAR2
VARCHAR CHAR CHAR
VARBINARY VARBINARY RAW, BLOB
VARCHAR VARCHAR VARCHAR2
VARCHAR VARCHAR RAW, CBLOB
VARBINARY VARBINARY RAW, BLOB
VARCHAR VARCHAR RAW, CBLOB
VARCHAR VARCHAR VARCHAR2
VARCHAR VARCHAR VARCHAR2
ARRAY N/A N/A
BOOLEAN N/A N/A
TUPLE N/A N/A
MAP N/A N/A
JSON, VARIANT JSON JSON
BITMAP N/A N/A

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 新增 Binary 数据类型,并且支持 String 和 Binary 之间的转换。
  • 支持自适应的 filter reorder 。
  • 支持 JSON 处理函数 concat
  • 支持自动刷新 ReadOnlyAttach 的表模式。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

支持任务建议系统表

Databend 计划支持 task_advice 系统表,为日常运维提供有效洞见,帮助数据库运维人员更轻松自如地管理数据。

catalog_name database_name table_name task_type need_run task_sql reason(variant)
default db xx COMPACT 1 optimize table xx compact limit 3 "{status in json}"
default db xx AGGREGATING_INDEX 0 refresh aggregating index xx_agg_idx limit 10 "{status in json}"
default db yy ADD_CLUSTER_KEY 1 alter table yy cluster by(col1) "{status in json}"

Issue #14323 | feat: task_advice system table

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 link.databend.rs/i-m-feeling... 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:github.com/datafuselab...

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

相关推荐
小蒜学长2 分钟前
基于uni-app的蛋糕订购小程序的设计与实现(代码+数据库+LW)
java·数据库·spring boot·后端·小程序·uni-app
安然~~~7 分钟前
mysql多表联查
android·数据库·mysql
乐世东方客9 分钟前
使用my2sql进行mysql的binlog恢复数据
数据库·mysql
肃清112 分钟前
《深入解析数据库事务的ACID特性》
数据库·mysql
Jayyih8 小时前
嵌入式系统学习Day35(sqlite3数据库)
数据库·学习·sqlite
得意霄尽欢10 小时前
Redis之底层数据结构
数据结构·数据库·redis
hsjkdhs11 小时前
MySQL 数据类型与运算符详解
数据库·mysql
爱吃烤鸡翅的酸菜鱼12 小时前
【Redis】常用数据结构之Hash篇:从常用命令到使用场景详解
数据结构·数据库·redis·后端·缓存·哈希算法
李少兄12 小时前
IntelliJ IDEA 启动项目时配置端口指南
数据库·sql·intellij-idea
NineData12 小时前
NineData云原生智能数据管理平台新功能发布|2025年8月版
数据库·mongodb·云原生·数据库管理工具·ninedata·数据库迁移·数据复制