Databend 开源周报第 128 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

使用 Databend 查询位于 HuggingFace 文件系统上的数据

HuggingFace 是目前最火热的 AI 社区。Databend 现已支持直接查询和分析存储在 HuggingFace 文件系统中的海量数据和模型,帮助您释放数据潜能。

URI格式:hf://{repo_id}/path/to/file,其中repo_id 类似 fka/awesome-chatgpt-prompts

支持的配置包括:

  • repo_type: HuggingFace 仓库类型,默认为 dataset,可用选项有 dataset, model
  • revision: HuggingFace 修订版本,默认为 main。可以是仓库中的分支、标签或提交。
  • token: HuggingFace 的 API 令牌。

下面示例使用 Databend 查询 fka/awesome-chatgpt-prompts ,列出其中 CSV 文件第一列的 5 条数据。

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

了解 Databend 与 MySQL,Oracle 之间的类型对照

Databend MySQL Oracle
TINYINT TINYINT NUMBER(3,0)
SMALLINT SMALLINT NUMBER(5,0)
INT INT NUMBER(10,0)
BIGINT BIGINT NUMBER(19,0)
FLOAT FLOAT FLOAT
DOUBLE DOUBLE FLOAT(24)
DECIMAL DECIMAL FLOAT(24)
DATE DATE DATE
TIMESTAMP TIMESTAMP NUMBER
DATETIME DATETIME DATE
YEAR INT NUMBER
VARCHAR VARCHAR VARCHAR2
VARCHAR CHAR CHAR
VARBINARY VARBINARY RAW, BLOB
VARCHAR VARCHAR VARCHAR2
VARCHAR VARCHAR RAW, CBLOB
VARBINARY VARBINARY RAW, BLOB
VARCHAR VARCHAR RAW, CBLOB
VARCHAR VARCHAR VARCHAR2
VARCHAR VARCHAR VARCHAR2
ARRAY N/A N/A
BOOLEAN N/A N/A
TUPLE N/A N/A
MAP N/A N/A
JSON, VARIANT JSON JSON
BITMAP N/A N/A

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 新增 Binary 数据类型,并且支持 String 和 Binary 之间的转换。
  • 支持自适应的 filter reorder 。
  • 支持 JSON 处理函数 concat
  • 支持自动刷新 ReadOnlyAttach 的表模式。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

支持任务建议系统表

Databend 计划支持 task_advice 系统表,为日常运维提供有效洞见,帮助数据库运维人员更轻松自如地管理数据。

catalog_name database_name table_name task_type need_run task_sql reason(variant)
default db xx COMPACT 1 optimize table xx compact limit 3 "{status in json}"
default db xx AGGREGATING_INDEX 0 refresh aggregating index xx_agg_idx limit 10 "{status in json}"
default db yy ADD_CLUSTER_KEY 1 alter table yy cluster by(col1) "{status in json}"

Issue #14323 | feat: task_advice system table

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 link.databend.rs/i-m-feeling... 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:github.com/datafuselab...

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

相关推荐
vvvae12342 小时前
分布式数据库
数据库
雪域迷影3 小时前
PostgreSQL Docker Error – 5432: 地址已被占用
数据库·docker·postgresql
bug菌¹3 小时前
滚雪球学Oracle[4.2讲]:PL/SQL基础语法
数据库·oracle
逸巽散人4 小时前
SQL基础教程
数据库·sql·oracle
月空MoonSky4 小时前
Oracle中TRUNC()函数详解
数据库·sql·oracle
momo小菜pa4 小时前
【MySQL 06】表的增删查改
数据库·mysql
向上的车轮5 小时前
Django学习笔记二:数据库操作详解
数据库·django
编程老船长5 小时前
第26章 Java操作Mongodb实现数据持久化
数据库·后端·mongodb
全栈师6 小时前
SQL Server中关于个性化需求批量删除表的做法
数据库·oracle
Data 3176 小时前
Hive数仓操作(十七)
大数据·数据库·数据仓库·hive·hadoop