Databend 开源周报第 130 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

支持 CREATE OR REPLACE DATABASE

CREATE OR REPLACE DATABASE 是一个语法糖,可以合并原本的:

sql 复制代码
DROP DATABASE IF EXISTS ...
CREATE DATABASE ...

CREATE OR REPLACE TABLE 的支持也在积极推进中。

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

使用 SQL 预测鸢尾花分类

结合 CASE WHEN 语句和简单的判据,可以利用 SQL 模拟简单的树模型,并且在鸢尾花分类中达到接近 97% 的精度。

SQL 复制代码
SELECT
  COUNT(*) AS total_count,
  SUM(CASE WHEN subquery.species = subquery.prediction THEN 1 ELSE 0 END) AS correct_count,
  SUM(CASE WHEN subquery.species <> subquery.prediction THEN 1 ELSE 0 END) AS incorrect_count,
  SUM(CASE WHEN subquery.species = subquery.prediction THEN 1 ELSE 0 END) / COUNT(*) AS accuracy
FROM
  (
    SELECT
      sepal_length,
      sepal_width,
      petal_length,
      petal_width,
      species,
      CASE
        WHEN petal_width < 0.75 THEN 1
        WHEN petal_width >= 0.75 AND petal_width < 1.35 THEN 2
        WHEN petal_width >= 0.75 AND petal_width < 1.75 AND petal_width >= 1.35 AND sepal_width < 2.65 THEN 3
        WHEN petal_width >= 0.75 AND petal_width < 1.75 AND petal_width >= 1.35 AND sepal_width >= 2.65 THEN 2
        WHEN petal_width >= 0.75 AND petal_width >= 1.75 THEN 3
      END AS prediction
    FROM
      iris
  ) AS subquery;

完整示例使用 Hugging Face 上的鸢尾花数据集进行,包含数据访问和数据清洗等关键步骤,欢迎阅读:

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持 SHOW USER FUNCTIONS
  • 新增系统表 user_functions
  • 新增条件函数 nvlnvl2
  • 新增 JSON 处理函数 minus 支持按索引或名称删除。
  • 支持谓词移动(Predicate Move-Around)。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

支持倒排索引

倒排索引(Inverted Index)是全文检索系统中常用的一种单词文档映射结构。Databend 计划引入倒排索引,以满足全文检索场景的需要。

参考语法如下:

sql 复制代码
-- 创建索引
CREATE [ASYNC] INVETED INDEX ivt_index ON <table>(<column>) ...

-- 刷新索引
REFRESH INVETED INDEX <index_name> [LIMIT <limit>]

Issue #14505 | feat: inverted index

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 link.databend.rs/i-m-feeling... 来挑选一个随机问题,祝好运!

New Contributors

一起认识社区中的新伙伴,Databend 因你们而变得更加美好。

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:github.com/datafuselab...

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

相关推荐
即将进化成人机8 分钟前
验证码生成 + Redis 暂存 + JWT 认证
数据库·redis·笔记
画***林8 分钟前
雷家林诗歌集录一英文版Collected Poems of Lei Jialin, Volume I (English Edition)
数据库·sql
fantasy_arch33 分钟前
pd_process.c 文件源码分析
c语言·数据库·视频编解码·av1
Elastic 中国社区官方博客34 分钟前
Kibana:使用 ES|QL 构建地图,对国家或地区的指标进行对比
大数据·数据库·elasticsearch·搜索引擎·信息可视化·全文检索·kibana
vortex542 分钟前
ORM是什么?如何理解ORM?ORM的优缺点?
java·数据库·sql·mysql·oracle·orm
盟接之桥43 分钟前
盟接之桥--说制造:从“找缝隙”到“一万米深”——庖丁解牛式的制造业精进之道
大数据·前端·数据库·人工智能·物联网·制造
九章-1 小时前
国企国产化替代标杆实践:金仓数据库赋能贵州磷化EMS系统自主可控升级
数据库·mysql·安全
利刃大大1 小时前
【Mybatis】Mybatis入门 && 基础操作 && XML配置文件开发 && 多表查询 && 注入问题 && 数据库连接池
xml·数据库·mybatis
老华带你飞1 小时前
志愿者服务管理|基于springboot 志愿者服务管理系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·后端·spring
William_cl2 小时前
【CSDN 精品专栏】ASP.NET Razor 变量输出 @变量名:从入门到避坑,新手也能写对!
java·数据库·asp.net