Databend 集成 PRQL:现代数据处理的一小步

PRQL,读作 "Prequel",是一种与 SQL 并肩的查询语言,它的独到之处在于采用了管道式的语法,在查询关系数据库时显得更加直观和高效。

Databend 拥抱 PRQL

v1.2.380-nightly 版本中,得益于社区贡献者 @ncuwaln 提交的重要 PR,Databend 成功地引入了对 PRQL 语言的支持。这一新特性进一步增强了 Databend 查询的灵活性和用户友好性。

用户仅需进行简单的配置更改,即可启用 PRQL 方言:

ini 复制代码
set sql_dialect = 'prql';

集成细节

Databend 和 PRQL 都采用了 Rust 语言进行开发,这使得集成 PRQL 编译器 prqlc 成为可能。

ini 复制代码
prqlc = "0.11.3"

PR 以不到一百行代码实现了对 PRQL 的支持,核心是添加了一个新的 SQL 方言选项 prql

启用此选项后,Databend 将调用 prqlc 解析 PRQL 语句,并将其转换为 SQL 语句,随后由 Databend 的 SQL 解析器进一步处理。

ini 复制代码
 let final_sql: String = match sql_dialect == Dialect::PRQL {
            true => {
                let options = prqlc::Options::default();
                match prqlc::compile(sql, &options) {
                    Ok(res) => {
                        prql_converted = true;
                        res
                    }
                    Err(e) => {
                        warn!(
                            "Try convert prql to sql failed, still use raw sql to parse. error: {}",
                            e.to_string()
                        );
                        sql.to_string()
                    }
                }
            }
            false => sql.to_string(),
        };
 ....

值得一提的是,prqlc 使用了 chumsky 库作为其解析器,而 Databend 则采用了 nom-rule 。尽管两者在技术实现上有所不同,但都提供了用户友好的 errror recovery 信息。

错误提示的对比展示

以下是 PRQL 解析器和 Databend 解析器的错误提示示例:

PRQL 解析器 错误提示:

ini 复制代码
from tracks
select {album_id, name, unit_price}
sort {-unit_price, name}
grouq album_id (
    aggregate {
    track_count = count name,
    album_price = sum unit_price
    }
)

Error: 
   ╭─[:4:1]
   │
 4 │ grouq album_id (
   │ ──┬──  
   │   ╰──── Unknown name `grouq`
───╯

Databend 解析器 错误提示:

vbnet 复制代码
🐳 :) SELECT
  album_id,
  COUNT(*) AS track_count,
  COALESCE(SUM(unit_price), 0) AS album_price
FROM
  tracks
GROUP BX
  album_id;
error: APIError: ResponseError with 1005: error:
  --> SQL:7:7
  |
1 | SELECT
  | ------ while parsing `SELECT ...`
  .
4 |   COALESCE(SUM(unit_price), 0) AS album_price
5 | FROM
6 |   tracks
7 | GROUP BX
  |       ^^ unexpected `BX`, expecting `BY`

如何使用 PRQL

用户只需进行简单的配置,即可切换到 PRQL 方言,并开始享受 PRQL 直观、管道式的查询体验。以下是一个简单的查询示例:

ini 复制代码
🐳 :) set sql_dialect = 'prql';

🐳 :) from lineitem ## run tpch q1
filter `l_shipdate` <= '1998-09-02'
group {l_returnflag, l_linestatus} (
 aggregate {
    sum_qty = sum l_quantity,
    sum_base_price = sum l_extendedprice,
    sum_disc_price = sum l_extendedprice * (1 - l_discount),
    sum_charge = sum l_extendedprice * (1 - l_discount) * (1 + l_tax),
    avg_qty = average l_quantity,
    avg_price = average l_extendedprice,
    avg_disc = average l_discount,
    count_order = count 0 ,
  }
);

通过这个例子,我们可以看到 PRQL 强大的功能和优雅的语法设计,它让复杂的数据查询变得简单而直观。当然,用户也可以随时根据需要切换回标准的 SQL 方言或其他支持的方言:

ini 复制代码
🐳 :) set sql_dialect = 'postgresql';

通过这次集成,Databend 拥抱了前沿的查询语言PRQL,为用户带来了更高效、愉悦的数据处理体验。

相关推荐
cfm_29141 小时前
Redis五大基本数据结构底层了解
数据结构·数据库·redis
真实的菜1 小时前
Redis 从入门到精通(十二):典型业务场景实战 —— 排行榜、限流器、秒杀系统、Session 共享
数据库·redis·python
你想考研啊1 小时前
mysql数据库导出导入
数据库·mysql·oracle
十年编程老舅2 小时前
Linux DRM:底层逻辑与实践架构
数据库·mysql
The Sheep 20233 小时前
Vue复习
linux·服务器·数据库
云边有个稻草人3 小时前
深度解析:KingbaseES高可用架构落地原理与生产运维实战
数据库·读写分离·数据库运维·金仓数据库·国产数据库技术·数据备份恢复
满天星83035773 小时前
【Qt】信号和槽(二) (自定义信号和槽)
开发语言·数据库·qt
我不介意孤独4 小时前
04-记忆系统为什么向量数据库不够用
数据库·人工智能·资源隔离·agent infra
AOwhisky5 小时前
MySQL 学习笔记(第六期):MySQL 备份与恢复
运维·数据库·笔记·学习·mysql·云计算
qq21084629535 小时前
【数据库】TDengine 清理旧数据
数据库·oracle·tdengine