SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
努力成为AK大王2 小时前
并发编程的核心挑战、优化方案与核心知识点总结
java·开发语言·数据库
En^_^Joy2 小时前
Django开发:模板系统入门指南
数据库·django·sqlite
无关86883 小时前
Redis Bitmaps 用户签到系统设计方案
数据库·redis·缓存
江华森3 小时前
FastAPI 极速开发指南 — 从零到生产级 API 实战
数据库·fastapi
老纪4 小时前
Redis分布式锁进第九零篇
数据库·redis·分布式
haven-8524 小时前
MySQL事务ACID、隔离级别、MVCC、幻读解决
数据库·mysql
小高学习java5 小时前
事务的边界问题,如何判断数据回滚时机。
java·数据库·后端
迷枫7125 小时前
【无标题】
数据库
TDengine (老段)6 小时前
TDengine 扫描算子 — TableScan、TagScan 与下推优化
大数据·数据库·物联网·时序数据库·tdengine·涛思数据