SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
Maggie_ssss_supp6 分钟前
Linux-MySQL数据类型&表操作
数据库·mysql
廋到被风吹走12 分钟前
【数据库】【MySQL】高可用架构深度解析:从主从复制到自动切换
数据库·mysql·架构
IT邦德19 分钟前
PostgreSQL 通过 mysql_fdw连通MySQL实战
数据库·mysql·postgresql
難釋懷21 分钟前
Redis 通用命令
数据库·redis·缓存
hanqunfeng26 分钟前
(九)Redis 命令及数据类型 -- Set
数据库·redis·bootstrap
企业对冲系统官27 分钟前
期货与期权一体化平台风险收益评估方法与模型实现
运维·服务器·开发语言·数据库·python·自动化
IT邦德28 分钟前
PostgreSQL通过Oracle_FDW连通Oracle实战
数据库·postgresql·oracle
廋到被风吹走35 分钟前
【数据库】【MySQL】分区表深度解析:架构设计与大数据归档实践
android·数据库·mysql
馨谙38 分钟前
面试题----用户,组,su,su-,sudo,sudo-,nologin shell
java·前端·数据库
技术净胜1 小时前
Sharding-JDBC实现完整的分库分表步骤
数据库