SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
你住过的屋檐2 分钟前
【oracle】oracle数据处理将一行数据根据条件拆分为多行
数据库·oracle
Channing Lewis17 分钟前
数据库的dump备份
数据库
开开心心_Every27 分钟前
无广告干扰:简单好用文字LOGO设计工具
xml·java·网络·数据库·华为od·华为云·excel
悄悄敲敲敲30 分钟前
数据库:库的操作
数据库
JAVA学习通35 分钟前
数据库备份与恢复(2)
数据库
lhrimperial38 分钟前
MongoDB核心技术深度解析题
数据库·mongodb
宠..39 分钟前
为单选按钮绑定事件
运维·服务器·开发语言·数据库·c++·qt·microsoft
宠..1 小时前
对单选按钮分组
开发语言·数据库·c++·qt·安全·安全性测试
Ashley_Amanda1 小时前
SAP ABAP 开发全攻略:从核心编程到最佳实践
大数据·数据库·sql
黎相思1 小时前
附录:SQLite介绍
数据库·sqlite