SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
麦聪聊数据3 小时前
数据服务化时代:企业数据能力输出的核心路径
数据库
shushangyun_4 小时前
2026年快消品B2B系统推荐:支持终端门店订货、促销政策自动化的工具?
java·运维·网络·数据库·人工智能·spring·自动化
DARLING Zero two♡4 小时前
【MySQL数据库】数据类型与表约束
数据库·mysql
曹牧5 小时前
Oracle EXPLAIN PLAN
数据库·oracle
BD_Marathon5 小时前
SQL学习指南——视图
数据库·sql
活宝小娜5 小时前
mysql详细安装教程
数据库·mysql·adb
贤时间5 小时前
codex 助力oracle ebs 开发
数据库·oracle
秉承初心5 小时前
PostgreSQL 数据性能瓶颈突破实战
数据库·postgresql·oracle
2601_962072555 小时前
李梦娇常识4600问|题库|打印版
sql·华为od·华为·c#·华为云·.net·harmonyos