SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
Jinkxs11 分钟前
PostgreSQL - 全文检索的开启与基础使用
数据库·postgresql·全文检索
情绪总是阴雨天~23 分钟前
检索增强生成 (RAG) 四大检索策略详解
数据库·prompt·检索增强
学Linux的语莫27 分钟前
redis的数据类型和使用
数据库·redis·缓存
IvorySQL1 小时前
PGv19预发布对现有生产系统的隐患思考,MySQL别看!
数据库·postgresql·开源
点灯小铭1 小时前
基于单片机的鱼缸监测与远程管理系统设计
数据库·单片机·嵌入式硬件·毕业设计·课程设计·期末大作业
持敬chijing1 小时前
Web渗透之SQL注入-堆叠注入(Stacked Queries Injection)
sql·安全·web安全·网络安全·网络攻击模型·安全威胁分析
Amnesia0_01 小时前
MYSQL表的约束
数据库·mysql
C137的本贾尼2 小时前
锁的分类:表锁、行锁、页锁与意向锁
数据库
Full Stack Developme2 小时前
SQL 执行顺序 及 全部关键字
数据库·sql
专注API从业者2 小时前
电商选品效率翻倍!基于 Open Claw + 淘宝商品 API 实现自动化监控选品(附完整可运行代码)
大数据·运维·数据结构·数据库·自动化