SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
ruleslol3 小时前
MySQL的段、区、页、行 详解
数据库·mysql
Learn-Python3 小时前
MongoDB-only方法
python·sql
while(1){yan}3 小时前
MyBatis Generator
数据库·spring boot·java-ee·mybatis
それども3 小时前
MySQL affectedRows 计算逻辑
数据库·mysql
是小章啊3 小时前
MySQL 之SQL 执行规则及索引详解
数据库·sql·mysql
富士康质检员张全蛋4 小时前
JDBC 连接池
数据库
yangminlei4 小时前
集成Camunda到Spring Boot项目
数据库·oracle
ChineHe5 小时前
Redis数据类型篇002_详解Strings核心命令与存储结构
数据库·redis·缓存
清水白石0085 小时前
《从零到进阶:Pydantic v1 与 v2 的核心差异与零成本校验实现原理》
数据库·python
电商API&Tina5 小时前
京东 API 数据采集接口接入与行业分析
运维·服务器·网络·数据库·django·php