SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
敬业小码哥5 分钟前
记一次:mysql的json及json数组使用组合使用
数据库·mysql·json
练小杰1 小时前
【Mysql-installer-community-8.0.26.0】Mysql 社区版(8.0.26.0) 在Window 系统的默认安装配置
数据库·sql·mysql·adb·配置文件·mysql安装·关系型数据库
Lris-KK1 小时前
【Leetcode】高频SQL基础题--1164.指定日期的产品价格
sql·leetcode
陈陈爱java2 小时前
Spring八股文
开发语言·javascript·数据库
拾忆,想起2 小时前
Redis复制延迟全解析:从毫秒到秒级的优化实战指南
java·开发语言·数据库·redis·后端·缓存·性能优化
爬山算法3 小时前
Redis(47)如何配置Redis哨兵?
数据库·redis·bootstrap
送秋三十五5 小时前
MySQL DBA需要掌握的 7 个问题
数据库·mysql·dba
jnrjian5 小时前
v$lock TS lock id1 用于发现Oracle pdb不能关闭的sid
sql·oracle
睡觉的时候不会困5 小时前
MySQL 高可用方案之 MHA 架构搭建与实践
数据库·mysql·架构
kyle~5 小时前
Qt---对话框QDialog
数据库·qt·microsoft