SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
duke8692672141 分钟前
C# 文件上传的服务器端加密 C#如何在存储到S3或Azure Blob时启用加密
jvm·数据库·python
yoyo_zzm4 分钟前
ThinkPHP1.X核心特性解析
数据库·spring boot·nginx
云边有个稻草人21 分钟前
金仓数据库标量子查询消除:解决复杂SQL性能瓶颈
数据库·sql·性能调优·金仓数据库·kes·标量子查询·数据库内核
小杍随笔25 分钟前
【LiteAdmin(sql-admin)项目前后端架构深度分析】
数据库·sql·架构·rust
2301_8084143831 分钟前
MySQL中的复合查询和索引
数据库·mysql
我也不曾来过131 分钟前
MYSQL的基本查询
数据库·mysql
czhc114007566334 分钟前
数据库517 数据注入
数据库
六月雨滴37 分钟前
Oracle 数据库安全审计
数据库·oracle·dba
小江的记录本1 小时前
【MySQL】MySQL日志体系:redo log/undo log/binlog 三者区别、两阶段提交、如何保证数据一致性
java·数据库·后端·python·sql·mysql·面试
CC城子1 小时前
EtherCAT研究之物理层PHY(一)
linux·运维·数据库