SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
guygg8817 分钟前
C# 监听数据库数据变化(SqlDependency 实现)
数据库·oracle·c#
隐退山林20 分钟前
JavaEE进阶:MyBatis 操作数据库(入门)
数据库·java-ee·mybatis
晴天¥29 分钟前
达梦数据库的内存结构
服务器·数据库·达梦数据库
倔强的石头_36 分钟前
生产环境排坑实录:SQL 标量子查询的“静默杀手”与优化器的智能推演
数据库
Navicat中国1 小时前
使用 SSL/TLS 安全连接数据库
数据库·安全·ssl
heimeiyingwang1 小时前
【架构实战】MySQL主从复制与读写分离:数据库高可用架构
数据库·mysql·架构
Cosolar1 小时前
2026年全球向量数据库技术全景与架构演进深度解析报告
数据库·人工智能·架构·agent·智能体
IronMurphy1 小时前
Redis拷打第七讲(最终章)
数据库·redis·php
张~颜2 小时前
PostgreSQL复制槽
数据库·postgresql