SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
LT10157974441 分钟前
2026年性能测试平台报告生成:专业可视化与合规适配指南
大数据·数据库·人工智能
2601_9577867710 分钟前
多平台矩阵运营的底层逻辑:当账号管理、内容生产与线索转化被一条链路串起来
java·数据库·矩阵·多平台管理
曹牧31 分钟前
Oracle:多字段排序
数据库·oracle
TDengine (老段)32 分钟前
TDengine MemTable 深度解析 — 内存写入缓冲区的数据结构与生命周期
大数据·数据结构·数据库·物联网·时序数据库·tdengine·涛思数据
瀚高PG实验室1 小时前
HGDB安全版单机修改用户密码
数据库·安全·瀚高数据库
CableTech_SQH1 小时前
上海大歌剧院工程综合布线解决方案分析报告
大数据·网络·数据库·5g·信息与通信
linmengmeng_13141 小时前
【总结】HugeGraph-AI:当图数据库遇见大模型,构建智能图应用的新范式
数据库·人工智能
是宇写的啊1 小时前
博客系统-小项目
java·数据库·spring boot·mybatis
nbsaas-boot1 小时前
Drools 规则引擎实战:原理、规则语法、数据库动态规则与企业级玩法
java·数据库·python
承渊政道2 小时前
【MySQL数据库学习】(MySQL数据库基础)
数据库·学习·mysql·ubuntu·bash·数据库架构·数据库系统