SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
吠品1 分钟前
Node.js谜团:fs.Stats废弃警告的侦探之旅与破局之道
linux·服务器·数据库
Mike117.1 分钟前
GBase 8c 会话、锁等待和长 SQL 的日常巡检写法
java·数据库·sql
熊文豪2 分钟前
表空间目录自动创建:国产数据库云原生存储管理的关键演进
数据库·电科金仓
承渊政道6 分钟前
数据删了不等于销毁:KingbaseES敏感数据物理擦除实战指南
运维·服务器·数据库·数据仓库·安全·oracle·业界资讯
精益数智小屋7 分钟前
什么是进销存库存表?进销存库存表包含哪些内容?
大数据·运维·数据库·人工智能·安全
重生之小比特13 分钟前
【MySQL 数据库】索引特性
数据库·mysql
Elastic 中国社区官方博客16 分钟前
为 Elasticsearch 带来火力:增加原生 Prometheus API 支持
大数据·数据库·elasticsearch·搜索引擎·信息可视化·prometheus
Andya_net23 分钟前
MySQL | DBeaver Mac版下载、安装与使用指南
数据库·mysql·macos
techdashen27 分钟前
Agent 的第三次浪潮:Cloudflare Project Think 是什么,要解决什么问题
jvm·数据库·oracle
草莓熊Lotso2 小时前
【Linux网络】UDP Socket 编程全解析:从回显服务到通用字典服务,从零实现工业级代码
linux·运维·服务器·数据库·c++·单片机·udp