SQL之LIMIT子句踩坑记录

部分场景下,我们可能希望从一个大表 unparsed 中抽取前100行并对这些行应用UDF,一种容易想到的SQL语句如下:

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content from unparsed
limit 100;

但这个语句实际上会对 unparsed 中的所有行先应用UDF然后再抽取前100行,不符合我们的期望,为此可以作出如下修改

sql 复制代码
@pyspark
insert into table parsed
select url, parse_func(content) as parsed_content
from (
    select url, content from unparsed
    limit 100
);

注意,以下这种语句是无效的,速度并不会有任何改变:

sql 复制代码
@pyspark
insert into table parsed
(select url, parse_func(content) as parsed_content from unparsed limit 100);
相关推荐
数据皮皮侠4 分钟前
2m气温数据集(1940-2024)
大数据·数据库·人工智能·制造·微信开放平台
Psycho_MrZhang26 分钟前
Redis 设计思想总结
数据库·redis·缓存
曹牧1 小时前
Java:Assert.isTrue()
java·前端·数据库
程序员葫芦娃2 小时前
【Java毕设项目】基于SSM的旅游资源网站
java·开发语言·数据库·编程·课程设计·旅游·毕设
2401_865854882 小时前
怎样挑选适合业务的数据库云服务?
数据库
lkbhua莱克瓦243 小时前
基础-函数
开发语言·数据库·笔记·sql·mysql·函数
福大大架构师每日一题3 小时前
dify 1.11.2 正式发布:向量数据库、安全增强、测试优化与多语言支持全面升级
数据库·安全
今天有个Bug3 小时前
【计算机毕业设计】流浪动物救助平台 - SpringBoot+Vue
sql·mysql·spring·vue·毕业设计·课程设计
码农学院3 小时前
Mysql 中的性能调优方法
数据库·mysql
UrSpecial3 小时前
MySQL索引
数据库·mysql