2. Spark报错,Task is Failed,errorMsg: FileNotFoundException xxxx

完整报错信息
sql 复制代码
21304, Task is Failed,errorMsg: FileNotFoundException: File does not exist: hdfs://xxxx-bigdata-nameservice/user/hive/warehouse/edw_ic.db/xxxx/part-00000-c8a718b3-54b3-42de-b36c-d6eedefd2e02-c000.snappy.parquet It is possible the xxx
报错场景

Airflow 调度脚本更新表xxxx的数据后,使用SparkSQL 查询表xxxx数据报如上错误。

解决方案

刷新表或重新创建相关的Dataset/DataFrame以使缓存失效。

还可以在Spark中通过运行 REFRESH TABLE tableName 命令来刷新表,或者重新创建相关的Dataset/DataFrame。

sql 复制代码
REFRESH TABLE tableName
相关推荐
落叶,听雪12 分钟前
河南建站系统哪个好
大数据·人工智能·python
大数据追光猿1 小时前
【大数据Doris】生产环境,Doris主键模型全表7000万数据更新写入为什么那么慢?
大数据·经验分享·笔记·性能优化·doris
武子康2 小时前
大数据-197 K折交叉验证实战:sklearn 看均值/方差,选更稳的 KNN 超参
大数据·后端·机器学习
数据皮皮侠2 小时前
2m气温数据集(1940-2024)
大数据·数据库·人工智能·制造·微信开放平台
Coder_Boy_3 小时前
基于SpringAI的智能运维平台(AI驱动)
大数据·运维·人工智能
Yuer20254 小时前
用 Rust 做分布式查询引擎之前,我先写了一个最小执行 POC
开发语言·分布式·rust
智能化咨询4 小时前
(99页PPT)智慧校园XXX学院总体解决方案(附下载方式)
大数据
张彦峰ZYF6 小时前
高并发场景下的缓存雪崩探析与应对策略
redis·分布式·缓存
wang_yb6 小时前
数据分析师的“水晶球”:时间序列分析
大数据·databook
ModestCoder_6 小时前
Git 版本管理教程
大数据·git·elasticsearch