2. Spark报错,Task is Failed,errorMsg: FileNotFoundException xxxx

完整报错信息
sql 复制代码
21304, Task is Failed,errorMsg: FileNotFoundException: File does not exist: hdfs://xxxx-bigdata-nameservice/user/hive/warehouse/edw_ic.db/xxxx/part-00000-c8a718b3-54b3-42de-b36c-d6eedefd2e02-c000.snappy.parquet It is possible the xxx
报错场景

Airflow 调度脚本更新表xxxx的数据后,使用SparkSQL 查询表xxxx数据报如上错误。

解决方案

刷新表或重新创建相关的Dataset/DataFrame以使缓存失效。

还可以在Spark中通过运行 REFRESH TABLE tableName 命令来刷新表,或者重新创建相关的Dataset/DataFrame。

sql 复制代码
REFRESH TABLE tableName
相关推荐
Hello.Reader4 分钟前
Flink 状态后端(State Backends)实战原理、选型、配置与调优
大数据·flink
dundunmm3 小时前
【每天一个知识点】[特殊字符] 大数据的定义及单位
大数据
IT森林里的程序猿3 小时前
基于Hadoop的京东电商平台手机推荐系统的设计与实现
大数据·hadoop·智能手机
笨蛋少年派4 小时前
MapReduce简介
大数据·mapreduce
秃头菜狗4 小时前
十四、运行经典案例 wordcount
大数据·linux·hadoop
INFINI Labs4 小时前
Elasticsearch 备份:方案篇
大数据·elasticsearch·搜索引擎·gateway·snapshot·backup·ccr
Java战神4 小时前
Hadoop
大数据·hadoop·分布式
望获linux5 小时前
【实时Linux实战系列】实时系统的可观测性:Prometheus 与 Grafana 集成
大数据·linux·服务器·开发语言·网络·操作系统
玄妙尽在颠倒间6 小时前
SQL中的四大核心语言:DQL、DML、DDL、DCL
大数据·数据库
不会写代码的加加7 小时前
告别重构噩梦:基于 Oinone 实现单体到微服务的平滑演进
spring boot·分布式