2. Spark报错,Task is Failed,errorMsg: FileNotFoundException xxxx

完整报错信息
sql 复制代码
21304, Task is Failed,errorMsg: FileNotFoundException: File does not exist: hdfs://xxxx-bigdata-nameservice/user/hive/warehouse/edw_ic.db/xxxx/part-00000-c8a718b3-54b3-42de-b36c-d6eedefd2e02-c000.snappy.parquet It is possible the xxx
报错场景

Airflow 调度脚本更新表xxxx的数据后,使用SparkSQL 查询表xxxx数据报如上错误。

解决方案

刷新表或重新创建相关的Dataset/DataFrame以使缓存失效。

还可以在Spark中通过运行 REFRESH TABLE tableName 命令来刷新表,或者重新创建相关的Dataset/DataFrame。

sql 复制代码
REFRESH TABLE tableName
相关推荐
码界筑梦坊20 分钟前
基于Spark的招聘数据预测分析推荐系统
大数据·分布式·python·信息可视化·spark·毕业设计
喻师傅1 小时前
横扫SQL面试——PV、UV问题
大数据·数据库·sql·面试·数据分析·uv
hongjianMa1 小时前
【模拟】P11043 [蓝桥杯 2024 省 Java B] 分布式队列 题解
分布式·蓝桥杯
煤烦恼1 小时前
scala类与集合
java·大数据·开发语言·人工智能·scala
神奇的海马体1 小时前
ZooKeeper集群部署(容器)
分布式·zookeeper·云原生
信徒_2 小时前
Kafka 在 k8s 中的消费者实例
分布式·kafka·kubernetes
黄雪超6 小时前
Flink介绍——实时计算核心论文之S4论文总结
大数据·论文阅读·flink
viperrrrrrrrrr77 小时前
大数据学习(96)-Hive面试题
大数据·hive·学习
csssnxy8 小时前
叁仟数智指路机器人是否支持远程监控和管理?
大数据·人工智能
高铭杰10 小时前
Citus源码(2)分布式读流程分析与基础概念梳理(shardid、placementid、groupid)
数据库·分布式·postgresql·citus