spark,读取和写入同一张表问题

读取a表,写入a表

1.写入的是分区表,不报错

2.读取上来之后,创建为临时视图temp,然后先写入a表,再使用temp,就会报错

解决办法:可以先使用temp,再写入a表

3.写入的不是分区表,会报错

解决办法:先把数据收集到Driver,创建临时视图,再写入a表

4.万能解决办法:先把数据收集到Driver,创建临时视图,再写入a表

java 复制代码
Dataset<Row> dataset = spark.sql(get_new_id_Sql());

StructType schema = dataset.schema();

List<Row> rows = dataset.collectAsList();

spark.createDataFrame(rows, schema).createOrReplaceTempView("all_data");
sql 复制代码
insert overwrite table ods.a
select * from all_data

可能的原因:spark是移动数据不如移动计算,所以数据的路径还是a表,如果收集到Driver,路径就不是a表了

相关推荐
deepdata_cn8 小时前
“深数据” vs “大数据”
大数据·bigdata·深数据·deepdata
数字化转型202510 小时前
SAP Signavio 在风机制造行业的深度应用研究
大数据·运维·人工智能
sheji341611 小时前
【开题答辩全过程】以 基于大数据的城市租房数据的分析与可视化为例,包含答辩的问题和答案
大数据
Augustvic12 小时前
消息队列Kafka
分布式·kafka
java1234_小锋14 小时前
Zookeeper分布式锁如何实现?
分布式·zookeeper·云原生
Biehmltym14 小时前
【AI】09AI Agent LLM → Streaming → Session 记录 的完整链路
大数据·人工智能·elasticsearch
Data-Miner15 小时前
精品PPT | 某制造集团灯塔工厂解决方案
大数据·人工智能·制造
小湘西15 小时前
Elasticsearch 的一些默认配置上下限
java·大数据·elasticsearch
`林中水滴`16 小时前
SeaTunnel vs Flume
大数据·flume
边缘计算社区16 小时前
第12届全球边缘计算大会-精彩瞬间
大数据·人工智能·边缘计算