Spark导出数据文件到HDFS

spark.read.format("csv")

.option("nullValue", "")

.option("quote", "")

.option("header", "true")

.load(s"file:/root/test/networks.csv")

.createOrReplaceTempView("v1")

spark.table("v1").show(5)

val l = spark.table("v1").count()

println(s"l = ${l}")

spark.sql("INSERT OVERWRITE TABLE xxxx select * from v1")

res.coalesce(1).write.option("header", "true").csv(s"/root/test/res")

res.coalesce(1).write.option("header", "true").csv(s"hdfs://xxxxxx:9000/test/network/res")

/test/makt

val res2 =

spark.sql(

s"""

|select * from

|xxxx.xxxx limit 1;

|""".stripMargin)

res2.coalesce(1).write.option("header", "true").csv(s"file:/root/test/res2")

res2.coalesce(1).write.csv("/root/test/res.csv")

hdfs dfs -get /root/test/res/xxxx /root/test

相关推荐
happymaker06263 分钟前
web前端学习日记——DAY04
前端·学习
发现一只大呆瓜9 分钟前
React-路由监听 / 跳转 / 守卫全攻略(附实战代码)
前端·react.js·面试
swipe1 小时前
为什么 RAG 一定离不开向量检索:从文档向量化到语义搜索的工程实现
前端·llm·agent
OpenTiny社区1 小时前
AI-Extension:让 AI 真的「看得到、动得了」你的浏览器
前端·ai编程·mcp
IT_陈寒1 小时前
Redis缓存击穿:3个鲜为人知的防御策略,90%开发者都忽略了!
前端·人工智能·后端
竹林8182 小时前
在Web3前端用Node.js子进程批量校验钱包,我踩了这些性能与安全的坑
javascript·node.js
农夫山泉不太甜3 小时前
Tauri v2 实战代码示例
前端
yuhaiqiang3 小时前
被 AI 忽悠后,开始怀念搜索引擎了?
前端·后端·面试
红色石头本尊3 小时前
1-umi-前端工程化搭建
前端
真夜3 小时前
关于对echart盒子设置百分比读取的宽高没有撑开盒子解决方案
前端