Spark导出数据文件到HDFS

spark.read.format("csv")

.option("nullValue", "")

.option("quote", "")

.option("header", "true")

.load(s"file:/root/test/networks.csv")

.createOrReplaceTempView("v1")

spark.table("v1").show(5)

val l = spark.table("v1").count()

println(s"l = ${l}")

spark.sql("INSERT OVERWRITE TABLE xxxx select * from v1")

res.coalesce(1).write.option("header", "true").csv(s"/root/test/res")

res.coalesce(1).write.option("header", "true").csv(s"hdfs://xxxxxx:9000/test/network/res")

/test/makt

val res2 =

spark.sql(

s"""

|select * from

|xxxx.xxxx limit 1;

|""".stripMargin)

res2.coalesce(1).write.option("header", "true").csv(s"file:/root/test/res2")

res2.coalesce(1).write.csv("/root/test/res.csv")

hdfs dfs -get /root/test/res/xxxx /root/test

相关推荐
chilavert3181 分钟前
技术演进中的开发沉思-230 Ajax:Prototype.js 重构原生 DOM
开发语言·前端·javascript
手握风云-7 分钟前
JavaEE 进阶第七期:Spring MVC - Web开发的“交通枢纽”(一)
前端·spring·java-ee
CaliXz9 分钟前
取出51.la统计表格内容为json数据 api
java·javascript·json
Rysxt_10 分钟前
Vue 集成富文本编辑器教程
前端·javascript·vue.js·富文本
开发者小天13 分钟前
React中的受控组件示例
前端·javascript·react.js
奋斗吧程序媛13 分钟前
request请求相关
前端·javascript·vue.js
dragoooon3414 分钟前
[Linux网络基础——Lesson9.「TCP 全连接队列与 tcpdump 抓包」]
前端·git·github
光影少年20 分钟前
用vite还是webpack多,vite为什么快
前端·webpack·node.js
waeng_luo20 分钟前
[鸿蒙2025领航者闯关] 鸿蒙应用中如何管理组件状态?
前端·harmonyos·鸿蒙·鸿蒙2025领航者闯关·鸿蒙6实战·开发者年度总结
克喵的水银蛇21 分钟前
Flutter 通用列表项封装实战:适配多场景的 ListItemWidget
前端·javascript·flutter