技术栈

手动指定数据源格式

howard2005
3 小时前
spark sql·手动指定数据源格式
4.2.2 Spark SQL数据源 - 手动指定数据源格式本次实战聚焦 Spark SQL 手动指定数据源格式。通过 format() 明确指定数据源类型(如 CSV、JSON、JDBC),并用 option() 传递特定参数(如 CSV 的 header、delimiter,JDBC 的 URL、用户名密码)。演示了读取 people.csv(处理 header 和 delimiter)、people.json,以及连接 MySQL 数据库读取 t_user 表。同时展示了将 DataFrame 以不同格式(Parquet、CSV、JSON)保存到 HDFS
我是有底线的