Spark_Oracle_I_通过jdbc读取oracle程序报错invalid character

问题背景:

我原先是通过我么api直接读取的oracle,现在由于要并行读取这个oracle数据库表数据,因此采用jdbc的方式,一开始我把sql变成query直接查,所以报上面的问题。部分样例代码如下

val date = "2024/07/01" 

val query = s"SELECT * FROM your_table WHERE stat_date = TO_DATE('$date', 'YYYY/MM/DD')"

val df = spark.read
  .format("jdbc")
  .option("url", url)
  .option("dbtable", "user.table1")
  .option("user", user)
  .option("password", password)
  .option("numPartitions", "8") 
  .option("query", query) //
  .load()

这样是不行的,不能加query

解决

不加query,直接在这里整出全表数据,然后再filter一下我们要的数据

  .option("dbtable", "user.table1")

思考

其实一开始就是想要快一点读取oracle表数据,但是发现设置这个并行度和我调我们自己搞得类时间是差不多的。效率我在优化一下吧,看看时间怎么样

相关推荐
带娃的IT创业者7 小时前
《Python实战进阶》No18: 使用 Apache Spark 进行分布式计算
python·spark·apache
神秘打工猴12 小时前
数据仓库为什么要分层
大数据·数据仓库·spark
Hard_pea12 小时前
Spark 深入解析
大数据·分布式·spark
猪猪果泡酒12 小时前
spark yum配置
spark
心灵Haven1 天前
9_Spark安装
大数据·分布式·spark
逆袭的小学生2 天前
Hadoop、Spark、Flink Shuffle对比
hadoop·flink·spark
精神病不行计算机不上班2 天前
【数据仓库与数据挖掘基础】决策分析
数据仓库·数据挖掘·spark
WHYBIGDATA4 天前
Spark Streaming编程初级实践
大数据·spark
爱编程的王小美4 天前
从0学习Spark
大数据·学习·spark
Bugkillers5 天前
Spark是什么?可以用来做什么?
大数据·分布式·spark