spark读mongodb

idea maven依赖

<dependency>

<groupId>org.mongodb.spark</groupId>

<artifactId>mongo-spark-connector_2.11</artifactId>

<version>2.3.2</version>

</dependency>

val mongoURL = s"mongodb://账号:密码@机器ip:27017"

val builder = SparkSession.builder()

builder.appName(appName)

builder.config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")

builder.config("spark.rdd.compress", "true")

builder.config("dfs.client.socket-timeout", "300000")

//builder.master("local1") 本地跑打开

val spark= builder.getOrCreate()

import spark.implicits._

val source = spark.read.mongo(ReadConfig(Map("uri" -> mongoURL, "database" -> "", "collection" -> "", "batchSize" -> "30000")))

.select("x")

//解析

source.map(it => {

val x= it.getAsString("x")

x

})

相关推荐
番茄去哪了13 分钟前
神领物流面试题(一)
java·大数据·中间件
qq_2915792527 分钟前
电商主图优化实战指南:AI工具如何提升点击率与转化率
大数据·人工智能·深度学习
黄焖鸡能干四碗30 分钟前
软件系统概要设计说明书模版(Word)
大数据·运维·数据库·架构·需求分析
之歆1 小时前
MongoDB 深度解析:从原理到实践的完整指南
数据库·mongodb
老徐聊GEO1 小时前
AI搜索获客:亲测有效的实践案例分享
大数据·人工智能·python
AI_yangxi1 小时前
短视频矩阵系统供应商
大数据·人工智能·矩阵
段一凡-华北理工大学2 小时前
LangChain框架在高炉炼铁智能化领域的应用~系列文章02:从Prompt开始,让大模型听懂高炉的“黑话“
大数据·人工智能·学习·架构·langchain·prompt·高炉炼铁
真上帝的左手2 小时前
19. 大数据-数据治理-数据标准
大数据·数据分析
Haibakeji2 小时前
长沙定制开发教育APP哪家软件公司强
大数据·人工智能
一生了无挂2 小时前
深度解析Token、RAG与Agent的层级逻辑、协作关系及落地价值
大数据·人工智能