spark读mongodb

idea maven依赖

<dependency>

<groupId>org.mongodb.spark</groupId>

<artifactId>mongo-spark-connector_2.11</artifactId>

<version>2.3.2</version>

</dependency>

val mongoURL = s"mongodb://账号:密码@机器ip:27017"

val builder = SparkSession.builder()

builder.appName(appName)

builder.config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")

builder.config("spark.rdd.compress", "true")

builder.config("dfs.client.socket-timeout", "300000")

//builder.master("local[1]") 本地跑打开

val spark= builder.getOrCreate()

import spark.implicits._

val source = spark.read.mongo(ReadConfig(Map("uri" -> mongoURL, "database" -> "", "collection" -> "", "batchSize" -> "30000")))

.select("x")

//解析

source.map(it => {

val x= it.getAs[String]("x")

x

})

相关推荐
一切皆是因缘际会9 小时前
AI技术新风口:边缘计算与智能体协同,解锁产业落地新范式
大数据·人工智能·安全·ai·架构·语音识别
znhb9910 小时前
从分治到协同:一体化联合脱硫脱硝的技术逻辑与实践路径
大数据
冯RI375II6948711 小时前
机械产品CE-MD认证怎么申请
大数据
时空自由民.11 小时前
PID介绍
数据库·mongodb
淡海水12 小时前
ComfyUI全面掌握-知识点详解——基础示例:文生图与图生图实操(参数+案例)
大数据·人工智能·算法·comfyui
aisifang0012 小时前
企业级GPT-Image2实战测评:从生成到生产
大数据·数据库·人工智能
znhb9912 小时前
焦化行业超低排放改造案例分析---中煤旭阳
大数据·人工智能
阳艳讲ai13 小时前
中小企业AI项目落地技术指南:常见问题与实施框架
大数据·人工智能·企业ai培训·ai获客·九尾狐ai
爱码小白14 小时前
MySQL运维篇
大数据·数据库·python
VALENIAN瓦伦尼安教学设备14 小时前
填补国内空白!瓦伦尼安发布首台船机机械故障诊断振动实验台
大数据·人工智能·嵌入式硬件