spark读mongodb

idea maven依赖

<dependency>

<groupId>org.mongodb.spark</groupId>

<artifactId>mongo-spark-connector_2.11</artifactId>

<version>2.3.2</version>

</dependency>

val mongoURL = s"mongodb://账号:密码@机器ip:27017"

val builder = SparkSession.builder()

builder.appName(appName)

builder.config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")

builder.config("spark.rdd.compress", "true")

builder.config("dfs.client.socket-timeout", "300000")

//builder.master("local[1]") 本地跑打开

val spark= builder.getOrCreate()

import spark.implicits._

val source = spark.read.mongo(ReadConfig(Map("uri" -> mongoURL, "database" -> "", "collection" -> "", "batchSize" -> "30000")))

.select("x")

//解析

source.map(it => {

val x= it.getAs[String]("x")

x

})

相关推荐
Giggle12186 分钟前
家政维修保洁预约上门服务小程序软件开发解析
大数据·小程序·产品运营·个人开发·内容运营
Wild API29 分钟前
多模型成本治理怎么落地?从任务分层、日志统计到结构优化的一套实战思路
大数据·网络·人工智能
桌面运维家32 分钟前
vDisk环境下机房保护卡更新操作指南
大数据
武子康37 分钟前
大数据-274 Spark MLib-决策树剪枝完全指南:预剪枝与后剪枝原理对比
大数据·后端·spark
永霖光电_UVLED40 分钟前
像“黏土”一样被光塑造的材料
大数据·人工智能·汽车·制造·娱乐
骑蜗牛散步43 分钟前
Docker下安装ElasticSearch
大数据·elasticsearch·jenkins
智能化咨询1 小时前
(198页PPT)罗兰贝格绿都地产集团战略咨询规划项目建议书(附下载方式)
大数据·人工智能
黎阳之光1 小时前
黎阳之光:港口智能体集群,重塑智慧港口新范式
大数据·人工智能·算法·安全·数字孪生
档案宝档案管理1 小时前
智慧档案管理系统是什么?档案宝功能深度解析
大数据·数据库·人工智能·档案管理
QYR-分析1 小时前
全地形轮足机器人行业发展分析:分类、格局与市场机遇
大数据·人工智能·机器人