技术栈
spark
小巫程序Demo日记
1 天前
java
·
spark
SparkUI依赖问题解决方法
你收到的错误是:这个错误表明:核心问题:你的类路径中缺少了 Jersey Servlet 相关的依赖。
小巫程序Demo日记
1 天前
大数据
·
笔记
·
spark
Spark简介脑图
本文档包含Apache Spark的总结图和知识概念图,使用Mermaid图表展示,方便快速复习和理解。
猿助码头qq352674698
1 天前
ajax
·
spark
·
django
django基于Spark的国漫推荐系统
**详细视频演示请联系博主 项目实现: 核心代码: from pyspark.sql import SparkSession from pyspark.ml.recommendation import ALS from pyspark.ml.evaluation import RegressionEvaluator from pyspark.sql.functions import col
春马与夏
1 天前
大数据
·
分布式
·
spark
Spark on yarn的作业提交流程
一、YarnClient二、YarnCluster三、详细描述
XiaoQiong.Zhang
1 天前
大数据
·
分布式
·
spark
Spark 性能调优七步法
本文档综合了 Spark 工程中常见的性能瓶颈和优化技巧,分为七大调优方向,适用于 PySpark 和 Scala Spark 场景,包括资源配置、并行度、缓存、垃圾回收、UDF 性能、Shuffle 优化和作业结构管控等。
zh_19995
4 天前
java
·
大数据
·
数据仓库
·
python
·
spark
·
数据库开发
·
数据库架构
Spark面试精讲(上)
By 大数据技术与架构场景描述:这是一个Spark的面试题合集。是我自己作为面试者和作为面试官都会被问到或者问到别人的问题,这个总结里面有大量参考了网上和书上各位老师、大佬的一些原文答案,只是希望可以给出更好的回答,一般上我都会把原文链接贴上,如有侵权请联系删除!
Aurora_NeAr
4 天前
大数据
·
后端
·
spark
Spark RDD 及性能调优
分区(Partitions):数据被切分为多个分区;每个分区在集群节点上独立处理;分区是并行计算的基本单位。
小伍_Five
4 天前
java
·
大数据
·
spark
·
scala
spark数据处理练习题番外篇【下】
spark-sql的优点()1 统一数据访问;2 包括具有行业标准JDBC和ODBC连接;3 对于交互式查询和长查询使用相同的引擎;4
2301_79306982
4 天前
hive
·
hadoop
·
网络安全
·
spark
【术语解释】网络安全((SAST, DAST, SCA, IAST),Hadoop, Spark, Hive 的关系
## OWASP Top 10等OWASP Top 10:OWASP (Open Worldwide Application Security Project,开放全球应用程序安全项目) Top 10 是一份由全球安全专家定期更新的报告,列出了当前 Web 应用程序面临的十大最关键安全风险。 它是一个广受认可的意识文档,旨在帮助开发人员和安全专业人员识别和缓解常见的安全漏洞。
潘小磊
4 天前
sql
·
面试
·
spark
高频面试之10 Spark Core & SQL
(1)Local:运行在一台机器上。测试用。 (2)Standalone:是Spark自身的一个调度系统。 对集群性能要求非常高时用。国内很少使用。 (3)Yarn:采用Hadoop的资源调度器。 国内大量使用。 Yarn-client模式:Driver运行在Client上(不在AM里) Yarn-cluster模式:Driver在AM上 (4)Mesos:国内很少使用。 (5)K8S:趋势,但是目前不成熟,需要的配置信息太多。
viperrrrrrrrrr7
5 天前
大数据
·
hive
·
学习
·
flink
·
spark
大数据学习(137)-大数据组件运行时角色
🍋🍋大数据学习🍋🍋🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
Kookoos
7 天前
hadoop
·
微服务
·
spark
·
.net
·
abp vnext
ABP vNext + Spark on Hadoop:实时流处理与微服务融合
在开始前,请确认以下环境与依赖已安装与配置:环境校验示例:安全提示:生产环境中的连接串、用户名和密码请通过环境变量或 Vault 管理,不要硬编码。
是梦终空
7 天前
hadoop
·
spring boot
·
spark
·
vue
·
毕业设计
·
源代码
·
大数据房屋维修系统
JAVA毕业设计227—基于SpringBoot+hadoop+spark+Vue的大数据房屋维修系统(源代码+数据库)
毕设所有选题: https://blog.csdn.net/2303_76227485/article/details/131104075
无人赴约的cat
7 天前
大数据
·
spark
·
scala
【20250607接单】Spark + Scala + IntelliJ 项目的开发环境配置从零教学
本教程适用于零基础、一台刚装好 Windows 的全新电脑开始,搭建能运行 Spark + Scala + IntelliJ 项目的开发环境。以下是超详细、小白级别逐步教程,从“下载什么”到“点击哪里”都帮你列清楚。
zh_19995
7 天前
大数据
·
spark
·
mapreduce
·
数据库架构
·
etl
·
涛思数据
·
odps
Spark 之 入门讲解详细版(1)
Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处,Spark以其先进的设计理念,迅速成为社区的热门项目,围绕着Spark推出了Spark SQL、Spark Streaming、MLLib和GraphX等组件,也就是BDAS(伯克利数据分析栈),这些组件逐渐形成大数据处理一站式解决平台。从各方面报道来看
qq_46394486
7 天前
大数据
·
分布式
·
spark
【Spark征服之路-2.5-Spark-Core编程(一)】
· 添加 Scala 插件Spark 由 Scala 语言开发的,所以接下来的开发所使用的语言也为 Scala,当前使用的 Spark 版本为 3.0.0,默认采用的 Scala 编译版本为 2.12,所以后续开发时,我们依然采用2.12的scala版本。开发前请保证 IDEA 开发工具中含有 Scala 开发插件
下雨不打伞码农
7 天前
大数据
·
分布式
·
spark
mkdir: Cannot create directory /spark/jars. Name node is in safe mode
原因:hdfs在启动开始时会进入安全模式,这时文件系统中的内容不允许修改也不允许删除,直到安全模式结束。安全模式主要是为了系统启动的时候检查各个DataNode上数据块的有效性,同时根据策略必要的复制或者删除部分数据块。运行期通过命令也可以进入安全模式。在实践过程中,系统启动的时候去修改和删除文件也会有安全模式不允许修改的出错提示,只需要等待一会儿即可。(我之前恢复了虚拟机快照所以开启集群后会进入安全模式,等一会就可以了,如果不行就执行命令把它关了)
小伍_Five
7 天前
java
·
大数据
·
spark
·
scala
spark数据处理练习题番外篇【上】
正确答案:A:pom.xml;Maven 依赖应该添加在 pom.xml 文件中,这是 Maven 项目的核心配置文件。
Detachym
7 天前
分布式
·
spark
·
centos
CentOS下的分布式内存计算Spark环境部署
Spark 是基于内存的分布式计算框架,相比 MapReduce 具有以下核心优势:典型应用场景:bash