spark

Yana_Zeng5 小时前
hadoop·windows·spark
win10安装spark3.1详细流程(小白用)我需要在win10安装spark和Hadoop,在网上找了很多教材,发现不适用于自己。所以根据自己的情况,做笔记如下。
1024find10 小时前
大数据·运维·容器·spark·kubernetes
Spark on k8s部署(1)Jdk1.8下载地址:https://www.oracle.com/java/technologies/downloads/archive/
Lansonli2 天前
大数据·分布式·spark
大数据Spark(六十七):Transformation转换算子distinct和mapValues文章目录Transformation转换算子distinct和mapValues一、distinct二、mapValues
weixin_525936333 天前
hadoop·python·hdfs·金融·数据分析·spark·matplotlib
金融大数据处理与分析本实验采用贵州茅台公司从2005年1月4日到2025年9月30日期间的每日股票行情数据,并搭建伪分布式Hadoop环境,使用HDFS存储数据,Spark处理数据,最后采用Matplotlib做数据可视化结果展示
geilip3 天前
开发语言·spark·scala
知识体系_scala_利用scala和spark构建数据应用https://blog.csdn.net/wanglingli95/article/details/134154006
孟意昶3 天前
大数据·分布式·sql·spark
Spark专题-第三部分:性能监控与实战优化(3)-数据倾斜优化只要是分布式架构,很容易出的问题就是数据倾斜,少量打工人干了大部分工作,但近期线上没有啥严重的数据倾斜问题,导致想找个素材还真不好找,就只能先用python展示一下类似问题的问题定位、分析流程以及优化思路
Lansonli3 天前
大数据·分布式·spark
大数据Spark(六十六):Transformation转换算子sample、sortBy和sortByKey文章目录Transformation转换算子sample、sortBy和sortByKey一、sample
IT毕设梦工厂4 天前
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
大数据毕业设计选题推荐-基于大数据的人口普查收入数据分析与可视化系统-Hadoop-Spark-数据可视化-BigData✨作者主页:IT毕设梦工厂✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、PHP、.NET、Node.js、GO、微信小程序、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python项目 安卓项目 微信小程序项目
计算机源码社4 天前
大数据·hadoop·机器学习·数据挖掘·spark·毕业设计·课程设计
基于Hadoop的车辆二氧化碳排放量分析与可视化系统|基于Spark的车辆排放量实时监控与预测系统|基于数据挖掘的汽车排放源识别与减排策略系统💕💕作者:计算机源码社 💕💕个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Spark、hadoop、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流! 💕💕学习资料、程序开发、技术解答、文档报告 💕💕如需要源码,可以扫取文章下方二维码联系咨询
励志成为糕手5 天前
大数据·分布式·spark·性能调优·数据倾斜
Spark Shuffle:分布式计算的数据重分布艺术🌟 你好,我是 励志成为糕手 ! 🌌 在代码的宇宙中,我是那个追逐优雅与性能的星际旅人。 ✨ 每一行代码都是我种下的星光,在逻辑的土壤里生长成璀璨的银河; 🛠️ 每一个算法都是我绘制的星图,指引着数据流动的最短路径; 🔍 每一次调试都是星际对话,用耐心和智慧解开宇宙的谜题。 🚀 准备好开始我们的星际编码之旅了吗?
DashingGuy5 天前
大数据·spark
Spark的Broadcast Join以及其它的Join策略当有一张表较小时,我们通常选择 Broadcast Hash Join,这样可以避免 Shuffle 带来的开销,从而提高性能。比如事实表与维表进行JOIN时,由于维表的数据通常会很小,所以可以使用 BHJ 将维表进行 Broadcast。这样可以避免数据Shuffle(在 Spark 中 Shuffle 操作是很耗时的),从而提高 JOIN 的效率。
计算机编程小央姐5 天前
大数据·hadoop·分布式·数据分析·spark·汽车·课程设计
大数据工程师认证项目:汽车之家数据分析系统,Hadoop分布式存储+Spark计算引擎💖💖作者:计算机编程小央姐 💙💙个人简介:曾长期从事计算机专业培训教学,本人也热爱上课教学,语言擅长Java、微信小程序、Python、Golang、安卓Android等,开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。平常喜欢分享一些自己开发中遇到的问题的解决办法,也喜欢交流技术,大家有技术代码这一块的问题可以问我! 💛💛想说的话:感谢大家的关注与支持! 💜💜
计算机毕设残哥6 天前
大数据·hadoop·python·scrapy·数据分析·spark·dash
基于Hadoop+Spark的人体体能数据分析与可视化系统开源实现🍊作者:计算机毕设匠心工作室 🍊简介:毕业后就一直专业从事计算机软件程序开发,至今也有8年工作经验。擅长Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等。 擅长:按照需求定制化开发项目、 源码、对代码进行完整讲解、文档撰写、ppt制作。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~ Java实战项目 Python实战项目 微信小程序|安卓实战项目 大数据实战项目 PHP|C#.NET|Golang实战项目 ?
IT研究室6 天前
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
大数据毕业设计选题推荐-基于大数据的全球产品库存数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python项目 安卓项目 微信小程序项目
DashingGuy6 天前
hive·sql·spark
hive、spark任务报错或者异常怎么排查以及定位哪段sqlhive引擎会根据shuffle算子把同一个sql划分成多个stage,每个stage都是独立的application运行,这与spark是不同的,spark是多个job复用一个application。
weixin_525936337 天前
hadoop·python·数据挖掘·数据分析·spark·数据可视化
2020年美国新冠肺炎疫情数据分析与可视化做实验之前,请先安装Hadoop和Spark环境 本文以Python为编程语言,涉及Spark数据分析,HDFS存储文件,以及pyecharts数据可视化。
孟意昶7 天前
大数据·分布式·sql·性能优化·spark·big data
Spark专题-第三部分:性能监控与实战优化(2)-分区优化这一篇不同于之前理论层面的讲解,会直接引入前段时间在工作中发现的问题,并配上思路和解决办法事情的起因是一个批处理作业,在9月24号当天疯狂报错,原本凌晨就该结束的作业愣是拖到晚上
计算机毕设残哥8 天前
大数据·hadoop·python·scrapy·spark·django·dash
基于Hadoop+Spark的商店购物趋势分析与可视化系统技术实现🍊作者:计算机毕设匠心工作室 🍊简介:毕业后就一直专业从事计算机软件程序开发,至今也有8年工作经验。擅长Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等。 擅长:按照需求定制化开发项目、 源码、对代码进行完整讲解、文档撰写、ppt制作。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~ Java实战项目 Python实战项目 微信小程序|安卓实战项目 大数据实战项目 PHP|C#.NET|Golang实战项目 ?
IT研究室8 天前
大数据·hadoop·spark·毕业设计·源码·数据可视化·bigdata
大数据毕业设计选题推荐-基于大数据的全球能源消耗量数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python项目 安卓项目 微信小程序项目
Lansonli8 天前
大数据·分布式·spark
大数据Spark(六十五):Transformation转换算子groupByKey和filter文章目录Transformation转换算子groupByKey和filter一、groupByKey