python与PySpark

1、Spark是Apache基金会 下的顶级开源项目,用于对海量数据经行大规模的分布式技术;

2、P有Spark是Spark的python实现,用于python中完成Spark的任务开发;

3、安装:可通过cmd终端进行安装

复制代码
pip install PySpark

也可以通过国内镜像网站,

复制代码
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspark

3、执行一个简答的程序进行验证

复制代码
# 导入 PySpark 相关包
from pyspark import SparkConf, SparkContext


conf =SparkConf().setMaster("local[*]").setAppName("test_spark_app") # 创建SparkConf对象
 # 基于SparkConf对象创建sparkcontext对象,
sc=SparkContext(conf=conf)

#打印pyspark的版本
print(sc.version)
sc.stop()

如果出现乱码,可能是jdk的问题,或者是编码问题

相关推荐
eggwyw几秒前
PHP搭建开发环境(Windows系统)
开发语言·windows·php
奇牙18 分钟前
DeepSeek V4 Agent 开发实战:用 deepseek-v4-pro 搭建多步骤工作流(2026 完整代码)
python
一行代码一行诗++19 分钟前
C语言中scanf详解
c语言·开发语言
斯维赤20 分钟前
Python学习超简单第八弹:连接Mysql数据库
数据库·python·学习
凤山老林21 分钟前
26-Java this 关键字
java·开发语言
ZenosDoron28 分钟前
keil软件修改字体,Asm editor,和C/C++ editor的区别
c语言·开发语言·c++
qq_6543669844 分钟前
如何排查Oracle客户端连接慢_DNS解析超时与sqlnet配置优化
jvm·数据库·python
山栀shanzhi1 小时前
C/C++之:构造函数为什么不能设置为虚函数?
开发语言·c++·面试
lsx2024061 小时前
.toggleClass() 方法详解
开发语言
yuan199971 小时前
C&CG(列与约束生成)算法,来解决“风光随机性”下的微网鲁棒配置问题
c语言·开发语言·算法