使用Pycharm运行spark实例时没有pyspark包(ModuleNotFoundError: No module named ‘py4j‘)

一、问题描述

在安装并配置pyspark下载并打开Pycharm(专业版)后进行spark实例操作(笔者以统计文件中的行数为例)时,运行程序后提示ModuleNotFoundError: No module named 'py4j':

二、解决办法

1.下载py4j包后下载pyspark包

打开新终端,在终端中输入(若在pycharm中进行下载可能导致下载失败,这里指定使用清华源镜像进行下载):

bash 复制代码
 pip install py4j -i https://pypi.tuna.tsinghua.edu.cn/simple

下载完成后打开Pycharm,再次运行即可成功,但代码中还是会有错误提示(红色波浪线):

要消除错误提示(红色波浪线)需下载pyspark包,点击Pycharm右上角的File>settings>Project:PythonProject>Python Interpreter,点击+号,在搜索框中搜索pyspark安装即可:

安装完成后可以看到错误提示消失且程序成功运行:

2.直接下载pyspark包

打开终端,输入以下内容来通过清华镜像下载pyspark包:

bash 复制代码
 pip install pyspark -i https://pypi.tuna.tsinghua.edu.cn/simple

等待下载完成后重新启动Pycharm,再次运行程序即可成功且无错误提示:

三、问题分析

上述错误是关于找不到py4j模块相关的错误。这个模块用于在Python和Java之间进行通信,这对于PySpark正常工作是至关重要的。可以使用pip来安装它,通过使用清华大学开源软件镜像站提供的源来安装PySpark,通常可以加快下载速度并提高安装成功率。安装成功后程序正常运行!!!

相关推荐
WXX_s1 分钟前
【OpenCV篇】OpenCV——03day.图像预处理(2)
人工智能·python·opencv·学习·计算机视觉
vsropy40 分钟前
VScode输出中文乱码问题解决
ide·vscode·编辑器
程序员JerrySUN1 小时前
Linux系统架构核心全景详解
linux·运维·系统架构
无敌的牛1 小时前
Linux文件理解,基础IO理解
linux·运维·服务器
未来之窗软件服务1 小时前
跨平台 WebSocket 服务器的设计与实现 —— 基于.NET 8 的跨操作系统解决方案linux,macos,windows——开发工具
linux·服务器·websocket·仙盟创梦ide·东方仙盟
Jackilina_Stone1 小时前
【论文|复现】YOLOFuse:面向多模态目标检测的双流融合框架
人工智能·python·目标检测·计算机视觉·融合
AutoMQ1 小时前
技术干货|为什么越来越多企业放弃 Flink/Spark,用 AutoMQ 替代传统 ETL?
大数据
杰哥的狗2 小时前
nacos连接失败,启动失败常见问题
linux·docker
Jackilina_Stone2 小时前
【faiss】用于高效相似性搜索和聚类的C++库 | 源码详解与编译安装
android·linux·c++·编译·faiss
双叶8362 小时前
(Python)文件储存的认识,文件路径(文件储存基础教程)(Windows系统文件路径)(基础教程)
开发语言·windows·python