Linux下Spark offline安装graphframes包

文章目录

背景

GraphX是Spark中用于图计算的模块. Spark安装包中内置Scala语言的GraphX库, 但是对于Python语言的安装包, 需要额外进行安装.

对于内网服务器, 不能访问外网, 安装GraphX的python库graphframes需要进行额外的步骤, 本文介绍如何在Linux下offline为Spark 安装graphframes包.

安装步骤

  • 下载spark-3.5.0-bin-hadoop3.tgz和graphframes-0.8.3-spark3.5-s_2.12.jar
  • cd $install_path and tar -zxvf spark-3.5.0-bin-hadoop3.tgz
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/spark-3.5.0-bin-hadoop3/jars/
  • mkdir -p $install_path/pluginlib/graphframes
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/pluginlib/graphframes/
  • jar xf graphframes-0.8.3-spark3.5-s_2.12.jar
  • 添加 $install_path/pluginlib/graphframes 到环境PYTHONPATH环境变量

这样, 就可以使用graphframes库了

相关推荐
IMPYLH30 分钟前
Linux 的 dir 命令
linux·运维·服务器·数据库
fanged38 分钟前
操作系统番外1(Linux的测试体系)(TODO)
linux·运维·服务器
123过去2 小时前
pixiewps使用教程
linux·网络·测试工具·算法·哈希算法
H_老邪3 小时前
Linux 与 Docker 常用命令
linux·运维·服务器·docker
yewq-cn3 小时前
linux 内核设备号
linux·运维·服务器
文静小土豆3 小时前
Linux 进程终止指南:理解 kill 与 kill -9 的核心区别与正确用法
linux·运维·服务器
不懒不懒3 小时前
安装python3.9.7和pycharm-community-2022.3.2.exe以及linux
linux·ide·python·pycharm
IMPYLH4 小时前
Linux 的 df 命令
linux·运维·服务器
wefg14 小时前
【Linux】会话、终端、前后台进程
linux·运维·服务器
zhixingheyi_tian4 小时前
Linux/Windows 免密登录
linux·运维·服务器