Linux下Spark offline安装graphframes包

文章目录

背景

GraphX是Spark中用于图计算的模块. Spark安装包中内置Scala语言的GraphX库, 但是对于Python语言的安装包, 需要额外进行安装.

对于内网服务器, 不能访问外网, 安装GraphX的python库graphframes需要进行额外的步骤, 本文介绍如何在Linux下offline为Spark 安装graphframes包.

安装步骤

  • 下载spark-3.5.0-bin-hadoop3.tgz和graphframes-0.8.3-spark3.5-s_2.12.jar
  • cd $install_path and tar -zxvf spark-3.5.0-bin-hadoop3.tgz
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/spark-3.5.0-bin-hadoop3/jars/
  • mkdir -p $install_path/pluginlib/graphframes
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/pluginlib/graphframes/
  • jar xf graphframes-0.8.3-spark3.5-s_2.12.jar
  • 添加 $install_path/pluginlib/graphframes 到环境PYTHONPATH环境变量

这样, 就可以使用graphframes库了

相关推荐
lin张7 分钟前
mysql
linux·时序数据库
YQ_0132 分钟前
ubuntu22.04及以上,安装中文输入法
linux·运维·服务器
一周困⁸天.35 分钟前
K8S-Pod资源对象
linux·容器·kubernetes
python百炼成钢38 分钟前
45.Linux I2C 驱动
linux·运维·服务器·驱动开发
k***817239 分钟前
使用Canal将MySQL数据同步到ES(Linux)
linux·mysql·elasticsearch
last demo1 小时前
Linux 正则表达式
linux·mysql·正则表达式
fiveym1 小时前
CentOS 7 部署 isc-dhcp-server(PXE 场景专属,含完整配置 + 避坑指南)
linux·运维·centos
Ghost Face...1 小时前
V4L2架构与硬件适配全解析
linux·架构
LDG_AGI1 小时前
【推荐系统】深度学习训练框架(六):PyTorch DDP(DistributedDataParallel)数据并行分布式深度学习原理
人工智能·pytorch·分布式·python·深度学习·算法·spark
繁华似锦respect1 小时前
C++ 设计模式之工厂模式详细介绍
java·linux·c++·网络协议·设计模式