Linux下Spark offline安装graphframes包

文章目录

背景

GraphX是Spark中用于图计算的模块. Spark安装包中内置Scala语言的GraphX库, 但是对于Python语言的安装包, 需要额外进行安装.

对于内网服务器, 不能访问外网, 安装GraphX的python库graphframes需要进行额外的步骤, 本文介绍如何在Linux下offline为Spark 安装graphframes包.

安装步骤

  • 下载spark-3.5.0-bin-hadoop3.tgz和graphframes-0.8.3-spark3.5-s_2.12.jar
  • cd $install_path and tar -zxvf spark-3.5.0-bin-hadoop3.tgz
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/spark-3.5.0-bin-hadoop3/jars/
  • mkdir -p $install_path/pluginlib/graphframes
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/pluginlib/graphframes/
  • jar xf graphframes-0.8.3-spark3.5-s_2.12.jar
  • 添加 $install_path/pluginlib/graphframes 到环境PYTHONPATH环境变量

这样, 就可以使用graphframes库了

相关推荐
Forget_85504 分钟前
RHCE第八章:防火墙
linux·服务器·数据库
德彪稳坐倒骑驴8 分钟前
Spark面试准备
大数据·分布式·spark
海绵宝宝de派小星13 分钟前
Linux内核源码结构全景解析
linux·运维·arm开发
9分钟带帽18 分钟前
debain系统更新软件源
linux·debain
奥特曼_ it20 分钟前
【Spark+Hadoop】基于spark+hadoop游戏评论数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
hadoop·分布式·spark
yayatiantian_202220 分钟前
Ubuntu 24.04 安装与配置 pyenv
linux·运维·python·ubuntu·pyenv
HIT_Weston27 分钟前
109、【Ubuntu】【Hugo】搭建私人博客:搜索功能(五)
linux·javascript·ubuntu
Byte不洛29 分钟前
《Linux线程原理详解:进程、轻量级进程(LWP)与pthread实战》
linux·多线程
坐怀不乱杯魂33 分钟前
Linux - 进程信号
linux·c++
fanruitian1 小时前
k8s pv pvc 持久化存储
java·linux·kubernetes