Linux下Spark offline安装graphframes包

文章目录

背景

GraphX是Spark中用于图计算的模块. Spark安装包中内置Scala语言的GraphX库, 但是对于Python语言的安装包, 需要额外进行安装.

对于内网服务器, 不能访问外网, 安装GraphX的python库graphframes需要进行额外的步骤, 本文介绍如何在Linux下offline为Spark 安装graphframes包.

安装步骤

  • 下载spark-3.5.0-bin-hadoop3.tgz和graphframes-0.8.3-spark3.5-s_2.12.jar
  • cd $install_path and tar -zxvf spark-3.5.0-bin-hadoop3.tgz
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/spark-3.5.0-bin-hadoop3/jars/
  • mkdir -p $install_path/pluginlib/graphframes
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/pluginlib/graphframes/
  • jar xf graphframes-0.8.3-spark3.5-s_2.12.jar
  • 添加 $install_path/pluginlib/graphframes 到环境PYTHONPATH环境变量

这样, 就可以使用graphframes库了

相关推荐
小年糕是糕手10 分钟前
【C++】C++入门 -- inline、nullptr
linux·开发语言·jvm·数据结构·c++·算法·排序算法
工具人555510 分钟前
Linux远程登录
linux·运维·服务器
wangsiling61 小时前
11.13zy
linux·服务器·网络
wdfk_prog1 小时前
[Linux]学习笔记系列 -- [kernel]trace
linux·笔记·学习
脏脏a2 小时前
【Linux】进程深度剖析:从概念到 fork 函数应用
linux·运维·服务器
秃秃秃秃哇2 小时前
C语言实现循环链表demo
linux·c语言·链表
雾岛听风眠2 小时前
串口通信代码的一些解释
linux·运维·服务器
怀旧,2 小时前
【Linux系统编程】8. 进程的概念(下)
linux·运维·服务器
路人甲ing..2 小时前
Ubuntu怎么安装tar.gz (android-studio为例)
linux·ubuntu·kotlin·android studio
福尔摩斯张2 小时前
二维数组详解:定义、初始化与实战
linux·开发语言·数据结构·c++·算法·排序算法