Linux下Spark offline安装graphframes包

文章目录

背景

GraphX是Spark中用于图计算的模块. Spark安装包中内置Scala语言的GraphX库, 但是对于Python语言的安装包, 需要额外进行安装.

对于内网服务器, 不能访问外网, 安装GraphX的python库graphframes需要进行额外的步骤, 本文介绍如何在Linux下offline为Spark 安装graphframes包.

安装步骤

  • 下载spark-3.5.0-bin-hadoop3.tgz和graphframes-0.8.3-spark3.5-s_2.12.jar
  • cd $install_path and tar -zxvf spark-3.5.0-bin-hadoop3.tgz
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/spark-3.5.0-bin-hadoop3/jars/
  • mkdir -p $install_path/pluginlib/graphframes
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/pluginlib/graphframes/
  • jar xf graphframes-0.8.3-spark3.5-s_2.12.jar
  • 添加 $install_path/pluginlib/graphframes 到环境PYTHONPATH环境变量

这样, 就可以使用graphframes库了

相关推荐
阿猿收手吧!1 小时前
【Linux】Ubuntu 24安装webbench
linux·运维·ubuntu
生信大表哥1 小时前
如何在服务器上使用 Gemini 3 进行生信分析:从入门到进阶
linux·人工智能·语言模型·数信院生信服务器·生信云服务器
buyutang_2 小时前
Linux 网络编程:深入浅出UDP协议Socket编程规范
linux·网络·udp
model20052 小时前
Alibaba linux 3安装LAMP(3)
linux·运维·服务器
JosieBook2 小时前
【IDEA】IntelliJ IDEA 快捷键大全(Windows/Linux 版)
linux·windows·intellij-idea
赖small强2 小时前
【Linux 内存管理】Kernel Buddy 分配器:Page Block Size 实现原理与工作机制深度解析
linux·buddy·page block size
robin59112 小时前
容器-汇总所有环境下的日志排查问题
linux·容器·kubernetes
朗晴2 小时前
Linux修改SSH远程端口号22!
linux·运维·ssh
赖small强2 小时前
【Linux 驱动开发】Linux PWM (脉冲宽度调制) 全面技术指南
linux·驱动开发·pwm
代码游侠2 小时前
Linux系统编程 - 文件操作
linux·运维·服务器·学习