Linux下Spark offline安装graphframes包

文章目录

背景

GraphX是Spark中用于图计算的模块. Spark安装包中内置Scala语言的GraphX库, 但是对于Python语言的安装包, 需要额外进行安装.

对于内网服务器, 不能访问外网, 安装GraphX的python库graphframes需要进行额外的步骤, 本文介绍如何在Linux下offline为Spark 安装graphframes包.

安装步骤

  • 下载spark-3.5.0-bin-hadoop3.tgz和graphframes-0.8.3-spark3.5-s_2.12.jar
  • cd $install_path and tar -zxvf spark-3.5.0-bin-hadoop3.tgz
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/spark-3.5.0-bin-hadoop3/jars/
  • mkdir -p $install_path/pluginlib/graphframes
  • cp graphframes-0.8.3-spark3.5-s_2.12.jar $install_path/pluginlib/graphframes/
  • jar xf graphframes-0.8.3-spark3.5-s_2.12.jar
  • 添加 $install_path/pluginlib/graphframes 到环境PYTHONPATH环境变量

这样, 就可以使用graphframes库了

相关推荐
久绊A3 分钟前
服务器磁盘只读/故障排
java·linux·服务器
yy_xzz6 分钟前
【Linux开发】03 TCP 网络编程中的数据边界问题与解决方案
linux·网络·tcp/ip
hutengyi8 分钟前
Redis基础——1、Linux下安装Redis(超详细)
linux·数据库·redis
LeocenaY17 分钟前
Linux 内核 I/O栈 总结
linux·运维·服务器
学不完的20 分钟前
Zrlog面试问答及问题解决方案
linux·运维·nginx·unity·游戏引擎
小邋遢2.023 分钟前
Centos stream 9 安装后root不能远程登录问题
linux·运维·centos
学不完的30 分钟前
ZrLog 博客系统部署指南(无 War 包版,Maven 构建 + 阿里云镜像优化)
java·linux·nginx·阿里云·maven
yy_xzz39 分钟前
【Linux开发】 02 Linux TCP 网络编程——迭代、回声服务器
linux·服务器·网络
秦渝兴1 小时前
从手工高可用到全容器化:我的 Keepalived+Nginx+Tomcat+MySQL 项目迁移实战
linux·运维·mysql·nginx·容器·tomcat
新时代牛马1 小时前
Autoexecra — 嵌入式设备的轻量级智能网关
linux