开源大数据流水线系统PiflowX本地开发调试

1.代码获取

关注公众号PiflowX,发送"源码"获取github地址。

2.后端本地开发

前提条件

  • Java1.8+
  • maven

项目编译

切换到dev-flow分支。

go 复制代码
 mvn clean package -DskipTests

解压缩包

编译完成后,找到dist目录下压缩包,解压到指定目录。

bash 复制代码
cd ./dist
tar -zxvf apache-streampark-2.2.0-incubating-bin.tar.gz

启动后台服务

找到 streampark-console/streampark-console-service/src/main/java/org/apache/streampark/console/StreamParkConsoleBootstrap.java

修改启动配置

勾选Add VM options,填写参数-Dapp.home=$path$path是我们刚刚复制的路径

3.PiflowX后端启动

修改配置

修改项目下config.properties文件,根据自己环境配置

ini 复制代码
#spark
spark.master=yarn
spark.deploy.mode=cluster

#hdfs default file system
fs.defaultFS=hdfs://192.168.186.100:8082
#yarn resourcemanager hostname
yarn.resourcemanager.hostname=192.168.186.100:8088

#if you want to use hive, set hive metastore uris
hive.metastore.uris=thrift://192.168.186.100:9083

#show data in log, set 0 if you do not show the logs
data.show=10

#monitor the throughput of flow
monitor.throughput=true

#server port
server.port=8001

#h2db port
h2.port=50001
#flink
flink.jobmanager.rpc.address=192.168.186.100
flink.jobmanager.rpc.port=6123
flink.rest.port=8081

启动服务

找到 piflowx/piflow-server/src/main/scala/cn/piflow/api/HTTPServer.scala

运行main方法。

启动完成,会在项目下生成一个server.ip文件,文件内容为当前机器ip。

修改streampark-console-service服务application.yml配置:

重启streampark-console-service服务。

4.前端本地开发

前提条件

Note

如果你遇到依赖下载缓慢需要配置 npm 镜像源,方法为在用户文件夹下找到 .npmrc 将以下内容写入:

ini 复制代码
strict-peer-dependencies=false
save-workspace-protocol = rolling
registry = 'http://registry.npmmirror.com'

构建并运行

  1. 安装依赖:
bash 复制代码
cd ../streampark-console/streampark-console-webapp
复制代码
pnpm install

如果运行失败,执行以下命令:

css 复制代码
 pnpm install --ignore-scripts
  1. 运行:

    pnpm serve

  1. 打包

    pnpm build

浏览器支持

本地开发推荐使用Chrome 80+ 浏览器,支持现代浏览器, 不支持 IE。

相关推荐
JustHappy3 分钟前
古法编程秘籍(四):函数究竟是什么?把函数最重要的能力一次讲清楚
前端·后端·面试
_Evan_Yao13 分钟前
一文搞懂:Git分支管理与团队协作规范——从GitFlow到GitHub Flow,从rebase到merge,打造高效协作流
java·git·后端·github
得物技术25 分钟前
用 LLM Agent 重构告警排查流程|得物技术
java·人工智能·后端
Codelinghu39 分钟前
Superpowers 实战:用 AI 工程化思维,从零构建小Demo
后端
卷无止境1 小时前
工程统计学中的参数估计
后端
jeffer_liu1 小时前
Spring AI 生产级实战:记忆管理
java·人工智能·后端·spring·语言模型
Curvatureflight2 小时前
接口幂等性设计:如何避免重复提交、重复扣款和消息重复消费?
分布式·后端·架构
铁皮饭盒2 小时前
彩色命令行,Node21自带函数1行实现 ,Bun也兼容, 附Bun.color实现渐变色的代码
前端·后端
锋行天下2 小时前
关于websocket,真实场景踩坑经验
前端·后端
PinkSun2 小时前
我用Spring AI做了个简历优化工具(1):Structured Output实战,让AI返回Java对象
后端