开源大数据流水线系统PiflowX本地开发调试

1.代码获取

关注公众号PiflowX,发送"源码"获取github地址。

2.后端本地开发

前提条件

  • Java1.8+
  • maven

项目编译

切换到dev-flow分支。

go 复制代码
 mvn clean package -DskipTests

解压缩包

编译完成后,找到dist目录下压缩包,解压到指定目录。

bash 复制代码
cd ./dist
tar -zxvf apache-streampark-2.2.0-incubating-bin.tar.gz

启动后台服务

找到 streampark-console/streampark-console-service/src/main/java/org/apache/streampark/console/StreamParkConsoleBootstrap.java

修改启动配置

勾选Add VM options,填写参数-Dapp.home=$path$path是我们刚刚复制的路径

3.PiflowX后端启动

修改配置

修改项目下config.properties文件,根据自己环境配置

ini 复制代码
#spark
spark.master=yarn
spark.deploy.mode=cluster

#hdfs default file system
fs.defaultFS=hdfs://192.168.186.100:8082
#yarn resourcemanager hostname
yarn.resourcemanager.hostname=192.168.186.100:8088

#if you want to use hive, set hive metastore uris
hive.metastore.uris=thrift://192.168.186.100:9083

#show data in log, set 0 if you do not show the logs
data.show=10

#monitor the throughput of flow
monitor.throughput=true

#server port
server.port=8001

#h2db port
h2.port=50001
#flink
flink.jobmanager.rpc.address=192.168.186.100
flink.jobmanager.rpc.port=6123
flink.rest.port=8081

启动服务

找到 piflowx/piflow-server/src/main/scala/cn/piflow/api/HTTPServer.scala

运行main方法。

启动完成,会在项目下生成一个server.ip文件,文件内容为当前机器ip。

修改streampark-console-service服务application.yml配置:

重启streampark-console-service服务。

4.前端本地开发

前提条件

Note

如果你遇到依赖下载缓慢需要配置 npm 镜像源,方法为在用户文件夹下找到 .npmrc 将以下内容写入:

ini 复制代码
strict-peer-dependencies=false
save-workspace-protocol = rolling
registry = 'http://registry.npmmirror.com'

构建并运行

  1. 安装依赖:
bash 复制代码
cd ../streampark-console/streampark-console-webapp
复制代码
pnpm install

如果运行失败,执行以下命令:

css 复制代码
 pnpm install --ignore-scripts
  1. 运行:

    pnpm serve

  1. 打包

    pnpm build

浏览器支持

本地开发推荐使用Chrome 80+ 浏览器,支持现代浏览器, 不支持 IE。

相关推荐
苏三说技术2 小时前
xxl-job 和 elastic-job,哪个更好?
后端
三小河2 小时前
Agent Skill与Rules的区别——以Cursor为例
前端·javascript·后端
三小河2 小时前
前端视角详解 Agent Skill
前端·javascript·后端
牛奔2 小时前
Go 是如何做抢占式调度的?
开发语言·后端·golang
颜酱2 小时前
二叉树遍历思维实战
javascript·后端·算法
爱装代码的小瓶子3 小时前
【C++与Linux基础】进程间通讯方式:匿名管道
android·c++·后端
程序员良许3 小时前
嵌入式处理器架构
后端·单片机·嵌入式
MrSYJ3 小时前
Redis 做分布式 Session
后端·spring cloud·微服务
Cache技术分享3 小时前
318. Java Stream API - 深入理解 Java Stream 的中间 Collector —— mapping、filtering 和 fla
前端·后端
Elieal3 小时前
SpringBoot 数据层开发与企业信息管理系统实战
java·spring boot·后端