SparkML

SparkML

SparkML_lr_train :读取py处理后的train表用于训练,将训练模型保存好。

SparkML_lr_predict :读取训练好的模型,读取py处理后的test表用于预测。将预测结果写入normal_data中,根据id修改stream_is_normal的值。

提交spark任务

javascript 复制代码
bin/spark-submit \
--class SparkML_lr_train \
--master yarn \
--deploy-mode cluster \
./SparkML_lr_train1.jar \
10


bin/spark-submit \
--class SparkML_lr_train \
--master yarn \
--deploy-mode client \
./SparkML_lr_train4.jar \
10


bin/spark-submit \
--class SparkML_lr_predict \
--master yarn \
--deploy-mode client \
./SparkML_lr_predict.jar \
10


bin/spark-submit \
--class lr_train\
--master yarn \
--deploy-mode client \
./lr_train.jar \
10


bin/spark-submit \
--class lr_predict\
--master yarn \
--deploy-mode client \
./lr_predict.jar \
10

启动hadoop(启动脚本)

hdp.sh start

启动spark(命令行启动)

sbin/start-all.sh

bin/spark-submit

--class SparkSQL_lr_train

--master yarn

--deploy-mode client

./SparkSQL_lr_train.jar

10

bin/spark-submit

--class lr_train

--master yarn

--deploy-mode client

./lr_train.jar

10

相关推荐
麦麦大数据4 天前
F052pro 基于spark推荐的中医古籍知识图谱可视化推荐系统|spark mlib|hadoop|docker集群
docker·spark-ml·spark·知识图谱·可是还·中医推荐·ehcarts
叫我:松哥7 天前
基于Spark智能推荐算法的农业作物推荐系统,推荐算法使用Spark ML风格推荐引擎
大数据·python·机器学习·spark-ml·spark·flask·推荐算法
Hello.Reader1 个月前
Spark MLlib 基础统计模块相关性、卡方检验与向量汇总
spark-ml
Yuyang_Leo2 个月前
Spark Core vs Spark MLlib:从数据处理到机器学习的完整指南
人工智能·机器学习·spark-ml
GG向前冲3 个月前
【大数据】Spark MLlib 机器学习流水线搭建
大数据·机器学习·spark-ml
Thomas21434 个月前
sparkml pipeline 使用案例
spark-ml
Thomas21434 个月前
sparkml 多列共享labelEncoder pipeline方案
spark-ml
Thomas21434 个月前
sparkml 多列共享labelEncoder
javascript·ajax·spark-ml
悟乙己4 个月前
在 PySpark ML 中LightGBM比XGBoost更好(二)
spark-ml
Lenskit4 个月前
使用pyspark对上百亿行的hive表生成稀疏向量
python·spark-ml·spark