Hadoop-MapReduce任务三种运行开发模式

1、local模式

数据在本地,代码也在本地,使用本机的电脑的资源运行我们的MR

输入和输出路径指的都是本地路径,运行时耗费的资源也是本地资源。

2、local模式2

数据在hdfs上,代码在本地,使用本机的电脑的资源运行我们的MR

复制代码
        System.setProperty("HADOOP_USER_NAME","root");    
        Configuration configuration = new Configuration();
        
        configuration.set("fs.defaultFS","hdfs://192.168.32.128:9820");
        // 使用本地的资源(CPU,内存等), 也可以使用yarn平台跑任务
        configuration.set("mapreduce.framework.name","local");

这个里面的输入和输出路径指的是hdfs上的路径。

3、Yarn模式

数据在hdfs上,代码 跑 在yarn上。

复制代码
        System.setProperty("HADOOP_USER_NAME","root");    
        Configuration configuration = new Configuration();
        
        configuration.set("fs.defaultFS","hdfs://192.168.32.128:9820");
        
        configuration.set("mapreduce.framework.name","yarn");

        // 跨平台任务提交打开
        configuration.set("mapreduce.app-submission.cross-platform", "true");	
相关推荐
syty2020几秒前
flink为什么需要序列化数据传递到算子
大数据·flink
Elastic 中国社区官方博客4 分钟前
使用 Elasticsearch 的 Profile API 对比 dense vector 搜索性能
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
是Judy咋!4 分钟前
Elasticsearch---集群部署(SSL + X-Pack)
大数据·elasticsearch·ssl
Dxy12393102165 分钟前
Elasticsearch 8.13.4 常用搜索操作完全指南
大数据·elasticsearch
samFuB9 分钟前
【实证分析】数智化转型对企业新质生产力的影响研究(2015-2023年)
大数据
jiedaodezhuti12 分钟前
基于yarn的flink实时流模型内存使用率高问题处理
大数据·flink
潘达斯奈基~18 分钟前
spark性能优化4:数据倾斜
大数据·性能优化·spark
天远数科19 分钟前
Node.js Crypto 模块详解:如何处理金融借贷信用风险探查加密数据交互
大数据·金融·node.js·交互
Tezign_space21 分钟前
AI 时代内容增长:靠谱内容运营解决方案的选择逻辑
大数据·人工智能·内容运营
楚来客26 分钟前
云计算之工业大数据平台基本概念
大数据