hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
东北甜妹5 分钟前
Redis Cluster 操作命令
java·开发语言
cwplh6 分钟前
平衡树学习笔记
数据结构·笔记·学习·算法
爱写代码的小朋友6 分钟前
生成式人工智能(AIGC)在中小学生探究式学习中的应用边界与伦理思考
人工智能·学习·aigc
jiayong2318 分钟前
第 17 课:任务选择与批量操作
开发语言·前端·javascript·vue.js·学习
消失的旧时光-194324 分钟前
Spring Boot 核心机制之 @Conditional:从原理到实战(一次讲透)
java·spring boot·后端
hINs IONN27 分钟前
深入解析HDFS:定义、架构、原理、应用场景及常用命令
hadoop·hdfs·架构
石榴树下的七彩鱼28 分钟前
智能抠图 API 接入实战:3 行代码实现图片自动去背景(Python / Java / PHP / JS)
java·图像处理·人工智能·python·php·api·抠图
星哥说事30 分钟前
开源项目OpenClaw:多AI模型统一调用的技术学习与实践
人工智能·学习
知兀31 分钟前
【Result类】(使用/不使用<T> data的情况);自带静态方法、纯数据类;
java·开发语言
像一只黄油飞32 分钟前
第二章-01-字面量
笔记·python·学习·零基础