hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
pshdhx_albert7 小时前
AI agent实现打字机效果
java·http·ai编程
&&Citrus7 小时前
【CPN学习笔记(二)】Chap2 非分层颜色 Petri 网——从一个简单协议开始读懂 CPN
笔记·学习·php·cpn·petri网
沉鱼.447 小时前
第十二届题目
java·前端·算法
赫瑞8 小时前
数据结构中的排列组合 —— Java实现
java·开发语言·数据结构
小橘子8319 小时前
(学习)Claude Code 源码架构深度解析
学习·程序人生·架构
周末也要写八哥9 小时前
多进程和多线程的特点和区别
java·开发语言·jvm
惜茶10 小时前
vue+SpringBoot(前后端交互)
java·vue.js·spring boot
diablobaal10 小时前
云计算学习100天-第102天-Azure入门4
学习·云计算·azure
AI_零食11 小时前
Flutter 框架跨平台鸿蒙开发 - 自定义式按钮设计应用
学习·flutter·ui·华为·harmonyos·鸿蒙
小陈phd11 小时前
多模态大模型学习笔记(三十)—— 基于YOLO26 Pose实现车牌检测
笔记·学习