hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
w***4814 分钟前
CVE-2024-38819:Spring 框架路径遍历 PoC 漏洞复现
java·后端·spring
架构师沉默16 分钟前
为什么工作 10 年都没遇过分布式锁?
java·后端·架构
阿宁又菜又爱玩19 分钟前
MySQL基础学习
数据库·学习·mysql
镜花水月linyi24 分钟前
synchronized 锁升级原理:从 JDK 8 实现到 JDK 25 演进
java·后端·java ee
ERP老兵-冷溪虎山25 分钟前
Python/JS/Go/Java同步学习(第五十篇半)四语言“path路径详解“对照表: 看完这篇定位文件就通透了(附源码/截图/参数表/避坑指南)
java·javascript·python·golang·中医编程·编程四语言同步学·path路径详解
qq_5710993525 分钟前
学习周报二十四
学习
零匠学堂202526 分钟前
移动学习平台与在线学习平台是什么?主要有哪些功能?
java·spring boot·学习
少平81830 分钟前
一分钱的Bug(求助帖)
java
q***017734 分钟前
Spring.factories
java·数据库·spring
-大头.37 分钟前
Spring Bean作用域深度解析与实战
java·后端·spring