hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
风送雨3 分钟前
FastAPI 学习教程 · 第4部分
学习·fastapi
资生算法程序员_畅想家_剑魔10 分钟前
Java常见技术分享-分布式篇-分布式系统基础理论
java·开发语言·分布式
binbinaishijie8815 分钟前
ANSYS Workbench完全入门教程|0基础学习路线图
学习·其他
色空大师1 小时前
【Result<T>泛型接收转化失败】
java·泛型
Geoking.1 小时前
【设计模式】中介者模式(Mediator)详解
java·设计模式·中介者模式
大猫和小黄1 小时前
Java异常处理:从基础到SpringBoot实战解析
java·开发语言·spring boot·异常
半夏知半秋1 小时前
kcp学习-通用的kcp lua绑定
服务器·开发语言·笔记·后端·学习
hero.fei1 小时前
kaptcha 验证码生成工具在springboot中集成
java·spring boot·后端
mikelv011 小时前
实现返回树状结构小记
java·数据结构
Duang007_1 小时前
【LeetCodeHot100 超详细Agent启发版本】两数之和 (Two Sum)
java·人工智能·python