hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
沧海寄馀生2 分钟前
Apache Hadoop生态组件部署分享-Hue
大数据·hadoop·分布式·apache
Lovely Ruby2 分钟前
前端er Go-Frame 的学习笔记:实现 to-do 功能(四),确保开发和部署共用一套代码
前端·学习·golang
2201_757830873 分钟前
Maven
java·maven
m0_740043734 分钟前
SpringMVC/Spring Boot 控制器返回视图路径(相对 / 绝对路径)核心总结
java·spring boot·后端·spring
上不如老下不如小4 分钟前
2025年第七届全国高校计算机能力挑战赛 决赛 Java组 编程题汇总
java·python·算法
CodeCraft Studio5 分钟前
Excel处理控件Aspose.Cells教程:使用C#在Excel中创建环形图
java·c#·excel·aspose·环形图·excel环形图·图表创建
这样の我6 分钟前
java tcp指纹模拟 chrome akamai_hash
java·chrome·tcp/ip
子夜江寒9 分钟前
使用 Requests 与 Selenium 实现网页数据爬取
python·学习
0和1的舞者11 分钟前
《Spring Bean&DI 通关笔记:从定义到注入的全场景避坑指南》
java·开发语言·学习·spring·ioc·di·web
tryxr11 分钟前
synchronized
java·开发语言·锁机制·锁升级·synchronized 锁