hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
间彧13 小时前
Java双亲委派模型工作原理
java
smileSunshineMan13 小时前
idea启动kafka源码
java·kafka·intellij-idea
indexsunny13 小时前
互联网大厂Java面试实战:核心技术与微服务架构解析
java·数据库·spring boot·缓存·微服务·面试·消息队列
想用offer打牌13 小时前
非常好用的工具: curl
java·后端·github
·云扬·13 小时前
ClickHouse数据备份与恢复实战:从基础操作到工具应用
android·java·clickhouse
程序员清风13 小时前
贝壳一面:Spring是怎么实现的?谈谈你的理解?
java·后端·面试
丝斯201113 小时前
AI学习笔记整理(48)——大模型中的向量工程RAG系统
人工智能·笔记·学习
YY_pdd13 小时前
全面战争三国-mod开发教程(demo,已实证)
经验分享·笔记·学习
坚持学习前端日记13 小时前
后台管理系统文档
java·开发语言·windows·spring boot·python·spring
雨中飘荡的记忆13 小时前
Spring Security入门:从零开始构建安全应用
java·安全·spring