hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
凤山老林2 小时前
04-Java JDK, JRE和JVM
java·开发语言·jvm
camellias_8 小时前
【无标题】
java·tomcat
咸鱼2.08 小时前
【java入门到放弃】需要背诵
java·开发语言
椰猫子8 小时前
Java:异常(exception)
java·开发语言
龙文浩_9 小时前
Attention Mechanism: From Theory to Code
人工智能·深度学习·神经网络·学习·自然语言处理
win x9 小时前
Redis 使用~如何在Java中连接使用redis
java·数据库·redis
星晨雪海9 小时前
基于 @Resource 的支付 Service 多实现类完整示例
java·开发语言
阿维的博客日记9 小时前
什么是逃逸分析
java·juc
Ricky_Theseus10 小时前
C++右值引用
java·开发语言·c++
Rick199310 小时前
Java内存参数解析
java·开发语言·jvm