hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
珹洺2 分钟前
Java-Spring入门指南(三十二)Android SQLite数据库实战
java·数据库·spring
刘一说2 分钟前
深入理解 Spring Boot 高级特性:条件化 Bean 注册机制
java·spring boot·后端
Han.miracle10 分钟前
JavaEE ——多线程的线程安全集合类
java·java-ee
DO your like32 分钟前
Activiti工作流
java·工作流
合作小小程序员小小店36 分钟前
web开发,在线%小区,物业%管理系统,基于idea,html,jsp,java,ssm,mysql数据库
java·数据库·mysql·jdk·intellij-idea
q***d17343 分钟前
后端缓存技术学习资源,Redis+Memcached
redis·学习·缓存
豐儀麟阁贵1 小时前
6.2 Object类
java·开发语言·python
Eric_Makabaka1 小时前
微服务重要知识点
java
lkbhua莱克瓦241 小时前
Java进阶——集合进阶(MAP)
java·开发语言·笔记·github·学习方法·map
u0119608231 小时前
java 不可变集合讲解
java·开发语言