hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
亓才孓1 分钟前
Java第三代时间API
java·开发语言
码农水水2 分钟前
京东Java面试被问:Spring Boot嵌入式容器的启动和端口绑定原理
java·开发语言·人工智能·spring boot·面试·职场和发展·php
咒法师无翅鱼2 分钟前
【西电机器学习】学习笔记(基础部分)
笔记·学习
光羽隹衡3 分钟前
机器学习——词向量转化和评论判断项目分析
人工智能·学习·机器学习
前端切图仔0014 分钟前
Chrome 扩展程序上架指南
android·java·javascript·google
专注于大数据技术栈7 分钟前
java学习--LinkedList
java·开发语言·学习
weixin199701080167 分钟前
安家 GO item_get - 获取安家详情数据接口对接全攻略:从入门到精通
java·大数据·python·golang
予枫的编程笔记7 分钟前
【Java进阶】Spring Security详解
java·spring security·security
D_FW8 分钟前
【Java】SpringAMQP+RabbitMQ消息可靠性保证
java·rabbitmq·java-rabbitmq
区区一散修9 分钟前
0.IntelliJ IDEA的安装和使用
java·ide·intellij-idea