hadoop的分区学习

自定义分区实现:

抽象类

要自定义分区规则,就必须继承并且重写。

设置分区数量

driver类:

java 复制代码
        job.setNumReduceTasks(3);
        job.setPartitionerClass(FlowPartitioner.class);

分区方法类,直接用编号代替就好了

java 复制代码
public class FlowPartitioner extends Partitioner<Text, FlowBean> {
    @Override
    public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
        int partitions;
        String phoneNum = text.toString();
        if(phoneNum.startsWith("136")){
            partitions = 0;
        } else if (phoneNum.startsWith("137")) {
            partitions = 1;
        }else if (phoneNum.startsWith("138")) {
            partitions = 2;
        }else if (phoneNum.startsWith("139")) {
            partitions = 3;
        }else {
            partitions = 4;
        }
        return partitions;
    }
}
相关推荐
徐某人..2 分钟前
基于i.MX6ULL开发板与OV5640摄像头实现QT相机应用开发
qt·学习·arm
逸Y 仙X3 分钟前
文章十三:ElasticSearch数据更新实战
java·大数据·elasticsearch·搜索引擎·jenkins
说给风听.3 分钟前
从零学会 Java 异常处理 —— 核心语法、自定义异常与面试指南
java·开发语言·面试
是翔仔呐5 分钟前
第10章 串口通信USART全解:轮询/中断/DMA三种收发模式与上位机通信实战
c语言·开发语言·stm32·单片机·嵌入式硬件·学习·gitee
身如柳絮随风扬6 分钟前
Java JDBC 从入门到进阶
java·开发语言
Joker`s smile7 分钟前
Spring Cloud Alibaba 基础入门实践
java·spring boot·后端·spring cloud
nbsaas-boot10 分钟前
AI编程的现实困境与未来路径:从“可用”到“可靠”的跃迁
java·运维·开发语言·架构
洛阳吕工11 分钟前
AI 工程师学习路径详解:从入门到实践
人工智能·学习
东离与糖宝14 分钟前
Java 26 Vector API 第十一轮孵化:AI 推理性能提升 80% 实战
java·人工智能