Java对象List根据ID去重

Java对象List根据ID去重

  • 一、前言
    • [1. 使用HashSet去重](#1. 使用HashSet去重)
    • [2. 使用Stream API去重](#2. 使用Stream API去重)
    • [3. 使用HashMap去重](#3. 使用HashMap去重)
    • [4. 使用TreeSet去重并保持顺序](#4. 使用TreeSet去重并保持顺序)
    • [5. 使用LinkedHashMap确保插入顺序](#5. 使用LinkedHashMap确保插入顺序)

一、前言

在Java中处理大数据时,常常会遇到需要去重的情况。假设我们有一个对象数组,其中对象具有一个ID字段,我们希望将ID相同的对象去重,保留一个对象。下面将介绍几种实现这种去重操作的方法,包括使用集合、流(Streams)以及Map数据结构。

1. 使用HashSet去重

HashSet利用哈希表的特性,可以有效地对元素进行去重。此方法的时间复杂度接近O(n)。

java 复制代码
import java.util.*;

class MyObject {
    private int id;
    private String data;

    public MyObject(int id, String data) {
        this.id = id;
        this.data = data;
    }

    public int getId() {
        return id;
    }

    // Equals and hashCode should be based on the ID for correct behavior in HashSet
    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        MyObject myObject = (MyObject) o;
        return id == myObject.id;
    }

    @Override
    public int hashCode() {
        return Objects.hash(id);
    }

    @Override
    public String toString() {
        return "MyObject{id=" + id + ", data='" + data + "'}";
    }
}

public class Main {
    public static void main(String[] args) {
        List<MyObject> list = Arrays.asList(
            new MyObject(1, "data1"),
            new MyObject(2, "data2"),
            new MyObject(1, "data3"),
            new MyObject(3, "data4")
        );

        Set<MyObject> set = new HashSet<>(list);
        List<MyObject> resultList = new ArrayList<>(set);

        System.out.println(resultList);
    }
}

2. 使用Stream API去重

Java 8引入了Stream API,可以通过distinct()方法直接对流中的元素进行去重。

java 复制代码
import java.util.*;
import java.util.stream.Collectors;

public class Main {
    public static void main(String[] args) {
        List<MyObject> list = Arrays.asList(
            new MyObject(1, "data1"),
            new MyObject(2, "data2"),
            new MyObject(1, "data3"),
            new MyObject(3, "data4")
        );

        List<MyObject> resultList = list.stream()
            .filter(distinctByKey(MyObject::getId))
            .collect(Collectors.toList());

        System.out.println(resultList);
    }

    public static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) {
        Map<Object, Boolean> seen = new ConcurrentHashMap<>();
        return t -> seen.putIfAbsent(keyExtractor.apply(t), Boolean.TRUE) == null;
    }
}

3. 使用HashMap去重

利用HashMap的键值对特性,我们可以通过ID作为键来去重,只保留最后一个出现的对象。

java 复制代码
import java.util.*;

public class Main {
    public static void main(String[] args) {
        List<MyObject> list = Arrays.asList(
            new MyObject(1, "data1"),
            new MyObject(2, "data2"),
            new MyObject(1, "data3"),
            new MyObject(3, "data4")
        );

        Map<Integer, MyObject> map = new HashMap<>();
        for (MyObject obj : list) {
            map.put(obj.getId(), obj);
        }

        List<MyObject> resultList = new ArrayList<>(map.values());
        System.out.println(resultList);
    }
}

4. 使用TreeSet去重并保持顺序

使用TreeSet可以实现去重并按自然顺序或指定顺序(通过Comparator)排序。

java 复制代码
import java.util.*;
import java.util.stream.Collectors;

public class Main {
    public static void main(String[] args) {
        List<MyObject> list = Arrays.asList(
            new MyObject(1, "data1"),
            new MyObject(2, "data2"),
            new MyObject(1, "data3"),
            new MyObject(3, "data4")
        );

        TreeSet<MyObject> set = list.stream()
            .collect(Collectors.toCollection(() -> new TreeSet<>(Comparator.comparingInt(MyObject::getId))));

        List<MyObject> resultList = new ArrayList<>(set);
        System.out.println(resultList);
    }
}

5. 使用LinkedHashMap确保插入顺序

LinkedHashMap不仅能去重,还能保持插入顺序。

java 复制代码
import java.util.*;

public class Main {
    public static void main(String[] args) {
        List<MyObject> list = Arrays.asList(
            new MyObject(1, "data1"),
            new MyObject(2, "data2"),
            new MyObject(1, "data3"),
            new MyObject(3, "data4")
        );

        Map<Integer, MyObject> map = new LinkedHashMap<>();
        for (MyObject obj : list) {
            map.putIfAbsent(obj.getId(), obj);
        }

        List<MyObject> resultList = new ArrayList<>(map.values());
        System.out.println(resultList);
    }
}

以上是几种不同的方法来实现对象数组中根据ID去重的操作。这些方法各有优劣,具体选择取决于你的实际需求和数据特点。

相关推荐
wjs20242 小时前
状态模式(State Pattern)
开发语言
我命由我123452 小时前
Kotlin 数据容器 - List(List 概述、创建 List、List 核心特性、List 元素访问、List 遍历)
java·开发语言·jvm·windows·java-ee·kotlin·list
liulilittle2 小时前
C++ TAP(基于任务的异步编程模式)
服务器·开发语言·网络·c++·分布式·任务·tap
励志要当大牛的小白菜4 小时前
ART配对软件使用
开发语言·c++·qt·算法
武子康4 小时前
Java-80 深入浅出 RPC Dubbo 动态服务降级:从雪崩防护到配置中心秒级生效
java·分布式·后端·spring·微服务·rpc·dubbo
爱装代码的小瓶子6 小时前
数据结构之队列(C语言)
c语言·开发语言·数据结构
YuTaoShao7 小时前
【LeetCode 热题 100】131. 分割回文串——回溯
java·算法·leetcode·深度优先
源码_V_saaskw7 小时前
JAVA图文短视频交友+自营商城系统源码支持小程序+Android+IOS+H5
java·微信小程序·小程序·uni-app·音视频·交友
Maybe_ch7 小时前
.NET-键控服务依赖注入
开发语言·c#·.net
超浪的晨8 小时前
Java UDP 通信详解:从基础到实战,彻底掌握无连接网络编程
java·开发语言·后端·学习·个人开发