Java集合（3：Set和Map）

文章目录

Set

概述

Set集合也是一个接口，继承自Collection，与List类似，都需要通过实现类来进行操作。
特点：

不允许包含重复的值
没有索引（就不能使用普通的for循环进行遍历）

java 复制代码

import java.util.HashSet;
import java.util.Set;

public class Demo01 {
    public static void main(String[] args) {
        //使用多态，父类的引用指向子类对象
        Set<String> set = new HashSet<>();
 
        //添加元素
        set.add("黄固");
        set.add("欧阳锋");
        set.add("段智兴");
        set.add("洪七公");
        set.add("段智兴");
        System.out.println(set);//打印集合
         //[洪七公, 黄固, 欧阳锋, 段智兴]
        //HashSet集合对于元素的读写顺序不做保证
        //相同的元素，多次存储，只能保留一个，并且不会报错
        //List集合可以存储重复元素，Set集合不行
    }
}

例：双色球

java 复制代码

import java.util.Random;
import java.util.TreeSet;
 
public class Demo02 {
    public static void main(String[] args) {
        Random ran = new Random();//创建随机类对象
 
        int blueBall = ran.nextInt(16) + 1;
//        HashSet<Integer> redBalls = new HashSet<>();//创建集合用来存储红球
        TreeSet<Object> redBalls = new TreeSet<>();//TreeSet集合自带排序规则
 
        while (redBalls.size() < 6){
            redBalls.add(ran.nextInt(33) + 1);//将当前生成的红球直接存进集合中
            //因为Set集合不能存储重复的元素，所以去重的操作可以省略不做。
        }
        System.out.println("红球：" + redBalls + "篮球 [" + blueBall + "]");
    }
}

哈希值

Set集合的去重原理使用的是哈希值。

哈希值就是JDK根据对象地址或者字符串或者数值通过自己内部的计算出来的一个整数类型数据

public int hashCode() - 用来获取哈希值，来自于Object顶层类

对象的哈希值特点：

同一个对象多次调用hashCode()方法，得到的结果是相同的。
默认情况下，不同的对象的哈希值也是不同的（特殊情况除外）

java 复制代码

public class Demo03 {
    public static void main(String[] args) {
        //相同对象哈希值相同
        System.out.println("张三".hashCode());//774889
        System.out.println("张三".hashCode());//774889
 
        //不同对象哈希值不同
        System.out.println(new Object().hashCode());
        System.out.println(new Object().hashCode());
 
        //不同的对象的哈希值也有可能相同，例外情况
        System.out.println("辂鹅".hashCode());//1179395
        System.out.println("较鸦".hashCode());//1179395
        System.out.println("辄鸇".hashCode());//1179395
        System.out.println("辅鷨".hashCode());//1179395
    }
}

HashSet去重原理

HashSet集合的特点：

底层结构是"哈希表"
集合对于读写顺序不做保证
没有索引
Set集合中的内容不能重复

java 复制代码

public class Demo04 {
    public static void main(String[] args) {
        HashSet<Student> set = new HashSet<>();
        //添加元素
        set.add(new Student("黄固",28));
        set.add(new Student("欧阳锋",38));
        set.add(new Student("段智兴",48));
        set.add(new Student("洪七公",40));
        set.add(new Student("段智兴",48));
        //从程序的角度来考虑，两个段智兴不是同一个对象，都有自己的存储空间，所以哈希值也不一样。
        for (Student stu : set) {
            System.out.println(stu);
        }
        /*
        重写hashcode和equals
        Student{name='段智兴', age=48}
        Student{name='欧阳锋', age=38}
        Student{name='洪七公', age=40}
        Student{name='黄固', age=28}
         */
    }
}

LinkedHashSet

特点:

LinkedHashSet是哈希表和链表实现的Set接口，具有可预测的读写顺序。
有链表来保证元素有序
有哈希表来保证元素的唯一性

java 复制代码

public class Demo05 {
    public static void main(String[] args) {
        LinkedHashSet<String> set = new LinkedHashSet<>();
 
        //添加元素
        set.add("黄固");
        set.add("欧阳锋");
        set.add("段智兴");
        set.add("洪七公");
        set.add("段智兴");//重复的元素不能存进去
 
        System.out.println(set);//打印集合 [黄固, 欧阳锋, 段智兴, 洪七公]
    }
}

TreeSet

TreeSet集合底层实际上是一个TreeMap
TreeMap集合底层是一个二叉树。
放到TreeSet集合中的元素，等同于放到TreeMap集合key部分了。
TreeSet集合中的元素：无序不可重复，但是可以按照元素的大小顺序自动排序。

java 复制代码

import java.util.TreeSet;
public class TreeSetTest02 {
    public static void main(String[] args) {
        // 创建一个TreeSet集合
        TreeSet<String> ts = new TreeSet<>();
        // 添加String
        ts.add("zhangsan");
        ts.add("lisi");
        ts.add("wangwu");
        ts.add("zhangsi");
        ts.add("wangliu");
        // 遍历
        for(String s : ts){
            // 按照字典顺序，升序！
            System.out.println(s);
 
        }
        /*
        lisi
         wangliu
         wangwu
         zhangsan
         zhangsi
         */
        TreeSet<Integer> ts2 = new TreeSet<>();
        ts2.add(100);
        ts2.add(200);
        ts2.add(900);
        ts2.add(800);
        ts2.add(600);
        ts2.add(10);
        for(Integer elt : ts2){
            // 升序！
            System.out.println(elt);
        }
    }
}

自定义排序规则

对于自定义的类无法排序，因为类中对象之间没有比较规则，不知道谁大谁小。

java 复制代码

import java.util.TreeSet;
 
public class TreeSetTest04 {
    public static void main(String[] args) {
        Customer c1 = new Customer(32);
        Customer c2 = new Customer(20);
        Customer c3 = new Customer(30);
        Customer c4 = new Customer(25);
 
        // 创建TreeSet集合
        TreeSet<Customer> customers = new TreeSet<>();
        // 添加元素
        customers.add(c1);
        customers.add(c2);
        customers.add(c3);
        customers.add(c4);
 
        // 遍历
        for (Customer c : customers){
            System.out.println(c);
        }
    }
}
 
// 放在TreeSet集合中的元素需要实现java.lang.Comparable接口。
// 并且实现compareTo方法。equals可以不写。
class Customer implements Comparable<Customer>{
 
    int age;
    public Customer(int age){
        this.age = age;
    }
    // 需要在这个方法中编写比较的逻辑，或者说比较的规则，按照什么进行比较！
    // k.compareTo(t.key)
    // 拿着参数k和集合中的每一个k进行比较，返回值可能是>0 <0 =0
    // 比较规则最终还是由程序员指定的：例如按照年龄升序。或者按照年龄降序。
    @Override
    public int compareTo(Customer c) { // c1.compareTo(c2);
        return c.age - this.age;
    }
 
    public String toString(){
        return "Customer[age="+age+"]";
    }
}

匿名内部类方式

java 复制代码

public class TreeSetTest05 {
    public static void main(String[] args) {
//        TreeSet<Student> ts = new TreeSet<>();//默认排序规则
        TreeSet<Student> ts = new TreeSet<>(new Comparator<Student>() {
            @Override
            public int compare(Student o1, Student o2) {
                int res = o1.getAge() - o2.getAge();
                return 0 == res ? o1.getName().compareTo(o2.getName()) : res;
                 //三目运算符  等于零用姓名排序
            }
        });//默认排序规则
 
        //添加元素
        ts.add(new Student("Andy",19));
        ts.add(new Student("Jack",18));
        ts.add(new Student("Tom",21));
        ts.add(new Student("Lucy",17));
        ts.add(new Student("Bob",21)); //当年龄相同时，按照姓名的字典顺序排序
 
        for (Student stu : ts) {
            System.out.println(stu);
        }
    }
}

Comparable和Comparator怎么选择呢？

当比较规则不会发生改变的时候，或者说当比较规则只有1个的时候，建议实现Comparable接口。

如果比较规则有多个，并且需要多个比较规则之间频繁切换，建议使用Comparator接口。

Map

概述

双列集合：用来存储键值对的集合。

interface Map<K,V> : K(key)键，V(value)值
将键映射到值的对象，不能出现重复的键，每个键最多可以映射到一个值

1、Map和Collection没有继承关系。

2、Map集合以key和value的方式存储数据：键值对

key和value都是引用数据类型。

key和value都是存储对象的内存地址。

key起到主导的地位，value是key的一个附属品。

Map的基本方法

方法名	说明
V put(K key,V value)	设置键值对
V remove(Object key)	删除元素
void clear()	清空集合
boolean containsKey(Object key)	判断键是否存在，存在则返回true
boolean containsValue(Object value)	判断值是否存在，存在则返回true
boolean isEmpty()	判断集合是否为空
int size()	获取集合元素个数

java 复制代码

import java.util.HashMap;
import java.util.Map;
 
public class Map01 {
    public static void main(String[] args) {
        Map<String,String> map = new HashMap<>();
 
        map.put("STU001","Andy");
        map.put("STU002","Jack");
        map.put("STU003","Tom");
        map.put("STU004","Bob");
        map.put("STU004","Smith");//设置（修改）
        //如果键不存在，则表示添加元素。如果键存在，则表示设置值。
 
        //删除
        System.out.println(map.remove("STU003"));  //Tom
        //判断是否包含
        System.out.println(map.containsKey("STU003"));  //false
        System.out.println(map.containsKey("STU004"));  //true
        System.out.println("-----------------------");
        System.out.println(map.containsValue("Tom"));  //false
        System.out.println(map.containsValue("Smith")); //true
 
        System.out.println("-----------------------");
        System.out.println(map.isEmpty());//判断集合是否为空   false
        map.clear();//清空集合
        System.out.println(map.isEmpty()); //true
 
        System.out.println(map); //{}
 
    }
}

Map集合的获取功能

java 复制代码

import java.util.Collection;
import java.util.HashMap;
import java.util.Map;
import java.util.Set;
 
public class map_get {
    public static void main(String[] args) {
        Map<String,String> map = new HashMap<>();
 
        map.put("STU001","Andy");
        map.put("STU002","Jack");
        map.put("STU003","Tom");
        map.put("STU004","Bob");
 
        //get通过键获取值
        System.out.println(map.get("STU003"));
        System.out.println("------------------");
        //keySet 获取所有键的Set集合
        Set<String> keySet = map.keySet();
        System.out.println(keySet);
        //values  获取所有值的Collection集合
        Collection<String> values = map.values();
        System.out.println(values);
        //entrySet  获取所有键值对对象的Set集合
        Set<Map.Entry<String, String>> es = map.entrySet();
        //Map集合通过entrySet()方法转换成的这个Set集合，Set集合中元素的类型是 Map.Entry<K,V>
        //Map.Entry和String一样，都是一种类型的名字，只不过：Map.Entry是静态内部类，是Map中的静态内部类
        System.out.println(es);
         //[STU001=Andy, STU003=Tom, STU002=Jack, STU004=Bob]
         for (Map.Entry<String, String> entry:es){
             System.out.println("key:"+entry.getKey()+"    "+"value:"+entry.getValue());
         }
        /*
        key:STU001    value:Andy
        key:STU003    value:Tom
        key:STU002    value:Jack
        key:STU004    value:Bob
         */
    }
}

哈希表

通过数组 + 链表实现的一种数据结构

哈希表的构造方法的参数是一个长度为16个元素的数组，通过哈希值 % 16 的值，作为头节点在数组中选择对应的位置，就形成了哈希表。

HashMap

底层源码

java 复制代码

 public class HashMap{
            // HashMap底层实际上就是一个数组。（一维数组）
            Node<K,V>[] table;
            // 静态的内部类HashMap.Node
            static class Node<K,V> {
                final int hash; // 哈希值（哈希值是key的hashCode()方法的执行结果。hash值通过哈希函数/算法，可以转换存储成数组的下标。）
                final K key; // 存储到Map集合中的那个key
                V value; // 存储到Map集合中的那个value
                Node<K,V> next; // 下一个节点的内存地址。
            }
        }

特点

1、无序，不可重复。

为什么无序？因为不一定挂到哪个单向链表上。

不可重复是怎么保证的？ equals方法来保证HashMap集合的key不可重复。

如果key重复了，value会覆盖。
2、放在HashMap集合key部分的元素其实就是放到HashSet集合中了。

所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。
3、HashMap集合的默认初始化容量是16，默认加载因子是0.75

这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候，数组以二叉树开始扩容。

重点，记住：HashMap集合初始化容量必须是2的倍数，这也是官方推荐的，

这是因为达到散列均匀，为了提高HashMap集合的存取效率，所必须的。

注意

1.向Map集合中存，以及从Map集合中取，都是先调用key的hashCode方法，然后再调用equals方法！ equals方法有可能调用，也有可能不调用。拿put(k,v)举例，什么时候equals不会调用？

k.hashCode()方法返回哈希值，哈希值经过哈希算法转换成数组下标。数组下标位置上如果是null，equals不需要执行。拿get(k)举例，什么时候equals不会调用？ k.hashCode()方法返回哈希值，哈希值经过哈希算法转换成数组下标。数组下标位置上如果是null，equals不需要执行。

4.假设将所有的hashCode()方法返回值固定为某个值，那么会导致底层哈希表变成了纯单向链表。

这种情况我们成为：散列分布不均匀。什么是散列分布均匀？
假设有100个元素，10个单向链表，那么每个单向链表上有10个节点，这是最好的，是散列分布均匀的。假设将所有的hashCode()方法返回值都设定为不一样的值，可以吗，有什么问题？不行，因为这样的话导致底层哈希表就成为一维数组了，没有链表的概念了。也是散列分布不均匀。散列分布均匀需要你重写hashCode()方法时有一定的技巧。