Java集合提升 - 技术栈

1. 手写ArrayList

1.1. ArrayList底层原理细节

底层结构是一个长度可以动态增长的数组（顺序表）transient Object[] elementData;
特点：在内存中分配连续的空间，只存储数据，不存储地址信息。位置就隐含着地址。
优点
1. 节省存储空间，因为分配给数据的存储单元全用于存放节点的数据（不考虑c/c++中数组需指定大小的情况），节点之间的逻辑关系没有占有额外的存储空间
2. 索引查找效率高，即每一个节点对应一个序号，由该序号可以直接计算出来节点的存储地址。
缺点
1. 插入和删除操作需要移动元素，效率较低
2. 必须提前分配固定数量的空间，如果存储元素少，可能导致空闲浪费
3. 按照内容查询效率低，因为需要逐个比较判断
通过无参构造方法创建对象时，JDK1.7初始长度时10；JDK1.8初始长度是0，在第一次添加元素时就进行扩容
容量不足时，每次扩容增加50%，int newCapacity = oldCapacity + (oldCapacity >> 1);
提供一个内部类ltr，实现了Iterator接口。用来对ArrayList进行遍历

java 复制代码

public Iterator<E> iterator() {
    return new itr();
}
private class itr implements Iterator<E> {
}

1.2. 定义List接口和Iterator接口

java 复制代码

public interface Iterator<T> {
    boolean hasNext();
    T next();
}
public interface List {
    // 返回线性表的大小，即数据元素的个数
    public int size();
    // 返回线性表中序号为i的数据元素
    public Object get(int i);
    // 如果线性表为空返回true，否则返回false
    public boolean isEmpty();
    // 判断线性表是否包含数据元素e
    public boolean contains(Object e);
    // 返回数据元素e在线性表中的序号
    public int indexOf(Object e);
    // 将数据元素e插入到线性表中i号位置
    public void add(int i, Object e);
    // 将数据元素e插入到线性表末尾
    public void add(Object e);
    // 将数据元素e插入到元素obj之前
    public boolean addBefore(Object obj, Object e);
    // 将数据元素e插入到元素obj之后
    public boolean addAfter(Object obj, Object e);
    // 删除线性表中序号为i的元素并返回
    public Object remove(int i);
    // 删除线性表中第一个与e相同的元素
    public boolean remove(Object e);
    // 替换线性表中序号为i的数据元素为e，返回原数据元素
    public Object replace(int i, Object e);
    // 迭代List
    public Iterator iterator();
}

1.3. 手写ArrayList

java 复制代码

/*
* 自定义数组越界异常
* */
public class IndexOutOfBoundsException extends RuntimeException {
    public IndexOutOfBoundsException() {}
    public IndexOutOfBoundsException(String message) {
        super(message);
    }
}
public class ArrayList implements List {
    // 底层数组来存储多个元素
    private Object[] elementData;
    // 存储元素的个数，线性表的长度，不是数组长度
    private int size;
    public ArrayList() {
        // 查看真实的ArrayList无参数构造方法是怎么实现的
        this(10);
        // this.elementData = new Object[]();
        // this.elementData = new Object[0];
    }
    public ArrayList(int initialCapacity) {
        // 如果initialCapacity<0，抛出异常
        if(initialCapacity < 0) {
            throw new IndexOutOfBoundsException("初始长度要大于0: " + initialCapacity);
        }
        // 按照初始长度给数组分配空间
        elementData = new Object[initialCapacity];
        // 指定线性表初始元素个数，可以省略，int成员变量默认值0
        // this.size = 0;
    }
    @Override
    public int size() {
        return size;
    }
    @Override
    public Object get(int i) {
        // 对i值进行判断
        if(i >= size) {
            throw new IndexOutOfBoundsException("数组指针越界异常：" + i);
        }
        return elementData[i];
    }
    @Override
    public boolean isEmpty() {
        return size == 0;
    }
    @Override
    public boolean contains(Object e) {
        // 逐个判断各元素是否与要查询元素内容相同，效率低下
        // 注意不是elementData.length，而是size
        /*for (int i = 0; i < size; i++) {
            if(e.equals(elementData[i])) return true;
        }
        return false;*/
        return this.indexOf(e) >= 0;
    }
    @Override
    public int indexOf(Object e) {
        // 逐个判断各个元素是否与要查询元素内容相同，效率低下
        // 有漏洞，如果e为null，使用if分别处理
        for (int i = 0; i < size; i++) {
            if(e.equals(elementData[i])) {
                return i;
            }
        }
        return -1;
    }
    @Override
    public void add(int i, Object e) {
        // 如果i超过了size，抛出异常
        if(i > size || i < 0) {
            throw new IndexOutOfBoundsException("数组指针越界异常：" + i);
        }
        // 需要先判断length是否足够，如果已经满了，需要扩容
        if(size == this.elementData.length) {
            grow();
        }
        // 添加元素
        // 从后向前移后面元素一个位置
        for (int j = size; j > i; j--) {
            this.elementData[i] = this.elementData[j-1];
        }
        // 添加元素到指定位置
        this.elementData[i] = e;
        // 元素个数+1
        this.size++;
    }
    @Override
    public void add(Object e) {
        // 需要先判断length是否足够，如果已经满了，需要扩容
        if(size == this.elementData.length) {
            grow();
        }
        // 增加元素
        this.elementData[size] = e;
        // 元素长度+1
        size++;
        // 可以合并成一条语句
        // this.elementData[size++] = e;
    }
    private void grow() {
        // 创建一个新的更长数组
        /*Object[] newArr = new Object[this.elementData.length * 2];
        // 将旧数组数据放入到新数组
        for (int i = 0; i < this.elementData.length; i++) {
            newArr[i] = this.elementData[i];
        }
        // 旧数组引用指向新数组
        this.elementData = newArr;*/
        elementData = Arrays.copyOf(elementData, this.elementData.length * 2);
    }
    @Override
    public String toString() {
        if(this.size == 0) return "[]";
        StringBuilder builder = new StringBuilder();
        builder.append("[");
        for (int i = 0; i < size; i++) {
            if(i != size - 1) {
                builder.append(this.get(i) + ",");
            }else {
                builder.append(this.get(i));
            }
        }
        builder.append("]");
        return builder.toString();
    }
    public Iterator iterator() {
        return new Itr();
    }
    private class Itr<T> implements Iterator<T> {
        // 指向当前元素，默认第一个（索引是0）
        int cursor = 0;
        // 指定当前元素的前一个元素用途在于remove使用
        int lastRet = -1;
        @Override
        public boolean hasNext() {
            return cursor != size;
        }
        @Override
        public T next() {
            int i = cursor;
            cursor++;
            // 如果不进行hasNext()判断，就可能越界
            if(i > size) {
                throw new RuntimeException("没有这个元素了");
            }
            return (T)elementData[i];
        }
    }
}

1.4. 测试ArrayList

java 复制代码

public class TestArrayList {
    public static void main(String[] args) {
        // 创建线性顺序表
        List list = new ArrayList();
        // 向末尾添加元素
        list.add("111");
        list.add("222");
        list.add(2, "AAAA");
        // 进行各种操作验证添加
        System.out.println(list.size()); // 3
        System.out.println(list.isEmpty()); // false
        System.out.println(list.get(2)); // AAAA
        System.out.println(list.contains("2")); // false
        System.out.println(list.indexOf("222")); // 1
        System.out.println(list.toString()); // [111,222,AAAA]
        Iterator<String> it = list.iterator();
        while (it.hasNext()) {
            String elem = it.next();
            System.out.println(elem);
        }
    }
}

2. 手写单链表和LinkedList

2.1. 单链表技能点

认识单链表
* 特点
- 数据元素的存储对应的是不连续的存储空间，每个存储节点对应一个需要存储的数据元素
- 每个节点是由数据域和指针域组成。元素之间的逻辑关系通过存储节点之间的链接关系反映出来。逻辑上相邻的节点物理上不必相邻。
缺点
1. 比顺序存储结构的存储密度小（每个节点都由数据域和指针域组成，所以相同空间内假设全存满，顺序比链式存储的更多）
2. 按照索引查找节点时，链式存储比顺序存储满（每个节点地址不连续、无规律，导致按照索引查询效率低下）
优点
1. 插入、删除灵活（不必移动节点，只要改变节点中的指针，但是需要先定位到元素上）
2. 有元素才会分配节点空间，不会有闲置的节点
添加节点
删除节点
带头节点的单链表
在使用单链表实现线性表时，为了使程序更加简洁，通常在单链表最前面添加一个哑元节点，也称头节点。
在头节点中不存储任何实质的数据对象，其next域指向线性表中0号元素所在的节点
可以对空表、非空表的情况以及对首元节点进行统一管理，编程更方便，常用头节点。
一个不带头节点和带头节点的单链表实现线性表的结构如图所示

2.2. 手写单链表

定义单链表节点

java 复制代码

public class Node {
    // 存储数据
    Object data;
    // 指向下一个节点的指针
    Node next;
    public Node() {
        super();
    }
    public Node(Object data) {
        super();
        this.data = data;
    }
    public Node(Object data, Node next) {
        super();
        this.data = data;
        this.next = next;
    }
    public Object getData() {
        return data;
    }
    public void setData(Object data) {
        this.data = data;
    }
    public Node getNext() {
        return next;
    }
    public void setNext(Node next) {
        this.next = next;
    }
    @Override
    public String toString() {
        return "Node{" +
                "data=" + data +
                ", next=" + next +
                '}';
    }
}

手写单链表

java 复制代码

public class SingleLinkedList implements List{
    // 头节点，哑巴节点，不存储数据，为了方便编程
    private Node head = new Node();
    // 节点的个数
    private int size = 0;
    @Override
    public int size() {
        return size;
    }
    @Override
    public Object get(int i) {
        // i从0开始
        // 判断i值是否合理
        if(i < 0 || i >= size) {
            throw new IndexOutOfBoundsException("索引越界：" + i);
        }
        // 从第一个节点开始查找
        Node p = head.next; // p初始指向第一个节点（不是头节点）
        for (int j = 0; j < i; j++) {
            // p指向下个节点
            p = p.next;
        }
        // 返回第i个节点，而不是第i个节点的data
        return p;
    }
    @Override
    public void add(int i, Object e) {
        // i值合理性判断
        if(i < 0 || i > size) {
            throw new IndexOutOfBoundsException("索引越界：" + i);
        }
        // 先找到前一个（如果当前索引是0，前一个就是head）
        Node p = head;
        if(i != 0) {
            p = (Node)this.get(i - 1);
        }
        // 创建一个新节点，给data复制
        Node newNode = new Node(e);
        // 指定新节点的下一个节点
        newNode.next = p.next;
        // 指定前一个节点的下一个节点是当前新节点
        p.next = newNode;
        // 数量+1
        size++;
    }
    @Override
    public Object remove(int i) {
        if(i < 0 || i>= size) {
            throw new IndexOutOfBoundsException("索引越界：" + i);
        }
        // 先找到前一个（如果当前索引是0，前一个就是head）
        Node p = head;
        if(i != 0) {
            p = (Node)this.get(i - 1);
        }
        // 指向要删除的节点
        Node currentNode = p.next;
        // 完成删除操作
        p.next = currentNode.next;
        currentNode.next = null;
        // 提示将要删除的节点变成垃圾
        currentNode = null;
        // 数量-1
        size--;
        return null;
    }
    @Override
    public String toString() {
        StringBuilder builder = new StringBuilder("[");
        // p初始指向第一个节点（不是头节点）
        Node p = head.next;
        for (int j = 0; j < size; j++) {
            builder.append(p.data + "   ");
            // p指向下一个节点
            p = p.next;
        }
        builder.append("]");
        return builder.toString();
    }
    @Override
    public boolean isEmpty() {
        return size == 0;
    }
}

单链表添加、删除、查询原理
测试单链表

java 复制代码

public class TestList {
    public static void main(String[] args) {
        java.util.ArrayList list2;
        // 创建线性顺序表
        List list = new SingleLinkedList();
        // 向末尾添加元素
        list.add("1");
        list.add("2");
        list.add("3");
        list.add(3, "4");
        list.remove(2);
        // 进行各种操作验证添加
        System.out.println(list.size()); // 3
        System.out.println(list.isEmpty()); // false
        System.out.println(list.contains("4")); // true
        System.out.println(list.indexOf("2")); // 1
        System.out.println(list.toString()); // [1 2 4]
    }
}

2.3. 手写LinkedList

LinkedList底层原理
- LinkedList底层是一个双向链表；添加、删除元素效率高；按照索引查找效率低。可以两个方向查询
- 每个节点都包含了对前一个和后一个元素的引用
- LinkedList同时实现了List、Deque、Queue接口，所以可以当作线性表、队列、双端队列、栈使用
- LinkedList是非同步的（线程不安全）
- 不存在LinkedList容量不足的问题
定义LinkedList节点

java 复制代码

public class LinkedList implements List{
    /*
    * 静态内部类，代表LinkedList的每个节点
    * */
    public static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;
        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
        @Override
        public String toString() {
            return "Node{" +
                    "item=" + item +
                    ", next=" + next +
                    ", prev=" + prev +
                    '}';
        }
    }
}

java 复制代码

public class LinkedList implements List{
    transient int size = 0;
    transient Node first;
    transient Node last;
    @Override
    public int size() {
        return size;
    }
    @Override
    public Object get(int i) {
        return node(i).item;
    }
    @Override
    public boolean isEmpty() {
        return size == 0;
    }
    @Override
    public boolean contains(Object e) {
        return false;
    }
    @Override
    public int indexOf(Object e) {
        return 0;
    }
    @Override
    public void add(int index, Object element) {
        if(index == size) {
            linkLast(element);
        }else {
            linkBefore(element, node(index));
        }
    }
    Node node(int index) {
        if(index < (size >> 1)) {
            Node x = first;
            for (int i = 0; i < index; i++) {
                x = x.next;
            }
            return x;
        }else {
            Node x = last;
            for (int i = size - 1; i > index; i--) {
                x = x.prev;
            }
            return x;
        }
    }
    void linkBefore(Object e, Node succ) {
        final Node pred = succ.prev;
        final Node newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if(pred == null) {
            first = newNode;
        }else {
            pred.next = newNode;
        }
        size++;
    }
    @Override
    public void add(Object e) {
        linkLast(e);
    }
    public void linkLast(Object e) {
        final Node l = last;
        final Node newNode = new Node<>(l, e, null);
        last = newNode;
        if(l == null) {
            first = newNode;
        }else {
            l.next = newNode;
        }
        size++;
    }
    public String toString() {
        return first.toString();
    }
}

LinkedList的add(Object)方法的实现过程
测试LinkedList

java 复制代码

public class TestList1 {
    public static void main(String[] args) {
        // 创建线性顺序表
        List list = new LinkedList();
        // 向末尾添加元素
        list.add(1);
        list.add(2);
        list.add(3);
        list.add(3, 4);
        // 进行各种操作验证添加
        System.out.println(list.size()); // 4
        System.out.println(list.isEmpty()); // false
        System.out.println(list.get(0)); // 1
    }
}

3. 手写HashMap

3.1. HashMap的原理

底层结构是哈希表，采用了顺序表+链表结合的结构；同一个链表上所有元素的存储地址都是相同的，是发生冲突的元素
链表上每个节点的就是一个Entry，字段包括四部分

同一个链表上节点的哈希码可能不相同，存储的地址是相同的
哈希表的优点
- 添加块、查询块（通过计算得到存储位置，不是通过比较）
- 无序
- key唯一
关键参数
- 默认主数组长度16
- 默认装填因子0.75
- 每次主数组扩容为原来的2倍
JDK8中，当链表长度大于8时，链表变为红黑树
第一步计算哈希码，不仅调用了hashCode()，又进行了多次散列。目的在于key不同，哈希码尽量不同，减少冲突

java 复制代码

final int hash(Object k) {
    int h = 0;
    h ^= k.hashCode();
    h ^= (h >>> 20) ^ (h >>> 12);
    return h ^ (h >>> 7) ^ (h >>> 4);
}

细节：发生冲突，经过比较不存在相同key的元素，要添加一个新的节点。不是加到链表最后，而是添加到链表最前。

3.2. 定义Map接口

java 复制代码

public interface Map {
    // 定义方法
    public void put(Object key, Object value);
    public Object get(Object key);
    public int size();
    public boolean isEmpty();
    // 定义内部接口
    interface Entry {
        public Object getKey();
        public Object getValue();
    }
}

3.3. 手写HashMap

java 复制代码

public class HashMap implements Map{
    // 指向哈希表的数组引用
    public Entry[] table;
    // 键值对数量
    int size;
    public HashMap() {
        // 哈希表主数组默认长度16
        table = new Entry[11];
    }
    @Override
    public void put(Object key, Object value) {
        // 计算哈希码
        int hash = key.hashCode();
        // 根据哈希码计算存储位置
        int index = hash % table.length;
        // 存入指定位置
        // 如果该位置没有元素，增加一个节点
        if(table[index] == null) {
            table[index] = new Entry(hash, key, value);
            size++;
        }else {
            // 如果有元素，进行逐个比较
            Entry entry = table[size];
            while (entry != null) {
                // 如果找到了相同的key
                if(entry.getKey().equals(key)) {
                    // 新的value替代旧的value
                    entry.value = value;
                    return;
                }
                entry = entry.next;
            }
            // 循环结束，表明也没有相同的key，在链表最前添加一个节点
            Entry firstEntry = table[index];
            table[index] = new Entry(hash, key, value, firstEntry);
            size++;
        }
    }
    @Override
    public Object get(Object key) {
        // 计算哈希码
        int hash = key.hashCode();
        // 根据哈希码计算存储位置
        int index = hash % table.length;
        // 查找对应的Entry
        Entry entry = null;
        if(table[index] != null) {
            Entry currentEntry = table[index];
            while (currentEntry != null) {
                if(currentEntry.getKey().equals(key)) {
                    entry = currentEntry;
                    break;
                }
                currentEntry = currentEntry.next;
            }
        }
        return entry == null ? null : entry.getValue();
    }
    @Override
    public String toString() {
        StringBuilder builder = new StringBuilder("{");
        for (int i = 0; i < table.length; i++) {
            if(table[i] != null) {
                Entry entry = table[i];
                while (entry != null) {
                    builder.append(entry.getKey() + "=" + entry.getValue() + "," + entry = entry.next);
                }
            }
        }
        if(builder.length() != 1) {
            builder.deleteCharAt(builder.length() - 1);
        }
        builder.append("}");
        return builder.toString();
    }
    @Override
    public int size() {
        return size;
    }
    @Override
    public boolean isEmpty() {
        return size == 0;
    }
}
public class Entry implements Map.Entry{
    private int hash;
    private Object key;
    private Object value;
    // 指向下一个节点的指针
    private Entry next;
    public Entry() {}
    public Entry(int hash, Object key, Object value) {
        this.hash = hash;
        this.key = key;
        this.value = value;
    }
    public Entry(int hash, Object key, Object value, Entry next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }
    @Override
    public Object getKey() {
        return key;
    }
    @Override
    public Object getValue() {
        return value;
    }
    @Override
    public String toString() {
        return "Entry{" +
                "hash=" + hash +
                ", key=" + key +
                ", value=" + value +
                ", next=" + next +
                '}';
    }
}

3.4 测试HashMap

java 复制代码

public class TestHashMap {
    public static void main(String[] args) {
        java.util.HashMap map1;
        HashMap map = new HashMap();
        map.put(23, "china");
        map.put(36, "Japan");
        System.out.println(map.size());
        System.out.println(Arrays.toString(map.table));
        System.out.println(map);
    }
}

4. 新一代并发集合类

4.1. 手写HashSet

HashSet底层就是HashMap，哈希表的每个Entry的key是每个元素，value统一都是new Object()

java 复制代码

public interface Set {
    public int size();
    public void add(Object obj);
    public boolean isEmpty();
    public boolean contains(Object obj);
}
public class HashSet implements Set {
    private transient HashMap map;
    private static final Object PRESENT = new Object();
    public HashSet() {
        this.map = new HashMap();
    }
    @Override
    public int size() {
        return map.size();
    }
    @Override
    public void add(Object key) {
        map.put(key, PRESENT);
    }
    @Override
    public boolean isEmpty() {
        return map.isEmpty();
    }
    @Override
    public boolean contains(Object obj) {
        return map.get(obj) != null;
    }
}

4.2. 三代集合类发展过程

第一代线程安全集合类
- Vector、Hashtable：使用synchronized修饰方法来保证线程安全
- 缺点：效率低下
第二代线程非安全集合类（主流）
- ArrayList、HashMap：线程不安全，但性能好，用来替代Vector、Hashtable
- 线程安全的：使用Collections.synchronizedList(list)和Collections.synchronizedMap(m)，底层使用synchronized代码块锁，虽然也是锁住了所有的代码，但是所在方法里面，比所在方法外性能稍有提高，毕竟进方法本身是要分配资源的
第三代线程安全集合类（波浪式前进，螺旋式上升）
- 在有大量并发下，使用java.util.concurrent.*中的ConcurrentHashMap、CopyOnWriteArrayList、CopyOnWriteArraySet来提高集合的效率和安全，底层大都采用Lock锁（1.8的ConcurrentHashMap不使用Lock锁），保证安全的同时，性能也很高

4.3. 新一代并发集合类

ConcurrentHashMap：分段（segment）锁定+Lock锁
- JDK1.7中
  - 比HashMap的线程安全，并且性能比Hashtable好，Collections.synchronizedMap(m)都有提高
  - 使用的不是synchronized代码块锁或方法锁，使用了锁分离技术，用多个锁来控制对hash表的不同部分（段segment）进行的修改，采用ReentrantLock锁来实现
  - 如果多个修改操作发生在不同的段上，就可以并发执行，从而提高效率
- JDK1.8中
  - 摒弃了segment锁段的概念，而是采用了volatile+CAS实现无锁化操作。**底层由数组+链表+红黑树的方式（JDK1.8中HashMap的实现）。**为了做到并发，又增加了很多辅助的类，如TreeBin，Traverser等对象内部类
CopyOnWriteArrayList：CopyOnWrite+Lock锁
- 对于set()、add()、remove()等方法使用ReentrantLock的Lock和unlock来加锁和解锁，读操作不需要加锁（之前集合安全类，即使读操作也要加锁，保证数据的实时一致）
- CopyOnWrite原理：写时复制
  - 当往一个容器中添加元素时，不直接添加，而是先将容器进行copy，然后往新容器中添加元素
  - 添加完元素之后，再将原容器的引用指向新容器。这样做的好处是可以对CopyOnWrite容器进行并发读，而不需要加锁，因为当前容器不会添加任何元素，所以CopyOnWrite容器也是一种读写分离的思想，读和写使用不同的容器。
  - 适合对于读操作远多于写操作的应用，特别在并发的情况下，可以提高性能的并发读取
  - CopyOnWrite容器只能保证数据的最终一致性，不能保证数据实时一致性。因此，如果希望写入数据马上能读到，就不要使用CopyOnWrite容器

java 复制代码

	public boolean add(E e) {
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            Object[] elements = getArray();
            int len = elements.length;
            // 复制出新数组
            Object[] newElements = Arrays.copyOf(elements, len + 1);
            // 把新元素添加到新数组中
            newElements[len] = e;
            // 把原数组引用指向新数组
            setArray(newElements);
            return true;
        }finally {
            lock.unlock();
        }

    }
    final void setArray(Object[] a) {
        array = a;
    }
    public E get(int index) {
        return get(getArray(), index);
    }

注意：读时不需要加锁，如果读时有多个线程正在向ArrayList添加数据，读还是会读到旧数据，因为写时不会锁住旧的ArrayList

CopyOnWriteArraySet：CopyOnWrite+Lock锁
- 线程安全的无序集合，CopyOnWriteArraySet和HashSet都继承于共同的父类AbstractSet；但是HashSet是通过散列表HashMap实现的，而CopyOnWriteArraySet是通过动态数组CopyOnWriteArrayList实现的
- CopyOnWriteArraySet在CopyOnWriteArrayList基础上使用了Java的装饰模式，所以底层是相同的。 而CopyOnWriteArrayList本质是动态数组队列，所以CopyOnWriteArraySet相当于通过动态数组实现的集合
- CopyOnWriteArrayList中允许有重复的元素；但CopyOnWriteArraySet不能有重复的元素。因此，CopyOnWriteArrayList额外提供了addIfAbsent()和addAllAbsent()这两个添加元素的API，通过API来添加元素，只有当元素不存在时才执行添加操作。