重修设计模式-行为型-迭代器模式

重修设计模式-行为型-迭代器模式

提供一种方法访问一个容器对象中各个元素,而又不需暴露该对象的内部细节。

迭代器模式(Iterator Pattern)将容器的遍历操作从容器类中拆分出来,放到迭代器类中,让两者的职责更加单一。容器对象的遍历与其内部表示分离,可以更好的支持对容器对象的多种遍历算法,并且可以在不修改容器对象本身的前提下增加新的遍历方式。

迭代器是用来遍历容器的,一个完整的迭代器模式包含容器迭代器 两部分内容。基于面向接口而非细节的编程思想,集合又分为容器接口、容器实现类;迭代器又包含迭代器接口、迭代器实现类,它们的关系如下所示:

迭代器角色介绍如下:

  1. 容器(Collection):它持有一组对象,可以是一个列表、数组或其他数据结构。这个对象实现了一个创建迭代器(Iterator)的接口。
  2. 迭代器(Iterator) :它是一个定义了遍历集合元素的接口。迭代器对象从集合对象中获取元素,并遍历这些元素。迭代器的典型方法包括 hasNext()(判断是否有下一个元素)和 next()(返回下一个元素)。
  3. 具体容器(Concrete Collection):它实现了容器接口,以存储和管理对象集合,并返回一个实现了迭代器接口的具体迭代器实例。
  4. 具体迭代器(Concrete Iterator):它实现了迭代器接口,并持有对具体容器的引用,通过遍历集合中的元素来实现迭代器的核心方法。

大部分编程语言都提供了遍历容器的迭代器类,在平时开发中直接拿来用即可,不大可能从零编写一个迭代器,所以迭代器模式的应用场景也非常少见。不过为了理解迭代器模式的原理,还是举个例子,从头来实现迭代器模式。

例如,在开发中线性数据结构 会经常使用,实现的方式又包括数组链表,下面为这个容器来实现一个迭代器。

首先是容器部分,数组和链表对应 ArrayListLinkedList 两个类。基于接口而非实现编程的思想,再从两个类中抽象出公共的接口 List,容器部分代码如下:

kotlin 复制代码
//容器接口
interface List<E> {
    //1.封装的迭代器方法
    fun iterator(): Iterator<E>	

    //2.容器相关的抽象方法
    fun add(e: E)

    fun remove(e: E)

    fun size(): Int

    fun get(index: Int): E
}

//具体容器1
class ArrayList<E>(): List<E> {
    private val arrayList = java.util.ArrayList<E>()
    //3.返回对应的迭代器
    override fun iterator(): Iterator<E> {
        return ArrayListIterator(this)
    }

    override fun size(): Int {
        //...
        return arrayList.size
    }

    override fun get(index: Int): E {
        return arrayList.get(index)
    }

    override fun remove(e: E) {
        //...
    }

    override fun add(e: E) {
        //...
    }
}

//具体容器2
class LinkedList<E>(): List<E> {
    //...
}

至此容器部分已经定义好了,接下来再定义迭代器部分。

kotlin 复制代码
//抽象迭代器
interface Iterator<E> {
    operator fun hasNext(): Boolean
    operator fun next(): E?
}

//ArrayList的具体迭代器
class ArrayListIterator<E>(val list: ArrayList<E>) : Iterator<E> {
    private var cursor = 0  //游标

    override fun hasNext(): Boolean {
        return cursor < list.size()
    }

    override fun next(): E? {
        if (cursor >= list.size()) {
            throw NoSuchElementException()
        }
        return list.get(cursor)
    }
}

至此一个完整的迭代器模式已经完整定义出来了,下面是调用方需要迭代容器元素时的代码:

kotlin 复制代码
fun main() {
    val arrayList = ArrayList<String>()
    arrayList.add("人生")
    arrayList.add("得意")
    arrayList.add("须尽欢")
    val iterator = arrayList.iterator()
    while (iterator.hasNext()) {
        val element = iterator.next()
        println("e:${element}")
    }
}
//输出:
人生
得意
须尽欢

以上就是迭代器的原理和代码实现。其实集合的遍历还可以通过 for 循环的方式,那么迭代器模式和 for 循环相比有哪些优势呢?

kotlin 复制代码
fun main() {
    //通过for循环遍历:
    for (i in 0 until list.size()) {
        println("e:${list.get(i)}")
    }
}

首先,对于类似数组和链表这样的数据结构,遍历方式比较简单,直接使用 for 循环来遍历就足够了。但是,对于复杂的数据结构(比如树、图)来说,有各种复杂的遍历方式。比如,树有前中后序、按层遍历;图有深度优先、广度优先遍历等等。如果由客户端代码来实现这些遍历算法,势必增加开发成本,且容易写错。如果将这部分遍历的逻辑写到容器类中,也会导致容器类代码的复杂性。

foreach 循环只是一个语法糖,底层是基于迭代器实现的。

所以面对复杂数据结构时,就需要使用迭代器模式,将容器代码和遍历代码进行解耦,将容器的遍历操作从容器类中拆分出来。比如,针对图的深度优先遍历和广度优先遍历,就可以定义 DFSIteratorBFSIterator 两个迭代器类来实现不同的遍历算法,在添加新的遍历算法时,只需要扩展新的迭代器类即可,非常符合开闭原则。而且每个迭代器独享自己的游标信息,就可以创建多个迭代器,同时对一个容器进行遍历。

至此我们可以总结出迭代器模式的优缺点:

优点:

  1. 职责分离:容器代码和遍历代码解耦,让两者职责更加单一,从而可以灵活的增加和修改遍历算法,符合开闭原则。
  2. 简化集合的遍历:迭代器提供了一个统一的接口来遍历集合对象,不需要调用者了解集合的内部结构。
  3. 使用灵活:迭代器之间相互独立,多个迭代器可同时遍历同一个容器。
  4. 安全性:由于集合对象的内部表示被封装起来,外部代码只能通过迭代器接口访问集合元素,这有助于保护集合对象的数据安全。

缺点:

  1. 增加复杂性:对于简单的集合,使用迭代器模式可能会增加额外的类和方法,从而增加代码的复杂性。
  2. 性能考虑:在某些情况下,使用迭代器可能比直接访问集合元素要慢,因为迭代器需要在每次调用 next() 方法时检查是否有下一个元素。

如何在迭代器中修改元素

通过迭代器来遍历集合元素的同时,如果增加或者删除集合中的元素,有可能会导致某个元素被重复遍历或遍历不到,也有可能正常遍历(运行结果的对错,要视情况而定),这种情况称为结果不可预期行为

举个例子:

kotlin 复制代码
fun main() {
    val list = java.util.ArrayList<String>()
    list.add("a")
    list.add("b")
    list.add("c")
    list.add("d")

    val iterator = list.iterator()
    list.remove("b")
    println(iterator.next())
}

集合中存在 a、b、c、d 四个元素,在进行迭代器遍历时,如果其他地方删除了容器内的元素 b,此时对容器继续遍历就会产生不可预期的行为:正常遍历或漏掉某个元素。

原因是为了保持数组存储数据的连续性,数组的删除操作会涉及元素的搬移,从而导致迭代器中游标和数组元素不匹配了,流程如下:

同样,遍历过程中外部对容器添加元素也会造成未决行为:

虽然我们知道游标前删除或添加元素,会导致遍历漏掉或重复遍历元素;游标后删除或添加元素则遍历结果正常,但不知道的是外部会在什么时机对容器元素进行修改,所以是未决行为。

要解决迭代器遍历集合时,增加、删除集合元素导致的不可预期行为有两个方案:

  1. 迭代器遍历时,禁止增删元素(困难
  2. 遵循fail-first思想,在增删元素之后立即让迭代器遍历报错,将错误尽早抛出(合理

第一种解决方案比较难实现,需要确定遍历开始和结束的时间点。遍历开始的时间节点很容易获得,比如迭代器的创建时间。但遍历结束的时间点无法确认,毕竟存在遍历到一半就结束的情况,如果调用方主动通知结束遍历,又会增加调用成本,所以该方案pass。

第二种解决方案比较合理,Java 中的迭代器使用的就是该方案,增删元素后,让迭代器报错。具体实现步骤如下:

首先容器内维护一个成员变量 modCount,记录容器被修改的次数。每次容器增加或删除元素时候,都让 modCount + 1。其次迭代器也维护一个成员变量 expectedModCount,用来记录迭代器创建时,容器的修改次数。当通过 iterator() 函数创建迭代器时,将容器 modCount 赋值给迭代器 expectedModCount 变量,每次调用迭代器方法(如 hasNext()、next())时,都校验一下当前容器的修改次数 modCount,是否等于迭代器创建时容器的修改次数 expectedModCount,也就是看迭代器创建后 modCount 是否修改过。如果两个值不同,则说明容器修改过了,迭代器继续运行会产生不可预期的结果,此时选择 fail-fast 方式,抛出异常,尽早终止迭代流程。

kotlin 复制代码
//容器:
class ArrayList<E>(): List<E> {
    var modCount: Int = 0  //1.记录容器修改次数
	...

    override fun remove(e: E) {
        modCount++
        //...
    }

    override fun add(e: E) {
        modCount++
        //...
    }
}

//迭代器:
class ArrayListIterator<E>(val list: ArrayList<E>) : Iterator<E> {
    private var cursor = 0  //游标
    private var expectedModCount: Int = list.modCount  //2.记录初始修改次数

    override fun hasNext(): Boolean {
        checkForComodification()
        return cursor < list.size()
    }

    override fun next(): E? {
        checkForComodification()
        if (cursor >= list.size()) {
            throw NoSuchElementException()
        }
        return list.get(cursor)
    }

    //3.校验并抛出异常
    private fun checkForComodification() {
        if (list.modCount != expectedModCount) throw ConcurrentModificationException()
    }
}

//调用时:
fun main() {
    val arrayList = ArrayList<String>()
    arrayList.add("人生")
    arrayList.add("得意")
    arrayList.add("须尽欢")

    val iterator = arrayList.iterator()
    arrayList.add("。")
    iterator.next() //报错:ConcurrentModificationException异常!
}

为什么 Java 的迭代器可以安全的删除元素?

在 Java 中,迭代器还定义了一个 remove() 方法,用于在遍历集合的同时,安全地删除集合中的元素。那么它是怎么做到的?下面分析一下 Java 迭代器的源码:

java 复制代码
public class ArrayList<E> {
  transient Object[] elementData;
  private int size;

  public Iterator<E> iterator() {
    return new Itr();
  }

  //迭代器实现:
  private class Itr implements Iterator<E> {
    int cursor;       // index of next element to return
    int lastRet = -1; // index of last element returned; -1 if no such
    int expectedModCount = modCount;

    Itr() {}

    public boolean hasNext() {
      return cursor != size;
    }

    @SuppressWarnings("unchecked")
    public E next() {
      checkForComodification();
      int i = cursor;
      if (i >= size)
        throw new NoSuchElementException();
      Object[] elementData = ArrayList.this.elementData;
      if (i >= elementData.length)
        throw new ConcurrentModificationException();
      //1. 调用next时,cursor加1,lastRet被赋值为游标的上一个元素
      cursor = i + 1;
      return (E) elementData[lastRet = i];
    }
    
    public void remove() {
      if (lastRet < 0)	//3.调用remove后lastRet为-1,再调用就会抛出异常
        throw new IllegalStateException();
      checkForComodification();

      try {
        //2.删除时,只能删除游标的上一个元素,并将游标回退一个位置
        ArrayList.this.remove(lastRet);
        cursor = lastRet;
        lastRet = -1;
        expectedModCount = modCount;
      } catch (IndexOutOfBoundsException ex) {
        throw new ConcurrentModificationException();
      }
    }
  }
}

在上面的代码实现中,迭代器类新增了一个 lastRet 成员变量,用来记录游标指向的前一个元素。迭代器的 remove 方法也只能删除 lastRet 指向的元素。在删除这个元素时,会将迭代器的游标回退一位,从而避免游标前删除元素导致的某个元素遍历不到。流程如下:

分析源码后可以发现,虽然 Java 中的迭代器提供了删除方法,但使用上也有一定限制:只能删除游标指向的前一个元素,且一个 next() 函数之后,只能跟着最多一个 remove() 操作,多次调用 remove() 操作会报错。

至于 Java 为什么不提供增加元素的方法,个人觉得迭代器的主要作用毕竟是遍历,添加元素的逻辑放到迭代器里本来就不太合适。

总结

迭代器模式提供了一种方法,访问一个容器对象中各个元素,而又不需暴露该对象的内部细节。目的是将容器对象的遍历与其内部表示分离,可以更好的支持对容器对象的多种遍历算法,并且可以在不修改容器对象本身的前提下增加新的遍历方式。

迭代器模式工作原理如下:

  1. 创建容器对象:首先,创建一个具体容器对象,并添加一些元素。
  2. 获取迭代器 :通过容器对象的迭代器创建方法(通常是 iterator()),获取一个具体迭代器对象。
  3. 遍历集合 :使用迭代器对象的 hasNext() 方法检查是否还有元素可以遍历,如果有,则使用 next() 方法获取下一个元素,直到遍历完所有元素。
相关推荐
liuyang-neu1 小时前
力扣 简单 70.爬楼梯
java·算法·leetcode
IronmanJay1 小时前
【LeetCode每日一题】——862.和至少为 K 的最短子数组
数据结构·算法·leetcode·前缀和·双端队列·1024程序员节·和至少为 k 的最短子数组
喵手1 小时前
Java 与 Oracle 数据泵实操:数据导入导出的全方位指南
java·开发语言·oracle
加载中loading...2 小时前
Linux线程安全(二)条件变量实现线程同步
linux·运维·服务器·c语言·1024程序员节
Wx120不知道取啥名2 小时前
C语言之长整型有符号数与短整型有符号数转换
c语言·开发语言·单片机·mcu·算法·1024程序员节
开心工作室_kaic3 小时前
ssm010基于ssm的新能源汽车在线租赁管理系统(论文+源码)_kaic
java·前端·spring boot·后端·汽车
代码吐槽菌3 小时前
基于SSM的汽车客运站管理系统【附源码】
java·开发语言·数据库·spring boot·后端·汽车
biomooc3 小时前
R语言 | paletteer包:拥有2100多个调色板!
r语言·数据可视化·1024程序员节
Hello.Reader3 小时前
FFmpeg 深度教程音视频处理的终极工具
ffmpeg·1024程序员节
zdkdchao3 小时前
jdk,openjdk,oraclejdk
java·开发语言