数据结构 —— 最小生成树

数据结构 ------ 最小生成树

什么是最小生成树
Kruskal算法
Prim算法

今天我们来看一下最小生成树：

我们之前学习的遍历算法并没有考虑权值，仅仅就是遍历结点：
今天的最小生成树要满足几个条件：

考虑权值

所有结点联通

权值之和最小

无环

什么是最小生成树

最小生成树（Minimum Spanning Tree，简称MST）是指在一个加权的、无向的连通图中，由所有顶点构成的一个子图，这个子图是一棵树，并且其所有边的权重之和最小 。换句话说，最小生成树是在保证图中所有顶点连通的前提下，使得连接这些顶点的边的总成本最低的一棵树。

最小生成树具有以下特性：

它包含图中的所有顶点。

它是一个没有环的连通子图（即树）。

它的边数比顶点数少一（对于 n 个顶点的图，有 n-1 条边）。

它的边的总权重是所有可能生成树中最小的。

最小生成树在很多实际应用中都有重要作用，例如在设计电信网络时，为了连接多个地点而需要铺设电缆或光纤，最小生成树可以用来确定一种成本最低的铺设方案。

求解最小生成树的常用算法包括：

Kruskal算法：此算法通过不断选择权重最小的边来构建最小生成树，同时避免添加会导致环路形成的边。它通常利用并查集（Disjoint Set Union）数据结构来检测环路。

Prim算法：此算法从任意一个顶点开始，逐步将顶点及其权重最小的连接边加入到生成树中，直到所有顶点都被包含进来。Prim算法可以使用优先队列（Priority Queue）来高效地选择下一个应加入的边。

我们今天就来介绍一下这两种算法：

Kruskal算法

Kruskal算法，简单来说，就是把所有边拿出来，从小到大挑边，构成最小生成树：

Kruskal算法是一种用于寻找加权、无向连通图的最小生成树（Minimum Spanning Tree, MST）的贪心算法。它的核心思想是在不形成任何环路的情况下，选择权重最小的边来构建生成树，直到所有的顶点都被包含在树中。

以下是Kruskal算法的主要步骤：

排序边：将图中所有的边按照权重从小到大排序。

初始化森林：创建一个森林，其中每个顶点都是一个单独的树（即每个顶点都是一个独立的连通分量）。

选择边：遍历排序后的边列表。对于每条边，检查它的两个端点是否已经在同一棵树中（即是否属于同一个连通分量）。如果不是，将这条边添加到最小生成树中，并将这两个顶点所在的树合并成一棵更大的树。

重复步骤3 ：继续选择满足条件的边，直到最小生成树中包含了图中的所有顶点，或者已经选择了n-1条边（其中n是顶点的数量）。

Kruskal算法的关键在于能够快速地检测边的两个端点是否属于同一棵树，这通常是通过使用并查集（Union-Find）数据结构来实现的。并查集允许我们在对数时间内执行"查找"操作（确定顶点所属的树）和"合并"操作（将两棵树合并成一棵树）。

cpp 复制代码

// 使用Kruskal算法计算最小生成树的总权重
W Kruskal(Self& minTree) // Self应为当前类的引用，minTree是用于存储最小生成树的实例
{
    // 初始化最小生成树的顶点集和索引
    minTree._vertex = _vertex;
    minTree._index = _index;
    minTree._matrix.resize(_vertex.size()); // 创建一个邻接矩阵，用于存储最小生成树中的边的权重

    for (auto& e : minTree._matrix) // 将邻接矩阵的所有元素初始化为最大权重值MAX_W
    {
        e.resize(_vertex.size(), MAX_W);
    }

    // 创建一个优先级队列，用于存储边的信息
    priority_queue<Edge, vector<Edge>, greater<Edge>> pq;

    // 将所有边（除了自环和重复边）加入优先级队列
    for (size_t i = 0; i < _vertex.size(); i++) 
    {
        for (size_t j = 0; j < _vertex.size(); j++) 
        {
            if (i < j && _matrix[i][j] != MAX_W) // 确保不加入自环和重复边
            {
                pq.push(Edge(i, j, _matrix[i][j])); // 将边加入优先级队列
            }
        }
    }

    // 初始化变量，用于记录最小生成树的总权重和边的数量
    W total = W();
    int size = 0;

    UnionFindSet ufs(_vertex.size()); // 创建并查集，用于判断顶点是否已经连接

    while (!pq.empty()) // 当优先级队列非空时
    {
        Edge min = pq.top(); // 取出权重最小的边
        pq.pop(); // 移除已取出的边

        // 判断边的两个顶点是否已经在同一集合内（即是否已经连接）
        if (!ufs.InSet(min._srci, min._desi)) 
        {
            cout << _vertex[min._srci] << "-" << _vertex[min._desi] << ":" << _matrix[min._srci][min._desi] << endl; // 打印边的信息

            minTree._AddEdge(min._srci, min._desi, min._w); // 将边加入最小生成树
            total += min._w; // 更新最小生成树的总权重

            ufs.Union(min._srci, min._desi); // 合并两个顶点所在的集合
            ++size; // 增加边的数量
        }
    }

    cout << endl;

    minTree.Print(); // 打印最小生成树

    // 如果边的数量等于顶点数量减一，则返回最小生成树的总权重
    if (size == _vertex.size() - 1)
    {
        return total;
    }
    else
    {
        return W(); // 否则返回默认权重值（可能表示无法形成最小生成树）
    }
}

我们可以来测试一下：

cpp 复制代码

	void TestGraph2()
	{
		string a[] = {"海皇","高斯","小傲","小潮","胖迪","小杨","皖皖"};
		Graph<string, int,INT_MAX, false> g1(a, sizeof(a)/sizeof(a[0]));
		g1.AddEdge("小潮", "小傲", 30);
		g1.AddEdge("小潮", "高斯", 83);
		g1.AddEdge("小潮", "海皇", 34);
		g1.AddEdge("胖迪", "海皇", 78);
		g1.AddEdge("胖迪", "小傲", 76);
		g1.AddEdge("小杨", "皖皖", 54);
		g1.AddEdge("小杨", "高斯", 48);

		g1.Print();
		cout << endl;

		Graph<string, int, INT_MAX, false> kminTree;
		cout << "Kruskal:" << g1.Kruskal(kminTree) << endl;
	}

按照Kruskal算法，构建出来的图是这样的：
胖迪和海皇的关系被抹除了，其实我们之前的图里有环：

Kruskal算法的时间复杂度主要取决于排序边的操作和并查集的效率。在最好的情况下，排序边的时间复杂度为O(E log E)，其中E是边的数量；并查集操作的时间复杂度接近常数，因此整个算法的时间复杂度近似为O(E log E)。由于排序的主导作用，该算法适用于边的数量远小于顶点数量平方的图，即稀疏图。

Prim算法

Prim算法和上面的思想差不多，但是，Prim算法会从一个顶点开始，这里我假设是从"小潮"开始：

跟小潮连接的3条边，会进入优先级队列，维护起来：
接下来，会选择30的权重来构造，然后30这条边的另一边的小傲的边入优先级队列：

以此类推：

cpp 复制代码

// 使用Prim算法构建并返回最小生成树的总权重
W Prim(Self& minTree, const V& vertex) // Self应该是当前类的引用，minTree是用于存储最小生成树的实例，vertex是顶点的容器
{
    // 初始化最小生成树的顶点集和索引
    minTree._vertex = _vertex;
    minTree._index = _index;
    minTree._matrix.resize(_vertex.size()); // 创建一个邻接矩阵，用于存储最小生成树中的边的权重

    // 初始化邻接矩阵的所有元素为最大权重值MAX_W
    for (auto& e : minTree._matrix)
    {
        e.resize(_vertex.size(), MAX_W);
    }

    // 区分顶点集合：已选择和未选择
    size_t srcIndex = FindSrci(vertex); // 找到起始顶点的索引
    vector<bool> select(_vertex.size(), false); // 已选择顶点集合，初始时所有顶点都未选择
    vector<bool> non_select(_vertex.size(), true); // 未选择顶点集合，初始时所有顶点都未被选择

    select[srcIndex] = true; // 起始顶点被标记为已选择
    non_select[srcIndex] = false; // 起始顶点从未选择集合中移除

    // 创建一个优先级队列，用于存储待处理的边
    priority_queue<Edge, vector<Edge>, greater<Edge>> pq; // 边按权重从小到大排序

    // 将起始顶点的邻接边加入优先级队列
    for (int i = 0; i < _vertex.size(); i++)
    {
        if (_matrix[srcIndex][i] != MAX_W) // 如果存在边，且不是最大权重（表示边存在）
        {
            pq.push(Edge(srcIndex, i, _matrix[srcIndex][i])); // 加入边信息到优先级队列
        }
    }

    // 初始化计数器和总权重
    size_t size = 0;
    W total = W(); // 初始化总权重为0

    // 当优先级队列非空时
    while (!pq.empty())
    {
        Edge min = pq.top(); // 获取当前权重最小的边
        pq.pop(); // 从队列中移除已处理的边

        // 如果目标顶点已被选择，跳过这条边
        if (select[min._desi]) continue;

        // 输出边的信息
        cout << _vertex[min._srci] << "-" << _vertex[min._desi] << ":" << _matrix[min._srci][min._desi] << endl;

        // 添加边到最小生成树
        minTree._AddEdge(min._srci, min._desi, min._w);

        // 标记目标顶点为已选择
        select[min._desi] = true;
        non_select[min._desi] = false;
        ++size; // 已处理的边数量加1
        total += min._w; // 更新总权重

        // 将新加入顶点的邻接边加入优先级队列
        for (size_t i = 0; i < _vertex.size(); i++)
        {
            if (_matrix[min._desi][i] != MAX_W && non_select[i]) // 如果存在边且目标顶点未被选择
            {
                pq.push(Edge(min._desi, i, _matrix[min._desi][i])); // 加入边信息到优先级队列
            }
        }
    }

    // 打印最小生成树
    minTree.Print();

    // 如果边的数量等于顶点数量减一，则返回最小生成树的总权重
    if (size == _vertex.size() - 1)
    {
        return total;
    }
    else
    {
        return W(); // 否则返回默认权重值（可能表示无法形成最小生成树）
    }
}

cpp 复制代码

	void TestGraph2()
	{
		string a[] = {"海皇","高斯","小傲","小潮","胖迪","小杨","皖皖"};
		Graph<string, int,INT_MAX, false> g1(a, sizeof(a)/sizeof(a[0]));
		g1.AddEdge("小潮", "小傲", 30);
		g1.AddEdge("小潮", "高斯", 83);
		g1.AddEdge("小潮", "海皇", 34);
		g1.AddEdge("胖迪", "海皇", 78);
		g1.AddEdge("胖迪", "小傲", 76);
		g1.AddEdge("小杨", "皖皖", 54);
		g1.AddEdge("小杨", "高斯", 48);

		g1.Print();
		cout << endl;

		Graph<string, int, INT_MAX, false> kminTree;
		cout << "Kruskal:" << g1.Kruskal(kminTree) << endl;

		cout << endl;

		Graph<string, int, INT_MAX, false> pminTree;
		cout << "Prim:" << g1.Prim(pminTree,"小潮") << endl;

	}

Prim算法同样是用于寻找加权无向图的最小生成树(Minimum Spanning Tree, MST)的一种贪心算法。与Kruskal算法不同的是，Prim算法从一个顶点开始，逐步添加最短的边来扩展树，直到包含所有的顶点。

Prim算法基本步骤：

选择任意一个顶点作为起始顶点。

在当前树的顶点的邻接边中找到权重最小的边，将这条边添加到树中，并将新的顶点也添加进来。

重复步骤2，直到树包含所有的顶点。

这是两种算法挑选边的过程和最后结果，大家可以类比对比：

cpp 复制代码

		//Kruskal算法
		W Kruskal(Self& minTree)
		{
			//初始化
			minTree._vertex = _vertex;
			minTree._index = _index;
			minTree._matrix.resize(_vertex.size());

			for (auto& e : minTree._matrix)
			{
				e.resize(_vertex.size(), MAX_W);
			}

			//优先级队列
			priority_queue<Edge, vector<Edge>, greater<Edge>> pq;

			for (size_t i = 0; i < _vertex.size(); i++)
			{
				for (size_t j = 0; j < _vertex.size(); j++)
				{
					if (i < j && _matrix[i][j] != MAX_W)
					{
						pq.push(Edge(i, j, _matrix[i][j]));
					}
				}
			}

			//拿边构造最小生成树
			W totoal = W();
			int size = 0;
			UnionFindSet ufs(_vertex.size());

			while (!pq.empty())
			{
				Edge min = pq.top();
				//出边
				pq.pop();

				//判断是否在同一集合
				if (!ufs.InSet(min._srci ,min._desi))
				{
					cout << _vertex[min._srci] << "-" << _vertex[min._desi] <<
						":" << _matrix[min._srci][min._desi] << endl;

					minTree._AddEdge(min._srci, min._desi, min._w);
					totoal += min._w;

					//合并
					ufs.Union(min._srci, min._desi);
					++size;
				}
			}

			cout << endl;

			minTree.Print();

			if (size == _vertex.size() - 1)
			{
				return totoal;
			}
			else
			{
				return W();
			}

			
		}

		W Prim(Self& minTree,const V& vertex)
		{
			//初始化
			minTree._vertex = _vertex;
			minTree._index = _index;
			minTree._matrix.resize(_vertex.size());

			for (auto& e : minTree._matrix)
			{
				e.resize(_vertex.size(), MAX_W);
			}

			//区分集合
			size_t srcIndex = FindSrci(vertex);
			vector<bool> select(_vertex.size(), false);
			vector<bool> non_select(_vertex.size(), true);

			select[srcIndex] = true;
			non_select[srcIndex] = false;

			//开始入边
			priority_queue<Edge, vector<Edge>, greater<Edge>> pq;

			for (int i = 0; i < _vertex.size(); i++)
			{
				if (_matrix[srcIndex][i] != MAX_W)
				{
					pq.push(Edge(srcIndex, i, _matrix[srcIndex][i]));
				}
			}

			size_t size = 0;
			W totoal = W();

			while (!pq.empty())
			{
				Edge min = pq.top();
				pq.pop();

				if (select[min._desi])
					continue;

				cout << _vertex[min._srci] << "-" << _vertex[min._desi] <<
					":" << _matrix[min._srci][min._desi] << endl;

				minTree._AddEdge(min._srci, min._desi, min._w);

				select[min._desi] = true;
				non_select[min._desi] = false;
				++size;
				totoal += min._w;

				//新入的顶点的边也加入到优先级队列
				for (size_t i = 0; i < _vertex.size(); i++)
				{
					if (_matrix[min._desi][i] != MAX_W && non_select[i])
					{
						pq.push(Edge(min._desi, i, _matrix[min._desi][i]));
					}
				}
			}

			minTree.Print();

			if (size == _vertex.size() - 1)
			{
				return totoal;
			}
			else
			{
				return W();
			}

		}