【算法笔记】图论基础（一）：建图、存图、树和图的遍历、拓扑排序、最小生成树

何为图论

图的概念

图（Graph） 是一种数据结构，是由 节点（Node） 和 边（Edge） 组成的集合。

由节点所构成的集合就叫点集，由边所构成的集合就叫边集，点集和边集放在一起就形成了一张图。

注意：一张图的边集可以为空，但点集一定不能为空。

下面就是一个图，可以看到这个图有5个顶点，分别编号为{0，1，2，3，4}。同时这个图有5条边，例如，在顶点1和顶点3之间存在着一条边。

在图这个数据结构上面的所有问题和算法，统称为图论。

图的一些基本概念

有向图和无向图

图的边分为有向边 和无向边 ，只有有向边的图就是有向图 ，只有无向边的图就是无向图。

上面的图片就是一个无向图，而如果把图改成这样，就是有向图。

如果对于边a -> b，a能到b、b不能到a，那这就是一条a到b的有向边 。

如果对于边a -- b，a能到b、b也能到a，那这就是一条a到b的无向边。

可以发现一个结论：无向边就是特殊的有向边、无向图就是特殊的有向图

解释：对于两个点a, b，你想在a、b之间连一条无向边，只需从a向b连一条有向边，再从b到a连一条有向边即可，就像下面这样：

所以我们研究的所有问题，只需考虑有向图即可，无向图只需在建图的时候建两条相反的有向边。

带权图

对于一个图，如果每一条边都被赋予一个数作为该边的权，这个图就是带权图。

边权其实也就是边长

比如下图

边权为正数的边就是正权边 ，比如上图中的(0, 1)、(2, 4)

边权为负数的边就是负权边，比如上图中的(1, 2)、(1, 3)

对于非带权图，表示的通常是节点和节点之间的连通关系
对于带权图，表示的同通常是节点和节点的距离

连通图和非连通图

对于无向图

对于无向图中的两个点u,v，如果存在一条从u到v的路径，则称为u和v连通。

连通图

非连通图

如果无向图的任意两个顶点均连通，这个图就是连通图 ，图的这一性质被称为连通性。

对于有向图

对于有向图中的两个点u,v，如果存在一条从u到v的路径，则称为u可达v。

若一张有向图的节点两两互相可达，则称这张图是强连通的

若一张有向图的边替换为无向边后可以得到一张连通图，则称原来这张有向图是弱连通的

弱连通图

强连通图

度

顶点连接的边数叫做这个顶点的度

对于无向图

无向图中一个点的度数就是这个点的临边数。

比如下面的无向图，d(0) = 2, d(1) = 3, d(4) = 1...

对于有向图

有向图的度数分为两种：入度和出度

对于无向图中的一个点，

它的入度等于一这个点为终点的边（即直接指向这个点的边）的数量
它的出度等于以这个点为起点的边（即从这个点指向别的点的边）的数量

比如下面的有向图，din(0) = 0，dout(0) = 2, din(1) = 1, dout(1) = 2, din(4) = 1, dout(4) = 0...

一些结论

1.在任意无向图中，所有节点的度数和等于总边数*2。

在任意无向图中，度为奇数的顶点的个数为偶数。
在任意有向图中，所有节点入度的和等于所有节点出度的和。

环

图中起点和终点重合的非空路径叫做环

比如下面的图中，0 -> 1 -> 2 -> 0这条路径就是一个环

没有环的图叫无环图 ，没有环的有向图叫有向无环图 ，没有环的连通图称为树。

自环、重边、简单图、完全图

自环

对于图中的一条边(u, v)，如果u == v，那么这条边就被称做自环。

比如下图中的(2, 2)就是一个自环。

重边

如果图中有两条完全相同的边（起点、终点、方向都相同），那么他们就被称为一组重边。

比如下图中，(2, 4)和(2, 4)就是一组重边，但(0, 1) 和（1, 0）不是。

简单图

没有重边和自环的图被称作简单图。

任意两个节点都相邻的无向简单图被称为完全图。

若有向图满足任意不同两点间都有两条方向不同的边，则称为有向完全图。

稀疏图和稠密图

若一张图的边数远小于其点数的平方，那么它是一张 稀疏图 。
若一张图的边数接近其点数的平方，那么它是一张 稠密图 。

稀疏图和稠密图一般来讨论时间复杂度为 O ( V 2 ) O(V^2) O(V2)的算法和 O ( E ) O(E) O(E)的算法的效率差异，在稠密图上二者效率相当，在稀疏图上 O ( E ) O(E) O(E)的算法更优。

子图、生成子图

如果图a的节点集和边集分别是图b的节点集的子集和边集的子集，那么就称图a为图b的子图。

含有图G的所有顶点的子图称为图G的生成子图

如果一个生成子图是树（无环连通图），那么就称这个生成子图为生成树

比如下面这张图，就是上面那个出现很多次的无向图的一个生成树

同构

定义（图的同构）

给定两个图 G G G 和 H H H。若存在一个函数 f : V ( G ) → V ( H ) f: V(G) \to V(H) f:V(G)→V(H)满足对于任意顶点 u , v u, v u,v， ( u , v ) ∈ E ( G ) (u, v) \in E(G) (u,v)∈E(G) 当且仅当 ( f ( u ) , f ( v ) ) ∈ E ( H ) (f(u), f(v)) \in E(H) (f(u),f(v))∈E(H)，则称 f f f 为从 G G G 到 H H H 的一个同构，并且称图 G G G 与 H H H 是同构的，记作 G ≃ H G \simeq H G≃H

通俗的来讲，两个图同构就是结构相同，比如下面两个图就是同构的

图的存储

算法竞赛中，你想做图论的题，肯定得先学会怎么存图，图的存储主要分为以下几种方式：

直接存边

最简单粗暴的一种，用一个结构体数组直接存边

cpp 复制代码

struct Edge{
    int a, b, w; // 表示一条 a->b 的边，边权为w
}edges[N];

for(int i = 0; i < m; i++){ // 输入m条边
    int a, b, w;
    cin >> a >> b >> w;
    edges[i] = {a, b, w};
}

需要遍历所有边、做给边排序（比如Kruskal算法）等操作的时候常用这种存图方法。

邻接矩阵存边

邻接矩阵就是用一个二维数组来存边，数组的下标就是边的端点，数组的值就是边的权值。

对于不带权的图， g $a$ $b$ = 1 g $a$ $b$ = 1 g $a$ $b$ =1表示存在从a到b的边， g $a$ $b$ = 0 g $a$ $b$ = 0 g $a$ $b$ =0表示不存在，这时的邻接矩阵也叫可达性矩阵。

cpp 复制代码

int g[N][N];

while(m--){ // 输入m条边
    int a, b;
    cin >> a >> b;
    g[a][b] = 1;
}

对于带权图， g $a$ $b$ = w g $a$ $b$ = w g $a$ $b$ =w表示存在从a到b、权值为w的边， g $a$ $b$ = 0 g $a$ $b$ = 0 g $a$ $b$ =0表示不存在边

cpp 复制代码

int g[N][N];

while(m--){ // 输入m条边
    int a, b, w;
    cin >> a >> b >> w;
    g[a][b] = w;
}

邻接矩阵常用于稠密图，并且邻接矩阵只能用于没有重边或重边可以忽略的情况（比如求最短路时，如果有重边就只要最短的一条就可以了，其他的都可以忽略）。

邻接表存边

使用一个支持动态增加元素的数据结构构成的数组，如vector来存边。g $a$ 记录a的所有出边的信息（如终点、边权等）。

对于不带权的图，g $a$ 存的是所有以a为起点的边的终点。

cpp 复制代码

vector<int> g[N];

for(int i = 0; i < m; i++){
    int a, b;
    cin >> a >> b;
    g[a].push_back(b);
}


for(int v : g[u]){ // 遍历u的所有出边，v就是出边的终点

}

对于带权图，g $a$ 存的是所有以a为起点的边的终点和边权。

cpp 复制代码

typedef pair<int, int> PII;
vector<PII> g[N];

for(int i = 0; i < m; i++){
    int a, b, w;
    cin >> a >> b >> w;
    g[a].push_back({b, w});
}

for(auto i : g[u]){ // 遍历u的所有出边
	int v = i.first, w = i.second; // v:出边的终点，w:边权 
}

这是最常用的一种存边方法，存各种图都很适合。

链式前向星存边

链式前向星存图其实就是用单链表实现的的邻接表。

想用的话先去学链表，在这不做过多介绍。

cpp 复制代码

int h[N], e[N], ne[N], idx;

void add(int a, int b){
    e[idx] = b, ne[idx] = h[a], h[a] = idx++; // add(a, b) : 加一条 a->b的边
}

memset(h, -1, sizeof h); // 表头初始化成-1
idx = 0;

for(int i = h[t]; i != -1; i = ne[i]){ // 遍历t的出边
    int j = e[i]; // j是出边的终点
}

cpp 复制代码

int h[N], e[N], ne[N], w[N], idx;

void add(int a, int b, int c){
    e[idx] = b, w[idx] = c, ne[idx] = h[a], h[a] = idx++; // add(a, b, c) : 加一条 a->b 边权为c的边
}

memset(h, -1, sizeof h); // 表头初始化成-1
idx = 0;

for(int i = h[t]; i != -1; i = ne[i]){ // 遍历t的出边
    int j = e[i]; // j是出边的终点
}

存各种图都很适合，但不能快速查询一条边是否存在，也不能方便地对一个点的出边进行排序。

优点是边是带编号的，有时会非常有用，而且如果 cnt 的初始值为奇数，存双向边时 i ^ 1即是 i 的反边

图的遍历

树和图的遍历（图示）

树

dfs遍历顺序：1， 2， 5， 9， (5)， 10， (5)， (2)， (1)， 3， 6， 11，(6)， (3)， 7， (3)， (1)， 4， 8

bfs遍历顺序：1， 2， 3， 4， 5， 6， 7， 8， 9， 10， 11

图

dfs遍历顺序：1， 2， 5， 7， 6，（7），（5），（2），（1）， 3，（1）， 4

bfs遍历顺序：1， 2， 3， 4， 5， 6， 7

树和图的深度优先遍历（dfs）

和传统树的遍历一样，图的遍历也是一条路走到黑、不撞南墙不回头

给他一个遍历的起点，他会先走该点的第一条出边，然后再遍历终点的第一条出边...直到遍历到某个点没有出边了，再回溯去遍历第二条出边。

cpp 复制代码

bool st[N];

void dfs(int u){
    st[u] = true;
    ...;
    for(int v : g[u]){
        if(st[v]) continue;
        dfs(v);
        ...;
    }
    ...;
}

dfs(1);

树和图的广度优先遍历（bfs）

给他一个遍历的起点，他会把这个点所有的出边都走完，然后再去走所有第一步到的终点的所有出边...直到队首的点没有出边可走（队列为空，所有点就都遍历完了）

cpp 复制代码

bool st[N];

void bfs(int start){
    queue<int> q;
    q.push(start);
    st[start] = true;
    while(!q.empty()){
        int u = q.front();
        q.pop();
        ...;
        for(int v : g[u]){
        	if(st[v]) continue;
            q.push(v);
            st[v] = true;
            ...;
        }
    }
}

bfs(1);

拓扑排序

什么是拓扑排序?

一个有向图，如果图中有入度为 0 的点，就把这个点删掉，同时也删掉这个点所连的边。

一直进行上面的处理，如果所有点都能被删掉，则这个图可以进行拓扑排序。

结论

一个图可以拓扑排序 ⇔ \Leftrightarrow ⇔这个图是有向无环图（DAG）

例题

848. 有向图的拓扑序列

cpp 复制代码

#include <iostream>
#include <algorithm>
#include <cstring>
#include <vector>
#include <queue>
#define endl '\n'
using namespace std;
const int N = 1e5 + 10;
int n, m;
vector<int> g[N]; // 邻接表存边
int d[N]; // 存每个点的入度
int res[N]; // 存拓扑序列（答案）

bool topsort(){
    int cnt = 0; // 记录当前删掉的节点数，也就是当前拓扑序列中的节点数
    queue<int> q;
    for(int i = 1; i <= n; i++){
        if(!d[i]) q.push(i); // 先把入度为0的点入队
    }
    while(!q.empty()){
        int t = q.front();
        q.pop();
        res[cnt++] = t; // 记录答案
        for(int i : g[t]){ // 遍历i的每条出边，给每个临点的入度-1（拿掉一条边）
            if(--d[i] == 0) q.push(i); // 将新的入度为0的点入队
        }
    }
    return cnt == n; // 如果每个点都能被删掉，就说明是有向无环图
}

int main(){
    ios::sync_with_stdio(false); cin.tie(0); cout.tie(0);
    cin >> n >> m;
    while(m--){
        int a, b;
        cin >> a >> b;
        g[a].push_back(b); // 边 a->b
        d[b]++; // b入度+1
    }
    if(!topsort()) cout << -1 << endl;
    else{
        for(int i = 0; i < n; i++) cout << res[i] << ' ';
    }
    cout << endl;
    return 0;
}

一个技巧

一个有向无环图的拓扑序列是有很多种的，如果按上面的写法，就是先把所有入度为0的节点删除，再去删除其后继结点，但如果题目中要求优先输出编号大的或编号小的，把 q u e u e queue queue换成 p r i o r i t y _ q u e u e priority\_queue priority_queue就好了,维护一个大根堆（编号大的先输出）/小根堆（编号小的先输出），其他代码都一样。

例如：确定比赛名次

最小生成树

首先，如果一个生成子图是树（无环连通图），那么就称这个生成子图为生成树

一个无向图有很多的生成树，规定边权和最小的一个叫做最小生成树。

求最小生成树有两种最简单常用的算法，Kruskal算法和Prim算法，两种算法都是基于贪心的思想。

Kruskal求最小生成树

Kruskal算法非常好理解，简单粗暴，他是一个向图中加边的过程。

算法过程

将所有的边都拿掉，只留下所有的点，并将边按边权从小到大排序。
从小到大遍历每条边，看加上这条边会不会形成环，如果这个边与之前选择的所有边不会组成环，就选择这条边，将边权加到答案，反之，舍去。
遍历完所有边后，筛选出来的边和所有的顶点构成此图的最小生成树。

判断是否会产生回路的方法为：使用并查集。

在初始状态下给各个顶点在不同的集合中。
遍历过程的每条边，判断这两个顶点的是否在一个集合中
如果边上的这两个顶点在一个集合中，说明两个顶点已经连通，再加边就会成环，这条边不要。如果不在一个集合中，则要这条边。

图示

例题

Kruskal算法求最小生成树

cpp 复制代码

#include <iostream>
#include <algorithm>
#include <cstring>
#define endl \n'
using namespace std;
const int N = 2e5 + 10;
int n, m;
int fa[N];

struct Edge{
    int a, b, w; // 结构体数组存边
} edges[N];

bool cmp(Edge a,Edge b){
    return a.w < b.w; // 按边权从小到大排序
}

int find(int x){
    if(fa[x] != x)
        fa[x] = find(fa[x]);
    return fa[x];
}

int kruskal(){
    sort(edges, edges + m, cmp); // 按边权从小到大排序
    for(int i = 1; i <= n; i++) fa[i] = i; // 并查集初始化
    int res = 0, cnt = 0; // res记录当前加到最小生成树中的边的权值的总和, cnt记录当前加了多少条边
    for(int i = 0; i < m; i++){
        int a = edges[i].a, b = edges[i].b, w = edges[i].w;
        a = find(a), b = find(b); // 并查集找祖先
        if(a != b){ // 如果a和b不在一个集合里，加边就不会成环
            fa[a] = b; // 加这条边
            res += w; // 将边权累加
            cnt++; // 又加进去一条边
        }
    }
    if(cnt < n - 1)
        return -1; // 加不到n - 1条边说明图不连通
    return res;
}

int main(){
    ios::sync_with_stdio(false); cin.tie(0); cout.tie(0);
    cin >> n >> m;
    for (int i = 0; i < m; i++){
        int a, b, w;
        cin >> a >> b >> w;
        edges[i] = {a, b, w}; // m条边
    }
    int t = kruskal();
    if(t == -1) cout << "impossible" << endl;
    else cout << t << endl;
    return 0;
}

Prim求最小生成树

Prim算法是向图中加点的过程，他是维护了两个集合：{已经加到最小生成树中的点和边}（连通部分）和 {还未加到最小生成树中的点和边}，每次将离连通部分的最近的点和点对应的边加入连通部分，连通部分逐渐扩大，最后将整个图连通起来，并且边长之和最小，最后的连通部分就是该图的最小生成树。

算法过程

一开始，任取一个起点加入连通部分（第一次迭代）
接下来每次迭代，遍历所有不在连通部分的点，找到离连通部分最近的点，将其加入连通部分
用该点到其他点的距离更新其他点到连通部分的距离
继续下一次迭代，直到所有点都加到最小生成树中（由于一次加一个点，所以n个点只需迭代n 次）
最后迭代n次后的连通部分就是该图的最小生成树。

图示

例题

Prim算法求最小生成树

cpp 复制代码

#include <iostream>
#include <algorithm>
#include <cstring>
#define endl '\n'
using namespace std;
const int N = 505;
int n, m;
int g[N][N]; // 邻接矩阵存图
int dist[N]; // dist[i]表示当前i距离连通部分的距离
bool st[N]; // st标记当前点是否已经加入连通部分，st[i] = true说明已经加入了，st[i] = false说明还没加入

int prim(){
    memset(dist, 0x3f, sizeof dist); // 一开始，连通部分没有点，所有点到连通部分的距离为正无穷
    int res = 0; // res记录当前加到最小生成树中的边的权值的总和
    for(int i = 0; i < n; i++){ // 迭代n次
        int t = -1; // t来记录未加入连通部分的点中距离连通部分最近的点
        for(int j = 1; j <= n; j++){ // 遍历所有不在连通部分的点, 找到离连通部分最近的点
            if(!st[j] && (t == -1 || dist[t] > dist[j])) // t == -1 : 防止越界; dist[t] > dist[j]：点j比点t距离连通部分近
                t = j; // 把t换成j
        }
        if(i && dist[t] == 0x3f3f3f3f) // 如果连通部分有点，离连通部分最近的点dist还是正无穷，说明图不连通
            return 0x3f3f3f3f;
        if(i)
            res += dist[t]; // 从第二个加入连通部分的点开始，把其距离连通部分的距离加到答案（也就是将其对应的边加入连通部分）
        st[t] = 1; // 标记一下这个点加进去了
        for(int j = 1; j <= n; j++)
            dist[j] = min(dist[j], g[t][j]); // 遍历所有点，用t到其他点的距离更新其他点到连通部分的距离
    }
    return res;
}

int main(){
    ios::sync_with_stdio(false); cin.tie(0); cout.tie(0);
    cin >> n >> m;
    memset(g, 0x3f, sizeof g); // 由于要取min，所以初始化成正无穷
    while(m--){
        int a, b, w;
        cin >> a >> b >> w;
        g[a][b] = g[b][a] = min(g[a][b], w); // 求最小生成树，如果有重边就只要最短边
    }
    int t = prim();
    if(t == 0x3f3f3f3f) cout << "impossible" << endl;
    else cout << t << endl;
    return 0;
}

最大生成树

在求最小生成树的基础上，Kruskal就是把正序排序换成逆序排序，Prim就是把大于小于号调换一下，灵活一点。

【算法笔记】图论基础（一）：建图、存图、树和图的遍历、拓扑排序、最小生成树

目录

何为图论

图的概念

图的一些基本概念

有向图和无向图

带权图

连通图和非连通图

对于无向图

对于有向图

度

对于无向图

对于有向图

一些结论

环

自环、重边、简单图、完全图

自环

重边

简单图

稀疏图和稠密图

子图、生成子图

同构

图的存储

直接存边

邻接矩阵存边

邻接表存边

链式前向星存边

图的遍历

树和图的遍历（图示）

树

图

树和图的深度优先遍历（dfs）

树和图的广度优先遍历（bfs）

拓扑排序

什么是拓扑排序?

结论

例题

一个技巧

最小生成树

Kruskal求最小生成树

算法过程

图示

例题

Prim求最小生成树

算法过程

图示

例题

最大生成树