第三章 图论 No.9有向图的强连通与半连通分量

文章目录

    • 定义
    • Tarjan求SCC
      • [1174. 受欢迎的牛](#1174. 受欢迎的牛)
      • [367. 学校网络](#367. 学校网络)
      • [1175. 最大半连通子图](#1175. 最大半连通子图)
      • [368. 银河](#368. 银河)

定义

连通分量是无向图的概念,yxc说错了,不要被误导

强连通分量:在一个有向图中,对于分量中的任意两点u,v,一定能从u走到v,且能从v走到u。强连通分量是一些点的集合,若加入其他点,强连通分量中的任意两点就不能互相递达

半连通分量:在一个有向图中,对于分量中的任意两点u,v,一定存在从u走到v或者从v的路径

应用:通过缩点(将所有强连通分量缩成一个点)的方式,那么一个有向图就转换成了一个有向无环图DAG(拓扑图)

对于拓扑图,可以直接用bfs求最短路问题

  1. 树枝边(x和y直接相连)
  2. 前向边(y是x的祖先节点)
  3. 后向边(前向边的反)
  4. 横叉边(指向已经遍历过的其他分支上的点)

树枝边是一种特殊的前向边

强连通分量简称scc,如何判断当前点是否在scc中?

  1. 存在一条后向边,指向祖先节点
  2. 先走横叉边,横叉边连接了后向边

无论如何,其一定能走到已经遍历过的祖先节点上

点可能存在自环,也是强连通分量(书上说自环不是强连通分量,但是为了算法的实现,将自环认为是强连通分量)


Tarjan求SCC

给定时间戳的概念,从小到大的时间为dfs的顺序

那树枝边的y一定比x大1,前向边的y一定大于等于x+1

后向边的y一定小于x,横叉边也是

对每个点定义两个时间戳:
dfs[u]表示遍历到u的时间
low[u]表示从u开始走,能遍历到的最小时间戳

若u是强连通分量的最高点,那么dfn[u] == low[u],即该点无法再往上走到其他点

板子中使用了两个栈,一个是系统函数栈,用来深搜。一个是自定义的栈,保存当前正在遍历的强连通分量中的所有点

板子 O ( n + m ) O(n + m) O(n+m):

cpp 复制代码
void tarjan(int x)
{
	dfn[x] = low[x] = ++ tp;
	stk[ ++ tt] = x, st[x] = true;
	for (int i = h[x]; i != -1; i = ne[i])
	{
		int y = e[i];
		if (!dfn[y])
		{
			tarjan(y);
			low[x] = min(low[x], low[y]);
		}
		else if (st[y]) low[x] = min(low[x], dfn[y]);
	}
	if (low[x] = dfn[x])
	{
		int y;
		++ cnt;
		do{
			y = stk[tt -- ], st[y] =false;
			id[y] = cnt;
		} while (y != x)
	}
}

缩点:遍历所有点,再遍历其所有邻点,若两点不在同一强连通分量中,将这两点之间添加一条边

强连通分量编号递减的顺序一定是拓扑序,求拓扑序一般使用bfs,除此之外还能使用dfs

遍历所有点,从入边为0的点开始,dfs其所有邻点,完成后将该点的编号加入序列中,序列的逆序就是拓扑序。因为每次进入序列的点一定无后继(或者后继节点已经进入序列的点)

不过,若图中存在多个入边为0的点,选择其一进行dfs即可,后续要在拓扑序开头加上这几个入边为0的点


1174. 受欢迎的牛

1174. 受欢迎的牛 - AcWing题库

反向建图,遍历所有点,用bfs判断当前点是否能递达其他所有点,时间复杂度为 O ( n 2 ) O(n^2) O(n2)

如果不反向建图,就要判断图中有几个出边为0的点,若有1个,那么这个点就是最受欢迎的,若有>1个,那么不存在最受欢迎的点,若有0个,说明图中一定存在环(强连通分量),环中的节点数量为受欢迎的点的数量

将所有的强连通分量(环)缩成一个点,此时图中出边为0的点的数量不可能为0

只要判断数量是否为1即可

若出边为的点的数量为1,说明该强连通分量中的所有点都是受欢迎的,统计环中节点的数量即可

cpp 复制代码
#include <iostream>
#include <cstring>
using namespace std;

const int N = 1e4 + 10, M = 5e4 + 10;
int h[N], e[M], ne[M], idx;
int dfn[N], low[N], tp, cnt;
int stk[N], tt; bool st[N];
int dout[N], id[N], sz[N]; // 每个强连通分量中的节点数量
int n, m;

void add(int x, int y)
{
    e[idx] = y, ne[idx] = h[x], h[x] = idx ++ ;
}

void tarjan(int x)
{
    stk[ ++ tt] = x, st[x] = true;
    dfn[x] = low[x] = ++ tp;
    for (int i = h[x]; i != -1; i = ne[i])
    {
        int y = e[i];
        if (!dfn[y])
        {
            tarjan(y);
            low[x] = min(low[x], low[y]);
        }
        else if (st[y]) low[x] = min(low[x], dfn[y]);
    }
    if (dfn[x] == low[x])
    {
        int y;
        cnt ++ ;
        do {
            y = stk[tt -- ], st[y] = false;
            id[y] = cnt;
            sz[cnt] ++ ;
        } while (y != x);
    }
}

int main()
{
    memset(h, -1, sizeof(h));
    scanf("%d%d", &n, &m);
    int x, y;
    for (int i = 0; i < m; ++ i )
    {
        scanf("%d%d", &x, &y);
        add(x, y);
    }
    
    for (int i = 1; i <= n; ++ i )
        if (!dfn[i]) tarjan(i);
        
    for (int x = 1; x <= n; ++ x ) 
        for (int i = h[x]; i != -1; i = ne[i])
        {
            int y = e[i];
            int a = id[x], b = id[y];  
            if (a != b) dout[a] ++ ;
        }
        
    int ans = 0, t = 0;
    for (int i = 1; i <= cnt; ++ i )
        if (!dout[i])
        {
            t ++ ;
            ans = sz[i];
            if (t > 1)
            {
                ans = 0;
                break;
            }
        }
        
    printf("%d\n", ans);
    return 0;
}

debug到死的一道题:

首先tp要前置++,虽然tp是时间戳的概念,但是在数组中作为下标还对应着节点编号

最后检查dout数组中,循环从1到cnt,不是从1到n,也不是从1到cnt - 1,因为cnt不是后置++,而是++完再使用
else if (st[y]) low[x] = min(low[x], dfn[y]);写歪了,写成
else if (st[y]) low[x] = min(low[x], dfn[x]);


367. 学校网络

367. 学校网络 - AcWing题库

将所有强连通分量缩点后,图中入度为0的点为第一问的答案

第二问是:任何一个有向无环图,需要加几条边才能使之成为一个强连通分量

结论:假设有向无环图有P个入度为0的点,Q个出度为0的点,需要加max(P, Q)个点

设起点的集合为P,终点的集合为Q

假设 ∣ P ∣ < = ∣ Q ∣ |P| <= |Q| ∣P∣<=∣Q∣,若 ∣ P ∣ > ∣ Q ∣ |P| > |Q| ∣P∣>∣Q∣,建个反图即可

考虑两种情况, ∣ P ∣ = 1 |P| = 1 ∣P∣=1,此时将所有的终点向起点连一条边,即 Q Q Q条边。此时从起点一定能走到所有点,从中间点一定能走到终点,而终点一定能走到起点,从而走完所有点。所以此时图中任意一点能走完图中所有点
∣ P ∣ > 1 |P| > 1 ∣P∣>1时,在终点与起点之间连一条边(尽可能与无法到达该终点的起点连线),直到起点的数量为1(每次连完边后,起点数量与终点数量都减一),此时的情况为 ∣ P ∣ = 1 |P|=1 ∣P∣=1的情况 ∣ Q ∣ − ( ∣ P ∣ − 1 ) |Q|-(|P|-1) ∣Q∣−(∣P∣−1)条边即可,由于已经连了 ∣ P ∣ − 1 |P|-1 ∣P∣−1条边,所以总共需要连的边数为 ∣ Q ∣ |Q| ∣Q∣

cpp 复制代码
#include <iostream>
#include <cstring>
using namespace std;

const int N = 110, M = N * N;
int h[N], e[M], ne[M], idx;
int dfn[N], low[N], tp, cnt;
int id[N], stk[N], tt;
bool st[N];
int din[N], dout[N];
int n, t;

void add(int x, int y)
{
    e[idx] = y, ne[idx] = h[x], h[x] = idx ++ ;
}

void tarjan(int x)
{
    st[x] = true, stk[ ++ tt] = x;
    dfn[x] = low[x] = ++ tp;
    for (int i = h[x]; i != -1; i = ne[i])
    {
        int y = e[i];
        if (!dfn[y])
        {
            tarjan(y);
            low[x] = min(low[x], low[y]);
        }
        else if (st[y]) low[x] = min(low[x], dfn[y]);
    }
    if (dfn[x] == low[x])
    {
        int y;
        cnt ++ ;
        do {
            y = stk[tt -- ], st[y] = false;
            id[y] = cnt;
        } while (x != y);
    }
}

int main()
{
    memset(h, -1, sizeof(h));
    scanf("%d", &n);
    int y;
    for (int x = 1; x <= n; ++ x )
        while (scanf("%d", &y), y)
            add(x, y);
            
    for (int i = 1; i <= n; ++ i )
        if (!dfn[i])
            tarjan(i);

    
    int u = 0;
    for (int x = 1; x <= n; ++ x)
        for (int i = h[x]; i != -1; i = ne[i])
        {
            int y = e[i];
            int a = id[x], b = id[y];
            if (a != b) din[b] ++, dout[a] ++ ;
        }
        
    int in = 0, out = 0;
    for (int i = 1; i <= cnt; ++ i )
    {
        if (!din[i]) in ++ ;
        if (!dout[i]) out ++ ;
    }
    if (cnt == 1) printf("%d\n%d\n", in, 0);
    else printf("%d\n%d\n", in, max(in, out));
    
    return 0;
}

debug:dfs的次数与缩点后入度为0的点的数量不一定相同

缩点后的图中可能存在入度和出度都为0的点,所以判断要用两个if

最后要注意,缩点后的图只有一个连通分量时,需要特判输出


1175. 最大半连通子图

1175. 最大半连通子图 - AcWing题库

首先,强连通分量一定是半连通分量,所以可以先找出图中所有强连通分量

用tarjan将图缩点,得到由强连通分量组成的有向无环图,此时再找出极大半连通分量(有向图中点最多的一条路径),可以按照拓扑序递推,找一条最长路

由于每个点都是强连通分量,计算最长路的节点数量时,需要累加所有"节点"(强连通分量)中的节点数量,只能在按照拓扑序递推最长路时,将边权设置为分量中的点数

若缩点后的两点之间存在多条边,因为导出子图一定会将和点有关的所有边 选择,所以边数不同不能算不同的半连通子图,半连通分量中不存在只选择两点之间一部分边的情况,因此点数不同才算不同的半连通子图

由于我们找最长路时,需要使用边的权重,重边将影响最长路的求解,所以在建立缩点后的图时要注意给边判重

边的权重是分量中点的数量,与这些两点之间的重边没有关系,因此只需要在两点之间建立一条边

缩点建图完成后,就是递推求最长路。由于缩点的递归顺序是拓扑序的逆序,所以我们逆着遍历缩点的顺序,按照拓扑序递推求最长路即可。注意不仅要记录最长路的权值还要记录最长路的数量,分别对应最大半连通子图中点的数量以及最大半连通子图的数量

cpp 复制代码
#include <iostream>
#include <cstring>
#include <unordered_set>
using namespace std;

typedef long long LL;
const int N = 1e5 + 10, M = 2e6 + 10;
int h[N], hs[N], e[M], ne[M], idx;
int dfn[N], low[N], cnt, tp;
int stk[N], tt; bool st[N];
unordered_set<LL> s;
int sz[N], id[N];
int f[N], g[N];
int n, m, X;

void add(int h[], int x, int y)
{
    e[idx] = y, ne[idx] = h[x], h[x] = idx ++ ;
}

void tarjan(int x)
{
    dfn[x] = low[x] = ++ tp;
    st[x] = true, stk[ ++ tt] = x;
    for (int i = h[x]; i != -1; i = ne[i])
    {
        int y = e[i];
        if (!dfn[y])
        {
            tarjan(y);
            low[x] = min(low[x], low[y]);
        }
        else if (st[y]) low[x] = min(low[x], dfn[y]);
    }
    if (dfn[x] == low[x])
    {
        int y;
        cnt ++ ;
        do {
            y = stk[tt -- ], st[y] = false;
            id[y] = cnt;
            sz[cnt] ++ ;
        } while (x != y);
    }
}

int main()
{
    memset(h, -1, sizeof(h));
    memset(hs, -1, sizeof(hs));
    scanf("%d%d%d", &n, &m, &X);
    int x, y;
    for (int i = 0; i < m; ++ i )
    {
        scanf("%d%d", &x, &y);
        add(h, x, y);
    }
    
    for (int i = 1; i <= n; ++ i )
        if (!dfn[i]) tarjan(i);
        
    for (int x = 1; x <= n; ++ x )
        for (int i = h[x]; i != -1; i = ne[i])
        {
            int y = e[i];
            int a = id[x], b = id[y];
            if (a != b)
            {
                LL t = a * 100000ll + b;
                if (!s.count(t)) 
                {
                    add(hs, a, b);
                    s.insert(t);
                }
            }
        }
    for (int x = cnt; x; -- x )
    {
        if (!f[x]) f[x] = sz[x], g[x] = 1;
        for (int i = hs[x]; i != -1; i = ne[i])
        {
            int y = e[i];
            if (f[y] < f[x] + sz[y])
            {
                f[y] = f[x] + sz[y];
                g[y] = g[x];
            }
            else if (f[y] == f[x] + sz[y]) 
                g[y] = (g[x] + g[y]) % X;
        }
    }
    
    int maxf = 0, sum = 0;
    for (int i = 1; i <= cnt; ++ i )
    {
        if (f[i] > maxf)
        {
            maxf = f[i];
            sum = g[i];
        }
        else if (f[i] == maxf) sum = (sum + g[i]) % X;
    }
    printf("%d\n%d\n", maxf, sum);
    return 0;
}

debug:unordered_set比set快很多,当然,也比unordered_map快

最后的最长路递推没有按照拓扑序(cnt的逆序)

没有去重,递推时要遍历缩点后的图

递推时:

cpp 复制代码
if (f[y] < f[x] + sz[y])
{
	f[y] = f[x] + sz[y];
	g[y] = g[x];
}

写成了g[y] = f[x],手滑了,但是这种错误真的超难debug


368. 银河

368. 银河 - AcWing题库

很直接的不等式关系,一眼差分约束,首先转换不等式关系,由于题目要求最小值,所以要用最短路,所有不等式要转换成>=的形式

  1. A >= B, B >= A
  2. B >= A + 1
  3. A >= B
  4. A >= B + 1
  5. B >= A

并且题目提供了一个边界, x i > = 1 x_i >= 1 xi>=1,转换成 x i > = x 0 + 1 x_i >= x_0 + 1 xi>=x0+1

那么 x 0 x_0 x0为虚拟源点,与所有点有一条边权为1的边,从 x 0 x_0 x0开始遍历,一定能遍历所有的点,也一定能遍历所有的边

所以从 x 0 x_0 x0为源点,用spfa求最长路,并且判断负环(无解)即可

这题和1169. 糖果一样,解法一样,数据一样,但是时间限制卡的很死。用sfpa求最长路与正环会超时

正解是:用线性时间复杂度的tarjan求强连通分量,判断每个强连通分量是否是正环。由于图中只有权值为0和1的边,环中权值为0是个零环,只要有一条边的权值为1,那么该强连通分量就是正环,返回无解

接着按照拓扑序求最长路即可

cpp 复制代码
#include <iostream>
#include <cstring>
using namespace std;

typedef long long LL;
const int N = 1e5 + 10, M = 4e5 + 10;
int h[N], hs[N], e[M], ne[M], w[M], idx;
int dfn[N], low[N], cnt, tp;
int stk[N], tt; bool st[N];
int id[N], dis[N], sz[N];
int n, m;

void add(int h[], int x, int y, int d)
{
    e[idx] = y, ne[idx] = h[x], w[idx] = d, h[x] = idx ++ ;
}

void tarjan(int x)
{
    dfn[x] = low[x] = ++ tp;
    st[x] = true, stk[ ++ tt] = x;
    for (int i = h[x]; i != -1; i = ne[i])
    {
        int y = e[i];
        if (!dfn[y])
        {
            tarjan(y);
            low[x] = min(low[x], low[y]);
        }
        else if (st[y]) low[x] = min(low[x], dfn[y]);
    }
    if (dfn[x] == low[x]) 
    {
        int y;
        ++ cnt;
        do {
            y = stk[tt -- ], st[y] = false;
            id[y] = cnt;
            sz[cnt] ++ ;
        } while (x != y);
    }
}

int main()
{
    memset(h, -1, sizeof(h));
    memset(hs, -1, sizeof(hs));
    scanf("%d%d", &n, &m);
    int t, x, y;
    for (int i = 0; i < m; ++ i )
    {
        scanf("%d%d%d", &t, &x, &y);
        if (t == 1) add(h, x, y, 0), add(h, y, x, 0);
        else if (t == 2) add(h, x, y, 1);
        else if (t == 3) add(h, y, x, 0);
        else if (t == 4) add(h, y, x, 1);
        else add(h, x, y, 0);
    }
    for (int i = 1; i <= n; ++ i ) add(h, 0, i, 1);
    for (int i = 0; i <= n; ++ i ) 
        if (!dfn[i]) tarjan(i);

    for (int x = 0; x <= n; ++ x )
        for (int i = h[x]; i != -1; i = ne[i])
        {
            int y= e[i];
            int a = id[x], b = id[y];
            if (a == b && w[i] == 1)
            {
                puts("-1");
                return 0;
            }
            else if (a != b) add(hs, a, b, w[i]);
        }
        
    for (int x = cnt; x; -- x )
    {
        for (int i = hs[x]; i != -1; i = ne[i] )
        {
            int y = e[i];
            dis[y] = max(dis[y], dis[x] + w[i]);
        }
    }
    LL sum = 0;
    for (int i = 1; i <= cnt; ++ i ) sum += (LL)sz[i] * dis[i];
    printf("%lld\n", sum);
    
    return 0;
}

debug:递推时又是没有遍历hs,缩点后的图

虚拟源点的边没有提前建,之前做sfpa时习惯在spfa里直接将所有边入队了

同时,tarjan需要遍历的点为0~n之间的所有点,不是1~n

最后计算总和时,连通分量乘以距离才是正解

相关推荐
hsling松子2 小时前
使用PaddleHub智能生成,献上浓情国庆福
人工智能·算法·机器学习·语言模型·paddlepaddle
dengqingrui1233 小时前
【树形DP】AT_dp_p Independent Set 题解
c++·学习·算法·深度优先·图论·dp
C++忠实粉丝3 小时前
前缀和(8)_矩阵区域和
数据结构·c++·线性代数·算法·矩阵
ZZZ_O^O3 小时前
二分查找算法——寻找旋转排序数组中的最小值&点名
数据结构·c++·学习·算法·二叉树
CV-King4 小时前
opencv实战项目(三十):使用傅里叶变换进行图像边缘检测
人工智能·opencv·算法·计算机视觉
代码雕刻家4 小时前
数据结构-3.9.栈在递归中的应用
c语言·数据结构·算法
雨中rain4 小时前
算法 | 位运算(哈希思想)
算法
Kalika0-06 小时前
猴子吃桃-C语言
c语言·开发语言·数据结构·算法
sp_fyf_20246 小时前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-02
人工智能·神经网络·算法·计算机视觉·语言模型·自然语言处理·数据挖掘
我是哈哈hh8 小时前
专题十_穷举vs暴搜vs深搜vs回溯vs剪枝_二叉树的深度优先搜索_算法专题详细总结
服务器·数据结构·c++·算法·机器学习·深度优先·剪枝