【图论】（二）图论基础与路径问题

图论基础与路径问题

图的构造
- 邻接矩阵
- 邻接表
所有可达路径
- 邻接矩阵存储
- 邻接表存储
字符串接龙
有向图的完全可达性

图的构造

这里仅对图论路径问题中图的构造做整理总结归纳，具体详细相关概念请参考代码随想录上的整理总结：

我们如何用代码来表示一个图呢？

一般使用邻接表、邻接矩阵或者用类来表示。

邻接矩阵

邻接矩阵使用二维数组来表示图结构 。邻接矩阵是从节点的角度来表示图，有多少节点就申请多大的二维数组。
例如： grid[2][5] = 6，表示节点 2 连接节点5 为有向图，节点2 指向节点5，边的权值为6。
如果想表示无向图，即：grid[2][5] = 6，grid[5][2] = 6，表示节点2 与节点5 相互连通，权值为6

在一个 n （节点数）为8 的图中，就需要申请 8 * 8 这么大的空间。
这种表达方式（邻接矩阵）在边少，节点多的情况下，会导致申请过大的二维数组，造成空间浪费。
而且在寻找节点连接情况的时候，需要遍历整个矩阵，即 n * n 的时间复杂度，同样造成时间浪费。

邻接矩阵的优点：

表达方式简单，易于理解
检查任意两个顶点间是否存在边的操作非常快
适合稠密图，在边数接近顶点数平方的图中，邻接矩阵是一种空间效率较高的表示方法。

缺点：

遇到稀疏图，会导致申请过大的二维数组造成空间浪费
遍历边的时候需要遍历整个n * n矩阵，造成时间浪费

邻接表

邻接表使用数组 + 链表的方式来表示。邻接表是从边的数量来表示图，有多少边才会申请对应大小的链表。

邻接表的构造如图：

这里表达的图是：

节点1 指向节点3 和节点5
节点2 指向节点4、节点3、节点5
节点3 指向节点4
节点4指向节点1

有多少边邻接表才会申请多少个对应的链表节点。

从图中可以直观看出使用数组 + 链表来表达边的连接情况

邻接表的优点：

对于稀疏图的存储，只需要存储边，空间利用率高
遍历节点连接情况相对容易

缺点：

检查任意两个节点间是否存在边，效率相对低，需要 O(V)时间，V表示某节点连接其他节点的数量。
实现相对复杂，不易理解

所有可达路径

卡码网题目链接（ACM模式）

力扣题目链接 - 797. 所有可能的路径

题目描述：

给定一个有 n 个节点的有向无环图，节点编号从 1 到 n。请编写一个函数，找出并返回所有从节点 1 到节点 n 的路径。每条路径应以节点编号的列表形式表示。

输入描述：

第一行包含两个整数 N，M，表示图中拥有 N 个节点，M 条边
后续 M 行，每行包含两个整数 s 和 t，表示图中的 s 节点与 t 节点中有一条路径

输出描述： 输出所有的可达路径，路径中所有节点的后面跟一个空格，每条路径独占一行，存在多条路径，路径输出的顺序可任意。如果不存在任何一条路径，则输出 -1。

注意输出的序列中 ，最后一个节点后面没有空格！例如正确的答案是 1 3 5,而不是 1 3 5 ， 5后面没有空格！

输入示例：

cpp 复制代码

输出示例：

cpp 复制代码

1 3 5
1 2 4 5

提示信息：

写在前面：

在上述谈到图的两张存储方式中，这里通过两种方式逐一巩固。
此外，本题是目是深度优先搜索比较好的入门题，若对深搜不清楚的需先提前了解深度搜索理论与过程。

邻接矩阵存储

邻接矩阵使用二维数组来表示图结构，邻接矩阵是从节点的角度来表示图，有多少节点就申请多大的二维数组。
本题有n 个节点，因为节点标号是从1开始的，为了节点标号和下标对齐，我们申请 n + 1 * n + 1 这么大的二维数组。
cpp 复制代码
```
vector<vector<int>> graph(n + 1, vector<int>(n + 1, 0));
```
输入每行两个整数 s 和 t，表示图中的 s 节点与 t 节点中有一条路径，则表示 graph[s][t] = 1;，输入m条边程序则有：
cpp 复制代码
```
while (m--) {
    cin >> s >> t;
    // 使用邻接矩阵 ，1 表示 节点s 指向 节点t
    graph[s][t] = 1;
}
```

深搜三部曲：

1. 确认递归函数，参数

首先我们dfs函数一定要存一个图，用来遍历，需要存一个目前我们遍历的节点，定义为x
还需要存一个n，表示终点，我们遍历的时候，用来判断当 x==n 时候标明找到了终点

至于单一路径和路径集合可以放在全局变量，那么代码是这样的：

cpp 复制代码

vector<vector<int>> result; 	// 收集符合条件的路径
vector<int> path; 				// 0节点到终点的路径
// x：目前遍历的节点
// graph：存当前的图
// n：终点
void dfs (const vector<vector<int>>& graph, int x, int n) {

2. 确认终止条件

当目前遍历的节点为最后一个节点 n 的时候就找到了一条从出发点到终止点的路径。

cpp 复制代码

// 当前遍历的节点x 到达节点n 
// 找到符合条件的一条路径
if (x == n) 
{ 
    result.push_back(path);
    return;
}

3. 处理目前搜索节点出发的路径

接下来是走当前遍历节点x的下一个节点。

首先是要找到 x节点指向了哪些节点呢？遍历方式是这样的：

cpp 复制代码

for (int i = 1; i <= n; i++) 	// 遍历节点x链接的所有节点
{ 
    if (graph[x][i] == 1) 		// 找到 x指向的节点，就是节点i
    { 	
    	
    }
}

接下来就是将选中的x所指向的节点，加入到单一路径来

cpp 复制代码

path.push_back(i); // 遍历到的节点加入到路径中来

进入下一层递归

cpp 复制代码

dfs(graph, i, n); // 进入下一层递归

最后就是回溯的过程，撤销本次添加节点的操作

cpp 复制代码

path.pop_back(); // 回溯，撤销本节点

该过程整体代码：

cpp 复制代码

for (int i = 1; i <= n; i++) 	// 遍历节点x链接的所有节点
{ 
    if (graph[x][i] == 1)		// 找到 x链接的节点
     {
        path.push_back(i); 		// 遍历到的节点加入到路径中来
        dfs(graph, i, n); 		// 进入下一层递归
        path.pop_back(); 		// 回溯，撤销本节点
    }
}

程序实现：

cpp 复制代码

#include <iostream>
#include <vector>
#include <algorithm>
#include <queue>

using namespace std;


vector<vector<int>> result;		// 手机符合条件的路径
vector<int> path;				//0节点到终点的路径
// graph：存当前的图
// x：目前遍历的节点
// n：终点
void dfs(const vector<vector<int>> graph, int x, int n)
{
	// 当前遍历的节点x 到达节点n 
	if(x == n)
	{
		result.push_back(path);
		return;
	}
	// 遍历节点x链接的所有节点
	for(int i = 1; i <= n; i++)
	{
		// 找到 x指向的节点，就是节点i
		if(graph[x][i] == 1)
		{
			// 将选中的x所指向的节点，加入到 单一路径来。
			path.push_back(i);
			// 进入下一层递归
			dfs(graph,i,n);
			// 回溯的过程，撤销本次添加节点的操作
			path.pop_back();
		}
	}
}

int main()
{
	// m条边 n个节点 
	// graph[s][t] = 1表示节点s可以指向t
	int m,n,s,t;
	cin >> n >> m;
	vector<vector<int>> graph(n+1, vector<int>(n+1,0));
	while(m--)
	{
		cin >> s >> t;
		// 使用邻接矩阵 表示无线图，1 表示 s 与 t 是相连的
		graph[s][t] = 1;
	}
	
	// 任何路径都是从节点1开始
	path.push_back(1);
	// 开始遍历
	dfs(graph,1,n);
	
	// 打印结果
	if(result.size() == 0)
		cout << -1 << endl;
	for(int i = 0; i < result.size(); i++)
	{
		for(int j = 0; j < result[i].size() - 1; j++)
		{
			cout << result[i][j] << " ";
		}
		cout << result[i][result[i].size() - 1] << endl;
	}
	
	return 0;
}

邻接表存储

用邻接表存储和邻接矩阵存储的区别只需要修改图的定义存储、dfs函数内的参数以及对链表的遍历，核心框架、思路均不变。

程序实现：

cpp 复制代码

//邻接表法
vector<vector<int>> result;		// 手机符合条件的路径
vector<int> path;				//0节点到终点的路径
// graph：存当前的图
// x：目前遍历的节点
// n：终点
void dfs(const vector<list<int>> graph, int x, int n)
{
	// 当前遍历的节点x 到达节点n 
	if(x == n)
	{
		result.push_back(path);
		return;
	}
	// 遍历节点x链接的所有节点
	for(int node: graph[x])
	{
		// 将选中的x所指向的节点，加入到 单一路径来。
		path.push_back(node);
		// 进入下一层递归
		dfs(graph,node,n);
		// 回溯的过程，撤销本次添加节点的操作
		path.pop_back();
	}
}

int main()
{
	// m条边 n个节点 
	// graph[s][t] = 1表示节点s可以指向t
	int m,n,s,t;
	cin >> n >> m;
	vector<list<int>> graph(n+1);
	while(m--)
	{
		cin >> s >> t;
		// 使用邻接矩阵 表示无线图，1 表示 s 与 t 是相连的
		graph[s].push_back(t);
	}
	
	// 任何路径都是从节点1开始
	path.push_back(1);
	// 开始遍历
	dfs(graph,1,n);
	
	// 打印结果
	if(result.size() == 0)
		cout << -1 << endl;
	for(int i = 0; i < result.size();i++)
	{
		for(int j = 0; j < result[i].size() - 1; j++)
		{
			cout << result[i][j] << " ";
		}
		cout << result[i][result[i].size() - 1] << endl;
	}
	
	return 0;
}

字符串接龙

卡码网题目链接（ACM模式）

题目描述：

字典 strList 中从字符串 beginStr 和 endStr 的转换序列是一个按下述规格形成的序列：

序列中第一个字符串是 beginStr。
序列中最后一个字符串是 endStr。
每次转换只能改变一个字符。
转换过程中的中间字符串必须是字典 strList 中的字符串。

给你两个字符串 beginStr 和 endStr 和一个字典 strList，找到从 beginStr 到 endStr 的最短转换序列中的字符串数目。如果不存在这样的转换序列，返回 0。

输入描述：

第一行包含一个整数 N，表示字典 strList 中的字符串数量。第二行包含两个字符串，用空格隔开，分别代表 beginStr 和 endStr。后续 N 行，每行一个字符串，代表 strList 中的字符串。

输出描述：

输出一个整数，代表从 beginStr 转换到 endStr 需要的最短转换序列中的字符串数量。如果不存在这样的转换序列，则输出 0。

输入示例：

cpp 复制代码

6
abc def
efc
dbc
ebc
dec
dfc
yhn

输出示例：

cpp 复制代码

提示信息： 从 startStr 到 endStr，在 strList 中最短的路径为 abc -> dbc -> dec -> def，所以输出结果为 4

本题只需要求出最短路径的长度就可以了，不用找出具体路径。

所以这道题要解决两个问题：

图中的线是如何连在一起的
起点和终点的最短路径长度

首先题目中并没有给出点与点之间的连线，而是要我们自己去连，条件是字符只能差一个。

所以判断点与点之间的关系，需要判断是不是差一个字符，如果差一个字符，那就是有链接。

然后就是求起点和终点的最短路径长度，这里无向图求最短路，广搜最为合适，广搜只要搜到了终点，那么一定是最短的路径。 因为广搜就是以起点中心向四周扩散的搜索。

本题如果用深搜，会比较麻烦，要在到达终点的不同路径中选则一条最短路。 而广搜只要达到终点，一定是最短路。

另外需要有一个注意点：

本题是一个无向图，需要用标记位，标记着节点是否走过，否则就会死循环！
使用set来检查字符串是否出现在字符串集合里更快一些

程序实现：

cpp 复制代码

#include <iostream>
#include <string>
#include <queue>
#include <unordered_set>
#include <unordered_map>

using namespace std;

int main()
{
	int n;
	string beginStr;
	string endStr;
	string str;
	unordered_set<string> strSet;	// 字典 存放每一个字符串
	
	cin >> n;
	cin >> beginStr >> endStr;
	
	for(int i = 0; i < n;i++){
		cin >> str;
		strSet.insert(str);
	}
	
	// 记录strSet里的字符串是否被访问过，同时记录路径长度
	unordered_map<string, int> visitMap; // <记录的字符串，路径长度>
	
	// 初始化队列
	queue<string> que;
	que.push(beginStr);
	
	// 加入队列即标记访问
	visitMap.insert(pair<string,int>(beginStr, 1));
	
	while(!que.empty())
	{
		// 获取队头字符串，拿出来
		string word = que.front();
		que.pop();
		// 这个字符串在路径中的长度为 visitMap[word]
		int path = visitMap[word];
		
		// 开始在这个str中，挨个字符去替换
		for(int i = 0; i < word.size(); i++)
		{
			// 用一个新字符串替换str，因为每次要置换一个字符
			string newWord = word;
			// 遍历26的字母
			for(int j = 0; j < 26; j++)
			{
				newWord[i] = j + 'a';
				// 发现替换字母后，字符串与终点字符串相同
				if(newWord == endStr)
				{
					cout <<  path + 1 << endl; // 找到了路径 
					return 0;
				}
				// 字符串集合里出现了newWord，并且newWord没有被访问过
				if (strSet.find(newWord) != strSet.end() 
					&& visitMap.find(newWord) == visitMap.end())
				{
					// 添加访问信息，并将新字符串放到队列中
					visitMap.insert(pair<string, int>(newWord, path + 1));
					 que.push(newWord);
				}
			}
		}
	}
	// 没找到输出0
	return 0;
}

有向图的完全可达性

卡码网题目链接（ACM模式）

题目描述：

给定一个有向图，包含 N 个节点，节点编号分别为 1，2，...，N。现从 1 号节点开始，如果可以从 1 号节点的边可以到达任何节点，则输出 1，否则输出 -1。

输入描述：

第一行包含两个正整数，表示节点数量 N 和边的数量 K。后续 K 行，每行两个正整数 s 和 t，表示从 s 节点有一条边单向连接到 t 节点。

输出描述： 如果可以从 1 号节点的边可以到达任何节点，则输出 1，否则输出 -1。

输入示例：

cpp 复制代码

输出示例：

cpp 复制代码

提示信息：

思路

本题给我们是一个有向图，因此路径是存在方向的

递归三部曲：

1. 确认递归函数，参数

需要传入地图，当前的节点数（到当前节点是通路），同时还需要一个数组，用来记录我们都走过了哪些节点，这样好知道最后有没有把所有房间都遍历的。

所以递归函数参数如下：

cpp 复制代码

// key 当前的节点数（到当前节点是通路）
// visited 记录访问过的房间 
void dfs(const vector<list<int>>& graph, int key, vector<bool>& visited) {

2. 确认终止条件

遍历的时候，什么时候终止呢？这里有一个很重要的逻辑，就是在递归中，是处理当前访问的节点，还是处理下一个要访问的节点

如果我们是处理当前访问的节点，当前访问的节点如果是 true ，说明是访问过的节点，那就终止本层递归，如果不是true，我们就把它赋值为true，因为这是我们处理本层递归的节点。

代码就是这样的：

cpp 复制代码

// 写法一：处理当前访问的节点
void dfs(const vector<list<int>>& graph, int key, vector<bool>& visited) {
    if (visited[key]) {
        return;
    }
    visited[key] = true;
    list<int> keys = graph[key];	// 获取当前节点连接的节点链表
    for (int key : keys) {
        // 深度优先搜索遍历
        dfs(graph, key, visited);
    }
}

如果我们是处理下一层访问的节点，而不是当前层。那么就要在深搜三部曲中第三步：处理目前搜索节点出发的路径的时候对节点进行处理。

这样的话，就不需要终止条件，而是在搜索下一个节点的时候，直接判断下一个节点是否是我们要搜的节点。

代码就是这样的：

cpp 复制代码

// 写法二：处理下一个要访问的节点
void dfs(const vector<list<int>>& graph, int key, vector<bool>& visited) {
    list<int> keys = graph[key];	// 获取当前节点连接的节点链表
    for (int key : keys)
     {
      	// 确认下一个是没访问过的节点
        if(visited[key] == false) {
            visited[key] = true;
            dfs(graph, key, visited);
        }
    }
}

可以看出，如何看待我们要访问的节点，直接决定了两种不一样的写法

上述程序中，好像没有发现回溯的逻辑。本题是需要判断 1节点是否能到所有节点，那么我们就没有必要回溯去撤销操作了，只要遍历过的节点一律都标记上。

那什么时候需要回溯操作呢？

当我们需要搜索一条可行路径的时候，就需要回溯操作了，因为没有回溯，就没法"调头"，

程序实现：

cpp 复制代码

#include <iostream>
#include <vector>
#include <list>

using namespace std;

// key 当前得到的可以 
// visited 记录访问过的房间 
void dfs(vector<list<int>>& graph, int key, vector<bool>& visited)
{
	list<int> keys = graph[key];	// 获取当前节点下挂的节点链表
	for(int key: keys)
	{
		if(visited[key] == false)	// 遍历每一个节点 并做dfs标记
		{
			visited[key] = true;
			dfs(graph,key,visited);
		}
	}
}

int main()
{
	int n, m, s, t;
	cin >> n >> m;
	
	vector<list<int>> graph(n+1);

	while(m--){
		cin >> s >> t;
		graph[s].push_back(t);
	}
	
	vector<bool> visited(n + 1, false);
	visited[1] = true; 			// 节点1 预先处理
	dfs(graph, 1, visited);		// dfs计算能到达的最远节点，能到达并做标记
	
	for(int i = 1; i <= n; i++)
	{
		if(visited[i] == false)
		{
			cout << -1 << endl;	
			return 0;
		}
	}
	
	cout << 1 << endl;	
	return 0;
}