正权图的 Dijkstra 最短路算法

最短路径问题是图论中最经典且重要的应用问题之一。它的目标是找到一个图中从起点到终点的最短路径,即在所有可能的路径中,选择一条边权和最小的路径。该问题广泛存在于多个实际场景中,比如交通运输、通信网络、导航系统等。

在实际生活中,很多情况都涉及到寻找最短路径。例如,导航系统需要为用户推荐从当前位置到目的地的最短路线,或者在计算机网络中,数据包可能需要找到从源点到目标节点的最短传输路径。此外,物流公司在进行货物配送时,也会使用最短路径算法来最优化运输路线,减少成本和时间。

最短路径问题可以分为几类,主要区别在于图中边的权重特性。这里,我们关心的是"正权图"和"负权图"的区别:

  • 正权图:在正权图中,所有边的权重都为正数。这类图广泛应用于实际生活中的路径规划问题,因为权重通常代表着距离、时间、费用等,通常都是正数。

  • 负权图:与正权图不同,负权图允许边的权重为负数。负权边的存在可能导致问题变得复杂,因为如果某些路径经过负权边,可能会导致最短路径无限循环下降,无法收敛。因此,解决带有负权边的图时需要使用不同的算法,如 Bellman-Ford 算法。

在最短路问题上,正权图和负权图有着质的区别。本文将聚焦于正权图,并探讨 Dijkstra 算法在正权图中的应用。

Dijkstra 算法

Dijkstra 算法是一种典型的贪心算法,旨在解决单源最短路径问题。它的核心思想是每次选择当前距离起点最近的未访问节点,并逐步更新与其邻接的节点的最短路径。Dijkstra算法通过逐渐扩展已知的最短路径集合,最终得到从起点到所有节点的最短路径。

Dijkstra算法的执行步骤如下:

  1. 初始化:设定起点的距离为0,其他所有节点的距离为无穷大。将所有点划分为"已求解最短距离"和"未求解最短距离"两部分。开始起点的最短路径已知,其它节点的最短路径未知。

    \[\text{dist}(s) = 0, \quad \text{dist}(v) = \infty \quad \text{for all other nodes } v \neq s \]

  2. 选择当前最近节点 :从"未求解最短距离"的点中中选择距离起点最近的节点,记为当前节点 \(u\)。

  3. 更新邻接节点的距离 :对于当前节点 \(u\) 的所有邻接节点 \(v\),如果通过 \(u\) 到 \(v\) 的路径比已知的最短路径更短,则更新 \(v\) 的最短路径:

    \[\text{dist}(v) = \min(\text{dist}(v), \text{dist}(u) + w(u, v)) \]

    其中 \(w(u, v)\) 表示边 \(u \to v\) 的权重。

  4. 标记当前节点已访问 :将当前节点 \(u\) 标记为已访问,成为"已求解最短距离"部分,不再参与后续的最短路径计算。

  5. 重复上述过程:重复步骤 2 到步骤 4,直到所有节点都被访问过,或者起点到所有其他节点的最短路径已经找到。

Dijkstra 算法的正确性

Dijkstra 算法的正确性可以通过"贪心选择性质"和"最短路径定理"来证明。

  • 贪心选择性质 :对于任何一个顶点 \(v\),如果已知通过某个节点 \(u\) 到 \(v\) 的路径是当前最短的路径,那么从起点到 \(v\) 的最短路径一定是通过 \(u\) 到 \(v\) 的路径。也就是说,Dijkstra算法每次选择距离起点最近的未访问顶点 \(u\),这个选择是局部最优的,从而保证了全局最优。

  • 最短路径定理:如果一个路径是从源点到目标节点的最短路径,那么在路径的任意前缀段(从起点到某个中间节点的路径)也是最短路径。这个定理保证了算法每次扩展的路径是最短的。

基于这些性质,Dijkstra算法能够在每次迭代中得到当前节点的最短路径,最终保证算法得到从源点到所有节点的最短路径。

在正权图中,每一次选择当前最短节点的操作是有效的,那是因为每个新选择的节点都不会影响已确定最短路径的正确性。但在负权图中,负权边可能导致我们先前认为最短的路径变得不再最短。因此,如果图中包含负权边,Dijkstra 算法无法正确地更新路径,也就无法确保最终结果是全局最优的。

cpp 复制代码
// 二叉堆版本
vector<long long> dijkstra(int s) {
    vector<long long> dist(n, LLONG_MAX / 2);
    vector<bool> visited(n, false);
    dist[s] = 0;
    priority_queue<pair<long long, int>, vector<pair<long long, int>>, greater<pair<long long, int>>> pq;
    pq.push({0, s});
    while (!pq.empty()) {
        int u = pq.top().second;
        pq.pop();
        if (visited[u]) continue;
        visited[u] = true;
        for (const auto &e : adj[u]) {
            int v = e.to;
            int w = e.weight;
            if (dist[v] > dist[u] + w) {
                dist[v] = dist[u] + w;
                pq.push({dist[v], v});
            }
        }
    } return dist;
}

时间复杂度分析

Dijkstra 算法的时间复杂度依赖于其实现方式,主要影响因素是如何选择距离起点最近的未访问节点。我们将分析不同的数据结构实现下的时间复杂度。

  1. 暴力方法(无堆实现)

    在暴力方法中,我们每次从未访问的节点中选择距离起点最近的节点,通常通过遍历所有未访问节点来实现。这种方法的时间复杂度为 \(O(V^2)\),其中 \(V\) 是图中节点的数量。每次选择最短路径节点需要 \(O(V)\) 时间,更新邻接节点的距离需要 \(O(E)\) 时间(\(E\) 为边数),总的时间复杂度为 \(O(V^2)\)。

  2. 使用二叉堆优化

    通过使用二叉堆(最小堆)来维护未访问节点的最短距离,我们可以在每次选择最短路径节点时做到 \(O(\log V)\) 时间复杂度。对于每条边的更新操作,也需要 \(O(\log V)\) 时间。因此,使用二叉堆后,Dijkstra算法的时间复杂度为 \(O((V + E) \log V)\)。

  3. 使用 k 叉堆优化

    使用 \(k\) 叉堆时,每次选择最短路径节点的时间复杂度为 \(O(\log_k V)\),而每条边的更新操作仍然是 \(O(\log_k V)\)。对于一般情况,\(k\) 的取值在实践中可能比二叉堆略大,对于非常稠密的图,多叉堆比二叉堆更好。总体时间复杂度为 \(O((V + E) \log_k V)\)。

  4. 使用斐波那契堆优化

    斐波那契堆是一个更高级的堆结构,更新操作(减小堆中元素的值)的摊销时间复杂度为 \(O(1)\)。因此,使用斐波那契堆的时间复杂度为 \(O(E + V \log V)\),这是理论的最优实现。

总结来说,Dijkstra算法的时间复杂度在不同的数据结构下有显著的差异,具体选择哪种结构取决于图的特性和实际需求。

Dijkstra 算法是正权图的最佳选择

Dijkstra 算法在正权图中有着显著的优势,适用于有向图,也适用于无向图。稳定且效率高。但其无法处理负权图。Bellman-Ford 算法才能够处理负权边并检测负权环。

对于全源最短路径, Floyd-Warshall 算法是一个用于求解所有顶点对之间最短路径的算法,其时间复杂度为 \(O(V^3)\)。虽然该算法适用于所有类型的图,但对于大规模图,尤其是图中边数较少时,Floyd-Warshall 算法的计算成本远高于 Dijkstra 算法。Dijkstra 算法更加高效,我们可以直接分别以每个点作为源点运行一次算法,得到全源最短路径。

A* 算法是对 Dijkstra 算法的一种优化,通常用于有启发式信息的路径搜索问题。A* 算法通过加入启发式函数来引导搜索,使得算法在求解最短路径时更加高效,尤其在路径搜索中与目标节点的距离较近时。若非单纯的图论求解,而在某些存在启发式的场景下(如现实地图,坐标系中的点等),可以在 dijkstra 中引入启发式。

当边权均为 1 时,我们发现 dijstra 退化为 BFS,不再需要优先队列了。反过来说,dijstra 就是 BFS 在边权不等需要用优先队列先取出最小值的扩展。t