【图论应用】使用多路图(multigraph)对上海地铁站点图建模,并解决最短路径问题

文章目录

    • [1 前言](#1 前言)
    • [2 导包+导入数据集](#2 导包+导入数据集)
    • [3 创建多路图,导入节点和边信息](#3 创建多路图,导入节点和边信息)
    • [3 绘制线路图](#3 绘制线路图)
    • [4 计算最短路径](#4 计算最短路径)

1 前言

最近正在学习图神经网络,先pick up了一些最基础的图论知识并学习了一些好玩的应用。

本文启发于B站视频(BV1LY411R7HJ),其对于上海地铁站点图使用了无向图也就是nx.Graph()进行建模的(Python的NetworkX库)。但是由于上海地铁存在两个站点之间可有多条线路相通的情况(如3号线和4号线共享了"虹桥路 "、"延安西路"、"中山公园"、"金沙江路"、"曹杨路"等多个站点),所以单纯的无向图严格来说不能充分解决该问题。

所以准确来讲,应该建立一个多路图(multigraph),即节点与节点之间应可以创建多条边。下图是多路图(左)与普通图(右)之间的区别。

在NetworkX库中,nx.Graph()的add_edges_from()方法是无法添加多条边的,文档里是这样记载的:

Notes-----Adding the same edge twice has no effect but any edge datawill be updated when each duplicate edge is added.

下面解决这个问题:

2 导包+导入数据集

python 复制代码
import networkx as nx
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors
%matplotlib inline

plt.rcParams['font.sans-serif']=['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False  # 用来正常显示负号

# 上海地铁站点连接表
df = pd.read_csv('shanghai_subway.csv')
df.head()

3 创建多路图,导入节点和边信息

python 复制代码
# 创建多路图
G = nx.MultiGraph()

for idx, row in df.iterrows(): # 遍历表格的每一行,添加节点
    G.add_edges_from([(row['前一站'], row['后一站'])], line=row['地铁线'], time=row['时间(分钟)'])

print(f'节点个数:{len(G)},连接个数:{len(G.edges)}')

# 查看连接属性特征
print(G.edges(data=True))

# 查看连接属性特征(multigraph)
# 最后一个维度为边的index,可能为 0,1,2...
print(G.edges[('同济大学', '四平路', 0)])

# 查看两个节点之间的边
print(G['上海火车站']['中潭路'])

可以看到查看 G['上海火车站']['中潭路'] 可以看到所有连接两节点之间的边信息

3 绘制线路图

python 复制代码
# 节点排版布局-默认弹簧布局
pos = nx.spring_layout(G, seed=123)

# 设置其它可视化样式
options = {
    "font_size": 6,
    "node_size": 300,
    "node_color": "white",
    "edgecolors": "black",
    "linewidths": 1, # 节点线宽
    "width": 2, # edge线宽
}
plt.figure(figsize=(15,15))
nx.draw_networkx(G, pos, **options)

4 计算最短路径

下面计算昌吉东路到同济大学的最短路径

python 复制代码
# 任意两节点之间是否存在路径
print(nx.has_path(G, source='昌吉东路', target='同济大学'))

# 任意两节点之间的最短路径
print(nx.shortest_path(G, source='昌吉东路', target='同济大学', weight='time'))

# 任意两节点之间的最短路径长度
print(nx.shortest_path_length(G, source='昌吉东路', target='同济大学', weight='time'))
python 复制代码
# 指定起始站和终点站
A_station = '昌吉东路'
B_station = '同济大学'

# 计算最短路径的节点序列
shortest_path = nx.shortest_path(G, source=A_station, target=B_station, weight='time')

# 计算最短路径长度
shortest_path_length = nx.shortest_path_length(G, source=A_station, target=B_station, weight='time')

# 找出最短路径经过的边
edges_in_path = []
for i in range(len(shortest_path) - 1):
    u = shortest_path[i]
    v = shortest_path[i + 1]
    # 找到具有最小权重的边
    min_weight = float('inf')
    min_edge = None
    for key, data in G[u][v].items():
        if data['time'] < min_weight:
            min_weight = data['time']
            line_id = data['line'] # 地铁线编号
            min_edge = (u, v, line_id, data['time'])
    edges_in_path.append(min_edge)

print(f"Shortest path from {A_station} to {B_station}: {shortest_path}")
print(f"Shortest path length from {A_station} to {B_station}: {shortest_path_length}")
python 复制代码
print('Edges in the shortest path: ')
for i in edges_in_path:
    print(f"{i[0]}--->{i[1]} {i[2]}号线 {i[3]}分钟")

到此解决!

我们还可以看到这里算出的从昌吉东路到同济大学的所用时间为58分钟,但原视频是59分钟。这是因为从"上海火车站"到"宝山路"两个节点的两条边所用 time 不同:
所以如果直接使用Graph的add_edges_from方法,会把3号线的信息被覆盖成4号线,就会失去3号线那段共享路线的信息,导致路径计算出现差错。


本文代码:https://github.com/aquamarineaqua/D2L-My-Note/blob/main/Graph-Neural-Network/C5_topost.ipynb

相关推荐
chan_lay2 小时前
图论导引 - 第二章 - 11/08
图论
小冉在学习2 小时前
day55 图论章节刷题Part07([53.寻宝]prim算法、kruskal算法)
java·算法·图论
chan_lay3 小时前
图论导引 - 第三章 第一节:连通性 - 11/09
图论
小冉在学习7 小时前
day57 图论章节刷题Part08(拓扑排序、dijkstra(朴素版))
java·算法·图论
Fool25635316 小时前
Guarding the Chessboard(UVA 11214)
算法·深度优先·图论
JingHongB2 天前
代码随想录算法训练营Day55 | 图论理论基础、深度优先搜索理论基础、卡玛网 98.所有可达路径、797. 所有可能的路径、广度优先搜索理论基础
算法·深度优先·图论
weixin_432702262 天前
代码随想录算法训练营第五十五天|图论理论基础
数据结构·python·算法·深度优先·图论
小冉在学习2 天前
day52 图论章节刷题Part04(110.字符串接龙、105.有向图的完全可达性、106.岛屿的周长 )
算法·深度优先·图论
小冉在学习2 天前
day53 图论章节刷题Part05(并查集理论基础、寻找存在的路径)
java·算法·图论
chan_lay4 天前
图论导引 - 目录、引言、第一章 - 11/05
笔记·图论