Python如何使用Networkx实现复杂的人物关系图?

1 简单引入

  • 日常工作、生活中我们经常会遇到一些复杂的事务关系,比如人物关系,那如何才能清楚直观的看清楚这些任务关系呢?
  • 比如我们从网上搜索1个人物关系图,大家看看:

声明:以下图片来源于网络,如果涉及版权问题,请联系作者删除。本文仅供学习,不做他用。

  • 那我们如何使用Python来实现类似的人物关系图呢?
  • 这里我们需要用到Python的networkx模块,它可以帮助我们很好的显示我们需要的效果。

2 关于Networkx

2.1 Networkx简单说明

  • NetworkX 是一个用于创建、操作和研究复杂网络的 Python 库;
  • 可以创建、分析和可视化各种类型的网络,例如社交网络、Web图、生物网络等;
  • NetworkX 可以用来创建各种类型的网络,包括有向图和无向图;
  • 提供各种方法来添加、删除和修改网络中的节点和边;
  • NetworkX 还提供许多图的算法和分析工具;
  • NetworkX还提供多种方式来可视化网络。

2.2 Networkx部分源码

  • NetworkX支持四种图,从以下源码可以看出:
python 复制代码
Python37\Lib\site-packages\networkx\classes\__init__.py
python 复制代码
from .graph import Graph
from .digraph import DiGraph
from .multigraph import MultiGraph
from .multidigraph import MultiDiGraph
from .ordered import *

from .function import *

from networkx.classes import filters

from networkx.classes import coreviews
from networkx.classes import graphviews
from networkx.classes import reportviews
  • 四种图即为:
说明
Graph 无多重边无向图
DiGraph 无多重边有向图
MultiGraph 有多重边无向图
MultiDiGraph 有多重边有向图
  • 而本文我们要用的是 Graph,它主要是用点和线来刻画离散事务集合,每对事务之间以某种方式相联系的数学模型;
  • Graph可以用来表示的关系图为人物关系图、流程图等等;
  • 以下为Graph的几个方法源码:
python 复制代码
Python37\Lib\site-packages\networkx\classes\graph.py
python 复制代码
def draw_networkx_nodes(
    G,
    pos,
    nodelist=None,
    node_size=300,
    node_color="#1f78b4",
    node_shape="o",
    alpha=None,
    cmap=None,
    vmin=None,
    vmax=None,
    ax=None,
    linewidths=None,
    edgecolors=None,
    label=None,
    margins=None,
):
    """Draw the nodes of the graph G.
python 复制代码
def draw_networkx_edges(
    G,
    pos,
    edgelist=None,
    width=1.0,
    edge_color="k",
    style="solid",
    alpha=None,
    arrowstyle="-|>",
    arrowsize=10,
    edge_cmap=None,
    edge_vmin=None,
    edge_vmax=None,
    ax=None,
    arrows=None,
    label=None,
    node_size=300,
    nodelist=None,
    node_shape="o",
    connectionstyle="arc3",
    min_source_margin=0,
    min_target_margin=0,
):
    r"""Draw the edges of the graph G.
python 复制代码
def draw_networkx_labels(
    G,
    pos,
    labels=None,
    font_size=12,
    font_color="k",
    font_family="sans-serif",
    font_weight="normal",
    alpha=None,
    bbox=None,
    horizontalalignment="center",
    verticalalignment="center",
    ax=None,
    clip_on=True,
):
    """Draw node labels on the graph G.
python 复制代码
def circular_layout(G, scale=1, center=None, dim=2):
    # dim=2 only
    """Position nodes on a circle.

    Parameters
    ----------
    G : NetworkX graph or list of nodes
        A position will be assigned to every node in G.

    scale : number (default: 1)
        Scale factor for positions.

    center : array-like or None
        Coordinate pair around which to center the layout.

    dim : int
        Dimension of layout.
        If dim>2, the remaining dimensions are set to zero
        in the returned positions.
        If dim<2, a ValueError is raised.

2.3 Networkx一个示例

  • 比如一个几个节点的有向图:
python 复制代码
# -*- coding: utf-8 -*-
import networkx as nx
import matplotlib.pyplot as plt

# 设置画布大小
plt.figure(figsize=(6, 7))

# 创建有向图对象
G = nx.DiGraph()

# 添加节点
my_node = ["nodeA", "nodeB", "nodeC", "nodeD", "nodeE", "nodeF"]
for node in my_node:
    G.add_node(node)

# 添加有向边
for edge in range(len(my_node)-1):
    print(edge)
    G.add_edge(my_node[edge], my_node[edge+1])

# 绘制
# 布局算法
pos = nx.spring_layout(G)
nx.draw(G, pos, with_labels=True)
plt.show()
  • 输出如下图示:

3 人物关系图绘制过程

3.1 创建原始数据

  • 我们以西游记和封神榜部分重点人物关系为例,先整理好一个任务关系excel文档relation.xls
python 复制代码
character1	character2	color	       num	 relation
菩提祖师	    孙悟空	    antiquewhite	9	  第一任师傅
唐僧	        孙悟空	    aqua	        9	  师徒
如来佛祖	    孙悟空	    aquamarine	    9	  五指山
观音菩萨	    孙悟空	    azure	        9	  紧箍咒
牛魔王	    孙悟空	    beige	        9	  结拜兄弟
猪八戒	    孙悟空	    bisque	        9	  大师兄
沙和尚	    孙悟空	    black	        9	  大师兄
白龙马	    孙悟空	    blanchedalmond	9	  大师兄
孙悟空	    唐僧	        aliceblue	    6	  师徒
猪八戒	    唐僧	        bisque	        6	  师徒
沙和尚	    唐僧	        black	        6	  师徒
白龙马	    唐僧	        blanchedalmond	6	  师徒
观音菩萨	    唐僧	        azure	        6	  委派西天取经
老鼠精	    唐僧	        blue	        6	  欲嫁
老鼠精	    托塔天王	    blue	        4	  义父女
哪吒	        托塔天王	    blueviolet	    4	  父子
木吒	        托塔天王	    brown	        4	  父子
金吒	        托塔天王	    burlywood	    4	  父子
木吒	        观音菩萨	    brown	        2	  大弟子
红孩儿	    观音菩萨	    cadetblue	    2	  善财童子
金吒	        如来佛祖	    burlywood	    1	  前部护法
铁扇公主	    牛魔王	    darkkhaki	    2	  夫妻
红孩儿	    牛魔王	    cadetblue	    2	  父子
红孩儿	    铁扇公主	    cadetblue	    1	  母子
哪吒	        太乙真人	    blueviolet	    1	  师徒
太乙真人	    元始天尊	    chartreuse	    7	  师徒
云中子	    元始天尊	    chocolate	    7	  师徒
玉鼎真人	    元始天尊	    coral	        7	  师徒
王母娘娘	    元始天尊	    cornflowerblue	7	  父女
鸿钧老祖	    元始天尊	    cornsilk	    7	  师徒
姜子牙	    元始天尊	    crimson	        7	  师徒
太上老君	    鸿钧老祖	    cyan	        3	  师徒
灵宝天尊	    鸿钧老祖	    darkblue	    3	  师徒
雷震子	    云中子	    darkcyan	    1	  师徒
杨戬	        玉鼎真人	    darkgoldenrod	1	  师徒
沉香	        杨戬	        darkgray	    2	  舅舅
三圣母	    杨戬	        darkgreen	    2	  兄妹
元始天尊	    鸿钧老祖	    darkmagenta	    3	  师徒
托塔天王	    孙悟空	    darkgrey	    9	  上下级
  • 这里需要注意一点,人物的数量和颜色的数量要对应起来,不然会报错:
python 复制代码
ValueError: 'c' argument has 23 elements, which is inconsistent with 'x' and 'y' with size 29.
  • 从上边的错误看,其实就是我的人物角色有29个,但是颜色只有23个,没有对应起来;
  • 为了避免错误,我们把人物和颜色列一个表,需要的时候选对应的数据就行:
python 复制代码
孙悟空	    aliceblue
菩提祖师	    antiquewhite
唐僧	        aqua
如来佛祖	    aquamarine
观音菩萨	    azure
牛魔王	    beige
猪八戒	    bisque
沙和尚	    black
白龙马	    blanchedalmond
老鼠精	    blue
哪吒	        blueviolet
木吒	        brown
金吒	        burlywood
红孩儿	    cadetblue
太乙真人	    chartreuse
云中子	    chocolate
玉鼎真人	    coral
王母娘娘	    cornflowerblue
鸿钧老祖	    cornsilk
姜子牙	    crimson
太上老君	    cyan
灵宝天尊	    darkblue
雷震子	    darkcyan
杨戬	        darkgoldenrod
沉香	        darkgray
三圣母	    darkgreen
托塔天王	    darkgrey
铁扇公主	    darkkhaki
元始天尊	    darkmagenta

3.2 获取目标文件数据

  • 读取excel中的文件数据:
python 复制代码
class TestRelation():
    def __init__(self):
        super(TestRelation, self).__init__()

        # 获取目标文件数据
        self.data = "./relation.xls"
        self.data_content = pd.DataFrame(pd.read_excel(self.data)) 
        self.character = self.data_content['character1'].drop_duplicates().values.tolist() 
        self.characters = self.data_content[['character1', 'character2', 'num']] 
  • 比如我们打印一下self.characters
python 复制代码
0        菩提祖师        孙悟空    9
1          唐僧         孙悟空    9
2        如来佛祖        孙悟空    9
3        观音菩萨        孙悟空    9
4         牛魔王        孙悟空    9
5         猪八戒        孙悟空    9
6         沙和尚        孙悟空    9
7         白龙马        孙悟空    9
8         孙悟空         唐僧    6
9         猪八戒         唐僧    6
10        沙和尚         唐僧    6
11        白龙马         唐僧    6
12       观音菩萨         唐僧    6
13        老鼠精         唐僧    6
14        老鼠精       托塔天王    4
15         哪吒       托塔天王    4
16         木吒       托塔天王    4
17         金吒       托塔天王    4
18         木吒       观音菩萨    2
19        红孩儿       观音菩萨    2
20         金吒       如来佛祖    1
21       铁扇公主        牛魔王    2
22        红孩儿        牛魔王    2
23        红孩儿       铁扇公主    1
24         哪吒       太乙真人    1
25       太乙真人       元始天尊    7
26        云中子       元始天尊    7
27       玉鼎真人       元始天尊    7
28       王母娘娘       元始天尊    7
29       鸿钧老祖       元始天尊    7
30        姜子牙       元始天尊    7
31       太上老君       鸿钧老祖    3
32       灵宝天尊       鸿钧老祖    3
33        雷震子        云中子    1
34         杨戬       玉鼎真人    1
35         沉香         杨戬    2
36        三圣母         杨戬    2
37       元始天尊       鸿钧老祖    3
38       托塔天王        孙悟空    9

3.3 获取颜色数据

python 复制代码
# 获取颜色数据
self.colors = self.data_content['color'].drop_duplicates().values.tolist()
print(self.colors)
  • 颜色获取如下:
python 复制代码
['antiquewhite', 'aqua', 'aquamarine', 'azure', 
'beige', 'bisque', 'black', 'blanchedalmond', 
'aliceblue', 'blue', 'blueviolet', 'brown', 
'burlywood', 'cadetblue', 'darkkhaki', 'chartreuse',
'chocolate', 'coral', 'cornflowerblue', 'cornsilk',
 'crimson', 'cyan', 'darkblue', 'darkcyan', 
 'darkgoldenrod', 'darkgray', 'darkgreen', 'darkmagenta', 'darkgrey']

3.5 添加边数据

python 复制代码
self.my_graph = nx.Graph()
for i in self.characters.index:
    self.my_graph.add_edge(self.characters.character1[i],
                           self.characters.character2[i],
                           weight=self.characters.num[i])

3.6 定义边及权重

python 复制代码
# 定义两个边,边给权重,s起点,e终点,w权重
edge1 = [(s, e) for (s, e, w) in self.my_graph.edges(data=True) if (w['weight'] >= 1)]
edge2 = [(s, e) for (s, e, w) in self.my_graph.edges(data=True) if (w['weight'] >= 5)]

3.7 图的布局、点、边和标签

python 复制代码
# 图的布局
pos = nx.circular_layout(self.my_graph)

# 点
nx.draw_networkx_nodes(self.my_graph, pos, alpha=1, node_size=300,
                       node_color=self.colors, node_shape='o')

# 边
nx.draw_networkx_edges(self.my_graph, pos, edgelist=edge1, width=1,
                       alpha=0.3, edge_color='g', style='dashed')

nx.draw_networkx_edges(self.my_graph, pos, edgelist=edge2, width=1.5,
                        alpha=0.5, edge_color='red')
# 标签
nx.draw_networkx_labels(self.my_graph, pos, font_size=9)

3.8 展示结果

python 复制代码
# 结果显示
plt.axis('off')
plt.title('西游记重点人物简单关系图(只是示例)')
plt.rcParams['font.size'] = 8

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.show()

3.9 完整源码

python 复制代码
# -*- coding:utf-8 -*-
# 作者:虫无涯
# 日期:2023/11/16
# 文件名称:test_relation.py
# 作用:network应用
# 联系:VX(NoamaNelson)
# 博客:https://blog.csdn.net/NoamaNelson

import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt


class TestRelation():
    def __init__(self):
        super(TestRelation, self).__init__()

        # 获取目标文件数据
        self.data = "./relation.xls"
        self.data_content = pd.DataFrame(pd.read_excel(self.data))
        self.character = self.data_content['character1'].drop_duplicates().values.tolist()
        self.characters = self.data_content[['character1', 'character2', 'num']]
        print(self.characters)

    def test_relation(self):

        # 设置画布大小,可以使用默认的
        # plt.figure(figsize=(4, 5))

        # 获取颜色数据
        self.colors = self.data_content['color'].drop_duplicates().values.tolist()
        print(self.colors)

        self.my_graph = nx.Graph()
        # 添加边
        for i in self.characters.index:
            self.my_graph.add_edge(self.characters.character1[i],
                       self.characters.character2[i],
                       weight=self.characters.num[i])

        # 定义两个边,边给权重,s起点,e终点,w权重
        edge1 = [(s, e) for (s, e, w) in self.my_graph.edges(data=True) if (w['weight'] >= 1)]
        edge2 = [(s, e) for (s, e, w) in self.my_graph.edges(data=True) if (w['weight'] >= 5)]

        # 图的布局
        pos = nx.circular_layout(self.my_graph)

        # 点
        nx.draw_networkx_nodes(self.my_graph, pos, alpha=1, node_size=300,
                               node_color=self.colors, node_shape='o')

        # 边
        nx.draw_networkx_edges(self.my_graph, pos, edgelist=edge1, width=1,
                               alpha=0.3, edge_color='g', style='dashed')

        nx.draw_networkx_edges(self.my_graph, pos, edgelist=edge2, width=1.5,
                               alpha=0.5, edge_color='red')
        # 标签
        nx.draw_networkx_labels(self.my_graph, pos, font_size=9)

        # 结果显示
        plt.axis('off')
        plt.title('西游记重点人物简单关系图(只是示例)')
        plt.rcParams['font.size'] = 8
        plt.rcParams['font.sans-serif'] = ['SimHei']  # 解决中文乱码
        plt.show()


if __name__ == "__main__":
    relation = TestRelation()
    relation.test_relation()

4 人物关系效果图

  • 运行上边的完整源码得到如下效果:
相关推荐
MichaelIp24 分钟前
LLM大语言模型中RAG切片阶段改进策略
人工智能·python·语言模型·自然语言处理·chatgpt·embedding·word2vec
find_starshine2 小时前
xml-dota-yolo数据集格式转换
xml·python·yolo
blues_C2 小时前
Pytest-Bdd-Playwright 系列教程(完结篇):本框架的功能参数说明
自动化测试·python·pytest·测试框架·bdd
nvvas2 小时前
Pytest安装Allure生成自动化测试报告
python·测试工具·pytest
Bruce-li__3 小时前
django解决跨域问题
后端·python·django
qq_273900234 小时前
pytorch torch.isclose函数介绍
人工智能·pytorch·python
生信与遗传解读4 小时前
XGBoost算法在自定义数据集中预测疾病风险
人工智能·python·算法·数据分析
serenity宁静4 小时前
Center Loss 和 ArcFace Loss 笔记
笔记·深度学习·机器学习
通信.萌新4 小时前
pandas系列----DataFrame简介
信息可视化·数据挖掘·数据分析
敲敲敲-敲代码5 小时前
【机器学习】决策树
人工智能·决策树·机器学习