【R语言+Gephi】利用R语言和Gephi实现共发生网络的可视化

【R语言+Gephi】利用R语言和Gephi实现共发生网络的可视化

注:本文仅作为自己的学习记录以备以后复习查阅

一 概述

Gephi是一款开源免费的多平台网络分析软件,在Windows、Linux和Mac os上均可以运行,像他们官网所说的,他们致力于创造像Photoshop一样的图表绘制软件。

软件特点如下:

符合人体工程学的界面:无需编程技能

高性能:内置渲染引擎。

原生文件格式:GDF (GUESS)、GraphML (NodeXL)、GML、NET (Pajek)、GEXF 等。

可通过插件进行自定义:布局、指标、数据源、操作工具、渲染预设等。

Gephi官方下载地址:https://gephi.org/users/download/

二 Gephi网络可视化及美化

在Gephi中我们可以通过边文件点文件创建网络图,步骤如下:





此时可以对网络图进行美化,Fruchterman Reingold是最常用的网络布局,当然大家也可以试试看其他的布局运行出来是什么样的。



在统计模块,我们可以进行如下图所示的计算,这些也是比较常用的,大家可以根据自己的需求进行计算:

美化后的呈现效果如下:

三 R语言数据预处理

其实有时候当你将数据预处理好了后,数据可视化反而是最容易的步骤。最常见的共发生网络分析过程是先计算相关系数矩阵,接着使用生成的gml/graphml格式的文件导入Gephi中使用上述过程进行可视化和个性化调整。当然了,强大如R语言,这个过程是完全可以用R语言完成的,如果你数据量不多你也可以手动编写边文件和点文件,在这里介绍如何用R语言完成这个数据准备的过程。

首先加载所需要的包并设置工作路径(也可以不设置,那么后面导入数据时需要写绝对路径),如果没有的用install.packages("包名")语句先安装:

r 复制代码
library(igraph)
library(Hmisc)
setwd("G:\\desktop\\准博一方向摸索\\R+Gephi网络可视化")

接下来导入数据(如果是我们自己的数据建议先另存为CSV-UTF-8的格式,不然后面导入的时候可能会报错,并且注意数据文件不要有多余的空行,多检查一下)并将其转换为矩阵,再对其进行一定的数据过滤(这一步可以根据自己数据的需求进行修改):

r 复制代码
otu=read.table("otu_data.xls" ,header=T,row.names = 1,sep = "\t")
otu<-as.matrix(otu)
#将丰度值大于1的值替换为1
dt<-otu
dt[dt>1]<-1
#将样本发现率低于20%的过滤掉;
no<-which(rowSums(dt)/ncol(dt)>0.2)
length(no)
otu<-otu[no,]

下面进行相关性的计算:

r 复制代码
sp.cor<-rcorr(t(otu),type="spearman") # 这里也可以用Pearson
r.cor<-sp.cor$r
p.cor<-sp.cor$P

#使用Benjamini-Hochberg("FDR-BH")法进行多重检验校正(对p值的矫正);
p.adj <- p.adjust(p.cor, method="BH")

#指定阈值;
r.cutoff=0.6
p.cutoff=0.001

对相关矩阵进行一定的处理:

r 复制代码
r.matrix<-r.cor
p<-p.adj 

r.matrix[which(r.cor <= r.cutoff)]=0
r.matrix[which(p.adj>p.cutoff)]=0

r.matrix<-r.matrix[which(rowSums(r.matrix)!=1),]
r.matrix<-r.matrix[,which(colSums(r.matrix)!=0)]

#查看过滤后的矩阵;
dim(r.matrix)
r.matrix[1:7,1:7]

接下来就可以用我们处理好的相关性矩阵进行网络的创建了:

r 复制代码
# 创建网络
g1<-graph.adjacency(r.matrix,weight=T,mode="undirected")
g1<-simplify(g1)

# 生成网络图的结点标签(OTU id)和degree属性
V(g1)$label <- V(g1)$name
V(g1)$degree <- degree(g1)

# 查看网络图的对象结构
print(g1)

# 将网络图导出
write_graph(g1, "g1.graphml", format = "graphml") # 也可以导出为gml格式的

有了R帮我们做的预处理生的.graphml文件我们就可以直接双击在Gephi中进行调整了,美化后的图如下所示:

四 参考资料

1、https://www.omicshare.com/forum/thread-6116-1-1.html

2、Dissolved organic matter transformation mechanisms and process optimization of wastewater sludge hydrothermal humification treatment for producing plant biostimulants. https://doi.org/10.1016/j.watres.2023.119910

相关推荐
ROC_bird..7 分钟前
STL - vector的使用和模拟实现
开发语言·c++
MavenTalk13 分钟前
Move开发语言在区块链的开发与应用
开发语言·python·rust·区块链·solidity·move
XiaoLeisj1 小时前
【JavaEE初阶 — 多线程】生产消费模型 & 阻塞队列
java·开发语言·java-ee
2401_840192271 小时前
python基础大杂烩
linux·开发语言·python
@东辰1 小时前
【golang-技巧】- 定时任务 - cron
开发语言·golang·cron
机器人天才一号1 小时前
C#从入门到放弃
开发语言·c#
Mr_Xuhhh2 小时前
递归搜索与回溯算法
c语言·开发语言·c++·算法·github
文军的烹饪实验室2 小时前
ValueError: Circular reference detected
开发语言·前端·javascript
B20080116刘实2 小时前
CTF攻防世界小白刷题自学笔记13
开发语言·笔记·web安全·网络安全·php
Qter_Sean3 小时前
自己动手写Qt Creator插件
开发语言·qt