【R语言+Gephi】利用R语言和Gephi实现共发生网络的可视化
注:本文仅作为自己的学习记录以备以后复习查阅
一 概述
Gephi是一款开源免费的多平台网络分析软件,在Windows、Linux和Mac os上均可以运行,像他们官网所说的,他们致力于创造像Photoshop一样的图表绘制软件。
软件特点如下:
符合人体工程学的界面:无需编程技能
高性能:内置渲染引擎。
原生文件格式:GDF (GUESS)、GraphML (NodeXL)、GML、NET (Pajek)、GEXF 等。
可通过插件进行自定义:布局、指标、数据源、操作工具、渲染预设等。
Gephi官方下载地址:https://gephi.org/users/download/
二 Gephi网络可视化及美化
在Gephi中我们可以通过边文件
和点文件
创建网络图,步骤如下:
此时可以对网络图进行美化,Fruchterman Reingold
是最常用的网络布局,当然大家也可以试试看其他的布局运行出来是什么样的。
在统计模块,我们可以进行如下图所示的计算,这些也是比较常用的,大家可以根据自己的需求进行计算:
美化后的呈现效果如下:
三 R语言数据预处理
其实有时候当你将数据预处理
好了后,数据可视化反而是最容易的步骤。最常见的共发生网络分析过程是先计算相关系数矩阵,接着使用生成的gml
/graphml
格式的文件导入Gephi中使用上述过程进行可视化和个性化调整。当然了,强大如R语言,这个过程是完全可以用R语言完成的,如果你数据量不多你也可以手动编写边文件和点文件,在这里介绍如何用R语言完成这个数据准备的过程。
首先加载所需要的包并设置工作路径(也可以不设置,那么后面导入数据时需要写绝对路径),如果没有的用install.packages("包名")
语句先安装:
r
library(igraph)
library(Hmisc)
setwd("G:\\desktop\\准博一方向摸索\\R+Gephi网络可视化")
接下来导入数据(如果是我们自己的数据建议先另存为CSV-UTF-8
的格式,不然后面导入的时候可能会报错,并且注意数据文件不要有多余的空行,多检查一下)并将其转换为矩阵,再对其进行一定的数据过滤(这一步可以根据自己数据的需求进行修改):
r
otu=read.table("otu_data.xls" ,header=T,row.names = 1,sep = "\t")
otu<-as.matrix(otu)
#将丰度值大于1的值替换为1
dt<-otu
dt[dt>1]<-1
#将样本发现率低于20%的过滤掉;
no<-which(rowSums(dt)/ncol(dt)>0.2)
length(no)
otu<-otu[no,]
下面进行相关性的计算:
r
sp.cor<-rcorr(t(otu),type="spearman") # 这里也可以用Pearson
r.cor<-sp.cor$r
p.cor<-sp.cor$P
#使用Benjamini-Hochberg("FDR-BH")法进行多重检验校正(对p值的矫正);
p.adj <- p.adjust(p.cor, method="BH")
#指定阈值;
r.cutoff=0.6
p.cutoff=0.001
对相关矩阵进行一定的处理:
r
r.matrix<-r.cor
p<-p.adj
r.matrix[which(r.cor <= r.cutoff)]=0
r.matrix[which(p.adj>p.cutoff)]=0
r.matrix<-r.matrix[which(rowSums(r.matrix)!=1),]
r.matrix<-r.matrix[,which(colSums(r.matrix)!=0)]
#查看过滤后的矩阵;
dim(r.matrix)
r.matrix[1:7,1:7]
接下来就可以用我们处理好的相关性矩阵进行网络的创建了:
r
# 创建网络
g1<-graph.adjacency(r.matrix,weight=T,mode="undirected")
g1<-simplify(g1)
# 生成网络图的结点标签(OTU id)和degree属性
V(g1)$label <- V(g1)$name
V(g1)$degree <- degree(g1)
# 查看网络图的对象结构
print(g1)
# 将网络图导出
write_graph(g1, "g1.graphml", format = "graphml") # 也可以导出为gml格式的
有了R帮我们做的预处理生的.graphml文件我们就可以直接双击在Gephi中进行调整了,美化后的图如下所示:
四 参考资料
1、https://www.omicshare.com/forum/thread-6116-1-1.html
2、Dissolved organic matter transformation mechanisms and process optimization of wastewater sludge hydrothermal humification treatment for producing plant biostimulants. https://doi.org/10.1016/j.watres.2023.119910