【R语言+Gephi】利用R语言和Gephi实现共发生网络的可视化

【R语言+Gephi】利用R语言和Gephi实现共发生网络的可视化

注:本文仅作为自己的学习记录以备以后复习查阅

一 概述

Gephi是一款开源免费的多平台网络分析软件,在Windows、Linux和Mac os上均可以运行,像他们官网所说的,他们致力于创造像Photoshop一样的图表绘制软件。

软件特点如下:

符合人体工程学的界面:无需编程技能

高性能:内置渲染引擎。

原生文件格式:GDF (GUESS)、GraphML (NodeXL)、GML、NET (Pajek)、GEXF 等。

可通过插件进行自定义:布局、指标、数据源、操作工具、渲染预设等。

Gephi官方下载地址:https://gephi.org/users/download/

二 Gephi网络可视化及美化

在Gephi中我们可以通过边文件点文件创建网络图,步骤如下:





此时可以对网络图进行美化,Fruchterman Reingold是最常用的网络布局,当然大家也可以试试看其他的布局运行出来是什么样的。



在统计模块,我们可以进行如下图所示的计算,这些也是比较常用的,大家可以根据自己的需求进行计算:

美化后的呈现效果如下:

三 R语言数据预处理

其实有时候当你将数据预处理好了后,数据可视化反而是最容易的步骤。最常见的共发生网络分析过程是先计算相关系数矩阵,接着使用生成的gml/graphml格式的文件导入Gephi中使用上述过程进行可视化和个性化调整。当然了,强大如R语言,这个过程是完全可以用R语言完成的,如果你数据量不多你也可以手动编写边文件和点文件,在这里介绍如何用R语言完成这个数据准备的过程。

首先加载所需要的包并设置工作路径(也可以不设置,那么后面导入数据时需要写绝对路径),如果没有的用install.packages("包名")语句先安装:

r 复制代码
library(igraph)
library(Hmisc)
setwd("G:\\desktop\\准博一方向摸索\\R+Gephi网络可视化")

接下来导入数据(如果是我们自己的数据建议先另存为CSV-UTF-8的格式,不然后面导入的时候可能会报错,并且注意数据文件不要有多余的空行,多检查一下)并将其转换为矩阵,再对其进行一定的数据过滤(这一步可以根据自己数据的需求进行修改):

r 复制代码
otu=read.table("otu_data.xls" ,header=T,row.names = 1,sep = "\t")
otu<-as.matrix(otu)
#将丰度值大于1的值替换为1
dt<-otu
dt[dt>1]<-1
#将样本发现率低于20%的过滤掉;
no<-which(rowSums(dt)/ncol(dt)>0.2)
length(no)
otu<-otu[no,]

下面进行相关性的计算:

r 复制代码
sp.cor<-rcorr(t(otu),type="spearman") # 这里也可以用Pearson
r.cor<-sp.cor$r
p.cor<-sp.cor$P

#使用Benjamini-Hochberg("FDR-BH")法进行多重检验校正(对p值的矫正);
p.adj <- p.adjust(p.cor, method="BH")

#指定阈值;
r.cutoff=0.6
p.cutoff=0.001

对相关矩阵进行一定的处理:

r 复制代码
r.matrix<-r.cor
p<-p.adj 

r.matrix[which(r.cor <= r.cutoff)]=0
r.matrix[which(p.adj>p.cutoff)]=0

r.matrix<-r.matrix[which(rowSums(r.matrix)!=1),]
r.matrix<-r.matrix[,which(colSums(r.matrix)!=0)]

#查看过滤后的矩阵;
dim(r.matrix)
r.matrix[1:7,1:7]

接下来就可以用我们处理好的相关性矩阵进行网络的创建了:

r 复制代码
# 创建网络
g1<-graph.adjacency(r.matrix,weight=T,mode="undirected")
g1<-simplify(g1)

# 生成网络图的结点标签(OTU id)和degree属性
V(g1)$label <- V(g1)$name
V(g1)$degree <- degree(g1)

# 查看网络图的对象结构
print(g1)

# 将网络图导出
write_graph(g1, "g1.graphml", format = "graphml") # 也可以导出为gml格式的

有了R帮我们做的预处理生的.graphml文件我们就可以直接双击在Gephi中进行调整了,美化后的图如下所示:

四 参考资料

1、https://www.omicshare.com/forum/thread-6116-1-1.html

2、Dissolved organic matter transformation mechanisms and process optimization of wastewater sludge hydrothermal humification treatment for producing plant biostimulants. https://doi.org/10.1016/j.watres.2023.119910

相关推荐
web安全工具库20 分钟前
Makefile 模式规则精讲:从 %.o: %.c 到静态模式规则的终极自动化
linux·运维·c语言·开发语言·数据库·自动化
從南走到北22 分钟前
JAVA代泊车接机送机服务代客泊车系统源码支持小程序+APP+H5
java·开发语言·微信小程序·小程序
earthzhang20213 小时前
【1028】字符菱形
c语言·开发语言·数据结构·c++·算法·青少年编程
earthzhang20215 小时前
第3讲:Go垃圾回收机制与性能优化
开发语言·jvm·数据结构·后端·性能优化·golang
纵有疾風起6 小时前
C++——类和对象(3)
开发语言·c++·经验分享·开源
Full Stack Developme6 小时前
java.text 包详解
java·开发语言·python
文火冰糖的硅基工坊7 小时前
[嵌入式系统-135]:主流AIOT智能体开发板
开发语言·嵌入式·cpu
yudiandian20148 小时前
02 Oracle JDK 下载及配置(解压缩版)
java·开发语言
要加油哦~8 小时前
JS | 知识点总结 - 原型链
开发语言·javascript·原型模式
鄃鳕8 小时前
python迭代器解包【python】
开发语言·python