R语言图形绘制 | 桑基图绘制教程

原文链接:R语言绘制桑基图教程

写在前面

在昨天3月10日,我们在知乎B站等分享了功能富集桑基气泡图的绘制教程。相关链接:NC|高颜值功能富集桑基气泡图桑基气泡组合图

确实,目前这个图在文章中出现的频率相对比较少,但是可能随着的代码的开放,此图会别大家玩出新花样,功能富集图可能会有不同的可视化方式,若你有好的想法,也可以在自己想到后进行实现,你可能成为此图的开山鼻祖

做生物信息的,对图形的要求是比较高的,因此,需要不断的创新,不断的调整,不断的失败,更重要的是需要不断的思考

因此,我们每天学习一点点,也就是一种进步;每天整理一下笔记,也算是一种总结

本期教程图形

绘制

  1. 导入所需的R包

    library(tidyverse)

    devtools::install_github("davidsjoberg/ggsankey")

    library(ggsankey)
    library(ggplot2)
    #install.packages("cols4all")
    library(cols4all)
    #BiocManager::install("dittoSeq")
    library(dittoSeq)

  2. 导入数据

    setwd("E:\小杜的生信筆記\2024\20240311_桑基图绘制教程")

    df <- read.csv("01_inputdata.csv",header = T)
    head(df)

    head(df)
    Pathway geneID Freq
    Flavonoid biosynthesis pmb0751 1
    Flavonoid biosynthesis pmp000571 1
    Flavonoid biosynthesis mws0914 1
    Flavonoid biosynthesis pme2960 1
    Flavonoid biosynthesis pme1201 1
    Flavonoid biosynthesis mws1068 1

  3. 转化格式

    df2 <- df %>% make_long(Pathway, geneID)

    ##'@指定绘图显示顺序
    df2node <- factor(df2node, levels = c(rev(unique(dfgeneID)), rev(unique(dfPathway))))

    head(df2)

    A tibble: 6 × 4

    x node next_x next_node
    <fct> <fct> <fct> <chr>
    1 Pathway Flavonoid biosynthesis geneID pmb0751
    2 geneID pmb0751 NA NA
    3 Pathway Flavonoid biosynthesis geneID pmp000571
    4 geneID pmp000571 NA NA
    5 Pathway Flavonoid biosynthesis geneID mws0914
    6 geneID mws0914 NA NA

绘制基础图形

代码一

复制代码
mycol3 <- sample(mycol3, length(mycol3)) 

##'@代码一
ggplot(df2, aes(x = x, next_x = next_x, node = node, next_node = next_node,
               fill = node, label = node)) +
  scale_fill_manual(values = mycol3)+
  
  geom_sankey(flow.alpha = 0.5, #条带不透明度
                  smooth = 7, #条带弯曲度
                  width = 0.18) + #节点宽度
  geom_sankey_text(size = 3.2, color = 'black') +
  theme_void() +
  theme(legend.position = 'none') #隐藏图例

ggsave("桑基图.jpg",width = 6, height = 4)

代码二

复制代码
ggplot(df2, aes(x = x, next_x = next_x, node = node, next_node = next_node,
                fill = node, label = node)) +
  #设置
  geom_sankey(flow.fill="#DFDFDF",#连线颜色
              flow.alpha = 0.5, ## 条带透明度
              flow.color="grey60",#连线边框颜色
              #node.fill=dittoColors()[1:36],#节点颜色,[1:36]数值需要根据自己的数据进行修改
              width=0.2) + #node的宽度
  #设置桑葚图文字
  geom_sankey_text(size = 3,#文字大小
                   color= "black",#文字颜色
                   hjust=1) + #文字位置,右对齐
  theme_void()+
  #隐藏图例
  theme(legend.position = 'none') 

ggsave("桑基图02.jpg",width = 6, height = 4)

注意: #node.fill=dittoColors()[1:36],#节点颜色,[1:36]数值需要根据自己的数据进行修改,如下图所示。

参考:

https://mp.weixin.qq.com/s/Wv90W3In7vzhnRjCYZXs7A


若我们的分享对你有用,希望您可以点赞+收藏+转发,这是对小杜最大的支持。

往期文章:

1. 复现SCI文章系列专栏

2. 《生信知识库订阅须知》,同步更新,易于搜索与管理。

3. 最全WGCNA教程(替换数据即可出全部结果与图形)


4. 精美图形绘制教程

5. 转录组分析教程

转录组上游分析教程[零基础]

一个转录组上游分析流程 | Hisat2-Stringtie

小杜的生信筆記,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!

相关推荐
lisw051 天前
R语言的专业网站top5推荐
开发语言·r语言
清同趣科研1 天前
扩增子分析|R分析之微生物生态网络稳定性评估之节点和连接的恒常性、节点持久性以及组成稳定性指数计算
开发语言·r语言
zm-v-159304339863 天前
解锁生命周期评价密码:OpenLCA、GREET 与 R 语言的融合应用
r语言·生命周期
生信大杂烩3 天前
R语言绘图 | 渐变火山图
数据分析·r语言
KY_chenzhao5 天前
用R语言+随机森林玩转遥感空间预测-基于R语言机器学习遥感数据处理与模型空间预测技术及实际项目案例分析
随机森林·机器学习·r语言·生态·遥感·空间预测
没有梦想的咸鱼185-1037-16635 天前
【生命周期分析(Life Cycle Assessment: LCA)】基于OpenLCA、GREET、R语言的生命周期评价方法、模型构建及典型案例应用
数据分析·r语言
没有梦想的咸鱼185-1037-16636 天前
全球森林数据如何分析?基于R语言森林生态系统结构、功能与稳定性分析与可视化
开发语言·随机森林·数据分析·r语言
Tiger Z6 天前
R 语言科研绘图 --- 桑基图-汇总
开发语言·r语言·贴图
Expecto08 天前
因子分析——数学原理及R语言代码
算法·r语言·统计学·多元统计分析
kngines8 天前
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】8.2 高级可视化技巧(热力图/桑基图/地理地图)
postgresql·数据分析·热力图·桑基图·地理地图·路径分析·转化漏斗