R语言实战—圆形树状图

话不多说,先看最终效果:

圆形树状图是树状图的一个变型,其实都是层次聚类。

接下来看代码步骤:

首先要先安装两个包:

R 复制代码
install.packages("ggtree")
install.packages("readxl")

咱就别问问什么昂,直接安装就行,代码复制过去,点一下回车键就好~

安装完咱就开始导入数据,我的数据是这样的:

就是随便找的数据,就30多个,在这里我就不上传了,小伙伴们自己简单做一些就好~

R 复制代码
file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)
#导入数据

导完数据,开始计算距离矩阵:

R 复制代码
mydata<-hclust(dist(data))
#dist()计算点的距离形成距离矩阵
#hclust()函数会根据距离矩阵将数据点逐步合并成不同的聚类

然后开始画图:

R 复制代码
p=ggtree(mydata,layout = "circular")+
  geom_text(aes(label=node))#显示树状图每个分支的标签
#layout = "circular"设置树状图为圆形,

然后我们观察到,树状图分为四类处的值分别为:38,40,42,43。有了这些值就可以给不同类划分颜色区域

为避免过于凌乱,我们在观察到值之后就注释掉代码。然后开始下一步

R 复制代码
  geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
#offset=0.5,标签偏移量,正值向外偏,负值向内。fontface="bold"标签字体为粗体
  geom_highlight(node = 38,fill="red",alpha=0.5)+
#指定38号节点部分设置为红色,透明度为0.5
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")

然后图就变成这样:

有了这个,我们就剩最后一个步骤,给每个类定一个标签:

R 复制代码
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
#barsize =2,标签条宽度。hjust=-1,水平对齐方式。vjust=-0.5,垂直对齐方式
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

运行结果如下:

完整代码如下:

R 复制代码
library(readxl)
library(ggtree)

file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)


mydata<-hclust(dist(data))


ggtree(mydata,layout = "circular")+
#geom_text(aes(label=node))+

geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
  geom_highlight(node = 38,fill="red",alpha=0.5)+
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")+
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

小伙伴们换成自己的数据就可以运行啦~

ok,这篇就到这里啦,欢迎小伙伴们批评指正~

相关推荐
xyq202410 分钟前
TypeScript中的String类型详解
开发语言
小糖学代码6 小时前
LLM系列:1.python入门:15.JSON 数据处理与操作
开发语言·python·json·aigc
handler016 小时前
从源码到二进制:深度拆解 Linux 下 C 程序的编译与链接全流程
linux·c语言·开发语言·c++·笔记·学习
小白学大数据7 小时前
现代Python爬虫开发范式:基于Asyncio的高可用架构实战
开发语言·爬虫·python·架构
渔舟小调7 小时前
P19 | 前端加密通信层 pikachuNetwork.js 完整实现
开发语言·前端·javascript
不爱吃炸鸡柳7 小时前
数据结构精讲:树 → 二叉树 → 堆 从入门到实战
开发语言·数据结构
网络安全许木7 小时前
自学渗透测试第21天(基础命令复盘与DVWA熟悉)
开发语言·网络安全·渗透测试·php
t***5447 小时前
如何在Dev-C++中使用Clang编译器
开发语言·c++
码界筑梦坊7 小时前
93-基于Python的中药药材数据可视化分析系统
开发语言·python·信息可视化
Cosmoshhhyyy8 小时前
《Effective Java》解读第49条:检查参数的有效性
java·开发语言