R语言实战—圆形树状图

话不多说,先看最终效果:

圆形树状图是树状图的一个变型,其实都是层次聚类。

接下来看代码步骤:

首先要先安装两个包:

R 复制代码
install.packages("ggtree")
install.packages("readxl")

咱就别问问什么昂,直接安装就行,代码复制过去,点一下回车键就好~

安装完咱就开始导入数据,我的数据是这样的:

就是随便找的数据,就30多个,在这里我就不上传了,小伙伴们自己简单做一些就好~

R 复制代码
file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)
#导入数据

导完数据,开始计算距离矩阵:

R 复制代码
mydata<-hclust(dist(data))
#dist()计算点的距离形成距离矩阵
#hclust()函数会根据距离矩阵将数据点逐步合并成不同的聚类

然后开始画图:

R 复制代码
p=ggtree(mydata,layout = "circular")+
  geom_text(aes(label=node))#显示树状图每个分支的标签
#layout = "circular"设置树状图为圆形,

然后我们观察到,树状图分为四类处的值分别为:38,40,42,43。有了这些值就可以给不同类划分颜色区域

为避免过于凌乱,我们在观察到值之后就注释掉代码。然后开始下一步

R 复制代码
  geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
#offset=0.5,标签偏移量,正值向外偏,负值向内。fontface="bold"标签字体为粗体
  geom_highlight(node = 38,fill="red",alpha=0.5)+
#指定38号节点部分设置为红色,透明度为0.5
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")

然后图就变成这样:

有了这个,我们就剩最后一个步骤,给每个类定一个标签:

R 复制代码
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
#barsize =2,标签条宽度。hjust=-1,水平对齐方式。vjust=-0.5,垂直对齐方式
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

运行结果如下:

完整代码如下:

R 复制代码
library(readxl)
library(ggtree)

file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)


mydata<-hclust(dist(data))


ggtree(mydata,layout = "circular")+
#geom_text(aes(label=node))+

geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
  geom_highlight(node = 38,fill="red",alpha=0.5)+
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")+
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

小伙伴们换成自己的数据就可以运行啦~

ok,这篇就到这里啦,欢迎小伙伴们批评指正~

相关推荐
李白同学1 小时前
【C语言】结构体内存对齐问题
c语言·开发语言
黑子哥呢?2 小时前
安装Bash completion解决tab不能补全问题
开发语言·bash
青龙小码农2 小时前
yum报错:bash: /usr/bin/yum: /usr/bin/python: 坏的解释器:没有那个文件或目录
开发语言·python·bash·liunx
大数据追光猿3 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法
彳卸风3 小时前
Unable to parse timestamp value: “20250220135445“, expected format is
开发语言
dorabighead4 小时前
JavaScript 高级程序设计 读书笔记(第三章)
开发语言·javascript·ecmascript
风与沙的较量丶4 小时前
Java中的局部变量和成员变量在内存中的位置
java·开发语言
水煮庄周鱼鱼4 小时前
C# 入门简介
开发语言·c#
编程星空5 小时前
css主题色修改后会多出一个css吗?css怎么定义变量?
开发语言·后端·rust
软件黑马王子5 小时前
Unity游戏制作中的C#基础(6)方法和类的知识点深度剖析
开发语言·游戏·unity·c#