R语言实战—圆形树状图

话不多说,先看最终效果:

圆形树状图是树状图的一个变型,其实都是层次聚类。

接下来看代码步骤:

首先要先安装两个包:

R 复制代码
install.packages("ggtree")
install.packages("readxl")

咱就别问问什么昂,直接安装就行,代码复制过去,点一下回车键就好~

安装完咱就开始导入数据,我的数据是这样的:

就是随便找的数据,就30多个,在这里我就不上传了,小伙伴们自己简单做一些就好~

R 复制代码
file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)
#导入数据

导完数据,开始计算距离矩阵:

R 复制代码
mydata<-hclust(dist(data))
#dist()计算点的距离形成距离矩阵
#hclust()函数会根据距离矩阵将数据点逐步合并成不同的聚类

然后开始画图:

R 复制代码
p=ggtree(mydata,layout = "circular")+
  geom_text(aes(label=node))#显示树状图每个分支的标签
#layout = "circular"设置树状图为圆形,

然后我们观察到,树状图分为四类处的值分别为:38,40,42,43。有了这些值就可以给不同类划分颜色区域

为避免过于凌乱,我们在观察到值之后就注释掉代码。然后开始下一步

R 复制代码
  geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
#offset=0.5,标签偏移量,正值向外偏,负值向内。fontface="bold"标签字体为粗体
  geom_highlight(node = 38,fill="red",alpha=0.5)+
#指定38号节点部分设置为红色,透明度为0.5
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")

然后图就变成这样:

有了这个,我们就剩最后一个步骤,给每个类定一个标签:

R 复制代码
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
#barsize =2,标签条宽度。hjust=-1,水平对齐方式。vjust=-0.5,垂直对齐方式
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

运行结果如下:

完整代码如下:

R 复制代码
library(readxl)
library(ggtree)

file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)


mydata<-hclust(dist(data))


ggtree(mydata,layout = "circular")+
#geom_text(aes(label=node))+

geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
  geom_highlight(node = 38,fill="red",alpha=0.5)+
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")+
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

小伙伴们换成自己的数据就可以运行啦~

ok,这篇就到这里啦,欢迎小伙伴们批评指正~

相关推荐
codecrafter1238 分钟前
sh:在 Python 里直接调系统命令
开发语言·python·其他
Luminous.8 分钟前
C语言--day29
c语言·开发语言
逢君学术论文AI写作9 分钟前
Java第24课:会话技术CookieSession
java·开发语言
小小编程路11 分钟前
字符串转数字时,可能会遇到哪些问题?
java·开发语言·算法
许彰午16 分钟前
责任链模式实战——同一个框架里的两种链
java·开发语言·责任链模式
寻道码路18 分钟前
LangChain4j Java AI 应用开发实战(十四):手写 RAG 全流程 - 深入理解每个环节
java·开发语言·人工智能·ai
吴阿福|一人公司29 分钟前
Python 类变量修改的压力测试:高并发场景
开发语言·python
天天进步201536 分钟前
Tunnelto 源码解析 #13:自托管部署:Docker、环境变量、端口规划与单实例限制
开发语言
AI科技星37 分钟前
第三卷:质数王朝志(全卷定稿)
c语言·开发语言·汇编·electron·概率论
kyle~1 小时前
DDS分布式实时系统---自省机制
开发语言·分布式·机器人·c#·接口·ros2