R语言实战—圆形树状图

话不多说,先看最终效果:

圆形树状图是树状图的一个变型,其实都是层次聚类。

接下来看代码步骤:

首先要先安装两个包:

R 复制代码
install.packages("ggtree")
install.packages("readxl")

咱就别问问什么昂,直接安装就行,代码复制过去,点一下回车键就好~

安装完咱就开始导入数据,我的数据是这样的:

就是随便找的数据,就30多个,在这里我就不上传了,小伙伴们自己简单做一些就好~

R 复制代码
file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)
#导入数据

导完数据,开始计算距离矩阵:

R 复制代码
mydata<-hclust(dist(data))
#dist()计算点的距离形成距离矩阵
#hclust()函数会根据距离矩阵将数据点逐步合并成不同的聚类

然后开始画图:

R 复制代码
p=ggtree(mydata,layout = "circular")+
  geom_text(aes(label=node))#显示树状图每个分支的标签
#layout = "circular"设置树状图为圆形,

然后我们观察到,树状图分为四类处的值分别为:38,40,42,43。有了这些值就可以给不同类划分颜色区域

为避免过于凌乱,我们在观察到值之后就注释掉代码。然后开始下一步

R 复制代码
  geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
#offset=0.5,标签偏移量,正值向外偏,负值向内。fontface="bold"标签字体为粗体
  geom_highlight(node = 38,fill="red",alpha=0.5)+
#指定38号节点部分设置为红色,透明度为0.5
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")

然后图就变成这样:

有了这个,我们就剩最后一个步骤,给每个类定一个标签:

R 复制代码
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
#barsize =2,标签条宽度。hjust=-1,水平对齐方式。vjust=-0.5,垂直对齐方式
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

运行结果如下:

完整代码如下:

R 复制代码
library(readxl)
library(ggtree)

file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)


mydata<-hclust(dist(data))


ggtree(mydata,layout = "circular")+
#geom_text(aes(label=node))+

geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
  geom_highlight(node = 38,fill="red",alpha=0.5)+
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")+
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

小伙伴们换成自己的数据就可以运行啦~

ok,这篇就到这里啦,欢迎小伙伴们批评指正~

相关推荐
Warren9836 分钟前
如何在 Spring Boot 中安全读取账号密码等
java·开发语言·spring boot·后端·安全·面试·测试用例
燃尽了,可无1 小时前
C#基础编程核心知识点总结
开发语言·c#
llrraa20102 小时前
python whisper生成字幕
开发语言·python·whisper
努力努力再努力wz2 小时前
【c++进阶系列】:万字详解多态
java·linux·运维·开发语言·c++
秦亿凡2 小时前
多线程下为什么用ConcurrentHashMap而不是HashMap
java·开发语言
阿波罗尼亚3 小时前
ExcelUtils实现 设置内容 插入行 复制行列格式
java·开发语言
啊吧怪不啊吧4 小时前
C++之list类的代码及其逻辑详解 (中)
开发语言·数据结构·c++·list
THMAIL4 小时前
大模型0基础开发入门与实践:第11章 进阶:LangChain与外部工具调用
开发语言·langchain·php
hfd19905 小时前
JavaScript 性能优化实战技术文章大纲
开发语言·javascript·性能优化
楼田莉子5 小时前
C++算法学习专题:滑动窗口
开发语言·数据结构·c++·学习·算法·leetcode