R语言实战—圆形树状图

话不多说,先看最终效果:

圆形树状图是树状图的一个变型,其实都是层次聚类。

接下来看代码步骤:

首先要先安装两个包:

R 复制代码
install.packages("ggtree")
install.packages("readxl")

咱就别问问什么昂,直接安装就行,代码复制过去,点一下回车键就好~

安装完咱就开始导入数据,我的数据是这样的:

就是随便找的数据,就30多个,在这里我就不上传了,小伙伴们自己简单做一些就好~

R 复制代码
file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)
#导入数据

导完数据,开始计算距离矩阵:

R 复制代码
mydata<-hclust(dist(data))
#dist()计算点的距离形成距离矩阵
#hclust()函数会根据距离矩阵将数据点逐步合并成不同的聚类

然后开始画图:

R 复制代码
p=ggtree(mydata,layout = "circular")+
  geom_text(aes(label=node))#显示树状图每个分支的标签
#layout = "circular"设置树状图为圆形,

然后我们观察到,树状图分为四类处的值分别为:38,40,42,43。有了这些值就可以给不同类划分颜色区域

为避免过于凌乱,我们在观察到值之后就注释掉代码。然后开始下一步

R 复制代码
  geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
#offset=0.5,标签偏移量,正值向外偏,负值向内。fontface="bold"标签字体为粗体
  geom_highlight(node = 38,fill="red",alpha=0.5)+
#指定38号节点部分设置为红色,透明度为0.5
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")

然后图就变成这样:

有了这个,我们就剩最后一个步骤,给每个类定一个标签:

R 复制代码
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
#barsize =2,标签条宽度。hjust=-1,水平对齐方式。vjust=-0.5,垂直对齐方式
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

运行结果如下:

完整代码如下:

R 复制代码
library(readxl)
library(ggtree)

file_path<-"G:/R代码/聚类测试数据.xlsx"

data <- read_excel(file_path)


mydata<-hclust(dist(data))


ggtree(mydata,layout = "circular")+
#geom_text(aes(label=node))+

geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
  geom_highlight(node = 38,fill="red",alpha=0.5)+
  geom_highlight(node=40,fill="blue")+
  geom_highlight(node=42,fill="orange")+
  geom_highlight(node=43,fill="pink")+
  geom_cladelabel(node=38,label="A",
                  offset=3,barsize =2,hjust=-1,
                  vjust=-0.5,color="red")+
  geom_cladelabel(node=40,label="B",
                offset=3,barsize =2,
                hjust=1.5,vjust=-0.5,color="blue")+
  geom_cladelabel(node=42,label="D",
                  offset=3,barsize=2,
                  hjust=-3,vjust=0.1,color="orange")+
  geom_cladelabel(node=43,label="C",
                offset=3,barsize=2,
                hjust=2,color="pink")

小伙伴们换成自己的数据就可以运行啦~

ok,这篇就到这里啦,欢迎小伙伴们批评指正~

相关推荐
岁忧5 小时前
GoLang五种字符串拼接方式详解
开发语言·爬虫·golang
tyatyatya5 小时前
MATLAB基础数据类型教程:数值型/字符型/逻辑型/结构体/元胞数组全解析
开发语言·matlab
心无旁骛~6 小时前
python多进程和多线程问题
开发语言·python
星云数灵6 小时前
使用Anaconda管理Python环境:安装与验证Pandas、NumPy、Matplotlib
开发语言·python·数据分析·pandas·教程·环境配置·anaconda
kaikaile19956 小时前
基于遗传算法的车辆路径问题(VRP)解决方案MATLAB实现
开发语言·人工智能·matlab
四问四不知6 小时前
Rust语言进阶(结构体)
开发语言·后端·rust
q***9946 小时前
index.php 和 php
开发语言·php
oioihoii6 小时前
C++网络编程:从Socket混乱到优雅Reactor的蜕变之路
开发语言·网络·c++
笙年7 小时前
JavaScript Promise,包括构造函数、对象方法和类方法
开发语言·javascript·ecmascript
神仙别闹7 小时前
基于C++实现(控制台)应用递推法完成经典型算法的应用
开发语言·c++·算法