【R语言实战】聚类分析及可视化

🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972

个人介绍: 研一|统计学|干货分享
         擅长Python、Matlab、R等主流编程软件
         累计十余项国家级比赛奖项,参与研究经费10w、40w级横向

文章目录

  • [1 系统聚类及可视化](#1 系统聚类及可视化)
  • [2 KMeans聚类及可视化](#2 KMeans聚类及可视化)

洛杉矶街区数据(LA.Neihborhoods.csv) 这是美国普查局2000年的数据。一共有110个街区,15个变量。变量情况见下表。表中API为涉及学生成绩的Academic Performance Index的缩写。增加单位面积下的人口数(变量名density),试对修改后的数据按照income,age,homes,white和density的数据进行系统聚类和Kmeans聚类分析(分成5类),并根据所分类别和每个街区的经纬度,把各个类用不同的符号画图进行可视化。

1 系统聚类及可视化

运行代码:

复制代码
w=read.csv("E://mvstats5/data/LA.Neighborhoods.csv")#读入数据
w=data.frame(w,density=w$Population/w$Area)#增加人口密度变量
u=w[,c(1,2,5,6,11,16)]#选择变量
hw=hclust(dist(scale(u[,-1])), "ward.D2") #对标准化的数据做分层聚类, 聚类方法选的"ward.D2"
plot(hw,labels=u[,1],cex=0.6)#画树状图
id=identify(hw)#手工分成5份
rect.hclust(hw,5)

运行结果:

2 KMeans聚类及可视化

运行代码:

复制代码
a=kmeans(scale(u[,-1]),5);ppp=c(7,17,19,21)
plot(w[a$cluster==1,14:15],pch=1,col=1,xlim=c(-118.7,-118.2),ylim=c(33.73,34.32),main="Los Angeles")
for(i in 2:5){
  points(w[a$cluster==i,14:15],pch=ppp[i-1],col=2:5)
  legend("bottomleft",pch=c(1,ppp),paste("Cluster",1:4))
}

运行结果:

相关推荐
海砥装备HardAus几秒前
飞控算法中双环串级PID深度解析:角度环与角速度环的协同机制
stm32·算法·无人机·飞控·串级pid
宵时待雨1 分钟前
优选算法专题1:双指针
数据结构·c++·笔记·算法·leetcode
zsc_1183 分钟前
pvz3解码小游戏求解算法
算法
汀、人工智能5 分钟前
[特殊字符] 第107课:LRU缓存(最后一课[特殊字符])
数据结构·算法·链表·数据库架构·哈希表·lru缓存
数据知道6 分钟前
claw-code 源码分析:大型移植的测试哲学——如何用 unittest 门禁守住「诚实未完成」的口碑?
开发语言·python·ai·claude code·claw code
数据知道10 分钟前
claw-code 源码分析:结构化输出与重试——`structured_output` 一类开关如何改变「可解析性」与失败语义?
算法·ai·claude code·claw code
tankeven11 分钟前
HJ172 小红的矩阵染色
c++·算法
小堃学编程14 分钟前
【项目实战】基于protobuf的发布订阅式消息队列(2)—— 线程池
java·开发语言
2301_8227032015 分钟前
Flutter 框架跨平台鸿蒙开发 - 智能植物生长记录应用
算法·flutter·华为·harmonyos·鸿蒙
每日任务(希望进OD版)20 分钟前
线性DP、区间DP
开发语言·数据结构·c++·算法·动态规划