上一篇:【数学建模 matlab 实验报告12】聚类分析和判别分析
目录
实验报告
本例数据存于:第14次-主成分分析.xlsx文件中

问题:
(1)请根据调查资料作区域消费类型划分(提示:聚类分析);
(2)请利用主成分分析方法对各省的消费水平做综合评价并排序,与聚类分析的结果进行对比。

截图:


代码:
Matlab
data = xlsread('第14次-主成分分析.xlsx', 'Sheet1');
data_std = zscore(data);
num_clusters = 3;
[cluster_idx, cluster_center] = kmeans(data_std, num_clusters);
[coeff, score, latent] = pca(data_std);
composite_score = score(:,1);
[score_sorted, sort_index] = sort(composite_score, 'descend');
disp('省份排序:');
disp(sort_index);
disp('聚类结果:');
disp(cluster_idx);
随着社会的高速发展,人民的生活发生巨大的变化,居民的消费水平备受关注,它是反映一个国家(或地区)的经济发展水平和人民物质文化生活水平的综合指标。重庆市直辖十年以来,居民的消费水平发生了很大的变化,从而也促进了整个城市经济的发展,在政府的带领下,居民的消费水平不断提高,生活质量越来越好。按照我国常用的消费支出分类法,居民的消费水平分为食品、衣着、家庭设备用品及服务、医疗保健、交通通讯、文教娱乐及服务、居住和杂项商品与服务8个部分,这8个部分代表了居民消费的各个领域,下表就是重庆市10年间城镇居民人均消费的情况(单位:元/人)。
|------|---------|---------|--------|--------|--------|---------|--------|--------|
| Y | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 |
| 1997 | 2297.86 | 589.62 | 474.74 | 164.19 | 290.91 | 626.21 | 295.20 | 199.03 |
| 1998 | 2262.19 | 571.69 | 461.25 | 185.90 | 337.83 | 604.78 | 354.66 | 198.96 |
| 1999 | 2303.29 | 589.99 | 516.21 | 236.55 | 403.92 | 730.05 | 438.41 | 225.80 |
| 2000 | 2308.70 | 551.14 | 476.45 | 293.23 | 406.44 | 785.74 | 494.04 | 254.10 |
| 2001 | 2337.65 | 589.28 | 509.82 | 334.05 | 442.50 | 850.15 | 563.72 | 246.51 |
| 2002 | 2418.96 | 618.60 | 454.20 | 429.60 | 615.00 | 1065.12 | 594.48 | 164.28 |
| 2003 | 2702.34 | 735.01 | 475.36 | 459.69 | 790.26 | 1025.99 | 741.60 | 187.81 |
| 2004 | 3015.32 | 779.68 | 474.15 | 537.95 | 865.45 | 1200.52 | 903.22 | 196.77 |
| 2005 | 3135.65 | 849.53 | 583.50 | 629.32 | 929.92 | 1391.11 | 882.41 | 221.85 |
| 2006 | 3415.92 | 1038.98 | 615.74 | 705.72 | 976.02 | 1449.49 | 954.56 | 242.26 |
试利用主成分分析方法对10年间城镇居民人均消费情况进行分析。
截图:


代码:
Matlab
data = [
2297.86, 589.62, 474.74, 164.19, 290.91, 626.21, 295.20, 199.03;
2262.19, 571.69, 461.25, 185.90, 337.83, 604.78, 354.66, 198.96;
2303.29, 589.99, 516.21, 236.55, 403.92, 730.05, 438.41, 225.80;
2308.70, 551.14, 476.45, 293.23, 406.44, 785.74, 494.04, 254.10;
2337.65, 589.28, 509.82, 334.05, 442.50, 850.15, 563.72, 246.51;
2418.96, 618.60, 454.20, 429.60, 615.00, 1065.12, 594.48, 164.28;
2702.34, 735.01, 475.36, 459.69, 790.26, 1025.99, 741.60, 187.81;
3015.32, 779.68, 474.15, 537.95, 865.45, 1200.52, 903.22, 196.77;
3135.65, 849.53, 583.50, 629.32, 929.92, 1391.11, 882.41, 221.85;
3415.92, 1038.98, 615.74, 705.72, 976.02, 1449.49, 954.56, 242.26
];
data_std = zscore(data);
[coeff, score, latent] = pca(data_std);
disp('主成分系数:');
disp(coeff);
disp('主成分得分:');
disp(score);
disp('特征值:');
disp(latent);
composite_score = score(:,1);
[sorted_score, sort_index] = sort(composite_score, 'descend');
disp('年份排序:');
disp(sort_index);
实验心得
本次实验围绕主成分分析与聚类分析两种多元统计方法展开,通过两个实操任务,系统练习了数据预处理、模型构建、结果分析的完整流程,深入理解了两种方法的核心原理与应用场景,切实体会到统计分析在解决实际经济、民生问题中的价值,在理论认知和实操能力上均获得了显著提升。
实验第一个任务聚焦区域消费类型划分与综合评价,要求结合聚类分析与主成分分析,对各省消费数据进行分析对比。实操中,我首先运用`xlsread`函数读取Excel数据,通过`zscore`函数完成数据标准化,这一步让我再次认识到,不同消费指标的量纲差异会影响分析结果的准确性,数据预处理是保障实验可靠性的前提。随后,采用K均值聚类将数据划分为3类,明确了不同区域的消费类型差异;再通过主成分分析,利用`pca`函数提取主成分、计算主成分得分及综合得分,对各省消费水平进行排序。通过对比聚类结果与主成分排序,我发现两者呈现出高度的一致性:消费水平较高的省份聚为一类,中等水平和较低水平的省份分别聚为另外两类,这印证了两种方法的互补性------聚类分析侧重探索数据内在的分组结构,主成分分析侧重将多维度数据降维,实现综合评价与排序,二者结合能更全面地解读数据特征。
实验第二个任务针对重庆市十年间城镇居民人均消费数据,运用主成分分析方法进行深入分析。该任务涉及食品、衣着、居住等8项消费指标,全面反映了居民消费的各个领域。实操中,我直接录入数据并完成标准化,通过`pca`函数获取主成分系数、得分及特征值,进而计算综合得分并对年份进行排序。分析结果清晰呈现了重庆市直辖十年间居民消费水平的变化趋势:从综合得分排序可以看出,居民消费水平整体呈逐年上升态势,尤其是2002年后增长速度明显加快。结合主成分系数和特征值,我进一步发现,食品、交通通讯、文教娱乐等指标对居民消费水平的影响最为显著,这与居民生活质量提升、消费结构优化的实际情况相符,也让我理解了主成分分析在数据降维、核心影响因素提取中的优势------它能将多个相关指标转化为少数几个互不相关的综合指标,简化分析过程,同时保留原始数据的主要信息。
通过本次实验,我不仅熟练掌握了MATLAB中`zscore`、`kmeans`、`pca`等核心函数的用法,更深刻领悟了主成分分析与聚类分析的核心逻辑。主成分分析作为一种数据降维方法,有效解决了多指标分析中信息重叠、计算繁琐的问题,适用于综合评价类场景;聚类分析作为无监督学习方法,无需预设分类标准,能客观呈现数据的自然分组,适用于类型划分类问题。二者在实际应用中相辅相成,比如在区域经济、居民消费等领域,结合两种方法既能明确分组差异,又能实现综合排序,为决策提供科学依据。
实验过程中,我也深刻认识到细节的重要性:数据标准化的规范性、聚类类别数量的合理选择、主成分的提取依据,都会影响实验结果的准确性。同时,我也体会到统计分析并非简单的代码运行,更重要的是对结果的解读能力------需结合实际场景,将数据结果转化为有意义的结论,才能真正发挥统计方法的价值。
此次实验夯实了我对多元统计分析方法的理论基础,提升了数据分析与MATLAB实操能力。在今后的学习中,我将继续深化对主成分分析、聚类分析等方法的理解,学会根据实际问题选择合适的统计方法,不断提升数据解读与应用能力,用科学的分析方法解决更多实际问题。