基于K近邻(KNN)算法的高光谱数据分类MATLAB实现

一、核心代码

1. 数据预处理
matlab 复制代码
% 加载Indian Pines数据集
load('Indian_pines_corrected.mat'); % 光谱数据
load('Indian_pines_gt.mat');      % 标签数据

% 数据标准化(Z-score)
X = zscore(reshape(data, [], size(data,3)));
Y = reshape(label, [], 1);

% 划分训练集/测试集
cv = cvpartition(Y,'HoldOut',0.3);
X_train = X(cv.training,:);
Y_train = Y(cv.training,:);
X_test = X(cv.test,:);
Y_test = Y(cv.test,:);
2. 特征降维(PCA)
matlab 复制代码
% 主成分分析
[coeff,score,~] = pca(X_train);
explained = 100*sum(coeff.^2)/size(X_train,2);
cum_explained = cumsum(explained);

% 选择前10个主成分
k = find(cum_explained >= 95, 1);
X_train_pca = score(:,1:k);
X_test_pca = coeff(:,1:k)' * (X_test' - mean(X_train))';
3. KNN分类实现
matlab 复制代码
% 参数设置
k_values = 1:5:20;
best_acc = 0;

for k = k_values
    % 构建KNN模型
    mdl = fitcknn(X_train_pca, Y_train, 'NumNeighbors', k, 'Distance', 'mahalanobis', 'Standardize', false);
    
    % 预测
    Y_pred = predict(mdl, X_test_pca);
    
    % 计算准确率
    acc = sum(Y_pred == Y_test)/numel(Y_test);
    if acc > best_acc
        best_k = k;
        best_acc = acc;
    end
end

disp(['最佳K值: ', num2str(best_k), ' 准确率: ', num2str(best_acc*100), '%']);

二、关键优化

1. 距离度量优化
matlab 复制代码
% 光谱角度匹配距离(SAM)
function d = spectral_angle(X,Y)
    numerator = sum(X.*Y, 2);
    denominator = sqrt(sum(X.^2,2)) * sqrt(sum(Y.^2,2));
    d = acos(numerator ./ denominator);
end

% 在KNN中应用自定义距离
mdl = fitcknn(X_train_pca, Y_train, 'NumNeighbors', 5, 'Distance', @spectral_angle);
2. 空间上下文融合
matlab 复制代码
% 加载空间坐标
load('Indian_pines_spatial.mat'); % 包含X,Y坐标

% 构建空间邻接矩阵
pos = [X_spatial, Y_spatial];
A = zeros(size(pos,1));
for i = 1:size(pos,1)
    dist = sqrt(sum((pos - pos(i,:)).^2,2));
    [~,idx] = mink(dist, 6);
    A(i,idx) = 1;
end

% 空间约束KNN
mdl = fitcknn([X_train_pca, A], Y_train, 'NumNeighbors', 5);

三、工程优化

1. GPU加速实现
matlab 复制代码
% 将数据转换为GPU数组
X_train_gpu = gpuArray(X_train_pca);
X_test_gpu = gpuArray(X_test_pca);

% 使用并行计算工具箱
mdl = fitcknn(X_train_gpu, Y_train, 'NumNeighbors', 5);
Y_pred_gpu = predict(mdl, X_test_gpu);
2. 分块处理策略
matlab 复制代码
% 分块处理大尺寸图像
block_size = 256;
[height,width] = size(data(:,:,1));
num_blocks = ceil(height/block_size) * ceil(width/block_size);

for i = 1:block_size:height
    for j = 1:block_size:width
        block = data(i:min(i+block_size-1,height), j:min(j+block_size-1,width), :);
        % 处理每个分块...
    end
end

四、典型应用案例

1. 农作物监测(PaviaU数据集)
matlab 复制代码
% 加载数据
load('PaviaU.mat');
load('PaviaU_gt.mat');

% 构建3D特征立方体
X = double(reshape(data, [], size(data,3)));
Y = double(reshape(gt, [], 1));

% 分类结果可视化
figure;
imagesc(label2rgb(Y));
title('真实分类图');
2. 矿产勘探(Hyperion数据)
matlab 复制代码
% 异常检测
mdl = fitcknn(X_train, Y_train, 'NumNeighbors', 3);
Y_pred = predict(mdl, X_test);

% 矿产富集区标记
anomaly_mask = Y_pred == 4; % 假设类别4为矿产

参考代码 高光谱数据进行KNN分类 www.youwenfan.com/contentcsi/65275.html

五、常见问题解决方案

1. 维数灾难处理
  • 采用核Fisher判别分析(KFDA)替代PCA
  • 使用流形学习(Isomap/LLE)
2. 类别不平衡
matlab 复制代码
% 加权KNN
mdl = fitcknn(X_train, Y_train, 'NumNeighbors', 5, 'Weights', 'classiferror');
3. 实时性提升
  • 使用KD树加速最近邻搜索
  • 采用近似最近邻算法(ANN)

六、扩展应用

  1. 多光谱视频分析
matlab 复制代码
% 视频帧间关联
prev_frame = process_frame(prev_img);
current_frame = process_frame(curr_img);
assoc = knn_associate(prev_frame, current_frame);
  1. 深度学习融合
matlab 复制代码
% 特征提取网络
net = alexnet;
features = activations(net, img, 'fc7', 'OutputAs', 'rows');

% 混合分类器
final_pred = majority_vote([knn_pred, cnn_pred]);
相关推荐
Shinom1ya_2 分钟前
算法 day 42
数据结构·算法·leetcode
earthzhang20215 分钟前
【2051】【例3.1】偶数
开发语言·数据结构·算法·青少年编程·图论
专注VB编程开发20年19 分钟前
.net c#音频放大,音量增益算法防止溢出
算法·c#·音频处理·录音·音量增益·增益控制
唯道行31 分钟前
计算机图形学·6 OpenGL编程3 谢尔宾斯基垫与三维编程
人工智能·算法·计算机视觉·计算机图形学·三维·谢尔宾斯基垫
高山上有一只小老虎33 分钟前
求最大连续bit数
java·算法
Dylan的码园1 小时前
以二叉树问题为基础的递归调试学习(上)
java·学习·算法·leetcode·r-tree
少许极端1 小时前
算法奇妙屋(九)-栈
java·数据结构·算法·
CoovallyAIHub1 小时前
未来已来:从 CVPR & ICCV 观察 2025→2026 年计算机视觉的七大走向
深度学习·算法·计算机视觉
apcipot_rain2 小时前
CSP集训错题集 第八周 主题:基础图论
算法·图论
天选之女wow2 小时前
【代码随想录算法训练营——Day57(Day56周日休息)】图论——53.寻宝
算法·图论