MATLAB的cvpartition函数用法


1. 函数作用

cvpartition 将数据集划分为训练集和测试集,支持多种交叉验证方法,包括:

  • Hold-Out验证:单次划分(如70%训练,30%测试)
  • K折交叉验证:数据分为K个子集,依次用其中一个作为测试集
  • 留一法(Leave-One-Out):每次留一个样本作为测试集
  • 分层交叉验证:保持不同类别的样本比例一致

2. 基本语法

matlab 复制代码
c = cvpartition(n, 'Method', value, ...)
c = cvpartition(group, 'Method', value, ...)  % 分层选项

3. 参数说明

参数 说明
n 样本数量
group 类别标签向量(用于分层交叉验证)
'Method' 验证方法:'HoldOut', 'KFold', 'LeaveOut'
'HoldOut'参数 测试集比例 p(默认0.1)
'KFold'参数 折数 k(默认10)

4. 常用方法示例

Hold-Out 验证
matlab 复制代码
data = rand(100, 5); % 100个样本,5个特征
c = cvpartition(100, 'HoldOut', 0.3); % 30%作为测试集

trainIdx = training(c); % 逻辑索引(训练集)
testIdx = test(c);      % 逻辑索引(测试集)

trainData = data(trainIdx, :);
testData = data(testIdx, :);
K折交叉验证(5折)
matlab 复制代码
c = cvpartition(100, 'KFold', 5);
for i = 1:c.NumTestSets
    trainIdx = training(c, i); % 第i折的训练索引
    testIdx = test(c, i);      % 第i折的测试索引
    % 在此训练和验证模型
end
分层K折交叉验证
matlab 复制代码
labels = [ones(50,1); zeros(50,1)]; % 类别标签(二分类)
c = cvpartition(labels, 'KFold', 5); % 保持各类比例

% 查看每折的类别分布
disp(c.TestSize); % 每折测试集样本数
留一法(LOO)
matlab 复制代码
c = cvpartition(100, 'LeaveOut');
for i = 1:c.NumTestSets
    trainIdx = training(c, i);
    testIdx = test(c, i); % 每次仅1个测试样本
end

5. 对象属性与方法

  • 属性
    • c.NumTestSets:测试集数量(K折时为K)
    • c.TrainSize:各训练集大小
    • c.TestSize:各测试集大小
  • 方法
    • training(c, i):获取第i折的训练索引
    • test(c, i):获取第i折的测试索引
    • repartition(c):重新随机化分区(仅Hold-Out和KFold)

6. 注意事项

  • 随机种子 :使用 rng(seed) 确保结果可重复。
  • 分层必要性:分类问题建议使用分层选项,避免类别分布不均。
  • 大数据慎用LOO:留一法计算成本高,样本量大时改用K折。

相关推荐
软件算法开发11 小时前
基于瞪羚优化算法的LSTM网络模型(GOA-LSTM)的一维时间序列预测matlab仿真
人工智能·matlab·lstm·一维时间序列预测·瞪羚优化·lstm网络·goa-lstm
春日见12 小时前
自动驾驶的四个演进阶段
开发语言·人工智能·驱动开发·matlab·docker·计算机外设
kebidaixu14 小时前
matlab安装MinGW-w64 C/C++ 编译器
matlab
机器学习之心14 小时前
基于GSWOA-SVM三种策略改进鲸鱼算法优化支持向量机的数据多变量时间序列预测,Matlab代码
算法·支持向量机·matlab·优化支持向量机·gswoa-svm·三种策略改进鲸鱼算法
3GPP仿真实验室15 小时前
【MATLAB源码】THz ISAC:太赫兹通感一体化链路级仿真平台
开发语言·matlab
88号技师1 天前
2026年3月中科院一区SCI-贝塞尔曲线优化算法Bezier curve-based optimization-附Matlab免费代码
开发语言·算法·matlab·优化算法
t198751281 天前
三维点云最小二乘拟合MATLAB程序
开发语言·算法·matlab
机器学习之心1 天前
PSO-LightGBM-ABKDE粒子群算法优化轻量级梯度提升机自适应带宽核密度估计多变量回归区间预测Matlab实现
算法·matlab·回归·abkde·自适应带宽核密度估计·pso-lightgbm·粒子群算法优化轻量级梯度提升机
3GPP仿真实验室1 天前
【MATLAB源码】CSI-RS:信道估计仿真与评估平台
开发语言·matlab
Evand J1 天前
基于PID控制的无人机巡航仿真(Matlab代码实现)——四旋翼无人机三轴位置 + 偏航角的串级PID控制仿真
matlab·无人机·控制·pid·uav·旋翼机