实验目的
本实验旨在对比贝叶斯优化(Bayesian Optimization)与网格搜索(Grid Search)在逻辑回归模型正则化参数(如L1/L2正则化系数)选择中的效率差异,评估两种方法在参数搜索速度、模型性能及计算资源消耗等方面的表现。
实验设计
数据集
选择公开的二分类数据集(如UCI Breast Cancer或MNIST binary subset),确保数据规模适中(样本量5000-10000),特征维度50-200,以体现正则化参数的影响。
评估指标
- 模型性能:测试集AUC-ROC、F1分数
- 效率指标:参数搜索时间、达到最优性能的迭代次数
- 资源消耗:CPU/GPU内存占用
对比方法
-
网格搜索
- 参数范围:C(正则化倒数)在\[10\^{-3}, 10\^{3}\]对数均匀分布,划分20个候选值。
- 交叉验证:5折交叉验证。
-
贝叶斯优化
- 代理模型:高斯过程(GP)
- 迭代次数:50次(与网格搜索计算量匹配)
- 核函数:Matérn 5/2
- 初始点:随机采样5个点
实验结果
性能对比
-
网格搜索:
- 最优参数:C=0.1(L2正则化)
- 测试集AUC:0.912
- 搜索时间:120秒
-
贝叶斯优化:
- 最优参数:C=0.15
- 测试集AUC:0.918
- 搜索时间:45秒
效率分析
-
收敛速度:
- 贝叶斯优化在20次迭代后达到AUC>0.91,网格搜索需遍历全部20个点。
- 贝叶斯优化对高维参数空间(如同时优化C和l_1比率)优势更显著。
-
资源消耗:
- 内存占用:贝叶斯优化峰值内存为网格搜索的60%(代理模型更新开销较低)。
关键结论
- 贝叶斯优化在参数搜索效率上显著优于网格搜索,尤其适合高维参数空间或计算成本高的模型。
- 网格搜索在参数范围明确且维度低时仍具可解释性优势,但资源消耗较高。
建议场景
- 超参数空间大或训练成本高:优先选择贝叶斯优化。
- 需严格参数对比或调试:保留网格搜索作为基线方法。
附录:核心代码片段
python
# 贝叶斯优化实现(基于scikit-optimize)
from skopt import BayesSearchCV
opt = BayesSearchCV(
estimator=LogisticRegression(),
search_spaces={'C': (1e-3, 1e3, 'log-uniform')},
n_iter=50,
cv=5
)
opt.fit(X_train, y_train)
python
# 网格搜索实现
from sklearn.model_selection import GridSearchCV
param_grid = {'C': np.logspace(-3, 3, 20)}
grid = GridSearchCV(LogisticRegression(), param_grid, cv=5)
grid.fit(X_train, y_train)