找到【SVM】中最优的惩罚项系数C

因为本来SVM是想找到间隔最大的分割面,所以C越大,SVC会选择边际更小的,能够更好的分类所有训练点的决策边界,不过模型的训练时间也会越长。如果C的设定值较小,那SVC会尽量最大化边界,决策功能会更简单,但代价是训练的准确度。

我们先来调线性核函数:

python 复制代码
#调线性核函数
score = []
C_range = np.linspace(0.01,30,50)
for i in C_range:
    clf = SVC(kernel="linear",C=i,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为:0.9766081871345029 1.2340816326530613

可以看到准确率最高是97%以上。接下来我们来看看在rbf上的结果:

python 复制代码
score = []
C_range = np.linspace(0.01,30,50)
for i in C_range:
    clf = SVC(kernel="rbf",C=i,gamma = 0.012742749857031322,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
    
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为:0.9824561403508771 6.130408163265306

既然最高的得分所对应的C值是6,那么我们可以在5-7之间进一步细化,看能否找到一个更好的局部最优:

python 复制代码
#进一步细化
score = []
C_range = np.linspace(5,7,50)
for i in C_range:
    clf = SVC(kernel="rbf",C=i,gamma = 
0.012742749857031322,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
    
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为:0.9824561403508771 5.938775510204081

可以看到,98.2456%就是我们最好的得分。

相关推荐
东离与糖宝12 小时前
Spring AI 2.0+Gemma 4端侧部署:Java离线AI应用全教程
java·人工智能
xcLeigh12 小时前
IoTDB AINode 实战指南:SQL 原生时序 AI 建模,毫秒级预测 / 异常检测落地
人工智能·sql·ai·iotdb·ainode
nap-joker12 小时前
Cox-PASNet:基于通路的稀疏深度神经网络用于生存分析
人工智能·神经网络·dnn
Jump 不二12 小时前
Claude Code 源码解析(一):架构篇,Claude Code的多Agent协同
人工智能·语言模型·架构
TMT星球12 小时前
深朴智能与生数科技达成深度战略合作,共筑物理世界的通用智能
大数据·人工智能·科技
幻想趾于现实12 小时前
Visionpro-blob工具-骰子的应用
人工智能·机器学习
PyHaVolask12 小时前
图片处理基础-下
人工智能·计算机视觉
Agent产品评测局12 小时前
企业 Agent 流程上线后,如何实现持续优化与迭代?——2026年企业级智能体长效运营全景指南
人工智能·ai·chatgpt
东离与糖宝12 小时前
Spring AI RAG生产方案:Java对接Gemma 4构建企业知识库
java·人工智能
小赖同学啊12 小时前
LLM 自动化测试平台 企业级架构图
人工智能