找到【SVM】中最优的惩罚项系数C

因为本来SVM是想找到间隔最大的分割面,所以C越大,SVC会选择边际更小的,能够更好的分类所有训练点的决策边界,不过模型的训练时间也会越长。如果C的设定值较小,那SVC会尽量最大化边界,决策功能会更简单,但代价是训练的准确度。

我们先来调线性核函数:

python 复制代码
#调线性核函数
score = []
C_range = np.linspace(0.01,30,50)
for i in C_range:
    clf = SVC(kernel="linear",C=i,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为:0.9766081871345029 1.2340816326530613

可以看到准确率最高是97%以上。接下来我们来看看在rbf上的结果:

python 复制代码
score = []
C_range = np.linspace(0.01,30,50)
for i in C_range:
    clf = SVC(kernel="rbf",C=i,gamma = 0.012742749857031322,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
    
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为:0.9824561403508771 6.130408163265306

既然最高的得分所对应的C值是6,那么我们可以在5-7之间进一步细化,看能否找到一个更好的局部最优:

python 复制代码
#进一步细化
score = []
C_range = np.linspace(5,7,50)
for i in C_range:
    clf = SVC(kernel="rbf",C=i,gamma = 
0.012742749857031322,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
    
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为:0.9824561403508771 5.938775510204081

可以看到,98.2456%就是我们最好的得分。

相关推荐
Cx330❀几秒前
脉脉:AI创作者xAMA第二期 | AI创作者崛起
人工智能
AI扶我青云志2 分钟前
深度介绍:Moltbot(原名Clawdbot)
人工智能·大模型·agent
天竺鼠不该去劝架2 分钟前
Moltbot 与金智维 K-APA :个人与企业级 AI 智能体架构差异
人工智能
无垠的广袤3 分钟前
【Arduino UNO Q】 边缘 AI 视觉部署方案:二维码识别
linux·人工智能·python·opencv
珠海西格电力科技7 分钟前
微电网与大电网的关系:互补而非替代的能源协同逻辑
人工智能·分布式·物联网·云计算·能源
超自然祈祷9 分钟前
论文内容提取:面向多智能体博弈对抗的对手建模框架_罗俊仁
人工智能
视***间13 分钟前
视程空间ARC Jetson Thor系列:以极致算力,赋机器人以智慧灵魂
人工智能·机器人·边缘计算·机器狗·视程空间·ai算力开发板
KlipC14 分钟前
微软资本支出飙升、云业务增速放缓
人工智能·klipc
数据猿14 分钟前
我参与了百度文心App AI群聊内测,提前感受到了社交AI的革命
人工智能·百度
青瓷程序设计15 分钟前
【害虫识别系统】Python+深度学习+人工智能+算法模型+TensorFlow+图像识别+卷积网络算法
人工智能·python·深度学习