机器学习7_支持向量机_兵王问题

兵王问题描述

用SVM解决问题

国际象棋的规则:

兵:第一次向前可以走一格或两格,以后每次只能向前走一格,不能后退。

王:王被将死即告负。每次只能走一格。

兵王问题:

棋局上,黑方只剩一个王,白方剩一个兵,一个王

结局有两种可能:

  • 白方将死黑方,白方获胜。
  • 和棋

国际象棋详细规则:

【兵的升变】:兵走至对方的底线,可以升变为除王以外的任意棋子。

【逼和】:一方的王未被将军,但移动到任意的地方都会被对方将死,则此时是和棋。

判断兵王问题

可以在UCI MACHINE LEARNING网站上下载数据集,文件名------krkopt.data

这个文件的每一行,就是一个训练样本

首先给出三个字棋子的坐标,例如,第一行,a,1,b,3,c,2,draw。表示黑方的王在a1的位置,白方的王在b3的位置,白方的兵在c2的位置,这时,黑方的王处于无路可走的状态,是和棋,那么这一行最后一个单词是标签做中文,意思是和棋。

例如下面,如d,1,e,3,f,1,six。意思是如果这三个子处于这样的位置,白方最多六步就能将死黑方。

在这里,我们用支持向量机处理这个问题。

把【和棋】当作一类设定

把【其他标签(one到fifteen)】当作另一类设定

在这个数据集中,总样本个数为28,056个,其中正样本 ,和棋个数为2,796个,其他都是负样本,也就是负样本 的集合个数为25,260个。

用支持向量机程序进行训练

使用LIBSVM工具包 下载的网址


兵王问题程序设计

第一步:对数据的预处理

  • 总样本数:28,056,其中正样本2,796,负样本25,260。
  • 随机取5,000个样本训练,其余测试。

对训练样本归一化

在训练样本上,求出每个维度的均值和方差,在训练和测试样本上同时归一化。

训练样本归一化(Normalization Of Training Data):是构建机器学习分类时常用的技术,它可以将输入特征每个维度限定在一个固定的范围内,从而减少不同维度由于动态范围不同导致的训练误差。

第二步:设置支持向量机的各种参数

目标函数:

这里用到-s 0,S=1~4可以查询LIBSVM工具包和其他资料加以了解。

核函数

LIBSVM支持的几个核函数,如下:

支持向量机的优化问题如下:

最大化:

限制条件:

(1)

(2)

可以看到,对于n个训练样本,我们知道它是排列出来的矩阵:

i和j=1~N

相关推荐
struggle20251 小时前
一个开源 GenBI AI 本地代理(确保本地数据安全),使数据驱动型团队能够与其数据进行互动,生成文本到 SQL、图表、电子表格、报告和 BI
人工智能·深度学习·目标检测·语言模型·自然语言处理·数据挖掘·集成学习
佛州小李哥1 小时前
通过亚马逊云科技Bedrock打造自定义AI智能体Agent(上)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
追求源于热爱!1 小时前
记5(一元逻辑回归+线性分类器+多元逻辑回归
算法·机器学习·逻辑回归
云空2 小时前
《DeepSeek 网页/API 性能异常(DeepSeek Web/API Degraded Performance):网络安全日志》
运维·人工智能·web安全·网络安全·开源·网络攻击模型·安全威胁分析
AIGC大时代2 小时前
对比DeepSeek、ChatGPT和Kimi的学术写作关键词提取能力
论文阅读·人工智能·chatgpt·数据分析·prompt
爱喝奶茶的企鹅3 小时前
构建一个研发助手Agent:提升开发效率的实践
机器学习
山晨啊83 小时前
2025年美赛B题-结合Logistic阻滞增长模型和SIR传染病模型研究旅游可持续性-成品论文
人工智能·机器学习
一水鉴天4 小时前
为AI聊天工具添加一个知识系统 之77 详细设计之18 正则表达式 之5
人工智能·正则表达式
davenian4 小时前
DeepSeek-R1 论文. Reinforcement Learning 通过强化学习激励大型语言模型的推理能力
人工智能·深度学习·语言模型·deepseek
X.AI6664 小时前
【大模型LLM面试合集】大语言模型架构_llama系列模型
人工智能·语言模型·llama