机器学习---规则学习（序贯覆盖、单条规则学习、剪枝优化）

三月七（爱看动漫的程序员）2024-02-16 11:46

1. 序贯覆盖

回归：分类：

聚类：

逻辑规则：

读作：若（文字1且文字2且...），则目标概念成立

规则集：充分性与必要性；冲突消解：顺序规则、缺省规则、元规则

eg：

命题逻辑 → 命题规则

原子命题：𝐴*,𝐵,𝐶,...A,B,C,...；逻辑连词：↔,→,←,⋀,⋁,¬*...↔,→,←,⋀,⋁,¬...

一阶逻辑 →一阶规则

常量：𝑎*,𝑏,𝑏,...,1,2,3,...*；变量：𝐴*,𝐵,𝐶,...*A,B,C,...

（n元）谓词/函数： p/n, f/n；项：常量|变量|函数/谓词（项1，项2，...）

原子公式：函数/谓词（项1，项2，...）父亲（X,Y），自然数（39），偶数（后继（1）），...

逻辑连词：↔,→,←,⋀,⋁,¬...；逻辑量词：∀，∃

序贯覆盖：在训练集上每学到一条规则，就将改规则覆盖的样例去除，然后以剩下的样例组成训练

集重复上述过程（分治策略）。

2. 单条规则学习

目标：寻找一组最优的逻辑文字来构成规则体。本质：搜索问题；搜索空间大，易造成组合爆炸。

方法：自顶向下：一般到特殊（泛化）；自底向上：特殊到一般（特化）

自顶向下策略：一般到特殊（特化）

自底向上策略：特殊到一般（泛化）

规则评判：增加/删除哪一个候选文字；准确率；信息熵增益（率）；基尼系数 ......

规避局部最优：集束搜索：每次保留最优的多个候选规则 ......

3. 剪枝优化

贪心算法导致的非最优的算法：

预剪枝：似然率统计量：

后剪枝：剪错剪枝（REP）：穷举所有可能的剪枝操作（删除文字、删除规则），复杂度非常高，

用验证集反复剪枝直到精确率无法提高。

二者结合：IREP：每生成一条新规则即对进行REP剪枝

IREP*：是对IREP的优化

RIPPER：

IREP*生成规则集，选取其规则，找到其覆盖的样例，重新生成规则，特化原规则在泛化，把原规

则和新规则放入规则集中进行评价，留下最好的，反复优化直到无法进步。

RIPPER将所有规则放在一起优化，通过全局的考虑来缓解序贯覆盖的局部性。

上一篇：[office] excel2003限定单元格输入值范围教程 #微信#经验分享

下一篇：PHP毕业设计图片分享网站76t17

热门推荐

01KGG转MP3工具|非KGM文件|解密音频 02集群聊天服务器---MySQL数据库的建立 03Coze扣子平台完整体验和实践（附国内和国际版对比）04绿色建筑新态势：楼宇自控助力能效提升，推动成本优化新路径 05使用Ruby接入实时行情API教程 06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07【无标题】08基于odoo17的设计模式详解---单例模式 09DeepSeek各版本说明与优缺点分析 10全球最强模型Grok4，国内已可免费使用！（附教程）