模式识别与机器学习-特征选择和提取

模式识别与机器学习-特征选择和提取

谨以此博客作为复习期间的记录。

常见分类问题的流程,数据预处理和特征选择提取时机器学习环节中最重要的两个流程。这两个环节直接决定了最终性能的上下限,本部分记录一下特征提取和选择部分(特征工程)

特征选择 可以表示为:从一个包含 n 个度量值的集合 { x 1 , x 2 , ... , x n } \{x_1, x_2, \dots, x_n\} {x1,x2,...,xn} 中,按照某个准则选择出一个子集,用作分类的特征,这个子集具有降维的效果(m 维,其中 m < n)。

特征提取 可以表示为:通过某种变换,将原始特征集合 ( x 1 , x 2 , ... , x n ) (x_1, x_2, \dots, x_n) (x1,x2,...,xn) 转换成一个包含 m 个新特征 ( y 1 , y 2 , ... , y m ) (y_1, y_2, \dots, y_m) (y1,y2,...,ym) 的集合(其中 m < n),这些新特征作为新的分类特征(有时称为二次特征)。

这两种方法的目的都在于在保留尽可能多的识别信息的前提下,降低特征空间的维度,以便有效地进行分类。

特征选择

一些距离测度公式






独立特征的选择准则

一般特征的散布矩阵准则

离散K-L变换


相关推荐
stephen one4 分钟前
2026 AI深度伪造危机:实测 Midjourney v7 与 Flux 2 Max 识别,谁才是 AI 检测的天花板?
人工智能·ai作画·stable diffusion·aigc·midjourney
卡奥斯开源社区官方4 分钟前
Claude 4.5技术深析:AI编码重构软件工程的底层逻辑与实践路径
人工智能·重构·软件工程
爱学英语的程序员14 分钟前
让AI 帮我做了个个人博客(附提示词!)
人工智能·git·vue·github·node·个人博客
lixzest22 分钟前
Transformer、PyTorch与人工智能大模型的关系
人工智能
其美杰布-富贵-李22 分钟前
PyTorch Lightning
人工智能·pytorch·python·training
SiYuanFeng24 分钟前
pytorch常用张量构造词句表和nn.组件速查表
人工智能·pytorch·python
MistaCloud25 分钟前
Pytorch深入浅出(十四)之完整的模型训练测试套路
人工智能·pytorch·python·深度学习
知乎的哥廷根数学学派25 分钟前
基于物理信息嵌入与多维度约束的深度学习地基承载力智能预测与可解释性评估算法(以模拟信号为例,Pytorch)
人工智能·pytorch·python·深度学习·算法·机器学习
WLJT12312312326 分钟前
电子元器件:智能时代的核心基石
大数据·人工智能·科技·安全·生活
RockHopper202534 分钟前
约束的力量:从生物认知到人工智能的跨越
人工智能·具身智能·具身认知