模式识别与机器学习-特征选择和提取

模式识别与机器学习-特征选择和提取

谨以此博客作为复习期间的记录。

常见分类问题的流程,数据预处理和特征选择提取时机器学习环节中最重要的两个流程。这两个环节直接决定了最终性能的上下限,本部分记录一下特征提取和选择部分(特征工程)

特征选择 可以表示为:从一个包含 n 个度量值的集合 { x 1 , x 2 , ... , x n } \{x_1, x_2, \dots, x_n\} {x1,x2,...,xn} 中,按照某个准则选择出一个子集,用作分类的特征,这个子集具有降维的效果(m 维,其中 m < n)。

特征提取 可以表示为:通过某种变换,将原始特征集合 ( x 1 , x 2 , ... , x n ) (x_1, x_2, \dots, x_n) (x1,x2,...,xn) 转换成一个包含 m 个新特征 ( y 1 , y 2 , ... , y m ) (y_1, y_2, \dots, y_m) (y1,y2,...,ym) 的集合(其中 m < n),这些新特征作为新的分类特征(有时称为二次特征)。

这两种方法的目的都在于在保留尽可能多的识别信息的前提下,降低特征空间的维度,以便有效地进行分类。

特征选择

一些距离测度公式






独立特征的选择准则

一般特征的散布矩阵准则

离散K-L变换


相关推荐
摘取一颗天上星️17 分钟前
NLP进化史:从规则模板到思维链推理,七次范式革命全解析
人工智能·自然语言处理
知舟不叙44 分钟前
深度学习——基于PyTorch的MNIST手写数字识别详解
人工智能·pytorch·深度学习·手写数字识别
Jamence1 小时前
多模态大语言模型arxiv论文略读(118)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
愚农搬码1 小时前
LangChain 调用不同类型的多MCP服务
人工智能·后端
AI速译官1 小时前
字节跳动推出视频生成新模型Seedance
人工智能
chenquan2 小时前
ArkFlow 流处理引擎 0.4.0-rc1 发布
人工智能·后端·github
Se7en2582 小时前
使用 Higress AI 网关代理 vLLM 推理服务
人工智能
AI大模型技术社2 小时前
PyTorch手撕CNN:可视化卷积过程+ResNet18训练代码详解
人工智能·神经网络
CSTechEi2 小时前
【IEEE/EI/Scopus检索】2025年第六届模式识别与数据挖掘国际会议 (PRDM 2025)
人工智能·数据挖掘·模式识别·ei学术会议
CSTechEi2 小时前
【SPIE/EI/Scopus检索】2025 年第二届数据挖掘,计算与软件工程国际会议 (DMCSE 2025)
人工智能·数据挖掘·软件工程·信息与通信·ei学术会议