机器学习Day12:特征选择与稀疏学习

1.子集搜索与评价

相关特征:对当前学习任务有用 的特征

无关特征:对当前学习任务没用 的特征

特征选择:从给定的特征集合 中选择出相关特征子集的过程

为什么要特征选择?

1.任务中经常碰到维数灾难

2.去除不相关的特征能降低学习的难度

特征选择很重要,但特征很多,如何根据评价结果 获取下一个候选特征子集?
子集搜索

如何评价候选特征子集的好坏?
子集评价

利用信息增熵方法计算的结果进行评价

2.过滤式选择


3.包裹式选择

包裹式特征选择直接最终 将要使用的学习器的性能作为特征子集的评价标准

优点:结果优于过滤式选择

缺点:计算开销大于过滤式选择

4.嵌入式选择

特征选择过程学习器训练 过程融为一体,在学习器训练过程中自动地进行特征选择

5.稀疏表示与字典学习

相关推荐
Dm_dotnet2 小时前
公益站Agent Router注册送200刀额度竟然是真的
人工智能
算家计算2 小时前
7B参数拿下30个世界第一!Hunyuan-MT-7B本地部署教程:腾讯混元开源业界首个翻译集成模型
人工智能·开源
机器之心2 小时前
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
人工智能·openai
Juchecar3 小时前
交叉熵:深度学习中最常用的损失函数
人工智能
林木森ai3 小时前
爆款AI动物运动会视频,用Coze(扣子)一键搞定全流程(附保姆级拆解)
人工智能·aigc
聚客AI4 小时前
🙋‍♀️Transformer训练与推理全流程:从输入处理到输出生成
人工智能·算法·llm
BeerBear5 小时前
【保姆级教程-从0开始开发MCP服务器】一、MCP学习压根没有你想象得那么难!.md
人工智能·mcp
小气小憩6 小时前
“暗战”百度搜索页:Monica悬浮球被“围剿”,一场AI Agent与传统巨头的流量攻防战
前端·人工智能
神经星星6 小时前
准确度提升400%!印度季风预测模型基于36个气象站点,实现城区尺度精细预报
人工智能
IT_陈寒9 小时前
JavaScript 性能优化:5 个被低估的 V8 引擎技巧让你的代码快 200%
前端·人工智能·后端