Day16_【机器学习建模流程】

一、机器学习建模流程:

  1. 获取数据(搜集与完成机器学习任务相关的数据集)
  2. 数据基本处理(数据 缺失值处理,异常值处理)
  3. 特征工程(特征提取、特征预处理 、特征降维、特征选择 、特征组合)
  4. 机器学习 (模型训练)选择合适的算法对模型进行训练(有监督学习,无监督学习,半监督学习,强化学习)
  5. 模型评估(回归评测指标 、线性评测指标 、聚类评估指标)评估效果好上线服务,评估效果不好则重复上述步骤

二、特征工程

特征:对任务有用的信息

特征工程:利用背景知识和专业技巧处理数据,让模型效果更好

  • 特征提取 ------ 专家面向原始数据的提取
  • 特征预处理 ------ 归一化和标准化 解决量纲问题
  • 特征降维 ------ 维度退化:3个特征 变成两个
  • 特征选择(很少做,不然说明特征提取有问题)------ 从特征提取中选择出一些重要特征训练模型
  • 特征组合 ------ 把多个特征合并组合成一个特征
相关推荐
A洛7 小时前
Claude Code项目流飞升!AI自动化测试迎来新纪元:Playwright MCP复用Chrome登录态
前端·人工智能·chrome
weixin_456904277 小时前
大规模异构数据挖掘与数据架构
人工智能·架构·数据挖掘
艾醒8 小时前
大模型面试题剖析:大模型多机多卡微调全解析
人工智能·深度学习·算法
zzywxc7878 小时前
大模型落地全流程实践:从技术选型到企业级部署
java·人工智能·spring·机器学习·spring cloud·数据挖掘·dubbo
先做个垃圾出来………8 小时前
大模型微调显存内存节约方法
人工智能
新智元8 小时前
刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大
人工智能·openai
音视频牛哥8 小时前
“人工智能+”时代的端侧AI:算力下沉与实时视频的新基座
人工智能·大牛直播sdk·无人机巡检·人工智能+·低延迟视频传输·无人机音视频低延迟·rtsp播放器rtmp播放器
LeeZhao@8 小时前
【项目】多模态RAG—本地部署MinerU实现多类文档解析
人工智能·面试·aigc·agi
zenRRan8 小时前
微软提出rStar2-Agent:“更聪明地思考”,远比简单地“更长时间地思考”更有效、更高效
人工智能·深度学习·神经网络·机器学习·计算机视觉