0-机器学习简介

有监督学习

目标:建立一个模型(函数),来描述输入(x)和输出(y)之间的映射关系。

价值:模型训练完成后,新的输入,模型会给出预测值输出。

  • 注意点:
    1.要有足够的训练样本
    2.输入和输出之间有关联关系
    3.输入和输出可以数值化表示

有监督学习的应用

  • 文本分类
    输入:文本
    输出:类别
  • 机器翻译
    输入:A语言文本
    输出:B语言文本
  • 图像识别
    输入:图像
    输出:类别
  • 语音识别
    输入:音频
    输出:文本

无监督学习

目标:提供无标注数据,使用算法对数据分析处理,得到结论

无监督学习的应用

  • 聚类
  • 降维
  • 找特征值

常用概念

  • 过拟合
    模型失去了泛化能力。模型再训练集和验证集上表现好,在测试集上表现差,一般是过拟合。
  • 欠拟合
    模型没能在输入和输出之间建立起合理的映射。输入训练集,输出预测与标注结果依然相差很大。
  • 评价指标
    准确率
    召回率
    F1值
    Topk

总结

机器学习本质:从已知数据中找规律,用来预测未知的样本。

深度学习:是机器学习的一种方法。


相关推荐
大龄程序员狗哥5 小时前
第47篇:使用Speech-to-Text API快速构建语音应用(操作教程)
人工智能
KKKlucifer5 小时前
数据安全合规自动化:策略落地、审计追溯与风险闭环技术解析
人工智能·安全
RWKV元始智能5 小时前
RWKV超并发项目教程,RWKV-LM训练提速40%
人工智能·rnn·深度学习·自然语言处理·开源
dyj0955 小时前
Dify - (一)、本地部署Dify+聊天助手/Agent
人工智能·docker·容器
墨染天姬5 小时前
【AI】Hermes的GEPA算法
人工智能·算法
小超同学你好5 小时前
OpenClaw 深度解析系列 · 第8篇:Learning & Adaptation(学习与自适应)
人工智能·语言模型·chatgpt
紫微AI5 小时前
前端文本测量成了卡死一切创新的最后瓶颈,pretext实现突破了
前端·人工智能·typescript
码途漫谈5 小时前
Easy-Vibe开发篇阅读笔记(四)——前端开发之结合 Agent Skills 美化界面
人工智能·笔记·ai·开源·ai编程
易连EDI—EasyLink5 小时前
易连EDI–EasyLink实现OCR智能数据采集
网络·人工智能·安全·汽车·ocr·edi
冬奇Lab6 小时前
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
人工智能·langchain·llm