机器学习(复试)

学习分类

其学习形式主要分为:有监督学习、无监督学习、半监督学习

有监督

有监督学习(supervised learning),需要你事先需要准备好要输入数据(训练样本)与真实的输出结果(参考答案)

预测结果分类

比如有监督学习可以划分为:回归问题和分类问题

如果预测结果是离散的,通常为分类问题,而为连续的,则是回归问题。

机器学习的专业术语

  1. 模型:模型这一词语将会贯穿整个教程的始末,它是机器学习中的核心概念。
  2. 数据集
  3. 样本&特征
  4. 向量
  5. 矩阵:矩阵看成由向量组成的二维数组

假设函数和损失函数

  1. 假设函数:假设函数(Hypothesis Function)可表述为 y=f(x) 其中 x 表示输入数据,而 y 表示输出的预测结果
  2. 损失函数:损失函数(Loss Function)又叫目标函数,简写为 L(x),这里的 x 是假设函数得出的预测结果"y",如果 L(x) 的返回值越大就表示预测结果与实际偏差越大,越小则证明预测值越来越"逼近"真实值,
  3. 优化方法:"优化方法"可以理解为假设函数和损失函数之间的沟通桥梁。

拟合&过拟合&欠拟合

1)拟合:形象地说,"拟合"就是把平面坐标系中一系列散落的点,用一条光滑的曲线连接起来,因此拟合也被称为"曲线拟合"。

  1. 过拟合:过拟合(overfitting)与是机器学习模型训练过程中经常遇到的问题,所谓过拟合,通俗来讲就是模型的泛化能力较差,也就是过拟合的模型在训练样本中表现优越,但是在验证数据以及测试数据集中表现不佳。过拟合问题在机器学习中经常遇到,主要是因为训练时样本过少,特征值过多导致的,后续还会详细介绍。

  2. 欠拟合:欠拟合(underfitting)恰好与过拟合相反,它指的是"曲线"不能很好的"拟合"数据。

相关推荐
qcx2314 小时前
【系统学AI】07 ReAct范式:从奠基之作到Reflexion/RAF的演进
前端·人工智能·react.js
小小程序员mono14 小时前
模型进入「日更时代」:GPT-5.6 泄露、Claude 4.8 逼近、Gemini 3.5 上线、国产杀疯了摘要
人工智能·重构·开源·github
yanxiaoyu11014 小时前
小白学习深度学习、强化学习的相关重要内容
人工智能·深度学习·学习
嗝o゚14 小时前
CANN asnumpy 库——昇腾 NPU 原生 NumPy 兼容层
人工智能·numpy·cann·asnumpy
Larcher14 小时前
「Codex + DeepSeek 用户请进:你的对话记录是不是也卡到想砸键盘?」
人工智能·github·编程语言
Black蜡笔小新14 小时前
制造业AI质检工作站/自动化AI算法训练服务器DLTM企业AI算力工作站筑牢制造业品质防线
人工智能·算法·自动化
hughnz14 小时前
AI 掌舵:量化上游石油和天然气的下一轮价值革命
人工智能
imbackneverdie14 小时前
论文/课题/组会PPT技术路线图绘制完整教程
人工智能·信息可视化·aigc·科研·论文写作·科研绘图·ai工具
一点一木14 小时前
Claude Opus 4.8 实测:AI 终于学会「承认自己不知道」了?
前端·人工智能·claude
Elastic 中国社区官方博客14 小时前
从平均值到任意百分位:Elasticsearch 在 ES|QL 中提供原生 exponential histogram 支持
大数据·人工智能·elasticsearch·搜索引擎·信息可视化·全文检索·数据可视化