【机器学习】机器学习基础

机器学习（Machine Learning, ML）是一种人工智能（AI）的分支，指计算机通过数据学习规律并做出预测或决策，而无需明确编程。它的核心目标是让机器能够从经验中学习，逐渐提高自身表现。

根据任务类型，机器学习主要分为以下几类：

监督学习（Supervised Learning）
- 目标：通过已有的标注数据（输入与输出的对应关系）学习一个函数，预测新数据的输出。
- 应用场景 ：
  - 分类：邮件是否是垃圾邮件（垃圾邮件/非垃圾邮件）
  - 回归：预测房价、股票走势等
- 常用算法 ：线性回归、逻辑回归、支持向量机、神经网络等。
无监督学习（Unsupervised Learning）
- 目标：处理无标注数据，发现数据的潜在结构或分组规律。
- 应用场景 ：
  - 聚类：客户分组、图像分割
  - 降维：数据可视化、特征提取
- 常用算法：K-means、主成分分析（PCA）、自编码器等。
强化学习（Reinforcement Learning）
- 目标：通过与环境交互，学习如何采取行动以最大化累计奖励。
- 应用场景 ：
  - 游戏 AI（如 AlphaGo）
  - 机器人控制
- 常用算法：Q-learning、深度 Q 网络（DQN）、策略梯度方法。
半监督学习（Semi-supervised Learning）
- 目标：结合少量标注数据和大量未标注数据来提高学习效果。
- 应用场景：标注成本高但未标注数据充足的场景（如医学图像分析）。
自监督学习（Self-supervised Learning）
- 目标：通过从数据本身生成伪标签，进行无标注数据的预训练。
- 应用场景：自然语言处理（BERT）、图像识别（SimCLR）。