机器学习算法概览

1. 监督学习(Supervised Learning)

监督学习是最常见的机器学习类型,模型通过已有的标注数据来学习输入与输出之间的映射关系。

分类(Classification):目标是将输入数据分配到一个离散的类别标签中。比如,垃圾邮件识别、图片分类、语音识别等。

常见算法:
逻辑回归(Logistic Regression)
支持向量机(SVM, Support Vector Machines)
决策树(Decision Tree)
随机森林(Random Forest)
K 最近邻(K-Nearest Neighbors, KNN)
朴素贝叶斯(Naive Bayes)
神经网络(Neural Networks)

回归(Regression):目标是预测连续值。比如,房价预测、温度预测等。

常见算法:
线性回归(Linear Regression)
岭回归(Ridge Regression)
套索回归(Lasso Regression)
支持向量回归(SVR, Support Vector Regression)

2. 无监督学习(Unsupervised Learning)

无监督学习的目标是从没有标签的数据中找到数据的结构或模式。常用于聚类、降维等任务。

聚类(Clustering):将数据分组,使得同一组的数据彼此相似,而不同组之间的数据差异较大。比如,市场细分、用户行为分析等。

常见算法:
K-means
层次聚类(Hierarchical Clustering)
DBSCAN
高斯混合模型(Gaussian Mixture Model, GMM)

降维(Dimensionality Reduction):通过减少数据的特征数量来简化数据,同时尽量保留数据的主要信息。常用于数据预处理或可视化。

常见算法:
主成分分析(PCA, Principal Component Analysis)
t-SNE(t-Distributed Stochastic Neighbor Embedding)
独立成分分析(ICA, Independent Component Analysis)

3. 半监督学习(Semi-supervised Learning)

半监督学习介于监督学习和无监督学习之间。它使用少量的标注数据和大量的未标注数据来训练模型,适用于标注数据稀缺但大量未标注数据可用的场景。

常见算法:
图半监督学习(Graph-based Semi-supervised Learning)
自监督学习(Self-supervised Learning)

4. 强化学习(Reinforcement Learning, RL)

强化学习是一种通过与环境交互并从中获取奖励信号来学习策略的算法。强化学习的目标是最大化长期奖励,适用于需要决策和规划的场景,比如游戏、机器人控制、自动驾驶等。

常见算法:
Q-learning
Deep Q Networks (DQN)
策略梯度(Policy Gradient)
深度强化学习(Deep Reinforcement Learning, DRL)
Proximal Policy Optimization (PPO)

5. 生成模型(Generative Models)

生成模型的目标是从数据中学习到如何生成新数据,通常用于数据增强、生成对抗网络等应用。

常见算法:
生成对抗网络(GAN, Generative Adversarial Networks)
变分自编码器(VAE, Variational Autoencoder)
贝叶斯网络(Bayesian Networks)

6. 自监督学习(Self-supervised Learning)

自监督学习是一种无监督学习的一种形式,它通过从数据本身生成标签进行训练。常见于自然语言处理(NLP)和计算机视觉(CV)任务。

常见应用:
语言模型(如 GPT, BERT)
图像特征学习

7. 集成学习(Ensemble Learning)

集成学习通过将多个模型的预测结果进行组合,来提高整体的性能。其基本思想是通过多个弱模型的组合,得到一个强模型。

常见算法:

随机森林(Random Forest)
AdaBoost
梯度提升树(Gradient Boosting Machines, GBM)
XGBoost
LightGBM
CatBoost

相关推荐
jackywine615 小时前
零样本学习(Zero-Shot Learning)和少样本学习(Few-Shot Learning)有何区别?AI 是怎么“猜“出来的
人工智能·机器学习
可涵不会debug15 小时前
Redis魔法学院——第四课:哈希(Hash)深度解析:Field-Value 层级结构、原子性操作与内部编码优化
数据库·redis·算法·缓存·哈希算法
犀思云15 小时前
构建全球化多云网格:FusionWAN NaaS 在高可用基础设施中的工程实践
运维·网络·人工智能·系统架构·机器人
@––––––15 小时前
力扣hot100—系列1
算法·leetcode·职场和发展
jinyeyiqi202615 小时前
气象监测设备如何助力精细化环境管理?金叶仪器智能气象站方案探讨
人工智能·机器学习·自动驾驶
weixin_4166600715 小时前
AI 导出 Word 不正规?10 类文档样式模板(可直接套用,含字体/字号/行距/缩进)
人工智能·word·论文·排版·数学公式
老鼠只爱大米15 小时前
LeetCode经典算法面试题 #236:二叉树的最近公共祖先(RMQ转化、Tarjan离线算法等五种实现方案详细解析)
算法·leetcode·二叉树·lca·并查集·最近公共祖先·rmq
问好眼15 小时前
【信息学奥赛一本通】1296:开餐馆
c++·算法·动态规划·信息学奥赛
小鸡吃米…15 小时前
机器学习 - 感知机(Perceptron)
人工智能·python·机器学习
yxm263366908115 小时前
【洛谷压缩技术续集题解】
java·开发语言·算法