机器学习的半监督学习,弱监督学习,自监督学习

半监督学习、弱监督学习和自监督学习是机器学习中利用不同形式监督信号的三种方法,它们的核心区别在于标注数据的数量、质量以及监督信号的来源。以下是它们的详细对比:


1. 半监督学习(Semi-Supervised Learning)

  • 核心特点

    • 少量标注数据 + 大量未标注数据,通过利用未标注数据的分布特征来提升模型性能。
    • 假设标注数据和未标注数据服从相同的分布(如聚类假设、流形假设)。
  • 典型方法

    • 自训练(Self-training):先用标注数据训练初始模型,预测未标注数据的伪标签,再迭代优化。
    • 协同训练(Co-training):用多个视图(特征子集)分别训练模型,相互提供伪标签。
    • 图半监督学习:基于数据点之间的图结构传播标签(如标签传播算法)。
  • 应用场景

    • 标注成本高的领域(如医学图像分类、语音识别)。
    • 示例:用100张标注的肺部CT图像和10万张未标注图像训练肺炎检测模型。

2. 弱监督学习(Weakly-Supervised Learning)

  • 核心特点

    • 使用不完整、不精确或噪声标注数据,标签质量低但数据量可能较大。
    • 标签形式多样:粗粒度标签(如图像级而非像素级)、多示例标签(如包级别标注)、噪声标签等。
  • 典型方法

    • 多示例学习(MIL):以"包"为单位标注(如"包中至少有一个正例"),用于病理切片分类。
    • 注意力机制(Attention):模型自动定位关键区域(如仅用图像级标签训练目标检测模型)。
    • 噪声标签修正:通过模型置信度或一致性过滤错误标签。
  • 应用场景

    • 标注难以获取或成本极高(如视频行为识别、遥感图像分割)。
    • 示例:训练目标检测模型时,仅提供图像级标签(如"图片中有猫"),不标注猫的位置。

3. 自监督学习(Self-Supervised Learning)

  • 核心特点

    • 无需人工标注,通过设计代理任务(Pretext Task)从数据本身生成监督信号。
    • 本质是无监督学习的一种,但通过构造监督任务学习特征表示。
  • 典型方法

    • 图像领域:图像修补(Inpainting)、旋转预测、对比学习(如SimCLR)。
    • 文本领域:掩码语言模型(如BERT)、下一句预测。
    • 视频领域:帧顺序预测、时序对齐。
  • 应用场景

    • 预训练通用特征表示,用于下游任务(如分类、检测)。
    • 示例:BERT通过预测文本中被掩码的词,学习语言表示,再微调用于问答任务。

三者的核心区别

维度 半监督学习 弱监督学习 自监督学习
监督信号来源 少量人工标注 + 未标注数据 低质量人工标注(如噪声标签) 数据自身生成的伪标签
数据假设 标注与未标注数据分布一致 标注不完整但有一定信息量 无标注数据隐含结构可被挖掘
典型任务 分类、回归 检测、分割 预训练表示学习
标注成本 中等(需部分标注) 低(标注简单但质量差) 零(无需人工标注)
代表方法 自训练、协同训练 多示例学习、注意力机制 对比学习、掩码语言模型

实际应用中的结合

  • 半监督 + 自监督:先用自监督任务预训练模型,再用半监督学习微调(如医疗影像分析)。
  • 弱监督 + 自监督:用自监督学习提取特征,结合弱监督标签训练下游模型(如社交媒体情感分析)。
  • 工业场景:自动驾驶中,利用自监督学习预训练视觉模型,再通过弱监督(自动生成的边界框)微调检测模型。

总结

  • 半监督学习:在标注数据有限时,利用未标注数据的分布信息提升模型。
  • 弱监督学习:在标注质量不足时,通过算法设计从噪声或不完整标签中学习。
  • 自监督学习:完全无需人工标注,通过数据内在结构学习通用特征表示。

三者并非互斥,实际应用中常结合使用(如自监督预训练 + 弱监督微调),以应对数据标注的多样挑战。

相关推荐
zhangfeng11335 小时前
国家超算中心 scnet.cn 跨用户文件分享流程总结 多个用户之间 文件共享 不需要反复下载上传
人工智能·语言模型·大模型
ting94520008 小时前
Tornado 全栈技术深度指南:从原理到实战
人工智能·python·架构·tornado
果汁华8 小时前
Browserbase Skills:让 Claude Agent 真正“看见“网页世界
人工智能·python
ZhengEnCi8 小时前
04-缩放点积注意力代码实现 💻
人工智能·python
2zcode9 小时前
基于LSTM神经网络的金属材料机器学习本构模型研究(硕士级别)
神经网络·机器学习·lstm·金属材料
HackTwoHub9 小时前
AI大模型网关存在SQL注入、附 POC 复现、影响版本LiteLLM 1.81.16~1.83.7(CVE-2026-42208)
数据库·人工智能·sql·网络安全·系统安全·网络攻击模型·安全架构
段一凡-华北理工大学9 小时前
【高炉炼铁领域炉温监测、预警、调控智能体设计与应用】~系列文章08:多模态数据融合:让数据更聪明
人工智能·python·高炉炼铁·ai赋能·工业智能体·高炉炉温
网络工程小王10 小时前
【LangChain 大模型6大调用指南】调用大模型篇
linux·运维·服务器·人工智能·学习
HIT_Weston10 小时前
63、【Agent】【OpenCode】用户对话提示词(示例)
人工智能·agent·opencode
phoenix@Capricornus10 小时前
从贝叶斯决策到最小距离判别法再到Fisher判别分析
机器学习