【深度学习】预训练和微调概述

[1. 预训练和微调的介绍](#1. 预训练和微调的介绍)
- [1.1 预训练（Pretraining）](#1.1 预训练（Pretraining）)
- [1.2 微调（Fine-Tuning）](#1.2 微调（Fine-Tuning）)
[2. 预训练和微调的区别](#2. 预训练和微调的区别)

预训练和微调是现代深度学习模型训练中的两个关键步骤，它们通常是一个预训练-微调 (Pretrain-Finetune) 流程的不同阶段。两者相辅相成，共同帮助模型从通用的知识到特定任务的适应。

1. 预训练和微调的介绍

定义：
预训练是指在大规模、无标注数据上对模型进行训练，让模型学会一些通用的特征或模式。这个阶段的目标是让模型具备基础的能力和知识，通常不涉及具体的任务。预训练之后，模型可以用作多个不同任务的基础，进一步通过微调来适应特定的应用场景。

目标：

方法：

无监督学习或自监督学习：预训练时使用的数据通常没有标注，模型的学习方式可能是无监督的（例如，语言模型学习词与词之间的关系），或者自监督的（例如，BERT 的掩码任务，模型通过预测缺失的词来学习语境）。

例子：

定义：
微调是指在预训练模型的基础上，通过小规模、标注数据对模型进行进一步训练。这个过程让模型在某个特定任务上进行优化，使其能更好地适应该任务的要求。

目标：

方法：

例子：

BERT 微调：在预训练阶段，BERT 学会了词汇的上下文关系。然后，BERT 在情感分析、命名实体识别（NER）、问答等任务上进行微调，使得模型在这些任务上有更好的表现。
ResNet 微调：在预训练阶段，ResNet 学会了从图像中提取通用的视觉特征（如边缘、形状、纹理等）。在微调阶段，可以用具体的图像数据集（例如猫狗分类）进行训练，以优化模型在该任务上的表现。

特性	预训练	微调
目标	学习通用特征和模式，训练一个能够迁移到多个任务的模型	让模型适应特定任务，优化特定任务的性能
数据	使用大规模无标注数据	使用特定任务的标注数据
任务类型	通常是通用的、无监督的任务，例如语言建模、掩码任务等	针对特定任务的监督学习，例如分类、回归、生成任务等
计算资源	需要大量的计算资源和时间，通常在大规模数据集上训练	微调需要的计算资源较少，因为微调的是预训练模型的部分参数
训练阶段	训练模型的基础能力，通常在预训练阶段不会涉及特定任务	在预训练后，针对特定任务进一步优化
结果	学到的是模型的通用表示和特征，能够用于多个任务	适应了具体任务，使模型能够在该任务上表现得更好