chatGPT培训老师AIGC培训讲师叶梓:大模型这么火，我们在使用时应该关注些什么？-6

大数据AI人工智能培训专家培训讲师叶梓2023-11-11 11:43

以下为叶老师讲义分享：

P25-P29

提示工程的模式

节省计算资源：

在微调过程中，不需要重新训练整个模型，因此可以节省计算资源。

提高特定任务上的性能：

通过微调，模型可以适应特定任务的语言特征和模式，从而提高模型的性能。

保留模型的通用性：

预训练模型具有较高的通用性能，微调可以帮助模型适应特定任务的语言特征和模式，从而提高模型的通用性。

减少数据需求：

预训练模型已经过大量训练，因此在微调过程中可以使用较少的数据。

微调大模型的意义

节省计算资源：

在微调过程中，不需要重新训练整个模型，因此可以节省计算资源。

提高特定任务上的性能：

通过微调，模型可以适应特定任务的语言特征和模式，从而提高模型的性能。

保留模型的通用性：

预训练模型具有较高的通用性能，微调可以帮助模型适应特定任务的语言特征和模式，从而提高模型的通用性。

减少数据需求：

预训练模型已经过大量训练，因此在微调过程中可以使用较少的数据。

微调大模型的方法（Adapter-Tuning）

微调时冻结预训练模型的主体，由Adapter模块学习特定下游任务的知识。
Adapter调优的参数量大约为LM参数的3.6%。

Prefix Tuning只是在每个任务前有少量的prefix的参数，

比如翻译任务，可以在每句话的前面加上"翻译："来引导模型进行翻译功能。
Prefix Tuning参数规模约为LM模型整体规模的0.1%。

因为离线的Prompt对于连续的神经网络只是次优解，prompt的词之间是彼此关联的，需要将其关联起来。

于是，P-Tuning将一些伪prompt输入至LSTM中，然后利用LSTM的输出向量来替代原始的prompt token，然后一起输入至预训练语言模型中。

LSTM和随着预训练语言模型一起训练。

chatGPT讲师AIGC讲师叶梓:大模型这么火，我们在使用时应该关注些什么？未完，下一章继续......

上一篇：k8s二进制（ETCD的部署安装）

下一篇：Visual Studio导入Wiinform项目文件，引用显示黄色感叹号

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI科技热点日报 | 2026年07月01日 092026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一 102026 年 AI 大模型 & AI 编程工具实战全总结