chatGPT培训老师AIGC培训讲师叶梓:大模型这么火,我们在使用时应该关注些什么?-6

以下为叶老师讲义分享:

P25-P29

提示工程的模式

节省计算资源:

在微调过程中,不需要重新训练整个模型,因此可以节省计算资源。

提高特定任务上的性能:

通过微调,模型可以适应特定任务的语言特征和模式,从而提高模型的性能。

保留模型的通用性:

预训练模型具有较高的通用性能,微调可以帮助模型适应特定任务的语言特征和模式,从而提高模型的通用性。

减少数据需求:

预训练模型已经过大量训练,因此在微调过程中可以使用较少的数据。

微调大模型的意义

节省计算资源:

在微调过程中,不需要重新训练整个模型,因此可以节省计算资源。

提高特定任务上的性能:

通过微调,模型可以适应特定任务的语言特征和模式,从而提高模型的性能。

保留模型的通用性:

预训练模型具有较高的通用性能,微调可以帮助模型适应特定任务的语言特征和模式,从而提高模型的通用性。

减少数据需求:

预训练模型已经过大量训练,因此在微调过程中可以使用较少的数据。

微调大模型的方法(Adapter-Tuning)

  • 微调时冻结预训练模型的主体,由Adapter模块学习特定下游任务的知识。
  • Adapter调优的参数量大约为LM参数的3.6%。

Prefix Tuning只是在每个任务前有少量的prefix的参数,

  • 比如翻译任务,可以在每句话的前面加上"翻译:"来引导模型进行翻译功能。
  • Prefix Tuning参数规模约为LM模型整体规模的0.1%。

因为离线的Prompt对于连续的神经网络只是次优解,prompt的词之间是彼此关联的,需要将其关联起来。

于是,P-Tuning将一些伪prompt输入至LSTM中,然后利用LSTM的输出向量来替代原始的prompt token,然后一起输入至预训练语言模型中。

LSTM和随着预训练语言模型一起训练。


chatGPT讲师AIGC讲师叶梓:大模型这么火,我们在使用时应该关注些什么?未完,下一章继续......

相关推荐
山茶花.1 分钟前
Accio Work 全面解析:从免费白嫖到2000积分时代
大数据·人工智能
AI2512245 分钟前
AI生视频主流工具功能及生成技术原理解析
人工智能·音视频
云捷配低代码7 分钟前
低代码自动化工作流实战:实现跨部门业务协同的自动化流转
运维·人工智能·低代码·自动化·数字化·敏捷流程·数字化转型
龙文浩_11 分钟前
AI中NLP的循环神经网络及其演进
人工智能·pytorch·深度学习·神经网络·自然语言处理
Cxiaomu12 分钟前
AI 聊天流式交互基础:SSE、EventSource 与 ReadableStream
人工智能·交互
啦啦啦!13 分钟前
项目环境的搭建,项目的初步使用和deepseek的初步认识
开发语言·c++·人工智能·算法
Westward-sun.15 分钟前
OpenCV实战:摄像头实时文档扫描与透视矫正
人工智能·opencv·计算机视觉
V搜xhliang024615 分钟前
生成式人工智能、大语言模型在医学教育教学中的前沿探讨
人工智能
枫叶林FYL16 分钟前
【自然语言处理 NLP】7.1 机制可解释性(Mechanistic Interpretability)
人工智能·自然语言处理
任小栗16 分钟前
【实战干货】Vue3 + WebRTC + SIP + AI 实现全自动语音接警系统(远程流获取+实时ASR+TTS回播)
人工智能·webrtc