大模型相关术语汇总

大模型相关术语汇总

1.大模型:具有大规模参数和复杂计算结构的机器学习模型。

2.LLM 大语言模型(large language model ):基于海量文本数据训练的深度学习模型。

3.AGI 通用人工智能(artifical general intelligence):指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体。

4.prompt:"提示词",在AI大模型中,Prompt的作用主要是给AI模型提示输入信息的上下文和输入模型的参数信息。

5.RNN:循环神经网络,RNN是一种神经网络模型,它的基本结构是一个循环体,可以处理序列数据,RNN的特点是能够在处理当前输入的同时,记住前面的信息,这种结构使得RNN非常适合用于自然语言处理、语音识别等任务,因为这些任务需要处理具有时序关系的数据。

6.CNN:卷积神经网络,CNN是一种神经网络模型,它的基本结构是由多个卷积层和池化层组成,卷积层可以提取图像中的局部特征,而池化层可以减少特征的数量,提高计算效率。CNN的结构使得它非常适合用于计算机视觉任务,如图像分类、物体检测等。和RNN相比,CNN更擅长处理图像数据。

7.transformer:是一种基于自注意力机制的神经网络模型,他的基本结构是由多个编码器和解码器组成的,编码器可以将输入序列转化为向量表示,而解码器则可以将该向量表示转换回输出序列。

8.BERT(Bidirectional Encoder Representations form Transformners)双向Transformer编码器和预训练微调:是一种基于Transformer的预训练语言模型,它的最大创新是引入了双向Transformer编码器,这使得模型可以同时考虑输入序列的前后上下文信息。BERT通过在大量文本数据上进行预训练,学习到了丰富的语言知识,然后在特定任务上进行微调,如文本分类、情感分析等。

9.GPT 生成式预训练模型 (Generative Pre-trained Models ):是一种基于Transformer的预训练语言模型,它的最大创新之处在于使用了单向Transformer编码器,这使得模型可以更好地捕捉输入序列的上下文信息。通过学习大量文本数据的统计模式,获得对语言的深层理解和生成能力。

10.xxB:在人工智能领域中,提到xxB这样的术语时,通常指模型的参数个数,B是billion的意思,即10亿,如175B代表1750亿个参数。

11.强化学习(Reinforcement Learning)是人工智能的一种学习方法,它通过让算法与环境交互并试图最大化某种奖励信号来学习如何在环境中实现目标。在强化学习过程中,学习主体或智能体(agent)不断从环境中获取状态,采取行动,接收奖励(或惩罚)并调整其策略。通过这种方式,智能体学习如何根据环境状态选择最佳行动以最大化累积奖励。---通过外部获得激励来校正学习方向从而获得一种自适应的学习能力。可用于自动驾驶、游戏、机器人技术、供应链优化、电力系统管理等场景

12.RLHF基于人类反馈的强化学习(Reinforcement Learning from human feedback)构建人类反馈数据集,训练一个激励模型,模仿人类的偏好对结果打分给予激励校正学习方向。RLHF的训练主要分成3个阶段:监督微调(supervised fine-tune, SFT),奖励模型训练,强化学习训练。

相关推荐
huaqianzkh19 分钟前
理解构件的3种分类方法
人工智能·分类·数据挖掘
后端码匠20 分钟前
Spring Boot3+Vue2极速整合:10分钟搭建DeepSeek AI对话系统
人工智能·spring boot·后端
用户2314349781421 分钟前
使用 Trae AI 编程平台生成扫雷游戏
人工智能·设计
神经美学_茂森35 分钟前
神经网络防“失忆“秘籍:弹性权重固化如何让AI学会“温故知新“
人工智能·深度学习·神经网络
大囚长37 分钟前
AI工作流+专业知识库+系统API的全流程任务自动化
运维·人工智能·自动化
阿_旭39 分钟前
【超详细】神经网络的可视化解释
人工智能·深度学习·神经网络
Se7en25840 分钟前
提升 AI 服务的稳定性:Higress AI 网关的降级功能介绍
人工智能
机器视觉知识推荐、就业指导1 小时前
【数字图像处理二】图像增强与空域处理
图像处理·人工智能·经验分享·算法·计算机视觉
陈辛chenxin1 小时前
【论文带读系列(1)】《End-to-End Object Detection with Transformers》论文超详细带读 + 翻译
人工智能·目标检测·计算机视觉
橙狮科技1 小时前
使用 GPTQ 进行 4 位 LLM 量化
人工智能·python·语言模型