LLM(Large Language Model)大语言模型

涌现:

语言模型够大,训练的语料够多,涌现出推理能力飙升等

常见的大语言模型:

GPT-3(OpenAI):

Generative Pre-trained Transformer 3(GPT-3)是最著名的LLM之一,拥有1750亿个参数。该模型在文本生成、翻译和其他任务中表现出显著的性能,在全球范围内引起了热烈的反响,目前OpenAI已经迭代到了GPT-4版本

Generative :能产生之前没有的模型

Pre:预训练

Transformer :谷歌的Transformer深度神经网络架构,分层式,优势是允许神经网络搭建更深的分层。从而理解更长的语句。

BERT(谷歌):

Bidirectional Encoder Representations from Transformers(BERT)是另一个流行的LLM,对NLP研究产生了重大影响。该模型使用双向方法从一个词的左右两边捕捉上下文,使得各种任务的性能提高,如情感分析和命名实体识别。

相关推荐
zhl7720 分钟前
YOLOv5:从0搭建你的第一个目标检测模型
人工智能
TechFind21 分钟前
用 OpenClaw 搭建企业微信 AI Agent:从零到自动化客服只需 30 分钟
人工智能·agent
FishCoderh21 分钟前
OpenClaw部署后Tools工具权限被禁用?一行配置解决
人工智能
飞哥数智坊2 小时前
openclaw 不是全站第一!但它的爆发,足以引人深思
人工智能
zone77393 小时前
001:LangChain的LCEL语法学习
人工智能·后端·面试
程序员鱼皮3 小时前
微软竟然出了免费的 AI 应用开发课?!我已经学上了
人工智能·程序员·ai编程
DevnullCoffe4 小时前
基于 OpenClaw + Pangolinfo API 的 Amazon 价格监控系统:架构设计与最佳实践
人工智能·架构
Baihai_IDP4 小时前
回头看 RLHF、PPO、DPO、GRPO 与 RLVR 的发展路径
人工智能·llm·强化学习
aristotle4 小时前
Openclow安装保姆级教程
人工智能·程序员
明明如月学长4 小时前
从 Subagent 到 Team:Claude Code 把 AI 协同玩明白了
人工智能