LLM(Large Language Model)大语言模型

涌现:

语言模型够大,训练的语料够多,涌现出推理能力飙升等

常见的大语言模型:

GPT-3(OpenAI):

Generative Pre-trained Transformer 3(GPT-3)是最著名的LLM之一,拥有1750亿个参数。该模型在文本生成、翻译和其他任务中表现出显著的性能,在全球范围内引起了热烈的反响,目前OpenAI已经迭代到了GPT-4版本

Generative :能产生之前没有的模型

Pre:预训练

Transformer :谷歌的Transformer深度神经网络架构,分层式,优势是允许神经网络搭建更深的分层。从而理解更长的语句。

BERT(谷歌):

Bidirectional Encoder Representations from Transformers(BERT)是另一个流行的LLM,对NLP研究产生了重大影响。该模型使用双向方法从一个词的左右两边捕捉上下文,使得各种任务的性能提高,如情感分析和命名实体识别。

相关推荐
小王毕业啦5 分钟前
2011-2022年 国内光伏电站遥感矢量数据
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·实证数据
Deepoch23 分钟前
智能赋能新范式:Deepoc开发板重塑仓储物流产业生态
人工智能·具身模型·deepoc·物流机器人
the4thone1 小时前
AI基础 笔记
人工智能·笔记
盼哥PyAI实验室1 小时前
我用 Coze + Python,从 0 搭了一个“能真正用”的 AI 律师函系统
开发语言·人工智能·python
jimmyleeee1 小时前
人工智能基础知识笔记三十一:Langfuse的几种tracing的方法
人工智能·笔记
算法与编程之美2 小时前
探索多个卷积层的卷积神经网络
人工智能·深度学习·神经网络·机器学习·cnn
木枷2 小时前
多GPU和单GPU运行llama的时间差
人工智能·llama
老吴学AI2 小时前
2025 Generative AI in Professional Services Report
人工智能
Livingbody2 小时前
基于大模型的智能读报助手
人工智能
企智小茶馆3 小时前
AI新闻 2026年01月02日
人工智能