涌现：

语言模型够大，训练的语料够多，涌现出推理能力飙升等

常见的大语言模型：

Generative Pre-trained Transformer 3（GPT-3）是最著名的LLM之一，拥有1750亿个参数。该模型在文本生成、翻译和其他任务中表现出显著的性能，在全球范围内引起了热烈的反响，目前OpenAI已经迭代到了GPT-4版本

Generative ：能产生之前没有的模型

Pre：预训练

Transformer ：谷歌的Transformer深度神经网络架构，分层式，优势是允许神经网络搭建更深的分层。从而理解更长的语句。

Bidirectional Encoder Representations from Transformers（BERT）是另一个流行的LLM，对NLP研究产生了重大影响。该模型使用双向方法从一个词的左右两边捕捉上下文，使得各种任务的性能提高，如情感分析和命名实体识别。