本部分内容主要是一些大语言模型(LLM)的基础知识点,包括AI发展的历程,以及LLM的核心工作原理
AI----LLM(大语言模型)

AI产生智能的三个要点:模型,数据,算力(GPU),tranform为AI的大脑,利用复杂的神经网络进行训练
核心---Transform
单个神经元是怎么工作的,流程如下:

反向传播
训练模型------找出正确的权重参数------反向传播

大语言 模型------LLM
基础:语言转向量坐标
输出概率分布

大语言模型的应用(chatGPT)
GPT(Generative Pre-trained Transformer;基于Tranform的预训练生成式语言模型)是大语言模型;
chatGPT是基于CPT的一个对话产品,是大模型的应用

大模型服务
云服务
