研一下学AI---(大语言模型篇)

本部分内容主要是一些大语言模型(LLM)的基础知识点,包括AI发展的历程,以及LLM的核心工作原理

AI----LLM(大语言模型)

AI产生智能的三个要点:模型,数据,算力(GPU),tranform为AI的大脑,利用复杂的神经网络进行训练

核心---Transform

单个神经元是怎么工作的,流程如下:

反向传播

训练模型------找出正确的权重参数------反向传播

大语言 模型------LLM

基础:语言转向量坐标

输出概率分布

大语言模型的应用(chatGPT)

GPT(Generative Pre-trained Transformer;基于Tranform的预训练生成式语言模型)是大语言模型;

chatGPT是基于CPT的一个对话产品,是大模型的应用

大模型服务

云服务

相关推荐
云和数据.ChenGuang3 小时前
PromptTemplate和ChatPromptTemplate的区别是什么呢?
人工智能·langchain·ai编程·chatprompt·langgraph·langsmith
华农DrLai3 小时前
什么是知识图谱?实体、关系、属性分别是什么?
人工智能·算法·llm·nlp·prompt·知识图谱
zzh940773 小时前
ChatGPT官网镜像站实战:高并发系统限流与熔断策略设计与演进
人工智能·gpt·chatgpt
ToTensor3 小时前
LangChain DeepAgents 完全指南
langchain·agent·agent skills·deepagents
倾颜4 小时前
不只是接个计算器:我是怎么把 Tool Calling 做成可扩展骨架的
langchain·llm·next.js
arvin_xiaoting13 小时前
OpenClaw 2026.3.23 重磅更新:UI焕新+安全加固+生态爆发,AI助手进入新纪元
自动化·llm·claude·工作流·ai agent·飞书机器人·openclaw
无风听海14 小时前
LangGraph 深度解析:Node、Edge 与 Channel 的对应机制及执行驱动原理
langchain·edge
zzh9407717 小时前
2026年ChatGPT镜像技术评测:GPT-5.4与Claude 3.5深度对比
gpt·chatgpt
Luke Ewin18 小时前
Linux中部署Qwen3.5大模型
linux·运维·服务器·ai·llm·qwen3.5