研一下学AI---(大语言模型篇)

本部分内容主要是一些大语言模型(LLM)的基础知识点,包括AI发展的历程,以及LLM的核心工作原理

AI----LLM(大语言模型)

AI产生智能的三个要点:模型,数据,算力(GPU),tranform为AI的大脑,利用复杂的神经网络进行训练

核心---Transform

单个神经元是怎么工作的,流程如下:

反向传播

训练模型------找出正确的权重参数------反向传播

大语言 模型------LLM

基础:语言转向量坐标

输出概率分布

大语言模型的应用(chatGPT)

GPT(Generative Pre-trained Transformer;基于Tranform的预训练生成式语言模型)是大语言模型;

chatGPT是基于CPT的一个对话产品,是大模型的应用

大模型服务

云服务

相关推荐
H_unique13 小时前
LangChain:消息
开发语言·langchain
迪娜学姐13 小时前
调用GPT image 2一键批量美化项目申请答辩PPT
人工智能·gpt·chatgpt·powerpoint·ppt
JaydenAI13 小时前
[Deep Agents:LangChain的Agent Harness-12]利用create_deep_agent整合所有的Harness中间件
langchain·agent·deep agents·harness
Derrick__114 小时前
LangChain基础实战手记:如何给大模型装上“大脑(记忆)”和“双手(工具)”?
人工智能·python·langchain·个人开发
龙侠九重天15 小时前
DeepSeek V4 深度解析:从架构创新到开发者生态的全面解读
人工智能·深度学习·架构·大模型·llm·deepseek·deepseek v4
厚国兄15 小时前
Agent 工程化系列 · 第 06 篇_MCP是什么协议
人工智能·llm·agent
狐狐生风16 小时前
LangGraph 生产级部署全解:FastAPI + Docker
python·docker·langchain·prompt·fastapi·langgraph·agentai
code bean16 小时前
【LangChain 】 自定义解析器实战指南:从原理到 10 个业务场景落地
算法·langchain
带刺的坐椅16 小时前
agentscope-harness vs solon-ai-harness:Java 智能体「马具引擎」的双雄对决
java·ai·llm·solon·agentscope·harness
monkeyhlj16 小时前
LangChain - V1.0
python·langchain·ai编程