大模型学习day6

Komorebi_99992026-05-07 9:09

一、单轮对话 vs 多轮对话

单轮对话 一问一答，不记历史。每次请求都是独立的，大模型不知道上一句聊了啥。适合：简单一次性提问、查单个知识点。
多轮对话 会记住上下文 ，需要把所有历史聊天记录一起传给大模型。模型能连贯接话、顺着之前的话题聊。适合：AI 聊天助手、智能客服、连续写代码改需求。

二、什么是上下文窗口（Context Window）

一句话：大模型一次能装下、能记住的最大文字总量。

上下文窗口越大：能读长文档、记很多聊天记录
上下文窗口越小：聊几句就忘、不能处理长文章常见规格：4K、8K、32K、128K（K 代表千 token）

三、输入 Token / 输出 Token

输入 Token：你发给大模型的文字（提问 + 历史对话）
输出 Token ：大模型给你回复的文字在线 API 调用时，输入、输出两边都计费。

四、流式输出 vs 一次性输出

一次性输出 等模型全部思考完，整段文字一次性发回来，要等待，像普通网页加载完才显示内容。
流式输出（SSE 流式） 一个字一个字实时往外蹦，像你用豆包打字那种逐字出现效果。前端对接用 SSE 协议，体验更丝滑，不用长时间等待。

五、Prompt 提示词基础概念

Prompt 就是你发给大模型的指令、提问、要求 。同样的模型，Prompt 写得越好，答案越准。好提示词三要素：

给身份（你是资深前端工程师）
给要求（简洁、带注释、用 Vue3）
给任务（帮我写一个登录页面代码）

六、今日必背总结

单轮无记忆，多轮带历史上下文。
上下文窗口：模型能容纳的最大 token 容量。
输入、输出 Token 都要计费。
流式输出逐字展示，一次性输出整段返回。
Prompt 就是给大模型的指令，写得好答案质量翻倍。

上一篇：深度解析Deepseek V4：1M 上下文不是军备竞赛，是养 Agent 的人才知道的痛

下一篇：RAG Chunk 分块五大策略全解

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 06AI科技热点日报 | 2026年07月01日 07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结