大模型学习day5

Komorebi_99992026-05-07 18:55

一、大模型常见使用形态（前端必须懂）

在线 API 调用用第三方闭源模型接口（文心、通义千问等），前端发 HTTP 请求，拿返回结果。特点：不用部署、开箱即用、适合快速开发。
本地私有化部署 下载开源模型权重，在自己电脑 / 内网服务器跑，前端连本地接口。特点：数据不出内网、隐私安全、可自己微调。
SaaS 在线平台直接用现成网页版 AI（ChatGPT、文心一言网页端），不用开发，纯日常使用。

二、前端对接大模型的两种常见形式

普通一次性问答一问一答，没有连续记忆，请求之间互不关联。
多轮对话 带上下文记忆，把历史聊天记录一起传给模型，模型能记住前面聊了什么，适合 AI 聊天助手、智能客服。

三、温度值 Temperature 通俗详解（高频考点）

温度值范围：一般 0～1
数值越低（接近 0）

答案越严谨、固定、保守
适合：写代码、查 bug、专业问答、公式、 Facts 事实类

数值越高（接近 1）

答案越发散、创意、脑洞大
适合：写文案、写诗、创意创作、闲聊

四、TopP 简单理解（了解即可）

控制模型选词的多样性：

TopP 越小：用词越保守、套路化
TopP 越大：用词更丰富、灵活日常前端开发优先调温度值就行，TopP 很少改。

五、幻觉是什么（必背名词）

大模型一本正经胡说八道，编造不存在的知识、接口、文档、论文。

为什么会有幻觉：模型是概率生成，不是联网查真实资料
怎么减轻幻觉：

调低温度值
给准确参考文档（后面 RAG 就是干这个的）
限定输出规则、要求有据可依

六、今日必背核心总结

大模型三种使用形态：在线 API、本地私有化部署、SaaS 平台。
对话分：一次性单轮问答、带历史记录的多轮对话。
Temperature 温度值：偏低写代码，偏高搞创作。
幻觉：大模型编造虚假信息、一本正经胡说八道。
私密业务数据优先本地开源部署，不往外传。

上一篇：AI 后台模型调用额度突降为零的治理复盘：从额度同步延迟到动态感知的稳定性实践

下一篇：储能系统出海防掉线架构：实现断点续传的边缘计算网关技术实战

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 06AI科技热点日报 | 2026年07月01日 07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 10几个好用的ip纯净度检测网站