一、大模型常见使用形态(前端必须懂)
-
在线 API 调用用第三方闭源模型接口(文心、通义千问等),前端发 HTTP 请求,拿返回结果。特点:不用部署、开箱即用、适合快速开发。
-
本地私有化部署 下载开源模型权重,在自己电脑 / 内网服务器跑,前端连本地接口。特点:数据不出内网、隐私安全、可自己微调。
-
SaaS 在线平台直接用现成网页版 AI(ChatGPT、文心一言网页端),不用开发,纯日常使用。
二、前端对接大模型的两种常见形式
-
普通一次性问答一问一答,没有连续记忆,请求之间互不关联。
-
多轮对话 带上下文记忆,把历史聊天记录一起传给模型,模型能记住前面聊了什么,适合 AI 聊天助手、智能客服。
三、温度值 Temperature 通俗详解(高频考点)
- 温度值范围:一般 0~1
- 数值越低(接近 0)
- 答案越严谨、固定、保守
- 适合:写代码、查 bug、专业问答、公式、 Facts 事实类
- 数值越高(接近 1)
- 答案越发散、创意、脑洞大
- 适合:写文案、写诗、创意创作、闲聊
四、TopP 简单理解(了解即可)
控制模型选词的多样性:
- TopP 越小:用词越保守、套路化
- TopP 越大:用词更丰富、灵活日常前端开发优先调温度值就行,TopP 很少改。
五、幻觉 是什么(必背名词)
大模型一本正经胡说八道,编造不存在的知识、接口、文档、论文。
- 为什么会有幻觉:模型是概率生成,不是联网查真实资料
- 怎么减轻幻觉:
- 调低温度值
- 给准确参考文档(后面 RAG 就是干这个的)
- 限定输出规则、要求有据可依
六、今日必背核心总结
- 大模型三种使用形态:在线 API、本地私有化部署、SaaS 平台。
- 对话分:一次性单轮问答、带历史记录的多轮对话。
- Temperature 温度值:偏低写代码,偏高搞创作。
- 幻觉:大模型编造虚假信息、一本正经胡说八道。
- 私密业务数据优先本地开源部署,不往外传。