大模型学习day5

一、大模型常见使用形态(前端必须懂)

  1. 在线 API 调用用第三方闭源模型接口(文心、通义千问等),前端发 HTTP 请求,拿返回结果。特点:不用部署、开箱即用、适合快速开发。

  2. 本地私有化部署 下载开源模型权重,在自己电脑 / 内网服务器跑,前端连本地接口。特点:数据不出内网、隐私安全、可自己微调

  3. SaaS 在线平台直接用现成网页版 AI(ChatGPT、文心一言网页端),不用开发,纯日常使用。

二、前端对接大模型的两种常见形式

  1. 普通一次性问答一问一答,没有连续记忆,请求之间互不关联。

  2. 多轮对话 带上下文记忆,把历史聊天记录一起传给模型,模型能记住前面聊了什么,适合 AI 聊天助手、智能客服。

三、温度值 Temperature 通俗详解(高频考点)

  1. 温度值范围:一般 0~1
  2. 数值越低(接近 0)
  • 答案越严谨、固定、保守
  • 适合:写代码、查 bug、专业问答、公式、 Facts 事实类
  1. 数值越高(接近 1)
  • 答案越发散、创意、脑洞大
  • 适合:写文案、写诗、创意创作、闲聊

四、TopP 简单理解(了解即可)

控制模型选词的多样性:

  • TopP 越小:用词越保守、套路化
  • TopP 越大:用词更丰富、灵活日常前端开发优先调温度值就行,TopP 很少改。

五、幻觉 是什么(必背名词)

大模型一本正经胡说八道,编造不存在的知识、接口、文档、论文。

  1. 为什么会有幻觉:模型是概率生成,不是联网查真实资料
  2. 怎么减轻幻觉:
  • 调低温度值
  • 给准确参考文档(后面 RAG 就是干这个的)
  • 限定输出规则、要求有据可依

六、今日必背核心总结

  1. 大模型三种使用形态:在线 API、本地私有化部署、SaaS 平台。
  2. 对话分:一次性单轮问答、带历史记录的多轮对话。
  3. Temperature 温度值:偏低写代码,偏高搞创作
  4. 幻觉:大模型编造虚假信息、一本正经胡说八道。
  5. 私密业务数据优先本地开源部署,不往外传。
相关推荐
vivo互联网技术1 天前
CVPR 2026 | 全新强化学习框架 BeautyGRPO:重塑真实人像
算法·大模型·cvpr·影像
通信小呆呆2 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
H__Rick2 天前
自动对焦学习-3
人工智能·学习·计算机视觉
Daisy Lee2 天前
量化学习-第1章-什么是量化金融
学习·金融·datawhale
Alsn862 天前
等待学习-学习目录:Docker 容器安全攻防
学习·安全·docker
YM52e2 天前
买菜计算器小应用 - HarmonyOS ArkUI 开发实战-PC版本
学习·华为·harmonyos·鸿蒙·鸿蒙系统
小雨下雨的雨2 天前
HarmonyOS ArkUI训练营入门-组件掌握系列-Animation 动画效果实现-PC版本
学习·华为·harmonyos·鸿蒙
cqbzcsq2 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
AndrewHZ2 天前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能·语言模型·大模型·llm·cot·思维链·icl
Vergelight2 天前
实战拆解|三类RAG架构差异:朴素、进阶、多轮RAG落地选型指南
架构·大模型·aigc·agent·ai产品经理·转行·ai后台设计