AI-大模型应用开发-大模型生成参数调优速查表

大模型生成参数调优速查表

下面这份速查表,按场景参数作用梳理了常见组合,方便在开发中快速选型。

核心参数速查

参数名 作用 典型取值 调优思路
max_new_tokens 控制生成的最大新 token 数 对话:512;创作:2048;代码:1024 不要超过模型上下文窗口,避免截断
do_sample 是否启用随机采样 对话/创作:True;代码/摘要:False True → 多样性;False → 确定性
temperature 调节生成"随机性" 创意写作:0.7--1.0;代码/问答:0.1--0.3 越高越发散,越低越保守
top_p 核采样,限制候选 token 范围 0.8--0.95 越小越保守,越大越开放
top_k 限制从概率最高的 k 个 token 中采样 50--100 与 top_p 二选一即可
repetition_penalty 抑制重复文本 1.1--1.3 越大越不容易重复,但可能导致语句生硬
stopping_criteria 自定义停止条件 如遇到特定 token、换行符等 用于控制生成边界,避免冗余
eos_token_id 句子结束 token ID 模型自带的 eos_token_id 确保模型在合适位置停止

场景化参数组合

1. 对话聊天(如 ChatGPT 风格)

  • 目标:自然、流畅、有一定多样性

  • 推荐组合:

    python 复制代码
    {
      "max_new_tokens": 512,
      "do_sample": True,
      "temperature": 0.7,
      "top_p": 0.9,
      "repetition_penalty": 1.2,
    }

2. 代码生成 / 技术问答

  • 目标:准确、严谨、可执行

  • 推荐组合:

    python 复制代码
    {
      "max_new_tokens": 1024,
      "do_sample": False,  # 或 True + 低 temperature
      "temperature": 0.2,
      "top_p": 0.95,
      "repetition_penalty": 1.1,
    }

3. 创意写作 / 文案生成

  • 目标:多样性、想象力、风格化

  • 推荐组合:

    python 复制代码
    {
      "max_new_tokens": 2048,
      "do_sample": True,
      "temperature": 0.9,
      "top_p": 0.9,
      "repetition_penalty": 1.2,
    }

4. 文本摘要 / 信息提取

  • 目标:简洁、准确、忠于原文

  • 推荐组合:

    python 复制代码
    {
      "max_new_tokens": 256,
      "do_sample": False,
      "temperature": 0.1,
      "top_p": 0.95,
      "repetition_penalty": 1.1,
    }

调优注意事项

  1. temperature 与 top_p 不要同时拉满:两者都高会导致生成内容极度发散、逻辑混乱。
  2. 优先调 temperature:它是最直观影响生成风格的参数,先从 0.7 开始微调。
  3. 注意模型上下文窗口max_new_tokens + 输入 token 数 ≤ 模型最大上下文长度(如 Llama-2-7B 是 4096)。
  4. 重复惩罚不宜过大:超过 1.3 容易导致句子不连贯,甚至出现奇怪的断句。
相关推荐
Jmayday8 小时前
Pytorch:张量创建及运算
人工智能·pytorch·python
领麦微红外8 小时前
W-TRS-5.5D1传感器:充电桩的“温度卫士”,解锁安全高效充电新范式
人工智能·安全
SomeB1oody8 小时前
【Python深度学习】3.4. 循环神经网络(RNN)实战:预测股价
开发语言·人工智能·python·rnn·深度学习·机器学习
ACCELERATOR_LLC8 小时前
【DataWhale组队学习】DIY-LLM Task2 PyTorch 与资源核算
人工智能·pytorch·深度学习·大模型
Elastic 中国社区官方博客9 小时前
Elastic Security、Observability 和 Search 现在在你的 AI 工具中提供交互式 UI
大数据·运维·人工智能·elasticsearch·搜索引擎·安全威胁分析·可用性测试
一碗白开水一9 小时前
【目标跟踪综述】目标跟踪近3年技术研究,全面了解目标跟踪发展
人工智能·计算机视觉·目标跟踪
Promise微笑10 小时前
AI搜索时代的流量重构:GEO优化深度执行细节与把控体系
人工智能·重构
言萧凡_CookieBoty10 小时前
比 Vibe Coding 更可怕的,是 Vibe Design 吧
人工智能·ai编程
Rick199310 小时前
Spring AI 如何进行权限控制
人工智能·python·spring
Theodore_102210 小时前
深度学习(15):倾斜数据集 & 精确率-召回率权衡
人工智能·笔记·深度学习·机器学习·知识图谱