AI大模型配置项

AI大模型配置项

下文将简述大模型通用的几个配置项。

1.temperature

取值0~2 浮点数值

temperature 翻译成中文是温度的意思,在首次看到这个参数时很困惑,大模型设置温度,很奇怪。通过翻阅说明,解释未数值越高更具创造性,数值越低越保守。对于不同类型应该设置未不同的温度,如下表所示:

根据表格总结为,一些固定的知识、法律条文,就设置较低的温度,避免自己创造。需要创造性的,则设置为高值。

2.maxToken

表示设置token的最大数量,如果超过maxtoken就终端。

在一个对话中,一次问答返回结果,不是一个token。比如这里的给大模型发送你好,返回内容是:你好!😊 有什么可以帮你的吗?,实际上使用了19个token

3.stop

截断你不想输出的内容

比如:

复制代码
	ai:
	  openai:
	    api-key: sk-e78e58b2b203474aaeae24d7d4b60034
	    base-url: https://api.deepseek.com
	    chat:
	      options:
	        model: deepseek-chat
	        temperature: 0.7
	        stop: 
	          - "\n"
	          - "###"
	          - "政治"
	          - "最后总结一下"

当返回中包含stop 里设置的关键字,会截取掉该关键字后面的所有内容。

相关推荐
一切皆是因缘际会28 分钟前
AI数字分身的底层原理:破解意识、自我与人格复刻的核心难题
大数据·人工智能·ai·架构
翔云12345632 分钟前
vLLM全解析:定义、用途与竞品对比
人工智能·ai·大模型
Huang26010840 分钟前
GLM API 介绍 - Ace Data Cloud
ai
Java小白中的菜鸟1 小时前
obsidian安装claude报错:Claude Code native binary not found
ai
不懂的浪漫3 小时前
把 AI Skill 做成系统:路由、领域技能、自我复盘和进化飞轮
人工智能·ai·skill
AI进化营-智能译站5 小时前
ROS2 C++开发系列12-用多态与虚函数构建可扩展的ROS2机器人行为模块
开发语言·c++·ai·机器人
运维开发王义杰5 小时前
告别发文繁琐,专注价值表达:Blogger-Agent 让知识积累产生复利
ai·agent
wenha6 小时前
大模型基础(三):大模型是怎么炼成的-从预训练到强化学习的完整流程
ai
DanCheOo7 小时前
开源 | ai-memory v2.6.2:不用配 API Key,一行命令把 Cursor 对话变成结构化知识库
人工智能·ai·ai编程
维元码簿8 小时前
Claude Code 深度拆解:多 Agent 协作 3 — Task 状态机、SendMessage 与消息邮箱
ai·agent·claude code·ai coding