AI大模型配置项

AI大模型配置项

下文将简述大模型通用的几个配置项。

1.temperature

取值0~2 浮点数值

temperature 翻译成中文是温度的意思,在首次看到这个参数时很困惑,大模型设置温度,很奇怪。通过翻阅说明,解释未数值越高更具创造性,数值越低越保守。对于不同类型应该设置未不同的温度,如下表所示:

根据表格总结为,一些固定的知识、法律条文,就设置较低的温度,避免自己创造。需要创造性的,则设置为高值。

2.maxToken

表示设置token的最大数量,如果超过maxtoken就终端。

在一个对话中,一次问答返回结果,不是一个token。比如这里的给大模型发送你好,返回内容是:你好!😊 有什么可以帮你的吗?,实际上使用了19个token

3.stop

截断你不想输出的内容

比如:

复制代码
	ai:
	  openai:
	    api-key: sk-e78e58b2b203474aaeae24d7d4b60034
	    base-url: https://api.deepseek.com
	    chat:
	      options:
	        model: deepseek-chat
	        temperature: 0.7
	        stop: 
	          - "\n"
	          - "###"
	          - "政治"
	          - "最后总结一下"

当返回中包含stop 里设置的关键字,会截取掉该关键字后面的所有内容。

相关推荐
Learn Beyond Limits1 小时前
解构语义:从词向量到神经分类|Decoding Semantics: Word Vectors and Neural Classification
人工智能·算法·机器学习·ai·分类·数据挖掘·nlp
哥布林学者2 小时前
吴恩达深度学习课程五:自然语言处理 第一周:循环神经网络 (六)长短期记忆 LSTM
深度学习·ai
AI大模型应用之禅4 小时前
全球股市估值与可持续农业垂直种植技术的关系
网络·ai
跨境日记的老周4 小时前
AI搜索革命:GEO优化如何成为企业获取精准流量
ai
坚定学代码5 小时前
基于观察者模式的ISO C++信号槽实现
开发语言·c++·观察者模式·ai
Java追光着7 小时前
gemini pro 此账号无法订阅Google AI方案
ai·gemini
少林码僧7 小时前
2.9 字段分箱技术详解:连续变量离散化,提升模型效果的关键步骤
人工智能·ai·数据分析·大模型
爱笑的眼睛118 小时前
超越可视化:降维算法组件的深度解析与工程实践
java·人工智能·python·ai
lkbhua莱克瓦2410 小时前
人工智能(AI)形象介绍
人工智能·ai
营销操盘手阿泽10 小时前
GEO优化服务商深度横评:AI搜索时代的战略选择与效能验证
ai