如何调试QWEN-1.8B模型的prompt来达到预期效果

这一段时间都在学习与预研大模型技术,目前采用的模型是用hugging-face上的Qwen-1.8B参数级别的模型, 本地部署启动, AMD 630 16G显卡,启动与推理都没什么压力

这几天碰到一个比较有意思的问题, 我想通过使用模型的NLP能力来进行意图分析,通过构造提示词模版来达到预期效果:

如图, 想让大模型按照我的提问来返回对应的答案,在实际使用场景中, 正确率只有50-60%左右,

很多时候会与模版中的希望返回的答案不匹配,同样的问题在通义千问的官网的回答基本都是准确的:

不知道有没有了解的大佬们看下到底是什么原因引起的这种问题,是要调整prompt还是要调整模型的参数?

相关推荐
在路上走着走着4 天前
Prompt Engineering 入门指南:从原理到上手
人工智能·prompt
coft4 天前
Loop Engineering — 从“写 prompt“到“设计循环“,AI Agent 的下一次进化
人工智能·prompt
CoLiuRs4 天前
从 Prompt 到 Loop:AI 工程到底在卷什么
人工智能·prompt
AI 小老六4 天前
GEPA 架构拆解:让 Prompt 和 Skill 优化不靠玄学
数据库·人工智能·ai·架构·开源·prompt
凯丨4 天前
从写 Prompt 到Loop Engineering:AI 编程的下一次跃迁
prompt
奋飛4 天前
从 Prompt 到 Agent:LangChain 究竟解决了什么问题
ai·langchain·prompt·agent
沪漂阿龙5 天前
Context Engineering:比 Prompt Engineering 更重要的上下文工程
人工智能·langchain·prompt
猿人谷5 天前
从 Prompt Engineering 到 Loop Engineering:AI 编程正在进入“闭环工程”时代
大数据·人工智能·prompt
取个鸣字真的难5 天前
Image2 生成 PPT 的最后分水岭:Prompt
人工智能·prompt·powerpoint
啾啾Fun5 天前
【LLM 应用优化】Prompt Caching:LLM 调用成本降 90% 的底层机制与实战策略
缓存·prompt