如何调试QWEN-1.8B模型的prompt来达到预期效果

这一段时间都在学习与预研大模型技术,目前采用的模型是用hugging-face上的Qwen-1.8B参数级别的模型, 本地部署启动, AMD 630 16G显卡,启动与推理都没什么压力

这几天碰到一个比较有意思的问题, 我想通过使用模型的NLP能力来进行意图分析,通过构造提示词模版来达到预期效果:

如图, 想让大模型按照我的提问来返回对应的答案,在实际使用场景中, 正确率只有50-60%左右,

很多时候会与模版中的希望返回的答案不匹配,同样的问题在通义千问的官网的回答基本都是准确的:

不知道有没有了解的大佬们看下到底是什么原因引起的这种问题,是要调整prompt还是要调整模型的参数?

相关推荐
人工智能培训1 小时前
数字孪生赋能建筑行业 解锁工程全周期智慧管理
大数据·人工智能·机器学习·prompt·agent
-停泊1 天前
Skill和Prompt有何不同
prompt·agent·skill
贺国亚1 天前
01-Prompt工程-Few-Shot-CoT与Tool-Use
prompt
z小猫不吃鱼1 天前
12 Prompt Engineering 入门:提示词为什么会影响模型行为?
人工智能·gpt·自然语言处理·prompt
csdn_aspnet1 天前
Gemini赋能安全工程师,自动写PoC脚本,探索Gemini在网络安全领域辅助漏洞验证与POC生成的实战路径
安全·web安全·prompt·poc·gemini·工程师
AskHarries2 天前
Agent Prompt 是怎么影响行为的
prompt
龙骑士baby2 天前
重建 AI 认知第 3 篇:Prompt Engineering——怎么让 AI 听懂你的话
ai·大模型·llm·prompt
城管不管2 天前
什么是Prompt?
android·java·数据库·语言模型·llm·prompt
醒醒该学习了!2 天前
Prompt提示词——风险和误用、对抗性prompt(理论篇)
prompt
隐层漫游者2 天前
从Prompt工程到金融实战:基于Few-shot Learning的大模型信息抽取全解析
金融·prompt