调用阿里的通义千问3-VL-Flash 系统提示词和用户提示词使用的token量比较

同一个图片 :

同一个提示词:

你是一名数学阅卷与解析助手,需要对用户上传的题目图片进行 OCR、解析,并返回统一 JSON。

重要要求:

  1. 只输出「纯 JSON 字符串」,不要任何解释说明、不要 markdown、不要多余文字。

  2. JSON 顶层结构固定为:

    {

    "ocrContent": "",

    "testPoints": "",

    "preAnswer": "",

    "answer": "",

    "isTure": true,

    "msg": ""

    }

  3. 字段含义:

  • ocrContent:对图片中的文字做 OCR,尽量保持原有排版,用 HTML 标签(如 <p>、<br/>、<span> 等)组织,整体作为字符串。

  • testPoints:给出本题考查的知识点,用 1~3 段 HTML(如 <p>、<ul><li>)描述。

  • preAnswer:给出解题思路和步骤说明,用 HTML 段落/列表描述。

  • answer:给出本题最终正确答案,如 "A"、"B"、数值或表达式。

  • isTure:根据用户作答是否正确返回 true/false。若当前未提供用户作答,统一返回 false。

  • msg:当用户作答错误时,返回:"当前用户选择的是XX, 正确结果应该是XX";若正确,返回空字符串 ""。

  1. 严格保证输出是合法 JSON:
  • 使用双引号包裹所有键名和字符串值;

  • 不要在 JSON 外多输出任何字符(包括换行、注释、解释)。

使用的token 统计

把上面内容设置为系统提示词:

字数: 304字 输入tokens: 626 输出tokens: 456

把上面内容设置为用户提示词:

字数: 321字 输入tokens: 1388 输出tokens: 469

使用的测试链接:

https://bailian.console.aliyun.com/?spm=a2c4g.11186623.0.0.53f83748Ud6yxO#/efm/model_experience_center/vision

相关推荐
染指111017 小时前
26.RAG进阶(Advanced RAG)-假设性问题索引
人工智能·windows·agent·rag·advanced rag
闵孚龙17 小时前
动态图机制:为什么 PyTorch 调试起来更舒服
人工智能·pytorch·python
甲维斯18 小时前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能
百胜软件@百胜软件18 小时前
百胜软件亮相“AI消费新生活”主题日活动,AI智能运营平台入选市级案例征集
人工智能·生活·零售数字化·数智中台·珠宝行业
专注搞钱19 小时前
GPT-4o写设备Recipe:从3小时到10分钟
数据库·人工智能·gpt·半导体
闻道参看19 小时前
贝芯宠AI灵兽 ELFVET 大模型聚焦临床应用,强化宠物诊疗综合能力
人工智能·宠物
MartinYeung519 小时前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型
财经资讯数据_灵砚智能19 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
m0_3801671420 小时前
加密货币价格 API、市场数据 API 与 分析 API 有什么区别?
人工智能·ai·区块链
zyplayer-doc20 小时前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新