98%命中率!Claude+Opus4.7也太强了吧!

不得不说,Anthropic 的 Claude 是真的牛逼啊!

看到这张图的数据我都惊呆了!

最近 Anthropic 和 SpaceX 合作,五小时配额翻倍,抠抠搜搜的 A 社这么大方,世所罕见。

我就非常好奇,这五小时到底给了多少 tokens!所以我计划一次性把五小时配额用完,然后统计一下消耗的 token 量。

然后,突然发现 Opus4.7 的命中率居然高达 98%!

下面我们就详细地来看一下,Claude 上下文、tokens 消耗、命中率的问题。

先来看一下这个五小时周期的消耗情况:

早上我一直在升级我的 JCode 软件,修改了好多功能,居然只消耗了 48%,翻倍之后果然更加耐用了,体感非常明显。因为功能已经改完了,所以我就不继续消耗了!

先简单看一下早上都干了什么活:

diff 复制代码
refactor(Proxy): 重构代理页面布局并排除默认 Claude 平台
​
- 将控制面板移至底部,优化说明信息为列表形式
- 调整保存按钮位置至映射规则标题行
- 过滤掉默认 Claude 平台,避免其作为代理目标
- 移除未使用的 Label 组件导入
​
​
feat: 添加页面布局组件并重构子页面导航
​
- 新增 PageActions 和 PageFooter 组件,用于将内容渲染到标题栏操作槽和全局底部槽
- 重构 TitleBar 组件,支持子页面显示返回按钮、图标和自定义标题
- 在 App.tsx 中添加底部槽位容器,用于 PageFooter 内容挂载
- 更新所有子页面(设置、统计、批量测试、平台编辑、代理)使用新的布局组件,移除重复的页头代码
- 优化平台图标,将首页添加平台按钮的图标从 Plus 改为 CirclePlus
- 在预设模型列表中添加 Ollama 平台支持及相关模型
- 更新本地开发配置,添加图标获取相关命令
​
​
feat(stats): 优化模型使用详情显示,增加缓存命中率
​
- 引入 ArrowUp 和 ArrowDown 图标区分输入输出
- 将模型明细拆分为两行,分别显示占比和分项详情
- 在缓存命中项旁显示命中率百分比
- 调整间距提升视觉层次感

这是我代码提交的记录。

有些条目虽然轻描淡写,但是也挺消耗 tokens 的。

因为,我这个软件,当前已经有不少功能了。所以肯定有不少上下文!

从图中可以看到我的上下文已经达到了 280K,也就是 100 万上下文窗口中的 28%!

很多上下文小一点的模型,直接就撑爆了,需要压缩了。

Opus 4.7 毫无压力,而且智商在线,指哪打哪。

然后我们来看一下消耗了多少 tokens。

根据统计,总共消耗了 32.7M tokens,如果这个数字不直观,我就转换一下,上午总共消耗了三千多万 tokens!

然后我们再来深入看一下底部的一行记录。

这里记录了几天使用的模型,以及输入,缓存命中,缓存写入,输出等数据。

我今天没有用任何其它模型,就是 Opus 4.7 xhigh!

下面是最近七天的数据,其实就五天有数据:

输入(input):5.1K

缓存命中(cache_read): 99.8M

缓存写入(cache_creation): 1.7M

输出(output): 559K

统计软件里面还专门标注了一个98% 的数据。

前三个数据应该都算输入,后面的是输出!

总的 tokens 计算公式:

ini 复制代码
let total = usage.input_tokens
    + usage.output_tokens
    + usage.cache_read_input_tokens
    + usage.cache_creation_input_tokens;
​

这里有两个数据是非常出乎我的意料的。

第一个是五小时配额的情况,我之前专门询问过 Grok。

Grok 说 Pro 的五小时配额大概才 44,000 tokens。

我强烈质疑它,但是它咬死了就是这个数据!

我是绝对不信它的,但是我感觉确实也不会太多。

今天一测,发现比我设想的要多很多,我们上面已经看到了 45% 的情况下,当日总消耗 tokens 为 32M 左右。

虽然,从图表中无法看到今日的细分,但是32M总量是没跑了!

第二个让人惊讶的是,它的缓存命中率 98%!!!

我让它查了一下当天的命中率 99%!

这个数据实在是太惊人了!

用同样的统计标准,对比一下国产模型。

下面是 DeepSeek 的数据:

我看过后台的数据和这个统计数据是一致的。

下面是智谱 GLM 的数据:

下面是 MinMax 的数据:

下面是 Kimi 的数据:

因为任务不一样,场景不一样,具体的数值可能会有差异,但是总体来看 Claude Code + Opus 4.7 的缓存率是领先很多的!

我特意查了一下,这个缓存命中率跟什么有关。这个应该是跟软件系统的工程实践有很大的关系,这是一个系统工程!大家天天吐槽 Anthropic 不做人事儿,但是又都跑去用它家的软件,其实大家都不傻的。

A社的实力,绝对是顶级的存在,无论模型还是软件!

最后说一个细节,如果想要省 tokens,记得在 5 分钟内,不间断提问!

在一个 session 中,一段时间内把核心功能和后续的调整全部搞定。

这个主要针对当前的 CC!

节奏把握好,技巧用到位,同样的五小时配额,可以比别人多干很多活哦!

我觉得我省着点用,Pro 也够。Codex 也能干不少事儿。

相关推荐
Pushkin.1 小时前
ReAct 架构深度解析:让大模型学会“边想边做“
人工智能
GIOTTO情1 小时前
媒介投放全链路技术解析:Infoseek 字节探索如何用 AI 重构投放体系
人工智能·重构
123_不打狼1 小时前
神经网络的反向传播(BP)详解
人工智能·神经网络·机器学习
IPHWT 零软网络1 小时前
AI Agent知识库功能解析:多源接入、动态更新与智能检索的技术价值
人工智能·科技·知识库
绿蕉1 小时前
端到端自动驾驶:系统架构的演进与未来
人工智能·系统架构·自动驾驶
开原第一保镖1 小时前
从“让 AI 写代码”到“把 AI 接入研发流程”:一次 Agentic Coding 实践复盘
aigc·openai·ai编程
GIOTTO情1 小时前
Infoseek 字节探索媒介投放技术架构解析:AI 驱动的全链路自动化实现
人工智能·架构·自动化
V搜xhliang02461 小时前
OpenClaw进阶完全教程
运维·人工智能·算法·microsoft·自动化
Mr数据杨1 小时前
【CanMV K210】AI 视觉 YOLO 手掌检测与框选显示
人工智能·硬件开发·canmv k210