挖到个巨省Token的开源Agent,还能以复利的方式变现(企业、开发者必看)!

大家好,我是袋鼠帝。

不知道大家有没有发现,随着AI的发展,token这个东西居然还变得越来越贵了。

包套餐完全免费了,现在推出付费高级版;Anthropic前段时间也上调了Claude API的价格;各种Coding Plan涨价的涨价,限量的限量,有些你甚至都抢不到。

那,是算力变贵了?还是大家前期烧钱铺用户,现在到了收割的阶段了?

经过我的调查,token变贵的直接原因可能是需求的几何爆发。有数据显示,中国日均token调用量到2025年底已经超过140万亿,相比2024年初的1000亿,增长超过1000倍。AI Agent兴起之后,尤其是小龙虾爆火以来,Token消耗量更是与日俱增。

需求决定价值,需求越大,就越贵。没毛病。

然后我发现当我给大家安利便宜的coding plan套餐,评论区马上就有人说:"要用就用最贵的模型,便宜的模型使不动,得不偿失😂" 说得很有道理。

但我之前写贵的模型的时候呢,又有人说"给Agent用这么贵的模型,你富二代吧?",写国产模型呢,又说不如国外的。

有时候我是真没招了,兄弟们。

(配图文字:看起来淡定 其实是没招了)

既然这样,那就换个思路:直接从Agent上面来降低token消耗。

不管你用什么模型,这次咱们从技术上、从根源上,解决大家的token焦虑。

最近有个开源项目叫OpenClacky,还挺值得看一看的。

OpenClacky是一个既能省钱,又能赚钱的开源AI Agent,它对MiniMax、Claude、DeepSeek、GPT、Kimi等十几模型API都做了响应格式和调用链的适配优化。

省钱的奥秘就两个字:缓存。具体来说,是上下文调优 + 接近100%的Cache命中率。

我看聪哥(@刘聪NLP)前两天也写了一篇文章安利:

《分享一个Agent开源项目,把KV Cache玩出了花,任务成本可降到Hermes的1/6》

无奖竞猜,照片中哪个是我😂

我还去评论了,然后聪哥就叫我也写写。

emm,好吧,写就写,主打一个听话。

省token这块,它有2个让我印象很深的点:

  1. 16个工具跑赢52个工具:OpenClacky只用了16个核心工具,而Hermes有52个,Claude Code有40多个。工具越多,每次请求都要带更重的schema,你没用到的工具也在上下文里消耗token。OpenClacky的做法是核心工具集保持极简,其他能力全交给Skill,需要什么调什么,不用的时候不占位。

  2. 读500行代码比读1000行更贵:这是创始人团队实测出来的。做coding agent的时候,最token的是读大文件。他们试了200行、300行、500行、800行、1000行,最后发现1000行是最优解:一次读够,AI一翻就找到要的东西。500行反而因为信息不够,AI要反复多读几次,成本直接翻倍。

全是反直觉。

实测数据有三项真实任务横评,OpenClacky总成本基本就是龙虾的1/3,爱马仕的1/6。

其实省token只是第一层好处。

OpenClacky真正让我眼前一亮的,是它在省钱之外做的另一件事:

变现。以复利的方式变现。

我逛OpenClacky官网的时候,看到一个概念,有点意思:

把你的专业技能做成一只能挣钱的龙虾

什么意思呢?

如果你有专业知识,OpenClacky可以帮你把它变成产品。

大多数专家面临同一个问题:知识无法规模化。

你帮一个客户,收一份钱。帮一百个客户,就需要一百倍的时间。知识本身没有复制性:除非你把它变成软件。

但做软件需要时间,需要维护...那条路还是有点太重了。

OpenClacky提供了另一条路:把你的方法论变成Agent Skills,一次创建,无限交付。也就是相当于把自己的时间打包成多份,来售卖。

这就是所谓的"复利"变现,并不是产品都能达到这种效果。一定要找到长期、且持续的刚需!

我研究之后发现,OpenClacky是搭建了一整套license激活码的变现系统。

首先是你把自己的Skills打包好,创建一个龙虾分身,对外提供服务。

可以发布自己的skill来赚钱,暂时没有自己的skill也没事,平台提供了一些原有的skill可以供你组合发布龙虾。

生成授权码,发布自己的龙虾

你的龙虾发布之后,用户有多种渠道可以安装你的龙虾(如下图),比如直接下载安装包,或者通过指令。甚至还能嵌入到你现有的网站中,商城。

比如通过指令安装袋鼠帝龙虾

安装完成后可以访问一个OpenClacky的WebUI页面

用户付费后获得激活码,拿着激活码就能激活你的Agent去使用。

激活码有有效期,时间一到,使用权回收,你就可以按时间定价收费。

激活码又是哪里来的呢?

在发布自己的龙虾(Agent)之后,有10个免费的License可以分发(每个license对应一个激活码,一个激活码对一个用户的专属激活)

License用完之后需要跟平台签约、获取更多license(看了下文档,签约后是3/7分成,创作者7)

不过,我暂时还没找到用户付费的入口😂,定价那块应该还在完善中。但整个变现逻辑已经趋于闭环了。

说实话,这一套东西如果自己搞,还真不好弄。

先搭建一个安全、用户付费、激活激活变现、按月按年的计时,用户付费后激活激活变现。整套完全免费了,自己维护这套激活码系统真的累。因为你还要去研究各种加密,以及防止被破解,防倒卖、服务器搭建等等。

OpenClacky等于帮你把这套变现的基础设施做好了。

肯定会有人问,那钱真的有这么好赚吗?

我觉得核心还是要找到刚需

然后我也给想做Skill变现的朋友提供一个思路:

你不需要一上来就做一个完美的付费Skill。

你先开源,让大家免费用。当你的某个开源Skill能够突破比较高的Star数,说明它确实解决了真问题,你再基于它做一个优化版、增强版,然后通过OpenClacky来做收费。

先开源去试错,通过市场反馈找到刚需,再把验证过的东西做成产品。 这也是很多开源项目的经典玩法。

而且OpenClacky的加密Skill功能可以让你不暴露自己的Skill内部提示词,直接用激活码的形式打包分发。这意味着你的方法论,不管是律师的审合同流程,还是龙虾分身,都可以安全地变成产品。

如果大家还有更多的变现小技巧,欢迎评论区一起交流分享😆

它又能省token,又能赚钱,那东西本身到底好不好用呢?

下面聊聊我这几天使用OpenClacky的感受,顺便展示几个我跑的案例。

先说安装和日常体验

OpenClacky 方便是真方便,支持 Mac 和 Windows,一键下载,一键打开WebUI,巨省心。

OpenClacky这块感觉立省五百块钱安装费😂

WebUI感觉比龙虾的好使,支持随意开多个会话。

定时任务可以随意编辑和立即测试,Agent还支持自动化操作浏览器、接入飞书。旁边的任务管理处可以看见定时任务详情。

还有一个小细节:OpenClacky每轮思考和工具调用,都会单独标注出花了多少钱。计费很透明,这让我每次跑任务的时候心里有数。

案例1:B站热门视频榜单获取做成PPT

我想看看OpenClacky的内置技能到底好不好使

它还会问我要邮箱,说可以每日自动发送日报。

但我想让它做成PPT,不走邮箱,看看它能不能灵活应对。

结果,成功输出了PPT。虽然我直接改了Skill的步骤,折腾了好几轮,最后一共花了0.4美刀(用的Sonnet 4.6)。

美感还行,而且我去核对了,确实是当前的B站热门榜单,完全一致,播放量、点赞投币收藏、视频封面、弹幕数量,都抓到了。数据准确性没问题,中途需求也能接住,还不错。

案例2:中国上空航班实时显示图

天上飞过一架飞机,突然想做一个实时航班图。

这个案例我想试试OpenClacky结合Opus 4.7,能不能搞定实时涉及OpenSky API调用、地图可视化、定时刷新的复杂任务。

我注册了一个OpenSky Network的账号,给了它client id和secret,prompt里详细描述了我要的效果:

深色背景地图、飞机按真实经纬度和航向显示、按高度分色、30秒自动刷新、带飞行轨迹。

一次性就做出来了。花了5刀(Opus 4.7确实贵),但出来的效果让我没话说。Leaflet地图上密密麻麻都是✈️图标,点任意一架就弹出呼号、国籍、高度、速度,每30秒所有飞机位置刷新一次,右侧还有来源国籍Top5排行榜。

之前用到的Agent做类似的事,基本都要来回改好几轮才能跑通。这次一遍过,有点意外。

所以,我感觉OpenClacky除了省token外,任务执行效果还是很不错的。

案例3:持仓股票日报(定时推送到飞书)

然后再看看OpenClacky的定时任务能力,每天一次。

最近想看几只股票:贵州茅台、比亚迪、宁德时代、中芯国际、阿里巴巴。

发现OpenClacky有财经新闻技能,既然已经接入了飞书,我就想让它每天去抓取财经新闻、分析市场行情,每天能感知一下市场情绪还是不错的。

很快就做完了,推送到我的飞书上。

可以每次准时收到,很满意,而且各方面分析都有。

「最后」

OpenClacky让我看到了Agent赛道一个新的可能性。

过去我们聊Agent,首先想到的就是它的效果,"它能干什么"。龙虾能干,爱马仕也能干,Claude Code、Codex更能干。

当Agent发展到一定的时期,优化token的使用,节省token这件事是一定会被拿出来聊的。

我们使用Agent,对于个人还好,但对于企业来说,token成本是巨大的。

如果能在每一次调用中都节省哪怕一丢丢,那么总的算下来,应该能为企业节省非常大的开支。

OpenClacky在省token这件事上确实做到了差异化。这对于企业来说很有价值,但让我更兴奋的是Skill变现这条线。

把你的方法论变成产品,用开源试错找到刚需,再用license做复利变现。

通常,你想把知识变成产品,得写课、做培训、开SaaS,每一条路都很重。现在,你可能只需要一个Skill。

我的cangjie-skill已经打包上去了。到底能不能跑通这条路?

我也在摸索。但至少,一个新的可能性打开了。

我是袋鼠帝,一个致力于帮你把AI变成生产力的博主。我们下期见~

相关推荐
LCG元5 小时前
RAG - 大模型检索增强生成深度解析:本地知识库 / 企业级落地优化配置
人工智能·算法
用户5191495848455 小时前
WordPress ACF City Selector 插件任意文件上传漏洞利用工具 (CVE-2024-56264)
人工智能·aigc
xingyuzhisuan5 小时前
GPU服务器集群搭建指南——选型、部署、优化+避坑全解析
运维·服务器·人工智能·gpu算力
独隅5 小时前
DeepSpeed ZeRO-3在TensorFlow中缺失的底层支持机制与优化全面指南
人工智能·python·tensorflow
AI医影跨模态组学5 小时前
J Thorac Oncol(IF=20.8)广东省人民医院钟文昭教授团队:基于影像组学的支持向量机区分驱动肺腺癌进展的分子事件
人工智能·深度学习·机器学习·论文·医学·医学影像·影像组学
初心未改HD6 小时前
LLM应用开发之向量数据库详解
数据库·人工智能
alwaysrun6 小时前
AI之智能体Agent简介
人工智能·ai·agent·runtime·认知闭环
薛定猫AI6 小时前
【深度解析】从 Mythos 到 DeepSeek 降价:大模型工程化选型、成本控制与 API 实战
人工智能
松☆6 小时前
昇腾NPU上的张量操作库,和PyTorch的张量操作有啥不一样?
人工智能·pytorch·python