token

小七-七牛开发者5 天前
缓存·agent·token·context·上下文·推理成本
TokenPilot:让 LLM Agent 长会话成本降 60%+ 的上下文管理今天解读的这篇论文叫 TokenPilot: Cache-Efficient Context Management for LLM Agents,作者来自浙江大学、电子科技大学、西安电子科技大学和 HomologyAI。
小七-七牛开发者6 天前
ai·agent·token·glm·智谱·claudecode·ai coding·周一上线
周一上线 | SpaceX 收购 Cursor、支付宝进入 AI 时代、DeepSeek 完成 500 亿元融资这期的「周一上线」,有点像 AI 终于不满足于“坐在聊天框里等你提问”了。一边,Cursor、GitHub Copilot 继续把 AI Coding 推向开发工作台;另一边,支付宝、腾讯 WorkBuddy 也开始让 AI 真正替用户跑流程、找服务、发起支付。
写点啥呢12 天前
claude·token·hud·glm
GLM HUD用量实时显示github地址:GitHub - MaoMiDeMao/glm-hud: Display GLM model usage (5h/7d token quota, MCP monthly) in Claude HUD status line · GitHub
理人综艺好会15 天前
中间件·token
双Token机制在实际项目中的应用与实践在现代Web应用与移动应用中,用户认证是保障系统安全的核心环节。传统的基于Session的单Token机制存在服务端存储压力大、跨域支持困难、移动端适配复杂等痛点。本文结合理论分析与实际项目经验,系统阐述 Access Token + Refresh Token 双令牌机制的设计思想、安全模型与落地要点,帮助读者不仅“会用”,更能“懂用”。
XLYcmy16 天前
服务器·python·ai·llm·prompt·agent·token
一个基于 Python 的轻量级 LLM(大语言模型)API 客户端程序:从API交互到LLM应用架构一个基于 Python 的轻量级 LLM(大语言模型)API 客户端程序,其核心功能是通过 HTTP 协议与大语言模型服务进行交互,实现用户输入提示词(Prompt)并获取模型生成结果的能力。程序采用极简设计理念,仅依赖 requests库完成网络通信,通过预配置的服务器地址和认证令牌实现身份验证,最终以 JSON 格式处理响应数据。
小七-七牛开发者18 天前
ai·大模型·agent·token·context·loop·codex·harness
AI Agent 的 4 个工程关键词:Prompt、Context、Loop、Harness 到底是什么?这周,AI Agent 圈又出现了一个新词:Loop Engineering。它看起来有点陌生,但如果放到我们和 AI 的交互变化里看,就会自然很多。
ZorChi20 天前
人工智能·aigc·接口·api·agent·token·中转站
AI API 调用优化实战:统一入口与超时处理指南AI API 经常超时?我后来把项目统一接到 API 中转站最近接 AI API 的项目多了以后,我发现一个很影响体验的问题:
极连AI22 天前
人工智能·gpt·chatgpt·api·token·极连ai·zovelox.com
国产大模型譬如DeepSeek接入codex教程分享之前在很长的一段时间里,国产大模型主要都是接入claude code、opencode、openclaw、hermes这样的agent软件
摸鱼同学25 天前
ai·大模型·llm·token·claudecode
LLM 是什么?从 API 调用到 Token 机制别被"大语言模型"这个名字吓到。本质上,它就是一台"接话机器"——你给它一段文字,它预测最合理的下一段文字。真正重要的是理解 API 怎么调、Token 怎么算、参数怎么调。
阿昌喜欢吃黄桃1 个月前
人工智能·ai·llm·prompt·token
大模型常见参数学习笔记Hi,我是阿昌,今天记录下大模型里面几个经常看到,但是一开始又很容易混在一起的概念词汇。比如平时调用大模型 API 的时候,经常会看到这些参数:
abigale031 个月前
缓存·langchain·prompt·token·rag·lcel
LangChain 实践4: 7个人AI助手全栈项目:完整拆解+分阶段开发指南本项目是一个从零搭建的全栈AI实战项目,覆盖大模型应用开发全链路核心技术。下文结合项目整体架构、功能模块与落地流程,拆解出7个递进式开发阶段,按照规划逐步开发,即可完成从本地调试到线上部署的完整流程。
xixixi777771 个月前
人工智能·ai·大模型·云计算·算力·token·流量
Token 经济重构价值分配:中国移动成核心枢纽,算网安一体化按需计费普惠中小企业AI 大模型的规模化落地,正催生以 Token 为核心的全新经济范式。Token 作为 AI 算力消耗的最小单位,不仅重构了算力服务的计价逻辑,更重塑了数字产业的价值分配体系。本文深度剖析 Token 经济的底层逻辑,明确中国移动在算网安融合生态中的核心枢纽地位,拆解 “算力 + 带宽 + 安全” 打包为 Token 服务的商业模式,分析按需计费模式如何破解中小企业 AI 转型高门槛痛点,同时探讨产业现存挑战与未来发展趋势,为行业参与者提供参考。
TG_yunshuguoji1 个月前
人工智能·阿里云·云计算·token
阿里云代理商:阿里云词元监控与优化在 AI 应用爆发的时代,词元(Token) 已成为企业算力成本的核心载体。每一次问答、内容生成或模型推理都在消耗词元,但许多企业正陷入 “用量模糊、消耗失控、成本飞涨” 的困境:
养肥胖虎1 个月前
大模型·llm·token·学习路线
完整学习LLM(四):Token是什么好家伙,上一篇我们聊了:当时一直在说 token.但其实还有一个问题没有拆:这个词在大模型里出现得太频繁了.
qcx231 个月前
人工智能·llm·产品经理·token·费用·deepseek
【系统学AI】02 token机制全解:LLM如何‘读懂‘人类语言Token = LLM处理文本的最小单位。一段文字先被切分成Token序列,再映射成整数ID,最后转为向量送入模型。分词算法决定了怎么切,上下文窗口决定了能吃多少。
weixin_553654481 个月前
人工智能·gpt·ai·大模型·token
Claude 4.7 的“逻辑美学” vs GPT-5 的“暴力推理”:2026 核心业务代码审计该用谁?到了 2026 年,如果还有人在讨论“AI 能不能帮你写个 CRUD 增删改查”,那真的可以说是外行中的外行了。现在行业内真正致命的痛点在于:大模型在疯狂提高敲键盘速度的同时,也在给全球的软件工程批量注入极其可怕的“系统性腐烂”与“隐形屎山”。
格桑阿sir1 个月前
ai·大模型·llm·agent·token·智能体·tokenization
04-大模型智能体开发工程师:Tokenization与模型推理流程系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文详解Tokenization(BPE/WordPiece/Unigram三种主流方法)及其对模型"字数限制"、"数错字"和成本的实际影响,并逐步拆解从用户输入到模型输出的完整推理流程(Tokenization→特殊Token→Embedding→位置编码→Transformer层→采样→自回归→Detokenization),涵盖采样参数(Temperature/Top-p/Top-k)和KV Cache加速原理,附OpenAI API实战
DO_Community1 个月前
人工智能·agent·token·ai-native·deepseek
Token聚合平台 vs 传统云 vs AI原生云,AI推理应用怎么选?在大模型能力深度融入生产环境的当下,后端 AI 架构的选择往往决定了应用的生死。从早期的“调用一个接口”到如今复杂的智能体(Agent)工作流,开发团队在底座选型上面临着两条截然不同的演进路径:一条是追求便利与极致轻量化的 Token 聚合平台;另一条则是在提供大模型的同时,提供更加自主可控的云基础设施的AI原生云。
创世宇图1 个月前
人工智能·ai·llm·token
【AI入门知识点】LLM 原理是什么?为什么 ChatGPT 看起来像“会思考”?为什么 ChatGPT 能聊天、写代码、写文章? 为什么 AI 好像“懂人话”? 为什么一句 Prompt,就能生成完整方案? 为什么它有时候又会“一本正经地胡说八道”?
BestOrNothing_20151 个月前
ide·agent·token·vs code·codex·reconnection
VS Code 中 Codex 功能详解:登录、IDE上下文、Token窗口、使用额度与重连问题说明目录一、摘要二、Codex 是什么?为什么要登录?2.1 Codex 的基本作用(1)解释代码含义(2)修改代码文件