token

不能只会打代码

Day 006 — Multi-Agent + MCP/A2A + 安全 + 可观测性📅 2026-07-20　|　🏷️ Python · AI Agent 方向　|　⏱️ 建议 5h　|　🎯 Agent 进阶三大件：协作、协议、安全

初识大模型~用户一次输入响应全流程面向 AI 小白的详细说明，以 DeepSeek 这类国内大模型服务为例。下面我会用“用户内容进入大模型后的一条流水线”来讲清楚，并用 DeepSeek 这类国内大模型作为例子说明文本、图片、视频分别会经历哪些处理。先给你一个总流程图，再逐层拆开讲。

Token 节约实战：全链路降本 90%+很多人都在讨论哪个大模型最强，却很少有人关注另外一个更现实的问题：Token 正在悄悄烧钱。真正浪费 Token 的往往不是复杂任务，而是错误的使用方式和系统架构。本文将结合一线项目实战经验，从 C 端使用习惯到 B 端 Agent 架构设计，分享一套完整的 Token 优化方案，大量团队实践证实能削减 90% 的 Token 成本！

Deepseek-api省token的用法网页端的DeepSeek总是显得太啰嗦，输出太冗长，消耗太多的tokens。每次都得提醒它简明扼要地说。特别是，每次只是提一个简单的问题，它都会长篇大论；翻译一句话，会给出多个版本，附加各种解释；一丝不苟的总分总结构。下面利用API做一个简单的脚本/cli工具。

MicrosoftReactor

技术速递｜Token 经济学：智能体 AI 时代的新 FinOps作者：卢建晖 - 微软高级云技术布道师排版：Alan Wang很长一段时间以来，AI 应用的设计都是从模型能力出发：模型会不会写代码？能不能推理？是否支持工具调用？能否处理长上下文？这些问题依然重要，但在智能体应用时代，它们已经不足以回答生产环境中的关键问题。真正更值得关注的问题是：完成一个真正有价值的任务，这套架构究竟会消耗多少 Token？

小七-七牛开发者

Coding Agent 规则管理：CLAUDE.md、Skills、Hooks、Subagents 到底怎么选？Coding Agent 用久了，规则管理就会变成一个绕不开的问题：哪些内容该放进项目说明，哪些流程得按需调用，哪些动作必须由系统强制执行。

小七-七牛开发者

TokenPilot：让 LLM Agent 长会话成本降 60%+ 的上下文管理今天解读的这篇论文叫 TokenPilot: Cache-Efficient Context Management for LLM Agents，作者来自浙江大学、电子科技大学、西安电子科技大学和 HomologyAI。

小七-七牛开发者

周一上线 | SpaceX 收购 Cursor、支付宝进入 AI 时代、DeepSeek 完成 500 亿元融资这期的「周一上线」，有点像 AI 终于不满足于“坐在聊天框里等你提问”了。一边，Cursor、GitHub Copilot 继续把 AI Coding 推向开发工作台；另一边，支付宝、腾讯 WorkBuddy 也开始让 AI 真正替用户跑流程、找服务、发起支付。

GLM HUD用量实时显示github地址：GitHub - MaoMiDeMao/glm-hud: Display GLM model usage (5h/7d token quota, MCP monthly) in Claude HUD status line · GitHub

理人综艺好会

双Token机制在实际项目中的应用与实践在现代Web应用与移动应用中，用户认证是保障系统安全的核心环节。传统的基于Session的单Token机制存在服务端存储压力大、跨域支持困难、移动端适配复杂等痛点。本文结合理论分析与实际项目经验，系统阐述 Access Token + Refresh Token 双令牌机制的设计思想、安全模型与落地要点，帮助读者不仅“会用”，更能“懂用”。

一个基于 Python 的轻量级 LLM（大语言模型）API 客户端程序：从API交互到LLM应用架构一个基于 Python 的轻量级 LLM（大语言模型）API 客户端程序，其核心功能是通过 HTTP 协议与大语言模型服务进行交互，实现用户输入提示词（Prompt）并获取模型生成结果的能力。程序采用极简设计理念，仅依赖 requests库完成网络通信，通过预配置的服务器地址和认证令牌实现身份验证，最终以 JSON 格式处理响应数据。

小七-七牛开发者

AI Agent 的 4 个工程关键词：Prompt、Context、Loop、Harness 到底是什么？这周，AI Agent 圈又出现了一个新词：Loop Engineering。它看起来有点陌生，但如果放到我们和 AI 的交互变化里看，就会自然很多。

AI API 调用优化实战：统一入口与超时处理指南AI API 经常超时？我后来把项目统一接到 API 中转站最近接 AI API 的项目多了以后，我发现一个很影响体验的问题：

国产大模型譬如DeepSeek接入codex教程分享之前在很长的一段时间里，国产大模型主要都是接入claude code、opencode、openclaw、hermes这样的agent软件

LLM 是什么？从 API 调用到 Token 机制别被"大语言模型"这个名字吓到。本质上，它就是一台"接话机器"——你给它一段文字，它预测最合理的下一段文字。真正重要的是理解 API 怎么调、Token 怎么算、参数怎么调。

阿昌喜欢吃黄桃

大模型常见参数学习笔记Hi，我是阿昌，今天记录下大模型里面几个经常看到，但是一开始又很容易混在一起的概念词汇。比如平时调用大模型 API 的时候，经常会看到这些参数：

LangChain 实践4： 7个人AI助手全栈项目：完整拆解+分阶段开发指南本项目是一个从零搭建的全栈AI实战项目，覆盖大模型应用开发全链路核心技术。下文结合项目整体架构、功能模块与落地流程，拆解出7个递进式开发阶段，按照规划逐步开发，即可完成从本地调试到线上部署的完整流程。

Token 经济重构价值分配：中国移动成核心枢纽，算网安一体化按需计费普惠中小企业AI 大模型的规模化落地，正催生以 Token 为核心的全新经济范式。Token 作为 AI 算力消耗的最小单位，不仅重构了算力服务的计价逻辑，更重塑了数字产业的价值分配体系。本文深度剖析 Token 经济的底层逻辑，明确中国移动在算网安融合生态中的核心枢纽地位，拆解 “算力 + 带宽 + 安全” 打包为 Token 服务的商业模式，分析按需计费模式如何破解中小企业 AI 转型高门槛痛点，同时探讨产业现存挑战与未来发展趋势，为行业参与者提供参考。

阿里云代理商：阿里云词元监控与优化在 AI 应用爆发的时代，词元（Token）已成为企业算力成本的核心载体。每一次问答、内容生成或模型推理都在消耗词元，但许多企业正陷入 “用量模糊、消耗失控、成本飞涨” 的困境：

完整学习LLM(四):Token是什么好家伙,上一篇我们聊了:当时一直在说 token.但其实还有一个问题没有拆:这个词在大模型里出现得太频繁了.