Google 发布 Android Skill & Android CLI:大幅提升 Android Agent 能力

2026 年 4 月,Google 发布了 Android Agent 开发三件套:Android CLI、Android skills 以及 Android Knowledge Base。它的核心诉求很明确:无论开发者在 Android Studio、Gemini CLI,还是第三方 agent(例如 Claude Code、Codex)里发起任务,都应该能以相对一致的方式获得高质量的 Android 工程结果。

这背后对应的是一个现实矛盾:LLM 能写代码,但 Android 开发里大量"有标准答案"的工程动作并不适合让模型用自然语言猜一遍,比如 SDK/组件安装、工程初始化、设备管理与部署、以及一些高度流程化但容易踩坑的任务(edge-to-edge、AGP 升级、R8 keep rules 治理等)。Google 选择的方向不是让每个 agent 都各写一套脚本和提示词,而是把这些能力收敛到一个更可控的分发与调用体系里。

为什么是 CLI:把不确定的工程动作变成可调用的接口

在官方介绍里,Android CLI 被定义为"从终端进行 Android 开发的主要接口",专门为 agent/自动化场景提供轻量、可编程的入口,覆盖环境设置、项目创建、设备管理,并强调易更新。

其一是"接口形态"更适合 agent。对 agent 来说,稳定的命令、结构化输出、明确的参数约束,比依赖 GUI 交互或散落的脚本集合更可控;而 Android 开发生态本身就存在大量命令行工具链,CLI 是天然的整合入口。

其二是"工程动作可标准化"。官方给出的能力清单非常聚焦:用 android sdk install 做 SDK 组件管理,用 android create 从官方模板快速生成工程,用 android emulator 管理虚拟设备、用 android run 部署运行,以及用 android update 保持工具更新。官方也给出了内部实验数据:在项目与环境初始化这类任务上,Android CLI 能显著减少 token 消耗并提升完成速度。官方宣传开发同类 Android Agent 应用 token 使用量降低超过 70%,完成速度提升到 3 倍。

从发布策略看,Android CLI 当前处于 preview 阶段,定位更像"面向 agent 的底座能力",并且强调与 Android Studio 的衔接:可以先在终端用 agent 快速搭出原型,再回到 Android Studio 做更深入的 UI 调试、profiling 与工程化完善。

为什么是 Skills:让 LLM 具备"可重复执行"的专家流程

Google 同步发布 Android skills 仓库 https://github.com/android/skills,动机在官方文中也写得很直白:传统文档偏概念与叙述,适合人类学习,但 LLM 在执行复杂工作流时更需要"可操作、可验证"的技术规范,否则容易出现过时模式、库选择不当或步骤遗漏。

因此 Android skills 选择了偏工程资产的表达形式:每个 skill 是一个目录,核心文件是 SKILL.md,文件头用 YAML 写清楚元数据,例如 namedescriptionmetadata.keywords;正文再把前置条件、步骤、必须/禁止规则、检查点与参考资料写成"执行规格"。官方文档也明确说明,技能遵循 Agent Skills 的开放标准(agentskills.io),从而能被"任何支持 skills 的 AI 工具"使用,而不是绑定某一种特定模型或 IDE。

这套 Skill 的第一批内容,正好覆盖了 Android 团队最希望 agent 少踩坑的关键路径:Navigation 3 的安装与迁移、Compose 应用的 edge-to-edge 适配、AGP 9 与 XML-to-Compose 迁移、R8 配置分析等。

CLI 与 Skills 怎么连在一起:安装、发现、激活

Android CLI 把 Android skills 当作一个可管理的"技能包"。流程可以理解为三步。

第一步是发现:用 android skills list 查看当前有哪些官方技能可用;如果只记得方向不记得名字,可以用 android skills find <关键词> 做一次匹配检索。

第二步是安装:用 android skills add 把技能下载安装到本机 agent 的 skills 目录里。可以用 --skill= 只装某一个,也可以用 --all 全量安装;如果需要限定安装对象,用 --agent= 指定安装到哪一个 agent。

第三步是激活/使用:当 agent 执行任务时,如果请求内容与某个 skill 的 description/keywords 命中,它会把该 skill 的 SKILL.md(以及同目录的 references 等资源)加载进上下文,按其中的步骤与约束执行;如果希望显式指定某个技能,也可以在支持 skills 的工具里通过"点名"的方式触发(具体入口取决于所用的 agent/IDE)。

为什么还要 Knowledge Base:对抗 LLM 知识不足与漂移

在 Android CLI 与 Skills 之外,Google 还强调了 Android Knowledge Base:通过 android docs 命令从一个专门的数据源里搜索与拉取权威文档片段,作为 agent 的实时上下文。官方给出的解释是,这能让 agent 把回答"接地"到 Android Developer docs、Firebase、Google Developers 与 Kotlin docs 的最新内容上,即使 LLM 的训练截止时间较早,也能在关键决策点参考最新指南。

这也是把 AI 能力工程化的一种典型做法:与其期待模型"天然知道最新最佳实践",不如提供一个低摩擦的检索入口,让它在执行任务时可以主动对齐权威信息。

小结:这次发布的本质是"把 agent 工作流产品化"

Android CLI、Android skills 与 Android Knowledge Base 组合在一起,解决的不是"模型会不会写代码",而是"工程动作能不能被稳定执行"。CLI 负责把环境、工程创建、设备与部署等核心动作变成确定接口;Skills 负责把关键工作流沉淀成可重复执行的专家流程;Knowledge Base 则负责把最新官方知识以可检索方式注入 agent。

这套体系的一个重要信号是"面向任意 agent":它既服务 Android Studio 的内置 agent,也面向终端与第三方工具链,希望把高质量 Android 开发的路径从单一 IDE 扩展到更分布式的开发环境。

相关推荐
帅次21 小时前
Modifier 链与顺序、测量与命中区域
android·kotlin·compose·modifier
一只毛驴21 小时前
从ReAct到IterResearch
agent
leory21 小时前
请详细描述Handler消息机制的工作原理
android·面试
leory21 小时前
请描述Binder IPC的基本原理和工作流程
android·面试
leory21 小时前
View的事件分发机制是怎样的?dispatchTouchEvent、onInterceptTouchEvent、onTouchEvent的关系?
android·面试
zander2581 天前
Canal本地部署保姆级教程
android
洛阳泰山1 天前
Maxkb4j集成sqlbot MCP实现企业智能问数智能体
java·ai·springboot·agent·智能问数
yezannnnnn1 天前
AI Agent又删我数据库?我直接写了个安全拦截器(附项目源码)
安全·agent·claude
GitCode官方1 天前
头号 Builder 集结|出海 Agent 开造!大疆 Pocket4 等你赢!
人工智能·agent·atomgit
小仙女喂得猪1 天前
2026 Android 组件化项目的AICoding落地实践
android·kotlin·ai编程