Google 发布 Android Skill & Android CLI:大幅提升 Android Agent 能力

2026 年 4 月,Google 发布了 Android Agent 开发三件套:Android CLI、Android skills 以及 Android Knowledge Base。它的核心诉求很明确:无论开发者在 Android Studio、Gemini CLI,还是第三方 agent(例如 Claude Code、Codex)里发起任务,都应该能以相对一致的方式获得高质量的 Android 工程结果。

这背后对应的是一个现实矛盾:LLM 能写代码,但 Android 开发里大量"有标准答案"的工程动作并不适合让模型用自然语言猜一遍,比如 SDK/组件安装、工程初始化、设备管理与部署、以及一些高度流程化但容易踩坑的任务(edge-to-edge、AGP 升级、R8 keep rules 治理等)。Google 选择的方向不是让每个 agent 都各写一套脚本和提示词,而是把这些能力收敛到一个更可控的分发与调用体系里。

为什么是 CLI:把不确定的工程动作变成可调用的接口

在官方介绍里,Android CLI 被定义为"从终端进行 Android 开发的主要接口",专门为 agent/自动化场景提供轻量、可编程的入口,覆盖环境设置、项目创建、设备管理,并强调易更新。

其一是"接口形态"更适合 agent。对 agent 来说,稳定的命令、结构化输出、明确的参数约束,比依赖 GUI 交互或散落的脚本集合更可控;而 Android 开发生态本身就存在大量命令行工具链,CLI 是天然的整合入口。

其二是"工程动作可标准化"。官方给出的能力清单非常聚焦:用 android sdk install 做 SDK 组件管理,用 android create 从官方模板快速生成工程,用 android emulator 管理虚拟设备、用 android run 部署运行,以及用 android update 保持工具更新。官方也给出了内部实验数据:在项目与环境初始化这类任务上,Android CLI 能显著减少 token 消耗并提升完成速度。官方宣传开发同类 Android Agent 应用 token 使用量降低超过 70%,完成速度提升到 3 倍。

从发布策略看,Android CLI 当前处于 preview 阶段,定位更像"面向 agent 的底座能力",并且强调与 Android Studio 的衔接:可以先在终端用 agent 快速搭出原型,再回到 Android Studio 做更深入的 UI 调试、profiling 与工程化完善。

为什么是 Skills:让 LLM 具备"可重复执行"的专家流程

Google 同步发布 Android skills 仓库 https://github.com/android/skills,动机在官方文中也写得很直白:传统文档偏概念与叙述,适合人类学习,但 LLM 在执行复杂工作流时更需要"可操作、可验证"的技术规范,否则容易出现过时模式、库选择不当或步骤遗漏。

因此 Android skills 选择了偏工程资产的表达形式:每个 skill 是一个目录,核心文件是 SKILL.md,文件头用 YAML 写清楚元数据,例如 namedescriptionmetadata.keywords;正文再把前置条件、步骤、必须/禁止规则、检查点与参考资料写成"执行规格"。官方文档也明确说明,技能遵循 Agent Skills 的开放标准(agentskills.io),从而能被"任何支持 skills 的 AI 工具"使用,而不是绑定某一种特定模型或 IDE。

这套 Skill 的第一批内容,正好覆盖了 Android 团队最希望 agent 少踩坑的关键路径:Navigation 3 的安装与迁移、Compose 应用的 edge-to-edge 适配、AGP 9 与 XML-to-Compose 迁移、R8 配置分析等。

CLI 与 Skills 怎么连在一起:安装、发现、激活

Android CLI 把 Android skills 当作一个可管理的"技能包"。流程可以理解为三步。

第一步是发现:用 android skills list 查看当前有哪些官方技能可用;如果只记得方向不记得名字,可以用 android skills find <关键词> 做一次匹配检索。

第二步是安装:用 android skills add 把技能下载安装到本机 agent 的 skills 目录里。可以用 --skill= 只装某一个,也可以用 --all 全量安装;如果需要限定安装对象,用 --agent= 指定安装到哪一个 agent。

第三步是激活/使用:当 agent 执行任务时,如果请求内容与某个 skill 的 description/keywords 命中,它会把该 skill 的 SKILL.md(以及同目录的 references 等资源)加载进上下文,按其中的步骤与约束执行;如果希望显式指定某个技能,也可以在支持 skills 的工具里通过"点名"的方式触发(具体入口取决于所用的 agent/IDE)。

为什么还要 Knowledge Base:对抗 LLM 知识不足与漂移

在 Android CLI 与 Skills 之外,Google 还强调了 Android Knowledge Base:通过 android docs 命令从一个专门的数据源里搜索与拉取权威文档片段,作为 agent 的实时上下文。官方给出的解释是,这能让 agent 把回答"接地"到 Android Developer docs、Firebase、Google Developers 与 Kotlin docs 的最新内容上,即使 LLM 的训练截止时间较早,也能在关键决策点参考最新指南。

这也是把 AI 能力工程化的一种典型做法:与其期待模型"天然知道最新最佳实践",不如提供一个低摩擦的检索入口,让它在执行任务时可以主动对齐权威信息。

小结:这次发布的本质是"把 agent 工作流产品化"

Android CLI、Android skills 与 Android Knowledge Base 组合在一起,解决的不是"模型会不会写代码",而是"工程动作能不能被稳定执行"。CLI 负责把环境、工程创建、设备与部署等核心动作变成确定接口;Skills 负责把关键工作流沉淀成可重复执行的专家流程;Knowledge Base 则负责把最新官方知识以可检索方式注入 agent。

这套体系的一个重要信号是"面向任意 agent":它既服务 Android Studio 的内置 agent,也面向终端与第三方工具链,希望把高质量 Android 开发的路径从单一 IDE 扩展到更分布式的开发环境。

相关推荐
seabirdssss2 小时前
Flutter 开发环境配置
android·windows·flutter·adb
花千树_0102 小时前
Java 实现 ReAct Agent:工具调用与推理循环
agent
Cosolar3 小时前
PageIndex技术全解析:基于推理的无向量RAG框架,重构长文档智能检索范式
llm·agent·chatglm (智谱)
Evavava啊3 小时前
Android WebView 中 React useState 更新失效问题
android·前端·react.js·渲染
longji4 小时前
android 01 AOSP android16 aaos 编译及webview升级
android·aaos·aosp·android16
Makoto_Kimur4 小时前
Agent 面试速成清单
java·agent
鹏程十八少4 小时前
2.2026金三银四 Android Handler 完全指南:28道高频面试题 + 源码解析 + 图解 (一文通关)
android·前端·面试
程序员陆业聪4 小时前
Agent时代的工程师危机:当会写代码不再是护城河
agent
数数科技的数据干货4 小时前
官宣!数数科技正式更名为 ThinkingAI
大数据·人工智能·科技·agent