新一代 Agentic AI 智能体，助力 Android 开发

往期文章：

《00. 文章合集目录》

《Google Gemini 如何加速 Android 开发？》

《深入理解 Android Jetpack Lifecycle（用法篇）》

《深入理解 Jetpack Lifecycle（原理篇）》

你好，我是朱涛。今天我们来聊聊 AI 和 Android 开发的话题。

往年的 Google I/O 大会，Android 几乎每年都是主角。但是，从近两年开始，AI 在 I/O 大会的重要性逐渐提升，而今年 Google I/O 大会上，AI 已经成为了万众瞩目的主角。

这几年，以 ChatGPT 为代表的生成式 AI 发展迅猛，各个科技巨头都开发出了各自的AI。比如：OpenAI 的 ChatGPT，Google 的 Gemini，Meta 的 Llama。而对我们开发者影响最大的，应该要属 Cursor，因为它开创了 AI 编程的先河。不过，可惜的是，Cursor 在 Android 开发领域的表现一直不太突出。

而今年 Google I/O 上，Android 团队宣布对 Android Studio 做了一系列的增强。

Android Studio Narwhal

如果你想要体验最新的 Android AI 编程工具，则需要升级到最新的 Android Studio Preview，它的版本名称叫做 Narwhal，中文意思是一角鲸。

对比几个月前的 Android Studio Meerkat 版本，一角鲸版本在 AI 功能方面做了许多增强。从某种意义上来说，确实在往 Agentic AI 的方向进化。

如果你看过我之前写的文章《Google Gemini 如何加速 Android 开发？》，你会知道，之前版本的 Android Studio 只能简单的问答。但这次升级到 Narwhal 版本，你会看到一系列 AI 相关的介绍。

上面引导内容的大概意思就是，Android Studio 现在支持 AI Agent 模式了。接下来，我们来看看如何配置和使用吧。

介绍 & 配置

首先，我们当然需要关闭 Android Studio 自带的 Assist 引导，然后点击右侧的 Gemini 图标。

点击这个图标后，就会出现 Gemini 聊天的界面了。

很明显，普通模式，就是像 ChatGPT 那样可以跟 AI 聊天。这个功能我在上一篇博客里介绍过了。今天我们重点来看看 Agent 模式。

Agent 模式下的关键配置，我已经在图片里标注了。我们从上往下一一介绍：

Agent Tab：点击这个 Tab 就可以帮助我们切换到 Agent 模式下了。那么，Agent 模式和普通模式到底有什么区别呢？用一句话概括：普通模式下，Gemini 只能和我们聊天，Agent 模式下，Gemini 一定程度接管 IDE 进行简单的操作。
API Key：Google 官方给所有 Android 开发者提供了免费使用 Gemini 的额度，但仅限于相对便宜的默认模型，如果希望使用 Gemini 的最强模型，则需要使用自己的 API Key。
选择上下文：当我们向 AI 提问的时候，大部分情况下，是会和当前工程的某些代码相关的。这里就需要我们明确指定提问的上下文信息。
选择 AI 模型：前面提到过，Google 提供的是免费默认模型，在遇到一些复杂问题的时候，AI 可能力不从心。这时候，如果你想要使用 Gemini 的最强模型，就需要你自己的 API Key 了。
更多设置：这里当前的设置非常简单，只有一个选项，是否自动允许 Agent 的操作。前面我提到过，Agent 模式下，AI 可以接管 IDE 对代码工程进行简单的操作。一般来说，我们刚开始使用 Agent 模式的时候，建议暂时不要开启，等熟悉了以后，再根据情况考虑是否要开启。目前我自己平时是不开启的。

案例

Agent 模式具体该怎么用？其实就跟 ChatGPT 聊天差不多。只是从前我们需要自己拷贝代码，然后修改代码，然后手动运行程序查看效果，现在这些都可以交给 AI 自动完成了。

官方案例

下面这个是 Google 官方提供的案例：

问题：APP 界面默认是明亮主题，希望改成默认黑暗主题。

具体该怎么做呢？其实我们只需要发一条消息给 AI：我希望把默认主题模式，改为黑暗主题。（Make dark mode the default in user preferences）

其他的，你就不用管了。 AI 会自动查找工程里的源代码，找到相关的配置文件，自动修改代码的内容，然后重新部署代码让它生效。

真香！

考考 Gemini

我在上一篇博客里，曾经用过这个例子来考验 Gemini，当时它回答的并不好。

kotlin 复制代码

class User {
    var name: String?
    var age: Int?
    var address: String?
}

这次我直接在 Android Studio 里创建了一个类，然后把问题丢给 Agent。

Gemini 直接在编辑器里帮我把代码改好了，然后告诉了我修复的思路：

并且，Gemini 也敏锐的发现了代码仍然有进一步优化的空间，主动提出了可以使用 Data Class 优化。

这时候我只需要动动嘴，告诉 Gemini 继续优化。

但是，Gemini 这次的修改仍然没有达到我的期望，我又继续发问了。

这次 Gemini 给出的修复已经非常不错了，并且，在后面它还贴心的附带了使用介绍。

这次实验，我使用自己的 API Key，使用的模型是 Google 最强的模型 Gemini 2.5 Pro，所以它总体的表现也非常令人满意。唯一的遗憾是，Gemini 没有一步到位帮我优化好代码，中间让我介入了两次。不过，这些其实可以通过一些通用配置来解决，我们可以通过为工程配置一些全局规则，让 Agent 更智能化的帮我们判断。理论上也可以实现一步到位的优化。

关于配置的部分，我们以后有机会再讲吧。

烧钱警告！

在使用自己的 API Key 的情况下，一定要注意使用量，还有上下文长度。在某些极端情况下，AI 烧钱速度也是会很快的，我曾经遇到过一晚上烧200美金的情况，触发 Gemini 单日消费上限后才停下来。

这里我附上 Gemini 各个模型 token 的价格，给大家参考：

看完上面的价格后，你也许会发现，Gemini 的 API Key 分为两个等级。

Free Tier：免费等级，Gemini 每天会给个人用户一些免费额度，正常使用的情况下，也是够用的。它的坏处就在于，会收集你的聊天信息用来改进 Gemini。也就是说，你选择免费 API Key 的话，你就成了小白鼠，同时你的代码也会暴露。
Paid Tier：付费等级，唯一的缺点就是要花钱。

所以，如果你是在做一些无关紧要的业余项目，那就可以考虑使用免费的 API Key。如果是重要的项目，则最好老实付费。

结尾

说实话，对比 Cursor，当前 Android Studio 的 Agent 体验其实还差点意思。但由于 Cursor 本身对 Android 开发不太友好，这就意味着，对于我们 Android 程序员来说，Android Studio + Gemini 成为了最佳选择。

AI 编程工具可以大幅提升我们的开发效率，但 AI 也是一把双刃剑，用的不好的话，有时候会适得其反。AI 编程本身是个非常大的话题，本文的作用是为大家科普，其背后还有许多知识点需要学习。大家如果感兴趣，可以去找一些大模型相关的知识了解一些，尤其是 Prompt，它是我们驾驭 AI 的关键。

好了，今天的内容就到这。感谢你的时间，我们下次见。

新一代 Agentic AI 智能体，助力 Android 开发 | Google I/O

Android Studio Narwhal

介绍 & 配置

案例

官方案例

考考 Gemini

烧钱警告！

结尾