Android 系统人工智能的新基石:Gemini Nano 和 AICore

原文地址:android-developers.googleblog.com/2023/12/a-n...

翻译者:张拭心

wx 联系方式:godblesszsx,加我进群,一起分享,共同进步

编者语

谷歌 12 月 6 日宣布推出其规模最大、功能最强大的人工智能模型 Gemini。

Gemini 将包括三种不同的套件:Gemini Ultra,Gemini Pro 和 Gemini Nano。根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了「最先进的性能」,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。

和 GPT-4 相比,Gemini 最大的优势在于可以直接内置于 Android 操作系统、、支持实现离线计算、提供了 API 给 App 使用,这将带来非常大的想象空间。

对于 Android 开发者,可以多关注 AICore 的最新进展、掌握它的 API 并思考如何基于已有的业务进行创新,这或许可以让你在 AI 浪潮中成就一番事业。

这篇文章主要介绍了什么是 Gemini Nano 和 AICore。

正文

基础模型从各种数据源中学习,以生成能够适应各种任务的人工智能系统,而不是针对单一的用例进行训练。今天,我们发布了迄今为止功能最强大的模型-- Gemini (双子座)。Gemini 的设计非常灵活,因此它可以在从数据中心到移动设备的任何地方运行。它针对三种不同的尺寸进行了优化: Ultra、Pro 和 Nano。

Gemini Nano,用于移动设备的模型

Gemini Nano 是我们专为移动设备构建的高效模型,可直接在移动芯片上运行,支持很多重要的使用场景。

在设备上运行模型可以实现数据不离开设备的功能 ,例如在端到端加密消息应用中实现回复消息的智能建议。它还能实现稳定的体验,即使在没有网络的情况下,功能也始终可用。

Gemini Nano 是由较大的 Gemini 模型精简而来,并针对移动芯片做了专门优化。Gemini Nano 可实现高质量文本摘要、上下文智能回复以及高级校对和语法纠正等强大功能。例如,Gemini Nano 增强的语言理解能力使 Pixel 8 Pro 即使在手机网络断开的情况下,也能简明扼要地概括录音机应用中的内容。

Pixel 8 Pro 在录音应用中使用 Gemini Nano 总结会议音频,即使没有网络连接也能正常运行。

Gemini Nano 已开始在 Pixel 8 Pro 的 Gboard 中支持智能回复,作为开发者预览版可在设置中启用。该设备上的人工智能模型现在可以在 WhatsApp 中试用(明年将在更多应用中使用),它可以给出一些高质量的回复建议,从而节省您的时间。

在 Pixel 8 Pro 上使用 Gemini Nano 在 WhatsApp 的 Gboard 中进行智能回复。

安卓 AICore,用于设备基础模型的新系统服务

Android AICore 是 Android 14 中的一项新系统服务,可让您轻松访问 Gemini Nano。AICore 实现了模型管理、运行时、安全功能等功能,简化了将人工智能融入应用程序的工作。

AICore 在设计上是私有的,它效仿了 Android 的私有计算核心(Private Compute Core),通过开源 API 与网络隔离,提供了透明度和可审计性。作为我们以负责任的方式构建和部署人工智能工作的一部分,我们还构建了专门的安全功能,使其对每个人都更加安全。

AICore 管理模型、运行时和安全功能。

AICore 通过 Gemini Nano 实现了低等级适配(LoRA)微调功能(微调大规模语言模型)。这一强大的功能使应用程序开发人员能够根据自己的训练数据创建小型 LoRA 适配器。LoRA 适配程序由 AICore 加载,产生一个功能强大的大型语言模型,并根据应用程序自身的使用情况进行调整。

AICore 利用了新的 ML 硬件,如最新的 Google Tensor TPU 和旗舰产品 Qualcomm Technologies、Samsung S.LSI 和 MediaTek 芯片中的 NPU。AICore 和 Gemini Nano 将在 Pixel 8 Pro 上推出,未来几个月还将公布更多的设备和芯片合作伙伴。

Build with Gemini

我们很高兴能将最先进的人工智能研究与易于使用的工具和应用程序接口结合起来,供 Android 开发人员在设备上使用 Gemini 构建应用程序

如果您对使用 Gemini Nano 和 AICore 构建应用程序感兴趣,请注册我们的 "早期访问计划"

相关推荐
黄林晴几秒前
离谱!Android 17藏神仙功能,手机录屏叠加真人出镜
android
大山佬几秒前
工业故障听诊:单片机上的稀疏音频分类模型部署
人工智能
晓得迷路了2 分钟前
栗子前端技术周刊第 133 期 - Angular v22、React 编译器 Rust 版、pnpm 11.5...
前端·javascript·css
Wanderer X2 分钟前
ViT 为什么可以对任意维度的图像进行编码?
人工智能
_codemonster2 分钟前
软考易错知识总结(二)
大数据·人工智能
江畔柳前堤3 分钟前
agent面试题
数据库·人工智能·opencv·数据挖掘·语音识别·agent
rongcj3 分钟前
为什么是张雪?为什么是荣耀?
大数据·人工智能·物联网
朱涛的自习室3 分钟前
Harness 还没学会,又来了个 Loop Engineering ?
android·人工智能·github
一个被程序员耽误的厨师4 分钟前
02-架构篇-前端怎么反客为主把AI编排权拿回到自己手里
前端·人工智能·架构
腾飞开源5 分钟前
06_Dify接入阿里云百炼API大模型
人工智能·项目实战·dify·ai智能体·ai应用开发·阿里云百炼·接入大模型