Android 系统人工智能的新基石:Gemini Nano 和 AICore

原文地址:android-developers.googleblog.com/2023/12/a-n...

翻译者:张拭心

wx 联系方式:godblesszsx,加我进群,一起分享,共同进步

编者语

谷歌 12 月 6 日宣布推出其规模最大、功能最强大的人工智能模型 Gemini。

Gemini 将包括三种不同的套件:Gemini Ultra,Gemini Pro 和 Gemini Nano。根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了「最先进的性能」,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。

和 GPT-4 相比,Gemini 最大的优势在于可以直接内置于 Android 操作系统、、支持实现离线计算、提供了 API 给 App 使用,这将带来非常大的想象空间。

对于 Android 开发者,可以多关注 AICore 的最新进展、掌握它的 API 并思考如何基于已有的业务进行创新,这或许可以让你在 AI 浪潮中成就一番事业。

这篇文章主要介绍了什么是 Gemini Nano 和 AICore。

正文

基础模型从各种数据源中学习,以生成能够适应各种任务的人工智能系统,而不是针对单一的用例进行训练。今天,我们发布了迄今为止功能最强大的模型-- Gemini (双子座)。Gemini 的设计非常灵活,因此它可以在从数据中心到移动设备的任何地方运行。它针对三种不同的尺寸进行了优化: Ultra、Pro 和 Nano。

Gemini Nano,用于移动设备的模型

Gemini Nano 是我们专为移动设备构建的高效模型,可直接在移动芯片上运行,支持很多重要的使用场景。

在设备上运行模型可以实现数据不离开设备的功能 ,例如在端到端加密消息应用中实现回复消息的智能建议。它还能实现稳定的体验,即使在没有网络的情况下,功能也始终可用。

Gemini Nano 是由较大的 Gemini 模型精简而来,并针对移动芯片做了专门优化。Gemini Nano 可实现高质量文本摘要、上下文智能回复以及高级校对和语法纠正等强大功能。例如,Gemini Nano 增强的语言理解能力使 Pixel 8 Pro 即使在手机网络断开的情况下,也能简明扼要地概括录音机应用中的内容。

Pixel 8 Pro 在录音应用中使用 Gemini Nano 总结会议音频,即使没有网络连接也能正常运行。

Gemini Nano 已开始在 Pixel 8 Pro 的 Gboard 中支持智能回复,作为开发者预览版可在设置中启用。该设备上的人工智能模型现在可以在 WhatsApp 中试用(明年将在更多应用中使用),它可以给出一些高质量的回复建议,从而节省您的时间。

在 Pixel 8 Pro 上使用 Gemini Nano 在 WhatsApp 的 Gboard 中进行智能回复。

安卓 AICore,用于设备基础模型的新系统服务

Android AICore 是 Android 14 中的一项新系统服务,可让您轻松访问 Gemini Nano。AICore 实现了模型管理、运行时、安全功能等功能,简化了将人工智能融入应用程序的工作。

AICore 在设计上是私有的,它效仿了 Android 的私有计算核心(Private Compute Core),通过开源 API 与网络隔离,提供了透明度和可审计性。作为我们以负责任的方式构建和部署人工智能工作的一部分,我们还构建了专门的安全功能,使其对每个人都更加安全。

AICore 管理模型、运行时和安全功能。

AICore 通过 Gemini Nano 实现了低等级适配(LoRA)微调功能(微调大规模语言模型)。这一强大的功能使应用程序开发人员能够根据自己的训练数据创建小型 LoRA 适配器。LoRA 适配程序由 AICore 加载,产生一个功能强大的大型语言模型,并根据应用程序自身的使用情况进行调整。

AICore 利用了新的 ML 硬件,如最新的 Google Tensor TPU 和旗舰产品 Qualcomm Technologies、Samsung S.LSI 和 MediaTek 芯片中的 NPU。AICore 和 Gemini Nano 将在 Pixel 8 Pro 上推出,未来几个月还将公布更多的设备和芯片合作伙伴。

Build with Gemini

我们很高兴能将最先进的人工智能研究与易于使用的工具和应用程序接口结合起来,供 Android 开发人员在设备上使用 Gemini 构建应用程序

如果您对使用 Gemini Nano 和 AICore 构建应用程序感兴趣,请注册我们的 "早期访问计划"

相关推荐
那个村的李富贵6 小时前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
子兮曰8 小时前
OpenClaw入门:从零开始搭建你的私有化AI助手
前端·架构·github
吴仰晖8 小时前
使用github copliot chat的源码学习之Chromium Compositor
前端
1024小神8 小时前
github发布pages的几种状态记录
前端
腾讯云开发者8 小时前
“痛点”到“通点”!一份让 AI 真正落地产生真金白银的实战指南
人工智能
CareyWYR8 小时前
每周AI论文速递(260202-260206)
人工智能
hopsky9 小时前
大模型生成PPT的技术原理
人工智能
禁默9 小时前
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战
人工智能·信号处理·cann
心疼你的一切10 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
AI绘画哇哒哒10 小时前
【干货收藏】深度解析AI Agent框架:设计原理+主流选型+项目实操,一站式学习指南
人工智能·学习·ai·程序员·大模型·产品经理·转行