一、前言
北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问。
一个更好的消息是:Gemini Pro 可免费使用。赶紧体验起来吧~
二、关于
Google Gemini是一款由Google AI开发的大型语言模型聊天机器人。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的产品,成为迄今为止最强大的AI系统之一。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。Gemini对标的是GPT-4,并在试图证明优于OpenAI的GPT-4。
Google Gemini 有三种版本,分别适用于不同场景:Ultra、Pro 和 Nano
-
Gemini Ultra 是最大的版本,具有最强大的性能。可用于大型数据中心等,属于处理高复杂度任务的模型。
-
Gemini Pro 是面向开发者的版本,用于各种扩展任务的最佳模型。且已搭载于谷歌的对话机器人Bard中。它可以通过 Google AI Studio 或 Google Cloud Vertex AI 获取。
-
Gemini Nano 是应用于智能手机等移动设备终端上最高效的模型。
三、特点
-
多模态能力:Gemini可以处理文本、图像、代码、音频和视频等多种类型的信息。
-
强大的对话能力:Gemini能够进行复杂的对话,并理解用户的上下文。
-
自然流畅的语言生成:Gemini生成的语言非常流畅和自然。
四、Gemini总结
-
它具备丰富的功能,包括函数调用、数据嵌入、语义检索、自定义知识嵌入以及聊天功能
-
在专业的基准测试中,Gemini Pro 的表现超越了其他同类模型
-
当前版本配备了 32K 文本上下文窗口,未来将推出拥有更广阔上下文窗口的版本
-
Gemini Pro 可处理文本输入并生成文本输出。还推出了一个专门的 Gemini Pro 视觉多模态终端,能够处理图像和文本输入,输出文本
-
它支持 全球超过 180 个国家和地区 的 38 种语言
-
Gemini Pro 提供了多种 SDK,以便开发者在不同平台上构建应用,包括 Python、Android (Kotlin)、Node.js、Swift 和 JavaScript,助力开发者在任何平台上快速构建应用
-
当前Gemini Pro 可免费使用(存在一定使用限制),并且其定价将十分 有竞争力
-
Google 还提供了一个免费的在线开发工具 Google AI Studio,你可以用它快速构建 Gemini 应用,Google AI Studio
-
关于计费方式:跟OpenAI 计算单位不一样, Google 是按字符,OpenAI 是按 Token,如果是中文会便宜不少
五、注册
1. 注册Google Cloud Platform帐户
有了Google Cloud Platform帐户,就可以通过 Google Cloud Vertex AI 或 Google AI Studio访问 Gemini Pro。
Gemini API 地址:ai.google.dev
2.Google Cloud Vertex AI
Google Cloud Vertex AI 使用 Gemini Pro,操作步骤:
-
登录 Google Cloud Platform
-
单击左侧导航栏中的 人工智能
-
单击 Vertex AI
-
单击 模型库 ,选择 Gemini Pro模型
-
打开 Language Studio
Vertex AI:
模型库:
3.Google AI Studio
Google AI Studio 使用 Gemini Pro,操作步骤:
-
登录 Google Cloud Platform
-
单击左侧导航栏中的 AI Platform
-
单击 AI Hub ,选择 Gemini Pro
六、Gemini体验
Bard 网页
Gemini API 使用入门
Gemini API 参考
七、Gemini与GPT-4对比
-
按谷歌的说法Gemini在所有多模态任务中的表现都优于 GPT-4。GPT-4 只能处理图像和文本。(除了HellaSwag)
-
Gemini 可以处理视频、音频、图像和文本。随着谷歌继续训练其工具包,它的性能可能会大大超过其他各种模型。
-
详情请参阅 Gemini 技术报告
-
进一步了解Gemini 的能力和运作方式
八、进一步了解
1.blog.google
2.一起交流~
公众号:【米七独立技术】