AI API 基础

通过使用 Google Gemini (注意:如果你没有梯子,那么随便找个模型都可以)动手实践 AI API------这是深入学习 LangChain 之前的重要基础。本初学者指南将逐步介绍环境设置、身份验证、首次 API 调用以及令牌、模型和参数等关键概念。

学习目标

  • 设置开发环境并获取 Google AI API 密钥(免费)
  • 使用 Python 进行首次 API 调用(本课程专注于 Python)
  • 理解关键参数:temperature(温度)、max_output_tokens(最大输出令牌数)、top_p 等
  • 学习有关令牌、定价和速率限制的知识

为什么在学习 LangChain 之前要学习 AI APIs?

LangChain 是一个简化 AI 开发的强大框架,但理解其底层的 AI APIs 至关重要。这些知识有助于调试问题、优化性能,并在构建 LangChain 应用程序时做出明智的决策。可以把它看作是先学会手动驾驶再学自动挡!

初学者入门:一步步设置指南

关于编程语言

虽然 AI APIs 和如 LangChain 这样的框架支持多种编程语言(Python、JavaScript、Go 等),但本课程仅使用 Python。由于其简单性和丰富的数据科学库生态系统,Python 成为了 AI/ML 开发中最受欢迎的语言。

步骤 1:创建 Google AI Studio 账户

再次说明:这一步不重要,随便找个模型都可以使用,比如公司的私有化部署的模型,或者自己本地部署的模型,本地部署参考LangChain开发环境搭建

  1. 访问 Google AI Studio
  2. 使用您的 Google 账户登录。
  3. 点击"创建 API 密钥"。
  4. 选择"在新项目中创建 API 密钥"或选择现有项目。
  5. 安全地复制并保存您的 API 密钥(以后可以再次查看)。
免费开始!

Google AI Studio 提供免费的 API 访问权限,配额非常慷慨 - 非常适合学习和实验。无需信用卡!

安全最佳实践
  • 不要将 API 密钥提交到版本控制系统。
  • 使用环境变量(.env 文件)。
  • 在您的 Google AI Studio 账户中设置使用警报。
  • 定期轮换密钥。
步骤 2:设置您的开发环境
您的第一个 API 调用
设置说明
  1. 安装 Google Generative AI 库:
pip 复制代码
pip install  google-genai   python-dotenv

或者用uv(推荐,不过对于初学者也不重要)

uv 复制代码
uv add  google-genai   python-dotenv
  1. 创建 .env 文件:
    在项目更目录创建一个.env文件
env 复制代码
GOOGLE_API_KEY=AIza...your-key-here...
  1. 编写第一个 Python 脚本:
python 复制代码
from dotenv import load_dotenv
from google import genai

# 加载环境变量
load_dotenv()

client = genai.Client()
response = client.models.generate_content(
    model='gemini-2.5-flash',
    contents='你好,你能干什么?'
)
print(response.text)
复制代码
你好!我是一个大型语言模型,我的主要能力包括:

1.  **回答你的问题**:我可以提供各种信息,解释概念,或者就你感兴趣的话题进行探讨。
2.  **撰写文本**:我可以帮你写文章、故事、诗歌、邮件、剧本、代码等各种文本。
3.  **提供创意和灵感**:如果你需要头脑风暴、构思方案,我可以提供想法和建议。
4.  **总结和分析**:我可以帮你总结长篇内容,提取关键信息。
5.  **翻译**:我可以进行不同语言之间的翻译。
6.  **学习和推理**:我正在不断学习和进步,可以根据新的信息调整我的回答。
7.  **日常对话**:你也可以只是和我进行轻松的聊天。

简而言之,凡是需要处理和生成语言的任务,我都能尽力帮助你。

你有什么想问的或者想让我帮忙的吗?

注意:

  1. 这个代码不重要,如果你没有大模型大概看看即可,主要是要理解下面的几个基础概念。
  2. 上面的gemini-2.5-flash模型一定选择新一点的,如果你设置为gemini-2.0-flash,可能会无法使用报错:

google.genai.errors.ClientError: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message':

'You exceeded your current quota, please check your plan and billing details. For more information on this error,

head to: https://ai.google.dev/gemini-api/docs/rate-limits...

  1. 一定要安装google-genai而不是旧的google-generativeai

理解 API 参数

💡 重要提示:

不同 AI 提供商之间的参数名称和可用选项可能有所不同。本课重点介绍 Google Gemini API。OpenAI 使用 max_tokens,而 Gemini 使用 max_output_tokens。始终检查所选提供商的具体 API 文档。

🌡️Temperature(温度)(0-2)

控制响应中的随机性。较低值使输出更加集中和确定。

  • 0-0.3:事实性的、一致的回答
  • 0.4-0.7:平衡创造力
  • 0.8-1.0:创造性的、多变的回答
📏Max Output Tokens(最大输出令牌数)

响应的最大长度。一个令牌 ≈ 4 个字符或 0.75 个词。

  • 简短回答:50-150 令牌
  • 段落:150-500 令牌
  • 文章:1000+ 令牌
🎲Top P(核采样)(0-1)

考虑具有最高累计概率质量的令牌。

  • 0.1:非常集中,可预测
  • 0.5:适度多样性
  • 1.0:考虑所有选项
🔄频率惩罚 (-2 到 2)

基于其出现频率对令牌进行惩罚以减少重复。

  • 负值:允许更多重复
  • 0:默认行为
  • 正值:减少重复

示例:不同的参数设置:

python 复制代码
# 创意写作
response = model.generate_content(
    "Write a story about...",
    generation_config=genai.GenerationConfig(
        temperature=0.9,
        max_output_tokens=500,
        top_p=0.9
    )
)

# 事实问答
response = model.generate_content(
    "What is the capital of...",
    generation_config=genai.GenerationConfig(
        temperature=0.1,
        max_output_tokens=50,
        top_p=0.1
    )
)

# 代码生成
response = model.generate_content(
    "Write a Python function...",
    generation_config=genai.GenerationConfig(
        temperature=0.3,
        max_output_tokens=300,
    )
)

理解令牌和定价

什么是令牌?

令牌是模型处理的单词片段。粗略估计:

  • 1 令牌 ≈ 4 个英文字符
  • 1 令牌 ≈ ¾ 个词
  • 100 令牌 ≈ 75 个词
💡 令牌示例
  • "Hello" = 1 令牌
  • "Hello, world!" = 4 令牌
  • "artificial intelligence" = 2 令牌
  • "今日は" = 3 令牌(非英语使用更多的令牌)

成本优化技巧

  • 尽可能使用较短的提示
  • 设置适当的 max_output_tokens 限制
  • 根据任务复杂度选择合适的模型
  • 在适当的情况下缓存响应
  • 通过 Google AI Studio 仪表板监控使用情况

常见错误及解决方案

401 Unauthorized(未授权)

原因:无效或缺失 API 密钥

解决方案:检查您的 API 密钥和环境变量

429 Rate Limit Exceeded(超出速率限制)

原因:短时间内请求过多

解决方案:实施指数退避或升级您的计划

400 Bad Request(错误请求)

原因:无效参数或模型名称

解决方案:检查模型名称和参数值

下一步:迈向 LangChain

干得好!你已经掌握了 AI API 的基础知识------这是 LangChain 开发的关键基础。直接与 AI APIs 工作的知识将帮助你欣赏 LangChain 在 AI 应用程序开发中带来的便捷和强大功能。

准备好从 AI 中获得更好的结果了吗?在下一课中,你将学习 Prompt Engineering 技巧,以显著提高 AI 回复的质量和一致性------这是 LangChain 开发的另一项必备技能。

参考文献

https://ai.google.dev/gemini-api/docs/migrate?hl=zh-cn

相关推荐
AI大佬的小弟22 天前
【详细步骤】大模型基础知识(4)---ollama模型调用-多轮对话体验
python·ollama·大模型基础·ai 聊天机器人·简单的大模型部署·实现ollama模型调用·零基础上手 ollama体验
AI大佬的小弟1 个月前
【小白第一课】大模型基础知识(1)---大模型到底是啥?
人工智能·自然语言处理·开源·大模型基础·大模型分类·什么是大模型·国内外主流大模型
cooldream20094 个月前
大模型分类与应用全景解析:从文本到多模态的智能演进
人工智能·ai·大模型基础
cooldream20091 年前
基于深度文档理解的开源 RAG 引擎RAGFlow的介绍和安装
rag·ragflow·大模型基础