【Easy-Vibe】【task4】给原型加上 AI 能力

【Easy-Vibe】【task4】给原型加上 AI 能力

API 基础概念

API 是计算机领域的一个重要抽象概念,我们可以简单理解为:你按对方要求的格式"发一个问题",对方就按同样的格式"回一个结果"。

  • 你发出去的内容:通常包括"密钥(API Key)"和"你要生成什么"
  • 对方回给你的内容:成功就给结果;失败会告诉你原因(比如"密钥不对""余额不足""参数写错")

具体来说,你需要掌握以下核心要素:

  • API Key:你的"通行证",也是"钱包钥匙"。别人拿到它,就可以替你调用接口并产生费用。
  • Endpoint(接口路径):API 请求的具体路径,告诉服务器你要访问哪个功能。完整的请求地址通常由"基础 URL + Endpoint路径"构成。例如:
  • 调用/请求:向 AI 服务发送任务并获取结果的过程
  • 请求内容:你发给AI的具体内容,比如你想让AI写的文章主题、生成的图片描述等。
  • 响应结果:AI处理完后返回给你的内容,比如生成的文章、图片等。
  • 错误处理:当出现问题时(如API Key错误、请求太频繁等),知道如何排查解决。

API 安全注意事项

API Key 是你请求 AI 服务的「通行证」,它是一串密码字符串,用于身份验证和计费。

由于 API Key 直接关联账户和费用,务必注意:

绝对不要分享到群聊、截图上传网络或发布在公开论坛 不要硬编码到代码中并提交到 Git 仓库(尤其是公开仓库) 如怀疑 Key

已泄露,立即更换新 Key

接入文本生成 API:DeepSeek

DeepSeek API 使用与 OpenAI 兼容的 API 格式,通过修改配置,您可以使用 OpenAI SDK 来访问 DeepSeek API,或使用与 OpenAI API 兼容的软件。

PARAM VALUE
base_url * https://api.deepseek.com
api_key apply for an API key
  • 出于与 OpenAI 兼容考虑,您也可以将 base_url 设置为 https://api.deepseek.com/v1 来使用,但注意,此处 v1 与模型版本无关。

  • deepseek-chat 和 deepseek-reasoner 对应模型版本不变,为 DeepSeek-V3.2 (128K 上下文长度),与 APP/WEB 版不同。deepseek-chat 对应 DeepSeek-V3.2 的非思考模式,deepseek-reasoner 对应 DeepSeek-V3.2 的思考模式。

    curl https://api.deepseek.com/chat/completions
    -H "Content-Type: application/json"
    -H "Authorization: Bearer ${DEEPSEEK_API_KEY}"
    -d '{
    "model": "deepseek-chat",
    "messages": [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Hello!"}
    ],
    "stream": false
    }'

使用提示词参考如下:

复制代码
参考这个调用方法,帮我支持文案生成功能,可以基于商品信息点击后生成对应抖音电商文案,多种风格。

以下参考资料:
api key:sk-8573341c39aefa1efe
api 请求参考:
curl  \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${DEEPSEEK_API_KEY}" \
  -d '{
        "model": "deepseek-chat",
        "messages": [
          {"role": "system", "content": "You are a helpful assistant."},
          {"role": "user", "content": "Hello!"}
        ],
        "stream": false
      }'

接入图像转文字 API:Qwen3 VL

图片转文字 API 参考代码

复制代码
from openai import OpenAI
from typing import Dict, Any, List
import base64
import os
SILICONFLOW_API_KEY: str = ""
SILICONFLOW_BASE_URL: str = "https://api.siliconflow.cn/v1/"
MODEL_NAME: str = "Qwen/Qwen3-VL-8B-Instruct"

def encode_image(image_path: str) -> str:
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

def get_vlm_completion(client: OpenAI, messages: List[Dict[str, Any]]) -> str:
    response = client.chat.completions.create(
        model=MODEL_NAME,
        messages=messages,
        max_tokens=512,
        temperature=0.7,
        top_p=0.7,
        frequency_penalty=0.5,
        stream=False,
        n=1
    )
    return response.choices[0].message.content

def caption_image(image_path: str) -> str:
    base64_image = encode_image(image_path)
    messages = [
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Please describe this image in detail."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{base64_image}"
                    }
                }
            ]
        }
    ]

    client = OpenAI(
        api_key=SILICONFLOW_API_KEY,
        base_url=SILICONFLOW_BASE_URL
    )

    return get_vlm_completion(client, messages)

image_path = "images.jpg"
caption = caption_image(image_path)

提示词

复制代码
基于下面的图生文接口 API ,帮我们实现将上传的图片,自动生成电商卖点文本、关键词的功能

<此处省略代码,你需要自行粘贴密钥和参考代码>

作业:集成你的第一个 AI 能力

接入 deepseek API

创建商品名称

一键生成文案

接入硅基流动的图生文 API,根据图片生成文案

上传图片

根据图片生成文本

相关推荐
乔江seven4 分钟前
【李沐 | 动手学深度学习】17 深度学习硬件:CPU 和 GPU
人工智能·深度学习·深度学习硬件·cpu和gpu
深海鱼在掘金10 分钟前
深入浅出 LangChain —— 第二章:环境搭建与快速上手
人工智能·typescript·langchain
qq_4112624227 分钟前
四博 AI 机械臂台灯智能音箱方案
人工智能·智能音箱
qq_4112624227 分钟前
基于 ESP32-S3 + VB6824 的四博三模联网 AI 智能音箱方案设计
人工智能·智能音箱
qq_4112624239 分钟前
四博 AI 双目智能音箱技术方案
人工智能·智能音箱
甲维斯43 分钟前
测一波MiMo 2.5 Pro,看看真实实力!
人工智能
qq_411262421 小时前
四博 AI 双目智能音箱技术拆解
人工智能·智能音箱
xwz小王子1 小时前
Science Robotics 让机器人学会“削果皮”:一种曲面物体操作任务转移的新方法
人工智能·机器人
qq_411262421 小时前
四博 AI 双目智能音箱方案:从“会说话”升级到“有感知、有表情、有反馈”的 AI 硬件平台
人工智能·智能音箱
xiaoduo AI1 小时前
客服机器人非工作时间能休眠?智能Agent开放平台定时唤醒,无人值守省资源?
大数据·人工智能·机器人