Go SiliconFlow API 语言实现多模态图像描述服务

Go SiliconFlow API 语言实现多模态图像描述服务

项目背景

本项目使用 Go 语言实现一个基于 SiliconFlow API 的图像描述微服务,展示 Go 在多模态 AI 应用中的强大能力。

项目依赖

bash 复制代码
# 初始化项目
go mod init image-description-service

# 添加依赖
go get github.com/joho/godotenv
go get github.com/sashabaranov/go-openai

环境配置 (.env)

shell 复制代码
# SiliconFlow API 配置
SILICONFLOW_API_KEY=sk-*******************************************
SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1

核心实现

1. 项目结构

复制代码
image-description-service/
├── main.go
├── .env
└── go.mod

2. 代码实现

main.go:

go 复制代码
package main

import (
    "context"
    "fmt"
    "log"
    "os"

    "github.com/joho/godotenv"
    openai "github.com/sashabaranov/go-openai"
)

// ImageDescriber 图像描述服务
type ImageDescriber struct {
    client *openai.Client
}

// NewImageDescriber 创建新的图像描述服务实例
func NewImageDescriber() (*ImageDescriber, error) {
    // 加载环境变量
    err := godotenv.Load()
    if err != nil {
        return nil, fmt.Errorf("加载 .env 文件失败: %v", err)
    }

    // 获取 API 配置
    apiKey := os.Getenv("SILICONFLOW_API_KEY")
    baseURL := os.Getenv("SILICONFLOW_BASE_URL")

    // 配置 OpenAI 客户端
    config := openai.DefaultAzureConfig(apiKey, baseURL)
    config.BaseURL = baseURL

    return &ImageDescriber{
        client: openai.NewClientWithConfig(config),
    }, nil
}

// DescribeImage 描述图像
func (d *ImageDescriber) DescribeImage(imageURL string) (string, error) {
    // 准备多模态请求
    req := openai.ChatCompletionRequest{
        Model: "Qwen/Qwen2-VL-72B-Instruct",
        Messages: []openai.ChatCompletionMessage{
            {
                Role: "user",
                MultimodalContent: []openai.ChatMessagePart{
                    {
                        Type: openai.ChatMessagePartTypeImageURL,
                        ImageURL: &openai.ChatMessageImageURL{
                            URL: imageURL,
                        },
                    },
                    {
                        Type: openai.ChatMessagePartTypeText,
                        Text: "用中文详细描述这张图片的内容",
                    },
                },
            },
        },
        Stream: true,
    }

    // 创建流式响应
    stream, err := d.client.CreateChatCompletionStream(context.Background(), req)
    if err != nil {
        return "", fmt.Errorf("创建流式响应失败: %v", err)
    }
    defer stream.Close()

    // 收集响应
    var description string
    for {
        response, err := stream.Recv()
        if err != nil {
            break
        }
        description += response.Choices[0].Delta.Content
    }

    return description, nil
}

func main() {
    // 创建图像描述服务
    describer, err := NewImageDescriber()
    if err != nil {
        log.Fatalf("初始化服务失败: %v", err)
    }

    // 示例图像
    imageURL := "https://sf-maas-uat-prod.oss-cn-shanghai.aliyuncs.com/dog.png"
    
    // 生成图像描述
    description, err := describer.DescribeImage(imageURL)
    if err != nil {
        log.Fatalf("图像描述生成失败: %v", err)
    }

    // 输出描述
    fmt.Println("图像描述:", description)
}

运行方法

bash 复制代码
# 设置环境变量
export SILICONFLOW_API_KEY=your_api_key
export SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1

# 运行程序
go run main.go

技术亮点

  1. 使用 Go 协程实现高性能异步处理
  2. 支持流式 API 响应
  3. 环境变量安全管理
  4. 模块化设计,易于扩展

注意事项

  • 确保正确配置 API 密钥
  • 处理网络异常和超时
  • 遵守 API 使用限制

立即体验

快来体验 Go 语言多模态 AI:https://go.dev/play/

快来体验 Go 语言多模态 AI:https://go.dev/play/

快来体验 Go 语言多模态 AI:https://go.dev/play/

相关推荐
喵了meme5 小时前
C语言实战4
c语言·开发语言
码界奇点5 小时前
Python从0到100一站式学习路线图与实战指南
开发语言·python·学习·青少年编程·贴图
码事漫谈5 小时前
C++ 多线程开发:从零开始的完整指南
后端
9ilk5 小时前
【C++】--- 特殊类设计
开发语言·c++·后端
码事漫谈5 小时前
十字路口的抉择:B端与C端C++开发者的职业路径全解析
后端
sali-tec6 小时前
C# 基于halcon的视觉工作流-章68 深度学习-对象检测
开发语言·算法·计算机视觉·重构·c#
提笔了无痕7 小时前
git基本了解、常用基本命令与使用
git·后端
java1234_小锋7 小时前
Spring IoC的实现机制是什么?
java·后端·spring
喵个咪7 小时前
开箱即用的 GoWind Admin|风行,企业级前后端一体中后台框架:JWT 集成指南
后端·go
生骨大头菜7 小时前
使用python实现相似图片搜索功能,并接入springcloud
开发语言·python·spring cloud·微服务