调用百度API实现图像多主体检测

[1. 作者介绍](#1. 作者介绍)
2．百度API介绍与获取
- [2.1 API介绍](#2.1 API介绍)
- [2.2 注册账号并获取API Key](#2.2 注册账号并获取API Key)
3．完整实验代码，测试结果
- [3.1 调用API](#3.1 调用API)
- 3.2框出主体部分，并标注标签和置信度
- [3.3 测试结果](#3.3 测试结果)

1. 作者介绍

邓富贵，男，西安工程大学电子信息学院，2023级研究生

研究方向：机器视觉与人工智能

电子邮件：[email protected]

吴天禧，女，西安工程大学电子信息学院，2023级研究生，张宏伟人工智能课题组

研究方向：模式识别与智能系统

电子邮件：[email protected]

2．百度API介绍与获取

2.1 API介绍

应用程序编程接口（英语：Application Programming Interface，简称：API），是一些预先定义的函数。

目的：让应用程序开发人员得以调用一组例程功能，而无须考虑其底层的源代码为何、或理解其内部工作机制的细节。

图像多主体检测API：检测出图片中多个主体的坐标位置，并给出主体的分类标签和标签的置信度得分，共计16大类，可用于图片打标、裁剪出对应主体进行二次开发。其效果图如下。

2.2 注册账号并获取API Key

（1）注册百度智能云账号，进入官网首页，搜索图像主体检测，点击

（2）跳转后点击查看详情

（3）跳转后点击立即使用

（4）跳转后点击应用列表，接着点击创建应用，获取你的API Key 和 Secret Key

3．完整实验代码，测试结果

3.1 调用API

python 复制代码

import requests
import base64
import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont
import numpy as np
from translate import Translator
API_KEY = "你的API_KEY"
SECRET_KEY = "你的SECRET_KEY"

def get_access_token():
    """
    使用 AK，SK 生成鉴权签名（Access Token）
    :return: access_token，或是None(如果错误)
    """
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/multi_object_detect"
# 二进制方式打开图片文件
f = open(r'C:\Users\86185\1.jpg', 'rb')
img = base64.b64encode(f.read())
params = {"image":img}
access_token = get_access_token()
request_url = request_url + "?access_token=" + access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
    print (response.json())
    print(type(response.json()))

3.2框出主体部分，并标注标签和置信度