AIGC: 如何让AI帮我们识别图片上的物品?

前言

今天我们来聊聊,如何用AI帮助我们识别图片上的物品。感兴趣的小伙伴们可以关注我,以后会带着大家了解更多有关ai的知识,与大家一起进步!

在开始讲解之前,我们需要进行一些准备工作

准备工作

准备工作

通过 Google Colab,用户可以创建和共享Jupyter笔记本,运行Python代码,访问云端计算资源,以及使用大量开源机器学习框架和库,而无需担心硬件或软件配置问题。而我们这里需要一点点的python 和 openai结合,当我们使用Google Colab 运行python时,可以不用担心配置环境。

注意,以上这些网站均为外网,当我们访问这些网站时,需要 "搭梯子",具体可以去网上看看教程

  1. 首先进入openai网站,拿到我们的sdk。教程如下:

选择VPI

复制我们的API keys, 如果没有的话点击Create new secret key,这样我们就可以拿到我们的sdk了。

  1. 接下来我们进入Google Colab网站,将代码放进此网站运行。这个网站十分的方便,当我们使用Google Colab 运行python时,可以不用担心配置环境。

点击文件-> 新建笔记本 点击左上角 +代码

输入!pip install transformers,Python中使用pip工具安装Hugging Face的Transformers库

当左下角出现Successfully时,说明安装成功

输入:

python 复制代码
from transformers.pipelines import SUPPORTED_TASKS

print(SUPPORTED_TASKS)

在Hugging Face的Transformers库中,SUPPORTED_TASKS是一个包含当前库支持的各种NLP(自然语言处理)任务的列表。这个列表包括可以使用Transformers库进行处理的不同NLP任务,例如文本分类、命名实体识别、问答等。

通过检查SUPPORTED_TASKS,你可以获得当前Transformers库版本中支持的任务的清单。这对于了解库的功能和可用性非常有用,特别是当我们计划使用库中的工具来处理特定类型的NLP任务时。

这将输出一个包含不同任务名称的列表,每个任务名称代表Transformers库支持的一个NLP任务。你可以根据需要选择适合你项目的任务,并使用相应的工具和模型。

输入:for k, v in SUPPORTED_TASKS.items(): print(k),我们可以看到支持的各种任务:

而我们的物品侦察也在其中

python 复制代码
import requests # python的http 请求库
from PIL import Image # PIL python 图片专业库

url = "https://unsplash.com/photos/oj0zeY2Ltk4/download?ixid=MnwxMjA3fDB8MXxzZWFyY2h8MTR8fHBpY25pY3xlbnwwfHx8fDE2Nzc0OTE1NDk&force=true&w=640"
# requests.get python 同步语言
img = Image.open(requests.get(url, stream=True).raw)
img

从指定的URL获取图像数据,然后使用PIL库打开该图像。

运行:

输入候选对象:

python 复制代码
from PIL import ImageDraw # 写模块
draw = ImageDraw.Draw(img)

for prediction in predictions:
  box = prediction["box"]
  label = prediction["label"]
  score = prediction["score"]
  xmin, ymin, xmax, ymax = box.values() # 解构
  draw.rectangle((xmin, ymin, xmax, ymax),outline="red",width=1)
  draw.text((xmin,ymin),f"{label}: {round(score, 2)}", fill="red")

img

这段代码使用了 PIL 库中的 ImageDraw 模块,在图像上绘制了目标检测模型的预测结果。代码遍历了模型的每个预测,为每个检测到的对象绘制了带有标签和置信度的红色边框。最后,显示了带有标注的图像

我们来看看效果:

今天的内容就到这啦,如果你觉得小编写的还不错的话,或者对你有所启发,请给小编一个辛苦的赞吧

相关推荐
诚威_lol_中大努力中18 分钟前
关于VQ-GAN利用滑动窗口生成 高清图像
人工智能·神经网络·生成对抗网络
Q_192849990627 分钟前
基于Spring Boot的个人健康管理系统
java·spring boot·后端
liutaiyi828 分钟前
Redis可视化工具 RDM mac安装使用
redis·后端·macos
Q_192849990634 分钟前
基于Springcloud的智能社区服务系统
后端·spring·spring cloud
xiaocaibao77737 分钟前
Java语言的网络编程
开发语言·后端·golang
中关村科金39 分钟前
中关村科金智能客服机器人如何解决客户个性化需求与标准化服务之间的矛盾?
人工智能·机器人·在线客服·智能客服机器人·中关村科金
逸_42 分钟前
Product Hunt 今日热榜 | 2024-12-25
人工智能
Luke Ewin1 小时前
基于3D-Speaker进行区分说话人项目搭建过程报错记录 | 通话录音说话人区分以及语音识别 | 声纹识别以及语音识别 | pyannote-audio
人工智能·语音识别·声纹识别·通话录音区分说话人
DashVector1 小时前
如何通过HTTP API检索Doc
数据库·人工智能·http·阿里云·数据库开发·向量检索
说私域1 小时前
无人零售及开源 AI 智能名片 S2B2C 商城小程序的深度剖析
人工智能·小程序·零售