AIGC: 如何让AI帮我们识别图片上的物品?

前言

今天我们来聊聊,如何用AI帮助我们识别图片上的物品。感兴趣的小伙伴们可以关注我,以后会带着大家了解更多有关ai的知识,与大家一起进步!

在开始讲解之前,我们需要进行一些准备工作

准备工作

准备工作

通过 Google Colab,用户可以创建和共享Jupyter笔记本,运行Python代码,访问云端计算资源,以及使用大量开源机器学习框架和库,而无需担心硬件或软件配置问题。而我们这里需要一点点的python 和 openai结合,当我们使用Google Colab 运行python时,可以不用担心配置环境。

注意,以上这些网站均为外网,当我们访问这些网站时,需要 "搭梯子",具体可以去网上看看教程

  1. 首先进入openai网站,拿到我们的sdk。教程如下:

选择VPI

复制我们的API keys, 如果没有的话点击Create new secret key,这样我们就可以拿到我们的sdk了。

  1. 接下来我们进入Google Colab网站,将代码放进此网站运行。这个网站十分的方便,当我们使用Google Colab 运行python时,可以不用担心配置环境。

点击文件-> 新建笔记本 点击左上角 +代码

输入!pip install transformers,Python中使用pip工具安装Hugging Face的Transformers库

当左下角出现Successfully时,说明安装成功

输入:

python 复制代码
from transformers.pipelines import SUPPORTED_TASKS

print(SUPPORTED_TASKS)

在Hugging Face的Transformers库中,SUPPORTED_TASKS是一个包含当前库支持的各种NLP(自然语言处理)任务的列表。这个列表包括可以使用Transformers库进行处理的不同NLP任务,例如文本分类、命名实体识别、问答等。

通过检查SUPPORTED_TASKS,你可以获得当前Transformers库版本中支持的任务的清单。这对于了解库的功能和可用性非常有用,特别是当我们计划使用库中的工具来处理特定类型的NLP任务时。

这将输出一个包含不同任务名称的列表,每个任务名称代表Transformers库支持的一个NLP任务。你可以根据需要选择适合你项目的任务,并使用相应的工具和模型。

输入:for k, v in SUPPORTED_TASKS.items(): print(k),我们可以看到支持的各种任务:

而我们的物品侦察也在其中

python 复制代码
import requests # python的http 请求库
from PIL import Image # PIL python 图片专业库

url = "https://unsplash.com/photos/oj0zeY2Ltk4/download?ixid=MnwxMjA3fDB8MXxzZWFyY2h8MTR8fHBpY25pY3xlbnwwfHx8fDE2Nzc0OTE1NDk&force=true&w=640"
# requests.get python 同步语言
img = Image.open(requests.get(url, stream=True).raw)
img

从指定的URL获取图像数据,然后使用PIL库打开该图像。

运行:

输入候选对象:

python 复制代码
from PIL import ImageDraw # 写模块
draw = ImageDraw.Draw(img)

for prediction in predictions:
  box = prediction["box"]
  label = prediction["label"]
  score = prediction["score"]
  xmin, ymin, xmax, ymax = box.values() # 解构
  draw.rectangle((xmin, ymin, xmax, ymax),outline="red",width=1)
  draw.text((xmin,ymin),f"{label}: {round(score, 2)}", fill="red")

img

这段代码使用了 PIL 库中的 ImageDraw 模块,在图像上绘制了目标检测模型的预测结果。代码遍历了模型的每个预测,为每个检测到的对象绘制了带有标签和置信度的红色边框。最后,显示了带有标注的图像

我们来看看效果:

今天的内容就到这啦,如果你觉得小编写的还不错的话,或者对你有所启发,请给小编一个辛苦的赞吧

相关推荐
用户83580861879113 分钟前
撮合引擎 OrderBook 的 100ns 之路:无锁 RingBuffer + 伪共享消除,Go 1.22 下单 op 11ns
后端
用户8818630013617 分钟前
用Node.js写一个简单的API请求日志中间件
后端
只是没名字18 分钟前
Codex CLI Windows 新手安装教程:从 Node.js 到首次运行
人工智能
用户86306526961320 分钟前
Krea 2 LoRA 训练全流程踩坑记录:从打标到双卡并行的 Windows 原生实战
人工智能
用户83580861879123 分钟前
Go 高并发下的“内存刺客“:自研 Size-Class 无锁对象池,把 sync.Pool 的 P99 从 128μs 压到 41μs
后端
货拉拉技术29 分钟前
资损下降 99.96% 的背后— AI 资损防控平台实战
后端
木雷坞2 小时前
让 AI 编程助手跑得起项目:Dev Container 实践记录
人工智能
山水洛行2 小时前
AI Agent 智能体记忆:从检索到被治理的数据系统
后端
卷无止境3 小时前
C++20 的概念与约束:让模板编程终于"说人话"
后端
Ai拆代码的曹操3 小时前
一次排查三种连接泄漏模式,再也不怕 HikariCP 连接池爆满了
后端