十分钟带你复现YOLOv8

YOLO 是 Joseph Redmon 等人于 2015 年提出的基于单个神经网络的目标检测算法。YOLO 的全称是 You Only Look Once,正是其自身特点的高度概括。

YOLOv8 是 Ultralytics 在 2023 年初推出的一个重大更新版本,建立在以前 YOLO 版本成功的基础上,基于深度学习和计算机视觉的前沿进展,采用最先进的 SOTA 模型,引入了新的功能和改进,进一步提升了目标检测的性能和灵活性,提供了无与伦比的速度和准确性。

YOLOv8 的精简设计使其适用于各种应用,并且可以轻松适应不同的硬件平台,从边缘设备到云 API,使其成为各种物体检测与跟踪、实例分割、图像分类和姿态估计任务的绝佳选择。

YOLOv8 共有 5 个不同大小的预训练模型,由小到大分别是 n、s、m、l 和 x,模型越大其检测效果越好,但模型越大参数量越大、运行速度越慢,训练时需要消耗的资源也越多。

复现环境

  • 操作系统:Windows11
  • 软件工具:PyCharm2023 + Anaconda3

参考来源

前期准备

  • 从开源仓库下载源码:
  • 下载最小模型的预训练权重文件:
  • 将权重文件直接放在 ultralytics 仓库下即可:

配置环境

  • 打开 Anaconda Prompt,创建一个新环境,官方要求 Python 版本要大于 3.8:
shell 复制代码
conda create -n env_yolov8 python==3.9
  • 提示要下载一些包,输入 y 继续:
  • 等待包下载完毕,环境创建完成:
  • 激活新创建的环境:
shell 复制代码
conda activate env_yolov8
  • 输入 nvidia-smi 查看 GPU 支持的最高 CUDA 版本:
  • 下载 Pytorch,打开官网:pytorch.org/
  • CUDA 版本选择 12.1,复制下载命令:
  • 粘贴到 Anaconda Prompt 运行下载命令:
  • 等待下载完成,下载时间略长:
  • 用 PyCharm 打开 YOLOv8 源码:
  • 点击右下角 Python 解释器-->添加新的解释器-->添加本地解释器:
  • 切换到我们新创建的环境:
  • 打开 Pycharm 终端:
  • 输入命令下载 ultralytics 包:

    pip install ultralytics

  • 如果下载速度较慢,可换用清华源下载:
arduino 复制代码
pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple/
  • 等待下载完成:

复现功能

  • 复现目标检测功能,直接在终端运行命令:
shell 复制代码
yolo predict model=yolov8n.pt source=./ultralytics/assets/bus.jpg
  • 运行结果在 run 文件夹 detect 里:
  • 复现实例分割功能,直接在终端运行命令:
shell 复制代码
yolo predict model=yolov8n-seg.pt source=./ultralytics/assets/bus.jpg
  • 运行结果在 run 文件夹 segment 里:
  • 复现姿态检测功能,直接在终端运行命令:
shell 复制代码
yolo predict model=yolov8n-pose.pt source=./ultralytics/assets/bus.jpg
  • 运行结果在 run 文件夹 pose 里:

模型训练

  • 未完待续......

更多内容

相关推荐
qq_4162764218 分钟前
LOFAR物理频谱特征提取及实现
人工智能
余俊晖1 小时前
如何构造一个文档解析的多模态大模型?MinerU2.5架构、数据、训练方法
人工智能·文档解析
Akamai中国2 小时前
Linebreak赋能实时化企业转型:专业系统集成商携手Akamai以实时智能革新企业运营
人工智能·云计算·云服务
LiJieNiub3 小时前
读懂目标检测:从基础概念到主流算法
人工智能·计算机视觉·目标跟踪
weixin_519535774 小时前
从ChatGPT到新质生产力:一份数据驱动的AI研究方向指南
人工智能·深度学习·机器学习·ai·chatgpt·数据分析·aigc
爱喝白开水a4 小时前
LangChain 基础系列之 Prompt 工程详解:从设计原理到实战模板_langchain prompt
开发语言·数据库·人工智能·python·langchain·prompt·知识图谱
takashi_void4 小时前
如何在本地部署大语言模型(Windows,Mac,Linux)三系统教程
linux·人工智能·windows·macos·语言模型·nlp
OpenCSG4 小时前
【活动预告】2025斗拱开发者大会,共探支付与AI未来
人工智能·ai·开源·大模型·支付安全
生命是有光的4 小时前
【深度学习】神经网络基础
人工智能·深度学习·神经网络
数字供应链安全产品选型4 小时前
国家级!悬镜安全入选两项“网络安全国家标准应用实践案例”
人工智能·安全·web安全