深度学习

思绪无限1 小时前
深度学习·yolo·目标检测·yolov12·yolo全家桶·钢材表面缺陷检测
YOLOv5至YOLOv12升级:钢材表面缺陷检测系统的设计与实现(完整代码+界面+数据集项目)摘要:钢材表面缺陷的稳定识别与快速定位是保障轧制质量、降低返工成本与实现产线智能化的重要环节。本篇博客围绕“YOLOv5 至 YOLOv12 升级:钢材表面缺陷检测系统的设计与实现”展开,给出从数据集构建到模型训练、再到桌面端部署的完整工程化方案,并提供可复现的完整代码、可交互界面与数据集项目。在算法层面,本文以 YOLO 系列为主线,系统梳理 YOLOv5→YOLOv12 的结构演化思路,并将其落到钢材表面缺陷检测这一高噪声、强纹理、类间差异小且尺度跨度大的场景中,通过统一训练设置对多代模型进行对比实验
_小雨林6 小时前
人工智能·深度学习
(UPDATING)LLM微调之实战,SFTTrainer官方案例、LoRA/QloRA微调案例、Unsloth、分布式训练、LLaMA FactoryAuto算力云上租一个4090,要选可扩容的,然后打开JupyterLab在上面操作。创建一个notebook
xiaotao1317 小时前
人工智能·深度学习·机器学习
03-深度学习基础:循环神经网络(RNN)选择指南:记住:
今日说"法"9 小时前
人工智能·深度学习
数值计算与浮点误差:深度学习中梯度崩溃的数学根源与归一化对策
LaughingZhu9 小时前
人工智能·经验分享·深度学习·神经网络·产品运营
Product Hunt 每日热榜 | 2026-04-21标语:具有上下文感知功能的Mac键盘,用于自动化工作流程和会议。介绍:Dune是一款智能上下文感知的键盘助手,专为Mac用户设计,紧挨你的键盘放置。当你在使用不同应用程序时,它的三个按键会实时改变功能。它特别适合那些在GitHub、VS Code、Claude和Openclaw等平台上工作的开发人员,以及经常参加Zoom、Teams和Google Meet会议的用户,甚至是运行AI助手的朋友们。
keineahnung234510 小时前
人工智能·pytorch·python·深度学习
PyTorch 張量尺寸為 1 時,步長為何不具語意?當張量中某個維度的尺寸為 1 時,步長實際上可以是任意值。我們直接用程式碼來驗證。首先中規中矩地使用 torch.arange 建立一個一維張量 x:
思绪无限10 小时前
深度学习·yolo·目标检测·日常场景下的人脸检测·yolov12·yolo全家桶
YOLOv5至YOLOv12升级:日常场景下的人脸检测系统的设计与实现(完整代码+界面+数据集项目)摘要:面向门禁考勤、相册整理与人机交互等应用中的日常场景人脸检测需求,本文给出一个从算法对比到桌面端落地的完整实现。系统以 YOLOv5–YOLOv12 为核心检测骨干,梳理各版本在骨干网络、特征金字塔、检测头与训练配置上的关键演进,并在自建与清洗的人脸数据集上进行统一训练与评测,给出 mAP、F1、速度、参数量及 PR/训练曲线等可复现实验结果。工程侧基于 Python 3.12 与 PySide6 构建可交互界面,通过 Qt 信号槽与多线程推理实现图片/视频/摄像头输入、Conf/IoU 动态调节、检
一休哥※11 小时前
深度学习·yolo·计算机视觉
YOLOv11改进系列 | 引入EMO ICCV2023的C3k2_iRMB模块,轻量注意力残差混合块增强C3k2,多尺度分割更稳更准专栏系列:YOLOv11 注意力/精度改进实战 改进点:将 YOLOv11-seg 中的 C3k2 替换为 C3k2_iRMB,引入 EMO 中的 iRMB 轻量注意力残差混合块,以窗口注意力、深度卷积局部建模和 SE 通道重标定联合增强特征表达能力,在较小参数与算力增幅下提升复杂背景、多尺度与实例边界场景下的分割表现。
小超同学你好11 小时前
人工智能·深度学习·transformer
Transformer 27. Vision Transformer(ViT):把图像当作「词序列」的编码器摘要:本文解读 Google Research 提出的 Vision Transformer(ViT)(Dosovitskiy et al., 2021):在不改动 Transformer 编码器主干的前提下,将图像切成固定大小的 Patch,经线性嵌入与 可学习位置编码 组成序列,配合 类别 Token(class token) 做图像分类。文中说明 ViT 与 CNN 在 归纳偏置 上的差异、为何依赖 大规模预训练、序列长度与 patch 尺寸 对算力的影响,并给出与张量形状、单层计算相对应的直觉与公
赋创小助手12 小时前
服务器·人工智能·科技·深度学习·自然语言处理
RTX PRO 6000 vs RTX 5090:从一组230B模型测试数据谈企业级推理选型随着大模型参数量持续攀升,AI 推理对硬件算力与能效的要求愈发严苛,消费级显卡已难以满足企业级、高负载的 AI 部署需求。NVIDIA 面向专业领域推出的 RTX Pro 6000 显卡,专为 AI 计算与专业图形工作流打造,其真实算力表现备受行业关注。 本次针对 230B参数 AI 模型的实测,正是为验证这款专业显卡的核心竞争力 —— 在顶级 AI 推理任务中,能否以更低功耗、更精简的硬件配置,达成多块旗舰消费级显卡的算力水平。本次测试结果不仅直观展现 RTX Pro 6000 的技术优势,也为专业 A
不才小强12 小时前
人工智能·深度学习
深度学习模型部署实战指南深度学习工程实践是一个系统性的过程,通常分为三个核心环节:数据准备是深度学习项目的基石,包括:使用深度学习框架搭建神经网络,进行模型训练:
思绪无限13 小时前
深度学习·yolo·目标检测·yolov12·yolo全家桶·车型识别与计数
YOLOv5至YOLOv12升级:车型识别与计数系统的设计与实现(完整代码+界面+数据集项目)摘要:面向道路监控、园区出入口与停车管理等应用场景,本文给出一套基于 YOLOv5–YOLOv12 的 车型识别与计数系统 的设计与实现,并以可复现工程为目标同步提供 完整代码、可运行界面与数据集项目。系统在检测层面完成车辆目标定位、车型细粒度分类与多目标计数,在交互层面采用 PySide6(Qt 信号槽) 构建桌面端 UI,支持图片、视频与摄像头多源输入,实时展示检测框、类别、置信度与 按车型/总量统计,并提供阈值(Conf/IoU)调节、结果可视化(含热力图等)与一键导出。为支撑跨代模型对比与工程落地
思绪无限13 小时前
深度学习·yolo·目标检测·田间杂草检测·yolov12·yolo全家桶
YOLOv5至YOLOv12升级:田间杂草检测系统的设计与实现(完整代码+界面+数据集项目)摘要:田间杂草的快速、稳定检测是精准除草与变量施药的关键环节,直接影响农药减量、作业效率与设备闭环控制的可靠性。围绕“复杂光照、遮挡混杂、尺度变化大与小目标密集”等真实田间场景难题,博主在本项目中构建了一套面向工程落地的田间杂草检测系统:以 YOLOv5 至 YOLOv12 为主线,统一训练与推理范式,对多代检测器在同一数据集上的精度与速度进行对比评估,并给出可复现实验配置。系统侧基于 Python 3.12 与 PySide6 完成桌面端可视化平台开发,支持图片/视频/摄像头多源输入,提供置信度与 Io
YOULANSHENGMENG13 小时前
人工智能·深度学习
深度学习的一些基础知识在全连接网络[1]中,一张图片上的所有像素点会被展开成一个1维向量输入网络,如 图1 所示,28 x 28的输入数据被展开成为784 x 1 的数据作为输入。
思绪无限13 小时前
人工智能·深度学习·yolo·目标检测·目标跟踪·yolov12·yolo全家桶
YOLOv5至YOLOv12升级:常见车型识别系统的设计与实现(完整代码+界面+数据集项目)摘要:面向交通监控、智慧停车与道路巡检等场景,构建高精度、可部署的常见车型识别系统具有重要工程价值。本文围绕“YOLOv5 至 YOLOv12”目标检测算法演进,系统性给出从数据集构建到模型训练、推理部署与桌面端交互的一体化实现方案,并提供可复现实验的完整代码与项目资源。系统以车辆图像为输入,能够稳定完成轿车、SUV、客车、货车等车型的定位与分类,同时支持在界面侧切换不同 YOLO 系列权重进行推理对比;界面采用 PySide6 开发,支持图片/文件夹/视频/摄像头多源检测,提供检测框与类别置信度可视化、
BFT白芙堂13 小时前
人工智能·深度学习·机器学习·机器人·ar·franka
基于 AR 阻抗可视化的 Franka Research3 机械臂遥操作设计与应用在非结构化、多接触交互场景中,机器人自主操作仍存在稳定性与适应性方面的局限,双臂协同的物体搬运、姿态调整等任务,需人类通过遥操作保障执行效果。低成本VR运动控制器虽具备6自由度跟踪能力,可实现直观的末端执行器运动控制,但缺少力反馈,操作人员难以感知阻抗控制生成的接触力,影响力控关键任务的完成质量。
jay神13 小时前
人工智能·深度学习·目标检测·计算机视觉·目标跟踪·毕业设计
鸟类识别数据集 - CUB_200CUB_200是基于经典细粒度鸟类识别基准数据集 CUB-200-2011(Caltech-UCSD Birds 200)转换而来的目标检测版本,标注格式为 YOLO 格式。数据集涵盖 200 种北美鸟类,按 8:1:1 比例划分为训练集、验证集和测试集三个子集。
逻辑驱动的ken14 小时前
java·开发语言·深度学习·求职招聘·春招
Java高频面试考点场景题10磁盘维度优化:采用顺序读写搭配操作系统页缓存,读写数据先存入页缓存再异步刷盘,消费者读取时命中页缓存可避免磁盘 IO;使用 sendfile 零拷贝技术,数据在内核态直接从磁盘传输到网卡,减少上下文切换与 CPU 拷贝。
大写的z先生15 小时前
深度学习·算法·语言模型
【深度学习 | 论文精读】这篇文章和之前读的那几篇尤其是MulMoSenT,在舆情分析的‘进化史’中处于一个互补且更进阶的位置,上一篇的MulMo是在教AI如何当好一个‘孟加拉语专家’,那么这篇就是在研究AI怎么成为一个‘语言通’--利用语系的规律,把英语中学到的情感分析本事,‘瞬移’到泰语、越南语等这些小语种上。
以梦为马无处可栖15 小时前
arm开发·笔记·深度学习
AxVisor 深度学习笔记-ARM 虚拟化硬件原理这是整个 AxVisor 的物理基础。不理解硬件机制,代码就只是一堆符号。下面用原理讲解 + AxVisor 代码对照的方式,把六大知识点全部讲透。