图像分类

Linux猿3 天前
人工智能·yolo·目标检测·图像分类·目标检测数据集·yolo目标检测·云朵照片数据集
云朵照片数据集,YOLO 目标检测 | 附数据集点击下载云朵照片数据集~1. 简介 该数据集含 961 张带标签的云摄影图像,按云类型分为 7 个类别,图像存储于对应类别子文件夹中;数据集存在类别不平衡问题,部分类别代表性不足。
EDPJ8 天前
目标检测·计算机视觉·架构·图像分割·图像分类
从 Grounding DINO 到 DINO-X:开放集目标检测的架构演进与细节拆解相关文章地址:Grounding DINO:https://arxiv.org/abs/2303.05499
阿钱真强道11 天前
人工智能·分类·图像分类·softmax·多层感知机
03 从 MLP 到 LeNet:一个分类模型,究竟是怎样做出判断的?很多人在接触分类模型时,最直观的理解往往是:输入一个样本,模型输出一个类别。 表面上看,这件事似乎很简单,但真正值得理解的问题是:
我就想睡到自然醒18 天前
图像处理·人工智能·计算机视觉·目标跟踪·图像分类
【论文翻译】CA注意力机制原文翻译 Coordinate Attention for Efficient Mobile Network Design最近关于移动网络设计的研究表明,通道注意力(例如 Squeeze-and-Excitation 注意力)在提升模型性能方面具有显著效果,但它们通常忽略了位置信息,而位置信息对于生成空间选择性注意力图非常重要。在本文中,我们提出了一种用于移动网络的新型注意力机制,通过将位置信息嵌入通道注意力中,我们称之为“坐标注意力”。与通过二维全局池化将特征张量转换为单一特征向量的通道注意力不同,坐标注意力将通道注意力分解为两个沿两个空间方向分别聚合特征的一维特征编码过程。通过这种方式,可以沿一个空间方向捕捉长程依赖,同
超级学长1 个月前
图像处理·人工智能·深度学习·图像分类
深度学习在图像处理领域的革命性应用:从原理到实践(深度学习程序开发)👨‍🎓 博主简介:博士研究生 🔬 超级学长:超级学长@实验室(提供各种深度学习程序开发、实验复现与论文指导) 📧 个人邮箱:easy_optics@126.com 💬 个人微信:easy_optics
简单光学1 个月前
图像分类·onn·d2nn·衍射光学神经网络·衍射神经网络
衍射深度神经网络(D²NN):基于光学衍射原理的图像分类系统本文深入分析了一个基于光学衍射原理的深度神经网络(Diffractive Deep Neural Network, D²NN)实现,该系统通过模拟光波在多层相位调制层中的衍射传播来完成CIFAR图像分类任务。与传统的电子神经网络不同,D²NN的核心计算过程可以在全光学系统中实现,具有低功耗、高速度的独特优势。本文将从物理原理、数学模型、代码实现、训练策略等多个维度进行详细分析,并给出实际运行结果。
All The Way North-3 个月前
pytorch·深度学习·cnn·图像分类·实战项目·cifar-10·gpu加速
PyTorch从零实现CIFAR-10图像分类:保姆级教程,涵盖数据加载、模型搭建、训练与预测全流程CIFAR-10 是一个广泛使用的图像识别数据集,由加拿大圭尔夫大学的Alex Krizhevsky、Ilya Sutskever和多伦多大学的Geoffrey Hinton整理。这个数据集被设计用于机器学习中的图像分类任务。
weixin_377634843 个月前
图像识别·图像分类
【开源-细粒度图像识别】SCAN快慢思考 无需微调标注即可分类AAAI2026开源细粒度图像识别工具《Endowing Vision-Language Models with System 2 Thinking for Fine-Grained Visual Recognition》,开源地址,论文介绍了一种不需要训练及标注,仅依靠大语言模型实现细粒度图像识别的方法,借鉴了人类的“快慢思考”流程,并实现了一种平衡快慢思考权重的动态方法,非常值得一读。
这张生成的图像能检测吗4 个月前
人工智能·深度学习·计算机视觉·图像分类·高光谱
(论文速读)基于YCrCb-MST高光谱重建的太阳镜片颜色分类系统论文题目:A color classification system for sunglass lenses based on YCrCb-MST hyperspectral reconstruction(基于YCrCb-MST高光谱重建的太阳镜片颜色分类系统)
算法打盹中6 个月前
图像处理·神经网络·计算机视觉·cnn·图像分类
计算机视觉:卷积神经网络(CNN)图像分类从像素与色彩通道基础到特征提取、池化及预测卷积神经网络通过滤波器(或称核)从图像中提取特征,再将这些特征传入神经网络进行预测或输出。在深入探讨卷积神经网络之前,我们先详细了解图像的工作原理。
小毕超6 个月前
图像分类·knn·dinov3
无需训练 DINOv3 + KNN 快速构建自监督图像分类模型DINOv3 是 Meta 2025年8月推出的视觉开源模型。核心优势在于通过大规模无监督预训练获得高度通用且语义丰富的图像表征能力。最大的亮点是 DINOv3 的骨干网络在完全冻结的情况下,仅通过添加轻量级任务头就能在多种任务上取得优异表现,无需微调即可直接应用。
DogDaoDao7 个月前
图像处理·人工智能·pytorch·python·深度学习·分类·图像分类
用PyTorch实现多类图像分类:从原理到实际操作图像分类作为计算机视觉的基石,已深度渗透到我们生活的方方面面——从医疗影像中早期肿瘤的识别、自动驾驶汽车对道路元素的实时检测,到卫星图像的地形分析与零售行业的商品识别,其核心都是让机器学会"看懂"世界并做出分类决策[1][2]。在这些应用背后,技术正经历着深刻变革:2025年,Vision Transformer(ViT)凭借其灵活的图像处理方式和强迁移学习能力,已逐步取代部分传统CNN架构,尤其在少样本学习场景中展现出显著优势[3][4]。与此同时,硬件算力的跃升与框架优化技术(如PyTorch 2.x
这张生成的图像能检测吗8 个月前
人工智能·计算机视觉·图像分类·clip
(论文速读)Logits DeConfusion-CLIP少样本学习论文题目:Logits DeConfusion with CLIP for Few-Shot Learning(Logits反融合与CLIP在少样本学习中的应用)
MWHLS10 个月前
人工智能·论文·图像分类·语义分割·reid
[AAAI Oral] 简单通用的公平分类方法文章首发于我的博客:https://mwhls.top/5032.html
知舟不叙10 个月前
深度学习·分类·cnn·卷积神经网络·图像分类·模型保存
深度学习——基于卷积神经网络实现食物图像分类【3】(保存最优模型)本文将详细介绍如何使用PyTorch框架构建一个完整的食物图像分类系统,包含数据预处理、模型构建、训练优化以及模型保存等关键环节。与上一篇博客介绍的版本相比,本版本增加了模型保存与加载功能,并优化了测试评估流程。
羞儿10 个月前
深度学习·图像分类·开放集识别问题·原型学习
【读点论文】A Survey on Open-Set Image Recognition归纳式方法(Inductive Methods),无需测试集参与训练,是 OSR 的主流方案,分为三类:
QBoson10 个月前
人工智能·神经网络·量子计算·图像分类·特征选择·“五岳杯”量子计算挑战赛·相干光量子计算机
量子计算+AI:特征选择与神经网络优化创新应用在由玻色量子协办的第二届APMCM“五岳杯”量子计算挑战赛中,来自北京理工大学的Q-Masterminds团队摘取了银奖。该团队由北京理工大学张玉利教授指导,依托玻色量子550计算量子比特的相干光量子计算机,将量子计算技术集成到特征选择和神经网络剪枝中,在提升人工智能领域的两大经典问题:特征选择和图像分类的模型性能和效率上体现了巨大的潜力,为解决复杂人工智能问题提供了新的方向。
Code_流苏1 年前
python·cnn·数据增强·图像分类·alexnet·lenet-5·vgg
《Python星球日记》 第54天:卷积神经网络进阶名人说:路漫漫其修远兮,吾将上下而求索。—— 屈原《离骚》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
CAE3201 年前
python·深度学习·机器学习·分类·图像分类
基于Python深度学习的鲨鱼识别分类系统摘要:鲨鱼是海洋环境健康的指标,但受到过度捕捞和数据缺乏的挑战。传统的观察方法成本高昂且难以收集数据,特别是对于具有较大活动范围的物种。论文讨论了如何利用基于媒体的远程监测方法,结合机器学习和自动化技术,来填补鲨鱼种群评估中的信息空白。提出了一个包含53,345张鲨鱼图片的数据库,覆盖了219种鲨鱼,并开发了一个名为“Shark Detector”的软件包,利用PyQt5设计了简约的系统UI界面,使用迁移学习和卷积神经网络(CNN)来自动识别和快速分类鲨鱼种类。
一面千人1 年前
pytorch·深度学习·cnn·图像分类·模型优化·cifar-10·调试经验·前沿趋势
从零开始:基于 PyTorch 的图像分类模型摘要:本文详细记录了使用 PyTorch 从零搭建一个图像分类模型的过程,涵盖卷积神经网络(CNN)、数据预处理、模型设计、训练调试与优化。通过对 CIFAR-10 数据集的处理实践,结合经典文献和 2025 年最新研究趋势,深入探讨了技术细节,并辅以完整实践源码的过程和结论。我选择用 PyTorch 搭建图像分类模型,既源于对深度学习的兴趣,也因为它在 2025 年的技术社区中热度不减。通过这次实践,我希望掌握 CNN 的核心原理,同时记录过程,为其他初学者提供参考。