计算机视觉

DB!!!2 小时前
图像处理·人工智能·深度学习·计算机视觉·目标跟踪
【综述】视频目标分割VOS这篇文章提出了一种名为“Associating Objects with Transformers (AOT)”的新方法,用于解决半监督视频目标分割(VOS)任务中的多目标场景问题。AOT通过将多个目标统一嵌入到同一个高维嵌入空间中,实现了多目标的匹配和解码,显著提高了效率,并在多个基准测试中取得了优异的性能。
羽凌寒3 小时前
图像处理·人工智能·计算机视觉
图像锐化调整之前找多尺度做对比度增强时候,发现了一些锐化相关算法,正好本来也要整理锐化,这里就直接顺手对之前做过的锐化大概整理了下,方便后续用的时候直接抓了。
Ro小陌3 小时前
计算机视觉·视觉检测·相机
工业视觉相机选型指南:从参数到品牌对比在工业视觉系统中,相机是核心传感器,其选型直接影响成像质量、检测精度和系统稳定性。本文从关键参数、主流品牌特性、应用场景适配及选型步骤四个维度,深度解析视觉工程师如何选择工业相机。
Maya动画技术3 小时前
前端·python·计算机视觉·视觉检测
ollama调用千问2.5-vl视频图片UI界面小程序分享ollama调用千问2.5-vl视频图片内容,通常用命令行工具不方便,于是做了一个python UI界面与大家分享。需要提前安装ollama,并下载千问qwen2.5vl:7b 模型,在ollama官网即可下载。 (8G-6G 显卡可用),用于识别图片信息。之前还下载了 qwen3:8b版,发现也可以此程序调用,比图片识别更快,用qwen3:8b文字直接提问,随便输入张图片即可。图片不起作用。 不知为何qwen2.5vl:7b 默认只支持cpu预处理图片,所以,图片推理的过程非常慢。qwen3:8b 默认
我是你们的星光11 小时前
人工智能·深度学习·计算机视觉·3d
基于深度学习的高效图像失真校正框架总结原文链接目录基于深度学习的高效图像失真校正框架总结1. 研究背景与问题2. 方法概述:两阶段校正框架3. 实验与性能
知舟不叙14 小时前
人工智能·opencv·计算机视觉·人脸微笑检测
基于OpenCV的人脸微笑检测实现在计算机视觉领域,人脸检测和表情识别一直是热门的研究方向。今天我将分享一个使用Python和OpenCV实现的实时人脸微笑检测系统。这个系统能够通过摄像头捕捉视频流,实时检测人脸并识别微笑表情,非常适合初学者学习计算机视觉的基础应用。
何仙鸟16 小时前
深度学习·计算机视觉·cnn
图像分割(2)u-net代码实战——基于视网膜分割整体是一个U型的结构,左边是特征提取层,第一个是做了一个两层的卷积,蓝色箭头就是做了一个3*3的卷积,图中的图像大小会变小,但是本文代码会加入padding,避免图像大小的变化;两层卷积之后进行一个下采样,这里使用最大值池化,每次大小减小一倍;到了最下面,通过卷积变成1024的通道数;到右边进行上采样,注意,这里只取1024通道里面的一半,然后和上一层中的512进行拼接,图中灰色的箭头是裁剪,但是经过padding之后就不需要此步骤。然后一直到右上方,图中通道数是2,实际实践中可以是3,4,5,根据任务来
硅谷秋水16 小时前
深度学习·计算机视觉·语言模型·机器人
视觉-和-语言导航的综述:任务、方法和未来方向22年6月来自UC Santa Cruz、澳大利亚的阿德莱德大学和 USC 的论文“Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions”。
妄想成为master18 小时前
人工智能·深度学习·计算机视觉
深度学习详细入门路线----以本人亲身实践得出大家好 相信有很多人现在正面临着大三考研 保研 不知道面试的时候如何和老师沟通的问题 亦或者 你可能是研0或者研一 导师交给你一个深度学习的项目 而你却从来没接触过 不知道该如何入门 本文将以一个初学者的角度分析如何入门深度学习 同时也是对三个月以来 学习路线的梳理 首先 认识深度学习 我不知道有多少人是被这个名字吸引过来的 反正我是 深度学习 听着是不是就比电机 嵌入式什么的高级一些呢 哈哈哈 言归正传 所谓深度学习 不过是神经网络的层数更多了 更深 所以在训练深度神经网络的过程 就叫做深度学习 没错
白熊18819 小时前
人工智能·计算机视觉·文生图
【图像大模型】FLUX.1-dev:深度解析与实战指南在人工智能领域,图像生成技术一直是研究的热点之一。FLUX.1-dev 是由 Black Forest Labs 开发的一款开源的 120 亿参数的图像生成模型,它能够根据文本描述生成高质量的图像。本文将从算法工程师的角度,深入探讨 FLUX.1-dev 的技术细节、实现方式以及实战中的运行和问题解决方法。
fouen21 小时前
人工智能·算法·机器学习·计算机视觉
【语义分割专栏】先导篇:评价指标(PA,CPA,IoU,mIoU,FWIoU,F1)本篇向大家介绍下语义分割任务中的常用的评价指标。该怎么评价语义分割模型的优劣以及好坏呢?以下就是些常用的评价指标。本篇文章收录于语义分割专栏,如果对语义分割领域感兴趣的,可以去看看专栏,会对经典的模型以及代码进行详细的讲解哦!其中会包含可复现的代码!
AI technophile1 天前
opencv·算法·计算机视觉
OpenCV计算机视觉实战(6)——经典计算机视觉算法计算机视觉是一个多学科交叉领域,目标是使机器能够理解和解释来自图像和视频的视觉信息。本节中,将介绍计算机视觉中使用的基础经典算法,即使是在深度学习技术的出现之后,这些算法仍然具有重要意义,为图像分析、特征提取、分割、运动估计和目标检测奠定了基础。
鸢想睡觉1 天前
人工智能·opencv·计算机视觉
【OpenCV基础2】图像运算、水印、加密、摄像头目录一、图像运算1、利用“+”2、cv2.add()3、掩膜异或二、摄像头1、读取、视频流保存2、人脸识别
kyle~1 天前
人工智能·深度学习·计算机视觉
计算机视觉---目标追踪(Object Tracking)概览目标追踪是计算机视觉的核心任务,从单目标的精准定位到多目标的全局关联,技术路线涵盖传统算法到深度学习,应用场景渗透安防、交通、机器人等领域。未来发展将聚焦于鲁棒性、实时性、多模态融合,以及与3D视觉、大模型的结合,推动从“追踪目标”到“理解目标行为”的跨越。
__Benco1 天前
人工智能·驱动开发·计算机视觉·harmonyos
OpenHarmony外设驱动使用 (四),Face_auth人脸识别功能是端侧设备不可或缺的一部分,为设备提供一种用户认证能力,可应用于设备解锁、支付、应用登录等身份认证场景。它是基于人的脸部特征信息进行身份识别的一种生物特征识别技术,用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别,通常也叫做人像识别、面部识别、人脸认证。人脸识别功能整体框架如图1。
点云SLAM1 天前
计算机视觉·slam·点云配准·点云数据处理·pcl点云库·点云分割·点云识别
PCL点云库点云数据处理入门系列教材目录(2025年5月更新....)
jndingxin1 天前
opencv·计算机视觉·矩阵
OpenCV CUDA 模块中的矩阵算术运算-----在频域(复数频谱)中执行逐元素乘法并缩放的函数mulAndScaleSpectrums()mulAndScaleSpectrums()是OpenCV CUDA模块中用于在频域(复数频谱)中执行逐元素乘法并缩放 的函数。
小袁拒绝摆烂1 天前
人工智能·opencv·计算机视觉
OpenCV-去噪效果和评估指标方法opencv常见噪音类型有高斯噪音:高斯噪音是一种随机噪音,其数值服从正态分布。图像受到高斯噪音的影响时,像素值的变化类似于白噪音,但是噪音的强度会随像素值的变化而变化。
小袁拒绝摆烂1 天前
python·opencv·计算机视觉
OpenCV-python灰度变化和直方图修正类型该段代码旨在读取名为"test.png"的图像,并将其转换为灰度图像。使用加权平均值法将原始图像的RGB值转换为灰度值。
2201_754918411 天前
人工智能·opencv·计算机视觉
OpenCV 特征检测全面解析与实战应用在计算机视觉领域,特征检测是从图像中提取关键信息的核心技术,这些关键特征是图像匹配、目标识别、场景理解等复杂任务的基础。OpenCV 作为计算机视觉领域最受欢迎的开源库之一,提供了丰富且高效的特征检测算法。本文将深入介绍 OpenCV 中多种经典的特征检测算法,结合代码示例和实际应用场景,帮助读者全面掌握 OpenCV 特征检测技术。