计算机视觉

CoovallyAIHub3 天前
深度学习·算法·计算机视觉
中科大DSAI Lab团队多篇论文入选ICCV 2025,推动三维视觉与泛化感知技术突破近日,计算机视觉顶级会议ICCV 2025论文录用结果公布。本次会议共收到11239篇有效投稿,最终录用2699篇,录用率为24%。中国科学技术大学DSAI Lab团队共有8篇论文被接收,研究成果覆盖三维场景理解、点云处理、恶劣环境感知、跨模态配准等多个前沿方向,展现了团队在泛化场景感知技术方面的深厚积累。
CoovallyAIHub4 天前
深度学习·算法·计算机视觉
港大&字节重磅发布DanceGRPO:突破视觉生成RLHF瓶颈,多项任务性能提升超180%!近日,香港大学与字节跳动联合推出了一项名为DanceGRPO的创新技术,该技术首次将Group Relative Policy Optimization(GRPO)成功应用于多类视觉生成任务,解决了基于强化学习的视觉生成方法在多样化Prompt集上的不稳定性问题。
CoovallyAIHub4 天前
深度学习·算法·计算机视觉
英伟达ViPE重磅发布!解决3D感知难题,SLAM+深度学习完美融合(附带数据集下载地址)近日,英伟达与多伦多大学、向量研究所及德克萨斯大学奥斯汀分校的研究团队联合发布了一项名为ViPE(视频姿势引擎) 的突破性技术。
xiaohouzi1122336 天前
人工智能·opencv·计算机视觉
OpenCV的cv2.VideoCapture如何加GStreamer后端在 OpenCV 里,“后端”通常指Video I/O(VideoCapture、VideoWriter)或 GUI(HighGUI)真正依赖的底层实现,而不是说整个 OpenCV 库本身有一个统一的“后端”。换句话说,OpenCV 把“怎么读摄像头/视频文件/网络流”以及“怎么把图像显示到窗口”抽象成统一的 API,但底层到底用 FFmpeg、GStreamer、V4L2、DirectShow、MSMF、AVFoundation 还是 Qt、GTK、Win32,就由“后端”决定。
小关会打代码6 天前
人工智能·计算机视觉
计算机视觉案例分享之答题卡识别目录一、基本流程二、代码实现1. 导入工具包和定义常量2. 辅助函数定义2.1 坐标点排序函数2.2 透视变换函数
天天进步20156 天前
人工智能·计算机视觉
用Python打造专业级老照片修复工具:让时光倒流的数字魔法在这个数字化时代,我们手中珍藏着许多泛黄、模糊、甚至有划痕的老照片。这些照片承载着珍贵的回忆,但时间的侵蚀让它们失去了往日的光彩。今天,我将带您一起用Python开发一个专业级的老照片修复工具,让这些珍贵的记忆重现光彩。
荼蘼6 天前
人工智能·opencv·计算机视觉
答题卡识别改分项目目录核心思路分步实现与代码解析1. 环境准备与工具函数定义2. 图片预处理3. 轮廓提取与筛选3. 轮廓提取与筛选
IT古董6 天前
人工智能·计算机视觉·cnn
【第五章:计算机视觉-项目实战之图像分类实战】1.经典卷积神经网络模型Backbone与图像-(4)经典卷积神经网络ResNet的架构讲解在 VGGNet 之后,卷积神经网络虽然加深了层数(达到 19 层以上),但也带来了 梯度消失与梯度爆炸 的问题,导致训练困难,效果甚至出现退化。 微软研究院在 2015 年提出了 ResNet(Residual Network),其核心贡献是引入了 残差学习机制(Residual Learning),大幅缓解了深层网络训练中的梯度问题。
张子夜 iiii6 天前
人工智能·python·opencv·计算机视觉
4步OpenCV-----扫秒身份证号这段代码用 OpenCV 做了一份“数字模板字典”,然后在银行卡/身份证照片里自动找到身份证号那一行,把每个数字切出来跟模板比对,最终输出并高亮显示出完整的身份证号码,下面是代码解释:
paid槮6 天前
图像处理·opencv·计算机视觉
机器视觉之图像处理篇图像平滑处理包含:1 均值滤波 2 方框滤波 3 高斯滤波 4 中值滤波 5 双边滤波均值滤波(Mean filtering):是指用当前像素点周围nxn个像素值的均值来代替当前像素值。边界点的处理可以扩展当前图像的周围像素点padding
通街市密人有6 天前
人工智能·深度学习·计算机视觉
IDF: Iterative Dynamic Filtering Networks for Generalizable Image Denoising论文链接:https://arxiv.org/abs/2508.19649项目链接:https://dongjinkim9.github.io/projects/idf/
sali-tec6 天前
开发语言·图像处理·算法·计算机视觉·c#
C# 基于halcon的视觉工作流-章34-环状测量C# 基于halcon的视觉工作流-章34-环状测量本章目标: 一、圆形ROI提取待测量的圆形图像; 二、gen_measure_arc 准备提取垂直于圆弧的直边; 三、measure_pos 提取垂直于矩形或环形弧的直线边缘; 四、measure_pairs提取垂直于矩形或环形弧长轴的直边对; 五、匹配批量计算; 一、用圆形ROI提取待测量的圆形图像 该部分为截图图像中待测量的局部图像,自动计算齿长中心圆,用到多种基础算子,由于基础算子在前些章中已提及,本章不一 一列出,仅描述实现思路。 1创建圆形RO
小王爱学人工智能6 天前
人工智能·opencv·计算机视觉
OpenCV一些进阶操作代码实现:代码是有关于图像直方图的计算、绘制以及直方图均衡化(增强图像对比度)展开,使用了 OpenCV(cv2)进行图像处理,Matplotlib 进行可视化等操作。以下是分步骤解析:
猫天意6 天前
人工智能·深度学习·目标检测·计算机视觉·cv
【目标检测】metrice_curve和loss_curve对比图可视化代码如下:可视化结果展示
山烛6 天前
人工智能·opencv·计算机视觉·图像透视变换
OpenCV:图像透视变换透视变换(Perspective Transformation),也叫投影变换,是一种将图像从一个二维坐标系映射到另一个三维坐标系的非线性变换。简单来说,它能模拟人眼视角的变化,把倾斜拍摄的“斜视图”转换成正面拍摄的“正视图”。
这张生成的图像能检测吗6 天前
人工智能·计算机视觉·语言模型·自然语言处理·视觉语言模型
(综述)视觉任务的视觉语言模型论文题目:Vision-Language Models for Vision Tasks: A Survey(视觉任务的视觉语言模型:综述)
星期天要睡觉7 天前
人工智能·opencv·计算机视觉
计算机视觉(opencv)实战二十一——基于 SIFT 和 FLANN 的指纹图像匹配与认证指纹识别是生物特征识别中的经典应用,其核心任务是从指纹图像中提取稳定的特征点,并将这些特征与模板指纹进行匹配,从而判断两幅指纹是否属于同一人。本文使用 SIFT 特征点检测 和 FLANN 匹配器 实现简单的指纹认证,并逐行解析代码。
星期天要睡觉7 天前
人工智能·opencv·计算机视觉
计算机视觉(opencv)实战十七——图像直方图均衡化图像处理领域中,直方图是一种非常重要的工具,它能够反映一幅图像中像素灰度分布的整体情况。而直方图均衡化则是一种常用的图像增强技术,可以有效改善图像的对比度,使暗部更亮、亮部更亮,从而让细节更加清晰。
赴3357 天前
人工智能·python·计算机视觉
图像拼接案例,抠图案例目录一.图像拼接案例1.图像拼接项目介绍2.核心步骤①计算图片特征点及描述符②匹配特征点,使用暴力匹配器
Monkey的自我迭代7 天前
人工智能·opencv·计算机视觉
SIFT特征匹配实战:KNN算法实现指纹认证这个利用了前面学到的SIFT特征检测来实现的,然后这里主要就是引入了一个新的匹配器。这里匹配是用KNN算法进行匹配的。下面来看下细节。