技术栈
计算机视觉
深度学习lover
18 分钟前
人工智能
·
python
·
yolo
·
目标检测
·
计算机视觉
·
扑克牌识别
<数据集>yolo扑克牌识别<目标检测>
数据集格式:VOC+YOLO格式图片数量:20000张标注数量(xml文件个数):20000标注数量(txt文件个数):20000
paper_reader
41 分钟前
深度学习
·
计算机视觉
·
ai
·
世界模型
世界模型的三个进化方向:从 AAA 游戏到第一人称闭环
2301_76444133
2 小时前
人工智能
·
计算机视觉
·
目标跟踪
计算机视觉:城市公共空间多主体行为计算
本文基于发表于2025年的研究论文,聚焦于利用先进的计算机视觉技术,解决城市公共空间中“多主体”(即不同类型人群,如儿童与家长)行为交互的精细化量化分析难题。
quetalangtaosha
1 天前
人工智能
·
计算机视觉
·
异常检测
Anomaly Detection系列(CVPR2025 DeCo-Diff论文解读)
Correcting Deviations from Normality: A Reformulated Diffusion Model for Multi-Class Unsupervised Anomaly Detection
Daydream.V
1 天前
人工智能
·
opencv
·
计算机视觉
·
仿射变换
·
换脸
·
视频换脸
·
图片换脸
基于Opencv和Dlib的人脸换脸实现
仿射变换是一种几何变换,它是一组保持平直性和比例性的线性 变换和平移的组合。简单来说,仿射变换会将直线映射为直线,保持线段之间的比例关系,但可能会改变图形的角度和大小。
xinxiangwangzhi_
1 天前
计算机视觉
立体匹配--SelectiveStereo(2024)
论文标题Selective-Stereo: Adaptive Frequency Information Selection for Stereo Matching (选择性立体匹配:自适应频率信息选择用于立体匹配)
开开心心就好
1 天前
windows
·
计算机视觉
·
计算机外设
·
excel
·
散列表
·
启发式算法
·
csdn开发云
支持自定义名单的实用随机抽签工具
软件介绍随机抽签是一款安卓平台的无权限抽签工具,全程不用注册登录,下载打开就能直接用,没有任何使用门槛。
xinxiangwangzhi_
1 天前
人工智能
·
计算机视觉
raft系列总结
这五篇论文构成了一条清晰的迭代优化立体匹配技术发展路线。RAFT 首先在光流估计领域提出了基于全对相关体+循环迭代更新的范式;随后 RAFT-Stereo 将其迁移至立体匹配;CREStereo 进一步解决了实际场景中的高分辨率和非理想校正问题;IGEV-Stereo 融合了代价聚合与迭代优化两大范式的互补优势;Selective-Stereo 则从频率信息的自适应融合角度对迭代更新算子进行了通用性改进。
Westward-sun.
1 天前
人工智能
·
opencv
·
计算机视觉
背景建模详解与OpenCV实现:从原理到代码实战
在计算机视觉中,背景建模是指让计算机“记住”一个场景静止时的样子,从而能够发现场景中运动或新出现的物体。简单来说,就是将视频中的运动目标(前景)与静止环境(背景)分离开。
碑 一
1 天前
人工智能
·
深度学习
·
计算机视觉
视频分割VisTR算法
CVPR 2021 | 基于Transformer的端到端视频实例分割方法 - 知乎目录第一个思考是:视频本身是序列级别的数据,能否直接将其建模为序列预测的任务?比如,借鉴自然语言处理(NLP)任务的思想,将视频实例分割建模为序列到序列(Seq2Seq)的任务,即给定多帧图像作为输入,直接输出多帧的分割Mask序列,这时需要一个能够同时对多帧进行建模的模型。
学习永无止境@
1 天前
图像处理
·
opencv
·
算法
·
计算机视觉
·
fpga开发
Sobel边缘检测的MATLAB实现
本文实现了一个基于Sobel算子的图像边缘检测算法。算法首先读取灰度图像,定义水平和垂直方向的Sobel卷积核,然后对图像进行卷积运算计算梯度幅值。通过设定阈值(默认220)将梯度幅值二值化,大于阈值的像素点标记为边缘(1),否则为背景(0)。处理过程中考虑了图像边界问题,最终输出二值化的边缘检测结果图。该算法能有效提取图像中的边缘特征,通过调整阈值可以控制边缘检测的灵敏度。
纤纡.
1 天前
人工智能
·
opencv
·
计算机视觉
基于 OpenCV 与 MediaPipe/Dlib 的计算机视觉实战:手势识别、仿射变换与 AI 换脸全解析
在人工智能与计算机视觉飞速发展的今天,实时手势交互、图像几何变换、智能换脸等技术已经从实验室走向大众生活,广泛应用于短视频创作、人机交互、虚拟直播、安防监控等领域。对于计算机视觉初学者而言,动手实现这些经典功能,是掌握 OpenCV、MediaPipe、Dlib 等核心工具的最佳路径。
Westward-sun.
1 天前
人工智能
·
opencv
·
计算机视觉
OpenCV实战:摄像头实时文档扫描与透视矫正
学习笔记:从零实现一个“扫描全能王”式文档扫描仪最近在学习OpenCV,发现一个非常有趣的应用——实时文档扫描。只要把摄像头对准一张纸、一本书或任何四边形物体,程序就能自动检测边缘、提取轮廓,并把倾斜的视角“拉正”成一张平整的俯视图。类似手机上的“扫描全能王”或Office Lens。
不懒不懒
1 天前
人工智能
·
opencv
·
计算机视觉
《从仿射变换到实时手势识别:构建完整换脸与手势交互系统的全流程指南》
img:仿射变换后的结果:penCV + Dlib 实现经典的人脸交换算法,无需深度学习模型,通过人脸关键点检测、仿射变换、肤色归一化、图像掩膜融合四大核心步骤,完成自然的换脸效果。
sali-tec
1 天前
图像处理
·
人工智能
·
opencv
·
算法
·
计算机视觉
C# 基于OpenCv的视觉工作流-章46-矩形卡尺
C# 基于OpenCv的视觉工作流-章46-矩形卡尺本章目标: 一、卡尺制作; 二、卡尺定位; 三、卡尺找点; 四、查找矩形; 矩形卡尺与章44-直线卡尺基本相似,可看成是由四个边直线卡尺组合而成,本文仅介绍不同之处。
深度学习lover
1 天前
人工智能
·
深度学习
·
yolo
·
目标检测
·
计算机视觉
·
胸部x光疾病检测
<数据集>yolo 胸部X光疾病识别<目标检测>
点击下载数据集https://download.csdn.net/download/qq_53332949/92789998数据集格式:VOC+YOLO格式
泰恒
1 天前
人工智能
·
深度学习
·
机器学习
·
计算机视觉
计算机视觉基础
计算机视觉(Computer Vision, CV)是让计算机“看懂”世界的技术学科,它通过摄像头、雷达等传感器获取图像或视频数据,再借助算法模拟人类视觉系统的感知、理解、分析过程,最终实现对现实世界的数字化解读。从手机人脸解锁、自动驾驶的障碍物识别,到工厂零件缺陷检测、医疗影像辅助诊断,计算机视觉已深度融入生产生活的方方面面。作为人工智能领域的核心分支,其底层逻辑、关键技术与实践路径,是每一位技术学习者必须掌握的基础。
甄心爱学习
1 天前
人工智能
·
计算机视觉
【图像与视频处理】什么是图像的频率?
在图像处理中,“频率”并不指代时间上的快慢,而是指空间频率(Spatial Frequency)。它定义的是图像像素灰度值随空间位置变化的剧烈程度。
模拟器连接器曾工
2 天前
人工智能
·
计算机视觉
·
视觉检测
·
智能视觉检测系统
CCD定位与图像辨别的智能视觉检测系统
在智能制造与自动化装配领域,CCD定位与图像辨别系统是实现高精度引导、尺寸测量及缺陷检测的核心技术。它将CCD(电荷耦合器件)相机的高分辨率成像与图像处理算法相结合,为工业机器人、贴片机及检测设备提供亚像素级的定位与识别能力。
Anycall.Q
2 天前
人工智能
·
计算机视觉
·
imagen
RE-IMAGEN(ICLR 2023)
研究发现模型的输出对文本提示中实体(或对象)的频率非常敏感。 特别是,当生成有关频繁实体的文本提示时,这些模型通常会生成逼真的图像,忠实地反映实体的视觉外观。 然而,当根据不太频繁的实体的文本提示生成时,这些模型要么幻觉不存在的实体,要么输出相关的频繁实体(见图 1),无法在生成的图像和提到的实体的视觉外观之间建立联系。 这一关键限制可能会极大地损害文本到图像模型在现实应用中的可信度,甚至引发道德问题。 在我们的研究中,我们发现这些模型在生成与代表性不足(under-represented)的群体相关的视