技术栈
计算机视觉
AI技术控
4 小时前
计算机视觉
计算机视觉算法实战——表面缺陷检测(主页有源码)
✨个人主页欢迎您的访问 ✨期待您的三连 ✨✨个人主页欢迎您的访问 ✨期待您的三连 ✨✨个人主页欢迎您的访问 ✨期待您的三连✨
Erekys
4 小时前
人工智能
·
计算机视觉
·
音视频
视觉分析之边缘检测算法
Roberts算子又称为交叉微分算法,是基于交叉差分的梯度算法,通过局部差分计算检测边缘线条。常用来处理具有陡峭的低噪声图像,当图像边缘接近于正45度或负45度时,该算法处理效果更理想。
唔皇万睡万万睡
5 小时前
人工智能
·
计算机视觉
数字水印嵌入及提取系统——基于小波变换GUI
数字水印嵌入及提取系统——基于小波变换GUI基于小波变换的数字水印系统(Matlab代码GUI操作)【有简洁程序报告】【可作開题+完整文档+达辩PPT】
IT古董
5 小时前
深度学习
·
目标检测
·
计算机视觉
【深度学习】计算机视觉(CV)-目标检测-DETR(DEtection TRansformer)—— 基于 Transformer 的端到端目标检测
DETR(DEtection TRansformer) 是 Facebook AI(FAIR)于 2020 年提出的 端到端目标检测算法,它基于 Transformer 架构,消除了 Faster R-CNN、YOLO 等方法中的 候选框(Anchor Boxes) 和 非极大值抑制(NMS) 机制,使目标检测变得更简单、高效。
LensonYuan
5 小时前
目标检测
·
计算机视觉
·
目标跟踪
视觉目标检测之小目标检测技术调研与实验
小目标检测是计算机视觉领域中的一个极具挑战性的问题。小目标检测广义是指在图像中检测和识别尺寸较小、面积较小的目标物体。
高力士等十万人
5 小时前
人工智能
·
opencv
·
计算机视觉
OpenCV中的边缘检测
边缘检测是图像处理和计算机视觉中的关键技术之一,旨在识别图像中像素强度发生显著变化的区域,这些区域通常对应于物体的边界或轮廓。边缘检测在机器视觉中具有重要的需求背景,主要体现在以下几个方面:
三年呀
5 小时前
图像处理
·
python
·
深度学习
·
算法
·
目标检测
·
机器学习
·
计算机视觉
计算机视觉之图像处理-----SIFT、SURF、FAST、ORB 特征提取算法深度解析
在图像处理领域亦或是计算机视觉中,首先我们需要先理解几个名词:什么是尺度不变?在实际场景中,同一物体可能出现在不同距离(如远处的山和近处的树),导致其在图像中的尺度不同,也引出了多尺度的概念。算法检测到的特征在图像缩放(放大或缩小)后仍能被正确识别和匹配,即尺度不变性。
C#Thread
7 小时前
图像处理
·
人工智能
·
计算机视觉
机器视觉--图像的运算(加法)
在机器视觉领域,Halcon 是一款功能强大且广泛应用的机器视觉软件库。图像的加法运算是其中一种基础且重要的操作,它在很多实际应用场景中都发挥着关键作用,比如图像增强、图像融合等。本文将深入探讨 Halcon 中图像加法运算的原理、实现方法,并通过具体的演示程序来帮助读者更好地理解和掌握这一操作。
高力士等十万人
8 小时前
python
·
opencv
·
计算机视觉
OpenCV二值化处理
二值化操作将灰度图像转换为黑白图像,即将图像中的像素值分为两类:前景(通常为白色,值为 255)和背景(通常为黑色,值为 0)。二值化的主要目的是简化图像,突出目标物体,便于后续的图像分析和处理,如特征提取、目标检测、图像分割等。
视觉人机器视觉
9 小时前
人工智能
·
数码相机
·
计算机视觉
·
3d
·
视觉检测
3D与2D机器视觉机械臂引导的区别
3D与2D机器视觉在机械臂引导中的主要区别如下:
大数据AI人工智能培训专家培训讲师叶梓
10 小时前
人工智能
·
计算机视觉
·
音视频
·
实时音视频
·
图像识别
·
gpt-4
·
视频生成
OmniHuman:一张图+音频生成逼真视频
人工智能咨询培训老师叶梓 转载标明出处想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。
AI技术控
13 小时前
人工智能
·
算法
·
计算机视觉
计算机视觉算法实战——图像合成(主页有源码)
✨个人主页欢迎您的访问 ✨期待您的三连 ✨✨个人主页欢迎您的访问 ✨期待您的三连 ✨✨个人主页欢迎您的访问 ✨期待您的三连✨
AI生成未来
15 小时前
计算机视觉
·
语言模型
·
多模态
·
mllms
多模态大语言模型(MLLMs)如何重塑和变革计算机视觉?
本文介绍了多模态大型语言模型(MLLM)的定义、使用挑战性提示的应用场景,以及正在重塑计算机视觉的顶级模型。
de之梦-御风
19 小时前
opencv
·
计算机视觉
·
分类
【OpenCV】OpenCV算子功能分类
在 OpenCV 中,算子(Operators)可以根据功能分类为不同的类别,主要包括图像处理、特征检测、几何变换等。以下是 OpenCV 算子的主要分类:
C#Thread
1 天前
人工智能
·
深度学习
·
计算机视觉
机器视觉--索贝尔滤波
在图像处理领域,边缘检测是一项至关重要的任务,它能够帮助我们识别图像中不同区域的边界,为后续的目标识别、图像分割等操作奠定基础。索贝尔滤波(Sobel Filter)作为一种经典的边缘检测算法,因其简单高效的特点被广泛应用。在功能强大的机器视觉软件 Halcon 中,也提供了对索贝尔滤波的支持。本文将详细介绍 Halcon 中索贝尔滤波的原理、应用场景,并通过具体的程序示例展示其在实际中的使用方法。
空空转念
1 天前
人工智能
·
深度学习
·
计算机视觉
目前(2025年2月)计算机视觉(CV)领域一些表现优异的深度学习模型
按任务类型分类介绍:CoCa:结合对比学习和生成学习,通过对比损失对齐图像和文本嵌入,并使用标题生成损失预测文本标记。它在图像分类、跨模态检索和图像描述等任务中表现出色,且仅需极少的任务特定微调。 PaLI:这是一个多模态模型,结合了40亿参数的视觉Transformer(ViT)和多种大型语言模型(LLM),并在包含100多种语言的100亿图像和文本数据集上进行训练。PaLI在图像描述、视觉问答和场景文本理解等任务中达到了最佳性能。 CoAtNet-7:该模型融合了卷积层和注意力层,平衡了模型的泛化能力
IT古董
1 天前
深度学习
·
生成对抗网络
·
计算机视觉
【深度学习】计算机视觉(CV)-图像生成-生成对抗网络(GANs, Generative Adversarial Networks)
生成对抗网络(GANs) 是 Ian Goodfellow 在 2014 年提出的一种深度生成模型,主要用于生成逼真的数据,如图像、音乐、文本等。GANs 采用博弈论思想,让两个神经网络(生成器 G 和 判别器 D)相互对抗,在不断竞争中提高数据的生成质量。
人工智能学起来
1 天前
人工智能
·
深度学习
·
计算机视觉
·
transformer
多模态机器学习火热idea汇总!
想发论文,却完全没头绪?那我非常推荐你关注这个潜力方向:多模态机器学习!它能够把不同模态的数据,映射到统一的高维向量空间,实现模态间的语义对齐,从而促进模态间的相互理解,提高模型的性能。多媒体内容理解、医疗健康、自动驾驶、情感分析等领域都离不开它。也因此,其在NeurIPS、ICML、CVPR等顶会上都有多篇成果!
CP-DD
2 天前
人工智能
·
计算机视觉
·
目标跟踪
目标跟踪(Object Tracking) vs. 目标识别(Object Recognition)
目标跟踪和目标识别都是计算机视觉中的核心任务,但它们的目标、方法和应用场景有所不同。目标识别(Object Recognition)是指识别图像或视频中的目标是什么,即确定目标的类别(如“人”、“车”、“猫”等)。目标识别通常是单帧任务,不考虑时间上的连续性。