计算机视觉

xiangzhihong829 分钟前
人工智能·深度学习·计算机视觉
Amodal3R ,南洋理工推出的 3D 生成模型Amodal3R 是一款先进的条件式 3D 生成模型,能够从部分可见的 2D 物体图像中推断并重建完整的 3D 结构与外观。该模型建立在基础的 3D 生成模型 TRELLIS 之上,通过引入掩码加权多头交叉注意力机制与遮挡感知注意力层,利用遮挡先验知识优化重建过程。Amodal3R 仅依赖合成数据进行训练,在实际应用中展现出卓越的性能,显著优于传统的“2D 预测补全 + 3D 重建”两步法,为遮挡场景下的 3D 重建设定了新的标杆。
阿linlin36 分钟前
opencv·学习·计算机视觉
OpenCV--图像预处理学习01在图像处理和计算机图形学中,插值(Interpolation)是一种通过已知数据点之间的推断或估计来获取新数据点的方法。它在图像处理中常用于处理图像的放大、缩小、旋转、变形等操作,以及处理图像中的像素值。
程序员Linc3 小时前
计算机视觉·边缘检测·形态学
边缘检测技术现状初探2:多尺度与形态学方法多尺度边缘检测通过在不同分辨率/平滑度下分析图像,实现:图像 I ( x , y ) I(x,y) I(x,y)在尺度 t t t( t = σ 2 t = \sigma^2 t=σ2)下的表示为: L ( x , y , t ) = G ( x , y , t ) ∗ I ( x , y ) L(x,y,t) = G(x,y,t) * I(x,y) L(x,y,t)=G(x,y,t)∗I(x,y) 其中高斯核 G ( x , y , t ) = 1 2 π t e − x 2 + y 2 2 t G(x
Blossom.1185 小时前
人工智能·深度学习·机器学习·计算机视觉·量子计算
量子计算与经典计算的融合与未来最近研学过程中发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击下方超链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面进入文章正题。
硅谷秋水5 小时前
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人
MoLe-VLA:通过混合层实现的动态跳层视觉-语言-动作模型实现高效机器人操作25年3月来自南京大学、香港理工、北大和香港科技大学的论文“MoLe-VLA: Dynamic Layer-skipping Vision Language Action Model via Mixture-of-Layers for Efficient Robot Manipulation”。
weixin_442424036 小时前
人工智能·opencv·计算机视觉
Opencv计算机视觉编程攻略-第七节 提取直线、轮廓和区域canny算子在低阈值边缘分布图上只保留具有连续路径的边缘点,同时把那些边缘点连接到属于高阈值边缘分布图的边缘上。高阈值分布图上的所有边缘点都被保留下来,而低阈值分布图上边缘点的孤立链全部被移除,只要指定适当的阈值,就能获得高质量的轮廓。这种基于两个阈值获得二值分布图的策略被称为滞后阈值化,可用于任何需要用阈值化获得二值分布图的场景,计算复杂度比较高。 另外,Canny 算法用了一个额外的策略来优化边缘分布图的质量。在进行滞后阈值化之前,如果梯度幅值不是梯度方向上的最大值,那么对应的边缘点都会被移除(前面
HABuo6 小时前
人工智能·深度学习·yolo·目标检测·计算机视觉
【YOLOv8】YOLOv8改进系列(12)----替换主干网络之StarNet主页:HABUO🍁主页:HABUO🍁YOLOv8入门+改进专栏🍁🍁如果再也不能见到你,祝你早安,午安,晚安🍁
Wnq1007215 小时前
运维·计算机视觉·机器人·智能硬件·deepseek
智能巡检机器人在化工企业的应用研究化工行业具有生产流程复杂、易燃易爆 / 有毒有害气体密集、设备运行环境严苛等特点,传统人工巡检存在效率低、风险高、数据采集滞后等问题。随着人工智能、物联网及传感器技术的发展,智能巡检机器人成为提升安全生产水平的重要手段。本文以北京玉麟科技有限公司研发的挂轨式防爆巡检机器人为案例,系统阐述其在化工企业的巡检内容、技术实现、数据处理流程及行业价值,并探讨传统巡检人员的职业转型路径。
jndingxin1 天前
人工智能·opencv·计算机视觉
OpenCV 图形API(或称G-API)(1)OpenCV 图形API(或称G-API)是一个新的OpenCV模块,旨在使常规图像处理更快且更便携。通过引入一种新的基于图的执行模型来实现这两个目标。
契合qht53_shine1 天前
人工智能·opencv·计算机视觉
OpenCV 从入门到精通(day_03)ROI:Region of Interest,翻译过来就是感兴趣的区域。什么意思呢?比如对于一个人的照片,假如我们要检测眼睛,因为眼睛肯定在脸上,所以我们感兴趣的只有脸这部分,其他都不care,所以可以单独把脸截取出来,这样就可以大大节省计算量,提高运行速度。 还记得Numpy这个库吗?我们在使用OpenCV进行读取图像时,图像数据会被存储为Numpy数组,这也意味着我们可以使用Numpy数组的一些操作来对图像数据进行处理,比如切片。而本实验的原理也是基于Numpy数组的切片操作来完成的,因此在对应的组件
闭月之泪舞1 天前
人工智能·计算机视觉
OpenCv(五)——边缘检测目录边缘检测一、sobel算子边缘检测(1)原理1、X轴方向的边缘检测2、Y轴方向的边缘检测(2)sobel算子参数
知舟不叙1 天前
人工智能·opencv·计算机视觉
OpenCV的基础操作这里我们读取一张企鹅图片,运行结果如下,左图为原图,右图为灰度图
编程在手天下我有1 天前
计算机视觉
计算机视觉(CV)技术的优势和挑战计算机视觉(CV)技术是人工智能领域中的一个重要分支,它主要通过让机器学会“看”和“理解”图像或视频来模拟人类视觉系统。以下是计算机视觉技术的一些优势和挑战:
AI绘画月月1 天前
图像处理·人工智能·计算机视觉·ai作画·stable diffusion·midjourney·sd
AI绘画 | Stable Diffusion 图片背景完美替换今天分享 Stable Diffusion 图片背景完美替换 功能,通过 Stable Diffusion 图生图重绘蒙版进行背景图的二次重绘。
xcLeigh1 天前
人工智能·python·opencv·计算机视觉
计算机视觉入门:从像素到理解的旅程计算机视觉入门:从像素到理解的旅程,计算机视觉是人工智能领域的核心方向之一,旨在让计算机具备理解和解释视觉信息的能力。本文以系统化的知识框架,结合 Python 代码与经典案例,带您从像素级操作逐步掌握计算机视觉核心技术。涵盖图像处理、特征工程、传统机器学习到深度学习模型,助您构建从基础到进阶的完整能力体系。
HABuo2 天前
人工智能·深度学习·yolo·目标检测·计算机视觉
【YOLOv8】YOLOv8改进系列(11)----替换主干网络之MobileNetV4主页:HABUO🍁主页:HABUO🍁YOLOv8入门+改进专栏🍁🍁如果再也不能见到你,祝你早安,午安,晚安🍁
枉费红笺2 天前
人工智能·目标检测·计算机视觉
目标检测的训练策略在目标检测竞赛中,训练策略的优化是提高模型性能的关键。常用的训练策略包括数据预处理、数据增强、超参数调节、损失函数设计、正负样本采样、模型初始化和训练技巧等。以下是一些常见的训练策略:
枉费红笺2 天前
人工智能·目标检测·计算机视觉
目标检测竞赛训练策略解析与拓展这篇文章全面且系统地阐述了目标检测竞赛中常用的训练策略,为提升模型性能提供了多维度的指导,具有很高的实用价值。具体分析如下:
闭月之泪舞2 天前
人工智能·opencv·计算机视觉
OpenCv(三)——图像平滑处理目录图像平滑处理(1)椒盐噪声生成函数(2)均值滤波(3)方框滤波(4)高斯滤波(5)中值滤波生成噪声的方法有很多种,这里只提供一种思路。