计算机视觉

勾股导航13 分钟前
人工智能·opencv·计算机视觉
OpenCV图像坐标系1.灰度图像如下图所示:坐标原点在左上角,水平为x轴,垂直为y轴;图像水平像素总数为宽度,垂直像素总数为高度
哈__2 小时前
人工智能·计算机视觉
CANN加速Image-to-Image转换:风格迁移与图像编辑优化Image-to-Image转换技术能够在保持图像内容结构的同时,改变图像的风格、属性或内容,在艺术创作、图像编辑、数据增强等领域有着广泛的应用。从风格迁移到图像修复,从超分辨率到颜色转换,Image-to-Image转换涵盖了多种任务。这些任务通常基于深度学习模型,计算复杂度较高,对推理性能提出了很高要求。CANN针对Image-to-Image转换推理推出了全面的优化方案,通过编码器-解码器优化、跳跃连接加速和特征融合优化,显著提升了Image-to-Image转换的性能和质量。
渡我白衣4 小时前
人工智能·深度学习·神经网络·目标检测·机器学习·计算机视觉·自然语言处理
信而有征——模型评估、验证与可信部署的完整体系“一个未经验证的模型,无论多么精巧,都只是空中楼阁。 真正的智能,不在于预测本身,而在于对预测不确定性的诚实。” ——机器学习工程的核心信条
xsc-xyc18 小时前
人工智能·深度学习·yolo·计算机视觉·视觉检测
RuntimeError: Dataset ‘/data.yaml‘ error ❌ ‘_lz遇到一个yolov8运行时错误,提示数据集文件 /data.yaml加载失败,具体原因为 ‘_lzma.LZMADecompressor’ object has no attribute ‘needs_input’。这通常表明系统中用于解压缩的 LZMA 库(常见于处理 .xz或 .lzma压缩格式)存在版本兼容性问题或内部损坏,可能是由于 Python 的 lzma模块与底层 C 库不匹配,或相关依赖库(如 backports.lzma)未正确安装所致,导致在读取可能经过压缩的数据集文件时无法正常初始化
星爷AG I19 小时前
人工智能·计算机视觉·agi
9-28 视觉工作记忆(AGI基础理论)《智能的理论》全书转至目录不同AGI的研究路线对比简化版:《AGI(具身智能)路线对比》,欢迎各位参与讨论、批评或建议。
橙露20 小时前
人工智能·计算机视觉·视觉检测
视觉检测中的数字光纤放大器的核心参数和调整在当今快速发展的工业自动化领域,机器视觉系统已成为质量控制、自动化生产和智能检测的关键技术。根据国际机器人联合会(IFR)2024年发布的《全球工业自动化报告》,全球机器视觉市场规模预计在2025年达到180亿美元,年复合增长率保持在12%以上。在这一蓬勃发展的技术领域中,光纤放大器作为视觉检测系统的关键组件,其性能直接影响整个系统的检测精度、稳定性和可靠性。
AAD555888991 天前
人工智能·目标检测·计算机视觉
基于Mask_RCNN的猫科动物目标检测识别模型实现与分析近年来,目标检测技术在学术界和工业界都取得了显著进展!🐱🐯 从传统的R-CNN系列到YOLO、SSD等单阶段检测器,再到如今的Mask RCNN等实例分割算法,技术迭代速度令人惊叹。特别是在动物识别领域,猫科动物检测有着广泛的应用价值,比如野生动物保护、宠物行为分析等场景。今天,我们就来深入探讨如何使用Mask RCNN实现猫科动物目标检测识别模型!🔍
LittroInno1 天前
人工智能·计算机视觉·目标跟踪
TVMS视频管理平台 —— 多种目标跟踪模式在自动跟踪模式下,AI 相机识别到目标后,若目标连续 3 帧均稳定识别则开始目标自动跟踪;当 AI 相机有云台控制权限时,相机发送 PELCO-D 或LPP/ExPelcoD指令控制云台按照目标跟踪轨迹运动,直至目标丢失或相机失去云台控制权限。
没有不重的名么1 天前
深度学习·opencv·计算机视觉·目标跟踪
Multiple Object Tracking as ID Prediction时间:2025会议:CVPR作者:Ruopeng Gao,Ji Qi,Limin Wang传统多目标跟踪方法在目标关联阶段严重依赖人工设计的启发式规则,难以适应复杂场景
马拉AI1 天前
人工智能·计算机视觉
VAE不再必要?北大PixelGen:像素扩散反超Latent Diffusion,重塑生成新范式目前的图像生成技术主要分为两大流派:一种是先压缩图片再生成的“潜在扩散模型”(Latent Diffusion),另一种是直接在像素上生成的“像素扩散模型”(Pixel Diffusion)。潜在扩散模型虽然快,但压缩过程像是有损压缩,会丢失细节并产生伪影。像素扩散模型虽然画质上限高,但因为它要处理的数据量太大,且包含很多像噪点一样人眼看不见的无用信息,导致训练非常困难,效果一直不如前者。
愚者游世1 天前
人工智能·opencv·计算机视觉
Opencv知识点大纲1、 基础知识了解 2、 Visual Stdio下引入库并使用 3、 vsCode+Python下引入库并使用 4、 Qt下引入库并使用 5、 cmake引入库进行编译
格林威1 天前
人工智能·opencv·机器学习·计算机视觉·视觉检测·工业相机·堡盟相机
Baumer相机电池极耳对齐度检测:提升叠片工艺精度的 5 个实用方案,附 OpenCV+Halcon 实战代码!在电池制造质检中,你是否常被这些问题困扰?极耳对齐度检测 ≠ 简单边缘分析 它要求在高精度、高速度条件下,精准识别极耳位置、对齐偏差、平行度——任何一处偏差都可能导致焊接不良
Funny_AI_LAB1 天前
人工智能·计算机视觉·语言模型·ocr
GLM-OCR发布:性能SOTA,超越PaddleOCR-VL-1.5?前有通过视觉压缩,实现高效、结构化的文档理解的DeepSeek-OCR2,后有高精度、鲁棒的多任务文档解析PaddleOCR-VL-1.5,而最近智谱AI发布最新GLM-OCR一款轻量级专业光学字符识别模型。它凭借“小尺寸、高精度”的特点,在复杂文档解析领域达到了当前最佳性能,并大幅降低了部署和使用成本。 开源地址 Github:https://github.com/zai-org/GLM-OCR Hugging Face:https://huggingface.co/zai-org/GLM-OCR 在线
esmap1 天前
前端·人工智能·计算机视觉·3d·ai·js
OpenClaw与ESMAP AOA定位系统融合技术分析技术融合背景:从感知到执行的完整闭环在 AI 智能体技术快速发展的今天,空间感知能力的不足成为制约智能体自主执行能力提升的关键瓶颈。openclaw作为一款开源的个人 AI 自动化助手,凭借其强大的 "感知 - 决策 - 执行" 闭环能力,在自动化领域展现出巨大潜力。而 ESMAP AOA 蓝牙定位技术则代表了室内定位领域的重大技术突破,通过创新的到达角测量原理和先进的信号处理算法,将传统蓝牙定位的精度从米级提升至厘米级。
赋创小助手1 天前
运维·服务器·人工智能·深度学习·计算机视觉·自然语言处理·架构
NVIDIA B200 GPU 技术解读:Blackwell 架构带来了哪些真实变化?随着大模型参数规模、上下文长度和多模态能力持续提升,AI 算力的瓶颈正在从“峰值算力”转向显存容量、带宽与能效。在这一背景下,NVIDIA 于 GTC 2024 发布了基于 Blackwell 架构的 B200 GPU,其目标并非简单替代 H100 / H200,而是面向新一代超大模型工作负载进行系统级重构。 B200 采用双芯片(Dual-Die)封装,单卡集成约 2080 亿晶体管,配备 192 GB HBM3e 显存,并通过 NVLink 5 提供 1.8 TB/s 的 GPU 间互联带宽。同时,第
AAD555888991 天前
人工智能·计算机视觉·目标跟踪
工业纸板加工过程中的检测与识别_Cornernet_Hourglass104模型应用随着工业自动化和智能制造的快速发展,纸板作为包装行业的重要材料,其质量控制成为生产过程中的关键环节。传统纸板检测方法主要依靠人工目检,存在效率低下、主观性强、易疲劳等问题,难以满足现代工业生产对高效率和高质量的要求。计算机视觉技术的出现为目标检测提供了新的解决方案,然而纸板检测面临着诸多挑战,如纸板表面纹理复杂、缺陷形态多样、光照条件变化等因素,导致现有目标检测算法在纸板检测任务中表现不佳。深度学习技术的进步为目标检测领域带来了革命性的变化,特别是卷积神经网络(CNN)的发展,使得目标检测精度得到了显著提
格林威1 天前
人工智能·深度学习·opencv·机器学习·计算机视觉·视觉检测·工业相机
Baumer相机电机转子偏心检测:实现动平衡预判的 5 个核心方法,附 OpenCV+Halcon 实战代码!在电机制造质检中,你是否常被这些问题困扰?转子偏心检测 ≠ 简单圆度分析 它要求在高精度、高速度条件下,精准识别内外圆心偏移、椭圆度、径向跳动——任何一处偏心都可能导致电机振动
LittroInno1 天前
人工智能·计算机视觉·音视频
TVMS视频管理平台 —— 目标识别跟踪客户端支持 AI 硬件产品下的目标识别功能与客户端模式下的目标识别。⚠️软件中为了减少误报情况,默认将目标宽或高大于画面一半以上的大物体进行了过滤,即便是识别到也不会显示与输出目标信息,在测试过程中需要注意。
Niuguangshuo1 天前
人工智能·深度学习·计算机视觉·stable diffusion·重构·transformer
DALL-E 3:如何通过重构“文本描述“革新图像生成对于每一个尝试过AI绘画的人,这样的场景或许都不陌生:你满心期待地输入“一只戴着红色围巾的黑猫,坐在飘雪的窗台上,背景有暖光台灯”,得到的却可能是一只没有围巾的猫,或是一个没有台灯的窗台,甚至是一只飘在空中的猫。这种模型“听不懂人话”或“视而不见”的现象,其专业名称是 “提示跟随能力(Prompt Following)”不足。
qwy7152292581631 天前
人工智能·opencv·计算机视觉
17-像素点和ROI操作代码-2:设置像素点代码-3:为例能肉眼识别,设置多个像素:执行结果:(画了一条白线) ROI 是指图像中我们感兴趣的区域。通过提取 ROI,我们可以只对图像的特定部分进行处理,从而提高处理效率。 代码-4:提取某个区域ROI