计算机视觉

一招定胜负13 分钟前
opencv·计算机视觉
基于dlib和OpenCV的人脸替换技术详解目录一、换脸技术概述1.1 换脸技术的发展1.2 常用换脸方法分类1.3 各方法优缺点对比二、本文方法介绍
空白诗2 小时前
深度学习·计算机视觉·stable diffusion
CANN ops-nn 算子解读:Stable Diffusion 图像生成中的 Conv2D 卷积实现本文基于 CANN ops-nn 仓库中的 Conv2D 算子实现,解析其在 AIGC 图像生成场景(如 Stable Diffusion)中的核心作用与优化策略。
lxs-3 小时前
图像处理·目标检测·计算机视觉
CANN计算机视觉算子库ops-cv全面解析:图像处理与目标检测的高性能引擎计算机视觉是人工智能领域最具活力的方向之一,从图像分类、目标检测到语义分割,各种视觉任务都需要大量高效的图像处理算子支持。CANN开源社区推出的ops-cv是一个专门面向计算机视觉应用的高性能算子库,提供了丰富的图像处理、目标检测相关算子实现,为CV应用在NPU上的加速提供了坚实基础。
qq_12498707537 小时前
java·数据库·人工智能·spring boot·计算机视觉·毕业设计·计算机毕业设计
基于JavaWeb的大学生房屋租赁系统(源码+论文+部署+安装)随着高等教育普及,大学生群体扩大,校外租房需求激增,但当前大学生房屋租赁市场存在诸多痛点:传统租房信息获取渠道有限,虚假房源频发,租客看房效率低;房东房源推广单一、租赁事务管理繁琐;市场缺乏规范管理机制,租赁纠纷、报修沟通不畅等问题突出。同时,现有大学生房屋租赁信息化管理缺乏完善系统机制,传统管理模式工作效率低、流程繁杂。在此背景下,结合信息化发展趋势,采用 Springboot 等主流技术,开发一套高效、便捷的大学生房屋租赁系统,解决市场痛点、规范租赁秩序,成为必然需求。
杜子不疼.7 小时前
图像处理·人工智能·计算机视觉
CANN计算机视觉算子库ops-cv的图像处理与特征提取优化实践计算机视觉是人工智能应用最广泛的领域之一,涵盖图像分类、目标检测、语义分割、视频分析等多种任务。这些任务的基础是高效的图像处理和特征提取算子。CANN的ops-cv库提供了丰富的计算机视觉算子,针对NPU硬件进行了深度优化,能够显著提升视觉应用的性能。
张人玉7 小时前
笔记·学习·计算机视觉·vsionprp
VisionPro 定位与卡尺测量学习笔记所有视觉工具的坐标计算均基于对应空间,测量、定位工具需统一坐标空间,否则结果偏移;Fixture 工具的核心作用是自定义适配工件的定位空间,解决工件位置 / 角度变化后的测量一致性问题。
勾股导航8 小时前
人工智能·opencv·计算机视觉
OpenCV图像坐标系1.灰度图像如下图所示:坐标原点在左上角,水平为x轴,垂直为y轴;图像水平像素总数为宽度,垂直像素总数为高度
哈__9 小时前
人工智能·计算机视觉
CANN加速Image-to-Image转换:风格迁移与图像编辑优化Image-to-Image转换技术能够在保持图像内容结构的同时,改变图像的风格、属性或内容,在艺术创作、图像编辑、数据增强等领域有着广泛的应用。从风格迁移到图像修复,从超分辨率到颜色转换,Image-to-Image转换涵盖了多种任务。这些任务通常基于深度学习模型,计算复杂度较高,对推理性能提出了很高要求。CANN针对Image-to-Image转换推理推出了全面的优化方案,通过编码器-解码器优化、跳跃连接加速和特征融合优化,显著提升了Image-to-Image转换的性能和质量。
渡我白衣11 小时前
人工智能·深度学习·神经网络·目标检测·机器学习·计算机视觉·自然语言处理
信而有征——模型评估、验证与可信部署的完整体系“一个未经验证的模型,无论多么精巧,都只是空中楼阁。 真正的智能,不在于预测本身,而在于对预测不确定性的诚实。” ——机器学习工程的核心信条
xsc-xyc1 天前
人工智能·深度学习·yolo·计算机视觉·视觉检测
RuntimeError: Dataset ‘/data.yaml‘ error ❌ ‘_lz遇到一个yolov8运行时错误,提示数据集文件 /data.yaml加载失败,具体原因为 ‘_lzma.LZMADecompressor’ object has no attribute ‘needs_input’。这通常表明系统中用于解压缩的 LZMA 库(常见于处理 .xz或 .lzma压缩格式)存在版本兼容性问题或内部损坏,可能是由于 Python 的 lzma模块与底层 C 库不匹配,或相关依赖库(如 backports.lzma)未正确安装所致,导致在读取可能经过压缩的数据集文件时无法正常初始化
星爷AG I1 天前
人工智能·计算机视觉·agi
9-28 视觉工作记忆(AGI基础理论)《智能的理论》全书转至目录不同AGI的研究路线对比简化版:《AGI(具身智能)路线对比》,欢迎各位参与讨论、批评或建议。
橙露1 天前
人工智能·计算机视觉·视觉检测
视觉检测中的数字光纤放大器的核心参数和调整在当今快速发展的工业自动化领域,机器视觉系统已成为质量控制、自动化生产和智能检测的关键技术。根据国际机器人联合会(IFR)2024年发布的《全球工业自动化报告》,全球机器视觉市场规模预计在2025年达到180亿美元,年复合增长率保持在12%以上。在这一蓬勃发展的技术领域中,光纤放大器作为视觉检测系统的关键组件,其性能直接影响整个系统的检测精度、稳定性和可靠性。
AAD555888991 天前
人工智能·目标检测·计算机视觉
基于Mask_RCNN的猫科动物目标检测识别模型实现与分析近年来,目标检测技术在学术界和工业界都取得了显著进展!🐱🐯 从传统的R-CNN系列到YOLO、SSD等单阶段检测器,再到如今的Mask RCNN等实例分割算法,技术迭代速度令人惊叹。特别是在动物识别领域,猫科动物检测有着广泛的应用价值,比如野生动物保护、宠物行为分析等场景。今天,我们就来深入探讨如何使用Mask RCNN实现猫科动物目标检测识别模型!🔍
LittroInno1 天前
人工智能·计算机视觉·目标跟踪
TVMS视频管理平台 —— 多种目标跟踪模式在自动跟踪模式下,AI 相机识别到目标后,若目标连续 3 帧均稳定识别则开始目标自动跟踪;当 AI 相机有云台控制权限时,相机发送 PELCO-D 或LPP/ExPelcoD指令控制云台按照目标跟踪轨迹运动,直至目标丢失或相机失去云台控制权限。
没有不重的名么1 天前
深度学习·opencv·计算机视觉·目标跟踪
Multiple Object Tracking as ID Prediction时间:2025会议:CVPR作者:Ruopeng Gao,Ji Qi,Limin Wang传统多目标跟踪方法在目标关联阶段严重依赖人工设计的启发式规则,难以适应复杂场景
马拉AI1 天前
人工智能·计算机视觉
VAE不再必要?北大PixelGen:像素扩散反超Latent Diffusion,重塑生成新范式目前的图像生成技术主要分为两大流派:一种是先压缩图片再生成的“潜在扩散模型”(Latent Diffusion),另一种是直接在像素上生成的“像素扩散模型”(Pixel Diffusion)。潜在扩散模型虽然快,但压缩过程像是有损压缩,会丢失细节并产生伪影。像素扩散模型虽然画质上限高,但因为它要处理的数据量太大,且包含很多像噪点一样人眼看不见的无用信息,导致训练非常困难,效果一直不如前者。
愚者游世1 天前
人工智能·opencv·计算机视觉
Opencv知识点大纲1、 基础知识了解 2、 Visual Stdio下引入库并使用 3、 vsCode+Python下引入库并使用 4、 Qt下引入库并使用 5、 cmake引入库进行编译
格林威1 天前
人工智能·opencv·机器学习·计算机视觉·视觉检测·工业相机·堡盟相机
Baumer相机电池极耳对齐度检测:提升叠片工艺精度的 5 个实用方案,附 OpenCV+Halcon 实战代码!在电池制造质检中,你是否常被这些问题困扰?极耳对齐度检测 ≠ 简单边缘分析 它要求在高精度、高速度条件下,精准识别极耳位置、对齐偏差、平行度——任何一处偏差都可能导致焊接不良
Funny_AI_LAB1 天前
人工智能·计算机视觉·语言模型·ocr
GLM-OCR发布:性能SOTA,超越PaddleOCR-VL-1.5?前有通过视觉压缩,实现高效、结构化的文档理解的DeepSeek-OCR2,后有高精度、鲁棒的多任务文档解析PaddleOCR-VL-1.5,而最近智谱AI发布最新GLM-OCR一款轻量级专业光学字符识别模型。它凭借“小尺寸、高精度”的特点,在复杂文档解析领域达到了当前最佳性能,并大幅降低了部署和使用成本。 开源地址 Github:https://github.com/zai-org/GLM-OCR Hugging Face:https://huggingface.co/zai-org/GLM-OCR 在线
esmap1 天前
前端·人工智能·计算机视觉·3d·ai·js
OpenClaw与ESMAP AOA定位系统融合技术分析技术融合背景:从感知到执行的完整闭环在 AI 智能体技术快速发展的今天,空间感知能力的不足成为制约智能体自主执行能力提升的关键瓶颈。openclaw作为一款开源的个人 AI 自动化助手,凭借其强大的 "感知 - 决策 - 执行" 闭环能力,在自动化领域展现出巨大潜力。而 ESMAP AOA 蓝牙定位技术则代表了室内定位领域的重大技术突破,通过创新的到达角测量原理和先进的信号处理算法,将传统蓝牙定位的精度从米级提升至厘米级。