技术栈
计算机视觉
韩师傅
4 天前
python
·
计算机视觉
海天线算法的前世今生
副标题:六点取色、海天线与前生今世——蓝天滤镜里我最磨人的一条线摘要:上篇 全流程速通 只交代 mask 结论;这篇细说原理——六点怎么取、取完怎么印中间步骤验收、magic number(ROI 0.65 / TOP_BAND)为什么存在、又怎么换成 bottom_up。无 GPU 见 第三篇。
韩师傅
4 天前
python
·
计算机视觉
当你的甲方设备过烂,要如何快速出效果?
副标题:整理资料时的灵机一动——HSV 能不能当 YOLO 的兜底?摘要:上篇 标准交付 走 YOLO 伪流;本篇讲我整理 Step 6 资料时突然想通的一件事:既然 HSV 本来就能做 mask、做染色,滤镜栈又已经拆好了,能不能整条链只换 mask 引擎、不训模型也上浏览器 demo? 2026-06-25 试完:本片肉眼与 YOLO 无差,略卡可优化,代码 + 少量手工取色 能扛很多事——YOLO 训练成本高,HSV 不必 universal 平替,作兜底策略够用了。
韩师傅
4 天前
python
·
计算机视觉
当你的甲方吐槽天空不够蓝,你应该如何应对
副标题:从单帧到视频流——一条可演示的蓝天滤镜决策链摘要:甲方要的不是 P 图,是接流 → 分天空 → 只调天的颜色 → 推回去。本篇讲我怎么拆需求、怎么定路线、关键分叉怎么选;海天线算法见 第二篇,甲方设备烂见 第三篇。复现用脚本见文末附录。
兵慌码乱
11 天前
python
·
opencv
·
计算机视觉
·
人机交互
·
手势识别
·
mediapipe
·
pyside2
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
非接触式人机交互是当前 HCI 领域的重要研究方向,传统音乐播放控制依赖键鼠、触屏等物理交互方式,在手部占用、洁净度要求高的场景下存在明显局限。基于计算机视觉的手势识别方案能够突破物理交互限制,但现有方案多依赖深度学习模型或深度相机,存在部署门槛高、算力需求大的问题。
小小杨树
13 天前
算法
·
计算机视觉
·
配色
读懂色彩:拍照调色不再难
关键词:色彩、 视觉、图像很多人拍照后调色全靠瞎拉参数,画面要么发灰、要么色彩杂乱刺眼,调几十分钟依旧达不到干净高级的质感。核心问题并不是你不会用修图软件,而是完全不懂色彩底层原理。这里我将以绿叶为例子进行讲解。
H__Rick
15 天前
人工智能
·
学习
·
计算机视觉
自动对焦学习-3
整理好的 CSDN Markdown 版本如下,可以直接复制发布。在工业相机、机器视觉、显微成像、电动调焦镜头、自动对焦设备中,基于图像的自动对焦是一类非常常见的方案。
计算机科研狗@OUC
15 天前
人工智能
·
深度学习
·
计算机视觉
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
该论文研究事件相机+图像结合用于深度估计。如下图所示,当前方法包括隐式融合(多模态数据直接拼接输入编码器),显示融合(多模态分别提取特征,由融合模块融合特征),作者提出一种全新方案,输入数据先进行特征对齐(SCPG),同时构建非对称模态编码器(AME),然后中间进行模态交互局部细化(ModiLocal)。
qq_36656650
15 天前
人工智能
·
计算机视觉
·
新媒体运营
2026最新:5款AI视频口型同步工具实测横评,视频翻译后嘴型对不上的终极解决方案
视频本地化过程中,翻译和配音已经能靠AI自动化了,但口型同步(lip sync)一直是最后一块短板。2025年底到2026上半年,多家平台开始推出AI口型同步功能,声称能自动将配音的口型匹配到画面中。
梦想三三
15 天前
人工智能
·
opencv
·
计算机视觉
OpenCV银行卡数字识别项目(图像预处理与字符分割)
在上一篇中,我们完成了标准化数字模板库的构建,得到了 0-9 每个数字的标准化匹配基准,为后续的字符识别准备好了「标准答案」。本模块是整个银行卡数字识别流程的核心执行部分,是连接模板库与最终识别结果的核心桥梁,负责将原始银行卡图像,转化为可直接与模板库匹配的标准化单个字符。
sali-tec
15 天前
图像处理
·
人工智能
·
opencv
·
算法
·
计算机视觉
C# 基于OpenCv的视觉工作流-章85-包胶不良检测
C# 基于OpenCv的视觉工作流-章85-包胶不良检测本章目标: 一、设定检测区域; 二、识别判定; 工件包胶不良,胶带飞边凸起,胶带整体面积增大,可以界定面积边界判定是否合格。本模块结合模板匹配,可实现工件随意摆放,适合流水线中的全检测量场景。
kaikaile1995
15 天前
开发语言
·
计算机视觉
·
matlab
图像稀疏化分解 + 压缩感知(CS)重建 MATLAB
完整流程: 图像 → 稀疏化(小波/DCT分块)→ 降采样测量 → OMP重建 → 逆变换 → 评估关键点:不用工具箱意味着我们要手搓 Haar 小波或分块 DCT,并手搓 OMP。
武子康
15 天前
人工智能
·
opencv
·
计算机视觉
·
chatgpt
·
llm
·
向量化
调查研究-180 roboflow/supervision:计算机视觉工程里的“胶水层“,为什么值得关注?
摘要:roboflow/supervision 不是一个训练框架,也不是新的视觉模型,而是一个面向计算机视觉应用开发的 Python 工程库。它的核心价值,是把 YOLO、SAM、Transformers、Roboflow Inference、Detectron2、MMDetection、VLM 等不同来源的模型输出,统一成 sv.Detections,再围绕这个统一对象做可视化、过滤、跟踪、区域计数、视频处理、数据集转换和指标评估。对于正在做视觉 demo、视频分析、机器人视觉、工业质检、交通统计、安防
装不满的克莱因瓶
15 天前
人工智能
·
python
·
深度学习
·
目标检测
·
机器学习
·
计算机视觉
·
目标跟踪
【工业领域】掌握非极大值抑制(NMS)目标检测后处理方法——从重复框消除到工程落地核心技术
目录一、前言二、为什么需要NMS(一)模型输出特点(二)问题本质(三)工业后果三、NMS核心思想(一)一句话理解
fie8889
15 天前
人工智能
·
opencv
·
计算机视觉
SSR / MSR 图像增强
Retinex 的核心假设: I(x,y) = 光照L(x,y) × 反射率R(x,y) 增强的本质是:用高斯模糊估计低频光照L,然后在对数域把L"减掉",得到细节反射R,最后再做增益/偏置拉伸。
YOLO数据集集合
15 天前
人工智能
·
深度学习
·
目标检测
·
计算机视觉
·
无人机
无人机风电设备智能巡检 风机叶片缺陷目标检测数据集实战 | 表面腐蚀漏油识别 工业视觉质检 深度学习模型训练落地10337期
#无人机风电巡检 #风机叶片缺陷检测 #目标检测实战 #工业视觉质检 #深度学习数据集 #风电设备运维 #表面缺陷识别 #漏油腐蚀检测 #AI电力巡检 #边缘部署算法
装不满的克莱因瓶
15 天前
人工智能
·
python
·
深度学习
·
机器学习
·
计算机视觉
·
目标跟踪
·
工业领域
【工业领域】了解目标检测基本流程——从数据到部署的完整工程化思路
目录一、前言二、目标检测的本质是什么(一)任务定义(二)输出内容(三)核心区别三、工业目标检测整体流程
装不满的克莱因瓶
15 天前
人工智能
·
pytorch
·
python
·
深度学习
·
目标检测
·
计算机视觉
·
目标跟踪
【工业领域】了解目标检测评估指标——从mAP到IoU的完整评价体系解析
目录一、前言二、为什么目标检测不能只看Accuracy(一)分类任务 vs 检测任务分类任务目标检测任务
m沐沐
15 天前
人工智能
·
python
·
opencv
·
计算机视觉
·
pycharm
·
numpy
【计算机视觉】OpenCV 模板匹配银行卡数字识别---下
在上篇教程中,我们已经完成了项目环境搭建、工具脚本封装、数字模板图预处理、0-9数字模板提取存储的全部核心操作,成功将标准模板图中的十个数字拆解为独立、统一尺寸的数字样本字典,为后续真实银行卡数字识别搭建了核心模板库。 本篇作为项目下篇核心实战内容,将重点讲解真实银行卡图像的全套图像处理流程、数字区域精准定位、单数字拆分、模板匹配识别、结果可视化输出全链路逻辑。全程延续零基础友好的讲解风格,逐行拆解代码原理、图像处理底层逻辑、参数设置依据,让大家不仅能跑通代码,更能理解每一步图像变换的意义,彻底掌握Ope
Dick507
16 天前
人工智能
·
计算机视觉
·
目标跟踪
ROS2 视觉感知、目标检测与 TF 控制闭环复盘:从 /camera/image_raw 到 /cmd_vel 的机器人目标跟随实现
这一阶段的核心,是理解机器人系统中一条完整的视觉感知到运动控制闭环。机器人首先通过摄像头获取图像,并把图像发布到 /camera/image_raw。随后,感知节点订阅图像话题,对图像进行 AprilTag 或 YOLO 目标检测,得到目标是否存在、目标中心点、目标偏移量、置信度等信息。