技术栈
计算机视觉
CoovallyAIHub
5 天前
深度学习
·
算法
·
计算机视觉
仿生学突破:SILD模型如何让无人机在电力线迷宫中发现“隐形威胁”
在智能电网巡检中,无人机已成为标配。然而,一个致命问题始终困扰着行业:返航途中的撞线事故。纤细的电力线在传统视觉系统中如同“隐形”。本文解读一种受生物启发的创新方案——尺度不变逼近检测器(SILD)。该模型模拟蝗虫的“逃逸神经元”,在计算资源有限的小型无人机上,实现了对电力线及多尺度障碍物的实时、精准检测,为无人机避障开辟了新的仿生路径。
CoovallyAIHub
5 天前
深度学习
·
算法
·
计算机视觉
从春晚机器人到零样本革命:YOLO26-Pose姿态估计实战指南
春晚舞台上,机器人群体的整齐划一令人惊叹——但如果想让机器人真正理解并模仿人类的复杂动作,我们需要怎样的视觉技术?
CoovallyAIHub
5 天前
深度学习
·
算法
·
计算机视觉
Le-DETR:省80%预训练数据,这个实时检测Transformer刷新SOTA|Georgia Tech & 北交大
训练一个顶级的实时目标检测模型,要花多少钱?这个问题,放在几年前,答案可能是“天价”。你得准备海量的数据,堆上成百上千张显卡,跑上几周甚至几个月。到了今天,虽然技术成熟了不少,但一些顶会论文里的模型,依然像娇贵的兰花——它们在特定的、昂贵且不公开的“温室”(超大规模的预训练数据集)里长大,旁人想复现?门都没有。
CoovallyAIHub
5 天前
深度学习
·
算法
·
计算机视觉
强化学习凭什么比监督学习更聪明?RL的“聪明”并非来自算法,而是因为它学会了“挑食”
想象一下,你同时用两种方法教导两个学生解数学题。一个学生(SFT)只是死记硬背你做过的每一道例题,连你的笔迹都想模仿。另一个学生(RL)呢,你只告诉他答案是对是错,让他自己琢磨规律。考试的时候,遇到没讲过的题,谁更可能答对?
CoovallyAIHub
5 天前
深度学习
·
算法
·
计算机视觉
YOLO-IOD深度解析:打破实时增量目标检测的三重知识冲突
增量目标检测(Incremental Object Detection, IOD)旨在让检测模型能够持续学习新类别,同时不遗忘已学类别的知识。 这一能力对于部署在动态环境中的视觉系统至关重要——试想一个自动驾驶系统,它需要不断适应新出现的道路目标类型,却又不能忘记之前学会的行人、车辆等基础类别。
这张生成的图像能检测吗
7 天前
人工智能
·
计算机视觉
·
nlp
·
注意力机制
(论文速读)XLNet:语言理解的广义自回归预训练
论文题目:XLNet: Generalized Autoregressive Pretraining for Language Understanding(语言理解的广义自回归预训练)
十铭忘
7 天前
人工智能
·
计算机视觉
自主认知-行动1——架构
目录一、前言二、自主认知-行动架构1.0关键设计特征三、自主认知-行动架构1.0画法2四、衍生实现框架:AutoLearner v1.0
yuzhuanhei
7 天前
人工智能
·
计算机视觉
·
目标跟踪
YOLO26实操记录(自用)
YOLOv1版本:在当时主流目标检测模型都使用两阶段的方法:滑动窗口生成候选再进行分类和回归,YOLOv1提出了一次前向传播输出所有检测结果,无候选框生成的单阶段目标检测方法,具体来说是将图像分成S×S的网格,然后每个网格预测2个预测框。
sali-tec
7 天前
图像处理
·
人工智能
·
opencv
·
算法
·
计算机视觉
C# 基于OpenCv的视觉工作流-章27-图像分割
C# 基于OpenCv的视觉工作流-章27-图像分割本章目标: 一、理论概念; 二、图像处理; 三、设置背景图; 四、设置前景图; 五、计算边缘图; 六、构建标识图; 七、图像分割; 一、理论概念; 详细见文末链接 二、图像处理; 对图像进行转灰度图、二值化、开运算去毛刺处理(前文章有介绍,不再描述),得到目标为白色,其它为黑色的图像,如下图所示。 三、设置背景图; 将处理后的图像进行膨胀运算(前文章有介绍,不再描述),再将所得图像作为背景图,用于后续运算,如下图所示。 膨胀的目的是为了取得更多的边缘地带
音视频牛哥
7 天前
android
·
人工智能
·
计算机视觉
·
音视频
·
rtmp播放器
·
安卓rtmp播放器
·
rtmp直播播放器
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
摘要:本文以大牛直播SDK(SmartMediaKit)为基础,结合RTMP协议规范,详细讲解如何在Android平台上实现超低延迟的RTMP/RTSP直播播放器,包括架构设计、核心模块封装、参数调优、录像管理以及回放播放等完整工程实践,所有代码均来自真实Demo工程。
咚咚王者
7 天前
人工智能
·
计算机视觉
人工智能之视觉领域 计算机视觉 第十六章 图像拼接
第十六章 图像拼接学习目标:掌握将2~3张具有重叠区域的图像自动拼接为一张无缝全景图的核心流程,理解特征匹配、单应性变换与图像融合三大关键技术,并能用 OpenCV 实现端到端的拼接系统。
开开心心就好
7 天前
windows
·
决策树
·
计算机视觉
·
pdf
·
计算机外设
·
excel
·
动态规划
安卓开源应用,超时提醒紧急人护独居安全
软件介绍这款叫 Keep Alive 的APP,是开源免费的安卓端应用。跟苹果那款“死了么”比,它不用签到,但要是你没在规定时间打开用,它就会自动给设好的紧急联系人发短信、打电话。
雪人不是菜鸡
7 天前
人工智能
·
数码相机
·
计算机视觉
镜头分辨率分析
相机分辨率:由芯片像素数量决定(如500万像素),决定了图像由多少个点构成。镜头分辨率(解析力):镜头作为光学系统,能分辨物体细节的极限能力,通常用 “线对/毫米” (lp/mm) 表示。
guygg88
7 天前
图像处理
·
opencv
·
计算机视觉
图像匹配技术:相关匹配、Hausdorff距离匹配与基于距离变换的Hausdorff距离匹配
图像匹配是计算机视觉中的核心任务,用于在图像中定位已知模板或特征。本文将详细介绍三种重要的图像匹配技术:相关匹配、Hausdorff距离匹配和基于距离变换的Hausdorff距离匹配,并提供完整的MATLAB实现代码。
qq_52609913
7 天前
图像处理
·
数码相机
·
计算机视觉
·
自动化
图像采集卡:机器视觉系统的“数据中枢”,解锁精准成像新可能
在工业自动化、智能检测、医疗影像、安防监控等领域,机器视觉技术正成为提升效率、保障精度的核心支撑。而在整套机器视觉系统中,图像采集卡作为连接图像采集设备(相机、摄像头等)与计算机的关键纽带,承担着信号转换、数据传输、同步控制的核心使命,如同系统的“数据中枢”,直接决定了图像采集的效率、精度与稳定性,其重要性往往被低估,却贯穿了视觉应用的全流程。
硅谷秋水
7 天前
深度学习
·
机器学习
·
计算机视觉
·
语言模型
·
机器人
从机制角度看视频生成作为世界模型:状态与动态
26年1月来自港科大(广州)、同济大学和快手公司的论文“A Mechanistic View on Video Generation as World Models: State and Dynamics”。
浩瀚之水_csdn
7 天前
计算机视觉
avformat_new_stream 详细解析
avformat_new_stream用于在 AVFormatContext 中创建一个新的媒体流。这是复用(muxing)过程中的关键函数,用于构建输出文件的流结构。
fie8889
7 天前
opencv
·
计算机视觉
·
matlab
基于Matlab实现的指纹识别系统流程
基于Matlab实现的指纹识别系统流程,涵盖图像预处理→特征点提取→特征匹配三大核心环节,结合经典算法与工程实践
sali-tec
8 天前
图像处理
·
人工智能
·
opencv
·
算法
·
计算机视觉
C# 基于OpenCv的视觉工作流-章26-图像拼接
C# 基于OpenCv的视觉工作流-章26-图像拼接本章目标: 一、图像拼接; 一、图像拼接; OpenCv 图像拼接可如下使用 Stitcher stitcher = Stitcher.Create(Stitcher.Mode.Scans); Mat pano = new Mat(); var status = stitcher.Stitch(images, pano); 其中:参数1,为输入图像列表,两张图; 参数2,为输出图像;
xinxiangwangzhi_
8 天前
图像处理
·
计算机视觉
立体匹配--Cross-Scale Cost Aggregation for Stereo Matching
这篇文中主要提出了一种利用多尺度图像构建约束方程从而直接求解视差的框架,而不是像其他密集匹配算法进行相似性度量下进行赢者通吃匹配。并且这种框架是天然兼容大多数代价计算方式的。代码开源:https://github.com/rookiepig/CrossScaleStereo