计算机视觉

搞科研的小刘选手3 分钟前
人工智能·物联网·机器学习·计算机视觉·自动化·能源·电气
【国家电网省科学研究院支持】第七届物联网、人工智能与电气能源国际学术会议(IoTAIEE 2026)第七届物联网、人工智能与电气能源国际学术会议(IoTAIEE 2026)2026 7th International Conference on Internet of Things, Artificial Intelligence and Electronical Energy (IoTAIEE 2026)
jinxindeep27 分钟前
人工智能·深度学习·计算机视觉
字节Lance:轻量级原生统一多模态模型,以多任务协同实现理解与生成的新范式字节跳动智能创作实验室提出仅3B激活参数的统一多模态框架arXiv: 2605.18678 ByteDance
ZHW_AI课题组32 分钟前
人工智能·计算机视觉·目标跟踪
利用YOLOv8在COCO128数据集上的目标检测贾晓莉,女,西安工程大学电子信息学院,2025级研究生研究方向:水下目标定位电子邮件:2823488372@qq.com
我没胡说八道9 小时前
人工智能·深度学习·机器学习·计算机视觉·aigc·论文
高校论文AI检测优化工具对比研究与实测分析(2026)在人工智能快速发展的背景下,大学生论文写作、课程报告、毕业设计大量借助AI辅助完成,随之而来的是高校AI检测系统的全面升级。目前知网、维普等主流检测平台,均可精准识别机器生成文本、句式模板化内容与AI特征语句,导致大量论文出现AI相似度超标问题。为有效解决论文机器特征过高、无法正常提交审核的问题,各类AI文本优化工具应运而生。本文选取当前市场主流的六款论文降AI工具,通过统一文本实测、多维度对比分析,探究各平台的实际优化效果、适配优势与适用场景,为学生论文修改提供客观、科学的参考依据。
探物 AI10 小时前
python·yolo·计算机视觉
把 MambaOut 塞进 YOLOv11:会有什么样的反应yolov11改进系列第15篇 作者:小探 发布时间:2026年6月 关键词:Mamba,yolov11改进
我最爱吃鱼香茄子17 小时前
计算机视觉·性能优化·电脑·笔记本电脑·intellij-idea·程序员创富·webstorm
终极方案:JetBrains IDE永久解放C盘空间很多程序员小伙伴,明明把 IDEA、WebStorm 安装在D/E盘,从未装在C盘,但电脑C盘空间依然持续缩水、频繁爆红!每次手动清理索引缓存,没过几天缓存又爆满,项目打开越来越卡顿。
玖釉-18 小时前
c++·windows·计算机视觉·图形渲染
Vulkan 离屏渲染详解:从 Framebuffer 到后处理、阴影贴图与 Render Texture在 Vulkan 中,最常见的渲染流程是:从 Swapchain 获取一张交换链图像;把场景直接渲染到这张图像上;
路人甲32619 小时前
人工智能·深度学习·计算机视觉·机器人·具身智能
SONIC: Supersizing Motion Tracking for Natural Humanoid Whole-Body Control“我们证明,扩大模型容量、数据和计算量可以产生一个通用的人形控制器,能够创建自然且强大的全身运动。具体来说,我们将运动跟踪视为人形控制的一项自然且可扩展的任务,利用来自不同运动捕捉数据的密集监督来获取人体运动先验,而无需手动奖励工程。”
armwind20 小时前
图像处理·计算机视觉
openISP学习8-GC — Gamma Correction(Gamma 校正)在图像信号处理器(ISP)中,Gamma校正(Gamma Correction)是图像处理流水线中至关重要的非线性操作。它的核心作用是解决图像传感器、人眼视觉感知以及显示设备之间的非线性差异,从而让最终呈现的图像更加自然、通透。
大江东去浪淘尽千古风流人物20 小时前
深度学习·计算机视觉·transformer·slam·vio·3d重建
【VGGT-Ω】前馈式3D重建的规模化之路:Register Attention、自监督训练与10B参数Scaling Law深度解析现有前馈式3D重建模型(如VGGT、DUSt3R、MASt3R)虽然摆脱了后优化流程,但模型规模和数据规模对重建精度的影响尚未被系统探索。VGGT-Ω 在架构、数据和训练三个维度同时做了规模化改进:引入 Register Attention 替代部分全局注意力以降低计算开销,用单一 Dense Head + Pixel Shuffle 替代多头 DPT 以节省显存,并构建了覆盖4M序列(含动态场景)的高质量标注流水线。最终在 Sintel 上相机位姿估计 AUC@3° 从22.5提升到40.0(+77%)
断眉的派大星20 小时前
人工智能·笔记·学习·yolo·目标检测·计算机视觉·目标跟踪
YOLO26 完整学习笔记:从 Anchor-Free、TAL、STAL 到端到端无 NMS 部署面向目标检测学习、源码阅读与工程部署的系统笔记 整理日期:2026-06-08 主要依据:Ultralytics 官方论文、官方文档与 ultralytics 仓库当前 main 分支 论文版本:arXiv v1,2026-06-02 发布,尚不能等同于经过同行评审的正式会议版本
却道天凉_好个秋1 天前
人工智能·计算机视觉·hevc·ctc
HEVC(六):CTC**HEVC CTC(Common Test Conditions,通用测试条件)*是国际视频编码联合标准组(JCT-VC)在制定 H.265/HEVC 标准以及后续进行学术研究、技术提案对比时,所确立的*一套绝对权威、严格统一的基准测试规范。
FOORIR 客流统计1 天前
人工智能·计算机视觉·目标跟踪
客流统计系统的工程实现:从线穿越计数到多目标跟踪客流统计系统最早的实现方式比较简单,本质就是“穿线计数”。在实际项目里,一般是摄像头画一条虚拟线,目标穿过就+1。
YOLO数据集集合1 天前
人工智能·深度学习·目标检测·计算机视觉·无人机
无人机电力巡检图像数据集 | 输电线路故障智能识别 深度学习目标检测数据集实战#智慧电网 #无人机巡检 #输电线路故障检测 #计算机视觉 #目标检测 #深度学习数据集 #电力AI运维 #线路异物检测 #线路覆冰识别
cjie2211 天前
计算机视觉·fpga开发
lanczos插值引起的振铃现象在图像缩放领域,bicubic双立方插值算法一般是4抽头,而为了取得更好的画质,增加到6抽头或8抽头时,往往会采用lanczos(兰佐斯)插值算法。但是如果直接使用lanczos插值系数则会出现振铃现象,就是指放大或插值过程中,图像锐利边缘附近出现明暗交替的“波纹”或“鬼影”伪影,本质是插值核(如Sinc、Lanczos)的振荡特性与灰度阶跃卷积引发的吉布斯现象。吉布斯现象‌‌——有限带宽逼近不连续信号必然在跳变点附近产生约9%过冲及振铃;并非错误,而是数学必然。
盼小辉丶1 天前
python·opencv·计算机视觉
OpenCV-Python实战(26)——复杂场景下的实时物体检测与跟踪我们已经学习了如何在高度受控的环境中检测并跟踪一个简单物体(手的轮廓)。更具体地说,我们指导应用的用户将手放在屏幕中央区域,然后对物体(手)的大小和形状做出了假设。在本节中,我们希望检测并跟踪任意大小的物体,这些物体可能从多个不同角度或部分遮挡的情况下被观察。 为此,我们将利用特征描述符,这是一种捕获感兴趣物体重要属性的方法。我们这样做是为了即使物体嵌入在复杂的视觉场景中,也能定位到它。我们将把算法应用于网络摄像头的实时视频流,并尽力保持算法的鲁棒性,同时使其足够简单以实时运行。
armwind1 天前
图像处理·计算机视觉
openISP学习9-CSC-Color Space Conversion(色彩空间转换)下面以RGB->YUV为例,一起来验证一下.将 RGB 图像转换为 YCbCr(YUV)色彩空间。Y 分量表示亮度,Cb/Cr 表示色度差,便于后续亮度和色度的独立处理(降噪、边缘增强等)。
YOLO数据集集合2 天前
人工智能·深度学习·目标检测·计算机视觉·无人机
智慧林业无人机巡检 松材线虫病害树木实例分割数据集 | 森林枯木识别 深度学习视觉随着低空无人机巡检在现代智慧林业中全面普及,传统目标检测算法仅能框选树木、枯木等目标,无法完成单株树木病害精细化像素级分割、个体病害程度区分,成为林业病虫害智能防控落地的核心瓶颈。松材线虫作为林业高危病害,依赖人工巡检效率低、漏检率高,而适配林业实景的专业实例分割公开数据集稀缺,极大阻碍了YOLO、Mask R-CNN、SAM等分割模型在林业场景的迭代优化。本文详解一套面向无人机航拍场景的林业病害专属实例分割数据集,配套完整使用代码、数据解析与训练方案,助力开发者快速落地森林病害识别、枯木巡检等计算机视觉
却道天凉_好个秋2 天前
人工智能·算法·计算机视觉·环路滤波
HEVC(一):环路滤波在高效视频编码(HEVC/H.265)标准中,环路滤波(In-Loop Filtering)是提升压缩效率和重建图像质量的关键技术之一。由于 HEVC 采用了基于块的混合编码框架(包含预测和变换),在低码率下不可避免地会引入块效应(Blocking Artifacts)**和**振铃效应(Ringing Artifacts)。
源代码杀手2 天前
算法·计算机视觉·机器人
基于ROS2+Gazebo+RIVE的40项计算机视觉前沿机器人项目(含视觉算法原理与源码获取方式)基于ROS2+Gazebo+RIVE的40项计算机视觉前沿机器人项目(含视觉算法原理)所有项目统一技术底座:Ubuntu22.04 + ROS2 Humble + Gazebo Harmonic + RIVE仿真交互平台,所有项目均内置核心计算机视觉算法,涵盖2D检测、语义分割、实例分割、光流跟踪、三维重建、多模态视觉、视觉SLAM、视觉强化学习、视觉轨迹预测等主流CV技术,适配机器人前沿科研与工程落地。(获取源码渠道:https://space.bilibili.com/358594193?spm_id