计算机视觉

m0_6501082440 分钟前
计算机视觉·扩散模型·零样本学习·论文精读·文本条件图像到视频生成
【论文精读】TI2V-Zero:零样本图像引导的文本到视频生成技术标题:TI2V-Zero: Zero-Shot Image Conditioning for Text-to-Video Diffusion Models
Jason_zhao_MR2 小时前
linux·人工智能·嵌入式硬件·计算机视觉·机器人·嵌入式·交互
RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知瑞芯微RK3576 AIoT处理器处理器凭借其卓越的多屏异显与8路摄像头接入能力,为机器人领域带来革新。米尔电子MYD-LR3576开发板实测数据显示,在高负载下CPU占用仅34%,完美实现多路视觉任务并行处理,是服务机器人开发的理想高性能平台。
mmq在路上2 小时前
人工智能·计算机视觉·目标跟踪
YOLO-World: Real-Time Open-Vocabulary Object Detection论文阅读YOLO系列检测器凭借高效实用的特性已获得广泛应用。然而,其依赖预定义训练对象类别的局限性,制约了其在开放场景中的应用。针对这一缺陷,提出YOLO-World创新方案——通过视觉-语言建模和大规模数据预训练,赋予YOLO开放词汇检测能力。 具体而言,开发了可重参数化视觉语言路径聚合网络(RepVL-PAN)和区域-文本对比损失函数,有效促进视觉与语言信息的交互。该方法在零样本检测场景中展现出卓越性能,能高效识别各类物体。 在具有挑战性的LVIS数据集上,YOLO-World在V100架构上实现35.4 A
柳鲲鹏3 小时前
人工智能·opencv·计算机视觉
全网首发:OpenCV防抖处理后,画面数据的存储及复制到原画面https://blog.csdn.net/quantum7/article/details/143586176
Fuxiao___4 小时前
人工智能·深度学习·计算机视觉
OpenVLA-OFT+ 在真实世界 ALOHA 机器人任务中的应用评估注意:与 LIBERO 评估设置不同,这里我们使用服务器 - 客户端接口。如果用户用于控制机器人的机器无法访问具有足够规格的本地 GPU 来运行微调后的 VLA 策略,这将特别有用。
AI妈妈手把手9 小时前
人工智能·算法·yolo·目标检测·计算机视觉·yolo v2
YOLO V2全面解析:更快、更准、更强大的目标检测算法在目标检测领域,YOLO V1无疑带来了一场革命性的变革。然而,正如所有初代产品一样,YOLO V1也存在一些明显的局限性:定位不够准确、对小目标检测效果差、召回率较低等问题逐渐凸显。
柠檬甜不甜呀10 小时前
数码相机·计算机视觉·机器人
海康相机与机器人标定要做相机与机器人或者行走轴模组的标定,首先需要确定相机的图像来源,优先配置好相机图像源的参数。创建标定所需物体的体征模板,并确认图像的匹配中心。
B站计算机毕业设计之家12 小时前
人工智能·深度学习·opencv·yolo·计算机视觉·零售·1024程序员节
计算机视觉:基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的零售柜商品检测识别系统(Python+PySide6界面+训练代码)(源码+文档)✅博主介绍:✌全网粉丝50W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
CoovallyAIHub13 小时前
深度学习·算法·计算机视觉
一致性模型:单步生成高质量图像,破解扩散模型速度瓶颈这篇名为《一致性模型》的论文提出了一类新的生成模型,能够一步到位地生成高质量图像,解决了扩散模型的主要瓶颈——采样过程慢、需要多次迭代。它的核心贡献在于证明了:在保持扩散模型强大表达能力和训练稳定性的同时,实现快速的一步生成和灵活的多步优化是可行的。通过理论推导和大量实验,作者表明一致性模型在一步和少步图像生成任务上达到了顶尖水平,这标志着高效、多功能生成建模向前迈出了重要一步。
音视频牛哥13 小时前
人工智能·计算机视觉·音视频·大牛直播sdk·多智能体协同·rtsp播放器rtmp播放器·视频感知低延迟音视频
AI智能体从系统智能到生态智能:SmartMediaKit 如何成为智能体时代的视频神经系统从模型到智能体,从语言到行动,AI 不再是算法的集合,而正在变成一套能感知、决策、执行的完整系统。 而在这套系统的底层,隐藏着一个被忽视的关键要素——视频神经系统。
CoovallyAIHub13 小时前
深度学习·算法·计算机视觉
搞定边缘AI部署:开源神器RamaLama,让视觉语言模型无处不在人工智能的前沿不再只是数据中心;它在于工厂车间、零售店、公共基础设施以及我们周围的智能设备。推动这一转变的是视觉语言模型(VLM),这是一个革命性的人工智能,可以解释和推理图像和视频。潜力巨大,但任何试图在边缘部署这些模型的开发人员都知道严酷的现实:这是一场与驱动程序不兼容和不一致环境的斗争。
CyberSoma13 小时前
人工智能·算法·计算机视觉·机器人
机器人模仿学习运动基元数学编码方法还有用吗?其实这些数学编码的运动基元方法非但没过时,反而在不少场景里的方向可以参考。虽说神经网络是厉害,但它像个黑箱子,出了问题不好查,而且需要大量数据,实时性也未必能保证。
CoovallyAIHub13 小时前
深度学习·算法·计算机视觉
英伟达再出「神作」!黄仁勋华盛顿GTC宣布Vera Rubin超级芯片,联手诺基亚进军6G,市值直逼5万亿美元昨夜,黄仁勋又“炸场”了。在 2025 年 10 月的 GTC 大会上,从量子计算到6G通信,从超级芯片到AI工厂,黄伟达在华盛顿勾勒出美国AI世纪的宏伟蓝图。
格林威1 天前
人工智能·数码相机·计算机视觉·视觉检测·制造·工业相机
AOI在新能源电池制造领域的应用在新能源电池(锂电池、钠离子电池等)制造中,“极片划痕、电芯短路、模组装配错位” 等缺陷,不仅会导致电池容量衰减、寿命缩短,更可能引发热失控、起火等安全事故。AOI(自动光学检测) 凭借高速精准的缺陷识别能力、24 小时不间断工作特性,成为电池制造全流程质量管控的 “安全卫士”—— 从极片生产到模组封装,全程拦截微观缺陷,既保障电池使用安全,又提升生产良率。今天就从电池制造流程切入,拆解 AOI 的 3 大核心应用场景,解析其如何为新能源电池产业 “降本增效、保驾护航”。
Coovally AI模型快速验证1 天前
人工智能·深度学习·机器学习·计算机视觉·自动驾驶·transformer
OmniNWM:突破自动驾驶世界模型三大瓶颈,全景多模态仿真新标杆(附代码地址)上海交通大学等机构联合提出全能驾驶导航世界模型,在生成质量与控制精度上全面超越现有SOTA!目录三大核心挑战:现有世界模型的局限性
m0_650108241 天前
计算机视觉·图像生成·视频生成·dim·论文精读·双向状态空间模型·高效生成模型
【论文精读】Diffusion Mamba:基于双向 SSM 的高效图像与视频生成架构标题:Scaling Diffusion Mamba with Bidirectional SSMs for Efficient Image and Video Generation
格林威1 天前
大数据·人工智能·数码相机·计算机视觉·ai·制造·aoi
AOI在传统汽车制造领域中的应用在传统汽车制造中,从发动机缸体到车身焊接,从电子 PCB 板到零部件装配,任何微小缺陷(如缸体砂眼、焊接虚焊、电子元件错装)都可能影响汽车性能与行车安全。AOI(自动光学检测) 凭借高速成像、精准缺陷识别和 24 小时不间断工作的优势,替代人工完成 “肉眼难辨、重复枯燥” 的质检工作,成为传统汽车制造全流程质量管控的核心设备。今天就从汽车制造关键环节切入,拆解 AOI 的 3 大核心应用场景,解析其如何为传统汽车制造 “降本增效、保障安全”。
B站计算机毕业设计之家1 天前
深度学习·qt·opencv·yolo·目标检测·计算机视觉·1024程序员节
计算机视觉:pyqt5+yoloV5目标检测平台 python实战 torch 目标识别 大数据项目 目标跟踪(建议收藏)✅博主介绍:✌全网粉丝50W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
知来者逆1 天前
人工智能·yolo·目标检测·计算机视觉·1024程序员节·目标追踪·yolov12
计算机视觉——从环境配置到跨线计数的完整实现基于 YOLOv12 与质心追踪器的实时人员监控系统在本课中,我们将继续探索 YOLOv12,它是第一个融入注意力机制的 YOLO 模型——包括 RELAN、区域注意力(Area Attention) 以及用于快速推理的可选 FlashAttention 支持等创新。正如我们在上一个教程中所介绍的,YOLOv12 引入了一个灵活的架构,支持先前版本(例如 YOLOv11 和 YOLOv8)提供的所有主要任务,包括目标检测、分割、分类和姿态估计。
这张生成的图像能检测吗1 天前
图像处理·人工智能·目标检测·计算机视觉·低照度图像增强
(论文速读)超像素引导低光图像增强与特征恢复论文题目:Super-Pixel Guided Low-Light Images Enhancement with Features Restoration(超像素引导低光图像增强与特征恢复)