深度学习

天天进步20152 小时前
python·深度学习·音视频
Python全栈项目--基于深度学习的视频目标跟踪系统在人工智能视觉应用中,目标检测和目标跟踪是两个非常重要的方向。目标检测解决的是“画面中有什么、在哪里”的问题,而目标跟踪进一步解决的是“这个目标在视频中如何连续移动”的问题。
AI人工智能+4 小时前
人工智能·深度学习·ocr·银行卡识别
融合图像处理与模式识别算法的智能银行卡识别系统,为金融行业带来了革命性的效率提升在数字化金融浪潮的推动下,移动支付、在线开户及无卡交易已成为常态。然而,如何快速、准确地将物理世界中的银行卡信息转化为数字世界的可用数据,一直是金融科技领域的核心挑战之一。传统的光学字符识别(OCR)技术在处理复杂背景、反光卡片或模糊图像时往往力不从心。如今,随着人工智能与深度学习技术的飞速发展,融合图像处理与模式识别算法的智能银行卡识别系统应运而生,为金融行业带来了革命性的效率提升。
zhangfeng11336 小时前
人工智能·深度学习·transformer
Mamba transformer的颠覆者 论文技术解读与应用实践深度报告,blog.csdnimg.cn/direct/d21dccf6f0bf45169ba25e9dd2832cef.png)在这里插入图片描述
动物园猫7 小时前
深度学习·yolo·目标检测
外墙裂缝目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1DoDlXWNUvZbVAnzfo1sMQQ?pwd=hjyx
郑洁文8 小时前
人工智能·深度学习·神经网络·车牌识别
基于卷积神经网络的智能车牌识别系统随着我国机动车保有量的迅速增长和智能交通系统的广泛应用,车牌识别技术已成为智能交通领域的重要研究方向。本文设计并实现一种基于卷积神经网络的智能车牌识别系统,旨在解决传统人工识别效率低下、准确率不稳定等问题。 系统采用Flask框架作为后端服务框架,使用PyTorch深度学习框架构建和训练CNN模型,集成MySQL数据库进行数据持久化存储,并提供Web界面。系统支持多种图像格式上传,能够实时处理用户请求并返回识别结果。数据预处理实现多层次的图像处理技术,包括图像质量检测、灰度转换、直方图均衡化、自适应阈值分
红宝村村长8 小时前
深度学习
loss.backward() 和 梯度累积这一行调用的是 PyTorch 的反向传播机制——核心作用是:从 loss 出发,沿着前向构建的计算图反向走,对所有 requires_grad=True 的参数计算梯度(∂loss / ∂param)并累加到 param.grad 上。
>ᴗoಣ9 小时前
人工智能·深度学习
COSER: Coordinating LLM-Based Persona Simulation of Established Roles角色扮演语言智能体,即 RPLAs,已经成为大语言模型的一类有前景的应用。然而,对于 RPLA 来说,模拟已经存在的成熟角色仍然是一项具有挑战性的任务。这主要是因为缺乏真实可靠的角色数据集,以及缺乏能够利用这些数据进行细致评价的方法。
云和数据.ChenGuang9 小时前
人工智能·深度学习·机器学习·自然语言处理·数据挖掘·边缘计算
openEuler下NLP模型的部署和推理openEuler 是面向服务器、云计算、高性能计算的开源国产化操作系统,依托鲲鹏 ARM 硬件生态、高效内存管理机制、毕昇编译器与 BoostKit 软件加速套件,成为国产化 NLP 落地主流环境。传统 x86 环境训练的 BERT、RoBERTa、TextCNN 等 NLP 模型直接迁移至 openEuler 系统常出现算子运行低效、推理延迟高、内存占用过大等问题。本文从环境适配、框架编译、模型优化、工程部署、性能调优五个维度,介绍在 openEuler 中基于 PyTorch 完成 NLP 分类模型
人工智能培训10 小时前
人工智能·深度学习·机器学习·容器·知识图谱
数字孪生建模常用方式有哪些?数字孪生是依托数字化手段构建物理实体、场景或系统的虚拟镜像,实现虚实映射、同步迭代、仿真推演的核心技术,而建模是数字孪生落地的基础与核心环节。数字孪生建模并非单一技术体系,而是结合几何形态、物理特性、运行规律、动态数据的综合建模工程。随着技术迭代,行业逐步形成多种成熟建模方式,适配智慧城市、工业制造、建筑工程、交通运维等不同场景。本文将详细介绍数字孪生主流建模方式,剖析其原理、特点与适用场景。
轻刀快马10 小时前
人工智能·深度学习·机器学习
跨越“拟人”的最后一道天堑:大模型强化学习(RLHF/RLAIF)底层原理解析在上一篇笔记中,我们聊到了 SFT(监督微调),也就是让人类写好“问答示范”给模型学。但前沿 AI 企业很快发现了一个致命瓶颈:人类可以教模型“什么是对的”,但很难教模型“什么是更好的”。
大江东去浪淘尽千古风流人物10 小时前
网络·深度学习·transformer·slam·位姿估计·kv-cache
【KV-Tracker】Transformer 实时位姿跟踪:KV-Cache 加速多视图几何网络达 27FPS多视图 3D 几何 Transformer(如 DUSt3R、MASt3R、π³)精度惊人,但全连接注意力的 O ( N 2 ) O(N^2) O(N2) 复杂度使其无法实时运行。Imperial College London 的 KV-Tracker 提出了一个无需额外训练的加速方案:在映射阶段缓存全局自注意力的 Key-Value 对,追踪阶段仅编码单帧并查询缓存,实现约 15× 加速和 27 FPS 实时跟踪。在 TUM RGB-D 上 ATE 0.108m,超越 TTT3R(0.132m)和 CU
lqqjuly11 小时前
深度学习·推荐算法
推荐系统技术解析(Recommendation Systems)
老鱼说AI11 小时前
人工智能·深度学习·神经网络·机器学习·学习方法·集成学习·boosting
统计学习方法第八章:BoostingBoosting 就是把简单模型依次串联,每一步都死死盯着上一步的短板(损失函数的负梯度方向),通过加权修正,最终累加出一个极其强大的集成模型。
钓了猫的鱼儿12 小时前
人工智能·深度学习·无人机
基于深度学习+AI的无人机森林火灾目标检测与预警系统(Python源码+数据集+UI可视化界面+YOLOv11训练结果)传统森林火灾目标检测与预警依赖人工巡护、瞭望塔观测、地面监测点值守、肉眼识别与手工上报,受人力成本高、巡护覆盖范围有限、主观判断偏差大、复杂森林环境适配性差、高大乔木冠层遮挡监测难度大、夜间及恶劣天气无法正常作业、初期微小火点易遗漏、火点识别不精准等因素制约,难以实现对森林火灾这一类核心目标、多场景的全天时、全天候、全区域精准检测与实时预警,而AI智能分析技术可依靠深度学习算法自动挖掘森林火灾的火点特征、燃烧规律、烟气形态变化与环境关联信息,精准捕捉森林火灾不同燃烧阶段(初期明火、中期蔓延、后期暴发)的火
无负今日_tq12 小时前
人工智能·深度学习·条纹
【无标题】2026 年第 23 周 · 06.03雷猴啊,朋友们!又到了每周挖 GitHub 宝藏的时间。本期从具身机器人、AI Agent、3D 视觉三个方向各挑了几匹黑马,覆盖最火的新星和最实用的利器。坐稳,发车——
爱吃肉的鹏12 小时前
人工智能·深度学习
基于深度学习的电缆异常检测本文主要介绍使用深度学习进行电缆的异常检测,在少样本、免训练的情况下,实现对电缆等目标的异常检测并进行标记。
钓了猫的鱼儿12 小时前
人工智能·深度学习·目标检测
基于深度学习+AI的茶叶病害目标检测与预警系统(Python源码+数据集+UI可视化界面+YOLOv11训练结果)传统茶叶病害目标检测与监测依赖人工巡查、叶片抽样、肉眼判断与手工记录,受人力成本高、巡检覆盖范围有限、主观判断偏差大、复杂茶园环境适配性差、茶叶密集冠层监测难度大、夜间及恶劣天气无法正常作业、微小病害症状易遗漏、病害类型判断不精准等因素制约,难以实现对Tea ring rot(茶轮斑病)、Tea-algae-leaf-spot(茶藻斑病)、Tea-bud-blight(茶芽枯病)、tea-leaf-blight(茶树叶枯病)四类核心病害目标、多场景的全天时、全天候、全区域精准检测与实时预警,而AI智能分析
云和数据.ChenGuang12 小时前
人工智能·深度学习·学习·机器学习·数据挖掘
深度学习在鲲鹏HPC下的学习随着卷积神经网络、大语言模型等深度学习算法向高精度、超大参数量方向演进,传统x86 HPC平台面临算力功耗偏高、内存带宽瓶颈、国产化适配困难等痛点。以鲲鹏920处理器为核心的国产HPC集群依托ARMv8+SVE向量架构、多NUMA众核设计,搭配昇腾NPU异构加速、HPCKit全栈软件生态,形成CPU+NPU软硬协同的神经网络优化体系。本文从硬件架构适配、算子底层优化、框架编译调优、分布式并行、模型轻量化、IO与系统调优六大维度,系统阐述鲲鹏HPC下神经网络训练与推理全链路优化方案,并结合CNN、大模型微调
YOLO数据集集合13 小时前
人工智能·深度学习·yolo·目标检测·计算机视觉·无人机
无人机航拍+深度学习落地智慧农业:作物出苗率目标检测开源数据集工程详解|YOLO作物计数、田间苗期AI监测、农情数字化训练资源国内规模化大田种植逐年扩张,依靠人工实地清点秧苗核算出苗成本居高不下,规模化基地单地块人工普查成本可达百元/亩,抽样统计误差普遍高于13%;无人机遥感+深度学习自动株数统计已成行业落地刚需,但高质量田间实景标注数据集稀缺、田间复杂环境样本缺失,长期制约农业AI项目落地迭代。本文以开源航拍作物苗期数据集为核心,遵循GitHub开源仓库README规范撰写全文档,补齐数据集明细台账、数据统计表格、全链路预处理+训练+推理源码,代码附带农业落地场景经验注释,完整覆盖数据盘点、格式转换、数据集拆分、模型训练、出苗
烬羽13 小时前
深度学习
从零搭建AIGC应用:英伟达NIM + Node.js实战最近AIGC火得一塌糊涂,各种大模型层出不穷。作为一名开发者,如何快速接入这些AI能力,构建自己的智能应用?今天我将带你从零开始,使用英伟达NIM平台和OpenAI SDK,一步步搭建一个完整的AIGC应用。