深度学习

动物园猫20 分钟前
深度学习·yolo·无人机
无人机角度的道路损害检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1CkmQRHQDjXzGa9KESO0i2A?pwd=snt5
手写码匠38 分钟前
人工智能·深度学习·算法·aigc
手写 Prefix Caching:从零构建 LLM 提示词缓存引擎用过 ChatGPT、Claude 或 DeepSeek 的开发者可能都遇到过这种情况:同样的系统提示词(System Prompt),每次对话都要重复传输和计算。无论你是在对话窗口粘贴了一遍又一遍的"你是一个资深 Python 工程师",还是在 API 调用中反复传递长达数千 token 的上下文指令,这些看似无伤大雅的重复,实际上在后台浪费了大量的算力和时间。
AI人工智能+1 小时前
深度学习·计算机视觉·自然语言处理·ocr·表格识别
基于深度学习与计算机视觉的表格识别技术:不仅能精准提取表格中的文字内容,更能深度解析复杂的表格结构,实现版面信息的完美还原在数字化转型的浪潮中,数据是企业的核心资产。然而,据相关统计显示,全球约80%的企业数据以非结构化或半结构化的形式存在,其中表格(Table)是最常见且最具价值的载体之一。从财务报表、医疗病历到物流单据,表格承载着海量关键信息。然而,传统的光学字符识别(OCR)技术往往只能提取文字内容,却难以理解表格的行列结构,导致数据“孤岛”化,无法直接用于下游分析。
盼小辉丶2 小时前
pytorch·python·深度学习·强化学习
PyTorch强化学习实战(11)——N步DQN(N-step DQN)自从 DeepMind 在 2015 年提出深度Q网络 (Deep Q-Network, DQN) 模型以来,研究人员已经提出了诸多改进方案,通过对基础架构的调整显著提升了原始 DQN 的收敛性、稳定性和样本效率。 2017 年 DeepMind 的 Hessel 等人发表了名为 Rainbow: Combining improvements in deep reinforcement learning 的论文,系统性地整合了 DQN 的六大核心改进。仅通过这六种方法的组合,便在 Atari 游戏测试集上
睡个好觉(努力提升自己版)2 小时前
人工智能·深度学习·机器学习
2026_TIP_image_Restoration(最新方法)本文整理 2026 年 IEEE Transactions on Image Processing 中图像复原相关论文体现出的先进方法趋势,并重点标注对遥感图像融合、尤其是 pansharpening 可借鉴的方向。
code_pgf2 小时前
深度学习·ocr
CRNN + CTC OCR 原理详解本文面向 OCR 模型部署、轻量化文本识别、ONNX/MNN/C++ 推理落地等工程场景,系统说明 CRNN + CTC 的核心原理、网络结构、训练方式、解码流程、工程部署要点与适用场景。
数学建模导师2 小时前
人工智能·深度学习·机器学习
【AI生成内容的质量评估】2026中青杯B题26页成品论文重磅更新本文围绕 AI 生成图像与视频质量评价问题展开研究,研究对象包括附件 1 中 8 张 AI 生成图像和附件 2 中车内视角车流视频。针对图像无参考评价缺少真实参照、图文一致性与成像质量难以统一度量、视频质量受时序波动影响等特点,构建了由语义保真度、技术质量、结构完整性、时序稳定性共同组成的评价框架,并结合极差归一化、加权综合、分位阈值划分、跨模型一致性检验及时序失稳判定完成质量评估。
沐籽李3 小时前
人工智能·深度学习·模型·药物研发·aidd
Protein Hunter:当结构预测模型开始“反向设计”蛋白在过去几年里,蛋白质设计领域发生了一个很有意思的变化。最早,人们问的是:给定一个蛋白序列,它会折叠成什么结构?
Kobebryant-Manba3 小时前
人工智能·深度学习
下载李沐老师动手深度学习源码16.1. 使用Jupyter Notebook — 动手学深度学习 2.0.0 documentation https://zh-v2.d2l.ai/chapter_appendix-tools-for-deep-learning/jupyter.html16.1. 使用Jupyter Notebook — 动手学深度学习 2.0.0 documentation
莫宰特3 小时前
人工智能·python·深度学习·从零训练
NNMind:像搭积木一样设计神经网络让神经网络设计,从抽象的代码堆栈,回到清晰、直观、可交流的结构表达。项目地址: NasNeo777/NNMind.git
星越华夏3 小时前
pytorch·深度学习·yolo·分类
深度学习项目实战:基于PyTorch的图像分类与目标检测(YOLOv8)目标检测是计算机视觉领域的核心技术之一,广泛应用于自动驾驶、安防监控、工业检测、医疗诊断等领域。YOLO(You Only Look Once)系列算法因其高效性和准确性成为目标检测的主流方案。
天天进步201514 小时前
python·深度学习·音视频
Python全栈项目--基于深度学习的视频目标跟踪系统在人工智能视觉应用中,目标检测和目标跟踪是两个非常重要的方向。目标检测解决的是“画面中有什么、在哪里”的问题,而目标跟踪进一步解决的是“这个目标在视频中如何连续移动”的问题。
AI人工智能+16 小时前
人工智能·深度学习·ocr·银行卡识别
融合图像处理与模式识别算法的智能银行卡识别系统,为金融行业带来了革命性的效率提升在数字化金融浪潮的推动下,移动支付、在线开户及无卡交易已成为常态。然而,如何快速、准确地将物理世界中的银行卡信息转化为数字世界的可用数据,一直是金融科技领域的核心挑战之一。传统的光学字符识别(OCR)技术在处理复杂背景、反光卡片或模糊图像时往往力不从心。如今,随着人工智能与深度学习技术的飞速发展,融合图像处理与模式识别算法的智能银行卡识别系统应运而生,为金融行业带来了革命性的效率提升。
zhangfeng113318 小时前
人工智能·深度学习·transformer
Mamba transformer的颠覆者 论文技术解读与应用实践深度报告,blog.csdnimg.cn/direct/d21dccf6f0bf45169ba25e9dd2832cef.png)在这里插入图片描述
动物园猫19 小时前
深度学习·yolo·目标检测
外墙裂缝目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1DoDlXWNUvZbVAnzfo1sMQQ?pwd=hjyx
郑洁文20 小时前
人工智能·深度学习·神经网络·车牌识别
基于卷积神经网络的智能车牌识别系统随着我国机动车保有量的迅速增长和智能交通系统的广泛应用,车牌识别技术已成为智能交通领域的重要研究方向。本文设计并实现一种基于卷积神经网络的智能车牌识别系统,旨在解决传统人工识别效率低下、准确率不稳定等问题。 系统采用Flask框架作为后端服务框架,使用PyTorch深度学习框架构建和训练CNN模型,集成MySQL数据库进行数据持久化存储,并提供Web界面。系统支持多种图像格式上传,能够实时处理用户请求并返回识别结果。数据预处理实现多层次的图像处理技术,包括图像质量检测、灰度转换、直方图均衡化、自适应阈值分
红宝村村长20 小时前
深度学习
loss.backward() 和 梯度累积这一行调用的是 PyTorch 的反向传播机制——核心作用是:从 loss 出发,沿着前向构建的计算图反向走,对所有 requires_grad=True 的参数计算梯度(∂loss / ∂param)并累加到 param.grad 上。
>ᴗoಣ21 小时前
人工智能·深度学习
COSER: Coordinating LLM-Based Persona Simulation of Established Roles角色扮演语言智能体,即 RPLAs,已经成为大语言模型的一类有前景的应用。然而,对于 RPLA 来说,模拟已经存在的成熟角色仍然是一项具有挑战性的任务。这主要是因为缺乏真实可靠的角色数据集,以及缺乏能够利用这些数据进行细致评价的方法。
云和数据.ChenGuang21 小时前
人工智能·深度学习·机器学习·自然语言处理·数据挖掘·边缘计算
openEuler下NLP模型的部署和推理openEuler 是面向服务器、云计算、高性能计算的开源国产化操作系统,依托鲲鹏 ARM 硬件生态、高效内存管理机制、毕昇编译器与 BoostKit 软件加速套件,成为国产化 NLP 落地主流环境。传统 x86 环境训练的 BERT、RoBERTa、TextCNN 等 NLP 模型直接迁移至 openEuler 系统常出现算子运行低效、推理延迟高、内存占用过大等问题。本文从环境适配、框架编译、模型优化、工程部署、性能调优五个维度,介绍在 openEuler 中基于 PyTorch 完成 NLP 分类模型