深度学习

大江东去浪淘尽千古风流人物27 分钟前
深度学习·3d·slam·视觉定位·dust3r·3d重建·mast3r
【PromptStereo】零样本立体匹配新范式:用结构与运动Prompt驱动迭代优化(CVPR 2026)立体匹配深度估计零样本泛化Depth AnythingCVPR 2026Transformer## 摘要
Rocky Ding*1 小时前
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识欢迎大家关注Rocky的知乎:Rocky Ding AIGC算法工程师/开发工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~
戴西软件2 小时前
网络·人工智能·python·深度学习·程序人生·算法·制造
戴西 DLM 许可授权管理系统:破解无网络环境下工业软件授权难题,助力制造企业降本增效当产线停工、设计锁死、审计红灯——DLM 让离线授权从“风险点”变为“可控项”某大型军工企业的仿真中心,IT 主管李工曾连续三个通宵没合眼。不是因为项目交付急,而是因为一台未接入互联网的高性能工作站上的 CATIA 许可证突然失效,整个气动外形设计团队被迫停工。
Black蜡笔小新2 小时前
人工智能·深度学习·机器学习
制造业AI质检工作站/企业AI算力工作站DLTM助力制造业质检智能化升级当下制造业市场竞争日趋激烈,产品质量是企业立足市场、稳固核心竞争力的根本,高效精准的标准化质检体系更是保障产品品质的关键支撑。针对行业痛点,企业级AI模型工作站DLTM,依托低门槛、全流程、高安全的核心优势,打造可自主学习、持续进化的专属AI质检解决方案,助力制造业质量管控从被动事后检测,向主动事前预防的智能化模式全面转型。
渡之4 小时前
深度学习·算法·动态规划·无人机
GRiM-Net 深度解析 | 无人机 GNSS 拒止场景下两阶段跨视角视觉定位框架无人机导航 | GNSS 拒止 | 跨视角图像匹配 | 视觉定位 | 深度学习原文信息论文标题:GRiM-Net: A Two-Stage Cross-View Visual Localization Framework for UAVs期刊:Remote Sensing(MDPI,2026 年 5 月)
code_pgf5 小时前
人工智能·深度学习·计算机视觉
mllm训练过程中有效地利用辅助监督信号来减少幻觉的方法从训练过程中如何利用辅助监督信号来减少 MLLM 幻觉进行系统说明。这里的“辅助监督信号”不是普通的 image-caption 或 VQA 标注,而是额外告诉模型:哪些内容有视觉依据、哪些没有、依据在哪、置信度如何、回答是否应拒绝。
装不满的克莱因瓶6 小时前
人工智能·pytorch·python·深度学习·ai·自然语言处理
自然语言处理常见任务——从文本理解到生成式AI的完整任务体系目录一、前言二、NLP任务整体分类三、文本分类任务(Text Classification)(一)任务定义
炎武丶航6 小时前
人工智能·python·深度学习·机器学习·ai·cnn·lenet
LeNet-5深度学习详解:从手写数字识别到代码实战想象一下,你去银行办理业务,工作人员让你填写一张表格。表格上有许多需要手写的数字:日期、金额、身份证号码等。银行系统如何自动识别这些手写数字呢?这就是LeNet-5最初要解决的问题。
湘美书院--湘美谈教育7 小时前
大数据·人工智能·深度学习·神经网络·机器学习
湘美谈教育AI赋能系列经验集锦:学好唐诗宋词的点滴心得体会作为传承文化薪火的载体,正亲身经历着这场由技术引发的时代巨变。面对AI成瘾、深度阅读退化等现象,我们并未一味排斥技术,而是探索如何在拥抱技术进步的同时,守护好人类文明的根与魂。在利用AI赋能唐诗宋词教学实践中的一点心得体会。
卷Java7 小时前
深度学习
混合检索让RAG召回率从62%干到89%上个月帮一个做知识库的客户排查RAG系统,用户反馈"搜出来的内容完全不相关"。我看了下他们的架构:纯向量检索,用OpenAI的text-embedding-3-small。
装不满的克莱因瓶7 小时前
人工智能·python·深度学习·算法·机器学习
掌握生成对抗网络(GAN)的优化目标与评估指标——从博弈函数到生成质量衡量体系在生成模型领域中,Generative Adversarial Network之所以具有里程碑意义,不仅在于其“生成能力”,更在于它引入了一种全新的训练范式:
技术小黑8 小时前
深度学习·算法·cnn·inceptionv1
CNN算法实战系列06 | InceptionV1实现猴痘病识别Inception Module 的核心思想:使用不同大小的卷积核(1x1、3x3、5x5)和最大池化并行提取不同尺度的特征,然后沿通道维度拼接。
王小王-1238 小时前
人工智能·深度学习·bert·情感分析·关键词提取·主题分析·景区评论分析
基于深度学习的景区口碑情感分析可视化系统有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主。Python 爬虫 + RoBERTa 情感分析 + TF-IDF/LDA/NMF 文本挖掘 + Flask 可视化系统
装不满的克莱因瓶8 小时前
人工智能·pytorch·python·深度学习·ai·自然语言处理
自然语言处理中的分词——从语言切分到模型输入的第一步目录一、前言二、什么是分词(一)基本定义(二)一句话理解(三)示例三、分词的核心作用(一)模型输入标准化
逻辑君9 小时前
人工智能·深度学习·机器学习·数学建模
认知神经科学研究报告【20260071】构建一个能够像人类一样分步思考并清晰展示推理过程的AI模型,是提升AI可解释性和教育应用价值的关键。本项目以开源的中文数学推理模型(1.5B参数)为基础,通过lora技术,使其从“直接给出答案”转变为“结构化、分步骤的数学推理链”。实验采用自建的6万条高质量“问题-思考链-答案”数据集,涵盖四则运算与函数求导两大类。
zhangfeng11339 小时前
人工智能·深度学习·microsoft
ONNX Runtime 微软的推理引擎 TensorRT,NVIDIA GPU 上的深度学习推理, CUDA GraphGPU优化的极致性能推理编译器;二者可协同使用——ONNX Runtime通过“TensorRT Execution Provider”调用TensorRT底层,在保持跨平台能力的同时实现NVIDIA GPU上的最高推理速度。‌‌
code_pgf10 小时前
人工智能·深度学习·算法
改进模型架构来减少MLLMs中的幻觉现象从模型架构上减少 MLLMs 幻觉,核心思路是:让生成端不能只依赖语言先验,而必须持续、细粒度地访问视觉证据。已有研究指出,VLM/MLLM 在生成较长文本时会逐渐降低对视觉输入的依赖,语言先验增强,这与幻觉高度相关。([arXiv][1])
发光的小豆芽10 小时前
深度学习·皮肤检测·u-net
使用U-Net 做皮肤图像的毛孔检测尝试听说YOLO 和U-Net,也是好几年了,对于这两个熟悉的陌生人我是想用的时候才用一下,可能是和老派视觉库合作太久了吧。下面就来记录一下老人新手使用U-Net. (1) 了解U-Net 然后我又在想YOLO和U-Net 有什么不同,不都是要做检测的嘛。 具体如下: 看看同一张图两者输出的结果: YOLO大哥只需要框出来就行,U-Net 还得分割出具体轮廓。这是检测和分割的具象差异了吧。
All The Way North-10 小时前
pytorch·深度学习·混合精度训练·大模型训练·梯度裁剪·梯度爆炸·混合精度训练/amp
大模型训练必修课:梯度裁剪(Gradient Clipping)从数学原理,到PyTorch工程实战全解析梯度裁剪(Gradient Clipping):大模型训练的“安全阀”与“稳定器”如果你之前没接触过梯度裁剪,那这篇文章将是你从零基础到精通实战的完整指南。在现代大模型(LLM)训练中,它不再是“可选项”,而是与学习率调度并列的必选项。