深度学习

绵满26 分钟前
深度学习·推荐系统
“A Deep Probabilistic Model for Customer Lifetime Value Prediction” 论文笔记现有 LTV 预测工作主要分为两种:一种是直接基于 MSE 建模 LTV;一种是两阶段建模,先用BCE建模付费概率,然后用MSE建模付费金额,排除 LTV 为0的样本的影响
AGV算法笔记2 小时前
人工智能·深度学习·目标检测·机器学习·计算机视觉·目标跟踪
目标检测论文精读:Deformable DETR 为什么被认为是 DETR 真正走向实用的关键一步?如果说原始 DETR 让大家第一次看到“目标检测也可以彻底摆脱 anchor 和 NMS”的可能性,那么 Deformable DETR 真正解决的,就是 DETR 在工程和训练层面最致命的两个问题:收敛太慢,以及对小目标不友好。这篇论文最核心的思路,是把标准 Transformer 里“全局密集注意力”改造成一种围绕参考点进行稀疏采样的可变形注意力机制,让模型不用再对整张特征图的所有位置做高成本关联,而只关注少量更有价值的区域。这样一来,Deformable DETR 不仅显著提升了训练效率,也增强了多
model20052 小时前
人工智能·深度学习
yolo26训练自己数据集安装GPU版本显示cuda不可用nvidia-smi NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
极光代码工作室2 小时前
人工智能·深度学习·机器学习·ai·系统设计
基于机器学习的商品价格预测系统随着电子商务与新零售业态的快速发展,商品价格动态调整已成为平台提升竞争力、优化库存周转与增强用户粘性的核心策略。然而,传统基于规则或人工经验的价格决策存在滞后性强、泛化能力弱、难以应对多源异构因素耦合影响等缺陷。本研究聚焦于构建一个高精度、可解释、可部署的商品价格预测系统,融合时间序列特征、市场供需信号、竞品价格波动、用户行为日志及外部宏观因子(如节假日、天气、舆情热度),提出一种“多源特征工程 + 集成学习建模 + 在线增量更新”的技术路线。系统采用Python语言开发,后端基于Flask框架,前端使用
古希腊掌管代码的神THU2 小时前
人工智能·深度学习·自然语言处理
【清华代码熊】DeepSeek V4多模态技术解析:以视觉基元思考📌 今天解析DeepSeek开源又紧急撤回的论文:《Thinking with Visual Primitives》,在 DeepSeek V4 Flash 基础上构建多模态🔥推理模型。
机器学习之心3 小时前
深度学习·回归·transformer
GAT-TCN-Transformer 回归模型 + SHAP 可解释性分析:空间、局部与全局的时空建模利器海量表格数据里,往往同时藏着空间上的邻里关系和随时间演化的复杂模式。比如气象站网的温度预测、交通路网的流量估计、金融多资产的联动回归……单纯用 CNN 捕捉空间、用 RNN 捕捉时间,已很难满足高精度与可解释性的双重要求。今天我们就来拆解一套GAT‑TCN‑Transformer 融合回归模型,并搭配 SHAP 可解释性分析,让模型既能精准捕捉多尺度时空特征,又能打开黑箱,把特征的贡献讲得明明白白。
这张生成的图像能检测吗3 小时前
人工智能·深度学习·transformer·时序模型
(论文速读)Shift:通过减少概念漂移解决时间序列预测泛化问题论文题目:TACKLING TIME-SERIES FORECASTING GENERALIZATION VIA MITIGATING CONCEPT DRIFT(通过减少概念漂移解决时间序列预测泛化问题)
wangqiaowq4 小时前
人工智能·深度学习
模型合并,转换,量化压缩,部署训练好的LoRA适配器 → 模型合并 → 转换为GGUF → 量化压缩 → 部署。conda activate /home/aistudio/work/my_conda_envs/llamafactory
生物信息与育种4 小时前
人工智能·深度学习·职场和发展·数据分析·r语言
实战总结:用 rMVP 做植物 GWAS 的标准工作流与避坑指南最近在一对一辅导一位同学做全基因组关联分析(GWAS)项目。他在处理一批水稻的数据时,使用 rMVP 跑流程遇到了几个非常典型的坑。从上千万个原始变异位点的质控过滤,到代码报错排查,再到最终模型选择,在这里记录总结下,供开展植物 GWAS 的同行参考。
deephub5 小时前
人工智能·深度学习·自动化·大语言模型·playwright
用 Playwright 和 LLM 实现自愈测试自动化Playwright 是一个用于 Web 自动化和端到端测试的开源框架。如果我们将他和LLM结合,就可以实现“自愈”的自动化测试,这样如果UI有了改动框架不再硬性失败而是在检测到失败之后分析当前的 DOM(Document Object Model),基于规则的策略自动恢复出一个能用的 locator。 自愈遵循一条严格的三阶段 pipeline。
数智工坊7 小时前
论文阅读·人工智能·深度学习·cnn·transformer
【DDIM 论文阅读】:扩散模型加速采样的里程碑!10~50 倍快采 + 确定性生成DDPM 效果强、训练稳,但采样慢到离谱:DDIM 站出来说: 不用重训、不用改网络,同一份 DDPM 权重,直接 10~50 倍加速采样,还能做到确定性生成、 latent 插值!
用AI赚一点8 小时前
人工智能·经验分享·深度学习
搞不清MES和WMS?制造业人必看的「协同指南」,别再踩数字化转型的坑早上刚到办公室,就收到制造部张经理的吐槽:上了WMS库存还是乱,MES排产总卡壳,花了几十万买的系统,反而成了“甩锅工具”——生产说仓库没及时供料,仓库说生产没提前报需求。
__Wedream__8 小时前
深度学习·计算机视觉·超分辨率重建·basicsr·nitre
NTIRE 2026遥感红外超分第五名方案解读:不训复杂模型,只调少量参数——Mona适配器如何高效迁移HAT?论文:The First Challenge on Remote Sensing Infrared Image Super-Resolution at NTIRE 2026: Benchmark Results and Method Overview 论文链接:https://arxiv.org/html/2604.21312v1 代码链接:https://github.com/Kai-Liu001/NTIRE2026_infraredSR
Mr.朱鹏8 小时前
人工智能·python·深度学习·langchain·llm·prompt·virtualenv
3.LangChain零基础速通-Prompt提示词模版和模型调用方法Prompt是引导AI模型生成特定输出的输入格式,Prompt的设计和措辞会显著影响模型的响应。Prompt最开始只是简单的字符串,随着时间的推移,Prompt逐渐开始包含特定的占位符,例如AI模型可通过将多个消息字符串分类为不同的角模型可以识别的"USER:"、"SYSTEM:"等。模型可通过多个消息字符串分类为不同的角色,然后再由AI模型处理,为prompt引入了更多结构。每条消息都分配有特定的角色,这些角色对消息进行分类,明确AI模型提示的每个部分的上下文和目的。这种结构化方法增强了与AI沟通的细微
AIDF20268 小时前
深度学习·yolo·目标检测
手把手教你分析深度学习目标检测模型——以YOLOv5为例手把手教你分析深度学习目标检测模型——以YOLOv5为例我们常常会接触各类预训练模型,但很多时候只知道“模型能做什么”,却不清楚“模型内部在做什么”。今天,我们就以经典的YOLOv5目标检测模型为例,结合Netron可视化工具,一步步教你如何完整分析一个深度学习模型,从输入到输出、从宏观到微观,读懂模型的每一个细节。
郭菁菁9 小时前
大数据·人工智能·深度学习·机器学习·prompt
职业深度解析:Prompt Engineer——与AI对话的艺术一句话定义: Prompt Engineer是通过设计、优化和结构化输入指令,让大语言模型(LLM)输出高质量、可预测、符合业务需求结果的人。
cici1587414 小时前
人工智能·深度学习·神经网络
卡尔曼滤波器实现RBF神经网络训练状态方程: Wk=Wk−1+wkW_k = W_{k-1} + w_kWk=Wk−1+wk 其中 wk∼N(0,Q)w_k \sim N(0, Q)wk∼N(0,Q) 是过程噪声。
郝学胜-神的一滴18 小时前
数据结构·人工智能·python·深度学习·算法·机器学习
深度学习优化核心:梯度下降与网络训练全解析在深度学习的训练旅程中,网络优化是贯穿始终的核心命题,而一切优化的起点,都是对权重更新规则的深度打磨。我们常说的网络优化方法,本质就是对权重更新公式的精巧调整,让模型以更稳、更快的速度收敛到最优解。
拓朗工控20 小时前
人工智能·深度学习·智能电视·工控机
深度学习工控机部署实战:从硬件选型到稳定运行的避坑指南近年来,随着AI技术在工业领域的普及,越来越多的企业开始尝试将深度学习应用到视觉检测、缺陷识别等实际场景中。很多工程师在实验室里把模型训练得非常好,但一到产线部署,却频频出现卡顿、崩溃、漏检等问题。其实,深度学习工控机的落地应用,和我们在办公室用普通电脑跑程序完全是两码事。要想让AI模型在工厂里7x24小时稳定干活,在选型和部署时,有几个关键的“坑”必须提前避开。
NorburyL20 小时前
深度学习·算法
DPO笔记在监督学习中,我们通常写 DKL(Pdata∥Pmodel)D_{KL}(P_{\text{data}} \| P_{\text{model}})DKL(Pdata∥Pmodel),这时 PdataP_{\text{data}}Pdata 是训练数据的真实分布(固定),而 PmodelP_{\text{model}}Pmodel 是模型近似分布(优化)。所以第一个位置是真实分布。