技术栈
深度学习
绵满
26 分钟前
深度学习
·
推荐系统
“A Deep Probabilistic Model for Customer Lifetime Value Prediction” 论文笔记
现有 LTV 预测工作主要分为两种:一种是直接基于 MSE 建模 LTV;一种是两阶段建模,先用BCE建模付费概率,然后用MSE建模付费金额,排除 LTV 为0的样本的影响
AGV算法笔记
2 小时前
人工智能
·
深度学习
·
目标检测
·
机器学习
·
计算机视觉
·
目标跟踪
目标检测论文精读:Deformable DETR 为什么被认为是 DETR 真正走向实用的关键一步?
如果说原始 DETR 让大家第一次看到“目标检测也可以彻底摆脱 anchor 和 NMS”的可能性,那么 Deformable DETR 真正解决的,就是 DETR 在工程和训练层面最致命的两个问题:收敛太慢,以及对小目标不友好。这篇论文最核心的思路,是把标准 Transformer 里“全局密集注意力”改造成一种围绕参考点进行稀疏采样的可变形注意力机制,让模型不用再对整张特征图的所有位置做高成本关联,而只关注少量更有价值的区域。这样一来,Deformable DETR 不仅显著提升了训练效率,也增强了多
model2005
2 小时前
人工智能
·
深度学习
yolo26训练自己数据集
安装GPU版本显示cuda不可用nvidia-smi NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
极光代码工作室
2 小时前
人工智能
·
深度学习
·
机器学习
·
ai
·
系统设计
基于机器学习的商品价格预测系统
随着电子商务与新零售业态的快速发展,商品价格动态调整已成为平台提升竞争力、优化库存周转与增强用户粘性的核心策略。然而,传统基于规则或人工经验的价格决策存在滞后性强、泛化能力弱、难以应对多源异构因素耦合影响等缺陷。本研究聚焦于构建一个高精度、可解释、可部署的商品价格预测系统,融合时间序列特征、市场供需信号、竞品价格波动、用户行为日志及外部宏观因子(如节假日、天气、舆情热度),提出一种“多源特征工程 + 集成学习建模 + 在线增量更新”的技术路线。系统采用Python语言开发,后端基于Flask框架,前端使用
古希腊掌管代码的神THU
2 小时前
人工智能
·
深度学习
·
自然语言处理
【清华代码熊】DeepSeek V4多模态技术解析:以视觉基元思考
📌 今天解析DeepSeek开源又紧急撤回的论文:《Thinking with Visual Primitives》,在 DeepSeek V4 Flash 基础上构建多模态🔥推理模型。
机器学习之心
3 小时前
深度学习
·
回归
·
transformer
GAT-TCN-Transformer 回归模型 + SHAP 可解释性分析:空间、局部与全局的时空建模利器
海量表格数据里,往往同时藏着空间上的邻里关系和随时间演化的复杂模式。比如气象站网的温度预测、交通路网的流量估计、金融多资产的联动回归……单纯用 CNN 捕捉空间、用 RNN 捕捉时间,已很难满足高精度与可解释性的双重要求。今天我们就来拆解一套GAT‑TCN‑Transformer 融合回归模型,并搭配 SHAP 可解释性分析,让模型既能精准捕捉多尺度时空特征,又能打开黑箱,把特征的贡献讲得明明白白。
这张生成的图像能检测吗
3 小时前
人工智能
·
深度学习
·
transformer
·
时序模型
(论文速读)Shift:通过减少概念漂移解决时间序列预测泛化问题
论文题目:TACKLING TIME-SERIES FORECASTING GENERALIZATION VIA MITIGATING CONCEPT DRIFT(通过减少概念漂移解决时间序列预测泛化问题)
wangqiaowq
4 小时前
人工智能
·
深度学习
模型合并,转换,量化压缩,部署
训练好的LoRA适配器 → 模型合并 → 转换为GGUF → 量化压缩 → 部署。conda activate /home/aistudio/work/my_conda_envs/llamafactory
生物信息与育种
4 小时前
人工智能
·
深度学习
·
职场和发展
·
数据分析
·
r语言
实战总结:用 rMVP 做植物 GWAS 的标准工作流与避坑指南
最近在一对一辅导一位同学做全基因组关联分析(GWAS)项目。他在处理一批水稻的数据时,使用 rMVP 跑流程遇到了几个非常典型的坑。从上千万个原始变异位点的质控过滤,到代码报错排查,再到最终模型选择,在这里记录总结下,供开展植物 GWAS 的同行参考。
deephub
5 小时前
人工智能
·
深度学习
·
自动化
·
大语言模型
·
playwright
用 Playwright 和 LLM 实现自愈测试自动化
Playwright 是一个用于 Web 自动化和端到端测试的开源框架。如果我们将他和LLM结合,就可以实现“自愈”的自动化测试,这样如果UI有了改动框架不再硬性失败而是在检测到失败之后分析当前的 DOM(Document Object Model),基于规则的策略自动恢复出一个能用的 locator。 自愈遵循一条严格的三阶段 pipeline。
数智工坊
7 小时前
论文阅读
·
人工智能
·
深度学习
·
cnn
·
transformer
【DDIM 论文阅读】:扩散模型加速采样的里程碑!10~50 倍快采 + 确定性生成
DDPM 效果强、训练稳,但采样慢到离谱:DDIM 站出来说: 不用重训、不用改网络,同一份 DDPM 权重,直接 10~50 倍加速采样,还能做到确定性生成、 latent 插值!
用AI赚一点
8 小时前
人工智能
·
经验分享
·
深度学习
搞不清MES和WMS?制造业人必看的「协同指南」,别再踩数字化转型的坑
早上刚到办公室,就收到制造部张经理的吐槽:上了WMS库存还是乱,MES排产总卡壳,花了几十万买的系统,反而成了“甩锅工具”——生产说仓库没及时供料,仓库说生产没提前报需求。
__Wedream__
8 小时前
深度学习
·
计算机视觉
·
超分辨率重建
·
basicsr
·
nitre
NTIRE 2026遥感红外超分第五名方案解读:不训复杂模型,只调少量参数——Mona适配器如何高效迁移HAT?
论文:The First Challenge on Remote Sensing Infrared Image Super-Resolution at NTIRE 2026: Benchmark Results and Method Overview 论文链接:https://arxiv.org/html/2604.21312v1 代码链接:https://github.com/Kai-Liu001/NTIRE2026_infraredSR
Mr.朱鹏
8 小时前
人工智能
·
python
·
深度学习
·
langchain
·
llm
·
prompt
·
virtualenv
3.LangChain零基础速通-Prompt提示词模版和模型调用方法
Prompt是引导AI模型生成特定输出的输入格式,Prompt的设计和措辞会显著影响模型的响应。Prompt最开始只是简单的字符串,随着时间的推移,Prompt逐渐开始包含特定的占位符,例如AI模型可通过将多个消息字符串分类为不同的角模型可以识别的"USER:"、"SYSTEM:"等。模型可通过多个消息字符串分类为不同的角色,然后再由AI模型处理,为prompt引入了更多结构。每条消息都分配有特定的角色,这些角色对消息进行分类,明确AI模型提示的每个部分的上下文和目的。这种结构化方法增强了与AI沟通的细微
AIDF2026
8 小时前
深度学习
·
yolo
·
目标检测
手把手教你分析深度学习目标检测模型——以YOLOv5为例
手把手教你分析深度学习目标检测模型——以YOLOv5为例我们常常会接触各类预训练模型,但很多时候只知道“模型能做什么”,却不清楚“模型内部在做什么”。今天,我们就以经典的YOLOv5目标检测模型为例,结合Netron可视化工具,一步步教你如何完整分析一个深度学习模型,从输入到输出、从宏观到微观,读懂模型的每一个细节。
郭菁菁
9 小时前
大数据
·
人工智能
·
深度学习
·
机器学习
·
prompt
职业深度解析:Prompt Engineer——与AI对话的艺术
一句话定义: Prompt Engineer是通过设计、优化和结构化输入指令,让大语言模型(LLM)输出高质量、可预测、符合业务需求结果的人。
cici15874
14 小时前
人工智能
·
深度学习
·
神经网络
卡尔曼滤波器实现RBF神经网络训练
状态方程: Wk=Wk−1+wkW_k = W_{k-1} + w_kWk=Wk−1+wk 其中 wk∼N(0,Q)w_k \sim N(0, Q)wk∼N(0,Q) 是过程噪声。
郝学胜-神的一滴
18 小时前
数据结构
·
人工智能
·
python
·
深度学习
·
算法
·
机器学习
深度学习优化核心:梯度下降与网络训练全解析
在深度学习的训练旅程中,网络优化是贯穿始终的核心命题,而一切优化的起点,都是对权重更新规则的深度打磨。我们常说的网络优化方法,本质就是对权重更新公式的精巧调整,让模型以更稳、更快的速度收敛到最优解。
拓朗工控
20 小时前
人工智能
·
深度学习
·
智能电视
·
工控机
深度学习工控机部署实战:从硬件选型到稳定运行的避坑指南
近年来,随着AI技术在工业领域的普及,越来越多的企业开始尝试将深度学习应用到视觉检测、缺陷识别等实际场景中。很多工程师在实验室里把模型训练得非常好,但一到产线部署,却频频出现卡顿、崩溃、漏检等问题。其实,深度学习工控机的落地应用,和我们在办公室用普通电脑跑程序完全是两码事。要想让AI模型在工厂里7x24小时稳定干活,在选型和部署时,有几个关键的“坑”必须提前避开。
NorburyL
20 小时前
深度学习
·
算法
DPO笔记
在监督学习中,我们通常写 DKL(Pdata∥Pmodel)D_{KL}(P_{\text{data}} \| P_{\text{model}})DKL(Pdata∥Pmodel),这时 PdataP_{\text{data}}Pdata 是训练数据的真实分布(固定),而 PmodelP_{\text{model}}Pmodel 是模型近似分布(优化)。所以第一个位置是真实分布。