技术栈
深度学习
keineahnung2345
32 分钟前
人工智能
·
pytorch
·
python
·
深度学习
為什麼要有 eval_is_non_overlapping_and_dense?PyTorch 包裝層與調用端解析
前篇 為什麼這個 Tensor 算 dense?PyTorch _eval_is_non_overlapping_and_dense 深入解析 介紹了 _eval_is_non_overlapping_and_dense 函數,該函數位於 torch/fx/experimental/symbolic_shapes.py,實作了判斷張量的記憶體佈局是否「非重疊且稠密」(non-overlapping and dense)的邏輯,是個純 Python 函數。
Hali_Botebie
32 分钟前
人工智能
·
深度学习
·
transformer
【量化】FQ-ViT: Post-Training Quantization for Fully Quantized Vision Transformer
FQ-ViT: Post-Training Quantization for Fully Quantized Vision Transformer
狮子座明仔
1 小时前
人工智能
·
深度学习
·
机器学习
·
交互
AggAgent:把并行轨迹当环境来交互,智能体聚合的新范式
你有没有遇到过这种情况——让一个Agent做深度研究,跑了8次,8条轨迹里其实藏着正确答案,但你怎么把它们"拼"出来?Majority Voting?要是多答案任务,投票直接废了。Best-of-N?模型自己标的confidence在长文本生成任务上根本不准。把8条轨迹全塞进context窗口?每条动辄十万token,8条拼一起直接OOM。
pzx_001
1 小时前
论文阅读
·
人工智能
·
深度学习
·
神经网络
·
ci/cd
【论文阅读】SWE-CI: Evaluating Agent Capabilities in Maintaining Codebases via Continuous Integration
https://arxiv.org/pdf/2603.03823基于大语言模型(LLM)的智能体已在自动化软件工程任务(如静态缺陷修复)中展现出强大能力,SWE‑bench 等基准测试已充分证明这一点。但在实际场景中,成熟软件的开发通常建立在复杂的需求变更与长期功能迭代之上 —— 这一过程是静态、一次性的修复范式所无法刻画的。为弥补这一差距,我们提出 SWE‑CI,这是首个基于持续集成(CI)流程构建的代码库级基准测试,旨在将代码生成的评估范式从静态、短期的功能正确性转向动态、长期的可维护性。该基准包含
摇落露为霜
1 小时前
人工智能
·
深度学习
·
transformer
·
扩散模型
·
dit
论文笔记DiT:Scalable Diffusion Models with Transformers(含transformer的可扩展扩散模型 )
Abstract:论文的核心思想非常直接:用一个标准的 Transformer 架构替换掉扩散模型中常用的 U-Net 主干网络,并证明这种新架构(称为 DiT, Diffusion Transformer)具有出色的可扩展性(Scalability)。
网安INF
1 小时前
论文阅读
·
人工智能
·
深度学习
·
计算机视觉
【论文阅读】-《QUERY EFFICIENT DECISION BASED SPARSE ATTACKS AGAINST BLACK-BOX DEEP LEARNING MODELS》
尽管我们已竭尽全力,深度学习模型仍然极易受到施加在输入上的微小对抗性扰动的影响。仅从机器学习模型的输出中提取信息来为黑盒模型制作对抗性扰动的能力,是对现实世界系统(如自动驾驶汽车或作为服务暴露的机器学习模型)的实际威胁。其中特别值得关注的是稀疏攻击。在黑盒模型中实现稀疏攻击表明,机器学习模型比我们想象的要更加脆弱。因为,这些攻击旨在最小化误导模型所需的扰动像素数量——以 l0l_0l0 范数衡量——而方法仅仅是观察模型查询返回的决策(预测的标签);即所谓的基于决策的攻击设置。但是,这样的攻击会导致一个 N
那个,我想吃麦麦
1 小时前
人工智能
·
深度学习
·
神经网络
【论文阅读 | Advanced Engineering Informatics 2026】融合条件扩散与图学习的 EEG 信号重建与认知负荷识别
📖 论文信息该论文提出了一个"重建-分类"统一框架:第一阶段使用条件引导去噪扩散概率模型(CG-DDPM)同时修复 6 种伪迹污染的 EEG 信号,第二阶段使用融合 CNN、GCN、KAN 三分支编码器的 EEGGX-Net 对认知负荷进行分级识别。在 STEW 和自采集 iNCog-EEG 两个数据集上,二分类准确率均超过 98%,三分类超过 95%,且均为被试独立评估。
hongjianMa
1 小时前
论文阅读
·
python
·
深度学习
·
推荐系统
·
多模态推荐
【论文阅读】Structured Spectral Reasoning for Frequency-Adaptive Multimodal Recommendation
用于频率自适应多模态推荐的结构化谱推理虽然最近的工作探索了频域作为分离稳定信号和噪声信号的透镜,但大多数方法依赖于静态滤波或重新加权,缺乏对频谱结构进行推理或适应特定模态可靠性的能力。
心疼你的一切
1 小时前
人工智能
·
pytorch
·
深度学习
·
神经网络
·
机器学习
PyTorch实战:手写数字识别神经网络
人工智能正在深刻改变我们的世界,而神经网络作为AI领域的核心技术之一,其重要性不言而喻。从图像识别到自然语言处理,从语音识别到自动驾驶,神经网络无处不在。本文将深入浅出地介绍神经网络的基础原理,并通过PyTorch框架进行实践演示,帮助读者快速上手神经网络开发。
Mike_666
1 小时前
人工智能
·
深度学习
·
ffmpeg
·
aarch64
·
摩尔线程
·
musa
摩尔线程AB100安装torch环境
gpu是AB100安装torch环境,参考下面这个文章在 M1000 进行 DeepSeek R1 蒸馏系列模型部署 | 摩尔线程博客中心
消晨消晨
2 小时前
人工智能
·
深度学习
Pytorch初上手——模型构建
我们接着上一篇文章继续,上次我们创建了数据集,加载了数据集,那么接下来就是搭建模型了。这里推荐看一下Pytorch官方的描述,比较具体。简单来说,神经网络由对数据执行操作的层/模块组成。我们构建的神经网络类继承自torch.nn.Module。我们需要在__init__中初始化神经网络层,然后在forward方法中实现对输入数据的操作。
动物园猫
2 小时前
深度学习
·
yolo
·
分类
交通事故车辆受损情况数据集分享(适用于YOLO系列深度学习分类检测任务)
链接:https://pan.baidu.com/s/1zYLg1EOwHB-HTBlxQr4w7A?pwd=yhmd
kcuwu.
2 小时前
人工智能
·
深度学习
深度学习模型优化完全指南:从“下山“到“刷题“的通俗讲解
本文用最通俗的比喻,带你彻底搞懂深度学习中各种优化器、学习率调度和正则化的原理与实践。读完这篇,你再也不会对AdamW、Dropout、BatchNorm这些名词感到困惑。
AI医影跨模态组学
3 小时前
人工智能
·
深度学习
·
论文
·
医学
·
医学影像
·
影像组学
J Adv Res(IF=13)南方医科大学南方医院等团队:基于多模态渐进融合 Transformer 的肝细胞癌患者免疫治疗反应预测模型
01文献学习今天分享的文献是由南方医科大学南方医院等团队于2026年2月在《Journal of Advanced Research》(中科院1区top,IF=13)上发表的研究“Multi-modal gradual fusion transformer-based model for predicting immunotherapy response in patients with hepatocellular carcinoma”即基于多模态渐进融合变换器模型的肝细胞癌免疫治疗反应预测研究,该研究
wdf8088
3 小时前
深度学习
·
ai 超频图形工作站
·
动画建模
超越极限:为专业创作与AI运算而生,UltraLAB A330 AI超频图形工作站
在AI建模、实时渲染、复杂仿真等高性能计算场景中,算力就是生产力。UltraLAB A330 以「超频」为核心设计理念,融合顶级消费级处理器、新一代旗舰显卡与企业级优化技术,为设计师、科研工程师与AI开发者打造一台既狂暴又安静的专业图形工作站。
行者-全栈开发
3 小时前
pytorch
·
深度学习
·
图神经网络
·
智慧交通
·
交通流量预测
·
时空建模
·
geometric
【AI时空分析】基于 GNN 的城市交通流量预测:图神经网络在智慧交通中的实战应用
💡 摘要: 本文系统介绍如何使用图神经网络(GNN)进行城市交通流量预测。通过构建道路网络图模型,结合 GCN(图卷积网络)和 LSTM 捕捉时空依赖关系,实现高精度的短时交通流预测。涵盖图数据结构设计、邻接矩阵构建、时空特征融合、模型训练优化等核心技术。包含完整的 PyTorch Geometric 代码实现、北京市真实路网数据集处理流程,以及与传统方法(ARIMA、LSTM)的对比实验。预测精度提升 15-20%,适合算法工程师、数据科学家和智慧城市开发者学习。
五月底_
4 小时前
深度学习
·
verl
verl二次开发
参考视频:b站--使用verl实现code-r1(agent-rl,verl二次开发)1. 加载模型(无需修改)(verl使用ray进行调度)
初心未改HD
4 小时前
人工智能
·
深度学习
深度学习之感知机详解
摘要: 感知机(Perceptron)是人工神经网络的基础模型,由Frank Rosenblatt于1957年提出。本文系统讲解感知机的数学原理、学习规则与收敛性,深入分析其在线性可分问题中的广泛应用,并探讨感知机在解决XOR问题时遇到的困境及其向多层感知机(MLP)的演进。通过NumPy从零实现的完整代码示例,帮助读者深入理解感知机的工作机制。实验表明,单层感知机仅能处理线性可分问题,而多层感知机可突破这一限制,这为后续深度学习的发展奠定了理论基础。
2zcode
5 小时前
人工智能
·
深度学习
·
智能交通
基于深度学习的车辆品牌与类型智能识别系统设计与实现
摘要:随着智能交通系统的快速发展,车辆识别技术在交通管理、智能停车、安全监控等领域发挥着越来越重要的作用。传统的车辆识别方法存在识别精度低、实时性差、适应性弱等问题,难以满足实际应用需求。本文设计并实现了一个基于YOLO11深度学习算法的车辆品牌与类型智能识别系统,旨在提高车辆识别的准确性和实时性。