深度学习

CV矿工4 小时前
人工智能·深度学习·机器人
VLA(Vision-Language-Action)模型在机器人领域的action 输出编码核心思想:把连续动作(关节角、位姿、 gripper 开合)按维度均匀分箱(binning),映射到固定词汇表的离散 Token,让 VLA 像生成文本一样自回归生成动作序列。
0 15 小时前
人工智能·深度学习·nlp
260401日志attention_mask是因为padding产生的静态填充和动态填充优缺点:批次大小固定,训练过程稳定,易于分布式训练,静态优点计算图固定,可能获得更好的硬件加速,缺点存在大量无效计算(填充部分),显存利用率低,长序列样本可能丢失重要信息,;动态填充优点提高计算效率,显存占用降低约 30%,保留更多序列信息,尤其适合短文本占比高的数据集,适合训练阶段,提升整体训练速度,推理阶段需要额外处理,不适合批量预测,批次长度不固定,分布式训练配置更复杂
追风哥哥7 小时前
人工智能·深度学习·神经网络·机器学习·语言模型·chatgpt·transformer
transformer 注意力机制解析我们用一句经典的歧义句:问题:人类很容易理解:Transformer 就是通过 Attention 自动学会这个关系。
xingyuzhisuan7 小时前
运维·深度学习·gpu算力
4090部署DeepSeek-V3:CPU卸载层数实测指南DeepSeek-V3作为新一代大语言模型,分为7B、13B、33B三个主流参数版本,其Transformer层数量分别为32层、40层、60层,模型推理与微调对显存和算力要求极高。NVIDIA RTX 4090 GPU搭载24GB GDDR6X显存、16384个CUDA核心,核心频率2.52GHz,显存带宽1008GB/s,是个人、中小企业部署DeepSeek-V3的主流硬件选择。
博士僧小星7 小时前
人工智能·深度学习·机器学习·知识蒸馏·模型蒸馏
人工智能|大模型——模型——大模型蒸馏详解(定义/原理/关键技术/落地)大模型蒸馏(Model Distillation),即知识蒸馏(Knowledge Distillation),是一种将大型教师模型(如BERT、GPT-4o、DeepSeek-R1)的“隐含知识”高效迁移至轻量级学生模型(如DistilBERT、Qwen-1.5B、LSTM+Attention)的关键压缩技术。本文基于掘金、CSDN及行业实测文档三源权威材料,系统梳理其四大核心:① 定义与动因——直面2017–2024年参数量从5×10⁶暴涨至>10¹²的算力焦虑;② 四步闭环原理——教师训练→软标签生
AI医影跨模态组学7 小时前
人工智能·深度学习
Cancer Lett(IF=10.1)北京大学第一医院杨尹默等团队:基于深度学习的病理组学特征可独立于CA19-9预测胰腺导管腺癌的生存与复发01文献学习今天分享的文献是由北京大学第一医院马永蔌、田孝东、杨尹默、陈凯等团队于2026年3月24日在《Cancer Letters》(中科院1区top,IF=10.1)上发表的研究”A Deep Learning Pathomic Signature Predicts Survival and Recurrence in Pancreatic Ductal Adenocarcinoma Independent of CA19-9“即一种基于深度学习的病理组学特征可独立于CA19-9预测胰腺导管腺癌的生
古希腊掌管代码的神THU8 小时前
人工智能·深度学习·自然语言处理·composer
【清华代码熊】RL后训练解析|Cursor Composer 2 技术报告📌 今天来解析Cursor Composer 2 技术报告,期一度因为使用Kimi K2.5预训练基座饱受争议,但是其技术报告关注Coding Agent的RL训练,做这个方向🧭的还是值得一看。
AI医影跨模态组学8 小时前
人工智能·深度学习·医学·医学影像·医学科研
Cell Rep Med(IF=10.6)北京清华长庚医院李国新&云南省肿瘤医院放射科李振辉等团队:基于TME的深度学习模型预测胃癌治疗反应01文献学习今天分享的文献是由北京清华长庚医院李国新联合云南省肿瘤医院放射科李振辉、南方医科大学南方医院、中山大学肿瘤防治中心等团队于2025年8月在《Cell Reports Medicine》(中科院1区top,IF=10.6)上发表的研究“TME-guided deep learning predicts chemotherapy and immunotherapy response in gastric cancer with attention-enhanced residual Swin Tr
这张生成的图像能检测吗9 小时前
人工智能·深度学习·物联网·智能制造·异常检测
(论文速读)基于混合学习的边缘计算物联网系统操作视觉质量检测论文题目:Hybrid-Learning-Based Operational Visual Quality Inspection for Edge-Computing-Enabled IoT System(基于混合学习的边缘计算物联网系统操作视觉质量检测)
龙腾AI白云9 小时前
人工智能·深度学习
深度学习实战:Transformer模型文本翻译应用深度学习实战:Transformer模型文本翻译应用从“逐词翻译”到“理解语境” 并行计算:速度的飞跃 预训练+微调:让翻译更“懂行” 从翻译到更广阔的未来
xu_wenming9 小时前
人工智能·深度学习·机器学习
ESP32 运行TinyML模型准确性影响因素在 ESP32 上运行神经网络模型,准确性的根本取决于计算机端的训练,但最终的推理结果还受部署过程中若干关键环节的影响。下面从几个层面展开说明。
CDA数据分析师干货分享10 小时前
深度学习·学习·数据挖掘·数据分析·cda证书·cda数据分析师
石油工程专业炼油厂一线岗位转行数据分析岗,CDA数据分析师二级学习经验大家好,我是CDA学员,一名从石油工程专业、炼油厂一线岗位,成功转行数据分析师的普通人。从延安大学石油工程毕业,到陕北小镇炼油厂拧螺丝两年,再到辞职回西安、备考CDA二级、拿下西安offer,这一路我走过迷茫、熬过备考的苦,也终于跳出了职业困境。今天,把我的真实转行经历和CDA二级学习心得分享给你,希望能给同样在传统行业挣扎、想靠技能转行的小伙伴,一点勇气和参考。
kingcjh9710 小时前
深度学习·算法
十、RL 算法性能调优指南覆盖 PPO / GRPO / DAPO / VERL,聚焦超参数 + 算法特性调优,零废话每个环节都可能成为瓶颈:
EIConferenceEmma1 天前
图像处理·人工智能·深度学习·算法·智能控制
【往届均于会后2-4个月EI检索 | SPIE出版】第六届先进算法与信号、图像处理国际学术会议(AASIP 2026)【SPIE出版】第六届先进算法与信号、图像处理国际学术会议(AASIP 2026)2026 6th International Conference on Advanced Algorithms and Signal, Image Processing
清空mega12 小时前
人工智能·深度学习
动手学深度学习——填充和步幅详解:卷积输出尺寸到底怎么控制?在前面的“图像卷积”和“卷积层”中,我们已经知道了卷积最基本的计算过程:卷积核在输入上滑动每次看一个局部区域
wuxuand13 小时前
人工智能·深度学习
读顶刊综述:新兴技术下深度学习入侵检测的现状、鸿沟与未来最近精读了 Neto 等人发表的《Deep learning for intrusion detection in emerging technologies: a comprehensive survey and new perspectives》这篇 2025 年的顶级综述,作为聚焦网络安全与深度学习交叉领域的研究,它没有停留在对算法的泛泛罗列,而是直击深度学习入侵检测系统(DL-IDS)从实验室走向产业落地的核心痛点,完整梳理了云、边缘、IoT 等新兴技术场景下的安全攻防全景。这篇博客将完整复盘我的
冰西瓜60013 小时前
人工智能·深度学习·transformer
深度学习的数学原理(二十三)—— Transformer开篇:从迷你模型到核心逻辑在前文的学习中,我们先后拆解了传统序列模型RNN/LSTM的固有缺陷,也掌握了Seq2Seq编码器-解码器的基础框架,理解了其作为序列转换任务通用范式的核心思想。但经典RNN版Seq2Seq存在的信息压缩瓶颈、长距离梯度消失、无差异化上下文依赖等问题,让其在复杂序列任务(如长文本翻译、语义理解)中性能受限。
2601_9507607913 小时前
人工智能·深度学习·蛋白
IL-7蛋白在脓毒症适应性免疫紊乱中的研究进展一、脓毒症免疫抑制与适应性免疫紊乱脓毒症是重症监护病房的主要死亡原因之一,其发生发展的核心机制在于机体免疫功能紊乱。最新临床研究显示,脓毒症早期促炎反应阶段即出现淋巴细胞数量减少,包括T淋巴细胞、B淋巴细胞和树突状细胞等。尸检发现,脓毒症患者脾脏、淋巴结及循环血中CD4阳性和CD8阳性T细胞耗损数量远大于炎性细胞浸润量,表明适应性免疫细胞耗竭导致的机体免疫麻痹是脓毒症病理生理过程的重要特征。T淋巴细胞免疫无反应性一直被认为是脓毒症免疫功能异常的标志,表现为外周血T细胞凋亡、T细胞计数下降及T细胞分化异常。
AI医影跨模态组学13 小时前
人工智能·深度学习·医学·医学影像
EJNMMI(IF=7.6)四川大学华西医院田蓉、李康等团队:基于深度学习的PET‑CT生物标志物用于滤泡淋巴瘤早期进展预测及生存分层01文献学习今天分享的文献是由四川大学华西医院田蓉、李康等团队于2026年3月23日在《European Journal of Nuclear Medicine and Molecular Imaging》(中科院1区top,IF=7.6)上发表的研究“A deep learning PET-CT biomarker for early progression (POD24) and survival stratification in follicular lymphoma: a multicenter
m0_5648768413 小时前
人工智能·深度学习·学习
提示词工程Zero-Shot、One-Shot、Few-ShotZero-Shot、One-Shot、Few-Shot 主要归属于提示词工程:1. Zero-Shot(零样本学习):不提供任何示例,直接问,直接答出整个问题。(一步到位)