深度学习

Robot_Nav32 分钟前
人工智能·深度学习·强化学习
深度学习与强化学习面试八股文知识点汇总SGD (随机梯度下降)Adam如何选择定义成因解决方案偏差-方差权衡Model-based vs. Model-free
一颗牙牙2 小时前
开发语言·python·深度学习
安装mmcv中文版教程Python中MMCV库的安装方法与常见问题解决官网mmcv 2.2.0 documentation
paperClub4 小时前
人工智能·深度学习
AACR 2026 · AI诊断:深度学习在肿瘤早期检测中的应用提供的信息中未包含具体的研究核心内容描述,因此无法基于现有内容撰写相关综述。请补充具体的研究内容或相关信息,以便进一步分析和撰写。
AI医影跨模态组学5 小时前
人工智能·深度学习·论文·医学·医学影像
NPJ Precis Oncol(IF=8)中国科学院深圳先进技术研究院吴红艳教授等团队:深度可解释放射基因组学解析乳腺MRI肿瘤微环境01文献学习今天分享的文献是由中国科学院深圳先进技术研究院吴红艳教授等团队于2026年5月在肿瘤学顶刊《npj Precision Oncology》(中科院1区top,IF=8)上发表的研究“Deep interpretable radiogenomic workflow deciphers tumor microenvironment from breast MRI and identifies clinician-interpretable biomarkers”即深度可解释放射基因组学工作流程:通
大模型最新论文速读6 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
05-15 · LLM 最新论文速览今日候选池 88 篇,硬过滤 + LLM 打分后通过评估 24 篇,精选 Top-10,另列 14 篇速览。
数智工坊6 小时前
论文阅读·人工智能·深度学习·计算机视觉·transformer
【DINOv2论文阅读】:无需监督的通用视觉特征提取器——机器人VLA模型的“眼睛“基石如果你最近在搞具身智能或者VLA(视觉-语言-动作)模型,那你一定绕不开DINOv2。这个来自Meta AI的视觉编码器,几乎成了所有开源VLA模型的标配——OpenVLA用它,Octo用它,小米的Xiaomi-Robotics-0也用它。为什么大家都这么爱DINOv2?因为它做到了一件前无古人的事:完全不需要任何标注,只靠看图片,就能学到和弱监督CLIP相当甚至更好的通用视觉特征。而且这些特征拿过来就能用,不需要微调,简直是视觉界的"万能钥匙"。今天我们就来深度拆解这篇神作,看看DINOv2到底是怎么炼
一切皆是因缘际会6 小时前
人工智能·深度学习·低代码·机器学习·ai·架构
AI低代码开发实战:轻量化部署与多场景落地随着AI技术从“实验室”走向“生产线”,开发者面临的核心痛点已从“会不会开发AI模型”转变为“如何快速落地AI应用”。2026年,AI低代码开发成为破解这一痛点的核心路径——它打破了“AI开发=高门槛、高成本、长周期”的固有认知,让普通开发者无需深耕算法底层,就能快速搭建可用、可复用的AI应用,同时轻量化部署技术的成熟,进一步降低了AI应用的落地门槛,成为CSDN开发者提升工作效率、抢占行业机遇的关键工具。本文将结合2026年AI低代码领域的最新趋势、核心工具、实战案例,详细拆解低代码开发流程与轻量化部署
EnCi Zheng7 小时前
人工智能·pytorch·python·深度学习·神经网络
09-斯坦福CS336作业 [特殊字符]本文档介绍斯坦福大学 CS336《从零开始的语言模型》课程的 5 个作业内容及其作用,帮助学习者了解这门硬核实践课程的核心训练环节。
Hali_Botebie7 小时前
人工智能·深度学习·transformer
【量化】Post-training quantization for vision transformer.基本上,量化任务可被视为分别为权重和输入寻找最优的低比特量化区间。为了保持注意力机制的功能性,我们在传统的量化目标中引入了一种排序损失(ranking loss),旨在量化后保持自注意力结果的相对顺序。此外,我们深入分析了不同层的量化损失与特征多样性之间的关系,并通过利用每个注意力图和输出特征的核范数,探索了一种混合精度量化方案。
郑寿昌8 小时前
人工智能·深度学习·transformer
SubQ颠覆Transformer:亚二次稀疏注意力革命SubQ模型通过其底层SSA(亚二次稀疏注意力)架构,从计算复杂度、长上下文处理效率和成本效益三个核心维度对Transformer架构构成了颠覆性挑战。其核心在于用内容依赖的稀疏注意力替代了Transformer中标准、稠密的全局注意力机制,实现了从 O(n²) 到接近 O(n log n) 的复杂度跃迁,并在功能上下文长度上展现出显著优势。
jay神8 小时前
前端·人工智能·深度学习·yolo·机器学习·毕业设计
基于YOLOv8的交通标志识别Web系统本项目是基于 YOLOv8 的交通标志识别 Web 系统,采用 Flask + Vue + MySQL 架构。系统包含前台用户端和后台管理员端,支持图片识别、视频识别、浏览器摄像头识别、识别历史管理,以及数据概览、数据集管理、模型管理、日志管理和用户管理。
名不经传的养虾人9 小时前
人工智能·深度学习·ai作画·nano banana 2·gpt-image-2
OpenAI GPT-Image-2.0 在线生图实测:$0.01/张,一组“南宋工笔画”看透模型差距2026年4月21日,OpenAI发布GPT-Image-2.0,上线12小时即登顶Image Arena文生图榜首,Elo 1512分,领先第二名Nano Banana 2整整241分。
RSTJ_162511 小时前
人工智能·python·深度学习
PYTHON+AI LLM DAY FOURTY-NINE今天简单聊聊卷积神经网络(Convolutional Neural Network CNN):就是含有卷积层的神经网络.是人工神经网络(ANN)的一种.具体分为数据输入层,卷积层,激励层,池化层,全连接层.数据输入层:对输入的数据进行一系列的处理,例如标准化,避免数据偏差太大.卷积层:获取输入的特征矩阵,有时为避免边缘信息丢失,需要对特征矩阵进行填充(padding),选择步长(stride).确定卷积核,然后用卷积核去和输入的特征矩阵做线性乘积求和.目的是提取数据的特征.相关API,torch.nn.C
Hali_Botebie11 小时前
人工智能·深度学习·bert
【蒸馏】Tinybert:Distilling BERT for natural language understanding.我们首先提出了一种新颖的 Transformer 蒸馏方法,该方法专为基于 Transformer 模型的知識蒸馏(Knowledge Distillation, KD)而设计。借助这一新的 KD 方法,大型“教师”BERT 中编码的大量知识可以有效地迁移到小型“学生”TinyBERT 中。随后,我们引入了一种新的两阶段学习框架,用于 TinyBERT,该框架在预训练阶段和特定任务学习阶段均执行 Transformer 蒸馏。该框架确保了 TinyBERT 能够捕获 BERT 中通用领域知识以及特定任务知
nashane11 小时前
人工智能·pytorch·深度学习·harmonyos
HarmonyOS 6学习:卡片组件圆角白边问题的诊断与修复实战在HarmonyOS 6应用开发中,我最近负责优化一个天气应用的桌面卡片。这个卡片设计得很精美——渐变背景、动态天气图标、实时温度显示,看起来一切都很好。但上线后,用户反馈来了一个问题:"你们的天气卡片四角怎么有白边?看着像没对齐一样,强迫症要犯了!"
Hali_Botebie11 小时前
人工智能·深度学习·bert
【量化】Q-bert: Hessian based ultra low precision quantization of bert.在本工作中,我们利用二阶海森矩阵信息进行详尽的细调 BERT 模型分析,并基于分析结果提出了一种将 BERT 模型量化至超低精度的新方法。具体而言,我们提出了一种新的分组量化方案,并采用基于海森矩阵的混合精度方法进一步压缩模型。
HyperAI超神经11 小时前
人工智能·深度学习
速度提升252倍,斯坦福/UCLA等用LSTM将二阶非线性光学仿真带入毫秒级时代二阶非线性光学是非线性光学里最重要、应用最广泛的核心分支,主要研究强激光与无中心反演对称的特殊光学晶体相互作用时,由二阶非线性极化率 χ⁽²⁾ 主导的光学效应。简单来说,当高强度激光射入这类晶体,光子会发生「能量合并和频率重组」,直接产生全新频率、全新颜色的光束,实现倍频(Second-harmonic generation,SHG)、和频(Sum-frequency generation,SFG)、差频(Difference-frequency generation,DFG)等经典非线性转换。在现代光学
HUUH12 小时前
深度学习
Kaggle入门比赛试验记录 -- Petals to the Metal本实验的实验环境为kaggle notebook比赛链接:www.kaggle.com/competition…
星浩AI12 小时前
人工智能·深度学习·llm
(三)一文看懂 Transformer:从 Token 到预测下一个字本文用 「春眠不觉」→ 补全「晓」 走通 Transformer 从输入到输出的完整链路。文首流程图用 4 字输入演示各步;后文示例多用整句 「春眠不觉晓」。示例模型为 uer/gpt2-chinese-cluecorpussmall(GPT-2 结构,层数、维度以 config.json 为准)。
Black蜡笔小新13 小时前
人工智能·深度学习·重构
企业AI算力工作站DLTM深度学习推理工作站AI智检重构制造业质量管控新模式质量是制造业的立身之本,高效、精准的质检体系是保障产品竞争力的关键。传统制造业质检长期依赖人工肉眼检测,面临成本高、效率低、标准难统一、漏检误检率高四大痛点,已难以适应现代生产需求。AI大模型训练工作站DLTM以低门槛、全流程、高智能的核心优势,为制造业提供一站式AI质检解决方案,推动质量管控从“人力驱动”向“AI驱动”的范式革新。