深度学习

wuxuand29 分钟前
人工智能·深度学习
读顶刊综述:新兴技术下深度学习入侵检测的现状、鸿沟与未来最近精读了 Neto 等人发表的《Deep learning for intrusion detection in emerging technologies: a comprehensive survey and new perspectives》这篇 2025 年的顶级综述,作为聚焦网络安全与深度学习交叉领域的研究,它没有停留在对算法的泛泛罗列,而是直击深度学习入侵检测系统(DL-IDS)从实验室走向产业落地的核心痛点,完整梳理了云、边缘、IoT 等新兴技术场景下的安全攻防全景。这篇博客将完整复盘我的
冰西瓜60031 分钟前
人工智能·深度学习·transformer
深度学习的数学原理(二十三)—— Transformer开篇:从迷你模型到核心逻辑在前文的学习中,我们先后拆解了传统序列模型RNN/LSTM的固有缺陷,也掌握了Seq2Seq编码器-解码器的基础框架,理解了其作为序列转换任务通用范式的核心思想。但经典RNN版Seq2Seq存在的信息压缩瓶颈、长距离梯度消失、无差异化上下文依赖等问题,让其在复杂序列任务(如长文本翻译、语义理解)中性能受限。
2601_9507607938 分钟前
人工智能·深度学习·蛋白
IL-7蛋白在脓毒症适应性免疫紊乱中的研究进展一、脓毒症免疫抑制与适应性免疫紊乱脓毒症是重症监护病房的主要死亡原因之一,其发生发展的核心机制在于机体免疫功能紊乱。最新临床研究显示,脓毒症早期促炎反应阶段即出现淋巴细胞数量减少,包括T淋巴细胞、B淋巴细胞和树突状细胞等。尸检发现,脓毒症患者脾脏、淋巴结及循环血中CD4阳性和CD8阳性T细胞耗损数量远大于炎性细胞浸润量,表明适应性免疫细胞耗竭导致的机体免疫麻痹是脓毒症病理生理过程的重要特征。T淋巴细胞免疫无反应性一直被认为是脓毒症免疫功能异常的标志,表现为外周血T细胞凋亡、T细胞计数下降及T细胞分化异常。
AI医影跨模态组学1 小时前
人工智能·深度学习·医学·医学影像
EJNMMI(IF=7.6)四川大学华西医院田蓉、李康等团队:基于深度学习的PET‑CT生物标志物用于滤泡淋巴瘤早期进展预测及生存分层01文献学习今天分享的文献是由四川大学华西医院田蓉、李康等团队于2026年3月23日在《European Journal of Nuclear Medicine and Molecular Imaging》(中科院1区top,IF=7.6)上发表的研究“A deep learning PET-CT biomarker for early progression (POD24) and survival stratification in follicular lymphoma: a multicenter
m0_564876841 小时前
人工智能·深度学习·学习
提示词工程Zero-Shot、One-Shot、Few-ShotZero-Shot、One-Shot、Few-Shot 主要归属于提示词工程:1. Zero-Shot(零样本学习):不提供任何示例,直接问,直接答出整个问题。(一步到位)
刘若里1 小时前
论文阅读·人工智能·笔记·深度学习·计算机视觉
【论文阅读】自适应稀疏自注意力——可直接用!论文标题Adaptive Sparse Self-Attention for Efficient Image Super-resolution and Beyond
刘简爱学习1 小时前
人工智能·深度学习·计算机视觉
用于病理图像多类分割的弱监督状态空间模型PathMamba论文题目:PathMamba: Weakly Supervised State Space Model for Multi-class Segmentation of Pathology Images
逆境不可逃2 小时前
人工智能·深度学习·机器学习
【用AI学Agent】Agent入门前置:大模型基础(开发向)首先欢迎大家点进文章,其次申明:本系列内容是作者通过AI学习Agent得到的内容,如若有错误之处,欢迎批评指正
极光代码工作室2 小时前
人工智能·python·深度学习·机器学习
基于机器学习的商品销量预测系统设计在数字经济深度渗透零售行业的背景下,精准的商品销量预测已成为企业实现智能补货、动态定价、库存优化与营销决策的核心能力。传统基于经验或简单时间序列的预测方法难以应对多源异构数据(如促销活动、节假日、天气、用户行为、竞品价格等)带来的非线性、高维度与强时序耦合特性。本文设计并实现了一套端到端的机器学习驱动商品销量预测系统,融合特征工程、集成学习与深度学习技术,构建了以XGBoost为主模型、LSTM为辅助时序模型的混合预测框架。系统采用Python生态构建,后端基于Flask微服务架构,前端使用Vue.js实
liliwoliliwo2 小时前
人工智能·深度学习·transformer
transformer架构详解模型首先将每个输入标记映射为表征语义的嵌入向量,随后,讲这些向量输入多层transformer块进行处理,每个块都是专为高效数据学习设计的神经网络架构,并具备良好的jpu扩展性。每个transformer块由注意力层和前馈网络组成, 模型将transformer块的输出向量,,传递给最终组件,语言模型头,由其生成输出标记。
AI人工智能+2 小时前
深度学习·计算机视觉·ocr·医疗器械注册证识别
医疗器械注册证识别技术采用深度学习与计算机视觉技术,实现注册证关键信息的智能提取与结构化转换在医疗器械行业,从生产、流通到临床使用,医疗器械注册证作为国家药品监督管理局(NMPA)颁发的产品“身份证”,是市场准入的核心凭证。然而,面对海量、格式多样、信息密集的注册证文档,传统的人工录入与审核方式面临多重挑战:效率低下——单张证件录入耗时数分钟;易出错——疲劳导致的关键字段误判;版式差异大——不同时期、不同类别的注册证存在显著格式差异。这些问题已成为行业数字化转型的显著瓶颈。
scott1985123 小时前
深度学习·stable diffusion·扩散模型·生成式
扩散模型之(二十)Stable Diffusion的运作原理Stable Diffusion作为 Latent Diffusion的继承与发展,它的发布是这一发展历程中的一个重要里程碑,因为它将高性能模型带给了大众(性能体现在图像质量、速度以及相对较低的资源/内存需求等方面)。本文对Stable Diffusion的工作原理与发展过程技术演进进行对比。
YuanDaima20483 小时前
人工智能·pytorch·笔记·python·深度学习·机器学习·conda
解决Conda环境下RTX 50系列显卡PyTorch+Transformers+PEFT微调报错声明:本文记录了个人在配置 Conda 环境过程中遇到的问题与解决思路,文中涉及的软硬件环境及操作步骤仅供参考与学习。
适应规律3 小时前
人工智能·深度学习
深度学习第四版r(秩)决定参数量,α(缩放系数)决定数值大小,这个增量的数值越大,对原始权重的修改幅度越大。A 和 B 就是两个普通的线性层(nn.Linear),没有偏置项。
八角Z3 小时前
科技·深度学习·创业创新
从行为惯性到正向认同:留守问题青年在数字社群中的风险机制与干预策略研究摘要: 随着数字化进程的加深,留守问题青年日益将数字社群作为获取社会支持与身份认同的核心场域。本文基于“惯性共同体”理论,深度剖析了数字社群对留守青年的高风险吸引力机制。研究发现,即时互惠、时序依赖与行为惯性这套底层逻辑,在弱关系约束下极易促使留守青年从“行为惯性”滑向“犯罪惯性”,构建出扭曲的能力身份。传统的“堵、疏、教”干预模式因脱离数字逻辑而失效。为此,本文提出“以子之矛攻子之盾”的干预新范式,主张通过创设替代性高价值反馈源、构建结构性良性互惠、赋能健康数字身份等策略,为留守青年构建“正向惯性共同体
枫叶林FYL3 小时前
人工智能·深度学习
MCP 实现深度技术报告Model Context Protocol (MCP) 是 Anthropic 推出的开放标准协议,旨在标准化 AI 助手与外部数据源、工具之间的集成方式。在 Claude Code 中,MCP 不仅是外部集成接口,更是核心架构组件,深度融入工具调用、权限管理和 UI 渲染体系。
iiiiii113 小时前
笔记·深度学习·学习·语言模型·大模型·llm·transformer
【LLM学习笔记】Batch Normalization vs Layer Normalization,为什么 NLP 中使用 LN 而非 BN在深度学习中,Batch Normalization(BN)和Layer Normalization(LN)是两种最常用的归一化技术。它们的本质差异可以归结为两点:归一化维度不同和统计独立性假设不同。
Elastic 中国社区官方博客4 小时前
大数据·数据库·人工智能·深度学习·elasticsearch·搜索引擎·全文检索
从判断列表到训练好的 Learning to Rank( LTR )模型作者:来自 Elastic Jeffrey Rengifo学习如何将判断列表转换为 Learning To Rank( LTR )的训练数据,设计有效特征,并解读模型学到了什么。
卡梅德生物科技小能手4 小时前
经验分享·深度学习·生活
深度解析先天免疫核心受体:TLR2(CD282)的分子机制、信号通路与药物研发技术路径CD282(TLR2)定位于人类4号染色体(4q31.3),属于I型跨膜蛋白,是TLR家族中配体识别谱最广的受体之一。其核心功能在于通过异源二聚化机制拓展识别范围:
HyperAI超神经4 小时前
人工智能·深度学习·学习·机器学习·gpu·orc·vllm
在线教程丨华中科大与小红书 hi lab开源dots.mocr,SOTA级OCR模型完美还原文档结构,图形也能转 SVG面对海量文档中的复杂图表、表格和多语言内容,传统 OCR 常常力不从心,主要原因是其核心能力集中于文本识别,往往将图表、公式、UI 布局等复杂视觉元素简单裁剪为图像,导致文档结构被破坏、语义关系丢失,难以满足高质量信息提取与重建需求。