深度学习

Pelb37 分钟前
人工智能·深度学习·神经网络·数学建模
求导 y = f(x) = x^2对于函数 y=f(x)=x2y = f(x) = x^2y=f(x)=x2,其导数 ∂y∂x=2x\frac{\partial y}{\partial x} = 2x∂x∂y=2x可以通过导数的定义或基本求导法则得到:
枫叶林FYL6 小时前
pytorch·python·深度学习
第10章 符号推理与神经符号AI一阶逻辑构成了人工智能中知识表示与推理的基石,其通过常量、变量、谓词、函数及量词构建形式化语言,旨在精确描述世界的状态与规律。与命题逻辑不同,一阶逻辑具备表达对象间关系的能力,其核心在于量词的作用范围与项的替换机制。推理过程旨在判定给定公式集是否逻辑蕴涵某一目标公式,这一过程通常转化为证明公式集与目标公式否定的不可满足性。归结原理是自动化定理证明中最核心的推理规则,其基本思想是通过消解互补文字来简化子句集。若两个子句分别包含互补的文字
小超同学你好8 小时前
人工智能·深度学习·transformer
Transformer 22. Gemma 1 架构详解:Decoder-only、GeGLU、RoPE 与每一步计算摘要:本文在 Decoder Only Transformer 与 LLaMA 架构 的统一框架下,系统介绍 Gemma 1(2B / 7B) 的架构与每一步的矩阵维度与运算。内容包括:Gemma 1 的定位(与 Gemini 技术同源的开源 Decoder-only 文本模型)、从文本到解码器的数据流(SentencePiece 词表、嵌入、无在嵌入上相加的绝对位置向量)、单层 Decoder 内的 Pre-Norm + RMSNorm、带掩码自注意力(7B 为 MHA,2B 为 MQA)与 RoPE、
fof92010 小时前
人工智能·深度学习
Base LLM | 从 NLP 到 LLM 的算法全栈教程 第七天首先看数据结构,针对label提取所有的实体类型并且基于BMES做标签映射,将映射表保存。针对文本:规范化文本(统一全角半角),统计词频,删掉小于最小词频的单词,添加pad和unk,注意排序使词汇表可复现。
龙文浩_10 小时前
人工智能·pytorch·深度学习
AI深度学习/PyTorch/反向传播与梯度下降import torchdef lwh_backward_grad(): “”" 前向传播 = 特征x * 权重w + 偏置b → 预测值z 反向传播 = 预测值z → 损失函数 → 损失值loss → 更新:权重w 、 偏置b 本案例:简化为单变量w,损失函数 loss = 2 * w²,演示单次前向+反向传播 “”" # ===================== 1. 定义可训练参数(权重w) ===================== # requires_grad=True:开启自动求导,PyT
独隅10 小时前
人工智能·深度学习·keras
Keras 全面介绍:从入门到实践Keras 是一个用 Python 编写的高级神经网络 API,其核心设计理念是 用户友好、模块化、可扩展。它最初由 Google 工程师 François Chollet 于 2015 年开发,旨在让深度学习研究者和开发者能够快速构建、训练和评估模型,而无需陷入底层框架(如 TensorFlow、Theano)的复杂细节。
cyyt11 小时前
人工智能·深度学习
深度学习周报(3.30~4.5)目录摘要Abstarct1 文献阅读:《Enhanced spectrum convolutional neural architecture: An intelligent leak detection method for gas pipeline》
qq_5710993511 小时前
人工智能·深度学习·机器学习
学习周报三十九学习LLaVA-OneVision-1.5的核心工作:通过8500万概念平衡的预训练数据和2200万指令数据,配合离线并行数据打包策略实现高效训练。模型采用RICE-ViT与Qwen3架构,创新性地引入区域聚类判别损失和两阶段强化学习(仅答案RL→思维链RL),显著提升了复杂多模态推理能力。重点记录了概念平衡采样、区域感知注意力、差异驱动的RL数据选择等可借鉴方法。
AI医影跨模态组学12 小时前
人工智能·深度学习·论文·医学·医学影像
Radiology子刊(IF=6.3)复旦大学附属金山医院强金伟教授等团队:基于多参数MRI的深度学习和影像组学评估早期宫颈癌淋巴结转移01文献学习今天分享的文献是由复旦大学附属金山医院强金伟教授等团队于2026年4月3日在《Radiology: Imaging Cancer》(中科院2区,IF=6.3)上发表的研究“Multiparametric MRI-based Deep Learning and Radiomics for Evaluating Lymph Node Metastasis in Early-Stage Cervical Cancer”即基于多参数MRI的深度学习和影像组学评估早期宫颈癌淋巴结转移,该研究是一项多中心
极光代码工作室12 小时前
python·深度学习·神经网络·机器学习·ai
基于深度学习的智能垃圾分类系统随着城市化进程加速和居民生活水平提升,我国生活垃圾年产量已突破2.5亿吨(住建部《2023年城乡建设统计年鉴》),传统人工分拣方式存在效率低、准确率差、人力成本高、二次污染严重等突出问题。为响应国家“双碳”战略与《“十四五”城镇生活垃圾分类和处理设施发展规划》政策导向,本研究设计并实现了一套端到端的基于深度学习的智能垃圾分类系统。系统采用改进型EfficientNetV2-S作为主干网络,融合注意力机制(CBAM)与标签平滑(Label Smoothing)策略,在自建高质量垃圾图像数据集(含4大类16子
卡梅德生物科技小能手12 小时前
经验分享·深度学习·生活
CD301(巨噬细胞半乳糖型凝集素):免疫稳态调控与靶向治疗的研究进展在免疫学与药物研发领域,C型凝集素受体家族一直是研究的热点。CD301(CLEC10A,巨噬细胞半乳糖型凝集素)作为该家族的重要成员,主要表达于巨噬细胞和树突状细胞表面。其通过识别特定的糖基结构,在维持免疫稳态、调控炎症反应及组织修复中发挥着关键作用。随着对自身免疫性疾病机制的深入理解,CD301已成为靶向治疗的重要研究对象。本文将从分子机制、药物研发及未来趋势三个方面,系统解析该靶点的研究现状。
多年小白13 小时前
网络·人工智能·科技·深度学习·计算机视觉
OpenAI 发布 DALL-E 4:4K分辨率+视频生成,AI图像创作进入新阶段前言DALL-E 4刚发布,我第一时间扒了一遍官方信息和早期测试反馈,整理成这篇文章。对AI图像生成感兴趣的开发者和创作者应该都关注到了——这次升级不是小修小补,而是几乎重构了上限:分辨率从2K拉到4096×4096,支持数百种艺术风格,还塞进了视频生成能力。
67X13 小时前
深度学习·网络安全
【论文写作】基于深度学习的异常检测方法(Deep learning-based anomaly detection methods)摘 要 随着5G时代的到来,网络安全也是人们逐渐关注的话题。针对网络安全这部分,异常检测是重点之一,异常检测在金融欺诈检测、医疗诊断、网络安全等方面得到了广泛的应用。现已有许多研究者研究了基于深度学习的异常检测这一个热点话题,因此本文将针对基于深度学习的异常检测进行分类,并指出问题所在以及各方法的原理、优缺点和应用场景,同时叙述未来可能的前景。
SkyXZ~13 小时前
人工智能·深度学习·rdk·地瓜机器人·rdks100·leap工具链
RDK-OE-LLM工具链量化SigLip全流程作者:SkyXZCSDN:SkyXZ~-CSDN博客博客园:SkyXZ - 博客园随着多模态大模型、VLM 乃至 VLA 的快速发展,越来越多的模型在视觉编码器部分采用了 SigLip 这一类结构。相比传统 CNN,SigLip 这类以 Transformer 为核心的视觉骨干在跨模态任务中表现更强,但也正因为其结构更复杂、对数值分布更敏感,直接沿用 RDK 传统 PTQ 量化流程时,往往会出现较明显的精度掉点。此前我也写过一篇基于传统工具链量化 ViT 的教程,虽然整体流程能够跑通,但从最终效果来看,精
Learn Beyond Limits13 小时前
人工智能·rnn·深度学习·神经网络·机器学习·自然语言处理·nlp
多层循环神经网络|Multi-layer RNNs-----------------------------------------------------------------------------------------------
龙文浩_13 小时前
人工智能·深度学习·神经网络
AI深度学习神经网络的结构设计与激活机制AI深度学习神经网络的结构设计与激活机制
Pushkin.13 小时前
人工智能·深度学习·机器学习
LLM预训练完全指南:从理论到NanoQwen实战| 项目:NanoQwen | 难度:⭐⭐⭐⭐ 中高级预训练(Pre-training) 是大语言模型(LLM)训练的第一阶段,也是最重要的阶段。它的核心思想是:
机器学习之心13 小时前
深度学习·gru·transformer·门控循环单元·编码器·二次分解
CEEMDAN-VMD-Transformer-GRU二次分解+编码器+门控循环单元多元时间序列预测实际工程与科学数据(如振动信号、电力负荷、金融时序)常呈现非线性、非平稳特征,单一预测模型难以充分提取多尺度信息。为此,结合自适应信号分解(CEEMDAN、VMD)与深度学习(Transformer、GRU)成为提升预测精度的有效手段。本代码实现了一套“分解-聚类-再分解-分量预测-重构”的完整流程,旨在提高复杂时间序列的预测性能。
wd5i8kA8i13 小时前
人工智能·深度学习·transformer
Transformer 与模型架构原理Transformer 采用 Encoder-Decoder 架构,但两者都由相同的 Layer 堆叠而成。
带娃的IT创业者13 小时前
人工智能·深度学习·神经网络·科普·技术分享·ai架构·nct
NCT 是什么——让 AI 拥有意识的尝试📚 《从零到一造大脑:AI架构入门之旅》专栏专栏定位:面向中学生、大学生和 AI 初学者的科普专栏,用大白话和生活化比喻带你从零理解人工智能 本系列共 42 篇,分为八大模块: