深度学习

T.i.s41 分钟前
人工智能·深度学习
parall scan(并行扫描)通俗理解今天,看b站的论文解读,Mamba涉及到了一个parallel scan,是一个并行计算的机制。说实话,最开始这个点我确实没听懂。“这个加这个,然后再加那个”——这套逻辑从我个人视角看,不太容易转过来。我觉得主要原因在于人脑的思维习惯:人脑本身是一套极其复杂的并行系统,但注意力的切换和维持是有成本的[1]。正因如此,在面对某些具体的小问题时,人脑的思考路径和计算机的实际执行方式之间,会出现一种“割裂感”。理解 parallel scan 的过程,恰好就踩在了这道裂缝上。
h64648564h1 小时前
人工智能·深度学习
CANN 昇腾训练食谱全景解读:cann-recipes-train 架构与使用指南深度学习模型训练是一个复杂的过程,涉及数据预处理、模型定义、训练循环、性能优化等多个环节。昇腾 CANN 的 cann-recipes-train 仓提供了丰富的训练优化食谱,覆盖图像分类、目标检测、自然语言处理等多个领域。本文深入解析 cann-recipes-train 的架构设计、核心内容和实际应用方法。
灰灰勇闯IT2 小时前
pytorch·python·深度学习
DeepSeek-R1 在 CANN 上的推理部署本文基于昇腾CANN和昇腾NPU,围绕 cann-recipes-infer 仓库的相关技术展开。DeepSeek-R1 是个 MoE 模型——671B 总参数但每次推理只激活 37B。这对推理系统是个结构性的挑战:MoE 的路由选择和 Expert 调度依赖通信,CANN 的集合通信库 HCCL 和单边通信库 hixl 构成了 MoE 推理的通信底座。
努力学习_小白2 小时前
pytorch·深度学习·inception v1
Inception V1——学习记录2014年,Google团队在ImageNet大规模视觉识别挑战赛(ILSVRC 2014)中提出了一种代号为“Inception”的深度卷积神经网络架构,即GoogLeNet(InceptionV1),一举斩获分类与检测双料冠军。该架构以500万参数量达到了top-5错误率6.67%的优异性能,参数量仅为AlexNet(6000万)的1/12,计算量仅15亿次浮点运算,却拥有22层的深度,远超过AlexNet的8层。
星河耀银海3 小时前
人工智能·深度学习·transformer
人工智能:注意力机制与Transformer模型实战💡 学习目标:掌握注意力机制的核心原理、经典注意力算法,以及Transformer模型的架构设计与实战应用。 💡 学习重点:理解自注意力与多头注意力的计算逻辑,学会使用TensorFlow搭建Transformer模型,完成机器翻译任务。
生成论实验室3 小时前
人工智能·深度学习·语言模型·机器人·自动驾驶
用事件关系网络重新理解AI:自注意力机制、词向量、CNN、GAN、强化学习、Dropout、知识蒸馏在前几篇文章中,我提出了一个核心命题:智能的本质不是“知道什么”,而是“知道在发生什么”。 要实现这种智能,我们的AI系统必须从处理“实体”转向处理“事件”。事件不是孤立的存在者,而是在关系网络中确定自身意义的发生。事件之间的关系——因果的、依赖的、冲突的、共振的——构成了认知的基本语法。
ybdesire4 小时前
人工智能·深度学习·机器学习
详解大模型DPO训练数据格式DPO(Direct Preference Optimization,直接偏好优化) 是 2023 年由斯坦福与谷歌提出的、替代 RLHF 的 LLM 人类对齐算法;核心是无需奖励模型、无需 PPO,用偏好对数据 结合 特殊损失函数,直接把 SFT 模型微调成符合人类偏好的模型,训练更快、更稳、更省显存。
文歌子4 小时前
人工智能·深度学习
认识 Prithvi:NASA × IBM 的遥感基础模型HuggingFace 上最受欢迎的遥感 AI 模型。读完你会用 Prithvi 提取卫星图像特征,用于分类、分割、变化检测。
txg6664 小时前
汇编·深度学习·安全·transformer
编译无关的漏洞检测:基于 Transformer 的 LLVM-IR 与汇编鲁棒建模“在真实软件开发与部署环境中,同一份源代码可能因编译器版本、优化级别或目标架构的不同,而生成差异显著的中间表示或汇编代码。这种“编译差异”会导致现有漏洞检测模型在一个编译配置下有效,却在另一个配置下迅速失效。针对这一问题,研究团队提出了一种面向多编译结果的鲁棒漏洞检测方法,系统比较了LLVM-IR与 Assembly两种表示在跨编译场景下的稳定性,并基于 Transformer 架构构建统一检测模型,为“编译无关漏洞检测”提供了新的实证与方法论支撑。
一切皆是因缘际会5 小时前
人工智能·深度学习·ai·重构
人工智能从对话工具向自主生产力跃迁近两年,大众对人工智能的认知正在发生根本性转变。曾经的AI,无论模型参数多大、对话多流畅,本质上都属于“被动响应式工具”,人类下达指令,模型执行输出,无法突破人机单向交互的局限。而2025至2026年,人工智能正式告别聊天辅助阶段,进入AI智能体(Agent)规模化落地的全新周期。AI不再只做回答者,而是成为具备自主规划、任务拆解、工具调用、闭环纠错能力的独立智能单元,完成了从“对话AI”到“行动AI”的关键进化。
手写码匠6 小时前
人工智能·深度学习·算法·aigc
【实战评测】华为云 MaaS 平台 DeepSeek 大模型推理服务 + Dify 一键部署全攻略2025 年以来,DeepSeek 系列模型凭借其出色的推理能力和极具竞争力的价格,迅速成为国内开发者社区的热门选择。无论是 DeepSeek-V3 的综合能力,还是 DeepSeek-R1 在数学推理与代码生成方面的惊艳表现,都让人看到了国产大模型的真正实力。
晚烛6 小时前
开发语言·网络·人工智能·python·深度学习
CANN 数据流水线优化:从数据加载到模型输入的端到端加速一个完整的推理请求,数据要经过这样的旅程:在优化之前,先要搞清楚瓶颈在哪里。盲目优化错误的环节,只会浪费时间。
AI街潜水的八角6 小时前
人工智能·pytorch·深度学习
PyTorch框架——基于深度学习PmrNet神经网络AI去噪图像增强系统(含训练代码、数据集和GUI交互界面)PmrNet是一种基于U-Net架构改进的深度学习网络,来自于论文《Practical Deep Raw Image Denoising on Mobile Devices》,这个网络聚焦于在移动设备上实现高效的原始图像(RAW)去噪(本文用来做去噪),解决了传统方法在计算资源受限的移动端难以部署的问题。
song5017 小时前
人工智能·分布式·深度学习·transformer·交互
对话:模型推理慢,怎么调A:模型上线了,推理延迟 280ms,比预期高了一倍。B:280ms 是什么模型?输入多大?A:BERT-base,序列长度 512,batch=1。
z小猫不吃鱼7 小时前
人工智能·深度学习·transformer
12 从 ViT 到 Swin:视觉 Transformer 主干网络的发展脉络总结到目前为止,我们已经整理了视觉 Transformer 发展中的几个关键模型:ViT DeiT PVT PVTv2 Swin Transformer
格桑阿sir7 小时前
深度学习·ai·架构·llm·transformer·agent·智能体
02-大模型智能体开发工程师:Transformer架构核心原理系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文从RNN的局限性出发,详解Transformer的核心架构:输入表示层(Token Embedding + 位置编码)、Transformer Block(多头自注意力 + FFN + 残差连接 + 层归一化)、输出层;重点拆解了Self-Attention计算过程、多头注意力、FFN的"升维-激活-降维"本质(模式匹配+知识检索)、MoE演进、以及Encoder-only vs Decoder-only的分野和KV Cache加速原理。
udc小白7 小时前
人工智能·深度学习·神经网络·机器学习
EXCEL实现MLP实例本文档详细分析 计算示例.xlsx 中展示的多层感知器(MLP)前向传播与反向传播计算过程。输入数据:
段一凡-华北理工大学8 小时前
数据库·人工智能·深度学习·神经网络·安全·架构·高炉炼铁智能化
2026 高炉炼铁智能化技术全景与演进路径~系列文章04:云-边-端协同架构:高炉智能化底层支撑体系导言:智能化系统的"智商"再高,也需要"强健的体魄"来支撑。本期我们将深入探讨高炉智能化系统的底层架构——如何通过"云-边-端"三层协同,实现海量工业数据的实时处理与智能推理,并确保系统的可靠性、实时性与可扩展性。
Rocky Ding*8 小时前
人工智能·深度学习·机器学习·chatgpt·ai作画·stable diffusion·aigc
昔日AI绘画框架王者Stable Diffusion WebUI,已死【WeThinkIn出品】栏目分享Rocky的认知思考与经验感悟,范围涵盖但不限于AI行业。欢迎大家关注Rocky的公众号:WeThinkIn 欢迎大家关注Rocky的知乎:Rocky Ding AIGC算法工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~ 获取更多AI行业的前沿资讯与干货资源
解局易否结局9 小时前
人工智能·pytorch·深度学习
GE 和 Runtime:不是上下游,是协同决策你以为 GE 做完融合决策,交给 Runtime 执行就行了?其实它们是一个协同系统——GE 决定"融什么",Runtime 决定"怎么跑",但 GE 的融合决策必须考虑 Runtime 的调度约束,Runtime 的调度策略也必须参考 GE 的融合结果。