mhc

逐梦苍穹2 天前
人工智能·deepseek·mhc
速通DeepSeek论文mHC:给大模型装上物理阀门的架构革命🍃作者介绍:25届双非本科网络工程专业,阿里云专家博主,深耕 AI 原理 / 应用开发 / 产品设计。前几年深耕Java技术体系,现专注把 AI 能力落地到实际产品与业务场景。 🦅个人主页:@逐梦苍穹 📕所属专栏:🌩 专栏①:人工智能; 🌩 专栏②:速通人工智能相关论文 🐼GitHub主页:https://github.com/XZL-CODE ✈ 您的一键三连,是我创作的最大动力🌹
红尘炼丹客18 天前
人工智能·深度学习·大模型·mhc
DeepSeek 新作 mHC 解读:用流形约束(Manifold Constraints)重构大模型残差连接这篇由 DeepSeek-AI 团队于 2025 年末发布的论文 《mHC: Manifold-Constrained Hyper-Connections》(mHC:流形约束的超连接),是对现代深度神经网络(特别是大语言模型)底层宏观架构设计的一次极其深入且具有高度工程实用价值的探索。
hay_lee1 个月前
人工智能·算法·机器学习·deepseek·mhc
DeepSeek开年发布新论文:提出新型残差连接mHC12月31日晚间,DeepSeek团队发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。该架构解决了传统超连接(Hyper-Connections, HC)引发的信号爆炸与梯度不稳定问题。
一个处女座的程序猿1 个月前
transformer·dl·hc·mhc
DL之Transformer之mHC:《mHC: Manifold-Constrained Hyper-Connections》翻译与解读DL之Transformer之mHC:《mHC: Manifold-Constrained Hyper-Connections》翻译与解读
我是有底线的