技术栈

mhc

红尘炼丹客
2 天前
人工智能·深度学习·大模型·mhc
DeepSeek 新作 mHC 解读:用流形约束(Manifold Constraints)重构大模型残差连接这篇由 DeepSeek-AI 团队于 2025 年末发布的论文 《mHC: Manifold-Constrained Hyper-Connections》(mHC:流形约束的超连接),是对现代深度神经网络(特别是大语言模型)底层宏观架构设计的一次极其深入且具有高度工程实用价值的探索。
hay_lee
19 天前
人工智能·算法·机器学习·deepseek·mhc
DeepSeek开年发布新论文:提出新型残差连接mHC12月31日晚间,DeepSeek团队发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。该架构解决了传统超连接(Hyper-Connections, HC)引发的信号爆炸与梯度不稳定问题。
一个处女座的程序猿
20 天前
transformer·dl·hc·mhc
DL之Transformer之mHC:《mHC: Manifold-Constrained Hyper-Connections》翻译与解读DL之Transformer之mHC:《mHC: Manifold-Constrained Hyper-Connections》翻译与解读
我是有底线的