deepseek-v3.2

黑客-雨13 天前
人工智能·程序员·大模型·知识图谱·agent·大模型教程·deepseek-v3.2
DeepSeek-V3.2深度拆解:开源模型逆袭,GPT-5迎来劲敌!从 685B 参数的稀疏架构到 IMO 金牌实力的 Speciale 一文看懂中国 AI 的"后训练"革命
大千AI助手1 个月前
人工智能·机器学习·agent·智能体·deepseek·deepseek-v3.2·大千ai助手
DeepSeek V3.2 能不能真正跑 Agent?本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
大千AI助手2 个月前
人工智能·机器学习·agent·dsa·deepseek·deepseek-v3.2·大千ai助手
DeepSeek V3.2 技术解读:一次不靠“堆参数”的模型升级本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
叶庭云4 个月前
开源·昇腾·开发效率·tilelang·算子编程语言·deepseek-v3.2·国产 ai 硬件
一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/随着人工智能(Artificial Intelligence,AI)技术的迅猛发展,深度学习模型的复杂度和规模正呈指数级增长,这给底层计算效率带来了前所未有的挑战。AI 算子是构成深度学习模型的基本计算单元,其性能直接决定了整个模型的训练和推理效率。然而,传统的算子开发语言存在诸多瓶颈。例如,CUDA 编程门槛高;Triton (提供了领域专用的语言和编译器)等现有领域专用语言(Domain-Specific Lang
我是有底线的