Deepseek 模型蒸馏

相关推荐
西西弗Sisyphus12 天前
知识蒸馏 - 最小化KL散度与最小化交叉熵是完全等价的
distillation·蒸馏
小王子102420 天前
Django模型开发:模型字段、元数据与继承全方位讲解
mysql·django·模型
Menger_Wen25 天前
【金融机器学习】第五章:最优投资组合——Bryan Kelly, 修大成(中文翻译)
人工智能·python·机器学习·金融·模型·量化
Menger_Wen25 天前
【金融机器学习】第三章:收益预测——Bryan Kelly, 修大成(中文翻译)
人工智能·python·机器学习·区块链·模型·量化
Menger_Wen25 天前
【金融机器学习】第二章:复杂模型的优势——Bryan Kelly, 修大成(中文翻译)
人工智能·机器学习·模型·量化
Menger_Wen25 天前
【金融机器学习】第四章:风险-收益权衡——Bryan Kelly, 修大成(中文翻译)
人工智能·python·机器学习·模型·量化
大千AI助手1 个月前
TinyBERT:知识蒸馏驱动的BERT压缩革命 | 模型小7倍、推理快9倍的轻量化引擎
人工智能·深度学习·机器学习·自然语言处理·bert·蒸馏·tinybert
AI掘金3 个月前
DeepSeek实战--蒸馏
微调·aigc·蒸馏·ai应用·deepseek·小模型推理
Panesle4 个月前
大模型微调与蒸馏的差异性与相似性分析
人工智能·微调·蒸馏
伊织code4 个月前
SAM 2 (Segment Anything ):图像与视频通用分割模型
sam·图像·视频·模型·segment·anything·分隔