技术栈

Deepseek 模型蒸馏

小田_2025-03-03 17:08

赋范课堂:
https://www.bilibili.com/video/BV1qUN8enE4c/

















上一篇:【tplink】校园网接路由器如何单独登录自己的账号,wan-lan和lan-lan区别
下一篇:php中使用laravel9项目 使用FFMpeg视频剪辑功能
相关推荐
AI掘金
24 天前
DeepSeek实战--蒸馏
微调·aigc·蒸馏·ai应用·deepseek·小模型推理
Panesle
1 个月前
大模型微调与蒸馏的差异性与相似性分析
人工智能·微调·蒸馏
伊织code
1 个月前
SAM 2 (Segment Anything ):图像与视频通用分割模型
sam·图像·视频·模型·segment·anything·分隔
伊织code
3 个月前
MCP 开放协议
github·协议·模型·mcp
放羊郎
3 个月前
宇树人形机器人开源模型
模型·gazebo·人形机器人·宇树·go2·b2·h1
dundunmm
3 个月前
【数据挖掘】知识蒸馏(Knowledge Distillation, KD)
人工智能·深度学习·数据挖掘·模型·知识蒸馏·蒸馏
Jackilina_Stone
3 个月前
【论文阅读笔记】浅谈深度学习中的知识蒸馏 | 关系知识蒸馏 | CVPR 2019 | RKD
论文阅读·深度学习·蒸馏·rkd
Jackilina_Stone
3 个月前
【论文阅读笔记】知识蒸馏:一项调查 | CVPR 2021 | 近万字翻译+解释
论文阅读·人工智能·深度学习·蒸馏
Jackilina_Stone
3 个月前
【DL】浅谈深度学习中的知识蒸馏 | 输出层知识蒸馏
人工智能·深度学习·机器学习·蒸馏
热门推荐
01KGG转MP3工具|非KGM文件|解密音频02YOLOv8入门 | 重要性能衡量指标、训练结果评价及分析及影响mAP的因素【发论文关注的指标】03从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑04【SpeedAI科研小助手】2分钟极速解决知网维普重复率、AIGC率过高,一键全文降!文件格式不变,公式都保留的!05DeepSeek各版本说明与优缺点分析06组基轨迹建模 GBTM的介绍与实现(Stata 或 R)07YOLOv5改进 | 添加CA注意力机制 + 增加预测层 + 更换损失函数之GIoU08【2025年最新】OpenWrt 更换国内源的指南(图形界面版)09VMware虚拟机安装Win7专业版保姆级教程(附镜像包)10如何在WPS和Word/Excel中直接使用DeepSeek功能