技术栈

Deepseek 模型蒸馏

小田_2025-03-03 17:08

赋范课堂:
https://www.bilibili.com/video/BV1qUN8enE4c/

















上一篇:【tplink】校园网接路由器如何单独登录自己的账号,wan-lan和lan-lan区别
下一篇:php中使用laravel9项目 使用FFMpeg视频剪辑功能
相关推荐
AI掘金
17 小时前
DeepSeek实战--蒸馏
微调·aigc·蒸馏·ai应用·deepseek·小模型推理
Panesle
13 天前
大模型微调与蒸馏的差异性与相似性分析
人工智能·微调·蒸馏
伊织code
14 天前
SAM 2 (Segment Anything ):图像与视频通用分割模型
sam·图像·视频·模型·segment·anything·分隔
伊织code
2 个月前
MCP 开放协议
github·协议·模型·mcp
放羊郎
2 个月前
宇树人形机器人开源模型
模型·gazebo·人形机器人·宇树·go2·b2·h1
dundunmm
2 个月前
【数据挖掘】知识蒸馏(Knowledge Distillation, KD)
人工智能·深度学习·数据挖掘·模型·知识蒸馏·蒸馏
Jackilina_Stone
3 个月前
【论文阅读笔记】浅谈深度学习中的知识蒸馏 | 关系知识蒸馏 | CVPR 2019 | RKD
论文阅读·深度学习·蒸馏·rkd
Jackilina_Stone
3 个月前
【论文阅读笔记】知识蒸馏:一项调查 | CVPR 2021 | 近万字翻译+解释
论文阅读·人工智能·深度学习·蒸馏
Jackilina_Stone
3 个月前
【DL】浅谈深度学习中的知识蒸馏 | 输出层知识蒸馏
人工智能·深度学习·机器学习·蒸馏
热门推荐
01从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑02KGG转MP3工具|非KGM文件|解密音频03YOLOv8入门 | 重要性能衡量指标、训练结果评价及分析及影响mAP的因素【发论文关注的指标】04【SpeedAI科研小助手】2分钟极速解决知网维普重复率、AIGC率过高,一键全文降!文件格式不变,公式都保留的!05苍穹外卖面试总结06西电B测-计算机网络综合实验(含验收问题)07Coze扣子平台完整体验和实践(附国内和国际版对比)08yolov8,yolo11,yolo12 服务器训练到部署全流程 笔记09DeepSeek各版本说明与优缺点分析10YOLOv5改进 | 添加CA注意力机制 + 增加预测层 + 更换损失函数之GIoU