技术栈

蒸馏-小模型微调

张彦峰ZYF
4 小时前
人工智能·ai·deepseek-v3·deepseek-r1·蒸馏-小模型微调
借助DeepSeek思考产业落地:蒸馏、小模型微调目录一、为什么蒸馏会成为行业落地的关键技术?二、为什么不能直接微调 DeepSeek-R1?(成本与数据的现实限制)
我是有底线的