技术栈

模型微淘

小新同学^O^
2 小时前
开发语言·人工智能·python·模型微淘
简单学习 --> 模型微调SFT (Supervised Fine-Tuning) - 有监督微调DPO (Direct Preference Optimization) - 直接偏好优化
我是有底线的