技术栈
模型微淘
小新同学^O^
2 小时前
开发语言
·
人工智能
·
python
·
模型微淘
简单学习 --> 模型微调
SFT (Supervised Fine-Tuning) - 有监督微调DPO (Direct Preference Optimization) - 直接偏好优化
我是有底线的