技术栈
微调格式
学Linux的语莫
3 小时前
人工智能
·
算法
·
机器学习
·
微调格式
大模型微调数据集格式详解:Alpaca、ShareGPT、DPO、KTO、预训练数据怎么构建?
在做大模型微调时,很多人第一步不是卡在模型,也不是卡在显卡,而是卡在数据集格式。同样是“微调数据”,不同训练任务需要的数据格式并不一样:
我是有底线的