【大模型微调】使用Llama Factory实现中文llama3微调

【大模型微调】使用Llama Factory实现中文llama3微调
github链接

为什么不用基座模型:95%用的英文数据训练,训练效果不好

所以用的Llama3-99-Chinese-Chat(别人微调过的再微调)

相关推荐
涛声依旧-底层原理研究所几秒前
防止Agent胡来五大安全防线
人工智能·python
我是谁??1 分钟前
【1】基于 GTX1660 Super + Docker + YOLOv8 的目标检测训练完整实践(Ubuntu22.04)
人工智能·yolo·目标检测
拓朗工控2 分钟前
工业视觉检测工控机采购的技术避坑指南
人工智能·计算机视觉·视觉检测·工业电脑·视觉工控机
RSTJ_16253 分钟前
PYTHON+AI LLM DAY FIFITY-THREE
开发语言·人工智能·python
programhelp_3 分钟前
Roblox Coding OA 面经分享|题量不小,但整体更偏工程思维
人工智能·算法·面试
周末也要写八哥3 分钟前
机器学习评价指标之平均概念
人工智能·算法·机器学习
侃谈科技圈5 分钟前
端侧AI基础设施:核心环节与代表企业
人工智能
Juicedata6 分钟前
降低数据存储成本:JuiceFS v1.4 分层存储设计解析
人工智能·开源
乐迪信息6 分钟前
乐迪信息:港口船舶盲区看不清?AI视觉检测精准识别
大数据·人工智能·安全·计算机视觉·目标跟踪·视觉检测
不知名的老吴7 分钟前
机器学习评价指标之综合指标的关系
人工智能·机器学习