【大模型微调】使用Llama Factory实现中文llama3微调

【大模型微调】使用Llama Factory实现中文llama3微调
github链接

为什么不用基座模型:95%用的英文数据训练,训练效果不好

所以用的Llama3-99-Chinese-Chat(别人微调过的再微调)

相关推荐
说私域2 小时前
情绪点设置在开源AI大模型驱动的S2B2C商城小程序AI智能名片中的应用研究
人工智能·小程序·开源
海底的星星fly2 小时前
【Prompt学习技能树地图】思维链(CoT)提示技术工作原理、主要技术方法及实践应用
人工智能·语言模型·prompt
Avicli2 小时前
从Prompt到Answer:详解AI Agent架构中的ReAct模式与工具调用
人工智能·prompt
腾飞开源3 小时前
AI智能体实战开发教程(从0到企业级项目落地):62节全完结,助力金九银十升职加薪!
人工智能·ai智能体·金九银十·agent落地实战·升职加薪·学习先机·企业级项目实战
黄啊码3 小时前
【黄啊码】别再花钱了,五分钟教你做一个国庆头像智能体小程序
人工智能
AI绘画哇哒哒3 小时前
实战:SQL统一访问200+数据源,构建企业级智能检索与RAG系统(下)
人工智能·sql·深度学习·学习·ai·程序员·大模型
2401_841495643 小时前
【计算机视觉】图像去雾技术
人工智能·python·opencv·算法·计算机视觉·技术·图像去雾
河北北重机械9663 小时前
汽车安全性能测试与铸铁底座的重要性
人工智能·算法·机器学习·铸铁底座·铁底座装配·试验台基底座加工
HyperAI超神经3 小时前
香港科技大学提出融合神经网络框架,高效预测蛋白质序列的多金属结合位点
人工智能·深度学习·ai
支付宝小程序云3 小时前
Ant Design X ✖️ 百宝箱智能体 SDK 极速构建 AI 聊天应用
人工智能