【大模型微调】使用Llama Factory实现中文llama3微调

【大模型微调】使用Llama Factory实现中文llama3微调
github链接

为什么不用基座模型:95%用的英文数据训练,训练效果不好

所以用的Llama3-99-Chinese-Chat(别人微调过的再微调)

相关推荐
tilblackout4 分钟前
机器学习详解(28):LightGBM原理
人工智能·机器学习
云卓SKYDROID14 分钟前
无人机气动设计模块解析
人工智能·计算机视觉·目标跟踪·无人机·高科技
数据皮皮侠19 分钟前
中国汽车能源消耗量(2010-2024年)
大数据·数据库·人工智能·物联网·金融·汽车·能源
love530love40 分钟前
Windows 11 下 Anaconda 命令修复指南及常见问题解决
运维·ide·人工智能·windows·python·架构·conda
东风中的蒟蒻1 小时前
MOE 速览
人工智能·language model
SimonKing1 小时前
一文搞定:SpringBoot集成语音识别模型FunASR
java·人工智能·后端
聚客AI1 小时前
📚企业AI架构革命:MCP协议如何打通数据孤岛?
人工智能·llm·mcp
易知微EasyV数据可视化1 小时前
3D高斯泼溅技术:数字孪生的新一代数据引擎
人工智能·3d·数字孪生·建模·3d高斯泼溅技术
Leo.yuan2 小时前
数据处理工具是做什么的?常见数据处理方法介绍
大数据·数据库·人工智能·python·信息可视化
墨尘游子2 小时前
基于 LSTM 与 SVM 融合的时间序列预测模型:理论框架与协同机制—实践算法(1)
人工智能·支持向量机·lstm