【大模型微调】使用Llama Factory实现中文llama3微调

【大模型微调】使用Llama Factory实现中文llama3微调
github链接

为什么不用基座模型:95%用的英文数据训练,训练效果不好

所以用的Llama3-99-Chinese-Chat(别人微调过的再微调)

相关推荐
shao9185163 分钟前
Gradio全解10——Streaming:流式传输的音频应用(7)——ElevenLabs:高级智能语音技术
人工智能·gradio·tts·streaming·elevenlabs·stt·eleven music
Monkey的自我迭代6 分钟前
基于OpenCV的银行卡号识别系统:从原理到实现
人工智能·opencv·计算机视觉
会写代码的饭桶27 分钟前
通俗理解 LSTM 的三门机制:从剧情记忆到科学原理
人工智能·rnn·lstm·transformer
算家计算33 分钟前
ComfyUI-MultiTalk本地部署教程:创新L-RoPE机制破解多音频流绑定难题,定义多人对话视频生成新SOTA!
人工智能·开源
Stestack34 分钟前
人工智能常见分类
人工智能·分类·数据挖掘
量子位36 分钟前
18岁女孩做养老机器人,上线2天卖爆了
人工智能·llm
小林学习编程38 分钟前
2025年最新AI大模型原理和应用面试题
人工智能·ai·面试
数据分析能量站41 分钟前
大模型为什么会有幻觉?-Why Language Models Hallucinate
人工智能
小白狮ww1 小时前
RStudio 教程:以抑郁量表测评数据分析为例
人工智能·算法·机器学习
沧海一粟青草喂马1 小时前
抖音批量上传视频怎么弄?抖音矩阵账号管理的专业指南
大数据·人工智能·矩阵