【大模型微调】使用Llama Factory实现中文llama3微调

【大模型微调】使用Llama Factory实现中文llama3微调
github链接

为什么不用基座模型:95%用的英文数据训练,训练效果不好

所以用的Llama3-99-Chinese-Chat(别人微调过的再微调)

相关推荐
qq_2739002316 分钟前
AF3 identity_trans函数解读
人工智能·pytorch·python·生物信息学
晨航22 分钟前
南京审计大学:《 面向工程审计行业的DeepSeek大模型应用指南》.pdf(免费下载)
人工智能·ai·aigc
Ronin-Lotus30 分钟前
深度学习篇---深度学习中的范数
人工智能·python·深度学习·l1范数·l2范数·l∞范数
L_cl43 分钟前
【NLP 40、文本生成任务】
人工智能·自然语言处理
Robot2511 小时前
「宇树科技」13家核心零部件供应商梳理!
大数据·人工智能·科技·机器人·自动驾驶
智驱力人工智能1 小时前
智能飞鸟监测 守护高压线安全
人工智能·计算机视觉·视觉检测·智能巡检·视觉算法·飞鸟检测·视觉分析
自由鬼1 小时前
IBM ECM结合 第三方AI API 来实现文档分析和 RAG
人工智能·ecm·deepseek·企业内容管理
HR Zhou1 小时前
群体智能优化算法-蜻蜓优化算法(Dragonfly Algorithm, DA,含Matlab源代码)
人工智能·算法·matlab·优化·群体智能优化
Scabbards_2 小时前
生成模型速通(Diffusion,VAE,GAN)
人工智能·神经网络·生成对抗网络
鸿蒙布道师2 小时前
字节跳动实习生主导开发强化学习算法,助力大语言模型性能突破
人工智能·神经网络·机器学习·计算机视觉·语言模型·自然语言处理·机器人