技术栈

【大模型微调】使用Llama Factory实现中文llama3微调

Jozky862025-03-23 8:43

【大模型微调】使用Llama Factory实现中文llama3微调
github链接

为什么不用基座模型:95%用的英文数据训练,训练效果不好

所以用的Llama3-99-Chinese-Chat(别人微调过的再微调)

上一篇:免费下载 | 2025年AI产业全景报告.pdf
下一篇:C# System.Text.Encoding 使用详解
相关推荐
子燕若水
1 小时前
Unreal Engine 5中的AI知识
人工智能
极限实验室
2 小时前
Coco AI 实战(一):Coco Server Linux 平台部署
人工智能
杨过过儿
2 小时前
【学习笔记】4.1 什么是 LLM
人工智能
巴伦是只猫
2 小时前
【机器学习笔记Ⅰ】13 正则化代价函数
人工智能·笔记·机器学习
大千AI助手
2 小时前
DTW模版匹配:弹性对齐的时间序列相似度度量算法
人工智能·算法·机器学习·数据挖掘·模版匹配·dtw模版匹配
AI生存日记
3 小时前
百度文心大模型 4.5 系列全面开源 英特尔同步支持端侧部署
人工智能·百度·开源·open ai大模型
LCG元
3 小时前
自动驾驶感知模块的多模态数据融合:时序同步与空间对齐的框架解析
人工智能·机器学习·自动驾驶
why技术
3 小时前
Stack Overflow,轰然倒下!
前端·人工智能·后端
超龄超能程序猿
4 小时前
(三)PS识别:基于噪声分析PS识别的技术实现
图像处理·人工智能·计算机视觉
热门推荐
01Java学习第十五部分——MyBatis02集群聊天服务器---MySQL数据库的建立03Coze扣子平台完整体验和实践(附国内和国际版对比)04基于odoo17的设计模式详解---装饰模式05使用Ruby接入实时行情API教程06扣子(coze)实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解07Everything文件检索工具 几秒检索几百G的文件08基于odoo17的设计模式详解---单例模式09DeepSeek各版本说明与优缺点分析10【无标题】