Day27 - 大模型微调,LLaMA搭建

指令微调

SFT:Supervised Fine - Tuning

  • 自我认知
    • self-cognition
    • identity
  • 私有知识 / 具体任务
  • 公共知识

LLaMA-Factory 搭建过程

  1. 下载 LLaMA-Factory 源代码
bash 复制代码
​git clone https://github.com/hiyouga/LLaMA-Factory.git
  1. 安装 LLaMA-Factory 依赖包
bash 复制代码
cd LLaMA-Factory
pip install -e ".[torch,metrics]"
  1. 魔塔社区映射端口(各个平台都不一样)
bash 复制代码
export GRADIO_SERVER_PORT=7860 GRADIO_ROOT_PATH=/${JUPYTER_NAME}/proxy/7860/
  1. 启动 LLaMA-Factory(LLaMA Board 可视化微调)
bash 复制代码
llamafactory-cli webui

点击链接: http://0.0.0.0:7860


如何微调?

如何修改模型的自我认知?

LLaMA-Factory/data/identity.json ,编辑模式打开该文件,修改{{name}}和{{author}},来改变模型的自我认知。

为了避免过拟合,训练的时候需要增加一些公共知识。

微调的核心是要去设计非常好的指令格式 ,指令格式的设计与上层开发是配套的。这个过程可以想象成:后端写接口,前端调接口去渲染数据,前后端得有个接口约定。

我们微调完大模型后,会将其变为API服务,然后用LangChain去调用,LangChain进行Prompt设计开发。

例如,在构建聊天机器人时,可以使用 LangChain 来搭建机器人的架构、整合各种API和服务,同时精心设计 Prompts 来确保机器人能够准确理解和回应用户的提问。通过不断地测试和优化 Prompts,提升对话的质量,使机器人更加智能和自然。

相关推荐
触底反弹15 分钟前
🔥 从点积到 Transformer:我终于搞懂大模型是怎么"猜"出下一个词的了
人工智能·机器学习·架构
Token炼金师19 分钟前
算力显存通信的三角博弈:DP/TP/PP/SP、ZeRO、混合精度与稳定性 —— 训练优化四件套
人工智能·深度学习·dp·sp·pp·zero·tp
无糖可可果21 分钟前
MCP(Model Context Protocol)学习分享:从理论到实践
人工智能
RFID科技的魅力22 分钟前
RFID资产管理系统选型避坑指南:从需求梳理到落地验证
大数据·人工智能·物联网·rfid
ai产品老杨34 分钟前
【边云协同视频分析项目实战记录】多站点AI视频分析平台部署手册
人工智能·音视频
北鹤M37 分钟前
如何将模特导入AI实现电商智能换装,主流工具体验分享
人工智能·aigc
一知半解仙1 小时前
2026年彻底免费的辅助编程Agent大模型汇总
开发语言·人工智能·开源
2301_767113981 小时前
Ollama 本地部署与运维使用指南
人工智能·ollama
2501_911067661 小时前
乡村振兴 + 零碳民生稿:叁仟光伏智慧灯杆,点亮杭州共富乡村绿色数字路
人工智能·5g·重构·生活·智慧城市
linzᅟᅠ1 小时前
README
人工智能·python