swift微调记录

BatmanWayne2026-02-16 8:45

1，模型：

Qwen3-4b-Thinking-2507

2，工具：

ms-swift

3，环境：

魔搭社区增送的免费GPU算力（GPU是 A10 24G显存）

4，过程：

4.1 建一个空白文件夹 ft_demo

4.2 创建一个环境变量,并激活

运行

python 复制代码

python -m venv ft_demo_env

source ./ft_demo_env/bin/activate

4.3 配置国内的镜像源

python 复制代码

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

4.4 安装 ms-swift、vllm、awq三个包

python 复制代码

pip install 'ms-swift[all]' -U

pip install vllm

4.5 启动 web-ui界面

python 复制代码

swift web-ui

web界面的好处，不用记很多参数，适合初学者

点击这个，即可进入相关页面

4.6 选择模型，并设置相关微调参数

4.7 点击开始训练，即可开始训练

4.8 点击展示运行状态

可显示当前训练的情况

4.9 点击找回运行时任务，可以找回正在跑的训练任务

当web界面不小心刷新或者关掉时，可以通过找回训练时任务，找到原来的任务，并继续训练。

5 观察日志

通过观察日志，注意最后的last_model_checkpoint和best_model_checkpoint，一般选用best_model_checkpoint

6 验证训练效果

除了上图中的各种参数的图外，还可以在LLM推理里，实际跑一下

上一篇：深入浅出链表：数据结构中的“珍珠项链“

下一篇：【数据结构2】带头结点·单向链表实现

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 10Kimi K3 真实体验：全网评价整理，优缺点一次性说清楚