1,模型:
Qwen3-4b-Thinking-2507
2,工具:
ms-swift
3,环境:
魔搭社区增送的免费GPU算力(GPU是 A10 24G显存)
4,过程:
4.1 建一个空白文件夹 ft_demo
4.2 创建一个环境变量,并激活
运行
python
python -m venv ft_demo_env
source ./ft_demo_env/bin/activate
4.3 配置国内的镜像源
python
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
4.4 安装 ms-swift、vllm、awq三个包
python
pip install 'ms-swift[all]' -U
pip install vllm
4.5 启动 web-ui界面
python
swift web-ui
web界面的好处,不用记很多参数,适合初学者

点击这个,即可进入相关页面

4.6 选择模型,并设置相关微调参数

4.7 点击开始训练,即可开始训练

4.8 点击展示运行状态
可显示当前训练的情况

4.9 点击找回运行时任务,可以找回正在跑的训练任务
当web界面不小心刷新或者关掉时,可以通过找回训练时任务,找到原来的任务,并继续训练。

5 观察日志
通过观察日志,注意最后的last_model_checkpoint和best_model_checkpoint,一般选用best_model_checkpoint


6 验证训练效果
除了上图中的各种参数的图外,还可以在LLM推理里,实际跑一下

