swift微调记录

1,模型:

Qwen3-4b-Thinking-2507

2,工具:

ms-swift

3,环境:

魔搭社区增送的免费GPU算力(GPU是 A10 24G显存)

4,过程:

4.1 建一个空白文件夹 ft_demo

4.2 创建一个环境变量,并激活

运行

python 复制代码
python -m venv ft_demo_env

source ./ft_demo_env/bin/activate

4.3 配置国内的镜像源

python 复制代码
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

4.4 安装 ms-swift、vllm、awq三个包

python 复制代码
pip install 'ms-swift[all]' -U

pip install vllm

4.5 启动 web-ui界面

python 复制代码
swift web-ui

web界面的好处,不用记很多参数,适合初学者

点击这个,即可进入相关页面

4.6 选择模型,并设置相关微调参数

4.7 点击开始训练,即可开始训练

4.8 点击展示运行状态

可显示当前训练的情况

4.9 点击找回运行时任务,可以找回正在跑的训练任务

当web界面不小心刷新或者关掉时,可以通过找回训练时任务,找到原来的任务,并继续训练。

5 观察日志

通过观察日志,注意最后的last_model_checkpoint和best_model_checkpoint,一般选用best_model_checkpoint

6 验证训练效果

除了上图中的各种参数的图外,还可以在LLM推理里,实际跑一下

相关推荐
追夢秋陽20 小时前
Cocoa 使用NSCollectionView显示列表,数据不足布局异常处理
macos·objective-c·cocoa·swift·collectionview
新缸中之脑1 天前
SaaS 大灭绝
开发语言·ios·swift
Swift社区1 天前
LeetCode 389 找不同 - Swift 题解
算法·leetcode·swift
yyoc973 天前
Mac基于LLaMA Factory微调模型导入Ollama踩坑记录
大模型·微调·llama·ollama
Sheffi664 天前
Swift 所有权宏 `~Copyable` 深度解析:如何在 Swift 中实现类似 Rust 的内存安全模型?
rust·ssh·swift
文件夹__iOS4 天前
Swift 性能优化:Copy-on-Write(COW) 与懒加载核心技巧
开发语言·ios·swift
文件夹__iOS4 天前
Array、Dictionary、Set 是值类型还是引用类型?
swift
符哥20084 天前
使用Apollo和GraphQL搭建一套网络框架
ios·swift·rxswift
2601_949146534 天前
Swift语音通知接口集成手册:iOS/macOS开发者如何调用语音API
macos·ios·swift