swift微调记录

1,模型:

Qwen3-4b-Thinking-2507

2,工具:

ms-swift

3,环境:

魔搭社区增送的免费GPU算力(GPU是 A10 24G显存)

4,过程:

4.1 建一个空白文件夹 ft_demo

4.2 创建一个环境变量,并激活

运行

python 复制代码
python -m venv ft_demo_env

source ./ft_demo_env/bin/activate

4.3 配置国内的镜像源

python 复制代码
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

4.4 安装 ms-swift、vllm、awq三个包

python 复制代码
pip install 'ms-swift[all]' -U

pip install vllm

4.5 启动 web-ui界面

python 复制代码
swift web-ui

web界面的好处,不用记很多参数,适合初学者

点击这个,即可进入相关页面

4.6 选择模型,并设置相关微调参数

4.7 点击开始训练,即可开始训练

4.8 点击展示运行状态

可显示当前训练的情况

4.9 点击找回运行时任务,可以找回正在跑的训练任务

当web界面不小心刷新或者关掉时,可以通过找回训练时任务,找到原来的任务,并继续训练。

5 观察日志

通过观察日志,注意最后的last_model_checkpoint和best_model_checkpoint,一般选用best_model_checkpoint

6 验证训练效果

除了上图中的各种参数的图外,还可以在LLM推理里,实际跑一下

相关推荐
大熊猫侯佩19 小时前
别被系统绑架:SwiftUI List 替换背后的底层逻辑
swiftui·swift·apple
花间相见1 天前
【MS-Swift实战】:LoRA原理+核心参数(r/alpha)调参指南(适配Qwen-1.8B医疗场景)
开发语言·r语言·swift
2501_915918411 天前
快蝎iOS开发IDE:免Xcode开发,支持Swift/Flutter项目
ide·vscode·ios·个人开发·xcode·swift·敏捷流程
我现在不喜欢coding2 天前
Swift 核心协议揭秘:从 Sequence 到 Collection,你离标准库设计者只差这一步
ios·swift
2501_915909062 天前
Xcode从入门到精通:全面解析iOS开发IDE的核心功能与实际应用指南
ide·vscode·ios·个人开发·xcode·swift·敏捷流程
东坡肘子2 天前
从 OpenSwiftUI 到 DanceUI:换个方式 Dive SwiftUI -- 肘子的 Swift 周报 #132
人工智能·swiftui·swift
visual_zhang3 天前
Swift 方法派发机制深度解析 —— 兼与 Objective-C `objc_msgSend` 对比
objective-c·swift
用户79457223954133 天前
【SwiftyJSON】拯救你的 as? [String: Any]——链式 JSON 访问的正确姿势
swiftui·objective-c·swift
用户79457223954133 天前
【Moya】为什么你的 Alamofire 代码需要再封装一层?
swiftui·objective-c·swift
花间相见3 天前
【大模型微调与部署03】—— ms-swift-3.12 命令行参数(训练、推理、对齐、量化、部署全参数)
开发语言·ios·swift