Mac训练大模型:MLX-LM框架LoRA训练Qwen3并集成SwanLab进行可视化

MLX LM 是由 Apple 机器学习研究团队开发的开源 Python 软件包,专门用于在 Apple Silicon(M1、M2、M3 等芯片)上高效运行和微调大型语言模型(LLM)。它基于 MLX 框架,充分利用 Apple 的统一内存架构和 Metal 性能着色器(Metal Performance Shaders)来优化性能,特别适合在 Mac 设备上本地运行和开发 AI 模型。

你可以使用 MLX LM 快速进行模型训练,同时使用SwanLab进行实验跟踪与可视化。

1. 环境安装

bash 复制代码
pip install mlx-lm swanlab

2. Lora微调

使用mlx-lm训练LLM的流程非常简单,案例可以在 mlx-lm/examples 中找到。

下面主要以Lora微调为例,这是一个用Qwen3-0.6B模型进行Lora微调的MLX-LM配置文件:

yaml 复制代码
model: "Qwen/Qwen3-0.6B"
train: true
fine_tune_type: lora
optimizer: adamw
data: "mlx-community/WikiSQL"
seed: 0
num_layers: 16
batch_size: 4
iters: 1000
val_batches: 25
learning_rate: 1e-5
steps_per_report: 10
steps_per_eval: 200
resume_adapter_file: null
adapter_path: "adapters"
save_every: 100
test: false
test_batches: 100
max_seq_length: 2048
grad_checkpoint: false
lora_parameters:
  keys: ["self_attn.q_proj", "self_attn.v_proj"]
  rank: 8
  scale: 20.0
  dropout: 0.0

将这个配置文件保存到本地,文件名用qwen3_sft.yaml

然后使用下面的命令,就可以启动训练,并将训练过程记录到SwanLab上:

bash 复制代码
mlx_lm.lora --config qwen3_sft.yaml --report-to swanlab --project-name MLX-LM

3. 可视化效果

相关推荐
weixin_456904277 小时前
从RNN到BERT
人工智能·rnn·bert
XiaoMu_0018 小时前
【全功能图片处理工具详解】基于Streamlit的现代化图像处理解决方案
图像处理·人工智能
IT_陈寒8 小时前
SpringBoot性能翻倍秘籍:5个90%开发者不知道的JVM调优实战技巧
前端·人工智能·后端
小码农叔叔8 小时前
【AI智能体】Dify 实现自然语言转SQL操作数据库实战详解
人工智能·sql·mysql
zzywxc7879 小时前
如何通过 AI IDE 集成开发工具快速生成简易留言板系统
javascript·ide·vue.js·人工智能·spring cloud·架构·dubbo
CoovallyAIHub9 小时前
GQNN 框架:让 Python 开发者轻松搭建量子神经网络
深度学习·算法·计算机视觉
CoovallyAIHub9 小时前
轻量级注意力模型HOTSPOT-YOLO:无人机光伏热异常检测新SOTA,mAP高达90.8%
深度学习·算法·计算机视觉
阿坡RPA10 小时前
AI接管浏览器:Claude Code+Chrome MCP自动化完全指南
人工智能·aigc
用户51914958484510 小时前
突破矩形边界:探索PWA窗口控件叠加技术
人工智能·aigc