llamfactory 微调中用到的cpu的两处参数preprocessing_num_workers dataloader_num_workers

我给你用最直白、最清晰、不绕弯 的方式讲清楚，这几个参数到底干什么的、区别在哪、为什么你必须都开。

一句话总结

你之前 CPU 只有 8%，就是因为 只开了预处理，没开训练时的数据加载多线程。

只在训练开始前跑一次！

跑完就结束，不会再用。

你看到 CPU 8%，就是因为预处理早就跑完了，这个参数已经不工作了。

训练全程一直跑！

负责从磁盘读取数据 → 送给显卡。

你没开这个，系统默认 单线程喂数据，CPU 根本不用干活。

让数据从内存 → 显卡的速度更快，不卡顿。

开了：数据传输更快

不开：慢，容易造成显卡等待

让显卡永远有数据可以练，不饿肚子。

显卡要数据时，数据已经提前准备好了。

参数	阶段	作用	运行时间	CPU 占用影响
preprocessing_num_workers	预处理	分词、格式化数据	训练前一次	❌ 几乎无
dataloader_num_workers	训练	给显卡喂数据	训练全程	✅ 极大（你缺的就是它）
dataloader_pin_memory	训练	加速数据传输	训练全程	中等
dataloader_prefetch_factor	训练	提前加载数据	训练全程	小

需要我再给你讲讲怎么看 DCU 利用率、判断训练是否达到最快速度吗？