lora微调

在云服务器上基于lora微调Qwen2.5-VL-7b-Instruct模型（下）承接上文在云服务器上基于lora微调Qwen2.5-VL-7b-Instruct模型（上）执行train.py之后，再输入swanlab的API，就训练流程就开始了：

橙子小哥的代码世界

【大模型lora微调】关于推理时如何使用 LoRA Adapter你可以用 peft 的方式加载 LoRA Adapter，推理时这样写：这样就可以直接用 LoRA 微调后的模型推理，无需合并！

咕噜咕噜day

高效微调方法简述针对成本和性价比选择RAG或微调，那他们适用的范围和区别要提前了解；形象的描述预训练、微调、提示工程、Agents：

【大模型实战】利用ms-swift微调框架对QwQ-32B推理模型进行微调之前我们在《大模型训练/微调的一些经验分享》、《利用DeepSeek-R1数据微调蒸馏ChatGLM32B让大模型具备思考能力》中做了相关模型微调的介绍。目前在基座大模型能力还没有达到足够牛的情况下，大模型微调在商业化、垂直领域应用依然是不可或缺，即使是使用DeepSeek-R1、QwQ-32B也难以保证商业应用的要求。

vivo互联网技术

NLLB 与 ChatGPT 双向优化：探索翻译模型与语言模型在小语种应用的融合策略作者：来自 vivo 互联网算法团队- Huang Minghui本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。首先介绍了 NLLB-200 的背景、数据、分词器和模型，以及其与 LLM（Large Language Model）的异同和协同关系。接着列举了实战与应用的案例，包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。通过本文的研究和实践，可以为小语种翻译模型和语言模型的融合提供一定的

大语言模型微调框架Unsloth：简化模型微调流程，提升模型性能Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍，内存使用量减少了 70%，而且准确性不会降低！

我是有底线的