微调

【Nature Communications‘24‘06】预训练多模态大语言模型通过 SkinGPT-4 提升皮肤病学诊断能力Pre-trained multimodal large language model enhances dermatological diagnosis using SkinGPT-4 阿卜杜拉国王科技大学（King Abdullah University of Science and Technology, KAUST） Nature communications (Accepted: 26 June 2024) 补充材料：https://www.nature.com/articles/s41467-

17.模型微调——微调数据集构建一般来说，一个经过指令格式化的数据实例包括任务描述（也称为指令）、任务输入、任务输出以及可选的示例。公开的数据集：https://www.waytoagi.com/zh/question/51049

通往AGI的模块化路径：一个可能的技术架构(同时解答微调与RAG之争)最近在思考一个问题：AGI（通用人工智能）一定要是一个超大的单体模型吗？2025年8月，GPT-5正式发布，Claude Opus 4.1紧随其后，国产的Kimi K2（1T总参数）也开源上线。整个行业似乎默认了一个路线——把模型做得越来越大，参数越来越多，训练数据越来越全。但这真的是唯一的路吗？或者说，这是最优的路吗？

微调高级推理大模型（COT）的综合指南：从理论到实践大规模语言模型（LLM）的预训练阶段，通过在海量文本语料库（例如，Llama 3使用了超过15万亿个token的数据）上学习，赋予模型广泛的世界知识和语言能力。然而，预训练本身不足以让模型成为可靠、有用且安全的工具。后训练（Post-training）是塑造模型行为、增强特定能力（尤其是复杂推理能力）并使其与人类价值观和偏好对齐的关键阶段。

从潜在空间到实际应用：Embedding模型架构与训练范式的综合解析现代自然语言处理（NLP）的核心是将非结构化文本转化为机器可理解的数学表示，Embedding模型是实现这一转化的关键技术。

Google开源Tunix：JAX生态的LLM微调方案来了JAX生态这两年在LLM训练这块追赶得挺快。PyTorch虽然还是主流但JAX在并行计算、TPU加速和API组合性上确实有些独特的优势。Google今天放出了Tunix这个库，专门做LLM的后训练——微调、强化学习、知识蒸馏这些都能搞。

【LLM】基于ms-Swift大模型SFT和RL的训练实践lora微调脚本例子如下，10分钟在单卡3090上对Qwen2.5-7B-Instruct进行自我认知微调：

Hugging Face NLP课程学习记录 - 3. 微调一个预训练模型安装Hugging Face的datasets模块：以下以一个批次（one batch）为例，说明了如何训练一个句子分类器（sequence classifier）：

小俊俊的博客

Llama-Factory微调Qwen2.5-VL从数据集制作到部署记录电脑环境配置： 1.ubuntu24 2.3090(24G) 3.Cuda==12.9我的数据集主要是对图像内容进行描述 1.Label-studio制作数据集这是最原始的从零开始制作数据集的方法，不建议这样做！安装完label-studio后，输入指令启动

AI：大语言模型微调的真相：打破迷思，理性选择现实打击：微调并不增加模型的知识容量，只是重新配置已有的参数权重。想让GPT-3.5通过微调变成量子物理专家？如果它预训练时没有足够的量子物理基础，微调一万个案例也无济于事。这就像试图通过调整望远镜的焦距来观察显微镜下的世界——工具的本质限制了可能性。

一条测试老狗

从GPT-5发布来分析LLM大模型幻觉收敛（一）GPT-5 号称在任何领域都有博士级别能力。在医疗健康领域，能够对专业的癌症诊断报告做通俗易懂的解读。对复杂的放射治疗方案决策，也能提供详细的分析报告，帮助病人权衡利弊。一位癌症患者的家属在发布会上表示，“ 真正鼓舞人心的是看着她通过使用 GPT-5 重新获得自主权，病人很容易感到无助，因为知识差距太大了。

迪菲赫尔曼

大模型入门实战 | 基于 YOLO 数据集微调 Qwen2.5-VL-3B-Instruct 的目标检测任务这篇就是新手向的“保姆级”实操文。你将把 YOLO 检测数据转成对话式 Grounding 数据，用 ms-swift 做 LoRA 微调，再用脚本推理 + 可视化。但值得注意的是，一般的检测任务不推荐这么用哈，这仅仅是给大家学习使用，切勿“大炮打蚊子”。

大模型微调面试题全解析：从概念到实战本文较长，建议点赞收藏，以免遗失。更多AI大模型开发学习视频/籽料/面试题都在这>>Github<< >>gitee<<

RAGFoundry：面向检索增强生成的模块化增强框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！

爱分享的飘哥

第五十五章：AI模型的“专属定制”：LoRA微调原理与高效合并技巧在之前我们了解到“微调（Fine-tuning）”是让大模型从“通才”变为“专才”的关键。但对一个拥有数十亿参数的LLM（如LLaMA-7B）进行全参数微调（Full Fine-tuning），意味着：

FLAN-T5：大规模指令微调的统一语言模型框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！

华尔街的幻觉

Datawhale AI夏令营——列车信息智能问答——科大讯飞AI大赛（基于结构化数据的用户意图理解和知识问答挑战赛）坐火车的你，遇到过这样的场景吗？我们这次将一起来探索——如何让AI“看懂”列车时刻表！你随口一问（比如“K123在哪检票？”），AI秒回精准答案！告别抓狂！

魔搭官方教程【快速开始】-swift 微调报错：`if v not in ALL_PARALLEL_STYLES`在魔搭社区按照官方教程搭建大模型时，在微调阶段执行【微调脚本】出现了问题：报错最后提示 if v not in ALL_PARALLEL_STYLES

Clip微调系列：《MaPLe: Multi-modal Prompt Learning》论文链接：arxiv.org/pdf/2210.03117参考链接：(28 封私信) CVPR2023 | MaPLe: Multi-modal Prompt Learning - 知乎

西西弗Sisyphus

LLaMA-Factory 单卡后训练微调Qwen3完整脚本flyfish将下面代码保存为 train_single_gpu.sh修改脚本中的以下参数： MODEL_PATH：模型路径 DS_CONFIG_PATH：DeepSpeed配置文件路径 OUTPUT_PATH：输出目录路径 --dataset erfen：替换为实际数据集名称这里是erfen