第一次尝试微调

一,什么是微调

相对专业的解释就是在已完成大规模预训练(Pre-training)的基础模型上,使用特定任务、特定领域或特定格式的标注数据集,进行进一步的参数优化训练,使模型在保留通用知识与基础能力的前提下,更好地适配下游具体任务,提升任务精度、响应一致性与领域适配性。

我个人的理解就是:完成预训练的模型是一本百科全书,样样通样样松,然后我们要做的就是进行微调。将他在某个方面的能力变强。

二,微调的准备工作

在虚拟环境中使用conda创建用于微调的环境,并在这个环境中安装Jupyterlab和Jupyter Kernel。

JupyterLab 是大模型微调时的交互式操作界面,提供代码编辑、分步运行、文件管理和结果可视化的工作台,方便调试微调流程、查看训练状态与实验记录;而 Jupyter Kernel 是后台负责实际执行代码、管理运行环境与 GPU 资源、维护模型和变量显存状态的计算内核,两者配合使用,既能通过 JupyterLab 灵活操作微调流程,又能依靠 Kernel 保证环境隔离、模型状态持久化,大幅提升微调实验的调试效率与可复现性。

还用到了vllm和unsloth,起到了一个加速的作用。

三,微调

先准备数据集,数据集是大模型微调的"学习教材",决定了大模型最终能够学会的知识,可以掌握的能力以及对话时的语气等

这次主要使用AI生成了一个200条问答对的数据集,以后会尝试更大,更完全的数据集。

然后通过脚本对模型进行微调,以下是微调的结果

微调前的

微调后的

四,压力测试

对微调后的模型进行压力测试,核心目的是在高频率、长时间、多并发的模拟真实使用场景下,验证模型是否能稳定运行不崩溃、回答逻辑不跑偏、输出内容不重复胡说,同时检测模型的响应速度、显存占用和推理性能是否达标,确保经过 LoRA 微调后的网安小助手在高强度、连续对话中依然保持专业、可靠、不掉线,最终确认模型可以稳定投入实际使用。

相关推荐
辉视广播对讲1 天前
医院IPTV,让医疗服务更有温度
网络·人工智能
xqqxqxxq1 天前
Java AI智能P图工具技术笔记
java·人工智能·笔记
AI袋鼠帝1 天前
本地4B开源模型,把任何App当Skil用!告 别token焦虑,私密性强~
人工智能
ComputerInBook1 天前
数字图像处理(4版)——第 11 章——特征提取(下)(Rafael C.Gonzalez&Richard E. Woods)
图像处理·人工智能·特征提取
在线打码1 天前
ToutiaoAI:AI 驱动的智能新闻杂志平台
人工智能·ai·aigc·ai写作·新闻资讯
ar01231 天前
AR电路巡检:让电力运维进入智能可视化时代
运维·人工智能·ar
低调小一1 天前
Midscene.js 原理拆解:它不是“自然语言点按钮”,而是一套会看屏幕的 UI 自动化运行时
人工智能·rnn·架构·大模型·transformer·tdd·midscene
Slow菜鸟1 天前
Codex CLI 教程(五)| Skills 安装指南:面向 Java 全栈工程师打造个人 ECC(V1版)
大数据·前端·人工智能
昇腾CANN1 天前
5月11日直播丨CANN算子挑战赛(江山赛区)赛题和评分规则解读
人工智能·昇腾·cann·deepseek
菜鸡信息技术1 天前
VSCode 安装 Claude Code 插件,配置 DeepSeek V4(Windows)
人工智能