CCF--LMCC大语言模型能力认证官方样题(第一赛(青少年组)第二部分 程序题 (26--30))

完整可直接运行的代码:

python 复制代码
# lora_qwen_train.py
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments, Trainer
from peft import LoraConfig, get_peft_model

model_name = "Qwen/Qwen2.5-7B-Instruct"

# 1) 加载分词器(允许 remote code,因为 Qwen 可能有自定义 tokenizer)
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

# 2) 加载模型(使用半精度并自动分配设备)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",           # auto device placement(若只用单卡也可以)
    torch_dtype=torch.float16,   # 以 fp16 加载以节省显存
    trust_remote_code=True
)

# 【可选但强烈建议】在注入 LoRA 之前检查模型中可用的模块名,确保 target_modules 名称正确
# 下面会打印出包含 q,k,v,o 的模块名,便于确认实际命名
print("------ 模型中可能的 attention 投影层(部分) ------")
for name, module in model.named_modules():
    if any(k in name for k in ["q_proj", "k_proj", "v_proj", "o_proj", "q", "k", "v", "o", "query", "key", "value"]):
        print(name)
print("------ 结束 ------")

# 3) 配置 LoRA:在 q_proj 与 v_proj 上注入,r=8, lora_alpha=16
lora_config = LoraConfig(
    r=8,
    lora_alpha=16,
    target_modules=["q_proj", "v_proj"],   # <-- 你要求的 target_modules
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)

# 把模型包装为 PEFT 模型(会在指定模块处注入低秩适配器)
model = get_peft_model(model, lora_config)

# 4) TrainingArguments(单卡 16GB 情况下稳妥设置)
training_args = TrainingArguments(
    output_dir="./lora-qwen2.5-7b",
    per_device_train_batch_size=1,       # 单卡每 step 1 个样本,降低 OOM 风险
    gradient_accumulation_steps=8,       # 累积 8 步 -> 有效全局 batch = 8
    num_train_epochs=3,
    learning_rate=2e-4,
    fp16=True,                           # 启用半精度训练(节省显存)
    logging_steps=10,
    save_strategy="epoch",
    # 可根据需要加上以下两个参数以更节省显存或更稳定:
    # gradient_checkpointing=True,
    # dataloader_pin_memory=True,
)

# 这里假设 train_dataset 已经准备好并是一个继承自 torch.utils.data.Dataset 的对象
# 例如:train_dataset = MyDataset(tokenizer, ...)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_dataset,   # 请在运行前把 train_dataset 变量定义好
    tokenizer=tokenizer,
)

# 5) 开始训练
trainer.train()

# 6) 只保存 LoRA adapter 权重(PEFT 会只保存 adapter 权重到该目录)
model.save_pretrained("./lora-qwen2.5-7b-lora")
print("LoRA 权重已保存到 ./lora-qwen2.5-7b-lora")

注意:本代码依赖 transformerspeft,并假定运行环境有支持 fp16 的 GPU(单卡 16GB)。

相关推荐
猿小猴子6 小时前
主流 AI IDE 之一的「DeepSeek-Reasonix 」介绍
人工智能·ai·deepseek·reasonix
装不满的克莱因瓶6 小时前
链式法则如何传递参数误差 —— 深入理解神经网络中的梯度传播
人工智能·python·深度学习·神经网络·数学·机器学习·ai
Anastasiozzzz6 小时前
从有限状态机到智能体图:传统 FSM 与 Agent Graph的演进
java·人工智能·python·ai
程序员cxuan11 小时前
为每个任务配一套 harness:Claude Code 里的动态工作流
人工智能
程序员cxuan11 小时前
Claude Fable 5 来了
人工智能·后端·程序员
云边云科技_云网融合11 小时前
云边云科技亮相 2026 WOD 制造业数智化博览会 云网融合赋能制造焕新
人工智能·科技·安全·制造
Σίσυφος190012 小时前
激光三角 光平面标定-多高度误差分析
人工智能·计算机视觉·平面
JS菌12 小时前
手写一个 AI Agent 全栈项目:从沙箱执行到子智能体的完整实现
前端·人工智能·后端
lqqjuly12 小时前
前沿算法深度解析(二)
人工智能·算法·机器学习
Bode_200212 小时前
基于大数据分析的全生命周期质量追溯质量评估体系落地方案
大数据·人工智能