山东大学软件学院毕业设计(一)

任务书:

将法律领域的结构化知识(如罪名构成要件、量刑情节、证据规则等)融入到LLM的训练与推理过程中,设计一种有效的知识注入机制,将上述领域知识构建成可计算的提示模板或软提示,进而对某个开源预训练语言模型进行提示微调,使其能够提取关键词、生成案例摘要,克服通用摘要模型在法律专业领域可能出现的事实偏差与逻辑谬误。

关键词:提示模板、软提示、关键词提取、生成案例摘要

模型:Qwen3-8B

模型任务:

任务一:关键词提取

任务二:生成案例摘要

论文任务:

对比基线模型、提示模板+基线模型、软提示+基线模型、Qlora+基线模型对不同任务的完成情况。

评价机制:

任务一:与基线模型对比F1参数

任务二:与基线模型对比ROUGE-1 / ROUGE-2 / ROUGE-L等自动指标

bash 复制代码
ROUGE-1

定义:计算生成文本与参考文本之间单个词(unigram)的重叠率。

计算方式:

召回率 (Recall):生成文本中与参考文本匹配的词数 / 参考文本总词数

精确率 (Precision):生成文本中与参考文本匹配的词数 / 生成文本总词数

F1-score:精确率和召回率的调和平均数

用途:衡量生成文本是否包含参考文本中的关键词。


ROUGE-2

定义:计算生成文本与参考文本之间连续两个词(二元组 bigram)的重叠率。

计算方式:

同 ROUGE-1,但匹配的是连续两个词的组合。

用途:衡量生成文本是否保留了参考文本中的短语或局部句法结构,比 ROUGE-1 更严格。

ROUGE-L

定义:计算生成文本与参考文本之间的最长公共子序列(Longest Common Subsequence, LCS)。

特点:

不要求连续的词,但顺序必须一致

可反映文本的整体顺序和语义连贯性

计算方式:

召回率 = LCS 长度 / 参考文本长度

精确率 = LCS 长度 / 生成文本长度

F1-score = 精确率和召回率的调和平均数

用途:衡量生成文本与参考文本在整体结构和逻辑上的一致性。

项目结构:

bash 复制代码
LawLLM_Project/                 # 项目根目录
├─ data/                        # 原始和处理后的数据
│   ├─ raw/                     # 原始裁判文书、案例文本
│   │   ├─ criminal_cases/      # 刑事判决书样本
│   │   ├─ civil_cases/         # 可选:民事案例样本
│   │   └─ metadata.json        # 数据集说明
│   ├─ processed/               # 清洗/标注后的数据
│   │   ├─ keyword_cases.jsonl  # 用于关键词提取的样本
│   │   └─ summary_cases.jsonl  # 用于摘要生成的样本
│   └─ prompts/                 # 统一存放 Prompt 模板
│       ├─ keyword_prompt.txt
│       ├─ summary_prompt.txt
│       └─ legal_constraint_prompt.txt
│
├─ models/                      # 模型存放
│   └─ Qwen3-8B/                # 本地下载的模型
│
├─ src/                         # 实验代码
│   ├─ __init__.py
│   ├─ download_model.py         # HuggingFace 模型下载脚本
│   ├─ inference.py              # 推理函数(generate_text, keyword_extraction, summarize_case)
│   ├─ evaluate.py               # 实验评测函数(人工打分/自动指标)
│   └─ run_experiments.py        # 对照实验执行脚本
│
├─ results/                     # 实验结果
│   ├─ keyword_extraction/      # 关键词提取输出
│   │   ├─ baseline.jsonl
│   │   └─ legal_prompt.jsonl
│   └─ summary/                 # 案例摘要输出
│       ├─ baseline.txt
│       └─ legal_prompt.txt
│
├─ notebooks/                   # 可选:Jupyter笔记本
│   └─ analysis.ipynb           # 可视化对比、统计图表
│
├─ requirements.txt             # Python依赖
├─ README.md                    # 项目说明

今日完成任务:

建立项目框架、下载模型、初步构建模型评价体系、将任务上传到github

相关推荐
一点一木5 小时前
深度体验TRAE SOLO移动端7天:作为独立开发者,我把工作流揣进了兜里
前端·人工智能·trae
Lee川6 小时前
mini-cursor 揭秘:从 Tool 定义到 Agent 循环的完整实现
前端·人工智能·后端
weelinking6 小时前
【产品】00_产品经理用Claude实现产品系列介绍
数据库·人工智能·sql·数据挖掘·github·产品经理
Agent产品评测局7 小时前
制造业模具管理AI系统,主流产品能力对比详解:2026年智能制造选型深度洞察
人工智能·ai·chatgpt·制造
研华科技Advantech7 小时前
如何用一套实训设备,打通工业AI预测性维护技术全流程?
人工智能
Lab_AI7 小时前
AI for Science: MaXFlow AI Agent+ 报告体验双升级,让AI智能体更高效易用!
人工智能·ai for science·ai agent·ai智能体
李坤7 小时前
让 Codex 和 Claude 互相 Review:告别手动复制
人工智能·openai·claude
南屹川8 小时前
【API设计】GraphQL实战:从REST到GraphQL的演进
人工智能
KJ_BioMed8 小时前
当计算生物学遇上生成式AI:从头设计生物分子的“新范式”初探
人工智能·从头设计·生命科学·生物医药·科研干货·科晶生物
明月醉窗台8 小时前
深度学习(17)YOLO训练中的超参数详解
人工智能·深度学习·yolo