山东大学软件学院毕业设计(一)

任务书:

将法律领域的结构化知识(如罪名构成要件、量刑情节、证据规则等)融入到LLM的训练与推理过程中,设计一种有效的知识注入机制,将上述领域知识构建成可计算的提示模板或软提示,进而对某个开源预训练语言模型进行提示微调,使其能够提取关键词、生成案例摘要,克服通用摘要模型在法律专业领域可能出现的事实偏差与逻辑谬误。

关键词:提示模板、软提示、关键词提取、生成案例摘要

模型:Qwen3-8B

模型任务:

任务一:关键词提取

任务二:生成案例摘要

论文任务:

对比基线模型、提示模板+基线模型、软提示+基线模型、Qlora+基线模型对不同任务的完成情况。

评价机制:

任务一:与基线模型对比F1参数

任务二:与基线模型对比ROUGE-1 / ROUGE-2 / ROUGE-L等自动指标

bash 复制代码
ROUGE-1

定义:计算生成文本与参考文本之间单个词(unigram)的重叠率。

计算方式:

召回率 (Recall):生成文本中与参考文本匹配的词数 / 参考文本总词数

精确率 (Precision):生成文本中与参考文本匹配的词数 / 生成文本总词数

F1-score:精确率和召回率的调和平均数

用途:衡量生成文本是否包含参考文本中的关键词。


ROUGE-2

定义:计算生成文本与参考文本之间连续两个词(二元组 bigram)的重叠率。

计算方式:

同 ROUGE-1,但匹配的是连续两个词的组合。

用途:衡量生成文本是否保留了参考文本中的短语或局部句法结构,比 ROUGE-1 更严格。

ROUGE-L

定义:计算生成文本与参考文本之间的最长公共子序列(Longest Common Subsequence, LCS)。

特点:

不要求连续的词,但顺序必须一致

可反映文本的整体顺序和语义连贯性

计算方式:

召回率 = LCS 长度 / 参考文本长度

精确率 = LCS 长度 / 生成文本长度

F1-score = 精确率和召回率的调和平均数

用途:衡量生成文本与参考文本在整体结构和逻辑上的一致性。

项目结构:

bash 复制代码
LawLLM_Project/                 # 项目根目录
├─ data/                        # 原始和处理后的数据
│   ├─ raw/                     # 原始裁判文书、案例文本
│   │   ├─ criminal_cases/      # 刑事判决书样本
│   │   ├─ civil_cases/         # 可选:民事案例样本
│   │   └─ metadata.json        # 数据集说明
│   ├─ processed/               # 清洗/标注后的数据
│   │   ├─ keyword_cases.jsonl  # 用于关键词提取的样本
│   │   └─ summary_cases.jsonl  # 用于摘要生成的样本
│   └─ prompts/                 # 统一存放 Prompt 模板
│       ├─ keyword_prompt.txt
│       ├─ summary_prompt.txt
│       └─ legal_constraint_prompt.txt
│
├─ models/                      # 模型存放
│   └─ Qwen3-8B/                # 本地下载的模型
│
├─ src/                         # 实验代码
│   ├─ __init__.py
│   ├─ download_model.py         # HuggingFace 模型下载脚本
│   ├─ inference.py              # 推理函数(generate_text, keyword_extraction, summarize_case)
│   ├─ evaluate.py               # 实验评测函数(人工打分/自动指标)
│   └─ run_experiments.py        # 对照实验执行脚本
│
├─ results/                     # 实验结果
│   ├─ keyword_extraction/      # 关键词提取输出
│   │   ├─ baseline.jsonl
│   │   └─ legal_prompt.jsonl
│   └─ summary/                 # 案例摘要输出
│       ├─ baseline.txt
│       └─ legal_prompt.txt
│
├─ notebooks/                   # 可选:Jupyter笔记本
│   └─ analysis.ipynb           # 可视化对比、统计图表
│
├─ requirements.txt             # Python依赖
├─ README.md                    # 项目说明

今日完成任务:

建立项目框架、下载模型、初步构建模型评价体系、将任务上传到github

相关推荐
yukai080082 小时前
【203篇系列】042 AndyBotFS
人工智能
开开心心就好2 小时前
免费音频转文字工具,绿色版离线多模型可用
人工智能·windows·计算机视觉·计算机外设·ocr·excel·语音识别
菜鸟小芯2 小时前
从 GLM-5 提示到思考:我用深度思考解决了 “50 米去超市” 的问题
人工智能
沪漂阿龙2 小时前
AI幻觉问题及缓解策略
人工智能
浩瀚之水_csdn2 小时前
avcodec_parameters_copy详解
linux·人工智能·ffmpeg
石去皿2 小时前
AI命名实体识别常见面试篇
人工智能·面试·职场和发展
沪漂阿龙2 小时前
从Chatbot到Agent:AI如何从“能说会道”进化为“能干实事”
人工智能
sanshanjianke2 小时前
AI辅助网文创作理论研究笔记(一):叙事模型的构建
人工智能·语言模型·ai写作
TImCheng06092 小时前
能力模型构建:AI产品经理所需技术、伦理与商业知识的比例与深度
人工智能