山东大学软件学院毕业设计(一)

任务书:

将法律领域的结构化知识(如罪名构成要件、量刑情节、证据规则等)融入到LLM的训练与推理过程中,设计一种有效的知识注入机制,将上述领域知识构建成可计算的提示模板或软提示,进而对某个开源预训练语言模型进行提示微调,使其能够提取关键词、生成案例摘要,克服通用摘要模型在法律专业领域可能出现的事实偏差与逻辑谬误。

关键词:提示模板、软提示、关键词提取、生成案例摘要

模型:Qwen3-8B

模型任务:

任务一:关键词提取

任务二:生成案例摘要

论文任务:

对比基线模型、提示模板+基线模型、软提示+基线模型、Qlora+基线模型对不同任务的完成情况。

评价机制:

任务一:与基线模型对比F1参数

任务二:与基线模型对比ROUGE-1 / ROUGE-2 / ROUGE-L等自动指标

bash 复制代码
ROUGE-1

定义:计算生成文本与参考文本之间单个词(unigram)的重叠率。

计算方式:

召回率 (Recall):生成文本中与参考文本匹配的词数 / 参考文本总词数

精确率 (Precision):生成文本中与参考文本匹配的词数 / 生成文本总词数

F1-score:精确率和召回率的调和平均数

用途:衡量生成文本是否包含参考文本中的关键词。


ROUGE-2

定义:计算生成文本与参考文本之间连续两个词(二元组 bigram)的重叠率。

计算方式:

同 ROUGE-1,但匹配的是连续两个词的组合。

用途:衡量生成文本是否保留了参考文本中的短语或局部句法结构,比 ROUGE-1 更严格。

ROUGE-L

定义:计算生成文本与参考文本之间的最长公共子序列(Longest Common Subsequence, LCS)。

特点:

不要求连续的词,但顺序必须一致

可反映文本的整体顺序和语义连贯性

计算方式:

召回率 = LCS 长度 / 参考文本长度

精确率 = LCS 长度 / 生成文本长度

F1-score = 精确率和召回率的调和平均数

用途:衡量生成文本与参考文本在整体结构和逻辑上的一致性。

项目结构:

bash 复制代码
LawLLM_Project/                 # 项目根目录
├─ data/                        # 原始和处理后的数据
│   ├─ raw/                     # 原始裁判文书、案例文本
│   │   ├─ criminal_cases/      # 刑事判决书样本
│   │   ├─ civil_cases/         # 可选:民事案例样本
│   │   └─ metadata.json        # 数据集说明
│   ├─ processed/               # 清洗/标注后的数据
│   │   ├─ keyword_cases.jsonl  # 用于关键词提取的样本
│   │   └─ summary_cases.jsonl  # 用于摘要生成的样本
│   └─ prompts/                 # 统一存放 Prompt 模板
│       ├─ keyword_prompt.txt
│       ├─ summary_prompt.txt
│       └─ legal_constraint_prompt.txt
│
├─ models/                      # 模型存放
│   └─ Qwen3-8B/                # 本地下载的模型
│
├─ src/                         # 实验代码
│   ├─ __init__.py
│   ├─ download_model.py         # HuggingFace 模型下载脚本
│   ├─ inference.py              # 推理函数(generate_text, keyword_extraction, summarize_case)
│   ├─ evaluate.py               # 实验评测函数(人工打分/自动指标)
│   └─ run_experiments.py        # 对照实验执行脚本
│
├─ results/                     # 实验结果
│   ├─ keyword_extraction/      # 关键词提取输出
│   │   ├─ baseline.jsonl
│   │   └─ legal_prompt.jsonl
│   └─ summary/                 # 案例摘要输出
│       ├─ baseline.txt
│       └─ legal_prompt.txt
│
├─ notebooks/                   # 可选:Jupyter笔记本
│   └─ analysis.ipynb           # 可视化对比、统计图表
│
├─ requirements.txt             # Python依赖
├─ README.md                    # 项目说明

今日完成任务:

建立项目框架、下载模型、初步构建模型评价体系、将任务上传到github

相关推荐
laozhao4327 分钟前
浪潮298.00万中标甘肃能源化工集团财务信息化系统项目
大数据·人工智能
smileNicky8 分钟前
Spring AI系列之对话记忆与工具调用指南
人工智能·python·spring
北京软秦科技有限公司8 分钟前
IACheck助力能源电力检测报告智能审核:AI报告审核提升质量与效率
大数据·人工智能·能源
arvin_xiaoting8 分钟前
从 0 到 1:搭建自学习 AI Agent 系统的完整工程指南
人工智能·学习·系统设计·ai agent·lancedb·自学习·openclaw
火山引擎开发者社区12 分钟前
真的懂?搞定 10 大热门 Skills,用 ArkClaw 实现养虾自由
人工智能
冰西瓜60016 分钟前
深度学习的数学原理(十七)—— 归一化:BN与LN
人工智能·深度学习
bryant_meng24 分钟前
【Reading Notes】(7.11)Favorite Articles from 2024 November
人工智能·深度学习·计算机视觉·aigc·资讯
GEO_Huang26 分钟前
企业转型无从下手?数谷的定制化 AI 方案能否指点迷津?
大数据·人工智能·aigc·rpa·geo·企业智能体定制·企业ai定制
Yvonne爱编码42 分钟前
2026 现象级 AI 工具 OpenClaw 全解析:本地部署、自动化实战与技术揭秘
运维·人工智能·自动化
啦啦啦_999944 分钟前
1. AI 学习目录
java·人工智能