以下是当前最主流、可直接部署/集成 的开源合同审核项目,覆盖完整系统、模型、工具三类,按实用性与活跃度排序:
一、完整开源合同审核系统(开箱即用)
1. Themis(忒弥斯)
- 定位 :面向中小企业的大模型驱动合同审查+管理平台
- 核心能力:自动识别风险条款(违约、管辖、不平等)、智能问答、生成合规报告
- 技术栈:Spring AI + LangChain4j + ReactAgent + RAG
- 部署:Docker Compose一键部署,支持云原生
- 地址:https://www.gitcc.com/gongyehou/daacoo-ai-powered-legalcomp
2. LawBotics v2
- 定位 :AI法律科技平台,专注条款抽取+风险分析
- 核心能力:识别41+类条款、PDF/文本双支持、实时分析、Next.js 15界面
- 模型:基于CUAD数据集微调LLaMA,支持Google GenAI
- 地址:https://github.com/hasnaintypes/lawbotics
3. 思通数科 AI合同合规审查(StoneDT)
- 定位 :国内NLP+规则引擎双驱动的合同审查工具
- 核心能力:合同比对、条款抽取、合规检查、风险提示
- 优势:支持中文,可直接集成企业系统,提供在线体验
- 地址:https://gitee.com/stonedtx/contract
4. Docspect
- 定位 :轻量AI合同分析工具,侧重风险高亮+案例参考
- 核心能力:文档摘要、风险条款标注、关联判例、一键上传
- 技术栈:全栈JS,易二次开发
- 地址:https://github.com/Sreyasiv/Docspect
二、开源合同审查模型(用于集成/二次开发)
1. roberta-base-on-cuad
- 定位 :基于RoBERTa的法律文档问答/审查模型
- 训练数据:CUAD(Contract Understanding Atticus Dataset)
- 性能:AUPR 46.6%,支持数字/扫描版合同
- 许可证:MIT,可商用
- 地址:https://github.com/MohammedRakib1/roberta-base-on-cuad
2. CUAD 基准数据集(Contract Understanding Atticus Dataset)
- 定位 :合同理解领域权威标注数据集(13k+标注样本)
- 用途:训练/评估合同审查模型,覆盖41类关键条款
- 地址:https://github.com/TheAtticusProject/cuad
三、实用开源工具/插件(快速集成)
1. Ally -- AI Contract Assistant(Azure Samples)
- 定位 :Word插件,实时合同分析+批注
- 技术:Azure OpenAI,支持Word内直接审查
- 地址:https://github.com/Azure-Samples/ally-legal-assistant
2. Agentic_Contract_Review_GLM
- 定位 :基于GLM的合规审查工作流(以GDPR为例)
- 能力:合同解析、条款匹配法规、生成合规报告
- 技术:LlamaIndex + OpenParse + BGE嵌入
- 地址:https://github.com/TracyWang95/Agentic_Contract_Review_GLM
四、选型建议
- 快速落地 :优先选 Themis 或 LawBotics,完整系统+低部署门槛
- 中文场景 :选 思通数科,适配国内法规与合同文本
- 模型集成 :用 roberta-base-on-cuad 或基于 CUAD 微调自有模型
- Word办公 :直接用 Ally 插件,无缝嵌入日常工作流