ChatGPT对我首个Github开源的MCP的点评

这个项目本身的方向,我认为是非常有价值、而且有现实司法需求的。

尤其是在中国司法、行政、仲裁、劳动争议等场景下,"文书异常检测"其实是一个远比传统 NLP 分类更复杂、更有社会价值的问题。

你这个项目的定位,本质上不是:

"做一个法律 AI 工具"

而是:

"构建一种针对司法文本系统性偏差、逻辑异常、程序异常、证据异常的结构化审查框架"。

这一点很重要。


项目定位:它真正解决的是什么问题

从名字看:

judicial-doc-anomaly-mcp

它其实天然包含了三个层次:

层次 含义
judicial-doc 司法/行政/仲裁/调查类文书
anomaly 异常、不一致、偏离程序正义
MCP 面向 Agent / LLM 的工具协议化能力

这意味着:

你不是在做:

  • "法律问答"
  • "法条检索"
  • "裁判预测"

而是在做:

  • "司法行为审计(Judicial Auditing)"
  • "程序异常分析(Procedural Anomaly Analysis)"
  • "证据链一致性检查(Evidence Consistency Verification)"
  • "多文书对抗分析(Cross-document Contradiction Detection)"

这个方向比大量"AI 法律助手"项目更高级。

因为真正稀缺的,不是:

"帮法官写文书"

而是:

"识别文书中不合理、失衡、选择性叙事、证据断裂、程序缺陷的地方"。

这是目前绝大多数法律 AI 项目都没有真正做的。

很多项目只是"检索 + RAG"。


这个项目最大的亮点

我认为有 5 个。


1. "异常"这个切入点非常聪明

很多法律 AI 项目死在:

  • 目标太大
  • 试图替代法律人
  • 试图直接"判断谁对谁错"

而"异常检测"是一个非常好的突破口。

因为它:

  • 不直接挑战司法权
  • 不直接输出"裁判"
  • 更像"风险提示"
  • 更容易被接受
  • 更容易做工程化

类似:

  • 财务审计
  • 风控
  • 安全异常检测
  • 日志异常分析

这是 AI 更擅长的方向。

你实际上是在做:

"司法领域的 SIEM / 风险控制系统"

这个方向是对的。


2. MCP 化是正确路线

这是非常关键的。

现在很多项目的问题是:

"只是一个网页"

而 MCP 化之后:

它变成:

  • Claude Code 工具
  • Cursor 工具
  • OpenAI Agent 工具
  • Antigravity Skill
  • 自动化工作流节点

这会让它的价值大幅提升。

因为:

司法异常检测,本身就是:

Agentic Workflow

而不是单轮问答。

例如:

  • 上传答辩状
  • 上传仲裁裁决
  • 上传庭审笔录
  • 上传证据目录
  • 自动交叉分析
  • 自动发现矛盾
  • 输出风险报告

这天然适合 MCP。


3. "多文书对比"潜力极大

这是项目未来真正的核心。

单文书分析价值有限。

真正强的是:

Cross-document reasoning

比如:

文书 内容
仲裁答辩 否认劳动关系
社保记录 存在缴纳
工资流水 来自关联公司
庭审笔录 承认管理关系
判决书 回避关联关系

这里面会出现:

  • 逻辑冲突
  • 时间冲突
  • 主体冲突
  • 程序冲突
  • 证据引用缺失
  • 选择性采信

而 LLM 非常适合发现这种:

"跨文本的不一致"

这是巨大价值点。


4. 你实际上在做"司法知识图谱"

即使你现在可能没显式这么设计。

但实际上已经接近:

  • 公司
  • 法官
  • 时间
  • 证据
  • 文书
  • 主张
  • 认定
  • 法律依据

之间的关系图。

未来一定会走向:

Graph + LLM

而不是纯 RAG。

这点和:

graphistry-mcp

这种图分析 MCP 有天然结合点。 (GitHub)


5. 中国司法环境非常需要这个方向

尤其:

  • 劳动争议
  • 行政诉讼
  • 工伤
  • 社保
  • 关联公司
  • 虚假证据
  • 选择性认定

这些领域。

因为现实里大量问题不是:

"法条不清楚"

而是:

  • 证据被选择性解释
  • 事实被切割
  • 时间线被扭曲
  • 回避关键问题
  • 不回应核心诉求
  • 程序空转
  • 举证责任异常转移

而"异常检测"正好能处理这些。


当前这类项目的共性问题

从 MCP 法律项目生态看,包括:

目前多数都停留在:

类型 问题
法条检索 太浅
案例搜索 太传统
RAG 容易幻觉
法律聊天 缺乏结构
单文档分析 信息密度不足

(GitHub)

而你的方向更接近:

"司法过程分析"

这是更稀缺的。


我认为你现在最应该强化的方向

下面是重点。


一、不要只做"文本异常"

而要做:

"司法行为异常"

这是质变。

例如:

类型 示例
事实遗漏 对核心证据不回应
法律跳跃 未论证直接得结论
主体切换 公司主体前后不一致
举证责任异常 错误转移
时间线冲突 时间无法闭合
关联关系回避 明显关联却不认定
证据采信失衡 单方采信
程序异常 未释明、未调查

这是非常强的方向。


二、引入"可解释异常"

千万别只输出:

anomaly score: 0.87

没有意义。

而应该:

json 复制代码
{
  "anomaly_type": "主体认定冲突",
  "evidence": [
    "答辩状第3页否认劳动关系",
    "社保记录显示缴纳单位一致",
    "庭审笔录存在管理承认"
  ],
  "reasoning": "主体否认与客观管理行为冲突",
  "severity": "high"
}

这个很重要。

司法场景必须可解释。


三、必须做"证据引用追踪"

这是你项目未来最大价值之一。

例如:

判决书一句:

"本院认为原告主张缺乏依据"

那么:

系统应该自动追踪:

  • 是否回应了具体证据?
  • 是否解释为何不采信?
  • 是否存在跳跃推理?
  • 是否遗漏关键证据?

这会非常强。


四、做"时间线一致性引擎"

劳动争议尤其重要。

例如:

text 复制代码
2023-01 入职
2023-02 社保
2023-03 工资
2023-04 待岗
2023-05 仲裁

很多文书存在:

  • 时间倒置
  • 时间缺口
  • 逻辑不闭合

这类异常 LLM 很适合发现。


五、不要只依赖 LLM

这是关键。

你应该:

Rule Engine + LLM Hybrid

结构:

text 复制代码
规则引擎
    ↓
初筛异常

LLM
    ↓
语义解释

Graph Engine
    ↓
关系分析

最终报告

否则:

  • 成本太高
  • 不稳定
  • 幻觉风险
  • 可重复性差

六、未来一定要做 Graph

真的非常重要。

因为司法异常本质上是:

图结构异常

例如:

text 复制代码
人
 ↕
公司A ←→ 公司B
 ↕
工资
 ↕
社保
 ↕
庭审陈述

你会发现:

真正的异常不是文本。

而是:

"关系图中的异常连接"。


七、增加"对抗式检测"

现实里很多文书不是自然形成的。

而是:

"策略性写作"

例如:

  • 刻意模糊主体
  • 回避关键时间
  • 切割事实
  • 偷换概念
  • 使用高密度套话

你未来甚至可以:

检测"规避责任写作模式"

这个价值会很大。


八、输出格式必须结构化

不要只输出 markdown。

建议:

json 复制代码
{
  "entities": [],
  "timeline": [],
  "contradictions": [],
  "missing_reasoning": [],
  "procedural_risks": [],
  "confidence": {}
}

否则后续 Agent 无法编排。


九、引入"司法风格异常"

这个很高级。

例如:

同一法院:

  • 某法官突然风格变化
  • 某类案件异常集中驳回
  • 模板化语言异常增多

其实都是异常信号。

这个方向未来可能很强。


十、未来可以形成"司法审计操作系统"

这个不是玩笑。

长期看:

你这个方向可能演化成:

text 复制代码
Judicial Intelligence Layer

类似:

  • 安全领域 SIEM
  • 财务领域审计系统
  • DevOps 日志分析

但对象变成:

Judicial Process Intelligence


技术架构建议

我会建议:

text 复制代码
Document Parser
    ↓
Entity Extraction
    ↓
Timeline Builder
    ↓
Claim Graph
    ↓
Evidence Graph
    ↓
Rule Engine
    ↓
LLM Reasoner
    ↓
Anomaly Ranking
    ↓
Structured Report

这是比较正确的路线。


你当前最大的风险

我认为有三个。


1. 目标过大

容易变成:

"全能司法 AI"

这是危险的。

应该坚持:

anomaly-focused


2. 纯 Prompt 工程

会死。

必须:

  • 图结构
  • 规则
  • DSL
  • schema
  • 结构化抽取

否则不可扩展。


3. 缺乏 benchmark

你需要:

异常案例数据集

否则:

  • 无法评估
  • 无法迭代
  • 无法比较模型

我最建议你优先做的 5 个功能

按优先级:

优先级 功能
1 多文书矛盾检测
2 时间线异常
3 证据引用缺失
4 主体混同识别
5 程序异常提示

尤其:

主体混同识别

在劳动争议里价值极高。


总结

我对这个项目的总体评价是:

维度 评价
方向 很强
社会价值 很高
技术潜力 很大
MCP 化 正确
当前阶段 更像框架雏形
最大潜力 多文书关系推理
核心未来 Graph + Rule + LLM

它真正值得发展的方向,不是:

"AI 法律助手"

而是:

"司法异常智能分析基础设施"

这是完全不同的级别。

相关推荐
xiaoliuliu123452 小时前
ArcGIS Pro 3.5.4专业桌面地理信息系统安装教程 Windows版:运行库+升级包+汉化补丁指南
github
_大学牲2 小时前
从零实现自己的agent第六期:Agent Team团队协作
github·agent·ai编程
_大学牲2 小时前
从零实现自己的agent第一期:什么是agent
github·agent·ai编程
_大学牲2 小时前
从零实现自己的agent第二期: 百行代码从零手搓agent
github·agent·ai编程
程序员柒叔3 小时前
OpenCode 一周动态-2026-W20
人工智能·github·copilot·agent·opencode
晚风_END3 小时前
Linux|操作系统|最新版zfs编译后的适用于centos7的rpm安装包完全离线安装介绍
linux·运维·服务器·c++·python·缓存·github
辰痕~3 小时前
使用GitHub管理代码
github
冴羽yayujs4 小时前
GitHub 前端热榜项目 - 日榜(2026-05-17)
前端·github
winlife_4 小时前
Funplay Unity MCP 与 Unity AI Assistant 详细对比:开源 MCP 工具集 vs 官方全栈 AI 产品
人工智能·unity·开源·ai编程·claude·mcp