深度学习速通系列:超长法律文件隐私过滤(基于预训练模型Bert)

法律文件隐私过滤

网上使用bert的中文模型进行命名识别教程少的可怜,摸索了一周的时间,硬是把法律文书的人名全部识别出来了,目前可以达到98.9999%(开玩笑的,不过准确率保守估计是有90%以上).注意:这个法律文书目前只是针对裁决书,其他还没测试过,可支持超长文本识别

github仓库地址

欢迎各位点个☆Star!!!

使用的模型

bert-base-chinese-ner 下载路径:https://hf-mirror.com/ckiplab/bert-base-chinese-ner (国内镜像,不用魔法也能访问)

下载好,直接放在当前目录下

使用步骤

python 复制代码
1.先去下载模型,放在当前目录下
2.将里面的text改成你的文本,即"text=''' 你的法律文书内容''' "
3.全局搜索from_pretrained,后面的两处路径都改成模型的绝对路径
4.启动person_filterling.py文件
5.在当前目录找到一个.docx文件,直接打开,就可以看到识别后的文件了

提醒

虽然项目只是针对了法律文书进行了调整,也可以尝试使用其他类型文本,效果应该也是可观的

相关推荐
哥布林学者5 分钟前
吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (四)YOLO 的完整传播过程
深度学习·ai
_codemonster9 分钟前
python易混淆知识点(十六)lambda表达式
开发语言·python
Mintopia14 分钟前
🤖 2025 年的人类还需要 “Prompt 工程师” 吗?
人工智能·llm·aigc
agicall.com15 分钟前
实时语音转文字设备在固话座机中的重要价值
人工智能·语音识别
aitoolhub17 分钟前
AI生成圣诞视觉图:从节日元素到创意落地的路径
人工智能·深度学习·自然语言处理·节日
神州问学19 分钟前
除了 DeepSeek-OCR,还有谁在“把字当图看”?
人工智能
Mintopia21 分钟前
意图驱动编程(Intent-Driven Programming)
人工智能·llm·aigc
zhongerzixunshi21 分钟前
工程研究中心认证:科技创新与产业升级的重要引擎
人工智能·科技
雍凉明月夜22 分钟前
深度学习网络笔记Ⅰ(CNN)
网络·笔记·深度学习·神经网络·学习·cnn
rayufo23 分钟前
对MNIST FASHION数据集训练的准确度的迭代提高
深度学习·机器学习