一、 业务痛点与需求分析
- **文件类型多样:**资质文件包括《药品生产/经营许可证》、《GMP/GSP证书》、《营业执照》、法人授权书等,格式不统一(扫描件、照片、PDF)。
- **关键信息非结构化:**所需审核的信息深嵌在文本中,手工录入易出错、效率低。
- **审核规则复杂:**需要校验证照的有效期、经营范围是否匹配、发证机构公章真伪(间接)、是否存在关联风险等。
- **动态监管要求:**医药监管政策时常更新,审核规则需要能够快速适配。
二、技术目标
- **自动化:**实现从资质文件上传、信息提取、到初步审核的全流程自动化,减少人工介入。
- **精准化:**利用针对医药行业训练的OCR和NLP模型,高精度提取关键字段,如企业名称、许可证编号、有效期、生产范围等。
- **智能化:**基于规则和机器学习模型,对提取的信息进行自动校验、风险识别和一致性比对。
- **合规化:**确保整个审核流程符合GSP/GMP等医药行业法规,并形成完整的、可追溯的电子审计轨迹。
三、系统架构
1、本方案采用分层架构,确保系统的灵活性、可扩展性和稳定性。

1、架构描述
用户层:提供多种前端界面,方便用户随时随地访问服务。
接入层:负责请求的统一接入、安全管控和负载分发,保障系统稳定高效。
AI 能力层:提供OCR识别和模型分析等核心AI功能,是系统的"大脑"。
支撑层:负责数据的存储、缓存与管理,是系统的"记忆中枢"。
基础层:提供底层的CPU和GPU计算资源,为整个系统提供运行动力。
四、核心工作流程(无缝结合的关键)
流程体现了"无缝结合",从用户上传一个文件开始,到最终输出审核结果,全程自动化。
- **文件上传与预处理:**系统自动对图像进行预处理,包括:灰度化、二值化、降噪、透视矫正(解决拍歪问题),确保OCR识别的最佳输入质量。
- 智能OCR与文档分类:预处理后的图像送入OCR服务。
- **文档类型识别:**首先通过图像分类或文本关键词,自动判断文件类型(是《药品生产许可证》还是《营业执照》?)。
- 文字识别: 根据文档类型,调用相应的OCR模型。
- **通用模型:**处理格式不固定的文件,如法人授权书。
- **定制化模型:**针对固定版式的许可证、营业执照,使用事先训练好的专用模型,识别精度可达99%以上。
- NLP 信息抽取与结构化:OCR输出的纯文本送入NLP服务。
- 命名实体识别: 精准定位并抽取出关键实体字段,例如:
- 企业名称:某某制药股份有限公司
- 证书编号:A-B123456789
- 有效期至: 2025-12-31
- 生产范围:片剂、胶囊剂、原料药...
- **数据标准化:**将提取的日期统一格式化,将经营范围与标准药品分类字典进行映射。
- 命名实体识别: 精准定位并抽取出关键实体字段,例如:
- 自动化审核与智能校验(业务逻辑核心): 提取出的结构化数据送入规则引擎,进行多维度、并行的自动化校验:
- 有效性校验:
- 有效期至 > 系统当前日期? (规则: expiry_date > now())
- 一致性校验:
- 同一供应商的《营业执照》上的公司名称与《药品生产许可证》上的企业名称是否一致?
- 法人授权书上的被授权公司是否与营业执照名称一致?
- 合规性校验:
- 经营/生产范围:是否包含本次合作的产品品类? (规则: "经营范围" CONTAINS "生物制品")
- 证书编号是否符合官方编码规则?(可通过正则表达式校验)
- 风险比对:
- 将该企业名称与内置的"风险企业数据库"进行比对,检查是否存在违规记录。
- 有效性校验:
- 结果汇总与决策: 规则引擎执行完毕后,生成审核报告。
- **自动通过:**所有校验规则全部通过。
- **自动拒绝:**发现关键问题,如证书已过期、企业在黑名单中。
- **人工复核:**出现非关键性异常或置信度较低的情况(如OCR提取的某个字段模糊不清),系统将任务标记并流转给人工审核员,并高亮提示异常点。
- **归档与监控:**最终审核结果(无论自动还是人工)与所有原始文件、提取的数据、审核日志一并归档,形成不可篡改的审计轨迹。系统提供仪表盘,实时监控供应商资质的整体健康度(如即将到期的证书比例)。
五、关键技术亮点
- **基于深度学习技术的OCR识别:**不仅能识别文字,还能理解文档的版面布局(如印章位置、表格结构),从而更准确地关联字段名和字段值。
- **动态规则引擎:**审核规则不再硬编码在程序里。业务人员可以通过管理界面,以"低代码"或自然语言的方式配置和修改规则(例如:"新增一条规则,检查经营范围是否包含'疫苗'")。
- **持续学习与优化:**系统会记录人工复核的纠正结果,这些数据可以作为训练数据,持续反馈给OCR和NLP模型,形成"越用越聪明"的闭环。
六、预期效益
- **效率提升:**将单份资质审核时间从小时级缩短到分钟级,人力成本下降70%以上。
- **准确性保障:**消除人工录入的错误和疏漏,审核准确率提升至95%以上。
- **风险控制:**实现7x24小时无间断的自动风险扫描,提前预警资质过期等问题,增强供应链韧性。
- **合规与追溯:**完整的电子化记录,轻松应对内外部审计和飞检。
- **战略价值:**使企业能够更高效地管理庞大的供应商网络,为供应链决策提供数据支持。