一、迭代背景
本次迭代针对性解决线上三大核心问题,对知识库同步、文件上传、个人草稿流程做整体闭环优化:
-
多知识库规则混乱:企业库、个人库、专项库共用一套同步逻辑,阈值、入库表、发布策略不统一,可控性差。
-
文件上传耦合严重:异步逻辑在事务未提交前执行,偶现查不到数据、流程中断问题。
-
个人库流程缺失:AI 自动同步的草稿无认领人,用户无法自主提交审核,业务链路断层。
二、核心优化方案
1. 多知识库同步规则统一重构
重新梳理各库阈值、入库策略与发布机制,彻底拆分差异化逻辑,实现各库独立可控。
| 知识库类型 | 目标表 | 置信度阈值 | 申请人 | 说明 |
|---|---|---|---|---|
| 企业成果库 | 最终表 | ≥0.7 | - | 直接发布,跳过草稿流程 |
| 个人私有库 | 草稿表 | ≥0.6 | null(未认领) | 用户提交审核时自动赋值认领人 |
| 专项库 | 最终表 | ≥0.7 | - | 基础公共数据,直接发布 |
幂等机制升级 :由单一 task_id 校验,升级为 task_id + kb_id 组合唯一校验,支持同一解构任务批量同步多知识库,杜绝跨库幂等冲突。
2. 文件上传职责分层与异步解耦
重构上传链路,彻底拆分存储、异步、业务三层职责,解决事务与异步时序错乱问题。
| 层级 | 核心职责 |
|---|---|
| 存储层 | 仅落地本地文件记录,轻量化执行 |
| 异步层 | 远程上传、AI解构创建、消息推送、成果同步 |
| 业务层 | 业务关联、文件秒传复用、幂等拦截 |
关键问题修复 :所有异步逻辑统一迁移至 TransactionSynchronizationManager.afterCommit 执行,确保事务完全提交后再走异步流程,彻底解决事务与异步时序错乱导致的数据一致性问题。
3. 个人库草稿认领流程闭环
补齐个人私有库从 AI 同步 → 草稿留存 → 用户认领提交的完整链路:
-
AI 自动同步阶段:草稿
applyUser置空,标记为未认领状态; -
用户主动提交审核时:自动赋值当前登录用户为认领人;
-
草稿列表全局展示,不做申请人拦截,保证用户可查看、可接管、可提交。
三、落地效果
✅ 多知识库同步逻辑解耦,规则清晰、互不干扰,数据质量可控
✅ 文件上传架构分层完成,彻底解决事务时序 bug,秒传场景消息、同步流程正常触发
✅ 个人库草稿认领、审核流程完全闭环,业务链路完整可用
四、后续待办规划
-
文档预览优化:实现 Word/PPT 异步转 PDF,同时存储原始文件与预览文件,前端统一 PDF 预览
-
平台规范补齐:统一文件预览策略、文件大小限制、转换失败重试机制
写在最后
本次迭代属于典型的「规则梳理+架构解耦+流程补全」的精细化优化。很多线上隐患并非功能无法使用,而是逻辑混杂、边界不清、时序错乱。在不重构整体架构的前提下,通过分层职责、细化规则、补齐流程,就能让系统稳定性、可维护性、业务完整性大幅提升。持续打磨细节,系统才会越来越健壮。
本文是《技术底稿》系列第47篇,记录知识库同步规则统一、文件上传异步重构与个人库草稿流程闭环的迭代落地全过程。