作者: 这个男人来自千祥,TorchV联合创始人,AI技术布道者。本文部分观点源自与TorchV CEO 员外先生的深入交流。
企业AI落地不顺?问题可能出在你没搞懂知识库
导读:
- 为什么企业AI落地往往不顺?
- 重新认识知识:它不是数据,也不是文档。
- AI企业知识库不等于RAG。
- 如何将文档、数据变成知识?本文将介绍一种基于SECI模型的实现方法。
一、AI时代,知识库为何如此重要
在今年的AI应用中,一些产品展现出了令人惊叹的能力,似乎AI已经进入了能够自我思考和执行的时代。然而,作者在使用这些产品时,发现了一个关键局限:它们难以理解企业特有的业务流程。即使是再聪明的AI,如果不能理解企业的内部知识,其提供的结果也可能与实际业务无关。这说明,在真正的企业AI应用中,知识库是不可或缺的。
正如一位国际高级咨询师,如果他完全不了解公司业务和知识,其建议可能听起来很好,但实际价值有限。企业竞争的关键点,就在于"我们的知识有多好"。彼得·德鲁克在《为成果而管理》一书中也明确指出,企业的关键资源只有两类:知识和资金。
TorchV CEO 员外曾深刻洞察到,"AI应用在toB侧的成功与否,很大程度上取决于企业知识库这个根基是否扎实。" 这与我们客户的反馈不谋而合。因此,TorchV始终致力于帮助企业夯实知识库基础,让知识成为企业在AI时代的真正竞争力。
二、重新定义知识:数据、信息、经验与知识
为了更好地理解知识,我们需要区分它与数据、信息和经验的不同。维基百科将知识定义为"对某个主题'认知'与'识别'的行为藉以确信的认识,并且这些认识拥有潜在的能力为特定目的而使用",强调了知识的"面向主题"和"使用潜力"。
为了更清晰地区分这几个概念,我们参考了DIKW金字塔模型和沈欣老师的定义:"知识是一种可验证、显性的经验模型"。它们之间的递进关系可以用下图来概括:
图1:数据、信息、经验和知识的递进关系
- 数据:反映客观事实的数字、符号或记录。
- 信息:经过整理、归类或分析,被赋予意义和目的的数据。
- 经验:通常依赖个人或组织积累的技能或认知。
- 知识:可验证的业务模型,能够指导决策和行动。
经验属于个人的隐性认知,而知识则是显性化、可复用的体系单元。在企业中,将运营人员的个人经验(例如,当用户浏览某运动鞋详情页但未下单时,向其发送优惠券)转化为可供AI直接使用的模型,才是真正完成了知识的转化。
三、如何让知识在AI中发挥作用
要让知识在AI时代发挥作用,需要一套科学、系统化的方法。这主要包括三个部分:知识构建 、知识应用 和知识运营。一个真正的企业级知识库,必须将这三者结合起来。
图2: AI企业级知识库的三大组成部分
3.1 知识构建
知识构建是核心环节,旨在将企业中分散的数据、信息和经验聚集并组织起来,转化为可用的知识。
知识导入 知识的来源多种多样,包括本地文件(如Word、Excel、PDF)、企业原有系统(如OA、数据库)、互联网上的外部知识,以及纸质文档等。知识导入的任务就是为这些来源提供入口,并通过自动化方式批量导入。
图3:知识导入触发条件
知识加工 知识加工决定了知识入库的质量。它类似于数据ETL(抽取、转化、加载)过程,旨在增强知识的可表示性、可用性和关联性。这个过程包括:内容抽取(如从文档中提取文本和表格)、处理算子(如数据脱敏、摘要)、知识清洗(将内容转化为Markdown)和知识丰富(如知识打标、添加上下文)。
图4:知识加工流程编排
如何将文档转化为知识?------SECI模型
SECI模型在TorchV知识库的实现:CEO员外曾指出,"AI时代的知识构建,不仅是技术的堆砌,更是对传统知识管理理论的创新应用。" 在此理念的指导下,TorchV的AI企业知识库实现了SECI过程的自动化。
将数据、文档和个人经验转化为知识是极具价值的挑战。这不仅有助于知识传承,还能使业务处理更加智能化。目前,一种常用的科学方法是基于SECI模型。
SECI模型由日本学者野中裕次郎和竹内弘高在1985年提出,描述了知识产生的四个过程:
- 社会化(Socialization):通过共享经历,建立隐性知识的过程。
- 外在化(Externalization):将隐性知识用显性的概念和语言表达出来的过程。
- 组合化(Combination):将多种显性知识组合和系统化,使其产生更大作用的过程。
- 内化(Internalization):将显性知识具体化,被组织成员吸收并升华为自己的隐性知识,用于实践的过程。
在AI时代,SECI模型的局限性可以通过技术手段得到弥补。例如,通过知识加工,可以从会议纪要、聊天记录中提取共识,形成潜在知识(社会化);将这些潜在知识提炼成知识主题(外在化);在"应用空间"中,将不同部门的知识组合,形成针对特定应用的组合知识(组合化);最后,将知识空间与智能体结合,形成可被AI触发的业务应用(内化)。
图5: AI企业知识库的知识构建过程
3.2 知识应用
知识库是AI系统的底层组件,可以通过API被各类应用接入。常见的AI应用形态可分为三类:
图6: 三种AI应用形态,帮我找、帮我写、帮我做
- 帮我找:如RAG问答系统和异步的Deep Research。
- 帮我写:基于在线编辑器,一键生成合同、报告、邮件等。
图7:通过企业知识库的AI应用写日报周报
- 帮我做:操作类型的应用,如预约会议室。
图8:帮我做的会议室预约
3.3 知识运营
知识库需要持续运营,以应对新旧知识带来的"噪声"。知识运营的主要手段包括:
- 知识降噪:定期检查并处理重复或冲突的文档,建议由知识管理人员处理。
- 知识刷新:自动替换过时的知识,更新文档链接和引用,或将具备时效性的知识标记为冷知识。
四、总结
在TorchV AIS和TorchV KBS的知识加工环节,我们利用流程编排技术,实现了以下知识加工过程。这得益于我们团队在AI技术领域的深厚积累。
很多企业在AI应用中感到失望,但原因可能在于,他们将重心放在了应用本身,而忽略了作为"根基"的AI企业知识库。AI企业知识库才是企业真正应该花大力气夯实的地方。企业AI应用的成功与否,很大程度上取决于知识库的质量。在AI时代,企业的竞争力不仅在于模型的规模,更在于如何更好地掌握和利用自身的知识。