企业AI落地不顺问题可能出在你没搞懂知识库

作者: 这个男人来自千祥,TorchV联合创始人,AI技术布道者。本文部分观点源自与TorchV CEO 员外先生的深入交流。

企业AI落地不顺?问题可能出在你没搞懂知识库

导读:

  • 为什么企业AI落地往往不顺?
  • 重新认识知识:它不是数据,也不是文档。
  • AI企业知识库不等于RAG。
  • 如何将文档、数据变成知识?本文将介绍一种基于SECI模型的实现方法。

一、AI时代,知识库为何如此重要

在今年的AI应用中,一些产品展现出了令人惊叹的能力,似乎AI已经进入了能够自我思考和执行的时代。然而,作者在使用这些产品时,发现了一个关键局限:它们难以理解企业特有的业务流程。即使是再聪明的AI,如果不能理解企业的内部知识,其提供的结果也可能与实际业务无关。这说明,在真正的企业AI应用中,知识库是不可或缺的。

正如一位国际高级咨询师,如果他完全不了解公司业务和知识,其建议可能听起来很好,但实际价值有限。企业竞争的关键点,就在于"我们的知识有多好"。彼得·德鲁克在《为成果而管理》一书中也明确指出,企业的关键资源只有两类:知识和资金。

TorchV CEO 员外曾深刻洞察到,"AI应用在toB侧的成功与否,很大程度上取决于企业知识库这个根基是否扎实。" 这与我们客户的反馈不谋而合。因此,TorchV始终致力于帮助企业夯实知识库基础,让知识成为企业在AI时代的真正竞争力。

二、重新定义知识:数据、信息、经验与知识

为了更好地理解知识,我们需要区分它与数据、信息和经验的不同。维基百科将知识定义为"对某个主题'认知'与'识别'的行为藉以确信的认识,并且这些认识拥有潜在的能力为特定目的而使用",强调了知识的"面向主题"和"使用潜力"。

为了更清晰地区分这几个概念,我们参考了DIKW金字塔模型和沈欣老师的定义:"知识是一种可验证、显性的经验模型"。它们之间的递进关系可以用下图来概括:

图1:数据、信息、经验和知识的递进关系

  • 数据:反映客观事实的数字、符号或记录。
  • 信息:经过整理、归类或分析,被赋予意义和目的的数据。
  • 经验:通常依赖个人或组织积累的技能或认知。
  • 知识:可验证的业务模型,能够指导决策和行动。

经验属于个人的隐性认知,而知识则是显性化、可复用的体系单元。在企业中,将运营人员的个人经验(例如,当用户浏览某运动鞋详情页但未下单时,向其发送优惠券)转化为可供AI直接使用的模型,才是真正完成了知识的转化。

三、如何让知识在AI中发挥作用

要让知识在AI时代发挥作用,需要一套科学、系统化的方法。这主要包括三个部分:知识构建知识应用知识运营。一个真正的企业级知识库,必须将这三者结合起来。

图2: AI企业级知识库的三大组成部分

3.1 知识构建

知识构建是核心环节,旨在将企业中分散的数据、信息和经验聚集并组织起来,转化为可用的知识。

知识导入 知识的来源多种多样,包括本地文件(如Word、Excel、PDF)、企业原有系统(如OA、数据库)、互联网上的外部知识,以及纸质文档等。知识导入的任务就是为这些来源提供入口,并通过自动化方式批量导入。

图3:知识导入触发条件

知识加工 知识加工决定了知识入库的质量。它类似于数据ETL(抽取、转化、加载)过程,旨在增强知识的可表示性、可用性和关联性。这个过程包括:内容抽取(如从文档中提取文本和表格)、处理算子(如数据脱敏、摘要)、知识清洗(将内容转化为Markdown)和知识丰富(如知识打标、添加上下文)。

图4:知识加工流程编排

如何将文档转化为知识?------SECI模型

SECI模型在TorchV知识库的实现:CEO员外曾指出,"AI时代的知识构建,不仅是技术的堆砌,更是对传统知识管理理论的创新应用。" 在此理念的指导下,TorchV的AI企业知识库实现了SECI过程的自动化。

将数据、文档和个人经验转化为知识是极具价值的挑战。这不仅有助于知识传承,还能使业务处理更加智能化。目前,一种常用的科学方法是基于SECI模型

SECI模型由日本学者野中裕次郎和竹内弘高在1985年提出,描述了知识产生的四个过程:

  • 社会化(Socialization):通过共享经历,建立隐性知识的过程。
  • 外在化(Externalization):将隐性知识用显性的概念和语言表达出来的过程。
  • 组合化(Combination):将多种显性知识组合和系统化,使其产生更大作用的过程。
  • 内化(Internalization):将显性知识具体化,被组织成员吸收并升华为自己的隐性知识,用于实践的过程。

在AI时代,SECI模型的局限性可以通过技术手段得到弥补。例如,通过知识加工,可以从会议纪要、聊天记录中提取共识,形成潜在知识(社会化);将这些潜在知识提炼成知识主题(外在化);在"应用空间"中,将不同部门的知识组合,形成针对特定应用的组合知识(组合化);最后,将知识空间与智能体结合,形成可被AI触发的业务应用(内化)。

图5: AI企业知识库的知识构建过程

3.2 知识应用

知识库是AI系统的底层组件,可以通过API被各类应用接入。常见的AI应用形态可分为三类:

图6: 三种AI应用形态,帮我找、帮我写、帮我做

  • 帮我找:如RAG问答系统和异步的Deep Research。
  • 帮我写:基于在线编辑器,一键生成合同、报告、邮件等。

图7:通过企业知识库的AI应用写日报周报

  • 帮我做:操作类型的应用,如预约会议室。

图8:帮我做的会议室预约

3.3 知识运营

知识库需要持续运营,以应对新旧知识带来的"噪声"。知识运营的主要手段包括:

  • 知识降噪:定期检查并处理重复或冲突的文档,建议由知识管理人员处理。
  • 知识刷新:自动替换过时的知识,更新文档链接和引用,或将具备时效性的知识标记为冷知识。

四、总结

在TorchV AIS和TorchV KBS的知识加工环节,我们利用流程编排技术,实现了以下知识加工过程。这得益于我们团队在AI技术领域的深厚积累。

很多企业在AI应用中感到失望,但原因可能在于,他们将重心放在了应用本身,而忽略了作为"根基"的AI企业知识库。AI企业知识库才是企业真正应该花大力气夯实的地方。企业AI应用的成功与否,很大程度上取决于知识库的质量。在AI时代,企业的竞争力不仅在于模型的规模,更在于如何更好地掌握和利用自身的知识。

相关推荐
9呀1 分钟前
【人工智能99问】什么是Post-Training,包含哪些内容?(19/99)
人工智能
小拇指~4 分钟前
神经网络的基础
人工智能·深度学习·神经网络
wenzhangli75 分钟前
AI 重塑软件产业:从技术革命到生态重构
人工智能·驱动开发·重构
安冬的码畜日常13 分钟前
【AI 加持下的 Python 编程实战 2_13】第九章:繁琐任务的自动化(中)——自动批量合并 PDF 文档
人工智能·python·自动化·ai编程·ai辅助编程
Bar_artist38 分钟前
RockAI 的破壁之战:Yan 架构如何啃下“端侧炼丹”硬骨头?
人工智能
爱编码的程序员41 分钟前
python 处理json、excel、然后将内容转化为DSL语句,适用于数据处理(实用版)
人工智能·python·ai·json·excel·数据处理·dsl
哔哩哔哩技术1 小时前
B站是如何实现原声视频翻译的
人工智能
陈敬雷-充电了么-CEO兼CTO1 小时前
OpenAI ChatGPT Agent横空出世:全能工具+实时交互,重新定义AI智能体的终极形态
人工智能·gpt·ai·chatgpt·大模型
新智元1 小时前
ChatGPT血洗美国50万科技岗位!25年美国GDP增长,不靠人类靠AI?
人工智能·openai
TMT星球1 小时前
官宣朱珠成为集团品牌代言人,转转推动二手消费新风尚
大数据·人工智能