Fine-tuning Large Enterprise Language Models via Ontological Reasoning

本文是LLM系列文章,针对《Fine-tuning Large Enterprise Language Models via Ontological Reasoning》的翻译。

基于本体论推理的大型企业语言模型微调

  • 摘要
  • [1 引言](#1 引言)
  • [2 微调LLM的神经符号管道](#2 微调LLM的神经符号管道)
  • [3 通过概念证明进行初步验证](#3 通过概念证明进行初步验证)
  • [4 结论](#4 结论)

摘要

大型语言模型(LLM)利用特定任务的训练数据,将微调作为一种适应不同目标的技术。任务特异性应该与领域定向齐头并进,即LLM的专业化,以准确地处理给定感兴趣领域的任务。然而,模型通常是根据公开可用的数据进行微调的,或者最多是根据数据库中的真实数据进行微调,而忽略了业务级别的定义和领域经验。另一方面,企业知识图谱(EKG)能够通过本体论推理来捕获和增强这些领域知识。为了将LLM的灵活性与EKG的领域定向相结合,我们提出了一种新的神经符号体系结构,该体系结构利用本体论推理的力量来构建用于LLM微调的任务和领域特定语料库。

1 引言

2 微调LLM的神经符号管道

3 通过概念证明进行初步验证

4 结论

根据计算语言学协会欧洲分会最近发表的一项工作,预先训练的语言模型还不能进行演绎推理:它们仍然不能概括逻辑规则,即使提供了规则,LLM也倾向于忘记以前推断的事实。虽然Transformer架构和推理方法之间还没有进行广泛的比较,但我们的工作表明,通过产生微调语料库作为本体论推理的副产品,可以明显提高领域特定NLP任务的LLM性能。我们利用我们在演绎推理方面的经验,为在企业知识图谱上进行推理的神经符号平台迈出了第一步。

相关推荐
杭州泽沃电子科技有限公司3 小时前
为电气风险定价:如何利用监测数据评估工厂的“电气安全风险指数”?
人工智能·安全
Godspeed Zhao4 小时前
自动驾驶中的传感器技术24.3——Camera(18)
人工智能·机器学习·自动驾驶
顾北126 小时前
MCP协议实战|Spring AI + 高德地图工具集成教程
人工智能
wfeqhfxz25887826 小时前
毒蝇伞品种识别与分类_Centernet模型优化实战
人工智能·分类·数据挖掘
中杯可乐多加冰6 小时前
RAG 深度实践系列(七):从“能用”到“好用”——RAG 系统优化与效果评估
人工智能·大模型·llm·大语言模型·rag·检索增强生成
珠海西格电力科技7 小时前
微电网系统架构设计:并网/孤岛双模式运行与控制策略
网络·人工智能·物联网·系统架构·云计算·智慧城市
FreeBuf_7 小时前
AI扩大攻击面,大国博弈引发安全新挑战
人工智能·安全·chatgpt
weisian1518 小时前
进阶篇-8-数学篇-7--特征值与特征向量:AI特征提取的核心逻辑
人工智能·pca·特征值·特征向量·降维
Java程序员 拥抱ai8 小时前
撰写「从0到1构建下一代游戏AI客服」系列技术博客的初衷
人工智能
186******205318 小时前
AI重构项目开发全流程:效率革命与实践指南
人工智能·重构