Fine-tuning Large Enterprise Language Models via Ontological Reasoning

本文是LLM系列文章,针对《Fine-tuning Large Enterprise Language Models via Ontological Reasoning》的翻译。

基于本体论推理的大型企业语言模型微调

  • 摘要
  • [1 引言](#1 引言)
  • [2 微调LLM的神经符号管道](#2 微调LLM的神经符号管道)
  • [3 通过概念证明进行初步验证](#3 通过概念证明进行初步验证)
  • [4 结论](#4 结论)

摘要

大型语言模型(LLM)利用特定任务的训练数据,将微调作为一种适应不同目标的技术。任务特异性应该与领域定向齐头并进,即LLM的专业化,以准确地处理给定感兴趣领域的任务。然而,模型通常是根据公开可用的数据进行微调的,或者最多是根据数据库中的真实数据进行微调,而忽略了业务级别的定义和领域经验。另一方面,企业知识图谱(EKG)能够通过本体论推理来捕获和增强这些领域知识。为了将LLM的灵活性与EKG的领域定向相结合,我们提出了一种新的神经符号体系结构,该体系结构利用本体论推理的力量来构建用于LLM微调的任务和领域特定语料库。

1 引言

2 微调LLM的神经符号管道

3 通过概念证明进行初步验证

4 结论

根据计算语言学协会欧洲分会最近发表的一项工作,预先训练的语言模型还不能进行演绎推理:它们仍然不能概括逻辑规则,即使提供了规则,LLM也倾向于忘记以前推断的事实。虽然Transformer架构和推理方法之间还没有进行广泛的比较,但我们的工作表明,通过产生微调语料库作为本体论推理的副产品,可以明显提高领域特定NLP任务的LLM性能。我们利用我们在演绎推理方面的经验,为在企业知识图谱上进行推理的神经符号平台迈出了第一步。

相关推荐
小鸡吃米…6 小时前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫7 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)7 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan7 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维7 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS7 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd7 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
水如烟8 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然8 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~8 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1