RATE:基于LLM的检索增强生成技术提取管道

RATE:基于LLM的检索增强生成技术提取管道

在技术变革的时代,技术图谱对提升决策制定起着关键作用。这些图谱高度依赖于自动化的技术提取方法。本文介绍了检索增强技术提取(RATE),一种基于大型语言模型(LLM)的从科学文献中自动提取技术的管道。

RATE将检索增强生成(RAG)与基于LLM的多定义验证相结合。这种混合方法在候选生成阶段实现高召回率,同时在候选筛选阶段保持高精确度。虽然该管道设计为通用且广泛适用,但我们以678篇聚焦脑机接口(BCI)和扩展现实(XR)的研究文章作为案例展示其应用。

经RATE验证的技术术语被映射到共现网络中,揭示了研究领域的主题集群和结构特征。为评估效果,专家们人工标注了70篇随机选取文章中的技术术语作为黄金标准数据集,并采用基于BERT的技术提取模型作为对比方法。RATE取得91.27%的F1分数,显著优于BERT模型的53.73%。

我们的研究结果凸显了基于定义驱动的LLM方法在技术提取和映射方面的潜力,同时为BCI-XR领域的新兴趋势提供了新见解。源代码可通过此链接获取:https://...

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

公众号二维码

相关推荐
Java.熵减码农9 小时前
长文拆解 Karpathy 的 AI 知识库搭建术(Obsidian + Claude Code 完整指南)
人工智能·chatgpt
初圣魔门首席弟子9 小时前
深度学习复习笔记|多层感知机 (MLP):原理 + 从零实现 + 简洁实现
人工智能·笔记·深度学习
Coovally AI模型快速验证9 小时前
YOLO26仓储检测实战:物体定位+有向边界框+姿态估计+实例分割,一个模型盯住整个仓库
大数据·人工智能·3d·视觉检测·工业质检
涛声依旧-底层原理研究所9 小时前
Qwen2.5模型加载与推理实战
人工智能·python
Mr数据杨9 小时前
花卉图像分类在植物识别与生态监测中的应用
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle
Codigger官方9 小时前
Phoenix 语言起步指南:开启 Polyglot Singularity 之门
开发语言·人工智能·程序人生
ting94520009 小时前
动手学深度学习(PyTorch版)深度详解(5):深度学习计算核心 —— 卷积操作、填充步幅、汇聚层与 LeNet 完整精讲
人工智能·pytorch·深度学习
miaowu3579 小时前
观点 | 70%的AI 市场将来自于垂直Agent
人工智能
时序之心9 小时前
时序前沿:CNN结合Transformer,通过通道-头绑定实现多变量时序插补!
人工智能·transformer·时间序列
SunnyDays10119 小时前
如何使用 Python 将 PDF 转换为 TIFF 或将 TIFF 转换为 PDF
人工智能·python·pdf