RATE:基于LLM的检索增强生成技术提取管道

RATE:基于LLM的检索增强生成技术提取管道

在技术变革的时代,技术图谱对提升决策制定起着关键作用。这些图谱高度依赖于自动化的技术提取方法。本文介绍了检索增强技术提取(RATE),一种基于大型语言模型(LLM)的从科学文献中自动提取技术的管道。

RATE将检索增强生成(RAG)与基于LLM的多定义验证相结合。这种混合方法在候选生成阶段实现高召回率,同时在候选筛选阶段保持高精确度。虽然该管道设计为通用且广泛适用,但我们以678篇聚焦脑机接口(BCI)和扩展现实(XR)的研究文章作为案例展示其应用。

经RATE验证的技术术语被映射到共现网络中,揭示了研究领域的主题集群和结构特征。为评估效果,专家们人工标注了70篇随机选取文章中的技术术语作为黄金标准数据集,并采用基于BERT的技术提取模型作为对比方法。RATE取得91.27%的F1分数,显著优于BERT模型的53.73%。

我们的研究结果凸显了基于定义驱动的LLM方法在技术提取和映射方面的潜力,同时为BCI-XR领域的新兴趋势提供了新见解。源代码可通过此链接获取:https://...

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

公众号二维码

相关推荐
腾讯云开发者3 分钟前
当10年架构师拿起AI:不是写不动了,是写得太快了
人工智能
小马过河R13 分钟前
RAG检索增强生成:通过重排序提升AI信息检索精准度
人工智能·语言模型
不惑_14 分钟前
通俗理解卷积神经网络
人工智能·windows·python·深度学习·机器学习
rayufo33 分钟前
自定义数据在深度学习中的应用方法
人工智能·深度学习
梦帮科技35 分钟前
量子计算+AI:下一代智能的终极形态?(第一部分)
人工智能·python·神经网络·深度优先·量子计算·模拟退火算法
山海青风40 分钟前
藏文TTS介绍:6 MMS 项目的多语言 TTS
人工智能·python·神经网络·音视频
人工智能培训42 分钟前
DNN案例一步步构建深层神经网络(3)
人工智能·深度学习·神经网络·大模型·dnn·具身智能·智能体
武当王丶也1 小时前
从零构建基于 RAG 的 AI 对话系统:Ollama + Python + 知识库实战
人工智能·python
dixiuapp1 小时前
设备维修记录系统,从数据沉淀到价值挖掘的跃迁
大数据·数据库·人工智能
Doctor_Strange_DML1 小时前
一个简单有效的数据增强技术:data3
人工智能·计算机视觉