将大型语言模型建立在反应知识图谱中以进行合成检索

大型语言模型(LLM)能够辅助化学合成路径规划,但标准提示方法常产生虚构或过时的建议。

本研究通过将反应路径检索构建为"Text2Cypher"(自然语言转图谱查询)生成问题,探究LLM与反应知识图谱的交互机制,并定义了单步与多步检索任务。

我们比较了零样本提示与采用静态示例、随机示例及嵌入向量对齐示例的单样本提示方法,同时评估了基于清单的验证/修正循环机制。

通过对查询有效性和检索准确率的系统评估,我们发现采用对齐示例的单样本提示策略始终表现最优。

清单式自我修正循环主要提升零样本场景下的查询可执行性,而在已有优质示例的情况下对检索效果的提升有限。

本研究提供了一套可复现的Text2Cypher评估框架,以推动基于知识图谱的LLM在合成规划领域的进一步发展。代码已开源:https://github.com/Intelligent-molecular-systems/KG-LLM-Synthesis-Retrieval

相关推荐
leo在掘金1 小时前
从DeepSeek 510亿融资到GitHub 33K Star开源项目:这周的技术生态发生了什么?
人工智能
小姜前线技术2 小时前
AI流式渲染打字机效果抖动?节流方案踩坑实录
人工智能
用户018349301692 小时前
AI对话状态管理:useReducer还是XState
人工智能
先锋部队2 小时前
给AI对话加「停止生成」按钮:abort SSE实战
人工智能
新新技术迷2 小时前
移动端H5接AI对话的坑:键盘顶起与滚动到底
人工智能
aqi005 小时前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能·python·大模型·ai编程·ai应用
用户5191495848456 小时前
libcurl Headers API 释放后重利用漏洞:跨请求复用头句柄导致堆内存安全风险
人工智能·aigc
踩蚂蚁6 小时前
自定义语音唤醒词:从训练到部署的完整链路实践
人工智能