将大型语言模型建立在反应知识图谱中以进行合成检索

renhongxia12026-01-28 16:53

大型语言模型（LLM）能够辅助化学合成路径规划，但标准提示方法常产生虚构或过时的建议。

本研究通过将反应路径检索构建为"Text2Cypher"（自然语言转图谱查询）生成问题，探究LLM与反应知识图谱的交互机制，并定义了单步与多步检索任务。

我们比较了零样本提示与采用静态示例、随机示例及嵌入向量对齐示例的单样本提示方法，同时评估了基于清单的验证/修正循环机制。

通过对查询有效性和检索准确率的系统评估，我们发现采用对齐示例的单样本提示策略始终表现最优。

清单式自我修正循环主要提升零样本场景下的查询可执行性，而在已有优质示例的情况下对检索效果的提升有限。

本研究提供了一套可复现的Text2Cypher评估框架，以推动基于知识图谱的LLM在合成规划领域的进一步发展。代码已开源：https://github.com/Intelligent-molecular-systems/KG-LLM-Synthesis-Retrieval