
大型语言模型(LLM)能够辅助化学合成路径规划,但标准提示方法常产生虚构或过时的建议。

本研究通过将反应路径检索构建为"Text2Cypher"(自然语言转图谱查询)生成问题,探究LLM与反应知识图谱的交互机制,并定义了单步与多步检索任务。

我们比较了零样本提示与采用静态示例、随机示例及嵌入向量对齐示例的单样本提示方法,同时评估了基于清单的验证/修正循环机制。
通过对查询有效性和检索准确率的系统评估,我们发现采用对齐示例的单样本提示策略始终表现最优。

清单式自我修正循环主要提升零样本场景下的查询可执行性,而在已有优质示例的情况下对检索效果的提升有限。

本研究提供了一套可复现的Text2Cypher评估框架,以推动基于知识图谱的LLM在合成规划领域的进一步发展。代码已开源:https://github.com/Intelligent-molecular-systems/KG-LLM-Synthesis-Retrieval