论文信息
论文标题: Guiding Generative Storytelling with Knowledge Graphs - International Journal of Human--Computer Interaction 2025
论文作者: Zhijun Pan et al. - University of the Arts London
论文链接: https://www.tandfonline.com/doi/full/10.1080/10447318.2025.2603634#abstract
研究背景
虽然 LLM(如 GPT-4、Llama)在自动化故事生成方面潜力巨大,但仍面临两大挑战:
- 长篇连贯性不足:随着故事篇幅增长,模型容易出现事实幻觉、逻辑矛盾(如地理位置错误、角色行为前后不一) 。
- 用户控制力有限:用户难以通过直观方式精确干预故事走向,通常需要复杂的提示词工程(Prompt Engineering) 。
核心贡献
论文提出了一种KG辅助的故事生成流水线,其核心是将非结构化的叙事逻辑转化为结构化的知识条目(节点、关系、描述) 。

系统架构(Pipeline)主要分为三个阶段:
- 初始化(Initialization): 根据用户输入的标题、背景和角色,提取并清洗初始知识图谱 。
- 场景生成(Scene Generation): 在生成第 i i i 个场景时,系统只查询与当前情节相关的 KG 子集,以减少 Token 消耗并增强聚焦度 。
- 动态更新与编辑(Update & Edit): 每生成一个新场景,系统会自动更新图谱中的节点属性和关系 。
- 同时,系统支持"编辑模式",允许用户手动修改图谱,从而即时改写后续情节 。
实验设计
- 参与者: 15 位具有高等教育或 AI 叙事背景的专业人士 。
- 实验设置:
- 阶段 1(编辑器关闭): 对比评估有无 KG 辅助生成的两篇故事(盲测),探究其对叙事质量的影响(RQ1) 。
- 阶段 2(编辑器开启): 用户通过编辑 KG 来控制故事发展,评估其对创作自主权的影响(RQ2) 。
- 模型: 为了便于消融研究和透明度分析,实验采用了 Llama 3.1 8B 这种轻量化开源模型,而非封闭的 GPT 模型 。
研究发现
- RQ1:KG 对质量的提升
- 在全行业/全题材的统计中,KG 对故事质量的整体提升在统计学上并不总是显著 。
- 但关键点在于: 在**动作导向(Action-oriented)**或逻辑严密的叙事(如结构化较强的类型片)中,KG 显著改善了事实一致性和情节逻辑 。
- RQ2:用户控制与互动性
- 编辑模式大幅增加了用户的"控制感"和"创作主体意识" 。
- 用户普遍认为通过结构化图谱修改故事比调整提示词更直观、更有趣,增加了创作过程中的"游戏化"体验 。
总结
- 这篇论文通过将 RAG(检索增强生成) 的理念引入创意写作,证明了结构化知识在弥补模型"长程记忆"缺陷方面的有效性 。
- 查询 kg 的范围限制在当前的 章节是否是最佳的,如何回溯过去的内容?
- 如何评估生成的内容的质量,与现实文本的区别。
- 是否有真实的demo?