Apache AGE 实战进阶：从图查询到知识图谱+LLM知识问答全流程

在关联数据密集型场景中，传统关系型数据库的多表关联查询效率瓶颈日益凸显。Apache AGE 作为 PostgreSQL 的原生图数据库扩展，实现了关系型数据与图数据的无缝融合，无需独立部署图数据库即可享受高效的关联分析能力。本文从 Apache AGE 核心价值切入，通过两个实战案例（校园社交网络图查询、企业知识图谱构建）完整覆盖图数据建模、插入、核心查询全流程；在此基础上，进一步扩展 LLM 与知识图谱的融合方案，实现智能知识问答功能。全文提供可直接复用的代码示例与配置步骤，助力开发者快速掌握 Apache AGE 的落地应用及进阶拓展能力。

一、引言：Apache AGE 为何成为关联数据分析优选？

随着社交网络、知识图谱、企业风控等场景的发展，数据间的关联关系愈发复杂，传统关系型数据库依赖 JOIN 操作的查询方式在多实体关联分析中效率低下、代码冗余。Apache AGE（Apache Graph Extension）作为 PostgreSQL 的开源图数据库扩展，基于 Labeled Property Graph（带标签属性图）模型，将图数据库的核心能力（节点、边、路径查询）融入 PostgreSQL 生态。

相比 Neo4j 等独立图数据库，Apache AGE 具备三大核心优势：一是架构极简，可复用现有 PostgreSQL 的事务、权限、备份能力，降低运维成本；二是多模型兼容，支持 SQL 操作关系数据、Cypher 操作图数据，无需跨数据库切换；三是生态完善，无缝对接 Python、Java 等主流开发语言及 PostgreSQL 周边工具。本文将通过实战案例验证其价值，并探索与 LLM 融合实现智能问答的进阶玩法。

二、Apache AGE 核心概念速览（新手必备）

在开展实战前，先明确 Apache AGE 的核心组成要素，为后续案例落地奠定基础：

节点（Node）：代表实体（如学生、企业、产品），可通过标签（Label）区分类型（如 :Student、:Enterprise），包含多个键值对属性（如 id、name、age）。
边（Edge）：代表实体间的关系（如好友、任职、合作），具有明确方向性（如 Person→Enterprise），支持添加属性描述关系细节（如任职年限、合作领域）。
图（Graph）：节点与边的集合，一个 PostgreSQL 数据库可创建多个图实现数据隔离（如校园社交图、企业知识图谱）。
Cypher 语法 ：图查询专用语言，通过简洁的模式匹配实现关联查询，如 (a:Student)-[:FRIEND]-(b:Student) 可匹配学生 a 的所有好友 b。

三、环境搭建：PostgreSQL + Apache AGE 部署（Ubuntu 22.04）

本节提供标准化部署步骤，确保环境一致性，后续案例均基于此环境验证。

3.1 安装 PostgreSQL 15

bash 复制代码

# 1. 更新软件源并安装 PostgreSQL 15
sudo apt update
sudo apt install postgresql-15 postgresql-client-15 postgresql-server-dev-15 -y

# 2. 启动并设置开机自启
sudo systemctl start postgresql
sudo systemctl enable postgresql

# 3. 验证安装（默认创建 postgres 超级用户）
sudo -u postgres psql
# 出现 psql 终端提示符即安装成功，输入 \q 退出
\q

3.2 安装 Apache AGE 1.3.0（适配 PostgreSQL 15）

bash 复制代码

# 1. 安装依赖工具
sudo apt install git gcc make libreadline-dev zlib1g-dev -y

# 2. 克隆源码并切换到稳定版本
git clone https://github.com/apache/age.git
cd age
git checkout release/1.3.0

# 3. 编译安装（指定 PostgreSQL 15 配置路径）
make PG_CONFIG=/usr/lib/postgresql/15/bin/pg_config
sudo make PG_CONFIG=/usr/lib/postgresql/15/bin/pg_config install

# 4. 验证安装（查看扩展文件）
ls /usr/share/postgresql/15/extension/ | grep age
# 输出 age.control、age--1.3.0.sql 等文件即安装成功

3.3 启用 AGE 扩展（数据库级配置）

sql 复制代码

# 1. 连接 PostgreSQL 并创建专用数据库
sudo -u postgres psql
CREATE DATABASE age_workshop;  --  workshop 数据库
\c age_workshop  -- 切换到目标数据库

# 2. 启用 AGE 扩展（需超级用户权限）
CREATE EXTENSION age;

# 3. 加载扩展并配置搜索路径（每次连接数据库后需执行）
LOAD 'age';
SET search_path = ag_catalog, "$user", public;

# 4. 验证扩展
\dx
# 输出列表中包含 age 即启用成功

四、实战案例一：校园社交网络图查询

本案例聚焦校园场景，构建包含学生、社团、课程三类实体的社交网络，实现好友查询、共同好友挖掘、社团成员关联等核心需求，覆盖图数据建模与基础查询能力。

4.1 案例需求拆解

查询指定学生的所有好友；
查询两名学生的共同好友；
查询学生加入的社团及社团成员；
查询选修同一门课程的学生关联；
查询两名学生间的最短社交路径。

4.2 数据建模设计

4.2.1 实体（节点）设计

节点标签	属性	示例数据
:Student	id(主键)、name、age、major	(1, 张三, 20, 计算机)、(2, 李四, 21, 数学)、(3, 王五, 20, 计算机)、(4, 赵六, 22, 电子信息)
:Club	id(主键)、name、type、found_time	(1, 编程社, 学术, 2020-09-01)、(2, 篮球社, 体育, 2019-09-01)
:Course	id(主键)、name、credit、teacher	(1, 数据库原理, 3, 李老师)、(2, 机器学习, 4, 王老师)、(3, 篮球战术, 2, 张老师)

4.2.2 关系（边）设计

边标签	方向	属性	示例关系
:FRIEND	Student ↔ Student（双向）	create_time	张三↔李四（2024-02-15）、张三↔王五（2024-01-10）、李四↔赵六（2024-03-01）
:JOIN	Student → Club	join_time、role	张三→编程社（2024-03-10，成员）、王五→编程社（2024-03-15，成员）、李四→篮球社（2024-02-20，社长）
:ENROLL	Student → Course	enroll_time	张三→数据库原理（2024-02-01）、张三→机器学习（2024-02-01）、李四→机器学习（2024-02-01）

4.3 实战操作：数据插入与核心查询

4.3.1 步骤 1：创建校园社交图

sql 复制代码

# 创建名为 campus_social 的图（图名自定义，实现数据隔离）
SELECT create_graph('campus_social');

4.3.2 步骤 2：插入节点与边数据

sql 复制代码

# 1. 插入节点数据（Student、Club、Course）
SELECT * FROM ag_catalog.cypher('campus_social', $$
CREATE 
  -- 学生节点
  (s1:Student {id:1, name:'张三', age:20, major:'计算机'}),
  (s2:Student {id:2, name:'李四', age:21, major:'数学'}),
  (s3:Student {id:3, name:'王五', age:20, major:'计算机'}),
  (s4:Student {id:4, name:'赵六', age:22, major:'电子信息'}),
  -- 社团节点
  (c1:Club {id:1, name:'编程社', type:'学术', found_time:'2020-09-01'}),
  (c2:Club {id:2, name:'篮球社', type:'体育', found_time:'2019-09-01'}),
  -- 课程节点
  (co1:Course {id:1, name:'数据库原理', credit:3, teacher:'李老师'}),
  (co2:Course {id:2, name:'机器学习', credit:4, teacher:'王老师'}),
  (co3:Course {id:3, name:'篮球战术', credit:2, teacher:'张老师'})
$$) AS (result agtype);

# 2. 插入边数据（FRIEND、JOIN、ENROLL）
SELECT * FROM ag_catalog.cypher('campus_social', $$
-- 好友关系（双向）
MATCH (s1:Student {id:1}), (s2:Student {id:2}) CREATE (s1)-[:FRIEND {create_time:'2024-02-15'}]-(s2);
MATCH (s1:Student {id:1}), (s3:Student {id:3}) CREATE (s1)-[:FRIEND {create_time:'2024-01-10'}]-(s3);
MATCH (s2:Student {id:2}), (s4:Student {id:4}) CREATE (s2)-[:FRIEND {create_time:'2024-03-01'}]-(s4);
-- 加入社团关系
MATCH (s1:Student {id:1}), (c1:Club {id:1}) CREATE (s1)-[:JOIN {join_time:'2024-03-10', role:'成员'}]->(c1);
MATCH (s3:Student {id:3}), (c1:Club {id:1}) CREATE (s3)-[:JOIN {join_time:'2024-03-15', role:'成员'}]->(c1);
MATCH (s2:Student {id:2}), (c2:Club {id:2}) CREATE (s2)-[:JOIN {join_time:'2024-02-20', role:'社长'}]->(c2);
-- 选修课程关系
MATCH (s1:Student {id:1}), (co1:Course {id:1}) CREATE (s1)-[:ENROLL {enroll_time:'2024-02-01'}]->(co1);
MATCH (s1:Student {id:1}), (co2:Course {id:2}) CREATE (s1)-[:ENROLL {enroll_time:'2024-02-01'}]->(co2);
MATCH (s2:Student {id:2}), (co2:Course {id:2}) CREATE (s2)-[:ENROLL {enroll_time:'2024-02-01'}]->(co2);
MATCH (s2:Student {id:2}), (co3:Course {id:3}) CREATE (s2)-[:ENROLL {enroll_time:'2024-02-01'}]->(co3);
MATCH (s3:Student {id:3}), (co1:Course {id:1}) CREATE (s3)-[:ENROLL {enroll_time:'2024-02-01'}]->(co1);
$$) AS (result agtype);

4.3.3 步骤 3：核心需求查询实现

sql 复制代码

# 1. 查询张三的所有好友
SELECT * FROM ag_catalog.cypher('campus_social', $$
MATCH (s:Student {name:'张三'})-[:FRIEND]-(friend:Student)
RETURN friend.id AS 好友ID, friend.name AS 好友姓名, friend.major AS 专业
$$) AS (friend_id int, friend_name text, major text);
-- 预期结果：返回李四、王五的信息

# 2. 查询张三和李四的共同好友
SELECT * FROM ag_catalog.cypher('campus_social', $$
MATCH (s1:Student {name:'张三'})-[:FRIEND]-(common:Student)-[:FRIEND]-(s2:Student {name:'李四'})
RETURN common.name AS 共同好友姓名
$$) AS (common_friend text);
-- 预期结果：无（张三好友为李四、王五；李四好友为张三、赵六，无交集）

# 3. 查询张三加入的社团及社团成员
SELECT * FROM ag_catalog.cypher('campus_social', $$
MATCH (s:Student {name:'张三'})-[:JOIN]->(club:Club)<-[:JOIN]-(member:Student)
RETURN club.name AS 社团名称, member.name AS 成员姓名, member.role AS 角色
$$) AS (club_name text, member_name text, role text);
-- 预期结果：编程社，成员张三、王五

# 4. 查询选修《机器学习》的学生
SELECT * FROM ag_catalog.cypher('campus_social', $$
MATCH (s:Student)-[:ENROLL]->(co:Course {name:'机器学习'})
RETURN s.name AS 学生姓名, s.major AS 专业, co.credit AS 学分
$$) AS (student_name text, major text, credit int);
-- 预期结果：张三（计算机，4学分）、李四（数学，4学分）

# 5. 查询张三到赵六的最短社交路径
SELECT * FROM ag_catalog.cypher('campus_social', $$
MATCH path = shortestPath((s1:Student {name:'张三'})-[*1..5]-(s2:Student {name:'赵六'}))
RETURN path
$$) AS (path agtype);
-- 预期结果：张三-[:FRIEND]-李四-[:FRIEND]-赵六（2步路径）

五、实战案例二：企业知识图谱构建与查询

知识图谱是 Apache AGE 的核心进阶场景，本案例聚焦科技企业领域，构建"企业-产品-行业-人物"四维知识图谱，实现企业关联信息检索、行业聚合分析等需求，重点体现图数据库在复杂实体关联中的优势。

5.1 案例需求拆解

查询指定企业的核心产品与所属行业；
查询某人物的任职企业及职位信息；
查询同一行业的企业列表；
挖掘企业间的间接关联路径（如通过行业、合作关系）。

5.2 数据建模设计（核心选中内容整理）

5.2.1 实体（节点）设计

节点标签	属性	示例数据
:Enterprise	id(主键)、name、establish_year、scale	(1, 字节跳动, 2012, 大型)、(2, 阿里巴巴, 1999, 大型)、(3, 旷视科技, 2011, 中型)、(4, 商汤科技, 2014, 中型)
:Product	id(主键)、name、type、launch_year	(1, 抖音, 短视频, 2016)、(2, 淘宝, 电商平台, 2003)、(3, 人脸识别系统, AI 解决方案, 2015)、(4, 智能云, 云计算服务, 2018)
:Industry	id(主键)、name、description	(1, 互联网娱乐, 涵盖短视频、游戏等)、(2, 电子商务, 线上交易平台)、(3, 人工智能, 含计算机视觉、大模型等)、(4, 云计算, 基础算力服务)
:Person	id(主键)、name、age、specialty	(1, 张一鸣, 40, 互联网产品)、(2, 马云, 59, 电子商务)、(3, 印奇, 36, 计算机视觉)、(4, 徐立, 41, 人工智能)

5.2.2 关系（边）设计

边标签	方向	属性	示例关系
:HAS_PRODUCT	Enterprise → Product	importance(重要性：高/中/低)	字节跳动→抖音（高）、阿里巴巴→淘宝（高）、旷视科技→人脸识别系统（高）、阿里巴巴→智能云（高）
:BELONG_TO	Enterprise → Industry	core_business(是否核心业务：是/否)	字节跳动→互联网娱乐（是）、阿里巴巴→电子商务（是）、旷视科技→人工智能（是）、阿里巴巴→云计算（是）
:HOLD_POSITION	Person → Enterprise	position(职位)、tenure(任职年限)	张一鸣→字节跳动（创始人，10年+）、马云→阿里巴巴（创始人，20年+）、印奇→旷视科技（创始人，12年+）、徐立→商汤科技（创始人，9年+）
:COOPERATE	Enterprise ↔ Enterprise	coop_field(合作领域)、start_year(合作起始年)	阿里巴巴↔商汤科技（AI 零售，2020）、字节跳动↔旷视科技（智能安防，2019）

5.3 实战操作：知识图谱构建与查询

5.3.1 步骤 1：创建企业知识图谱

sql 复制代码

# 创建名为 enterprise_knowledge 的知识图谱
SELECT create_graph('enterprise_knowledge');

5.3.2 步骤 2：插入节点与边数据

sql 复制代码

# 1. 插入节点数据
SELECT * FROM ag_catalog.cypher('enterprise_knowledge', $$
CREATE 
  -- 企业节点
  (e1:Enterprise {id:1, name:'字节跳动', establish_year:2012, scale:'大型'}),
  (e2:Enterprise {id:2, name:'阿里巴巴', establish_year:1999, scale:'大型'}),
  (e3:Enterprise {id:3, name:'旷视科技', establish_year:2011, scale:'中型'}),
  (e4:Enterprise {id:4, name:'商汤科技', establish_year:2014, scale:'中型'}),
  -- 产品节点
  (p1:Product {id:1, name:'抖音', type:'短视频', launch_year:2016}),
  (p2:Product {id:2, name:'淘宝', type:'电商平台', launch_year:2003}),
  (p3:Product {id:3, name:'人脸识别系统', type:'AI 解决方案', launch_year:2015}),
  (p4:Product {id:4, name:'智能云', type:'云计算服务', launch_year:2018}),
  -- 行业节点
  (i1:Industry {id:1, name:'互联网娱乐', description:'涵盖短视频、游戏等'}),
  (i2:Industry {id:2, name:'电子商务', description:'线上交易平台'}),
  (i3:Industry {id:3, name:'人工智能', description:'含计算机视觉、大模型等'}),
  (i4:Industry {id:4, name:'云计算', description:'基础算力服务'}),
  -- 人物节点
  (pe1:Person {id:1, name:'张一鸣', age:40, specialty:'互联网产品'}),
  (pe2:Person {id:2, name:'马云', age:59, specialty:'电子商务'}),
  (pe3:Person {id:3, name:'印奇', age:36, specialty:'计算机视觉'}),
  (pe4:Person {id:4, name:'徐立', age:41, specialty:'人工智能'})
$$) AS (result agtype);

# 2. 插入边数据
SELECT * FROM ag_catalog.cypher('enterprise_knowledge', $$
-- 企业-产品关系
MATCH (e1:Enterprise {id:1}), (p1:Product {id:1}) CREATE (e1)-[:HAS_PRODUCT {importance:'高'}]->(p1);
MATCH (e2:Enterprise {id:2}), (p2:Product {id:2}) CREATE (e2)-[:HAS_PRODUCT {importance:'高'}]->(p2);
MATCH (e3:Enterprise {id:3}), (p3:Product {id:3}) CREATE (e3)-[:HAS_PRODUCT {importance:'高'}]->(p3);
MATCH (e2:Enterprise {id:2}), (p4:Product {id:4}) CREATE (e2)-[:HAS_PRODUCT {importance:'高'}]->(p4);

-- 企业-行业关系
MATCH (e1:Enterprise {id:1}), (i1:Industry {id:1}) CREATE (e1)-[:BELONG_TO {core_business:'是'}]->(i1);
MATCH (e2:Enterprise {id:2}), (i2:Industry {id:2}) CREATE (e2)-[:BELONG_TO {core_business:'是'}]->(i2);
MATCH (e3:Enterprise {id:3}), (i3:Industry {id:3}) CREATE (e3)-[:BELONG_TO {core_business:'是'}]->(i3);
MATCH (e2:Enterprise {id:2}), (i4:Industry {id:4}) CREATE (e2)-[:BELONG_TO {core_business:'是'}]->(i4);

-- 人物-企业任职关系
MATCH (pe1:Person {id:1}), (e1:Enterprise {id:1}) CREATE (pe1)-[:HOLD_POSITION {position:'创始人', tenure:'10年+'}]->(e1);
MATCH (pe2:Person {id:2}), (e2:Enterprise {id:2}) CREATE (pe2)-[:HOLD_POSITION {position:'创始人', tenure:'20年+'}]->(e2);
MATCH (pe3:Person {id:3}), (e3:Enterprise {id:3}) CREATE (pe3)-[:HOLD_POSITION {position:'创始人', tenure:'12年+'}]->(e3);
MATCH (pe4:Person {id:4}), (e4:Enterprise {id:4}) CREATE (pe4)-[:HOLD_POSITION {position:'创始人', tenure:'9年+'}]->(e4);

-- 企业-企业合作关系（双向）
MATCH (e2:Enterprise {id:2}), (e4:Enterprise {id:4}) CREATE (e2)-[:COOPERATE {coop_field:'AI 零售', start_year:2020}]-(e4);
MATCH (e1:Enterprise {id:1}), (e3:Enterprise {id:3}) CREATE (e1)-[:COOPERATE {coop_field:'智能安防', start_year:2019}]-(e3);
$$) AS (result agtype);

5.3.3 步骤 3：核心需求查询实现

sql 复制代码

# 1. 查询阿里巴巴的核心产品与所属行业
SELECT * FROM ag_catalog.cypher('enterprise_knowledge', $$
MATCH (e:Enterprise {name:'阿里巴巴'})-[:HAS_PRODUCT]-(p:Product),
      (e)-[:BELONG_TO]-(i:Industry)
RETURN e.name AS 企业名称, p.name AS 产品名称, p.type AS 产品类型, i.name AS 所属行业
$$) AS (enterprise_name text, product_name text, product_type text, industry_name text);
-- 预期结果：淘宝（电商平台，电子商务）、智能云（云计算服务，云计算）

# 2. 查询张一鸣的任职企业信息
SELECT * FROM ag_catalog.cypher('enterprise_knowledge', $$
MATCH (pe:Person {name:'张一鸣'})-[:HOLD_POSITION]-(e:Enterprise)
RETURN pe.name AS 姓名, e.name AS 企业名称, e.establish_year AS 成立年份, pe.specialty AS 专长
$$) AS (name text, enterprise_name text, establish_year int, specialty text);
-- 预期结果：张一鸣，字节跳动，2012，互联网产品

# 3. 查询人工智能行业的所有企业
SELECT * FROM ag_catalog.cypher('enterprise_knowledge', $$
MATCH (i:Industry {name:'人工智能'})<-[:BELONG_TO]-(e:Enterprise)
RETURN i.name AS 行业名称, e.name AS 企业名称, e.scale AS 企业规模
$$) AS (industry_name text, enterprise_name text, scale text);
-- 预期结果：人工智能，旷视科技（中型）、商汤科技（中型）

# 4. 查询字节跳动与商汤科技的间接关联路径
SELECT * FROM ag_catalog.cypher('enterprise_knowledge', $$
MATCH path = shortestPath((e1:Enterprise {name:'字节跳动'})-[*1..4]-(e2:Enterprise {name:'商汤科技'}))
RETURN path
$$) AS (path agtype);
-- 预期结果：字节跳动-[:COOPERATE]-旷视科技-[:BELONG_TO]-人工智能-[:BELONG_TO]-商汤科技（3步路径）

六、进阶扩展：Apache AGE + LLM 实现智能知识问答

知识图谱存储了结构化的实体关联信息，但需通过 Cypher 语法查询，门槛较高。结合 LLM（大语言模型）可实现自然语言到 Cypher 语句的自动转换，让非技术人员也能通过自然语言进行知识问答。本节以"企业知识图谱"为基础，实现 LLM 驱动的智能问答功能。

6.1 核心原理

核心流程为：用户输入自然语言问题 → LLM 将问题转换为符合要求的 Cypher 语句 → 执行 Cypher 语句查询知识图谱 → 将查询结果格式化后返回给用户。其中，关键是引导 LLM 生成正确的 Cypher 语句，需为 LLM 提供清晰的知识图谱 schema（节点、边、属性信息）。

6.2 实现步骤（基于 Python + OpenAI API）

6.2.1 环境准备

bash 复制代码

# 安装依赖包
pip install openai psycopg2-binary python-dotenv

6.2.2 配置文件（.env）

ini 复制代码

# OpenAI API 配置
OPENAI_API_KEY=your-api-key
MODEL_NAME=gpt-3.5-turbo

# PostgreSQL 配置（AGE 所在数据库）
DB_HOST=localhost
DB_PORT=5432
DB_NAME=age_workshop
DB_USER=postgres
DB_PASSWORD=your-db-password

6.2.3 核心代码实现

python 复制代码

import os
import psycopg2
from openai import OpenAI
from dotenv import load_dotenv

# 加载配置文件
load_dotenv()

# 1. 初始化 OpenAI 客户端
client = OpenAI(
    api_key=os.getenv("OPENAI_API_KEY"),
    model=os.getenv("MODEL_NAME")
)

# 2. 连接 PostgreSQL（AGE 数据库）
def connect_db():
    conn = psycopg2.connect(
        host=os.getenv("DB_HOST"),
        port=os.getenv("DB_PORT"),
        dbname=os.getenv("DB_NAME"),
        user=os.getenv("DB_USER"),
        password=os.getenv("DB_PASSWORD")
    )
    # 启用 AGE 扩展
    cur = conn.cursor()
    cur.execute("LOAD 'age';")
    cur.execute("SET search_path = ag_catalog, \"$user\", public;")
    conn.commit()
    return conn, cur

# 3. LLM 生成 Cypher 语句
def generate_cypher(question, graph_name="enterprise_knowledge"):
    # 提供知识图谱 Schema 给 LLM，引导正确生成 Cypher
    schema_info = """
    知识图谱名称：enterprise_knowledge
    节点类型及属性：
    1. :Enterprise(id, name, establish_year, scale)
    2. :Product(id, name, type, launch_year)
    3. :Industry(id, name, description)
    4. :Person(id, name, age, specialty)
    边类型及方向：
    1. :HAS_PRODUCT（Enterprise→Product，属性：importance）
    2. :BELONG_TO（Enterprise→Industry，属性：core_business）
    3. :HOLD_POSITION（Person→Enterprise，属性：position, tenure）
    4. :COOPERATE（Enterprise↔Enterprise，属性：coop_field, start_year）
    
    要求：
    1. 仅返回 Cypher 语句，不包含任何解释性文字；
    2. 查询的图名称必须为 enterprise_knowledge；
    3. 确保节点标签、边标签、属性名与上述 Schema 一致；
    4. 返回结果字段使用中文别名，便于后续展示。
    """
    
    prompt = f"""
    请根据以下知识图谱 Schema，将用户问题转换为 Cypher 语句：
    {schema_info}
    用户问题：{question}
    """
    
    response = client.chat.completions.create(
        model=os.getenv("MODEL_NAME"),
        messages=[{"role": "user", "content": prompt}]
    )
    return response.choices[0].message.content.strip()

# 4. 执行 Cypher 并返回结果
def execute_cypher(cypher):
    conn, cur = connect_db()
    try:
        cur.execute(f"SELECT * FROM ag_catalog.cypher('enterprise_knowledge', $$ {cypher} $$) AS result;")
        columns = [desc[0] for desc in cur.description]
        results = [dict(zip(columns, row)) for row in cur.fetchall()]
        return results
    except Exception as e:
        return {"error": str(e)}
    finally:
        cur.close()
        conn.close()

# 5. 整合流程：自然语言问答
def knowledge_qa(question):
    # 生成 Cypher
    cypher = generate_cypher(question)
    print(f"生成的 Cypher 语句：{cypher}")
    # 执行查询
    results = execute_cypher(cypher)
    # 格式化结果返回
    if "error" in results:
        return f"查询失败：{results['error']}"
    elif not results:
        return "未查询到相关信息"
    else:
        return "\n".join([str(item) for item in results])

# 测试问答功能
if __name__ == "__main__":
    while True:
        question = input("请输入问题（输入 'exit' 退出）：")
        if question.lower() == "exit":
            break
        answer = knowledge_qa(question)
        print(f"回答：{answer}\n")

6.2.4 功能测试

运行上述代码后，输入自然语言问题进行测试：

text 复制代码

请输入问题（输入 'exit' 退出）：阿里巴巴有哪些核心产品？
生成的 Cypher 语句：MATCH (e:Enterprise {name:'阿里巴巴'})-[:HAS_PRODUCT {importance:'高'}]-(p:Product) RETURN p.name AS 核心产品名称, p.type AS 产品类型
回答：
{'核心产品名称': '淘宝', '产品类型': '电商平台'}
{'核心产品名称': '智能云', '产品类型': '云计算服务'}

请输入问题（输入 'exit' 退出）：张一鸣创办了哪家企业？
生成的 Cypher 语句：MATCH (pe:Person {name:'张一鸣'})-[:HOLD_POSITION {position:'创始人'}]-(e:Enterprise) RETURN e.name AS 企业名称, e.establish_year AS 成立年份
回答：
{'企业名称': '字节跳动', '成立年份': 2012}

6.3 优化方向

Schema 动态获取：通过 AGE 系统表（如 ag_catalog.ag_label）动态获取节点/边信息，避免手动维护 Schema；
多轮对话优化：保存对话上下文，支持多轮追问（如"它的成立年份是多少？"中的"它"指代上一轮的企业）；
模型选择：复杂场景可选用 GPT-4 提升 Cypher 生成准确率，或使用开源模型（如 Llama 3）部署私有化服务；
结果可视化：结合前端框架（如 Vue、React）将查询结果以表格、图谱形式可视化展示。

七、总结与展望

本文通过"校园社交网络图"和"企业知识图谱"两个实战案例，完整覆盖了 Apache AGE 的核心应用流程，从环境搭建、数据建模、数据插入到核心查询，提供了可直接复用的代码示例，验证了 Apache AGE 在关联数据分析中的高效性与便捷性。在此基础上，扩展的 LLM 融合方案，降低了知识图谱的使用门槛，实现了自然语言驱动的智能问答，为 Apache AGE 的落地应用提供了更多可能性。

Apache AGE 作为 PostgreSQL 生态的重要补充，其"关系型+图"的多模型优势在更多场景中仍有挖掘空间，例如：物流路径优化、金融欺诈检测、医疗知识图谱构建等。未来，随着 AGE 版本的迭代（如更高版本对图索引、并行查询的优化），其性能将进一步提升。建议开发者结合实际业务场景，深入探索图数据建模技巧与性能优化方法，充分发挥 Apache AGE 的价值。

参考资源：

Apache AGE 官方文档：https://age.apache.org/docs/1.3.0/index.html
PostgreSQL 官方文档：https://www.postgresql.org/docs/15/index.html
OpenAI API 文档：https://platform.openai.com/docs/api-reference