LightRAG系列3：LightRAG 环境准备与快速启动

图片来源网络，侵权联系删。

LightRAG系列文章

● LightRAG系列1：为什么 Web 开发者需要关注 RAG？

● LightRAG系列2：什么是 LightRAG？它和 LangChain 有什么区别？

● LightRAG系列3：LightRAG 环境准备与快速启动

● LightRAG 系列 4：核心技术解析------检索模块详解（上）

● LightRAG 系列 5：核心技术解析------HNSW 索引机制与 Web 应用中的毫秒级检索

● LightRAG 系列 6：核心技术解析------检索策略：Top-K + 重排序（Re-ranking）提升精度

● LightRAG 系列 7：核心技术解析------整合检索与生成模块，完整走通 LightRAG 的端到端工作流

● LightRAG 系列8：最佳实践与避坑指南

文章目录

[引言：5 分钟跑通你的第一个 RAG 应用](#引言：5 分钟跑通你的第一个 RAG 应用)
支持语言与运行环境
- 主力语言：Python（3.9+）
- 实验性支持：JavaScript（Node.js）
安装命令：一行搞定
[验证安装：运行第一个 Hello World 示例](#验证安装：运行第一个 Hello World 示例)
常见问题排查（避坑指南）
- 进阶：使用更好的中文模型（可选）
下一步：准备你的真实数据

引言：5 分钟跑通你的第一个 RAG 应用

对 Web 开发者而言，评估一个新工具是否值得投入，关键看"从零到可运行 Demo 需要多久 "。LightRAG 的设计哲学之一就是"开箱即用"------无需配置复杂的向量数据库、不用申请 API 密钥、甚至不需要 GPU。本节将带你用 3 条命令 + 10 行代码，在本地运行一个能回答问题的智能知识库，真正实现"所见即所得"。

LightRAG 把 RAG 的复杂性封装在底层，暴露给开发者的只有两个动作：insert 和 query。这种极简抽象，正是它适合 Web 开发者的核心原因。

支持语言与运行环境

主力语言：Python（3.9+）

官方维护完善，功能最全（包括图构建、双模检索、流式输出等）
依赖库精简：仅需 numpy、transformers、sentence-transformers、hnswlib 等基础 AI 工具包
兼容主流框架：可无缝集成 FastAPI、Flask、Django、Streamlit

实验性支持：JavaScript（Node.js）

通过 @lightrag/core 包提供基础检索能力（2025 年 Q2 起处于 alpha 阶段）
目前仅支持向量检索，暂不支持图增强和全局模式
适合前端开发者快速验证概念，生产环境仍推荐 Python 后端

⚠️ 注意：截至 2025 年 12 月，所有高级功能（如知识图谱、多跳推理）仅在 Python 版本中可用。

安装命令：一行搞定

确保你已安装 Python 3.9 或更高版本（可通过 python --version 验证），然后执行：

bash 复制代码

pip install lightrag

✅ 国内用户加速安装建议 ：

使用清华源可显著提升下载速度：
bash 复制代码
pip install lightrag -i https://pypi.tuna.tsinghua.edu.cn/simple

安装完成后，系统会自动下载默认的嵌入模型（all-MiniLM-L6-v2，约 80MB），该模型支持中英文，适合大多数通用场景。

验证安装：运行第一个 Hello World 示例

创建一个名为 hello_rag.py 的文件，输入以下代码：

python 复制代码

from lightrag import LightRAG, QueryParam

# 初始化：指定工作目录（用于存储索引和图数据）
rag = LightRAG(working_dir="./rag_workspace")

# 插入一段知识
rag.insert("""
LightRAG 是一个轻量级检索增强生成框架。
它由香港大学团队于2024年开源，专注于高效、准确的问答系统。
相比 LangChain，LightRAG 更轻、更快、更适合嵌入 Web 应用。
""")

# 提问并获取答案
response = rag.query(
    "LightRAG 是什么？",
    param=QueryParam(mode="local")  # 使用局部模式进行事实型问答
)

print("🤖 回答：", response)

在终端运行：

bash 复制代码

python hello_rag.py

你将看到类似输出：

复制代码

🤖 回答： LightRAG 是一个轻量级检索增强生成框架，由香港大学团队于2024年开源，专注于高效、准确的问答系统。相比 LangChain，它更轻、更快、更适合嵌入 Web 应用。

恭喜！你已成功运行第一个 LightRAG 应用。

常见问题排查（避坑指南）

问题现象	可能原因	解决方案
`ModuleNotFoundError: No module named 'lightrag'`	虚拟环境未激活或 pip 安装失败	检查 `pip list`，重新安装或切换 Python 环境
首次运行卡住	正在自动下载嵌入模型（约 80MB）	保持网络畅通，首次运行需 1--2 分钟
中文回答效果差	默认模型对中文支持有限	显式指定多语言模型（见下文）

进阶：使用更好的中文模型（可选）

若你的应用以中文为主，可在初始化时指定更强的嵌入模型：

python 复制代码

rag = LightRAG(
    working_dir="./rag_workspace",
    embedding_model="BAAI/bge-small-zh-v1.5"  # 中文优化模型
)

💡 提示：bge-small-zh-v1.5 在中文语义匹配任务中表现优异，且体积小（<200MB），适合生产环境。

下一步：准备你的真实数据

现在你已掌握基础流程。下一章将深入讲解如何：

批量导入 PDF/Markdown/网页内容
自定义分块策略
配置元数据与权限控制

LightRAG 的真正威力，不在于"能跑"，而在于"能用"------用你的数据，解决你的真实问题。