LightRAG测试BUG

错误一:

LightRAG无法回答错误:

复制代码
INFO:lightrag:kw_prompt result:
 {{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx", "xxx"]
}}
JSON parsing error: Expecting property name enclosed in double quotes: line 1 column 2 (char 1) {{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx", "xxx"]
}}
Sorry, I'm not able to provide an answer to that question.

是因为LLM响应的格式错误:

复制代码
{{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx", ]
}}

正确格式:

复制代码
{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx"]
}

解决方法:修改\lightrag\operate.py 477行代码。

python 复制代码
result = await use_model_func(kw_prompt, keyword_extraction=True)
logger.info("kw_prompt result:")
print("original result:", result)
result = result.replace('{{', '{').replace('}}', '}')
print("rewrite result", result)

错误二:

新环境测试LightRAG时突然出现错误:KeyError: 'Could not automatically map gpt-4o-mini to a tokeniser. Please use `tiktok.get_encoding` to explicitly get the tokeniser you expect.'

解决方法:搜索发现可能跟tiktoken版本问题有关,发现新环境中的tiktoken库版本是0.3.0,而旧环境是0.7.0,重新安装后即可正常运行。
pip install tiktoken==0.7.0

生成的知识图谱中带有很多英文节点:

将\lightrag\prompt.py中PROMPTS["DEFAULT_LANGUAGE"] 的值修改成 "Chinese"。

错误三:

使用API插入文本出错

官方测试curl命令(错误):curl -X POST "http://127.0.0.1:8020/insert_file" -H "Content-Type: application/json" -d '{"file_path": "path/to/your/file.txt"}'

返回错误:{"detail":[{"type":"missing","loc":["body","file"],"msg":"Field required","input":null}]}

正确curl命令:curl -X POST "http://127.0.0.1:8020/insert_file" -H "Content-Type: multipart/form-data" -F "file=@path/to/your/file.txt"

返回成功:{"status":"success","data":null,"message":"File content from test.txt inserted successfully"}

相关推荐
陈天伟教授4 小时前
人工智能训练师认证教程(2)Python os入门教程
前端·数据库·python
2301_764441334 小时前
Aella Science Dataset Explorer 部署教程笔记
笔记·python·全文检索
爱笑的眼睛114 小时前
GraphQL:从数据查询到应用架构的范式演进
java·人工智能·python·ai
BoBoZz194 小时前
ExtractSelection 选择和提取数据集中的特定点,以及如何反转该选择
python·vtk·图形渲染·图形处理
liwulin05064 小时前
【PYTHON-YOLOV8N】如何自定义数据集
开发语言·python·yolo
木头左5 小时前
LSTM量化交易策略中时间序列预测的关键输入参数分析与Python实现
人工智能·python·lstm
电子硬件笔记5 小时前
Python语言编程导论第七章 数据结构
开发语言·数据结构·python
南棱笑笑生5 小时前
20251217给飞凌OK3588-C开发板适配Rockchip原厂的Buildroot【linux-5.10】后调通ov5645【只能预览】
linux·c语言·开发语言·rockchip
HyperAI超神经6 小时前
【vLLM 学习】Prithvi Geospatial Mae
人工智能·python·深度学习·学习·大语言模型·gpu·vllm
逻极6 小时前
Python MySQL防SQL注入实战:从字符串拼接的坑到参数化查询的救赎
python·mysql·安全·sql注入