LightRAG测试BUG

错误一:

LightRAG无法回答错误:

复制代码
INFO:lightrag:kw_prompt result:
 {{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx", "xxx"]
}}
JSON parsing error: Expecting property name enclosed in double quotes: line 1 column 2 (char 1) {{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx", "xxx"]
}}
Sorry, I'm not able to provide an answer to that question.

是因为LLM响应的格式错误:

复制代码
{{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx", ]
}}

正确格式:

复制代码
{
  "high_level_keywords": ["xxx", "xxx"],
  "low_level_keywords": ["xxx", "xxx"]
}

解决方法:修改\lightrag\operate.py 477行代码。

python 复制代码
result = await use_model_func(kw_prompt, keyword_extraction=True)
logger.info("kw_prompt result:")
print("original result:", result)
result = result.replace('{{', '{').replace('}}', '}')
print("rewrite result", result)

错误二:

新环境测试LightRAG时突然出现错误:KeyError: 'Could not automatically map gpt-4o-mini to a tokeniser. Please use `tiktok.get_encoding` to explicitly get the tokeniser you expect.'

解决方法:搜索发现可能跟tiktoken版本问题有关,发现新环境中的tiktoken库版本是0.3.0,而旧环境是0.7.0,重新安装后即可正常运行。
pip install tiktoken==0.7.0

生成的知识图谱中带有很多英文节点:

将\lightrag\prompt.py中PROMPTS["DEFAULT_LANGUAGE"] 的值修改成 "Chinese"。

错误三:

使用API插入文本出错

官方测试curl命令(错误):curl -X POST "http://127.0.0.1:8020/insert_file" -H "Content-Type: application/json" -d '{"file_path": "path/to/your/file.txt"}'

返回错误:{"detail":[{"type":"missing","loc":["body","file"],"msg":"Field required","input":null}]}

正确curl命令:curl -X POST "http://127.0.0.1:8020/insert_file" -H "Content-Type: multipart/form-data" -F "file=@path/to/your/file.txt"

返回成功:{"status":"success","data":null,"message":"File content from test.txt inserted successfully"}

相关推荐
海棠蚀omo11 分钟前
Linux操作系统-命令行参数及环境变量
linux·操作系统
程序员三藏23 分钟前
银行测试:第三方支付平台业务流,功能/性能/安全测试方法
自动化测试·软件测试·python·功能测试·测试工具·职场和发展·安全性测试
小白不想白a24 分钟前
【shell】每日shell练习(系统用户安全审计/系统日志错误分析)
linux·运维·云原生
程序员晚枫33 分钟前
Python版本进化史:从3.6到3.14,每个版本都带来了什么惊喜?
python
码猫Mrr41 分钟前
创维E900V22D刷入armbian hdmi开机花屏和网络无法使用 解决方式【亲测】
linux·armbian·e900v22d
程序猿小D1 小时前
【完整源码+数据集+部署教程】 【零售和消费品&存货】【无人零售】自动售卖机饮料检测系统源码&数据集全套:改进yolo11-KernelWarehouse
python·yolo·计算机视觉·目标跟踪·数据集·yolo11·自动售卖机饮料检测系统
寒怜z1 小时前
python 景区游客量统计
python
程序员晚枫1 小时前
Python 3.14发布:多解释器让性能飙升300%,GIL时代即将终结!
python
Cx330❀1 小时前
《Linux基础入门指令(二)》:从零开始理解Linux系统
linux·运维·服务器·网络·经验分享
程序猿小D1 小时前
【完整源码+数据集+部署教程】 【零售和消费品&存货】条形码检测系统源码&数据集全套:改进yolo11-TADDH
python·yolo·计算机视觉·目标跟踪·数据集·yolo11·条形码检测系统