腾讯云向量数据库-RAG介绍

1.说明

RAG结合LLM(通用大预言模型)构件基于私有文档、专业领域知识、实时信息的charbot。

2.RAG的主要步骤

  • 知识切片成chunk
  • 向量化chunk入库
  • query检索知识chunk
  • 构件prompts
  • 调用llm生成回答

3.优势

  • 快速构件demo
  • 快速理解rag
  • 社区支持

4.痛点

  • 投入大
  • 效果差
  • 调优难

5.RAG应用的效果

整体效果=文档处理效果*embedding效果*retrieval效果*LLM效果

6.数据处理的难点:解析和拆分

1.PDF格式的++多样性++ (eg:标准格式、跨页表格、离散等),++会有复杂多变的文档格式++,提高效果的困难度。

解决办法:

2.++文档内容质量++将很有程度影响最终效果。

相关推荐
龙大大L6 小时前
第五章:5.3 ESP32物联网应用:阿里云IoT平台与腾讯云IoT平台的数据上传与远程控制
java·物联网·struts·esp32
移远通信7 小时前
QuecPython+GNSS:实现快速定位
物联网·gnss·quecpython
小叮当⇔14 小时前
IOT项目——物联网 GPS
物联网
程序边界16 小时前
DeepSeek在物联网设备中的应用:通过轻量化模型实现本地化数据分析
物联网·struts·数据分析
网易独家音乐人Mike Zhou16 小时前
【Linux应用】交叉编译环境配置,以及最简单粗暴的环境移植(直接从目标板上复制)
linux·stm32·mcu·物联网·嵌入式·iot
塔能物联运维20 小时前
解析塔能科技:绿色低碳智慧节能一站式破局之匙
大数据·人工智能·物联网
无脑学c++1 天前
STM32串口重定向:MDK与GCC重定向需重写的不同函数
stm32·单片机·物联网
九河云2 天前
物联网赋能玻璃制造业:实现设备智能管理与生产协同
科技·物联网·重构·云计算·制造
广东航连科技2 天前
银行网点款箱交接权限认证开锁与密钥时效双重监控
物联网·安全·银行·精细化管理·锁控·智能锁·款箱