四、使用langchain搭建RAG:金融问答机器人--构建web应用,问答链,带记忆功能

经过前面3节完成金融问答机器人基本流程,这章将使用Gradio构建web应用,同时加入memory令提示模板带有记忆的,使用LCEL构建问答链。

加载向量数据库

python 复制代码
from langchain.vectorstores import Chroma
from langchain_huggingface import HuggingFaceEmbeddings
import os

# 定义 Embeddings
embeddings = HuggingFaceEmbeddings(model_name="m3e-base")

# 向量数据库持久化路径
persist_directory = 'data_base/chroma'

# 加载数据库
vectordb = Chroma(
    persist_directory=persist_directory, 
    embedding_function=embeddings
)
retriever=vectordb.as_retriever()

加载LLM

python 复制代码
import os
os.environ["DASHSCOPE_API_KEY"] = 'sk-***'

from langchain_community.llms import Tongyi
llm = Tongyi()

创建memory

python 复制代码
from langchain.memory import ConversationBufferMemory
memory = ConversationBufferMemory(
    memory_key="chat_history",  # 与 prompt 的输入变量保持一致。
    return_messages=True  # 将以消息列表的形式返回聊天记录,而不是单个字符串
)

构建新的问答链,使用带有记忆的提示模板

python 复制代码
# 构建新的问答链,使用带有记忆的提示模板
from langchain.chains import ConversationalRetrievalChain
def chatqwen_chat(message, history):
     #构建对话问答链
     qa = ConversationalRetrievalChain.from_llm(
		llm,
		retriever=retriever,
		memory=memory,
		verbose=True,
	 )
     result = qa({"question": message})
     return result['answer']

定义gradio web app

python 复制代码
import gradio as gr
def launch_gradio():

    iface = gr.ChatInterface(
        fn=chatqwen_chat,
        title="金融RAG问答机器人",
        chatbot=gr.Chatbot(height=400),
    )
    iface.launch(share=True, server_name="0.0.0.0")

启动 Gradio 服务

python 复制代码
# 启动 Gradio 服务
launch_gradio()

测试

Gradio 服务启动成功后,可以使用浏览器f访问web应用: http://127.0.0.1:7861/

从上面第二个问题看出,有记忆到之前的问题。

下图是整个访问链条的LOG:

总结

使用Gradio构建web应用已完成,如果想独立部署项目,可以放到py文件中,然后使用下面代码启动

python 复制代码
if __name__ == "__main__": 
    # 启动 Gradio 服务
    launch_gradio()

启动脚本: python ***.py

如果是使用conda 虚拟环境则: **\envs\langchain_qwen\python **.py (带上虚拟环境的目录)

项目源代码: https://gitee.com/ailianshuo/finance-bot

相关推荐
仙人掌_lz10 分钟前
微调ModernBERT为大型语言模型打造高效“过滤器”
人工智能·python·ai·语言模型·自然语言处理·bert
小众AI13 分钟前
fastmcp: 更好用的 MCP Python 框架
开发语言·人工智能·python
cdut_suye17 分钟前
【Linux系统】从零开始构建简易 Shell:从输入处理到命令执行的深度剖析
java·linux·服务器·数据结构·c++·人工智能·python
小屁孩大帅-杨一凡22 分钟前
Azure Document Intelligence
后端·python·microsoft·flask·azure
政东.zd1 小时前
部署dify
python
萧鼎1 小时前
深入探索 Python 的 QuTiP 5 库:量子计算与开放量子系统模拟的利器
开发语言·python·量子计算
yibuapi_com1 小时前
Embedding 的数学特性与可视化解析
chatgpt·架构·langchain·embedding·claude·向量数据库·中转api
ccstuck1 小时前
AI安全之对抗样本攻击---FGSM实战脚本解析
人工智能·安全·生成对抗网络·ai
yousuotu2 小时前
python如何提取Chrome中的保存的网站登录用户名密码?
java·chrome·python
zx432 小时前
常见的降维算法
笔记·python·算法