新手小白动手学习大模型应用开发-搭建个人知识库

个人知识库助手项目

目录

个人知识库助手项目Chat_with_Datawhale_langchain

本项目可以实现基于 Datawhale 的现有项目 README 的知识问答,使用户可以快速了解 Datawhale 现有项目情况。

部署:
python 复制代码
git clone https://github.com/logan-zou/Chat_with_Datawhale_langchain.git
cd Chat_with_Datawhale_langchain

#创建环境
conda create -n llm-universe python==3.9.0
# 激活 Conda 环境
conda activate llm-universe
# 安装依赖项
pip install -r requirements.txt

注意这里在安装依赖时会报错,解决方案,重新执行requirements.txt 安装即可

python 复制代码
langchain
langsmith==0.1.0
langchain-community==0.0.31
packaging
运行:
python 复制代码
cd serve

启动服务为本地API:

python 复制代码
uvicorn api:app --reload

再打开另外一个终端窗口

python 复制代码
conda activate llm-universe

cd Chat_with_Datawhale_langchain/serve

修改run_gradio.py

python 复制代码
DEFAULT_DB_PATH = "/opt/data/private/xxx/Datawhale/Chat_with_Datawhale_langchain/knowledge_db"
DEFAULT_PERSIST_PATH = "/opt/data/private/xxx/Datawhale/Chat_with_Datawhale_langchain/vector_db/chroma"
AIGC_AVATAR_PATH = "/opt/data/private/xxx/Datawhale/Chat_with_Datawhale_langchain/figures/aigc_avatar.png"
DATAWHALE_AVATAR_PATH = "/opt/data/private/xxx/Datawhale/Chat_with_Datawhale_langchain/figures/datawhale_avatar.png"
AIGC_LOGO_PATH = "/opt/data/private/xxx/Datawhale/Chat_with_Datawhale_langchain/figures/aigc_logo.png"
DATAWHALE_LOGO_PATH = "/opt/data/private/xxx/Datawhale/Chat_with_Datawhale_langchain/figures/datawhale_logo.png"
python 复制代码
#注意安装
pip install sentence-transformers
获取API:

智谱 AI :首先进入到 智谱AI开放平台,输入手机号及验证码进行注册。对于需要使用 API key 来搭建应用的话,需要在控制台点击右上角就会进入个人的 API 管理列表中。在该界面,就可以看到获取到的 API 所对应的应用名字和 API key 了。我们可以点击 添加新的 API key 并输入对应的名字即可生成新的 API key

复制API key,并粘贴在.env文件中编辑 ZHIPUAI_API_KEY即可

运行命令

python 复制代码
python run_gradio.py -model_name='chatglm_std' -embedding_model='m3e' -db_path='../knowledge_db' -persist_path='../vector_db'
本地运行:

因为我是在远程 Linux 服务器运行,但是在自己本地 Windows 浏览器打开相关网页

选择使用 SSH 做端口转发,本地用 127.0.0.1:7860

python 复制代码
#在本地电脑打开终端(CMD)执行
ssh -p 25xx -L 7860:127.0.0.1:7860 root@10.xxx.xx.xxx

这时本地浏览器访问:http://127.0.0.1:7860,就能通过 SSH 隧道访问到服务器上的 Gradio 服务了

相关推荐
lingggggaaaa1 小时前
炎魂网络 - 安全开发实习生面经
网络·学习·安全·web安全·网络安全
好奇龙猫1 小时前
日语学习-日语知识点小记-构建基础-JLPT-N3阶段-二阶段(26):语法和单词 第5-6课
学习
知识分享小能手1 小时前
CentOS Stream 9入门学习教程,从入门到精通, CentOS Stream 9中的文件和目录管理(3)
linux·学习·centos
暗然而日章1 小时前
C++基础:Stanford CS106L学习笔记 4 容器(STL与序列容器)
c++·笔记·学习
richxu202510011 小时前
嵌入式学习之路>(二)单片机核心原理篇>1.GPIO
单片机·嵌入式硬件·学习
敲代码的嘎仔2 小时前
LeetCode面试HOT100——160. 相交链表
java·学习·算法·leetcode·链表·面试·职场和发展
敲代码的嘎仔2 小时前
LeetCode面试HOT100—— 206. 反转链表
java·数据结构·学习·算法·leetcode·链表·面试
丝斯20112 小时前
AI学习笔记整理(19)—— AI核心技术(深度学习3)
人工智能·笔记·学习
自然语2 小时前
深度学习时代结束了,2025年开始只剩下轮廓
数据结构·人工智能·深度学习·学习·算法