基于ChatGpt,Java,SpringBoot,Vue,Milvus向量数据库的定制化聊天Web demo

customized chat

GitHub - bigcyy/customized-chatgpt: 基于ChatGpt,Java,SpringBoot,Vue,Milvus向量数据库的定制化聊天Web demo

简介

基于ChatGpt,Java,SpringBoot,Vue,Milvus向量数据库的定制化聊天Web demo

  • 可开发成个人知识库
  • 针对某品牌的智能客服
  • 私人助理
  • more

在线体验

TODO

https://github.com/bigcyy/customized-chatgpt/blob/main/pic/chat_demo.png

前端项目地址

GitHub - bigcyy/customized-chatgpt-vue: customized-chatgpt项目的前端,使用Vue搭建

原理

上传PDF,让ChtGpt基于PDF的内容回答问题,原理很简单:将内容分割然后embedding存入向量数据库,当用户询问时将问题embedding,拿embedding结果去向量数据库查询相似度最高的几段话丢给ChatGpt让他组织语言并结合自己丰富的知识进行润色。

本地使用

注意,你需要有OpenAI账号并且创建一个apiKey,由于国内无法使用连接OpenAi服务所以你需要配置代理

  1. 安装Milvus向量数据库

    复制代码
    wget https://github.com/milvus-io/milvus/releases/download/v2.2.2/milvus-standalone-docker-compose.yml -O docker-compose.yml
    sudo docker-compose up -d

克隆后端项目

复制代码
git clone git@github.com:bigcyy/customized-chatgpt.git
  1. 用idea打开项目

  2. 初始化Milvus向量数据库表结构以及配置代理

    • application.yml中配置向量数据库连接地址和端口(本地不需要修改),然后配置你的代理ip和端口

    • 找到项目test文件夹下的CustomizedChatApplicationTests.java,运行prepare函数创建表结构

  3. 找到项目主函数运行后端

  4. 克隆并运行前端项目

    git clone git@github.com:bigcyy/customized-chatgpt-vue.git
    cd customized-chatgpt-vue
    npm install
    npm run serve

  5. 访问控制台输出的地址

  6. 界面左下角配置你的apiKey

  7. 界面左下角上传你需要定制聊天的PDF文件

  8. enjoy it

todo

  • 支持更多的文件格式
  • token计数
  • 优化文本的分割
  • 抽离embedding模型,使其能更优雅的切换为自己训练的模型或者其他公开的模型

参考资料

https://twitter.com/chuangbo/status/1631461656151887873 作者详细的描述了该方案的运行流程,本项目也是参考自该文章

相关项目

相关推荐
wuminyu43 分钟前
Java锁机制之park与futex系统级协同机制解析
java·linux·c语言·jvm·c++
疯狂打码的少年1 小时前
编译程序与解释程序的区别
java·开发语言·笔记
小雨下雨的雨5 小时前
井字棋AI机器人实现详解 - Minimax算法实战-鸿蒙PC Electron框架完成
前端·人工智能·算法·华为·electron·鸿蒙
xieliyu.8 小时前
Java算法精讲:双指针(三)
java·开发语言·算法
明夜之约8 小时前
Spring Boot 自动装配源码
java·spring boot·后端
Leaton Lee8 小时前
Spring Boot分层架构详解:从Controller到Service再到Mapper的完整流程
java·spring boot·后端·架构
极客老王说Agent8 小时前
2026电信IDC机房巡检深度报告:人工巡检频次和深度够吗?实在Agent重塑智慧运维新范式
人工智能·ai·chatgpt
Jinkxs8 小时前
Resilience4j- 与 Spring Boot 快速集成:自动配置与基础注解使用
java·spring boot·后端
辣机小司8 小时前
【踩坑记录:Spring Boot 配置文件读取值不一致?警惕 YAML 的“八进制陷阱”与 SnakeYAML 版本之谜】
java·spring boot·后端·yaml·踩坑记录
ZC跨境爬虫9 小时前
跟着 MDN 学JavaScript day_7:数学运算与逻辑判断实战测试
开发语言·前端·javascript·学习·ecmascript