基于GPT3.5逆向 和 本地Bert-Vits2-2.3 的语音智能助手

文章目录

一、效果演示

各位读者你们好,我最近在研究一个语音助手的项目,是基于GPT3.5网页版的逆向和本地BertVits2-2.3 文字转语音,能实现的事情感觉还挺多,目前实现【无需翻墙,国内网络发送消息,返回答案文字和语音】,网站已上线并未公开链接,以下是演示GIF:

二、操作步骤

  1. 前端使用uni-app完成,登录后主页中选中【AI助手】
  2. 跳转到对话页面
  3. 输入对话,并发送

自研人工智能助手-说话演示

  1. 切换模型,秒级响应

自研人工智能助手-切换人物演示

三、架构解析

  • 整体架构
    • 后端使用SpringCloud微服务 + nacos注册中心/配置中心 + sentinel限流
    • 前端使用 uni-app H5快速开发
  • 后端服务规划有:
    1. TTS服务(文本转语音服务):本地离线BertVits2-2.3
    2. ARS/STT服务 (语音转文本服务):sherpa-ncnn-fast
    3. Chat服务:Chatglm2-6b-int4 GPU/Chatglm3-6b-int4 c++ CPU/ChatGPT3.5 网页逆向
    4. 分布式爬虫服务,用于在网络上爬取 chat服务返回文本包含"抱歉"的需要进行在线实时搜索的内容
    5. 本地知识库服务:用于缓存热词,需要实时搜索的关键词,查询记录等
    6. 大文件上传下载服务:支持断点续传
相关推荐
子燕若水2 小时前
Unreal Engine 5中的AI知识
人工智能
极限实验室3 小时前
Coco AI 实战(一):Coco Server Linux 平台部署
人工智能
杨过过儿3 小时前
【学习笔记】4.1 什么是 LLM
人工智能
巴伦是只猫4 小时前
【机器学习笔记Ⅰ】13 正则化代价函数
人工智能·笔记·机器学习
大千AI助手4 小时前
DTW模版匹配:弹性对齐的时间序列相似度度量算法
人工智能·算法·机器学习·数据挖掘·模版匹配·dtw模版匹配
AI生存日记4 小时前
百度文心大模型 4.5 系列全面开源 英特尔同步支持端侧部署
人工智能·百度·开源·open ai大模型
LCG元4 小时前
自动驾驶感知模块的多模态数据融合:时序同步与空间对齐的框架解析
人工智能·机器学习·自动驾驶
why技术4 小时前
Stack Overflow,轰然倒下!
前端·人工智能·后端
超龄超能程序猿5 小时前
(三)PS识别:基于噪声分析PS识别的技术实现
图像处理·人工智能·计算机视觉