基于GPT3.5逆向 和 本地Bert-Vits2-2.3 的语音智能助手

文章目录

一、效果演示

各位读者你们好,我最近在研究一个语音助手的项目,是基于GPT3.5网页版的逆向和本地BertVits2-2.3 文字转语音,能实现的事情感觉还挺多,目前实现【无需翻墙,国内网络发送消息,返回答案文字和语音】,网站已上线并未公开链接,以下是演示GIF:

二、操作步骤

  1. 前端使用uni-app完成,登录后主页中选中【AI助手】
  2. 跳转到对话页面
  3. 输入对话,并发送

自研人工智能助手-说话演示

  1. 切换模型,秒级响应

自研人工智能助手-切换人物演示

三、架构解析

  • 整体架构
    • 后端使用SpringCloud微服务 + nacos注册中心/配置中心 + sentinel限流
    • 前端使用 uni-app H5快速开发
  • 后端服务规划有:
    1. TTS服务(文本转语音服务):本地离线BertVits2-2.3
    2. ARS/STT服务 (语音转文本服务):sherpa-ncnn-fast
    3. Chat服务:Chatglm2-6b-int4 GPU/Chatglm3-6b-int4 c++ CPU/ChatGPT3.5 网页逆向
    4. 分布式爬虫服务,用于在网络上爬取 chat服务返回文本包含"抱歉"的需要进行在线实时搜索的内容
    5. 本地知识库服务:用于缓存热词,需要实时搜索的关键词,查询记录等
    6. 大文件上传下载服务:支持断点续传
相关推荐
昵称是6硬币1 小时前
YOLO26论文精读(逐段解析)
人工智能·深度学习·yolo·目标检测·计算机视觉·yolo26
wwlsm_zql3 小时前
「赤兔」Chitu 框架深度解读(十四):核心算子优化
人工智能·1024程序员节
AKAMAI5 小时前
Fermyon推出全球最快边缘计算平台:WebAssembly先驱携手Akamai云驱动无服务器技术新浪潮
人工智能·云计算·边缘计算
云雾J视界6 小时前
TMS320C6000 VLIW架构并行编程实战:加速AI边缘计算推理性能
人工智能·架构·边缘计算·dsp·vliw·tms320c6000
想ai抽6 小时前
基于AI Agent的数据资产自动化治理实验
人工智能·langchain·embedding
小马过河R7 小时前
AIGC视频生成之Deepseek、百度妙笔组合实战小案例
人工智能·深度学习·计算机视觉·百度·aigc
june-Dai Yi8 小时前
免费的大语言模型API接口
人工智能·语言模型·自然语言处理·chatgpt·api接口
王哈哈^_^8 小时前
【数据集】【YOLO】【目标检测】农作物病害数据集 11498 张,病害检测,YOLOv8农作物病虫害识别系统实战训推教程。
人工智能·深度学习·算法·yolo·目标检测·计算机视觉·1024程序员节
数据库安全8 小时前
牛品推荐|分类分级效能飞跃:美创智能数据安全分类分级平台
大数据·人工智能·分类
却道天凉_好个秋8 小时前
卷积神经网络CNN(六):卷积、归一化与ReLU总结
人工智能·神经网络·cnn