基于GPT3.5逆向 和 本地Bert-Vits2-2.3 的语音智能助手

文章目录

一、效果演示

各位读者你们好,我最近在研究一个语音助手的项目,是基于GPT3.5网页版的逆向和本地BertVits2-2.3 文字转语音,能实现的事情感觉还挺多,目前实现【无需翻墙,国内网络发送消息,返回答案文字和语音】,网站已上线并未公开链接,以下是演示GIF:

二、操作步骤

  1. 前端使用uni-app完成,登录后主页中选中【AI助手】
  2. 跳转到对话页面
  3. 输入对话,并发送

自研人工智能助手-说话演示

  1. 切换模型,秒级响应

自研人工智能助手-切换人物演示

三、架构解析

  • 整体架构
    • 后端使用SpringCloud微服务 + nacos注册中心/配置中心 + sentinel限流
    • 前端使用 uni-app H5快速开发
  • 后端服务规划有:
    1. TTS服务(文本转语音服务):本地离线BertVits2-2.3
    2. ARS/STT服务 (语音转文本服务):sherpa-ncnn-fast
    3. Chat服务:Chatglm2-6b-int4 GPU/Chatglm3-6b-int4 c++ CPU/ChatGPT3.5 网页逆向
    4. 分布式爬虫服务,用于在网络上爬取 chat服务返回文本包含"抱歉"的需要进行在线实时搜索的内容
    5. 本地知识库服务:用于缓存热词,需要实时搜索的关键词,查询记录等
    6. 大文件上传下载服务:支持断点续传
相关推荐
atbigapp.com14 分钟前
PromptIDE提示词开发工具支持定向优化啦
人工智能
jndingxin19 分钟前
OpenCV CUDA模块中逐元素操作------算术运算
人工智能·opencv·计算机视觉
白熊18842 分钟前
【图像生成大模型】Step-Video-T2V:下一代文本到视频生成技术
人工智能·opencv·yolo·计算机视觉·大模型·音视频
立秋678944 分钟前
从零开始:使用 PyTorch 构建深度学习网络
人工智能·pytorch·深度学习
知舟不叙1 小时前
基于OpenCV的实时文档扫描与矫正技术
人工智能·opencv·计算机视觉·透视变换·实时文档扫描与矫正
Blossom.1181 小时前
基于区块链技术的供应链溯源系统:重塑信任与透明度
服务器·网络·人工智能·目标检测·机器学习·计算机视觉·区块链
说私域2 小时前
O2O电商变现:线上线下相互导流——基于定制开发开源AI智能名片S2B2C商城小程序的研究
人工智能·小程序·开源·零售
Jamence2 小时前
多模态大语言模型arxiv论文略读(七十六)
人工智能·语言模型·自然语言处理
与火星的孩子对话2 小时前
Unity3D开发AI桌面精灵/宠物系列 【六】 人物模型 语音口型同步 LipSync 、梅尔频谱MFCC技术、支持中英文自定义编辑- 基于 C# 语言开发
人工智能·unity·c#·游戏引擎·宠物·lipsync
Data-Miner3 小时前
35页AI应用PPT《DeepSeek如何赋能职场应用》DeepSeek本地化部署与应用案例合集
人工智能