AI数字人模拟面试机器人

该项目使用微软Azure技术 文本转语音头像与实时合成配合使用,在对话框中输入答案,数字人会根据答案生成评价和评分。

Azure语音提供用户生成支持的应用程序的API:
语音转文本 :语音识别API,应用程序接受语音输入;
文本转语言 :语音合成API,应用程序提供语音输出;
语音翻译 :将口语输入翻译为多种语言的API
关键字识别 :应用程序能够识别关键字或 短语的API
意向识别:使用的对话语言理解来确定口语输入的语义含义的API

思路

用户--->生成回答(文字)----->服务器(基于大模型建)------>输出并抛出下一个疑问------>对等连接(webRTC)

WebRTC入门指南:什么是WebRTC?核心原理、组件、应用场景

WebRTC(Web 实时通信)是一项强大的技术,其核心目标是使 Web
应用程序
站点 能够捕获和选择性地流式传输 音频或视频媒体,以及在浏览器之间交换任意数据,而无需中间件。它允许网络应用或站点,在不借助中间媒介的情况下,建立浏览器之间点对点(Peer-to-Peer)的连接 ,实现视频流和(或)音频流或者其他任意数据的传输 。WebRTC是一个免费的开放项目,通过简单的 API 为浏览器和移动应用程序提供实时通信(RTC)功能,并由 Google 在 2011 年将其开源。

(今天太晚了,忍不住了,眼睛睁不开了,明天接着写)

相关推荐
七牛云行业应用25 分钟前
GPT-5.4 mini 与 nano 深度评测:核心差异、API 成本实测与选型指南
人工智能·openai·api调用·gpt-5.4·大模型降本
cxr82829 分钟前
PaperclipAI 组织关系与智能体协作指南
数据库·人工智能·架构·ai智能体·openclaw
大傻^41 分钟前
Spring AI Alibaba RAG实战:基于向量存储的检索增强生成
java·人工智能·spring
Physicist in Geophy.42 分钟前
claude code workflow
人工智能
大傻^43 分钟前
Spring AI Alibaba 快速入门:基于通义千问的AI应用开发环境搭建
java·人工智能·后端·spring·springai·springaialibaba
跨境卫士-小汪1 小时前
高风险订单识别不足如何设置拦截与二次核验
大数据·人工智能·产品运营·跨境电商·营销策略
心勤则明1 小时前
用 Spring AI Alibaba 打造智能查询增强引擎
java·人工智能·spring
njsgcs2 小时前
图卷积是如何处理不同输入长度的 消息传递
人工智能
哥本哈士奇2 小时前
使用OpenClaw的Skills对接本地系统
人工智能