AI数字人模拟面试机器人

该项目使用微软Azure技术 文本转语音头像与实时合成配合使用,在对话框中输入答案,数字人会根据答案生成评价和评分。

Azure语音提供用户生成支持的应用程序的API:
语音转文本 :语音识别API,应用程序接受语音输入;
文本转语言 :语音合成API,应用程序提供语音输出;
语音翻译 :将口语输入翻译为多种语言的API
关键字识别 :应用程序能够识别关键字或 短语的API
意向识别:使用的对话语言理解来确定口语输入的语义含义的API

思路

用户--->生成回答(文字)----->服务器(基于大模型建)------>输出并抛出下一个疑问------>对等连接(webRTC)

WebRTC入门指南:什么是WebRTC?核心原理、组件、应用场景

WebRTC(Web 实时通信)是一项强大的技术,其核心目标是使 Web
应用程序
站点 能够捕获和选择性地流式传输 音频或视频媒体,以及在浏览器之间交换任意数据,而无需中间件。它允许网络应用或站点,在不借助中间媒介的情况下,建立浏览器之间点对点(Peer-to-Peer)的连接 ,实现视频流和(或)音频流或者其他任意数据的传输 。WebRTC是一个免费的开放项目,通过简单的 API 为浏览器和移动应用程序提供实时通信(RTC)功能,并由 Google 在 2011 年将其开源。

(今天太晚了,忍不住了,眼睛睁不开了,明天接着写)

相关推荐
小陈工1 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
墨染天姬5 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志5 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114245 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠5 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光6 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好6 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力6 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo6 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_6 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能