语音机器人的两种常见业务场景

第一个业务场景

之前写过一篇语音机器人是真人录音好,还是TTS转语音更好的文章。今天再来说一说TTS一个很细微的场景。

假设一句话

这里是*****银行委托机构,您在*****银行的信用卡长期逾期至今仍未依照约定履行还款义务,为避免逃废债给您带来影响,请您立即于今日17点前主动致电*********协商,避免后续违约责任,重听请按9,已知晓请挂机。

假设这句话是用TTS来转换,会出现一个什么问题呢?首先TTS的声音,天天讯通这边对接的是阿里的通道,应该声音的选择性来说还是很充足的,测试过他们的所有声音,有生硬的,当然柔美的,听起来舒服的还是很多的。现在TTS声音的优化上比2017、18年语音机器人刚火的时候优秀多了。

另一个问题,多音字。重(chong还是zhong)听请按9。有一个客户找到我,发了一段现有机器人系统存在的一个问题,就是这个多音字没法处理。这TTS的声音再柔美,听到最后这个多音字发音成了zhong,不太符合我们中国人的习惯。

第二个业务场景

现在很多业务都是要引导客户加企业微信,肯定不能通过语音播报这种方式把微信号说给客户听,然后客户来添加,万一加错了呢,那就尴尬了!

天天讯通这边是采用的对接第三方SCRM的方案来实现自动添加。效果看图说话!

这是最近咨询的客户中提到比较多,让我印象比较深刻的两个场景。分享出来,如有同样烦恼和需求的客户,可以找我们答疑解惑!

相关推荐
zhangrelay10 分钟前
如何使用AI快速编程实现标注ROS2中sensor_msgs/msg/Image图像色彩webots2025a
人工智能·笔记·opencv·学习·计算机视觉·机器人视觉
武子康13 分钟前
AI研究-120 DeepSeek-OCR 从 0 到 1:上手路线、实战要点
人工智能·深度学习·机器学习·ai·ocr·deepseek·deepseek-ocr
大千AI助手37 分钟前
LIFT:基于低秩引导的稀疏微调
人工智能·神经网络·lora·大模型·lift·大千ai助手·稀疏微调
Serverless 社区38 分钟前
算力成本降低 33%,与光同尘用 Serverless AI 赋能影视商业内容生产
人工智能·云原生·serverless
L.EscaRC40 分钟前
【AI基础篇】Transformer架构深度解析与前沿应用
人工智能·深度学习·transformer
王中阳Go1 小时前
3 - RAG 知识库基础 - AI 超级智能体项目教程
人工智能·agent
司马阅-SmartRead1 小时前
司马阅与数之境科技达成生态战略合作,释放1+1>2的产业赋能价值
人工智能
化作星辰1 小时前
四层神经网络案例(含反向传播)
人工智能·深度学习·神经网络
m0_650108241 小时前
【论文精读】AVID:基于扩散模型的任意长度视频修复
人工智能·扩散模型·论文精读·视频修复·时序一致性·任意时长·结构引导
TYUT_xiaoming1 小时前
ubuntu22.04 GPU环境安装mindspore
linux·人工智能·深度学习