手机打电话时由对方DTMF响应切换多级IVR语音应答(二)

手机打电话时由对方DTMF响应切换多级IVR语音应答(二)

--本地AI电话机器人

  • 一、前言

前面的篇章《手机打电话时由对方DTMF响应切换多级IVR语音应答(一)》中,我们从理论的角度论述了"根据对方按下DTMF值响应多级IVR"这个功能所应具备的体验效果和功能组成。

本篇章中,我们尝试在拨号器SDK的示例App中,通过界面列表的方式,将多级IVR的编辑界面内容给标注出来,使SDK-Demo的App,能够按用户自己的需要,手动编辑各种层级的IVR的DTMF按键响应的语料。从而实现一个完整的"手机SIM卡挂载多级IVR实现主动外呼或来电接听时根据通话对方不同的DTMF按键,实现播放不同IVR语音反馈"的实际功能。

智能拨号器App: http://120.78.211.195:8060/Dialer.apk

拨号器 SDK示例apphttp://120.78.211.195:8060/sdk/SdkDemo.apk

USB蓝牙配件购买路径 (参考):https://item.taobao.com/item.htm?_u=pk10l4ccbcd&id=649368472986

  • 二、多级IVR语音导航编辑界面

在SDK-Demo的App中,多级IVR语音导航是【功能设置】区域的"接通后播放IVR引导提示语"的基础之上,增加的"多级IVR语音应答"的复选框。供用户决定是否启用多级IVR的功能。

开场白完毕后可直接播放主要语音菜单,提示按1转归属地、按2转10086、按0转人工等等。此时,界面响应进入【一级IVR】的IVR菜单的列表中。

通话的对方如在主要语音菜单的播放过程中,按下DTMF键的0-9*#的任意按键,将自动跳转到对应的一级IVR的对应IVR语料内容中进行逻辑和语音的响应。编辑界面如下图所示:

本次编辑界面中,暂不考虑网络接口查询以及转TTS语音播放的功能。仅作静态的预录制语音或逐个DTMF字符导入对应语音的功能。

多级IVR的列表界面中,每个列表项的"IVR路径"之后,都默认有【子菜单】的按钮。(若该DTMF存在子IVR菜单则会显示图片,不存在则不显示内容但可以点击进入新弹出子菜单窗口进行编辑。)

  • 三、添加DTMF响应的IVR语料

默认的多级IVR列表是空的,具体登录用户可以手动点击【多级IVR语音片段-编辑】区域左上角的【+新增】按钮,进行DTMF键值的设置,并对具体IVR语料进行录制或导入操作。

新增的DTMF按键的选择列表不允许与同级IVR中已存在的DTMF值重复。若通话对方按下的DTMF键为未配置的DTMF,则会提示对方"按键错误,请重新输入"。

一级IVR的菜单列表中,可以设置按键超时的响应语音和逻辑,当通话对方长时间没有操作时,可设置播放的语料并作出挂断通话等业务响应。

  • 四、修改IVR语料

目前用户对IVR路径的操作仅包含录制、播放、导入这三个功能。一般建议用户使用"录制"按钮,对IVR语料中某个DTMF的响应内容进行人工录制。这样产生的通话效果更接近于真实的通话。

(不过步骤有点繁琐倒是事实,后续考虑引入不同角色口音的TTS的功能,供用户手动生成IVR语料。目前如果不想这样用,自己下载"剪映"等App,自己去上面生成后导出声音语料,在本界面做导入操作即可。)

  • 五、增加子DTMF的IVR响应

子IVR的各DTMF响应的语料的编辑方式为:点击某个列表项的"IVR路径"之后的【子菜单】的按钮。在新的弹出框中,点击左上角的【+新增】按钮,进行DTMF键值的设置,并对具体IVR语料进行录制或导入操作。

每个DTMF的IVR菜单项,都能够添加新的子DTMF响应,App默认最多可以添加8层的IVR语音逻辑。编辑操作的时候,可以进行逐个层级的添加操作。

  • 六、级联删除DTMF响应及语料

删除DTMF按键的IVR菜单项就要简单得多:点击列表右侧的×按钮,在弹出的确认框中确认,即可正常删除已存在的IVR菜单项。

由于某个被删除的IVR菜单项可能存在子级甚至孙级的IVR菜单项列表,删除的时候为了减轻工作量,将采用级联删除的模式。即用户确认删除后,不管该IVR菜单项是否存在下级菜单列表,均全部级联删除所有的IVR菜单项和对应的语料及文件。

  • 七、总结

从本篇开始,我们尝试花费一些篇幅来实现一套从手机本地,用普通的App实现AI电话机器人和多级IVR语音导航的功能。并对其实现原理和展示效果进行一定的探讨。

本篇我们尝试在拨号器SDK的示例App中,通过界面列表的方式,将多级IVR的编辑界面内容给标注出来,使SDK-Demo的App,能够按用户自己的需要,手动编辑各种层级的IVR的DTMF按键响应的语料。

我们将在下一篇章中,将这些IVR语料与通话对方按下的DTMF按键给联动起来,实现类似于"提示按1转归属地、按2转10086、按0转人工等"的具体业务功能。


上一篇:手机打电话时如何将通话对方的声音在手机上识别成文字

下一篇:编写中。

相关推荐
CG大魔王2 小时前
SenseVoice微调
人工智能·语言模型·音频
爱编程的喵喵2 小时前
Al Agent开发零基础构建复合智能体
人工智能·agent·智能体
Pocker_Spades_A2 小时前
论文精读(六):微服务系统服务依赖发现技术综述
人工智能
catchadmin4 小时前
PHP 快速集成 ChatGPT 用 AI 让你的应用更聪明
人工智能·后端·chatgpt·php
编程武士7 小时前
从50ms到30ms:YOLOv10部署中图像预处理的性能优化实践
人工智能·python·yolo·性能优化
max5006008 小时前
基于Meta Llama的二语习得学习者行为预测计算模型
人工智能·算法·机器学习·分类·数据挖掘·llama
月疯9 小时前
OPENCV摄像头读取视频
人工智能·opencv·音视频
极客天成ScaleFlash9 小时前
极客天成让统一存储从云原生‘进化’到 AI 原生: 不是版本升级,而是基因重组
人工智能·云原生
王哥儿聊AI9 小时前
Lynx:新一代个性化视频生成模型,单图即可生成视频,重新定义身份一致性与视觉质量
人工智能·算法·安全·机器学习·音视频·软件工程
_pinnacle_9 小时前
打开神经网络的黑箱(三) 卷积神经网络(CNN)的模型逻辑
人工智能·神经网络·cnn·黑箱·卷积网络