通过腾讯云国际站代理商的 SOE 进行口语评测,核心是先完成代理商侧的账号与权限配置,再按腾讯云 SOE 的技术规范完成开通、集成与调用,支持实时流式评测和录音文件评测两种主流方式,具体步骤如下:
- 前期准备(依托代理商完成基础配置)
- 账号与权限开通:向代理商申请开通腾讯云 SOE 服务权限,获取专属的 AppID、SecretId 和 SecretKey。代理商可协助完成权限校验、跨区域服务开通,还能根据业务场景申请适配目标市场的评测模型(如东南亚多语言适配、欧美成人严格打分模型)。
- 明确评测参数:提前确定核心参数,比如评分系数(1.0 适配儿童,4.0 适配成人严格场景)、评测模式(单词 / 句子 / 段落等)、音频格式(如 PCM、WAV)、是否需要输出中间结果等,代理商可提供参数配置建议适配具体业务。
- 技术集成(按终端场景选择适配方式) 腾讯云 SOE 支持多端 SDK 集成和 API 调用,代理商可协助解决集成中的兼容性问题,具体集成方向如下:
- SDK 集成:针对 Android、iOS、Web 等终端,直接接入对应平台的 SOE SDK,按文档完成初始化配置,比如 Android 端兼容 JDK1.6 及以上,iOS 端适配 iOS8.0 及以上。
- API 调用:通过 WebSocket 协议调用实时评测接口,或通过 HTTP 接口处理录音文件评测,适合服务端集成场景,支持 Python、Java 等主流开发语言。

- 发起评测(两种主流方式操作流程) 评测分为实时流式和录音文件两种核心场景,操作流程有差异,具体如下:
- **实时流式评测(适合在线课堂、实时口语练习)**第一步是握手建立连接。客户端发起 WebSocket 连接请求,请求 URL 需携带 AppID、SecretId、签名等参数。签名需按规则生成:先对除 signature 外的参数按字典序排序,拼接成签名原文,再用 SecretKey 做 HmacSha1 加密并 Base64 编码。握手成功后,服务端返回 code 为 0 的确认消息。第二步是传输音频并获取结果。采用分片方式传输音频流(实时模式),设置 WorkMode=0,SeqId 从 1 开始递增,最后一片音频设置 IsEnd=1。若需实时看到评测进度,可设置 SentenceInfoEnabled=1,服务端会返回断句中间结果;音频传输完成后,服务端返回 final=1 的最终结果,包含准确度、流畅度等评分。
- **录音文件评测(适合课后作业、离线考试)**先将录音文件转为 SOE 支持的格式(如 PCM,时长上限 60 秒),并转为 Base64 编码的 UserVoiceData。调用接口时设置 rec_mode=1(录音识别模式),一次性发送完整音频数据。无需分片传输,单次连接对应一次录音评测,获取结果后关闭连接即可。
- 结果解析与二次处理服务端返回的结果为 JSON 格式,核心关注 code(0 代表正常)、result 字段(包含音素级准确度、句子流利度、语速等细项)。若需纠错或多音词适配,可根据返回的 MatchTag 字段调整参数,比如遇到生僻词时,设置 TextMode=1 并通过 Wordlist 指定音素结构。同时代理商可协助对接数据存储服务,将评测结果归档用于后续学情分析。