一、背景
随着金融风控、智能安防、数字政务、在线教育、车载系统等应用场景不断增长,声纹识别(Voiceprint Recognition) 已成为身份验证、用户核验与个性化推荐的关键技术。
但在实际使用中,企业往往面临以下痛点:
-
🎙 不同厂商准确率差异大:各家声纹识别模型擅长的场景不同
-
🎧 噪音与录音设备影响强:同一个用户在不同设备采集效果差
-
⚙️ 对接多家服务成本高:每家接口格式不同,维护成本高
-
📈 多模态融合需求增加:需要对比多个声纹库、多个供应商结果
为此,我们推出 声纹融合服务,融合科大讯飞、腾讯云及自研声纹模型,提供更稳、更准、更通用的声纹识别能力。
二、产品概述
1️⃣ 多厂商声纹引擎融合
-
科大讯飞声纹识别:成熟语音生物识别算法,擅长嘈杂环境
-
腾讯云声纹识别:对短语音识别表现优秀,SDK 稳定
-
自研声纹模型:轻量化推理,高并发低延时,适合大规模服务
支持:
-
声纹注册(创建声纹库)
-
声纹特征提取
-
声纹比对(1:1、1:N)
-
声纹融合(多引擎结果加权)
2️⃣ 统一接口,屏蔽复杂差异
-
一套 API 同时调用多个声纹引擎
-
参数统一、结果统一、错误码统一
-
可扩展第三方声纹供应商
三、技术亮点
- 一致化返回:不同厂商的声纹分值范围、置信度标准各不相同,服务内部自动归一化处理,输出统一标准的比对结果。
- 可随机选择厂商:支持在多家声纹服务商之间进行随机调度(Random Vendor Mode),提升整体可用性并避免单厂商异常导致服务不可用。
四、典型应用场景
-
金融风控:注册验证、异常声音监测
-
智能安防:门禁、人证合一
-
在线教育:考试监考身份确认
-
客服机器人:用户身份匹配与个性化问候
-
车载系统:驾驶员自动识别
五、接口说明(Voiceprint Recognition API)
以下为声纹融合服务提供的全部接口,支持声纹库创建、管理、特征提取、1:1 / 1:N 比对等完整流程。
1️⃣ 创建声纹特征库(createRepository)
功能:创建新的声纹库,用于存储声纹特征。
请求方式 : POST /voiceprintRecognition/createRepository
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/createRepository" \
-H "Content-Type: application/json" \
-H "x-zcs-version: v1" \
-H "Authorization:Bearer <token>" \
-d '{}'
返回示例:
{
"error_code": 20000000,
"error_message": "SUCCESS",
"data": {
"GroupId": "iHBVOJzTGkLzumXVsHbIJjGxFWvXxeqK"
}
}
2️⃣ 添加音频特征(addAudioFeature)
功能:上传音频并抽取特征,存入指定声纹库。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| VoiceFormat | int | ✓ | 音频格式(0=wav, 2=pcm) |
| SampleRate | int | ✓ | 采样率,例如 16000 |
| Data | string | ✓ | Base64 音频数据 |
| GroupId | string | ✓ | 声纹库 ID |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/addAudioFeature" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"VoiceFormat":2,
"SampleRate":16000,
"Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
"GroupId":"group001"
}'
返回示例:
{
"success": true,
"data": [
{
"fusionFeatureId": "827d4781-33a3-4fb3-8161-340f6df516eb",
"VoicePrintId": "7189129a7e4ba930d084"
}
]
}
3️⃣ 更新音频特征(updateAudioFeature)
功能:更新已有声纹特征。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| VoicePrintId | string | ✓ | 要更新的特征 ID |
| VoiceFormat | int | ✓ | 音频格式 0=wav, 2=pcm |
| SampleRate | int | ✓ | 采样率 |
| Data | string | ✓ | Base64 音频数据 |
| GroupId | string | ✓ | 声纹库 ID |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/updateAudioFeature" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"VoiceFormat":0,
"SampleRate":16000,
"Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
"GroupId":"group001",
"VoicePrintId":"b9b1f902-cd13-45e9-87d7-1685e666c0fe"
}'
返回示例:
{
"success": true,
"data": [
{
"VoicePrintId": "b9b1f902-cd13-45e9-87d7-1685e666c0fe",
"status": "updated"
}
]
}
4️⃣ 删除音频特征(deleteAudioFeature)
功能:删除指定特征。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| GroupId | string | ✓ | 声纹库 ID |
| VoicePrintId | string | ✓ | 待删除特征 ID |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/deleteAudioFeature" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"GroupId":"group001",
"VoicePrintId":"fcac8503-afd1-45b2-a191-2d44bb53e269"
}'
返回示例:
{
"success": true,
"data": [
{
"VoicePrintId": "fcac8503-afd1-45b2-a191-2d44bb53e269",
"status": "deleted"
}
]
}
5️⃣ 1:1 特征比对(compareAudioFeature)
功能:音频数据与库中特征比对,验证用户身份。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| Data | string | ✓ | 待比对音频 Base64 |
| GroupId | string | ✓ | 声纹库 ID |
| VoicePrintId | string | ✓ | 特征 ID |
| VoiceFormat | int | ✓ | 音频格式 0=wav, 2=pcm |
| SampleRate | int | ✓ | 采样率 |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeature" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"VoiceFormat":0,
"SampleRate":16000,
"Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
"GroupId":"group001",
"VoicePrintId":"b9b1f902-cd13-45e9-87d7-1685e666c0fe"
}'
返回示例:
{
"success": true,
"data": [
{
"Decision": 0,
"Score": "21",
"VoicePrintId": "b9b1f902-cd13-45e9-87d7-1685e666c0fe"
}
]
}
6️⃣ 1:1 音频比对(compareAudioFeatureV2)
功能:两个音频直接比对,无需库特征。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| SrcAudioData | string | ✓ | 源音频 Base64 |
| DestAudioData | string | ✓ | 目标音频 Base64 |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeatureV2" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"SrcAudioData":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
"DestAudioData":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E"
}'
返回示例:
{
"success": true,
"data": [
{
"Decision": 1,
"Score": "100",
"VoicePrintId": ""
}
]
}
7️⃣ 1:N 特征比对(compareAudioFeatureN)
功能:音频与声纹库比对,返回 TopN 匹配结果。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| GroupId | string | ✓ | 声纹库 ID |
| TopN | int | ✓ | 返回前 N 条匹配结果 |
| Data | string | ✓ | 待比对音频 Base64 |
| VoiceFormat | int | ✓ | 音频格式 0=wav, 2=pcm |
| SampleRate | int | ✓ | 采样率 |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeatureN" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"VoiceFormat":0,
"SampleRate":16000,
"GroupId":"group001",
"TopN":10,
"Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E"
}'
返回示例:
{
"success": true,
"data": [
{
"VerifyTops": [
{
"Score":"21",
"SpeakerId":"",
"VoicePrintId":"179d8ca5-d8e6-43d9-a3ff-63161ef12c23"
}
]
}
]
}
8️⃣ 声纹注册数量统计(voicePrintCount)
功能:查询声纹库已注册数量(腾讯专用)。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| GroupId | string | ✓ | 声纹库 ID |
| CountMod | int | ✓ | 查询模式,固定 0 |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/voicePrintCount" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"GroupId":"group001",
"CountMod":0
}'
返回示例:
{
"success": true,
"data": {
"Count": 15
}
}
9️⃣ 删除声纹库(deleteRepository)
功能:删除整个声纹库及其特征。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| GroupId | string | ✓ | 声纹库 ID |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/deleteRepository" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"GroupId":"group001"
}'
返回示例:
{
"success": true,
"data": {
"GroupId": "group001",
"status": "deleted"
}
}
🔟 查询声纹库特征列表(queryFeatureList)
功能:查询声纹库中所有特征信息。
请求参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| GroupId | string | ✓ | 声纹库 ID |
请求示例:
curl -X POST "http://localhost:8080/voiceprintRecognition/queryFeatureList" \
-H "Content-Type: application/json" \
-H "Authorization:Bearer <token>" \
-d '{
"GroupId":"group001"
}'
返回示例:
{
"success": true,
"data": [
{
"FeatureId": "065c9644996a7550e872",
"VoicePrintId": "179d8ca5-d8e6-43d9-a3ff-63161ef12c23",
"FeatureInfo": ""
}
]
}
六、接口调用说明
-
Authorization Header规则-
-1= 自研声纹引擎 -
-4= 腾讯云 -
-11= 科大讯飞 -
默认融合:自研声纹引擎
-
七、API Key 获取说明
-
在智汇云官网 API 市场找到 语音扩展类服务


-
创建应用

-
获取 API Key

-
在 Header 中传入:
Authorization: Bearer <Your-API-Key>
八、合作与接入
我们的声纹融合服务能建设,现面向各行业开放试点接入:
- 开放合作探索 欢迎合作伙伴通过标准 API 接入,共同完善服务能力,拓展声纹融合服务在更多场景的应用价值。
如需获取接口文档或申请试用,请联系我们。