声纹融合服务(Voiceprint Fusion Service)

一、背景

随着金融风控、智能安防、数字政务、在线教育、车载系统等应用场景不断增长,声纹识别(Voiceprint Recognition) 已成为身份验证、用户核验与个性化推荐的关键技术。

但在实际使用中,企业往往面临以下痛点:

  • 🎙 不同厂商准确率差异大:各家声纹识别模型擅长的场景不同

  • 🎧 噪音与录音设备影响强:同一个用户在不同设备采集效果差

  • ⚙️ 对接多家服务成本高:每家接口格式不同,维护成本高

  • 📈 多模态融合需求增加:需要对比多个声纹库、多个供应商结果

为此,我们推出 声纹融合服务,融合科大讯飞、腾讯云及自研声纹模型,提供更稳、更准、更通用的声纹识别能力。


二、产品概述

1️⃣ 多厂商声纹引擎融合

  • 科大讯飞声纹识别:成熟语音生物识别算法,擅长嘈杂环境

  • 腾讯云声纹识别:对短语音识别表现优秀,SDK 稳定

  • 自研声纹模型:轻量化推理,高并发低延时,适合大规模服务

支持:

  • 声纹注册(创建声纹库)

  • 声纹特征提取

  • 声纹比对(1:1、1:N)

  • 声纹融合(多引擎结果加权)


2️⃣ 统一接口,屏蔽复杂差异

  • 一套 API 同时调用多个声纹引擎

  • 参数统一、结果统一、错误码统一

  • 可扩展第三方声纹供应商


三、技术亮点

  • 一致化返回:不同厂商的声纹分值范围、置信度标准各不相同,服务内部自动归一化处理,输出统一标准的比对结果。
  • 可随机选择厂商:支持在多家声纹服务商之间进行随机调度(Random Vendor Mode),提升整体可用性并避免单厂商异常导致服务不可用。

四、典型应用场景

  • 金融风控:注册验证、异常声音监测

  • 智能安防:门禁、人证合一

  • 在线教育:考试监考身份确认

  • 客服机器人:用户身份匹配与个性化问候

  • 车载系统:驾驶员自动识别


五、接口说明(Voiceprint Recognition API)

以下为声纹融合服务提供的全部接口,支持声纹库创建、管理、特征提取、1:1 / 1:N 比对等完整流程。

1️⃣ 创建声纹特征库(createRepository)

功能:创建新的声纹库,用于存储声纹特征。

请求方式POST /voiceprintRecognition/createRepository

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/createRepository" \
     -H "Content-Type: application/json" \
     -H "x-zcs-version: v1" \
     -H "Authorization:Bearer <token>" \
     -d '{}'

返回示例

复制代码
{
  "error_code": 20000000,
  "error_message": "SUCCESS",
  "data": {
    "GroupId": "iHBVOJzTGkLzumXVsHbIJjGxFWvXxeqK"
  }
}

2️⃣ 添加音频特征(addAudioFeature)

功能:上传音频并抽取特征,存入指定声纹库。

请求参数

字段 类型 必填 说明
VoiceFormat int 音频格式(0=wav, 2=pcm)
SampleRate int 采样率,例如 16000
Data string Base64 音频数据
GroupId string 声纹库 ID

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/addAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":2,
        "SampleRate":16000,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "GroupId":"group001"
     }'

返回示例

复制代码
{
  "success": true,
  "data": [
    {
      "fusionFeatureId": "827d4781-33a3-4fb3-8161-340f6df516eb",
      "VoicePrintId": "7189129a7e4ba930d084"
    }
  ]
}

3️⃣ 更新音频特征(updateAudioFeature)

功能:更新已有声纹特征。

请求参数

字段 类型 必填 说明
VoicePrintId string 要更新的特征 ID
VoiceFormat int 音频格式 0=wav, 2=pcm
SampleRate int 采样率
Data string Base64 音频数据
GroupId string 声纹库 ID

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/updateAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":0,
        "SampleRate":16000,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "GroupId":"group001",
        "VoicePrintId":"b9b1f902-cd13-45e9-87d7-1685e666c0fe"
     }'

返回示例

复制代码
{
  "success": true,
  "data": [
    {
      "VoicePrintId": "b9b1f902-cd13-45e9-87d7-1685e666c0fe",
      "status": "updated"
    }
  ]
}

4️⃣ 删除音频特征(deleteAudioFeature)

功能:删除指定特征。

请求参数

字段 类型 必填 说明
GroupId string 声纹库 ID
VoicePrintId string 待删除特征 ID

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/deleteAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001",
        "VoicePrintId":"fcac8503-afd1-45b2-a191-2d44bb53e269"
     }'

返回示例

复制代码
{
  "success": true,
  "data": [
    {
      "VoicePrintId": "fcac8503-afd1-45b2-a191-2d44bb53e269",
      "status": "deleted"
    }
  ]
}

5️⃣ 1:1 特征比对(compareAudioFeature)

功能:音频数据与库中特征比对,验证用户身份。

请求参数

字段 类型 必填 说明
Data string 待比对音频 Base64
GroupId string 声纹库 ID
VoicePrintId string 特征 ID
VoiceFormat int 音频格式 0=wav, 2=pcm
SampleRate int 采样率

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":0,
        "SampleRate":16000,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "GroupId":"group001",
        "VoicePrintId":"b9b1f902-cd13-45e9-87d7-1685e666c0fe"
     }'

返回示例

复制代码
{
  "success": true,
  "data": [
    {
      "Decision": 0,
      "Score": "21",
      "VoicePrintId": "b9b1f902-cd13-45e9-87d7-1685e666c0fe"
    }
  ]
}

6️⃣ 1:1 音频比对(compareAudioFeatureV2)

功能:两个音频直接比对,无需库特征。

请求参数

字段 类型 必填 说明
SrcAudioData string 源音频 Base64
DestAudioData string 目标音频 Base64

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeatureV2" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "SrcAudioData":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "DestAudioData":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E"
     }'

返回示例

复制代码
{
  "success": true,
  "data": [
    {
      "Decision": 1,
      "Score": "100",
      "VoicePrintId": ""
    }
  ]
}

7️⃣ 1:N 特征比对(compareAudioFeatureN)

功能:音频与声纹库比对,返回 TopN 匹配结果。

请求参数

字段 类型 必填 说明
GroupId string 声纹库 ID
TopN int 返回前 N 条匹配结果
Data string 待比对音频 Base64
VoiceFormat int 音频格式 0=wav, 2=pcm
SampleRate int 采样率

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeatureN" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":0,
        "SampleRate":16000,
        "GroupId":"group001",
        "TopN":10,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E"
     }'

返回示例

复制代码
{
  "success": true,
  "data": [
    {
      "VerifyTops": [
        {
          "Score":"21",
          "SpeakerId":"",
          "VoicePrintId":"179d8ca5-d8e6-43d9-a3ff-63161ef12c23"
        }
      ]
    }
  ]
}

8️⃣ 声纹注册数量统计(voicePrintCount)

功能:查询声纹库已注册数量(腾讯专用)。

请求参数

字段 类型 必填 说明
GroupId string 声纹库 ID
CountMod int 查询模式,固定 0

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/voicePrintCount" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001",
        "CountMod":0
     }'

返回示例

复制代码
{
  "success": true,
  "data": {
    "Count": 15
  }
}

9️⃣ 删除声纹库(deleteRepository)

功能:删除整个声纹库及其特征。

请求参数

字段 类型 必填 说明
GroupId string 声纹库 ID

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/deleteRepository" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001"
     }'

返回示例

复制代码
{
  "success": true,
  "data": {
    "GroupId": "group001",
    "status": "deleted"
  }
}

🔟 查询声纹库特征列表(queryFeatureList)

功能:查询声纹库中所有特征信息。

请求参数

字段 类型 必填 说明
GroupId string 声纹库 ID

请求示例

复制代码
curl -X POST "http://localhost:8080/voiceprintRecognition/queryFeatureList" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001"
     }'

返回示例

复制代码
{
  "success": true,
  "data": [
    {
      "FeatureId": "065c9644996a7550e872",
      "VoicePrintId": "179d8ca5-d8e6-43d9-a3ff-63161ef12c23",
      "FeatureInfo": ""
    }
  ]
}

六、接口调用说明

  • Authorization Header 规则

    • -1 = 自研声纹引擎

    • -4 = 腾讯云

    • -11 = 科大讯飞

    • 默认融合:自研声纹引擎

七、API Key 获取说明

  1. 智汇云官网 API 市场找到 语音扩展类服务

  2. 创建应用

  3. 获取 API Key

  4. 在 Header 中传入:

    Authorization: Bearer <Your-API-Key>


八、合作与接入

我们的声纹融合服务能建设,现面向各行业开放试点接入:

  • 开放合作探索 欢迎合作伙伴通过标准 API 接入,共同完善服务能力,拓展声纹融合服务在更多场景的应用价值。

如需获取接口文档或申请试用,请联系我们。

API市场地址:https://zyun.360.cn/product/apimarket