声纹融合服务（Voiceprint Fusion Service）

一、背景

随着金融风控、智能安防、数字政务、在线教育、车载系统等应用场景不断增长，声纹识别（Voiceprint Recognition） 已成为身份验证、用户核验与个性化推荐的关键技术。

但在实际使用中，企业往往面临以下痛点：

🎙 不同厂商准确率差异大：各家声纹识别模型擅长的场景不同
🎧 噪音与录音设备影响强：同一个用户在不同设备采集效果差
⚙️ 对接多家服务成本高：每家接口格式不同，维护成本高
📈 多模态融合需求增加：需要对比多个声纹库、多个供应商结果

为此，我们推出 声纹融合服务，融合科大讯飞、腾讯云及自研声纹模型，提供更稳、更准、更通用的声纹识别能力。

二、产品概述

1️⃣ 多厂商声纹引擎融合

科大讯飞声纹识别：成熟语音生物识别算法，擅长嘈杂环境
腾讯云声纹识别：对短语音识别表现优秀，SDK 稳定
自研声纹模型：轻量化推理，高并发低延时，适合大规模服务

支持：

声纹注册（创建声纹库）
声纹特征提取
声纹比对（1:1、1:N）
声纹融合（多引擎结果加权）

2️⃣ 统一接口，屏蔽复杂差异

一套 API 同时调用多个声纹引擎
参数统一、结果统一、错误码统一
可扩展第三方声纹供应商

三、技术亮点

一致化返回：不同厂商的声纹分值范围、置信度标准各不相同，服务内部自动归一化处理，输出统一标准的比对结果。
可随机选择厂商：支持在多家声纹服务商之间进行随机调度（Random Vendor Mode），提升整体可用性并避免单厂商异常导致服务不可用。

四、典型应用场景

金融风控：注册验证、异常声音监测
智能安防：门禁、人证合一
在线教育：考试监考身份确认
客服机器人：用户身份匹配与个性化问候
车载系统：驾驶员自动识别

五、接口说明（Voiceprint Recognition API）

以下为声纹融合服务提供的全部接口，支持声纹库创建、管理、特征提取、1:1 / 1:N 比对等完整流程。

1️⃣ 创建声纹特征库（createRepository）

功能：创建新的声纹库，用于存储声纹特征。

请求方式 ： POST /voiceprintRecognition/createRepository

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/createRepository" \
     -H "Content-Type: application/json" \
     -H "x-zcs-version: v1" \
     -H "Authorization:Bearer <token>" \
     -d '{}'

返回示例：

复制代码

{
  "error_code": 20000000,
  "error_message": "SUCCESS",
  "data": {
    "GroupId": "iHBVOJzTGkLzumXVsHbIJjGxFWvXxeqK"
  }
}

2️⃣ 添加音频特征（addAudioFeature）

功能：上传音频并抽取特征，存入指定声纹库。

请求参数：

字段	类型	必填	说明
VoiceFormat	int	✓	音频格式（0=wav, 2=pcm）
SampleRate	int	✓	采样率，例如 16000
Data	string	✓	Base64 音频数据
GroupId	string	✓	声纹库 ID

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/addAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":2,
        "SampleRate":16000,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "GroupId":"group001"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": [
    {
      "fusionFeatureId": "827d4781-33a3-4fb3-8161-340f6df516eb",
      "VoicePrintId": "7189129a7e4ba930d084"
    }
  ]
}

3️⃣ 更新音频特征（updateAudioFeature）

功能：更新已有声纹特征。

请求参数：

字段	类型	必填	说明
VoicePrintId	string	✓	要更新的特征 ID
VoiceFormat	int	✓	音频格式 0=wav, 2=pcm
SampleRate	int	✓	采样率
Data	string	✓	Base64 音频数据
GroupId	string	✓	声纹库 ID

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/updateAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":0,
        "SampleRate":16000,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "GroupId":"group001",
        "VoicePrintId":"b9b1f902-cd13-45e9-87d7-1685e666c0fe"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": [
    {
      "VoicePrintId": "b9b1f902-cd13-45e9-87d7-1685e666c0fe",
      "status": "updated"
    }
  ]
}

4️⃣ 删除音频特征（deleteAudioFeature）

功能：删除指定特征。

请求参数：

字段	类型	必填	说明
GroupId	string	✓	声纹库 ID
VoicePrintId	string	✓	待删除特征 ID

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/deleteAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001",
        "VoicePrintId":"fcac8503-afd1-45b2-a191-2d44bb53e269"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": [
    {
      "VoicePrintId": "fcac8503-afd1-45b2-a191-2d44bb53e269",
      "status": "deleted"
    }
  ]
}

5️⃣ 1:1 特征比对（compareAudioFeature）

功能：音频数据与库中特征比对，验证用户身份。

请求参数：

字段	类型	必填	说明
Data	string	✓	待比对音频 Base64
GroupId	string	✓	声纹库 ID
VoicePrintId	string	✓	特征 ID
VoiceFormat	int	✓	音频格式 0=wav, 2=pcm
SampleRate	int	✓	采样率

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeature" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":0,
        "SampleRate":16000,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "GroupId":"group001",
        "VoicePrintId":"b9b1f902-cd13-45e9-87d7-1685e666c0fe"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": [
    {
      "Decision": 0,
      "Score": "21",
      "VoicePrintId": "b9b1f902-cd13-45e9-87d7-1685e666c0fe"
    }
  ]
}

6️⃣ 1:1 音频比对（compareAudioFeatureV2）

功能：两个音频直接比对，无需库特征。

请求参数：

字段	类型	必填	说明
SrcAudioData	string	✓	源音频 Base64
DestAudioData	string	✓	目标音频 Base64

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeatureV2" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "SrcAudioData":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E",
        "DestAudioData":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": [
    {
      "Decision": 1,
      "Score": "100",
      "VoicePrintId": ""
    }
  ]
}

7️⃣ 1:N 特征比对（compareAudioFeatureN）

功能：音频与声纹库比对，返回 TopN 匹配结果。

请求参数：

字段	类型	必填	说明
GroupId	string	✓	声纹库 ID
TopN	int	✓	返回前 N 条匹配结果
Data	string	✓	待比对音频 Base64
VoiceFormat	int	✓	音频格式 0=wav, 2=pcm
SampleRate	int	✓	采样率

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/compareAudioFeatureN" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "VoiceFormat":0,
        "SampleRate":16000,
        "GroupId":"group001",
        "TopN":10,
        "Data":"UklGRka1CQBXQVZFZm10IBAAAAABAAEAgD4E"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": [
    {
      "VerifyTops": [
        {
          "Score":"21",
          "SpeakerId":"",
          "VoicePrintId":"179d8ca5-d8e6-43d9-a3ff-63161ef12c23"
        }
      ]
    }
  ]
}

8️⃣ 声纹注册数量统计（voicePrintCount）

功能：查询声纹库已注册数量（腾讯专用）。

请求参数：

字段	类型	必填	说明
GroupId	string	✓	声纹库 ID
CountMod	int	✓	查询模式，固定 0

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/voicePrintCount" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001",
        "CountMod":0
     }'

返回示例：

复制代码

{
  "success": true,
  "data": {
    "Count": 15
  }
}

9️⃣ 删除声纹库（deleteRepository）

功能：删除整个声纹库及其特征。

请求参数：

字段	类型	必填	说明
GroupId	string	✓	声纹库 ID

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/deleteRepository" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": {
    "GroupId": "group001",
    "status": "deleted"
  }
}

🔟 查询声纹库特征列表（queryFeatureList）

功能：查询声纹库中所有特征信息。

请求参数：

字段	类型	必填	说明
GroupId	string	✓	声纹库 ID

请求示例：

复制代码

curl -X POST "http://localhost:8080/voiceprintRecognition/queryFeatureList" \
     -H "Content-Type: application/json" \
     -H "Authorization:Bearer <token>" \
     -d '{
        "GroupId":"group001"
     }'

返回示例：

复制代码

{
  "success": true,
  "data": [
    {
      "FeatureId": "065c9644996a7550e872",
      "VoicePrintId": "179d8ca5-d8e6-43d9-a3ff-63161ef12c23",
      "FeatureInfo": ""
    }
  ]
}

六、接口调用说明

Authorization Header 规则
- -1 = 自研声纹引擎
- -4 = 腾讯云
- -11 = 科大讯飞
- 默认融合：自研声纹引擎

七、API Key 获取说明

在智汇云官网 API 市场找到 语音扩展类服务
创建应用
获取 API Key
在 Header 中传入：

Authorization: Bearer <Your-API-Key>

八、合作与接入

我们的声纹融合服务能建设，现面向各行业开放试点接入：

开放合作探索 欢迎合作伙伴通过标准 API 接入，共同完善服务能力，拓展声纹融合服务在更多场景的应用价值。

如需获取接口文档或申请试用，请联系我们。

API市场地址：https://zyun.360.cn/product/apimarket