说话人分离中的聚类方法:深入解析Agglomerative聚类、KMeans聚类和Oracle聚类说话人分离(Speaker Diarization)是将音频流根据说话人身份划分为同质片段的过程。这一过程中的关键步骤是聚类,即将说话人嵌入(embeddings)分组为不同的簇,每个簇代表一个独特的说话人。在pyannote.audio`管道中使用的三种聚类方法:层次聚类(Agglomerative Clustering)、KMeans聚类(KMeans Clustering)和Oracle聚类(Oracle Clustering)。