用于说话人识别的方法、装置、电子设备及可读存储介质与流程

2021-09-14 23:49:00 来源：中国专利 TAG：电子设备识别装置可读说话

技术特征：
1.一种用于说话人识别的方法，其特征在于，包括：获取若干个第一语音片段；各所述第一语音片段分别包括至少一个说话人的音频数据；对各所述第一语音片段进行说话人分类，获得若干个第二语音片段；各所述第二语音片段包括单个说话人的音频数据；确定各所述第二语音片段之间是否语义连续并将语义连续的各所述第二语音片段进行合并，获得若干个第三语音片段；获取各所述第三语音片段的语义特征；根据所述语义特征确定各所述第三语音片段对应的说话人。2.根据权利要求1所述的方法，其特征在于，所述获取若干个第一语音片段，包括：获取第四语音片段；所述第四语音片段包括多个说话人的音频数据；对所述第四语音片段进行去噪处理后获得若干个第一语音片段。3.根据权利要求1所述的方法，其特征在于，确定各所述第二语音片段之间是否语义连续，包括：分别获取各所述第二语音片段对应的识别文本；确定各所述识别文本之间是否语义连续；将语义连续的多个识别文本分别所对应的第二语音片段确定为语义连续的第二语音片段。4.根据权利要求1所述的方法，其特征在于，根据所述语义特征确定各所述第三语音片段对应的说话人，包括：获取各所述第三语音片段的语音特征；将所述语音特征和所述语义特征进行拼接，获得备选特征；根据所述备选特征确定各所述第三语音片段对应的说话人。5.根据权利要求4所述的方法，其特征在于，根据所述备选特征确定各所述第三语音片段对应的说话人，包括：将所述备选特征输入预设的说话人区分模型，获得带有说话人标签的第三语音片段；将所述说话人标签对应的说话人确定为所述第三语音片段对应的说话人。6.根据权利要求4所述的方法，其特征在于，根据所述备选特征确定各所述第三语音片段对应的说话人，包括：根据所述备选特征对各所述第三语音片段进行无监督聚类，获得带有说话人标签的第三语音片段；将所述说话人标签对应的说话人确定为所述第三语音片段对应的说话人。7.根据权利要求1至6任一项所述的方法，其特征在于，根据所述语音特征和语义特征确定各所述第三语音片段对应的说话人后，还包括：将所述第三语音片段按照所述第三语音片段对应的说话人进行归档。8.一种用于说话人识别的装置，其特征在于，包括：第一获取模块，被配置为获取若干个第一语音片段；各所述第一语音片段分别包括至少一个说话人的音频数据；分类模块，被配置为对各所述第一语音片段进行说话人分类，获得若干个第二语音片
段；各所述第二语音片段包括单个说话人的音频数据；合并模块，被配置为确定各所述第二语音片段之间是否语义连续并将语义连续的各所述第二语音片段进行合并，获得若干个第三语音片段；第二获取模块，被配置为获取各所述第三语音片段的语义特征；确定模块，被配置为根据所述语义特征确定各所述第三语音片段对应的说话人。9.一种电子设备，包括处理器和存储有程序指令的存储器，其特征在于，所述处理器被配置为在运行所述程序指令时，执行如权利要求1至7任一项所述的用于说话人识别的方法。10.一种可读存储介质，存储有可执行指令，其特征在于，所述可执行指令在运行时执行如权利要求1至7任一项所述的用于说话人识别的方法。

技术总结
本申请涉及语音识别技术领域，公开一种用于说话人识别的方法，该方法包括：获取若干个第一语音片段；各第一语音片段分别包括至少一个说话人的音频数据；对各第一语音片段进行说话人分类，获得若干个第二语音片段；各第二语音片段包括单个说话人的音频数据；确定各第二语音片段之间是否语义连续并将语义连续的各第二语音片段进行合并，获得若干个第三语音片段；获取各第三语音片段的语义特征；根据语义特征确定各第三语音片段对应的说话人。通过将语义连续的第二语音片段进行合并获得第三语音片段，使得对第三语音片段中的说话人识别更准确。本申请还公开一种用于说话人识别的装置、电子设备及可读存储介质。电子设备及可读存储介质。电子设备及可读存储介质。

技术研发人员：江民
受保护的技术使用者：上海明略人工智能（集团）有限公司
技术研发日：2021.06.11
技术公布日：2021/9/13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

用于说话人识别的方法、装置、电子设备及可读存储介质与流程

相关文章

最热文献