语音对话检测方法及装置与流程

2022-08-02 23:26:10 来源：中国专利 TAG：

技术特征：
1.一种语音对话检测方法，其特征在于，包括：基于目标语音数据中的语音对话的对话相关信息及对话文本，对所述目标语音数据中的语音对话进行插抢话预检测，得到候选语音对话，其中，所述目标语音数据包括不同角色的说话人的语音对话，所述对话相关信息包括对话起止时间信息及说话人角色；基于预设情绪识别模型对所述候选语音对话进行情绪识别，得到情绪识别结果；基于所述情绪识别结果和所述候选语音对话的语音特征，确定所述候选语音对话是否存在插抢话行为。2.根据权利要求1所述的方法，其特征在于，所述情绪识别结果包括所述候选语音对话的负向情绪值；所述候选语音对话的语音特征包括所述候选语音对话相对于第一关联语音对话的音量变化值，所述第一关联语音对话的说话人角色与所述候选语音对话的说话人角色相同；所述基于所述情绪识别结果和所述候选语音对话的语音特征，确定所述候选语音对话是否存在插抢话行为，包括：若所述候选语音对话的负向情绪值超过预设情绪阈值或者所述音量变化值超过预设音量值，则确定所述候选语音对话存在插抢话行为。3.根据权利要求1所述的方法，其特征在于，在基于所述情绪识别结果和所述候选语音对话的语音特征，确定所述候选语音对话是否存在插抢话行为之前，所述方法还包括：基于所述候选语音对话的第二关联语音对话和第三关联语音对话，确定所述候选语音对话是否满足预设免检条件，其中，所述第二关联语音对话的说话人角色与所述候选语音对话的说话人角色不同，所述第三关联语音对话的说话人角色与所述候选语音对话的说话人角色不同；所述基于所述情绪识别结果和所述候选语音对话的语音特征，确定所述候选语音对话是否存在插抢话行为，包括：若所述候选语音对话不满足所述预设免检条件，则基于所述情绪识别结果和所述候选语音对话的语音特征，确定所述候选语音对话是否存在插抢话行为。4.根据权利要求3所述的方法，其特征在于，所述预设免检条件包括所述第二关联语音对话的意图为结束对话、且所述第三关联语音对话的对话文本与预设结束对话文本之间的匹配程度值超过第一预设程度阈值；所述基于所述候选语音对话的第二关联语音对话和所述第三关联语音对话，确定所述候选语音对话是否满足预设免检条件，包括：基于预设意图识别模型和所述第二关联语音对话的对话文本，对所述第二关联语音对话进行意图识别，得到所述第二关联语音对话的意图识别结果其中，所述第二关联语音对话的起始时间位于所述候选语音对话的起始时间之前；将所述第三关联语音对话的对话文本与预设结束对话文本进行匹配，得到第一匹配结果，其中，所述第三关联语音对话的起始时间位于所述第二关联语音对话的起始时间与所述候选语音对话的起始时间之间；基于所述意图识别结果和所述第一匹配结果，确定所述候选语音对话是否满足所述预设免检条件。5.根据权利要求3所述的方法，其特征在于，在基于所述候选语音对话的第二关联语音
对话和所述第三关联语音对话，确定所述候选语音对话是否满足预设免检条件之后，所述方法还包括：若所述候选语音对话满足所述预设免检条件，则确定所述候选语音对话不存在插抢话行为。6.根据权利要求1所述的方法，其特征在于，所述基于目标语音数据中的语音对话的对话相关信息及对话文本，对所述目标语音数据中的语音对话进行插抢话预检测，得到候选语音对话，包括：若第一语音对话与第二语音对话各自的说话人角色不同，则基于所述第一语音对话的结束时间和所述第二语音对话的起始时间，确定所述第一语音对话与所述第二语音对话之间的交叉时长，其中，所述第一语音对话和所述第二语音对话为所述目标语音数据中任意相邻的两句语音对话，且所述第一语音对话的起始时间位于所述第二语音对话的起始时间之前；若所述交叉时长超过预设时长或者所述第二语音对话的对话文本包含的字符数超过预设字符数，则将所述第二语音对话确定为所述候选语音对话。7.根据权利要求6所述的方法，其特征在于，在基于目标语音数据中的语音对话的对话相关信息及对话文本，对所述目标语音数据中的语音对话进行插抢话预检测，所述方法还包括：确定所述第二语音对话的对话文本是否包含预设词语；若所述第二语音对话的对话文本包含预设词语，则删除所述第二语音对话的对话文本中的预设词语。8.根据权利要求7所述的方法，其特征在于，所述确定所述第二语音对话的对话文本是否包含预设词语，包括：对所述第二语音对话的对话文本进行分词处理，得到所述第二语音对话的对话文本包含的词语；将所述第二语音对话的对话文本包含的词语与预设词语库中的预设词语进行匹配，得到第二匹配结果；基于所述第二匹配结果，确定所述第二语音对话的对话文本中是否包含预设词语。9.根据权利要求7所述的方法，其特征在于，所述确定所述第二语音对话的对话文本是否包含预设词语，包括：将所述第二语音对话的对话文本输入预先训练的词语识别模型，得到所述第二语音对话的对话文本的词语识别结果，其中，所述词语识别结果用于指示对应的对话文本是否包含预设词语，所述词语识别模型是基于样本文本及所述样本文本包含的词语的词语标签进行模型训练得到的，词语的词语标签用于指示词语是否为预设词语。10.一种语音对话检测装置，其特征在于，包括：第一确定模块，用于基于目标语音数据中的语音对话的对话相关信息及对话文本，对所述目标语音数据中的语音对话进行插抢话预检测，得到候选语音对话，其中，所述目标语音数据包括不同角色的说话人的语音对话，所述对话相关信息包括对话起止时间信息及说话人角色；情绪识别模块，用于基于预设情绪识别模型对所述候选语音对话进行情绪识别，得到
情绪识别结果；第二确定模块，用于基于所述情绪识别结果和所述候选语音对话的语音特征，确定所述候选语音对话是否存在插抢话行为。11.一种电子设备，其特征在于，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如权利要求1至9中任一项所述的方法。12.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至9中任一项所述的方法。

技术总结
本申请公开了一种语音对话检测方法及装置，用于解决现有的语音对话检测方法的检测准确率低的问题。所述方法包括：基于目标语音数据中的语音对话的对话相关信息及对话文本，对所述目标语音数据中的语音对话进行插抢话预检测，得到候选语音对话，其中，所述目标语音数据包括不同角色的说话者的语音对话，所述对话相关信息包括对话起止时间信息及说话人角色；基于预设情绪识别模型对所述候选语音对话进行情绪识别，得到情绪识别结果；基于所述情绪识别结果和所述候选语音对话的语音特征，确定所述候选语音对话是否存在插抢话行为。所述候选语音对话是否存在插抢话行为。所述候选语音对话是否存在插抢话行为。

技术研发人员：邓成东曾琳铖曦郭江吴海英
受保护的技术使用者：马上消费金融股份有限公司
技术研发日：2022.04.24
技术公布日：2022/8/1

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音唤醒方法、装置、电子设备及存储介质与流程

语音对话检测方法及装置与流程

相关文献

最热文献