一种基于语音识别的目标文本获取方法及装置、存储介质与流程

2022-09-14 23:51:12 来源：中国专利 TAG：

技术特征：
1.一种基于语音识别的目标文本获取方法，其特征在于，包括：获取第一语音片段对应的第一识别文本，将所述第一识别文本作为待判断文本，判断所述待判断文本是否属于完整文本；当所述待判断文本不属于完整文本时，判断预设时间间隔内是否获取到第二语音片段对应的第二识别文本；当结果为否时，将所述待判断文本作为所述目标文本；当结果为是时，基于所述第二识别文本更新所述待判断文本，并返回至所述判断所述待判断文本是否属于完整文本的步骤，直至所述待判断文本属于完整文本，或者所述当结果为否时结束，得到所述目标文本。2.根据权利要求1所述的方法，其特征在于，所述判断所述待判断文本是否属于完整文本，包括：基于预设匹配文本，判断所述待判断文本是否属于不完整文本；当结果为是时，输出所述判断结果；当结果为否时，将所述待判断文本输入至文本完整性识别模型中，基于所述文本完整性识别模型的模型输出结果确定所述待判断文本是否属于完整文本。3.根据权利要求2所述的方法，其特征在于，所述基于预设匹配文本，判断所述待判断文本是否属于不完整文本，包括：基于精准匹配模式，确定所述待判断文本中是否包含第一预设匹配文本；和/或，基于局部匹配模式，确定所述待判断文本的句尾是否包含第二预设匹配文本；和/或，基于正则匹配模式，确定所述待判断文本中是否包含第三预设匹配文本；当存在包含的结果时，判断所述待判断文本属于不完整文本。4.根据权利要求2所述的方法，其特征在于，所述基于预设匹配文本，判断所述待判断文本是否属于不完整文本之前，所述方法还包括：获取人机会话日志，从所述人机会话日志中确定历史用户对应的历史语音记录，为所述历史语音记录添加属性标签，所述属性标签包括完整标签以及不完整标签；从带有完整标签的历史语音记录中，识别出存在停顿时间且停顿时间大于预设停顿时长的第一语音记录，从所述第一语音记录中确定停顿时间大于所述预设停顿时长的目标位置，依据所述目标位置确定第一文本，并基于所述第一文本确定所述第一预设匹配文本；和/或，从带有不完整标签的历史语音记录中，识别每个语音结尾处对应的第二文本，并将出现次数大于第一次数阈值的所述第二文本作为所述第二预设匹配文本；和/或，从带有不完整标签的历史语音记录中确定出现次数大于第二次数阈值的正则表达式，并基于所述正则表达式确定所述第三预设匹配文本。5.根据权利要求4所述的方法，其特征在于，所述为所述历史语音记录添加属性标签之后，所述方法还包括：将所述历史语音记录转化为对应的历史文本，对所述历史文本进行分词处理，并基于分词处理结果，确定每个所述历史文本对应的词向量组合；分别将所述词向量组合输入至初始识别模型，并基于输出的预测结果以及所述历史文本对应的属性标签，确定所述初始识别模型的模型损失值；
当所述模型损失值大于预设损失阈值时，调整所述初始识别模型的模型参数，并返回至所述分别将所述词向量组合输入至初始识别模型的步骤，直至所述模型损失值小于或者等于所述预设损失阈值时结束，得到所述文本完整性识别模型。6.根据权利要求1所述的方法，其特征在于，所述基于所述第二识别文本更新所述待判断文本，包括：将所述第一识别文本与所述第二识别文本按照文本产生时间进行拼接，并基于拼接结果更新所述待判断文本。7.根据权利要求1所述的方法，其特征在于，所述判断预设时间间隔内是否获取到第二语音片段对应的第二识别文本之前，所述方法还包括：启动预设定时器，并将所述预设定时器的定时时间设置为所述预设时间间隔；相应地，所述当结果为否时之后，所述方法还包括：将所述预设定时器的定时时间进行清零处理。8.一种基于语音识别的目标文本获取装置，其特征在于，包括：文本获取模块，用于获取第一语音片段对应的第一识别文本，将所述第一识别文本作为待判断文本，判断所述待判断文本是否属于完整文本；判断模块，用于当所述待判断文本不属于完整文本时，判断预设时间间隔内是否获取到第二语音片段对应的第二识别文本；目标文本确定模块，用于当结果为否时，将所述待判断文本作为所述目标文本；返回模块，用于当结果为是时，基于所述第二识别文本更新所述待判断文本，并返回至所述判断所述待判断文本是否属于完整文本的步骤，直至所述待判断文本属于完整文本，或者所述当结果为否时结束，得到所述目标文本。9.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。10.一种计算机设备，包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。

技术总结
本申请公开了一种基于语音识别的目标文本获取方法及装置、存储介质、计算机设备，该方法包括：获取第一语音片段对应的第一识别文本，将所述第一识别文本作为待判断文本，判断所述待判断文本是否属于完整文本；当所述待判断文本不属于完整文本时，判断预设时间间隔内是否获取到第二语音片段对应的第二识别文本；当结果为否时，将所述待判断文本作为所述目标文本；当结果为是时，基于所述第二识别文本更新所述待判断文本，并返回至所述判断所述待判断文本是否属于完整文本的步骤，直至所述待判断文本属于完整文本，或者当结果为否时结束，得到所述目标文本。本申请可以在保证外呼机器人及时应答的前提下，快速、准确地得到用户语音的完整识别文本。音的完整识别文本。音的完整识别文本。

技术研发人员：张航飞黄明星王福钋沈鹏
受保护的技术使用者：北京健康之家科技有限公司
技术研发日：2022.06.21
技术公布日：2022/9/13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于语音识别的目标文本获取方法及装置、存储介质与流程

相关文献

最热文献