一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频的处理方法和装置与流程

2021-07-13 16:21:00 来源:中国专利 TAG:音频处理 语音 装置 公开 计算机

技术特征:

1.一种音频的处理方法,所述方法包括:

获取会话的会话音频,确定所述会话音频的语音识别结果中的多种会话关键词,其中,所述多种会话关键词包括所述会话中待办任务的执行者词、动作词和任务词;

对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合,其中,关联组合用于指示执行者采用动作执行待办任务;

根据所述至少一个关联组合,生成所述会话的会话纪要。

2.根据权利要求1所述的方法,其中,所述对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合,包括:

基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合。

3.根据权利要求2所述的方法,其中,所述基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合,包括:

对于所述多种会话关键词中,相同语句内不同种的会话关键词进行句内关联,得到至少一个初始关联组合;以及

对于所述至少一个初始关联组合中的初始关联组合,响应于确定该初始关联组合缺少任意种的会话关键词,在该初始关联组合所在语句的上下文语句中,确定所述任意种的会话关键词作为目标关键词,将所述目标关键词补充到该初始关联组合中;

将补充后的所述至少一个初始关联组合作为所述至少一个关联组合。

4.根据权利要求2所述的方法,其中,所述基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合,包括:

对所述多种会话关键词中不同种的会话关键词进行句内关联和上下文关联,得到所述至少一个关联组合。

5.根据权利要求3所述的方法,其中,所述对所述多种会话关键词中不同种的会话关键词进行句内关联和上下文关联,得到所述至少一个关联组合,包括:

对于所述多种会话关键词中,相同语句内不同种的会话关键词进行句内关联,得到至少一个初始关联组合;

对于所述至少一个初始关联组合中的初始关联组合,响应于确定该初始关联组合中存在代词,在所述代词的上文语句中,确定所述代词所指代的会话关键词作为目标关键词,利用所述目标关键词替换所述代词;

将替换后的至少一个初始关联组合作为所述至少一个关联组合。

6.根据权利要求1所述的方法,其中,在所述对所述多种会话关键词中不同种的会话关键词进行关联之前,所述方法还包括:

响应于确定所述多种会话关键词中存在代词,在该代词所在语句的上文语句中,确定所述代词所指代的会话关键词作为目标关键词;

利用所述目标关键词替换所述代词,得到更新后的多种会话关键词;以及

所述基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合,包括:

对更新后的所述多种会话关键词中,相同语句内不同种的会话关键词进行句内关联,得到所述至少一个关联组合。

7.根据权利要求1-6之一所述的方法,其中,所述多种会话关键词还包括时间词,所述关联组合还用于指示执行待办任务的时间范围。

8.根据权利要求1所述的方法,其中,所述根据所述至少一个关联组合,生成所述会话的会话纪要,包括:

执行以下关联组合的合并步骤:对执行者词相同的关联组合进行合并,得到指示相同执行者执行不同任务的合并结果;或者,对任务词相同的关联组合进行合并,得到指示不同执行者执行相同任务的合并结果;

按照合并结果,生成所述会话的会话纪要。

9.根据权利要求1所述的方法,其中,所述多种会话关键词的生成步骤包括:

对所述语音识别结果进行分词,得到至少两个词;

确定出所述至少两个词中,与对所述会话预设的关键词相匹配的词,并将相匹配的词作为所述多个会话关键词。

10.一种音频的处理装置,所述装置包括:

获取单元,被配置成获取会话的会话音频,确定所述会话音频的语音识别结果中的多种会话关键词,其中,所述多种会话关键词包括所述会话中待办任务的执行者词、动作词和任务词;

关联单元,被配置成对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合,其中,关联组合用于指示执行者采用动作执行待办任务;

生成单元,被配置成根据所述至少一个关联组合,生成所述会话的会话纪要。

11.根据权利要求9所述的装置,其中,所述关联单元,进一步被配置成按照如下方式执行所述对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合:

基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合。

12.根据权利要求11所述的装置,其中,所述关联单元,进一步被配置成按照如下方式执行所述基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合:

对于所述多种会话关键词中,相同语句内不同种的会话关键词进行句内关联,得到至少一个初始关联组合;以及

对于所述至少一个初始关联组合中的初始关联组合,响应于确定该初始关联组合缺少任意种的会话关键词,在该初始关联组合所在语句的上下文语句中,确定所述任意种的会话关键词作为目标关键词,将所述目标关键词补充到该初始关联组合中;

将补充后的所述至少一个初始关联组合作为所述至少一个关联组合。

13.根据权利要求11所述的装置,其中,所述关联单元,进一步被配置成按照如下方式执行所述基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合:

对所述多种会话关键词中不同种的会话关键词进行句内关联和上下文关联,得到所述至少一个关联组合。

14.根据权利要求13所述的装置,其中,所述关联单元,进一步被配置成按照如下方式执行所述对所述多种会话关键词中不同种的会话关键词进行句内关联和上下文关联,得到所述至少一个关联组合:

对于所述多种会话关键词中,相同语句内不同种的会话关键词进行句内关联,得到至少一个初始关联组合;

对于所述至少一个初始关联组合中的初始关联组合,响应于确定该初始关联组合中存在代词,在所述代词的上文语句中,确定所述代词所指代的会话关键词作为目标关键词,利用所述目标关键词替换所述代词;

将替换后的至少一个初始关联组合作为所述至少一个关联组合。

15.根据权利要求10所述的装置,其中,所述装置还包括:

确定单元,被配置成在所述对所述多种会话关键词中不同种的会话关键词进行关联之前,响应于确定所述多种会话关键词中存在代词,在该代词所在语句的上文语句中,确定所述代词所指代的会话关键词作为目标关键词;

替换单元,被配置成利用所述目标关键词替换所述代词,得到更新后的多种会话关键词;以及

所述关联单元,进一步被配置成按照如下方式执行所述基于会话关键词在会话中的位置,对所述多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合:

对更新后的所述多种会话关键词中,相同语句内不同种的会话关键词进行句内关联,得到所述至少一个关联组合。

16.根据权利要求10-15之一所述的装置,其中,所述多种会话关键词还包括时间词,所述关联组合还用于指示执行待办任务的时间范围。

17.根据权利要求10所述的装置,其中,所述生成单元,进一步被配置成按照如下方式执行所述根据所述至少一个关联组合,生成所述会话的会话纪要:

执行以下关联组合的合并步骤:对执行者词相同的关联组合进行合并,得到指示相同执行者执行不同任务的合并结果;或者,对任务词相同的关联组合进行合并,得到指示不同执行者执行相同任务的合并结果;

按照合并结果,生成所述会话的会话纪要。

18.根据权利要求10所述的装置,其中,所述多种会话关键词的生成步骤包括:

对所述语音识别结果进行分词,得到至少两个词;

确定出所述至少两个词中,与对所述会话预设的关键词相匹配的词,并将相匹配的词作为所述多个会话关键词。

19.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。

21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一所述的方法。


技术总结
本公开提供了音频的处理方法和装置,涉及语音技术领域。具体实施方式包括:获取会话的会话音频,确定会话音频的语音识别结果中的多种会话关键词,其中,多种会话关键词包括会话中待办任务的执行者词、动作词和任务词;对多种会话关键词中不同种的会话关键词进行关联,得到至少一个关联组合,其中,关联组合用于指示执行者采用动作执行待办任务;根据至少一个关联组合,生成会话的会话纪要。本公开可以通过确定会话音频中的多种会话关键词,准确地确定出会话的关键要素,从而生成准确的会话纪要。并且,本公开可以对不同种的会话关键词进行关联,实现生成准确、简明的会话纪要。

技术研发人员:刘俊启
受保护的技术使用者:百度在线网络技术(北京)有限公司
技术研发日:2021.04.08
技术公布日:2021.07.13
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜