农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

音频的处理方法和装置与流程

2021-07-13 16:21:00 来源：中国专利 TAG：音频处理语音装置公开计算机

技术特征：

1.一种音频的处理方法，所述方法包括：

获取会话的会话音频，根据所述会话音频的语音识别结果中的多种会话关键词，确定所述会话的初始会话纪要；

将包括所述初始会话纪要的待确认信息，发送给所述执行者词对应的执行者终端；

接收所述执行者终端针对所述待确认信息发送的反馈信息，基于所述反馈信息，生成所述会话的目标会话纪要。

2.根据权利要求1所述的方法，其中，所述基于所述反馈信息，生成所述会话的目标会话纪要，包括：

响应于确定所述反馈信息包括所述初始会话纪要的确认信息，将所述初始会话纪要作为所述目标会话纪要；

响应于确定所述反馈信息包括所述初始会话纪要的修改信息，根据所述修改信息，生成所述目标会话纪要；

响应于确定所述反馈信息包括所述初始会话纪要的否认信息，调整所述初始会话纪要，将调整结果作为所述目标会话纪要。

3.根据权利要求1所述的方法，其中，所述会话存在于多人参与的总会话中；

所述基于所述反馈信息，生成所述会话的目标会话纪要，包括：

响应于确定所述反馈信息包括所述初始会话纪要中待办任务的撤销信息，向所述总会话的参与者终端中所述执行者终端以外的其它参与者终端，发送待确认撤销信息；

响应于接收到所述其它参与者终端中的至少一者针对所述待确认撤销信息返回的否认信息，将所述初始会话纪要作为所述目标会话纪要。

4.根据权利要求1所述的方法，其中，所述多种会话关键词的生成步骤包括：

对所述语音识别结果进行分词，得到至少两个词；

确定出所述至少两个词中，与对所述会话预设的关键词相匹配的词，并将相匹配的词作为所述多个会话关键词。

5.根据权利要求4所述的方法，其中，所述预设的关键词的生成步骤，包括：

获取所述会话的会话预案信息，其中，所述会话预案信息包括会话主题和会话概要；

提取所述会话预案信息中的多种会话关键词，作为所述预设的关键词。

6.根据权利要求1-5之一所述的方法，其中，所述根据所述会话音频的语音识别结果中的多种会话关键词，确定所述会话的初始会话纪要，包括：

基于会话关键词在会话中的位置，对所述多种会话关键词中不同种的会话关键词进行关联，得到至少一个关联组合，其中，所述关联组合用于指示执行者采用动作执行任务；

根据所述至少一个关联组合，生成所述会话的初始会话纪要。

7.根据权利要求6所述的方法，其中，所述根据所述至少一个关联组合，生成所述会话的初始会话纪要，包括：

执行以下关联组合的合并步骤：对执行者词相同的关联组合进行合并，得到指示相同执行者执行不同任务的合并结果；或者对任务词相同的关联组合进行合并，得到指示不同执行者执行相同任务的合并结果；

按照合并结果，生成所述会话的初始会话纪要。

8.根据权利要求1-5之一所述的方法，其中，所述多种会话关键词还包括时间词，所述关联组合还用于指示执行待办任务的时间范围。

9.一种音频的处理装置，所述装置包括：

获取单元，被配置成获取会话的会话音频，根据所述会话音频的语音识别结果中的多种会话关键词，确定所述会话的初始会话纪要；

发送单元，被配置成将包括所述初始会话纪要的待确认信息，发送给所述执行者词对应的执行者终端；

生成单元，被配置成接收所述执行者终端针对所述待确认信息发送的反馈信息，基于所述反馈信息，生成所述会话的目标会话纪要。

10.根据权利要求9所述的装置，其中，所述生成单元，进一步被配置成按照如下方式执行所述基于所述反馈信息，生成所述会话的目标会话纪要：

响应于确定所述反馈信息包括所述初始会话纪要的确认信息，将所述初始会话纪要作为所述目标会话纪要；

响应于确定所述反馈信息包括所述初始会话纪要的修改信息，根据所述修改信息，生成所述目标会话纪要；

响应于确定所述反馈信息包括所述初始会话纪要的否认信息，调整所述初始会话纪要，将调整结果作为所述目标会话纪要。

11.根据权利要求9所述的装置，其中，所述会话存在于多人参与的总会话中；

所述生成单元，进一步被配置成按照如下方式执行所述基于所述反馈信息，生成所述会话的目标会话纪要：

响应于确定所述反馈信息包括所述初始会话纪要中待办任务的撤销信息，向所述总会话的参与者终端中所述执行者终端以外的其它参与者终端，发送待确认撤销信息；

响应于接收到所述其它参与者终端中的至少一者针对所述待确认撤销信息返回的否认信息，将所述初始会话纪要作为所述目标会话纪要。

12.根据权利要求9所述的装置，其中，所述多种会话关键词的生成步骤包括：

对所述语音识别结果进行分词，得到至少两个词；

确定出所述至少两个词中，与对所述会话预设的关键词相匹配的词，并将相匹配的词作为所述多个会话关键词。

13.根据权利要求12所述的装置，其中，所述预设的关键词的生成步骤，包括：

获取所述会话的会话预案信息，其中，所述会话预案信息包括会话主题和会话概要；

提取所述会话预案信息中的多种会话关键词，作为所述预设的关键词。

14.根据权利要求9-13之一所述的装置，其中，所述确定单元，进一步被配置成按照如下方式执行所述根据所述会话音频的语音识别结果中的多种会话关键词，确定所述会话的初始会话纪要：

基于会话关键词在会话中的位置，对所述多种会话关键词中不同种的会话关键词进行关联，得到至少一个关联组合，其中，所述关联组合用于指示执行者采用动作执行任务；

根据所述至少一个关联组合，生成所述会话的初始会话纪要。

15.根据权利要求14所述的装置，其中，所述确定单元，进一步被配置成按照如下方式执行所述根据所述至少一个关联组合，生成所述会话的初始会话纪要：

执行以下关联组合的合并步骤：对执行者词相同的关联组合进行合并，得到指示相同执行者执行不同任务的合并结果；或者对任务词相同的关联组合进行合并，得到指示不同执行者执行相同任务的合并结果；

按照合并结果，生成所述会话的初始会话纪要。

16.根据权利要求9-13之一所述的装置，其中，所述多种会话关键词还包括时间词，所述关联组合还用于指示执行待办任务的时间范围。

17.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-8中任一所述的方法。

技术总结
本公开提供了音频的处理方法和装置，涉及语音技术领域。具体实施方式包括：获取会话的会话音频，根据所述会话音频的语音识别结果中的多种会话关键词，确定所述会话的初始会话纪要；将包括所述初始会话纪要的待确认信息，发送给所述执行者词对应的执行者终端；接收所述执行者终端针对所述待确认信息发送的反馈信息，基于所述反馈信息，生成所述会话的目标会话纪要。本公开可以在生成会话纪要之后，先让任务的执行者确认会话是否准确，从而可以有效提高最终生成的会话纪要的准确度。

技术研发人员：刘俊启
受保护的技术使用者：百度在线网络技术(北京)有限公司
技术研发日：2021.04.08
技术公布日：2021.07.13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：词声学特征系统、词声学特征系统的训练方法及系统与流程

音频的处理方法和装置与流程

相关文章

最热文献