语音质检方法及装置、存储介质及电子设备与流程

2022-03-26 12:30:22 来源：中国专利 TAG：

1.本发明涉及数据处理技术领域，特别涉及一种语音质检方法及装置、存储介质及电子设备。

背景技术：

2.如今有许多以通话进行业务销售的行业，如银行业，银保监会为了规范银行业金融机构理财及代销产品的销售行为，要求对销售过程中的通话语音进行录音。为保证录音数据的合规性，提早发现销售过程中的违规操作，减少银行可能面对的诉讼风险，需要对录音数据进行语音质检。录音数据中客户经理作为提问者，客户作为回答者，语音质检的目的是检查录音数据中提问者是否按照规定询问了多个目标问题，回答者对所有目标问题是否给出了明确的回答。
3.传统的语音质检方法是通过人工方式进行抽检，这种方式不仅耗费人力物力，而且容易出现漏检的情况，质检结果的准确率和稳定性不能得到保证。

技术实现要素：

4.鉴于上述问题，本发明提供一种克服上述问题或者至少部分地解决上述问题的一种，技术方案如下所述：
5.一种语音质检方法，包括：
6.确定待质检语音数据中的第一短句集合和第二短句集合，所述第一短句集合中包括提问者对应的多个语音短句，所述第二短句集合中包括回答者对应的多个语音短句；
7.获取目标语音业务对应的标准问答对集合，所述标准问答对集合中包括多个标准问答对，每个所述标准问答对中包括标准提问以及与所述标准提问对应的标准回答；所述目标语音业务为与所述待质检语音数据相对应的语音业务；
8.确定所述待质检语音数据对应的匹配集合，所述匹配集合中包括多个匹配模式；
9.按预设的选取顺序，依次在所述匹配集合中选取匹配模式，并确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，所述目标问答对集合为所述标准问答对集合的子集；
10.在当前选取的匹配模式下，对于所述目标问答对集合中的每个标准问答对，若所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句，且所述第二短句集合中存在与该标准问答对中的标准回答对应的语音短句，则对该标准问答对进行标记；
11.若在当前选取的匹配模式下，所述目标问答对集合中的所有标准问答对均被标记，通过对所述待质检语音数据的质检。
12.上述的方法，可选的，所述确定待质检语音数据中的第一短句集合和第二短句集合，包括：
13.提取所述待质检语音数据中的提问者语音数据和回答者语音数据；
14.对所述提问者语音数据进行切分，将所述提问者语音数据分割为多个提问者语音
短句，组成所述第一短句集合；
15.对所述回答者语音数据进行切分，将所述回答者语音数据分割为多个回答者语音短句，组成所述第二短句集合。
16.上述的方法，可选的，所述提取所述待质检语音数据中的提问者语音数据和回答者语音数据，包括：
17.获取预先设置的提问者的声纹特征以及回答者的声纹特征；
18.依据所述提问者的声纹特征和所述回答者的声纹特征，在所述待质检语音数据中提取所述提问者语音数据和回答者语音数据。
19.上述的方法，可选的，确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，包括：
20.若当前选取的匹配模式是在所述匹配集合中首个选取的匹配模式，则将所述标准问答对集合确定为所述目标问答对集合；
21.若当前选取的匹配模式不是在所述匹配集合中首个选取的匹配模式，将所述当前选取的匹配模式的上一个选取的匹配模式所对应的目标问答集合中未被标记的各个标准问答对组成新的目标问答对集合，作为所述当前选取的匹配模式对应的目标问答对集合。
22.上述的方法，可选的，判断所述第一短句集合中是否存在与该标准问答对中的标准提问相对应的语音短句，包括：
23.确定当前选取的匹配模式对应的特征提取规则；
24.应用所述特征提取规则，提取该标准问答对中的标准提问所对应的目标匹配特征；
25.将所述目标匹配特征与已获取的与所述第一短句集合对应的第一特征集合中的各个特征进行匹配；
26.若所述第一特征集合中存在与所述目标匹配特征相匹配的特征，确定所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句。
27.上述的方法，可选的，所述第一特征集合的获取过程，包括：
28.应用预设的滑框依次对所述第一短句集合中的各个语音短句进行遍历，并在遍历过程中，应用所述当前选取的匹配模式对应的特征提取规则，对所述第一短句集合中的各个语音短句中的特征进行提取，以组成所述第一特征集合。
29.上述的方法，可选的，还包括：
30.若在所述匹配集合中最后一个匹配模式下，所述最后一个匹配模式对应的目标问答对集合中的所有标准问答未全部被标记，确定所述待质检语音数据的质检不通过。
31.一种语音质检装置，包括：
32.第一确定单元，用于确定待质检语音数据中的第一短句集合和第二短句集合，所述第一短句集合中包括提问者对应的多个语音短句，所述第二短句集合中包括回答者对应的多个语音短句；
33.第二确定单元，用于获取目标语音业务对应的标准问答对集合，所述标准问答对集合中包括多个标准问答对，每个所述标准问答对中包括标准提问以及与所述标准提问对应的标准回答；所述目标语音业务为与所述待质检语音数据相对应的语音业务；
34.第三确定单元，用于确定所述待质检语音数据对应的匹配集合，所述匹配集合中
包括多个匹配模式；
35.执行单元，用于按预设的选取顺序，依次在所述匹配集合中选取匹配模式，并确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，所述目标问答对集合为所述标准问答对集合的子集；在当前选取的匹配模式下，所述执行单元对于所述目标问答对集合中的每个标准问答对进行是否标记的判断，若所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句，且所述第二短句集合中存在与该标准问答对中的标准回答对应的语音短句，则对该标准问答对进行标记；
36.判断单元，用于在当前选取的匹配模式下，判断是否所述目标问答对集合中的所有标准问答对均被标记，若是通过对所述待质检语音数据的质检。
37.一种存储介质，所述存储介质包括存储的指令，其中，在所述指令运行时控制所述存储介质所在的设备执行上述的语音质检方法。
38.一种电子设备，包括至少一个处理器、以及与处理器连接的至少一个存储器、总线；其中，处理器、存储器通过总线完成相互间的通信；处理器用于调用存储器中的程序指令，以执行上述的语音质检方法。
39.与现有技术相比，本发明具有以下优点：一种语音质检方法及装置、存储介质及电子设备，具体包括：确定待质检语音数据中的第一短句集合和第二短句集合，所述第一短句集合中包括提问者对应的多个语音短句，所述第二短句集合中包括回答者对应的多个语音短句；获取目标语音业务对应的标准问答对集合，所述标准问答对集合中包括多个标准问答对，每个所述标准问答对中包括标准提问以及与所述标准提问对应的标准回答；所述目标语音业务为与所述待质检语音数据相对应的语音业务；确定所述待质检语音数据对应的匹配集合，所述匹配集合中包括多个匹配模式；按预设的选取顺序，依次在所述匹配集合中选取匹配模式，并确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，所述目标问答对集合为所述标准问答对集合的子集；在当前选取的匹配模式下，对于所述目标问答对集合中的每个标准问答对，若所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句，且所述第二短句集合中存在与该标准问答对中的标准回答对应的语音短句，则对该标准问答对进行标记；若在当前选取的匹配模式下，所述目标问答对集合中的所有标准问答对均被标记，通过对所述待质检语音数据的质检。本发明实施例提供的方案中，利用自然语言处理技术，实现了对待质检语音数据的自动化和快速质检，克服了人工质检方式耗费人力物力、不能保证正确率和稳定性的缺点；并且本发明实施例提供的方案中，设计了多个匹配模式，能够防止漏检情况出现，提高了匹配准确度。
40.上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。
附图说明
41.通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：
42.图1为本发明实施例提供的一种语音质检方法的方法流程图；
43.图2为本发明实施例提供的一种语音质检方法进行轮询匹配的流程图；
44.图3为本发明实施例提供的一种语音质检装置的结构示意图；
45.图4为本发明实施例提供的一种电子设备的结构图。
具体实施方式
46.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。
47.参考图1示出了，本发明实施例提供的一种语音质检方法的方法流程图，图1示出的方法执行过程为本发明实施例提供的语音质检方法的一种可行性实现方案，该方法的可以应用在各大系统平台中，其执行主体为设置在系统平台中的服务器，所述语音质检方法具体包括：
48.s101：确定待质检语音数据中的第一短句集合和第二短句集合，所述第一短句集合中包括提问者对应的多个语音短句，所述第二短句集合中包括回答者对应的多个语音短句；
49.本发明实施例提供的方法中，待质检语音数据是问答形式的对话，如客户经理在销售产品时，为了保证销售行为合规，要求客户经理作为提问者，按照规定对客户进行多个不同目标问题的询问，并要求客户作为回答者，对每个目标问题作出明确合规的回答，因此获取的待质检语音数据是包括提问者的语音数据和回答者的语音数据。出于对问题和回答进行匹配的目的，需要对待质检语音数据进行话者分流，将提问者和回答者的语音数据进行切分，这种将提问者的语音和回答者的语音划分的行为，即为话者分流。
50.本发明实施例提供的方法中，所述提取所述待质检语音数据中的提问者语音数据和回答者语音数据，即进行话者分流，包括：获取预先设置的提问者的声纹特征以及回答者的声纹特征；依据所述提问者的声纹特征和所述回答者的声纹特征，在所述待质检语音数据中提取所述提问者语音数据和回答者语音数据。
51.本发明实施例提供的方法中，进行话者分流可以通过设备分流，采用设备分流时，可使用两个语音获取模块分别将提问者的语音数据和回答者的语音数据进行录入，其中语音获取模块可以采用麦克风。然后将两个语音获取模块获取的语音数据分别进行降噪，如在获取提问者的语音数据中降低乃至消除回答者的语音数据，或者在获取回答者的语音数据中降低乃至消除提问者的语音数据。最后将经过采集和降噪后的提问者的语音数据和回答者的语音数据进行存储以供后续流程使用。
52.本发明实施例提供的方法中，进行话者分流还可以通过软件分流，采用软件分流时，可采用一个语音获取模块如麦克风对提问者语音和回答者语音进行录音，此时语音获取模块获取的语音数据中既包含提问者语音数据，又包含回答者语音数据。软件分流方法可以通过自然语言处理技术将提问者和回答者的语音数据进行分割，本发明实施例提供的方法中采用的分割原理可主要根据不同说话人的声纹信息进行分割，通过模型训练实现。语音获取模块获取提问者和回答者的语音数据后进行存储，在模型训练和应用时调用所存储的提问者和回答者的语音数据。模型训练和应用过程中，根据输入的语音数据计算不同
说话人的声纹信息，获得提问者的声纹信息和回答者的声纹信息，然后根据提问者的声纹信息和回答者的声纹信息对存储的包含提问者和回答者的语音数据进行分割，获得分割后的提问者的语音数据和回答者的语音数据，并进行存储以供后续流程使用。
53.本发明实施例提供的方法中，提问者的语音数据和回答者的语音数据通常由长句组成，在进行匹配时长句的计算量较大，因此本发明实施例提供的方法将经过话者分流后的提问者语音数据进行切分组成所述第一短句集合，将回答者的语音数据进行切分组成所述第二短句集合，使得切分后进行实际匹配时是对若干个独立的短句进行匹配。
54.本发明实施例提供的方法中，短句切分可以利用自然语言处理技术中的语音分割实现，进行短句切分能够保证得到语音数据为若干个短句，以便于进行匹配计算。
55.本发明实施例提供的方法中，所述确定待质检语音数据中的第一短句集合和第二短句集合，包括：提取所述待质检语音数据中的提问者语音数据和回答者语音数据；对所述提问者语音数据进行切分，将所述提问者语音数据分割为多个提问者语音短句，组成所述第一短句集合；对所述回答者语音数据进行切分，将所述回答者语音数据分割为多个回答者语音短句，组成所述第二短句集合。
56.s102：获取目标语音业务对应的标准问答对集合，所述标准问答对集合中包括多个标准问答对，每个所述标准问答对中包括标准提问以及与所述标准提问对应的标准回答；所述目标语音业务为与所述待质检语音数据相对应的语音业务；
57.本发明实施例提供的方法中，语音质检的目的是检查提问者和回答者是否按规定作出提问并给出合规的回答，而针对不同语音业务下获得的待质检语音数据，所检查的目标问题也不同，因此首先获取目标语音业务对应的标准问答对集合。
58.本发明实施例提供的方法中，每个所述标准问答对中包括标准提问以及与所述标准提问对应的标准回答，通常来说，与所述标准提问对应的标准回答应当是一个肯定的回答，但实际情况下，也可在判断到回答者没有回答预设否定回答时，认为回答者给出了与所述标准提问对应的标准回答。
59.s103：确定所述待质检语音数据对应的匹配集合，所述匹配集合中包括多个匹配模式；
60.本发明实施例提供的方法中，采用多个匹配模式依次对待质检语音数据进行语音质检，每个匹配模式有不同的匹配规则，某些标准问答对根据其中一个匹配模式的匹配规则进行匹配时可能匹配不到，但在下一个匹配模式中根据该下一个匹配模式的匹配骨子进行匹配时可能就能够匹配到，因此每个匹配模式之间可以相互查漏补缺，相比只采用一个匹配模块的情况，能够提高语音质检的检测准确度。
61.s104：按预设的选取顺序，依次在所述匹配集合中选取匹配模式；
62.每选取一个匹配模式，包括：
63.s1041：确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，所述目标问答对集合为所述标准问答对集合的子集；
64.本发明实施例提供的方法中，为了不进行重复匹配，在每个匹配模式完成之后，将在每个匹配模式中已经完成匹配的标准问答对从当前选取的匹配模式使用的目标问答对集合中去掉后，作为下一匹配模式使用的目标问答对集合；即将每个匹配模式使用的目标问答对集合中去掉在该匹配模式进行标记的所有标准问答对后，作为下一匹配模式使用的
目标问答对集合。
65.本发明实施例提供的方法中，确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，包括：若当前选取的匹配模式是在所述匹配集合中首个选取的匹配模式，则将所述标准问答对集合确定为所述目标问答对集合；若当前选取的匹配模式不是在所述匹配集合中首个选取的匹配模式，将所述当前选取的匹配模式的上一个选取的匹配模式所对应的目标问答集合中未被标记的各个标准问答对组成新的目标问答对集合，作为所述当前选取的匹配模式对应的目标问答对集合。
66.本发明实施例提供的方法中，首个选取的匹配模式使用的目标问答对集合是所述标准问答对集合，若所述标准问答对集合中共n个标准问答对，表示要对n个规定的不同问题和对应回答进行语音质检。若在首个选取的匹配模式中匹配到x1个问题和对应回答，标记首个选取的匹配模式使用的目标问答对集合中对应的x1个标准问答对，将首个选取的匹配模式使用的目标问答对集合中剩余的n-x1个标准问答对组成第二个选取的匹配模式使用的目标问答对集合。若在第二个选取的匹配模式中匹配到x2个问题和对应回答，标记第二个选取的匹配模式中对应的x2个标准问答对，将第二个选取的匹配模式使用的目标问答对集合中剩余的n-x1-x2个标准问答对组成第三个选取的匹配模式使用的目标问答对集合。依次类推，只要当前选取的匹配模式使用的目标问答对集合在完成当前匹配模式后还有剩余未标记的标准问答对，并且当前选取的匹配模式不是最后一个匹配模式，就将剩余未标记的标准问答对组成下一个选取的匹配模式使用的目标问答对集合。
67.s1042：在当前选取的匹配模式下，对于所述目标问答对集合中的每个标准问答对，若所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句，且所述第二短句集合中存在与该标准问答对中的标准回答对应的语音短句，则对该标准问答对进行标记；
68.本发明实施例提供的方法中，每一个标准问答对包括标准提问和与标准提问对应的标准回答，每个选取的匹配模式下，只有一个标准问答对的标准提问和对应的标准回答都匹配成功时，才表示该标准问答对匹配成功可以被标记。
69.本发明实施例提供的方法中，由于从待质检语音数据中提取了由提问者对应的多个语音短句组成的所述第一短句集合，因此可以将每一个标准问答对的标准提问与所述第一短句集合的每个语音短句进行匹配比较，判断所述第一短句集合中是否存在与该标准问答对中的标准提问相对应的语音短句。同样的，由于从待质检语音数据中提取了由回答者对应的多个语音短句组成的所述第二短句集合，因此可以将每一个标准问答对的标准回答与所述第二短句集合的每个语音短句进行匹配比较，判断所述第二短句集合中是否存在与该标准问答对中的标准回答相对应的语音短句。这样先分类后匹配，能够提高匹配效率和提高匹配准确度，防止在回答者语音数据中去匹配标准提问，造成资源浪费和误匹配。
70.本发明实施例提供的方法中，每个匹配模式下按照该匹配模式对应的匹配规则进行匹配，如一个匹配模式采用关键词作为匹配规则时，就需要提取标准问答对中标准提问和标准回答的关键词，分别与所述第一短句集合中提取的关键词和所述第二短句集合中提取的关键词进行比较，判断是否匹配。
71.本发明实施例提供的方法中，判断所述第一短句集合中是否存在与该标准问答对中的标准提问相对应的语音短句，包括：确定当前选取的匹配模式对应的特征提取规则；应
用所述特征提取规则，提取该标准问答对中的标准提问所对应的目标匹配特征；将所述目标匹配特征与已获取的与所述第一短句集合对应的第一特征集合中的各个特征进行匹配；若所述第一特征集合中存在与所述目标匹配特征相匹配的特征，确定所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句。
72.本发明实施例提供的方法中，所述第一特征集合的获取过程，包括应用预设的滑框依次对所述第一短句集合中的各个语音短句进行遍历，并在遍历过程中，应用所述当前选取的匹配模式对应的特征提取规则，对所述第一短句集合中的各个语音短句中的特征进行提取，以组成所述第一特征集合。
73.本发明实施例提供的方法中，为了不进行重复匹配，可在每个匹配模式完成之后，将与已经在当前匹配模式中标记的所有标准提问对应的语音短句从所述第一短句集合中去掉，在进行下一匹配模式时，就不重复比较所述第一短句集合中已经在上一匹配模式中进行标记的标准提问对应的语音短句。
74.本发明实施例提供的方法中，类似的，判断所述第二短句集合中是否存在与该标准问答对中的标准回答相对应的语音短句，包括：确定当前选取的匹配模式对应的特征提取规则；应用所述特征提取规则，提取该标准问答对中的标准回答所对应的目标匹配特征；将所述目标匹配特征与已获取的与所述第二短句集合对应的第二特征集合中的各个特征进行匹配；若所述第二特征集合中存在与所述目标匹配特征相匹配的特征，确定所述第二短句集合中存在与该标准问答对中的标准回答相对应的语音短句。
75.本发明实施例提供的方法中，类似的，所述第二特征集合的获取过程，包括应用预设的滑框依次对所述第二短句集合中的各个语音短句进行遍历，并在遍历过程中，应用所述当前选取的匹配模式对应的特征提取规则，对所述第二短句集合中的各个语音短句中的特征进行提取，以组成所述第二特征集合。
76.本发明实施例提供的方法中，类似的，为了不进行重复匹配，可在每个匹配模式完成之后，将与已经在当前匹配模式中标记的所有标准回答对应的语音短句从所述第二短句集合中去掉，在进行下一匹配模式时，就不重复比较所述第二短句集合中已经在上一匹配模式中进行标记的标准回答对应的语音短句。
77.s1043：若在当前选取的匹配模式下，所述目标问答对集合中的所有标准问答对均被标记，通过对待质检语音的质检。
78.本发明实施例提供的方法中，在每一个选取的匹配模式完成之后，检测当前选取的匹配模式的所述目标问答对集合中的所有标准问答对是否均被标记，若是表示待质检语音的质检合格，不需要再进行后续设定顺序的匹配模式；若当前选取的匹配模式的所述目标问答对集合中还有剩余未被标记的目标问答对，则进行下一个选取的匹配模式。
79.s1044：若在所述匹配集合中最后一个匹配模式下，所述最后一个匹配模式对应的目标问答对集合中的所有标准问答未全部被标记，确定待质检语音的质检不通过。
80.本发明实施例提供的方法中，当设定的所有匹配模式都完成之后，最后一个匹配模式对应的目标问答对集合中还有剩余未被标记的标准问答对，就表示所述标准问答对集合在经过所有匹配模式后还有剩余未被标记的标准问答对，提问者和回答者没有按照规定完成规定的多个目标问题的问答，因此判定待质检语音的语音质检不合格。
81.为了更加清晰的对本技术语音质检过程进行说明，本发明实施例提供一具体实例
如下：
82.首先，进行话者分流，提取处待质检语音数据中的提问者语音数据和回答者语音数据。可采用设备分流，利用两个麦克风分别对提问者和回答者进行录音；也可采用软件分流，利用一个麦克风对提问者和回答者一起录音后，根据提问者的声纹特征以及回答者的声纹特征，分别提取出其中的提问者语音数据和回答者语音数据，还可以对根据声纹特征提取的语音数据进行降噪，提高语音质检的精度。
83.然后，进行短句切分，将提问者语音数据分割为多个提问者语音短句，组成所述第一短句集合；将回答者语音数据分割为多个回答者语音短句，组成所述第二短句集合。
84.接下来，根据所述待质检语音数据相对应的语音业务，获取对应的标准问答对集合。假设待质检语音数据相对应的语音业务是金融机构的客户经理对理财及代销产品的销售业务，根据法律法规要求的进行该理财及代销产品的销售业务之前，客户经理需要对客户提出规定的n个相关问题，客户也需要针对每个问题作出明确合规的回答，因此根据规定的n个相关问题和对应回答建立标准问答对集合，该标准问答对集合包括n个标准问答对。
85.随后，采用滑动窗口质检的方式进行多匹配层级的语音质检，每一匹配层级的匹配模式不同，本实施例中以采用三个匹配模式，依次为faq(frequently asked questions，常见问题解答)匹配模式、关键词匹配模式和关键音匹配模式为例，进行语音质检。
86.进行faq匹配模式时，由于是首个选取的匹配模式，因此将所述标准问答对集合确定为faq匹配模式的目标问答对集合，即faq匹配模式的目标问答对集合内包含n个标准问答对。同样的，由于是首个选取的匹配模式，因此对所述第一短句集合内的每个提问者语音短句进行匹配，也对所述第二短句集合内的每个回答者语音短句进行匹配。
87.进行faq匹配模式过程中，可采用窗口滑动的方式，根据faq匹配模式的目标问答对集合中的所有标准提问，对所述第一短句集合内的每个提问者语音短句进行轮询匹配；同时，根据faq匹配模式的目标问答对集合中的所有标准回答，对所述第二短句集合内的每个回答者语音短句进行轮询匹配。参见图2，两个滑动窗口同时对第一短句集合和第二短句集合内的每个语音短句进行遍历，可令滑动窗口大小为3，滑动步长为1，实际应用中可根据具体情况进行调整。轮询匹配时，根据faq匹配模式的特征提取规则对第一个滑动窗口内的每个提问者语音短句进行特征提取，并与根据faq匹配模式的特征提取规则提取的faq匹配模式的目标问答对集合中所有标准提问对应的目标匹配特征进行比较；以及根据faq匹配模式的特征提取规则对第二个滑动窗口内的每个回答者语音短句进行特征提取，并与根据faq匹配模式的特征提取规则提取的faq匹配模式的目标问答对集合中所有标准回答对应的目标匹配特征进行比较。
88.一些实施例中认为，只有在设定的时间范围内，当某个标准问答对中的标准提问在第一个滑动窗口内匹配到对应的提问者语音短句，并且该标准问答对中的标准回答在第二个滑动窗口内也匹配到对应的回答者语音短句时，认为该标准问答对匹配成功，对该标准问答对进行标记。之所以设定一个时间范围，是因为如果一个标准问答对的标准问题和对应标准回答在相隔时间较长时分别匹配到，就不能保证该标准回答与该标准提问是对应的。并且此种情况下，第一短句集合和第二短句集合内的语音短句应当按照短句发生时间进行排序。
89.faq匹配模式的特征提取规则可以为：对于faq匹配模式的目标问答对集合，获得
faq匹配模式的目标问答对集合中每个标准问答对的文字数据，并将每个标准问答对的标准提问的文字数据转换为向量，将每个标准问答对的标准回答的文字数据也转换为向量。对于待匹配的第一短句集合和第二短句集合，将第一短句集合中的每个提问者语音数据转换为文字后再转换为向量，将第二短句集合中的每个回答者语音数据转换为文字后再转换为向量。第一短句集合中转换得到的每个向量分别与faq匹配模式的目标问答对集合中每个标准提问转换的向量进行向量间的相似度计算，第二短句集合中转换得到的每个向量分别与faq匹配模式的目标问答对集合中每个标准回答转换的向量进行向量间的相似度计算。相似度计算方式可采用余弦相似度计算，余弦相似度的计算公式为：
[0090][0091]
其中，a、b为两个m维向量，a表示被滑动窗口选中的第一短句集合中提问者语音数据转换的向量，b表示faq匹配模式的目标问答对集合中标准提问的文字数据转换得到的向量；或者a表示被滑动窗口选中的第二短句集合中回答者语音数据转换的向量，b表示faq匹配模式的目标问答对集合中标准回答的文字数据转换得到的向量。当cosθ大于设定的阈值时，表示此时的a对应语音短句与b对应的标准提问或标准回答匹配成功。
[0092]
当出现一个相似度计算结果大于设定阈值时，认为该大于设定阈值的相似度计算结果所对应的两个向量匹配，这两个向量对应的第一短句集合中的提问者语音短句与faq匹配模式的目标问答对集合中的标准提问匹配成功，或者这两个向量对应的第二短句集合中的回答者语音短句与faq匹配模式的目标问答对集合中的标准回答匹配成功。
[0093]
当faq匹配模式的目标问答对集合中一个标准问答对的标准提问和对应标注回答都匹配时，认为待质检语音数据中提问并回答了该标准问答对对应的问题。
[0094]
假设在faq匹配模式下标记了x1个标准问答对，检查x1是否等于n，若是则结束语音质检，输出质检合格的结果，若不是则将faq匹配模式的目标问答对集合中去掉标记的这x1个标准问答对后，作为第二匹配模式，即关键词匹配模式的目标问答对集合，关键词匹配模式的目标问答对集合有n-x1个标准问答对。
[0095]
进行关键词匹配模式过程中，同样可采用窗口滑动的方式，对所述第一短句集合和第二短句集合中，去掉在faq匹配模式中与标记的x1个标准问答对对应的提问者语音短句和回答者语音短句后，剩余的所有语音短句进行轮询匹配。根据关键词匹配模式的特征提取规则，提取关键词匹配模式的目标问答对集合的n-x1个标准问答对的关键词，与根据关键词匹配模式的特征提取规则提取的滑动窗口中的每个语音短句的关键词进行比较，某个标准问答对的标准提问和标准回答均匹配时标记该标准问答对。
[0096]
假设在关键词匹配模式下标记了x2个标准问答对，检查x1 x2是否等于n，若是则结束语音质检，输出质检合格的结果，若不是则将关键词匹配模式的目标问答对集合中去掉标记的这x2个标准问答对后，作为第三匹配模式，即关键音匹配模式的目标问答对集合，关键音匹配模式的目标问答对集合有n-x1-x2个标准问答对。由于待质检语音数据中可能存在方言，而方言难以准确地进行语义级别的匹配，因此针对这种情况，本实施例提出在第三匹配模式下采用关键音匹配模式，关键音可以是方言或外语的关键音。
[0097]
进行关键音匹配模式过程中，同样可采用窗口滑动的方式，对所述第一短句集合
和第二短句集合中，去掉在faq匹配模式和关键词匹配模式中与标记的x1 x2个标准问答对对应的提问者语音短句和回答者语音短句后，剩余的所有语音短句进行轮询匹配。根据关键音匹配模式的特征提取规则，提取关键音匹配模式的目标问答对集合的n-x1-x2个标准问答对的关键音，与根据关键音匹配模式的特征提取规则提取的滑动窗口中的每个语音短句的关键音进行比较，某个标准问答对的标准提问和标准回答均匹配时标记该标准问答对。
[0098]
假设在关键音匹配模式下标记了x3个标准问答对，检查x1 x2 x3是否等于n，若是则结束语音质检，输出质检合格的结果，若不是也结束语音质检，输出质检不合格的结果。
[0099]
本发明实施例提供的具体实例中，从faq匹配、关键词、关键音这三个匹配层级对待质检语音数据进行质检，利用自然语言处理技术，实现了对待质检语音数据的自动化和快速质检，克服了人工质检方式耗费人力物力、不能保证正确率和稳定性的缺点，并且相比单一层级质检而言提高了质检结果的准确性，避免的漏检的情况。
[0100]
本发明实施例还提供了与一种语音质检方法对应的一种语音质检装置，所述语音质检装置用于实现所述语音质检方法在实际中的应用，所述一种语音质检装置的结构图可参照图3，所述语音质检装置中包括：
[0101]
第一确定单元，用于确定待质检语音数据中的第一短句集合和第二短句集合，所述第一短句集合中包括提问者对应的多个语音短句，所述第二短句集合中包括回答者对应的多个语音短句；
[0102]
第二确定单元，用于获取目标语音业务对应的标准问答对集合，所述标准问答对集合中包括多个标准问答对，每个所述标准问答对中包括标准提问以及与所述标准提问对应的标准回答；所述目标语音业务为与所述待质检语音数据相对应的语音业务；
[0103]
第三确定单元，用于确定所述待质检语音数据对应的匹配集合，所述匹配集合中包括多个匹配模式；
[0104]
执行单元，用于按预设的选取顺序，依次在所述匹配集合中选取匹配模式，并确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，所述目标问答对集合为所述标准问答对集合的子集；在当前选取的匹配模式下，所述执行单元对于所述目标问答对集合中的每个标准问答对进行是否标记的判断，若所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句，且所述第二短句集合中存在与该标准问答对中的标准回答对应的语音短句，则对该标准问答对进行标记；
[0105]
判断单元，用于在当前选取的匹配模式下，判断是否所述目标问答对集合中的所有标准问答对均被标记，若是通过对所述待质检语音数据的质检。
[0106]
本发明实施例提供的语音质检装置，判断单元还用于在所述匹配集合中最后一个匹配模式下，判断所述最后一个匹配模式对应的目标问答对集合中的所有标准问答是否全部被标记，若是通过对待质检语音的质检，否则确定待质检语音的质检不通过。
[0107]
本发明实施例提供的语音质检装置包括处理器和存储器，上述第一确定单元、第二确定单元、第三确定单元、执行单元和判断单元均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0108]
处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来动态执行语音质检过程，提升更新效率。
[0109]
本发明实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现所述语音质检方法。
[0110]
本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行所述语音质检方法。
[0111]
如图4所示，本发明实施例提供了一种电子设备，所述电子设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线；其中，处理器、存储器通过总线完成相互间的通信；处理器用于调用存储器中的程序指令，以执行上述的语音质检方法。本文中的设备可以是服务器、pc、pad、手机等。
[0112]
本技术还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序，包括：
[0113]
一种语音质检方法，包括：
[0114]
确定待质检语音数据中的第一短句集合和第二短句集合，所述第一短句集合中包括提问者对应的多个语音短句，所述第二短句集合中包括回答者对应的多个语音短句；
[0115]
获取目标语音业务对应的标准问答对集合，所述标准问答对集合中包括多个标准问答对，每个所述标准问答对中包括标准提问以及与所述标准提问对应的标准回答；所述目标语音业务为与所述待质检语音数据相对应的语音业务；
[0116]
确定所述待质检语音数据对应的匹配集合，所述匹配集合中包括多个匹配模式；
[0117]
按预设的选取顺序，依次在所述匹配集合中选取匹配模式，并确定在当前选取的匹配模式下，所述标准问答对集合对应的目标问答对集合，所述目标问答对集合为所述标准问答对集合的子集；
[0118]
在当前选取的匹配模式下，对于所述目标问答对集合中的每个标准问答对，若所述第一短句集合中存在与该标准问答对中的标准提问相对应的语音短句，且所述第二短句集合中存在与该标准问答对中的标准回答对应的语音短句，则对该标准问答对进行标记；
[0119]
若在当前选取的匹配模式下，所述目标问答对集合中的所有标准问答对均被标记，通过对所述待质检语音数据的质检。
[0120]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0121]
在一个典型的配置中，设备包括一个或多个处理器(cpu)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
[0122]
存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)，存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
[0123]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动
态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
[0124]
还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0125]
本领域技术人员应明白，本技术的实施例可提供为方法、系统或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0126]
以上仅为本技术的实施例而已，并不用于限制本技术。对于本领域技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本技术的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种语音合成方法、装置、终端设备及存储介质与流程

语音质检方法及装置、存储介质及电子设备与流程

相关文献

最热文献