智能语音标注系统的字准检测方法、装置、设备及介质与流程

2022-08-13 16:20:18 来源：中国专利 TAG：

1.本发明涉及智能语音标注技术领域，特别涉及一种智能语音标注系统的字准检测方法、装置、设备及介质。

背景技术：

2.在智能客服领域，智能语音标注系统是针对客户与机器人的对话进行分析和标注的系统，但针对客户与机器人的语音对话分析精细程度尚不够完善及智能化。目前市面上的智能语音标注系统大多无法独立承担asr(automatic speech recognition，语音识别)转义后的字准比对功能，受限于技术壁垒、成本等因素，即使是对接第三方字准算法引擎，方案上也存在诸多的缺陷，主要有以下几点：
3.1、需要对接第三方系统，进而存在着开发语言不匹配、网络问题、问题响应迟缓等问题；
4.2、目前对接算法引擎，主要方式还是通过需求方按照算法平台要求，线下整理需要计算字准的txt文本，格式要求严格，对于没有太多技术背景的业务操作人员难度很高，很容易出现因为格式不正确导致无法计算出正确结果的情况；
5.3、得到计算结果后，目前同样还是主要采用线下分析计算结果，一般算法引擎平台的接口返回有自己的标准和规范，得到结果的数据类型无法满足实际使用者的诉求，对使用者来说不太友好。

技术实现要素：

6.鉴于以上所述现有技术的缺点，本发明的目的在于提供一种智能语音标注系统的字准检测方法、装置、设备及介质，用于解决现有的智能语音标注系统借助第三方系统进行语音识别转义后的字准比对时与第三方系统的开发语言不匹配、网络问题、问题响应迟缓问题，对业务操作人员要求高以及不能满足使用者的诉求的技术问题。
7.第一方面，提供了一种智能语音标注系统的字准检测方法，所述智能语音标注系统中部署有字准比对本地脚本，包括：
8.获取机器人与客户对话片段中的客户语音的音转字识别文本，以作为机器人识别文本话术；
9.获取业务标注人员听取机器人与客户对话片段中的客户语音时录入的客户说话文本，以作为客户文本话术；
10.调用字准比对本地脚本，求取将所述机器人识别文本话术转成所述客户文本话术所需的最少编辑操作次数、以及最少编辑操作次数中包含的操作类型及每种操作类型的次数，以生成字准比对结果，其中，所述编辑操作的操作类型包括插入、替换和删除；
11.接收所述字准计算本地脚本的字准比对结果数据报文，并对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。
12.第二方面，提供了一种智能语音标注系统的字准检测装置，包括：
13.第一话术获取模块，用于获取机器人与客户对话片段中的客户语音的音转字识别文本，以作为机器人识别文本话术；
14.第二话术获取模块，用于获取业务标注人听取机器人与客户对话片段中的客户语音时录入的客户说话文本，以作为客户文本话术；
15.字准计算调用模块，用于调用字准比对本地脚本，采用编辑距离的动态规划方法求取将所述机器人识别文本话术转成所述客户文本话术所需的最少编辑操作次数、以及最少编辑操作次数中包含的操作类型及每种操作类型的次数，以生成字准比对结果；
16.结果数据解析模块，用于接收所述字准计算本地脚本的字准比对结果数据报文，并对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。
17.第三方面，提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述智能语音标注系统的字准检测的步骤。
18.第四方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述智能语音标注系统的字准检测方法的步骤。
19.上述智能语音标注系统的字准检测方法、装置、设备及介质，通过获取机器人与客户对话片段中的客户语音的音转字识别文本，以作为机器人识别文本话术；并获取业务标注人听取机器人与客户对话片段中的客户语音时录入的客户说话文本，以作为客户文本话术；调用字准比对本地脚本，采用编辑距离的动态规划方法求取将所述机器人识别文本话术转成所述客户文本话术所需的最少编辑操作次数、以及最少编辑操作次数中包含的操作类型及每种操作类型的次数，以生成字准比对结果；接收所述字准计算本地脚本的字准比对结果数据报文，并对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。在本发明中，采用纯线上自动化实时实现机器人识别文本话术和客户文本话术的字准计算比对，替代了传统线下手工整理计算所需文档，提高了计算效率，显著避免了线下手工整理文档的出错的情况；将字准比对计算程序本地化部署，简单易用，可实现应用服务器本地化调用算法，提升计算效率，无需长时间等待，并且安全高效；无需对接算法引擎系统实现字准计算比对，避免对接第三方系统带来的诸如网络问题、系统依赖性增强、定制化开发等问题。
附图说明
20.图1示出了本发明的智能语音标注系统的字准检测方法的一应用环境示意图。
21.图2示出了本发明的智能语音标注系统的字准检测方法的一流程示意图。
22.图3示出了本发明的智能语音标注系统的字准检测装置的一功能模块图。
23.图4示出了本发明的智能语音标注系统的字准检测方法的电子设备的一结构示意图。
具体实施方式
24.以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离
本发明的精神下进行各种修饰或改变。
25.请参阅图1-4。需要说明的是，本实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。
26.本发明实施例提供的智能语音标注系统的字准检测方法，可应用在如图1所示的应用环境中，其中，智能客服系统，智能客服系统通过网络与智能语音标注系统进行通信。智能客服系统用于不同业务场景下的客户与机器人的对话，所述业务场景信息例如可以是信用卡业务场景、贷款业务场景或还款业务场景，所述智能客服系统包括电话平台和录音平台，所述电话平台用于录制客户与机器人打电话时的录音音频文件，所述电话平台通过asr(automatic speech recognition,语音识别技术)引擎识别与录音音频文件对应的录音信息，所述录音信息中包括所述录音音频文件的录音唯一识别号、录音开始时间、录音结束时间、录音时长、场景信息、所述业务线、录音文本(音转字识别文本)等信息。
27.所述语音标注系统是针对客户与机器人的对话进行分析和标注的系统，所述语音标注系统可通过系统间http接口对接方式，从智能客服系统的录音平台和电话平台分别获取客户与机器人对话的录音音频文件及对应的录音信息，并从所述录音信息中解析出机器人与客户对话片段中客户语音的音转字识别文本，以作为机器人识别文本话术，同时获取业务标注人员听取录音音频文件中机器人与客户对话片段中客户语音时录入的客户说话文本，以作为客户文本话术；调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对，以生成字准比对结果；接收所述字准计算本地脚本的字准比对结果数据报文，并对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。其中，智能客服系统的服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现；语音标注系统的服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
28.请参阅图2所示，图2为本发明实施例提供的智能语音标注系统的字准检测方法的一个流程示意图，本发明实施例的智能语音标注系统的字准检测方法，可应用于智能语音标注系统中，能够对机器人与客户对话片段中的客户语音的asr(automatic speechrecognition,语音识别技术)转义文本进行字准比对。包括如下步骤：
29.s10：获取机器人与客户对话片段中的客户语音的音转字识别文本，以作为机器人识别文本话术。
30.所述语音标注系统可通过系统间http接口对接方式，从智能客服系统的录音平台和电话平台分别获取客户与机器人对话的录音音频文件及对应的录音信息，所述录音信息中包括所述录音音频文件的录音唯一识别号、录音开始时间、录音结束时间、录音时长、场景信息、所述业务线、录音文本(音转字识别文本)等数据信息，所述智能语音标注系统可从所述录音信息中解析出机器人与客户对话片段中客户语音的音转字识别文本，以作为机器人识别文本话术。
31.s20：获取业务标注人员听取录音音频文件中机器人与客户对话片段中客户语音时录入的客户说话文本，以作为客户文本话术。
32.当所述智能语音标注系统通过系统间http接口对接方式，从智能客服系统的录音
平台和电话平台分别获取客户与机器人对话的录音音频文件及对应的客户文本话术后，还需要与客户文本话术来进行字准比对，以评估asr引擎的识别准确度。所述客户文本话术是业务标注人员通过智能语音标注系统听取当时客户在与机器人对话过程中实际说话内容的录音音频数据，并在智能语音标注系统内手工录入客户说话的文本(这个过程就是业务标注人员所做的标注操作，即人工通过听录音识别客户当时所说的话)。
33.需要说明的是，在智能客服系统中，客户与机器人的每一次电话，都会对应产生一条录音音频文件和对应的录音信息，每条录音音频文件会对应多个前文描述的对话片段(也称为话术片段)，每条录音信息会包括多个机器人识别文本话术，所述机器人识别文本话术与所述的对话片段一一对应。需要说明的是，所述机器人识别文本话术是通过asr(automatic speech recognition,语音识别技术)引擎将机器人与客户对话片段中的客户语音进行音转字识别后生成的文本。
34.s30：调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对，以生成字准比对结果。具体地，调用字准比对本地脚本，求取将所述机器人识别文本话术转成所述客户文本话术所需的最少编辑操作次数、以及最少编辑操作次数中包含的操作类型及每种操作类型的次数，作为字准比对结果。
35.当所述智能语音标注系统接收到业务标注人员在智能语音标注系统内手工录入客户说话的文本后，可实时调用字准比对本地脚本(字准计算python脚本)并计算出字准比对结果。本发明的通过在智能语音标注系统安装字准比对引擎环境(python)及相关字准比对算法程序，将字准比对算法程序部署于本地，可以方便智能语音标注系统的本地化调用，安全高效。
36.在调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对时，所述智能语音标注系统可通过自动化执行命令，实时调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对，并实时计算出字准比对结果。
37.在一具体实例中，调用字准比对本地脚本的方式例如可通过java端创建linux命令实例，传入需执行的计算命令及需进行比较的两个文本对象(机器人识别文本话术和客户文本话术)，所述字准比对本地脚本完成字准比对并结果以报文的形式发送给智能语音标注系统。
38.可以理解的是，在一些实施例中，在调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对时，所述智能语音标注系统可响应于操作人员的字准比对指令，来调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对。
39.需要说明的是，在本实施例中，所述字准比对本地脚本是采用编辑距离的动态规划方法来对所述机器人识别文本话术和所述客户文本话术进行字准比对，以生成字准比对结果。具体地，所述字准比对本地脚本，采用编辑距离的动态规划方法求取将所述机器人识别文本话术转成所述客户文本话术所需的最少编辑操作次数、以及最少编辑操作次数中包含的操作类型及每种操作类型的次数，作为字准比对结果，其中，所述编辑操作的操作类型包括插入、删除和替换。
40.编辑距离是指两个字串之间，由一个转成另一个所需的最少编辑操作次数。通常
来说，编辑距离越小，两个文本的相似性越大。编辑距离是针对二个字符串(中英文字符串)的差异程度的量化量测，量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。
41.编辑操作主要包括三个点：1.插入：将一个字符插入某个字符串；2.删除：将字符串中的某个字符删除；3.替换：将字符串中的某个字符替换为另外一个字符。
42.举例说明：satr变为smart。1.satr变为smatr(插入字符m)；2.smatr变为smat(删除字符r)3.smat变为smart(插入字符r)。因此，整个转换过程的编辑距离为3，包含插入、删除两个操作，具体为两次插入操作，一次删除操作。该算法的思想即为动态规划。
43.动态规划思想的简单描述：当两个字符串都为空串，那么编辑距离为0；
44.当其中一个字符串为空串时，那么编辑距离为另一个非空字符串的长度；
45.当两个字符串均为非空时(长度分别为i和j)，取以下三种情况最小值即可：
46.1、长度分别为i-1和j的字符串的编辑距离已知，那么加1即可；
47.2、长度分别为i和j-1的字符串的编辑距离已知，那么加1即可；
48.3、长度分别为i-1和j-1的字符串的编辑距离已知，此时考虑两种情况，若第i个字符和第j个字符不同，那么加1即可；如果不同，那么不需要加1。
49.求长度为m和n的字符串的编辑距离，首先定义函数——edit(i,j)，它表示第一个长度为i的字符串与第二个长度为j的字符串之间的编辑距离。动态规划表达式可以写为：
50.if i＝＝0且j＝＝0，edit(i,j)＝0
51.if(i＝＝0且j》0)或者(i》0且j＝＝0)，edit(i,j)＝i j
52.ifi≥1且j≥1，edit(i,j)＝＝min{edit(i-1,j) 1,edit(i,j-1) 1,edit(i-1,j-1) d(i,j)}，当第一个字符串的第i个字符不等于第二个字符串的第j个字符时，d(i,j)＝1；否则，d(i,j)＝0。
53.最终的编辑距离即为edit(m，n)。
54.可以理解的是，也可以使用jaccard相似度算法、simhash相似度算法、bm25相似度算法、词向量平均求余弦相似度算法来对所述机器人识别文本话术和所述客户文本话术进行字准比对。
55.s40：接收所述字准计算本地脚本的字准比对结果数据报文，并对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。
56.所述字准比对本地脚本完成字准比对并返回字准比对结果以报文的形式发送给智能语音标注系统，所述智能语音标注系统在接收到所述字准计算本地脚本的字准比对结果数据报文后，需要对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。所述字准比对解析结果例如可包含：正确字数、错误字数(插入错误字数替换错误字数删除错误字数)、标注文本长度(去除标点等特殊符号的长度)、插入错误字数、替换错误字数；删除错误字数中的一个或多个。可以理解的是，在其他实施例中，所述字准比对解析结果也可以包括字正确率、字错误率等其他结果，其中，字错误率＝代错误字数/标注文本长度，正确率＝1-字错误率。
57.具体地，所述智能语音标注系统会通过读取文件流的方式，逐一解析所述字准计算本地脚本发送的字准比对结果数据报文，来获取字准比对解析结果，并将客户文本话术、机器人识别文本话术及这些字准比对解析结果存入数据库中，供所述智能语音标注系统展
示该条语音字准比对的详细结果及产生语音识别准确率相关的统计报表，更直观的帮助分析人员提高标注准确性。
58.s50：将所述字准比对结果推送至语音识别引擎。
59.获取到字准比对解析结果后，还可将字准比对解析结果推送至电话平台的语音识别引擎进行再次训练，形成训练闭环，进一步提升语音识别引擎的识别准确率。
60.可见，在上述方案中，采用纯线上自动化实时实现机器人识别文本话术和客户文本话术的字准计算比对，替代了传统线下手工整理计算所需文档，提高了计算效率，显著避免了线下手工整理文档的出错的情况，并且将字准比对计算程序本地化部署，简单易用，可实现应用服务器本地化调用算法，提升计算效率，无需长时间等待，并且安全高效。上述方案既提升了分析标注人员的工作准确性及效率，又提升了机器人的识别准确度。上述方案无需对接算法引擎系统实现字准计算比对，避免对接第三方系统带来的诸如网络问题、系统依赖性增强、定制化开发等问题。
61.需要说明的是，上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包含相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。
62.图3为本发明实施例提供的智能语音标注系统的字准检测装置的一个功能模块图。请参阅图3所示，所述智能语音标注系统的字准检测装置包括第一话术获取模块111，第二话术获取模块112，字准计算调用模块113，结果数据解析模块114及比对结果推送模块115。
63.所述第一话术获取模块111，用于获取机器人与客户对话片段中的客户语音的音转字识别文本，以作为机器人识别文本话术。
64.所述第一话术获取模块111可通过系统间http接口对接方式，从智能客服系统的录音平台和电话平台分别获取客户与机器人对话的录音音频文件及对应的录音信息，所述录音信息中包括所述录音音频文件的录音唯一识别号、录音开始时间、录音结束时间、录音时长、场景信息、所述业务线、录音文本(音转字识别文本)等数据信息，所述第一话术获取模块111可从所述录音信息中解析出机器人与客户对话片段中客户语音的音转字识别文本，以作为机器人识别文本话术。
65.第二话术获取模块112，用于获取业务标注人员听取机器人与客户对话片段中的客户语音时录入的客户说话文本，以作为客户文本话术。
66.当所述第一话术获取模块111通过系统间http接口对接方式，从智能客服系统的录音平台和电话平台分别获取客户与机器人对话的录音音频文件及对应的客户文本话术后，还需要与客户文本话术来进行字准比对，以评估asr引擎的识别准确度。所述客户文本话术是业务标注人员通过智能语音标注系统听取当时客户在与机器人对话过程中实际说话内容的录音音频数据，并在智能语音标注系统内手工录入客户说话的文本(这个过程就是业务标注人员所做的标注操作，即人工通过听录音识别客户当时所说的话)，所述第二话术获取模块112用于接收所述客户文本话术。
67.需要说明的是，在智能客服系统中，客户与机器人的每一次电话，都会对应产生一条录音音频文件和对应的录音信息，每条录音音频文件会对应多个前文描述的对话片段
(也称为话术片段)，每条录音信息会包括多个机器人识别文本话术，所述机器人识别文本话术与所述的对话片段一一对应。需要说明的是，所述机器人识别文本话术是通过asr(automatic speech recognition,语音识别技术)引擎将机器人与客户对话片段中的客户语音进行音转字识别后生成的文本。
68.所述字准计算调用模块113，用于调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对，以生成字准比对结果。具体地，调用字准比对本地脚本，求取将所述机器人识别文本话术转成所述客户文本话术所需的最少编辑操作次数、以及最少编辑操作次数中包含的操作类型及每种操作类型的次数，作为字准比对结果。
69.当所述第二话术获取模块112接收到业务标注人员在智能语音标注系统内手工录入客户说话的文本后，可实时调用字准比对本地脚本(字准计算python脚本)并计算出字准比对结果。本发明的通过在智能语音标注系统安装字准比对引擎环境(python)及相关字准比对算法程序，将字准比对算法程序部署于本地，可以方便智能语音标注系统的本地化调用，安全高效。
70.所述字准计算调用模块113在调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对时，可通过自动化执行命令，实时调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对，并实时计算出字准比对结果。
71.在一具体实例中，所述字准计算调用模块113调用字准比对本地脚本的方式例如可通过java端创建linux命令实例，传入需执行的计算命令及需进行比较的两个文本对象(机器人识别文本话术和客户文本话术)，所述字准比对本地脚本完成字准比对并结果以报文的形式发送给智能语音标注系统的结果数据解析模块114。
72.可以理解的是，在一些实施例中，所述字准计算调用模块113在调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对时，可响应于操作人员的字准比对指令，来调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对。
73.需要说明的是，在本实施例中，所述字准比对本地脚本是采用编辑距离的动态规划方法来对所述机器人识别文本话术和所述客户文本话术进行字准比对，以生成字准比对结果。具体地，所述字准比对本地脚本，采用编辑距离的动态规划方法求取将所述机器人识别文本话术转成所述客户文本话术所需的最少编辑操作次数、以及最少编辑操作次数中包含的操作类型及每种操作类型的次数，作为字准比对结果，其中，所述编辑操作的操作类型包括插入、删除和替换。
74.编辑距离是指两个字串之间，由一个转成另一个所需的最少编辑操作次数。通常来说，编辑距离越小，两个文本的相似性越大。编辑距离是针对二个字符串(中英文字符串)的差异程度的量化量测，量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。
75.编辑操作主要包括三个点：1.插入：将一个字符插入某个字符串；2.删除：将字符串中的某个字符删除；3.替换：将字符串中的某个字符替换为另外一个字符。
76.举例说明：satr变为smart。1.satr变为smatr(插入字符m)；2.smatr变为smat(删除字符r)3.smat变为smart(插入字符r)。因此，整个转换过程的编辑距离为3，包含插入、删
除两个操作，具体为两次插入操作，一次删除操作。该算法的思想即为动态规划。
77.动态规划思想的简单描述：当两个字符串都为空串，那么编辑距离为0；
78.当其中一个字符串为空串时，那么编辑距离为另一个非空字符串的长度；
79.当两个字符串均为非空时(长度分别为i和j)，取以下三种情况最小值即可：
80.1、长度分别为i-1和j的字符串的编辑距离已知，那么加1即可；
81.2、长度分别为i和j-1的字符串的编辑距离已知，那么加1即可；
82.3、长度分别为i-1和j-1的字符串的编辑距离已知，此时考虑两种情况，若第i个字符和第j个字符不同，那么加1即可；如果不同，那么不需要加1。
83.求长度为m和n的字符串的编辑距离，首先定义函数——edit(i,j)，它表示第一个长度为i的字符串与第二个长度为j的字符串之间的编辑距离。动态规划表达式可以写为：
84.if i＝＝0且j＝＝0，edit(i,j)＝0
85.if(i＝＝0且j》0)或者(i》0且j＝＝0)，edit(i,j)＝i j
86.ifi≥1且j≥1，edit(i,j)＝＝min{edit(i-1,j) 1,edit(i,j-1) 1,edit(i-1,j-1) d(i,j)}，当第一个字符串的第i个字符不等于第二个字符串的第j个字符时，d(i,j)＝1；否则，d(i,j)＝0。
87.最终的编辑距离即为edit(m，n)。
88.可以理解的是，也可以使用jaccard相似度算法、simhash相似度算法、bm25相似度算法、词向量平均求余弦相似度算法来对所述机器人识别文本话术和所述客户文本话术进行字准比对。
89.所述结果数据解析模块114，用于接收所述字准计算本地脚本的字准比对结果数据报文，并对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。
90.所述字准比对本地脚本完成字准比对并返回字准比对结果以报文的形式发送给智能语音标注系统的结果数据解析模块114，所述结果数据解析模块114在接收到所述字准计算本地脚本的字准比对结果数据报文后，需要对所述字准比对结果数据报文进行解析，以获取字准比对解析结果。所述字准比对解析结果例如可包含：正确字数、错误字数(插入错误字数替换错误字数删除错误字数)、标注文本长度(去除标点等特殊符号的长度)、插入错误字数、替换错误字数；删除错误字数中的一个或多个。可以理解的是，在其他实施例中，所述字准比对解析结果也可以包括字正确率、字错误率等其他结果，其中，字错误率＝代错误字数/标注文本长度，正确率＝1-字错误率。
91.具体地，所述结果数据解析模块114会通过读取文件流的方式，逐一解析所述字准计算本地脚本发送的字准比对结果数据报文，来获取字准比对解析结果，并将客户文本话术、机器人识别文本话术及这些字准比对解析结果存入数据库中，供所述智能语音标注系统展示该条语音字准比对的详细结果及产生语音识别准确率相关的统计报表，更直观的帮助分析人员提高标注准确性。
92.所述比对结果推送模块115，用于将所述字准比对结果推送至语音识别引擎。
93.所述比对结果推送模块115获取到字准比对解析结果后，还可将字准比对解析结果推送至电话平台的语音识别引擎进行再次训练，形成训练闭环，进一步提升语音识别引擎的识别准确率。
94.需要说明的是，上述的各功能模块实际实现时可以全部或部分集成到一个物理实
体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的部分或全部步骤，或以上的各功能模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
95.如图4所示，是本发明实现智能语音标注系统的字准检测方法的电子设备的一种结构示意图。
96.所述电子设备1可以包括存储器12、处理器13和总线，还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序，例如智能语音标注系统的字准检测程序。
97.其中，存储器12至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地，存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如基于智能语音标注系统的字准检测的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。
98.处理器13在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(control unit)，利用各种接口和线路连接整个电子设备1的各个部件，通过运行或执行存储在所述存储器12内的程序或者模块(例如执行智能语音标注系统的字准检测程序等)，以及调用存储在所述存储器12内的数据，以执行电子设备1的各种功能和处理数据。
99.所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述智能语音标注系统的字准检测方法中的步骤，例如图1所示的步骤。
100.示例性的，所述计算机程序可以被分割成一个或多个模块，所述一个或者多个模块被存储在所述存储器12中，并由所述处理器13执行，以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如，所述计算机程序可以被分割成第一话术获取模块111，第二话术获取模块112，字准计算调用模块113，结果数据解析模块114及比对结果推送模块115。
101.上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备，或者网络设备等)或处理器(processor)执行本发明
各个实施例所述智能语音标注系统的字准检测方法的部分功能。
102.本发明的智能语音标注系统的字准检测方法、装置、设备及介质，通过智能语音标注系统获取机器人与客户对话片段中的客户语音的音转字识别文本，以作为机器人识别文本话术；并通过智能语音标注系统获取业务标注人听取机器人与客户对话片段中的客户语音时录入的客户说话文本，以作为客户文本话术；调用字准比对本地脚本来对所述机器人识别文本话术和所述客户文本话术进行字准比对；接收所述字准计算本地脚本的字准比对结果数据报文，并对所述字准比对结果数据报文进行解析，以获取字准比对结果。本发明的智能语音标注系统的字准检测方法、装置、设备及介质，采用纯线上自动化实时实现机器人识别文本话术和客户文本话术的字准计算比对，替代了传统线下手工整理计算所需文档，提高了计算效率，显著避免了线下手工整理文档的出错的情况；本发明的智能语音标注系统的字准检测方法、装置、设备及介质，将字准比对计算程序本地化部署，简单易用，可实现应用服务器本地化调用算法，安全高效；本发明的智能语音标注系统的字准检测方法、装置、设备及介质，无需对接算法引擎系统实现字准计算比对，避免对接第三方系统带来的诸如网络问题、系统依赖性增强、定制化开发等问题。
103.对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。
104.以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种通过定时脸部识别保护用户隐私的方法及电子产品与流程

智能语音标注系统的字准检测方法、装置、设备及介质与流程

相关文献

最热文献