客服通话的质检方法、装置、计算机设备及存储介质与流程

2021-08-06 18:27:00 来源：中国专利 TAG：客服质检通话装置计算机

本发明涉及数据分析技术领域，尤其涉及一种客服通话的质检方法、装置、计算机设备及存储介质。

背景技术：

目前，部分企业或者运营商的客服中心已经通过客服质检系统对客服人员的服务质量进行质检。具体地，系统在进行工单抽样得到待质检的各个话务工单后，对语音进行分析并输出质检结果，为后续提升客服质量提供依据。

但是，现有技术中，往往通过人工去质检客服人员的专业能力，大大占用人工资源，而且缺少对客服的专业能力进行科学地评估，如果客服人员解答了错误的专业术语，则会导致客户所接收到的错误专业信息，从而严重降低客户体验，以及导致质检效果不佳最终评估出客服的质检报告准确度低。

技术实现要素：

本发明提供一种客服通话的质检方法、装置、计算机设备及存储介质，实现了能够自动对客服的通话音频文件分割、提取业务关键词和此类分布，结合业务标准词汇模型和客服类型匹配结果，输出客服的质检报告，减少了人工质检的人工成本，提高了质检报告的准确度和可靠性，为后续的提高客户满意度提供数据基础。

一种客服通话的质检方法，包括：

获取客服的通话音频文件；所述通话音频文件包含与所述客服对应的至少一个客服类型以及通话音频文件；所述通话音频文件为客服与客户的音频文件；

运用语音分割算法对所述通话音频文件进行分割处理，以及对分割处理后的所述通话音频文件进行语音识别，得到客服文本文件；

通过业务词汇检测模型，提取所述客服文本文件中的业务关键词，将所有业务关键词确定为通话词汇库；

对所述通话词汇库进行词类分布，确定出与所述通话词汇库对应的业务类型；

获取与所述业务类型匹配的业务标准词汇模型，通过获取的所述业务标准词汇模型对所述通话词汇库进行匹配识别，得到第一质检结果，同时将所述业务类型与各所述客服类型进行对比，得到第二质检结果；

根据所述第一质检结果和所述第二质检结果，确定所述客服对应的质检报告。

一种客服通话的质检装置，包括：

获取模块，用于获取客服的通话音频文件；所述通话音频文件包含与所述客服对应的至少一个客服类型以及通话音频文件；所述通话音频文件为客服与客户的音频文件；

分割模块，用于运用语音分割算法对所述通话音频文件进行分割处理，以及对分割处理后的所述通话音频文件进行语音识别，得到客服文本文件；

提取模块，用于通过业务词汇检测模型，提取所述客服文本文件中的业务关键词，将所有业务关键词确定为通话词汇库；

分布模块，用于对所述通话词汇库进行词类分布，确定出与所述通话词汇库对应的业务类型；

输出模块，用于获取与所述业务类型匹配的业务标准词汇模型，通过获取的所述业务标准词汇模型对所述通话词汇库进行匹配识别，得到第一质检结果，同时将所述业务类型与各所述客服类型进行对比，得到第二质检结果；

确定模块，用于根据所述第一质检结果和所述第二质检结果，确定所述客服对应的质检报告。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述客服通话的质检方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述客服通话的质检方法的步骤。

本发明提供的客服通话的质检方法、装置、计算机设备及存储介质，通过获取客服的通话音频文件；所述通话音频文件包含与所述客服对应的至少一个客服类型以及通话音频文件；所述通话音频文件为客服与客户的音频文件；运用语音分割算法对所述通话音频文件进行分割处理，以及对分割处理后的所述通话音频文件进行语音识别，得到客服文本文件；通过业务词汇检测模型，提取所述客服文本文件中的业务关键词，将所有业务关键词确定为通话词汇库；对所述通话词汇库进行词类分布，确定出与所述通话词汇库对应的业务类型；获取与所述业务类型匹配的业务标准词汇模型，通过获取的所述业务标准词汇模型对所述通话词汇库进行匹配识别，得到第一质检结果，同时将所述业务类型与各所述客服类型进行对比，得到第二质检结果；根据所述第一质检结果和所述第二质检结果，确定所述客服对应的质检报告，因此，实现了自动对客服的通话音频文件分割、提取业务关键词和词类分布，结合业务标准词汇模型和客服类型匹配结果，输出客服的质检报告，减少了人工质检的人工成本，提高了质检报告的准确度和可靠性，有利于提高客服人员的业务素质，并为后续的提高客户满意度提供数据基础。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中客服通话的质检方法的应用环境示意图；

图2是本发明一实施例中客服通话的质检方法的流程图；

图3是本发明一实施例中客服通话的质检方法的步骤s201的流程图；

图4是本发明一实施例中客服通话的质检方法的步骤s202的流程图；

图5是本发明一实施例中客服通话的质检方法的步骤s30的流程图；

图6是本发明一实施例中客服通话的质检方法的步骤s50的流程图；

图7是本发明一实施例中客服通话的质检装置的原理框图；

图8是本发明一实施例中计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的客服通话的质检方法，可应用在如图1的应用环境中，其中，客户端(计算机设备)通过网络与服务器进行通信。其中，客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

所述客服通话的质检方法由客户端或者服务端执行。

在一实施例中，如图2所示，提供一种客服通话的质检方法，其技术方案主要包括以下步骤s10-s60：

s10，获取客服的通话音频文件；所述通话音频文件包含与所述客服对应的至少一个客服类型以及通话音频文件；所述通话音频文件为客服与客户的音频文件。

可理解地，所述通话音频文件为录制的客服和客户之间沟通的通话文件，所述通话音频文件的格式可以根据需求设定，比如通话音频文件的语音取样的比特率为128kbps(千比特每秒)，以有利于获取语音质量高的音频文件，所述通话音频文件采用双向通道录制方式，分别通过客户与客服的双方的声源进行录制，保证了通话音频文件的获取，例如：所述通话音频文件包含客服类型、通话时长、开始时间和结束时间等，所述通话音频文件可通过数据管理平台udmp(datamanagementplatform)获取，所述数据管理平台为存储了所有客服与客户的通话音频文件，所述通话音频文件也可以通过质量筛选获得，将通话异常的通话音频文件进行舍弃，所述通话异常包括低于3s的通话录音、客户接通异常等。

s20，运用语音分割算法对所述通话音频文件进行分割处理，以及对分割处理后的所述通话音频文件进行语音识别，得到客服文本文件。

可理解地，所述语音分割算法为对所述通话音频文件进行平滑切割，得到多个均分的待处理音频片段，并对各所述待处理音频片段进行声学特征提取，并根据提取的各声学特征映射出与各所述待处理音频片段的待分类特征向量，所述声学特征为与客服的声学相关特征，例如音色，以及运用信道补偿算法，对各所述待分类特征向量进行识别，识别出与所述客服对应的声学特征向量匹配的所述待分类特征向量，并标记为客服的角色标识；将所有标记为客服的角色标识的所述待处理音频片段按照时间顺序进行拼接，输出所述客服音频文件的算法，所述语音识别技术(automaticspeechrecognition，asr)就是把语音信号转变为相应的文本的技术，通过所述语音识别技术，可以将所述通话音频文件转换成客服文本文件，将所述通话音频文件进行语音识别，输出客服文本文件，

所述客服文本文件为所述通话音频文件通过语音分割算法分割后，并运用语音识别技术识别语音而转换成文字的文本文件。

在一实施例中，所述步骤s20中，即所述运用语音分割算法对所述通话音频文件进行分割处理，以及对分割处理后的所述通话音频文件进行语音识别，得到客服文本文件，包括：

s201，运用语音分割算法，通过客服识别模型对所述通话音频文件进行声学特征提取，根据提取的所述声学特征识别出所述通话音频文件中的客服的待处理音频片段，并将所有所述待处理音频片段进行拼接，得到客服音频文件。

可理解地，在客服质检的过程中，需要对对所述通话音频文件进行客服和客户进行分割区分出客服的通话内容，运用所述语音分割算法，自动从所述通话音频文件中提取声学特征，识别出与其匹配的客服，从而确定出该客服的所述客服音频文件。

其中，所述语音分割算法为对所述通话音频文件进行平滑切割，得到多个均分的待处理音频片段，并对各所述待处理音频片段进行声学特征提取，并根据提取的各声学特征映射出与各所述待处理音频片段的待分类特征向量，以及运用信道补偿算法，对各所述待分类特征向量进行识别，识别出与所述客服对应的声学特征向量匹配的所述待分类特征向量，并标记为客服的角色标识；将所有标记为客服的角色标识的所述待处理音频片段按照时间顺序进行拼接，输出所述客服音频文件的算法。

在一实施例中，如图3所示，所述步骤s201中，即所述运用语音分割算法，通过客服识别模型对所述通话音频文件进行声学特征提取，根据提取的所述声学特征识别出所述通话音频文件中的客服的待处理音频片段，并将所有所述待处理音频片段进行拼接，得到客服音频文件，包括：

s2011，获取预设滑动窗，并对所述通话音频文件进行平滑切割，得到多个均分的待处理音频片段。

可理解地，所述预设滑动窗为预设音频帧范围内的窗口，例如1帧窗口、2帧窗口等等，对所述通话音频文件均分成与所述预设滑动窗等长度的所述待处理音频片段。

s2012，将各所述待处理音频片段输入客服识别模型中，通过所述客服识别模型对各所述待处理音频片段进行所述声学特征提取，得到各所述待处理音频片段的待分类特征向量。

可理解地，所述客服识别模型为通过历史所有客服的音频样本进行训练完成获得的神经网络模型，所述客服识别模型实现了自动识别出输入的音频片段的待分类特征向量，所述待分类特征向量为所有客服映射对应的特征向量值，对各所述待处理音频片段进行所述声学特征提取，得到各所述待处理音频片段的待分类特征向量。提取所述x-vector特征为在mfcc特征的基础上增加噪声和混响信道特征的特征，提取所述声学特征的过程为将不定长的音频通过加该音频段的噪声和混响的信道信息进行数据扩充，然后经由深度神经网络映射成预设维度的特征向量的过程，将所述待处理音频片段经过所述声学特征提取后得到的所述待处理音频片段的待分类特征向量。

s2013，运用信道补偿算法，对各所述待分类特征向量进行识别，识别出与所述客服对应的声学特征向量匹配的所述待分类特征向量，并将与其对应的所述待处理音频片段标记为客服的角色标识。

可理解地，运用信道补偿算法，建立基于信道补偿的神经网络模型，该模型训练的目标就是输入音频数据集，输出表示该音频数据集的各参数，即噪声空间维度和身份空间维度的参数，从而得到声纹函数的训练过程，运用基于信道补偿的神经网络模型对各所述待分类特征向量进行信道补偿，所述信道补偿为输入至训练完成的声纹函数中增加噪声空间的补充以及身份空间的补偿，通过将信道补偿后的所述待分类特征向量与各客服对应的声学特征向量进行匹配，匹配出与其最靠近的所述声学特征向量，将与其最靠近的所述声学特征向量确定为与该待分类特征向量匹配的所述待分类特征向量，并将与其对应的所述待处理音频片段标记为客服的角色标识。

其中，所述声学特征向量为与其对应客服映射出的具有唯一声学特征的向量，所述客服的角色标识可以为同一唯一标识，或者为不同客服对应的不同唯一标识，为了保证质检结果的准确度，每位客服拥有具有唯一性的所述客服的角色标识，例如工号id、客服的身份证号码等。

s2014，将所有标记为客服的角色标识的所述待处理音频片段按照时间顺序进行拼接，得到所述客服音频文件。

可理解地，根据时间顺序拼接所述待处理音频片段，可以保证所述客服音频文件和客户音频文件在对话场景中的逻辑性，即保证在后续的客服质检过程中的准确性，提高客服质检的准确率。

本发明实现了通过进行所述分割处理，所述分割处理为通过对所述客服音频文件获取预设滑动窗，并对所述通话音频文件进行平滑切割，得到多个均分的待处理音频片段；将各所述待处理音频片段输入客服识别模型中，通过所述客服识别模型对各所述待处理音频片段进行所述声学特征提取，得到各所述待处理音频片段的待分类特征向量；运用信道补偿算法，对各所述待分类特征向量进行识别，识别出与所述客服对应的声学特征向量匹配的所述待分类特征向量，并将与其对应的所述待处理音频片段标记为客服的角色标识；将所有标记为客服的角色标识的所述待处理音频片段按照时间顺序进行拼接，得到所述客服音频文件，如此，实现了在质检过程中，能够准确地从客服音频文件中截取出只有客服的客服音频文件，无需人工识别出客服的音频片段，节省了人工判断及截取的过程，提高了质检效率，并节省了成本。

s202，运用语音识别技术，将所述客服音频文件转换成客服文本文件。

可理解地，所述客服文本文件为所述通话音频文件通过语音分割算法分割后，并运用语音识别技术识别语音而转换成文字的文本文件。

本发明实现了运用语音分割算法，通过客服识别模型对所述通话音频文件进行声学特征提取，根据提取的所述声学特征识别出所述通话音频文件中的客服的待处理音频片段，并将所有所述待处理音频片段进行拼接，得到客服音频文件；运用语音识别技术，将所述客服音频文件转换成客服文本文件，如此，实现了通过语音分割算法和语音识别技术，能够准确地通话音频文件中划分并转换出客服的客服文本文件，为后续的质检分析提供了数据基础，提高了质检报告输出的准确率。

在一实施例中，如图4所示，所述步骤s202中，即所述运用语音识别技术，将所述客服音频文件转换成客服文本文件，包括：

s2021，运用语音识别技术，对所述客服音频文件进行识别，得到待检测文本。

可理解地，所述语音识别技术(automaticspeechrecognition，asr)就是把语音信号转变为相应的文本的技术，通过所述语音识别技术，可以将所述通话音频文件转换成文本内容，即对所述通话音频文件进行信号处理后，按帧(毫秒级)拆分出预设段的波形，并对拆分出的预设段波形按照人耳特征转换成多维向量信息，将转换后的多维向量信息进行识别出状态信息，在将状态信息组合成音素，最后将音素组成字词并串连成句的技术，所述识别过程为运用所述语音识别技术识别所述通话音频文件中音频包含的文本内容的过程，经过识别之后输出所述文本文件，所述文本文件为所述通话音频文件中的文本内容。

s2022，运用word2vec算法，对所述待检测文本进行向量转换，得到向量文本。

可理解地，所述cnn网络为深度学习神经网络，所述cnn网络为用于将字符转换成字符嵌入向量且训练完成的神经网络模型，所述word2vec算法为将词语转换成词嵌入向量的算法，通过所述cnn网络和所述word2vec算法可以将所述对话文本中的每个字或者词语进行向量转换，将向量转换后的字符嵌入向量和词嵌入向量进行拼接，得到所述向量文本，所述向量转换包括将字符转换成字符嵌入向量和将词语转换成词嵌入向量的转换过程，所述向量文本为包括字符嵌入向量和/或词嵌入向量的向量数组。

s2023，运用双向长短期记忆网络，对所述向量文本进行语义识别，得到所述客服文本文件。

可理解地，所述语义识别为运用双向长短期记忆网络对所述向量文本提取所述待检测文本中的上下文语义特征，预测出文本内容的识别过程，所述文本结果为经过所述语义识别输出的文本内容。

本发明实现了通过运用语音识别技术，对所述客服音频文件进行识别，得到待检测文本；运用word2vec算法，对所述待检测文本进行向量转换，得到向量文本；运用双向长短期记忆网络，对所述向量文本段进行语义识别，得到所述客服文本文件，，如此，实现了运用语音识别技术、word2vec算法以及双向长短期记忆网络，能够准确地根据语义对客服音频文件转换成文本，为后续的质检分析提供了数据基础，提高了质检报告输出的准确率。

s30，通过业务词汇检测模型，提取所述客服文本文件中的业务关键词，将所有业务关键词确定为通话词汇库。

可理解地，所述业务词汇检测模型为通过客服的业务知识库进行训练获得的词汇检测模型，所述业务知识库包括客服所涉及的服务业务内容，可用于企业客服培训和业务详情查询，针对客服的业务能力进行质检，则需要通过利用客服业务的业务知识库。所述业务词汇检测模型通过所述词典业务词汇检测模型对所述客服文本文件进行业务关键词的提取，并将所有业务关键词确定为通话词汇库用于客服业务能力的质检，所述业务关键词为与所述业务知识库中的相关业务的专业术语，所述业务知识库包含多种业务种类，所述业务种类包括但不限于以下种类：家电产品、农副产品、数码产品、金融产品、妆护产品、服饰产品等。

其中，所述业务标准词汇模型的训练过程为通过对业务知识库内的术语中的业务关键词进行筛选，将每个术语的业务关键词进行分组，并将筛选好的业务关键词作为业务标准词汇，构建所述业务标准词汇模型，，所述业务标准词汇模型构建方式包括导入业务知识库的术语，并通过业务词汇检测模型筛选出业务关键词作为标准业务词汇统计对应标准业务词汇的词频，例如：业务知识库：您好，为您推荐的这款产品会在运输过程中产生损坏，损坏率为4％，当损坏率超过10％将会进行赔偿，业务词汇检测模型分词后：您好/为您/推荐的这款/产品/会在/运输/过程中/产生/损坏/损坏率/为/4％/当/损坏率/超过/10％/将会/进行/赔偿，通过业务词汇检测模型筛选出业务词汇，设置为标准业务词汇：产品/运输/损坏率/4％/损坏率/超过/10％/赔偿，根据标准业务词汇所统计出的词频：产品[1]运输[1]损坏率[2]4％[1]超过[1]10％[1]赔偿[1]，将所述术语和所述术语的标准业务词汇及词频，存储至业务标准词汇模型，完成业务标准词汇模型的构建。

其中，所述业务标准词汇模型可以通过openapi(applicationprogramminginterface，应用程序接口)进行交互处理，对此并不进行限定。

在一实施例中，如图5所示，所述步骤s30中，通过业务词汇检测模型，提取所述客服文本文件中的业务关键词，将所有业务关键词确定为通话词汇库，包括：

s301，通过所述业务词汇检测模型，对所述客服文本文件进行分词处理，得到多个分词文本。

可理解地，所有标记为客服的角色标识的所述待处理音频片段按照时间顺序进行拼接，所述客服文本文件为分割后获得的客服音频文件转换成文本的文件，所述客服文本文件包含中文、英文和数字，通过对所述客服文本文件进行分词处理，得到多个分词文本。在客服业务能力质检中，多个分词文本则对应所述业务知识库中不同的专业术语。

s302，通过所述业务词汇检测模型，根据业务词库对各所述分词文本进行业务关键词识别，得到各个所述分词文本的关键词识别结果。

可理解地，所述业务词汇检测模型是将分割后的所述多个分词文本筛选出业务关键词，得到各个所述分词文本的关键词识别结果，所述关键词识别结果表明了与其对应的所述分词文本中的关键词的集合，例如：客服通话内容为：您好，为您推荐的这款樱桃会在运输过程中产生损坏，损坏率为4％，当损坏率超过10％将会进行赔偿，进行词汇分割出：您好/为您/推荐的这款/产品/会在/运输/过程中/产生/损坏/损坏率/为/4％/当/损坏率/超过/10％/将会/进行/赔偿，对其进行业务关键词筛选得到识别结果：樱桃/运输/损坏率/4％/损坏率/超过/10％/赔偿。

在另一实施例中，当检测到所述业务知识库出现无法识别的陌生词汇时，通过词汇词典进行检索识别陌生词汇，并将识别后的陌生词汇根据词汇词典匹配相似或相近的标准专业词汇进行标注，在接下来的质检分析过程中，暂时将标准专业词汇替代陌生词汇进行分析。并在此次分析结束后，存入所述标准业务词汇模型库，关联相近标准业务词汇。当无法识别词汇不能正常识别，或标注相近标准业务词汇后，导致分析结果波动严重，则将无法识别词汇进行统计，通过人工标注的方式进行判断，其中，所述词汇词典的内容为现代汉语词典，将所述陌生词汇通过所述词汇词典进行查询检索，可查询到所述陌生词汇的词义、相近词、近义词和反义词等词汇信息，例如：客户通话内容为：“请问，刚刚推荐的那款樱桃会在运输过程中会被挤坏吗？挤坏率为多少？”，客户文本文件的词汇分割：请问/刚刚/推荐的/那款/樱桃/会/在运输过程中/会/被/挤坏/吗？挤坏率/为/多少。经过词汇词典检索后可知，陌生词汇“挤坏”与标准专业词汇“损坏”意思相近，将并陌生词汇“挤坏”标注上“损坏”后，暂时将标准专业词汇替代陌生词汇进行分析，标准业务词汇及词频：产品[1]运输[1]损坏率[2]4％[1]超过[1]10％[1]赔偿[1]，陌生词汇标注后的标准业务词汇及词频：产品[1]运输[1]挤坏(损坏)率[2]4％[1]超过[1]10％[1]赔偿[1]，如此，通过所述词汇词典完善所述业务词汇检测模型的业务词汇量。

s303，将所有的所述关键词识别结果为业务关键词，确定为所述通话词汇库。

本发明实现了通过通过所述业务词汇检测模型，对所述客服文本文件进行分词处理，得到多个分词文本；通过所述业务词汇检测模型，根据业务词库对各所述分词文本进行业务关键词识别，得到各个所述分词文本的关键词识别结果；将所有的所述关键词识别结果为业务关键词，确定为所述通话词汇库如此，实现了通过所述业务词汇检测模型是将分割后的所述多个分词文本筛选出业务关键词，得到各个所述分词文本的关键词识别结果，提高了质检分析的效率，提高了质检分析的准确性。

s40，对所述通话词汇库进行词类分布，确定出与所述通话词汇库对应的业务类型。

可理解地，对所述通话词汇库进行词类分布，识别所述通话词汇库中的业务词汇的词频较高的业务关键词，通过词频最高的业务关键词，确定出与所述通话词汇库对应的业务类型。，所述词类分布为所述通话词汇库中的业务关键词的分布情况，可以通过词频进行分布，也可以通过词性的业务类型进行分布，在出现多业务类型的通话词汇库，将所述通话词汇库添加更多的业务标签，并将通话词汇库匹配对应标准业务词汇模型库，例如通话词汇库的部分内容如下：“樱桃/运输/损坏率/4％/损坏率/超过/10％/赔偿”，根据词汇中的本次通话词汇库识别为樱桃产品的业务类型。

s50，获取与所述业务类型匹配的业务标准词汇模型，通过获取的所述业务标准词汇模型对所述通话词汇库进行匹配识别，得到第一质检结果，同时将所述业务类型与各所述客服类型进行对比，得到第二质检结果。

可理解地，客服业务能力的质检从所述业务类型匹配的业务标准词汇模型词频匹配度，以及与所述业务类型与各所述客服类型的相似度两个维度进行分析，将通话词汇库与标准业务词汇模型库的词频对比，以标准业务词汇及标准业务词汇词频为标准，统计通话词汇库中对应的业务词汇及词频，对于通话词汇库中没有达到标准业务词汇词频及词频，统计标准业务词汇词频所对应的术语出现的词频异常，再根据客服的多个词频异常的术语进行统计，和同日的多个通话词汇库进行统计分析，分析客服在服务讲解中，所使用的术语中出现的问题。所述匹配识别是根据标准业务词汇模型库中术语的所述标准业务词汇，将所述通话词汇库的每句分割的业务关键词汇进行语义对比的过程，所述对比过程则根据标准业务词汇模型库中的所述标准业务词汇及词频，与所述通话词汇库的业务关键词汇及词频的相似度计算处理过程，所述第一质检结果表明了客服在与客户通话中，所存在的业务术语的问题，所述第二质检结果通过相似度值对应的分数，直观表明了客服本次沟通的业务能力。

在一实施例中，如图6所示，所述步骤s50中，即所述获取与所述业务类型匹配的业务标准词汇模型，通过获取的所述业务标准词汇模型对所述通话词汇库进行匹配识别，得到第一质检结果，包括：

s501，通过所述业务标准词汇模型，对所述通话词汇库中各个分词文本进行词频汇总，得到各个所述分词文本的词频匹配度。

可理解地，所述业务标准词汇模型通过所述业务词汇检测模型，对业务知识库内的术语中的业务关键词进行筛选，将每个术语的业务关键词进行分组，并将筛选好的业务关键词作为业务标准词汇，构建所述业务标准词汇模型。以所述业务标准词汇模型的业务标准词汇为标准，统计所述业务标准词汇词频，对所述通话词汇库中各个所述分词文本进行词频汇总，不同的术语包括不同的业务标准词汇，通过识别匹配对应术语下的业务关键词，得到各个所述分词文本的词频匹配度。

s502，通过所述业务标准词汇模型，根据各个所述分词文本的序列标注，对各个所述分词文本进行先后顺序检测，得到各个所述分词文本的词序匹配度。

可理解地，所述所述词序匹配度为各个所述分词之间的先后顺序的符合程度，根据时间顺序拼接所述待处理音频片段，根据各个所述分词文本的序列标注，对各个所述分词文本进行先后顺序检测，即对各个分词文本中标注的序列进行上下文顺序检测，判断是否符合预设的先后顺序的设定，以保证所述分词文本的语义不变。

s503，运用加权算法，根据各所述分词文本的所述词频匹配度和所述词序匹配度，计算各所述分词文本的最终匹配度。

可理解地，所述加权算法为对所述词频匹配度和所述词序匹配度赋予各自的权重，将所述词频匹配度和与其对应的权重以及所述词序匹配度和与其对应的权重分别相乘后求和，得到所述最终匹配度，所述权重的范围可以根据需求设定，比如0值1的取值范围。

s504，根据所有所述最终匹配度，确定所述第一质检结果。

可理解地，将所有所述最终匹配度进行汇总获得所述第一质检结果。

本发明实现了通过所述业务标准词汇模型，对所述通话词汇库中各个分词文本进行词频汇总，得到各个所述分词文本的词频匹配度；通过所述业务标准词汇模型，根据各个所述分词文本的序列标注，对各个所述分词文本进行先后顺序检测，得到各个所述分词文本的词序匹配度；运用加权算法，根据各所述分词文本的所述词频匹配度和所述词序匹配度，计算各所述分词文本的最终匹配度；根据所有所述最终匹配度，确定所述第一质检结果，如此，实现了通过标准业务词汇模型库中术语的所述标准业务词汇，将所述通话词汇库的每句分割的业务关键词汇进行语义对比，发现客服在与客户通话中，所存在的业务术语的问题，提高了质检报告输出的准确率。

在一实施例中，所述步骤s50中，即所述将所述业务类型与各所述客服类型进行对比，得到第二质检结果，包括：

s505，运用余弦相似度算法，计算所述业务类型与各所述客服类型的相似度。

可理解地，所述余弦相似度算法为通过测量两个向量的夹角的余弦值来度量它们之间的相似性，通常用于文本挖掘中的文件比较。通过相似度算法可直观地得出客服的所述分词文本与其所对应的术语相似度，对客服业务能力进行量化参考，该方式作为客服业务能力质检的第二质检结果。

s506，获取所有所述相似度中的平均相似度。

可理解地，运用余弦相似度算法对每个所述分词文本进行相似度计算，将业务关键词的词频与其所对应的标准业务词汇的词频转化为词频向量余弦相似度计算公式为

其中，标准业务词汇词频的词频向量为a:(a1,a2,...,an)，通话词汇库的业务词汇词频的词频向量为b:(b1,b2,...,bn)，余弦相似度值为cos(θ)，在计算中会先根据所识别的内容进行匹配，所以不会出现毫无相似度的情况(向量b集合之和大于0)，关于余弦相似度计算公式示例如下，标准业务词汇模型库：某产品[1]耗损率[1]预计[1]2％[1]环保型[1]建材产品[1]运输[1]有[1]一定[1]风险[1]；通话词汇库：某产品[1]耗损率[1]预计[0]2％[0]环保型[0]建材产品[1]运输[0]有[0]一定[0]风险[1]。

其中，词频向量为：a:(1,1,1,1,1,1,1,1,1,1)，b:(1,1,0,0,0,0,1,0,0,1)；余弦相似度计算方式为可知cos(θ)的值约为0.632。

s507，在所述平均相似度大于预设阈值时，确定所述第二质检结果为合格。

可理解地，当平均相似度大于一定的值的时候，客服的业务能力是符合质检标准，根据统计后将预设阈值设置为0.8，当计算出的相似度值的范围大于0.8，所述第二质检结果为合格。

s508，在所述平均相似度小于或者等于所述预设阈值时，确定所述第二质检结果为不合格。

可理解地，当平均相似度低于一定的值的时候，客服的业务能力是不符合质检标准，当计算出的相似度值的没有超过0.8，所述第二质检结果为不合格。

本发明实现了通过运用余弦相似度算法，计算所述业务类型与各所述客服类型的相似度；获取所有所述相似度中的平均相似度；在所述平均相似度大于预设阈值时，确定所述第二质检结果为合格；在所述平均相似度小于或者等于所述预设阈值时，确定所述第二质检结果为不合格，如此，实现了通过计算所述标准业务词汇模型库中的所述标准业务词汇及词频，与所述通话词汇库的业务关键词汇及词频的相似度值，相似度值量化，直观表明了客服此次沟通的业务能力分数。

s60，根据所述第一质检结果和所述第二质检结果，确定所述客服对应的质检报告。

可理解地，通过所述第一质检结果和所述第二质检结果的两个维度的质检结果相结合，其中，根据所述第二质检结果，确定所述客服业务能力是否合格，再根据所述第一质检结果发现客服的能力缺陷，确定所述客服对应的质检报告。

本发明通过获取客服的通话音频文件；所述通话音频文件包含与所述客服对应的至少一个客服类型以及通话音频文件；所述通话音频文件为客服与客户的音频文件；运用语音分割算法对所述通话音频文件进行分割处理，以及对分割处理后的所述通话音频文件进行语音识别，得到客服文本文件；通过业务词汇检测模型，提取所述客服文本文件中的业务关键词，将所有业务关键词确定为通话词汇库；对所述通话词汇库进行词类分布，确定出与所述通话词汇库对应的业务类型；获取与所述业务类型匹配的业务标准词汇模型，通过获取的所述业务标准词汇模型对所述通话词汇库进行匹配识别，得到第一质检结果，同时将所述业务类型与各所述客服类型进行对比，得到第二质检结果；根据所述第一质检结果和所述第二质检结果，确定所述客服对应的质检报告。因此，实现了自动对客服的通话音频文件分割、提取业务关键词和词类分布，结合业务标准词汇模型和客服类型匹配结果，输出客服的质检报告，减少了人工质检的人工成本，提高了质检报告的准确度和可靠性，有利于提高客服人员的业务素质，并为后续的提高客户满意度提供数据基础。

在一实施例中，提供一种客服通话的质检装置，该客服通话的质检装置与上述实施例中客服通话的质检方法一一对应。如图7所示，该客服通话的质检装置包括获取模块11、分割模块12、提取模块13、分布模块14、输出模块15和确定模块16，各功能模块详细说明如下：

获取模块11，用于获取客服的通话音频文件；所述通话音频文件包含与所述客服对应的至少一个客服类型以及通话音频文件；所述通话音频文件为客服与客户的音频文件；

分割模块12，用于运用语音分割算法对所述通话音频文件进行分割处理，以及对分割处理后的所述通话音频文件进行语音识别，得到客服文本文件；

提取模块13，用于通过业务词汇检测模型，提取所述客服文本文件中的业务关键词，将所有业务关键词确定为通话词汇库；

分布模块14，用于对所述通话词汇库进行词类分布，确定出与所述通话词汇库对应的业务类型；

输出模块15，用于获取与所述业务类型匹配的业务标准词汇模型，通过获取的所述业务标准词汇模型对所述通话词汇库进行匹配识别，得到第一质检结果，同时将所述业务类型与各所述客服类型进行对比，得到第二质检结果；

确定模块16，用于根据所述第一质检结果和所述第二质检结果，确定所述客服对应的质检报告。

关于客服通话的质检装置的具体限定可以参见上文中对于客服通话的质检方法的限定，在此不再赘述。上述客服通话的质检装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是客户端或者服务端，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机程序和数据库。该内存储器为可读存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种客服通话的质检方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中客服通话的质检方法。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中客服通话的质检方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种带有内置扩音器的便携折叠式吉他的制作方法

客服通话的质检方法、装置、计算机设备及存储介质与流程

相关文章

最热文献