一种呼叫中心热点发现方法、装置和电子设备与流程

2022-11-14 16:13:06 来源：中国专利 TAG：

1.本技术涉及数据处理的领域，尤其是涉及一种呼叫中心热点发现方法、装置和电子设备。

背景技术：

2.呼叫中心主要处理来自企业、用户的电话垂询，由于呼叫中心面向的企业和用户数量较多，因此每天接触的咨询业务也较多，在大量咨询数据中提取用户的热点信息，并基于热点信息做出反馈和分析，便于满足大多数用户的需求。
3.热点信息指比较受大众关注或欢迎的公共服务新闻或信息，或指某时期引人注目的公共服务新闻或问题，相关技术中，对大量话务数据中对热点信息进行识别时，通过先将大量话务数据进行聚类，再对形成的聚类结果直接进行热点信息识别，但由于话务数据数量较大，形成聚类结果时极易出现偏差，进而影响识别热点信息时的准确性。

技术实现要素：

4.为了提高确定热点信息时的准确度，本技术提供一种呼叫中心热点发现方法、装置和电子设备。
5.第一方面，本技术提供一种呼叫中心热点发现方法，采用如下的技术方案：一种呼叫中心热点发现方法，包括：获取至少一个新增工单数据，所述新增工单数据是用户与呼叫中心建立联系后形成的；将所述至少一个新增工单数据进行聚类，得到至少一个新增工单簇；判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准；确定每一符合预设聚类标准的新增工单簇对应的聚类边界信息；根据每一新增工单簇对应的聚类边界信息，确定对应的热点信息，并将每一热点信息进行反馈。
6.通过采用上述技术方案，在获取到至少一个新增工单数据后，将至少一个新增工单数据进行聚类，其中新增工单数据是用户与呼叫中心建立通讯联系后形成的，聚类后得到至少一个新增工单簇，判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准，再确定每一符合预设聚类标准的新增工单数据对应的聚类空间范围，最后根据每一新增工单簇对应的聚类空间范围，确定每一新增工单簇对应的热点信息，并将热点信息进行反馈，通过对不符合预设聚类标准的新增工单簇进行聚类优化，便于提高识别热点信息时的准确性。
7.在一种可能实现的方式中，所述将所述至少一个新增工单数据进行聚类，得到至少一个新增工单簇，包括：确定每一新增工单数据对应的新增工单向量；
根据预设聚类关联半径和初始核心向量对所有的新增工单向量进行聚类，得到至少一个新增工单簇，所述初始核心向量为任一新增工单向量，用于表征对所有的新增工单向量进行聚类时的基准向量。
8.通过采用上述技术方案，通过得到每一新增工单数据对应的新增工单向量，再根据预设聚类关联半径和初始核心向量对所有新增工单向量进行聚类，便于提高对新增工单数据进行聚类时的准确性。
9.在一种可能实现的方式中，所述根据预设聚类关联半径和初始核心向量对所有的新增工单向量进行聚类，包括：基于预设聚类关联半径和初始核心向量，确定所述初始核心向量对应的核心范围；根据所述初始核心向量对应的核心范围和剩余向量，确定与所述初始核心向量相关联的关联向量，并将所有的所述关联向量与所述初始核心向量进行聚类形成一个新增工单簇，所述剩余向量为所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量；若剩余向量的个数不为零，则根据所述剩余向量，确定下一初始核心向量，循环执行所述根据所述初始核心向量对应的核心范围和剩余向量，确定与所述初始核心向量相关联的关联向量，并将所有的所述关联向量与所述初始核心向量进行聚类形成一个新增工单簇，直至所述剩余向量的个数为零。
10.通过采用上述技术方案，通过预设聚类关联半径和初始核心向量对初始核心向量对应的核心范围进行确定，再根据初始核心向量对应的核心范围和所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量确定的剩余向量，确定与初始核心向量相关联的关联向量，其次将所有关联向量与初始核心向量聚类为一个新增工单簇，再判断所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量的个数是否为零，不为零时，根据剩余向量对下一初始核心向量进行确定，并循环执行确定初始核心向量对应的关联向量步骤，直至剩余向量的个数为零，提高了确定新增工单簇时的准确程度。
11.在一种可能实现的方式中，根据任一初始核心向量对应的核心范围和剩余向量，确定与所述任一初始核心向量相关联的关联向量，并将所有的所述关联向量与所述任一初始核心向量进行聚类形成一个新增工单簇，包括：从剩余向量中确定位于新增工单簇对应的核心范围内的其他新增工单向量，所述新增工单簇对应的核心范围为每个关联向量对应的核心范围以及初始核心向量对应的核心范围组成的总范围；将符合预设标准的新增工单向量确定为与所述初始核心向量关联的关联向量，并将所述任一个其他新增工单向量与所述初始核心向量进行聚类形成一个新增工单簇；循环执行所述从剩余向量中确定位于新增工单簇对应的核心范围内的其他新增工单向量，直至满足预设条件，所述预设条件包括以下任一项：所述新增工单簇对应的核心范围内不存在其他新增工单向量；所述新增工单簇对应的核心范围内存在其他新增工单向量，且对应的其他新增工单向量均不符合所述预设标准。
12.通过采用上述技术方案，通过从所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量确定出新增工单簇对应的核心范围内的其他新增工单向量后，判断其他新增工单向量是否符合预设标准，并将符合预设标准的任一其他新增工单向量确定为与初始核心向量关联的关联向量，再将该任一其他新增工单向量与初始核心向量进行聚类形成一个新增工单簇，最后再循环执行确定其他新增工单向量的步骤直至满足新增工单簇对应的核心范围内不存在其他新增工单向量或新增工单簇对应的核心范围内存在其他新增工单向量，且对应的其他新增工单向量均不符合预设标准为止，提高了对新增工单数据向量进行聚类时的准确性。
13.在一种可能实现的方式中，所述判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，包括：判断每一新增工单簇对应的聚类空间范围是否符合预设聚类标准对应的标准空间范围，所述聚类空间范围为每一新增工单簇中至少一个新增工单向量确定的；若存在不符合预设聚类标准的新增工单簇，则根据所述不符合预设聚类标准的新增工单簇对应的聚类空间范围和预设聚类标准对应的标准空间范围，确定聚类异常类型；若聚类异常类型为新增工单簇对应的聚类空间范围小于所述标准空间范围，则将所述不符合预设聚类标准的新增工单簇进行合并；若聚类异常类型为新增工单簇对应的聚类空间范围大于所述标准空间范围，则将所述不符合预设聚类标准的新增工单簇进行细化。
14.通过采用上述技术方案，通过判断每一新增工单簇对应的聚类空间范围是否符合预设聚类标准空间范围，并将不符合预设聚类标准空间范围的新增工单簇对应的聚类空间空间范围进行确定，再将聚类空间范围与聚类标准空间范围进行对比，确定聚类异常类型，按照聚类异常类型对不符合预设聚类标准的新增工单簇进行优化，当聚类异常类型为新增工单簇对应的聚类空间范围大于标准空间范围时将对应的新增工单簇进行细化，当聚类异常类型为新增工单簇对应的聚类空间范围小于标准空间范围时将对应的新增工单簇进行合并，通过对不符合预设聚类标准的新增工单数据进行聚类优化，便于提高根据聚类结果识别对应热点信息时的准确性。
15.在一种可能实现的方式中，将任一不符合预设聚类标准的新增工单簇进行合并，包括：获取任一不符合预设聚类标准的新增工单簇的聚类边界信息；根据所述聚类边界信息，判断是否存在关联簇；若存在，则将所述关联簇与所述任一不符合预设聚类标准的新增工单簇进行合并。
16.通过采用上述技术方案，若存在聚类空间范围小于预设标准空间范围的新增工单簇对应的时，根据新增工单簇确定聚类边界信息，再根据聚类边界信息判断是否存在关联簇，若对应的新增工单簇存在关联簇，则将确定出的关联簇与对应的新增工单簇各自对应的聚类空间范围进行合并，以实现将对应的新增工单簇进行合并，通过关联簇进行聚类合并，便于提高聚类结果的准确性。
17.在一种可能实现的方式中，所述根据每一新增工单簇对应的聚类边界信息，确定对应的热点信息，并将每一热点信息进行反馈，包括：
根据每一新增工单数据对应的聚类边界信息，从预设热点数据库中进行遍历，确定对应的热点信息；若存在未识别到对应已知热点信息的新增工单数据，则将对应的新增工单簇进行未知热点信息标记；将所有新增工单簇对应的所有热点信息进行反馈。
18.通过采用上述技术方案，根据每一新增工单数据对应的聚类边界信息，从预设热点数据库中进行遍历，确定对应的热点信息，若存在未识别到对应已知热点信息的新增工单簇，则将对应的新增工单簇进行未知热点信息标记，最后将所有的新增工单簇对应的热点信息进行反馈，通过对已知热点信息和未知热点信息进行识别便于相关工作人员根据反馈结果对所有新增工单数据进行热点事件分析。
19.在一种可能实现的方式中，所述获取至少一个新增工单数据之前，还包括：获取至少一个话务数据；对每一话务数据进行数据清理，得到对应的初始新增工单数据；将每一初始新增工单数据进行分词处理，得到最终的新增工单数据。
20.通过采用上述技术方案，通过对获取到的话务数据进行数据清洗和数据分词处理，便于对话务数据中一些无意义的词语以及语气词、助词和连接词进行时被和去除，提升了话务数据有效性。
21.第二方面，本技术提供一种呼叫中心热点发现装置，采用如下的技术方案：一种呼叫中心热点发现装置，包括：获取工单数据模块，用于获取至少一个新增工单数据，所述新增工单数据是用户与呼叫中心建立联系后形成的；数据聚类模块，用于将所述至少一个新增工单数据进行聚类，得到至少一个新增工单簇；聚类优化模块，用于判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准；确定边界信息模块，用于确定每一符合预设聚类标准的新增工单簇对应的聚类边界信息；确定热点信息模块，用于根据每一新增工单簇对应的聚类边界信息，确定对应的热点信息，并将每一热点信息进行反馈。
22.通过采用上述技术方案，在获取到至少一个新增工单数据后，将至少一个新增工单数据进行聚类，其中新增工单数据是用户与呼叫中心建立通讯联系后形成的，聚类后得到至少一个新增工单簇，判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准，再确定每一符合预设聚类标准的新增工单数据对应的聚类空间范围，最后根据每一新增工单簇对应的聚类空间范围，确定每一新增工单簇对应的热点信息，并将热点信息进行反馈，通过对不符合预设聚类标准的新增工单簇进行聚类优化，便于提高识别热点信息的准确性。
23.第三方面，本技术提供一种电子设备，采用如下的技术方案：一种电子设备，该电子设备包括：至少一个处理器；
存储器；至少一个应用程序，其中所述至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行，所述至少一个应用程序配置用于：执行上述呼叫中心热点发现的方法。
24.第四方面，本技术提供一种计算机可读存储介质，采用如下的技术方案：一种计算机可读存储介质，包括：存储有能够被处理器加载并执行上述呼叫中心热点发现方法的计算机程序。
25.综上所述，本技术包括以下至少一种有益技术效果：1.在获取到至少一个新增工单数据后，将至少一个新增工单数据进行聚类，其中新增工单数据是用户与呼叫中心建立通讯联系后形成的，聚类后得到至少一个新增工单簇，判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准，再确定每一符合预设聚类标准的新增工单数据对应的聚类空间范围，最后根据每一新增工单簇对应的聚类空间范围，确定每一新增工单簇对应的热点信息，并将热点信息进行反馈，通过对不符合预设聚类标准的新增工单簇进行聚类优化，便于提高识别热点信息时的准确性。
26.2.根据每一新增工单数据对应的聚类边界信息，从预设热点数据库中进行遍历，确定对应的热点信息，若存在未识别到对应已知热点信息的新增工单簇，则将对应的新增工单簇进行未知热点信息标记，最后将所有的新增工单簇对应的热点信息进行反馈，通过对已知热点信息和未知热点信息进行识别便于相关工作人员根据反馈结果对所有新增工单数据进行热点事件分析。
附图说明
27.图1是本技术实施例中一种呼叫中心热点发现方法的流程示意图；图2是本技术实施例中一种呼叫中心热点发现装置的结构示意图；图3是本技术实施例中一种电子设备的结构示意图。
具体实施方式
28.以下结合附图1-3对本技术作进一步详细说明。
29.本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改，但只要在本技术的权利要求范围内都受到专利法的保护。
30.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
31.为了提高对新增工单数据进行热点识别时的准确性，本技术实施例中，在获取到至少一个新增工单数据后，将至少一个新增工单数据进行聚类，其中新增工单数据是用户与呼叫中心建立通讯联系后形成的，聚类后得到至少一个新增工单簇，判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准，再确定每一符合预设聚类标准的新增工单数据对应的聚类空间
范围，最后根据每一新增工单簇对应的聚类空间范围，确定每一新增工单簇对应的热点信息，并将热点信息进行反馈，通过对不符合预设聚类标准的新增工单簇进行聚类优化，便于提高识别热点信息的准确性。
32.具体的，本技术实施例提供了一种呼叫中心热点发现方法，由电子设备执行，该电子设备可以为服务器也可以为终端设备，其中，该服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此，该终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本技术实施例在此不做限制。
33.参考图1，图1是本技术实施例中一种呼叫中心热点发现方法的流程示意图，该方法包括步骤s110、步骤s120、步骤s130、步骤s140和步骤s150，其中：步骤s110：获取至少一个新增工单数据，新增工单数据是用户与呼叫中心建立联系后形成的。
34.具体的，新增工单数据为预设周期内新增的工单数据，预设周期可以为一小时、一天，在本技术实施例中不做具体限定，可以根据实际需求进行修改。在本技术实施例中，默认每一新增工单数据对应一个热点。
35.进一步的，步骤s110获取至少一个新增工单数据，之前还包括步骤s01（附图未示出）、步骤s02（附图未示出）和步骤s03（附图未示出），其中：步骤s01：获取至少一个话务数据。
36.具体的，话务数据为用户与呼叫中心建立通信后，对应的话务员与用户之间的沟通记录，话务数据可以有话务员进行人工输入沟通记录形成，也可以通过语音识别自动生成。
37.步骤s02：对每一话务数据进行数据清理，得到对应的初始新增工单数据。
38.具体的，对话务数据进行数据清洗是指发现并纠正话务数据中可识别错误的一道程序，便于去除话务数据中一些无意义数据内容。对话务数据进行清洗时可以通过分箱法、聚类法、回归法，在本技术实施例中不做具体限定，只要能够对话务数据进行清洗即可。
39.步骤s03：将每一初始新增工单数据进行分词处理，得到最终的新增工单数据。
40.具体的，对初始新增工单数据进行分词处理是指发现和去除初始新增工单数据中的语气词、助词和连接词，便于减少数据运算量。对初始新增工单数据进行分词处理时，可以通过nlp自然语言处理算法，具体的分词处理方式在本技术实施例中不做具体限定，只要能够对初始新增工单数据进行分词处理即可。
41.本技术实施例中，通过对获取到的话务数据进行数据清洗和数据分词处理，便于对话务数据中一些无意义的词语以及语气词、助词和连接词进行时被和去除，提升了话务数据有效性。
42.步骤s120：将至少一个新增工单数据进行聚类，得到至少一个新增工单簇。
43.具体的，可通过dbscan (density-based spatial clustering of applications with noise)算法对所有的新增工单数据进行聚类，dbscan算法是一种基于密度的聚类算法，对新增工单数据进行聚类的方式还可以通过k-means（k均值算法）和single-pass（单遍聚类）算法，具体的，对新增工单数据进行聚类的方式在本技术实施例中不做具体限定，只
要能够对所有的新增工单数据进行聚类即可。
44.步骤s130：判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准。
45.具体的，预设聚类标准是根据历史聚类处理经验确定的，用于对每一新增工单数据的聚类结果，即每一新增工单簇进行检测，进而便于提高对聚类结果进行确定时的准确度。预设聚类标准可以根据用户需求进行修改、增加和删除。若存在不符合预设聚类标准的新增工单簇，则将新增工单簇中包含的至少一个新增工单数据进行再次聚类，形成优化结果，再判断优化结果是否符合预设聚类标准，若符合则停止聚类优化，若不符合，则继续将优化结果中包含的至少一个新增工单数据进行聚类优化。其中优化结果为对不符合预设聚类标准的至少一个新增工单数据进行聚类优化后形成的优化新增工单簇。
46.聚类过程中密度相连的点形成的最大集合过大，或者过小时可能会导致对应的新增工单簇不符合预设聚类标准，例如将关于食品配送的新增工单数据聚类到食品安全簇中。当聚类过程中密度相连的点形成的最大集合过大时，可以通过细化的方式将不符合预设聚类标准的新增工单簇对应的新增工单数据进行聚类优化；当聚类过程中密度相连的点形成的最大集合过小时，可以通过合并的方式将不符合预设聚类标准的新增工单簇对应的新增工单数据进行聚类优化。
47.对每一新增工单簇是否符合预设聚类标准进行判断时，可通过将生成的每一新增工单簇反馈至对应的终端设备，以便于相关工作人员对每一新增工单簇是否符合预设聚类标准进行人为判定。由于新增工单簇中包含至少一个新增工单数据，为了提高相关工作人员对新增工单簇是否符合预设聚类标准的速率，可通过将新增工单簇进行展示，由于每一新增工单数据对应内容较多，在将新增工单簇进行展示时，可以通过textrank 算法对每一新增工单数据进行文本摘要，通过计算每一新增工单数据中的每一句子的权重，并对每一句子的权重进行排序确定每一新增工单数据的中心句，便于相关工作人员对每一新增工单数据进行阅读，具备良好的实用性。
48.步骤s140：确定每一符合预设聚类标准的新增工单簇对应的聚类边界信息。
49.具体的，新增工单簇对应的聚类边界信息由多个符合预设聚类标准的新增工单簇中的边界向量进行确定，其中新增工单簇中的边界向量为边界新增工单数据对应的新增工单向量。对每一新增工单数据进行向量化处理能够得到对应的新增工单向量。
50.步骤s150：根据每一新增工单簇对应的聚类边界信息，确定对应的热点信息，并将每一热点信息进行反馈。
51.具体的，确定每一新增工单簇对应的热点信息时，通过将每一新增工单簇对应的聚类边界信息与预设热点信息表中每一热点信息对应的热点聚类边界信息进行对比，其中预设热点信息表中存放有多个已知热点信息，每一已知热点信息包括已知热点的名称以及对应的热点聚类边界信息。
52.本技术实施例中，在获取到至少一个新增工单数据后，将至少一个新增工单数据进行聚类，其中新增工单数据是用户与呼叫中心建立通讯联系后形成的，聚类后得到至少一个新增工单簇，判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准，再确定每一符合预设聚类标准的新增工单数据对应的聚类空间范围，最后根据每一新增工单簇对应的聚类空间范
围，确定每一新增工单簇对应的热点信息，并将热点信息进行反馈，通过对不符合预设聚类标准的新增工单簇进行聚类优化，便于提高识别热点信息的准确性。
53.进一步的，步骤s120中将至少一个新增工单数据进行聚类，得到至少一个新增工单簇，具体可以包括步骤s1201（附图未示出）和步骤s1202（附图未示出），其中：步骤s1201：确定每一新增工单数据对应的新增工单向量。
54.具体的，对每一新增工单数据进行向量化处理能够得到对应的新增工单向量，对每一新增工单数据进行向量化处理时，可通过将每一新增工单数据输入doc2vec文档向量模型中，输出对应的新增工单向量，其中通过基于每一新增工单数据对应的文本信息建立高维坐标系，再通过文本中各分词出现的次数以及分词上下文之间的联系，形成对应的新增工单向量。
55.doc2vec是一种非监督式算法，可以获得新增工单数据的向量表达，在向量化过程中考虑了新增工单数据中各词语间的上下文相关性，在经过大量样本数据训练下有良好的语言模型表示效果。呼叫中心中工单数据是核心的业务数据，绝大部分呼叫中心都留存了大量的历史工单数据用于初始化文档向量模型训练，同时，doc2vec是非监督算法，无需人工标注和优化。在本技术实施例中，利用大量历史工单数据构建doc2vec模型并用于对新增工单数据进行向量化处理，便于使的每次对新增工单数据均按照同一标准进行向量化处理，便于每次对新增工单数据进行向量化后输出的新增工单向量位于统一坐标系中。
56.步骤s1202：根据预设聚类关联半径和初始核心向量对所有的新增工单向量进行聚类，得到至少一个新增工单簇，初始核心向量为任一新增工单向量，用于表征对所有的新增工单向量进行聚类时的基准向量。
57.具体的，初始核心向量为从多个新增工单向量中随机选择确定的，预设聚类关联半径可以根据需求进行修改，在本技术实施例中不做具体限定，在对多个新增工单向量进行聚类时，以初始核心向量作为聚类基准，以预设聚类关联半径为半径，确定初始核心向量对应的聚类邻域，再基于确定的聚类领域完成对多个新增工单向量的聚类。至少一个新增工单向量聚类为一个新增工单簇。
58.本技术实施例中，通过得到每一新增工单数据对应的新增工单向量，再根据预设聚类关联半径和初始核心向量对所有新增工单向量进行聚类，便于提高对新增工单数据进行聚类时的准确性。
59.进一步的，步骤s1202中根据预设聚类关联半径和初始核心向量对所有的新增工单向量进行聚类，具体可以包括步骤s1202a（附图未示出）、步骤s1202b（附图未示出）和步骤s1202c（附图未示出），其中：步骤s1202a：基于预设聚类关联半径和初始核心向量，确定初始核心向量对应的核心范围。
60.具体的，初始核心向量对应的核心范围为以初始核心向量对应的坐标为圆心，与预设聚类关联半径为半径确定的圆。
61.步骤s1202b：根据初始核心向量对应的核心范围和剩余向量，确定与初始核心向量相关联的关联向量，并将所有的关联向量与初始核心向量进行聚类形成一个新增工单簇。
62.其中，剩余向量为所有已聚类的新增工单簇对应的至少一个新增工单向量之外的
其他新增工单向量。
63.具体的，将初始核心向量确定为初始簇，即初始簇内只包含一个核心向量，再通过将与初始核心向量相关联的关联向量更新初始簇完成聚类。从所有的新增工单向量中去除已完成聚类的新增工单向量，剩余的其他新增工单向量为剩余向量。
64.步骤s1202c：若剩余向量的个数不为零，则根据剩余向量，确定下一初始核心向量，循环执行根据初始核心向量对应的核心范围和剩余向量，确定与初始核心向量相关联的关联向量，并将所有的关联向量与初始核心向量进行聚类形成一个新增工单簇，直至剩余向量的个数为零。
65.具体的，当剩余向量的个数不为零时，从剩余的其他新增工单向量中随机选择一个作为下一初始核心向量，并循环执行步骤s1202b，实现对剩余向量进行聚类，直至剩余向量均已完成聚类为止停止循环。
66.本技术实施例中，通过预设聚类关联半径和初始核心向量对初始核心向量对应的核心范围进行确定，再根据初始核心向量对应的核心范围和所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量确定的剩余向量，确定与初始核心向量相关联的关联向量，其次将所有关联向量与初始核心向量聚类为一个新增工单簇，再判断所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量的个数是否为零，不为零时，根据剩余向量对下一初始核心向量进行确定，并循环执行确定初始核心向量对应的关联向量步骤，直至剩余向量的个数为零，提高了确定新增工单簇时的准确程度。
67.进一步的，步骤s1202b中根据任一初始核心向量对应的核心范围和剩余向量，确定与任一初始核心向量相关联的关联向量，并将所有的关联向量与任一初始核心向量进行聚类形成一个新增工单簇，具体可以包括步骤sa（附图未示出）、步骤sb（附图未示出）和步骤sc（附图未示出），其中：步骤sa：从剩余向量中确定位于新增工单簇对应的核心范围内的其他新增工单向量，新增工单簇对应的核心范围为每个关联向量对应的核心范围以及初始核心向量对应的核心范围组成的总范围。
68.具体的，新增工单簇对应的核心范围内的其他新增向量可能是初始核心向量的关联向量，也可能不是初始核心向量的关联向量。其他新增新增工单簇中包含初始核心向量和与初始核心向量相关联的关联向量，因此新增工单簇对应的核心范围为初始核心向量对应的核心范围以及与初始核心向量相关联的关联向量所对应的核心范围。
69.步骤sb：将符合预设标准的新增工单向量确定为与初始核心向量关联的关联向量，并将任一个其他新增工单向量与初始核心向量进行聚类形成一个新增工单簇。
70.具体的，判断新增工单对应的核心范围内的其他新增工单向量是否为初始核心向量的关联向量时的预设标准为判断以任一新增工单簇对应的核心范围内的其他新增工单向量为圆心，以预设聚类关联半径为半径的聚类领域内包含新增工单向量对应的坐标点的数量是否不小于预设最小样本点数，将任一聚类领域内新增工单向量对应的坐标点的数量大于或等于最小样本点数的其他新增工单向量确定为初始核心向量的关联向量。
71.从多个新增工单向量中确定初始核心向量时，可通过对多个新增工单向量进行编号，再通过随机数选择器确定随机编号，将随机编号对应的新增工单向量确定为初始核心
向量。
72.步骤sc：循环执行从剩余向量中确定位于新增工单簇对应的核心范围内的其他新增工单向量，直至满足预设条件，预设条件包括以下任一项：新增工单簇对应的核心范围内不存在其他新增工单向量；新增工单簇对应的核心范围内存在其他新增工单向量，且对应的其他新增工单向量均不符合预设标准。
73.具体的，若新增工单簇对应的核心范围内不存在其他新增工单向量，则表示已聚类的新增工单簇对应的至少一个新增工单向量之外不存在其他新增工单向量；新增工单簇对应的核心范围内存在其他新增工单向量，但任一其他新增工单向量对应的核心范围内新增工单向量对应坐标点的数量均小于预设最小样本点数。
74.本技术实施例中，通过从所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量确定出新增工单簇对应的核心范围内的其他新增工单向量后，判断其他新增工单向量是否符合预设标准，并将符合预设标准的任一其他新增工单向量确定为与初始核心向量关联的关联向量，再将该任一其他新增工单向量与初始核心向量进行聚类形成一个新增工单簇，最后再循环执行确定其他新增工单向量的步骤直至满足新增工单簇对应的核心范围内不存在其他新增工单向量或新增工单簇对应的核心范围内存在其他新增工单向量，且对应的其他新增工单向量均不符合预设标准为止，提高了对新增工单数据向量进行聚类时的准确性。
75.进一步的，步骤s130中判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，具体可以包括步骤s1301（附图未示出）、步骤1302（附图未示出）、步骤s1303（附图未示出）和步骤s1304（附图未示出），其中：步骤s1301：判断每一新增工单簇对应的聚类空间范围是否符合预设聚类标准对应的标准空间范围。
76.其中，聚类空间范围为每一新增工单簇中至少一个新增工单向量确定的。
77.具体的，每一新增工单簇对应的聚类空间范围为每一新增工单簇中多个边界新增工单向量构成的，对应的，标准空间范围为预设聚类标准中多个边界标准工单向量构成的。
78.步骤s1302：若存在不符合预设聚类标准的新增工单簇，则根据不符合预设聚类标准的新增工单簇对应的聚类空间范围和预设聚类标准对应的标准空间范围，确定聚类异常类型。
79.具体的，聚类异常类型包括任一新增工单簇对应的聚类空间范围小于标准空间范围和任一新增工单簇对应的聚类空间范围大于标准空间范围。
80.步骤s1303：若聚类异常类型为任一新增工单簇对应的聚类空间范围小于标准空间范围，则将不符合预设聚类标准的新增工单簇进行合并。
81.步骤s1304：若聚类异常类型为任一新增工单簇对应的聚类空间范围大于标准空间范围，则将不符合预设聚类标准的新增工单簇进行细化。
82.具体的，聚类过程中密度可达的点形成的最大集合过大，或过小，即新增工单簇对应的聚类空间范围大于标准空间范围或新增工单簇小于标准空间单位时可能会导致聚类结果不符合业务经验，例如将关于食品配送的新增工单数据聚类到食品安全簇中。
83.对不符合预设聚类标准的新增工单簇进行细化时，可通过减小预设聚类关联半径
和预设最小样本点数，进而减少聚类过程中密度相连的点形成的最大集合，以对聚类空间范围大于标准空间范围的新增工单簇进行细化。对不符合预设聚类标准的新增工单簇进行合并时，可通过增大预设聚类关联半径和预设最小样本点数，进而增大聚类过程中密度相连的点形成的最大集合，以对聚类空间范围小于标准空间范围的新增工单簇进行合并，还可以通过将两个新增工单簇对应的聚类空间范围进行合并以对聚类空间范围小于标准空间范围的新增工单簇进行合并。
84.本技术实施例中，通过判断每一新增工单簇对应的聚类空间范围是否符合预设聚类标准空间范围，并将不符合预设聚类标准空间范围的新增工单簇对应的聚类空间空间范围进行确定，再将聚类空间范围与聚类标准空间范围进行对比，确定聚类异常类型，按照聚类异常类型对不符合预设聚类标准的新增工单簇进行优化，当聚类异常类型为新增工单簇对应的聚类空间范围大于标准空间范围时将对应的新增工单簇进行细化，当聚类异常类型为新增工单簇对应的聚类空间范围小于标准空间范围时将对应的新增工单簇进行合并，通过对不符合预设聚类标准的新增工单数据进行聚类优化，便于提高根据聚类结果识别对应热点信息时的准确性。
85.进一步的，步骤s1303中将任一新增工单簇进行合并，具体可以包括步骤s1303a（附图未示出）、步骤s1303b（附图未示出）和步骤s1303c（附图未示出），其中：步骤s1301a：获取任一不符合预设聚类标准的新增工单簇的聚类边界信息。
86.具体的，聚类空间范围为多个新增工单向量在各维度上的取值范围构成的，聚类空间范围可表示为[amin：amax，bmin：bmax，cmin：cmax，
……
nmin：nmax]，其中a、b、c
…
n表示各维度，amin表示在a维度上的最小值，amax表示在a维度上的最大值。新增工单簇的聚类边界信息是由新增工单簇对应的至少一个新增工单向量中位于新增工单簇聚类边界的新增工单向量构成的。
[0087]
步骤s1303b：根据聚类边界信息，判断是否存在关联簇。
[0088]
步骤s1303c：若存在关联簇，则将关联簇与任一不符合预设聚类标准的新增工单簇进行合并。
[0089]
具体的，关联簇为与新增工单簇对应的聚类空间范围距离预设范围的另一新增工单簇，预设范围可以两个新增工单簇中目标核心向量坐标之间的直线距离，具体的预设范围可以根据用户需求进行修改，在本技术实施例中不做具体限定。
[0090]
当两个新增工单簇中目标核心向量坐标之间的直线距离小于预设范围时，则表示两个新增工单簇互为关联簇，通过将两个新增工单簇各自对应的聚类空间范围进行合并，以实现对关联簇之间进行合并，其中两个关联簇各自对应的聚类空间范围可能接壤，也可能有间隔。
[0091]
本技术实施例中，若存在任一新增工单簇对应的聚类空间范围小于预设标准空间范围时，根据对应的新增工单簇确定聚类边界信息，再根据聚类边界信息判断是否存在关联簇，若对应的新增工单簇存在关联簇，则将确定出的关联簇与对应的新增工单簇各自对应的聚类空间范围进行合并，以实现将对应的新增工单簇进行合并，通过关联簇进行聚类合并，便于提高聚类结果的准确性。
[0092]
进一步的，步骤s150中根据每一新增工单簇对应的聚类边界信息，确定对应的热点信息，并将每一热点信息进行反馈，具体包括步骤s1501（附图未示出）、步骤s1502（附图
未示出）和步骤s1503（附图未示出），其中：步骤s1501：根据每一新增工单簇对应的聚类边界信息，从预设热点数据库中进行遍历，确定对应的热点信息。
[0093]
步骤s1502：若存在未识别到对应已知热点信息的新增工单簇，则将对应的新增工单簇进行未知热点信息标记。
[0094]
具体的，预设热点数据库中存放有多个已知热点信息，其中每一热点信息包括已知热点名称和对应的热点聚类边界信息。确定每一新增工单簇对应的热点信息时，将每一新增工单簇对应的聚类边界信息与已知热点对应的热点聚类边界信息进行匹配，针对任一新增工单簇，若任一新增工单簇对应的聚类边界信息在任一已知热点对应的热点聚类边界信息范围内，则依据该已知热点信息对新增工单簇进行热点命名。
[0095]
若在预设热点数据库中遍历后，存在未进行热点命名的新增工单簇，则将对应的新增工单簇进行未知热点命名，并保存未知热点对应新增工单簇的聚类边界信息。
[0096]
步骤s1503：将所有新增工单簇对应的所有热点信息进行反馈。
[0097]
具体的，在进行热点信息反馈时，将识别到的已知热点与未知热点均进行反馈。通过将未知热点信息发送至对应的终端设备，便于相关工作人员对未知热点进行识别，获取到对应的终端设备发送的未知热点确认信息后，依据未知热点确认信息更新预设预设热点数据库。
[0098]
本技术实施例中，根据每一新增工单数据对应的聚类边界信息，从预设热点数据库中进行遍历，确定对应的热点信息，若存在未识别到对应已知热点信息的新增工单簇，则将对应的新增工单簇进行未知热点信息标记，最后将所有的新增工单簇对应的热点信息进行反馈，通过对已知热点信息和未知热点信息进行识别便于相关工作人员根据反馈结果对所有新增工单数据进行热点事件分析。
[0099]
上述实施例从方法流程的角度介绍一种呼叫中心热点发现方法，下述实施例从虚拟模块或者虚拟单元的角度介绍了一种呼叫中心热点发现的装置，具体详见下述实施例。
[0100]
本技术实施例提供一种呼叫中心热点发现的装置，如图2所示，该装置具体可以包括获取工单数据模块210、数据聚类模块220、聚类优化模块230、确定边界信息模块240和确定热点信息模块250，其中：获取工单数据模块210，用于获取至少一个新增工单数据，新增工单数据是用户与呼叫中心建立联系后形成的；数据聚类模块220，用于将至少一个新增工单数据进行聚类，得到至少一个新增工单簇；聚类优化模块230，用于判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准；确定边界信息模块240，用于确定每一符合预设聚类标准的新增工单簇对应的聚类边界信息；确定热点信息模块250，用于根据每一新增工单簇对应的聚类边界信息，确定对应的热点信息，并将每一热点信息进行反馈。
[0101]
在一种可能实现的方式中，数据聚类模块220包括：确定新增工单向量子模块，用于确定每一新增工单数据对应的新增工单向量；
聚类子模块，用于根据预设聚类关联半径和初始核心向量对所有的新增工单向量进行聚类，得到至少一个新增工单簇，初始核心向量为任一新增工单向量，用于表征对所有的新增工单向量进行聚类时的基准向量。
[0102]
在一种可能实现的方式中，聚类子模块包括：确定核心范围单元，用于基于预设聚类关联半径和初始核心向量，确定初始核心向量对应的核心范围；确定关联向量单元，用于根据初始核心向量对应的核心范围和剩余向量，确定与初始核心向量相关联的关联向量，并将所有的关联向量与初始核心向量进行聚类形成一个新增工单簇，剩余向量为所有已聚类的新增工单簇对应的至少一个新增工单向量之外的其他新增工单向量；循环确定关联向量单元，用于在剩余向量的个数不为零时，根据剩余向量，确定下一初始核心向量，循环执行根据初始核心向量对应的核心范围和剩余向量，确定与初始核心向量相关联的关联向量，并将所有的关联向量与初始核心向量进行聚类形成一个新增工单簇，直至剩余向量的个数为零。
[0103]
在一种可能实现的方式中，确定关联向量单元包括：确定其他新增工单向量子单元，用于从剩余向量中确定位于新增工单簇对应的核心范围内的其他新增工单向量，新增工单簇对应的核心范围为每个关联向量对应的核心范围以及初始核心向量对应的核心范围组成的总范围；关联聚类子单元，用于将符合预设标准的新增工单向量确定为与初始核心向量关联的关联向量，并将任一个其他新增工单向量与初始核心向量进行聚类形成一个新增工单簇；循环确定子单元，用于循环执行从剩余向量中确定位于新增工单簇对应的核心范围内的其他新增工单向量，直至满足预设条件，预设条件包括以下任一项：新增工单簇对应的核心范围内不存在其他新增工单向量；新增工单簇对应的核心范围内存在其他新增工单向量，且对应的其他新增工单向量均不符合预设标准。
[0104]
在一种可能实现的方式中，聚类优化模块230包括：判断子模块，用于判断每一新增工单簇对应的聚类空间范围是否符合预设聚类标准对应的标准空间范围，聚类空间范围为每一新增工单簇中至少一个新增工单向量确定的；确定异常类型子模块，用于在存在不符合预设聚类标准的新增工单簇时，根据不符合预设聚类标准的新增工单簇对应的聚类空间范围和预设聚类标准对应的标准空间范围，确定聚类异常类型；聚类合并子模块，用于在聚类异常类型为任一新增工单簇对应的聚类空间范围小于标准空间范围时，将不符合预设聚类标准的新增工单簇进行合并；聚类细化子模块，用于在聚类异常类型为任一新增工单簇对应的聚类空间范围大于标准空间范围时，将不符合预设聚类标准的新增工单簇进行细化。
[0105]
在一种可能实现的方式中，聚类合并子模块包括：获取边界信息单元，用于获取任一不符合预设聚类标准的新增工单簇的聚类边界
信息；关联判断单元，用于根据聚类边界信息，判断是否存在关联簇；聚类合并单元，用于若存在关联簇，则将关联簇与任一不符合预设聚类标准的新增工单簇进行合并。
[0106]
在一种可能实现的方式中，确定热点信息模块250包括：确定热点信息子模块，用于根据每一新增工单数据对应的聚类边界信息，从预设热点数据库中进行遍历，确定对应的热点信息；热点标记子模块，用于在存在未识别到对应已知热点信息的新增工单数据时，将对应的新增工单簇进行未知热点信息标记；热点反馈子模块，用于将所有新增工单簇对应的所有热点信息进行反馈。
[0107]
在一种可能实现的方式中，该装置还包括：获取话务数据模块，用于获取至少一个话务数据；确定初始新增工单数据模块，用于对每一话务数据进行数据清理，得到对应的初始新增工单数据；确定新增工单数据模块，用于将每一初始新增工单数据进行分词处理，得到最终的新增工单数据。
[0108]
本技术实施例中提供了一种电子设备，如图3所示，图3所示的电子设备300包括：处理器301和存储器303。其中，处理器301和存储器303相连，如通过总线302相连。可选地，电子设备300还可以包括收发器304。需要说明的是，实际应用中收发器304不限于一个，该电子设备300的结构并不构成对本技术实施例的限定。
[0109]
处理器301可以是cpu（central processing unit，中央处理器），通用处理器，dsp（digital signal processor，数据信号处理器），asic（application specific integrated circuit，专用集成电路），fpga（field programmable gate array，现场可编程门阵列）或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器301也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，dsp和微处理器的组合等。
[0110]
总线302可包括一通路，在上述组件之间传送信息。总线302可以是pci（peripheral component interconnect，外设部件互连标准）总线或eisa（extended industry standard architecture，扩展工业标准结构）总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
[0111]
存储器303可以是rom（read only memory，只读存储器）或可存储静态信息和指令的其他类型的静态存储设备，ram（random access memory，随机存取存储器）或者可存储信息和指令的其他类型的动态存储设备，也可以是eeprom（electrically erasable programmable read only memory，电可擦可编程只读存储器）、cd-rom（compact disc read only memory，只读光盘）或其他光盘存储、光碟存储（包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等）、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限
于此。
[0112]
存储器303用于存储执行本技术方案的应用程序代码，并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码，以实现本技术实施例所示的内容。
[0113]
其中，电子设备包括但不限于：移动电话、笔记本电脑、数字广播接收器、pda（个人数字助理）、pad（平板电脑）、pmp（便携式多媒体播放器）、车载终端（例如车载导航终端）等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。还可以为服务器等。图3示出的电子设备仅仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
[0114]
本技术实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，当其在计算机上运行时，使得计算机可以执行前述方法实施例中相应内容。与相关技术相比，本技术实施例中，在获取到至少一个新增工单数据后，将至少一个新增工单数据进行聚类，其中新增工单数据是用户与呼叫中心建立通讯联系后形成的，聚类后得到至少一个新增工单簇，判断每一新增工单簇是否符合预设聚类标准，并将不符合预设聚类标准的新增工单簇进行聚类优化，直至优化结果满足预设聚类标准，再确定每一符合预设聚类标准的新增工单数据对应的聚类空间范围，最后根据每一新增工单簇对应的聚类空间范围，确定每一新增工单簇对应的热点信息，并将热点信息进行反馈，通过对不符合预设聚类标准的新增工单簇进行聚类优化，便于提高识别热点信息的准确性。
[0115]
应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0116]
以上所述仅是本技术的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：吸污车辆调度方法、装置、设备及计算机可读存储介质与流程

一种呼叫中心热点发现方法、装置和电子设备与流程

相关文献

最热文献