业务分析方法、装置、电子设备及存储介质与流程

2022-10-13 08:37:29 来源：中国专利 TAG：

1.本发明涉及保险互联网技术领域，具体涉及一种业务分析方法、装置、电子设备及存储介质。

背景技术：

2.在与客户业务对接的过程中，业务平台会产生并存储大量业务数据。当前主要由业务人员基于传统的数据库查询、报表统计等方式查看这些历史业务数据，无法发现历史业务数据中存在的关系和规则，也无法根据历史业务数据对待合作的客户进行预测分类。

技术实现要素：

3.鉴于以上内容，有必要提出一种业务分析方法、装置、电子设备及存储介质，能够于对多种业务的客户或合作伙伴进行分类或分级，从而高效精准地识别重要客户。
4.本发明的第一方面提供一种业务分析方法，所述方法包括：获取目标历史客户的目标历史业务数据；对所述目标历史业务数据进行预处理，将预处理后的目标历史业务数据划分为训练集与测试集；基于最近邻knn算法，利用所述训练集构建业务预测模型；基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型；获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果。
5.根据本发明的一个可选的实施方式，所述获取目标历史客户的目标历史业务数据包括：确定业务需求，获取所述业务需求的历史业务数据，所述业务需求包括保险需求；根据所述业务需求的预定义的数据属性规则，筛选并统计所述历史业务数据以及获得所述目标历史业务数据，其中，所述数据属性规则包括如下的一种或多种：任一历史客户每日生成的保单量，以第一预设单位取整；任一历史客户每日生成的保单总额，以第二预设单位取整；剔除每日的保单量小于预设数量的历史客户的历史业务数据。
6.根据本发明的一个可选的实施方式，所述方法还包括：在任一历史客户的每日生成的保单量和/或每日生成的保单总额达到预设条件后，确定所述任一历史客户为重点关注的客户。
7.根据本发明的一个可选的实施方式，所述预处理包括数据归一化，所述数据归一化使用的公式包括：
[0008][0009]
其中，x
is
表示第i个目标客户的归一化后的目标历史业务数据，x
mean
表示n个目标历史客户的同一类别的目标历史业务数据的均值，xi表示第i个目标客户的目标历史业务数据；s表示n个目标历史客户的同一类别的目标历史业务数据的标准差，所述类别包括：每日生成的保单量、每日生成的保单总额。
[0010]
根据本发明的一个可选的实施方式，所述基于最近邻knn算法，利用所述训练集构
建业务预测模型，包括：设置所述业务预测模型的模型参数k，所述模型参数k表示所述业务预测模型确定的最近邻的个数，其中计算所述最近邻所使用的距离函数包括：欧氏距离、余弦距离、汉明距离、曼哈顿距离。
[0011]
根据本发明的一个可选的实施方式，所述基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型，包括：将所述测试集输入所述业务预测模型并获得所述测试集的业务预测结果，确定所述业务预测结果的准确率，所述业务预测结果包括：任一目标历史客户是否为重点关注的客户；当所述准确率小于预设的准确率阈值时，调整所述业务预测模型的模型参数k和/或所述距离函数，直至所述准确率大于所述准确率阈值，将所述调整后的业务预测模型作为所述目标业务预测模型。
[0012]
根据本发明的一个可选的实施方式，所述获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果，包括：根据所述数据属性规则获取所述待预测业务数据；对所述待预测业务数据进行所述预处理；将预处理后的待预测业务数据输入所述目标业务预测模型，基于所述距离函数获得所述待预测客户与任一目标历史客户的距离；根据所述距离确定所述待预测客户是否为重点关注的客户，包括：确定最小的k个所述距离对应的k个最近邻的目标历史客户，确定所述最近邻的目标历史客户中重点关注的客户所占的比例，当所述比例大于预设的比例阈值时，确定所述待预测客户为重点关注的客户。
[0013]
本发明的第二方面提供一种业务分析装置，所述装置包括：获取模块、处理模块、训练模块、优化模块、预测模块：所述获取模块，用于获取目标历史客户的目标历史业务数据；所述处理模块，用于对所述目标历史业务数据进行预处理，将预处理后的目标历史业务数据划分为训练集与测试集；所述训练模块，用于基于最近邻knn算法，利用所述训练集构建业务预测模型；所述优化模块，用于基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型；所述预测模块，用于获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果。
[0014]
本发明的第三方面提供一种电子设备，所述电子设备包括处理器和存储器，所述处理器用于执行所述存储器中存储的计算机程序时实现所述业务分析方法。
[0015]
本发明的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述业务分析方法。
[0016]
综上所述，本发明所述的业务分析方法、装置、电子设备及存储介质，可以用于例如保险等金融行业，根据业务需求和数据属性规则获取目标历史客户数据；利用预处理后的目标历史客户数据构建基于knn算法的业务预测模型；对所述业务预测模型的模型参数k与距离函数进行调整以优化所述业务预测模型获得目标业务预测模型；利用所述目标业务预测模型判断待预测客户是否为重点关注的客户。实现了基于业务数据对多种业务的客户或合作伙伴进行分类或分级，能够高效精准地识别重要客户，从而为不同类别或级别的客户提供对应的服务，提高客户的服务体验，提高达成业务需求的效率。
附图说明
[0017]
图1是本发明实施例一提供的业务分析方法的流程图。
[0018]
图2是本技术实施例提供的目标历史业务数据的示例图。
[0019]
图3是本技术实施例提供的目标历史业务数据的均值与标准差的示例图。
[0020]
图4是本技术实施例提供的训练集的示例图。
[0021]
图5是本技术实施例提供的待预测业务数据的示例图。
[0022]
图6是本技术实施例提供的预处理后的待预测业务数据的示例图。
[0023]
图7是本技术实施例提供的待预测客户与目标历史客户的距离数值的示例图。
[0024]
图8是本技术实施例提供的最近邻的目标历史客户的示例图。
[0025]
图9是本技术实施例提供的待预测客户与目标历史客户的距离图像的示例图。
[0026]
图10是本发明实施例二提供的业务分析装置的结构图。
[0027]
图11是本发明实施例三提供的电子设备的结构示意图。
具体实施方式
[0028]
为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。
[0029]
除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的，不是旨在于限制本发明。
[0030]
本发明实施例提供的业务分析方法由电子设备执行，相应地，业务分析装置运行于电子设备中。
[0031]
实施例一
[0032]
图1是本发明实施例一提供的业务分析方法的流程图。所述业务分析方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。
[0033]
s11，获取目标历史客户的目标历史业务数据。
[0034]
在一个可选的实施方式中，本技术实施例提供的方案可以应用于基于业务数据对多种业务的客户或合作伙伴进行分类或分级，能够高效精准地识别重要客户，从而为不同等级或级别的客户提供对应的服务，提高客户的服务体验。所述多种业务可以包括例如保险等金融行业。
[0035]
举例而言，保险公司可以为客户提供互联网接口平台，所述接口平台可以响应客户的注册身份信息、登录等操作；在所述接口平台对客户输入的身份信息进行审核后，可以响应客户的申请各类保险产品的接口访问权限的操作，从而响应拥有权限的客户的下单、购买等操作，从而达成客户与所述保险公司进行例如购买保险等的合作。
[0036]
其中，所述接口平台支持例如rsa加密算法(rsa algorithm)等多种算法的数字证书，有效保障了业务对接过程的数据安全；此外，所述接口平台还可以将客户录入的身份信息(例如，身份标识)、下单的订单数量(例如，保单量)、每个订单的购买额度(例如，保单额)等存储至电子设备中的预设数据库中进行安全保存。
[0037]
在一个可选的实施方式中，所述获取目标历史客户的目标历史业务数据包括：确定业务需求，获取所述业务需求的历史业务数据，所述业务需求包括保险需求；根据所述业务需求的预定义的数据属性规则，筛选并统计所述历史业务数据以及获得所述目标历史业
务数据。
[0038]
其中，所述数据属性规则包括如下的一种或多种：任一历史客户每日生成的保单量，以第一预设单位(例如，百)取整；任一历史客户每日生成的保单总额，以第二预设单位(例如，万)取整；剔除每日的保单量小于预设数量(例如，100)的历史客户的历史业务数据。其中，每个成交的保单对应一个保单额或投保额，所述保单量表示保单的个数，所述保单总额表示一个或多个保单的保单额的总和。
[0039]
在一个可选的实施方式中，所述业务需求表示综合业务目的与业务目标得到的需求指标，例如，所述保险需求包括每日达成40个保单量，每日达成400万保单总额，每日达成10个新客户购买保险等。
[0040]
在一个可选的实施方式中，可以利用sql(structured query language)数据库的视图、报表等查询技术，从所述数据库中筛选并统计所述历史业务数据。
[0041]
在一个可选的实施方式中，所述数据属性规则中使用的取整方法可以为四舍五入等，例如，将不足0.5万的每日生成的保单总额取整记为0。
[0042]
在一个可选的实施方式中，所述方法还包括：在任一历史客户的每日生成的保单量和/或每日生成的保单总额达到预设条件后，确定所述任一历史客户为重点关注的客户。
[0043]
具体地，可以利用所述接口平台在生成达到预设条件的历史客户的保单时，将达到预设条件的历史客户标记为重点关注的客户，还可以在进行所述筛选和统计时，对所述重点客户进行标记。例如图2所示，为本技术实施例提供的目标历史业务数据的示例图。其中，客户的身份标识用大写的字母表示，所述第一预设单位为“百”，所述第二预设单位为“万”，对所述重点客户的标记结果为“是”或“否”。
[0044]
在一个可选的实施方式中，所述预设条件可以包括如下的一种或多种：每日生成的保单量大于第一预设数值；每日生成的保单总额大于第二预设数值；每日生成的保单总额与每日生成的保单量的比值大于第三预设数值等。
[0045]
在一个可选的实施方式中，还可以将客户划分为多个等级，例如，为达到的上述预设条件中的多种条件的种类越多的客户划分更高的等级，所述多个等级可以包括例如高、中、低等。
[0046]
需要说明的是，将达到预设条件的历史客户标记为重点关注的客户，相当于将客户划分为两个等级，包括：是重点关注的客户、不是重点关注的客户。
[0047]
在一个可选的实施方式中，本技术实施例提供的方法，可以针对实际的业务需求得到所述业务需求对应的目标历史客户的目标历史业务数据，基于所述目标历史业务数据构建的业务预测模型能够更精准地识别所述业务需求对应的重点客户，提高达成所述业务需求的效率，为客户提供更好的服务。
[0048]
s12，对所述目标历史业务数据进行预处理，将预处理后的目标历史业务数据划分为训练集与测试集。
[0049]
在一个可选的实施方式中，由于无法确定所述目标历史业务数据中每种类别的取值范围，直接利用所述目标历史业务数据作为样本集训练模型得到的模型的预测能力会很低，因此需要对所述目标历史业务数据进行预处理，以降低训练误差从而提高模型的预测能力。
[0050]
在一个可选的实施方式中，所述预处理包括数据归一化(feature scaling)。本实
施例采用的数据归一化方法包括z-score标准化(zero-mean normalization)方法，使用的公式包括：
[0051][0052]
其中，x
is
表示第i个目标客户的归一化后的目标历史业务数据，x
mean
表示n个目标历史客户的同一类别的目标历史业务数据的均值(average)，xi表示第i个目标客户的目标历史业务数据；
[0053]
s表示n个目标历史客户的同一类别的目标历史业务数据的标准差(standard deviation)，所述类别包括：每日生成的保单量、每日生成的保单总额。例如图3所示，为本技术实施例提供的目标历史业务数据的均值与标准差的示例图，其中图3中的数值是基于图2中的数值计算得到的。
[0054]
在一个可选的实施方式中，所述目标历史业务数据的每种类别的数据值没有明显的边界值，有可能存在极端(例如极大)的数据值。使用所述z-score标准化方法，可以在原数据集(例如所述目标历史业务数据)存在极端数据值的情况下，实现对所述目标历史业务数据进行归一化的同时，保留原数据集中的数据在特征空间的距离而不产生偏差。
[0055]
在一个可选的实施方式中，在进行所述数据归一化之前，所述预处理还可以包括数据集成、数据清洗等。其中，所述数据集成可以将多个所述接口平台获得的数据整合在一起，从而获得更多的业务数据，扩充构建模型的样本集从而获得更精准的模型。所述数据清理可以删除所述目标历史业务数据中的无关数据(例如与所述业务需求无关的数据)、重复数据等，还可以处理所述目标历史业务数据中的缺失值、异常值等；从而进一步完善在步骤s11中获得的目标历史业务数据。
[0056]
在一个可选的实施方式中，可以按照预设的划分比例(例如，7比3)将预处理后的目标历史业务数据划分为训练集与测试集。
[0057]
例如图4所示，为本技术实施例提供的训练集的示例图。其中，负数表示归一化后的数值，不影响数据在特征空间中互相之间的距离。图4中的数值是根据图2与图3得到的。
[0058]
s13，基于最近邻knn算法，利用所述训练集构建业务预测模型。
[0059]
在一个可选的实施方式中，为了确定待合作的待预测客户是否为重点关注客户，可以利用所述训练集构建所述业务预测模型，从而基于所述目标历史客户的目标历史业务数据对所述待预测客户进行分类预测，将客户划分为多个等级。
[0060]
在一个可选的实施方式中，所述基于最近邻knn(k-neares neighbor)算法，利用所述训练集构建业务预测模型，包括：设置所述业务预测模型的模型参数k，所述模型参数k表示所述业务预测模型确定的最近邻的个数，其中计算所述最近邻所使用的距离函数包括：欧氏距离、余弦距离、汉明距离、曼哈顿距离等。
[0061]
在一个可选的实施方式中，所述最近邻knn算法的核心思想包括：计算任一样本在数据集中的k个距离最近的样本作为最近邻样本，确定所述任一样本属于这k个最近邻样本中的大多数样本所属于的类别。其中，决定所述最近邻knn算法的准确性的要素包括：所述模型参数k与所述距离函数。
[0062]
s14，基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型。
[0063]
在一个可选的实施方式中，为了提高所述业务预测模型进行预测的准确率，可以利用所述测试集通过调整所述模型参数与距离函数实现对所述业务预测模型的优化。
[0064]
在一个可选的实施方式中，所述基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型，包括：
[0065]
将所述测试集输入所述业务预测模型并获得所述测试集的业务预测结果，确定所述业务预测结果的准确率，所述业务预测结果包括：任一目标历史客户是否为重点关注的客户；
[0066]
当所述准确率小于预设的准确率阈值(例如，0.95)时，调整所述业务预测模型的模型参数k和/或所述距离函数，直至所述准确率大于所述准确率阈值，将所述调整后的业务预测模型作为所述目标业务预测模型。
[0067]
在一个可选的实施例中，可以将所述业务预测结果中的正确结果的数量与全部业务预测结果的数量的比值作为所述准确率。
[0068]
在一个可选的实施方式中，本实施例利用所述训练集与所述测试集进行交叉验证，从而调整所述模型参数k，提高所述目标业务预测模型的预测结果的准确率。其中，所述模型参数k的取值可以设置为不大于训练集中数据的数量的平方根，例如，当目标历史客户的数量为x时，所述模型参数还可以遍历所有小于或等于的所有奇数，以确定使得所述准确率最高的k的取值。
[0069]
在一个可选的实施方式中，将所述模型参数k取值为奇数可以避免出现样本不均衡现象，从而避免过拟合现象。
[0070]
在一个可选的实施方式中，可以通过更换所述距离函数以提高所述目标业务预测模型的预测结果的准确率。
[0071]
举例而言，基于图4中的训练集获得的所述目标业务预测模型的模型参数k为3，所使用的距离函数为欧式距离。
[0072]
s15，获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果。
[0073]
在一个可选的实施方式中，所述获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果，包括：
[0074]
根据所述数据属性规则获取所述待预测业务数据；
[0075]
对所述待预测业务数据进行所述预处理；
[0076]
将预处理后的待预测业务数据输入所述目标业务预测模型，基于所述距离函数获得所述待预测客户与任一目标历史客户的距离；
[0077]
根据所述距离确定所述待预测客户是否为重点关注的客户，包括：确定最小的k个所述距离对应的k个最近邻的目标历史客户，确定所述最近邻的目标历史客户中重点关注的客户所占的比例，当所述比例大于预设的比例阈值时，确定所述待预测客户为重点关注的客户。
[0078]
在一个可选的实施方式中，根据上述步骤，所述待预测业务数据的类别包括：每日生成的保单量、每日生成的保单总额。例如图5所示，为本技术实施例提供的待预测业务数据的示例图。例如图6所示，为本技术实施例提供的预处理后的待预测业务数据的示例图，其中，对图5进行预处理使用的均值与方差为图3中的数据。
[0079]
在一个可选的实施方式中，当所述目标业务预测模型的距离函数为欧式距离时，所述基于所述距离函数获得所述待预测客户与任一目标历史客户的距离包括：
[0080]
计算所述待预测客户的每日生成的保单量a1与任一历史客户的每日生成的保单量b1的第一差值(a
1-b1)；
[0081]
计算所述待预测客户的每日生成的保单总额a2与任一历史客户的每日生成的保单总额b2的第二差值(a
2-b2)；
[0082]
根据所述第一差值与所属第二差值计算所述欧氏距离d
ab
，其中，，其中，
[0083]
在一个可选的实施方式中，例如图7所示，为本技术实施例提供的待预测客户与目标历史客户的距离数值的示例图。例如图8所示，为本技术实施例提供的最近邻的目标历史客户的示例图，其中，当所述目标业务预测模型的模型参数k为3时，基于图7获得图8中的3个最近邻的目标历史客户f、d、e。
[0084]
在一个可选的实施方式中，所述比例阈值可以为0.5。例如图9所示，为本技术实施例提供的待预测客户与目标历史客户的距离图像的示例图。其中，实线矩形框表示时重点关注的目标历史客户，实线圆形框表示不是重点关注的目标历史客户。3个最近邻的目标历史客户中有两个重点关注的目标历史客户f、d，因此将待预测客户l确定为重点关注的客户。
[0085]
在一个可选的实施方式中，可以为重点关注的客户提供优先级的软硬件资源支持，还可以为重点关注的客户分配更专业的服务人员，从而为重点关注的客户提供更好的服务。
[0086]
在一个可选的实施方式中，本技术实施例提供的基于knn算法的客户预测分析方案，可以用于例如保险等金融行业，根据业务需求和数据属性规则获取目标历史客户数据；利用预处理后的目标历史客户数据构建基于knn算法的业务预测模型；对所述业务预测模型的模型参数k与距离函数进行调整以优化所述业务预测模型获得目标业务预测模型；利用所述目标业务预测模型判断待预测客户是否为重点关注的客户。实现了基于业务数据对多种业务的客户或合作伙伴进行分类或分级，能够高效精准地识别重要客户，从而为不同类别或级别的客户提供对应的服务，提高客户的服务体验，提高达成业务需求的效率。
[0087]
实施例二
[0088]
图10是本发明实施例二提供的业务分析装置的结构图。
[0089]
在一些实施例中，所述业务分析装置20可以包括多个由计算机程序段所组成的功能模块。所述业务分析装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中，并由至少一个处理器所执行，以执行(详见图1描述)业务分析的功能。
[0090]
本实施例中，所述业务分析装置20根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：获取模块201、处理模块202、训练模块203、优化模块204、预测模块205。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。
[0091]
所述获取模块201，用于获取目标历史客户的目标历史业务数据。
[0092]
在一个可选的实施方式中，本技术实施例提供的方案可以应用于基于业务数据对多种业务的客户或合作伙伴进行分类或分级，能够高效精准地识别重要客户，从而为不同等级或级别客户提供对应的服务，提高客户的服务体验。所述多种业务可以包括例如保险等金融行业。
[0093]
举例而言，保险公司可以为客户提供互联网接口平台，所述接口平台可以响应客户的注册身份信息、登录等操作；在所述接口平台对客户输入的身份信息进行审核后，可以响应客户的申请各类保险产品的接口访问权限的操作，从而响应拥有权限的客户的下单、购买等操作，从而达成客户与所述保险公司进行例如购买保险等的合作。
[0094]
其中，所述接口平台支持例如rsa加密算法(rsa algorithm)等多种算法的数字证书，有效保障了业务对接过程的数据安全；此外，所述接口平台还可以将客户录入的身份信息(例如，身份标识)、下单的订单数量(例如，保单量)、每个订单的购买额度(例如，保单额)等存储至电子设备中的预设数据库中进行安全保存。
[0095]
在一个可选的实施方式中，所述获取目标历史客户的目标历史业务数据包括：确定业务需求，获取所述业务需求的历史业务数据，所述业务需求包括保险需求；根据所述业务需求的预定义的数据属性规则，筛选并统计所述历史业务数据以及获得所述目标历史业务数据。
[0096]
其中，所述数据属性规则包括如下的一种或多种：任一历史客户每日生成的保单量，以第一预设单位(例如，百)取整；任一历史客户每日生成的保单总额，以第二预设单位(例如，万)取整；剔除每日的保单量小于预设数量(例如，100)的历史客户的历史业务数据。其中，每个成交的保单对应一个保单额或投保额，所述保单量表示保单的个数，所述保单总额表示一个或多个保单的保单额的总和。
[0097]
在一个可选的实施方式中，所述业务需求表示综合业务目的与业务目标得到的需求指标，例如，所述保险需求包括每日达成40个保单量，每日达成400万保单总额，每日达成10个新客户购买保险等。
[0098]
在一个可选的实施方式中，可以利用sql(structured query language)数据库的视图、报表等查询技术，从所述数据库中筛选并统计所述历史业务数据。
[0099]
在一个可选的实施方式中，所述数据属性规则中使用的取整方法可以为四舍五入等，例如，将不足0.5万的每日生成的保单总额取整记为0。
[0100]
在一个可选的实施方式中，所述方法还包括：在任一历史客户的每日生成的保单量和/或每日生成的保单总额达到预设条件后，确定所述任一历史客户为重点关注的客户。
[0101]
具体地，可以利用所述接口平台在生成达到预设条件的历史客户的保单时，将达到预设条件的历史客户标记为重点关注的客户，还可以在进行所述筛选和统计时，对所述重点客户进行标记。例如图2所示，为本技术实施例提供的目标历史业务数据的示例图。其中，客户的身份标识用大写的字母表示，所述第一预设单位为“百”，所述第二预设单位为“万”，对所述重点客户的标记结果为“是”或“否”。
[0102]
在一个可选的实施方式中，所述预设条件可以包括如下的一种或多种：每日生成的保单量大于第一预设数值；每日生成的保单总额大于第二预设数值；每日生成的保单总额与每日生成的保单量的比值大于第三预设数值等。
[0103]
在一个可选的实施方式中，还可以将客户划分为多个等级，例如，为达到的上述预
设条件中的多种条件的种类越多的客户划分更高的等级，所述多个等级可以包括例如高、中、低等。
[0104]
需要说明的是，将达到预设条件的历史客户标记为重点关注的客户，相当于将客户划分为两个等级，包括：是重点关注的客户、不是重点关注的客户。
[0105]
在一个可选的实施方式中，本技术实施例提供的方法，可以针对实际的业务需求得到所述业务需求对应的目标历史客户的目标历史业务数据，基于所述目标历史业务数据构建的业务预测模型能够更精准地识别所述业务需求对应的重点客户，提高达成所述业务需求的效率，为客户提供更好的服务。
[0106]
所述处理模块202，用于对所述目标历史业务数据进行预处理，将预处理后的目标历史业务数据划分为训练集与测试集。
[0107]
在一个可选的实施方式中，由于无法确定所述目标历史业务数据中每种类别的取值范围，直接利用所述目标历史业务数据作为样本集训练模型得到的模型的预测能力会很低，因此需要对所述目标历史业务数据进行预处理，以降低训练误差从而提高模型的预测能力。
[0108]
在一个可选的实施方式中，所述预处理包括数据归一化(feature scaling)。本实施例采用的数据归一化方法包括z-score标准化(zero-mean normalization)方法，使用的公式包括：
[0109][0110]
其中，x
is
表示第i个目标客户的归一化后的目标历史业务数据，x
mean
表示n个目标历史客户的同一类别的目标历史业务数据的均值(average)，xi表示第i个目标客户的目标历史业务数据；
[0111]
s表示n个目标历史客户的同一类别的目标历史业务数据的标准差(standard deviation)，所述类别包括：每日生成的保单量、每日生成的保单总额。例如图3所示，为本技术实施例提供的目标历史业务数据的均值与标准差的示例图，其中图3中的数值是基于图2中的数值计算得到的。
[0112]
在一个可选的实施方式中，所述目标历史业务数据的每种类别的数据值没有明显的边界值，有可能存在极端(例如极大)的数据值。使用所述z-score标准化方法，可以在原数据集(例如所述目标历史业务数据)存在极端数据值的情况下，实现对所述目标历史业务数据进行归一化的同时，保留原数据集中的数据在特征空间的距离而不产生偏差。
[0113]
在一个可选的实施方式中，在进行所述数据归一化之前，所述预处理还可以包括数据集成、数据清洗等。其中，所述数据集成可以将多个所述接口平台获得的数据整合在一起，从而获得更多的业务数据，扩充构建模型的样本集从而获得更精准的模型。所述数据清理可以删除所述目标历史业务数据中的无关数据(例如与所述业务需求无关的数据)、重复数据等，还可以处理所述目标历史业务数据中的缺失值、异常值等；从而进一步完善在获取模块201中获得的目标历史业务数据。
[0114]
在一个可选的实施方式中，可以按照预设的划分比例(例如，7比3)将预处理后的目标历史业务数据划分为训练集与测试集。
[0115]
例如图4所示，为本技术实施例提供的训练集的示例图。其中，负数表示归一化后
的数值，不影响数据在特征空间中互相之间的距离。图4中的数值是根据图2与图3得到的。
[0116]
所述训练模块203，用于基于最近邻knn算法，利用所述训练集构建业务预测模型。
[0117]
在一个可选的实施方式中，为了确定待合作的待预测客户是否为重点关注客户，可以利用所述训练集构建所述业务预测模型，从而基于所述目标历史客户的目标历史业务数据对所述待预测客户进行分类预测，将客户划分为多个等级。
[0118]
在一个可选的实施方式中，所述基于最近邻knn(k-neares neighbor)算法，利用所述训练集构建业务预测模型，包括：设置所述业务预测模型的模型参数k，所述模型参数k表示所述业务预测模型确定的最近邻的个数，其中计算所述最近邻所使用的距离函数包括：欧氏距离、余弦距离、汉明距离、曼哈顿距离等。
[0119]
在一个可选的实施方式中，所述最近邻knn算法的核心思想包括：计算任一样本在数据集中的k个距离最近的样本作为最近邻样本，确定所述任一样本属于这k个最近邻样本中的大多数样本所属于的类别。其中，决定所述最近邻knn算法的准确性的要素包括：所述模型参数k与所述距离函数。
[0120]
所述优化模块204，用于基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型。
[0121]
在一个可选的实施方式中，为了提高所述业务预测模型进行预测的准确率，可以利用所述测试集通过调整所述模型参数与距离函数实现对所述业务预测模型的优化。
[0122]
在一个可选的实施方式中，所述基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型，包括：
[0123]
将所述测试集输入所述业务预测模型并获得所述测试集的业务预测结果，确定所述业务预测结果的准确率，所述业务预测结果包括：任一目标历史客户是否为重点关注的客户；
[0124]
当所述准确率小于预设的准确率阈值(例如，0.95)时，调整所述业务预测模型的模型参数k和/或所述距离函数，直至所述准确率大于所述准确率阈值，将所述调整后的业务预测模型作为所述目标业务预测模型。
[0125]
在一个可选的实施例中，可以将所述业务预测结果中的正确结果的数量与全部业务预测结果的数量的比值作为所述准确率。
[0126]
在一个可选的实施方式中，本实施例利用所述训练集与所述测试集进行交叉验证，从而调整所述模型参数k，提高所述目标业务预测模型的预测结果的准确率。其中，所述模型参数k的取值可以设置为不大于训练集中数据的数量的平方根，例如，当目标历史客户的数量为x时，所述模型参数还可以遍历所有小于或等于的所有奇数，以确定使得所述准确率最高的k的取值。
[0127]
在一个可选的实施方式中，将所述模型参数k取值为奇数可以避免出现样本不均衡现象，从而避免过拟合现象。
[0128]
在一个可选的实施方式中，可以通过更换所述距离函数以提高所述目标业务预测模型的预测结果的准确率。
[0129]
举例而言，基于图4中的训练集获得的所述目标业务预测模型的模型参数k为3，所使用的距离函数为欧式距离。
[0130]
所述预测模块205，用于获取待预测客户的待预测业务数据，将所述待预测业务数
据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果。
[0131]
在一个可选的实施方式中，所述获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果，包括：
[0132]
根据所述数据属性规则获取所述待预测业务数据；
[0133]
对所述待预测业务数据进行所述预处理；
[0134]
将预处理后的待预测业务数据输入所述目标业务预测模型，基于所述距离函数获得所述待预测客户与任一目标历史客户的距离；
[0135]
根据所述距离确定所述待预测客户是否为重点关注的客户，包括：确定最小的k个所述距离对应的k个最近邻的目标历史客户，确定所述最近邻的目标历史客户中重点关注的客户所占的比例，当所述比例大于预设的比例阈值时，确定所述待预测客户为重点关注的客户。
[0136]
在一个可选的实施方式中，根据上述步骤，所述待预测业务数据的类别包括：每日生成的保单量、每日生成的保单总额。例如图5所示，为本技术实施例提供的待预测业务数据的示例图。例如图6所示，为本技术实施例提供的预处理后的待预测业务数据的示例图，其中，对图5进行预处理使用的均值与方差为图3中的数据。
[0137]
在一个可选的实施方式中，当所述目标业务预测模型的距离函数为欧式距离时，所述基于所述距离函数获得所述待预测客户与任一目标历史客户的距离包括：
[0138]
计算所述待预测客户的每日生成的保单量a1与任一历史客户的每日生成的保单量b1的第一差值(a
1-b1)；
[0139]
计算所述待预测客户的每日生成的保单总额a2与任一历史客户的每日生成的保单总额b2的第二差值(a
2-b2)；
[0140]
根据所述第一差值与所属第二差值计算所述欧氏距离d
ab
，其中，，其中，
[0141]
在一个可选的实施方式中，例如图7所示，为本技术实施例提供的待预测客户与目标历史客户的距离数值的示例图。例如图8所示，为本技术实施例提供的最近邻的目标历史客户的示例图，其中，当所述目标业务预测模型的模型参数k为3时，基于图7获得图8中的3个最近邻的目标历史客户f、d、e。
[0142]
在一个可选的实施方式中，所述比例阈值可以为0.5。例如图9所示，为本技术实施例提供的待预测客户与目标历史客户的距离图像的示例图。其中，实线矩形框表示时重点关注的目标历史客户，实线圆形框表示不是重点关注的目标历史客户。3个最近邻的目标历史客户中有两个重点关注的目标历史客户f、d，因此将待预测客户l确定为重点关注的客户。
[0143]
在一个可选的实施方式中，可以为重点关注的客户提供优先级的软硬件资源支持，还可以为重点关注的客户分配更专业的服务人员，从而为重点关注的客户提供更好的服务。
[0144]
在一个可选的实施方式中，本技术实施例提供的基于knn算法的客户预测分析方案，可以用于例如保险等金融行业，根据业务需求和数据属性规则获取目标历史客户数据；利用预处理后的目标历史客户数据构建基于knn算法的业务预测模型；对所述业务预测模
型的模型参数k与距离函数进行调整以优化所述业务预测模型获得目标业务预测模型；利用所述目标业务预测模型判断待预测客户是否为重点关注的客户。实现了基于业务数据对多种业务的客户或合作伙伴进行分类或分级，能够高效精准地识别重要客户，从而为不同类别或级别的客户提供对应的服务，提高客户的服务体验，提高达成业务需求的效率。
[0145]
实施例三
[0146]
本实施例提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述业务分析方法实施例中的步骤，例如图1所示的s11-s15：
[0147]
s11，获取目标历史客户的目标历史业务数据；
[0148]
s12，对所述目标历史业务数据进行预处理，将预处理后的目标历史业务数据划分为训练集与测试集；
[0149]
s13，基于最近邻knn算法，利用所述训练集构建业务预测模型；
[0150]
s14，基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型；
[0151]
s15，获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果。
[0152]
或者，该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能，例如图5中的模块201-205：
[0153]
所述获取模块201，用于获取目标历史客户的目标历史业务数据；
[0154]
所述处理模块202，用于对所述目标历史业务数据进行预处理，将预处理后的目标历史业务数据划分为训练集与测试集；
[0155]
所述训练模块203，用于基于最近邻knn算法，利用所述训练集构建业务预测模型；
[0156]
所述优化模块204，用于基于所述测试集优化所述业务预测模型，直至获得达到预设要求的目标业务预测模型；
[0157]
所述预测模块205，用于获取待预测客户的待预测业务数据，将所述待预测业务数据输入所述目标业务预测模型，获得所述待预测客户的业务预测结果。
[0158]
实施例四
[0159]
参阅图11所示，为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中，所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
[0160]
本领域技术人员应该了解，图11示出的电子设备的结构并不构成本发明实施例的限定，既可以是总线型结构，也可以是星形结构，所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。
[0161]
在一些实施例中，所述电子设备3是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。
[0162]
需要说明的是，所述电子设备3仅为举例，其他现有的或今后可能出现的电子产品
如可适应于本发明，也应包含在本发明的保护范围以内，并以引用方式包含于此。
[0163]
在一些实施例中，所述存储器31中存储有计算机程序，所述计算机程序被所述至少一个处理器32执行时实现如所述的业务分析方法中的全部或者部分步骤。所述存储器31包括只读存储器(read-only memory，rom)、可编程只读存储器(programmable read-only memory，prom)、可擦除可编程只读存储器(erasable programmable read-only memory，eprom)、一次可编程只读存储器(one-time programmable read-only memory，otprom)、电子擦除式可复写只读存储器(electrically-erasable programmable read-only memory，eeprom)、只读光盘(compact disc read-only memory，cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
[0164]
进一步地，所述计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。
[0165]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0166]
在一些实施例中，所述至少一个处理器32是所述电子设备3的控制核心(control unit)，利用各种接口和线路连接整个电子设备3的各个部件，通过运行或执行存储在所述存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行电子设备3的各种功能和处理数据。例如，所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的业务分析方法的全部或者部分步骤；或者实现业务分析装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
[0167]
在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
[0168]
尽管未示出，所述电子设备3还可以包括给各个部件供电的电源(比如电池)，优选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、wi-fi模块、摄像装置等，在此不再赘述。
[0169]
上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
[0170]
在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其
它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
[0171]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，既可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0172]
另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。
[0173]
对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。
[0174]
最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于特征金字塔网络结构和通道注意力机制的脑肿瘤分类检测方法及系统

业务分析方法、装置、电子设备及存储介质与流程

相关文献

最热文献