一种预付卡企业风险预警方法和装置以及存储介质与流程

2022-07-23 12:03:08 来源：中国专利 TAG：

1.本技术涉及预警技术领域，具体涉及一种预付卡企业风险预警方法和装置以及存储介质。

背景技术：

2.随着社会消费水平的提高和消费观念，消费方式的改变，极大的促进了预付卡行业的蓬勃发展。企业的预付卡业务具有先付款后消费的特点，在发展运行的过程中必然会产生一定的运营风险，给消费者带来经济损失。通过建立预付卡风险企业模型，可以为政府监管提供一定的参考，也可在切实保护消费者自身权益的基础上，减少对商业预付卡消费模式运行造成的损害。
3.目前现有模型所采用的规则算法基本上是根据数据源的指标情况划分出不同的桶，对每个桶给定一个分值，当有新数据进来时，通过判断新数据的指标值落在哪一个桶中，就赋对应的分值，之后将各个数据源的所有指标所得的分值加起来获得总分值，通过总分值来进行各种判断，比如风险等级；现有的规则算法计算方式如下：，其中：表示一个样本的总得分，n表示指标的数量，表示指标xi划分桶的个数，score
ij
表示指标xi在对应的第j个桶中的得分。
4.采用上述规则算法进行建模，会导致预测结果的总分值随着数据源的增加而增加，部分边界数据异常的特征的引入，容易引起总分值的溢出，甚至可能出现导致超过边界值的风险，为避免上述随着特征增加造成的总风险的增加及边界值的溢出，技术人员常常需要伴随特征增加而同步调整权重，费时费力，效率低下，同时也影响相关人员的判断，不利于理解。

技术实现要素：

5.本技术的目的在于克服上述技术的不足，通过提供一种预付卡企业风险预警方法和装置以及存储介质，提高了预测输出结果的可解释性以及预测的准确率。
6.为达到上述目的，本技术主要提供一种预付卡企业风险预警方法，包括以下步骤：s1获取预付卡企业经营样本数据和目标企业的经营数据，从预付卡企业经营样本数据中提取出企业风险指标样本数据，从目标企业的经营数据中提取出目标企业的风险指标数据；s2根据企业风险指标样本数据构建企业风险评估模型，所述构建企业风险评估模型包括：对每个风险指标建立评分标准并确定每个风险指标的风险指标权重，对所有风险
指标的得分进行加权求和，得到风险指标总得分，根据风险指标总得分确定企业风险等级；s3将所述目标企业的风险指标数据输入至企业风险评估模型中，得到目标企业的风险等级；s4判断目标企业的风险等级是否超过预设风险阈值，若目标企业的风险等级超过预设风险阈值，则进行风险异常预警；风险指标数量变化时，风险指标总得分的最大值保持不变；所述最大值保持不变的方法为：设置阶梯式的风险指标分值，及依托阶梯式风险指标分值利用主动学习模型迭代更新的风险指标权重。
7.优选的，所述风险指标权重基于上次风险指标数量变化前的权重及特征筛选的iv值确定。
8.优选的，对每个风险指标建立评分标准包括：将每个风险指标划分为若干桶，并给每个风险指标中的每个桶赋对应的分值，判断企业的风险指标值落入的桶，即获得对应的风险指标得分。
9.优选的，所述风险指标的初始权重通过以下方式计算得到：风险指标的初始权重为风险指标的最大分值与所有风险指标的最大分值之和的比值。
10.优选的，所述利用主动学习模型迭代更新风险指标权重包括：根据每个风险指标的iv值按照以下公式（6）迭代更新每个风险指标的权重：其中：为更新率，表示第t次更新风险指标xi的权重，示第t 1次更新风险指标xi的权重，ivi为风险指标xi的iv值。
11.优选的，分桶后的风险指标的得分确定方法为：其中：scorei表示风险指标xi的得分，score
ik
表示第k个桶的风险指标的得分，x
value
为每个样本的指标xi的原始数据，x
ik
为第k个桶的数据范围，为风险指标xi被拆分的桶的个数。
12.一种预付卡企业风险预警装置，包括：数据获取模块，用于获取预付卡企业经营样本数据和目标企业的经营数据，从预付卡企业经营样本数据中提取出企业风险指标样本数据，从目标企业的经营数据中提取出目标企业的风险指标数据；模型构建模块，用于根据企业风险指标样本数据构建企业风险评估模型，所述构建企业风险评估模型包括：对每个风险指标建立评分标准并确定每个风险指标的权重，对所有风险指标的得分进行加权求和，得到风险指标总得分，再根据风险指标总得分确定企业风险等级；风险计算模块，用于将所述目标企业的风险指标数据输入至企业风险评估模型
中，得到目标企业的风险等级；风险预警模块，用于判断目标企业的风险等级是否超过预设风险阈值，若目标企业的风险等级超过预设风险阈值，则进行风险异常预警；当风险指标数量变化时，风险指标总得分的最大值保持不变；所述最大值保持不变的方法为：设置阶梯式的风险指标分值，及依托阶梯式风险指标分值利用主动学习模型迭代更新的风险指标权重。
13.优选的，所述风险指标权重基于上次风险指标数量变化前的权重及特征筛选的iv值确定。
14.优选的，对每个风险指标建立评分标准包括：将每个风险指标划分为若干桶，并给每个风险指标中的每个桶赋对应的分值，判断企业的风险指标值落入的桶，即获得对应的风险指标得分。
15.一种存储介质，所述存储介质上存储有预付卡企业风险预警程序，所述预付卡企业风险预警程序被处理器执行时实现上述任一项所述的预付卡企业风险预警方法的步骤。
16.本技术实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：本技术实施例提供的预付卡企业风险预警方法采用加权的规则算法建模，通过对企业风险指标权重的自适应调整，使得当指标数量变化时，待测样本各个指标的总分值仍维持在原有区间内，避免了数据的溢出，提高了预测输出结果的可解释性，并提高了预测效率。
17.附图说明
18.图1为本技术实施例提供的预付卡企业风险预警方法的流程图。
19.图2为本技术实施例提供的预付卡企业风险预警装置的模块框图。
具体实施方式
20.为了便于本领域技术人员对本技术方案的理解，下面结合附图和具体实施例对本技术方案进行进一步阐述，应当理解，本技术实施例是对本技术方案的解释说明，不作为对本技术保护范围的限定。
21.除非另有其他明确表示，否则在整个说明书和权利要求书中，术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分，而并未排除其他元件或其他组成部分。
22.现有预付卡风险预警采用的算法模型会导致预测结果的总分值随着特征增加造成的总风险的增加及边界值的溢出，技术人员常常需要伴随特征增加而同步调整权重，费时费力，效率低下，同时也影响相关人员的判断，不利于理解。
23.鉴于上述技术的不足，本技术实施例通过提供一种预付卡企业风险预警方法和装置以及存储介质，来提高预测输出结果的可解释性以及预测的准确率。
24.本技术实施例中的技术方案为解决上述问题，总体思路如下：实施例一本技术实施例提供一种预付卡企业风险预警方法，如图1所示，包括以下步骤：
步骤一，获取预付卡企业经营样本数据和目标企业的经营数据，从预付卡企业经营样本数据中提取出企业风险指标样本数据，从目标企业的经营数据中提取出目标企业的风险指标数据；需要说明的是，本技术实施例提供的风险预警方法所针对的目标企业既包括开通预付卡业务的企业，也包括任何需要企业信用风险评估和预警的企业。目标企业可以涵盖房地产、非银、银行业、服务业、制造业等各类行业的企业或公司。企业的经营数据可包括政府监管信息、银行信贷信息、行业评价信息、媒体评价信息、企业运营信息、市场反馈信息等方面的数据。其中政府监管信息包括企业基本资质、质量检查信息、行政许可/认定、行政奖罚信息、商标/专利/著作权信息、人民法院判决等；银行信贷信息包括中国人民银行信贷评价信息、商业银行信贷评价信息、小额贷款公司及民间借贷评价信息等；行业评价信息包括行业协会（社团组织）评价信息、水、电、气、通讯等公共事业单位评价信息等；企业运营信息包括企业财务信息、企业管理体系评估信息等；市场反馈信息包括消费者、交易对方、合作伙伴、员工等不同身份的实名评价信息。
25.具体地，司法数据可通过司法系统获取企业的司法信息，并从中提取裁判文书中的涉诉金额、企业是否涉及重大经济类纠纷等数据信息；市场反馈数据可通过网络途径获取企业在社会上的舆情，然后按照预先设定的打分标准对舆情进行正负面打分，再统计一段时间内重大正负面舆情的数量；工商数据可通过工商系统获取企业的注册资本是否有减少、股东持股比例的变化情况等数据信息；财务数据可通过企业财务报表来获得，并以此来分析企业的盈利水平、偿债水平、成长性等；征信数据可通过中国人民银行征信中心的信用信息基础数据库获取企业征信情况；经验管理数据可通过企业调研报告获得。
26.具体地，从企业的经营数据提取出企业的风险指标数据时，需要对大量的企业数据进行统计分析，选取出能反映企业经营风险的经营数据。风险指标数据既可为某个经营数据，也可将经营数据进行分类，将一类经营数据作为风险指标数据。
27.具体地，风险指标的数量以及类型可根据企业的经营情况和市场发展情况进行调整，从而可保证数据维度的多样化和丰富性，有效保证风险预警结果的可靠性。
28.步骤二，根据企业风险指标样本数据构建企业风险评估模型，该构建企业风险评估模型包括：对每个风险指标建立评分标准并确定每个风险指标的权重，对所有风险指标的得分进行加权求和，得到风险指标总得分，再根据风险指标总得分确定企业风险等级；该确定每个风险指标的权重包括：先给每个风险指标赋值初始权重，再利用主动学习模型迭代更新风险指标权重；具体地，在对每个风险指标建立评分标准时，可以利用专家先验知识，也可结合大量企业风险指标的统计分析数据。具体地，将每个风险指标划分为若干桶，并给每个风险指标中的每个桶赋对应的分值，判断企业的风险指标值落入哪个桶，即获得对应的风险指标得分。
29.具体地，将样本数据的风险指标集合定义为{x1，x2，
…
，xn}，其中，n为风险指标的数量，xi为风险指标；进一步的，风险指标xi被拆分为个桶，获得桶向量：，其中，i∈[1, n]，n、m均为整数，为对应第个桶的风险指标；风险指标xi中的各个桶分别赋对应的分值，获得分值向量：
，其中，表示风险指标xi对应的桶的分值。
[0030]
具体地，判断样本数据的风险指标xi的值x
value
落入哪个桶，然后获取其对应桶的分值，具体计算方式如下：
ꢀꢀꢀ
（1）其中：scorei表示风险指标xi的得分，score
ik
表示第k个桶的风险指标的得分，x
value
为每个样本的指标xi的原始数据，x
ik
为第k个桶的数据范围，为风险指标xi被拆分的桶的个数。优选的，scorei可根据评分卡模型计算获得。
[0031]
上述风险指标得分的确定方式，将所有指标基于分桶，避免指标直接进行分析对模型造成的干扰，分桶可基于卡方分箱，但不限定为唯一的分桶方式。在分桶的基础上，对相应同一桶内的得分赋予同一分值，使得相近的特征归一化，不同的特征离散化，消除了较为极端的维度对风险指标的总得分的过分影响。上述对特征划分区间，有效区分了不同风险权重对结果的影响。与其他分箱或分桶不同的是，本实施例的技术方案将分桶的风险指标的得分，在上述分箱的基础上，为更好地对分箱后的特征加以区别，以自适应的权重对分桶后的风险指标的得分进行匹配，本实施例综合的阶梯式风险指标的得分与迭代更新的权重，有效平衡了准确率与溢出抑制。具体的，本发明在所有风险指标的总得分处理时进一步引入权重wi为定量识别不同类型的特征其对补入新特征的过程中的影响，所述引入权重的所有风险指标的总得分的确定方法为：
ꢀꢀꢀꢀꢀꢀ
（2）其中，wi表示风险指标xi的权重，scorei表示风险指标xi的得分，score
汇总
表示所有风险指标的总得分。
[0032]
具体地，风险指标的初始权重通过以下方式计算得到：任意一个风险指标的初始权重为该任意一个风险指标的最大分值与所有风险指标的最大分值之和的比值。具体地，可根据以下公式（3）给每个风险指标赋初始权重：（3）其中：wi表示风险指标xi的初始权重，表示风险指标xi对应的桶的分值，表示风险指标xi对应的各个桶的最高分值，其中，i∈[1, n]，，n、m均为整数。
[0033]
需要说明的是，由于风险指标的初始权重仅根据评分制度计算得到，不能反映风险指标对企业风险评估的影响程度，且在每次每批新加入特征后，上述权重不能体现新加
入特征后所有风险指标的特点，容易造成溢出或准确率的降低，因此本实施例在计算风险指标的初始权重后，再对初始权重进行基于主动学习的更新和优化。本实施例通过对风险指标权重的递次更新，调整不同风险指标权重的大小，使风险指标权重随着历次加入的特征情况，动态反映各风险指标对企业风险评估的贡献程度，并通过不断循环迭代更新权重，适应逐次新加的更多类型的数据，让模型趋于稳定，从而可以优化企业风险评估模型，提高模型输出结果的准确性。
[0034]
具体地，为保证更新后的风险指标权重具有较高的精准度，避免对企业风险评估影响较小的风险指标具有较大的权重，可通过主动学习模型的方法从企业的经营数据中分辨风险指标对企业风险评估的作用大小，并加大对衡量企业风险比较有效的风险指标的权重，减小对衡量企业风险作用较小的风险指标的权重，最终实现对企业风险评估模型的训练，提高风险预测的精准度。
[0035]
具体地，利用主动学习模型迭代更新风险指标权重包括以下步骤：先按照以下公式（4）计算每个风险指标的每个桶的iv值：
ꢀꢀꢀꢀꢀꢀꢀꢀ
（4）其中，iv
ij
为风险指标xi对应的桶x
ij
的iv值，y
ij
表示样本数据落入风险指标xi的桶x
ij
中负样本的个数，y
t
表示样本数据对应风险指标xi的所有负样本个数，n
ij
表示样本数据落入风险指标xi的桶x
ij
中正样本的个数，n
t
表示风险指标xi的所有正样本个数；按照以下公式（5）计算每个风险指标的iv值：，i∈[1,n]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（5）其中: ivi为风险指标xi的iv值，iv
ij
为风险指标xi对应的桶x
ij
的iv值；为风险指标xi被拆分的桶的个数。
[0036]
根据每个风险指标的iv值按照以下公式（6）迭代更新每个风险指标的权重：
ꢀꢀꢀꢀꢀꢀ
（6）其中：为更新率，表示第t次更新风险指标xi的权重，示第t 1次更新风险指标xi的权重，ivi为风险指标xi的iv值。
[0037]
在所有风险指标的总得分的确定时，采用当此风险指标数量更新后对应的权重来进行总得分的计算。
[0038]
需要说明的是，上述iv值是用来衡量风险指标对企业风险评估作用大小的指标，在常规的iv值计算时，通常引入第一层的权重逻辑，一般体现为iv值计算中的ln函数。本实施例与上述技术方案的关键区别在于，在第一层权重逻辑的基础上，引入第二层权重数据。第二层权重数据依赖体现逐次加入新特征更新情况的更新率λ，上次更新的权重，及上次更
新的iv值三者共同确定。更新率λ的确定方法为：根据网格搜索方法计算选择当前风险指标下的最优值。本实施例基于主动学习及权重设置，使得风险指标权重根据企业经营样本数据引入的特征的增加而实现自适应调整。
[0039]
具体地，当风险指标数量变化时，根据上述企业风险评估模型得到的风险指标总得分的最大值保持不变。如将当风险指标数量不断增加时，本实施例设计的两层权重处理方式，通过对所有风险指标进行多次加权，从指标本身对企业风险的影响，及指标对新引入指标的影响两个维度进行加强体现，避免了仅考虑iv值，或仅考虑风险指标对企业风险的影响导致在多轮多次引入新指标时，风险总分的溢出。上述方案有效将风险指标总得分控制在100或其他风险指标总边界值以内，可保证风险等级的判断区间保持不变，从而仍可按原有解释规则对输出结果进行解释，无需对判断区间进行调整，提高了解释效率。
[0040]
步骤三，将上述目标企业的风险指标数据输入至企业风险评估模型中，得到目标企业的风险等级；步骤四，判断目标企业的风险等级是否超过预设风险阈值，若目标企业的风险等级超过预设风险阈值，则进行风险异常预警。
[0041]
具体地，上述预设风险阈值为根据实际情况设定的用于判断企业是否处于风险预警范围内的风险评判值，具体可根据历史风险评估经验进行设定，并结合实际情况进行调整。
[0042]
本技术实施例提供的预付卡企业风险预警方法通过建立企业风险评估模型，再根据目标企业的经营数据来进行企业风险评估，并对超出预设风险等级阈值的目标企业作出预警，相对于人工预警的方式，可提高预警效率和预警准确性。本技术实施例采用加权的规则算法建模，通过对企业风险指标权重的调整，一方面可保证当指标数量变化时，待测样本各个风险指标的总分值仍维持在原有区间内，避免由于风险指标的增加导致的溢出，从而提高了预测输出结果的可解释性，并提高预测效率；另一方面根据预测结果自适应更新指标权重，以体现重要风险指标的特征权重，从而提高预测准确率。
[0043]
需要说明的是，本技术实施例提供的上述方法的执行主体可以是具有网络通信、数据处理以及程序运行功能的计算服务设备，如手机、平板电脑、个人电脑、服务器等。
[0044]
当风险指标数量变化或企业经营样本数据更新时，采用上述主动学习模型构建的企业风险评估模型，不仅计算得到的风险指标总得分始终维持在一定区间内，而且各个风险指标的权重随样本数据的变化得到更新，从而风险指标的权重能切实反映风险指标对企业风险评估的作用大小，最终提高预测结果的准确性和可解释性。
[0045]
本技术实施例提供的上述风险预警方法通过对发预付卡企业的多维度数据进行风险研判分析，可实现对预付卡企业的经营或服务状况进行综合预警，也可对某些可能存在有风险比如跑路、倒闭的企业作出预警，以及持卡消费者的潜在风险作出预警。
[0046]
实施例二本技术实施例提供了一种预付卡企业风险预警装置，图2为本技术实施例提供的预付卡企业风险预警装置的结构示意图，该预付卡企业风险预警装置为与上述预付卡企业风险预警方法对应的装置，即通过虚拟装置的方式实现上述预付卡企业风险预警方法，构成该预付卡企业风险预警装置的各个虚拟模块可以由电子设备执行，例如网络设备、终端设备、或服务器。
[0047]
具体地，本技术实施例中的预付卡企业风险预警装置包括：数据获取模块01，用于获取预付卡企业经营样本数据和目标企业的经营数据，从预付卡企业经营样本数据中提取出企业风险指标样本数据，从目标企业的经营数据中提取出目标企业的风险指标数据；模型构建模块02，用于根据企业风险指标样本数据构建企业风险评估模型，该构建企业风险评估模型包括：对每个风险指标建立评分标准并确定每个风险指标的权重，对所有风险指标的得分进行加权求和，得到风险指标总得分，再根据风险指标总得分确定企业风险等级；上述确定每个风险指标的权重包括：先给每个风险指标赋值初始权重，再利用主动学习模型迭代更新风险指标权重；风险计算模块03，用于将上述目标企业的风险指标数据输入至企业风险评估模型中，得到目标企业的风险等级；风险预警模块04，用于判断目标企业的风险等级是否超过预设风险阈值，若目标企业的风险等级超过预设风险阈值，则进行风险异常预警。
[0048]
本技术实施例提供的预付卡企业风险预警装置所包括的模型构建模块，通过建立企业风险评估模型，再根据目标企业的经营数据来进行企业风险评估，并对超出预设风险等级阈值的目标企业作出预警，相对于人工预警的方式，可提高预警效率和预警准确性。该模型构建模块中，采用加权的规则算法建模，通过对企业风险指标权重的调整，一方面可保证当指标数量变化时，待测样本各个指标的总分值仍维持在原有区间内，从而提高了预测输出结果的可解释性，并提高了预测效率；另一方面根据预测结果自适应更新指标权重，以体现重要指标的特征权重，从而提高预测准确率。
[0049]
进一步地，在上述模型构建模块中，当风险指标数量变化时，根据上述企业风险评估模型得到的风险指标总得分的最大值保持不变。
[0050]
进一步地，上述模型构建模块还用于：将每个风险指标划分为若干桶，并给每个风险指标中的每个桶赋对应的分值，判断企业的风险指标值落入哪个桶，即获得对应的风险指标得分。
[0051]
进一步地，上述风险指标的初始权重通过以下方式计算得到：任意一个风险指标的初始权重为该任意一个风险指标的最大分值与所有风险指标的最大分值之和的比值。
[0052]
本技术实施例提供的预付卡企业风险预警装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。
[0053]
实施例三本技术实施例提供了一种存储介质，该存储介质上存储有预付卡企业风险预警程序，该预付卡企业风险预警程序被处理器执行时实现上述的预付卡企业风险预警方法的步骤。
[0054]
在本技术所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，上述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0055]
另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0056]
上述预付卡企业风险预警装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储设备中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储设备包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，random access memory)、reram、mram、pcm、nand flash，nor flash，memristor、磁碟或者光盘等各种可以存储程序代码的介质。
[0057]
最后说明的是，以上实施例仅用以说明本技术的技术方案而非限制，尽管参照较佳实施例对本技术进行了详细说明，本领域的普通技术人员应当理解，可以对本技术的技术方案进行修改或者等同替换，而不脱离本技术技术方案的宗旨和范围，其均应涵盖在本技术的权利要求范围当中。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于图数据库的组件依赖关系分析方法及系统与流程

一种预付卡企业风险预警方法和装置以及存储介质与流程

相关文献

最热文献