用户动支概率预测方法、装置、计算机设备和存储介质与流程

2022-04-25 05:19:18 来源：中国专利 TAG：

1.本技术涉及数据处理技术领域，特别是涉及一种用户动支概率预测方法、装置、计算机设备和存储介质。

背景技术：

2.在信贷业务数据处理过程中，会基于信贷用户的用户特征以及动支行为表现，为用户进行额度调整以满足用户需求，例如，提高用户的可贷款额度等。然而，总的资金额度有限，如果额度调整策略部署不合理，额度提高后用户并没有充分利用该额度，将会造成额度资源的浪费。因此，可以预先对用户的动支概率进行分析，根据分析结果部署策略。
3.然而，在传统方法中，是假设用户在每次提额度后的动支概率都是一样的，而且，基于传统方法，会舍弃掉一些刚提额几次的样本，因为，这部分样本还没有足够的反映用户是否产生动支的数据，这样一来，样本与总体之间会有偏差，并不能很好的反映用户实际情况，从而导致用户动支概率预测的准确性低。

技术实现要素：

4.基于此，有必要针对上述技术问题，提供一种能够提高用户动支概率预测准确性的用户动支概率预测方法、装置、计算机设备和存储介质。
5.一种用户动支概率预测方法，该方法包括：获取目标用户的用户特征数据；获取目标用户的当前额度调整次数；根据目标用户的用户特征数据、当前额度调整次数以及预先建立的动支概率预测模型，预测经过当前额度调整次数的调整之后目标用户的动支概率；其中，动支概率预测模型是以样本用户的用户特征数据和生存时间作为模型特征而构建的用于预测任意一次或多次额度调整之后用户的动支概率的模型，生存时间与样本用户的额度调整次数相关。
6.在一个实施例中，动支概率预测模型的构建方法，包括：获取样本用户的用户特征数据；分析样本用户的生存时间；确定样本用户对应的目标变量；根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型。
7.在一个实施例中，分析样本用户的生存时间，包括：获取样本用户在各次额度调整之后的动支行为信息，根据动支行为信息分析样本用户是否存在未动支行为；若是，则将首次出现未动支行为时所对应的额度调整次数作为样本用户的生存时间；若否，则将样本采集时的额度调整次数确定为样本用户的生存时间。
8.在一个实施例中，根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型，包括：根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，基于机器学习算法和生存分析方法，得到任意一个样本用户在任意一次额度调整之后的危险函数；根据各个危险函数，得到用于计算任意一次或多次额度调整之后任意一个用户的动支概率的动支概率预测模型。
9.在一个实施例中，用户特征数据包括用户埋点数据、用户外部征信数据、用户发生
借贷的行为数据之中的至少一个。
10.在一个实施例中，获取样本用户的用户特征数据之后，该方法还包括：对样本用户的用户特征数据进行数据清洗处理、数据融合处理和数据衍生处理之中的至少一种处理。
11.在一个实施例中，该方法还包括：根据预测的目标用户的动支概率生成评价报告，将评价报告发送至终端。
12.在一个实施例中，该方法还包括：获取预设概率阈值，在预测的目标用户的动支概率小于预设概率阈值时，生成控制指令以停止对目标用户的下一次额度调整操作。
13.一种用户动支概率预测装置，该装置包括：
14.特征数据获取模块，用于获取目标用户的用户特征数据；
15.调整次数确定模块，用于获取所述目标用户的当前额度调整次数；
16.动支概率预测模块，用于根据所述目标用户的用户特征数据、所述当前额度调整次数以及预先建立的动支概率预测模型，预测经过所述当前额度调整次数的调整之后所述目标用户的动支概率；其中，所述动支概率预测模型是以样本用户的用户特征数据和生存时间作为模型特征而构建的用于预测任意一次或多次额度调整之后用户的动支概率的模型，所述生存时间与所述样本用户的额度调整次数相关。
17.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一项用户动支概率预测方法的步骤。
18.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项用户动支概率预测方法的步骤。
19.上述用户动支概率预测方法、装置、计算机设备和存储介质，通过将目标用户的用户特征数据结合当前额度调整次数作为预先建立的动支概率预测模型的输入，能够得到动支概率预测模型输出的表征目标用户在经过当前额度调整次数的调整后所产生的动支概率。由于动支概率预测模型是预先根据样本用户的用户特征数据，并结合基于额度调整次数所确定的生存时间所构建的模型，即，该动支概率预测模型是将用户的生存时间也作为其中一个模型特征加入至模型构建，因此，该动支概率预测模型能够将用户的额度调整次数转化为对应的生存时间进行预测。在传统方法中，将用户在每次额度调整后的动支概率都视为相同，但这并不符合实际客观规律，在额度调整的实际过程中，前几次调整所对应的动支概率会高于后几次调整，因此，不考虑额度调整次数对动支概率的影响是不能实现准确预测的。本方案，将额度调整次数与用户的生存时间相关联，并将生存时间作为模型特征加入模型构建，因此，利用本方案的动支概率预测模型进行用户动支概率预测，能够预测任意一次或多次额度调整后用户的动支概率，从而提高用户动支概率预测的准确性。
附图说明
20.图1为一个实施例中用户动支概率预测方法的流程示意图；
21.图2为一个实施例中动支概率预测模型的构建方法的流程示意图；
22.图3为一个实施例中用户动支概率预测装置的结构框图；
23.图4为一个实施例中计算机设备的内部结构图。
具体实施方式
24.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅用以解释本技术，并不用于限定本技术。
25.在一个实施例中，本技术提供的用户动支概率预测方法，可以应用于服务器。具体地，服务器获取目标用户的用户特征数据；获取目标用户的当前额度调整次数；根据目标用户的用户特征数据、当前额度调整次数以及预先建立的动支概率预测模型，预测经过当前额度调整次数的调整之后目标用户的动支概率；其中，动支概率预测模型是以样本用户的用户特征数据和生存时间作为模型特征而构建的用于预测任意一次或多次额度调整之后用户的动支概率的模型，生存时间与样本用户的额度调整次数相关。其中，服务器可以是云服务器、终端服务器、虚拟服务器等，服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
26.在一个实施例中，如图1所示，提供了一种用户动支概率预测方法，以该方法应用于服务器为例进行说明，包括以下步骤：
27.步骤s102：获取目标用户的用户特征数据。
28.其中，目标用户是指被确定为有待进行动支概率预测的用户，可以是任意一个或多个信贷用户。用户特征数据是指在信贷业务中用于反映用户属性特征的数据，例如，可以包括但不限于：用户的埋点数据、外部征信数据、发生借贷的行为数据等。
29.具体地，在本步骤中，服务器可以确定有待进行动支概率预测的目标用户，并可以通过调用缓存、访问数据库等方式锁定并读取该目标用户对应的用户特征数据。
30.步骤s104：获取目标用户的当前额度调整次数。
31.其中，额度调整是指对用户可借贷的信用额度数据进行调整的操作，例如，调高用户可借贷的信用额度的上限值等。当前额度调整次数是指当前时间点或时间段下对用户已经进行的额度调整操作的次数总和，额度调整操作的次数可以为一次或多次，例如，当前时间点或时间段下对用户已经进行了3次额度调整操作，则当前额度调整次数为3。
32.示例性地，在每次对用户进行额度调整的操作之后，可以相应地对该次额度调整的相关信息进行记录并储存，服务器可以通过读取之前记录的目标用户的额度调整的相关信息，确定该目标用户的当前额度调整是第几次调整，从而确定当前额度调整次数。
33.步骤s106：根据目标用户的用户特征数据、当前额度调整次数以及预先建立的动支概率预测模型，预测经过当前额度调整次数的调整之后目标用户的动支概率；其中，动支概率预测模型是以样本用户的用户特征数据和生存时间作为模型特征而构建的用于预测任意一次或多次额度调整之后用户的动支概率的模型，生存时间与样本用户的额度调整次数相关。
34.在本步骤中，动支概率预测模型可以是预先利用样本集的数据进行构建和训练的模型，可以用于预测任意一次或多次额度调整之后任意用户的动支概率。样本集可以由样本用户的数据构成，可以根据需要从样本用户的用户特征数据中选取全部或部分特征作为模型特征，并可以结合样本用户的生存时间，将生存时间也作为其中一个模型特征加入至动支概率预测模型构建和训练中。其中，生存时间是指生存分析方法中的概念，其定义可以是：目标对象从起始事件到终点事件之间所经历的时间跨度称为生存时间，这里，可以将样
本用户的额度调整次数与生存时间相关联，也即是，可以样本用户的将额度调整次数作为离散的生存时间，通过用户的额度调整次数确定该用户的生存时间。示例性地，可以将样本采集时，用户的当前额度调整次数作为该用户的生存时间；也可以将首次额度调整看作事件起点，将额度调整后首次发生用户未动支时对应的那次额度调整的操作作为事件终点，将事件起点到事件终点之间用户所经历的额度调整的次数作为该用户的生存时间。
35.示例性地，服务器可以将目标用户的用户特征数据、当前额度调整次数作为预先建立的动支概率预测模型的输入变量，基于该动支概率预测模型进行预测和计算后，该动支概率预测模型能够输出经过当前额度调整次数的调整后该目标用户所对应的动支概率。例如，当前额度调整次数为3，则动支概率预测模型可以输出经过3次调整后该目标用户的动支概率。
36.上述的用户动支概率预测方法，通过将目标用户的用户特征数据结合当前额度调整次数作为预先建立的动支概率预测模型的输入，能够得到动支概率预测模型输出的表征目标用户在经过当前额度调整次数的调整后所产生的动支概率。由于动支概率预测模型是预先根据样本用户的用户特征数据，并结合基于额度调整次数所确定的生存时间所构建的模型，即，该动支概率预测模型是将用户的生存时间也作为其中一个模型特征加入至模型构建，因此，该动支概率预测模型能够将用户的额度调整次数转化为对应的生存时间进行预测。在传统方法中，将用户在每次额度调整后的动支概率都视为相同，但这并不符合实际客观规律，在额度调整的实际过程中，前几次调整所对应的动支概率会高于后几次调整，因此，不考虑额度调整次数对动支概率的影响是不能实现准确预测的。本方案，将额度调整次数与用户的生存时间相关联，并将生存时间作为模型特征加入模型构建，因此，利用本方案的动支概率预测模型进行用户动支概率预测，能够预测任意一次或多次额度调整后用户的动支概率，从而提高用户动支概率预测的准确性。
37.在一个实施例中，该动支概率预测模型的构建方法，包括：
38.步骤s202：获取样本用户的用户特征数据。
39.具体地，首先可以选取一定数量的用户作为样本用户，样本用户可以在全部借贷用户中进行随机抽选，且不需要放弃掉额度调整次数较少的用户。在传统的方法中，传统模型所需要的样本必须是具有较长表现期的样本，因此，传统方法在构建模型时需要舍弃一些仅额度调整了较少几次的样本，也就是说，传统方法需要舍弃近期贷款用户的数据，这将导致以传统方法构建的模型无法反映近期贷款用户的表现，从而导致动支概率预测不准确。本技术的方法并不对样本的选取做特别限制，可以从不同时期的借贷用户中随机选取样本，全部借贷生命周期中的用户都可以作为样本用户，从而，可以提高模型样本的全面性，进而提高模型构建和预测的准确性。
40.进一步地，在选取了样本用户之后，可以获取这些样本用户的用户特征数据，用户特征数据是指在信贷业务中用于反映用户属性特征的数据，例如，用户特征数据可以包括用户的埋点数据、外部征信数据、发生借贷的行为数据、用户额度调整数据之中的至少一种。
41.步骤s204：分析样本用户的生存时间。
42.具体地，服务器可以通过分析样本用户的额度调整次数，以确定样本用户的生存时间。示例性地，可以将首次额度调整看作事件起点，将额度调整后首次发生用户未动支时
对应的那次额度调整作为事件终点，将事件起点到事件终点之间用户所经历的额度调整的总次数作为用户的生存时间。
43.步骤s206：确定样本用户对应的目标变量。
44.示例性地，目标变量是指机器学习模型的结果变量，例如，目标变量可以分为好样本和坏样本两类，目标变量的确定方法可以包括：用户在发生借贷行为的过程中，首次在提额后预设时间内(例如，三十天)动支的视为好样本，未动支的视为坏样本。
45.步骤s208：根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型。
46.在本实施例中，可以采用生存分析方法，将生存分析方法结合机器学习算法，将反映用户额度调整次数的生存时间作为特征变量加入至动支概率预测模型的建模中。具体地，生存分析是一种统计分析方法。本技术将提额次数当作是用户的生存时间，来预测用户对调整后的额度的接受程度。将提额次数看成是离散的生存时间，例如，可以取值为1，2，3，
…
n，再基于xgboost(extreme gradient boosting，极端梯度提升)算法来进行用户的生存分析，并根据用户在额度调整后的生存率确定该用户的动支概率。
47.在一个实施例中，获取样本用户的用户特征数据之后，上述的方法还可以包括：对样本用户的用户特征数据进行数据清洗处理、数据融合处理和数据衍生处理之中的至少一种处理。
48.在本实施例中，在获取了用户埋点数据、用户外部征信数据、用户发生借贷的行为数据等用户特征数据之后，进一步地，可以对这些数据进行数据清洗处理、数据融合处理、和/或数据衍生处理等数据处理操作，在经过数据处理之后，可以基于处理过的用户特征数据，并可以结合业务需求等筛选适合用于模型构建的模型特征。从而能够提高模型特征选取的多样性、灵活性以及准确性。
49.在一个实施例中，分析样本用户的生存时间，可以包括：获取样本用户在各次额度调整之后的动支行为信息，根据动支行为信息分析样本用户是否存在未动支行为；若是，则将首次出现未动支行为时所对应的额度调整次数作为样本用户的生存时间；若否，则将样本采集时的额度调整次数确定为样本用户的生存时间。
50.在本实施例中，服务器可以通过读取样本用户的动支行为信息，并根据样本用户的动支行为信息分析样本用户在每次的额度调整之后的预设时间范围内是否发生动支行为。例如，可以根据业务需求自定义设置时间节点，如，可以将额度调整后三十天作为判断用户是否发生动支行为的时间节点。
51.在一个实施例中，根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型，包括：根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，基于机器学习算法和生存分析方法，得到任意一个样本用户在任意一次额度调整之后的危险函数；根据各个危险函数，得到用于计算任意一次或多次额度调整之后任意一个用户的动支概率的动支概率预测模型。
52.具体地，下面结合一个实际应用场景，对本实施例进行进一步详细说明，其中，有关生存分析方法与机器学算法的结合以构建本实施例的动支概率预测模型的具体过程可以参考如下：
53.1、生存分析的相关概念。
54.生存函数是某一观测对象存活时间t大于等于设置阈值t的概率，为t时刻活着的人数除以期最开始的人数，即
[0055][0056]
死亡函数是某一目标对象存活时间小于设置阈值t的概率，即
[0057]
f(t)＝1-s(t)
[0058]
死亡密度函数是某一目标对象在t时刻的死亡率，即
[0059]
f(t)＝df(t)/dt＝-ds(t)/dt
[0060]
危险函数是某一目标对象在t时刻存活，但在t时刻后的一瞬间的死亡率，即，可以用如下公式表示：
[0061]
h(t)＝f(t)/s(t)＝-d(ln(s(t)))/dt
[0062]
累积危险函数是t时刻内累积的危险函数，即
[0063][0064]
2、可以将额度调整的次数可看成是离散的生存时间，生存时间的取值可以为1，2，3，
…
，n建立模型时，以首次出现额度调整后30天内未动支行为作为终点事件，可得出所有样本用户的生存时间，并结合样本用户的其他特征维度，利用机器学习算法，如，python和/或xgboost算法进行建模，模型可以得出任意一个用户的危险函数h(t,s)，即针对任一用户实例si及任一额度调整次数tj，可得该次额度调整的危险函数h(tj,si)，其中tj取值可以为1，2，3，
…
，n。
[0065]
3、根据上述每次额度调整的危险函数可以得出，经过n次额度调整后用户si的动支概率的计算公式为：
[0066][0067]
基于上述的经过n次额度调整后用户si的动支概率的计算公式可以得到基于生存分析的用户的动支概率预测模型。
[0068]
在一个实施例中，预测经过当前额度调整次数的调整之后目标用户的动支概率的步骤之后，该方法还可以进一步包括以下步骤：根据预测的目标用户的动支概率生成评价报告，将评价报告发送至终端。
[0069]
在本实施例中，服务器可以基于本技术所涉及的用户动支概率预测模型得到目标用户的动支概率，并结合该目标用户的其他相关信息，生成用于评价该目标用户是否适合继续进行额度调整的评价报告等，进一步还可以将生成的评价报告在显示界面中进行展示，或也可以将其发送至管理人员所对应的终端，以使得该管理人员能够根据该评价报告清楚、准确地进行策略分析，做出合理的额度调整策略，提高策略制定的准确性和效率。
[0070]
在一个实施例中，在预测经过当前额度调整次数的调整之后目标用户的动支概率的步骤之后，该方法还可以进一步包括以下步骤：获取预设概率阈值，在预测的目标用户的动支概率小于预设概率阈值时，生成控制指令以停止对目标用户的下一次额度调整的操
作。
[0071]
在本实施例中，服务器还可以获取预设概率阈值，该预设概率阈值是指用于判断目标用户的动支概率是否符合业务需求的临界值。在目标用户的动支概率小于预设概率阈值时，可以停止对目标用户的下一次额度调整操作，示例性地，服务器可以通过生成停止指令的方式，通过指令以控制额度调整服务或程序的参数，从而使得额度调整服务或程序停止为该目标用户继续进行额度调整处理；或者，进一步地，服务器还可以控制相关程序停止向该目标用户继续发送额度已调整的提示信息等等。
[0072]
利用上述实施例中所涉及的用户动支概率预测方法，能够预测用户在任意一次或多次额度调整后的动支概率。相较于传统方法而言，本技术所涉及的用户动支概率预测方法至少具有以下的优势：
[0073]
1、将对用户进行的额度调整操作的次数当作生存时间加入到模型构建中，使得模型的预测效果更好，更加贴合真实场景和实际需求，能够更加准确地反映用户在每次提额以后的动支概率。
[0074]
2、传统模型所需要的样本表现期较长，为了建模需要舍弃一些样本。本技术所涉及的动支概率预测模型可以将全借贷生命周期中的用户作为样本进行模型建立，而不必舍弃额度调整次数较少的用户，由于额度调整次数较少的多是近期贷款的用户，舍弃这些样本之后构建的模型无法反映近期贷款用户的表现。本技术不需要特别限制样本的选取，样本选取更加全面，更能体现总体特性，因此，本技术所涉及的动支概率预测模型能够提高预测的准确性。
[0075]
3、传统的动支概率模型是假设每次额度调整后动支概率都一样，而本技术所涉及的动支概率预测模型并未做此不合理的限定，即容许每次额度调整后动支概率有差异，这更符合实际情况，即任意一次或多次额度调整后用户的动支概率不尽相同，且都能够进行预测，因此，对生成评价报告、分析额度调整次数上限、分析额度调整策略等后续的应用都具有重要意义。
[0076]
应该理解的是，虽然图1～2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1～2中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0077]
在一个实施例中，如图3所示，提供了一种用户动支概率预测装置，包括：特征数据获取模块310、调整次数确定模块320和动支概率预测模块330，其中：
[0078]
特征数据获取模块310，用于获取目标用户的用户特征数据；
[0079]
调整次数确定模块320，用于获取目标用户的当前额度调整次数；
[0080]
动支概率预测模块330，用于根据目标用户的用户特征数据、当前额度调整次数以及预先建立的动支概率预测模型，预测经过当前额度调整次数的调整之后目标用户的动支概率；其中，动支概率预测模型是以样本用户的用户特征数据和生存时间作为模型特征而构建的用于预测任意一次或多次额度调整之后用户的动支概率的模型，生存时间与样本用
户的额度调整次数相关。
[0081]
在一个实施例中，该装置还包括动支模型构建模块340，动支模型构建模块340，用于构建动支概率预测模型，其具体用于获取样本用户的用户特征数据；分析样本用户的生存时间；确定样本用户对应的目标变量；根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型。
[0082]
在一个实施例中，动支模型构建模块340获取样本用户在各次额度调整之后的动支行为信息，根据动支行为信息分析样本用户是否存在未动支行为；若是，则将首次出现未动支行为时所对应的额度调整次数作为样本用户的生存时间；若否，则将样本采集时的额度调整次数确定为样本用户的生存时间。
[0083]
在一个实施例中，动支模型构建模块340根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，基于机器学习算法和生存分析方法，得到任意一个样本用户在任意一次额度调整之后的危险函数；根据各个危险函数，得到用于计算任意一次或多次额度调整之后任意一个用户的动支概率的动支概率预测模型。
[0084]
在一个实施例中，动支模型构建模块340，还用于对样本用户的用户特征数据进行数据清洗处理、数据融合处理和数据衍生处理之中的至少一种处理。
[0085]
在一个实施例中，动支概率预测模块330，还用于根据预测的目标用户的动支概率生成评价报告，将评价报告发送至终端。
[0086]
在一个实施例中，动支概率预测模块330，还用于获取预设概率阈值，在预测的目标用户的动支概率小于预设概率阈值时，生成控制指令以停止对目标用户的下一次额度调整操作。
[0087]
关于用户动支概率预测装置的具体限定可以参见上文中对于用户动支概率预测方法的限定，在此不再赘述。上述用户动支概率预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
[0088]
在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户动支概率预测方法。
[0089]
本领域技术人员可以理解，图4中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0090]
在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：获取目标用户的用户特征数据；获取目标用户的当前额度调整次数；根据目标用户的用户特征数据、当前额度调整次数以及预先建立的动支概率预测模型，预测经过当前额度调整次数的调整之
后目标用户的动支概率；其中，动支概率预测模型是以样本用户的用户特征数据和生存时间作为模型特征而构建的用于预测任意一次或多次额度调整之后用户的动支概率的模型，生存时间与样本用户的额度调整次数相关。
[0091]
在一个实施例中，处理器执行计算机程序时还实现构建动支概率预测模型的步骤，具体地，获取样本用户的用户特征数据；分析样本用户的生存时间；确定样本用户对应的目标变量；根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型。
[0092]
在一个实施例中，处理器执行计算机程序实现分析样本用户的生存时间时，具体实现以下步骤：获取样本用户在各次额度调整之后的动支行为信息，根据动支行为信息分析样本用户是否存在未动支行为；若是，则将首次出现未动支行为时所对应的额度调整次数作为样本用户的生存时间；若否，则将样本采集时的额度调整次数确定为样本用户的生存时间。
[0093]
在一个实施例中，处理器执行计算机程序实现根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型时，具体实现以下步骤：根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，基于机器学习算法和生存分析方法，得到任意一个样本用户在任意一次额度调整之后的危险函数；根据各个危险函数，得到用于计算任意一次或多次额度调整之后任意一个用户的动支概率的动支概率预测模型。
[0094]
在一个实施例中，处理器执行计算机程序时还实现以下步骤：对样本用户的用户特征数据进行数据清洗处理、数据融合处理和数据衍生处理之中的至少一种处理。
[0095]
在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据预测的目标用户的动支概率生成评价报告，将评价报告发送至终端。
[0096]
在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取预设概率阈值，在预测的目标用户的动支概率小于预设概率阈值时，生成控制指令以停止对目标用户的下一次额度调整操作。
[0097]
在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取目标用户的用户特征数据；获取目标用户的当前额度调整次数；根据目标用户的用户特征数据、当前额度调整次数以及预先建立的动支概率预测模型，预测经过当前额度调整次数的调整之后目标用户的动支概率；其中，动支概率预测模型是以样本用户的用户特征数据和生存时间作为模型特征而构建的用于预测任意一次或多次额度调整之后用户的动支概率的模型，生存时间与样本用户的额度调整次数相关。
[0098]
在一个实施例中，计算机程序被处理器执行时还实现构建动支概率预测模型的步骤，具体地，获取样本用户的用户特征数据；分析样本用户的生存时间；确定样本用户对应的目标变量；根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型。
[0099]
在一个实施例中，计算机程序被处理器执行实现分析样本用户的生存时间时，具体实现以下步骤：获取样本用户在各次额度调整之后的动支行为信息，根据动支行为信息分析样本用户是否存在未动支行为；若是，则将首次出现未动支行为时所对应的额度调整
次数作为样本用户的生存时间；若否，则将样本采集时的额度调整次数确定为样本用户的生存时间。
[0100]
在一个实施例中，计算机程序被处理器执行实现根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，构建动支概率预测模型时，具体实现以下步骤：根据样本用户的用户特征数据、样本用户的生存时间以及样本用户对应的目标变量，基于机器学习算法和生存分析方法，得到任意一个样本用户在任意一次额度调整之后的危险函数；根据各个危险函数，得到用于计算任意一次或多次额度调整之后任意一个用户的动支概率的动支概率预测模型。
[0101]
在一个实施例中，计算机程序被处理器执行时还实现以下步骤：对样本用户的用户特征数据进行数据清洗处理、数据融合处理和数据衍生处理之中的至少一种处理。
[0102]
在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据预测的目标用户的动支概率生成评价报告，将评价报告发送至终端。
[0103]
在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取预设概率阈值，在预测的目标用户的动支概率小于预设概率阈值时，生成控制指令以停止对目标用户的下一次额度调整操作。
[0104]
本领域普通技术人员可以理解实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0105]
以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0106]
以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于医疗程序的计算机辅助识别的系统和方法与流程

用户动支概率预测方法、装置、计算机设备和存储介质与流程

相关文献

最热文献