贷款余额的关键影响因子确定方法、装置、设备及介质与流程

2022-04-06 14:54:43 来源：中国专利 TAG：

1.本发明涉及影响因子确定
技术领域：
：，尤其涉及一种贷款余额的关键影响因子确定方法、装置、电子设备及计算机可读存储介质。
背景技术：
：：2.贷款余额指至某一节点日期为止，借款人尚未归还放款人的贷款总额，也指到会计期末尚未偿还的贷款，尚未偿还的贷款余额等于贷款总额扣除已偿还的银行贷款。目前，广大小微企业主和个体户频繁性的资金需求急剧增加，市面上的贷款机构也越来越多。而贷款机构想要健康的持续发展，主要依靠新增销售额和贷款余额。影响贷款余额的因素即贷款余额的影响因子有很多，如何在这些影响因子中的找到关键影响因子，对于提高贷款余额，增加贷款机构的盈利至关重要。而现有技术中缺少快速准确确定贷款余额的关键影响因子的方案。技术实现要素：3.本发明的目的在于提供一种贷款余额的关键影响因子确定方法、装置、电子设备及计算机可读存储介质，以解决现有技术中无法快速准确地确定贷款余额的关键影响因子的技术问题。4.本发明的技术方案如下，提供一种贷款余额的关键影响因子确定方法，包括如下步骤：5.获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，其中，所述贷款结清明细数据包括贷款余额的评价指标和所述贷款余额的多个影响因子；6.判断所述贷款结清明细数据是否导入完毕，若导入完毕，则根据所述贷款余额的评价指标和贷款余额的多个影响因子，计算每个影响因子下的所述评价指标的量化数据；7.根据所述影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子。8.可选地，所述获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，具体包括：9.在数据仓库工具中创建与所述贷款结清明细数据相适应的数据仓库工具表，连接上游数据库地址；10.获取所述上游数据库中所述贷款结清明细数据的对应库名，并确定所述数据仓库工具表对应的分布式文件系统目录；11.根据所述上游数据库中所述贷款结清明细数据的对应库名，将所述贷款结清明细数据从所述上游数据库中导入至所述分布式文件系统目录对应的所述数据仓库工具表中。12.可选地，所述判断所述贷款结清明细数据是否导入完毕，具体包括：13.遍历上游数据库中所述贷款结清明细数据的对应库名，并将所述贷款结清明细数据从所述上游数据库中导入至分布式文件系统目录对应的数据仓库工具表中后，生成第一成功标识；14.对所述第一成功标识进行检测，若检测到所述第一成功标识，则判定所述贷款结清明细数据导入完毕。15.可选地，所述计算每个影响因子下的评价指标的量化数据之后，还包括：16.生成第二成功标识；相应地，所述根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子之前，还包括，对所述第二成功标识进行检测。17.可选地，根据所述影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子，具体包括：18.若所述影响因子为定性指标，则根据所述影响因子下的不同指标及其对应的评价指标的量化数据，确定所述影响因子是否为贷款余额的关键影响因子；19.若所述影响因子为量化指标，则获取所述影响因子对应的数值与评价指标的量化数据的线性回归直线，根据所述线性回归直线确定所述影响因子是否为贷款余额的关键影响因子。20.可选地，所述获取所述影响因子与评价指标的量化数据的线性回归直线，具体包括：21.预设所述线性回归直线的表达函数为f(x)＝a1*x a0，其中，x为影响因子的数值，f(x)为对应的评价指标的量化数据，a1为线性回归直线的斜率，a0为线性回归直线的截距；22.计算所述评价指标的量化数据中每个数据点到所述线性回归直线的最小距离；23.对所述最小距离进行求和，得到求和损失，根据所述求和损失计算平均损失；24.根据所述平均损失和所述线性回归直线计算表达函数中斜率和截距，得到所述线性回归直线的表达函数。25.可选地，根据所述线性回归直线确定所述影响因子是否为贷款余额的关键影响因子，具体包括：26.若所述线性回归直线的斜率的绝对值大于预设阈值，则对应的所述影响因子为贷款余额的关键影响因子；27.若所述线性回归直线的斜率的绝对值小于或等于预设阈值，则对应的所述影响因子为贷款余额的非关键影响因子。28.本发明的另一技术方案如下，一种贷款余额的关键影响因子确定装置，包括数据导入模块、指标计算模块及关键影响因子确定模块；29.所述数据导入模块，用于获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，其中，所述贷款结清明细数据包括贷款余额的评价指标和所述贷款余额的多个影响因子；30.所述指标计算模块，用于判断所述贷款结清明细数据是否导入完毕，若导入完毕，则根据所述贷款余额的评价指标和贷款余额的多个影响因子，计算每个影响因子下的评价指标的量化数据；31.所述关键影响因子确定模块，用于根据所述影响因子下的所述评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子。32.本发明的另一技术方案如下，一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一技术方案所述的贷款余额的关键影响因子确定方法。33.本发明的另一技术方案如下，一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一技术方案所述的贷款余额的关键影响因子确定方法。34.本发明的有益效果在于：本发明提供的贷款余额的关键影响因子确定方法、装置、电子设备及计算机可读存储介质，获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，其中，贷款结清明细数据包括贷款余额的评价指标和贷款余额的多个影响因子；判断所述贷款结清明细数据是否导入完毕，若导入完毕，则根据所述贷款余额的评价指标和贷款余额的多个影响因子，计算每个影响因子下的评价指标的量化数据；根据影响因子下的评价指标的量化数据确定贷款结清明细数据中的贷款余额关键影响因子；其中，根据影响因子下的评价指标的量化数据与对应影响因子的关系，可以确定对应影响因子是否为关键影响因子，可以通过上述方式，可以快速、准确地确定贷款余额的关键影响因子。附图说明35.图1为本发明第一实施例的贷款余额的关键影响因子确定方法的流程示意图；36.图2为本发明第二实施例的贷款余额的关键影响因子确定装置的结构示意图；37.图3为本发明第三实施例的电子设备的结构示意图；38.图4为本发明第四实施例的存储介质的结构示意图。具体实施方式39.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。40.在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。41.图1是本发明第一实施例的贷款余额的关键影响因子确定方法的流程示意图。需注意的是，若有实质上相同的结果，本发明的方法并不以图1所示的流程顺序为限。如图1所示，该贷款余额的关键影响因子确定方法主要包括以下步骤s101～s103：42.s101，获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，其中，所述贷款结清明细数据包括贷款余额的评价指标和贷款余额的多个影响因子；43.其中，贷款余额的评价指标可以为账龄，贷款余额的影响因子包括日期、产品、分期数、费率、本金、是否是法人、是否提前结清；贷款结清明细数据可以用表格的形式存放于上游数据库，贷款结清明细数据表，如表1所示，44.表1贷款结清明细数据表[0045][0046][0047]上述表1中包括流水号、产品、起息日期、结清日期、本金、账龄、费率、是否是法人、分期(分期数)及是否提前结清等信息，其中，产品、起息日期、结清日期、本金、费率、是否是法人、分期(分期数)及是否提前结清等均可以对账龄或者平均账龄产生影响；其中，平均账龄大小与贷款余额成正相关性，平均账龄越长表示用户贷款留存的时间越长，贷款余额更多；反之，用户贷款留存的时间越短，贷款余额越少。[0048]因此，产品、起息日期、结清日期、本金、费率、是否是法人、分期及是否提前结清为贷款余额的影响因子，为了快速确定贷款余额的关键影响因子，可以以账龄作为确定评价指标，以平均账龄作为评价指标的量化数据；为了确定关键影响因子，需要在不同影响因子下，确定该影响因子下的平均账龄，即确定评价指标的量化数据。[0049]获取贷款结清明细数据的工具为sqoop工具，该sqoop工具从上游数据库中获取贷款结清明细数据，上游数据库可以为mysql或oracle等关系型数据库，sqoop工具是将hadoop和关系型数据库中的数据相互转移的开源工具，该sqoop工具可以将一个关系型数据库中的数据导进到hadoop的hdfs(分布式文件系统)中，也可以将hdfs的数据导进到关系型数据库中。[0050]hadoop是一个分布式系统基础架构，用户可以在不了解分布式底层细节的情况下，开发分布式程序；充分利用集群的威力进行高速运算和存储。hadoop实现了一个分布式文件系统，其中一个组件是hdfs。hdfs有高容错性的特点，并且设计用来部署在低廉的硬件上；而且它提供高吞吐量来访问应用程序的数据，适合那些有着超大数据集的应用程序。[0051]在一个可选的实施方式中，获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，具体包括：[0052]s201，在数据仓库工具中创建与贷款结清明细数据相适应的数据仓库工具表，连接上游数据库地址；[0053]s202，获取上游数据库中贷款结清明细数据的对应库名，并确定数据仓库工具表对应的分布式文件系统目录；[0054]s203，根据所述上游数据库中贷款结清明细数据的对应的、库名，将贷款结清明细数据从所述上游数据库中导入至所述分布式文件系统目录对应的数据仓库工具表中。[0055]其中，sqoop工具获取贷款结清明细数据，具体为，在hive(基于hadoop的一个数据仓库工具，适用于离线大批量的数据处理)中创建和贷款结清明细数据表的表结构对应的hive表，创建hive表后使用shell脚本抽取贷款结清明细数据表，抽取贷款结清明细数据表的流程包括：导入spoop工具，连接上游数据库(mysql或者oracle)的地址，登录连接数据库的账号，确定上游数据库中贷款结清明细数据表对应的库名，确定hive表对应的hdfs目录，将贷款结清明细数据导入至hive，设置并行执行数，设定分隔符，设置hive库名和hive表名，设定写入形式(例如覆盖写入)。其中，通过设置并行执行数，可以提高执行速度，上述设定的分隔符与hive表分隔符一致。该shell脚本中抽取贷款结清明细数据表的部分代码如下，[0056]spoop路径/bin/sqoopimport\[0057]‑‑connectjdbc：oracle：thin：@192.168.56.111：1521\[0058]‑‑usernameroot\[0059]‑‑password123456\[0060]‑‑tableoracle中表1对应的库名.表1\[0061]‑‑target-dirhive表对应的hdfs目录\[0062]‑‑hive-import\[0063]‑‑m8\[0064]‑‑fields-terminated-by"\t"\[0065]‑‑hive-tablehive库名.hive表名\[0066]‑‑hive-overwrite[0067]在一个可选的实施方式中，判断所述贷款结清明细数据是否导入完毕，具体包括：[0068]遍历上游数据库中贷款结清明细数据的对应的库名，并将贷款结清明细数据从所述上游数据库中导入至分布式文件系统目录对应的数据仓库工具表中后，生成第一成功标识；[0069]对所述第一成功标识进行检测，若检测到所述第一成功标识，则判定所述贷款结清明细数据导入完毕。[0070]其中，利用sqoop工具抽取贷款结清明细数据后，还需要判断抽取是否完成，判断贷款结清明细数据抽取是否完成的部分代码包括，if[$？-ne0]；(判断上述抽取是否成功)then；echo"表1导入hive数据失败"；exit1(显示程序报错，程序停止)；fi；echo"表1导入hive数据成功"。[0071]贷款结清明细数据抽取完成后还包括生产抽取成功的标识flag1(第一成功标识)，具体实施时，首先需要创建flag1成功标识目录，例如，hadoopfs-mkdir-p目录/hive表名/日期/，然后创建flag1成功标识，例如，hadoopdfs-touchz目录/hive表名/日期/，所述日期可以具体某一天，例如，2020年10月28日。[0072]其中，在计算某一影响因子条件下的评价指标的量化数据前，需要检测flag1成功标识是否存在，若存在，则说明所有待导入的贷款结清明细数据均已导入完毕，然后执行计算计算影响因子下的评价指标的量化数据操作，若不存在flag1成功标识，则不计算计算影响因子下的评价指标的量化数据，通过设置flag1成功标识以确定计算影响因子下的评价指标的量化数据的时机。[0073]检测flag1成功标识是否生成的具体流程为，[0074]hadoopfs-test-eflag1成功标识，[0075]while[$？-ne0]do[0076]echoflag1成功标识'notexist'[0077]sleep10[0078]hadoopfs-test-eflag1成功标识[0079]done[0080]echoflag1成功标识'exist'。[0081]其中，sleep10的含义为，当检测到不存在flag1成功标识，则等待10秒，然后继续检测是否存在flag1成功标识，等待时间可以根据实际情况确定。[0082]需要说明的是，在执行抽取贷款结清明细数据前，可以将抽取贷款结清明细数据的shell脚本压缩成压缩包(可以为zip格式的)，将该压缩包上传至azkaban任务调度工具，通过在azkaban任务调度工具对应的页面自定义设置开始执行的时间(例如每日凌晨1点30分)，当到预设时间时，执行压缩包对应的shell脚本，开始抽取贷款结清明细数据的步骤流程。[0083]s102，判断所述贷款结清明细数据是否导入完毕，若导入完毕，则根据所述贷款余额的评价指标和贷款余额的多个影响因子，计算每个影响因子下的评价指标的量化数据；[0084]具体实施时，以结清日期为当前月时，以产品、起息日期、结清日期、本金、费率、是否是法人、分期或是是否提前结清为影响因子，在某一影响因子条件(其他影响因子相同)下，对评价指标的量化数据进行计算，计算评价指标的量化数据的过程为，在该影响因子条件下，对评价指标进行求和统计得到评价指标的总数，然后对该影响因子条件下的贷款件数进行统计，得到贷款总件数，最后以评价指标的总数除以贷款总件数，得到评价指标的量化数据。[0085]在一个可选的实施方式中，所述计算每个影响因子下的评价指标的量化数据之后，还包括：生成第二成功标识；相应地，所述根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子，包括：对所述第二成功标识进行检测；若检测到所述第二成功标识，则根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子。[0086]其中，可以对是否完成评价指标的量化数据计算进行检测，检测程序具体为，if[$？-ne0]；then；echo"计算报错"；exit1(显示程序报错，程序停止)；fi；echo"计算完成"。上述检测程序中，对是否完成评价指标的量化数据计算进行了检测，若计算报错，则检测程序显示程序报错，检测程序停止运行。若检测到评价指标的量化数据完成，则生成flag2成功标识(即第二成功标识)。生成flag2成功标识的部分程序流程为：hadoopfs-mkdir-p目录/hive结果表表名/日期/；hadoopdfs-touchz目录/hive结果表表名/日期/success，其中日期可以具体某一天，例如2020年10月28日。[0087]将评价指标的量化数据计算完成的结果放入表格，可以对表格中的评价指标的量化数据进行降序排列，当评价指标的量化数据相同时，则排名次序并列。具体实施时，若以产品类型为影响因子，以评价指标的量化数据为平均账龄，则通过计算平均账龄，得到平均账龄表，如表2所示。[0088]表2平均账龄表[0089][0090]若以是否是法人为影响因子，以评价指标的量化数据为平均账龄，计算平均账龄，得到平均账龄表，如表3所示。[0091]表3平均账龄表[0092][0093]若以费率为影响因子，以评价指标的量化数据为平均账龄，则通过计算平均账龄，得到平均账龄表，如表4所示。[0094]表4平均账龄表[0095][0096][0097]其中，在根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子前，可将计算某一影响因子条件下的评价指标的量化数据的执行shell脚本压缩成压缩包(例如zip格式的压缩包)，将该压缩包上传至azkaban(一种批量处理调度器)任务调度工具，通过在azkaban任务调度工具对应的页面自定义设置开始执行的时间(例如每日凌晨1点50分)，当到预设时间时，执行对压缩包对应的shell脚本，开始计算评价指标的量化数据的步骤流程。[0098]其中，在检测到flag2成功标识(第二成功标识)后，即在计算完评价指标的量化数据后，可将计算后的结果数据同步到一个数据库中，具体可以同步至hbase数据库(分布式的、面向列的开源数据库)中，通过接口读取对应的hbase数据库中数据，通过vue(一套用于构建用户界面的渐进式javascript框架)访问该接口可以获取评价指标的量化数据数据，最终可以将各个结果进行展示。该接口可以通过java实现，该接口为后端接口。[0099]其中，检测flag2成功标识是否生成，具体程序流程为，[0100]hadoopfs-test-eflag2成功标识[0101]while[$？-ne0][0102]do[0103]echoflag2成功标识'notexist'[0104]sleep10[0105]hadoopfs-test-eflag2成功标识[0106]done[0107]echoflag2成功标识'exist'。[0108]其中，sleep10的含义为，当检测到不存在flag2成功标识，则等待10秒，然后继续检测是否存在flag2成功标识，具体等待时间可以根据实际情况确定。[0109]由于计算评价指标的量化数据的操作是在hive中进行的，若将计算结果存储，需要将其导入至数据库中，具体实施时，读取hive结果表数据(评价指标的量化数据统计表数据)的存储文件导入到hbase中的hfile_path文件。数据导入到hbase中的hfile_path文件的程序流程为，[0110]base‑‑configconfig_dirorg.apache.hadoop.hbase.mapreduce.importtsv[0111]‑‑dimporttsv.bulk.output＝hdfs：///hfile_path\[0112]‑‑dimporttsv.columns＝"hbase_row_key，[0113]column_family：column_name.."[0114]‑‑hbase_namespace：table_name\[0115]‑‑hdfs：//hive_table_dir。[0116]需要说明的是，config_dir是hbase的配置目录，hbase自带importtsv工具，dimporttsv.bulk.output＝hdfs：///hfile_path，即指定hfile_path文件路径；dimporttsv.columns＝"hbase_row_key，column_family：column_name，即，指定hbase表的row_key、列簇、列；hbase_namespace：table_name，即，指定hbase的空间名和hbase的表名；hdfs：//hive_table_dir，即，使importtsv去读取hive_table_dir中的文件放到hfile_path中。[0117]其中，上述导入的数据文件可以命名为hfile文件，将hfile文件导入至hbase表中的具体程序流程为，[0118]hbase‑‑configconfig_dir[0119]org.apache.hadoop.hbase.mapreduce.loadincrementalhfiles\[0120]‑‑hdfs：///hfile_path\[0121]‑‑hbase_namespace：table_name。[0122]需要说明的是，在将计算结果导入至数据库之前，可以将计算结果导入至数据库的shell脚本压缩成压缩包(可以为zip格式的)，将该压缩包上传至azkaban任务调度工具，通过在azkaban任务调度工具对应的页面自定义设置开始执行的时间(例如每日凌晨2点30分)，当到预设时间时，执行压缩包对应的shell脚本，开始将计算结果导入至数据库的步骤流程。[0123]其中，通过接口并使用get()方法读取对应的hbase数据库中数据，通过vue访问该接口可以获取评价指标的量化数据统计表中数据，最终可以将各个结果进行展示；结果数据展示顺序以评价指标的量化数据从大到小进行降序排列。[0124]s103，根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子。[0125]其中，所述影响因子包括定性指标和量化指标，所述定性指标包括产品、是否是法人以及是否提前结清等，所述量化指标包括本金、费率和分期数等。[0126]一个可选的实施方式中，步骤s103具体包括如下步骤：[0127]若所述影响因子为定性指标，则根据该影响因子下的不同指标及其对应的评价指标的量化数据，确定该影响因子是否为贷款余额的关键影响因子；[0128]若所述影响因子为量化指标，则获取该影响因子对应的数值与评价指标的量化数据的线性回归直线，根据所述线性回归直线确定该影响因子是否为贷款余额的关键影响因子。[0129]其中，若所述影响因子为定性指标，例如，影响因子为是否是法人，则在其他影响影子相同的清理下，比较是法人情况下的评价指标的量化数据以及不是法人情况下的评价指标的量化数据，若两者的差值超过差值预设阈值，则判定该影响因子为关键影响因子。[0130]在一个可选的实施方式中，所述获取该影响因子与评价指标的量化数据的线性回归直线，具体包括：[0131]s301，预设所述线性回归直线的表达函数为f(x)＝a1*x a0，其中，x为影响因子的数值，f(x)为影响因子的数值x对应的评价指标的量化数据，a1为线性回归直线的斜率，a0为线性回归直线的截距；[0132]s302，计算所述评价指标的量化数据中每个数据点到所述线性回归直线的最小距离；[0133]s303，对所述最小距离进行求和，得到求和损失，根据所述求和损失计算平均损失；[0134]s304，根据所述平均损失和所述线性回归直线计算表达函数中斜率a1和截距a0，得到所述线性回归直线的表达函数。[0135]其中，由于本金、费率和分期数等影响因子都会对应大量不同数值，而各数值会对应不同的评价指标的量化数据，在其他影响因子相同的情况下，获取量化指标影响因子对应的评价指标的量化数据，并可以根据所述影响因子对应的评价指标的量化数据获取线性回归直线。[0136]在一个可选的实施方式中，根据所述线性回归直线确定该影响因子是否为贷款余额的关键影响因子，具体包括：[0137]若所述线性回归直线的斜率的绝对值大于预设阈值，则对应的影响因子为贷款余额的关键影响因子；[0138]若所述线性回归直线的斜率的绝对值小于或等于预设阈值，则对应的影响因子为贷款余额的非关键影响因子。[0139]其中，若线性回归直线的斜率的绝对值大于预设阈值，则说明对应的影响因子对评价指标的量化数据的影响较大；由于线性回归直线的斜率可以为负数或者正数，因此，将其绝对值与预设阈值相比较，当斜率为负数时，此时，评价指标的量化数据与对应的影响因子呈负相关性，即影响因子的数值越大评价指标的量化数据越小；当斜率为正数时，此时，评价指标的量化数据与对应的影响因子呈正相关性，即影响因子的数值越大评价指标的量化数据越大；上述预设阈值可以取大于1.1的数值。当关键影响因子对应的斜率为负数时，用户可以通过将关键影响因子数值的调小，以增大贷款余额；当关键影响因子对应的斜率为正数时，用户可以通过将关键影响因子数值的调大，以增大贷款余额。[0140]本发明实施例提供的贷款余额的关键影响因子确定方法，获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，其中，贷款结清明细数据包括贷款余额的评价指标和贷款余额的多个影响因子；判断所述贷款结清明细数据是否导入完毕，若导入完毕，则根据所述贷款余额的评价指标和贷款余额的多个影响因子，计算每个影响因子下的评价指标的量化数据；根据影响因子下的评价指标的量化数据确定贷款结清明细数据中的贷款余额关键影响因子；其中，根据影响因子下的评价指标的量化数据与对应影响因子的关系，可以确定对应影响因子是否为关键影响因子，可以通过上述方式，可以快速、准确地确定贷款余额的关键影响因子。用于可以调整关键影响因子，以提高贷款余额，增加贷款机构的盈利。[0141]本实施例的贷款余额的关键影响因子确定方法，可以基于人工智能进行构建，基于人工智能技术对相关的数据进行获取和处理，实现无人值守的人工智能的关键影响因子确定。其中，人工智能(artificialintelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。[0142]人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。[0143]图2是本发明第二实施例的贷款余额的关键影响因子确定装置的结构示意图。如图2所示，该贷款余额的关键影响因子确定装置20包括数据导入模块21、指标计算模块22及关键影响因子确定模块23；其中，数据导入模块21，用于获取贷款结清明细数据，将所述贷款结清明细数据导入至数据仓库工具，其中，所述贷款结清明细数据包括贷款余额的评价指标和贷款余额的多个影响因子；指标计算模块22，用于判断所述贷款结清明细数据是否导入完毕，若导入完毕，则根据所述贷款余额的评价指标和贷款余额的多个影响因子，计算每个影响因子下的评价指标的量化数据；关键影响因子确定模块23，用于根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子。[0144]进一步地，该数据导入模块21，还用于在数据仓库工具中创建与贷款结清明细数据相适应的数据仓库工具表，连接上游数据库地址；获取所述上游数据库中贷款结清明细数据的对应库名，并确定数据仓库工具表对应的分布式文件系统目录；根据所述上游数据库中贷款结清明细数据的对应库名，将所述贷款结清明细数据从所述上游数据库中导入至所述分布式文件系统目录对应的数据仓库工具表中。[0145]进一步地，该指标计算模块22，还用于遍历上游数据库中贷款结清明细数据的对应库名，并将贷款结清明细数据从所述上游数据库中导入至分布式文件系统目录对应的数据仓库工具表中后，生成第一成功标识；对所述第一成功标识进行检测，若检测到所述第一成功标识，则判定所述贷款结清明细数据导入完毕。[0146]进一步地，该关键影响因子确定模块23，还用于在计算完每个影响因子下的评价指标的量化数据之后，生成第二成功标识，在根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子之前，对所述第二成功标识进行检测，若检测到所述第二成功标识，则根据影响因子下的评价指标的量化数据确定所述贷款结清明细数据中的贷款余额关键影响因子。[0147]进一步地，该关键影响因子确定模块23，还用于在所述影响因子为定性指标时，根据该影响因子下的不同指标及其对应的评价指标的量化数据，确定该影响因子是否为贷款余额的关键影响因子；在所述影响因子为量化指标时，获取该影响因子对应的数值与评价指标的量化数据的线性回归直线，根据所述线性回归直线确定该影响因子是否为贷款余额的关键影响因子。[0148]进一步地，该关键影响因子确定模块23，还用于预设所述线性回归直线的表达函数为f(x)＝a1*x a0，其中，x为影响因子的数值，f(x)为对应的评价指标的量化数据，a1为线性回归直线的斜率，a0为线性回归直线的截距；计算所述评价指标的量化数据中每个数据点到所述线性回归直线的最小距离；对所述最小距离进行求和，得到求和损失，根据所述求和损失计算平均损失；根据所述平均损失和所述线性回归直线计算表达函数中斜率和截距，得到所述线性回归直线的表达函数。[0149]进一步地，该关键影响因子确定模块23，还用于在所述线性回归直线的斜率的绝对值大于预设阈值时，确定对应的影响因子为贷款余额的关键影响因子；在所述线性回归直线的斜率的绝对值小于或等于预设阈值时，确定对应的影响因子为贷款余额的非关键影响因子。[0150]图3是本发明第三实施例的电子设备的结构示意图。如图3所示，该电子设备30包括处理器31及和处理器31耦接的存储器32。[0151]存储器32存储有用于实现上述任一实施例的所述贷款余额的关键影响因子确定方法的程序指令。[0152]处理器31用于执行存储器32存储的程序指令以进行代码测试。[0153]其中，处理器31还可以称为cpu(centralprocessingunit，中央处理单元)。处理器31可能是一种集成电路芯片，具有信号的处理能力。处理器31还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。[0154]参阅图4，图4为本发明第四实施例的存储介质的结构示意图。本发明实施例的存储介质存储有能够实现上述所有方法的程序指令41，所述存储介质可以是非易失性，也可以是易失性。其中，该程序指令41可以以软件产品的形式存储在上述存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质，或者是计算机、服务器、手机、平板等终端设备。[0155]在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。[0156]另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。以上仅为本发明的实施方式，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的
技术领域：
：，均同理包括在本发明的专利保护范围。[0157]以上所述的仅是本发明的实施方式，在此应当指出，对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以做出改进，但这些均属于本发明的保护范围。当前第1页12当前第1页12

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：数据分析项目的管理方法、装置和项目管理系统与流程

贷款余额的关键影响因子确定方法、装置、设备及介质与流程

相关文献

最热文献