一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

收入预估方法、装置、存储介质及计算机设备与流程

2022-03-02 00:03:23 来源:中国专利 TAG:


1.本发明涉及信息技术领域,尤其是涉及一种收入预估方法、装置、存储介质及计算机设备。


背景技术:

2.随着社会的发展,居民收入不再趋于稳定,由于居民收入渠道增多,预期收入也会不断变化,居民个人和家庭在安排当前与未来消费开支计划时,不仅以现期收入为依据,也需要预计未来可能取得的收入,因此,如何准确地预估居民的未来收入成为亟待解决的问题。
3.目前,通常采用统一的方式对居民的收入进行预估。然而,由于不同人有不同的收入成分,不同收入成分的波动率也不相同,即不同人收入特征不相同,由此会导致这种预估方式在部分人群中表现较好,但在另一部分收入特征不同的人群中表现会不理想,即这种预估方式并不适用于所有人群,会导致对部分人群的收入预估精度偏低。


技术实现要素:

4.本发明提供了一种收入预估方法、装置、存储介质及计算机设备,主要在于能够对不同人群的收入进行准确预估,提高了收入预估精度。
5.根据本发明的第一个方面,提供一种收入预估方法,包括:
6.获取待预估人员的历史收入数据;
7.基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;
8.根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;
9.基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
10.根据本发明的第二个方面,提供一种收入预估装置,包括:
11.获取单元,用于获取待预估人员的历史收入数据;
12.确定单元,用于基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;
13.划分单元,用于根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;
14.预估单元,用于基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
15.根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
16.获取待预估人员的历史收入数据;
17.基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;
18.根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;
19.基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
20.根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
21.获取待预估人员的历史收入数据;
22.基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;
23.根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;
24.基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
25.根据本发明提供的一种收入预估方法、装置、存储介质及计算机设备,与目前采用统一的方式对居民的收入进行预估的方式相比,本发明通过获取待预估人员的历史收入数据;并基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;与此同时,根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;最终基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果,由此通过将待预估人员进行人群划分,确定所述待预估人员所属的目标人群,并利用所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,能够避免不同收入特征的人群都采用统一收入预估方式,导致此种收入预估方式在部分人群中表现较好,而在另一部分人群中表现不理想,从而提高了收入预估精度。
附图说明
26.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
27.图1示出了本发明实施例提供的一种收入预估方法流程图;
28.图2示出了本发明实施例提供的另一种收入预估方法流程图;
29.图3示出了本发明实施例提供的一种收入预估装置的结构示意图;
30.图4示出了本发明实施例提供的另一种收入预估装置的结构示意图;
31.图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
32.下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
33.目前,采用统一方式对居民收入进行预估的方式,会导致这种预估方式在部分人群中表现较好,但在另一部分收入特征不同的人群中表现会不理想,即这种预估方式并不适用于所有人群,会导致对部分人群的收入预估精度偏低。
34.为了解决上述问题,本发明实施例提供了一种收入预估方法,如图1所示,所述方
法包括:
35.101、获取待预估人员的历史收入数据。
36.其中,历史收入数据包括待预估人员历史每天、每月、每季度等的历史收入数据。
37.对于本发明实施例,为了克服现有技术中对不同人群的收入预估精度较低的缺陷,本发明实施例通过将待预估人员进行人群划分,确定所述待预估人员所属的目标人群,并利用所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,能够避免不同收入特征的人群都采用统一收入预估方式,导致此种收入预估方式在部分人群中表现较好,而在另一部分人群中表现不理想,从而提高了收入预估精度。本发明实施例主要应用于对收入进行预估的场景,本发明实施例的执行主体为能够对收入进行预估的装置或者设备,具体可以设置在客户端或者服务器一侧。
38.具体地,需要基于待预估人员的历史收入数据,对待预估人员的收入进行预估,收入数据库中存储有不同人群对应的每天、每月等的历史收入数据,当需要获取待预估人员的历史收入数据时,只需在所述历史收入数据库中输入所述待预估人员的姓名、身份证号等信息即可查询到所述待预估人员的历史收入数据,将所述历史收入数据拷贝下来,并对所述历史收入数据进行特征分析,得到收入波动特征系数,并基于所述收入波动特征系数确定所述待预估人员对应的收入预估算法,最终基于所述预估算法,对所述待预估人员的收入进行预估,能够避免不同收入特征的人群都采用统一收入预估方式,导致此种收入预估方式在部分人群中表现较好,而在另一部分人群中表现不理想,从而能够对不同人群的收入进行准确预估,提高了收入预估精度。
39.102、基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数。
40.对于本发明实施例,当获取待预估人员的历史收入数据后,需要对所述历史收入数据进行特征分析,分析所述待预估人员历史收入的波动情况,得到特征分析结果,即所述待预估人员对应的收入波动特征系数,根据所述收入波动特征系数,可以对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群,并根据所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,从而能够针对不同人群采用不同的预估方法,提高了收入预估精度。
41.103、根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群。
42.其中,目标人群的收入特征与所述待预估人员的收入特征相同或相近。
43.对于本发明实施例,不同范围收入波动特征系数对应不同的人群,当需要确定所述待预估人员属于哪类目标人群时,需要根据所述收入波动特征系数的大小,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群,并根据所述目标人群对应的收入预估算法,对所述待预估人员的收入进行预估,避免采用统一预估方式在部分人群中表现较好,但在另一部分收入特征不同的人群中表现会不理想,从而能够对不同人群的收入进行准确预估。
44.104、基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
45.其中,不同收入特征人群对应不同的收入预估算法,对于本发明实施例,当确定所述待预估人员所属的目标人群后,通过预设收入预估算法记录表查询所述目标人群对应的
收入预估算法,并基于所述历史收入数据,利用查询到的收入预估算法对所述待预估人员的收入进行预估,得到所述待预估人员对应的收入预估值,例如根据收入预估算法可以对所述待预估人员的将来月收入进行预估。
46.根据本发明提供的一种收入预估方法,与目前采用统一的方式对居民的收入进行预估的方式相比,本发明通过获取待预估人员的历史收入数据;并基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;与此同时,根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;最终基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果,由此通过将待预估人员进行人群划分,确定所述待预估人员所属的目标人群,并利用所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,能够避免不同收入特征的人群都采用统一收入预估方式,导致此种收入预估方式在部分人群中表现较好,而在另一部分人群中表现不理想,从而提高了收入预估精度。
47.进一步的,为了更好的说明上述对收入进行预估的过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种收入预估方法,如图2所示,所述方法包括:
48.201、获取待预估人员的历史收入数据。
49.对于本发明实施例,基于所述待预估人员的身份信息,在所述收入数据库中查询所述待预估人员的每天和每月等的历史收入数据,并基于所述历史收入数据,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群,最终根据所述目标人群对应的收入预估算法,对所述待预估人员的收入进行预估。
50.202、对所述待预估人员的所述历史收入数据进行聚类,得到所述历史收入数据对应的聚类结果,并基于所述聚类结果,识别并排除所述历史收入数据中的异常收入数据。
51.其中,异常收入数据是指待预估人员的历史收入中某月因为奖金等收入,导致该月的收入突然大幅增多,或者因为请假等原因,导致某月的收入突然大幅减少。
52.对于本发明实施例,为了准确计算待预估人员对应的收入波动特征系数,在获取历史收入数据之后,需要对所述历史收入数据进行聚类,具体聚类方法可以采用k-means算法,即选取k个团簇分别对应的初始质心,然后计算所述历史收入数据分别与k个初始质心的距离,并将所述历史收入数据分配到距离最近的团簇中,之后针对每个团簇,重新计算每个团簇的质心,并重新将所述历史收入数据划分到不同的团簇中,以此不断地对历史收入数据进行划分,直到质心的位置不发生变化,此时识别不在团簇中的历史收入数据,该历史收入数据即为异常收入数据,并将所述异常收入数据在所述历史收入数据中排除,最终基于排除后的历史收入数据,计算待预估人员对应的收入波动特征系数,例如若要对待预估人员的月收入进行预估,则通过聚类算法可以找到异常月份的收入数据,并将所述异常月份的收入数据在所述历史收入数据中排除,得到剩余月份对应的历史收入数据,最终基于剩余月份对应的历史收入数据,计算待预估人员对应的收入波动特征系数。
53.203、确定排除后的历史收入数据对应的标准差和中位数,并将所述标准差与所述中位数相除,得到所述待预估人员对应的收入波动特征系数。
54.对于本发明实施例,在识别并排除所述历史收入数据中的异常收入数据后,为了计算待预估人员对应的收入波动特征系数,需要先计算排除后的历史收入数据对应的标准差和中位数,具体计算标准差公式如下:
[0055][0056]
其中,s表示排除后的历史收入数据对应的标准差,i表示月份,n表示月份总数,xi表示第i个月的历史收入,表示平均月收入,基于上述公式,能够计算排除后的历史收入数据对应的标准差。
[0057]
进一步地,在计算历史收入数据对应的标准差的同时,还需要计算排除后的历史收入数据对应的中位数,首先将所述历史收入数据按照从小到大的顺序进行排列,之后利用如下公式计算中位数:
[0058]m0.5
=x
(n 1)/2
ꢀꢀꢀ
(1)
[0059][0060]
其中,m
0.5
表示排除后的历史收入数据对应的中位数,n表示月份总数,x表示历史收入,当n是奇数时采用公式(1)计算历史收入数据对应的中位数,当n为偶数时,采用公式(2)计算历史收入数据对应的中位数。
[0061]
进一步地,在确定排除后的历史收入数据对应的标准差和中位数之后,将所述标准差除以所述中位数,得到待预估人员对应的收入波动特征系数,具体计算公式如下:
[0062][0063]
其中,cv表示收入波动特征系数,由此能够计算得到待预估人员对应的收入波动特征系数,并基于所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群,最终基于所述目标人群对应的收入预估算法对对所述待预估人员的收入进行预估。
[0064]
204、根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群。
[0065]
对于本发明实施例,为了确定所述待预估人员所属的目标人群,步骤204具体包括:若所述待预估人员对应的所述收入波动特征系数小于或等于第一预设阈值,则确定所述待预估人员属于收入无波动人群;若所述待预估人员对应的所述收入波动特征系数大于所述第一预设阈值,且小于第二预设阈值,则确定所述待预估人员属于收入稳定波动人群;若所述待预估人员对应的所述收入波动特征系数大于或等于所述第二预设阈值,则确定所述待预估人员属于收入不稳定波动人群。
[0066]
具体地,在计算得到待预估人员对应的收入波动特征系数后,判断所述收入波动特征系数是否小于或等于所述第一预设阈值,若小于或等于第一预设阈值,则确定所述待预估人员的收入比较稳定,即所述待预估人员属于收入无波动人群,若所述收入波动特征系数大于所述第一预设阈值,则还需要判断所述收入波动特征系数是否小于第二预设阈值,若所述收入波动特征系数大于所述第一预设阈值,且小于所述第二预设阈值,则确定所述待预估人员的收入在某个固定收入基础上存在部分浮动收入,即所述待预估人员属于收入稳定波动人群,若所述收入波动特征系数大于或等于所述第二预设阈值,则确定所述待预估人员的收入不稳定,即所述待预估人员属于收入不稳定波动人群,将所述待预估人员
进行人群划分后,基于收入无波动人群或收入稳定波动人群或收入不稳定波动人群对应的收入预估算法,对所述待预估人员的收入进行预估。
[0067]
205、基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
[0068]
对于本发明实施例,在确定所述待预估人员所述的目标人群后,需要基于所述目标人群对应的收入预估算法对所述待预估人员的收入进行预估,基于此,步骤205具体包括:若所述待预估人员属于所述收入无波动人群,则基于所述收入无波动人群对应的预设收入预估回归模型对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果;若所述待预估人员属于所述收入稳定波动人群,则基于所述收入稳定波动人群对应的预设浮动收入预估模型对所述待预估人员进行浮动收入预估,得到所述待预估人员对应的浮动收入预估结果,并基于所述待预估人员的历史基准收入和所述浮动收入预估结果,确定所述待预估人员对应的收入预估结果;若所述待预估人员属于所述收入不稳定波动人群,则基于所述收入不稳定波动人群对应的预设收入预估模型对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
[0069]
具体地,首先需要构建收入无波动人群对应的预设收入预估回归模型,基于所述无波动人群的历史收入数据,生成预设收入预估回归模型的回归函数,得到回归函数如下:
[0070]
y=a bx
t
c
[0071]
其中,y表示收入预估结果,a表示常数,b表示回归系数,x
t
表示预估时间段,c表示误差,在构造完所述回归函数后,还需要检测所述回归函数的收入预估结果的准确度,具体检测方法为,利用所述预设收入预估回归模型中的回归函数预估所述收入无波动人群中的某个人的历史收入预估值,基于所述某个人的历史收入预估值和所述该人的实际收入,计算均方根误差,并根据均方根误差,判断所述回归函数的收入预估结果的准确度,具体计算均方根误差的公式如下:
[0072][0073]
其中,z表示均方根误差,u1、u2....ur表示历史收入预估值,u表示实际收入,r表示预估次数,由此能够计算预设收入预估回归模型对应的均方根误差,若所述均方根误差大于第三预设阈值,则说明所述预设收入预估回归模型的收入预估结果不理想,此时可以采用梯度下降法等最优化算法找到所述回归函数中误差c的最小值出cz,并将所述最小值cz确定为所述回归函数中的误差项,此时的回归函数公式为:
[0074]
y=a bx
t
cz[0075]
以此构建收入无波动人群对应的预设收入预估回归模型,当需要对待预估人员的收入进行预估时,例如,若要对所述待预估人员3月份的收入进行预估,则将3代入至上述公式中,即可得到待预估人员3月份的收入预估值,需要说明的是,当要预估待预估人员异常月份的收入时,需要确定所述待预估人员历史收入的最大值和中位数,将所述最大值减去所述中位数,得到异常月份对应的基准值,与此同时利用上述回归函数预测异常月份的预估值,将所述预估值加上所述基准值,得到所述待预估人员异常月份的收入值。
[0076]
进一步地,若所述待预估人员属于所述收入稳定波动人群,因为收入稳定波动人群的收入中包括基准收入和浮动收入,首先利用预设浮动收入预估模型对所述待预估人员
的浮动收入进行预估,所述预设浮动收入预估模型具体可以为sarima模型,sarima模型的表达式如下:
[0077][0078]
其中,m为非季节ar项阶数,m为季节ar项阶数,q为非季节ma项阶数,q为季节ma项阶数,d为非季节差分的次数,d为季节差分的次数,s为季节周期长度,为非季节自回归多项式,φm(bs)为季节自回归多项式,θq(b)为非季节滑动平均多项式,ψq(bs)为季节移动平均特征多项式,u
t
为模型的输入数据,即待预估人员的历史日收入、月收入、季度收入等历史收入数据,y
t
为模型预测的输出数据,即待预估人员的浮动收入,由此利用sarima模型能够对待预估人员的浮动收入进行预估,得到浮动收入的预估结果,并基于所述浮动收入预估结果和所述待预估人员的基准收入,确定所述待预估人员对应的收入预估结果,具体基于所述浮动收入预估结果和所述基准收入,确定待预估人员对应的收入预估结果的方法为:确定所述待预估人员的历史收入数据对应的四分位历史收入,并确定所述四分位历史收入中的最小历史收入,将所述最小历史收入确定为所述待预估人员的历史基准收入;将所述历史基准收入加上所述浮动收入预估结果,得到所述待预估人员对应的所述收入预估结果。
[0079]
具体地,首先将所述待预估人员的历史收入数据按照从小到达的顺序进行排列,并将排序后的历史收入数据分成四等分,处于三个分割点位置处的历史收入数据即为四分位历史收入,之后确定所述四分位历史收入中的最小历史收入,并将所述最小历史收入确定为所述待预估人员的历史基准收入,并将所述历史基准收入加上所述浮动收入预估结果,得到所述待预估人员对应的所述收入预估结果。
[0080]
进一步地,若所述待预估人员属于所述收入不稳定波动人群,则需要基于所述收入不稳定波动人群对应的预设收入预估模型对所述待预估人员进行收入预估,基于此首先需要训练并构建所述预设收入预估模型,具体构建方法为:基于所述历史收入数据,生成多组训练集,并根据所述多组训练集,构建多个预设多层感知器;利用多个预设多层感知器对所述待预估人员的历史收入进行预估,得到所述多个预设多层感知器分别对应的历史收入预估结果;基于所述待预估人员的实际历史收入和所述历史收入预估结果,分别确定所述多个预设多层感知器分别对应的历史收入预估误差,并在所述历史收入预估误差中确定最小历史收入预估误差,将所述最小历史收入预估误差对应的预设多层感知器确定为所述预设收入预估模型。
[0081]
对于本发明实施例,具体可以利用adaboost模型训练并构建所述预设收入预估模型,具体构建方法为,将所述历史收入数据和多个预设多层感知器输入至所述adaboost模型中,adaboost模型在所述历史收入数据中有放回地抽取多组训练集,并根据所述多组训练集,训练多个预设多层感知器,之后利用所述多个预设多层感知器对待预估人员的历史收入进行预估,得到所述多个预设多层感知器分别对应的历史收入预估结果,并将所述多个预估结果与所述待预估人员的实际历史收入进行比较,计算所述多个预设多层感知器分别对应的历史收入预估误差,所述预估误差可以是均方根误差,之后确定所述均方根误差中的最小均方根误差,最终将所述最小均方根误差对应的预设多层感知器确定为所述预设收入预估模型,与此同时,为了进一步提高对待预估人员的收入进行预估的精度,在利用所
述预设收入预估模型对所述待预估人员的收入进行预估时,需要确定所述预设收入预估模型对应的精确率,并基于所述精确率和所述预设收入预估模型的预估结果,确定所述待预估人员最终的收入,基于此所述方法包括:利用预设二分类算法预测所述待预估人员在多个历史时间阶段是否存在收入,得到所述待预估人员分别在所述多个历史时间阶段的预测结果;利用所述预设收入预估模型对所述待预估人员在所述多个历史时间阶段的收入值进行预估,得到所述待预估人员分别在所述多个历史时间阶段的收入值;基于所述预测结果和所述收入值,从所述历史收入数据中分别确定有历史收入且所述收入值不为0的第一目标历史收入收据,以及无历史收入且所述收入值不为0的第二目标历史收入数据;将所述第一目标历史收入数据对应的数据量和所述第二目标历史收入对应的数据量相加,得到所述收入值不为0的总数据量,将所述第一目标历史收入数据对应的数据量与所述总数据量相除,得到所述预设收入预估模型对应的精确率;利用所述收入不稳定波动人群对应的所述预设收入预估模型对所述待预估人员进行收入预估,得到待预估人员的初始收入预估结果,并将所述精确率乘以所述初始收入预估结果,得到所述待预估人员对应的收入预估结果。
[0082]
其中,所述历史时间阶段可以是历史每个月,每个季度等。
[0083]
具体地,首先利用预设二分类算法预测所述待预估人员在多个历史时间阶段是否存在收入,所述预设二分类算法具体可以为logistic算法,logistic算法的公式如下:
[0084][0085]
其中,f(θ)表示有收入概率,e表示常数,θ表示时间,当预测所述待预估人员在多个历史时间阶段是否存在收入时,将所述历史时间段代入至上述公式中,得到所述历史时间段对应的有收入的概率值,将所述有收入的概率值与所述第四预设阈值进行比较,当大于所述第四预设阈值,则确定所述待预估人员在所述历史时间段存在收入,若所述收入的概率值小于或等于所述第四预设阈值,则确定所述待预估人员在所述历史时间段不存在收入,同理能够预测待预估人员在多个历史时间段是否存在收入,与此同时,再利用预设收入预估模型对所述待预估人员在所述多个历史时间阶段的收入值进行预估,所述预设收入预估模型具体可以为预设多层感知器,该预设多层感知器包括输入层、隐藏层和输出层,具体进行收入预估的过程中,将待预估人员的历史收入数据通过预设多层感知器的输入层输入至隐藏层,通过该隐藏层输出的结果为:
[0086]
f(w1x b1)
[0087]
其中,x为待预估人员的历史收入数据,w1为隐藏层的权重,也是预设多层感知器的连接系数,b1为隐藏层的偏置系数,f函数通常可以采用sigmoid函数或者tanh函数,如下所示:
[0088]
sigmoid(x)=1/(1 e-x
)
[0089]
tanh(x)=(e
x-e-x
)/(e
x
e-x
)
[0090]
进一步地,在将待预估人员的历史收入数据通过预设多层感知器的输入层输入至隐藏层,得到该隐藏层输出的结果之后,再将该结果输入至输出层,通过该输出层进行分类,得到的分类结果为:
[0091]
softmax(w2f(w1x b1) b2)
[0092]
其中,w2为输出层的权重系数,b2为输出层的偏置系数,通过预设多层感知器的输出层能够输出待预估人员在历史时间段的收入值。
[0093]
进一步地,基于所述是否存在收入的预测结果和所述收入值,从所述历史收入数据中分别确定有历史收入且所述收入值不为0的第一目标历史收入收据,以及无历史收入且所述收入值不为0的第二目标历史收入数据,将所述第一目标历史收入数据对应的数据量和所述第二目标历史收入对应的数据量相加,得到所述收入值不为0的总数据量,将所述第一目标历史收入数据对应的数据量与所述总数据量相除,得到所述预设收入预估模型对应的精确率。
[0094]
进一步地,当确定完所述预设收入预估模型对应的精确率之后,当利用所述预设收入预估模型对所述待预估人员进行收入预估,得到待预估人员的初始收入预估结果之后,为了提高待预估人员的收入预估精度,需要将所述精确率乘以所述初始收入预估结果,得到所述待预估人员对应的收入预估结果。
[0095]
根据本发明提供的另一种收入预估方法,与目前采用统一的方式对居民的收入进行预估的方式相比,本发明通过获取待预估人员的历史收入数据;并基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;与此同时,根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;最终基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果,由此通过将待预估人员进行人群划分,确定所述待预估人员所属的目标人群,并利用所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,能够避免不同收入特征的人群都采用统一收入预估方式,导致此种收入预估方式在部分人群中表现较好,而在另一部分人群中表现不理想,从而提高了收入预估精度。
[0096]
进一步地,作为图1的具体实现,本发明实施例提供了一种收入预估装置,如图3所示,所述装置包括:获取单元31、确定单元32、划分单元33和预估单元34。
[0097]
所述获取单元31,可以用于获取待预估人员的历史收入数据。
[0098]
确定单元32,可以用于基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数。
[0099]
所述划分单元33,可以用于根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群。
[0100]
所述预估单元34,可以用于基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
[0101]
在具体应用场景中,为了确定所述待预估人员对应的收入波动特征系数,如图4所示,所述确定单元32,包括聚类模块321和相除模块322。
[0102]
所述聚类模块321,可以用于对所述待预估人员的所述历史收入数据进行聚类,得到所述历史收入数据对应的聚类结果,并基于所述聚类结果,识别并排除所述历史收入数据中的异常收入数据。
[0103]
所述相除模块322,可以用于确定排除后的历史收入数据对应的标准差和中位数,并将所述标准差与所述中位数相除,得到所述待预估人员对应的收入波动特征系数。
[0104]
在具体应用场景中,为了确定所述待预估人员所属的目标人群,所述划分单元33具体可以用于若所述待预估人员对应的所述收入波动特征系数小于或等于第一预设阈值,
则确定所述待预估人员属于收入无波动人群;若所述待预估人员对应的所述收入波动特征系数大于所述第一预设阈值,且小于第二预设阈值,则确定所述待预估人员属于收入稳定波动人群;若所述待预估人员对应的所述收入波动特征系数大于或等于所述第二预设阈值,则确定所述待预估人员属于收入不稳定波动人群。
[0105]
在具体应用场景中,为了得到所述待预估人员对应的收入预估结果,所述预估单元34具体可以用于若所述待预估人员属于所述收入无波动人群,则基于所述收入无波动人群对应的预设收入预估回归模型对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果;若所述待预估人员属于所述收入稳定波动人群,则基于所述收入稳定波动人群对应的预设浮动收入预估模型对所述待预估人员进行浮动收入预估,得到所述待预估人员对应的浮动收入预估结果,并基于所述待预估人员的历史基准收入和所述浮动收入预估结果,确定所述待预估人员对应的收入预估结果;若所述待预估人员属于所述收入不稳定波动人群,则基于所述收入不稳定波动人群对应的预设收入预估模型对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
[0106]
在具体应用场景中,为了基于所述待预估人员的历史基准收入和所述浮动收入预估结果,确定所述待预估人员对应的收入预估结果,所述预估单元34,包括确定模块341和相加模块342。
[0107]
所述确定模块341,可以用于确定所述待预估人员的历史收入数据对应的四分位历史收入,并确定所述四分位历史收入中的最小历史收入,将所述最小历史收入确定为所述待预估人员的历史基准收入。
[0108]
所述相加模块342,可以用于将所述历史基准收入加上所述浮动收入预估结果,得到所述待预估人员对应的所述收入预估结果。
[0109]
在具体应用场景中,为了利用预设收入预估模型对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果,所述预估单元34,还包括预测模块343、预估模块344、相除模块345和相乘模块346。
[0110]
所述预测模块343,可以用于利用预设二分类算法预测所述待预估人员在多个历史时间阶段是否存在收入,得到所述待预估人员分别在所述多个历史时间阶段的预测结果。
[0111]
所述预估模块344,可以用于利用所述预设收入预估模型对所述待预估人员在所述多个历史时间阶段的收入值进行预估,得到所述待预估人员分别在所述多个历史时间阶段的收入值。
[0112]
所述确定模块341,还可以用于基于所述预测结果和所述收入值,从所述历史收入数据中分别确定有历史收入且所述收入值不为0的第一目标历史收入收据,以及无历史收入且所述收入值不为0的第二目标历史收入数据;
[0113]
所述相除模块345,可以用于将所述第一目标历史收入数据对应的数据量和所述第二目标历史收入对应的数据量相加,得到所述收入值不为0的总数据量,将所述第一目标历史收入数据对应的数据量与所述总数据量相除,得到所述预设收入预估模型对应的精确率。
[0114]
所述相乘模块346,可以用于利用所述收入不稳定波动人群对应的所述预设收入预估模型对所述待预估人员进行收入预估,得到待预估人员的初始收入预估结果,并将所
述精确率乘以所述初始收入预估结果,得到所述待预估人员对应的收入预估结果。
[0115]
在具体应用场景中,为了构建所述预设收入预估模型,所述预估单元34,还包括构建模块347。
[0116]
所述构建模块347,可以用于基于所述历史收入数据,生成多组训练集,并根据所述多组训练集,构建多个预设多层感知器。
[0117]
所述预估模块344,还可以用于利用多个预设多层感知器对所述待预估人员的历史收入进行预估,得到所述多个预设多层感知器分别对应的历史收入预估结果。
[0118]
所述确定模块341,还可以用于基于所述待预估人员的实际历史收入和所述历史收入预估结果,分别确定所述多个预设多层感知器分别对应的历史收入预估误差,并在所述历史收入预估误差中确定最小历史收入预估误差,将所述最小历史收入预估误差对应的预设多层感知器确定为所述预设收入预估模型。
[0119]
需要说明的是,本发明实施例提供的一种收入预估装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。
[0120]
基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取待预估人员的历史收入数据;基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
[0121]
基于上述如图1所示方法和如图3所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图5所示,该计算机设备包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤:获取待预估人员的历史收入数据;基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果。
[0122]
通过本发明的技术方案,本发明通过获取待预估人员的历史收入数据;并基于所述历史收入数据,确定所述待预估人员对应的收入波动特征系数;与此同时,根据所述收入波动特征系数,对所述待预估人员进行人群划分,确定所述待预估人员所属的目标人群;最终基于所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,得到所述待预估人员对应的收入预估结果,由此通过将待预估人员进行人群划分,确定所述待预估人员所属的目标人群,并利用所述目标人群对应的收入预估算法对所述待预估人员进行收入预估,能够避免不同收入特征的人群都采用统一收入预估方式,导致此种收入预估方式在部分人群中表现较好,而在另一部分人群中表现不理想,从而提高了收入预估精度。
[0123]
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示
出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0124]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献