一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种空壳企业识别方法、装置、设备及计算机存储介质与流程

2022-04-24 22:26:05 来源:中国专利 TAG:


1.本技术属于网络信息技术领域,尤其涉及一种空壳企业识别方法、装置、设备及计算机存储介质。


背景技术:

2.空壳企业通常是指没有实体经营或资产的法人实体,常被用于掩盖非法的金融活动。我国目前对于空壳企业仍没有统一认定标准,因此利用数据驱动和科技赋能的方法在开立对公账户前进行核验显得尤为重要。
3.现有常见的空壳企业识别方法主要有:金融机构的专业人员人工调查与采用机器学习建模方法,通过分析企业各类数据指标建立模型进而对企业的空壳风险进行评估,其中机器学习方法包括监督学习和无监督学习。
4.现有的空壳企业识别方法,人工调查耗时费力效率低且存在专业人员受利益驱使而导致人工防控措施失效的风险。监督学习需要大量的标注企业空壳与非空壳的标签,而标注过程中也要消耗大量时间与人力。无监督学习因为正负样本边界模糊和样本分布不均匀等问题,导致分类的可靠性不足。


技术实现要素:

5.本技术实施例提供了一种空壳企业识别的方法、装置、设备及计算机存储介质,能够识别待识别企业是否为空壳企业,能够实现无需人工操作、人工审核,避免了专业人员在人工处理的情况下带来的风险;实现了无需对空壳企业样本与非空壳企业样本进行人工标注,节省了大量时间与人力;避免了因为正负样本边界模糊和样本分布不均匀等问题导致的分类可靠性不足的问题。
6.一方面,本技术实施例提供了一种空壳企业的识别方法,方法包括:
7.获取待识别企业的工商注册信息;
8.基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据;
9.将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分;空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
10.根据评分,确定待识别企业是否为空壳企业。
11.在一个示例中,企业信息风险指标数据包括至少一项:
12.企业注册地址风险指标数据;
13.企业基本信息风险指标数据;
14.企业法定代表人风险指标数据;
15.企业受益所有人风险指标数据;
16.企业治理结构风险指标数据。
17.在一个示例中,企业信息风险指标数据包括企业注册地址风险指标数据;基于待
识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
18.根据企业网格区域数据库,确定相距待识别企业预设距离内的企业数量;企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的;
19.根据企业数量以及预设企业数量分布等级,确定企业数量对应的目标数量分布等级;
20.根据目标数量分布等级与预设等级阈值,确定待识别企业是否为偏远企业,以得到待识别企业的企业注册地址风险指标数据。
21.在一个示例中,企业信息风险指标数据包括企业基本信息风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括以下至少一项:
22.根据待识别企业的联系方式以及数据库内其他企业的联系方式,确定联系方式重复数量;根据联系方式重复数量与第一预设阈值,确定待识别企业是否为联系方式为公用的企业,以得到联系方式的风险指标数据;
23.根据待识别企业注册地址与办公地址,确定待识别企业是否为异地经营,以得到异地经营风险指标数据;
24.根据待识别企业注册地址,确定待识别企业的注册地址是否属于自贸区,以得到注册地址风险指标数据;
25.根据待识别企业注册时间,确定待识别企业注册时间是否在预设时间范围内,以得到注册时间风险指标数据;
26.根据待识别企业注册资金,确定待识别企业注册资金是否在预设资金额度范围内,以得到注册资金风险指标数据。
27.在一个示例中,企业信息风险指标数据包括法定代表人风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
28.基于待识别企业工商注册信息,分析待识别企业股东和任职关系,生成股东、高管投资关系图谱;
29.基于投资关系图谱,确定待识别企业的法定代表人实际控制企业数量,以得到法定代表人实际控制企业数量风险指标数据;
30.基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册地址所属地区,确定企业的注册地址所属地区是否均不相同,以得到法定代表人实际控制企业所属地区风险指标数据;
31.基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册时间,确定待识别企业法定代表人实际控制企业的注册时间是否集中在一段时间内,以得到法定代表人实际控制企业注册时间风险指标数据。
32.在一个示例中,企业信息风险指标数据包括企业收益所有人风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
33.根据待识别企业的受益所有人控制企业的数量,确定待识别企业受益所有人实际控制企业数量是否超过第三预设阈值;
34.在实际控制企业数量超过第三预设阈值的情况下,根据预设匹配规则,确定待识别企业受益所有人与具有相同姓名的实际控制企业的企业受益所有人是否为同一人,以得到待识别企业的企业受益所有人风险指标数据;
35.预设匹配规则包括至少一项:
36.根据实际控制的企业之间投资关系的层级数量与第四预设阈值,确定具有相同姓名的企业受益所有人是否为同一人;
37.根据实际控制的企业间有相同的联系方式、注册地址信息制定筛选规则,确定具有相同姓名的企业受益所有人是否为同一人;
38.根据待识别企业的企业法定代表人、股东大会、董事会、监事会、高管与实际控制的企业的重复人员的数量与第五预设阈值,确定具有相同姓名的企业受益所有人是否为同一人。
39.在一个示例中,企业信息风险指标数据包括企业治理结构风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
40.根据待识别企业的法定代表人、股东大会、董事会、监事会、高管与企业网格区域数据库内其他公司重复人员的数量,确定待识别企业管理人员与企业网格区域数据库内其他公司重复人员数量是否超过第六预设阈值,以得到待识别企业的企业治理结构风险指标数据。
41.在一个示例中,获取待识别企业的工商注册信息之前,还包括:
42.获取多个空壳企业的工商注册信息和评分标签;
43.根据每个空壳企业的工商注册信息,分别生成空壳企业对应的空壳企业信息风险指标标签数据;
44.根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
45.在一个示例中,根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型,具体包括:
46.采用ahp层次分析法设置的企业信息风险指标标签数据的权重;
47.根据权重和初始空壳企业识别模型,得到空壳企业的预测评分;
48.在预测评分与评分标签的差值不满足预设条件的情况下,返回采用ahp层次分析法设置的企业信息风险指标标签数据的权重,直至预测评分与评分标签的差值满足预设条件,得到空壳企业识别模型。
49.再一方面,本技术实施例还提供一种企业识别装置,装置包括:
50.第一获取模块,用于获取待识别企业的工商注册信息;
51.第二获取模块,用于基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据;
52.识别模块,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分,空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
53.确定模块,根据评分与预设阈值比较分析,确定待识别企业是否为空壳企业。
54.再一方面,本技术实施例提供了一种空壳企业识别装备,设备包括:
55.处理器以及存储有计算机程序指令的存储器;
56.处理器执行计算机程序指令时实现上述实施例的空壳企业识别的方法。
57.再一方面,本技术实施例提供了一种计算机存储介质,其特征在于,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现上述实施例的空壳企业识别的方法。
58.再一方面,本技术实施例提供了一种计算机程序产品,其特征在于,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行上述实施例的空壳企业识别方法。
59.本技术实施例的空壳企业识别方法、装置、设备及计算机存储介质,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该方法也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界模糊和样本分布不均等而导致的分类可靠性不足的问题。
附图说明
60.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
61.图1是本技术一个实施例提供的空壳企业识别模型的构建方法流程示意图;
62.图2是本技术一个实施例提供的s130的具体实现方式的流程示意图;
63.图3是本技术一个实施例提供的空壳企业识别方法的流程示意图;
64.图4是本技术另一个实施例提供的空壳企业识别方法的流程示意图;
65.图5是本技术一个实施例提供的空壳企业识别装置的结构示意图;
66.图6是本技术一个实施例提供的空壳企业识别设备的结构示意图。
具体实施方式
67.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本技术,而不是限定本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
68.本技术技术方案中对数据的获取、存储、使用以及处理等均符合国家法律法规的相关规定。
69.为了解决现有技术问题,本技术实施例提供了一种空壳企业识别方法。该方法将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该方法也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界
模糊和样本分布不均等而导致的分类可靠性不足的问题。
70.在介绍本技术实施例所提供的空壳企业识别方法之前,首先介绍本技术实施例提供的识别方法遇到的空壳企业识别模型。
71.如图1所示,本技术实施例所提供的空壳企业识别模型的构建方法包括以下步骤:
72.s110,获取多个空壳企业的工商注册信息和评分标签;
73.s120,根据每个空壳企业的工商注册信息,分别生成空壳企业对应的空壳企业信息风险指标标签数据;
74.s130,根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
75.通过上述实施方式,可以根据已知的空壳企业样本信息生成风险指标数据从而构建空壳企业识别模型,并且可以根据多个空壳企业样本的企业信息风险指标数据与多个空壳企业样本的企业得分之间的关系,进一步对空壳企业识别模型进行迭代优化。
76.具体地,在s110中,多个空壳企业样本的工商注册信息可直接获取,空壳企业样本的工商注册信息包括但不限于:注册号、公司名称、股东名称、投资比例、法定代表人、经营期限、组织机构、注册时间、注册地址等;评分标签是对空壳企业进行人工评估得到的评分。
77.在s120中,根据空壳企业工商注册信息生成对应的空壳企业信息风险指标标签数据的过程与s220过程类似,不同之处在于s120过程中需要的是空壳企业,s220过程中需要的可以是任意待识别企业,详细实施内容将在s220中进行详细描述。
78.在s130中,根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
79.作为s130的一个示例,如图2所示,s130可以具体包括以下步骤:
80.s210:采用ahp层次分析法设置的企业信息风险指标标签数据的权重;
81.s220:根据权重和初始空壳企业识别模型,得到空壳企业的预测评分;
82.s230:判断预测评分与评分标签的差值是否满足预设条件。
83.s240:在预测评分与评分标签的差值不满足预设条件的情况下,返回s210,直至预测评分与评分标签的差值满足预设条件,得到空壳企业识别模型;在预测评分与评分标签的差值满足预设条件的情况下,结束上述识别过程。
84.s210中,可以采用层次分析法(analytic hierarchy process,ahp)对企业的风险指标数据进行赋权。
85.ahp层次分析法是指是对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法。这种方法的特点就是在对复杂决策问题的本质、影响因素及其内在关系等进行深入研究的基础上,利用较少的定量信息使决策的思维过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法,是对难以完全定量的复杂系统做出决策的模型和方法。
86.本技术实施例中采用ahp层次分析法根据识别空壳企业这一问题的性质和总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同的层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权值的确定或相对优劣次序的排
定。
87.层次分析法所对应的比较矩阵的值主要反映了每一个风险指标数据相对重要性的认识。
88.请参照表1,表1给出了层次分析法比较矩阵值及其含义。
[0089][0090]
比较矩阵是层次分析法的基本信息,也是进行层次分析法分析的基础,比较矩阵的特征向量经过归一化后,即为同层次相应因素对于上一层次某因素相对重要性的排序权值。具体地,在s210中,采用ahp层次分析法对一个空壳企业样本的各项企业信息风险指标数据进行赋权,得到各风险指标数据的权重值,假设该企业有n个风险指标数据:w1,w2,w3,
……
,wn;对应地设置该企业各项企业信息风险指标数据的权重值:a1,a2,a3,
……
,an,其中w1,w,w3,
……
,wn的值根据该企业的实际情况取值,a1,a2,a3,
……
,an的值只能为0或1。至此,得到该企业第一轮空壳企业识别过程中的风险指标数据和权重值。
[0091]
在s220中,初始空壳企业识别模型可以如下式表示:
[0092]
p=a1*w1 a2*w2

an*wn[0093]
其中,p为评分;
[0094]
w1,w2,w3,
……
,wn为空壳企业有n个风险指标数据;
[0095]
a1,a2,a3,
……
,an分别为各项企业信息风险指标数据的权重值,该权重值可以根据s210步骤得到。
[0096]
作为s220的一个示例,本步骤可以具体为:将一个空壳企业的n个风险指标数据输入到初始空壳企业识别模型中,得到该空壳企业的预测评分p1。
[0097]
在s230中,判断预测评分与评分标签的差值是否满足预设条件,如果是,执行s240,如果否,返回s210。
[0098]
其中,作为一示例,预设条件可以为预测评分与对该企业预先设定的评分标签的差值小于预设阈值。
[0099]
以上本技术实施例提供的空壳企业识别模型的构建方法的具体实现方式。在该具体实现方式中,通过拟合空壳企业的评分及其对应的空壳企业信息风险指标之间的关系即
可得到空壳企业识别模型。在上述过程中无需对空壳与非空壳企业样本进行标注,节省了大量时间与人力,不会因正负样本边界模糊和样本分布不均匀等问题,导致分类的可靠性不足。
[0100]
基于上述实施例中提供的空壳企业识别模型,下面对本技术实施例所提供的空壳企业识别方法进行介绍。
[0101]
如图3所示,本技术实施例提供的空壳企业识别方法包括以下步骤:空壳企业识别方法的流程示意图;
[0102]
s310,获取待识别企业的工商注册信息;
[0103]
s320,基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据;
[0104]
s330,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分,空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
[0105]
s340,根据评分,确定待识别企业是否为空壳企业。
[0106]
通过上述实施方式,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该方法也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界模糊和样本分布不均等而导致的分类可靠性不足的问题。
[0107]
下面结合具体实施例对上述各步骤做出详细叙述。
[0108]
在s310中,获取待识别企业的工商注册信息。其中,待识别企业是指评估其是否为空壳企业的对象。企业的工商注册信息具体包括但不限于注册号、公司名称、股东名称、投资比例、法定代表人、经营期限、组织机构、注册时间、注册地址等。在一个实施例中,若要获取企业的工商注册信息可向企业所在地的工商局处查询企业公开的工商注册信息。
[0109]
在s320中,基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据。
[0110]
作为本技术的一个示例,企业信息风险指标数据可以具体包括以下中的至少一项:
[0111]
企业注册地址风险指标数据;
[0112]
企业基本信息风险指标数据;
[0113]
企业法定代表人风险指标数据;
[0114]
企业受益所有人风险指标数据;
[0115]
企业治理结构风险指标数据。
[0116]
在本技术实施例中,企业注册地址风险指标数据需要对企业工商注册信息中的注册地址挖掘分析,综合运用数据分析和挖掘、互联网地图应用程序接口(application programming interface,api)、python和神经语言程序学(neuro-linguistic programming,nlp)等技术,基于企业注册地址信息生成企业网格数据库,从而设定待识别企业所在区域范围内企业数量分布等级,形成待识别企业是否过于偏远的标签,为识别空
壳企业提供辅助判断。
[0117]
作为一个示例,当企业信息风险指标数据包括企业注册地址风险指标数据时,s320可以具体包括:
[0118]
s321、根据企业网格区域数据库,确定相距待识别企业预设距离内的企业数量;企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的;
[0119]
s322、根据企业数量以及预设企业数量分布等级,确定企业数量对应的目标数量分布等级;
[0120]
s323、根据目标数量分布等级与预设等级阈值,确定待识别企业是否为偏远企业,以得到待识别企业的企业注册地址风险指标数据。
[0121]
在s321中,企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的。作为一示例,该数据库的构建过程可以如下:基于区域范围内企业的工商注册信息,提取出该区域范围内企业的注册地址信息,通过互联网地图api获得企业的位置信息,根据位置信息按照r公里划分网格区域,统计各网格区域的企业数量,形成企业网格区域数据库。
[0122]
作为s321的一个示例,s321可以具体包括:根据待识别企业所在地址的位置信息,运用基于欧式距离的概率密度函数计算待识别企业与β公里范围内各网格区域的权重系数,采用加权平均法获得待识别企业β公里范围内企业加权平均数量。
[0123]
在s322中,可以通过对待识别企业β公里范围以内企业数量分布进行统计分析。在一个示例中,采用均值方法,根据β公里范围内企业的总数量与待识别企业β公里范围内网格区域数量的比值,可以得到各网格区域内企业数量的平均值,根据待识别企业β公里范围内企业加权平均数量、待识别企业β公里范围内企业加权平均数量和/或待识别企业所在网格区域内企业数量和/或上述平均值比较分析,根据均值法的比较规则,设定待识别企业的数量分布等级为n,n是一个正整数。
[0124]
在另一个示例中,采用百分位数方法,根据β公里范围内各网格区域内企业的数量之间的比值,确定待识别企业所在网格区域内企业数量占区域范围内企业总数量的百分位数,和/或待识别企业所在网格区域内企业数量的区间范围占区域范围内企业总数量的百分位数,和/或其他根据百分位数法能够得到的百分位数,根据待识别企业相关的企业数量百分位数与百分位数法的比较规则,设定待识别企业的数量分布等级为n,n是一个正整数。
[0125]
在本技术实施例中,对待识别企业β公里范围以内企业数量分布进行统计分析,以设定企业数量分布等级的过程中,统计分析采用的方法包括但不限于上述两个示例的均值法、百分位数法,采用的方法所得到的数据包括但不限于上述示例中的数据。
[0126]
将待识别企业的企业数量分布等级n与预设的等级阈值进行比较,形成待识别企业是否过于偏远的标签,为识别待识别企业是否为空壳企业提供辅助判断。
[0127]
作为一个示例,当企业信息风险指标数据包括企业基本信息风险指标数据时;s320可以包括以下至少一项:
[0128]
根据待识别企业的联系方式以及数据库内其他企业的联系方式,确定联系方式重复数量;根据联系方式重复数量与第一预设阈值,确定待识别企业是否为联系方式为公用的企业,以得到联系方式的风险指标数据;
[0129]
根据待识别企业注册地址与办公地址,确定待识别企业是否为异地经营,以得到
异地经营风险指标数据;根据待识别企业注册地址,确定待识别企业的注册地址是否属于自贸区,以得到注册地址风险指标数据;
[0130]
根据待识别企业注册时间,确定待识别企业注册时间是否在预设时间范围内,以得到注册时间风险指标数据;
[0131]
根据待识别企业注册资金,确定待识别企业注册资金是否在预设资金额度范围内,以得到注册资金风险指标数据。
[0132]
作为一个示例,企业法定代表人风险指标数据基于企业的股东、高管投资关系图谱而形成,关系图谱是通过大数据分析区域范围内企业的工商注册信息,采用图数据库技术解析企业的股东任职关系,生成企业的股东、高管投资关系图谱。
[0133]
当企业信息风险指标数据包括企业法定代表人风险指标数据时,s220可以包括以下至少一项:
[0134]
基于投资关系图谱,确定待识别企业的法定代表人实际控制企业数量是否超过第二预设阈值,以得到法定代表人实际控制企业数量风险指标数据;基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册地址所属地区,确定企业的注册地址所属地区是否均不相同,以得到法定代表人实际控制企业所属地区风险指标数据;
[0135]
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册时间,确定待识别企业法定代表人实际控制企业的注册时间是否集中在一段时间内,以得到法定代表人实际控制企业注册时间风险指标数据。
[0136]
作为一个示例,当企业信息风险指标数据包括企业受益所有人风险指标数据时;s220可以包括以下至少一项:
[0137]
根据待识别企业的受益所有人控制企业的数量,确定待识别企业受益所有人实际控制企业数量是否超过第三预设阈值;在实际控制企业数量超过第三预设阈值的情况下,根据预设匹配规则,确定待识别企业受益所有人与具有相同姓名的实际控制企业的企业受益所有人是否为同一人,以得到待识别企业的企业受益所有人风险指标数据;
[0138]
预设匹配规则包括至少一项:
[0139]
根据实际控制的企业之间投资关系的层级数量与第四预设阈值,确定具有相同姓名的企业受益所有人是否为同一人;
[0140]
根据实际控制的企业间有相同的联系方式、注册地址信息制定筛选规则,确定具有相同姓名的企业受益所有人是否为同一人;
[0141]
根据待识别企业的企业法定代表人、股东大会、董事会、监事会、高管与实际控制的企业的重复人员的数量与第五预设阈值,确定具有相同姓名的企业受益所有人是否为同一人。
[0142]
作为一个示例,当企业信息风险指标数据包括企业治理结构风险指标数据时;s320可以包括以下至少一项:
[0143]
根据待识别企业的法定代表人、股东大会、董事会、监事会、高管与企业网格区域数据库内其他公司重复人员的数量,确定待识别企业管理人员与企业网格区域数据库内其他公司重复人员数量是否超过第六预设阈值,以得到待识别企业的企业治理结构风险指标数据。
[0144]
企业信息风险指标数据是基于企业的工商注册信息进一步挖掘、处理、分析而得
到的,相较于企业的工商注册信息能够更加直观、综合、全面地反映企业的相关特征信息,能够直接被空壳企业识别模型所采用。
[0145]
在s330中,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分。
[0146]
待识别企业的企业信息风险指标数据输入到上述构建得到的空壳企业识别模型中,可以得到待识别空壳企业评分。
[0147]
在s340中,根据评分,确定待识别企业是否为空壳企业。
[0148]
上述实施例,综合运用大数据挖掘分析构建企业网格区域数据库、企业投资关系图谱和层次分析法等技术手段搭建空壳企业识别模型,基于企业的工商注册信息实现了深层次、多维度地挖掘企业的风险指标,精准地识别待识别企业,最大程度上提高了空壳企业识别模型的准确率。能够挖掘出隐藏较深的空壳企业及其法定代表人、企业受益所有人等团伙,避免了因空壳企业的非法金融活动对市场造成的风险。
[0149]
为了能够更加准确地识别空壳企业,本技术还提供了一种空壳企业识别方法的另一个实施例。具体如图4所示,该方法在s310之前还可以包括:
[0150]
s410:获取多个空壳企业的工商注册信息和评分标签;
[0151]
s420:根据每个空壳企业的工商注册信息,分别生成空壳企业对应的空壳企业信息风险指标标签数据;
[0152]
s430:根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
[0153]
在一个示例中,s410-s430具体实施部分与本技术实施例空壳企业识别模型构建方法相同,详细描述可参见图1空壳企业识别模型方法构建的流程示意图中空壳企业识别模型的构建过程。
[0154]
基于上述实施例提供的空壳企业识别方法,本技术还提供了一种空壳企业识别装置实施例500。如图5所示,该装置包括:第一获取模块510、第二获取模块520、识别模块530、确定模块540。
[0155]
第一获取模块510,用于获取待识别企业的工商注册信息。
[0156]
第二获取模块520,用于获取基于待识别企业的工商注册信息而得到的风险指标数据。
[0157]
识别模块530,用于将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分,空壳企业识别模型为根据空壳企业的信息风险指标构建得到的。
[0158]
确定模块540,用于将评分根据预设规则与预设评分阈值进行比较,得出待识别企业的识别结果。
[0159]
本技术实施例的空壳企业识别装置,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该装置也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界模糊和样本分布不均等而导致的分类可靠
性不足的问题。
[0160]
作为一示例,所述企业信息风险指标数据包括企业注册地址风险指标数据;第二获取模块520可以具体用于:
[0161]
根据企业网格区域数据库,确定相距待识别企业预设距离内的企业数量;企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的;
[0162]
根据企业数量以及预设企业数量分布等级,确定企业数量对应的目标数量分布等级;
[0163]
根据目标数量分布等级与预设等级阈值,确定待识别企业是否为偏远企业,以得到待识别企业的企业注册地址风险指标数据。
[0164]
作为一示例,企业信息风险指标数据包括企业基本信息风险指标数据;第二获取模块520可以具体用于以下至少一项:
[0165]
根据待识别企业的联系方式以及数据库内其他企业的联系方式,确定联系方式重复数量;根据联系方式重复数量与第一预设阈值,确定待识别企业是否为联系方式为公用的企业,以得到联系方式的风险指标数据;
[0166]
根据待识别企业注册地址与办公地址,确定待识别企业是否为异地经营,以得到异地经营风险指标数据;
[0167]
根据待识别企业注册地址,确定待识别企业的注册地址是否属于自贸区,以得到注册地址风险指标数据;
[0168]
根据待识别企业注册时间,确定待识别企业注册时间是否在预设时间范围内,以得到注册时间风险指标数据;
[0169]
根据待识别企业注册资金,确定待识别企业注册资金是否在预设资金额度范围内,以得到注册资金风险指标数据。
[0170]
作为一示例,企业信息风险指标数据包括企业法定代表人风险指标数据;第二获取模块520可以具体用于以下至少一项:
[0171]
基于待识别企业工商注册信息,分析待识别企业股东和任职关系,生成股东、高管投资关系图谱;
[0172]
基于投资关系图谱,确定待识别企业的法定代表人实际控制企业数量是否超过第二预设阈值,以得到法定代表人实际控制企业数量风险指标数据;
[0173]
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册地址所属地区,确定企业的注册地址所属地区是否均不相同,以得到法定代表人实际控制企业所属地区风险指标数据;
[0174]
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册时间,确定待识别企业法定代表人实际控制企业的注册时间是否集中在一段时间内,以得到法定代表人实际控制企业注册时间风险指标数据。
[0175]
作为一示例,企业信息风险指标数据包括企业受益所有人风险指标数据;第二获取模块520可以具体用于以下至少一项:
[0176]
根据所述待识别企业的受益所有人控制企业的数量,确定所述待识别企业受益所有人实际控制企业数量是否超过第三预设阈值;
[0177]
在实际控制企业数量超过第三预设阈值的情况下,根据预设匹配规则,确定待识
别企业受益所有人与具有相同姓名的实际控制企业的企业受益所有人是否为同一人,以得到待识别企业的企业受益所有人风险指标数据;
[0178]
预设匹配规则包括至少一项:
[0179]
根据实际控制的企业之间投资关系的层级数量与第四预设阈值,确定具有相同姓名的企业受益所有人是否为同一人;
[0180]
根据实际控制的企业间有相同的联系方式、注册地址信息制定筛选规则,确定具有相同姓名的企业受益所有人是否为同一人;
[0181]
根据待识别企业的企业法定代表人、股东大会、董事会、监事会、高管与实际控制的企业的重复人员的数量与第五预设阈值,确定具有相同姓名的企业受益所有人是否为同一人。
[0182]
作为一示例,企业信息风险指标数据包括企业治理结构风险指标数据;第二获取模块520可以具体用于以下至少一项:
[0183]
根据待识别企业的法定代表人、股东大会、董事会、监事会、高管与企业网格区域数据库内其他公司重复人员的数量,确定待识别企业管理人员与企业网格区域数据库内其他公司重复人员数量是否超过第六预设阈值,以得到待识别企业的企业治理结构风险指标数据。
[0184]
作为装置的另一实施例,为了提高识别准确率,装置还可以包括:
[0185]
第三获取模块,用于待识别企业的工商注册信息之前,获取多个空壳企业的工商注册信息和评分标签;
[0186]
生成模块,用于根据每个所述空壳企业的工商注册信息,分别生成壳企业对应的空壳企业信息风险指标标签数据;
[0187]
拟合模块,用于根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
[0188]
作为一示例,拟合模块可以具体包括:
[0189]
采用ahp层次分析法设置的企业信息风险指标标签数据的权重;
[0190]
根据权重和初始空壳企业识别模型,得到空壳企业的预测评分;
[0191]
在所述预测评分与所述评分标签的差值不满足预设条件的情况下,返回所述采用ahp层次分析法设置的企业信息风险指标标签数据的权重,直至预测评分与评分标签的差值满足预设条件,得到空壳企业识别模型。
[0192]
图6示出了本技术实施例提供的空壳企业识别设备的硬件结构示意图。
[0193]
在空壳企业识别设备可以包括处理器601以及存储有计算机程序指令的存储器602。
[0194]
具体地,上述处理器601可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0195]
存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在合
适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在综合网关容灾设备的内部或外部。在特定实施例中,存储器602是非易失性固态存储器。
[0196]
存储器可包括只读存储器(rom),随机存取存储器(ram),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
[0197]
处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种空壳企业识别方法。
[0198]
在一个示例中,空壳企业识别设备还可包括通信接口603和总线510。其中,如图6所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。
[0199]
通信接口603,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。
[0200]
总线610包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0201]
该空壳企业识别设备可以基于当前待识别企业的风险指标数据以及层次分析法执行本技术实施例中的空壳企业识别方法,从而实现结合图1描述的空壳企业识别模型构建的流程和图2描述的空壳企业识别方法。
[0202]
另外,结合上述实施例中的空壳企业识别方法,本技术实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种空壳企业识别方法。
[0203]
需要明确的是,本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本技术的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本技术的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
[0204]
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、
光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
[0205]
上面参考根据本技术的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本技术的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
[0206]
还需要说明的是,本技术中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本技术不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
[0207]
以上,仅为本技术的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献