一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

空壳公司识别方法、装置、设备及介质与流程

2022-03-26 14:26:32 来源:中国专利 TAG:


1.本技术涉及金融科技(fintech)技术领域,尤其涉及一种空壳公司识别方法、装置、设备及介质。


背景技术:

2.空壳公司是金融机构需要警惕的重要风险之一,但受限于识别手段和尽调成本的制约,空壳公司乱象使金融机构在多个场景中受困。现有情况下,金融机构往往需要对单个企业的财务报表、资产、税务、负债等多维度进行调查,判断单个企业是否为空壳公司。现有方案在识别多个空壳公司时,识别成本高且耗时长,使得当前的空壳公司识别效率较低。


技术实现要素:

3.本技术的主要目的在于提供一种空壳公司识别方法、装置、设备及介质,旨在解决当前的空壳公司识别效率较低的技术问题。
4.为实现上述目的,本技术实施例提供一种空壳公司识别方法,所述空壳公司识别方法包括:
5.获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;
6.确定所述有向知识图谱中是否存在可疑实体;
7.若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。
8.优选地,所述确定所述有向知识图谱中是否存在可疑实体的步骤包括:
9.确定所述有向知识图谱中是否存在中心节点;
10.若存在所述中心节点,则根据所述中心节点对所述有向知识图谱中的所有实体进行实体筛选,得到实体集合,其中,所述实体集合包括所述中心节点对应实体的各连出企业;
11.分别确定所述实体集合中两两连出企业之间的相似度;
12.根据各所述相似度分别确定各所述连出企业是否为可疑实体;
13.若各所述连出企业中存在任一连出企业为可疑实体,则确定所述有向知识图谱中存在可疑实体。
14.优选地,所述根据各所述相似度分别确定各所述连出企业是否为可疑实体的步骤包括:
15.针对各所述连出企业,分别执行以下步骤:
16.针对当前连出企业与所述实体集合中连出企业之间的名字相似度,与第一预设相似度阈值进行对比;
17.若所述相似度大于或等于所述第一预设相似度阈值,则确定所述相似度对应的两连出企业的注册地址是否匹配;
18.若所述相似度对应的两连出企业的注册地址匹配,则确定当前连出企业及相应的其他连出企业为可疑实体。
19.优选地,所述根据所述可疑实体的数量确定所述可疑实体是否为空壳公司的步骤包括:
20.将所述实体集合中注册地址相同的可疑实体确定为目标可疑实体,并确定所述目标可疑实体的数量;
21.将所述目标可疑实体的数量与预设数量阈值进行对比;
22.若所述目标可疑实体的数量大于或等于所述预设数量阈值,则确定各所述目标可疑实体均为空壳公司。
23.优选地,所述确定各所述目标可疑实体均为空壳公司的步骤之后,还包括:
24.从所述有向知识图谱中获取所述空壳公司对应的第一子图谱;
25.确定所述中心节点在所述有向知识图谱中的第二子图谱;
26.基于所述第一子图谱确定所述第二子图谱中的实体是否为所述空壳公司的团伙。
27.优选地,所述基于所述第一子图谱确定所述第二子图谱中的实体是否为所述空壳公司的团伙的步骤包括:
28.提取所述第一子图谱的第一待比较特征以及所述第二子图谱的第二待比较特征;
29.根据所述第一待比较特征与所述第二待比较特征分别确定所述第一子图谱与所述第二子图谱的结构相似性、属性相似性、中心节点重要度相似性;
30.根据所述结构相似性、所述属性相似性与所述中心节点重要度相似度确定所述第二子图谱中的实体是否为所述空壳公司的团伙。
31.优选地,所述根据所述结构相似性、所述属性相似性与所述中心节点重要度相似度确定所述第二子图谱中的实体是否为所述空壳公司的团伙的步骤包括:
32.对所述结构相似性、所述属性相似性与所述中心节点重要度相似度进行加权运算,得到加权相似度;
33.将所述加权相似度与第二预设相似度阈值进行对比;
34.若所述加权相似度大于或等于所述第二预设相似度阈值,则确定所述第二子图谱中的实体为所述空壳公司的团伙。
35.为实现上述目的,本技术还提供一种空壳公司识别装置,所述空壳公司识别装置包括:
36.构建模块,用于获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;
37.第一确定模块,用于确定所述有向知识图谱中是否存在可疑实体;
38.第二确定模块,用于若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。
39.进一步地,为实现上述目的,本技术还提供一种空壳公司识别设备,所述空壳公司识别设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的空壳公司识别程序,所述空壳公司识别程序被所述处理器执行时实现上述的空壳公司识别方法的步骤。
40.进一步地,为实现上述目的,本技术还提供一种介质,所述介质为计算机可读存储介质,所述计算机可读存储介质上存储有空壳公司识别程序,所述空壳公司识别程序被处理器执行时实现上述的空壳公司识别方法的步骤。
41.进一步地,为实现上述目的,本技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的空壳公司识别方法的步骤。
42.本技术实施例提供一种空壳公司识别方法、装置、设备及介质,获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;确定所述有向知识图谱中是否存在可疑实体;若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。本技术可以根据待识别企业的实体信息、企业投资关系信息与法定代表关系信息构建有向知识图谱,并在检测有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
附图说明
43.图1为本技术空壳公司识别方法实施例方案涉及的硬件运行环境的结构示意图;
44.图2为本技术空壳公司识别方法第一实施例的流程示意图;
45.图3为本技术空壳公司识别方法第二实施例的流程示意图;
46.图4为本技术空壳公司识别方法第三实施例的流程示意图;
47.图5为本技术空壳公司识别装置较佳实施例的功能模块示意图。
48.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
49.应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
50.本技术实施例提供一种空壳公司识别方法、装置、设备及介质,获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;确定所述有向知识图谱中是否存在可疑实体;若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。本技术可以根据待识别企业的实体信息、企业投资关系信息与法定代表关系信息构建有向知识图谱,并在检测有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
51.本技术实施例涉及的技术术语:
52.实体:知识图谱中有类型的点;
53.关系:知识图谱中实体与实体连接有类型的边;
54.出度:知识图谱中实体向外连接的数量;
55.中心节点:知识图谱中出度超过m的实体;
56.n跳:从当前节点出发向外最多广度优先遍历n次;
57.有向知识图谱:知识图谱中关系指向有方向。
58.如图1所示,图1是本技术实施例方案涉及的硬件运行环境的空壳公司识别设备结构示意图。
59.在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本技术的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
60.本技术实施例空壳公司识别设备可以是pc,也可以是平板电脑、便携计算机等可移动式终端设备。
61.如图1所示,该空壳公司识别设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
62.本领域技术人员可以理解,图1中示出的空壳公司识别设备结构并不构成对空壳公司识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
63.如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及空壳公司识别程序。
64.在图1所示的设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的空壳公司识别程序,并执行以下操作:
65.获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;
66.确定所述有向知识图谱中是否存在可疑实体;
67.若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。
68.进一步地,所述确定所述有向知识图谱中是否存在可疑实体的步骤包括:
69.确定所述有向知识图谱中是否存在中心节点;
70.若存在所述中心节点,则根据所述中心节点对所述有向知识图谱中的所有实体进行实体筛选,得到实体集合,其中,所述实体集合包括所述中心节点对应实体的各连出企业;
71.分别确定所述实体集合中两两连出企业之间的相似度;
72.根据各所述相似度分别确定各所述连出企业是否为可疑实体;
73.若各所述连出企业中存在任一连出企业为可疑实体,则确定所述有向知识图谱中存在可疑实体。
74.进一步地,所述根据各所述相似度分别确定各所述连出企业是否为可疑实体的步骤包括:
75.针对各所述连出企业,分别执行以下步骤:
76.针对当前连出企业与所述实体集合中连出企业之间的名字相似度,与第一预设相似度阈值进行对比;
77.若所述相似度大于或等于所述第一预设相似度阈值,则确定所述相似度对应的两连出企业的注册地址是否匹配;
78.若所述相似度对应的两连出企业的注册地址匹配,则确定当前连出企业及相应的其他连出企业为可疑实体。
79.进一步地,所述根据所述可疑实体的数量确定所述可疑实体是否为空壳公司的步骤包括:
80.将所述实体集合中注册地址相同的可疑实体确定为目标可疑实体,并确定所述目标可疑实体的数量;
81.将所述目标可疑实体的数量与预设数量阈值进行对比;
82.若所述目标可疑实体的数量大于或等于所述预设数量阈值,则确定各所述目标可疑实体均为空壳公司。
83.进一步地,所述确定各所述目标可疑实体均为空壳公司的步骤之后,处理器1001可以用于调用存储器1005中存储的空壳公司识别程序,并执行以下操作:
84.从所述有向知识图谱中获取所述空壳公司对应的第一子图谱;
85.确定所述中心节点在所述有向知识图谱中的第二子图谱;
86.基于所述第一子图谱确定所述第二子图谱中的实体是否为所述空壳公司的团伙。
87.进一步地,所述基于所述第一子图谱确定所述第二子图谱中的实体是否为所述空壳公司的团伙的步骤包括:
88.提取所述第一子图谱的第一待比较特征以及所述第二子图谱的第二待比较特征;
89.根据所述第一待比较特征与所述第二待比较特征分别确定所述第一子图谱与所述第二子图谱的结构相似性、属性相似性、中心节点重要度相似性;
90.根据所述结构相似性、所述属性相似性与所述中心节点重要度相似度确定所述第二子图谱中的实体是否为所述空壳公司的团伙。
91.进一步地,所述根据所述结构相似性、所述属性相似性与所述中心节点重要度相似度确定所述第二子图谱中的实体是否为所述空壳公司的团伙的步骤包括:
92.对所述结构相似性、所述属性相似性与所述中心节点重要度相似度进行加权运算,得到加权相似度;
93.将所述加权相似度与第二预设相似度阈值进行对比;
94.若所述加权相似度大于或等于所述第二预设相似度阈值,则确定所述第二子图谱中的实体为所述空壳公司的团伙。
95.为了更好的理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
96.为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
97.参照图2,图2为本技术第一实施例提供的一种空壳公司识别方法的流程示意图。
该实施例中,所述空壳公司识别方法包括以下步骤:
98.步骤s10,获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;
99.本实施例中空壳公司识别方法应用于空壳公司识别系统,该空壳公司识别系统可以部署于智能终端或服务器中以执行空壳公司识别方法,本实施例中通过空壳公司识别系统执行空壳公司识别方法,可以根据待识别企业的实体信息与企业投资关系信息构建有向知识图谱,并在检测有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
100.具体地,当存在企业需要向金融机构进行金融业务例如贷款、保险等业务办理时,需要向金融机构提供其企业信息,其中该企业信息可以包括企业营业执照,以便于金融结构根据企业信息对该企业进行审核以确定是否对该企业进行业务的办理。但是当前空壳公司是金融机构需要警惕的重要风险之一,因此金融机构需要根据该企业提供的企业信息判断该企业是否与空壳公司存在关联。因此,金融机构可以通过空壳公司识别系统将该企业作为待识别企业,并将待识别企业的企业信息输入至空壳公司识别系统中。
101.进一步地,空壳公司识别系统获取待识别企业的营业执照,根据营业执照构建待识别企业的企业实体,具体可以为抽取营业执照中企业信息作为企业实体各类属性信息,以及构建个人实体,具体可以为抽取营业执照中法定代表人作为个人实体信息,得到待识别企业由企业实体与个人实体组成的实体信息;同时,构建企业实体与个人实体的法定代表关系,并抽取企业投资关系信息,具体可以为构建企业实体与企业实体间的投资关系。进一步地,根据实体信息、企业投资关系信息与法定代表关系信息构建有向知识图谱,具体可以为以实体信息中的企业实体、个人实体作为实体,企业投资关系信息中的企业间投资关系以及法定代表关系信息中的企业与个人间法定代表关系为边,构建有向知识图谱。以便于后续确定有向知识图谱中是否存在可疑实体,并在有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,以此可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
102.步骤s20,确定所述有向知识图谱中是否存在可疑实体;
103.在根据实体信息、企业投资关系信息与法定代表关系信息构建有向知识图谱后,本实施例可以通过规则模型结合有向知识图谱识别是否存在空壳公司,其中,规则模型主要识别一人法定代表/投资多家空壳公司、一家公司投资多家空壳公司的情景。具体地,可以先确定有向知识图谱中是否存在中心节点;若不存在中心节点,则可以结束当前的空壳公司识别流程。若存在中心节点,则根据中心节点对有向知识图谱中的所有实体进行实体筛选,得到实体集合,需要说明的是,实体集合包括中心节点对应实体的各连出企业,中心节点可能为一个或多个;分别确定实体集合中两两连出企业之间的相似度;根据各相似度确定各连出企业是否为可疑实体,一个相似度可以确定相应的两个连出企业是否为可疑实体;若各连出企业均非可疑实体,则确定有向知识图谱中不存在可疑实体,可以结束当前的空壳公司识别流程。而若各连出企业中存在任一连出企业为可疑实体,则确定有向知识图谱中存在可疑实体。以在有向知识图谱中存在可疑实体时,根据可疑实体的数量确定可疑实体是否为空壳公司,以此可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识
别效率。
104.步骤s30,若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。
105.在确定有向知识图谱中是否存在可疑实体后,若确定有向知识图谱中存在可疑实体,则进一步确定实体集合中可疑实体的数量,具体为实体集合中注册地址相同的可疑实体的数量,通过确定可疑实体的数量是否达到空壳公司标准来判定可疑实体是否为空壳公司,其中,若注册地址相同的可疑实体的数量达到空壳公司标准,则判定可疑实体为空壳公司;若可疑实体的数量未达到空壳公司标准,则判定可疑实体非空壳公司,以此快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
106.进一步地,所述根据所述可疑实体的数量确定所述可疑实体是否为空壳公司的步骤包括:
107.步骤s31,将所述实体集合中注册地址相同的可疑实体确定为目标可疑实体,并确定所述目标可疑实体的数量;
108.步骤s32,将所述目标可疑实体的数量与预设数量阈值进行对比;
109.步骤s33,若所述目标可疑实体的数量大于或等于所述预设数量阈值,则确定各所述目标可疑实体均为空壳公司。
110.在确定有向知识图谱中存在可疑实体后,将实体集合的所有可疑实体中,注册地址相同的可疑实体确定为目标可疑实体,并统计所有可疑实体中注册地址相同的可疑实体的数量即目标可疑实体的数量,具体地,统计相似度大于或等于第一预设相似度阈值,且注册地址与其他连出企业的注册地址匹配的连出企业的数量,即确定相似度较高且注册地址还相同的连出企业的数量,其中,第一预设相似度阈值为根据实际需求设置的数值。在确定出目标可疑实体的数量后,将目标可疑实体的数量与预设的数量阈值进行对比,确定目标可疑实体的数量与预设数量阈值之间的大小关系,更具体地,可以对目标可疑实体的数量与预设数量阈值进行差值运算,并根据差值运算的结果来确定目标可疑实体的数量与预设数量阈值的大小关系。若经对比确定目标可疑实体的数量大于或等于预设数量阈值,说明可疑实体达到空壳公司判定标准,则确定各目标可疑实体均为空壳公司。其中,预设数量阈值为根据实际需求设置的数值。
111.本实施例提供一种空壳公司识别方法,获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;确定所述有向知识图谱中是否存在可疑实体;若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。本技术可以根据待识别企业的实体信息、企业投资关系信息与法定代表关系信息构建有向知识图谱,并在检测有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
112.进一步地,参照图3,基于本技术空壳公司识别方法的第一实施例,提出本技术空壳公司识别方法的第二实施例,在第二实施例中,所述确定所述有向知识图谱中是否存在可疑实体的步骤包括:
113.步骤s21,确定所述有向知识图谱中是否存在中心节点;
114.步骤s22,若存在所述中心节点,则根据所述中心节点对所述有向知识图谱中的所有实体进行实体筛选,得到实体集合,其中,所述实体集合包括所述中心节点对应实体的各连出企业;
115.步骤s23,分别确定所述实体集合中两两连出企业之间的相似度;
116.步骤s24,根据各所述相似度分别确定各所述连出企业是否为可疑实体;
117.步骤s25,若各所述连出企业中存在任一连出企业为可疑实体,则确定所述有向知识图谱中存在可疑实体。
118.在根据实体信息、企业投资关系信息与法定代表关系信息构建有向知识图谱后,先确定出有向知识图谱中是否存在中心节点,具体地,确定有向知识图谱中是否存在出度超过一定范围的实体,例如出度超过3、出度超过4、出度超过5等的实体,若不存在则确定有向知识图谱中不存在中心节点,可以结束当前的空壳公司识别流程。若存在则将该实体确定为中心节点,若存在多个该实体,则说明存在多个中心节点。进一步地,针对每一中心节点,可以通过中心节点对有向知识图谱中的所有实体进行实体筛选,具体地,确定该中心节点的实体连出的所有实体对应的连出企业,并由该中心节点的实体连出的所有实体对应的连出企业组成实体集合。若存在多个中心节点,也可以直接由多个中心节点的实体连出的所有实体对应的连出企业组成实体集合。
119.进一步地,分别确定实体集合中每一中心节点的各连出企业之间两两连出企业的相似度,具体地,分别比较实体集合中每一中心节点对应各连出企业与其他连出企业之间的两两名字相似性,根据各连出企业之间两两的名字相似性分别确定出各连出企业之间的相似度,例如,实体集合中包括中心节点1连出的10个实体对应的连出企业,则分别计算每一连出企业与其他9个连出企业之间的相似度,以此确定每一连出企业是否为可疑实体。进一步地,分别确定各连出企业之间两两的相似度是否大于或等于第一预设相似度阈值,当相似度大于或等于第一预设相似度阈值时进一步确定该相似度对应的两连出企业的注册地址是否匹配;并在该相似度对应的两连出企业的注册地址匹配时,确定该连出企业及该相似度对应的另一连出企业为可疑实体。而若相似度小于第一预设相似度阈值,或相似度大于或等于第一预设相似度阈值,但该相似度对应的两连出企业的注册地址不匹配,则确定该连出企业非可疑实体。以此类推,直至分别确定出所有连出企业是否为可疑实体。若各连出企业均非可疑实体,则确定有向知识图谱中不存在可疑实体,可以结束当前的空壳公司识别流程。而若各连出企业中存在任一连出企业为可疑实体,则确定有向知识图谱中存在可疑实体。在有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,以此可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
120.进一步地,所述根据各所述相似度分别确定各所述连出企业是否为可疑实体的步骤包括:
121.步骤s241,针对各所述连出企业,分别执行步骤s242-s244:
122.步骤s242,针对当前连出企业与所述实体集合中连出企业之间的名字相似度,与第一预设相似度阈值进行对比;
123.步骤s243,若所述相似度大于或等于所述第一预设相似度阈值,则确定所述相似度对应的两连出企业的注册地址是否匹配;
124.步骤s244,若所述相似度对应的两连出企业的注册地址匹配,则确定当前连出企业及相应的其他连出企业为可疑实体。
125.在根据各相似度分别确定各连出企业是否为可疑实体时,确定当前需要进行确定的连出企业,获取当前连出企业与其他连出企业的其中一个连出企业之间的相似度,将该相似度与第一预设相似度阈值进行对比,确定该相似度与第一预设相似度阈值之间的大小关系,更具体地,可以将该相似度与第一预设相似度阈值进行差值运算,并根据差值运算结果确定出该相似度与第一预设相似度阈值之间的大小关系。进一步地,若经对比确定该相似度大于或等于第一预设相似度阈值,则获取该相似度对应两连出企业的注册地址,并进一步将两连出企业的注册地址进行匹配,确定两连出企业的注册地址是否匹配,具体地,注册地址具体可以为注册地市,即将两连出企业的注册地市进行匹配,确定两连出企业的注册地市是否相同,若相同则确定两连出企业的注册地址匹配;若不相同则确定两连出企业的注册地址不匹配。进一步地,若确定两连出企业的注册地址匹配,即两连出企业的相似度大于或等于第一预设相似度阈值,且注册地市相同,则判定该相似度对应的两连出企业即当前连出企业及相应的一其他连出企业为可疑实体。再获取下一连出企业与其他连出的相似度并与第一预设相似度阈值进行对比,或获取当前连出企业与另一其他连出企业的相似度并与第一预设相似度阈值进行对比,当相似度大于或等于第一预设相似度阈值且该相似度对应两连出企业的注册地址相同时确定两连出企业为可疑实体。以此类推,直至分别确定出所有连出企业是否为可疑实体。以在有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,以此可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
126.本实施例可以先确定有向知识图谱中是否存在中心节点;若存在中心节点,则根据中心节点对有向知识图谱中的所有实体进行实体筛选,得到实体集合;分别确定实体集合中两两连出企业之间的相似度;根据各相似度分别确定各连出企业是否为可疑实体;若各连出企业中存在任一连出企业为可疑实体,则确定有向知识图谱中存在可疑实体。以在有向知识图谱中存在可疑实体时,根据可疑实体的数量准确地确定可疑实体是否为空壳公司,以此可以快速、便捷且准确地识别空壳公司,有效提高空壳公司的识别效率。
127.进一步地,参照图4,基于本技术空壳公司识别方法的第一实施例,提出本技术空壳公司识别方法的第三实施例,在第三实施例中,所述确定各所述目标可疑实体均为空壳公司的步骤之后,还包括:
128.步骤s40,从所述有向知识图谱中获取所述空壳公司对应的第一子图谱;
129.步骤s50,确定所述中心节点在所述有向知识图谱中的第二子图谱;
130.步骤s60,基于所述第一子图谱确定所述第二子图谱中的实体是否为所述空壳公司的团伙。
131.可以理解地,在确定有向知识图谱中的空壳公司之后,本实施例中还可以准确地确定有向知识图谱中是否存在该空壳公司的团伙。具体地,从有向知识图谱中获取在空壳公司n跳的实体及其边(即关系)组成的第一子图谱,其中n为0,1,2...,可以根据实际需求选择相应的数值;同时,从有向知识图谱中确定出中心节点,具体为确定有向知识图谱中出度超过m的个人或企业,其中m为0,1,2...,可以根据实际需求选择相应的数值,并且,中心节点可能为一个或多个;并进一步从有向知识图谱中获取在中心节点n跳的实体及其边组
成的第二子图谱。进一步地,提取第一子图谱的第一待比较特征以及第二子图谱的第二待比较特征;根据第一待比较特征与第二待比较特征分别确定第一子图谱与第二子图谱的结构相似性、属性相似性、中心节点重要度相似性;根据结构相似性、属性相似性与中心节点重要度相似度确定第二子图谱中的实体是否为空壳公司的团伙。可以准确地挖掘出空壳公司背后潜在的团伙关系,有利于大规模推广应用,帮助金融机构建立统一的、标准化的空壳公司风险防范能力和体系。
132.进一步地,所述基于所述第一子图谱确定所述第二子图谱中的实体是否为所述空壳公司的团伙的步骤包括:
133.步骤s61,提取所述第一子图谱的第一待比较特征以及所述第二子图谱的第二待比较特征;
134.步骤s62,根据所述第一待比较特征与所述第二待比较特征分别确定所述第一子图谱与所述第二子图谱的结构相似性、属性相似性、中心节点重要度相似性;
135.步骤s63,根据所述结构相似性、所述属性相似性与所述中心节点重要度相似度确定所述第二子图谱中的实体是否为所述空壳公司的团伙。
136.在获取到空壳公司对应的第一子图谱与中心节点对应的第二子图谱后,提取第一子图谱的第一核心结构、第一图谱属性与第一中心节点特征,得到第一子图谱的第一待比较特征,以及提取第二子图谱的第二核心结构、第二图谱属性与第二中心节点特征,得到第二子图谱的第二待比较特征,其中,核心结构指有向知识图谱中出度不为0的最大连通子图,图谱属性涵盖相似名字企业占比、相同注册地企业占比,中心节点特征提取涵盖中心节点重要度。进一步地,通过利用weisfeiler-lehman kernel算法结合第一核心结构与第二核心结构得到图上独一无二的特征集合作为图是否相似的判别依据,比较第一子图谱与第二子图谱的结构相似性;利用levenshtein distance编辑距离算法结合第一图谱属性与第二图谱属性判断中心节点连接企业的特定属性相似性,确定出第一子图谱与第二子图谱的属性相似性;利用pagerank算法结合第一中心节点特征与第二中心节点特征计算不同图谱上的节点重要度,得到第一子图谱与第二子图谱的中心节点重要度相似性。进一步地,根据结构相似性、属性相似性与中心节点重要度相似度确定第二子图谱中的实体是否为空壳公司的团伙。可以准确地挖掘出空壳公司背后潜在的团伙关系,有利于大规模推广应用,帮助金融机构建立统一的、标准化的空壳公司风险防范能力和体系。
137.具体地,所述根据所述结构相似性、所述属性相似性与所述中心节点重要度相似度确定所述第二子图谱中的实体是否为所述空壳公司的团伙的步骤包括:
138.步骤s651,对所述结构相似性、所述属性相似性与所述中心节点重要度相似度进行加权运算,得到加权相似度;
139.步骤s652,将所述加权相似度与第二预设相似度阈值进行对比;
140.步骤s653,若所述加权相似度大于或等于所述第二预设相似度阈值,则确定所述第二子图谱中的实体为所述空壳公司的团伙。
141.在确定出第一子图谱与第二子图谱的结构相似性、属性相似性、中心节点重要度相似性后,对结构相似性、属性相似性与中心节点重要度相似度进行加权运算,得到加权相似度;将得到的加权相似度与第二预设相似度阈值进行对比,确定加权相似度与第二预设相似度阈值之间的大小关系,其中,第二预设相似度阈值为根据实际识别需求设置的数值。
具体地,可以将加权相似度与第二预设相似度阈值进行差值运算,根据差值运算的结果确定加权相似度与第二预设相似度阈值之间的大小关系。进一步地,若经对比确定加权相似度大于或等于第二预设相似度阈值,则确定第二子图谱中的实体为所述空壳公司的团伙,存在多个这样的中心节点,则分别确定多个中心节点均为该空壳公司的团伙。
142.本实施例在确定有向知识图谱中的空壳公司之后,还可以准确地确定有向知识图谱中是否存在该空壳公司的团伙。通过准确地挖掘出空壳公司背后潜在的团伙关系,有利于大规模推广应用,帮助金融机构建立统一的、标准化的空壳公司风险防范能力和体系。
143.进一步地,本技术还提供一种空壳公司识别装置。
144.参照图5,图5为本技术空壳公司识别装置第一实施例的功能模块示意图。
145.所述空壳公司识别装置包括:
146.构建模块10,用于获取待识别企业的实体信息、企业投资关系信息与法定代表关系信息,根据所述实体信息、所述企业投资关系信息与所述法定代表关系信息构建有向知识图谱;
147.第一确定模块20,用于确定所述有向知识图谱中是否存在可疑实体;
148.第二确定模块30,用于若所述有向知识图谱中存在所述可疑实体,则根据所述可疑实体的数量确定所述可疑实体是否为空壳公司。
149.此外,本技术还提供一种介质,所述介质优选为计算机可读存储介质,其上存储有空壳公司识别程序,所述空壳公司识别程序被处理器执行时实现上述空壳公司识别方法各实施例的步骤。
150.此外,本技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述空壳公司识别方法各实施例的步骤。
151.在本技术空壳公司识别设备、计算机可读存储介质和计算机程序产品的实施例中,包含了上述空壳公司识别方法各实施例的全部技术特征,说明和解释内容与上述空壳公司识别方法各实施例基本相同,在此不做赘述。
152.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
153.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
154.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是固定终端,如物联网智能设备,包括智能空调、智能电灯、智能电源、智能路由器等智能家居;也可以是移动终端,包括智能手机、可穿戴的联网ar/vr装置、智能音箱、自动驾驶汽车等诸多联网设备)执行本技术各个实施例所述的方法。
155.以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本申
请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献