一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

名单数据过滤方法、装置、电子设备及可读存储介质与流程

2022-11-23 14:36:37 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,具体而言,本技术涉及一种名单数据过滤方法、装置、电子设备及可读存储介质。


背景技术:

2.随着计算机技术的发展,越来越多的业务被转移到线上处理。在许多业务中,都存在进行名单筛查的业务需求,比如在进行某项业务时,需要首先判断待处理的名单数据是否位于黑名单或者白名单,根据名单筛查结果确定是否进行后续业务。
3.目前的名单筛查方法较为简单,一般而言是通过将筛查条件与名单数据的属性进行简单匹配,根据匹配程度确定名单数据是否命中。然而,单纯根据匹配程度确定出的命中名单数据对应的属性中可能出现不满足有效属性条件的无效属性,使得直接使用匹配程度难以准确地确定出有效的命中名单数据,从而影响名单数据筛查的准确性。


技术实现要素:

4.本技术实施例的目的旨在能解决名单数据筛查的准确性不高的问题。
5.本技术实施例提供了一种名单数据过滤方法,该方法包括:
6.基于目标筛查条件从待过滤名单中确定出至少一个候选名单数据;
7.确定目标筛查条件对应的至少一个目标属性;
8.基于至少一个目标属性,从多个预设属性中确定与至少一个目标属性均不匹配的无效属性;其中,每一预设属性设置有对应的初始权重;
9.基于无效属性的初始权重重新分配至少一个目标属性的属性权重,得到各个目标属性对应的第一属性权重;
10.基于各个目标属性对应的第一属性权重分别获取各个候选名单数据的名单数据权重,并根据名单数据权重从至少一个候选名单数据中确定出有效名单数据。
11.在第一方面的可选实施例中,方法还包括:
12.设置每一预设属性对应的初始权重,预设属性的初始权重之和为1。
13.在第一方面的可选实施例中,基于无效属性的初始权重重新分配至少一个目标属性的属性权重,包括:
14.对无效属性的初始权重进行求和,得到待分配权重值;
15.根据待分配权重值重新分配至少一个目标属性的属性权重。
16.在第一方面的可选实施例中,根据待分配权重值重新分配至少一个目标属性的属性权重,包括:
17.确定至少一个目标属性的属性权重之间的比例关系,根据比例关系将待分配权重重新分配至至少一个目标属性的属性权重;分配后的至少一个目标属性的第一属性权重之和为1。
18.在第一方面的可选实施例中,每一目标属性设置有对应的有效属性条件,基于各
个目标属性对应的第一属性权重分别获取各个候选名单数据的名单数据权重,包括:
19.基于有效属性条件从至少一个目标属性中确定出有效目标属性,将至少一个目标属性中除了有效目标属性以外的属性作为无效目标属性;
20.基于无效目标属性对各个有效目标属性对应的第一属性权重进行重新分配,得到各个有效目标属性的第二属性权重;
21.针对每一候选名单数据,获取候选名单数据对应的至少一个有效目标属性,确定对应的各个有效目标属性的匹配率,基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重;匹配率用于表征有效目标属性与目标筛查条件之间的匹配程度。
22.在第一方面的可选实施例中,基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重,包括:
23.将各个有效目标属性的匹配率和第二属性权重相乘,得到各个有效目标属性的目标匹配率;对各个有效目标属性的目标匹配率进行求和,得到候选名单数据的名单数据权重。
24.在第一方面的可选实施例中,根据名单数据权重从至少一个候选名单数据中确定出有效名单数据,包括:
25.获取预设的名单数据权重阈值;
26.将名单数据权重大于名单数据权重阈值的候选名单数据作为有效名单数据。
27.第二方面,提供了一种名单数据过滤装置,该装置包括:
28.名单数据筛查模块,用于基于目标筛查条件从待过滤名单中确定出至少一个候选名单数据;
29.无效属性确定模块,用于确定目标筛查条件对应的至少一个目标属性;基于至少一个目标属性,从多个预设属性中确定与至少一个目标属性均不匹配的无效属性;其中,每一预设属性设置有对应的初始权重;
30.权重重新分配模块,用于基于无效属性的初始权重重新分配至少一个目标属性的属性权重,得到各个目标属性对应的第一属性权重;
31.名单数据确定模块,用于基于各个目标属性对应的第一属性权重分别获取各个候选名单数据的名单数据权重,并根据名单数据权重从至少一个候选名单数据中确定出有效名单数据。
32.第三方面,提供了一种电子设备,该电子设备包括:
33.存储器、处理器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现上述任一实施例的名单数据过滤方法。
34.第四方面,提供了一种可读存储介质,可读存储介质上存储有程序,该程序被处理器执行时实现上述任一实施例的名单数据过滤方法。
35.上述的名单数据过滤方法,包括:根据目标筛查条件从待过滤名单中确定出至少一个候选名单数据,然后基于目标筛查条件对应的至少一个目标属性,从多个预设属性中确定出与至少一个目标属性均不匹配的无效属性。可以根据无效属性的初始权重提升各个目标属性的属性权重,得到各个目标属性对应的第一属性权重,再根据各个目标属性对应的第一属性权重获取各个候选名单数据的名单数据权重,通过判断名单数据权重是否大于
预设的名单数据权重阈值来确定出最终的有效名单数据,提高了名单数据筛查的准确性,使筛查出的名单数据更加有应用价值。
附图说明
36.为了更清楚地说明本技术实施例中的技术方案,下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
37.图1为本技术实施例提供的一种名单数据过滤方法的流程示意图;
38.图2为本技术实施例提供的一种名单数据过滤方法的流程示意图;
39.图3为本技术实施例提供的一种名单数据过滤方法的流程示意图;
40.图4为本技术实施例提供的一种名单数据过滤装置的结构示意图;
41.图5为本技术实施例提供的一种用于名单数据过滤的电子设备的结构示意图。
具体实施方式
42.下面结合本技术中的附图描述本技术的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本技术实施例的技术方案的示例性描述,对本技术实施例的技术方案不构成限制。
43.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“a和/或b”可以实现为“a”,或者实现为“b”,或者实现为“a和b”。
44.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
45.随着计算机技术的发展,越来越多的业务被转移到线上处理。在许多业务中,都存在进行名单筛查的业务需求,比如在进行某项业务时,需要首先判断待处理的名单数据是否位于黑名单或者白名单,根据名单筛查结果确定是否进行后续业务。
46.目前的名单筛查方法较为简单,一般而言是通过将筛查条件与名单数据的属性进行简单匹配,根据匹配程度确定名单数据是否命中。
47.然而,在名单筛查的业务应用过程中,不同业务渠道在筛查时,对不同类型名单的筛查条件可能不尽相同,而且对于被命中的名单如果某个筛查条件对应的属性不存在,可能不同渠道的处理要求也不一样,单纯根据匹配程度确定出的命中名单数据对应的属性中可能出现不满足有效属性条件的无效属性,使得直接使用匹配程度难以准确地确定出命中名单数据,从而影响名单数据筛查的准确性。
48.本技术提供的名单数据过滤方法、装置、电子设备及可读存储介质,旨在解决现有技术的如上技术问题。
49.下面通过对几个示例性实施方式的描述,对本技术实施例的技术方案以及本技术的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
50.本技术实施例中提供了一种名单数据过滤方法,如图1所示,该方法包括:
51.步骤s101,基于目标筛查条件从待过滤名单中确定出至少一个候选名单数据。
52.本技术所提供的名单数据过滤方法可以应用于任何具有名单数据过滤需求的业务系统。
53.针对不同业务场景的不同业务系统可以对应于不同的待过滤名单,不同的筛查条件。同一业务系统中针对不同的业务需求也可以存在多种可选择的筛查条件,对此,本技术不做限制。
54.可以从多种筛查条件中确定出目标筛查条件,根据目标筛查条件从过滤名单中确定出至少一个候选名单数据。
55.具体根据目标筛查条件进行筛查的方法本技术不做限制,仅作为示例,提供如下一种方案:目标筛查条件可以对应于至少一个目标属性以及各个目标属性的目标属性值,可以根据各个目标属性的目标属性值从待过滤名单中确定出至少一个候选名单数据。
56.每个候选名单数据对应的属性包含所有目标属性,并且,候选名单数据中目标属性的目标属性值与目标筛查条件中的目标属性的目标属性值相匹配。是否相匹配的判断方法可以根据预设的匹配率阈值,当候选名单数据的目标属性值与筛查条件的目标属性值的匹配率大于匹配率阈值时,认为两者相匹配。
57.例如,目标筛查条件中的目标属性可以为“名称”、“地址”和“账号”,基于目标筛查条件确定出的候选名单数据的属性可以包括“名称”、“地址”和“账号”这几种目标属性。假设目标筛查条件中的“名称”、“地址”和“账号”的属性值分别为“北京有限公司”、“北京”和“beijing”,候选名单数据中“名称”、“地址”和“账号”的属性值分别为“北京快乐有限公司”、“北京三里屯”和“beijingkuaile”。针对任一项目标属性,例如“名称”,目标筛查条件中的“北京有限公司”和候选名单数据中的“北京快乐有限公司”之间的匹配率满足预设的匹配率阈值,因此,可以认为两者相匹配。同理,在其他两项目标属性的属性值也相匹配的情况下,确定出该候选名单数据。
58.匹配率的计算方法可以为计算两个字符串之间的相似度,本技术不做限制。
59.步骤s102,确定目标筛查条件对应的至少一个目标属性;基于至少一个目标属性,从多个预设属性中确定与至少一个目标属性均不匹配的无效属性;其中,每一预设属性设置有对应的初始权重。
60.在本技术实施例中,目标筛查条件可以对应于至少一个目标属性,可以基于至少一个目标属性,从多个预设属性中确定出于至少一个目标属性均不匹配的无效属性,其中,不匹配可以是指属性的名称不同,而无效属性可以是指预设属性中与任意一个目标属性的名称均不相同的属性。
61.即可以将预设属性中除了与至少一个目标属性属性名称一致的其他属性作为无效属性,也可以直接理解为将预设属性中除了目标属性之外的其他属性作为无效属性。
62.每一预设属性均设置有对应的初始权重。
63.在一个示例中,预设属性可以包括“属性1”、“属性2”、“属性3”、“属性4”、“属性5”、和“属性6”,目标属性可以包括“属性1”、“属性2”和“属性6”,则在这种情况下,可以认为“属性3”、“属性4”和“属性5”为无效属性。
64.在本技术实施例中,可以预先设置每一预设属性对应的初始权重,并且,预设属性的初始权重之和为1。
65.例如,若存在预设属性“属性1”、“属性2”、“属性3”、“属性4”、“属性5”、和“属性6”,可以分别设置各个预设属性的初始权重为“0.1”、“0.2”、“0.05”、“0.25”、“0.1”和“0.4”。各个预设属性的初始权重之和为1。
66.在一些实施例中,不同业务场景中的不同业务系统的各个预设属性的初始权重可以不同,预设属性的种类也可以不同,对此,本技术不做限制。
67.在一些实施例中,不同的待过滤名单可以为不同的类别,可以根据待过滤名单的类别确定适用于过滤该待过滤名单的预设属性以及各个预设属性的初始权重。
68.步骤s103,基于无效属性的初始权重重新分配至少一个目标属性的属性权重,得到各个目标属性对应的第一属性权重。
69.在本技术实施例中,各个预设属性设置有对应的初始权重,在确定出预设属性中的无效属性之后,可以根据预设属性中的无效属性的初始权重重新分配各个目标属性的属性权重,得到各个目标属性对应的第一属性权重。
70.在本技术实施例中,基于无效属性的初始权重重新分配至少一个目标属性的属性权重,可以包括如下步骤:
71.(1)对无效属性的初始权重进行求和,得到待分配权重值。例如,预设属性包括“属性1”、“属性2”和“属性3”,上述几个属性的初始权重可以分别为“0.5”、“0.3”和“0.2”。假设“属性1”不属于目标属性,则“属性1”可以作为无效属性,待分配权重值为“0.5”。
72.(2)根据待分配权重值重新分配至少一个目标属性的属性权重。
73.具体的,可以将待分配权重值进行拆分,拆分为多个部分,分别分配给各个目标属性。例如,当“属性1”为无效属性,待分配权重值为“0.5”时可以将“0.5”重新分配给两个目标属性“属性2”和“属性3”。
74.在本技术实施例中,根据待分配权重值重新分配至少一个目标属性的属性权重,可以包括如下步骤:
75.确定至少一个目标属性的属性权重之间的比例关系,根据比例关系将待分配权重重新分配至至少一个目标属性的属性权重;分配后的至少一个目标属性的属性权重之和为1。
76.例如,预设属性包括“属性1”、“属性2”和“属性3”,上述几个属性的初始权重可以分别为“0.5”、“0.3”和“0.2”。假设“属性1”不属于目标属性,则“属性1”可以作为无效属性,待分配权重值为“0.5”。
[0077]“属性2”和“属性3”的属性权重之间的比例关系为3:2,因此,可以根据比例关系将待分配权重值“0.5”分配给“属性2”和“属性3”,即“0.5”中的“0.3”分配给“属性2”,“0.2”分配给“属性3”,重新分配后的“属性2”和“属性3”的第一属性权重分别为“0.6”和“0.4”,和依然为1。
[0078]
步骤s104,基于各个目标属性对应的第一属性权重分别获取各个候选名单数据的
名单数据权重,并根据名单数据权重从至少一个候选名单数据中确定出有效名单数据。
[0079]
在本技术实施例中,名单数据权重用于表征候选名单数据的有效性,可以根据各个目标属性对应的第一属性权重分别获取各个候选名单数据的名单数据权重,并根据名单数据权重确定各个候选名单数据是否有效,从而确定出有效名单数据,以提升名单数据过滤的准确性。
[0080]
在本技术实施例中,根据名单数据权重从至少一个候选名单数据中确定出有效名单数据,可以包括如下步骤:获取预设的名单数据权重阈值;将名单数据权重大于名单数据权重阈值的候选名单数据作为有效名单数据。
[0081]
上述的名单数据过滤方法,包括:根据目标筛查条件从待过滤名单中确定出至少一个候选名单数据,然后基于目标筛查条件对应的至少一个目标属性,从多个预设属性中确定出与至少一个目标属性均不匹配的无效属性。可以根据无效属性的初始权重提升各个目标属性的属性权重,得到各个目标属性对应的第一属性权重,再根据各个目标属性对应的第一属性权重获取各个候选名单数据的名单数据权重,通过判断名单数据权重是否大于预设的名单数据权重阈值来确定出最终的有效名单数据,提高了名单数据筛查的准确性,使筛查出的名单数据更加有应用价值。
[0082]
本技术实施例中提供了一种可能的实现方式,每一目标属性可以设置有对应的有效属性条件。本技术对有效属性条件的具体形式和内容不做限制,例如,对于属性值为数值型的属性,其有效属性条件可以是属性值的范围,对于属性值为字段的属性,其有效属性条件可以是预设关键字或者要求属性值的字段中包含预设的内容。在一个示例中,存在目标属性“地址”,其对应的有效属性条件可以是要求“地址”这一属性的属性值中必须包含国家级别以下的地点名称(例如省或者州)。假设有个名单数据的“地址”属性的属性值中只包含“国家a”,并未包含国家级别以下的地点名称,则“地址”这一目标属性对于该名单数据而言属于无效目标属性。
[0083]
具体的,基于各个目标属性对应的第一属性权重分别获取各个候选名单数据的名单数据权重,可以包括如下步骤:
[0084]
(1)针对每一候选名单数据,基于有效属性条件从至少一个目标属性中确定出候选名单数据对应的有效目标属性,将至少一个目标属性中除了有效目标属性以外的属性作为候选名单数据对应的无效目标属性。
[0085]
具体的,由于各个候选名单数据针对同一目标属性的属性值可能不同,可能一部分候选名单数据针对该目标属性的属性值满足有效属性条件,而另一部分候选名单数据针对该目标属性的属性值不满足有效属性条件,各个候选名单数据对应的有效目标属性、无效目标属性可能是不同的。
[0086]
(2)基于无效目标属性对各个有效目标属性对应的第一属性权重进行重新分配,得到候选名单数据对应的各个有效目标属性的第二属性权重。
[0087]
其中,基于无效目标属性对各个有效目标属性对应的第一属性权重进行重新分配的方式与第一次进行重新分配得到第一属性权重的方式可以相同,具体包括如下步骤:
[0088]
对无效目标属性的第一属性权重进行求和,得到第一权重值。确定各个有效目标属性的第一属性权重之间的比例关系,根据比例关系将第一权重值重新分配给各个有效目标属性,得到候选名单数据对应的各个有效目标属性的第二属性权重。
[0089]
(3)获取候选名单数据对应的各个有效目标属性的匹配率,基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重;匹配率用于表征有效目标属性与目标筛查条件之间的匹配程度。
[0090]
具体的,候选名单数据的任一有效目标属性的匹配率可以指候选名单数据中有效目标属性的属性值与目标筛查条件中有效目标属性的属性值之间的匹配率。目标筛查条件包括至少一个目标属性的参考属性值(即用于筛查的参考值),而有效目标属性是从至少一个目标属性中确定出来的,因此,目标筛查条件自然包括有效目标属性的参考属性值。
[0091]
在本技术实施例中,可以计算出目标筛查条件中有效目标属性的参考属性值与候选名单数据中有效目标属性的属性值之间的相似度,将相似度作为匹配率。
[0092]
在本技术实施例中,基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重,包括:
[0093]
将各个有效目标属性的匹配率和第二属性权重相乘,得到各个有效目标属性的目标匹配率;对各个有效目标属性的目标匹配率进行求和,得到候选名单数据的名单数据权重。
[0094]
具体的,在获取候选名单数据对应的各个有效目标属性的匹配率之后,可以基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重。其中,针对每一有效目标属性,将该有效目标目标的匹配率和第二属性权重相乘,得到该目标属性的目标匹配率,然后对该候选名单数据对应的所有有效目标属性的目标匹配率相加,得到候选名单数据的名单数据权重。通过上述方法进行两次属性权重的重新分配之后,最终计算得到的名单数据权重可以更准确的评估名单数据的有效性。
[0095]
在一个示例中,假设候选名单数据对应的有效目标属性为“属性1”、“属性2”和“属性3”,各个有效目标属性的匹配率分别为“100%”、“50%”和“100%”,第二属性权重分别为“0.375”、“0.5”和“0.125”,则可以通过公式(1)计算得到该候选名单数据的名单数据权重为0.75。
[0096]
0.375*1.0 0.5*0.5 0.125*1.0=0.375 0.25 0.125=0.75公式(1)
[0097]
在一个示例中,本技术所提供的名单数据过滤方法如图2所示,可以包括如下步骤:
[0098]
步骤s201,基于目标筛查条件从待过滤名单中确定出至少一个候选名单数据;
[0099]
步骤s202,确定目标筛查条件对应的至少一个目标属性;基于至少一个目标属性,从多个预设属性中确定与至少一个目标属性均不匹配的无效属性;其中,每一预设属性设置有对应的初始权重,预设属性的初始权重之和为1;
[0100]
步骤s203,对无效属性的初始权重进行求和,得到待分配权重值;
[0101]
步骤s204,确定至少一个目标属性的属性权重之间的比例关系,根据比例关系将待分配权重重新分配至至少一个目标属性的属性权重,得到各个目标属性对应的第一属性权重;分配后的至少一个目标属性的第一属性权重之和为1;
[0102]
步骤s205,基于有效属性条件从至少一个目标属性中确定出有效目标属性,将至少一个目标属性中除了有效目标属性以外的属性作为无效目标属性;
[0103]
步骤s206,基于无效目标属性对各个有效目标属性对应的第一属性权重进行重新分配,得到各个有效目标属性的第二属性权重;
[0104]
步骤s207,针对每一候选名单数据,获取候选名单数据对应的至少一个有效目标属性,确定对应的各个有效目标属性的匹配率,基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重;
[0105]
步骤s208,获取预设的名单数据权重阈值,将所述名单数据权重大于所述名单数据权重阈值的候选名单数据作为有效名单数据。
[0106]
在实际应用场景中,本技术所提供的名单数据过滤方法可以应用于名单管理监测平台,用于准确地对名单进行筛查。
[0107]
名单可以理解为被制裁的实体或个人,这些实体或个人通常用于做筛查匹配的属性有:名称、地址、证件、国家、账号等,可以将名单以及名单对应于各个属性的属性值作为名单数据。具体而言,名单数据过滤方法可以包括如下步骤:
[0108]
第一步,配置权重规则。权重规则中可以包含本系统内所有属性分别对应的初始权重值,所有属性的初始权重值之和为1。
[0109]
第二步,根据需求确定目标筛查条件,对待过滤名单进行筛查,从待过滤名单中确定出至少一个候选名单数据。同时,确定目标筛查条件对应的属性,然后判断权重规则中哪些属性与目标筛查条件对应,哪些属性与目标筛查条件无关。其中,目标筛查条件可以包括针对多个属性的参考属性值。
[0110]
可以将与筛查条件无关的属性作为无效属性剔除,然后将无效属性的初始权重进行求和,并按照比例关系重新分配给与目标筛查条件对应的目标属性,使重新分配后的目标属性的第一属性权重之和仍然为1。其中,比例关系可以指各个目标属性的初始权重之比。
[0111]
在一个示例中,预设属性包括“属性1”、“属性2”和“属性3”,上述几个属性的初始权重可以分别为“0.5”、“0.3”和“0.2”。假设“属性1”不属于目标属性,则“属性1”可以作为无效属性,待分配权重值为“0.5”。
[0112]“属性2”和“属性3”的属性权重之间的比例关系为3:2,因此,可以根据比例关系将待分配权重值“0.5”分配给“属性2”和“属性3”,即“0.5”中的“0.3”分配给“属性2”,“0.2”分配给“属性3”,重新分配后的“属性2”和“属性3”的第一属性权重分别为“0.6”和“0.4”,和依然为1。
[0113]
第三步,除了判断权重规则对应的哪些属性为有效属性,哪些属性为无效属性,还可以对各个候选名单数据的各个属性值的有效性进行判断。
[0114]
具体的,每一目标属性设置有对应的有效属性条件,针对每一候选名单数据,可以基于有效属性条件判断该候选名单数据的各个属性值是否有效,将满足有效属性条件的属性值对应的目标属性作为候选名单数据的有效目标属性,将不满足有效属性条件的属性值对应的目标属性作为候选名单数据的无效目标属性。
[0115]
第四步,基于无效目标属性对各个有效目标属性对应的第一属性权重进行重新分配,得到候选名单数据对应的各个有效目标属性的第二属性权重。
[0116]
第五步,可以获取候选名单数据对应的各个有效目标属性的匹配率,基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重。
[0117]
具体的,可以将各个有效目标属性的匹配率和第二属性权重相乘,得到各个有效目标属性的目标匹配率;对各个有效目标属性的目标匹配率进行求和,得到候选名单数据
的名单数据权重。
[0118]
第六步,获取预设的名单数据权重阈值,将名单数据权重大于名单数据权重阈值的候选名单数据作为有效名单数据。
[0119]
在一个示例中,本技术所提供的名单数据过滤方法,可以包括如图3所示的步骤:
[0120]
第一步,解析权重规则,得到每个权重属性的属性权重;
[0121]
第二步,判断所有权重属性是否有对应的筛查条件,若是,则获取命中名单信息,否则忽略不存在对应筛查条件的权重属性,提升其他权重属性的属性权重,然后再获取命中名单信息。
[0122]
第三步,判断命中名单信息中是否全部属性的属性值均有效,若是,则用属性权重和属性命中率相乘,并相加求和;否则,提升忽略无效的权重属性,提升其他权重属性的属性权重,再用属性权重和属性命中率相乘,并相加求和。
[0123]
第四步,判断相加后的值是否达到预设权重规则的权重总值,若是,保留该命中名单信息,否则,抛弃该命中名单信息。
[0124]
在一个示例中,预设的权重规则可以表达为如下表达式(1)。
[0125]
[name:0.3][credential:0.4][address:0.2][country:0.1]》=0.9
[0126]
表达式(1)
[0127]
其中,该权重规则包括名称、证件、地址和国家四种属性,以及各个属性的初始权重依次为“0.3”、“0.4”、“0.2”和“0.1”。右端的0.9表示名单数据权重阈值为0.9。
[0128]
在实际业务发生过程中,可能某一次接口的筛查条件中不包含关于地址这一属性的条件,则地址属于无效属性,可以基于地址的初始权重和比例关系对其他三项(名称、证件和国家)的属性权重进行重新分配,分配方式可以表示为表达式(2)~表达式(4)。
[0129]
[name:(0.2*0.3/(0.3 0.4 0.1) 0.3)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
表达式(2)
[0130]
[credential:(0.2*0.4/(0.3 0.4 0.1) 0.4)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
表达式(3)
[0131]
[country:(0.2*0.1/(0.3 0.4 0.1) 0.1)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
表达式(4)
[0132]
计算后得出结果为:名称的第一属性权重为0.375,证件的第一属性权重为0.5,国家的第一属性权重为0.125。
[0133]
可以根据筛查条件中的名称、证件、国家对待过滤的名单数据进行匹配,假设最终统计出来得出名单编号分别为001、002和003的3条命中名单,其中001名单的名称匹配率为90%,名称本身没有有效的证件信息,国家匹配率为100%,针对001名单由于本身没有有效的证件信息,所以权重需要进一步调整,调整后的结果为:名称的第二属性权重为0.8,国家的第二属性权重为0.2。第二次进行权重分配的具体方法与第一次进行权重分配的方法类似。
[0134]
在获取到第二属性权重和匹配率之后,可计算得到001名单的名单数据权重。计算公式和计算结果如公式(2)。
[0135]
0.8*0.9 0.2*1.0=0.72 0.2=0.92
ꢀꢀꢀꢀ
公式(2)
[0136]
由于001名单名单数据权重为0.92,大于名单权重阈值0.9,所以001名单的命中结果有效。
[0137]
假设002名单的名称匹配率为100%,证件匹配率50%,国家匹配率100%,由于002名单的名称、证件和国家三个属性均有效,可以直接计算得到002名单的名单数据权重。计
算公式和计算结果如公式(3)。
[0138]
0.375*1.0 0.5*0.5 0.125*1.0=0.375 0.25 0.125=0.75
ꢀꢀꢀꢀꢀ
公式(3)
[0139]
由于002名单名单数据权重为0.75,小于名单权重阈值0.9,所以001名单的命中结果无效,最后被抛弃。
[0140]
本技术实施例提供了一种名单数据过滤装置,如图4所示,该名单数据过滤装置40可以包括:名单数据筛查模块401、无效属性确定模块402、权重重新分配模块403以及名单数据确定模块404,其中,
[0141]
名单数据筛查模块401,用于基于目标筛查条件从待过滤名单中确定出至少一个候选名单数据;
[0142]
无效属性确定模块402,用于确定目标筛查条件对应的至少一个目标属性;基于至少一个目标属性,从多个预设属性中确定与至少一个目标属性均不匹配的无效属性;其中,每一预设属性设置有对应的初始权重;
[0143]
权重重新分配模块403,用于基于无效属性的初始权重重新分配至少一个目标属性的属性权重,得到各个目标属性对应的第一属性权重;
[0144]
名单数据确定模块404,用于基于各个目标属性对应的第一属性权重分别获取各个候选名单数据的名单数据权重,并根据名单数据权重从至少一个候选名单数据中确定出有效名单数据。
[0145]
上述的名单数据过滤装置,包括:根据目标筛查条件从待过滤名单中确定出至少一个候选名单数据,然后基于目标筛查条件对应的至少一个目标属性,从多个预设属性中确定出与至少一个目标属性均不匹配的无效属性。可以根据无效属性的初始权重提升各个目标属性的属性权重,得到各个目标属性对应的第一属性权重,再根据各个目标属性对应的第一属性权重获取各个候选名单数据的名单数据权重,通过判断名单数据权重是否大于预设的名单数据权重阈值来确定出最终的有效名单数据,提高了名单数据筛查的准确性,使筛查出的名单数据更加有应用价值。
[0146]
在本技术实施例中,还包括初始权重设置模块,具体用于:
[0147]
设置每一预设属性对应的初始权重,预设属性的初始权重之和为1。
[0148]
在本技术实施例中,权重重新分配模块403在基于无效属性的初始权重重新分配至少一个目标属性的属性权重时,具体用于:
[0149]
对无效属性的初始权重进行求和,得到待分配权重值;
[0150]
根据待分配权重值重新分配至少一个目标属性的属性权重。
[0151]
在本技术实施例中,权重重新分配模块403在根据待分配权重值重新分配至少一个目标属性的属性权重时,具体用于:
[0152]
确定至少一个目标属性的属性权重之间的比例关系,根据比例关系将待分配权重重新分配至至少一个目标属性的属性权重;分配后的至少一个目标属性的第一属性权重之和为1。
[0153]
在本技术实施例中,名单数据确定模块404在每一目标属性设置有对应的有效属性条件,基于各个目标属性对应的第一属性权重分别获取各个候选名单数据的名单数据权重时,具体用于:
[0154]
基于有效属性条件从至少一个目标属性中确定出有效目标属性,将至少一个目标
属性中除了有效目标属性以外的属性作为无效目标属性;
[0155]
基于无效目标属性对各个有效目标属性对应的第一属性权重进行重新分配,得到各个有效目标属性的第二属性权重;
[0156]
针对每一候选名单数据,获取候选名单数据对应的至少一个有效目标属性,确定对应的各个有效目标属性的匹配率,基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重;匹配率用于表征有效目标属性与目标筛查条件之间的匹配程度。
[0157]
在本技术实施例中,名单数据确定模块404在基于对应的各个有效目标属性的匹配率和第二属性权重计算得到候选名单数据的名单数据权重时,具体用于:
[0158]
将各个有效目标属性的匹配率和第二属性权重相乘,得到各个有效目标属性的目标匹配率;对各个有效目标属性的目标匹配率进行求和,得到候选名单数据的名单数据权重。
[0159]
在本技术实施例中,名单数据确定模块404在根据名单数据权重从至少一个候选名单数据中确定出有效名单数据时,具体用于:
[0160]
获取预设的名单数据权重阈值;
[0161]
将名单数据权重大于名单数据权重阈值的候选名单数据作为有效名单数据。
[0162]
本技术实施例的装置可执行本技术实施例所提供的方法,其实现原理相类似,本技术各实施例的装置中的各模块所执行的动作是与本技术各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
[0163]
本技术实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现名单数据过滤方法的步骤,与相关技术相比可实现:提高了名单数据筛查的准确性,使筛查出的名单数据更加有应用价值。
[0164]
在一个可选实施例中提供了一种电子设备,如图5所示,图5所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本技术实施例的限定。
[0165]
处理器4001可以是cpu(central processing unit,中央处理器),通用处理器,dsp(digital signal processor,数据信号处理器),asic(application specific integrated circuit,专用集成电路),fpga(field programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
[0166]
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总
线或一种类型的总线。
[0167]
存储器4003可以是rom(read only memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(random access memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)、cd-rom(compact disc read only memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
[0168]
存储器4003用于存储执行本技术实施例的计算机程序,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的计算机程序,以实现前述方法实施例所示的步骤。
[0169]
其中,电子设备包括但不限于:移动电话、笔记本电脑、pad等等移动终端以及诸如数字tv、台式计算机等等固定终端。
[0170]
本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
[0171]
本技术实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
[0172]
本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除图示或文字描述以外的顺序实施。
[0173]
应该理解的是,虽然本技术实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本技术实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本技术实施例对此不限制。
[0174]
以上所述仅是本技术部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术的方案技术构思的前提下,采用基于本技术技术思想的其他类似实施手段,同样属于本技术实施例的保护范畴。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献