一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

企业机构验证方法、装置、设备及介质与流程

2022-05-21 02:38:33 来源:中国专利 TAG:


1.本技术涉及语音语义相关技术领域,尤其涉及一种企业机构验证方法、装置、设备及介质。


背景技术:

2.随着互联网技术的发展,基于线上的业务办理方式能够缩减业务办理时间,且不需要用户到达指定场所办理业务,给用户办理业务带来极大便捷,被广泛应用于金融、医疗、保险等领域。通常用户在办理业务之前,需要对用户的基本信息进行验证,在验证通过后,才允许用户办理业务,例如,用户在办理金融相关的业务时,需要对用户所属的企业机构进行验证,在验证用户的企业机构不存在失信等异常行为时,才允许用户办理金融相关的业务。实践中发现,只有用户所输入的企业机构与工商局所注册的企业机构完全一致时,才能确保企业机构验证的准确度,如果用户所输入的企业机构与工商局所注册的企业机构不一致时,容易出现误判情况,导致业务机构的验证准确度比较低。


技术实现要素:

3.本技术实施例提供一种企业机构验证方法、装置、设备及介质,提高企业机构的验证准确度。
4.第一方面,本技术实施例提供了一种企业机构验证方法,该方法包括:
5.获取目标对象所输入的待验证的目标企业机构信息;
6.根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,对所述m个企业机构分词进行语义提取,得到所述m个企业机构分词的企业机构语义信息;
7.根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词;
8.根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,根据所述标准企业机构信息对所述目标企业机构信息进行验证。
9.第二方面,本技术实施例提供了一种企业机构验证装置,该装置包括:
10.获取模块,用于获取目标对象所输入的待验证的目标企业机构信息;
11.提取模块,用于根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,对所述m个企业机构分词进行语义提取,得到所述m个企业机构分词的企业机构语义信息;
12.处理模块,用于根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词;
13.验证模块,用于根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,根据所述标准企业机构信息对所述目标企业机构信息进行验证。
14.第三方面,本技术实施例提供了一种电子设备,该设备包括:处理器,适于实现一条或一条以上指令;以及,
15.计算机存储介质,所述计算机存储介质存储有一条或一条以上指令,所述一条或一条以上指令适于由所述处理器加载并执行如下步骤:
16.获取目标对象所输入的待验证的目标企业机构信息;
17.根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,对所述m个企业机构分词进行语义提取,得到所述m个企业机构分词的企业机构语义信息;
18.根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词;
19.根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,根据所述标准企业机构信息对所述目标企业机构信息进行验证。
20.第四方面,本技术实施例提供了一种计算机可读存储介质,包括:所述计算机存储介质存储有一条或一条以上指令,所述一条或一条以上指令适于由处理器加载并执行如下步骤:
21.获取目标对象所输入的待验证的目标企业机构信息;
22.根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,对所述m个企业机构分词进行语义提取,得到所述m个企业机构分词的企业机构语义信息;
23.根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词;
24.根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,根据所述标准企业机构信息对所述目标企业机构信息进行验证。
25.本技术中,电子设备可以获取目标对象所输入的待验证的目标企业机构信息,通过根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,可实现对目标企业机构信息进行更加细粒度的分析,提高对目标企业机构信息进行验证的准确度。具体的,电子设备对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息,根据该企业机构语义信息,通过对该m个企业机构分词进行标准化处理,得到m个标准化分词,根据所述m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证。也就是说,上述对该m个企业机构分词进行标准化处理可以是指对该m个企业机构分词进行格式转换、补偿等处理,通过根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,即在查询标准企业机构信息时,不需要考虑各个标准化分词的输入顺序,这样可以避免用户所输入的目标企业机构信息中存在漏字、分词顺序错乱等情况,导致对目标企业机构信息的验证准确度比较低的问题,提高对目标企业机构信息的验证准确度。
附图说明
26.为了更清楚地说明本技术实施例技术方案,下面将对实施例描述中所需要使用的
附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1是本技术实施例提供的一种企业机构验证方法的流程示意图;
28.图2是本技术实施例提供的一种企业机构验证方法的流程示意图;
29.图3是本技术实施例提供的一种企业机构验证装置的结构示意图;
30.图4是本技术另一实施例提供的一种电子设备的结构示意图。
具体实施方式
31.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
32.请参见图1,是本技术实施例提供的一种企业机构验证方法的流程示意图,本技术实施例由电子设备来执行,该电子设备可以是指服务器或终端设备,此处上述电子设备具体可以是一台独立的服务器、或由若干台服务器组成的服务器集群、或云计算中心、智能机器人,平板电脑、笔记本电脑、掌上电脑、智能音响、移动互联网设备(mid,mobile internet device)等等。其中,如图1所示,该企业机构验证方法包括以下步骤s101~s104。
33.s101、获取目标对象所输入的待验证的目标企业机构信息。
34.当目标对象需要办理业务时,目标对象可以在电子设备中直接输入文本格式的目标企业机构信息,这时,电子设备可以获取目标对象所输入的待验证的目标企业机构信息;或者,目标对象可以在电子设备中关于企业机构信息的企业机构语音数据,这时电子设备可以获取目标对象所输入的关于企业机构信息的企业机构语音数据,根据该企业机构语音数据,确定该目标对象所输入的待验证的目标企业机构信息。目标企业机构信息包括目标对象所属企业的名称,用于反映目标对象所属企业的标识、地址、业务类型等等。
35.s102、根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息。
36.电子设备可以根据目标企业机构信息确定该目标对象所属企业机构的类型,企业机构的类型包括金融类型、医疗类型、电子产品类型等等,获取与该目标对象所属的企业机构的类型匹配的企业机构数据库,查询该企业机构数据库中是否存在与所述目标企业机构信息相同的标准企业机构信息。若该企业机构数据库中存在与所述目标企业机构信息相同的标准企业机构信息,则直接对该目标企业机构信息进行验证;若该企业机构数据库中不存在与所述目标企业机构信息相同的标准企业机构信息,则根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息。企业机构数据库包括多个标准企业机构信息,标准企业机构信息是从可信的机构对于的网站上获取到的,可信机构可以是指用于管理或注册企业机构的机构。
37.s103、根据该企业机构语义信息,对该m个企业机构分词进行标准化处理,得到m个标准化分词。
38.若该企业机构数据库中不存在与所述目标企业机构信息相同的标准企业机构信息,表明目标对象所输入的目标企业机构信息存在分词的顺序颠倒、漏字等情况,因此,电子设备可以根据该企业机构语义信息,对该m个企业机构分词进行标准化处理,得到m个标准化分词。
39.s104、根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证。
40.电子设备可以根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证,即查询该标准企业机构信息是否属于失信企业机构集合,如果该标准企业机构信息属于失信企业机构集合,则确定该目标企业机构信息验证未通过,拒绝目标对象办理业务;如果该标准企业机构信息不属于失信企业机构集合,则确定该目标企业机构信息验证通过。失信企业机构集合包括多个失信企业机构信息,失信企业机构信息是指与诉讼案件关联、贷款延期、拖欠工人工资等失信行为的企业机构对应的企业机构信息。
41.本技术中,电子设备可以获取目标对象所输入的待验证的目标企业机构信息,通过根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,可实现对目标企业机构信息进行更加细粒度的分析,提高对目标企业机构信息进行验证的准确度。具体的,电子设备对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息,根据该企业机构语义信息,通过对该m个企业机构分词进行标准化处理,得到m个标准化分词,根据所述m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证。也就是说,上述对该m个企业机构分词进行标准化处理可以是指对该m个企业机构分词进行格式转换、补偿等处理,通过根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,即在查询标准企业机构信息时,不需要考虑各个标准化分词的输入顺序,这样可以避免用户所输入的目标企业机构信息中存在漏字、分词顺序错乱等情况,导致对目标企业机构信息的验证准确度比较低的问题,提高对目标企业机构信息的验证准确度。
42.请参见图2,是本技术实施例提供的另一种企业机构验证方法的流程示意图,本技术实施例由电子设备来执行,该企业机构验证方法包括以下步骤s201~s207。
43.s201、获取目标对象所输入的企业机构语音数据,以及该目标对象的对象属性信息。
44.s202、从文本识别模型库中,选择与该目标对象的对象属性信息匹配的文本识别模型。
45.s203、采用该文本识别模型对该企业机构语音数据进行文本转换,得到文本格式的企业机构信息。
46.s204、将该文本格式的企业机构信息,确定为该目标对象所输入的待验证的目标企业机构信息。
47.在步骤s201~s204中,电子设备可以获取目标对象所输入的企业机构语音数据,以及该目标对象的对象属性信息,该目标对象的对象属性信息包括目标对象的职业、目标对象所属的位置信息、目标对象的年龄、性别等中的一种或多种。该文本识别模块库中包括
多个候选文本识别模型,不同候选文本识别模型所具备的能力不一样,因此,电子设备可以从文本识别模型库中,选择与该目标对象的属性信息匹配的文本识别模型,采用该文本识别模型对该企业机构语音数据进行文本转换,得到文本格式的企业机构信息,将该文本格式的企业机构信息,确定为该目标对象所输入的待验证的目标企业机构信息。通过采用与目标对象的对象属性信息匹配的文本识别模型,对该目标对象的企业机构语音数据进行识别,提高识别的准确度以及识别的效率。
48.可选的,上述步骤s202中,由于受地域问题的限制,不同地区的用户的发音不一致,为了提高目标企业机构信息的准确度,电子设备可以从文本识别模型库中,选择与目标对象所属的位置信息匹配的文本识别模型。文本识别模型库包括擅长处理属于不同位置的对象的语音数据,如,候选文本识别模型1擅长处理所属于a地的对象的语音数据,候选文本识别模型2擅长处理所属于b地的对象的语音数据,如果该目标对象所属的位置信息指示该目标对象属于a地,则将候选文本识别模型1确定为与目标对象所属的位置信息匹配的文本识别模型;如果该目标对象所属的位置信息指示该目标对象属于b地,则将候选文本识别模型2确定为与目标对象所属的位置信息匹配的文本识别模型。其中,候选文本识别模型1是采用属于a地的样本对象的样本语音数据训练得到的,候选文本识别模型2是采用属于b地的样本对象的样本语音数据训练得到的。
49.可选的,上述步骤s202中,由于受职业问题的限制,具有相同发音的词其意义不相同,为了提高目标企业机构信息的准确度,电子设备可以从文本识别模型库中,选择与目标对象的职业匹配的文本识别模型。文本识别模型库包括擅长处理属于不同领域的语音数据,如,候选文本识别模型3擅长处理科技领域的语音数据,候选文本识别模型3擅长处理金融领域的语音数据,如果该目标对象的职业属于科技领域,则将候选文本识别模型3确定为与目标对象的职业匹配的文本识别模型;如果该目标对象职业属于金融领域,则将候选文本识别模型4确定为与目标对象的职业匹配的文本识别模型。其中,候选文本识别模型3是采用属于科技领域的样本语音数据训练得到的,候选文本识别模型4是采用属于金融领域的样本语音数据训练得到的。
50.可选的,上述步骤s204包括:对该文本格式的企业机构信息进行校正处理,得到校正处理后的企业机构信息,将校正处理后的企业机构信息确定为该目标对象所输入的待验证的目标企业机构信息。
51.上述对该文本格式的企业机构信息进行校正处理,得到校正处理后的企业机构信息,包括:对该文本格式的企业机构信息进行识别,得到该文本格式的企业机构信息的异常字符(如乱码、冗余字符、敏感字段),从该文本格式的企业机构信息中移除该异常字符,得到校正处理后的企业机构信息。或者,对该文本格式的企业机构信息进行格式统一化处理,得校正处理后的企业机构信息。
52.s205、根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息。
53.可选的,上述根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,包括:采用所述文本识别模型,根据所述目标企业机构信息对应的企业机构语音数据,提取所述目标企业机构信息所包含的字符的发音特征信息;根据
所述目标企业机构信息所包含的字符的发音特征信息,确定所述目标企业机构信息的发音变化位置点;根据该发音变化位置点,对该目标企业机构信息进行划分,得到m个企业机构分词。
54.同一分词的发音特征具有相似性,因此,电子设备可以根据发音特征对目标企业机构信息进行划分,得到m个企业机构分词,具体的,电子设备可以采用该文本识别模型,根据该目标企业机构信息对应的企业机构语音数据,提取该目标企业机构信息所包含的字符的发音特征信息,该发音特征信息包括发音能量、频率等等信息,根据该目标企业机构信息所包含的字符的发音特征信息,确定所述目标企业机构信息的发音变化位置点。进一步,可以根据该发音变化位置点,对该目标企业机构信息进行划分,得到m个企业机构分词,如将该目标企业机构中的起始字符到第一个发音变化位置点的字符作为第一个企业机构分词,将第一个发音变化位置点处的后一个字符到第二个发音变化位置点处的字符,作为第二企业机构分词,以此类推,得到m个企业机构分词。
55.可选的,上述根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,包括:统计所述目标企业机构所包含的字符在参考文本中出现的次数,根据所述次数,计算所述目标企业机构所包含的每两个字符在参考文本中出现的次数差值,将所述目标企业机构信息中所述次数差值属于差值范围内,且具有相邻关系的字符划分至同一个分词中,得到m个企业机构分词。
56.同一分词内的字符在参考文本中出现的次数具有相同或相近,因此,电子设备可以统计该目标企业机构所包含的字符在参考文本中出现的次数,根据该次数,计算该目标企业机构所包含的每两个字符在参考文本中出现的次数差值,将该目标企业机构信息中该次数差值属于差值范围内,且具有相邻关系的字符划分至同一个分词中,得到m个企业机构分词。
57.s206、根据该企业机构语义信息,对该m个企业机构分词进行标准化处理,得到m个标准化分词。
58.可选的,上述根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词,包括:根据所述企业机构语义信息,从所述m个企业机构分词中筛选出具有地址属性语义的地址分词,以及具有标识属性语义的标识分词,对所述地址分词进行完整性检测,若所述地址分词不具有完整性,则获取地址数据库,根据所述地址数据库对所述地址分词进行补偿处理,得到标准化的地址分词;将所述标识分词进行格式转换,得到标准化的标识分词;所述标准化的标识分词的格式与所述标准化的地址分词的格式不同,将所述标准化的地址分词、所述标准化的标识分词,以及剩余企业机构分词,确定为m个标准化分词;所述剩余企业机构分词为所述m个企业机构分词中除所述地址分词和所述标识分词以外的企业机构分词。
59.电子设备可以根据该企业机构语义信息,从该m个企业机构分词中筛选出具有地址属性语义的地址分词,以及具有标识属性语义的标识分词,标识分词可以是指企业机构的商标,商标通常具有唯一性,用于唯一标识对应的企业机构。由于具有地址属性语义的分词,容易遗漏字符,如xx市,字符市容易被遗漏,因此,电子设备可以采用企业机构字典检测该地址分词是否具有完整性,若该地址分词具有完整性,则将地址分词确定为标准化的地址分词;若该地址分词不具有完整性,则获取地址数据库,根据该地址数据库对该地址分词
进行补偿处理,得到标准化的地址分词,这样可避免目标企业机构信息中由于遗漏字符而被误判。进一步,由于某些分词的发音具有相似性,容易被混淆,如苏木、树木,但是两者的拼音具有较大区别,同时,具有标识属性语义的分词具有较高的辨识度。因此。电子设备可以将该标识分词进行格式转换,得到标准化的标识分词,如可以对标识分词转换成拼音格式,得到标准化的标识分词,这样可避免由于具有相似的发音的标识分词,被混淆的问题,这样可以扩大标识分词的辨识度。然后,可以将所述标准化的地址分词、所述标准化的标识分词,以及剩余企业机构分词,确定为m个标准化分词,提高企业机构信息的准确度。
60.s207、根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证。
61.电子设备可以分别获取所述企业机构数据库中的标准企业机构信息与该第mi个标准化分词之间的匹配度,对所述企业机构数据库中的标准企业机构信息与各个标准化分词之间的匹配度进行求和处理,得到所述企业机构数据库中的标准企业机构信息的评分;将所述企业机构数据库中的标准企业机构信息的评分为最大评分的标准企业机构信息,确定为与所述目标企业机构信息匹配的标准企业机构信息。
62.假设以企业机构数据库中包括标准企业机构信息1和标准企业机构信息2,m为3进行说明,计算机标准企业机构信息1分别与3个标准化分词之间的匹配度,得到匹配1、匹配2以及匹配度3,对匹配1、匹配2以及匹配度3进行求和处理(或加权求和处理),得到该标准企业机构信息1的评分。同理,计算机标准企业机构信息2分别与3个标准化分词之间的匹配度,得到匹配4、匹配5以及匹配度6,对匹配4、匹配5以及匹配度6进行求和处理(或加权求和处理),得到该标准企业机构信息2的评分。进一步,将标准企业机构信息1和标准企业机构信息2中评分为最大评分的标准企业机构信息,确定为与所述目标企业机构信息匹配的标准企业机构信息。
63.可选的,上述对所述企业机构数据库中的标准企业机构信息与所述m个标准化分词之间的匹配度进行求和处理,得到所述企业机构数据库中的标准企业机构信息的评分,包括:根据所述m个企业机构分词的企业机构语义信息,确定所述m个标准化分词的分词权重;采用所述m个标准化分词的分词权重,对所述企业机构数据库中的标准企业机构信息与所述m个标准化分词之间的匹配度进行加权求和处理,得到所述企业机构数据库中的标准企业机构信息的评分。
64.电子设备可以根据所述m个企业机构分词的企业机构语义信息,确定该m个标准化分词的辨识度,根据辨识度确定该m个标准化分词的分词权重。采用该m个标准化分词的分词权重,对该机构数据库中的标准企业机构信息与该m个标准化分词之间的匹配度进行加权求和处理,得到所述企业机构数据库中的标准企业机构信息的评分。通过加权求和处理方式获取各个标准企业机构信息的评分,突出高辨识度的分词的影响,提高标准企业机构信息之间的区别度,进一步,提高获取标准企业机构信息的准确度。
65.例如,标准化的标识分词具有较高的辨识度,标准化的地址分词具有较低辨识度,因此,可以将第一分词权重确定为标准化的标识分词的分词权重;可以将第二分词权重确定为标准化的地址分词的分词权重;第一分词权重大于第二分词权重。采用该m个标准化分词的分词权重,对该机构数据库中的标准企业机构信息与该m个标准化分词之间的匹配度进行加权求和处理,得到所述企业机构数据库中的标准企业机构信息的评分。
66.本技术中,电子设备可以获取目标对象所输入的待验证的目标企业机构信息,通过根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,可实现对目标企业机构信息进行更加细粒度的分析,提高对目标企业机构信息进行验证的准确度。具体的,电子设备对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息,根据该企业机构语义信息,通过对该m个企业机构分词进行标准化处理,得到m个标准化分词,根据所述m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证。也就是说,上述对该m个企业机构分词进行标准化处理可以是指对该m个企业机构分词进行格式转换、补偿等处理,通过根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,即在查询标准企业机构信息时,不需要考虑各个标准化分词的输入顺序,这样可以避免用户所输入的目标企业机构信息中存在漏字、分词顺序错乱等情况,导致对目标企业机构信息的验证准确度比较低的问题,提高对目标企业机构信息的验证准确度。
67.请参见图3,是本技术实施例提供的一种企业机构验证装置的结构示意图,如图3所示,本实施例中企业机构验证装置包括:获取模块301、提取模块302、处理模块303以及验证模块304。
68.获取模块,用于获取目标对象所输入的待验证的目标企业机构信息;
69.提取模块,用于根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,对所述m个企业机构分词进行语义提取,得到所述m个企业机构分词的企业机构语义信息;
70.处理模块,用于根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词;
71.验证模块,用于根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,根据所述标准企业机构信息对所述目标企业机构信息进行验证。
72.可选的,所述提取模块根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词,包括:
73.根据所述企业机构语义信息,从所述m个企业机构分词中筛选出具有地址属性语义的地址分词,以及具有标识属性语义的标识分词;
74.对所述地址分词进行完整性检测,若所述地址分词不具有完整性,则获取地址数据库,根据所述地址数据库对所述地址分词进行补偿处理,得到标准化的地址分词;
75.将所述标识分词进行格式转换,得到标准化的标识分词;所述标准化的标识分词的格式与所述标准化的地址分词的格式不同;
76.将所述标准化的地址分词、所述标准化的标识分词,以及剩余企业机构分词,确定为m个标准化分词;所述剩余企业机构分词为所述m个企业机构分词中除所述地址分词和所述标识分词以外的企业机构分词。
77.可选的,所述处理模块根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,包括:
78.获取所述企业机构数据库中的标准企业机构信息与第mi个标准化分词之间的匹
配度;i为小于或等于m的正整数;
79.对所述企业机构数据库中的标准企业机构信息与各个标准化分词之间的匹配度进行求和处理,得到所述企业机构数据库中的标准企业机构信息的评分;
80.将所述企业机构数据库中的标准企业机构信息的评分为最大评分的标准企业机构信息,确定为与所述目标企业机构信息匹配的标准企业机构信息。
81.可选的,所述验证模块对所述企业机构数据库中的标准企业机构信息与所述m个标准化分词之间的匹配度进行求和处理,得到所述企业机构数据库中的标准企业机构信息的评分,包括:
82.根据所述m个企业机构分词的企业机构语义信息,确定所述m个标准化分词的分词权重;
83.采用所述m个标准化分词的分词权重,对所述企业机构数据库中的标准企业机构信息与所述m个标准化分词之间的匹配度进行加权求和处理,得到所述企业机构数据库中的标准企业机构信息的评分。
84.可选的,所述获取模块获取目标对象所输入的待验证的目标企业机构信息,包括:
85.获取所述目标对象所输入的企业机构语音数据,以及所述目标对象的对象属性信息;
86.从文本识别模型库中,选择与所述目标对象的对象属性信息匹配的文本识别模型;
87.采用所述文本识别模型对所述企业机构语音数据进行文本转换,得到文本格式的企业机构信息;
88.将所述文本格式的企业机构信息,确定为所述目标对象所输入的待验证的目标企业机构信息。
89.可选的,所述提取模块根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,包括:
90.采用所述文本识别模型,根据所述目标企业机构信息对应的企业机构语音数据,提取所述目标企业机构信息所包含的字符的发音特征信息;
91.根据所述目标企业机构信息所包含的字符的发音特征信息,确定所述目标企业机构信息的发音变化位置点;
92.根据所述发音变化位置点,对所述目标企业机构信息进行划分,得到m个企业机构分词。
93.可选的,所述提取模块根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,包括:
94.统计所述目标企业机构所包含的字符在参考文本中出现的次数;
95.根据所述次数,计算所述目标企业机构所包含的每两个字符在参考文本中出现的次数差值;
96.将所述目标企业机构信息中所述次数差值属于差值范围内,且具有相邻关系的字符划分至同一个分词中,得到m个企业机构分词。
97.本技术中,电子设备可以获取目标对象所输入的待验证的目标企业机构信息,通过根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业
机构分词,可实现对目标企业机构信息进行更加细粒度的分析,提高对目标企业机构信息进行验证的准确度。具体的,电子设备对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息,根据该企业机构语义信息,通过对该m个企业机构分词进行标准化处理,得到m个标准化分词,根据所述m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证。也就是说,上述对该m个企业机构分词进行标准化处理可以是指对该m个企业机构分词进行格式转换、补偿等处理,通过根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,即在查询标准企业机构信息时,不需要考虑各个标准化分词的输入顺序,这样可以避免用户所输入的目标企业机构信息中存在漏字、分词顺序错乱等情况,导致对目标企业机构信息的验证准确度比较低的问题,提高对目标企业机构信息的验证准确度。
98.请参见图4,是本技术实施例提供的一种电子设备的结构示意图,如图4所示的本实施例中的电子设备可以包括:一个或多个处理器21,一个或多个输入装置22,一个或多个输出装置23和存储器24。上述处理器21、输入装置22、输出装置23和存储器24通过总线25连接。
99.所处理器21可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
100.输入装置22可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出装置23可以包括显示器(lcd等)、扬声器等,输出装置23可以输出校正处理后的数据表。
101.该存储器24可以包括只读存储器和随机存取存储器,并向处理器21提供指令和数据。存储器24的一部分还可以包括非易失性随机存取存储器,存储器24用于存储计算机程序,所述计算机程序包括程序指令,处理器21用于执行存储器24存储的程序指令,以用于执行一种企业机构验证方法,即用于执行以下操作:
102.获取目标对象所输入的待验证的目标企业机构信息;
103.根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,对所述m个企业机构分词进行语义提取,得到所述m个企业机构分词的企业机构语义信息;
104.根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词;
105.根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,根据所述标准企业机构信息对所述目标企业机构信息进行验证。
106.可选的,处理器21用于执行存储器24存储的程序指令,以用于执行一种企业机构验证方法,即用于执行根据所述企业机构语义信息,对所述m个企业机构分词进行标准化处理,得到m个标准化分词,包括:
107.根据所述企业机构语义信息,从所述m个企业机构分词中筛选出具有地址属性语义的地址分词,以及具有标识属性语义的标识分词;
108.对所述地址分词进行完整性检测,若所述地址分词不具有完整性,则获取地址数据库,根据所述地址数据库对所述地址分词进行补偿处理,得到标准化的地址分词;
109.将所述标识分词进行格式转换,得到标准化的标识分词;所述标准化的标识分词的格式与所述标准化的地址分词的格式不同;
110.将所述标准化的地址分词、所述标准化的标识分词,以及剩余企业机构分词,确定为m个标准化分词;所述剩余企业机构分词为所述m个企业机构分词中除所述地址分词和所述标识分词以外的企业机构分词。
111.可选的,处理器21用于执行存储器24存储的程序指令,以用于执行一种企业机构验证方法,即用于执行根据所述m个标准化分词,从企业机构数据库中查询与所述目标企业机构信息匹配的标准企业机构信息,包括:
112.分别获取所述企业机构数据库中的标准企业机构信息与第mi个标准化分词之间的匹配度;i为小于或等于m的正整数;
113.对所述企业机构数据库中的标准企业机构信息与各个标准化分词之间的匹配度进行求和处理,得到所述企业机构数据库中的标准企业机构信息的评分;
114.将所述企业机构数据库中的标准企业机构信息的评分为最大评分的标准企业机构信息,确定为与所述目标企业机构信息匹配的标准企业机构信息。
115.可选的,处理器21用于执行存储器24存储的程序指令,以用于执行一种企业机构验证方法,即用于执行对所述企业机构数据库中的标准企业机构信息与所述m个标准化分词之间的匹配度进行求和处理,得到所述企业机构数据库中的标准企业机构信息的评分,包括:
116.根据所述m个企业机构分词的企业机构语义信息,确定所述m个标准化分词的分词权重;
117.采用所述m个标准化分词的分词权重,对所述企业机构数据库中的标准企业机构信息与所述m个标准化分词之间的匹配度进行加权求和处理,得到所述企业机构数据库中的标准企业机构信息的评分。
118.可选的,处理器21用于执行存储器24存储的程序指令,以用于执行一种企业机构验证方法,即用于执行获取目标对象所输入的待验证的目标企业机构信息,包括:
119.获取所述目标对象所输入的企业机构语音数据,以及所述目标对象的对象属性信息;
120.从文本识别模型库中,选择与所述目标对象的对象属性信息匹配的文本识别模型;
121.采用所述文本识别模型对所述企业机构语音数据进行文本转换,得到文本格式的企业机构信息;
122.将所述文本格式的企业机构信息,确定为所述目标对象所输入的待验证的目标企业机构信息。
123.可选的,处理器21用于执行存储器24存储的程序指令,以用于执行一种企业机构验证方法,即用于执行根据所述目标企业机构信息所包含的字符对所述目标企业机构信息
进行划分,得到m个企业机构分词,包括:
124.采用所述文本识别模型,根据所述目标企业机构信息对应的企业机构语音数据,提取所述目标企业机构信息所包含的字符的发音特征信息;
125.根据所述目标企业机构信息所包含的字符的发音特征信息,确定所述目标企业机构信息的发音变化位置点;
126.根据所述发音变化位置点,对所述目标企业机构信息进行划分,得到m个企业机构分词。
127.可选的,处理器21用于执行存储器24存储的程序指令,以用于执行一种企业机构验证方法,即用于执行根据所述目标企业机构信息所包含的字符对所述目标企业机构信息进行划分,得到m个企业机构分词,包括:
128.统计所述目标企业机构所包含的字符在参考文本中出现的次数;
129.根据所述次数,计算所述目标企业机构所包含的每两个字符在参考文本中出现的次数差值;
130.将所述目标企业机构信息中所述次数差值属于差值范围内,且具有相邻关系的字符划分至同一个分词中,得到m个企业机构分词。
131.本技术中,电子设备可以获取目标对象所输入的待验证的目标企业机构信息,通过根据该目标企业机构信息所包含的字符对该目标企业机构信息进行划分,得到m个企业机构分词,可实现对目标企业机构信息进行更加细粒度的分析,提高对目标企业机构信息进行验证的准确度。具体的,电子设备对该m个企业机构分词进行语义提取,得到该m个企业机构分词的企业机构语义信息,根据该企业机构语义信息,通过对该m个企业机构分词进行标准化处理,得到m个标准化分词,根据所述m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,根据该标准企业机构信息对该目标企业机构信息进行验证。也就是说,上述对该m个企业机构分词进行标准化处理可以是指对该m个企业机构分词进行格式转换、补偿等处理,通过根据该m个标准化分词,从企业机构数据库中查询与该目标企业机构信息匹配的标准企业机构信息,即在查询标准企业机构信息时,不需要考虑各个标准化分词的输入顺序,这样可以避免用户所输入的目标企业机构信息中存在漏字、分词顺序错乱等情况,导致对目标企业机构信息的验证准确度比较低的问题,提高对目标企业机构信息的验证准确度。
132.本技术实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现如图1及图2实施例中所示的企业机构验证生成方法。
133.所述计算机可读存储介质可以是前述任一实施例所述的电子设备的内部存储单元,例如控制设备的硬盘或内存。所述计算机可读存储介质也可以是所述控制设备的外部存储设备,例如所述控制设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flashcard)等。进一步地,所述计算机可读存储介质还可以既包括所述控制设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述控制设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
134.作为示例,上述计算机可读存储介质可被部署在一个计算机设备上执行,或者被
部署位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。
135.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的控制设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
136.在本技术所提供的几个实施例中,应该理解到,所揭露的控制设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例是示意性的,例如,所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
137.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献