一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

单位名称的匹配方法、装置、电子设备及可读存储介质与流程

2021-11-03 11:24:00 来源:中国专利 TAG:

技术特征:
1.一种单位名称的匹配方法,其特征在于,包括:获取待匹配的单位名称;对所述待匹配的单位名称进行预处理;对预处理后的单位名称进行分词处理;合并分词处理后所述待匹配的单位名称包含的多个词组,得到顺序排列的词组集合;在前一词组集合与标准单位序列树的节点单位名称匹配成功后,将匹配成功的节点单位名称作为根节点,在根节点的子节点范围内匹配所述前一词组集合的下一词集集合,直至所有词组集合匹配完成,定位到标准单位序列树中的目标单位。2.根据权利要求1所述的方法,其特征在于,所述对所述待匹配的单位名称进行预处理,包括:将所述待匹配的单位名称中的编号和/或数字进行归一化处理;和/或根据预先建立的同义词词典转换所述待匹配的单位名称中的简称、别名或者代号。3.根据权利要求1所述的方法,其特征在于,所述对预处理后的单位名称进行分词处理,包括:利用预先建立的中文分词字典对预处理后的单位名称进行分词处理。4.根据权利要求1所述的方法,其特征在于,所述合并分词处理后所述待匹配的单位名称包含的多个词组,得到顺序排列的词组集合,包括:识别分词处理后所述待匹配的单位名称包含的实体词和属性词;将所述实体词和位于所述实体词前的所述属性词合并,得到顺序排列的词组集合。5.根据权利要求4所述的方法,其特征在于,所述在根节点的子节点范围内匹配所述前一词组集合的下一词集集合,包括:筛选子节点范围内组成下一词集集合的实体词是否唯一,若是则匹配成功;若不唯一,则继续筛选组成所述下一词集集合的数字属性词是否唯一,若是则匹配成功;若不唯一,则联合筛选组成所述下一词集集合的所述数字属性词以及数字属性词的相邻属性词是否唯一,若是则匹配成功;若不唯一,则筛选组成所述下一词集集合中除所述数字属性词、相邻属性词以外的剩余属性词是否唯一,若是则匹配成功;否则,则匹配失败。6.根据权利要求5所述的方法,其特征在于,还包括:判断所述下一词集集合中的属性词与所述子节点包括的多个属性词成功匹配的比例是否满足容错参数,若是则匹配成功。7.根据权利要求6所述的方法,其特征在于,所述容错参数为1/4。8.一种单位名称的匹配装置,其特征在于,包括:获取模块,被配置为获取待匹配的单位名称;预处理模块,被配置为对所述待匹配的单位名称进行预处理;分词模块,被配置为对预处理后的单位名称进行分词处理;合并模块,被配置为合并分词处理后所述待匹配的单位名称包含的多个词组,得到顺序排列的词组集合;定位模块,被配置为在前一词组集合与标准单位序列树的节点单位名称匹配成功后,
将匹配成功的节点单位名称作为根节点,在根节点的子节点范围内匹配所述前一词组集合的下一词集集合,直至所有词组集合匹配完成,定位到标准单位序列树中的目标单位。9.一种电子设备,其特征在于,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现以下方法步骤:获取待匹配的单位名称;对所述待匹配的单位名称进行预处理;对预处理后的单位名称进行分词处理;合并分词处理后所述待匹配的单位名称包含的多个词组,得到顺序排列的词组集合;在前一词组集合与标准单位序列树的节点单位名称匹配成功后,将匹配成功的节点单位名称作为根节点,在根节点的子节点范围内匹配所述前一词组集合的下一词集集合,直至所有词组集合匹配完成,定位到标准单位序列树中的目标单位。10.一种可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1

7任一项所述的方法步骤。

技术总结
本公开实施例公开了一种单位名称的匹配方法、装置、电子设备及可读存储介质,所述方法包括:获取待匹配的单位名称;对所述待匹配的单位名称进行预处理;对预处理后的单位名称进行分词处理;合并分词处理后所述待匹配的单位名称包含的多个词组,得到顺序排列的词组集合;在前一词组集合与标准单位序列树的节点单位名称匹配成功后,将匹配成功的节点单位名称作为根节点,在根节点的子节点范围内匹配所述前一词组集合的下一词集集合,直至所有词组集合匹配完成,定位到标准单位序列树中的目标单位。该技术方案实现了单位名称匹配的自动化,大大提高了数据整编工作的质量效率。大大提高了数据整编工作的质量效率。大大提高了数据整编工作的质量效率。


技术研发人员:郑重 韩向斌 李宏建 葛毅 李世川 王俪璇 吉高喆
受保护的技术使用者:中央军委后勤保障部信息中心
技术研发日:2021.07.30
技术公布日:2021/11/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献