一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

行业类目识别方法、设备、介质及计算机程序产品与流程

2021-11-03 21:39:00 来源:中国专利 TAG:


1.本技术涉及金融科技(fintech)的机器学习技术领域,尤其涉及一种行业类目识别方法、设备、介质及计算机程序产品。


背景技术:

2.随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
3.随着计算机技术的发展,机器学习的应用越来越广泛,目前,在国民经济行业分类标准中,将国民经济行业划分为门类、大类、中类和小类四级类目,企业在工商等级注册时,需要填写相应的行业类别,当前,当企业的国民经济行业类别缺失或者有误时,往往是根据企业名称和经营范围的文本描述,在国民行业分类体系中人工查找对应的类目路径,然而,当行业类目缺失的企业较多时,使用传统的人工判别方法工作量大,需要较长的时间,进而导致行业分类效率较低。


技术实现要素:

4.本技术的主要目的在于提供一种行业类目识别方法、设备、介质及计算机程序产品,旨在解决现有技术中的行业分类效率低的技术问题。
5.为实现上述目的,本技术提供一种行业类目识别方法,所述行业类目识别方法包括:
6.获取待分类企业的经营范围和企业名称;
7.分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型;
8.将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果;
9.基于所述目标小类识别结果和预设类目体系映射关系,确定所述待分类企业对应的行业类目。
10.本技术还提供一种行业类目识别装置,所述行业类目识别装置为虚拟装置,所述行业类目识别装置包括:
11.获取模块,用于获取待分类企业的经营范围和企业名称;
12.第一分类模块,用于分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型;
13.第二分类模块,用于将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,
获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果;
14.确定模块,用于基于所述目标小类识别结果和预设类目体系映射关系,确定所述待分类企业对应的行业类目。
15.本技术还提供一种行业类目识别设备,所述行业类目识别设备为实体设备,所述行业类目识别设备包括:存储器、处理器以及存储在所述存储器上的行业类目识别程序,所述行业类目识别程序被所述处理器执行实现如上述的行业类目识别方法的步骤。
16.本技术还提供一种介质,所述介质为可读存储介质,所述可读存储介质上存储行业类目识别程序,所述行业类目识别程序被处理器执行实现如上述的行业类目识别方法的步骤。
17.本技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的行业类目识别方法的步骤。
18.本技术提供了一种行业类目识别方法、设备、介质及计算机程序产品,相比于现有技术采用的根据企业名称和经营范围的文本描述,在国民行业分类体系中人工查找对应的行业类目的技术手段,本技术首先获取待分类企业的经营范围和企业名称,进而分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型,进一步地,将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果,需要说明的是,行业类目包括门类、大类、中类和小类四级类目体系,所述层级分类模型中的每一层类目分类模型根据上一层类目分类模型对应的分类预测结果进行判断下一层的输出,采用层级预测的方法,预测目标范围较集中,减少了行业类目的搜索空间,加快分类预测的速度和准确性,进一步地,基于所述目标小类识别结果和预设类目体系映射关系,确定所述待分类企业对应的行业类目,实现基于所述经营范围与所述企业名称,自动获得待分类企业对应的行业类目,也即,无需人工手动进行查询分类,克服了现有技术中当行业类目缺失的企业较多时,使用传统的人工判别方法工作量大,需要较长的时间,进而导致行业分类效率较低的技术缺陷,从而提高了行业分类的效率。
附图说明
19.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
20.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域默认技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
21.图1为本技术行业类目识别方法第一实施例的流程示意图;
22.图2为本技术行业类目识别方法第二实施例的流程示意图;
23.图3为本技术行业类目识别方法第三实施例的流程示意图;
24.图4为本技术实施例中行业类目识别方法涉及的硬件运行环境的行业类目识别设备结构示意图。
25.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
26.应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
27.本技术实施例提供一种行业类目识别方法,在本技术行业类目识别方法的第一实施例中,参照图1,所述行业类目识别方法包括:
28.步骤s10,获取待分类企业的经营范围和企业名称;
29.在本实施例中,需要说明的是,国民经济行业分类标准,规定了全社会经济活动的分类与代码,标准采用线分类法和分层次编码方法,将国民经济行业划分为门类、大类、中类和小类四级类目体系,企业在工商等级注册时,需要填写相应类别,所述经营范围为所述待分类企业可以从事的生产经营与服务项目的范围。
30.获取待分类企业的经营范围和企业名称,具体地,获取所述待分类企业的经营范围对应的文本信息以及所述待分类企业的企业名称对应的文本信息。
31.步骤s20,分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型;
32.在本实施例中,需要说明的是,所述层级分类模型包括经营范围层级分类模型和名称层级分类模型,其中,所述经营范围层级分类模型和所述名称层级分类模型均包括多层类目分类模型,各层对应的类目分类模型用于预测对应层级的行业类目信息的文本多分类模型。
33.分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型,具体地,通过预先收集的待训练经营范围对待训练经营范围层级模型中的第一层类目分类模型进行迭代训练优化,以获得第一层经营类目分类模型,并输出训练经营范围预测结果,并通过上层模型输出的训练经营范围预测结果和待训练经营范围对所述待训练经营范围层级模型中的下一层类目分类模型进行迭代训练优化,直至训练完最后一层的类目分类模型,即可获得所述经营范围层级模型,所述名称层级分类模型的训练过程可参照上述经营范围层级模型的训练过程的具体内容,在此不再赘述,进一步地,将所述经营范围输入所述经营范围层级分类模型中的第一层类目分类模型,输出经营范围门类概率结果,将所述企业名称输入所述名称层级分类模型中的第一层类目分类模型,输出名称门类概率结果,进而分别将所述经营范围门类概率结果和所述名称门类概率结果进行排序,获得经营范围门类概率排序结果和名称门类概率排序结果,进而所述排序经营范围门类概率排序结果和所述名称门类概率排序结果进行相加,获得门类合并结果,进而在所述类目合并结果或者在所述经营范围门类概率结果中按照预设选取规则进行类别选取,获得所述分类预测结果,其中所述预设选取规则为在门类合并结果中选取排名顺序取值小的分类或者在经营范围门类概率结果中选取概率最大对应的分类的规则。
34.其中,所述层级分类模型包括经营范围层级分类模型和名称层级分类模型,
35.所述分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果的步骤包括:
36.步骤s21,将所述经营范围输入所述经营范围层级分类模型中的第一层类目分类模型,输出经营范围门类概率结果;
37.在本实施例中,需要说明的是,所述经营范围门类概率结果为经营范围对应门类类别的概率的结果。
38.将所述经营范围输入所述经营范围层级分类模型中的第一层类目分类模型,输出经营范围门类概率结果,具体地,基于词频

逆文档频率模型或者word2vec模型,将述经营范围对应的文本信息构建成经营范围文本向量,进而通过所述经营范围层级分类模型中的第一层类目分类模型对所述经营范围文本向量进行分类,获得所述经营范围文本向量对应的经营范围门类概率结果。
39.步骤s22,将所述企业名称输入所述名称层级分类模型中的第一层类目分类模型,输出名称门类概率结果;
40.在本实施例中,将所述企业名称输入所述名称层级分类模型中的第一层类目分类模型,输出名称门类概率结果,具体地,基于词频

逆文档频率模型或者word2vec模型,将述企业名称对应的文本信息构建成企业名称文本向量,进而通过所述名称层级分类模型中的第一层类目分类模型对所述企业名称文本向量进行分类,获得所述企业名称文本向量对应的名称门类概率结果,步骤s22的具体实施内容可参照步骤s21中的具体内容,在此不再赘述。
41.步骤s23,将所述经营范围门类概率结果和所述名称门类概率结果进行合并,获得门类合并结果;
42.在本实施例中,将所述经营范围门类概率结果和所述名称门类概率结果进行合并,获得门类合并结果,具体地,将所述经营范围门类概率结果中的各分类概率进行排序,获得第一排序结果,并将所述名称门类概率结果中的各分类概率进行排序,获得第二排序结果,进而将所述第一排序结果和所述第二排序结果进行相加,获得所述门类合并结果,例如,所述经营范围门类概率结果中的a类、b类、c类分别对应的概率为(0.15,0.8,0.05),排序结果为(2,1,3),所述名称门类概率结果中的a类、b类、c类分别对应的概率为(0.1,0.4,0.5),排序结果为(3,2,1),排序结果相加为(5,3,4),即可获得所述门类合并结果。
43.其中,所述将所述经营范围门类概率结果和所述名称门类概率结果进行合并,获得类目合并结果的步骤包括:
44.步骤s231,将所述经营范围门类概率结果进行排序,获得第一排序结果;
45.在本实施例中,将所述经营范围门类概率结果进行排序,获得第一排序结果,具体地,将所述经营范围门类概率结果中的各类别对应的概率按照从大到小进行排序,获得所述第一排序结果,例如,假设所述经营范围门类概率结果为(0.15,0.8,0.05),排序结果为(2,1,3)。
46.步骤s232,将所述名称门类概率结果进行排序,获得第二排序结果;
47.在本实施例中,将所述名称门类概率结果进行排序,获得第二排序结果,具体地,将所述经营范围门类概率结果中的各类别对应的概率按照从大到小进行排序,获得所述第二排序结果。
48.步骤s233,将所述第一排序结果和所述第二排序结果进行相加,获得所述类目合并结果。
49.在本实施例中,将所述第一排序结果和所述第二排序结果进行相加,获得所述类目合并结果,具体地,将所述经营范围门类概率结果中各分类概率对应的排序结果和所述名称门类概率结果中各分类概率对应的排序结果进行相加,即可获得所述类目合并结果。
50.步骤s24,在所述类目合并结果或所述经营范围门类概率结果中按照预设选取规则进行类别选取,获得分类预测结果。
51.在本实施例中,在所述类目合并结果中按照预设选取规则进行类别选取,获得分类预测结果,具体地,在所述类目合并结果中选取排名顺序取值小的分类作为所述分类预测结果,若所述类目合并结果存在多个最小值时,则在所述经营范围门类概率结果中选取概率最大对应的分类作为所述分类预测结果,例如,所述经营范围门类概率结果为(0.15,0.8,0.05),排序结果为(2,1,3),所述名称门类概率结果为(0.1,0.4,0.5),排序结果为(3,2,1),排序相加结果为(5,3,4),进而选取排序相加结果为3所对应的类目。
52.步骤s30,将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果;
53.在本实施例中,将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果,具体地,根据所述层级分类模型中的上一层类目分类模型获得的分类预测结果,进而将所述经营范围和所述分类预测结果输入所述经营范围层级模型中的下一层类目分类模型,并将所述企业名称和所述分类预测结果输入所述名称层级分类模型中的下一层类目分类模型,获得所述下一类别预测结果,以根据所述下一类别预测结果进行下一层类目分类模型的预测,循环直至达到最后一层类目分类模型,获得所述目标小类识别结果。
54.步骤s40,基于所述目标小类识别结果和预设类目体系映射关系,确定所述待分类企业对应的行业类目。
55.在本实施例中,需要说明的是,国民经济行业分类标准中,门类为国民经济行业分类标准中的第一级类目,每个门类下再按大类继续细分,大类为国民经济行业分类标准中的第二级类目,是门类的细分,每个大类下面再按中类继续细分,中类为国民经济行业分类标准中的第三级类目,是大类的细分,中类代码用三位阿拉伯数字表示,前两位为大类对应的代码,第三位为中类顺序代码,每个中类下面再按小类继续细分,小类为国民经济行业分类标准中的第四级类目,是中类的细分,也是最后一级目录,小类代码用四位阿拉伯数字表示,前三位为中类对应的代码,第四位为小类顺序代码,所述预设类目体系映射关系为行业类目中各分类体系之间的映射关系,包括小类与中类对应的映射关系、中类与大类对应的映射关系、大类与门类对应的映射关系等映射关系。
56.基于所述目标小类识别结果和预设类目体系映射关系,确定所述待分类企业对应的行业类目,具体地,基于所述目标小类识别结果与所述小类与中类对应的映射关系、中类与大类对应的映射关系、大类与门类对应的映射关系,确定所述待分类企业对应的行业类目。
57.本技术实施例提供了一种行业类目识别方法,相比于现有技术采用的根据企业名称和经营范围的文本描述,在国民行业分类体系中人工查找对应的行业类目的技术手段,
本技术实施例首先获取待分类企业的经营范围和企业名称,进而分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型,进一步地,将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果,需要说明的是,行业类目包括门类、大类、中类和小类四级类目体系,所述层级分类模型中的每一层类目分类模型根据上一层类目分类模型对应的分类预测结果进行判断下一层的输出,采用层级预测的方法,预测目标范围较集中,减少了行业类目的搜索空间,加快分类预测的速度和准确性,进一步地,基于所述目标小类识别结果和预设类目体系映射关系,确定所述待分类企业对应的行业类目,实现基于所述经营范围与所述企业名称,自动获得待分类企业对应的行业类目,也即,无需人工手动进行查询分类,克服了现有技术中当行业类目缺失的企业较多时,使用传统的人工判别方法工作量大,需要较长的时间,进而导致行业分类效率较低的技术缺陷,从而提高了行业分类的效率。
58.进一步地,参照图2,基于本技术中第一实施例,在本技术的另一实施例中,所述层级分类模型包括经营范围层级分类模型和名称层级分类模型,
59.将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果的步骤包括:
60.步骤a10,将所述经营范围和所述分类预测结果输入所述经营范围分类模型中的第二层类目分类模型,输出经营范围大类概率结果;
61.在本实施例中,所述经营范围和所述分类预测结果输入所述经营范围分类模型中的第二层类目分类模型,输出经营范围大类概率结果,具体地,通过将经营范围分类模型中的第一层类目分类模型输出的分类预测结果和所述经营范围作为所述经营范围分类模型中的第二层类目分类模型的输入,获得第二层类目分类模型对应的经营范围大类概率结果。
62.步骤a20,将所述企业名称和所述分类预测结果输入所述名称分类模型中的第二层类目分类模型,输出名称大类概率结果;
63.在本实施例中,将所述企业名称和所述分类预测结果输入所述名称分类模型中的第二层类目分类模型,输出名称大类概率结果,具体地,通过将名称分类模型中的第一层类目分类模型输出的分类预测结果和所述企业名称作为所述名称分类模型中的第二层类目分类模型的输入,获得第二层类目分类模型对应的名称大类概率结果。
64.步骤a30,将所述经营范围大类概率结果和所述名称大类概率结果进行合并,获得大类合并结果;
65.在本实施例中,将所述经营范围大类概率结果和所述名称大类概率结果进行合并,获得大类合并结果,具体地,将所述经营范围大类概率结果进行排序,获得第三排序结果,并将所述名称大类概率结果进行排序,获得第四排序结果,进而将所述第三排序结果和所述第四排序结果进行相加,获得所述大类合并结果,步骤a30的具体实施内容可参照步骤s23中的具体内容,在此不再赘述。
66.步骤a40,在所述大类合并结果或所述经营范围大类概率结果中按照预设选取规
则进行类别选取,获得所述下一类别预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果。
67.在本实施例中,具体地,在所述大类合并结果中选取排名顺序取值小的分类作为所述对应层次的分类预测结果,若所述大类合并结果存在多个最小值时,则在所述经营范围大类概率结果中选取概率最大对应的分类作为所述对应层次的分类预测结果,以将所述对应层次的类别预测结果、所述经营范围与所述企业名称输入各自对应的层级分类模型的下一层类目分类模型,直至输出所述目标小类识别结果。
68.本技术实施例提供了一种行业类目识别方法,也即,将所述经营范围和所述分类预测结果输入所述经营范围分类模型中的第二层类目分类模型,输出经营范围大类概率结果,同时将将所述企业名称和所述分类预测结果输入所述名称分类模型中的第二层类目分类模型,输出名称大类概率结果,进而将所述经营范围大类概率结果和所述名称大类概率结果进行合并,获得大类合并结果,进一步地,在所述大类合并结果或所述经营范围大类概率结果中按照预设选取规则进行类别选取,获得所述下一类别预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果,实现了通过所述层级分类模型,对所述待分类企业按门类、大类、中类和小类的层级顺序进行预测,所述层级分类模型中的每一层类目分类模型根据上一层类目分类模型对应的分类预测结果进行判断下一层的输出,最终得到目标小类识别结果,以使得预测的目标范围较为集中,进而预测分类的效率更快,为克服现有技术中当行业类目缺失的企业较多时,使用传统的人工判别方法工作量大,需要较长的时间,进而导致行业分类效率较低的技术缺陷奠定了基础。
69.进一步地,参照图3,基于本技术中第一实施例,在本技术的另一实施例中,在所述分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型步骤之前,所述行业类目识别方法还包括:
70.步骤b10,获取行业分类中各级类目分别对应的样本企业名称和各级类目分别对应的样本经营范围;
71.在本实施例中,获取行业分类中各级类目分别对应的样本企业名称和各级类目分别对应的样本经营范围,具体地,根据国民行业分类标准最新版本,获取最新行业的分类信息,也即,门类、大类、中类和小类分别对应的样本企业名称和样本经营范围。
72.步骤b20,对所述样本企业名称和所述样本经营范围进行数据清洗,获得训练企业名称和训练经营范围;
73.在本实施例中,对所述样本企业名称和所述样本经营范围进行数据清洗,获得训练企业名称和训练经营范围,具体地,将所述样本企业名称中的地名和固定后缀等数据信息去除,以防止出现模型训练过拟合的情况,进而去除所述样本经营范围中的非经营范围文本描述的部分,例如国家法规的说明等。
74.步骤b30,获取待训练经营范围层级模型和待训练名称层级模型;
75.步骤b40,通过所述训练经营范围对所述待训练经营范围层级模型进行迭代训练优化,获得所述训练经营范围对应的层级分类模型;
76.在本实施例中,通过所述训练经营范围对所述待训练经营范围层级模型进行迭代训练优化,获得所述训练经营范围对应的层级分类模型,具体地,通过所述训练经营范围对
所述待训练经营范围层级模型中的第一层类目分类模型进行迭代训练,获得第一层类目分类模型,并输出第一层的训练预测结果,进而将所述训练经营范围与所述第一层的训练预测结果作为所述待训练经营范围层级模型中的下一层类目分类模型的输入,以对所述经营范围模型中的下一层类目分类模型进行迭代训练,获得对应层次的类目分类模型,直至训练完最后一层的类目分类模型。
77.其中,所述通过所述训练经营范围对所述待训练经营范围层级模型进行迭代训练优化,获得所述训练经营范围对应的层级分类模型的步骤包括:
78.步骤b41,通过所述训练经营范围对所述待训练经营范围层级模型中的第一层经营类目分类模型进行迭代训练,获得第一层经营类目分类模型,并输出训练经营范围预测结果;
79.在本实施例中,通过所述训练经营范围对所述待训练经营范围层级模型中的第一层类目分类模型进行迭代训练,获得第一层经营类目分类模型,并输出训练经营范围预测结果,具体地,将所述训练经营范围输入所述待训练经营范围层级模型中的第一层经营类目分类模型,以优化所述第一层经营类目分类模型,进而判断所述第一层经营类目分类模型是否满足预设训练结束条件,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件,若满足,获得所述第一层经营经营类目分类模型,并输出训练经营范围预测结果,若不满足,则返回执行步骤:通过所述训练经营范围对所述待训练经营范围层级模型中的第一层经营类目分类模型进行迭代训练,获得第一层经营类目分类模型。
80.步骤b42,基于所述训练经营范围预测结果与所述训练经营范围,对下一层经营类目分类模型进行迭代训练优化,获得对应层次的经营类目分类模型,并输出下一训练经营范围预测结果,循环直至训练完最后一层的经营类目分类模型,获得所述训练经营范围对应的层级分类模型。
81.在本实施例中,具体地,通过所述待训练经营范围层级模型中的第一层经营类目分类模型输出的训练经营范围预测结果与所述训练经营范围对下一层经营类目分类模型进行迭代训练,以优化所述待训练经营范围层级模型中的下一层经营类目分类模型直至满足预设训练结束条件,获得对应层次的类目分类模型,并输出下一训练经营范围预测结果,直至训练完待训练经营范围层级模型最后一层的经营类目分类模型,进而获得所述训练经营范围对应的层级分类模型。
82.步骤b50,通过所述训练企业名称对所述待训练名称层级模型进行迭代训练优化,获得所述训练企业名称对应的层级分类模型。
83.在本实施例中,通过所述训练企业名称对所述待训练名称层级模型进行迭代训练优化,获得和所述训练企业名称对应的层级分类模型,具体地,通过所述训练企业名称对所述待训练层级名称范围模型中的第一层类目分类模型进行迭代训练,获得第一层类目分类模型,并输出训练名称预测结果,进而将所述训练经营范围与所述第一层的训练预测结果作为所述待训练经营范围层级模型中的下一层类目分类模型的输入,以对所述经营范围模型中的下一层类目分类模型进行迭代训练,获得对应层次的类目分类模型,直至训练完最后一层的类目分类模型。
84.其中,所述通过所述训练企业名称对所述待训练名称层级模型进行迭代训练优化,获得所述训练企业名称对应的层级分类模型的步骤包括:
85.步骤b51,通过所述训练企业名称对所述待训练名称层级模型中的第一层名称类目分类模型进行迭代训练,获得第一层名称类目分类模型,并输出训练名称预测结果;
86.在本实施例中,通过所述训练企业名称对所述待训练名称层级模型中的第一层名称类目分类模型进行迭代训练,获得第一层名称类目分类模型,并输出训练名称预测结果,具体地,将所述训练企业名称输入所述待训练名称层级模型中的第一层名称类目分类模型,以优化所述第一层名称类目分类模型,进而判断所述第一层名称类目分类模型是否满足预设训练结束条件,若满足,获得所述第一层名称类目分类模型,并输出训练名称预测结果,若不满足,则返回执行步骤:通过所述训练企业名称对所述待训练名称层级模型中的第一层名称类目分类模型进行迭代训练,获得第一层名称类目分类模型,并输出训练名称预测结果,步骤b51的具体实施内容可参照步骤b41中的具体内容,在此不再赘述。
87.步骤b52,基于所述训练名称预测结果和所述训练企业名称,对下一层名称类目分类模型进行迭代训练优化,获得对应层次的名称类目分类模型,并输出下一训练名称预测结果,循环直至训练完最后一层的名称类目分类模型,获得所述训练企业名称对应的层级分类模型。
88.在本实施例中,具体地,通过所述待训练名称层级模型中的第一层名称类目分类模型输出的训练名称预测结果与所述训练企业名称对所述待训练名称层级模型中的下一层名称类目分类模型进行迭代训练,以优化所述待训练名称层级模型中的下一层名称类目分类模型直至满足预设训练结束条件,获得对应层次的名称类目分类模型,直至训练完最后一层的名称类目分类模型,进而获得所述训练企业名称对应的层级分类模型,步骤b52的具体实施内容可参照步骤b42中的具体内容,在此不再赘述。
89.本技术实施例提供了一种行业类目识别方法,也即,获取行业分类中各级类目分别对应的样本企业名称和各级类目分别对应的样本经营范围,进而对所述样本企业名称和所述样本经营范围进行数据清洗,获得训练企业名称和训练经营范围,进一步地,获取待训练经营范围层级模型和待训练名称层级模型,进而通过所述训练经营范围对所述待训练经营范围层级模型进行迭代训练优化,获得所述训练经营范围对应的层级分类模型,进一步地,通过所述训练企业名称对所述待训练名称层级模型进行迭代训练优化,获得所述训练企业名称对应的层级分类模型,训练过程采用层级训练方法,即每一层级只判断其对应下一级的类目,以使得在通过所述层级分类模型对待分类企业的预测过程中,减少类目的搜索空间,从而提高了钢业分类的效率,为克服现有技术中当行业类目缺失的企业较多时,使用传统的人工判别方法工作量大,需要较长的时间,进而导致行业分类效率较低的技术缺陷奠定了基础。
90.参照图4,图4是本技术实施例方案涉及的硬件运行环境的行业类目识别设备结构示意图。
91.如图4所示,该行业类目识别设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速rbm存储器,也可以是稳定的存储器(non

volbtile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
92.可选地,该行业类目识别设备还可以包括矩形用户接口、网络接口、相机、rf(rbdio frequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括
显示屏(displby)、输入子模块比如键盘(keybobrd),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可包括标准的有线接口、无线接口(如wifi接口)。
93.本领域技术人员可以理解,图4中示出的行业类目识别设备结构并不构成对行业类目识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
94.如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及行业类目识别程序。操作系统是管理和控制行业类目识别设备硬件和软件资源的程序,支持行业类目识别程序以及其它软件和/或,程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与行业类目识别系统中其它硬件和软件之间通信。
95.在图4所示的行业类目识别设备中,处理器1001用于执行存储器1005中存储的行业类目识别程序,实现上述任一项所述的行业类目识别方法的步骤。
96.本技术行业类目识别设备具体实施方式与上述行业类目识别方法各实施例基本相同,在此不再赘述。
97.本技术还提供一种行业类目识别装置,所述行业类目识别装置包括:
98.获取模块,用于获取待分类企业的经营范围和企业名称;
99.第一分类模块,用于分别将所述经营范围与所述企业名称输入各自对应的层级分类模型的第一层类目分类模型,获得分类预测结果,其中,所述层级分类模型包括各层类目分类模型;
100.第二分类模块,用于将所述分类预测结果分别和所述经营范围以及所述企业名称进行组合,以作为所述经营范围和所述企业名称分别对应的下一层类目分类模型的输入,获得下一分类预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果;
101.确定模块,用于基于所述目标小类识别结果和预设类目体系映射关系,确定所述待分类企业对应的行业类目。
102.可选地,所述第一分类模块还用于:
103.将所述经营范围输入所述经营范围层级分类模型中的第一层类目分类模型,输出经营范围门类概率结果;
104.将所述企业名称输入所述名称层级分类模型中的第一层类目分类模型,输出名称门类概率结果;
105.将所述经营范围门类概率结果和所述名称门类概率结果进行合并,获得门类合并结果;
106.在所述类目合并结果或所述经营范围门类概率结果中按照预设选取规则进行类别选取,获得分类预测结果。
107.可选地,所述第一分类模块还用于:
108.将所述经营范围门类概率结果进行排序,获得第一排序结果;
109.将所述名称门类概率结果进行排序,获得第二排序结果;
110.将所述第一排序结果和所述第二排序结果进行相加,获得所述类目合并结果。
111.可选地,所述第二分类模块还用于:
112.将所述经营范围和所述分类预测结果输入所述经营范围分类模型中的第二层类
目分类模型,输出经营范围大类概率结果;
113.将所述企业名称和所述分类预测结果输入所述名称分类模型中的第二层类目分类模型,输出名称大类概率结果;
114.将所述经营范围大类概率结果和所述名称大类概率结果进行合并,获得大类合并结果;
115.在所述大类合并结果或所述经营范围大类概率结果中按照预设选取规则进行类别选取,获得所述下一类别预测结果,循环直至达到最后一层类目分类模型,获得目标小类识别结果。
116.可选地,所述行业类目识别装置还用于:
117.获取行业分类中各级类目分别对应的样本企业名称和各级类目分别对应的样本经营范围;
118.对所述样本企业名称和所述样本经营范围进行数据清洗,获得训练企业名称和训练经营范围;
119.获取待训练经营范围层级模型和待训练名称层级模型;
120.通过所述训练经营范围对所述待训练经营范围层级模型进行迭代训练优化,获得所述训练经营范围对应的层级分类模型;
121.通过所述训练企业名称对所述待训练名称层级模型进行迭代训练优化,获得所述训练企业名称对应的层级分类模型。
122.可选地,所述行业类目识别装置还用于:
123.通过所述训练经营范围对所述待训练经营范围层级模型中的第一层类目分类模型进行迭代训练,获得第一层经营类目分类模型,并输出训练经营范围预测结果;
124.基于所述训练经营范围预测结果与所述训练经营范围,对下一层经营类目分类模型进行迭代训练优化,获得对应层次的经营类目分类模型,并输出下一训练经营范围预测结果,循环直至训练完最后一层的经营类目分类模型,获得所述训练经营范围对应的层级分类模型。
125.可选地,所述行业类目识别装置还用于:
126.通过所述训练企业名称对所述待训练名称层级模型中的第一层类目分类模型进行迭代训练,获得第一层名称类目分类模型,并输出训练名称预测结果;
127.基于所述训练名称预测结果和所述训练企业名称,对下一层名称类目分类模型进行迭代训练优化,获得对应层次的名称类目分类模型,并输出下一训练名称预测结果,循环直至训练完最后一层的名称类目分类模型,获得所述训练企业名称对应的层级分类模型。
128.本技术行业类目识别装置的具体实施方式与上述行业类目识别方法各实施例基本相同,在此不再赘述。
129.本技术实施例提供了一种介质,所述介质为可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的行业类目识别方法的步骤。
130.本技术可读存储介质具体实施方式与上述行业类目识别方法各实施例基本相同,在此不再赘述。
131.本技术实施例提供了一种计算机程序产品,且所述计算机程序产品包括有一个或
者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的行业类目识别方法的步骤。
132.本技术计算机程序产品具体实施方式与上述行业类目识别方法各实施例基本相同,在此不再赘述。
133.以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利处理范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献