一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种确定代理主体的方法及装置与流程

2022-03-26 02:18:45 来源:中国专利 TAG:


1.本发明涉及金融科技(fintech)领域,尤其涉及一种确定代理主体的方法及装置。


背景技术:

2.随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技转变,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。在金融领域中,除了通用的企业贷款产品外,围绕供应链的金融产品也在不断发展。供应链金融的最大痛点在于如何判断哪些企业属于供应链相关企业,也就是经销商。目前确定经销商的方式主要是通过人工在互联网上搜索查找,但是由于互联网上关于经销商的上下游的相关数据较少,通过人工难以精确的找到代理各大品牌的经销商。因此,导致通过人工查找经销商时会出现识别效率和准确率低的问题。


技术实现要素:

3.本发明提供了一种确定代理主体的方法及装置,可以提高识别代理主体的效率和准确率。
4.第一方面,本发明提供了一种确定代理主体的方法,包括:
5.获取企业的企业名称;
6.将所述企业的企业名称进行分词处理,得到所述企业的企业字号,并确定出所述企业的地域、经营范围和经营规模;
7.将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量;
8.将所述企业的特征向量输入到代理主体预测模型中,确定出所述企业的代理主体类型,其中,所述代理主体预测模型是对标记有代理主体类型的企业的企业名称的训练样本进行训练学习得到的。
9.上述技术方案中,由于通过使用了标记有代理主体类型的企业的企业名称的训练样本进行训练学习得到的代理主体预测模型对企业的代理主体类别进行预测,可以实现快速的识别出企业的代理主体类型,提高代理主体类别识别的效率,由于是由代理主体预测模型来预测企业的代理主体类别,相对于现有技术中通过少量的上下游数据进行人工查找代理主体的方式,可以提高确定代理主体的准确率。同时本发明实施例使用代理主体预测模型方式来代替人工查找代理主体,可以减少人工成本,进而降低了拓展代理主体的成本。
10.可选的,所述将所述企业的企业名称进行分词处理,包括:
11.使用预训练分词模型将所述企业的企业名称进行分词处理。
12.可选的,所述将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量,包括:
13.使用预训练词向量模型将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量。
14.上述技术方案中,使用预训练词向量模型将企业的企业字号、地域、经营范围和经营规模进行向量化,可以提高代理主体预测模型的预测效率。
15.可选的,所述对标记有代理主体类型的企业的企业名称的训练样本进行训练学习得到所述代理主体预测模型,包括:
16.获取所述标记有代理主体类型的企业的企业名称的训练样本;
17.分别对所述训练样本中的企业名称进行分词处理,得到所述训练样本中的企业的企业字号、地域、经营范围和经营规模;
18.对所述训练样本中分词后的企业名称进行聚类,并确定出每个类别的核心特征;
19.将所述企业所在类别的核心特征以及所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述训练样本中各企业对应的特征向量;
20.将所述训练样本中各企业对应的特征向量依次输入到预设的监督学习模型中进行训练,直到模型收敛后,得到所述代理主体预测模型。
21.可选的,所述监督学习模型为逻辑回归模型。
22.可选的,所述代理主体类别包括代理主体和非代理主体;
23.所述将所述企业的特征向量输入到代理主体预测模型中,确定出所述企业的代理主体类型,包括:
24.将所述企业的特征向量输入到所述代理主体预测模型中,确定出所述企业对应的预测概率;
25.若预测概率大于阈值,则确定所述企业为代理主体;否则确定所述企业为非代理主体。
26.上述技术方案中,通过判断预测概率是否大于阈值的方式来确定企业是否为代理主体,可以实现准确的确定出企业的代理主体类型。
27.可选的,在确定出所述企业的代理主体类型之后,还包括:
28.将所述企业的企业名称及其对应的代理主体类别存入所述训练样本,重新训练所述代理主体预测模型。
29.上述技术方案中,通过将新确定出的企业的代理主体类型存储到训练样本中,可以增加训练样本的样本数据,重新训练的代理主体预测模型能够进一步的提高预测效果。
30.第二方面,本发明实施例提供一种确定代理主体的装置,包括:
31.获取单元,用于获取企业的企业名称;
32.处理单元,用于将所述企业的企业名称进行分词处理,得到所述企业的企业字号,并确定出所述企业的地域、经营范围和经营规模;将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量;将所述企业的特征向量输入到代理主体预测模型中,确定出所述企业的代理主体类型,其中,所述代理主体预测模型是对标记有代理主体类型的企业的企业名称的训练样本进行训练学习得到的。
33.可选的,所述处理单元具体用于:
34.使用预训练分词模型将所述企业的企业名称进行分词处理。
35.可选的,所述处理单元具体用于:
36.使用预训练词向量模型将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量。
37.可选的,所述处理单元具体用于:
38.获取所述标记有代理主体类型的企业的企业名称的训练样本;
39.分别对所述训练样本中的企业名称进行分词处理,得到所述训练样本中的企业的企业字号、地域、经营范围和经营规模;
40.对所述训练样本中分词后的企业名称进行聚类,并确定出每个类别的核心特征;
41.将所述企业所在类别的核心特征以及所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述训练样本中各企业对应的特征向量;
42.将所述训练样本中各企业对应的特征向量依次输入到预设的监督学习模型中进行训练,直到模型收敛后,得到所述代理主体预测模型。
43.可选的,所述监督学习模型为逻辑回归模型。
44.可选的,所述代理主体类别包括代理主体和非代理主体;
45.所述处理单元具体用于:
46.将所述企业的特征向量输入到所述代理主体预测模型中,确定出所述企业对应的预测概率;
47.若预测概率大于阈值,则确定所述企业为代理主体;否则确定所述企业为非代理主体。
48.可选的,所述处理单元还用于:
49.在确定出所述企业的代理主体类型之后,将所述企业的企业名称及其对应的代理主体类别存入所述训练样本,重新训练所述代理主体预测模型。
50.第三方面,本发明提供一种计算设备,包括:
51.存储器,用于存储计算机程序;
52.处理器,用于调用所述存储器中存储的计算机程序,按照获得的程序执行上述第一方面所述的方法。
53.第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行上述第一方面所述的方法。
附图说明
54.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
55.图1为本发明实施例提供的一种系统架构的示意图;
56.图2为本发明实施例提供的一种确定代理主体的方法的流程示意图;
57.图3为本发明实施例提供的一种确定代理主体的装置的结构示意图。
具体实施方式
58.为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施
例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
59.图1为本发明实施例提供的一种系统架构。如图1所示,该系统架构可以为服务器100,包括处理器110、通信接口120和存储器130。
60.其中,通信接口120用于与终端设备进行通信,收发该终端设备传输的信息,实现通信。
61.处理器110是服务器100的控制中心,利用各种接口和线路连接整个服务器100的各个部分,通过运行或执行存储在存储器130内的软件程序/或模块,以及调用存储在存储器130内的数据,执行服务器100的各种功能和处理数据。可选地,处理器110可以包括一个或多个处理单元。
62.存储器130可用于存储软件程序以及模块,处理器110通过运行存储在存储器130的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器130可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据业务处理所创建的数据等。此外,存储器130可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
63.需要说明的是,上述图1所示的结构仅是一种示例,本发明实施例对此不做限定。
64.基于上述描述,图2示例性的示出了本发明实施例提供的一种确定代理主体的方法的流程,该流程可以由一种确定代理主体的装置执行。
65.如图2所示,该流程具体步骤包括:
66.步骤201,获取企业的企业名称。
67.在本发明实施例中,该企业为需要确定是否为代理主体企业的企业。其企业名称为该企业的整体名称,例如,上海xxx日化贸易有限责任公司。
68.需要说明的是,本发明实施例中的代理主体可以是经销商或其他的经营代理品牌的企业。代理主体类型可以分为代理主体和非代理主体,相应的,代理主体类型也可以称为经销商和非经销商。
69.步骤202,将所述企业的企业名称进行分词处理,得到所述企业的企业字号,并确定出所述企业的地域、经营范围和经营规模。
70.得到企业名称之后,就可以对企业名称进行分词,例如对上海xxx日化贸易有限责任公司进行分词,可以得到分词后的企业名称=“上海xxx日化贸易有限责任公司”,通过分词后的企业名称可以确定出企业的地域、经营范围和经营规模,即企业的地域为上海、经营范围为日化产品、经营规模为有限责任公司。
71.常规的分词方式是将企业名称与词典中的词进行匹配,匹配成功后使用空格作为分隔符将每个词隔开。
72.在本发明实施例中,可以使用预训练分词模型对企业的企业名称进行分词,比如可以是hmm(hidden markov model,隐式马尔科夫模型)、crf(conditional random field,条件随机场)等模型。
73.该经营规模和企业的公司类型相关,还可以是个体户、个人独资企业、股份有限公司、集团公司等。
74.步骤203,将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量。
75.在本发明实施例中,可以将使用预训练词向量模型将企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到企业的特征向量。该预训练词向量模型可以为bert(bidirectional encoder representations from transformers,transformer的双向编码器表示)。
76.需要说明的是,对企业的企业字号、地域、经营范围和经营规模进行向量化处理时并不限于使用上述预训练词向量模型,也可以使用其它的词向量模型,例如词向量模型word2vec(word to vector,词向量)、glove(global vectors,全局向量)、elmo(embeddings from language models,嵌入语言模型)等。
77.步骤204,将所述企业的特征向量输入到代理主体预测模型中,确定出所述企业的代理主体类型。
78.具体的,可以将企业的特征向量输入到代理主体预测模型中,确定出企业对应的预测概率,若预测概率大于阈值,则确定企业为代理主体。否则确定企业为非代理主体。从而可以实现确定出企业的代理主体类型。该阈值可以依据经验设置。
79.在将企业的特征向量输入到代理主体预测模型之前,需要先训练该代理主体预测模型。在训练时,可以先获取标记有代理主体类型的企业的企业名称的训练样本,然后分别对训练样本中的企业名称进行分词处理,得到训练样本中的企业的企业字号、地域、经营范围和经营规模。再对训练样本中分词后的企业名称进行聚类,并确定出每个类别的核心特征。最后将企业所在类别的核心特征以及企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到训练样本中各企业对应的特征向量。将训练样本中各企业对应的特征向量依次输入到预设的监督学习模型中进行训练,直到模型收敛后,得到代理主体预测模型。
80.该标记有代理主体类型的企业的企业名称的训练样本中包括了正样本和负样本。其中,代理主体类型为标记有代理主体企业的企业的企业名称为正样本,代理主体类型为标记有非代理主体企业的企业的企业名称为负样本。
81.例如,某企业的企业名称为上海xxx日化贸易有限责任公司,该企业为代理主体企业,则可以标记该企业名称即为正样本。另一企业的企业名称为上海xxx信息技术有限责任公司,该企业为非代理主体,则可以标记该企业名称即为负样本。
82.对训练样本中所有的企业名称进行分词,根据分词结果,确定企业的企业字号、地域、经营范围和规模。分别对代理主体企业和非代理主体企业的分词结果使用k-means(k均值)算法进行聚类(非监督学习),得到代理主体企业和非代理主体企业的核心特征模型。也就是确定每个类别的核心特征。具体的,可以将每个类别的中心对应的词确定为该类别的核心特征。这样该类别中的企业就标记有对应的核心特征。
83.最后以代理主体企业作为正样本,非代理主体企业作为负样本,使用lr(logistic regression,逻辑回归模型)算法(监督学习)进行模型训练,直到模型收敛为止,就可以得到代理主体预测模型。
84.在进行代理主体预测模型训练时,本发明实施例不限于使用上述lr算法,也可以使用其它的神经网络模型,例如支持向量机、深度学习模型、卷积神经网络等。
85.此外,本发明实施例还可以将企业的企业名称及其对应的代理主体类别存入上述
训练样本中,重新训练上述代理主体预测模型。这样可以不断提高代理主体类别的预测效果。
86.本发明实施例通过使用企业名称即可以给出预测结果,数据门槛较低,比较容易实现。此外由于结合非监督学习和监督学习算法,利用少量数据挖掘代理主体企业的特点,并可以不断的增加训练样本的数量。
87.本发明实施例表明,通过获取企业的企业名称,将企业的企业名称进行分词处理,得到企业的企业字号,并确定出企业的地域、经营范围和经营规模,将企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到企业的特征向量,将企业的特征向量输入到代理主体预测模型中,确定出企业的代理主体类型,其中,代理主体预测模型是对标记有代理主体类型的企业的企业名称的训练样本进行训练学习得到的。由于通过使用了标记有代理主体类型的企业的企业名称的训练样本进行训练学习得到的代理主体预测模型对企业的代理主体类别进行预测,可以提高代理主体类别识别的效率,由于是由代理主体预测模型来预测企业的代理主体类别,相当于现有技术中通过少量的上下游数据进行人工查找代理主体企业的方式,可以提高确定代理主体企业的准确率。
88.基于相同的技术构思,图3示例性的示出了本发明实施例提供的一种确定代理主体的装置的结构示意图,该装置可以执行确定代理主体的流程。
89.如图3所示,该装置具体包括:
90.获取单元301,用于获取企业的企业名称;
91.处理单元302,用于将所述企业的企业名称进行分词处理,得到所述企业的企业字号,并确定出所述企业的地域、经营范围和经营规模;将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量;将所述企业的特征向量输入到代理主体预测模型中,确定出所述企业的代理主体类型,其中,所述代理主体预测模型是对标记有代理主体类型的企业的企业名称的训练样本进行训练学习得到的。
92.可选的,所述处理单元302具体用于:
93.使用预训练分词模型将所述企业的企业名称进行分词处理。
94.可选的,所述处理单元302具体用于:
95.使用预训练词向量模型将所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述企业的特征向量。
96.可选的,所述处理单元302具体用于:
97.获取所述标记有代理主体类型的企业的企业名称的训练样本;
98.分别对所述训练样本中的企业名称进行分词处理,得到所述训练样本中的企业的企业字号、地域、经营范围和经营规模;
99.对所述训练样本中分词后的企业名称进行聚类,并确定出每个类别的核心特征;
100.将所述企业所在类别的核心特征以及所述企业的企业字号、地域、经营范围和经营规模进行向量化处理,得到所述训练样本中各企业对应的特征向量;
101.将所述训练样本中各企业对应的特征向量依次输入到预设的监督学习模型中进行训练,直到模型收敛后,得到所述代理主体预测模型。
102.可选的,所述监督学习模型为逻辑回归模型。
103.可选的,所述代理主体类别包括代理主体和非代理主体;
104.所述处理单元302具体用于:
105.将所述企业的特征向量输入到所述代理主体预测模型中,确定出所述企业对应的预测概率;
106.若预测概率大于阈值,则确定所述企业为代理主体;否则确定所述企业为非代理主体。
107.可选的,所述处理单元302还用于:
108.在确定出所述企业的代理主体类型之后,将所述企业的企业名称及其对应的代理主体类别存入所述训练样本,重新训练所述代理主体预测模型。
109.基于相同的技术构思,本发明实施例提供一种计算设备,包括:
110.存储器,用于存储计算机程序;
111.处理器,用于调用所述存储器中存储的计算机程序,按照获得的程序执行上述确定代理主体的方法。
112.基于相同的技术构思,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行上述确定代理主体的方法。
113.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
114.本发明是参照根据本发明的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
115.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
116.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
117.尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
118.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本技术权利要求及其等同技术的范围
之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献