智能匹配方法、装置、电子设备及存储介质与流程

2022-02-22 23:39:31 来源：中国专利 TAG：

1.本公开涉及计算机技术领域，尤其涉及一种智能匹配方法、装置、电子设备及存储介质。

背景技术：

2.随着科学技术的迅速发展，政府部门制定并出台了一系列针对企业的相关政策，但是由于这些政策的类别、发布部门、要求条件等不同，并且企业的各种信息也不同，需要根据海量的政策数据和企业数据对政策和企业进行匹配。相关技术中的政策和企业的匹配方法效率较低、准确性较差。
3.需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素：

4.本公开的目的在于提供一种智能匹配方法、装置、电子设备及存储介质，该方法可以自动、快速、准确地获得政策和企业的匹配度。
5.本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。
6.本公开实施例提供一种智能匹配方法，包括：获取政策的政策信息和企业的企业信息，所述政策信息包括政策标题和政策原文；对所述政策标题和所述政策原文进行特征提取，获得所述政策标题的词向量、所述政策原文的词向量以及所述政策原文的关键词的词向量；根据所述政策标题的词向量、所述政策原文的词向量以及所述政策原文的关键词的词向量，确定所述政策的特征向量；通过深度学习模型对所述政策的特征向量和所述企业信息进行处理，获得所述政策和所述企业的匹配度。
7.在本公开一些示例性实施例中，所述政策信息还包括政策发布部门，所述企业信息包括所述企业的地域信息；在对所述政策标题和所述政策原文进行特征提取之前，所述方法还包括：根据所述政策发布部门确定所述政策的地域信息；根据所述政策的地域信息和所述企业的地域信息，对所述政策和所述企业进行过滤。
8.在本公开一些示例性实施例中，所述企业信息包括所述企业的行业信息；在对所述政策标题和所述政策原文进行特征提取之前，所述方法还包括：通过政策行业分类模型对所述政策原文进行处理，获得所述政策的行业信息；根据所述政策的行业信息和所述企业的行业信息，对所述政策和所述企业进行过滤。
9.在本公开一些示例性实施例中，对所述政策标题和所述政策原文进行特征提取，获得所述政策标题的词向量、所述政策原文的词向量以及所述政策原文的关键词的词向量，包括：通过第一bert深度学习模型对所述政策标题进行处理，获得所述政策标题的词向量；通过textrank算法模型对所述政策原文进行处理，获得所述政策原文的关键词的词向量；通过第二bert深度学习模型对所述政策原文进行处理，获得所述政策原文的词向量。
10.在本公开一些示例性实施例中，根据所述政策标题的词向量、所述政策原文的词向量以及所述政策原文的关键词的词向量，确定所述政策的特征向量，包括：分别使用第一权重、第二权重和第三权重对所述政策标题的词向量、所述政策原文的词向量和所述政策原文的关键词的词向量进行加权求和，获得所述政策的特征向量。
11.在本公开一些示例性实施例中，所述政策信息还包括政策发布部门；所述深度学习模型为deepfm模型，所述deepfm模型包括deep结构和fm结构；其中，所述方法还包括：对所述政策标题、政策发布部门和政策原文进行处理，获得所述政策的政策类别、政策发布部门类别和财务信息；其中，通过深度学习模型对所述政策的特征向量和所述企业信息进行处理，获得所述政策和所述企业的匹配度，包括：通过所述fm结构对所述政策类别、所述政策发布部门类别、所述财务信息和所述企业信息进行处理，获得第一输出结果；通过deep结构对所述政策类别、所述政策发布部门类别、所述财务信息、所述政策的特征向量和所述企业信息进行处理，获得第二输出结果；根据所述第一输出结果和所述第二输出结果，获得所述政策和所述企业的匹配度。
12.在本公开一些示例性实施例中，所述deep结构包括多层残差网络结构，所述多层残差网络结构包括第一残差网络结构和第二残差网络结构；其中，通过所述deep结构对所述政策类别、所述政策发布部门类别、所述财务信息、所述政策的特征向量和所述企业信息进行处理，获得第二输出结果，包括：通过所述第一残差网络结构对所述政策类别、所述政策发布部门类别、所述财务信息、所述政策的特征向量和所述企业信息进行处理，获得中间输出结果；通过所述第二残差网络结构对所述中间输出结果进行处理，以获得所述第二输出结果。
13.在本公开一些示例性实施例中，每层残差网络结构均包括输入层、全连接层和输出层，所述第一残差网络结构的输出层与所述第二残差网络结构的输入层连接。
14.在本公开一些示例性实施例中，对所述政策标题、政策发布部门和政策原文进行处理，获得所述政策的政策类别、政策发布部门类别和财务信息，包括：通过政策分类模型对所述政策标题进行处理，获得所述政策的政策类别；通过政策发布部门分类模型对所述政策发布部门进行处理，获得所述政策的政策发布部门类别；通过正则表达式提取所述政策原文中的财务信息。
15.本公开实施例提供一种智能匹配装置，包括：信息获取模块，用于获取政策的政策信息和企业的企业信息，所述政策信息包括政策标题和政策原文；特征提取模块，用于对所述政策标题和所述政策原文进行特征提取，获得所述政策标题的词向量、所述政策原文的词向量以及所述政策原文的关键词的词向量；特征向量确定模块，用于根据所述政策标题的词向量、所述政策原文的词向量以及所述政策原文的关键词的词向量，确定所述政策的特征向量；匹配度获得模块，用于通过深度学习模型对所述政策的特征向量和所述企业信息进行处理，获得所述政策和所述企业的匹配度。
16.本公开实施例提供一种电子设备，包括：至少一个处理器；存储装置，用于存储至少一个程序，当所述至少一个程序被所述至少一个处理器执行时，使得所述至少一个处理器实现如上述任一种智能匹配方法。
17.本公开实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一种智能匹配方法。
18.本公开实施例提供的智能匹配方法，通过对政策的政策信息进行特征提取，基于深度学习模型对政策的特征向量和企业的企业信息进行处理，可以自动、快速、准确地获得政策和企业的匹配度。并且，该方法全面考虑了政策的政策标题、政策原文和政策原文的关键词对政策的特征提取的影响，提高了政策与企业的匹配度的准确性。
19.此外，该方法还可以为政策的政策标题、政策原文和政策原文的关键词分别设置权重，可以由历史数据和专家经验训练得到各个部分的权重，减少人工参与，进而提高了匹配的准确性。
20.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
21.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
22.图1示出了可以应用本公开实施例的智能匹配方法的示例性系统架构的示意图。
23.图2是根据一示例性实施方式示出的一种智能匹配方法的流程图。
24.图3是根据一示例性实施方式示出的一种deepfm算法架构的示意图。
25.图4是根据一示例性实施方式示出的另一种智能匹配方法的流程图。
26.图5是根据一示例示出的企业匹配流程的示意图。
27.图6是根据一示例示出的政策匹配流程的示意图。
28.图7是根据一示例性实施方式示出的一种智能匹配装置的框图。
29.图8是根据一示例性实施方式示出的一种电子设备的结构示意图。
具体实施方式
30.现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
31.此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
32.图1示出了可以应用本公开实施例的智能匹配方法的示例性系统架构的示意图。
33.如图1所示，该系统架构可以包括服务器101、网络102和终端设备103。网络102用以在终端设备103和服务器101之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
34.服务器101可以是提供各种服务的服务器，例如对用户利用终端设备103所进行操
作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理，并将处理结果反馈给终端设备。
35.本公开实施例中，服务器101例如可以获取政策的政策信息和企业的企业信息，政策信息包括政策标题和政策原文；服务器101可以对政策标题和政策原文进行特征提取，获得政策标题的词向量、政策原文的词向量以及政策原文的关键词的词向量；服务器101可以根据政策标题的词向量、政策原文的词向量以及政策原文的关键词的词向量，确定政策的特征向量；服务器101可以通过深度学习模型对政策的特征向量和企业信息进行处理，获得政策和企业的匹配度。
36.应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的，服务器101可以是一个实体的服务器，还可以为多个服务器组成的服务器集群，还可以是云端服务器，根据实际需要，可以具有任意数目的终端设备、网络和服务器。
37.下面，将结合附图及实施例对本公开示例实施例中的智能匹配方法的各个步骤进行更详细的说明。
38.图2是根据一示例性实施方式示出的一种智能匹配方法的流程图。本公开实施例提供的方法可以由如图1所示的服务器执行，但本公开并不限定于此。
39.如图2所示，本公开实施例提供的智能匹配方法可以包括以下步骤。
40.在步骤s202中，获取政策的政策信息和企业的企业信息。
41.其中，政策信息可以包括政策标题和政策原文，还可以包括政策发布部门。
42.本公开实施例中，政策可以由政策发布部门发布在互联网上，供用户查看。
43.本公开实施例中，企业的企业信息可以包括但不限于企业的基本信息、人力信息、财务信息、知识产权信息、经营信息、风险信息和创新载体信息数据等。
44.在示例性实施例中，该方法还可以包括：对政策标题、政策发布部门和政策原文进行处理，获得政策的政策类别、政策发布部门类别和财务信息。
45.其中，对政策标题、政策发布部门和政策原文进行处理，获得政策的政策类别、政策发布部门类别和财务信息可以包括：通过政策分类模型对政策标题进行处理，获得政策的政策类别；通过政策发布部门分类模型对政策发布部门进行处理，获得政策的政策发布部门类别；通过正则表达式提取政策原文中的财务信息。
46.在示例性实施例中，该方法还可以包括：通过政策行业分类模型对政策原文进行处理，获得政策的行业信息。
47.其中，上述政策分布模型可以为fasttext(快速文本分类器)深度学习模型，上述政策发布部门分类模型可以为textrnn(text recurrent neural network，文本循环神经网络)深度学习模型，上述政策行业分类模型可以为textcnn(text convolutional neural network，文本卷积神经网络)深度学习模型，但本公开并不限定于此。
48.例如，可以基于fasttext深度学习模型构建政策分类模型，将政策标题输入至该政策分类模型，可以输出政策的政策类别，政策类别可以包括但不限于资金支持、税费减免、人才奖励、产业补贴。政策类别可以用pf表示。
49.例如，可以基于textrnn模型构建政策发布部门分类模型，将政策发布部门输入至该发布部门分类模型，可以输出该政策发布部门的政策发布部门类别，政策发布部门类别可以包括但不限于科技类、知识产权类、文化类、经工信类、课题类、农业类、服务类、人社
类、其他类。政策发布部门类别可以用pdc表示。
50.例如，可以基于textcnn深度学习模型构建政策行业分类模型，将政策原文输入至政策行业分类模型，可以输出一个或多个行业信息，行业信息可以用pis表示。
51.行业信息可以如表1所示的二级行业。需要说明的是，表1以一级行业为建筑业和金融业为例，列举了建筑业和金融业对应的二级行业，但本公开并不限定于此。
52.表1：行业类别信息
53.一级行业二级行业建筑业房屋建筑业建筑业土木工程建筑业建筑业建筑安装业建筑业建筑装饰和其他建筑业金融业货币金融服务金融业资本市场服务金融业保险业金融业其他金融业
54.例如，可以根据正则表达式从政策原文提取相关的财务信息，财务信息可以为最高补贴金额(最高补贴金额可以用pmm表示)。例如：政策原文中包含“最高补贴金额不超过100万元”，则提取出该字段信息为100，单位为万。
55.本公开实施例中，还可以根据transformer(转换器)模型提取政策要求条件信息。其中，政策要求条件信息可以为政策中提到的企业需满足的条件。将政策原文输入至transformer模型，可以输出政策要求条件信息，政策要求条件信息包括但不限于基本信息、企业规模、生命周期、政策类型等，政策要求条件集合cond可以表示为：
56.cond＝[c1,c2,
…
,cn]
ꢀꢀꢀ
(1)
[0057]
其中，cn表示第n个政策要求条件，n为大于或等于1的整数。
[0058]
本公开实施例中，政策要求条件信息可以从表2中获得。
[0059]
参考表2，其包括特征维度、所属类别、细分维度和备注。本公开实施例中，可以针对一个政策确定与其匹配的企业，或者，可以针对一个企业确定与其匹配的政策。
[0060]
以特征维度为企业基本信息为例，其所属类别为“政策/企业”表示在这个维度下可以针对政策匹配企业，也可以针对企业匹配政策；以细分维度为地域信息为例，例如政策需要匹配的企业应满足“辽宁省沈阳市和平区”，则企业的地域信息为“辽宁省沈阳市和平区”的可以认为与其匹配；例如企业需要匹配的政策应满足“辽宁省沈阳市和平区”，则政策的地域信息为“辽宁省沈阳市和平区”的可以认为与其匹配。
[0061]
以特征维度为生命周期为例，其所属类别为“政策”表示在这个维度下只能针对政策匹配企业，以细分维度为初创期为例，例如政策需要匹配的企业应满足初创期，则可以获取企业的成立日期，通过企业的成立日期来判断满足初创期，以判断是否与政策匹配。
[0062]
表2特征信息
[0063]
[0064]
[0065]
[0066][0067]
本公开实施例中，企业的企业信息可以包括但不限于企业的基本信息、人力信息、财务信息、知识产权信息、经营信息、风险信息和创新载体信息，上述企业信息可以通过企业的名称或企业标识获取。具体的企业信息可以参考表2中所属类别包含企业的行对应的特征维度和细分维度。
[0068]
企业的企业信息cf可以表示为：
[0069]
cf＝[cf1,cf2,
…
,cf
dim
]
ꢀꢀꢀ
(2)
[0070]
其中，cf
dim
表示第dim个企业信息，dim为大于或等于1的整数。
[0071]
在步骤s204中，对政策标题和政策原文进行特征提取，获得政策标题的词向量、政策原文的词向量以及政策原文的关键词的词向量。
[0072]
本公开实施例中，可以使用深度学习模型分别对政策标题和政策原文进行特征提取，分别获得政策标题的词向量和政策原文的词向量；可以从政策原文中提取关键词，并将关键词转化为关键词的词向量。
[0073]
在示例性实施例中，可以通过第一bert(bidirectional encoder representations from transformers，来自变换器的双向编码器表征量)深度学习模型对政策标题进行处理，获得政策标题的词向量；通过textrank算法模型对政策原文进行处理，获得所述政策原文的关键词的词向量；通过第二bert深度学习模型对政策原文进行处理，获得政策原文的词向量。
[0074]
其中，第一bert深度学习模型和第二bert深度学习模型可以为相同的bert深度学习模型，也可以为不同的bert深度学习模型。
[0075]
例如，可以预训练第一bert深度学习模型，模型维度为dim，将政策标题输入至第一bert深度学习模型中，可以输出政策标题的词向量，政策标题的词向量集合te可以表示为：
[0076]
te＝[te1,te2,
…
,te
dim
]
ꢀꢀꢀ
(3)
[0077]
其中，te
dim
表示第dim个政策标题的词向量。
[0078]
例如，可以使用textrank(文本排序)算法模型从政策原文中提取n个关键词，并将n个关键词转化为词向量。其中，n个关键词的列表words可以表示为：
[0079]
words＝[ke1,ke2,
…
,ken]
ꢀꢀꢀ
(4)
[0080]
其中，ke1～ken表示政策关键词。
[0081]
每个关键词kei的词向量可以表示为：
[0082]
kei＝[ke1,ke2,
…
,ke
dim
],i∈(1,n)
ꢀꢀꢀ
(5)
[0083]
其中，ke
dim
表示kei中第dim个维度的向量。
[0084]
对上述n个关键词的词向量求平均得到政策原文的关键词的词向量ae可以表示为：
[0085]
ae＝[ae1,ae2,
…
,ae
dim
]
ꢀꢀꢀ
(6)
[0086]
其中，ae
dim
表示ae中第dim个维度的向量。
[0087]
例如，可以预训练第二bert深度学习模型，模型维度为dim，将政策原文输入至第二bert深度学习模型中，可以输出政策原文的词向量，政策原文的词向量se可以表示为：
[0088]
se＝[se1,se2,
…
,se
dim
]
ꢀꢀꢀ
(7)
[0089]
其中，se
dim
表示se中第dim个维度的向量。
[0090]
本公开实施例中，一方面，通过bert深度学习模型和textrank算法对政策原文和政策标题进行处理，可以准确地获得表征政策原文、政策标题和政策原文的关键词的词向量，从而提高政策与企业的匹配度的准确性；另一方面，将政策原文和政策标题转化为词向量的形式，便于后续使用深度学习模型进行处理，可以提高模型处理的效率。
[0091]
在步骤s206中，根据政策标题的词向量、政策原文的词向量以及政策原文的关键词的词向量，确定政策的特征向量。
[0092]
本公开实施例中，可以分别为政策标题的词向量、政策原文的词向量和政策原文的关键词的词向量设置权重，以获得政策的特征向量；也可以将政策标题的词向量、政策原文的词向量和政策原文的关键词的词向量拼接，获得政策的特征向量。
[0093]
在示例性实施例中，分别使用第一权重、第二权重和第三权重对政策标题的词向量、政策原文的词向量和政策原文的关键词的词向量进行加权求和，获得政策的特征向量。
[0094]
本公开实施例中，政策特征的表达考虑了政策标题、政策原文和政策原文的关键词三个方面，在进行特征表达时，可以取三者的词向量进行加权求和。
[0095]
本公开实施例中，可以根据统计的方式学习到各个部分的权重，也可以手动设置，也可以由历史数据和专家经验训练得到各个部分的权重。权重w可以表示为：
[0096]
w＝[w1,w2,w3]
ꢀꢀꢀ
(8)
[0097]
其中，w1为第一权重，w2为第二权重，w3为第三权重，w1 w2 w3＝1。上述第一权重对应政策标题的词向量，第二权重对应政策原文的词向量，第三权重对应政策原文的关键词的词向量，这三个权重可以根据实际情况实时调整。
[0098]
本公开实施例中，可以使用第一权重乘政策标题的词向量，使用第二权重乘政策原文的词向量，使用第三权重乘政策原文的关键词的词向量，将乘积相加得到政策的特征向量。政策的特征向量ce可以通过以下公式计算得到：
[0099]
ce＝te*w1 ae*w2 se*w3ꢀꢀꢀ
(9)
[0100]
政策的特征向量ce可以表示为：
[0101]
ce＝[ce1,ce2,
…
,ce
dim
]
ꢀꢀꢀ
(10)
[0102]
其中，ce
dim
表示ce中第dim个维度的向量。
[0103]
在步骤s208中，通过深度学习模型对政策的特征向量和企业信息进行处理，获得政策和企业的匹配度。
[0104]
本公开实施例中，可以将上述政策的特征向量和企业信息输入至深度学习模型中进行处理，输出政策和企业的匹配度。
[0105]
其中，政策和企业的匹配度可以表征该政策和该企业的匹配程度，匹配度的数值可以在0～1之间。
[0106]
在示例性实施例中，深度学习模型可以为deepfm(deep factorization machine，深度因式分解器)模型，deepfm模型可以包括deep结构(也可称为deep部分)和fm结构(也可称为fm部分)。
[0107]
其中，deep部分是一个dnn的结构，用多层的神经网络来进行构建。fm部分主要负责特征的交叉，fm模型可以建模1阶特征，还可以通过隐向量点积的方法高效地获得2阶特征表示，即使交叉特征在数据集中非常稀疏甚至是从来没出现过。
[0108]
在示例性实施例中，通过fm结构对政策类别、政策发布部门类别、财务信息和企业信息进行处理，获得第一输出结果；通过deep结构对政策类别、政策发布部门类别、财务信息、政策的特征向量和企业信息进行处理，获得第二输出结果；根据第一输出结果和第二输出结果，获得政策和企业的匹配度。
[0109]
图3是根据一示例性实施方式示出的一种deepfm算法架构的示意图。
[0110]
本公开实施例中，可以获取基础数据特征信息，该基础数据特征信息可以为features＝[pf,pdc,pmm,ce,cf]。其中，pf表示政策类别，pdc表示政策发布部门类别，pmm表示最高补贴金额，ce表示政策的特征向量，cf表示企业的企业信息。在实际应用时可以根据具体的应用场景获取不同的基础数据特征信息，本公开对此不作限制。
[0111]
本公开实施例中，参考图3，fm部分可以输入政策特征和企业特征的文本类特征和数值类特征，deep部分可以输入政策特征和企业特征的文本类特征、数值类特征和词向量特征，可以将fm部分和deep部分的输出结果输入至匹配层获得匹配得分。
[0112]
例如，fm部分的输入特征可以为[pf,pdc,pmm,cf]，fm部分的输出结果y
fm
可以表示为：
[0113][0114]
其中x为fm模型的特征，wi为一阶特征权重，d为特征数，vi和vj为xi和xj的隐向量，为需要交叉的特征对。
[0115]
在示例性实施例中，为了提升模型的泛化能力，deep结构可以包括多层残差网络结构，多层残差网络结构可以包括第一残差网络结构和第二残差网络结构，还可以包括第三残差网络结构、
……
、第h残差网络结构，其中，h为大于或等于3的整数。
[0116]
其中，每层残差网络结构可以包括输入层、全连接层和输出层，其中，第一残差网络结构是输出层可以和第二残差网络结构的输入层连接，第二残差网络结构的输出层可以和第三残差网络结构的输入层连接，以此类推。
[0117]
下面以多层残差网络结构包括第一残差网络结构和第二残差网络结构为例进行说明，但本公开并不限定于此。
[0118]
本公开实施例中，可以通过第一残差网络结构对政策类别、政策发布部门类别、财务信息、政策的特征向量和企业信息进行处理，获得中间输出结果；即可以将政策类别、政策发布部门类别、财务信息、政策的特征向量和企业信息输入到第一残差网络结构的输入层中，第一残差网络结构的输出层输出中间输出结果。
[0119]
本公开实施例中，可以通过第二残差网络结构对所述中间输出结果进行处理，以
获得第二输出结果；即可以将第一残差网络结构的输出层输出的中间输出结果输入至第二残差网络结构的输入层中，第二残差网络结构的输出层直接输出第二输出结果，或者，将第二残差网络结构输出层输出的结果继续输入到第三残差网络结构的输入层中处理，以获得第二输出结果。
[0120]
deep部分的总体输入特征可以为[pf,pdc,pmm,ce,cf]，deep部分的第一残差网络结构的输入可以表示为：
[0121]a(1)
＝[e1,e2,
…
,em]
ꢀꢀꢀ
(12)
[0122]
deep部分第l层残差网络的输出层可以表示为：
[0123]a(l 1)
＝σ2(σ1(w
lal
b
l
) a
(1)
)
ꢀꢀꢀ
(13)
[0124]
其中w和b为全连接层参数，σ1和σ2分别为第一激活函数和第二激活函数，如可选sigmoid函数。其中sigmoid函数是一个将变量映射到0～1之间的函数，例如在公式(13)中，σ1(w
lal
b
l
)表示可以将变量w
lal
b
l
映射到0～1之间，σ2(σ1(w
lal
b
l
) a
(1)
)表示可以将变量σ1(w
lal
b
l
) a
(1)
映射到0～1之间。
[0125]
假设共有h个残差网络结构，则残差网络结构的最后一层的输出结果可以表示为：
[0126]
yh＝σ2(σ1(w
h 1ah
b
l
) a
(h)
)
ꢀꢀꢀ
(14)
[0127]
deep部分的最终输出结果可以表示为：
[0128]ydeep
＝wfyh bfꢀꢀꢀ
(15)
[0129]
wf、bf分别代表deep部分的最后一层的参数。
[0130]
deep和fm部分联合计算可得到政策和企业的匹配度，政策和企业的匹配度y可以表示为：
[0131]
y＝σ(y
fm
y
deep
)
ꢀꢀꢀ
(16)
[0132]
本公开实施例中，一方面，通过deepfm模型对政策的特征向量和企业信息进行处理，可以提高政策与企业的匹配度的准确性；另一方面，通过deep部分的多层残差网络结构对政策的特征向量和企业信息进行处理，可以提高深度学习模型的泛化能力。
[0133]
本公开实施例中，可以通过上述方法获得政策和企业的匹配度。
[0134]
例如可以获取待匹配的多个政策pi和多个企业cj，通过上述方法获得每个政策和每个企业的匹配度，然后可以获取政策pi和多个企业c＝[c1,c2,
…
,cn]的匹配度，根据该政策pi和多个企业c＝[c1,c2,
…
,cn]的匹配度为这多个企业打分，获得得分列表s＝[s1,s2,
…
,sn]，对得分列表s中的得分进行倒排序，取top k个得分，即可得到针对于政策pi的企业推荐列表。
[0135]
类似地，可以获取企业cj和多个政策的匹配度，根据企业cj和多个政策的匹配度对多个政策打分，获得得分列表，从而得到针对企业cj的政策推荐列表。
[0136]
本公开实施例中，可以计算政策之间的相似度。
[0137]
例如可以获取待计算政策对《pi,pj》，根据政策pi和pj分别获取他们的te、ae和se的词向量表达即[tei,aei,sei]和[tej,aej,sej]。可以根据如下公式计算政策对的相似度s
i,j
为：
[0138]si,j
＝cos(tei,tej)*w1 cos(aei,aej)*w2 cos(sei,sej)*w3ꢀꢀꢀ
(17)
[0139]
其中cos为向量余弦相似度计算。
[0140]
根据政策对的相似度可以确定与政策pi相似的一个或多个政策，可以将政策pi的
企业推荐列表推荐给与其相似的一个或多个政策。
[0141]
本公开实施例提供的智能匹配方法，通过对政策的政策信息进行特征提取，基于深度学习模型对政策的特征向量和企业的企业信息进行处理，可以自动、快速、准确地获得政策和企业的匹配度。并且，该方法全面考虑了政策的政策标题、政策原文和政策原文的关键词对政策的特征提取的影响，提高了政策与企业的匹配度的准确性。
[0142]
此外，该方法还可以为政策的政策标题、政策原文和政策原文的关键词分别设置权重，可以由历史数据和专家经验训练得到各个部分的权重，减少人工参与，进而提高了匹配的准确性。
[0143]
图4是根据一示例性实施方式示出的另一种智能匹配方法的流程图。
[0144]
本公开实施例中，在图2所示的智能匹配方法的步骤s208之前，可以使用图4所示的智能匹配方法对政策和企业进行过滤。
[0145]
图4所示的智能匹配方法可以包括以下步骤。
[0146]
在步骤s402中，根据政策发布部门确定政策的地域信息。
[0147]
本公开实施例中，政策信息可以包括政策发布部门，在获取到政策发布部门后，可以根据政策发布部门确定政策的地域信息。
[0148]
例如，政策发布部门为辽宁省沈阳市某某局，则该政策发布部门的地域信息为辽宁省沈阳市。
[0149]
本公开实施例中，企业信息可以包括企业的地域信息和行业信息。
[0150]
例如，企业的地域信息为辽宁省沈阳市和平区，行业信息为房屋建筑业。
[0151]
在步骤s404中，根据政策的地域信息和企业的地域信息，对政策和企业进行过滤。
[0152]
本公开实施例中，可以根据政策的地域信息和企业的地域信息对政策和企业进行过滤，即根据政策的地域信息和企业的地域信息确定该政策和该企业是否匹配，若匹配，则继续执行后续步骤；若不匹配，则认为该政策和该企业不匹配，将该企业从该政策的推荐列表中过滤掉，或者将该政策从该企业的推荐列表中过滤掉。
[0153]
例如，根据政策pi和企业cj地域信息判断二者是否匹配，设置省、市、区县分别为1、2、3级，如果政策地域是3级，则企业对应3级；如果政策地域是2级，则企业对应3级或者对应2级；如果政策地域是1级，则企业对应3级或者对应2级或者对应1级。
[0154]
在步骤s406中，根据政策的行业信息和企业的行业信息，对政策和企业进行过滤。
[0155]
本公开实施例中，政策的行业信息可以基于政策原文使用textcnn深度学习算法获得。
[0156]
本公开实施例中，可以根据政策的行业信息和企业的行业信息对政策和企业进行过滤，即根据政策的行业信息和企业的行业信息确定该政策和该企业是否匹配，若匹配，则继续执行后续步骤；若不匹配，则认为该政策和该企业不匹配，将该企业从该政策的推荐列表中过滤掉，或者将该政策从该企业的推荐列表中过滤掉。
[0157]
例如，根据政策pi和企业cj的行业信息判断二者是否匹配，如果政策行业是2级，则企业对应2级；如果政策行业是1级，则企业可以为对应的2级或者对应的1级。
[0158]
本公开实施例中，还可以根据政策和企业的其他信息对政策和企业进行过滤，即根据政策和企业的其他信息确定该政策和该企业是否匹配，例如根据政策的政策要求条件信息cond判断企业是否满足该政策要求条件信息。若匹配，则继续执行后续步骤；若不匹
配，则认为该政策和该企业不匹配，将该企业从该政策的推荐列表中过滤掉，或者将该政策从该企业的推荐列表中过滤掉。
[0159]
例如，对政策pi和企业cj的其他条件进行判断，即判断如下条件是否成立：
[0160]
match＝f(cond,cf)
ꢀꢀꢀ
(18)
[0161]
其中，match表示政策的政策要求条件信息coud和企业的企业信息cf是否匹配。
[0162]
本公开实施例中，在通过上述方法对政策和企业进行过滤之后，再使用deepfm深度学习模型对政策和企业的相关信息进行处理，可以减少模型输入的数据量，提高模型的运算速度，获得更加准确的匹配度。
[0163]
图5是根据一示例示出的企业匹配流程的示意图。
[0164]
图6是根据一示例示出的政策匹配流程的示意图。
[0165]
本公开实施例提供的智能匹配方法，可以针对一个企业匹配出多个政策，也可以针对一个政策匹配出多个企业。
[0166]
参考图5，针对一个企业匹配多个政策的方法包括以下步骤。
[0167]
在步骤s502中，输入企业名称。
[0168]
在步骤s504中，获取企业特征信息。
[0169]
本公开实施例中，可以根据企业名称获取企业特征信息，企业特征信息可以包括但不限于企业的基本信息、人力信息、财务信息、知识产权信息、经营信息、风险信息和创新载体信息等，具体可以参见表2。
[0170]
在步骤s506中，根据地域获取政策列表。
[0171]
本公开实施例中，可以根据企业名称获取企业的地域信息，根据企业的地域信息可以获取与其对应的政策，组成政策列表。
[0172]
在步骤s508中，过滤特征获取满足条件列表。
[0173]
本公开实施例中，可以使用图4所示的方法对政策列表中的政策进行过滤，获取满足条件的政策列表。
[0174]
在步骤s510中，通过deepfm模型获取匹配得分。
[0175]
本公开实施例中，可以通过deepfm模型获得企业与政策列表中每个政策的匹配得分。
[0176]
在步骤s512中，对结果列表进行排序。
[0177]
本公开实施例中，可以根据企业与每个政策的匹配得分，对政策列表(即结果列表)进行排序。
[0178]
在步骤s514中，返回top n列表。
[0179]
本公开实施例中，可以从排序后的列表中选取前n个政策，返回top n列表。
[0180]
参考图6，针对一个政策匹配多个企业的方法包括以下步骤。
[0181]
在步骤s602中，输入政策名称。
[0182]
在步骤s604中，获取政策特征信息。
[0183]
本公开实施例中，可以根据政策名称获取政策特征信息，政策特征信息可以包括但不限于政策原文、政策标题、政策要求条件信息、最高补贴金额、政策发布部门等，具体可以参见表2。
[0184]
在步骤s606中，根据地域获取企业列表。
[0185]
本公开实施例中，可以根据政策发布部门获取政策的地域信息，根据政策的地域信息可以获取与其对应的企业，组成企业列表。
[0186]
在步骤s608中，过滤企业特征获取满足条件列表。
[0187]
本公开实施例中，可以使用图4所示的方法对企业列表中的企业进行过滤，获取满足条件的企业列表。
[0188]
在步骤s610中，通过deepfm模型获取匹配得分。
[0189]
本公开实施例中，可以通过deepfm模型获得政策与企业列表中每个企业的匹配得分。
[0190]
在步骤s612中，对结果列表进行排序。
[0191]
本公开实施例中，可以根据政策与企业列表中每个企业的匹配得分，对企业列表(即结果列表)进行排序。
[0192]
在步骤s614中，返回top n列表。
[0193]
本公开实施例中，可以从排序后的列表中选取前n个政策，返回top n列表。
[0194]
需要注意的是，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是在多个模块中同步或异步执行的。
[0195]
下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。
[0196]
图7是根据一示例性实施方式示出的一种智能匹配装置的框图。
[0197]
如图7所示，智能匹配装置700可以包括：信息获取模块702、特征提取模块704、特征向量确定模块706和匹配度获得模块708。
[0198]
其中，信息获取模块702用于获取政策的政策信息和企业的企业信息，政策信息包括政策标题和政策原文；特征提取模块704用于对政策标题和政策原文进行特征提取，获得政策标题的词向量、政策原文的词向量以及政策原文的关键词的词向量；特征向量确定模块706用于根据政策标题的词向量、政策原文的词向量以及政策原文的关键词的词向量，确定政策的特征向量；匹配度获得模块708用于通过深度学习模型对政策的特征向量和企业信息进行处理，获得政策和企业的匹配度。
[0199]
在本公开一些示例性实施例中，政策信息还包括政策发布部门，企业信息包括企业的地域信息；智能匹配装置700还包括：地域信息确定模块，用于根据政策发布部门确定政策的地域信息；第一匹配模块，用于根据政策的地域信息和企业的地域信息，对政策和企业进行过滤。
[0200]
在本公开一些示例性实施例中，企业信息包括企业的行业信息；智能匹配装置700还包括：行业信息获得模块，用于通过政策行业分类模型对政策原文进行处理，获得政策的行业信息；第二匹配模块，用于根据政策的行业信息和企业的行业信息，对政策和企业进行过滤。
[0201]
在本公开一些示例性实施例中，特征提取模块704包括：第一词向量获得单元，用于通过第一bert深度学习模型对政策标题进行处理，获得政策标题的词向量；第二词向量获得单元，用于通过textrank算法模型对政策原文进行处理，获得政策原文的词向量；第三词向量获得单元，用于通过第二bert深度学习模型对政策原文进行处理，获得政策原文的
词向量。
[0202]
在本公开一些示例性实施例中，特征向量确定模块706包括：特征向量单元，用于分别使用第一权重、第二权重和第三权重对政策标题的词向量、政策原文的词向量和政策原文的关键词的词向量进行加权求和，获得政策的特征向量。
[0203]
在本公开一些示例性实施例中，政策信息还包括政策发布部门；深度学习模型为deepfm模型，deepfm模型包括deep结构和fm结构；智能匹配装置700还包括：信息处理模块，用于对所述政策标题、政策发布部门和政策原文进行处理，获得所述政策的政策类别、政策发布部门类别和财务信息；其中，匹配度获得模块708包括：第一处理单元，用于通过fm结构对政策类别、政策发布部门类别、财务信息和企业信息进行处理，获得第一输出结果；第二处理单元，用于通过deep结构对政策类别、政策发布部门类别、财务信息、政策的特征向量和企业信息进行处理，获得第二输出结果；匹配度获得单元，用于根据第一输出结果和第二输出结果，获得政策和企业的匹配度。
[0204]
在本公开一些示例性实施例中，所述deep结构包括多层残差网络结构，所述多层残差网络结构包括第一残差网络结构和第二残差网络结构；其中，第二处理单元用于通过所述第一残差网络结构对所述政策类别、所述政策发布部门类别、所述财务信息、所述政策的特征向量和所述企业信息进行处理，获得中间输出结果；以及通过所述第二残差网络结构对所述中间输出结果进行处理，以获得所述第二输出结果。
[0205]
在本公开一些示例性实施例中，每层残差网络结构均包括输入层、全连接层和输出层，所述第一残差网络结构的输出层与所述第二残差网络结构的输入层连接。
[0206]
在本公开一些示例性实施例中，信息处理模块包括：政策类别获得单元，用于通过政策分类模型对政策标题进行处理，获得政策的政策类别；政策发布部门类别获得单元，用于通过政策发布部门分类模型对政策发布部门进行处理，获得政策的政策发布部门类别；财务信息提取单元，用于通过正则表达式提取政策原文中的财务信息。
[0207]
需要注意的是，上述附图中所示的框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0208]
图8是根据一示例性实施方式示出的一种电子设备的结构示意图。需要说明的是，图8示出的电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。
[0209]
如图8所示，电子设备800包括中央处理单元(cpu)801，其可以根据存储在只读存储器(rom)802中的程序或者从存储部分808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。在ram 803中，还存储有系统800操作所需的各种程序和数据。cpu 801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
[0210]
以下部件连接至i/o接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811，诸如
磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。
[0211]
特别地，根据本发明的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(cpu)801执行时，执行本发明的系统中限定的上述功能。
[0212]
需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。
[0213]
附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
[0214]
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
[0215]
作为另一方面，本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电
子设备中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如上述实施例中的方法。例如，上述的电子设备可以实现如图2所示的各个步骤。
[0216]
根据本公开的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例的各种可选实现方式中提供的方法。
[0217]
需要理解的是，在本公开附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。
[0218]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0219]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：对象检测方法、装置、电子设备及自动驾驶车辆与流程

智能匹配方法、装置、电子设备及存储介质与流程

相关文献

最热文献