一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于人工智能的实体关系分类方法、装置、电子设备及介质与流程

2021-12-14 22:54:00 来源:中国专利 TAG:


1.本发明涉及人工智能领域,尤其涉及一种基于人工智能的实体关系分类方法、装置、电子设备及介质。


背景技术:

2.实体关系分类是对一个句子中实体之间的关系进行分类,实体关系分类在自然语言处理领域中有着广泛的应用,例如,知识图谱的构建、问答系统中的问句理解、机器阅读理解中的多跳推理等,如何快速、准确地进行实体关系分类是当前的关注要点。
3.当前,通常采用句法分析工具提取句子的句法特征,将句子和句法特征输入神经网络模型进行实体关系分类,这种实体关系分类方法需要借助句法分析工具,操作复杂、分类效率低,且分类准确度受限于句法分析工具的准确度的影响。因此,亟需一种基于人工智能的实体关系分类方法,以快速、准确地对实体之间的关系进行分类。


技术实现要素:

4.鉴于以上内容,有必要提供一种基于人工智能的实体关系分类方法,旨在快速、准确地对实体之间的关系进行分类。
5.本发明提供的基于人工智能的实体关系分类方法,包括:
6.响应用户基于客户端发出的针对待处理文本的实体关系分类请求,对所述待处理文本执行分词处理及实体标记处理,得到所述待处理文本对应的目标词语序列;
7.从预设数据库获取实体关系分类模型,所述实体关系分类模型包括第一特征提取网络、第二特征提取网络及分类网络,所述第一特征提取网络包括串联连接的多个编码层;
8.将所述目标词语序列输入所述第一特征提取网络执行字面特征、语义特征及句法特征提取处理,得到各个编码层输出的所述目标词语序列中每个词语的第一特征向量;
9.将各个第一特征向量输入所述第二特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语对应的权重值;
10.基于所述第一特征向量及所述权重值计算所述待处理文本对应的第二特征向量,将所述第二特征向量输入所述分类网络执行实体关系分类处理,得到所述待处理文本中实体之间的关系分类结果。
11.可选的,所述对所述待处理文本执行分词处理及实体标记处理,得到所述待处理文本对应的目标词语序列,包括:
12.对所述待处理文本执行实体识别处理,得到所述待处理文本对应的实体集合;
13.对所述待处理文本执行分词处理,得到所述待处理文本对应的初始词语序列;
14.基于所述实体集合对所述初始词语序列执行实体标记处理,得到所述待处理文本对应的目标词语序列。
15.可选的,所述将各个第一特征向量输入所述第二特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语对应的权重值,包括:
16.合并各个第一特征向量,得到所述目标词语序列中每个词语的第一特征矩阵;
17.将所述第一特征矩阵输入所述第二特征提取网络的第一个线性层执行特征降维处理,得到所述目标词语序列中每个词语的第二特征矩阵;
18.将所述第二特征矩阵输入所述第二特征提取网络的串联连接的多个组合特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语的第三特征矩阵;
19.将所述第三特征矩阵输入所述第二特征提取网络的第二个线性层执行特征降维处理,得到所述目标词语序列中每个词语的第三特征向量;
20.将所述第三特征向量输入所述第二特征提取网络的激活层执行权重计算,得到所述目标词语序列中每个词语对应的权重值。
21.可选的,所述基于所述第一特征向量及所述权重值计算所述待处理文本对应的第二特征向量,包括:
22.基于最后一个编码层输出的所述目标词语序列中每个词语的第一特征向量及所述权重值,计算所述待处理文本对应的第四特征向量;
23.基于最后一个编码层输出的所述目标词语序列中多个预设词语的第一特征向量,计算所述待处理文本对应的第五特征向量;
24.对所述第四特征向量及第五特征向量执行堆叠处理,得到所述待处理文本对应的第二特征向量。
25.可选的,所述实体关系分类模型的构建过程,包括:
26.分别构建第一特征提取网络、第二特征提取网络及分类网络,连接所述第一特征提取网络的输出与所述分类网络的输入;
27.将所述第一特征提取网络中各个编码层的输出与所述第二特征提取网络的输入连接,将所述第二特征提取网络的输出与所述分类网络的输入连接,得到实体关系分类模型。
28.可选的,所述将所述第二特征向量输入所述分类网络执行实体关系分类处理,得到所述待处理文本中实体之间的关系分类结果,包括:
29.将所述第二特征向量输入所述分类网络,得到所述待处理文本中每两个实体在目标关系类别集中每个关系类别的概率值,将概率值最大的关系类别作为对应的两个实体的目标关系类别。
30.可选的,所述目标关系类别集的确定过程,包括:
31.确定所述待处理文本中每个实体对应的领域类别;
32.获取领域类别与关系类别集之间的映射关系,基于所述映射关系确定所述待处理文本中每个实体对应的初始关系类别集;
33.将所述初始关系类别集的集合作为目标关系类别集。
34.为了解决上述问题,本发明还提供一种基于人工智能的实体关系分类装置,所述装置包括:
35.响应模块,用于响应用户基于客户端发出的针对待处理文本的实体关系分类请求,对所述待处理文本执行分词处理及实体标记处理,得到所述待处理文本对应的目标词语序列;
36.获取模块,用于从预设数据库获取实体关系分类模型,所述实体关系分类模型包括第一特征提取网络、第二特征提取网络及分类网络,所述第一特征提取网络包括串联连接的多个编码层;
37.第一提取模块,用于将所述目标词语序列输入所述第一特征提取网络执行字面特征、语义特征及句法特征提取处理,得到各个编码层输出的所述目标词语序列中每个词语的第一特征向量;
38.第二提取模块,用于将各个第一特征向量输入所述第二特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语对应的权重值;
39.分类模块,用于基于所述第一特征向量及所述权重值计算所述待处理文本对应的第二特征向量,将所述第二特征向量输入所述分类网络执行实体关系分类处理,得到所述待处理文本中实体之间的关系分类结果。
40.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
41.至少一个处理器;以及,
42.与所述至少一个处理器通信连接的存储器;其中,
43.所述存储器存储有可被所述至少一个处理器执行的实体关系分类程序,所述实体关系分类程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述基于人工智能的实体关系分类方法。
44.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实体关系分类程序,所述实体关系分类程序可被一个或者多个处理器执行,以实现上述基于人工智能的实体关系分类方法。
45.相较现有技术,本发明首先对待处理文本执行分词处理及实体标记处理,得到目标词语序列;接着,将目标词语序列输入实体关系分类模型的第一特征提取网络执行字面特征、语义特征及句法特征提取处理,得到各个编码层输出的目标词语序列中每个词语的第一特征向量;然后,将各个第一特征向量输入第二特征提取网络执行局部特征及全局关联特征提取处理,得到目标词语序列中每个词语对应的权重值;最后,基于第一特征向量及权重值计算待处理文本对应的第二特征向量,将第二特征向量输入分类网络,得到待处理文本中实体之间的关系分类结果。本发明提取了待处理文本的字面特征、语义特征、句法特征、局部特征及全局关联特征,从而提取到的特征更加丰富,分类准确度更高,且特征提取和分类都由实体关系分类模型执行,未依赖外部工具,保证了分类的高效率。因此,本发明实现了快速、准确地对实体之间的关系进行分类。
附图说明
46.图1为本发明一实施例提供的基于人工智能的实体关系分类方法的流程示意图;
47.图2为本发明一实施例提供的实体关系分类模型的结构示意图;
48.图3为本发明一实施例提供的组合特征提取网络的结构示意图;
49.图4为本发明一实施例提供的基于人工智能的实体关系分类装置的模块示意图;
50.图5为本发明一实施例提供的实现基于人工智能的实体关系分类方法的电子设备的结构示意图;
51.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
52.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
53.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
54.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
55.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
56.需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
57.本发明提供一种基于人工智能的实体关系分类方法。参照图1所示,为本发明一实施例提供的基于人工智能的实体关系分类方法的流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。
58.本实施例中,基于人工智能的实体关系分类方法包括:
59.s1、响应用户基于客户端发出的针对待处理文本的实体关系分类请求,对所述待处理文本执行分词处理及实体标记处理,得到所述待处理文本对应的目标词语序列。
60.本实施例中,所述待处理文本可以是一句话,也可以是多句话,本方案的目的是对待处理文本中的任意两个实体之间的关系分类。例如,若待处理文本为“a公司成立于1980年,位于广东省”,待处理文本中包括三个实体“a公司”、“1980年”及“广东省”,本方案用于对这三个实体中的任两个实体进行关系分类。
61.获取到待处理文本后,需要对待处理文本执行分词处理及实体标记处理,以得到待处理文本对应的目标词语序列。
62.所述对所述待处理文本执行分词处理及实体标记处理,得到所述待处理文本对应的目标词语序列,包括:
63.a11、对所述待处理文本执行实体识别处理,得到所述待处理文本对应的实体集合;
64.本实施例中,通过实体识别模型对待处理文本执行实体识别处理,所述实体识别模型可以是bert模型,也可以是神经网络模型。
65.a12、对所述待处理文本执行分词处理,得到所述待处理文本对应的初始词语序列;
66.本实施例中,可采用正向最大匹配法、逆向最大匹配法或最少切分法对待处理文本执行分词处理。
67.a13、基于所述实体集合对所述初始词语序列执行实体标记处理,得到所述待处理文本对应的目标词语序列。
68.所述实体标记处理包括实体标记、句首标记及句尾标记处理,本方案采用标记符对初始词语序列执行实体标记处理,所述标记符包括句首符、句尾符、实体起始符及实体终止符,并通过实体集合中的实体确定初始词语序列中需要标记的实体。
69.本实施例中,句首符为[cls],句尾符为[sep],第一个实体的实体起始符为[e11]、实体终止符为[e12],第二个实体的实体起始符为[e21]、实体终止符为[e22],
……

[0070]
例如,对于待处理文本“a公司成立于1980年,位于广东省”,对其执行分词处理及实体标记处理后,得到的目标词语序列为“[cls][e11]a公司[e12]成立于[e21]1980年[e22],位于[e31]广东省[e32][sep]”。
[0071]
s2、从预设数据库获取实体关系分类模型,所述实体关系分类模型包括第一特征提取网络、第二特征提取网络及分类网络,所述第一特征提取网络包括串联连接的多个编码层。
[0072]
本实施例中,为解决现有技术需要依靠句法分析工具进行实体关系分类的问题,预先构建并存储了实体关系分类模型,该实体关系分类模型可提取输入文本的字面特征、语义特征及句法特征,同时还提取输入文本的局部特征及全局关联特征,能够对输入文本进行深层次的学习,可提高实体关系分类结果。
[0073]
所述实体关系分类模型的构建过程,包括:
[0074]
b11、分别构建第一特征提取网络、第二特征提取网络及分类网络,连接所述第一特征提取网络的输出与所述分类网络的输入;
[0075]
参照图2所示,为本发明一实施例提供的实体关系分类模型的结构示意图,将第一特征提取网络的输出与分类网络的输入连接,作为实体关系分类模型的主干网络,图2的左侧为主干网络,其中,第一特征提取网络包括嵌入层及串联连接的多个编码层(transformer encoder层),嵌入层用于将输入的文字转换为词向量,编码层用于提取词向量的特征。
[0076]
本实施例中,所述编码层可以是12层,类似于bert模型中的编码层,第1层~第3层编码层可提取输入文本中单个词或相邻几个词的字面特征,即可提取输入文本的字面特征;第4层~第7层编码层提取输入文本中各个词语的词性(例如,名词、动词等)及词语之间在语法上的关系,例如主谓关系、动宾关系等,即可提取输入文本的句法特征;第8层~第12层可提取输入文本的各个词语在语义上的关系,即可提取输入文本的语义特征。
[0077]
分类网络包括全连接层及激活层,其中,全连接层用于整合输入的特征,激活层用于分类预测。
[0078]
b12、将所述第一特征提取网络中各个编码层的输出与所述第二特征提取网络的
输入连接,将所述第二特征提取网络的输出与所述分类网络的输入连接,得到实体关系分类模型。
[0079]
图2的右侧为第二特征提取网络,第二特征提取网络为实体关系分类模型的分支网络。本实施例中,第二特征提取网络包括线性层、串联连接的多个组合特征提取网络(local and global combination)及激活层,其中,线性层用于将输入从高维稀疏特征转换为低维稠密特征,组合特征提取网络用于提取输入的局部特征和全局关联特征,激活层用于输出各个输入对应的权重。
[0080]
参照图3所示,为本发明一实施例提供的组合特征提取网络的结构示意图,组合特征提取网络包括卷积层、注意力层及线性层,其中,卷积层用于提取输入的局部特征,注意力层用于提取输入的全局关联特征,线性层用于对特征进行降维处理。
[0081]
将第一特征提取网络中各个编码层的输出作为第二特征提取网络的输入,第二特征提取网络通过学习各个编码层输出特征的局部特征和全局关联特征,加强了对输入文本的理解,可提高输入文本中实体关系分类的准确度。
[0082]
s3、将所述目标词语序列输入所述第一特征提取网络执行字面特征、语义特征及句法特征提取处理,得到各个编码层输出的所述目标词语序列中每个词语的第一特征向量。
[0083]
将目标词语序列输入第一特征提取网络的嵌入层执行词向量转换处理,得到目标词语序列中每个词语的词向量,将词向量输入串联连接的多个编码层执行字面特征、语义特征及句法特征提取处理,得到各个编码层输出的每个词语的第一特征向量。本实施例中,编码层为12层,则每个词语对应12个第一特征向量。
[0084]
s4、将各个第一特征向量输入所述第二特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语对应的权重值。
[0085]
第二特征提取网络用于提取输入的局部特征及全局关联特征,第一特征向量已融合了字面特征、语义特征及句法特征,经过第二特征提取网络处理后,得到的权重值较为准确。
[0086]
所述将各个第一特征向量输入所述第二特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语对应的权重值,包括:
[0087]
c11、合并各个第一特征向量,得到所述目标词语序列中每个词语的第一特征矩阵;
[0088]
例如,对于目标词语序列中的词语1,若每个编码层输出的第一特征向量为n维特征,则12个第一特征向量合并后得到的第一特征矩阵为12*n的特征。
[0089]
c12、将所述第一特征矩阵输入所述第二特征提取网络的第一个线性层执行特征降维处理,得到所述目标词语序列中每个词语的第二特征矩阵;
[0090]
线性层用于对输入的特征进行降维处理,从而加快分类效率。
[0091]
c13、将所述第二特征矩阵输入所述第二特征提取网络的串联连接的多个组合特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语的第三特征矩阵;
[0092]
组合特征提取网络的卷积层用于提取局部特征,注意力层用于提取全局关联特征,故而,第三特征矩阵包含了局部和全局的特征。
[0093]
c14、将所述第三特征矩阵输入所述第二特征提取网络的第二个线性层执行特征降维处理,得到所述目标词语序列中每个词语的第三特征向量;
[0094]
第二个线性层对第三特征矩阵进行了进一步的降维处理。
[0095]
c15、将所述第三特征向量输入所述第二特征提取网络的激活层执行权重计算,得到所述目标词语序列中每个词语对应的权重值。
[0096]
激活层通过激活函数进行运算,可输出目标词语序列中每个词语对应的权重值。
[0097]
s5、基于所述第一特征向量及所述权重值计算所述待处理文本对应的第二特征向量,将所述第二特征向量输入所述分类网络执行实体关系分类处理,得到所述待处理文本中实体之间的关系分类结果。
[0098]
经过第一特征提取网络及第二特征提取网络的处理,输入分类网络的特征较为丰富,可准确输出待处理文本中实体之间的关系类别。
[0099]
例如,对于待处理文本,经实体关系分类模型的处理,输出的关系分类结果为:“a公司”与“1980年”之间的关系类别为“公司机构

成立时间”、“a公司”与“广东省”之间的关系类别为“公司机构

所在地”及“1980年”与“广东省”之间的关系类别为“成立时间

所在地”。
[0100]
所述基于所述第一特征向量及所述权重值计算所述待处理文本对应的第二特征向量,包括:
[0101]
d11、基于最后一个编码层输出的所述目标词语序列中每个词语的第一特征向量及所述权重值,计算所述待处理文本对应的第四特征向量;
[0102]
本实施例中,根据最后一个编码层(即第12层编码层)输出的每个词语的第一特征向量及权重值计算待处理文本对应的第二特征向量。
[0103]
最后一个编码层已融合了前面的每个编码层的特征,输出的特征所表征的信息量最大。
[0104]
所述第四特征向量的计算公式为:y=a1*x1 a2*x2

a
n
*x
n
,其中,y为待处理文本对应的第四特征向量,x1、x2、x
n
分别为目标词语序列中第一个、第二个及第n个词语的第一特征向量,a1、a2、a
n
分别为目标词语序列中第一个、第二个及第n个词语对应的权重值。
[0105]
d12、基于最后一个编码层输出的所述目标词语序列中多个预设词语的第一特征向量,计算所述待处理文本对应的第五特征向量;
[0106]
本实施例中,所述预设词语包括句首符及各个实体起始符,例如,待处理文本的目标词语序列中的[cls]、[e11]、[e21]及[e31]),其中,[cls]聚合了整个目标词语序列的特征,[e11]聚合了第一个实体的特征,[e21]聚合了第二个实体的特征。
[0107]
将句首符与各个实体起始符的第一特征向量合并,得到待处理文本对应的第五特征向量。
[0108]
d13、对所述第四特征向量及第五特征向量执行堆叠处理,得到所述待处理文本对应的第二特征向量。
[0109]
堆叠处理即为拼接处理,若第四特征向量为p维的特征,第五特征向量为q维的特征,则堆叠处理后得到的第二特征向量的维度数为(p q)。
[0110]
所述将所述第二特征向量输入所述分类网络执行实体关系分类处理,得到所述待处理文本中实体之间的关系分类结果,包括:
[0111]
将所述第二特征向量输入所述分类网络,得到所述待处理文本中每两个实体在目标关系类别集中每个关系类别的概率值,将概率值最大的关系类别作为对应的两个实体的目标关系类别。
[0112]
为防止目标关系类别集中的关系类别太多,而导致分类效率低,本方案根据待处理文本中实体的领域类别确定目标关系类别集。
[0113]
所述目标关系类别集的确定过程,包括:
[0114]
e11、确定所述待处理文本中每个实体对应的领域类别;
[0115]
本实施例中,通过将实体与各个领域类别对应的实体库进行匹配,以确定每个实体对应的领域类别。
[0116]
e12、获取领域类别与关系类别集之间的映射关系,基于所述映射关系确定所述待处理文本中每个实体对应的初始关系类别集;
[0117]
本实施例中,预先存储了领域类别与关系类别集之间的映射关系,通过该映射关系,可确定每个实体对应的初始关系类别集。
[0118]
e13、将所述初始关系类别集的集合作为目标关系类别集。
[0119]
汇总各个实体对应的初始关系类别集,得到待处理文本对应的目标关系类别集。
[0120]
由上述实施例可知,本发明提出的基于人工智能的实体关系分类方法,首先,对待处理文本执行分词处理及实体标记处理,得到目标词语序列;接着,将目标词语序列输入实体关系分类模型的第一特征提取网络执行字面特征、语义特征及句法特征提取处理,得到各个编码层输出的目标词语序列中每个词语的第一特征向量;然后,将各个第一特征向量输入第二特征提取网络执行局部特征及全局关联特征提取处理,得到目标词语序列中每个词语对应的权重值;最后,基于第一特征向量及权重值计算待处理文本对应的第二特征向量,将第二特征向量输入分类网络,得到待处理文本中实体之间的关系分类结果。本发明提取了待处理文本的字面特征、语义特征、句法特征、局部特征及全局关联特征,从而提取到的特征更加丰富,分类准确度更高,且特征提取和分类都由实体关系分类模型执行,未依赖外部工具,保证了分类的高效率。因此,本发明实现了快速、准确地对实体之间的关系进行分类。
[0121]
如图4所示,为本发明一实施例提供的基于人工智能的实体关系分类装置的模块示意图。
[0122]
本发明所述基于人工智能的实体关系分类装置100可以安装于电子设备中。根据实现的功能,所述基于人工智能的实体关系分类装置100可以包括响应模块110、获取模块120、第一提取模块130、第二提取模块140及分类模块150。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0123]
在本实施例中,关于各模块/单元的功能如下:
[0124]
响应模块110,用于响应用户基于客户端发出的针对待处理文本的实体关系分类请求,对所述待处理文本执行分词处理及实体标记处理,得到所述待处理文本对应的目标词语序列。
[0125]
所述对所述待处理文本执行分词处理及实体标记处理,得到所述待处理文本对应的目标词语序列,包括:
[0126]
a21、对所述待处理文本执行实体识别处理,得到所述待处理文本对应的实体集合;
[0127]
a22、对所述待处理文本执行分词处理,得到所述待处理文本对应的初始词语序列;
[0128]
a23、基于所述实体集合对所述初始词语序列执行实体标记处理,得到所述待处理文本对应的目标词语序列。
[0129]
获取模块120,用于从预设数据库获取实体关系分类模型,所述实体关系分类模型包括第一特征提取网络、第二特征提取网络及分类网络,所述第一特征提取网络包括串联连接的多个编码层。
[0130]
所述实体关系分类模型的构建过程,包括:
[0131]
b21、分别构建第一特征提取网络、第二特征提取网络及分类网络,连接所述第一特征提取网络的输出与所述分类网络的输入;
[0132]
b22、将所述第一特征提取网络中各个编码层的输出与所述第二特征提取网络的输入连接,将所述第二特征提取网络的输出与所述分类网络的输入连接,得到实体关系分类模型。
[0133]
第一提取模块130,用于将所述目标词语序列输入所述第一特征提取网络执行字面特征、语义特征及句法特征提取处理,得到各个编码层输出的所述目标词语序列中每个词语的第一特征向量。
[0134]
第二提取模块140,用于将各个第一特征向量输入所述第二特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语对应的权重值。
[0135]
所述将各个第一特征向量输入所述第二特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语对应的权重值,包括:
[0136]
c21、合并各个第一特征向量,得到所述目标词语序列中每个词语的第一特征矩阵;
[0137]
c22、将所述第一特征矩阵输入所述第二特征提取网络的第一个线性层执行特征降维处理,得到所述目标词语序列中每个词语的第二特征矩阵;
[0138]
c23、将所述第二特征矩阵输入所述第二特征提取网络的串联连接的多个组合特征提取网络执行局部特征及全局关联特征提取处理,得到所述目标词语序列中每个词语的第三特征矩阵;
[0139]
c24、将所述第三特征矩阵输入所述第二特征提取网络的第二个线性层执行特征降维处理,得到所述目标词语序列中每个词语的第三特征向量;
[0140]
c25、将所述第三特征向量输入所述第二特征提取网络的激活层执行权重计算,得到所述目标词语序列中每个词语对应的权重值。
[0141]
分类模块150,用于基于所述第一特征向量及所述权重值计算所述待处理文本对应的第二特征向量,将所述第二特征向量输入所述分类网络执行实体关系分类处理,得到所述待处理文本中实体之间的关系分类结果。
[0142]
所述基于所述第一特征向量及所述权重值计算所述待处理文本对应的第二特征向量,包括:
[0143]
d21、基于最后一个编码层输出的所述目标词语序列中每个词语的第一特征向量
及所述权重值,计算所述待处理文本对应的第四特征向量;
[0144]
d22、基于最后一个编码层输出的所述目标词语序列中多个预设词语的第一特征向量,计算所述待处理文本对应的第五特征向量;
[0145]
d23、对所述第四特征向量及第五特征向量执行堆叠处理,得到所述待处理文本对应的第二特征向量。
[0146]
所述将所述第二特征向量输入所述分类网络执行实体关系分类处理,得到所述待处理文本中实体之间的关系分类结果,包括:
[0147]
将所述第二特征向量输入所述分类网络,得到所述待处理文本中每两个实体在目标关系类别集中每个关系类别的概率值,将概率值最大的关系类别作为对应的两个实体的目标关系类别。
[0148]
所述目标关系类别集的确定过程,包括:
[0149]
e21、确定所述待处理文本中每个实体对应的领域类别;
[0150]
e22、获取领域类别与关系类别集之间的映射关系,基于所述映射关系确定所述待处理文本中每个实体对应的初始关系类别集;
[0151]
e23、将所述初始关系类别集的集合作为目标关系类别集。
[0152]
如图5所示,为本发明一实施例提供的实现基于人工智能的实体关系分类方法的电子设备的结构示意图。
[0153]
所述电子设备1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子设备1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
[0154]
在本实施例中,电子设备1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有实体关系分类程序10,所述实体关系分类程序10可被所述处理器12执行。图3仅示出了具有组件11

13以及实体关系分类程序10的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0155]
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子设备1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子设备1的内部存储单元,例如该电子设备1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子设备1的操作系统和各类应用软件,例如存储本发明一实施例中的实体关系分类程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0156]
处理器12在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设
备1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行实体关系分类程序10等。
[0157]
网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述电子设备1与客户端(图中未画出)之间建立通信连接。
[0158]
可选的,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light

emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
[0159]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0160]
所述电子设备1中的所述存储器11存储的实体关系分类程序10是多个指令的组合,在所述处理器12中运行时,可以实现上述基于人工智能的实体关系分类方法。
[0161]
具体地,所述处理器12对上述实体关系分类程序10的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0162]
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是非易失性的,也可以是非易失性的。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read

only memory)。
[0163]
所述计算机可读存储介质上存储有实体关系分类程序10,所述实体关系分类程序10可被一个或者多个处理器执行,以实现上述基于人工智能的实体关系分类方法。
[0164]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0165]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0166]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0167]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0168]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0169]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0170]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
[0171]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献