一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种情感类型确定方法及装置与流程

2022-11-30 14:12:03 来源:中国专利 TAG:


1.本技术涉及数据处理领域,特别是涉及一种情感类型确定方法及装置。


背景技术:

2.目前,分析文本的情感类型,尤其是分析文本中各个实体词对应的情感类型,具有较大的意义。其可以用于指导后续的实践行为。此处提及的文本,例如可以是评论文本。
3.如何准确的确定实体词对应的情感类型,是目前尚待解决的技术问题。


技术实现要素:

4.为了实体词对应的情感类型,本技术实施例提供了一种情感类型确定方法及装置。
5.第一方面,本技术实施例提供了一种情感类型确定方法,所述方法包括:
6.获取待分析文本,所述待分析文本包括至少一个实体词;
7.将所述待分析文本输入情感类型确定模型,得到所述至少一个实体词中每个实体词分别对应的情感类型,其中:所述情感类型确定模型,用于:
8.确定所述待分析文本的第一词嵌入向量和所述至少一个实体词的第二词嵌入向量;
9.根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重;
10.根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型。
11.可选的,所述方法还包括:
12.确定所述第一词嵌入向量和所述第二词嵌入向量的第一融合向量;
13.所述根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重,包括:
14.根据所述第一词嵌入向量、所述第二词嵌入向量以及所述第一融合向量,确定所述目标注意力权重。
15.可选的,所述确定所述待分析文本的第一词嵌入向量,包括:
16.确定位置感知嵌入,所述位置感知嵌入用于指示所述待分析文本中各个分词的权重,其中,所述各个分词的权重与所述各个分词和所述至少一个实体词之间的位置关系确定;
17.根据所述位置感知嵌入和所述待分析文本的第三词嵌入向量,得到所述第一词嵌入向量。
18.可选的,所述根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重,包括:
19.根据所述第一词嵌入向量,得到第一隐层向量;
20.根据所述第二词嵌入向量,得到第二隐层向量;
21.根据所述第一隐层向量和所述第二隐层向量,得到所述目标注意力权重。
22.可选的,根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型,包括:
23.根据所述目标注意力权重、所述第一词嵌入向量以及第一融合向量,确定所述至少一个实体词中每个实体词分别对应的情感类型,其中,所述第一融合向量为所述第一词嵌入向量和所述第二词嵌入向量的融合向量。
24.第二方面,本技术实施例提供了一种情感类型确定装置,所述装置包括:
25.获取单元,用于获取待分析文本,所述待分析文本包括至少一个实体词;
26.第一确定单元,用于将所述待分析文本输入情感类型确定模型,得到所述至少一个实体词中每个实体词分别对应的情感类型,其中:所述情感类型确定模型,用于:
27.确定所述待分析文本的第一词嵌入向量和所述至少一个实体词的第二词嵌入向量;
28.根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重;
29.根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型。
30.可选的,所述装置还包括:
31.第二确定单元,用于确定所述第一词嵌入向量和所述第二词嵌入向量的第一融合向量;
32.所述根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重,包括:
33.根据所述第一词嵌入向量、所述第二词嵌入向量以及所述第一融合向量,确定所述目标注意力权重。
34.可选的,所述确定所述待分析文本的第一词嵌入向量,包括:
35.确定位置感知嵌入,所述位置感知嵌入用于指示所述待分析文本中各个分词的权重,其中,所述各个分词的权重与所述各个分词和所述至少一个实体词之间的位置关系确定;
36.根据所述位置感知嵌入和所述待分析文本的第三词嵌入向量,得到所述第一词嵌入向量。
37.可选的,所述根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重,包括:
38.根据所述第一词嵌入向量,得到第一隐层向量;
39.根据所述第二词嵌入向量,得到第二隐层向量;
40.根据所述第一隐层向量和所述第二隐层向量,得到所述目标注意力权重。
41.可选的,根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型,包括:
42.根据所述目标注意力权重、所述第一词嵌入向量以及第一融合向量,确定所述至少一个实体词中每个实体词分别对应的情感类型,其中,所述第一融合向量为所述第一词嵌入向量和所述第二词嵌入向量的融合向量。
43.与现有技术相比,本技术实施例具有以下优点:
44.本技术实施例提供了一种情感类型确定方法,包括:获取待分析文本,所述待分析文本包括至少一个实体词。而后,将所述待分析文本输入情感类型确定模型,得到所述至少一个实体词中每个实体词分别对应的情感类型。其中,所述情感类型确定模型,可以确定所述待分析文本的第一词嵌入向量和所述至少一个实体词的第二词嵌入向量,并进一步根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重。而后,根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型。由于所述情感类型确定模型在确定实体词的情感类型时,采用了注意力机制,并且,确定目标注意力权重时,考虑了所述至少一个实体词的第二词嵌入向量。因此,采用本方案,能够更加准确的确定出实体词的情感类型。本技术实施例中的情感类型,可以认为是情感极性。情感极性例如可以包括正面情感和负面情感。
附图说明
45.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
46.图1为本技术实施例提供的一种情感类型确定方法的流程示意图;
47.图2为本技术实施例提供的一种情感类型确定模型来确定情感类型的方法的流程示意图;
48.图3为本技术实施例提供的一种情感类型确定装置的结构示意图。
具体实施方式
49.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
50.下面结合附图,详细说明本技术的各种非限制性实施方式。
51.示例性方法
52.参见图1,该图为本技术实施例提供的一种情感类型确定方法的流程示意图。在本实施例中,所述方法可以由终端设备执行,也可以由服务器执行,本技术实施例不做具体限定。
53.在一个示例中,所述方法例如可以包括以下步骤:s101-s102。
54.s101:获取待分析文本,所述待分析文本包括至少一个实体词。
55.本技术实施例不具体限定所述待分析文本,所述待分析文本可以是通过任意渠道获取的文本。在一个示例中,考虑到分析评论文本中各个实体词对应的情感类型,具有较大的意义,例如,根据评论文本中个实体词对应的情感类型,对被评论对象进行改进。因此,在一个示例中,所述待分析文本可以是评论文本。
56.s102:将所述待分析文本输入情感类型确定模型,得到所述至少一个实体词中每个实体词分别对应的情感类型。
57.获取所述待分析文本之后,可以将所述待分析文本输入情感类型确定模型,该情感类型确定模型,用于确定文本中实体词对应的情感类型。因此,将所述待分析文本输入所述情感类型确定模型之后,可以得到所述至少一个实体词中每个实体词分别对应的情感类型。
58.关于所述情感类型确定模型确定所述各个实体词对应的情感类型的具体实现方式,可以参考图2,图2为本技术实施例提供的一种情感类型确定模型来确定情感类型的方法的流程示意图。如图2所示,所述情感类型确定模型可以执行s201-s203,从而得到所述待分析文本中各个实体词分别对应的情感类型。
59.s201:确定所述待分析文本的第一词嵌入向量和所述至少一个实体词的第二词嵌入向量。
60.在一个示例中,可以利用词嵌入计算算法,得到所述待分析文本的第一词嵌入向量和所述至少一个实体词的第二词嵌入向量。
61.在一个示例中,可以利用glove算法,确定所述第一词嵌入向量和所述第二词嵌入向量。其中:
62.glove的实现方式如下:glove根据语料库构建一个共现矩阵,在共现矩阵中的每一个元素xij的含义是单词i和单词j在特定大小而定上下文窗口内共同出现的次数,并且根据两个单词的距离dis提出了衰减函数用于计算权重信息,权重越小则代表着两个单词所占总计数距离越远。
63.对于多方面级别情感分析,一句话中会包含多个实体词。例如:“the staff service is very good and the cake tastes normal,but i am not satisfied with the drinks here”,在这句话中,就存在多个实体词,分别为“service”、“cake”和“drinks”。于是对于待分析文本进行分词处理,得到多个分词。并将每个分词映射成对应的词向量,当待分析文本中包括n个分词,该n个分词中包括m个实体词时,第一词嵌入向量和第二词嵌入向量可以分别表示为:
[0064][0065][0066]
在公式(1)和公式(2)中:
[0067]
s为第一词嵌入向量;
[0068]
为第i个分词的词嵌入;
[0069]
a为第二词嵌入向量;
[0070]
为第i个实体的词嵌入。
[0071]
在一个示例中,为了使得所述第一词嵌入向量能够携带更多的信息,获取所述第一词嵌入向量在具体实现时,可以通过如下步骤a1-a2实现。
[0072]
步骤a1:确定位置感知嵌入,所述位置感知嵌入用于指示所述待分析文本中各个分词的权重,其中,所述各个分词的权重与所述各个分词和所述至少一个实体词之间的位置关系确定。
[0073]
步骤a2:根据所述位置感知嵌入和所述待分析文本的第三词嵌入向量,得到所述第一词嵌入向量。
[0074]
所述位置感知嵌入,可以用于指示所述待分析文本中各个分词在确定实体词的情感类型的重要程度。例如分词1距离实体词1比较近,则分词1在确定实体词1的情感类型时所对应的重要程度较高。
[0075]
关于所述位置感知嵌入,在一个示例中:
[0076]
对于一个完整的句子,例如待分析文本“a group of friendly staff,the pizza is not bad,but the beef cubes are not worth the money!”中,一共有三个实体词,比如第一个实体词是“staff”,那么此时该实体词的位置标签就设为0,实体词左右两边的标签索依次为{-4,-3,-2,-1,0,1,2,3,

},同理可以得到pizza的位置索引,位置感知机制可以如公式(3)所述:
[0077][0078]
在公式(3)中:
[0079]ws
和we代表实体词的开始和结束的标志;
[0080]
这时候pi就是代表待分析文本中中第i个分词到指定实体词的相对距离。
[0081]
此时,这时候s相应的位置嵌入可以通过位置感知嵌入矩阵查找得到。其中,d
p
表示为位置嵌入维度,n为s的总长度。由位置索引转换为位置感知嵌入建模,我们可以得到s中不同距离单词的有不同的权重,从而达到位置感知嵌入的目的。从上面的例子我们可以看出,单词“friendly”在判断实体词“staff”中起到更为重要的作用。
[0082]
前述第三词嵌入向量,例如可以是利用glove算法对带分词文本进行处理得到的词嵌入向量。
[0083]
s202:根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重。
[0084]
在本技术实施例中,所述情感类型确定模式,可以是基于注意力机制的模型。确定所述第一词嵌入向量之后,可以根据所述第一词嵌入向量和所述第二词嵌入向量,得到所述目标注意力权重。
[0085]
在一个示例中,s202在具体实现时,可以根据所述第一词嵌入向量确定第一隐层向量,例如,将所述第一词嵌入性向量输入双向长短时记忆(bi-directional long short-term memory,bi-lstm)网络,得到所述第一隐层向量。相应的,根据第二词嵌入向量确定第二隐层向量,例如,将所述第二词嵌入向量输入bi-lstm网络,得到第二隐层向量。进一步地,基于所述第一隐层向量和所述第二隐层向量,得到所述目标注意力权重。对于这种情况,在一个示例中,所述目标注意力权重,可以通过如下公式(4)和公式(5)得到。
[0086][0087][0088]
在公式(4)和公式(5)中:
[0089]
为第一隐层向量;
[0090]
为第二隐层向量;
[0091]
tanh函数是非线性激活函数;
[0092]
αi是归一化后目标注意力权重。
[0093]
在又一个示例中,为了使得所述目标注意力权重更加准确,还可以计算第一词嵌入向量和第二词嵌入向量的第一融合向量。相应的,s202在具体实现时,可以根据所述第一词嵌入向量、所述第二词嵌入向量以及所述第一融合向量,确定所述目标注意力权重。
[0094]
作为一个示例,可以根据所述第一词嵌入向量确定第一隐层向量,根据第二词嵌入向量确定第二隐层向量,并根据所述第一融合向量确定第三因此向量,进一步地,基于所述第一隐层向量、所述第二隐层向量和所述第三隐层向量,得到所述目标注意力权重。
[0095]
s203:根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型。
[0096]
确定所述目标注意力权重之后,可以根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型。
[0097]
在一个示例中,可以根据所述目标注意力权重,得到实体词对应的注意力表示,而后,根据所述实体词分别对应的注意力表示和所述第一词嵌入向量,确定所述至少一个实体词中每个实体词分别对应的情感类型。
[0098]
在一个示例中,可以根据所述目标注意力权重、所述第一词嵌入向量以及第一融合向量,确定所述至少一个实体词中每个实体词分别对应的情感类型。具体地:
[0099]
可以根据所述第一词嵌入向量和所述目标注意力权重,得到第一上下文表示,并根据所述第一融合向量和所述目标注意力权重,得到第二上下文表示,进一步地,根据所述第一上下文表示和所述第二上下文表示,确定所述至少一个实体词中每个实体词分别对应的情感类型。
[0100]
作为一个示例,可以参考一下公式(6)至公式(15)理解。
[0101][0102][0103][0104][0105][0106][0107]
[0108][0109]
在公式(6)至公式(13)中:
[0110]hs
为第一上下文表示;
[0111]hsa
为第二上下文表示;
[0112]
为第一隐层向量。
[0113]
根据第一上下文表示和第二上下文表示得到第三上下文表示h之后,可以将h输入到非线性层后得到输出序列表示x,则:
[0114]
x=tanh(w
x
h b
x
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
公式(14)
[0115]
其中,w
x
和b
x
分别是权重矩阵和偏差。进一步地,将x输入到一个线性层,加入softmax层从而得到实体词对应各种情感类型的概率y,则:
[0116]
y=softmax(wsx bs)
ꢀꢀꢀꢀꢀꢀꢀ
公式(15)
[0117]
类似的,ws和bs分别是权重矩阵和偏差。
[0118]
通过以上描述可知,由于所述情感类型确定模型在确定实体词的情感类型时,采用了注意力机制,并且,确定目标注意力权重时,考虑了所述至少一个实体词的第二词嵌入向量。因此,采用本技术实施例提供的方案,能够更加准确的确定出实体词的情感类型。
[0119]
本技术实施例中的情感类型,可以认为是情感极性。情感极性例如可以包括正面情感和负面情感。当然,所述情感类型还可以划分的更加细致,例如,将正面情感划分为多种类型,和/或,将负面情感划分为多种类型,等等,本技术实施例不做具体限定。
[0120]
示例性设备
[0121]
基于以上实施例提供的方法,本技术实施例还提供了一种装置,以下结合附图介绍该装置。
[0122]
参见图3,示出了本技术实施例中一种情感类型确定装置的结构示意图。所述装置300例如可以具体包括:获取单元301和第一确定单元302。
[0123]
获取单元301,用于获取待分析文本,所述待分析文本包括至少一个实体词;
[0124]
第一确定单元302,用于将所述待分析文本输入情感类型确定模型,得到所述至少一个实体词中每个实体词分别对应的情感类型,其中:所述情感类型确定模型,用于:
[0125]
确定所述待分析文本的第一词嵌入向量和所述至少一个实体词的第二词嵌入向量;
[0126]
根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重;
[0127]
根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型。
[0128]
可选的,所述装置还包括:
[0129]
第二确定单元,用于确定所述第一词嵌入向量和所述第二词嵌入向量的第一融合向量;
[0130]
所述根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重,包括:
[0131]
根据所述第一词嵌入向量、所述第二词嵌入向量以及所述第一融合向量,确定所述目标注意力权重。
[0132]
可选的,所述确定所述待分析文本的第一词嵌入向量,包括:
[0133]
确定位置感知嵌入,所述位置感知嵌入用于指示所述待分析文本中各个分词的权重,其中,所述各个分词的权重与所述各个分词和所述至少一个实体词之间的位置关系确定;
[0134]
根据所述位置感知嵌入和所述待分析文本的第三词嵌入向量,得到所述第一词嵌入向量。
[0135]
可选的,所述根据所述第一词嵌入向量和所述第二词嵌入向量,确定目标注意力权重,包括:
[0136]
根据所述第一词嵌入向量,得到第一隐层向量;
[0137]
根据所述第二词嵌入向量,得到第二隐层向量;
[0138]
根据所述第一隐层向量和所述第二隐层向量,得到所述目标注意力权重。
[0139]
可选的,根据所述第一词嵌入向量和所述目标注意力权重,确定所述至少一个实体词中每个实体词分别对应的情感类型,包括:
[0140]
根据所述目标注意力权重、所述第一词嵌入向量以及第一融合向量,确定所述至少一个实体词中每个实体词分别对应的情感类型,其中,所述第一融合向量为所述第一词嵌入向量和所述第二词嵌入向量的融合向量。
[0141]
由于所述装置300是与以上方法实施例提供的方法对应的装置,所述装置300的各个单元的具体实现,均与以上方法实施例为同一构思,因此,关于所述装置300的各个单元的具体实现,可以参考以上方法实施例的描述部分,此处不再赘述。
[0142]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本技术的真正范围和精神由下面的权利要求指出。
[0143]
应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。
[0144]
以上所述仅为本技术的较佳实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献