一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于方面类别的语句情感分析方法、装置以及设备

2022-10-12 22:54:38 来源:中国专利 TAG:


1.本发明涉及情感分析领域,特别涉及是一种基于方面类别的语句情感分析方法、装置、设备以及存储介质。


背景技术:

2.相比粗粒度情感分类,基于方面级的情感分析是一种细粒度的情感分类任务,识别句子中给定方面的情感极性。根据给定方面的不同,分为两个子任务:方面类别情感分析和方面术语情感分析。其中方面类别情感分析任务旨在识别句子给定方面类别的情感极性。
3.然而,方面类别情感分析所讨论的方面类别是预定义的类别,通常不会出现在句子中,导致目前基于位置向量和句法距离等信息的方法都无法准确构建方面类别和情感观点表达的联系,从而无法对语句进行准确的情感分析。


技术实现要素:

4.基于此,本发明的目的在于,提供一种基于方面类别的语句情感分析方法、装置、设备以及存储介质,通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
5.第一方面,本技术实施例提供了一种基于方面类别的语句情感分析方法,包括以下步骤:获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网
络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
6.第二方面,本技术实施例提供了一种基于方面类别的语句情感分析装置,包括:语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;编码模块,用于将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;注意力计算模块,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;语义特征提取模块,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;分布预测模块,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;训练模块,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;分析模块,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
7.第三方面,本技术实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述基于方面类别的语句情感分析方法的步骤。
8.第四方面,本技术实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于方面类别的语句情感分析方法的步骤。
9.在本技术实施例中,提供一种基于方面类别的语句情感分析方法、装置、设备以及存储介质,通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
10.为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
11.图1为本技术一个实施例提供的基于方面类别的语句情感分析方法的流程示意图;图2为本技术一个实施例提供的基于方面类别的语句情感分析方法中s2的流程示意图;图3为本技术一个实施例提供的基于方面类别的语句情感分析方法中s3的流程示意图;图4为本技术一个实施例提供的基于方面类别的语句情感分析方法中s4的流程示意图;图5为本技术一个实施例提供的基于方面类别的语句情感分析方法中s5的流程示意图;图6为本技术一个实施例提供的基于方面类别的语句情感分析方法中s6的流程示意图;图7为本技术一个实施例提供的基于方面类别的语句情感分析方法中s7的流程示意图;图8为本技术一个实施例提供的基于方面类别的语句情感分析装置的结构示意图;图9为本技术一个实施例提供的计算机设备的结构示意图。
具体实施方式
12.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
13.在本技术使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
14.应当理解,尽管在本技术可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本技术范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
15.请参阅图1,图1为本技术一个实施例提供的基于方面类别的语句情感分析方法的流程示意图,所述方法包括如下步骤:s1:获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词。
16.所述基于方面类别的语句情感分析方法的执行主体为基于方面类别的语句情感分析方法的分析设备(以下简称分析设备),在一个可选的实施例中,所述分析设备可以是
一台计算机设备可以是服务器,或是多台计算机设备联合而成的服务器机群。
17.所述样本语句包括若干个单词,所述单词可以是名词、形容词等等。
18.在本实施例中,分析设备可以获得用户输入的若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述样本语句的若干个方面类别组,所述方面类别组包括若干个特征词,所述特征词体现了所述样本语句中的方面类别。
19.s2:将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集。
20.所述编码模块可以采用bert(bidirectional encoder representation from transformers)模型,也可以采用glove模型,用于对样本语句以及方面类别组的进行词嵌入处理。
21.在本实施例中,分析模块将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示。
22.所述特征词包括实体词以及属性词,在一个可选的实施例中,一组方面类别组由一个实体词以及属性词组成。请参阅图2,图2为本技术一个实施例提供的基于方面类别的语句情感分析方法中s2的流程示意图,包括步骤s201~s206,具体如下:s201:将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句。
23.在本实施例中,分析设备将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句,例如,当该样本语句有相应的一个方面类别组,该方面类别组由一个实体词以及属性词组成,拼接处理后的样本语句的表达式为:式中,为样本语句的句子表示,为实体词的词表示,为属性词的词表示,[cls]以及[sep]均为拼接处理中,关于bert词嵌入模型的标记符号。
[0024]
s202:将所述若干个拼接处理后的样本语句输入至所述神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示。
[0025]
在本实施例中,分析设备将所述若干个拼接处理后的样本语句输入至所述神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示。
[0026]
s203:将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为所述句子特征表示集。
[0027]
在本实施例中,分析设备将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为所述句子特征表示集。其中,所述若干个样本语句的句子特征表示的表达式为:
式中,表示第i个样本句子的词嵌入矩阵,为第i个样本语句的第n个单词对应的词嵌入表示。
[0028]
s204:将同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为所述词嵌入特征表示集。
[0029]
式中,表示第i个样本语句的第k个方面类别组的词嵌入矩阵,为第i个样本语句的第k个方面类别组的实体词对应的词嵌入表示,为第i个样本语句的第k个方面类别组的属性词对应的词嵌入表示。
[0030]
s205:将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有同一属性词的拼接处理后的样本语句进行组合,获得所述若干个属性词对应的样本语句集。
[0031]
在本实施例中,分析设备将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有所述同一属性词的拼接处理后的样本语句进行组合,获得若干个属性词对应的样本语句集,所述实体词对应的样本语句集的表达式为:式中,为第i个样本语句中的第k个方面类别组的实体词对应的样本语句集,为该实体词对应的样本语句集中的第j个样本语句的句子表示。
[0032]
所述属性词对应的样本语句集的表达式为:式中,为第i个样本语句中的第k个方面类别组的属性词对应的样本语句集,为该属性词对应的样本语句集中的第j个样本语句的句子表示。
[0033]
s206:将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集。
[0034]
在本实施例中,分析设备将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集。
[0035]
具体地,分析设备将所述实体词对应的样本语句集中的样本语句的句子表示进行拼接处理,获得所述实体词对应的样本语句集对应的总句子表示,所述实体词对应的样本
语句集对应的总句子表示的表达式为:将所述实体词对应的样本语句集对应的总句子表示输入至所述神经网络模型中的编码模块,取bert词嵌入模型的第j个样本语句前的拼接标记[cls]对应的输出表示作为所述实体词对应的样本语句集中第j个样本语句的方面类别特征表示,如下所述:式中,为第i个样本语句中的第k个方面类别组的实体词对应的样本语句集的关于样本语句的方面类别特征表示集,为该实体词对应的样本语句集中的第j个样本语句的方面类别特征表示。
[0036]
同理,分析设备将所述属性词对应的样本语句集中的样本语句的句子表示进行拼接处理,获得所述属性词对应的样本语句集对应的总句子表示,将所述属性词对应的样本语句集对应的总句子表示输入至所述神经网络模型中的编码模块,获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集,具体如下:式中,为第i个样本语句中的第k个方面类别组中的属性词对应的样本语句集的关于样本语句的方面类别特征表示集,为该属性词对应的样本语句集中的第j个样本语句的方面类别特征表示。
[0037]
s3:将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
[0038]
在本实施例中,分析设备将所述词嵌入表示集以及方面类别特征表示集,输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
[0039]
请参阅图3,图3为本技术一个实施例提供的基于方面类别的语句情感分析方法中s3的流程示意图,包括步骤s301~s304,具体如下:s301:构建与所述样本语句相应的特征词相关联的图网络结构。
[0040]
为了提取特征词体现的情感信息,在本实施例中,分析设备构建与所述样本语句相应的特征词相关联的图网络结构,其中,所述样本所述图网络包括中心节点以及若干个子节点。
[0041]
s302:将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵。
[0042]
在本实施例中,分析设备将所述特征词对应的词嵌入表示设置在所述图网络结构
的中心节点,并从所述方面类别特征表示集中,将同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵。
[0043]
在一个可选的实施例中,当一组方面类别组由一个实体词以及一个属性词组成,所述方面类别组的邻接矩阵包括实体词对应的邻接矩阵以及属性词对应的邻接矩阵,具体地,分析设备分别将所述实体词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将所述同一实体词对应的样本语句的句子特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的实体词对应的邻接矩阵,同理,分析设备构建所述若干个样本语句的若干个方面类别组的属性词对应的邻接矩阵。
[0044]
s303:根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示。
[0045]
在本实施例中,分析设备根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示,所述图注意力计算算法为:式中,为所述图注意力网络模块的第l层的特征词对应的注意力特征表示,relu()为激活函数,q为所述图网络结构的子节点的数目,为所述图注意力网络模块的第l层的权重参数,为所述图注意力网络模块的第l层的可训练的位置关系矩阵,为所述图注意力网络模块的第l层的方面类别特征表示,为所述图注意力网络模块的第l层的偏置参数,为第j个样本语句的第k个方面类别组的邻接矩阵中节点之间关系,为所述图注意力网络模块的参数矩阵,为所述图注意力网络模块的第l-1层的特征词对应的词嵌入表示;其中,所述特征词对应的注意力特征表示包括所述实体词对应的注意力特征表示,以及所述属性词对应的注意力特征表示。
[0046]
s304:根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
[0047]
所述特征融合算法为:
式中,为第i个样本语句中的第k个方面类别组对应的注意力特征表示,为所述图注意力网络模块的第l层的实体词对应的注意力特征表示,为所述图注意力网络模块的第l层的属性词对应的注意力特征表示,为预设的第一可训练权重参数,为预设的第二可训练权重参数。
[0048]
在本实施例中,分析设备根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
[0049]
s4:将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示。
[0050]
为了提高情感分析的准确性,在本实施例中,分析设备将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示,其中,所述语义特征表示包括第一语义特征表示以及第二语义特征表示。
[0051]
请参阅图4,图4为本技术一个实施例提供的基于方面类别的语句情感分析方法中s4的流程示意图,包括步骤s401~s403,具体如下:s401:获得所述若干个样本语句的若干个方面类别组的拼接向量,以及所述若干个样本语句的词性矩阵。
[0052]
所述拼接向量为同一组方面类别组的若干个特征词对应的词嵌入表示进行拼接处理的结果,在本实施例中,分析设备根据所述词嵌入表示集,将同一组方面类别组的若干个特征词对应的词嵌入表示,获得所述若干个样本语句的若干个方面类别组的拼接向量,所述拼接向量的表达式为:式中,为第i个样本语句的第k个方面类别组的拼接向量,为第i个样本语句的第k个方面类别组的实体词对应的词嵌入表示,为第i个样本语句的第k个方面类别组的属性词对应的词嵌入表示,为向量拼接符号。
[0053]
所述词性矩阵体现了样本语句中各个单词的词性,其中,所述词性包括形容词、副词、名词和其他。考虑不同词性的词对情感表达的作用不尽相同,样本语句中形容词、副词和名词对情感分类任务贡献更大,在本实施例中,分析设备基于预设的词性,通过随机初始化,对所述样本语句的单词进行词性向量化,获得所述若干个样本语句的词性矩阵,所述词性矩阵的表达式为:式中,为第i个样本语句的词性矩阵,为第i个样本语句的第n个单词的词性表示。
[0054]
s402:根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样
本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示。
[0055]
所述第一语义特征计算算法为:式中,为第i个样本语句的第k个方面类别组关于第n个单词的第一融合词性表示,表示截取到第p到p t个单词对应的词性表示,p t≤n,为第一卷积核参数,为第一可训练参数矩阵,为第一可训练偏置参数,为第二可训练参数矩阵,为为第二可训练偏置参数,为第i个样本语句的第k个方面类别组关于第n个单词的第二融合词性表示,为第i个样本语句的第k个方面类别组关于第n个单词的第一语义特征表示;在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示。
[0056]
上述计算公式,分析设备分别利用relu和tanh激活函数作为词性信息和样本语句情感信息门函数。由于tanh激活函数范围[-1, 1],可认为提取样本语句中每个词的语义信息。而relu激活函数的范围[0, ∞],通过捕获样本语句中重要词性信息,给以样本语句中每个单词一个体现重要性的权重。将经过两个门机制的特征进行点乘,对样本语句中每个单词的语义信息进行缩放,捕获样本语句中重要词性的语义信息,去除噪声信息。
[0057]
s403:根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示。
[0058]
所述第二语义特征计算算法为:式中,为第i个样本语句的第k个方面类别组关于第n个单词的第三融合词性表示,表示截取到第p到p t个单词对应的词嵌入表示;为第二卷积核参数,为第i个样本语句的第k个方面类别组关于第n个单词的第四融合词性表示,为第i个样本语句的第k个方面类别组关于第n个单词的第二语义特征表示。
[0059]
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示。
[0060]
为了提高情感分析的准确性,分析设备通过增加方面类别信息,捕获样本语句中
关于方面类别的上下文语义信息,以此区别样本语句中不同方面类别的表示。
[0061]
s5:将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据。
[0062]
在本实施例中,分析设备将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据,其中,所述预测分布数据包括分类预测分布数据以及情感预测分布数据。
[0063]
请参阅图5,图5为本技术一个实施例提供的基于方面类别的语句情感分析方法中s5的流程示意图,包括步骤s501~s502,具体如下:s501:根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据。
[0064]
所述分类预测分布数据计算算法为:式中,为第i个样本语句的第k个方面类别组的分类预测分布数据,为第i个样本语句的第k个方面类别组的第一语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第一语义特征表示进行拼接操作获得的;为第三可训练的参数矩阵,,为第一语义特征表示的维度,t为预设的与方面类别相关联的伪标签的数目,为第三偏置参数;为归一化函数;在本实施例中,分析设备根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据,能够进一步强化第一语义特征表示中包含目标方面类别的信息,以提高情感分析的准确性。
[0065]
s502:根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据。
[0066]
所述情感预测分布数据计算算法为:式中,为可训练的参数矩阵,,为第i个样本语句的第k个方面类别组的第二语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第二语义特征表示进行拼接操作获得的;其中,c表示情感类别,包含积极、消极以及中立,为第四偏置参数。
[0067]
在本实施例中,分析设备根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据。
[0068]
s6:根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型。
[0069]
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型,以提高情感分析的准确率。
[0070]
请参阅图6,图6为本技术一个实施例提供的基于方面类别的语句情感分析方法中s6的流程示意图,包括步骤s601~s603,具体如下:s601:获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数。
[0071]
所述分类真实分布数据用于指示方面类别组的情感分类。
[0072]
在本实施例中,分析设备获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数,其中,所述分类损失函数为:式中,为所述分类损失函数,m为所述样本语句的数目,k为所述样本语句中方面类别组的数目,为第i个样本语句的第k个方面类别组的分类真实分布数据,为正则项参数,为所述神经网络模型的所有参数;s602:获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数。
[0073]
所述情感真实分布数据用于指示方面类别组的情感类型。
[0074]
在本实施例中,分析设备获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数,其中,所述情感损失函数为:式中,为所述情感损失函数,为第i个样本语句的第k个方面类别组的情感真实分布数据。
[0075]
s603:根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数。
[0076]
在本实施例中,分布设备根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数,其中,所述神经网络模型的损失函数为:式中,为所述神经网络模型的损失函数,为第一可训练损失参数,为
第二可训练损失参数。
[0077]
s7:响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
[0078]
所述情感分析指令是用户发出,分析设备接收的。
[0079]
在本实施例中,分析设备获取用户发出的情感分析指令,并进行响应,响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
[0080]
请参阅图7,图7为本技术一个实施例提供的基于方面类别的语句情感分析方法中s7的流程示意图,包括步骤s701~s702,具体如下:s701:将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据。
[0081]
s702:根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
[0082]
在本实施例中,分析设备将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据,根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
[0083]
具体地,所述情感极性包括积极、中性以及消极,具体地,当计算得到所述待测语句的关于方面类别组的情感预测分布数据u=[u积极,u消极,u中性]=[0.1,0.7,0.2],概率最大为u消极,其概率最大的维度对应的情感极性为消极,作为所述待测语句的情感分析结果。
[0084]
请参考图8,图8为本技术一个实施例提供的基于方面类别的语句情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于方面类别的语句情感分析装置的全部或一部分,该装置8包括:语句获得模块81,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;编码模块82,用于将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;注意力计算模块83,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;语义特征提取模块84,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
processing unit,cpu)、图像处理器91(graphics processing unit,gpu)和调制解调器等中的一个或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器91中,单独通过一块芯片进行实现。
[0088]
其中,存储器92可以包括随机存储器92(random access memory,ram),也可以包括只读存储器92(read-only memory)。可选的,该存储器92包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器92可用于存储指令、程序、代码、代码集或指令集。存储器92可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器92可选的还可以是至少一个位于远离前述处理器91的存储装置。
[0089]
本技术实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行上述图1至图7的方法步骤,具体执行过程可以参见图1至图7的具体说明,在此不进行赘述。
[0090]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0091]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0092]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束算法。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0093]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0094]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0095]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0096]
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
[0097]
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献