一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于文本和情感极性的评论有用性预测方法、设备及介质与流程

2022-04-02 05:52:29 来源:中国专利 TAG:

技术特征:
1.基于文本和情感极性的评论有用性预测方法,其特征在于,包括如下步骤,获取评论数据,并对所述评论数据进行编码处理,所述编码处理包括基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,以及基于句子级注意力机制对评论句子进行编码获取评论的表示向量;将评论的表示向量送入预测模型的两个全连接层,分别获取评论的有用性预测概率和评论情感极性预测概率,并基于交叉熵损失函数构建评论有用性概率预测的第一损失函数和评论情感极性概率预测的第二损失函数,再对所述第一损失函数与第二损失函数进行优化。2.根据权利要求1所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,包括:获取评论句子中词的序列,其中l∈[1,l],l表示评论中有l条评论句子,t表示评论句子l中词的数量,通过词嵌入矩阵得到词的表示向量,其中m为词典中词的综述,为表示词向量维度的参数,,,再将评论句子l中的词向量序列送入第一双向gru网络中,其中第一时间步的计算如下式(1)、(2)所示,(1)(2)通过式(1)、(2)得到两个隐状态,,再拼接两个隐状态得到第一双向gru网络的第一时间步的输出,其中,第一时间步表示评论词;将送入第一多层感知机得到向量,如下式(3)所示,(3)其中,为可学习的参数,为待学习的随机初始化的向量参数;再计算向量的转置向量与向量的内积,再通过softmax函数得到每个第一时间步基于词级注意力机制输出的权重,如下式(4)所示,(4)其中,为待学习的随机初始化的向量参数;最后通过加权求和每个第一时间步输出得到句子l的表示向量,如下式(5)所示,(5)。3.根据权利要求2所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述基于句子级注意力机制对评论句子进行编码获取评论的表示向量,包括:获取评论中评论句子的表示向量集合,将向量集合输入第二双向gru网络中,其中第二时间步的计算如下式(6)、(7)所示,(6)
(7)通过式(6)、(7)得到两个隐状态,,再拼接两个隐状态得到第二双向gru网络的第二时间步的输出,其中,第二时间步表示评论句子;将送入第一多层感知机得到向量,如下式(8)所示,(8)其中,为可学习的参数,为待学习的随机初始化的向量参数;再计算向量的转置向量与向量的内积,再通过softmax函数得到每个第二时间步基于句子级注意力机制输出的权重,如下式(9)所示,(9)其中,为待学习的随机初始化的向量参数;最后通过加权求和每个第二时间步输出得到评论的表示向量,如下式(10)所示,(10)。4.根据权利要求1所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述评论的有用性预测概率的获取如下式(11)所示,(11)其中,为评论的有用性预测概率,为可学习的参数。5.根据权利要求4所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述评论情感极性预测概率采用softmax函数获取概率分布,如下式(12)所示,(12)其中,为评论情感极性预测概率,为可学习的参数。6.根据权利要求5所述的基于文本和情感极性的评论有用性预测方法,其特征在于,构建评论有用性概率预测的第一损失函数为,采用二元交叉熵损失函数构建第一损失函数,如下式(13)所示,(13)其中,c为训练用评论数据集, c∈(n1,n2,

,n
k
),k∈[1,k],为表示评论有用性的真实标签;构建评论情感极性概率预测的第二损失函数为,采用多元交叉熵损失函数构建第二损失函数,如下式(14)所示,(14)其中,为表示评论情感极性的真实标签;所述对所述第一损失函数与第二损失函数进行优化如下式(15)所示,
(15)其中,为所述预测模型的损失函数,θ为可学习的参数。7.根据权利要求1所述的基于文本和情感极性的评论有用性预测方法,其特征在于,在将评论的表示向量送入预测模型之前还包括,将所有评论的表示向量基于相似度进行分类,在被分在同一类的评论中选取一条评论,用被选择评论的表示向量代表其所在的评论分类作为输入。8.根据权利要求7所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述将所有评论的表示向量基于相似度进行分类包括,预设相似度阈值区间,当两条评论的向量相似度位于所述相似度阈值区间时,两条评论判定为同一分类。9.一种电子设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一项所述的基于文本和情感极性的评论有用性预测方法。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的基于文本和情感极性的评论有用性预测方法。

技术总结
本发明提供基于文本和情感极性的评论有用性预测方法、设备及介质,方法如下,获取评论数据,对所述评论数据进行编码处理,所述编码处理包括基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,以及基于句子级注意力机制对评论句子进行编码获取评论的表示向量;将评论的表示向量送入预测模型的两个全连接层,分别获取评论的有用性预测概率和评论情感极性预测概率,并基于交叉熵损失函数构建评论有用性概率预测的第一损失函数和评论情感极性概率预测的第二损失函数,再对所述第一损失函数与第二损失函数进行优化;本申请将评论内容与评论的情感极性结合,通过多任务学习的方式进行模型训练,实现高效率的评论有用性预测。评论有用性预测。评论有用性预测。


技术研发人员:江岭 黄鹏 王思宇
受保护的技术使用者:成都晓多科技有限公司
技术研发日:2022.01.04
技术公布日:2022/4/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献