一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于强化蒸馏的跨语言属性级情感分类方法

2022-05-06 11:17:54 来源:中国专利 TAG:

技术特征:
1.一种基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,包括如下步骤:步骤一,基于源语言语料训练一个教师网络,基于知识蒸馏框架将源语言语料中的属性情感信息迁移到学生网络的目标分类器中;步骤二,采用属性敏感的序列选择器根据特定的属性从目标翻译句子序列中选择属性情感相关的信息,并作为模型的中间模块向目标分类器提供去噪后的句子序列表示;步骤三,使用自注意力层构建基于跨语言蒸馏的目标分类器,建模属性序列与去噪后的目标翻译句子序列间的细粒度交互。2.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,所述序列选择器使用lstm网络建模策略网络p
π
,并利用策略梯度算法学习一个最优策略π(a
1:n
),策略网络p
π
通过定义回报学习最优策略,并以概率p
π
(a
i
|s
i
;θ
r
)决定是否选择x
i
。3.根据权利要求2所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,所述策略网络的状态、动作和回报的定义如下:
·
状态:第i个时间步的状态定义为s
i
;根据给定的属性,状态需要提供足够的信息来决定是否选择x
i
,因此状态s
i
由以下三部分构成:其中,h
i
是lstm第i个时间步的隐状态表示,v
i
是第i个词x
i
的向量表示,v
a
是属性向量表示;
·
动作:策略网络p
π
以概率p
π
(a
i
|s
i
;θ
r
)执行动作a
i
∈{0,1},并且使用逻吉斯特函数来计算此概率:a=[a1,a2,...,a
n
]~p
π
(a|s;θ
r
)其中θ
r
为策略网络参数,~表示采样操作,s表示状态,a表示动作,w
r
与b
r
表示可训练参数;
·
回报:定义一个属性敏感的回报r,该定义集成了属性情感分类损失和跨语言蒸馏损失,对于一个训练样本<x
s
,x
t
,y>回报定义如下:其中θ
src
为教师网络参数,θ
tgt
为学生网络参数,γn

/n为惩罚项防止过拟合。4.根据权利要求1或3所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,所述步骤二和步骤三具体包括如下过程:对于目标翻译句子表示属性表示通过序列选择器获得去噪后的句子表示h
d
,即:a=[a1,a2,...,a
n
]=rats(h
s
,v
a
)h
d
=h
s
~a其中,rats表示序列选择器,生成动作序列a,~表示从h
s
中将所有位置a
i
=1的向量提取出来拼接成新的句子序列表示;接着,在基于跨语言蒸馏的目标分类器中借助助自注意力层建模属性与去噪句子表示之间的细粒度交互:h=self attention(h
a
,h
d
)
最后,利用平均池化层和全连接层来计算每个类别的非归一化概率,即q=[q1,q2,...,q
k
],其中k表示类别数;通过软化softmax层,将概率进行归一化:其中t表示温度,当t=1时退化为softmax函数。5.根据权利要求2或3所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,对于所述序列选择器中的策略网络,利用基于策略梯度的reinforce算法进行优化;参数θ
r
的优化目标即最大化期望回报关于参数θ
r
的策略梯度定义如下:其中d表示数据集大小,n表示句子序列长度,表示表示第i个样本第t时间步的动作,表示第i个样本第t时间步的状态。6.根据权利要求4所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,对于目标分类器的参数θ
tgt
,利用反响传播算法进行优化;寻求参数θ
tgt
使得目标分类器的属性情感分类损失最小化:其中,<x
s
,x
t
>分别表示源语言训练样本和目标翻译训练样本,θ
src
为教师网络参数,θ
tgt
为学生网络参数;知识蒸馏框架下教师网络参数在训练过程中需要被冻结。7.根据权利要求4或6所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,在模型训练初期,θ
r
不参与训练过程,当参数θ
tgt
在开发集上的损失开始收敛后,则开始对参数θ
r
和θ
tgt
一起进行训练。8.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,教师网络采用谷歌官方提供的bertbase模型进行训练,学生网络的目标分类器使用多头自注意力层建模属性与去噪后句子序列之间的交互关系,由3层transformer编码器子模块构成。句子序列最大长度设置为60,属性序列最大长度为5,词向量维度为768,句子序列和属性序列共享目标语言编码器。9.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法,其特征在于,模型使用adam优化器进行优化,初始学习率设置为1e-5用于训练学生网络,知识蒸馏温度t设置为3,回报中的惩罚项参数γ设置为1e-5;此外,模型训练的批次大小取值为32,训练迭代轮数为10,神经元随机失活率设置为0.3。

技术总结
本发明提供了一种基于强化蒸馏的跨语言属性级情感分类方法,基于源语言语料训练一个教师网络,基于知识蒸馏框架将源语言语料中的属性情感信息迁移到目标分类器中;采用序列选择器根据特定的属性从目标翻译句子序列中选择属性情感相关的信息,向目标分类器提供去噪后的句子序列表示;使用自注意力层构建基于跨语言蒸馏的目标分类器,建模属性序列与去噪后的目标翻译句子序列间的细粒度交互。本发明缓解了翻译语料与真实语料之间的领域偏差问题,目标分类器具有更强的泛化能力。本发明能够充分利用源语言与目标翻译中有效的属性情感信息,同时更好地建模句子与属性之间的细粒度交互。本发明在情感分类的各方面性能都较基线方法有了一定提升。法有了一定提升。法有了一定提升。


技术研发人员:吴含前 王志可 吴国威 李露
受保护的技术使用者:东南大学
技术研发日:2022.01.14
技术公布日:2022/5/5
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献