一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于自然语言处理神经网络模型的可视化分析方法和系统与流程

2021-12-15 03:20:00 来源:中国专利 TAG:

技术特征:
1.一种用于自然语言处理神经网络模型的可视化分析方法,其特征在于,包括:接收神经网络模型和训练语料库,其中,所述训练语料库用于训练所述神经网络模型;计算所述训练语料库中每个单词与所述神经网络模型中输出层输出的语义向量的第一互信息,根据所述第一互信息获取所述训练语料库中每个单词对所述神经网络模型的重要程度;将所述训练语料库中每个单词及其对所述神经网络模型的重要程度进行可视化展示。2.根据权利要求1所述的可视化分析方法,其特征在于,在所述将所述训练语料库中每个单词及其对所述神经网络模型的重要程度可视化展示之后,还包括:对所述重要程度进行分析,以确定所述训练语料库中的异常单词,并将所述异常单词对所述神经网络模型的重要程度作为第一异常值;根据所述第一异常值确定所述神经网络模型中出现样本倾斜的异常现象并进行可视化展示。3.根据权利要求1或2所述的可视化分析方法,其特征在于,在所述计算所述训练语料库中每个单词与所述神经网络模型中输出层输出的语义向量的第一互信息之后,还包括:将多个所述第一互信息组成第一互信息向量,其中,通过下述步骤获取所述第一互信息向量:对所述训练样本添加高斯噪音;根据所述训练样本和所述高斯噪音构建关于所述第一互信息向量的损失函数;对关于所述第一互信息向量的损失函数使用最大似然估计使所述损失函数最小,计算得到第一高斯噪音,并根据所述第一高斯噪音获取所述第一互信息向量;其中,所述损失函数的表达式为:其中,为添加高斯噪音后的训练样本,表示∈
i
是服从分布的高斯噪音,φ表示所述神经网络模型,s表示所述训练样本通过神经网络模型φ在输出层输出的语义向量,表示所述神经网络模型φ对所述训练语料库中全体训练样本在输出层输出的语义向量的方差,表示对的数学期望,k和λ取做0

1之间的经验值。4.根据权利要求1或2所述的可视化分析方法,其特征在于,所述根据所述第一互信息获取所述训练语料库中每个单词对所述神经网络模型的重要程度,具体包括:获取所述每个单词在所述训练语料库出现的词频,和所述每个单词与所述神经网络模型在输出层输出的语义向量的贡献度;根据所述词频和所述词频计算所述重要程度;其中,通过下式计算所述重要程度:m=log(c(w) 1.0)*g(w)其中,m为每个单词对所述神经网络模型的重要程度,w为训练语料库中的每个单词,c(w)为每个单词在所述训练语料库出现的词频,g(w)为每个单词与神经网络模型在输出层
输出的语义向量的第一互信息的均值。5.根据权利要求1所述的可视化分析方法,其特征在于,在所述接收神经网络模型和训练语料库之后,还包括:计算所述训练语料库中每个训练样本对所述神经网络模型的预测得分和所述输出层输出的语义向量;通过投影技术对所述神经网络模型的预测得分和所述输出层输出的语义向量进行投影处理,以得到每个训练样本的投影坐标并进行可视化展示。6.根据权利要求5所述的可视化分析方法,其特征在于,在所述通过投影技术对所述神经网络模型的预测得分和所述输出层输出的语义向量进行投影处理,以得到每个训练样本的投影坐标并进行可视化展示之后,还包括:对所述重要程度进行分析,以确定所述训练语料库中的异常样本,并将所述异常样本对所述神经网络模型的投影坐标作为第二异常值;根据所述第二异常值确定所述神经网络模型中出现样本倾斜的异常现象并进行可视化展示。7.根据权利要求1或2所述的可视化分析方法,其特征在于,在所述接收神经网络模型和训练语料库之后,还包括:计算所述训练语料库中每个训练样本与所述神经网络模型的每个中间层的第二互信息矩阵;根据所述第二互信息矩阵提取每个训练样本与所述神经网络模型的多个中间层的第一多个第二互信息列向量,其中,一个第二互信息列向量中的每个元素指示一个训练样本中包含的每个单词对某一中间层的第二互信息值;对所述第一多个第二互信息列向量进行层次聚类,以得到每个训练样本在每个中间层的语法结构,并计算所述第一多个第二互信息列向量中的任意两个元素的相似度;将所述语法结构和所述第一多个第二互信息列向量中的任意两个元素的相似度进行可视化展示。8.根据权利要求7所述的可视化分析方法,其特征在于,在所述将所述语法结构和所述第一多个第二互信息列向量中的任意两个元素的相似度进行可视化展示之后,还包括:对所述语法结构和所述第一多个第二互信息列向量中的任意两个元素的相似度进行分析,以确定得到的所有所述语法结构和所述相似度中的异常语法结构和/或相似度异常,并将所述异常语法结构和/或相似度异常作为第三异常值;根据所述第三异常值确定所述神经网络模型中出现样本倾斜的异常现象并进行可视化展示。9.根据权利要求7所述的可视化分析方法,其特征在于,包括:根据所述第二互信息矩阵获取所述训练语料库中包含同一单词的训练样本与所述神经网络模型的多个中间层对应的第二多个第二互信息列向量,并计算所述同一单词与所述神经网络模型中输出层输出的语义向量的第二互信息;显示所述第二多个第二互信息列向量中包含的高于所述第二互信息的阈值的元素值对应的单词。10.根据权利要求8所述的可视化分析方法,其特征在于,包括:
对显示的所述第二多个第二互信息列向量中包含的高于所述第二互信息的阈值的元素值对应的单词进行分析,以确定异常单词并将其作为第四异常值;根据所述第四异常值确定所述神经网络模型中出现样本倾斜的异常现象并进行可视化展示。11.一种用于自然语言处理神经网络模型的可视化分析系统,其特征在于,包括:接收模块,用于接收神经网络模型和训练语料库,其中,所述训练语料库用于训练所述神经网络模型;处理模块,用于计算所述训练语料库中每个单词与所述神经网络模型中输出层输出的语义向量的第一互信息,根据所述第一互信息获取所述训练语料库中每个单词对所述神经网络模型的重要程度;可视化模块,用于将所述训练语料库中每个单词及其对所述神经网络模型的重要程度进行可视化展示。12.根据权利要求11所述的可视化分析系统,其特征在于,所述可视化分析系统,还包括异常确定模块,所述异常确定模块,用于对所述重要程度进行分析,以确定所述训练语料库中的异常单词,并将所述异常单词对所述神经网络模型的重要程度作为第一异常值;所述可视化模块,还用于根据所述第一异常值确定所述神经网络模型中出现样本倾斜的异常现象并进行可视化展示。13.根据权利要求11或12所述的可视化分析系统,其特征在于,所述处理模块,还用于:将多个所述第一互信息组成第一互信息向量,其中,通过下述步骤获取所述第一互信息向量:对所述训练样本添加高斯噪音;根据所述训练样本和所述高斯噪音构建关于所述第一互信息向量的损失函数;对关于所述第一互信息向量的损失函数使用最大似然估计使所述损失函数最小,计算得到第一高斯噪音,并根据所述第一高斯噪音获取所述第一互信息向量;其中,所述损失函数的表达式为:其中,为添加高斯噪音后的训练样本,表示∈
i
是服从分布的高斯噪音,φ表示所述神经网络模型,s表示所述训练样本通过神经网络模型φ在输出层输出的语义向量,表示所述神经网络模型φ对所述训练语料库中全体训练样本在输出层输出的语义向量的方差,表示对的数学期望,k和λ取做0

1之间的经验值。14.根据权利要求11或12所述的可视化分析系统,其特征在于,所述处理模块,还用于:计算所述训练语料库中每个训练样本与所述神经网络模型的每个中间层的第二互信息矩阵;根据所述第二互信息矩阵提取每个训练样本与所述神经网络模型的多个中间层的第
一多个第二互信息列向量,其中,一个第二互信息列向量中的每个元素指示一个训练样本中包含的每个单词对某一中间层的第二互信息值;对所述第一多个第二互信息列向量进行层次聚类,以得到每个训练样本在每个中间层的语法结构,并计算所述第一多个第二互信息列向量中的任意两个元素的相似度;所述可视化模块,还用于将所述语法结构和所述第一多个第二互信息列向量中的任意两个元素的相似度进行可视化展示。15.根据权利要求14所述的可视化分析系统,其特征在于,所述异常确定模块,还用于:对所述语法结构和所述第一多个第二互信息列向量中的任意两个元素的相似度进行分析,以确定得到的所有所述语法结构和所述相似度中的异常语法结构和/或相似度异常,并将所述异常语法结构和/或相似度异常作为第三异常值;所述可视化模块,还用于根据所述第三异常值确定所述神经网络模型中出现样本倾斜的异常现象并进行可视化展示。16.根据权利要求14所述的可视化分析系统,其特征在于,所述处理模块,还用于根据所述第二互信息矩阵获取所述训练语料库中包含同一单词的训练样本与所述神经网络模型的多个中间层对应的第二多个第二互信息列向量,并计算所述同一单词与所述神经网络模型中输出层输出的语义向量的第二互信息;所述可视化模块,还用于显示所述第二多个第二互信息列向量中包含的高于所述第二互信息的阈值的元素值对应的单词。17.根据权利要求16所述的可视化分析系统,其特征在于,包括:所述异常确定模块,还用于对显示的所述第二多个第二互信息列向量中包含的高于所述第二互信息的阈值的元素值对应的单词进行分析,以确定异常单词并将其作为第四异常值;所述可视化模块,还用于根据所述第四异常值确定所述神经网络模型中出现样本倾斜的异常现象并进行可视化展示。18.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1

10中任一所述的方法。19.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1

10中任一所述的方法。

技术总结
本申请公开了一种用于自然语言处理神经网络模型的可视化分析方法和系统,涉及自然语言处理技术领域,该方案通过接收神经网络模型和用于训练所述神经网络模型的训练语料库;计算所述训练语料库中每个单词与所述神经网络模型中输出层输出的语义向量的第一互信息,根据所述第一互信息获取所述训练语料库中每个单词对所述神经网络模型的重要程度;将所述训练语料库中每个单词及其对所述神经网络模型的重要程度进行可视化展示。由此,采用上述方案的本申请可以实现对不同结构的神经网络模型进行对比分析并可视化展示,从而改善用户体验。验。验。


技术研发人员:刘世霞 李振 张慧
受保护的技术使用者:清华大学
技术研发日:2021.08.31
技术公布日:2021/12/14
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献