技术特征:
1.一种基于量子测量与酉变换技术的语言模型的构建方法,其特征在于,基于量子测量技术对初始复合系统进行量子测量,并对量子测量后的复合系统进行酉变换,融合上文信息,然后求解约化密度矩阵,再与下文组成得到最终的复合系统,并循环上述过程,最后生成文本表示,并进行下游任务。
2.一种基于量子测量与酉变换技术的语言模型,其特征在于,包括复合系统模块、量子测量模块、酉变换模块、约化密度矩阵模块和卷积模块;
复合系统模块用于将输入文本与特征矩阵进行张量积运算,构成复合系统;首先构建特征矩阵,特征矩阵是对answer特征的假设;之后将输入的question中每一个单词的词向量做外积,组成单词密度矩阵,并将所有单词的密度矩阵相加,获得question的密度矩阵表示;最终将特征矩阵与question的密度矩阵做张量积运算,得到复合系统;
量子测量模块用于通过使用测量算子对复合系统进行量子测量;首先构造测量算子,即单位矩阵和词向量外积矩阵的张量积,量子测量过程就是将测量算子与复合系统相乘,再乘上测量算子的共轭转置,最后得到经过量子测量后的复合系统;
酉变换模块用于将经过量子测量的复合系统进行演化,将量子测量的信息保留在特征矩阵中,进而建模出整个question序列的语义信息;得到经过量子测量和酉变换的复合系统;
约化密度矩阵模块用于将经过量子测量和酉变换的复合系统进行分解,得到关于特征矩阵的约化密度矩阵,约化密度矩阵包含了question序列的信息;
卷积模块用于对约化密度矩阵和answer密度矩阵构造的联合表示进行卷积池化操作,采用了一个二维的卷积神经网络提取联合表示的特征,提取的联合表示的特征表示文本之间的相似距离,最后进行匹配训练。
3.根据权利要求2所述一种基于量子测量与酉变换技术的语言模型,其特征在于,复合系统ρsystem表示为:
question的密度矩阵表示为ρquestion;特征矩阵为ρfeature;|featurei>和|featurei′>在构造特征矩阵时,表示特征矩阵的基向量,在经过一轮量子测量和酉变换后,表示为约化密度矩阵的一组单位正交化的特征向量;<featurei|和<featurei′|表示为|featueri>和|featurei′>的共轭转置;
4.根据权利要求2所述一种基于量子测量与酉变换技术的语言模型,其特征在于,对复合系统的量子测量表示为
复合系统测量算子为πsystem,question密度矩阵的测量算子为πw,复合系统为ρsystem,复合系统测量算子的共轭转置为
5.根据权利要求2所述一种基于量子测量与酉变换技术的语言模型,其特征在于,酉变换模块中通过构造酉矩阵usystem,在初始化时,酉矩阵usystem表示为一个单位矩阵i,在经过一次训练后,对酉矩阵进行了参数更新,然后对更新后的酉矩阵进行奇异值分解计算,求出特征向量,然后对特征向量进行拼接得到下一轮的酉矩阵的近似表示;接下来进行酉变换,首先使用酉矩阵乘以经过量子测量后的复合系统,再乘以酉矩阵的共轭转置。
6.根据权利要求2所述一种基于量子测量与酉变换技术的语言模型,其特征在于,约化密度矩阵看作是在理解了question信息的情况下,对answer特征的猜测,在后续进行矩阵相似度计算时,能够和正确answer的密度矩阵匹配到最高得分。
7.根据权利要求2所述一种基于量子测量与酉变换技术的语言模型,其特征在于,使用卷积网络对约化密度矩阵和answer密度矩阵的联合矩阵进行卷积池化操作,计算约化密度矩阵和answer密度矩阵的匹配度得分,通过匹配度得分计算损失值,然后对整个网络进行参数更新。
8.根据权利要求2所述一种基于量子测量与酉变换技术的语言模型,其特征在于,构造answer的密度矩阵与构造question的密度矩阵的过程相同。
技术总结
本发明公开一种基于量子测量与酉变换技术的语言模型及构建方法,基于量子测量的思想,对复合系统进行量子测量,并对量子测量后的系统进行酉变换,融合上文信息,然后求解约化密度矩阵,最后生成文本表示,并进行下游任务。包括复合系统模块、量子测量模块、酉变换模块、约化密度矩阵模块和卷积模块。在问答任务中,使用answer的密度矩阵与约化密度矩阵联合表示,使用卷积神经网络相似度计算,利用计算的loss值进行反向传播进行参数更新。
技术研发人员:樊子鹏;张鹏;张晔华
受保护的技术使用者:天津大学
技术研发日:2021.04.25
技术公布日:2021.08.27
本文用于企业家、创业者技术爱好者查询,结果仅供参考。