自然语言处理方法及其模型的获取方法、装置、存储介质与流程

2021-10-19 23:58:00 来源：中国专利 TAG：方法自然语言人工智能装置模型

技术特征：
1.一种自然语言处理方法，其特征在于，所述方法包括：获取目标文本，所述目标文本包括至少一个实体；获取目标自然语言处理模型，所述目标自然语言处理模型为基于基础处理模型的实体预测损失值和实体关系预测损失值对所述基础处理模型进行更新得到的模型，所述实体预测损失值基于所述基础处理模型预测的各个实体的相似度确定，所述实体关系预测损失值基于所述基础处理模型预测的各个实体对的关系相似度确定，其中，每个所述实体对包括两个实体；将所述目标文本输入所述目标自然语言处理模型，得到所述目标自然语言处理模型输出的处理结果。2.一种自然语言处理模型的获取方法，其特征在于，所述方法包括：获取多个第一训练样本和多个第二训练样本，每个所述第一训练样本包括一个实体对，每个所述第二训练样本包括两个实体对，所述实体对包括两个实体；将所述多个第一训练样本输入至基础处理模型，得到所述基础处理模型的实体预测损失值，所述实体预测损失值基于所述基础处理模型预测的各个所述第一训练样本中两个实体的相似度确定；将所述多个第二训练样本输入至所述基础处理模型，得到所述基础处理模型的实体关系预测损失值，所述实体关系预测损失值基于所述基础处理模型预测的各个所述第二训练样本中两个实体对的关系相似度确定；基于所述实体预测损失值和所述实体关系预测损失值，更新所述基础处理模型的参数，得到目标自然语言处理模型。3.根据权利要求2所述的方法，其特征在于，所述多个第一训练样本包括：从第一文档集合包括的多个第一文档中获取到的m个第一正训练样本，以及与每个所述第一正训练样本对应的多个第一负训练样本；其中，每个所述第一正训练样本包括：一个所述第一文档中的一个头实体，以及所述头实体的尾实体，每个所述第一负训练样本包括：所述第一负训练样本所对应的第一正训练样本中的头实体，以及所述头实体所属的第一文档中的参考实体，所述参考实体为所述第一文档中除所述尾实体之外的实体，m为大于1的整数；所述多个第二训练样本包括：从第二文档集合包括的多个第二文档中获取到的n个第二正训练样本，以及与每个所述第二正训练样本对应的多个第二负训练样本；其中，每个所述第二正训练样本包括：从至少一个所述第二文档中获取到的具有相同关系的两个实体对，每个所述第二负训练样本包括：从至少一个所述第二文档中获取到的具有不同关系的两个实体对，以及无关系的两个实体对，且每个所述第二负训练样本中的一个实体对与所述第二负训练样本对应的一个第二正训练样本中的一个实体对相同，n为大于1的整数。4.根据权利要求3所述的方法，其特征在于，所述将所述多个第一训练样本输入至基础处理模型，得到所述基础处理模型的实体预测损失值，包括：将每个所述第一正训练样本和对应的多个所述第一负训练样本输入至基础处理模型，得到所述基础处理模型的实体预测损失值；所述将所述多个第二训练样本输入至所述基础处理模型，得到所述基础处理模型的实体关系预测损失值，包括：将每个所述第二正训练样本和对应的多个所述第二负训练样本输入至所述基础处理
模型，得到所述基础处理模型的实体关系预测损失值。5.根据权利要求4所述的方法，其特征在于，基于第m个第一正训练样本和对应的多个第一负训练样本得到的基础处理模型的实体预测损失值lep满足：其中，是指第m个第一正训练样本中头实体和尾实体的相似度，是指与所述第m个第一正训练样本对应的多个第一负训练样本中，第j个第一负训练样本所包括的头实体和参考实体的相似度，i是指所述多个第一负训练样本的数量，且m为小于等于m的整数，j为小于等于i的整数；基于第n个第二正训练样本和对应的多个第二负训练样本得到的基础处理模型的实体关系预测损失值lrp满足：其中，是指第n个第二正训练样本中两个实体对的关系相似度，是指与所述第n个第二正训练样本对应的多个第二负训练样本中，第k个第二负训练样本所包括的两个实体对的关系相似度，nneg是指所述多个第二负训练样本的数量，且n为小于等于n的整数，k为小于等于nneg的整数。6.根据权利要求2至5任一所述的方法，其特征在于，所述基于所述实体预测损失值和所述实体关系预测损失值，更新所述基础处理模型的参数，得到目标自然语言处理模型，包括：基于目标损失值、所述实体预测损失值和所述实体关系预测损失值之和，更新所述基础处理模型，直至满足更新终止条件为止；将满足更新终止条件时的基础处理模型确定为目标自然语言处理模型；其中，所述目标损失值用于指示所述基础处理模型自身的计算损失度。7.一种自然语言处理装置，其特征在于，所述装置包括：文本获取模块，用于获取目标文本，所述目标文本包括至少一个实体；模型获取模块，用于获取目标自然语言处理模型，所述目标自然语言处理模型为基于基础处理模型的实体预测损失值和实体关系预测损失值对所述基础处理模型进行更新得到的模型，所述实体预测损失值基于所述基础处理模型预测的各个实体的相似度确定，所述实体关系预测损失值基于所述基础处理模型预测的各个实体对的关系相似度确定，其中，每个所述实体对包括两个实体；处理模型，用于将所述目标文本输入所述目标自然语言处理模型，得到所述目标自然语言处理模型输出的处理结果。8.一种自然语言处理模型的获取装置，其特征在于，所述装置包括：样本获取模块，用于获取多个第一训练样本和多个第二训练样本，每个所述第一训练样本包括一个实体对，每个所述第二训练样本包括两个实体对，所述实体对包括两个实体；第一输入模型，用于将所述多个第一训练样本输入至基础处理模型，得到所述基础处
理模型的实体预测损失值，所述实体预测损失值基于所述基础处理模型预测的各个所述第一训练样本中两个实体的相似度确定；第二输入模型，用于将所述多个第二训练样本输入至所述基础处理模型，得到所述基础处理模型的实体关系预测损失值，所述实体关系预测损失值基于所述基础处理模型预测的各个所述第二训练样本中两个实体对的关系相似度确定；更新模块，用于基于所述实体预测损失值和所述实体关系预测损失值，更新所述基础处理模型的参数，得到目标自然语言处理模型。9.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1所述的自然语言处理方法，或者实现如权利要求2至6任一所述的自然语言处理模型的获取方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求1所述的自然语言处理方法，或者实现如权利要求2至6任一所述的自然语言处理模型的获取方法。

技术总结
本申请公开了一种自然语言处理方法及其模型的获取方法、装置、存储介质，涉及人工智能技术领域。其中，该方法可以将获取到的目标文本输入至目标自然语言处理模型，以得到自然语言的处理结果。由于该目标自然语言处理模型是基于基础处理模型的实体预测损失值及实体关系预测损失值对基础处理模型更新得到的，因此该目标自然语言处理模型不仅能够较好的了解实体本身，而且能够较好的了解不同实体之间的复杂交互关系，进而采用该目标自然语言处理模型对自然语言处理的结果准确率更高，可靠性更好。好。好。

技术研发人员：秦禹嘉林衍凯高信龙一刘知远李鹏周杰
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：2020.12.28
技术公布日：2021/10/18

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

自然语言处理方法及其模型的获取方法、装置、存储介质与流程

相关文献

最热文献