一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本处理方法、装置、电子设备及计算机可读存储介质与流程

2021-12-17 19:02:00 来源:中国专利 TAG:

技术特征:
1.一种文本处理方法,其特征在于,包括:获得具有关联关系的第一文本和第二文本;获得第一文本的语义向量序列以及第二文本的语义向量序列;对所述第一文本的语义向量序列和所述第二文本的语义向量序列进行交互计算和信息聚合,得到所述第一文本和所述第二文本的关联点。2.根据权利要求1所述的方法,其特征在于,所述对所述第一文本的语义向量序列和所述第二文本的语义向量序列进行交互计算,包括:将所述第一文本的语义向量序列和所述第二文本的语义向量序列进行拼接,得到拼接向量;计算所述拼接向量的语义向量序列。3.根据权利要求2所述的方法,其特征在于,所述对所述第一文本的语义向量序列和所述第二文本的语义向量序列进行信息聚合,包括:根据所述拼接向量的语义向量序列得到聚合向量;根据所述聚合向量得到与多个候选关联点相对应的概率分布;根据所述多个候选关联点相对应的概率分布,得到所述第一文本和所述第二文本的关联点。4.根据权利要求3所述的方法,其特征在于,所述根据所述聚合向量得到与多个候选关联点相对应的概率分布,包括:将所述聚合向量输入系统模型的全连接层并经过激活函数作用,得到与多个候选关联点相对应的概率分布。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:对所述系统模型进行预训练;所述预训练包括以下任务的一项或多项:预测两个文本片段是否为连续文本、预测文本中被遮蔽的部分内容、预测对文本执行的操作。6.根据权利要求5所述的方法,其特征在于,所述预测两个文本片段是否为连续文本包括:从第三文本中获得连续的第一片段和第二片段;从所述第三文本中随机选择第三片段;使用所述第三片段替换所述第一片段或所述第二片段;预测所述第三片段与所述第二片段,或者所述第一片段与所述第三片段是否为连续文本。7.根据权利要求5所述的方法,其特征在于,所述预测文本中被遮蔽的部分内容,包括:在所述第一文本和/或所述第二文本中随机选择任意文本片段;以预设的掩码方式处理所述任意文本片段;对处理后的任意文本片段中被遮蔽的部分内容进行预测。8.根据权利要求6所述的方法,其特征在于,所述预测对文本执行的操作包括:在所述第一片段和所述第二片段组成的文本,和/或,所述第一片段和所述第三片段组成的文本,和/或,所述第三片段和所述第二片段组成的文本中,选择任意词进行特定操作;对所述特定操作进行预测,所述特定操作包括删除、替换、无操作。
9.一种文本处理装置,其特征在于,包括:第五获取模块,被配置为获得具有关联关系的第一文本和第二文本;第六获取模块,被配置为获得第一文本的语义向量序列以及第二文本的语义向量序列;第七获取模块,被配置为对所述第一文本的语义向量序列和所述第二文本的语义向量序列进行交互计算和信息聚合,得到所述第一文本和所述第二文本的关联点。10.一种电子设备,其特征在于,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现权利要求1-8任一项所述的方法步骤。11.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-8任一项所述的方法步骤。

技术总结
本公开实施例公开了一种文本处理方法、装置、电子设备及计算机可读存储介质,所述文本处理方法包括一种文本处理方法,其特征在于,包括:获得具有关联关系的第一文本和第二文本;获得第一文本的语义向量序列以及第二文本的语义向量序列;对所述第一文本的语义向量序列和所述第二文本的语义向量序列进行交互计算和信息聚合,得到所述第一文本和所述第二文本的关联点,从而可以提高获取的关联点的准确度。度。度。


技术研发人员:王天祎 王剑 张雅婷 周鑫
受保护的技术使用者:阿里巴巴集团控股有限公司
技术研发日:2020.06.11
技术公布日:2021/12/16
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献