一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本相似度的确定方法、装置、存储介质及电子装置与流程

2022-07-13 20:57:48 来源:中国专利 TAG:

技术特征:
1.一种文本相似度的确定方法,其特征在于,包括:将获取的目标文本输入至第一目标模型,得到所述第一目标模型输出的所述目标文本的目标向量;基于所述目标向量从预设数据库中获取n个向量,其中,所述n是大于或等于1的自然数;利用所述n个向量和所述目标向量,确定所述n个向量中每个向量对应的文本与所述目标文本之间的相似度。2.根据权利要求1所述的方法,其特征在于,将获取的目标文本输入至第一目标模型,得到所述第一目标模型输出的所述目标文本的目标向量,包括:通过所述第一目标模型中的多头注意力网络提取所述目标文本的特征变量;利用所述第一目标模型中的嵌入层embedding将所述特征变量转化为特征向量,得到所述目标文本的目标向量。3.根据权利要求1或2所述的方法,其特征在于,基于所述目标向量从预设数据库中获取n个向量,包括:确定所述目标向量存储至所述预设数据库中的向量索引;计算所述目标向量的向量索引与所述预设数据库中每个向量的向量索引之间的距离,确定m个距离,其中,所述m是大于或等于所述n的自然数;将所述m个距离中大于预设阈值的距离所对应的向量,确定为所述n个向量。4.根据权利要求1-3任一项所述的方法,其特征在于,利用所述n个向量和所述目标向量,确定所述n个向量中每个向量对应的文本与所述目标文本之间的相似度,包括:确定所述n个向量中每个向量对应的文本,确定n个文本;将所述目标文本和所述n个文本输入至第二目标模型,得到所述第二目标模型输出的所述每个向量对应的文本与所述目标文本之间的相似结果。5.根据权利要求4所述的方法,其特征在于,将所述目标文本和所述n个文本输入至第二目标模型,得到所述第二目标模型输出的所述每个向量对应的文本与所述目标文本之间的相似结果,包括:将所述目标文本和所述n个文本输入至所述第二目标模型中的实体结构中,得到所述目标文本的目标嵌入向量和所述n个文本的n个嵌入向量;计算所述目标嵌入向量和所述n个嵌入向量中每个嵌入向量之间的差值;将所述目标嵌入向量、所述每个嵌入向量,以及所述目标嵌入向量和所述每个嵌入向量之间的差值进行拼接,确定n个拼接向量;基于所述n个拼接向量输出所述相似结果。6.根据权利要求5所述的方法,其特征在于,基于所述n个拼接向量输出所述相似结果,包括:将每个拼接向量输入至所述第二目标模型中的全连接层,得到所述全连接层输出的对所述每个拼接向量进行二分类的概率值;将所述概率值与第二预设阈值进行比较;利用比较结果输出所述相似结果。7.根据权利要求1-6任一项所述的方法,其特征在于,基于所述目标向量从预设数据库
中获取n个向量之前,所述方法还包括:通过所述第一目标模型中的多头注意力网络提取m个文本的特征变量,其中,所述m是大于或等于所述n的自然数;利用所述第一目标模型中的嵌入层将所述m个文本的特征变量转化为特征向量,得到m个向量;按照所述m个文本的索引和向量化表征,将所述m个向量存储至所述预设数据库中。8.一种文本相似度的确定装置,其特征在于,包括:第一输入模块,用于将获取的目标文本输入至第一目标模型,得到所述第一目标模型输出的所述目标文本的目标向量;第一获取模块,用于基于所述目标向量从预设数据库中获取n个向量,其中,所述n是大于或等于1的自然数;第一确定模块,用于利用所述n个向量和所述目标向量,确定所述n个向量中每个向量对应的文本与所述目标文本之间的相似度。9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7中任一项所述的方法。10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。

技术总结
本申请公开了一种文本相似度的确定方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:将获取的目标文本输入至第一目标模型,得到第一目标模型输出的目标文本的目标向量;基于目标向量从预设数据库中获取N个向量,其中,N是大于或等于1的自然数;利用N个向量和目标向量,确定N个向量中每个向量对应的文本与目标文本之间的相似度。应的文本与目标文本之间的相似度。应的文本与目标文本之间的相似度。


技术研发人员:刘建国 王迪 李昱涧
受保护的技术使用者:海尔智家股份有限公司
技术研发日:2022.03.25
技术公布日:2022/7/12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献