一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

医疗标题匹配方法、装置、设备及存储介质与流程

2021-10-29 19:59:00 来源:中国专利 TAG:匹配 装置 医疗 标题 方法

技术特征:
1.一种医疗标题匹配方法,其特征在于,包括:获得医疗搜索语句;针对待匹配的多个医疗标题中每个医疗标题,确定所述医疗标题的标题向量;确定所述医疗搜索语句的语句向量;针对每个医疗标题,基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,确定所述医疗标题与所述医疗搜索语句的特征相似度;针对每个医疗标题,基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,并利用意图识别模型确定所述医疗标题与所述医疗搜索语句的意图匹配结果,所述意图匹配结果用于表征所述医疗标题与所述医疗搜索语句之间的医疗意图是否相同,所述意图识别模型为依据多个第一样本对各自标注的意图匹配结果,并利用各第一样本对内的医疗标题样本和医疗搜索语句样本各自的向量训练得到;结合各医疗标题与所述医疗搜索语句的特征相似度和意图匹配结果,确定所述多个医疗标题的匹配度排序。2.根据权利要求1所述的方法,其特征在于,在所述确定所述医疗标题与所述医疗搜索语句的特征相似度之前,还包括:确定所述医疗搜索语句的语句向量与所述医疗标题的标题向量之间的向量差,得到差值向量;所述基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,确定所述医疗标题与所述医疗搜索语句的特征相似度,包括:基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,确定所述医疗标题与所述医疗搜索语句的特征相似度。3.根据权利要求2所述的方法,其特征在于,所述基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,确定所述医疗标题与所述医疗搜索语句的特征相似度,包括:基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,并利用相似度识别模型确定所述医疗标题与所述医疗搜索语句的特征相似度;其中,所述相似度识别模型为依据多个第二样本对各自标注的特征相似度,并利用所述第二样本对内的医疗标题样本和医疗搜索语句样本各自对应的向量,以及所述医疗标题样本与所述医疗搜索语句样本各自的向量之间的差值向量训练得到。4.根据权利要求3所述的方法,其特征在于,在确定所述医疗标题与所述医疗搜索语句的特征相似度和意图匹配结果之前,还包括:通过向量降维模型对所述医疗搜索语句的语句向量进行降维,所述向量降维模型为在训练所述相似度识别模型的过程中,利用所述第二样本对中医疗标题样本的标题向量以及医疗搜索语句样本的语句向量训练得到的;通过所述向量降维模型对所述医疗标题的标题向量进行降维;所述确定所述医疗搜索语句的语句向量与所述医疗标题的标题向量之间的向量差,得到差值向量,包括:确定降维后所述医疗搜索语句的语句向量与降维后所述医疗标题的标题向量之间的向量差,得到差值向量。
5.根据权利要求1所述的方法,其特征在于,所述确定所述医疗标题的标题向量,包括:利用向量转换模型确定所述医疗标题的标题向量;所述确定所述医疗搜索语句的语句向量,包括:利用所述向量转换模型确定所述医疗搜索语句的语句向量;其中,所述向量转换模型为基于变换器的双向编码表征bert模型,且所述向量转换模型为利用多份医疗语料样本对应的已掩码词序列,并以预测出所述已掩码词序列中被掩码处理的词为训练目标,训练得到的;所述医疗语料样本由医疗标题样本以及医疗标题样本表示的医疗文本内容构成,且所述已掩码词序列为对所述医疗语料样本中包含至少一个词进行掩码处理后得到的词序列。6.一种医疗标题匹配装置,其特征在于,包括:语句获得单元,用于获得医疗搜索语句;第一向量确定单元,用于针对待匹配的多个医疗标题中每个医疗标题,确定所述医疗标题的标题向量;第二向量确定单元,用于确定所述医疗搜索语句的语句向量;特征确定单元,用于针对每个医疗标题,基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,确定所述医疗标题与所述医疗搜索语句的特征相似度;意图确定单元,用于针对每个医疗标题,基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,并利用意图识别模型确定所述医疗标题与所述医疗搜索语句的意图匹配结果,所述意图匹配结果用于表征所述医疗标题与所述医疗搜索语句之间的医疗意图是否相同,所述意图识别模型为依据多个第一样本对各自标注的意图匹配结果,并利用各第一样本对内的医疗标题样本和医疗搜索语句样本各自的向量训练得到;匹配确定单元,用于结合各医疗标题与所述医疗搜索语句的特征相似度和意图匹配结果,确定所述多个医疗标题的匹配度排序。7.根据权利要求6所述的装置,其特征在于,还包括:差值确定单元,用于在所述特征确定单元确定所述医疗标题与所述医疗搜索语句的特征相似度之前,确定所述医疗搜索语句的语句向量与所述医疗标题的标题向量之间的向量差,得到差值向量;所述特征确定单元,具体为,用于基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,确定所述医疗标题与所述医疗搜索语句的特征相似度。8.根据权利要求7所述的装置,其特征在于,所述特征确定单元,包括:特征确定子单元,用于基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,并利用相似度识别模型确定所述医疗标题与所述医疗搜索语句的特征相似度;其中,所述相似度识别模型为依据多个第二样本对各自标注的特征相似度,并利用所述第二样本对内的医疗标题样本和医疗搜索语句样本各自对应的向量,以及所述医疗标题样本与所述医疗搜索语句样本各自的向量之间的差值向量训练得到。9.一种服务器,其特征在于,包括存储器和处理器;其中,所述存储器用于存储程序;所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如权利要求1至5任
意一项所述的医疗标题匹配方法。10.一种存储介质,其特征在于,用于存储程序,所述程序被执行时,用于实现如权利要求1至5任意一项所述的医疗标题匹配方法。

技术总结
本申请提供了一种医疗标题匹配方法、装置、设备及存储介质,本申请的方案涉及到人工智能技术的应用,该方案在获得医疗搜索语句之后,针对每个医疗标题,不仅会结合医疗标题的标题向量以及医疗搜索语句的语句向量,确定医疗标题与该医疗搜索语句在语义上的特征相似度,还会确定医疗标题与医疗搜索语句之间的医疗意图是否相同。在此基础上,结合医疗标题与医疗搜索语句在语义上的特征相似度以及医疗意图上的意图匹配结果,可以更为全面分析医疗标题与医疗搜索语句之间的匹配程度,从而有利于更为准确的从多个医疗标题中确定出与该医疗搜索语句更匹配的医疗标题,进而可以基于医疗搜索语句,更为准确的搜索出医疗标题指向的医疗文本内容。医疗文本内容。医疗文本内容。


技术研发人员:康战辉
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.01.14
技术公布日:2021/10/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜