一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

样本语句的生成方法、装置、设备及存储介质与流程

2021-11-26 23:00:00 来源:中国专利 TAG:

技术特征:
1.一种样本语句的生成方法,其特征在于,所述方法包括:获取用于进行关系识别的种子语句,所述种子语句中包括目标实体和所述目标实体对应的属性条件,所述种子语句用于指示对所述目标实体的属性进行确定;将所述种子语句与语句库进行匹配,得到与所述种子语句符合第一相似度条件的第一候选语句,其中,所述语句库中包括历史搜索语句,所述历史搜索语句为搜索平台在历史时间段内接收到的搜索语句;基于所述第一候选语句生成与所述目标实体和所述属性条件对应的样本语句。2.根据权利要求1所述的方法,其特征在于,所述将所述种子语句与语句库进行匹配,得到与所述种子语句符合第一相似度条件的第一候选语句,包括:将所述种子语句输入语句匹配模型,所述语句匹配模型中包括所述语句库;通过所述语句匹配模型对所述种子语句与所述语句库进行匹配,得到所述第一候选语句。3.根据权利要求2所述的方法,其特征在于,所述通过所述语句匹配模型对所述种子语句与所述语句库进行匹配,得到所述第一候选语句,包括:通过所述语句匹配模型对所述种子语句与所述语句库中的所述历史搜索语句进行相似度分析,得到符合所述第一相似度的所述第一候选语句。4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:对所述目标实体和所述属性条件进行语句预测,生成第二候选语句;所述基于所述第一候选语句生成与所述目标实体和所述属性条件对应的样本语句,包括:基于所述第一候选语句和所述第二候选语句,生成与所述目标实体和所述属性条件对应的样本语句。5.根据权利要求4所述的方法,其特征在于,所述对所述目标实体和所述属性条件进行语句预测,生成第二候选语句,包括:将所述种子语句输入语句生成模型,所述语句生成模型为预先训练得到的用于根据实体和属性关系进行语句生成的模型;通过所述语句生成模型对所述目标实体和所述属性条件进行语句预测,生成所述第二候选语句。6.根据权利要求4所述的方法,其特征在于,所述基于所述第一候选语句和所述第二候选语句生成与所述目标实体和所述属性条件对应的样本语句,包括:将所述第一候选语句与所述种子语句进行相似度分析,从所述第一候选语句中确定符合第二相似度条件的第一样本语句;将所述第二候选语句与所述种子语句进行相似度分析,从所述第二候选语句中确定符合第三相似度条件的第二样本语句;将所述第一样本语句与所述第二样本语句的集合确定为包含所述样本语句的集合。7.根据权利要求4所述的方法,其特征在于,所述种子语句标注有参考属性;所述基于所述第一候选语句和所述第二候选语句生成与所述目标实体和所述属性条件对应的样本语句之后,还包括:对所述样本语句标注所述参考属性;
通过所述样本语句对关系识别模型进行训练,所述关系识别模型用于识别语句中实体的属性条件。8.根据权利要求7所述的方法,其特征在于,所述通过所述样本语句对关系识别模型进行训练,包括:通过所述关系识别模型对所述样本语句进行属性关系识别,得到预测属性;基于所述预测属性与所述参考属性之间的差异,对所述关系识别模型中的模型参数进行调整。9.根据权利要求4所述的方法,其特征在于,所述种子语句标注有参考属性;所述基于所述第一候选语句和所述第二候选语句生成与所述目标实体和所述属性条件对应的样本语句之后,还包括:通过所述样本语句对关系识别模型和所述语句匹配模型进行训练,所述关系识别模型用于识别语句中实体的属性条件。10.根据权利要求9所述的方法,其特征在于,所述关系识别模型中包括第一模型参数,所述语句匹配模型中包括第二模型参数;所述通过所述样本语句对关系识别模型和所述语句匹配模型进行训练,包括:获取所述样本语句中的样本语句对,所述样本语句对中包括第一样本语句和第二样本语句;通过所述关系识别模型对所述第一样本语句进行属性关系识别,得到第一预测属性;通过所述关系识别模型对所述第二样本语句进行属性关系识别,得到第二预测属性;基于所述第一预测属性、所述第二预测属性和所述参考属性之间的差异,对所述第一模型参数和所述第二模型参数进行调整。11.根据权利要求10所述的方法,其特征在于,所述基于所述第一预测属性、所述第二预测属性和所述参考属性之间的差异,对所述第一模型参数和所述第二模型参数进行调整,包括:确定所述第一预测属性与所述参考属性之间的第一差异;确定所述第二预测属性与所述参考属性之间的第二差异;确定所述第一预测属性与所述第二预测属性之间的第三差异;基于所述第一差异、所述第二差异和所述第三差异确定损失差异;基于所述损失差异对所述第一模型参数和所述第二模型参数进行调整。12.一种样本语句的生成装置,其特征在于,所述装置包括:获取模块,用于获取用于进行关系识别的种子语句,所述种子语句中包括目标实体和所述目标实体对应的属性条件,所述种子语句用于指示对所述目标实体的属性进行确定;匹配模块,用于将所述种子语句与语句库进行匹配,得到与所述种子语句符合第一相似度条件的第一候选语句,其中,所述语句库中包括历史搜索语句,所述历史搜索语句为搜索平台在历史时间段内接收到的搜索语句;生成模块,用于基于所述第一候选语句生成与所述目标实体和所述属性条件对应的样本语句,所述样本语句用于进行关系识别的训练。13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一
段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的样本语句的生成方法。14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至11任一所述的样本语句的生成方法。

技术总结
本申请公开了一种样本语句的生成方法、装置、设备及存储介质,涉及机器学习领域。该方法包括:获取用于进行关系识别的种子语句;将种子语句与语句库进行匹配,得到与种子语句符合第一相似度条件的第一候选语句;对目标实体和属性条件进行语句预测,生成第二候选语句;基于第一候选语句和第二候选语句生成样本语句。样本语句并非采用人工标注方式生成,而是通过提供种子语句,在种子语句的基础上,从语句库中匹配出第一候选语句,并通过自动生成方式生成第二候选语句,从而在第一候选语句和第二候选语句的基础上得到自动生成的样本语句,将样本语句的生成过程自动化,提高了样本语句的生成效率,从而间接提高了关系识别的训练效率和准确率。准确率。准确率。


技术研发人员:杨韬
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.04.14
技术公布日:2021/11/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献