一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于贝叶斯的数据匹配方法、装置、设备及可读存储介质与流程

2021-12-14 23:32:00 来源:中国专利 TAG:

技术特征:
1.一种基于贝叶斯的数据匹配方法,其特征在于,包括:根据数据来源,将历史样本数据拆分为目标数据和待匹配数据,所述目标数据的数据来源指示所述目标数据来自于同一目标机构,所述待匹配数据的数据来源指示所述待匹配数据来自于与所述目标机构不同的多个其他机构;对所述目标数据和样本训练数据进行模型训练,得到数据匹配模型,所述样本训练数据是按照第一拆分比例在所述待匹配数据中提取得到的;将所述待匹配数据输入数据匹配模型,计算所述待匹配数据与目标数据之间的数据相似度和数据方差;查询预设相似度阈值和预设方差阈值,基于所述预设相似度阈值和所述预设方差阈值,在所述待匹配数据中确定目标匹配数据,将所述目标匹配数据输出,所述目标匹配数据的数据相似度大于等于所述预设相似度阈值且数据方差小于等于所述预设方差阈值。2.根据权利要求1所述的方法,其特征在于,所述根据数据来源,将历史样本数据拆分为目标数据和待匹配数据,包括:采集所述历史样本数据,查询所述历史样本数据的所述数据来源;按照所述数据来源,将所述数据来源指示所述历史样本数据为同一所述目标机构的所述历史样本数据,划分为所述目标数据;将所述数据来源指示所述待匹配数据来自于与所述目标机构不同的多个其他机构的所述历史样本数据,划分为所述待匹配数据。3.根据权利要求1所述的方法,其特征在于,所述对所述目标数据和样本训练数据进行模型训练,得到数据匹配模型,包括:按照第一预设拆分比例,对所述待匹配数据进行拆分,得到样本训练数据;对所述目标数据添加正样本标签,对所述样本训练数据添加负样本标签,将添加标签后的所述目标数据和所述样本训练数据作为训练数据集;按照第二预设拆分比例,将所述训练数据集进行拆分,得到模型训练集和模型验证集;基于贝叶斯估计功能,提取所述模型训练集的样本特征,按照所述样本特征,构建所述数据匹配模型。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于贝叶斯估计功能,提取所述模型验证集的所述样本特征,按照所述样本特征构建验证模型;将所述验证模型与所述数据匹配模型进行比对,确定所述验证模型与所述数据匹配模型之间的模型偏差量;运用自适应矩估计算法,按照所述模型偏差量指示的偏差特征,对所述样本特征的网络权重进行调整并重新训练所述数据匹配模型,直至所述验证模型和所述数据匹配模型之间的所述模型偏差量小于偏差量阈值。5.根据权利要求1所述的方法,其特征在于,所述将所述待匹配数据输入数据匹配模型,计算所述待匹配数据与目标数据之间的数据相似度和数据方差,包括:将所述待匹配数据输入至所述数据匹配模型,获取数据匹配预测值;统计所述待匹配数据的输入次数,当所述输入次数等于预设输入次数阈值时,停止数据输入,获取多个所述数据匹配预测值;
计算多个所述数据匹配预测值的均值,将所述均值作为所述待匹配数据与所述目标数据之间的数据相似度;计算多个所述数据匹配预测值的方差,将所述方差作为所述待匹配数据与所述目标数据之间的数据方差。6.根据权利要求1所述的方法,其特征在于,所述基于所述预设相似度阈值和所述预设方差阈值,在所述待匹配数据中确定目标匹配数据,包括:将所述待匹配数据对应的所述数据相似度与所述预设相似度阈值进行比对;如果所述待匹配数据对应的所述数据相似度小于所述预设相似度阈值,则将所述待匹配数据删除;如果所述待匹配数据对应的所述数据相似度大于等于所述预设相似度阈值,则提取所述待匹配数据;将所述待匹配数据对应的所述方差与所述预设方差阈值进行比对,生成比对结果,基于所述比对结果,在所述待匹配数据中确定目标匹配数据。7.根据权利要求6所述的方法,其特征在于,所述将所述待匹配数据对应的所述方差与所述预设方差阈值进行比对,生成比对结果,基于所述比对结果,在所述待匹配数据中确定目标匹配数据,包括:若所述待检测数据对应的数据方差大于所述预设方差阈值,则将所述待检测数据进行删除;若所述待检测数据对应的数据方差小于等于所述预设方差阈值,则将所述待检测数据作为所述目标匹配数据进行输出。8.一种基于贝叶斯的数据匹配装置,其特征在于,包括:拆分模块,用于根据数据来源,将历史样本数据拆分为目标数据和待匹配数据,所述目标数据的数据来源指示所述目标数据来自于同一目标机构,所述待匹配数据的数据来源指示所述待匹配数据来自于与所述目标机构不同的多个其他机构;训练模块,用于对所述目标数据和样本训练数据进行模型训练,得到数据匹配模型,所述样本训练数据是按照第一拆分比例在所述待匹配数据中提取得到的;计算模块,用于将所述待匹配数据输入数据匹配模型,计算所述待匹配数据与目标数据之间的数据相似度和数据方差;确定模块,用于查询预设相似度阈值和预设方差阈值,基于所述预设相似度阈值和所述预设方差阈值,在所述待匹配数据中确定目标匹配数据,将所述目标匹配数据输出,所述目标匹配数据的数据相似度大于等于所述预设相似度阈值且数据方差小于等于所述预设方差阈值。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

技术总结
本申请公开了一种基于贝叶斯的数据匹配方法、装置、设备及存储介质,涉及人工智能及智慧医疗技术领域,基于贝叶斯估计建立数据匹配模型,提取与目标数据相似的待匹配数据,有效去排除混淆因素带来的影响,提高分析准确率。所述方法包括:根据数据来源,将历史样本数据拆分为目标数据和待匹配数据;对目标数据和样本训练数据进行模型训练,得到数据匹配模型;将待匹配数据输入数据匹配模型,计算待匹配数据与目标数据之间的数据相似度和数据方差;查询预设相似度阈值和预设方差阈值,基于预设相似度阈值和预设方差阈值,在待匹配数据中确定数据相似度大于等于预设相似度阈值且数据方差小于等于预设方差阈值的目标匹配数据,将目标匹配数据输出。标匹配数据输出。标匹配数据输出。


技术研发人员:孙瑜尧 李响 李晓宇
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2021.09.16
技术公布日:2021/12/13
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献