一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

医疗数据集成方法、装置、电子设备及存储介质与流程

2022-02-20 07:13:47 来源:中国专利 TAG:

技术特征:
1.一种医疗数据集成方法,其特征在于,所述方法包括:获取标准医疗数据集,识别所述标准医疗数据集中每个医疗数据的医疗类型,将具有相同医疗类型的医疗数据进行聚类,生成一个或多个聚类中心点,并将所述聚类中心点中每个数据转换成数据库对象;根据所述数据库对象,构建所述聚类中心点的医疗数据表,并根据所述医疗数据表,生成所述标准医疗数据集的医疗数据库;获取至少两个业务数据源,利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征;从所述医疗数据库中选取每个所述数据语义特征的数据表;将每个所述业务数据源加载至所述数据表中,以生成每个所述业务数据源的业务数据表,根据所述业务数据表,执行所述至少两个业务数据源的数据集成。2.如权利要求1所述的医疗数据集成方法,其特征在于,所述识别所述标准医疗数据集中每个医疗数据的医疗类型,包括:获取所述标准医疗数据集中每个医疗数据的医疗属性,根据所述医疗属性,识别所述医疗数据的医疗类型。3.如权利要求2所述的医疗数据集成方法,其特征在于,所述将具有相同医疗类型的医疗数据进行聚类,包括:利用下述公式将具有相同医疗类型的医疗数据进行聚类:其中,e表示聚类中心点,k表示聚类中心点的数量,c表示聚类中心点的数据数量,x
t
表示聚类中心点中第t条数据,μ
i
表示第i个聚类中心点的簇心质量。4.如权利要求1所述的医疗数据集成方法,其特征在于,所述将所述聚类中心点中每个数据转换成数据库对象,包括:识别所述聚类中心点中每个数据的数据特征;将所述数据特征转换为数据库字段,以生成所述数据的数据库对象。5.如权利要求1所述的医疗数据集成方法,其特征在于,所述根据所述数据库对象,构建所述聚类中心点的医疗数据表,包括:获取所述数据库对象的对象字段,及确定所述数据库对象的数据标识,并定义所述数据库对象的序列位置;根据所述数据标识、所述对象字段以及所述序列位置,利用数据库定义语言创建所述聚类中心点的医疗数据表。6.如权利要求1所述的医疗数据集成方法,其特征在于,所述利用预训练好的语义分析模型识别每个所述业务数据源的数据语义特征之前,还包括:获取训练语料,利用预构建语义分析模型中的编码器对所述训练语料进行位置向量编码,得到编码向量语料;利用所述预构建语义分析模型中的掩码层对所述编码向量语料进行掩码,得到掩码向量语料;
利用所述预构建语义分析模型中的解码器对所述编码向量语料进行序列解码,得到所述训练语料的预测语义特征;利用所述向量生成机制中的损失函数计算所述预测语义特征和其对应的真实语义特征的训练损失;若所述训练损失大于预设损失,则重新调整所述预构建语义分析模型的参数,并返回执行所述利用预构建语义分析模型中的编码器对所述训练语料进行位置向量编码的步骤;若所述训练损失不大于所述预设损失,得到训练好的语义分析模型。7.如权利要求1所述的医疗数据集成方法,其特征在于,所述从所述医疗数据库中选取每个所述数据语义特征的数据表,包括:计算每个所述数据语义特征与所述医疗数据库中医疗数据表的匹配度;选取所述匹配度大于预设阈值的医疗数据表作为所述数据语义特征的数据表。8.一种医疗数据集成装置,其特征在于,所述装置包括:数据库对象生成模块,用于获取标准医疗数据集,识别所述标准医疗数据集中每个医疗数据的医疗类型,将具有相同医疗类型的医疗数据进行聚类,生成一个或多个聚类中心点,并将所述聚类中心点中每个数据转换成数据库对象;医疗数据库生成模块,用于根据所述数据库对象,构建所述聚类中心点的医疗数据表,并根据所述医疗数据表,生成所述标准医疗数据集的医疗数据库;语义特征识别模块,用于获取至少两个业务数据源,利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征;数据表选取模块,用于从所述医疗数据库中选取每个所述数据语义特征的数据表;数据源集成模块,用于将每个所述业务数据源加载至所述数据表中,以生成每个所述业务数据源的业务数据表,根据所述业务数据表,执行所述至少两个业务数据源的数据集成。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的医疗数据集成方法。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的医疗数据集成方法。

技术总结
本发明涉及数据处理领域,揭露一种医疗数据集成方法,包括:识别标准医疗数据集中每个医疗数据的医疗类型,将具有相同医疗类型的医疗数据进行聚类,生成一个或多个聚类中心点,将聚类中心点中每个数据转换成数据库对象,以构建聚类中心点的医疗数据表,根据医疗数据表,生成标准医疗数据集的医疗数据库;利用语义分析模型识别至少两个业务数据源的数据语义特征;从医疗数据库中选取每个数据语义特征的数据表;将每个业务数据源加载至所述数据表中,以生成每个业务数据源的业务数据表,根据业务数据表,执行至少两个业务数据源的数据集成。此外,本发明还涉及区块链技术,所述数据语义特征可存储区块链。本发明可以提高医疗数据集成的效率。集成的效率。集成的效率。


技术研发人员:刘建平
受保护的技术使用者:平安国际智慧城市科技股份有限公司
技术研发日:2021.10.11
技术公布日:2022/1/11
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献