医疗数据集成方法、装置、电子设备及存储介质与流程

2022-02-20 07:13:47 来源：中国专利 TAG：

1.本发明涉及数据处理领域，尤其涉及一种医疗数据集成方法、装置、电子设备及计算机可读存储介质。

背景技术：

2.随着医疗科技的不断发展，医疗数据也逐步趋向标准化，如通过国家卫健委制定包括电子病历、妇女保健、疾病管理、疾病控制、卫生管理等各方面标准数据，目前，医疗数据通常是基于医疗行业各个业务系统产生，伴随着医疗数据的监管和服务提升，需要将更多的各种渠道医疗数据进行融合，在融合过程中，由于各个业务系统在建设过程，通常是根据系统功能需求设计医疗数据库，导致不同业务系统设计的医疗数据库结构千差万别，从而会在融合多渠道医疗数据时出现结构标准不统一的问题，这样就需要花费大量的人力做医疗数据的结构标准化工作，进而会影响医疗数据集成的效率。

技术实现要素：

3.本发明提供一种医疗数据集成方法、装置、电子设备及计算机可读存储介质，其主要目的在于提高医疗数据集成的效率。
4.为实现上述目的，本发明提供的一种医疗数据集成方法，包括：
5.获取标准医疗数据集，识别所述标准医疗数据集中每个医疗数据的医疗类型，将具有相同医疗类型的医疗数据进行聚类，生成一个或多个聚类中心点，并将所述聚类中心点中每个数据转换成数据库对象；
6.根据所述数据库对象，构建所述聚类中心点的医疗数据表，并根据所述医疗数据表，生成所述标准医疗数据集的医疗数据库；
7.获取至少两个业务数据源，利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征；
8.从所述医疗数据库中选取每个所述数据语义特征的数据表；
9.将每个所述业务数据源加载至所述数据表中，以生成每个所述业务数据源的业务数据表，根据所述业务数据表，执行所述至少两个业务数据源的数据集成。
10.可选地，所述识别所述标准医疗数据集中每个医疗数据的医疗类型，包括：
11.获取所述标准医疗数据集中每个医疗数据的医疗属性，根据所述医疗属性，识别所述医疗数据的医疗类型。
12.可选地，所述将具有相同医疗类型的医疗数据进行聚类，包括：
13.利用下述公式将具有相同医疗类型的医疗数据进行聚类：
[0014][0015]
其中，e表示聚类中心点，k表示聚类中心点的数量，c表示聚类中心点的数据数量，
x
t
表示聚类中心点中第t条数据，μi表示第i个聚类中心点的簇心质量。
[0016]
可选地，所述将所述聚类中心点中每个数据转换成数据库对象，包括：
[0017]
识别所述聚类中心点中每个数据的数据特征；
[0018]
将所述数据特征转换为数据库字段，以生成所述数据的数据库对象。
[0019]
可选地，所述根据所述数据库对象，构建所述聚类中心点的医疗数据表，包括：
[0020]
获取所述数据库对象的对象字段，及确定所述数据库对象的数据标识，并定义所述数据库对象的序列位置；
[0021]
根据所述数据标识、所述对象字段以及所述序列位置，利用数据库定义语言创建所述聚类中心点的医疗数据表。
[0022]
可选地，所述利用预训练好的语义分析模型识别每个所述业务数据源的数据语义特征之前，还包括：
[0023]
获取训练语料，利用预构建语义分析模型中的编码器对所述训练语料进行位置向量编码，得到编码向量语料；
[0024]
利用所述预构建语义分析模型中的掩码层对所述编码向量语料进行掩码，得到掩码向量语料；
[0025]
利用所述预构建语义分析模型中的解码器对所述编码向量语料进行序列解码，得到所述训练语料的预测语义特征；
[0026]
利用所述向量生成机制中的损失函数计算所述预测语义特征和其对应的真实语义特征的训练损失；
[0027]
若所述训练损失大于预设损失，则重新调整所述预构建语义分析模型的参数，并返回执行所述利用预构建语义分析模型中的编码器对所述训练语料进行位置向量编码的步骤；
[0028]
若所述训练损失不大于所述预设损失，得到训练好的语义分析模型。
[0029]
可选地，所述从所述医疗数据库中选取每个所述数据语义特征的数据表，包括：
[0030]
计算每个所述数据语义特征与所述医疗数据库中医疗数据表的匹配度；
[0031]
选取所述匹配度大于预设阈值的医疗数据表作为所述数据语义特征的数据表。
[0032]
为了解决上述问题，本发明还提供一种医疗数据集成装置，所述装置包括：
[0033]
数据库对象生成模块，用于获取标准医疗数据集，识别所述标准医疗数据集中每个医疗数据的医疗类型，将具有相同医疗类型的医疗数据进行聚类，生成一个或多个聚类中心点，并将所述聚类中心点中每个数据转换成数据库对象；
[0034]
医疗数据库生成模块，用于根据所述数据库对象，构建所述聚类中心点的医疗数据表，并根据所述医疗数据表，生成所述标准医疗数据集的医疗数据库；
[0035]
语义特征识别模块，用于获取至少两个业务数据源，利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征；
[0036]
数据表选取模块，用于从所述医疗数据库中选取每个所述数据语义特征的数据表；
[0037]
数据源集成模块，用于将每个所述业务数据源加载至所述数据表中，以生成每个所述业务数据源的业务数据表，根据所述业务数据表，执行所述至少两个业务数据源的数据集成。
[0038]
为了解决上述问题，本发明还提供一种电子设备，所述电子设备包括：
[0039]
至少一个处理器；以及，
[0040]
与所述至少一个处理器通信连接的存储器；其中，
[0041]
所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以实现上述所述的医疗数据集成方法。
[0042]
为了解决上述问题，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个计算机程序，所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的医疗数据集成方法。
[0043]
可以看出，相较于现有技术中通过根据系统功能需求设计医疗数据库，导致不同业务系统设计的医疗数据库结构千差万别，影响医疗数据集成的效率的现象，本发明实施例通过标准医疗数据，确定医疗数据在数据库存储的标准结构形式，保障业务系统产生的业务数据源可以按照标准医疗数据构建的数据库存储形式进行数据存储，使得业务数据源的存储形式具有标准化和统一化，以使业务系统的数据在汇总融合阶段，可以减少不同系统间的壁垒，缩短数据集成周期，降低数据集成的难度，提高数据集成的效率。因此，本发明实施例提出的一种医疗数据集成方法、装置、电子设备及计算机可读存储介质可以提高医疗数据集成的效率。
附图说明
[0044]
图1为本发明一实施例提供的医疗数据集成方法的流程示意图；
[0045]
图2为本发明一实施例提供的医疗数据集成装置的模块示意图；
[0046]
图3为本发明一实施例提供的实现医疗数据集成方法的电子设备的内部结构示意图；
[0047]
本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。
具体实施方式
[0048]
应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
[0049]
本技术实施例提供一种医疗数据集成方法。所述医疗数据集成方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之，所述医疗数据集成方法可以由安装在终端设备或服务端设备的软件或硬件来执行，所述软件可以是区块链平台。所述服务端包括但不限于：单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0050]
参照图1所示，为本发明一实施例提供的医疗数据集成方法的流程示意图。在本发明实施例中，所述医疗数据集成方法包括：
[0051]
s1、获取标准医疗数据集，识别所述标准医疗数据集中每个医疗数据的医疗类型，将具有相同医疗类型的医疗数据进行聚类，生成一个或多个聚类中心点，并将所述聚类中心点中每个数据转换成数据库对象。
[0052]
本发明实施例中，所述标准医疗数据集是指根据国家标准制定的医疗数据集合，常见的如门诊部、住院部、护理部、院长、内科医师、主任医师、望诊、听诊、病理切片以及活组织检查等专业医疗词语。可选的，本发明实施例中，所述标准医疗数据集可以通过从专业网站下载得到。
[0053]
进一步地，本发明实施例通过识别所述标准医疗数据集中每个医疗数据的医疗类型，以获取所述标准医疗数据集中每个医疗数据的数据属性，保障后续医疗数据聚类的前提。作为本发明的一个实施例，所述识别所述标准医疗数据集中每个医疗数据的医疗类型，包括：获取所述标准医疗数据集中每个医疗数据的医疗属性，根据所述医疗属性，识别所述医疗数据的医疗类型。其中，所述医疗属性可以理解为用于表征所述医疗数据的身份信息的数据，如所述医疗数据为门诊部、住院部，则该医疗数据的医疗属性可以为医疗位置，则其医疗类型可以为医院部门。
[0054]
进一步地，本发明实施例通过将具有相同医疗类型的医疗数据进行聚类，以实现后续医疗数据的快速查询和处理，可选的，利用下述公式将具有相同医疗类型的医疗数据进行聚类：
[0055][0056]
其中，e表示聚类中心点，k表示聚类中心点的数量，c表示聚类中心点的数据数量，x
t
表示聚类中心点中第t条数据，μi表示第i个聚类中心点的簇心质量。
[0057]
进一步地，本发明实施例将所述聚类中心点中每个数据转换成数据库对象，以作为后续不同业务系统产生的医疗数据存储的标准，实现不同业务系统的数据存储结构的标准化。
[0058]
作为本发明的一个实施例，所述将所述聚类中心点中每个数据转换成数据库对象，包括：识别所述聚类中心点中每个数据的数据特征，将所述数据特征转换为数据库字段，以生成所述数据的数据库对象。其中，所述数据特征可以理解为用于表征所述聚类中心点中每个数据的医疗信息，所述数据库字段可以理解为所述数据特征在数据库中的数据结构形式。可选的，本发明实施例中，所述数据特征可以基于所述聚类中心点中每个数据的信息描述进行确定，所述数据库字段可以通过数据库编写语言实现，如sql语言。
[0059]
s2、根据所述数据库对象，构建所述聚类中心点的医疗数据表，并根据所述医疗数据表，生成所述标准医疗数据集的医疗数据库。
[0060]
本发明实施例通过所述数据库对象，构建所述聚类中心点的医疗数据表，以确定所述聚类中心点中每个数据在数据库存储时的数据结构，方便后续数据的快速查询，作为本发明的一个实施例，所述根据所述数据库对象，构建所述聚类中心点的医疗数据表，包括：获取所述数据库对象的对象字段，及确定所述数据库对象的数据标识，并定义所述数据库对象的序列位置，根据所述数据标识、所述对象字段以及所述序列位置，利用数据库定义语言创建所述聚类中心点的医疗数据表。
[0061]
其中，所述对象字段用于表征所述数据库对象在后续医疗数据表中的表现形式，如数据库对象为姓名，则其对象字段可以为name，所述数据标识用于表征后续医疗数据表中的唯一表信息，以实现医疗数据表的快速查找，所述序列位置用于表征所述数据库对象
在后续医疗数据表中的存储位置，如数据库对象为门诊部、住院部、护理部，则门诊部、住院部、护理部的序列位置可以分别在医疗数据表中的第一列、第二列以及第三列。所述数据库定义语言(data definition language，ddl)用于定义数据库的结构，其包括create，alter，drop等命令。
[0062]
进一步地，本发明实施例根据所述医疗数据表，生成所述标准医疗数据集的医疗数据库，以实现后续医疗数据的存储和查找，在本发明实施例中，所述医疗数据库为关系系数据库，如oracle、mysql等数据库。
[0063]
s3、获取至少两个业务数据源，利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征。
[0064]
本发明实施例中，所述业务数据源是基于不同业务场景下产生，如对于医疗就诊场景下，所述业务数据源包括就诊人员信息、就诊科室信息、就诊医生信息等，对于医疗问诊场景，所述业务数据源包括问诊时间信息、问诊人员信息以及问诊类别信息等，进一步地，本发明实施例通过获取至少两个业务数据源，以保障后续数据集成的前提。
[0065]
进一步地，本发明实施例利用预训练好的语义分析模型识别每个所述业务数据源的数据语义特征，以识别每个所述业务数据源的关键数据特征，提高后续数据匹配的速度。其中，所述语义分析模型可以通过transformer网络构建，其用于识别数据语义。
[0066]
进一步地，本发明一可选实施例中，所述利用预训练好的语义分析模型识别每个所述业务数据源的数据语义特征之前，还包括：获取训练语料，利用预构建语义分析模型中的编码器对所述训练语料进行位置向量编码，得到编码向量语料，利用所述预构建语义分析模型中的掩码层对所述编码向量语料进行掩码，得到掩码向量语料，利用所述预构建语义分析模型中的解码器对所述编码向量语料进行序列解码，得到所述训练语料的预测语义特征，利用所述向量生成机制中的损失函数计算所述预测语义特征和其对应的真实语义特征的训练损失，若所述训练损失大于预设损失，则重新调整所述预构建语义分析模型的参数，并返回执行所述利用预构建语义分析模型中的编码器对所述训练语料进行位置向量编码的步骤，若所述训练损失不大于所述预设损失，得到训练好的语义分析模型。
[0067]
其中，所述真实语义特征是指所述训练语料对应的真实语义，其用于监督所述语义分析模型在训练过程中语义分析的识别能力，所述预设损失可以设置为0.1，也可以根据实际训练过程设置。
[0068]
示例性地，存在训练语料a，在所述训练语料a中存在数据t1、t2、t3、t4、t5，则通过所述编码器对所述训练语句进行位置向量编码可以得到：[cls]t1 t2[sep]t3 t4 t5[sep]的编码向量语料，并通过所述掩码层对该编码向量语料中t2和t4进行掩码可以得到掩码向量语料为[cls]t1 masked[sep]t3 masked t5[sep],该掩码向量语料可以理解为：t1 t2能够访问到“[cls]t1 t2[sep]”这四个掩码序列，t4可以访问到[cls]t1 t2[sep]t3 t4这六个掩码序列，进一步，利用所述解码器中的注意力机制对所述掩码向量语料中的掩码序列解码，以得到所述语句a的预测语义特征。
[0069]
进一步地，本发明又一可选实施例中，所述损失函数包括
[0070]
[0071]
其中，loss表示训练损失，b表示预测语义特征的数量，y(xi)表示预测语义特征的数据向量，表示真实语义特征的数据向量。
[0072]
进一步地，本发明实施例将每个所述业务数据源输入至所述训练好的语义分析模型，以输出每个所述业务数据源的数据语义特征。
[0073]
进一步地，为保障所述数据语义特征的隐私性和复用性，所述数据语义特征还可存储于一区块链节点中。
[0074]
s4、从所述医疗数据库中选取每个所述数据语义特征的数据表。
[0075]
本发明实施例通过从所述医疗数据库中选取每个所述数据语义特征的数据表，以获取所述数据语义特征对应业务数据源的数据存储结构，实现所述业务数据源的数据标准化存储，进而提高后续业务数据源的集成效率。
[0076]
作为本发明的一个实施例，所述从所述医疗数据库中选取每个所述数据语义特征的数据表，包括：计算每个所述数据语义特征与所述医疗数据库中医疗数据表的匹配度，选取所述匹配度大于预设阈值的医疗数据表作为所述数据语义特征的数据表。
[0077]
进一步地，本发明又一可选实施例中，所述数据语义特征与所述医疗数据库中医疗数据表的匹配度可以通过匹配度算法实现，如k-近邻算法。所述预设阈值可以设置为0.75，也可以根据实际业务场景设置。
[0078]
s5、将每个所述业务数据源加载至所述数据表中，以生成每个所述业务数据源的业务数据表，根据所述业务数据表，执行所述至少两个业务数据源的数据集成。
[0079]
本发明实施例通过将每个所述业务数据源加载至所述数据表中，以生成每个所述业务数据源的业务数据表，从而可以获取每个所述业务数据源在数据库中的标准存储形式，可选的，所述业务数据源的加载可以通过sql语句实现，如create语句。进一步地，本发明实施例根据所述业务数据表，执行所述至少两个业务数据源的数据集成，即将所述业务数据表进行关联，以使所述业务数据源直接具有血缘关系。其中，所述业务数据表的关联可以通过所述业务数据表的id实现。
[0080]
可以看出，相较于现有技术中通过根据系统功能需求设计医疗数据库，导致不同业务系统设计的医疗数据库结构千差万别，影响医疗数据集成的效率的现象，本发明实施例通过标准医疗数据，确定医疗数据在数据库存储的标准结构形式，保障业务系统产生的业务数据源可以按照标准医疗数据构建的数据库存储形式进行数据存储，使得业务数据源的存储形式具有标准化和统一化，以使业务系统的数据在汇总融合阶段，可以减少不同系统间的壁垒，缩短数据集成周期，降低数据集成的难度，提高数据集成的效率。因此，本发明实施例提出的一种医疗数据集成方法可以提高医疗数据集成的效率。
[0081]
如图2所示，是本发明医疗数据集成装置的功能模块图。
[0082]
本发明所述医疗数据集成装置100可以安装于电子设备中。根据实现的功能，所述医疗数据集成装置可以包括数据库对象生成模块101、医疗数据库生成模块102、语义特征识别模块103、数据表选取模块104以及数据源集成模块105。本发明所述模块也可以称之为单元，是指一种能够被电子设备的处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。
[0083]
在本实施例中，关于各模块/单元的功能如下：
[0084]
所述数据库对象生成模块101，用于获取标准医疗数据集，识别所述标准医疗数据
集中每个医疗数据的医疗类型，将具有相同医疗类型的医疗数据进行聚类，生成一个或多个聚类中心点，并将所述聚类中心点中每个数据转换成数据库对象；
[0085]
所述医疗数据库生成模块102，用于根据所述数据库对象，构建所述聚类中心点的医疗数据表，并根据所述医疗数据表，生成所述标准医疗数据集的医疗数据库；
[0086]
所述语义特征识别模块103，用于获取至少两个业务数据源，利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征；
[0087]
所述数据表选取模块104，用于从所述医疗数据库中选取每个所述数据语义特征的数据表；
[0088]
所述数据源集成模块105，用于将每个所述业务数据源加载至所述数据表中，以生成每个所述业务数据源的业务数据表，根据所述业务数据表，执行所述至少两个业务数据源的数据集成。
[0089]
详细地，本发明实施例中所述医疗数据集成装置100中的所述各模块在使用时采用与上述的图1中所述的医疗数据集成方法一样的技术手段，并能够产生相同的技术效果，这里不再赘述。
[0090]
如图3所示，是本发明实现医疗数据集成方法的电子设备1的结构示意图。
[0091]
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13，还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序，如医疗数据集成程序。
[0092]
其中，所述处理器10在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备1的控制核心(control unit)，利用各种接口和线路连接整个电子设备1的各个部件，通过运行或执行存储在所述存储器11内的程序或者模块(例如执行医疗数据集成程序等)，以及调用存储在所述存储器11内的数据，以执行电子设备1的各种功能和处理数据。
[0093]
所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式移动硬盘、智能存储卡(smart media card，smc)、安全数字(secure digital，sd)卡、闪存卡(flash card)等。进一步地，所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如医疗数据集成程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。
[0094]
所述通信总线12可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
[0095]
所述通信接口13用于上述电子设备1与其他设备之间的通信，包括网络接口和员
工接口。可选地，所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等)，通常用于在该电子设备1与其他电子设备1之间建立通信连接。所述员工接口可以是显示器(display)、输入单元(比如键盘(keyboard))，可选地，员工接口还可以是标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的员工界面。
[0096]
图3仅示出了具有部件的电子设备1，本领域技术人员可以理解的是，图3示出的结构并不构成对所述电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。
[0097]
例如，尽管未示出，所述电子设备1还可以包括给各个部件供电的电源(比如电池)，优选地，电源可以通过电源管理装置与所述至少一个处理器10逻辑相连，从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等，在此不再赘述。
[0098]
应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。
[0099]
所述电子设备1中的所述存储器11存储的医疗数据集成程序是多个计算机程序的组合，在所述处理器10中运行时，可以实现：
[0100]
获取标准医疗数据集，识别所述标准医疗数据集中每个医疗数据的医疗类型，将具有相同医疗类型的医疗数据进行聚类，生成一个或多个聚类中心点，并将所述聚类中心点中每个数据转换成数据库对象；
[0101]
根据所述数据库对象，构建所述聚类中心点的医疗数据表，并根据所述医疗数据表，生成所述标准医疗数据集的医疗数据库；
[0102]
获取至少两个业务数据源，利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征；
[0103]
从所述医疗数据库中选取每个所述数据语义特征的数据表；
[0104]
将每个所述业务数据源加载至所述数据表中，以生成每个所述业务数据源的业务数据表，根据所述业务数据表，执行所述至少两个业务数据源的数据集成。
[0105]
具体地，所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。
[0106]
进一步地，所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个非易失性计算机可读取存储介质中。所述计算机可读存储介质可以是易失性的，也可以是非易失性的。例如，所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-only memory)。
[0107]
本发明还提供一种计算机可读存储介质，所述可读存储介质存储有计算机程序，所述计算机程序在被电子设备1的处理器所执行时，可以实现：
[0108]
获取标准医疗数据集，识别所述标准医疗数据集中每个医疗数据的医疗类型，将
具有相同医疗类型的医疗数据进行聚类，生成一个或多个聚类中心点，并将所述聚类中心点中每个数据转换成数据库对象；
[0109]
根据所述数据库对象，构建所述聚类中心点的医疗数据表，并根据所述医疗数据表，生成所述标准医疗数据集的医疗数据库；
[0110]
获取至少两个业务数据源，利用训练好的语义分析模型识别每个所述业务数据源的数据语义特征；
[0111]
从所述医疗数据库中选取每个所述数据语义特征的数据表；
[0112]
将每个所述业务数据源加载至所述数据表中，以生成每个所述业务数据源的业务数据表，根据所述业务数据表，执行所述至少两个业务数据源的数据集成。
[0113]
在本发明所提供的几个实施例中，应该理解到，所揭露的设备，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
[0114]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0115]
另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。
[0116]
对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。
[0117]
因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0118]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0119]
本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0120]
此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称，而并不表示任何特定的顺序。
[0121]
最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的
技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

医疗数据集成方法、装置、电子设备及存储介质与流程

相关文献

最热文献