一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质与流程

2021-10-19 23:56:00 来源:中国专利 TAG:融合 特征 方法 病历 数据处理

技术特征:
1.一种电子病历中异构数据特征融合方法,其特征在于:包括如下步骤:步骤1:将患者的电子病历数据进行处理构成患者的就诊向量;其中,将患者的电子病历数据按照数据类型划分序列并按照就诊时间排列,再依据预设的医疗事件唯一编码集合对每一类数据所在序列进行事件编码得到每一类数据对应的就诊向量;步骤2:将每类数据的就诊向量作为原始输入数据,分别利用bi_lstm模型和cnn模型提取时序特征和非时序特征;步骤3:分别综合每类数据的时序特征和非时序特征得到综合特征;步骤4:利用所述综合特征挖掘每类数据的之间的作用信息得到每类数据对应的最终特征,其中,所有类数据的最终特征构成所述患者的电子病历数据的特征表示。2.根据权利要求1所述的方法,其特征在于:所述每类数据的就诊向量作为原始输入数据,输入所述bi_lstm模型之前,还包括对所述原始输入数据进行调整,调整后再输入所述bi_lstm模型;其中,设定时间衰减因子捕获时间间隔和患者年龄的影响,并基于所述时间衰减因子调整输入数据,再输入所述bi_lstm模型;所述时间衰减因子如下:式中,τ(δt
i
,a
i
)为时间衰减因子,a
i
是就诊向量中第i次就诊r
i
发生时患者的年龄,δt
i
表示就诊向量中第i次就诊r
i
和需要预测的就诊之间的时间间隔;λ是用于调整时间衰减强度的标量参数,e为自然底数;基于所述时间衰减因子调整输入数据时,调整后的数据表示为:其中,r
i
为调整前第i次就诊r
i
对应的表示向量,调整后第i次就诊r
i
对应的表示向量,示按元素相乘。3.根据权利要求1所述的方法,其特征在于:利用所述bi_lstm模型提取时序特征的过程如下:a:将输入数据输入bi_lstm模型得到由前向和后向隐藏状态序列构成的隐藏状态序列;b:利用基于位置的注意力机制以及softmax函数计算权重分数,并进行加权求和得到融合表示;融合表示;融合表示;式中,是参数矩阵,表示实数集,t'为矩阵的转置符号,n为参数维度,
是偏置参数,α
i
为第i次就诊对应的影响因子,h
i
为步骤a中得到的隐藏状态序列中第i次就诊对应的数据,为第i次就诊对应的权重,t表示患者的电子病历数据中的就诊总次数,c
t
为输入bi_lstm模型的一类数据对应的融合表示;c:按照如下公式计算基于注意力的隐藏状态向量:w
c
为参数矩阵,h
t
为bi_lstm的最后一个输出向量,tanh为双曲正切函数,为基于注意力计算的隐藏状态向量。4.根据权利要求1所述的方法,其特征在于:利用所述综合特征挖掘每类数据的之间的作用信息得到每类数据对应的最终特征的过程如下:步骤41:将每一类数据的综合特征按照如下公式分别映射得到三个向量;征按照如下公式分别映射得到三个向量;征按照如下公式分别映射得到三个向量;式中,w
q
,w
k
,是参数矩阵,表示实数集,u为向量的维度,q
i
、k
i
和v
i
为将第i类数据的综合特征进行映射得到的三个向量,为第i类数据的综合特征;步骤42:利用softmax函数计算权重分数;式中,β
i1

i2

im
分别表示针对第i类数据与第1类、第2类、第m类数据之间对应的权重分数,m表示数据的类型数,为缩放因子;步骤43:基于权重分数按照如下公式分别计算出每一类数据的最终特征;其中,s
i
为第i类数据的最终特征。5.一种基于电子病历中异构数据融合特征的预测方法,其特征在于:包括如下步骤:步骤s1:采集患者的电子病历数据,并按照权利要求1中步骤1

步骤4的过程处理得到患者的电子病历数据的特征表示;其中,依据预测目标选择患者样本;步骤s2:构建预测模型,所述预测模型的输入数据为患者的电子病历数据的特征表示,输出数据为患者对应的预测目标的预测结果;其中,将步骤s1中患者样本的电子病历数据的特征表示以及患者样本中预测目标对应的已知结果训练所述预测模型,训练过程调节所述预测模型和/或步骤1

步骤4中患者的电子病历数据的特征表示生成过程中的模型参数。6.根据权利要求5所述的方法,其特征在于:所述预测模型表示如下:
其中,为预测目标的结果,是参数矩阵,表示实数集,u为向量s的维度,b
y
是偏置参数,s1;s2;....s
m
为患者的电子病历数据中第1类,第2类,以及第m类数据对应的最终特征;若所述预测目标为心血管疾病风险,所述预测目标的预测结果为1,表示存在心血管疾病风险;所述预测目标的预测结果为0,表示不存在心血管疾病风险。7.一种基于权利要求1所述方法的系统,其特征在于:包括:就诊向量生成模块,用于将患者的电子病历数据进行处理构成患者的就诊向量;时序特征提取模块,用于将每类数据的就诊向量作为原始输入数据,并利用bi_lstm模型提取时序特征;非时序特征提取模块,用于将每类数据的就诊向量作为原始输入数据,并利用cnn模型提取非时序特征;综合特征生成模块,用于分别综合每类数据的时序特征和非时序特征得到综合特征;最终特征表示模块,用于利用所述综合特征挖掘每类数据的之间的作用信息得到每类数据对应的最终特征,其中,所有类数据的最终特征构成所述患者的电子病历数据的特征表示。8.根据权利要求7所述的系统,其特征在于:还包括:预测模型构建模块,用于构建预测模型,并利用患者样本的数据训练模型;预测模块,用于利用预测模型进行预测。9.一种系统,其特征在于:包括处理器和存储器,所述存储器存储了计算机程序,所述处理器调用所述计算机程序以执行:权利要求1所述的电子病历中异构数据特征融合方法的步骤以及权利要求2所述的基于电子病历中异构数据融合特征的预测方法的步骤。10.一种可读存储介质,其特征在于:存储了计算机程序,所述计算机程序被处理器调用以执行:权利要求1所述的电子病历中异构数据特征融合方法的步骤以及权利要求2所述的基于电子病历中异构数据融合特征的预测方法的步骤。

技术总结
本发明公开了一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质,所述方法包括:步骤1:将患者的电子病历数据进行处理构成患者的就诊向量;步骤2:将每类数据的就诊向量作为原始输入数据,分别利用Bi_LSTM模型和CNN模型提取时序特征和非时序特征;步骤3:分别综合每类数据的时序特征和非时序特征得到综合特征;步骤4:利用所述综合特征挖掘每类数据的之间的作用信息得到每类数据对应的最终特征。其中,利用得到最终特征可以用于疾病风险预测,本发明综合了不同类型医学数据各自的时序和非时序特征及其之间的相互关系,以获得更准确的患者表示特征,进而提高了疾病风险预测结果的可靠性。进而提高了疾病风险预测结果的可靠性。进而提高了疾病风险预测结果的可靠性。


技术研发人员:安莹 唐琨 陈先来
受保护的技术使用者:中南大学
技术研发日:2021.04.15
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜