基于迁移学习的脑卒中风险预测方法及系统与流程

2022-05-18 12:40:21 来源：中国专利 TAG：

1.本发明涉及健康管理领域，特别涉及一种基于迁移学习的脑卒中风险预测方法及系统。

背景技术：

[0002][0003]
随着人工智能技术和大数据的迅速发展，国内外学者利用机器学习等人工智能技术在脑卒中早期风险预警方面进行了大量研究。研究者主要基于临床生化数据指标(低密度脂蛋白、胆固醇、同型半胱氨酸等)、影像学和个人基本信息，利用人工智能算法进行大数据挖掘和分析，实现脑卒中早期风险预测，这种预测模型采用了生化指标，属于有创监测，在实际中广泛应用比较困难。近年来，有学者开始研究利用基于心冲击图来判断房颤，从而来进行心血管风险预警，但是目前缺乏大样本数据库进行训练学习，预测的精度和准确度都有待进一步提高。
[0004]
为此，本发明提出一种基于迁移学习的脑卒中风险预测方法及系统，对脑卒中的风险预测和防治具有重要的意义。

技术实现要素：

[0005]
本发明的目的是提供一种基于迁移学习的脑卒中风险预测方法及系统，该方法有助于解决当前基于低成本、无感式生理信号监测数据对脑卒中风险预测中的个体差异大，样本量少或者无标签等问题。
[0006]
为了实现本发明的技术目的，采取如下的技术方案。
[0007]
一种基于迁移学习的脑卒中风险预测方法，该方法包括如下步骤：获取脑卒中发病人群发病前的生理和运动数据以及日常生活习惯的历史数据，并对这些数据进行滤波和归一化预处理，得到源数据；获取无标签人员的生理和运动数据以及日常生活习惯数据，并对这些数据进行如上述一致的滤波和归一化预处理，得到目标数据；选取源数据中的高危风险(特异性敏感性)特征，建立脑卒中高危风险特征数据集x＝[x1,x2,x3...xq]，并相应地提取目标数据中的脑卒中高危风险特征数据；基于动态时间规整算法计算目标数据中的脑卒中高危风险特征数据与源数据中的脑卒中高危风险特征数据的相似距离，并且获取这些数据的相似历史数据片段；如果求出特征xi源数据中的样本特征片段为c个，则构成可迁移样本k＝{k1,k2,...kc}，并将每个片段按照时间窗t进行拆分，扩大可迁移样本数据集；构建基于长短时记忆神经网络lstm的预测模型，利用迁移学习训练数据集训练好的预测模型分别对目标数据样本进行预测，得到目标域样本中特征xi的预测结果；重复上述步骤，得到待测样本q个特征分别对应的预测结果z＝[z1,z2,...zq]；基于权重融合的方法，将多个预测结果进行融合，得到最终的预测结果fc。
[0008]
在一个实施例中，选取高危风险特征的步骤如下：将源数据中样本未发病但数据参数已改变的一段时间(例如发病前一个月)的生理和运动数据以及日常生活习惯的历史
数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存，分别定义为每个特征的危险图；将源数据中样本未发病且数据参数未改变时(例如发病前6个月)的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存，分别定义为每个特征的安全图；将每个特征的危险图和安全图构成特征的样本数据库，并随机将样本数据库分为训练集和测试集，利用卷积神经网络算法对每个特征的样本集进行训练，并最终得到不同特征危险图和安全图的识别准确率；将特征识别准确率高于一定阈值的特征，定义为脑卒中的高危风险数据特征。
[0009]
在一个有利实施例中，获取数据的相似历史数据片段的步骤如下：设目标数据中待测样本的第i个特征的时间序列为xi＝{xi1，xi2，...xin}，长度为l， xi按照时间滑动时间窗长度f在源数据样本上的对应特征上进行移动，将源数据样本对应的特征序列yi分为w个片段，[yi1,yi2,...yiw]，其中yiw的时间序列为yiw＝{yiw1，yiw2，...yiwn}，基于动态时间规整算法计算待测样本第i个特征对应源数据样本的相似距离di，最小值对应的源数据特征片段为目标数据待测样本的相似历史数据片段。
[0010]
所述生理和运动数据以及日常生活习惯的历史数据包括心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒习惯。
[0011]
在一个有利实施例中，采用遗传算法对基于长短时记忆神经网络lstm的预测模型的参数进行如下优化：
[0012]
将第i个特征的可迁移样本数据集k按照一定的比例随机分为训练集和测试集；
[0013]
初始化长短时记忆神经网络模型的参数种群，将训练集的数据放到长短时记忆神经网络模型中进行训练；
[0014]
将长短时记忆神经网络模型的均方根误差作为遗传算法的适应度函数；
[0015]
将训练和测试完一次的长短时记忆神经网络模型的参数进行交叉变异操作，若获得适应度函数的最优目标值，则进行下一步操作，否则，返回上一步操作；
[0016]
得出长短时记忆神经网络模型的最优参数组合；
[0017]
将得出的最优参数组合输入到长短时记忆神经网络模型中，得到训练好的长短时记忆神经网络的预测模型及输入门、遗忘门的权重和偏置。
[0018]
在一个有利实施例中，，将目标数据中待测样本第i个特征输入到训练好的lstm长短时记忆神经网络的预测模型进行预测。
[0019]
本发明还提供一种基于迁移学习的脑卒中风险预测系统，包括：第一信息收集模块，用于收集脑卒中发病人群发病前的生理和运动数据以及日常生活习惯的历史数据；第二信息收集模块，用于收集无标签人员的生理和运动数据以及日常生活习惯的历史数据；信号预处理分析模块，用于对第一信息收集模块和第二信息收集模块收集的数据进行滤波和归一化预处理，分别得到源数据和目标数据；信息分析模块，用于提取源数据的高危风险特征，建立脑卒中高危风险特征数据集x＝[x1,x2,x3...xq]，并相应地提取目标域中的脑卒中高危风险特征数据；迁移学习模块，用于基于动态时间规整算法计算目标数据与源数据的相似距离，获取目标数据的相似历史数据片段，获取各数据特征的可迁移学习样本；脑卒中风险预测模块，构建基于长短时记忆神经网络lstm的预测模型，并将得到的各特征迁
移学习样本的预测结果，进行权重融合，得到最终的预测结果fc。
[0020]
有利地，信息分析模块如下选取高危风险特征：将源数据中样本未发病但数据参数已改变的一段时间的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存，分别定义为每个特征的危险图；将源数据中样本未发病且数据参数未改变时的生理和运动数据以及日常生活习惯的历史数据的时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差的每个数据特征以窗口截图的形式保存，分别定义为每个特征的安全图；将每个特征的危险图和安全图构成特征的样本数据库，并随机将样本数据库分为训练集和测试集，利用卷积神经网络算法对每个特征的样本集进行训练，并最终得到不同特征危险图和安全图的识别准确率；将特征识别准确率高于一定阈值的特征，定义为脑卒中的高危风险数据特征。
[0021]
有利地，迁移学习模块如下获取数据的相似历史数据片段：设目标数据中待测样本的第i个特征的时间序列为xi＝{xi1，xi2，...xin}，长度为l，xi按照时间滑动时间窗长度f在源数据样本上的对应特征上进行移动，将源数据样本对应的特征序列yi分为w个片段，[yi1,yi2,...yiw]，其中yiw的时间序列为 yiw＝{yiw1，yiw2，...yiwn}，基于动态时间规整算法计算待测样本第i个特征对应源数据样本的相似距离di，最小值对应的源数据特征片段为目标数据待测样本的相似历史数据片段。
[0022]
采用遗传算法对基于长短时记忆神经网络lstm的预测模型的参数进行如下优化：
[0023]
将第i个特征的可迁移样本数据集k按照一定的比例随机分为训练集和测试集；
[0024]
初始化长短时记忆神经网络模型的参数种群，将训练集的数据放到长短时记忆神经网络模型中进行训练；
[0025]
将长短时记忆神经网络模型的均方根误差作为遗传算法的适应度函数；
[0026]
将训练和测试完一次的长短时记忆神经网络模型的参数进行交叉变异操作，若获得适应度函数的最优目标值，则进行下一步操作，否则，返回上一步操作；
[0027]
得出长短时记忆神经网络模型的最优参数组合；
[0028]
将得出的最优参数组合输入到长短时记忆神经网络模型中，得到训练好的长短时记忆神经网络的预测模型及输入门、遗忘门的权重和偏置。
[0029]
一种基于迁移学习的脑卒中风险预测方法，包括如下步骤：
[0030]
步骤1：获取脑卒中发病人群发病前的心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动和日常生活习惯等历史数据，并进行滤波和归一化预处理，得到源数据。
[0031]
步骤2：获取无标签的老年人近2个月的心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动数据和日常生活习惯数据，并进行与步骤1一致的滤波和归一化预处理，得到目标数据。
[0032]
步骤3：基于卷积神经网络算法选取步骤1中源数据的高危风险特征，建立脑卒中高危风险特征数据集x＝[x1,x2,x3...xq]，并相应的提取步骤2目标域脑卒中高危风险特征数据，具体高危风险特征选取步骤如下：
[0033]
3-1：将源数据中样本发病前1个月的心率、呼吸、心率变异性、血压、血压变异性、
血氧、呼吸、睡眠、运动状况、吸烟、饮酒及心率变异性时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差等每个数据特征以窗口截图的形式保存，分别定义为每个特征的危险图。
[0034]
3-2：将源数据中样本发病6个月前的心率、呼吸、心率变异性、血压、血压变异性、血氧、呼吸、睡眠、运动状况、吸烟、饮酒及心率变异性时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差等每个数据特征以窗口截图的形式保存，分别定义为每个特征的安全图；
[0035]
3-3：将每个特征的危险图和安全图构成了特征的样本数据库，并随机将样本数据库分为训练集和测试集，利用卷积神经网络算法对每个特征的样本集进行训练，并最终得到不同特征危险图和安全图的识别准确率。
[0036]
3-4：将特征识别准确率高于某个阈值的的特征，定义为脑卒中的高危风险数据特征。
[0037]
步骤4：基于动态时间规整算法计算目标数据与历史源数据的相似距离，获取目标数据的相似历史数据片段。设目标数据中待测样本的第i个特征的时间序列为xi＝{x
i1
，x
i2
，...x
in
},长度为l,xi按照时间滑动时间窗长度f在源数据样本上的对应特征上进行移动，将源数据样本对应的特征序列yi分为w个片段， [y
i1
,y
i2
,...y
iw
],其中y
iw
的时间序列为y
iw
＝{y
iw1
，y
iw2
，...y
iwn
}，基于动态时间规整算法计算待测样本第i个特征对应源数据样本的相似距离di，最小值对应的源数据特征片段为目标数据待测样本的相似历史数据片段。
[0038]di
＝min(d(xi，y
i1
)，d(xi，y
i2
)...d(xi，y
iw
))
[0039][0040]
其中，min是求最小值。
[0041]
步骤5：按照步骤4的方法求出特征xi源数据中的样本特征片段为c个，则构成可迁移样本k＝{k1,k2,...kc}，并将每个片段按照时间窗t进行拆分，扩大可迁移样本数据集。
[0042]
步骤6：构建基于lstm的预测模型，利用迁移学习训练数据集训练好的预测模型分别对目标数据样本进行预测，得到目标域样本中特征xi的预测结果。
[0043]
zi＝σ(w
lstm1
*k b
lstm1
) tanh(w
lstm2
*k b
lstm2
)
[0044]
其中，zi为输出的预测结果,σ为激活函数，w
lstm1
、w
lstm2
为长短时记忆网络输入门和遗忘门的权重，b
lstm1
、b
lstm
2为长短时记忆网络输入门和遗忘门的偏置，k为输入的源域可迁移样本。
[0045]
步骤7：重复步骤4-步骤6，得到待测样本q个特征分别对应的预测结果 z＝[z1,z2,...zq]。
[0046]
步骤8：基于权重融合的方法，将步骤7中的多个预测结果进行融合，得到最终的预测结果fc。
[0047][0048]
其中，ai为校正系数，sort(zi)为预测结果中与预测结果zi比较接近的数的个数。
[0049]
将sort(zi)的值按照从大到小进行排列，ai的值根据sort(zi)的值的大小而定，当sort(zi)为排列中的最大值时，ai也取最大值；当sort(zi)为排列中的最小值时， ai也取最
小值；当sort(zi)为排列中的中间某个数值时，ai则取个中间的数值。
[0050]
另外，本发明还提供了一种基于迁移学习的脑卒中风险预测系统，包括信息收集模块1、信息收集模块2、信息预处理模块、信息分析模块，迁移学习模块、风险预测模块，其中：
[0051]
信息收集模块1，利用智能床垫、智能血压计、智能血糖仪、智能手环、健康评估量表收集脑卒中人群病前的心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动和日常生活习惯等历史数据；
[0052]
信息收集模块2，利用智能床垫、智能血压计、智能血糖仪、智能手环、健康评估量表收集脑卒中高危人群的心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动和日常生活习惯等数据；
[0053]
信号预处理分析模块，用于对信息收集模块1和信息收集模块2的数据进行滤波和归一化预处理，分别得到源数据和目标数据；
[0054]
信息分析模块，用于对信息收集模块1进行处理分析，提取源数据的高危风险特征，建立脑卒中高危风险特征数据集x＝[x1,x2,x3...xq]，并相应的提取目标域脑卒中高危风险特征数据。
[0055]
迁移学习模块，用于基于动态时间规整算法计算目标数据与源数据的相似距离，获取目标数据的相似历史数据片段，获取各数据特征的可迁移学习样本。具体步骤如下：
[0056]
s-1：基于动态时间规整算法计算目标数据与历史源数据的相似距离，获取目标数据的相似历史数据片段。设目标数据中待测样本的第i个特征的时间序列为xi＝{x
i1
，x
i2
，...x
in
},长度为l,xi按照时间滑动时间窗长度f在源数据样本上的对应特征上进行移动，将源数据样本对应的特征序列yi分为w个片段， [y
i1
,y
i2
,...y
iw
],其中y
iw
的时间序列为y
iw
＝{y
iw1
，y
iw2
，...y
iwn
}，基于动态时间规整算法计算待测样本第i个特征对应源数据样本的相似距离di，最小值对应的源数据特征片段为目标数据待测样本的相似历史数据片段。
[0057]di
＝min(d(xi，y
i1
)，d(xi，y
i2
)...d(xi，y
iw
))
[0058][0059]
其中，min是求最小值。
[0060]
s-2：按照步骤s-1中的方法求出特征xi源数据中的样本特征片段为c个，则构成可迁移样本k＝{k1,k2,...kc}，并将每个片段按照时间窗t进行拆分，扩大可迁移样本数据集。
[0061]
s-3：重复步骤s1-s2，分别得到目标域待测样本q个特征的可迁移样本数据集。
[0062]
脑卒中风险预测模块，构建基于lstm的预测模型，并将得到的各特征迁移学习样本的预测结果，进行权重融合，得到最终的预测结果fc。
[0063][0064]
其中，ai为校正系数，sort(zi)为预测结果中与预测结果zi比较接近的数的个数。
[0065]
将sort(zi)的值按照从大到小进行排列，ai的值根据sort(zi)的值的大小而定，当sort(zi)为排列中的最大值时，ai也取最大值；当sort(zi)为排列中的最小值时， ai也取最小值；当sort(zi)为排列中的中间某个数值时，ai则取个中间的数值。
[0066]
与现有技术相对比，本发明的有益效果是：
[0067]
(1)采用低成本、易监测的心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等数据进行脑卒中风险预测，相比生化数据和影像数据，使脑卒中风险预警更具有操作性和实际应用价值。
[0068]
(2)利用基于迁移学习的方法精确扩大可训练样本，并融合各个特征的预测结果，使得预测的精度和准确度都大大提高。
[0069]
(3)利用该方法和系统，能够通过对比目样本与源数据中脑卒中人群发病前的生理、运动和日常生活习惯等历史数据，最终得到目标域人群的未来可能发生脑卒中风险的时间，能够使目标人群获得更加精准的脑卒中风险预测结果，从而提醒目标人群根据预测的结果及时采取干预措施，降低脑卒中发病风险。
附图说明
[0070]
在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本发明公开的一些实施方式，而不应将其视为是对本发明范围的限制。
[0071]
图1为根据本发明基于迁移学习的脑卒中风险预测系统的示意图；
[0072]
图2为本发明基于迁移学习的脑卒中风险预测方法流程图；
[0073]
图3为根据图1所示的迁移学习模块的流程图。
具体实施方式
[0074]
在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本发明的精神或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的而非限制性的。
[0075]
下面结合附图1-3对本发明的具体实施方式进行详细说明。
[0076]
如图1所示，示出了一种基于迁移学习的脑卒中风险预测系统，其包括具有第一信息收集模块和第二信息收集模块的信息收集模块、信息预处理模块、信息分析模块，迁移学习模块、风险预测模块。
[0077]
第一信息收集模块利用智能床垫、智能血压计、智能血糖仪、智能手环、健康评估量表收集脑卒中人群病前的心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动和日常生活习惯等历史数据；第二信息收集模块利用智能床垫、智能血压计、智能血糖仪、智能手环、健康评估量表收集脑卒中高危人群的心率、心率变异性、血压、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动和日常生活习惯等数据。
[0078]
信号预处理分析模块用于对第一信息收集模块和第二信息收集模块的数据进行滤波和归一化预处理，分别得到源数据和目标数据。
[0079]
信息分析模块用于对第一信息收集模块进行处理分析，提取源数据的高危风险特征，建立脑卒中高危风险特征数据集x＝[x1,x2,x3...xq]，并相应的提取目标域脑卒中高危风险特征数据。
[0080]
迁移学习模块用于基于动态时间规整算法计算目标数据与源数据的相似距离，获
取目标数据的相似历史数据片段，获取各数据特征的可迁移学习样本。
[0081]
脑卒中风险预测模块用于构建基于lstm的预测模型，并将得到的各特征迁移学习样本的预测结果，进行权重融合，得到最终的预测结果fc，即多长时间后有可能患脑卒中。
[0082]
本技术还提供一种基于迁移学习的脑卒中风险预测方法，如图2所示，该方法包括如下步骤：
[0083]
步骤1：获取脑卒中发病人群发病前的心率、心率变异性、血压、血压变异性、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动和日常生活习惯等历史数据，并进行滤波和归一化预处理，得到源数据。
[0084]
步骤2：获取无标签的老年人近2个月的心率、心率变异性、血压、血压变异性、血氧、呼吸、睡眠、运动状况、吸烟、饮酒等长期易监测的生理、运动数据和日常生活习惯数据，并进行与步骤1一致的滤波和归一化预处理，得到目标数据。
[0085]
步骤3：基于卷积神经网络算法选取步骤1中源数据的高危风险特征，建立脑卒中高危风险特征数据集x＝[x1,x2,x3...xq]，并相应的提取步骤2目标域脑卒中高危风险特征数据。具体高危风险特征选取步骤如下：
[0086]
3-1：将源数据中样本发病前1个月的心率、呼吸、心率变异性、血压、血压变异性、血氧、呼吸、睡眠、运动状况、吸烟、饮酒及心率变异性时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差等每个数据特征以窗口截图的形式保存，分别定义为每个特征的危险图。
[0087]
3-2：将源数据中样本发病6个月前的心率、呼吸、心率变异性、血压、血压变异性、血氧、呼吸、睡眠、运动状况、吸烟、饮酒及心率变异性时域特征相邻心动周期差值均方根、相邻正常心动周期差值大于50ms占全部心动周期的比值、平均心动周期、心动周期标准差等每个数据特征以窗口截图的形式保存，分别定义为每个特征的安全图；
[0088]
3-3：将每个特征的危险图和安全图构成了特征的样本数据库，并随机将样本数据库分为训练集和测试集，利用卷积神经网络算法对每个特征的样本集进行训练，并最终得到不同特征危险图和安全图的识别准确率。
[0089]
进一步的，卷积神经网络算法模型由输入层、卷积层1、池化层1、卷积层 2、池化层2、全连接层、输出层构成。其中，卷积层1选用选用大小为(2，2) 的卷积核，用于提取更多更全的数据特征；池化层1选用内核大小为(3，2)进行最大池化；卷积层2选用大小为(8，16)的卷积核；池化层2选用内核大小为(2，2)进行最大池化；全连接层根据不同数据特征的类型选择范围为0.2-0.8 的dropout学习率，用于提高模型训练效率；最后将数据特征在输出层输出特征识别准确率。
[0090]
3-4：将特征识别准确率高于某个阈值的特征，定义为脑卒中的高危风险数据特征。
[0091]
例如：设阈值为0.8，如心率特征经过步骤3，得出的识别准确率为 0.9(0.9》0.8),则心率特征作为高危风险数据特征之一，当心动周期标准差特征经过步骤3，得出的识别准确率为0.6(0.6《0.8),则心动周期标准差特征则不能作为高危风险数据特征。
[0092]
进一步的，经过步骤3计算，得到心率、呼吸、心率变异性、血压、血压变异性、血氧、呼吸、睡眠、运动状况及心率变异性时域特征相邻心动周期差值均方根、平均心动周期、心动周期标准差的识别准确率均高于特定阈值，则将这些特征作为脑卒中的高危风险数据特
征。
[0093]
步骤4：如图3所示，基于动态时间规整算法计算目标数据与历史源数据的相似距离，获取目标数据的相似历史数据片段。设目标数据中待测样本的第 i个特征的时间序列为xi＝{x
i1
，x
i2
，...x
in
},长度为l,xi按照时间滑动时间窗长度f 在源数据样本上的对应特征上进行移动，将源数据样本对应的特征序列yi分为 w个片段，[y
i1
,y
i2
,...y
iw
],其中y
iw
的时间序列为y
iw
＝{y
iw1
，y
iw2
，...y
iwn
}，基于动态时间规整算法计算待测样本第i个特征对应源数据样本的相似距离di，最小值对应的源数据特征片段为目标数据待测样本的相似历史数据片段。
[0094]di
＝min(d(xi，y
i1
)，d(xi，y
i2
)...d(xi，y
iw
))
[0095][0096]
其中，min是求最小值。
[0097]
步骤5：按照步骤4的方法求出特征xi源数据中的样本特征片段为c个，则构成可迁移样本k＝{k1,k2,...kc}，并将每个片段按照时间窗t进行拆分，扩大可迁移样本数据集。
[0098]
步骤6：构建基于长短时记忆神经网络lstm的预测模型，利用迁移学习训练数据集训练好的预测模型分别对目标数据样本进行预测，得到目标域样本中特征xi的预测结果。
[0099]
所述步骤6中的基于长短时记忆神经网络lstm的预测模型由输入门、遗忘门、输出门三部分组成，并采用遗传算法对长短时记忆神经网络lstm的预测模型的参数进行优化，以误差最小为目标函数，选择最优的参数组合。具体步骤如下：
[0100]
s61：将步骤5中第i个特征的可迁移样本数据集k按照5：2的比例随机分为训练集和测试集；
[0101]
s62：初始化长短时记忆神经网络模型的参数种群，包括：训练次数、神经网络层数、每层神经网络节点的舍弃率、步长等，将训练集的数据放到lstm 长短时记忆神经网络模型中进行训练；
[0102]
s63：将长短时记忆神经网络模型的均方根误差作为遗传算法的适应度函数；
[0103]
s64：将训练和测试完一次的长短时记忆神经网络模型参数进行交叉变异操作；
[0104]
s65：若获得适应度函数的最优目标值，则进行下一步，否则，返回步骤 s64；
[0105]
s66：得出长短时记忆神经网络模型最优参数组合。
[0106]
s67：将s66得出最优参数组合输入到lstm长短时记忆神经网络模型中，得到训练好的长短时记忆神经网络的预测模型及输入门、遗忘门的权重和偏置。
[0107]
s67：将目标数据中待测样本第i个特征输入到训练好的长短时记忆神经网络的预测模型。
[0108]
zi＝σ(w
lstm1
*mi b
lstm1
) tanh(w
lstm2
*mi b
lstm2
)
[0109]
其中，zi为输出的预测结果,σ为激活函数，w
lstm1
、w
lstm2
为长短时记忆网络输入门和遗忘门的权重，b
lstm1
、b
lstm
2为长短时记忆网络输入门和遗忘门的偏置，mi为输入的目标数据中待测样本第i个特征。
[0110]
步骤7：重复步骤4至步骤6，得到待测样本q个特征分别对应的预测结果 z＝[z1,z2,...zq]。
[0111]
步骤8：基于权重融合的方法，将步骤7中的多个预测结果进行融合，得到最终的预
测结果fc。
[0112][0113]
其中，ai为校正系数，sort(zi)为预测结果中与预测结果zi比较接近的数的个数。
[0114]
将sort(zi)的值按照从大到小进行排列，ai的值根据sort(zi)的值的大小而定，当sort(zi)为排列中的最大值时，ai也取最大值；当sort(zi)为排列中的最小值时，ai也取最小值；当sort(zi)为排列中的中间某个数值时，ai则取个中间的数值。
[0115]
根据本技术，对目标域中的某个人的脑卒中风险进行预测，首先对该人最近2个月的基本生理信息等进行预处理和敏感性指标提取，然后利用动态时间规整算法计算血压变异性指标与历史源数据中血压变异性指标的相似距离，获取目标数据血压变异性指标的相似历史数据片段，再将血压变异性指标的相似历史数据片段按照时间窗进行拆分，获取可迁移样本数据库，最后利用lstm 算法对可迁移样本数据库进行训练，并将训练后的lstm模型对目标域中的基于血压变异性特征进行脑卒中风险预测，得到风险预测结果；然后重复上述步骤，获得所有敏感性特征的预测结果，最终基于权重融合，获得目标样本的脑卒中风险预测结果，例如若得出的目标样本未来2-4周后有可能患脑卒中，则目标样本能够及时就医，降低脑卒中发病风险。
[0116]
上述概述仅仅是为了说明的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本发明进一步的方面、实施方式和特征将会是容易明白的。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种变异数据降维输入的驴种群自然选择分类系统

基于迁移学习的脑卒中风险预测方法及系统与流程

相关文献

最热文献