病例传播信息的预测方法、电子设备及存储介质与流程

2022-12-02 19:50:57 来源：中国专利 TAG：

1.本技术涉及数据处理领域，特别是涉及一种病例传播信息的预测方法、电子设备及计算机可读存储介质。

背景技术：

2.传染病会为人们的生活带来很多负面的影响，因此已知传染病的“防”和“治”是两个必要措施。对于传染病的“治”，是在发现病例之后及时进行医治，对于传染病的“防”，是预测未来传染病的病例传播信息。相对于“治”，“防”具有更多的未知性，目前社会大都关注的是传染病的“治”，而忽略了传染病的“防”。因此，亟需一种自动实现传染病的“防”的方法。

技术实现要素：

3.本技术提供一种病例传播信息的预测方法、电子设备及计算机可读存储介质，能够自动预测病例传播信息。
4.为解决上述技术问题，本技术采用的一个技术方案是：提供一种病例传播信息的预测方法。该方法包括：获取多个被监测人员的第一病例数据的多个时间序列；利用神经网络对第一病例数据的多个时间序列进行预测，得到多个监测人员的第二病例数据的时间序列；基于第二病例数据的时间序列，确定多个监测人员的病例传播信息。
5.为解决上述技术问题，本技术采用的另一个技术方案是：提供一种电子设备，该电子设备包括处理器、与处理器连接的存储器，其中，存储器存储有程序指令；处理器用于执行存储器存储的程序指令以实现上述方法。
6.为解决上述技术问题，本技术采用的又一个技术方案是：提供一种计算机可读存储介质，存储有程序指令，该程序指令被执行时能够实现上述方法。
7.通过上述方式，本技术能够通过多个被监测人员的第一病例数据的多个时间序列，预测多个被监测人员的第二病例数据的时间序列，基于第二病例数据的时间序列，确定多个被监测人员中的病例传播信息。一方面，本技术能够自动预测病例传播信息，方便相关部门的管理。另一方面，本技术由于第二病例数据的时间序列，是由神经网络基于第一病例数据的时间序列来预测的，因此神经网络在预测时会考虑时间因素带来的影响，提高预测精度，进而提高最终得到的病例传播信息的准确度。
附图说明
8.图1是本技术病例传播信息的预测方法一实施例的流程示意图；
9.图2是lstm单元的一结构示意图；
10.图3是gru单元的一结构示意图；
11.图4是本技术病例传播信息的预测方法另一实施例的流程示意图；
12.图5是本技术病例传播信息的预测方法另一实施例的流程示意图；
13.图6是本技术病例传播信息的预测方法一具体实例的流程示意图；
14.图7是图6中step1的具体流程示意图；
15.图8是本技术电子设备一实施例的结构示意图；
16.图9是本技术计算机可读存储介质一实施例的结构示意图。
具体实施方式
17.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术的一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
18.本技术中的术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本技术的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。
19.在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，在不冲突的情况下，本文所描述的实施例可以与其它实施例相结合。
20.图1是本技术病例传播信息的预测方法一实施例的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图1所示的流程顺序为限。如图1所示，本实施例可以包括：
21.s11：获取多个被监测人员的第一病例数据的多个时间序列。
22.多个被监测人员可以为监测区域的全部人员或者全部人员的抽样结果，监测区域可以是某个城市、某个国家、全球等等。
23.本技术提及的病例面向的可以是任何具有传染性质的疾病，后文主要以传染病a为例进行说明。病例的种类可以是确诊病例、死亡病例等等中的至少一个，确诊病例又可以是有症状感染病例、无症状感染病例。
24.第一病例数据为监测时段之前的预设长度的时间段(后文称为参考时段)的病例数据。
25.在一些实施例中，第一病例数据包括参考时段监测人员的身份指示信息和病例的第一指示信息，身份指示信息用于指示监测人员的身份，病例的第一指示信息为监测人员是病例的概率，用于指示监测人员是否为病例。若是病例，病例的第一指示信息为1，若不为病例，病例的第一指示信息为0。由此，多个监测人员的第一病例数据可以指示参考时段中每个时间单位的病例数量。
26.在一些实施例中，第一病例数据还可以包括参考时段监测人员的病例的第二指示信息。病例的第二指示信息可以包括天气指示信息、生活质量指示信息、身体状况指示信息、交际范围指示信息等等。
27.一个时间序列的长度可以是一个时间单位，也可以是多个时间单位。时间单位可以是一个小时、一天、一周等等。例如，时间单位为一天，一个时间序列的长度是一周，那么
一个时间序列包括连续的七天的第一病例数据，时间序列示例为{(s11，s12，
…
)，(s21，s22，
…
)，
…
}，其中sij表示第i天第j个被监测人员的第一病例数据，sij＝[s1，s2，
…
]， sk表示第k维度的指示信息。
[0028]
第一病例数据的多个时间序列中相邻的时间序列可以是连续的，也可以是间隔一定时长的。例如，参考时段为30天，对应时间序列1～6，其中时间序列1对应第1～5天，时间序列2对应第6～10天，
…
，依次类推。或者，时间序列1对应第1～4天，时间序列2对应第6～9天，
…
，依次类推。
[0029]
可以获取监测区域、参考时段的第一病例数据的总时间序列，对总时间序列进行切分，得到第一病例数据的连续的多个时间序列。其中，总时间序列可以是从相关权威机构下载源数据之后将无关数据(例如日期列)去除得到的。例如，权威机构可以是csse at johns hopkinsuniversity(约翰斯
·
霍普金斯大学)，unitednations(联合国)，world bank (世界银行)，global burden of disease(全球疾病负担研究)，blavatnikschool of government(布拉瓦尼政治学院)。
[0030]
s12：利用神经网络对第一病例数据的多个时间序列进行预测，得到多个被监测人员的第二病例数据的时间序列。
[0031]
第二病例数据是监测时段的病例数据。第二病例数据包括监测时段中监测人员的身份指示信息和病例的第一指示信息。
[0032]
神经网络可以预测得到每个被监测人员在监测时段是病例的概率，该是病例的概率作为第二病例数据中的病例的第一指示信息。
[0033]
可以理解的是，因为时间序列涵盖时间因素，因此神经网络在通过第一病例数据的多个时间序列预测时，能够感知到时间因素带来的影响。并且，在第一病例数据包括病例相关的参考信息时，神经网络的预测还会额外考虑到参考信息带来的影响。
[0034]
神经网络可以但不限于是lstm(long short-term memory，长短期记忆网络)、lstm的各种衍生网络、gru(gate recurrent unit，门控网络)等等，在此不做具体限定。
[0035]
一个lstm单元由一个隔室(cell)、一个输入门(input gate)、一个输出门(output gate)和一个遗忘门(forget gate)组成。具体的lstm 单元结构示例见图2。如图2所示，基于此，可以模拟一个lstm，该 lstm包括一个输入层、一个隐藏层和一个用于预测的输出层。输入层包括多个神经元，分别对应输入的第一病例数据的多个时间序列；隐藏层是一个lstm层；输出层有一个密集层，有一个单元用于预测输出。
[0036]
一个gru单元由重置门r(reset gate)、更新门z(update gate)、候选状态h(candidate state)组成。具体的gru单元结构示例见图3。基于此，可以模拟一个gru，该gru的输入为第一病例数据的多个时间序列，输出为第二病例数据的时间序列。
[0037]
s13：基于第二病例数据的时间序列，确定多个监测人员的病例传播信息。
[0038]
s13可以是通过神经网络实现的，也可以是在神经网络之外实现的。
[0039]
病例传播信息可以包括监测时段(或者监测时段中每个时间单位) 的病例数量、新增病例数量、病例传播速度、不同病例的传播关系等等。
[0040]
其中，是病例的概率高于概率阈值的被监测人员被视为病例，由此可以基于多个第二病例数据中的病例的第一指示信息，确定多个被监测人员中的病例数量。可以基于参考时段和监测时段中各个时间单位的病例数量之间的关系，确定病例的传播速度。可以通
过多个监测人员中病例对应的交际范围的指示信息，确定不同病例之间的传播关系等等。
[0041]
通过本实施例的实施，本技术能够通过多个被监测人员的第一病例数据的多个时间序列，预测多个被监测人员的第二病例数据的时间序列，基于第二病例数据的时间序列，确定多个被监测人员中的病例传播信息。一方面，本技术能够自动预测病例传播信息，方便相关部门的管理。另一方面，本技术由于第二病例数据的时间序列，是由神经网络基于第一病例数据的时间序列来预测的，因此神经网络在预测时会考虑时间因素带来的影响，提高预测精度，进而提高最终得到的病例传播信息的准确度。
[0042]
进一步地，在上述应用神经网络进行预测之前，需要将神经网络训练至预期。具体可以如下：
[0043]
图4是本技术病例传播信息的预测方法另一实施例的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图4所示的流程顺序为限。如图4所示，本实施例可以包括：
[0044]
s21：获取多个训练人员的第一训练病例数据的多个时间序列。
[0045]
在一些实施例中，训练人员的第一训练病例数据可以包括训练参考时段训练人员的病例的第一指示信息等等。该方式在对训练过程的时间要求高、其他指示信息难获取等情况下适用。
[0046]
在一些实施例中，训练人员的第一训练病例数据还可以包括训练参考时段训练人员的天气指示信息、生活质量指示信息、身体状况指示信息、交际范围指示信息等等。
[0047]
s22：利用神经网络对第一训练病例数据的多个时间序列进行预测，得到多个训练人员的第二训练病例数据的时间序列。
[0048]
第二训练病例数据可以包括训练监测时段训练人员的病例的第一指示信息。
[0049]
s23：基于多个训练人员的第二训练病例数据的时间序列，调整神经网络的参数。
[0050]
可以基于第二训练病例数据包括的病例的第一指示信息与对应真值之间的差异构建损失函数，基于损失函数调整神经网络的参数。损失函数可以是均方根误差(root mean square error，rmse)、绝对均值误差(mean absolute relative errors，mare)。
[0051]
进一步地，在训练人员的第一训练病例数据仅包括训练参考时段训练人员的病例的第一指示信息，而不包括病例的第二指示信息的情况下，还可以将训练人员的病例的第二指示信息加入到再次训练环节。再次训练的流程可以是利用第一训练病例数据的多个时间序列对神经网络的训练效果未达到预期的情况下触发的，也可以是病例的第二指示信息的获取难度降低的情况下触发的。以未达到预期的情况为例，再次训练具体可以如下：
[0052]
图5是本技术病例传播信息的预测方法另一实施例的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图5所示的流程顺序为限。如图5所示，本实施例可以包括：
[0053]
s31：判断利用第一训练病例数据的多个时间序列对神经网络的训练效果是否达到预期。
[0054]
若是，则执行s32；否则执行s33。
[0055]
s32：不进行再次训练。
[0056]
s33：利用多个训练人员的第三训练病例数据的时间序列对神经网络进行再次训练。
[0057]
第三训练病例数据包括训练参考时段训练人员的病例的第一指示信息和病例的第二指示信息。第三训练病例数据和第一训练病例数据对应的时间段可以相同，也可以不同。再次训练的过程与利用第一训练病例数据的多个时间序列对神经网络的训练过程类似，具体参考前面的实施例，在此不赘述。
[0058]
如下以具体实例的形式对本技术提供的方法进行说明：
[0059]
1、结合图6～图7说明神经网络的训练。
[0060]
step1：准备传染病a的数据集，包括训练人员的病例的第一指示信息。可以确定训练数据集的地域范围、时间范围，基于地域范围和时间范围从权威机构下载得到传染病a的数据集。
[0061]
step2：数据集预处理。可以删除数据集中的日期列，使用一周的窗口大小对余下的观察值序列的转换，得到lstm适应的数据集，即关于传染病a的第一训练病例数据的多个时间序列。
[0062]
step3：lstm的训练。
[0063]
将第一训练病例数据的多个时间序列输入lstm，得到输出，即第二训练病例数据的实际序列。
[0064]
输入和输出的示例见下表1：
[0065][0066][0067]
如表1所示，am代表第m天对应的时间序列，可以将a1～a7输入 lstm，得到a8；将a2～a8输入lstm，得到a9；将a3～a9输入lstm，得到a10；将a4～a10输入lstm，得到a11；
…
。
[0068]
计算输出的预测值与实际值之间的rmse和mare，基于rmse 和mare调整lstm的参数。具体示例见下表2：
[0069]
确诊病例的rmse死亡病例的rmsex1y1确诊病例的mare死亡病例的marea1b1
[0070]
step4：分析lstm。
[0071]
若训练效果未达到预期，收集新的传染病a的数据集，包括训练人员的病例的第一指示信息和病例的第二指示信息。对新的传染病a的数据集处理得到第三训练病例数据的时间序列，并将第三病例数据的时间序列应用于对lstm的再次训练，得到更高准确度的lstm。
[0072]
2、lstm的应用。
[0073]
step1：获取最近7天的多个监测人员的第一病例数据的多个时间序列。
[0074]
step2：将第一病例数据的多个时间序列输入lstm，得到第二病例数据的时间序列。
[0075]
step3：基于第二病例数据的时间序列得到未来1天的病例数量。
[0076]
图8是本技术电子设备一实施例的结构示意图。如图8所示，该电子设备包括处理器21、与处理器21耦接的存储器22。
[0077]
其中，存储器22存储有用于实现上述任一实施例的方法的程序指令；处理器21用于执行存储器22存储的程序指令以实现上述方法实施例的步骤。其中，处理器21还可以称为cpu(central processing unit，中央处理单元)。处理器21可能是一种集成电路芯片，具有信号的处理能力。处理器21还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0078]
本实施例提及的电子设备可以是接入管理节点，也可以是与接入管理节点建立有连接的其他设备。
[0079]
图9是本技术计算机可读存储介质一实施例的结构示意图。如图9 所示，本技术实施例的计算机可读存储介质30存储有程序指令31，该程序指令31被执行时实现本技术上述实施例提供的方法。其中，该程序指令31可以形成程序文件以软件产品的形式存储在上述计算机可读存储介质30中，以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本技术各个实施方式方法的全部或部分步骤。而前述的计算机可读存储介质30包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram， random access memory)、磁碟或者光盘等各种可以存储程序代码的介质，或者是计算机、服务器、手机、平板等终端设备。
[0080]
在本技术所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0081]
另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。以上仅为本技术的实施方式，并非因此限制本技术的专利范围，凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本技术的专利保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种具保健功效的植物油复方软胶囊及其制备方法与流程

病例传播信息的预测方法、电子设备及存储介质与流程

相关文献

最热文献