疾病风险预测方法、装置、设备及存储介质与流程

2022-06-16 04:20:55 来源：中国专利 TAG：

1.本技术属于数据分析技术领域，尤其涉及一种疾病风险预测方法、装置、设备及存储介质。

背景技术：

2.近年来，受到环境污染和生活方式改变的影响，加之居民普遍对影响健康的风险因素认识不足，我国居民的健康状况不容乐观，慢性疾病人群的比例逐年升高，慢性病是一大类受环境因素和遗传因素共同影响的多因素疾病，是由多种风险因素综合作用产生的结果。
3.由于慢性病起病隐匿，潜伏期长、病情进展快，很多患者难以及时发现及治疗，因此需要对疾病风险的进行预测。

技术实现要素：

4.本技术实施例提供一种疾病风险预测方法、装置、设备及存储介质，提高疾病风险预测的准确性。
5.第一方面，本技术实施例提供一种疾病风险预测方法，包括：
6.获取用户的用户数据，所述用户数据包括生理特征数据和行为习惯数据和饮食习惯数据中至少一种数据；
7.对所述用户数据进行分组，得到n个判定标准组数据，所述判定标准组数据包括多个第一风险因素数据，所述多个第一风险因素数据为满足预设相关联条件的所述用户数据中与预设疾病相关联的第一风险因素数据，n为正整数；
8.针对每个判定标准组数据，根据第一风险因素的预设赋值规则和预设权重系数对所述第一风险因素数据进行处理，得到所述判定标准组数据的第一风险概率；
9.根据n个所述第一风险概率，预测所述用户患所述预设疾病的风险概率。
10.第二方面，本技术实施例提供一种疾病风险预测装置，包括：
11.获取模块，用于获取用户的用户数据，所述用户数据包括生理特征数据和行为习惯数据和饮食习惯数据中至少一种数据；
12.分组模块，用于对所述用户数据进行分组，得到n个判定标准组数据，所述判定标准组数据包括多个第一风险因素数据，所述多个第一风险因素数据为满足预设相关联条件的所述用户数据中与预设疾病相关联的第一风险因素数据，n为正整数；
13.处理模块，针对每个判定标准组数据，根据第一风险因素的预设赋值规则和预设权重系数对所述第一风险因素数据进行处理，得到所述判定标准组数据的第一风险概率；
14.预测模块，用于根据n个所述第一风险概率预测所述用户患所述预设疾病的风险概率。
15.第三方面，本技术实施例提供了一种电子设备，设备包括：处理器以及存储有计算机程序指令的存储器；
16.处理器执行计算机程序指令时实现如第一方面所示的疾病风险预测方法，
17.第四方面，本技术实施例提供了一种可读存储介质，计算机存储介质上存储有计算机程序指令，计算机程序指令被处理器执行时实现如第一方面所示的疾病风险预测方法。
18.本技术实施例提供的疾病风险预测方法，在获取目标用户的用户数据之后，将用户数据中的与预设疾病相关的风险因素数据根据预设相关联条件分成n个判定标准组数据；然后根据预设的风险因素赋值规则和权重系数分别对每个判定标准组中的风险因素数据进行预测，得到每个判定标准组的风险概率；根据每个判定标准组数据的风险概率，综合分析得出用户患预设疾病的风险概率。通过对用户的风险因素数据进行分组预测，再对不同分组的风险因素数据预测结果进行综合预测，得出用户患预设疾病的风险概率，实现对用户患预设疾病的风险概率的准确预测。
附图说明
19.为了更清楚地说明本技术实施例的技术方案，下面将对本技术实施例中所需要使用的附图作简单的介绍，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
20.图1是本技术实施例提供的疾病风险预测方法的流程示意图；
21.图2是本技术实施例提供的疾病风险预测方法的另一流程示意图；
22.图3是本技术实施例提供的疾病风险预测装置的结构示意图；
23.图4是本技术实施例提供的电子设备的结构示意图。
具体实施方式
24.下面将详细描述本技术的各个方面的特征和示例性实施例，为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及具体实施例，对本技术进行进一步详细描述。应理解，此处所描述的具体实施例仅意在解释本技术，而不是限定本技术。对于本领域技术人员来说，本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
25.需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括
……”
限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
26.近年来，受到环境污染和生活方式改变的影响，加之居民普遍对影响健康的风险因素认识不足，我国居民的健康状况不容乐观，慢性疾病人群的比例逐年升高，亚健康状态的人群更是超过人群总数的70％，亚健康状态是指人体处于健康与疾病之间的一种生理机能失衡状态。常表现为疲乏无力、头昏头痛、心悸胸闷、睡眠紊乱、精力不足等。当机体生理机能失衡持续到某个临界点，人体组织器官会发生病理性改变，甚至发展到器质性损害，则
相应的疾病已经发生，也就错过了治疗未病的良机。若能定期并采集居民的健康信息进行评估和风险预警，对影响健康的因素进行人工干预，让居民重视自己的健康状况，采取必要措施改善生活环境、改变生活方式，可以使大部分亚健康状态人群的生理机能恢复正常或者延缓慢性疾病的发生。
27.目前现有的健康预测技术，大多采取问卷调查的形式完成风险因素的采集，未实时采集生理检测数据，依赖于主观判断，缺少量化的检测数据支撑，不能客观反映实际的身体状况，影响实际预测效果。其次，现有的计算机评估系统不能对各类疾病风险模型进行灵活配置和调整，影响评估效果和工作效率。最后，现有的疾病风险预测方法是直接对所有的风险因素进行综合分析，对疾病风险因素设置相同或固定的权重系数，不能真实地反映各种风险因素在不同人群中对疾病风险的影响程度，导致疾病风险预测缺乏客观性，影响预测结果的准确。
28.下面对本技术中涉及的一些名词进行解释：
29.cox回归模型，又称比例风险回归模型(proportional hazards model，简称cox模型)，是一种半参数的模型，顾名思义，它是介于参数和非参数之间的一种回归方法。由于对基线函数没有任何限制，只是利用部分似然函数估计出预测因素对身体健康的影响，集合了参数模型和非参数模型两者之间的优点，是一种多因素的生存分析方法。它可以分析带有删失生存时间的资料，同时可以分析诸多因素对生存时间的影响，且不要求估计资料的生存函数的分布类型。
30.为了解决现有技术问题，本技术实施例提供了一种疾病风险预测方法、装置、设备及存储介质。下面首先对本技术实施例所提供的疾病风险预测方法进行介绍。
31.图1示出了本技术一个实施例提供的疾病风险预测方法的流程示意图。如图1所示，该方法包括步骤101至步骤102：
32.步骤101，获取用户的用户数据。
33.在步骤101中，获取用户的用户数据。其中，用户数据包括生理特征数据和行为习惯数据和饮食习惯数据中至少一种数据。生理特征数据可以包括：血压、心率、血脂、血糖等生理指标数据。
34.在一些实施例中，生理特征数据可以通过健康检测设备采集，自动上传并保存在健康指标数据库。行为习惯数据和饮食习惯数据可以通过设置调查问卷，在设备显示屏上展示问卷调查内容，通过选择问卷选项，采集个体的生活运动习惯等数据，通过网络自动上传到健康问卷数据库。
35.步骤102，对用户数据进行分组，得到n个判定标准组数据。
36.在步骤102中，对用户数据进行分组，得到n个判定标准组数据。其中，判定标准组数据包括多个第一风险因素数据，多个第一风险因素数据为满足预设相关联条件的用户数据中与预设疾病相关联的第一风险因素数据，n为正整数。
37.其中，与预设疾病相关联的第一风险因素可以通过参考预设疾病的流行病学统计资料，将影响预设疾病的疾病风险因素量化，收集与预设疾病的发生有关联的第一风险因素集合。
38.具体地，对获取的用户数据进行分组，将用户数据中与与预设疾病相关联的第一风险因素数据，根据预设相关联条件将满足预设相关联条件的第一风险因素数据归到同一
判定标准组，得到n个判定标准组数据。一个判定标准组可视为疾病风险预测的一个判定条件。
39.在一些实施例中，预设相关联条件可以为属性相近的风险因素，即预设相关联条件可以是参考预设疾病的临床资料将属性相近的风险因素(如：体质、血脂、腰围为相近属性的风险因素)归到同一判定标准组，作为疾病风险预测的一个判定组，如：判定标准a组、判定标准b组。
40.步骤103，针对每个判定标准组数据，根据第一风险因素的预设赋值规则和预设权重系数对第一风险因素数据进行处理，得到判定标准组数据的第一风险概率。
41.其中，预设赋值规则可以根据临床经验以及医学资料根据实际情况来设置，例如：对于年龄数据，预设赋值规则可以设定为50岁以下分值为1；50岁以上的确定分值为2。预设权重系数可以通过对预设疾病的流行病学统计资料中的历史数据进行统计分析来确定，也可以根据临床经验来设定。
42.在一些实施例中，可以根据预设赋值规则和第一风险因素的权重系数(或预设权重系数)通过公式(2)计算风险概率值；
[0043][0044]
其中，y为风险概率，k为第一风险因素的数量，xi是第一风险因素数据的分值，βi为第一风险因素的权重系数，α为误差值。
[0045]
将判定标准组数据包括多个第一风险因素数据利用上述公式(1)即可得到判定标准组数据的第一风险概率。
[0046]
步骤104，根据n个第一风险概率，预测用户患预设疾病的风险概率。
[0047]
具体地，根据每个判定标准组数据的风险概率，综合分析得出用户患预设疾病的风险概率。
[0048]
本技术实施例提供的疾病风险预测方法，在获取目标用户的用户数据之后，将用户数据中的与预设疾病相关的风险因素数据根据预设相关联条件分成n个判定标准组数据；然后根据预设的风险因素赋值规则和权重系数分别对每个判定标准组中的风险因素数据进行预测，得到每个判定标准组的风险概率；根据每个判定标准组数据的风险概率，综合分析得出用户患预设疾病的风险概率。通过对用户的风险因素数据进行分组预测，再对不同分组的风险因素数据预测结果进行综合预测，得出用户患预设疾病的风险概率，实现对用户患预设疾病的风险概率的准确预测。
[0049]
在一些实施例中，如图2所示，在s102之前，为了确定n个判定标准组的分组标准以及每个判定标准组中第一风险因素的预设赋值规则和预设权重系数，还可以包括以下s201至s205：
[0050]
s201、根据预设疾病的流行病学统计资料确定与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据；
[0051]
s202、根据第一风险因素的类型将第一风险因素分成多个第一风险因素组；
[0052]
s203、通过cox多因素回归模型分别对每个第一风险因素组的样本数据进行分析，得到每个第一风险因素的赋值规则和权重系数；
[0053]
s204、根据第一风险因素组中的第一风险因素的赋值规则和权重系数，得到第一风险因素组中样本数据的第二风险概率；
[0054]
s205、根据第一风险因素组的第二风险概率曲线与预设疾病的实际发生概率曲线的拟合度，对多个第一风险因素组进行调整，得到n个判定标准组以及每个判定标准组中第一风险因素的赋值规则和权重系数。
[0055]
本实施例中得到的n个判定标准组以及每个判定标准组中第一风险因素的赋值规则和权重系数，即为步骤103中的预设赋值规则和预设权重系数。
[0056]
在本实施例中，设计了分组标准判定规则的方法，将满足预设相关联条件的第一风险因素归集为同一判定标准组，可以根据每个判定标准组下的疾病风险概率与实际疾病发生概率的相似度(即第二风险概率曲线与预设疾病的实际发生概率曲线的拟合度)，对判定标准组进行灵活组合，得到n个判定标准组以及每个判定标准组中第一风险因素的赋值规则和权重系数，以提高预测结果的准确性。本技术实施例中可以确定对预设疾病进行预测所需的n个判定标准组中的多个第一风险因素的预设相关联条件。
[0057]
在s201中，根据预设疾病的流行病学统计资料确定与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据。
[0058]
具体地，获取预设疾病的流行病学统计资料，可以包括预设疾病的临床医疗数据、临床试验数据等数据。例如：医疗卫生工作记录(病历、医学检查记录、出生死亡报表等)、健康检查记录、专题调查或实验研究资料等等。对获取的预设疾病的流行病学统计资料进行统计分析之后，依据统计数据或者临床经验将影响患预设疾病概率的风险因素确定为第一风险因素，即将与预设疾病的发生概率高度相关的因素确定为第一风险因素，与风险因素对应的数据即为样本数据。
[0059]
在一些实施例中，根据预设疾病的流行病学统计资料确定与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据，可以包括：
[0060]
根据预设疾病的流行病学统计资料确定与预设疾病相关联的初始风险因素以及每个初始风险因素对应的样本数据；
[0061]
通过cox单因素回归模型对每个初始风险因素的数据进行分析，将显著性小于第二预设阈值的初始风险因素确定为预设疾病相关联的第一风险因素，得到与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据。
[0062]
具体地，在对预设疾病的流行病学统计资料进行初步统计分析之后，可以确定影响预设疾病患病概率的初始风险因素以及对应的初始样本数据。对于获得的初始风险因素，可能存在对于预设疾病患病概率影响较小或者并不相关的风险因素，因此为了提高预测的准确性，可以通过cox单因素回归模型对初步风险因素对应的初始样本数据进行分析，筛选出与预设疾病患病风险概率显著相关的第一风险因素，即，对于每个初始风险因素对应的初始样本数据，利用cox单因素回归模型进行分析，将显著性小于第二预设阈值的初始风险因素确定为预设疾病相关联的第一风险因素。
[0063]
在本技术实施例中，对预设疾病的初始风险因素进行筛选，可以将与预设疾病没有显著相关的风险因素剔除，进一步提高了预测准确性。
[0064]
在s202中，根据第一风险因素的类型将第一风险因素分成多个第一风险因素组。
[0065]
在本实施例中，可以通过参考预设疾病的临床资料将属性相近的风险因素归到同
一第一风险因素组，例如：将体质、血脂、腰围等相近属性的风险因素列为一组。
[0066]
在s203中，通过cox多因素回归模型分别对每个第一风险因素组的样本数据进行分析，得到每个第一风险因素的赋值规则和权重系数。
[0067]
具体地，针对每一组第一风险因素组对应的样本数据通过cox多因素回归模型进行分析，首先根据预设的赋值规则对每个第一风险因素对应的样本数据进行赋值(例如：对于样本数据中的年龄数据，对50岁以下的样本数据确定分值为1；50岁以上的确定分值为2)，将赋值后的样本数据通过cox多因素回归模型进行处理即可得到每个第一风险因素的相对危险值，通过相对危险值可以确定第一风险因素的权重系数。
[0068]
其中，相对危险值反映自变量对阳性结局的影响程度，表示的是暴露相对于对照对阳性事件发生造成的影响。能直观的表达为影响的倍数或者比例。因此，可以通过相对危险值确定自变量的权重系数，即本技术的第一风险因素的权重系数。
[0069]
在一些实施例中，第一风险因素的权重系数β可以通过公式(2)计算得到。
[0070]
hr＝exp(β)
ꢀꢀꢀ
(2)
[0071]
其中，hr为相对危险值，β为权重系数。
[0072]
在s204中，根据第一风险因素组中的第一风险因素的赋值规则和权重系数，得到第一风险因素组中样本数据的第二风险概率。
[0073]
具体地，基于s203中确定的每个第一风险因素组中的每个第一风险因素的赋值规则以及权重系数可以计算得到每个第一风险因素组的风险概率值。即，先根据预设的赋值规则对样本数据进行赋值，得到每个第一风险因素的样本数据的分值(即自变量)，通过每个第一风险因素组中第一风险因素对应的数据的分值和权重系数即可计算得到每个第一风险因素组对应数据的风险概率值(即第二风险概率)。
[0074]
在一些实施例中，可以根据预设赋值规则和第一风险因素的权重系数(或预设权重系数)通过上述公式(1)即可计算得到第二风险概率值。
[0075]
s205、根据第一风险因素组的第二风险概率曲线与预设疾病的实际发生概率曲线的拟合度，对多个第一风险因素组进行调整，得到n个判定标准组以及每个判定标准组中第一风险因素的赋值规则和权重系数。
[0076]
具体地，根据s204中获取的第一风险因素组中样本数据的第二风险概率，获得第一风险因素组中样本数据的预测风险概率曲线(即第二风险概率曲线)；然后根据样本数据的真实数据，统计分析得到预设疾病的实际发生概率曲线；通过预测风险概率曲线与实际发生概率曲线的拟合优度大小来确定预测风险概率曲线与实际发生概率曲线的相似度；依据每一个第一风险因素组的数据的拟合度可以判断该分组经过cox多因素回归分析后得到的权重系数是否准确，进而对初步分组得到的多个第一风险因素组进行调整，以使调整后得到的n个判定标准组，满足预设相关联条件(判定标准组中的第一风险因素满足类型相近或者预测风险概率曲线满足预设条件)。
[0077]
其中，度量拟合优度(即拟合度)的统计量是可决系数(亦称确定系数)r2。r2最大值为1。r2的值越接近1，说明预测风险概率曲线对实际发生概率曲线的拟合程度越好，相似度越大；反之，r2的值越小，说明预测风险概率曲线对实际发生概率曲线的拟合程度越差，相似度越小。
[0078]
在本实施例中，在对一组第一风险因素数据进行分析时，采用逐步回归法剔除无
统计学意义的自变量(即第一风险因素)，调整风险因素权值和误差数值，提高曲线间的拟合度。
[0079]
在一些实施例中，根据第一风险因素组的第二风险概率曲线与预设疾病实际发生概率曲线的拟合度，对多个第一风险因素组进行调整，得到n个判定标准组以及每个判定标准组中第一风险因素的赋值规则和权重系数，可以包括：
[0080]
针对每个第一风险因素组，分别执行以下操作：
[0081]
在第一风险因素组的第二风险概率曲线与预设疾病的的实际发生概率曲线的拟合度不大于第二预设阈值的情况下，将第一风险因素组确定为第二风险因素组；
[0082]
在第一风险因素组的第二风险概率曲线与预设疾病的的实际发生概率曲线的拟合度大于第一预设阈值的情况下，将第一风险因素组确定为判定标准组，得到n个判定标准组。
[0083]
具体地，若第一风险因素组中样本数据的预测风险概率曲线(即第二风险概率曲线)与实际预设疾病发生概率曲线的拟合优度大于第二预设阈值(例如，r2小于0.8)，则说明该第一风险因素组中的第一风险因素的权重系数准确，则将该第一风险因素组确定为判定标准组；若拟合优度大于第二预设阈值(例如，r2小于0.8)，则说明该第一风险因素组中的第一风险因素的权重系数不准确或者分组不准确，则将该第一风险因素组，确定为第二风险因素组。
[0084]
在本实施例中，通过获第一风险因素组中样本数据的预测风险概率曲线(即第二风险概率曲线)与实际预设疾病发生概率曲线的拟合优度值，可以筛选出符合预测标准的第一风险因素组，将第二风险概率曲线符合预测标准的分组确定为判定标准组，进一步提高了预测的准确性。
[0085]
在一些实施例中，根据第一风险因素组的第二风险概率曲线与预设疾病实际发生概率曲线的拟合度，对多个风险因素组进行调整，得到n个判定标准组以及每个判定标准组中风险因素的赋值规则和权重系数，还可以包括：
[0086]
针对每个第二风险因素组，分别执行以下操作：
[0087]
将第二风险因素组与第i个判定标准组合并，组成第三风险因素组，i为正整数，且i≤n；
[0088]
通过cox多因素回归模型对第三风险因素组的数据进行分析，得到第三风险因素组中每个第一风险因素的赋值规则和权重系数；
[0089]
根据第三风险因素组中的风险因素的赋值规则和权重系数，得到第三风险因素组中样本数据的第三风险概率；
[0090]
在第三风险因素组的第三风险概率曲线与预设疾病的的实际发生概率曲线的拟合度不大于第一预设阈值的情况下，按照i＝i 1的方式更新i，并返回将第二风险因素组与第i个判定标准组合并，组成第三风险因素组，直到满足第三风险因素组的第三风险概率曲线与预设疾病的的实际发生概率曲线的拟合度大于第一预设阈值；
[0091]
在第三风险因素组的第三风险概率曲线与预设疾病的的实际发生概率曲线的拟合度大于第一预设阈值的情况下，将第三风险因素组更新为第i个判定标准组，或i≥n，删除第二风险因素组。
[0092]
具体地，在本实施例中，对于第二风险因素组，可以通过与符合预测标准的判定标
准组进行合并分析来对第一风险因素的分组进行调整。即，将第二风险因素组与的判定标准组进行合并分析，即，将第二风险因素组与已确定的一个判定标准组合并，组成第三风险因素组，对第三风险因素组再进行cox多因素回归分析，采用与s203至s205相同的方法，进行cox多因素回归分析，得到第三风险因素组的第三风险概率，然后根据第三风险概率曲线与预设疾病的的实际发生概率曲线的拟合度来确定，是否能将该第二风险因素组与该判定标准组合并，若满足预设条件，则将合并后的第三粉线因素组更新为该判定标准组，若不满足预设条件，则将该第二风险因素组与下一个判定标准组合并重复上述步骤，直到和并的第三风险因素组符合预设条件；若该第二风险因素组与每一个判定标准组合并都无法满足预设条件，则删除第二该风险因素组。
[0093]
在本实施例中，根据第一风险因素组的第二风险概率曲线与预设疾病实际发生概率曲线的拟合度，对多个风险因素组进行调整，可以进一步筛选出与预设疾病的患病概率并无显著相关的风险因素，得到的判定标准组的预测风险概率值与实际值的相似度较高，进一步提高了预测的准确性。
[0094]
在一些实施例中，步骤104中的根据n个第一风险概率，预测用户患预设疾病的风险概率，具体可以包括：
[0095]
计算n个第一风险概率的平均值，得到用户患预设疾病的风险概率。
[0096]
在本实施例中，通过对分组的风险因素数据预测结果进行综合预测，得出用户患预设疾病的风险概率，进一步提高了预测的准确性。
[0097]
以下结合一具体应用例对本技术实施例进行说明，在根据用户数据进行预设疾病风险预测时，可以采用以下步骤。
[0098]
步骤1，参考某类疾病的流行病学统计资料，以该类疾病在人群中的实际发生概率，将疾病发生的风险(患某种疾病的风险概率)设置为四个等级，分别为极低风险(25％以下患病比例)，低风险(25％～50％患病比例)，中等风险(50％～75％患病比例)，高风险(75％以上患病比例)，风险越高则患该类疾病的风险越大。将影响某类疾病的疾病风险因素量化，收集与该类疾病的发生有关联的风险因素集合(即根据预设疾病的流行病学统计资料确定与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据)。
[0099]
步骤2，利用cox单因素回归分析法对每个风险因素进行分析，筛选出与该类疾病显著相关的疾病风险因素数据集；并根据显著程度赋予每个风险因素以不同的分值。(即通过cox单因素回归模型对每个初始风险因素的数据进行分析，将显著性小于第二预设阈值的初始风险因素确定为预设疾病相关联的第一风险因素，得到与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据)。
[0100]
步骤3、给该数据集进行分组。参考该类疾病的临床资料将属性相近的风险因素(如：体质、血脂、腰围为相近属性的风险因素)归到同一判定标准组，作为疾病风险等级的一个判定条件，如：判定标准a组、判定标准b组。依次初步完成疾病风险等级的全部判定条件的设置(即根据所述第一风险因素的类型将所述第一风险因素分成多个第一风险因素组)。
[0101]
步骤4、对各判定标准组的风险因素分别进行cox多因素综合回归分析，比较预测风险因素曲线与实际疾病发生曲线的相似度。预测函数为：y＝β1x1
…
βkxk α，其中y是因变量，即患某种疾病的风险概率，x1
…
xk是自变量，即影响某种疾病的疾病风险因素评估分
值，β1
…
βk为各项疾病风险因素评估分值的权重系数，α为误差值。用逐步回归法剔除无统计学意义的自变量，调整风险因素权值和误差数值，提高曲线间的拟合度。将两者相似度小于某个值(如：＜0.8)的n个判定标准组进行合并分析，即在同时满足n个判定标准组的情况下，再次以cox多因素综合回归分析方法验证疾病风险预测发生率与实际发生率的相似度，直到预测值与实际值的相似度大于等于某个值(如：≥0.8)，将该合并的n个标准组作为一个判定条件，依次类推，最终确定该类疾病的全部预测评估标准(即，通过cox多因素回归模型分别对每个第一风险因素组的样本数据进行分析，得到每个第一风险因素的赋值规则和权重系数；根据第一风险因素组中的第一风险因素的赋值规则和权重系数，得到第一风险因素组中样本数据的第二风险概率；根据第一风险因素组的第二风险概率曲线与预设疾病的实际发生概率曲线的拟合度，对多个第一风险因素组进行调整，得到n个判定标准组以及每个判定标准组中第一风险因素的赋值规则和权重系数)。
[0102]
步骤5、将上述分组标准判定规则和预测评估标准生成该类疾病的计算机预测模型，以便于在疾病风险评估系统完成对输入的疾病风险因素数据进行自动评估预测。
[0103]
步骤6、采集用户的健康信息及检测数据，以健康检测设备采集个体的血压、心率、血脂、血糖等生理指标数据，自动上传并保存在健康指标数据库。根据步骤01所述的疾病风险因素设置调查问卷，在设备显示屏上展示问卷调查内容，通过选择问卷选项，采集个体的生活运动习惯等数据，通过网络自动上传到健康问卷数据库，系统对以上数据进行结构化处理，得到量化的疾病风险标准数据(即，获取用户的用户数据，用户数据包括生理特征数据和行为习惯数据和饮食习惯数据中至少一种数据)。
[0104]
步骤7、疾病风险评估系统的数据筛选模块根据疾病预测模型的分组标准，自动筛选出步骤5得到的疾病风险标准数据，数据预处理模块对数据进行清洗后转化成符合评估要求的数据，数据分析模块将转化后的数据进行分组，并赋予各分组中的指标数据不同的分值和权值，风险评估模块对分组数据进行综合评估，形成评估结果(即，针对每个判定标准组数据，根据第一风险因素的预设赋值规则和预设权重系数对第一风险因素数据进行处理，得到判定标准组数据的第一风险概率；根据n个第一风险概率，预测用户患预设疾病的风险概率)，健康报告模块将评估结果与疾病风险等级匹配，输出最终的疾病风险报告。
[0105]
本技术实施例提供的疾病风险预测方法，可以在获取目标用户的用户数据之后，将用户数据中的与预设疾病相关的风险因素数据根据预设相关联条件分成n个判定标准组数据；然后根据预设的风险因素赋值规则和权重系数分别对每个判定标准组中的风险因素数据进行预测，得到每个判定标准组的风险概率；根据每个判定标准组数据的风险概率，综合分析得出用户患预设疾病的风险概率。通过对用户的风险因素数据进行分组预测，再对不同分组的风险因素数据预测结果进行综合预测，得出用户患预设疾病的风险概率，实现对用户患预设疾病的风险概率的准确预测。
[0106]
如图3所示，本技术实施例还提供了一种疾病风险预测装置300，包括：获取模块301、分组模块302、处理模块303和预测模块304。
[0107]
获取模块301，用于获取用户的用户数据，用户数据包括生理特征数据和行为习惯数据和饮食习惯数据中至少一种数据。
[0108]
第一分组模块302，用于对用户数据进行分组，得到n个判定标准组数据，判定标准组数据包括多个第一风险因素数据，多个第一风险因素数据为满足预设相关联条件的用户
数据中与预设疾病相关联的第一风险因素数据，n为正整数。
[0109]
处理模块303，用于针对每个判定标准组数据，根据第一风险因素的预设赋值规则和预设权重系数对第一风险因素数据进行处理，得到判定标准组数据的第一风险概率。
[0110]
预测模块304，用于根据n个第一风险概率预测用户患预设疾病的风险概率。
[0111]
可选地，上述疾病风险预测装置300，还可以包括：
[0112]
第一确定模块，用于根据预设疾病的流行病学统计资料确定与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据
[0113]
第二分组模块，用于根据所述第一风险因素的类型将所述第一风险因素分成多个第一风险因素组；
[0114]
第一分析模块，用于通过cox多因素回归模型分别对每个第一风险因素组的样本数据进行分析，得到每个第一风险因素的赋值规则和权重系数；
[0115]
计算模块，用于根据第一风险因素组中的第一风险因素的赋值规则和权重系数，得到第一风险因素组中样本数据的第二风险概率；
[0116]
调整模块，用于根据第一风险因素组的第二风险概率曲线与预设疾病的实际发生概率曲线的拟合度，对多个第一风险因素组进行调整，得到n个判定标准组以及每个判定标准组中第一风险因素的赋值规则和权重系数。
[0117]
可选地，上述处理模块303，具体可以用于根据第一风险因素的预设赋值规则对判定标准组中的第一风险因素数据进行赋值，得到每个第一风险因素数据的分值；
[0118]
通过上述公式(1)计算判定标准组数据的第一风险概率。
[0119]
可选地，上述调整模块，具体可以用于针对每个第一风险因素组，分别执行以下操作：
[0120]
在第一风险因素组的第二风险概率曲线与预设疾病的的实际发生概率曲线的拟合度不大于第二预设阈值的情况下，将第一风险因素组确定为第二风险因素组；
[0121]
在第一风险因素组的第二风险概率曲线与预设疾病的的实际发生概率曲线的拟合度大于第一预设阈值的情况下，将第一风险因素组确定为判定标准组，得到n个判定标准组。
[0122]
可选地，上述调整模块，具体还可以用于：
[0123]
针对每个第二风险因素组，分别执行以下操作：
[0124]
将第二风险因素组与第i个判定标准组合并，组成第三风险因素组，i为正整数，且i≤n；
[0125]
通过cox多因素回归模型对第三风险因素组的数据进行分析，得到第三风险因素组中每个第一风险因素的赋值规则和权重系数；
[0126]
根据第三风险因素组中的风险因素的赋值规则和权重系数，得到第三风险因素组中样本数据的第三风险概率；
[0127]
在第三风险因素组的第三风险概率曲线与预设疾病的的实际发生概率曲线的拟合度不大于第一预设阈值的情况下，按照i＝i 1的方式更新i，并返回将第二风险因素组与第i个判定标准组合并，组成第三风险因素组，直到满足第三风险因素组的第三风险概率曲线与预设疾病的的实际发生概率曲线的拟合度大于第一预设阈值；
[0128]
在第三风险因素组的第三风险概率曲线与预设疾病的的实际发生概率曲线的拟
合度大于第一预设阈值的情况下，将第三风险因素组更新为第i个判定标准组，或i≥n，删除第二风险因素组。
[0129]
可选地，上述疾病风险预测装置300，还可以包括：
[0130]
第二确定模块，用于根据预设疾病的流行病学统计资料确定与预设疾病相关联的初始风险因素以及每个初始风险因素对应的样本数据；
[0131]
第二分析模块，用于通过cox单因素回归模型对每个初始风险因素的数据进行分析，将显著性小于第二预设阈值的初始风险因素确定为预设疾病相关联的第一风险因素，得到与预设疾病相关联的第一风险因素以及每个第一风险因素对应的样本数据。
[0132]
可选地，上述处理模块303，具体可以用于计算n个第一风险概率的平均值，得到用户患预设疾病的风险概率。
[0133]
本技术实施例提供的疾病风险预测装置，可以在获取目标用户的用户数据之后，将用户数据中的与预设疾病相关的风险因素数据根据预设相关联条件分成n个判定标准组数据；然后根据预设的风险因素赋值规则和权重系数分别对每个判定标准组中的风险因素数据进行预测，得到每个判定标准组的风险概率；根据每个判定标准组数据的风险概率，综合分析得出用户患预设疾病的风险概率。通过对用户的风险因素数据进行分组预测，再对不同分组的风险因素数据预测结果进行综合预测，得出用户患预设疾病的风险概率，实现对用户患预设疾病的风险概率的准确预测。
[0134]
图4示出了本技术实施例提供的电子设备的硬件结构示意图。
[0135]
在电子设备可以包括处理器401以及存储有计算机程序指令的存储器402。
[0136]
具体地，上述处理器401可以包括中央处理器(cpu)，或者特定集成电路(application specific integrated circuit，asic)，或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0137]
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制，存储器402可包括硬盘驱动器(hard disk drive，hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus，usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下，存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下，存储器402可在综合网关容灾设备的内部或外部。在特定实施例中，存储器402是非易失性固态存储器。
[0138]
存储器可包括只读存储器(rom)，随机存取存储器(ram)，磁盘存储介质设备，光存储介质设备，闪存设备，电气、光学或其他物理/有形的存储器存储设备。因此，通常，存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如，存储器设备)，并且当该软件被执行(例如，由一个或多个处理器)时，其可操作来执行参考根据本公开的一方面的方法所描述的操作。
[0139]
处理器401通过读取并执行存储器402中存储的计算机程序指令，以实现上述实施例中的任意一种人车重识别模型训练方法，或者实现上述实施例中的任意一种人车重识别方法。
[0140]
在一个示例中，电子设备还可包括通信接口403和总线404。其中，如图4所示，处理器401、存储器402、通信接口403通过总线404连接并完成相互间的通信。
[0141]
通信接口403，主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的
通信。
[0142]
总线404包括硬件、软件或两者，将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制，总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下，总线404可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线，但本技术考虑任何合适的总线或互连。
[0143]
另外，结合上述实施例中的疾病风险预测方法，本技术实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令；该计算机程序指令被处理器执行时实现上述实施例中的任意一种疾病风险预测方法。
[0144]
需要明确的是，本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见，这里省略了对已知方法的详细描述。在上述实施例中，描述和示出了若干具体的步骤作为示例。但是，本技术的方法过程并不限于所描述和示出的具体步骤，本领域的技术人员可以在领会本技术的精神后，作出各种改变、修改和添加，或者改变步骤之间的顺序。
[0145]
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时，其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时，本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中，或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路，等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
[0146]
还需要说明的是，本技术中提及的示例性实施例，基于一系列的步骤或者装置描述一些方法或系统。但是，本技术不局限于上述步骤的顺序，也就是说，可以按照实施例中提及的顺序执行步骤，也可以不同于实施例中的顺序，或者若干步骤同时执行。
[0147]
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解，流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器，以产生一种机器，使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解，框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合，也可以由执行指定的功能或动作的专用硬件来实现，或可由专用硬件和计算机指令的组合来实现。
[0148]
以上，仅为本技术的具体实施方式，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、模块和单元的具体工作过程，可以参考前述方法实施
例中的对应过程，在此不再赘述。应理解，本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：具有辅助翻身功能的家庭养老床的制作方法

疾病风险预测方法、装置、设备及存储介质与流程

相关文献

最热文献