冠心病的多基因遗传风险综合评分的构建方法与装置及应用与流程

2021-10-15 23:56:00 来源：中国专利 TAG：冠心病遗传基因及其应用装置

1.本发明是关于一种冠心病的多基因遗传风险综合评分(metaprs)的构建方法与装置及其应用。

背景技术：

2.心血管疾病(cvd)的发生发展受到遗传因素和环境因素的共同作用。
3.在心血管疾病的一级预防中，风险预测和评估起着至关重要的作用。遗传因素作为稳定且可量化的终生标记，长期以来一直被期望能用于疾病的风险评估，以促进心血管疾病的精准预防。在过去的10年里，全基因组关联研究已经成功识别出了上百个与冠心病以及冠心病相关表型(血脂水平、血压、2型糖尿病和bmi)存在显著关联的区域。最近，整合多个遗传变异信息的冠心病多基因遗传风险评分(prs)已经被成功开发，并用于冠心病风险预测的临床效用评估(eur.heart.j.37,561
‑
567(2016)； nat.genet.50,1219
‑
1224(2018)；j.am.coll.cardiol.72,1883
‑
1893(2018)；eur.heart. j.37,3267
‑
3278(2016)；jama323,627
‑
635(2020)；jama323,636
‑
645,(2020)；jamacardiol...3,693
‑
702(2018)；n.engl.j.med.375,2349
‑
2358(2016))。然而，几乎所有这些遗传评分均是基于欧洲人群构建的，不同人群间变异位点频率的不同、连锁不平衡模式的差异导致了欧洲人群的评分不能在东亚和中国人群中使用。其次不同人群间生活方式、其他危险因素以及潜在的基因
‑
环境交互作用的不同，也会导致这种异质性。有研究报道这些遗传评分的预测效果在其他种族群体中预测效能明显下降。
4.因此，迫切需要开发东亚人群特别是中国人群的遗传风险评分。

技术实现要素：

5.本发明的一个目的在于提供一种冠心病的多基因遗传风险评分的构建方法。
6.本发明的另一目的在于提供一种构建冠心病多基因遗传风险评分的装置。
7.具体而言，一方面，本发明提供了一种冠心病多基因遗传风险评分的构建方法，其是一种冠心病多基因遗传风险综合评分的构建方法，该方法包括步骤：
8.(1)筛选与冠心病相关或与冠心病相关表型相关(达到全基因组显著关联)的单核苷酸多态性位点(snp)的集合；其中冠心病相关表型包括：血压、2型糖尿病、血脂、肥胖和脑卒中；
9.(2)基于步骤(1)中的单核苷酸多态性位点进行基因分型；
10.(3)从全基因组关联研究结果中分别提取所测snp对应于多个亚表型的危险等位基因、效应值及p值，构建多个候选亚表型prs并筛选最佳亚表型prs；
11.(4)确定各个亚表型prs的权重；
12.(5)将亚表型prs的权重转化为snp水平的权重；
13.(6)构建冠心病多基因遗传风险综合评分metaprs。
14.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法
中，冠心病相关表型血压包括：收缩压、舒张压、脉压、平均动脉压和高血压；冠心病相关表型肥胖(体质指数)包括体重指数、腰围和腰臀比；冠心病相关表型血脂包括总胆固醇、低密度脂蛋白胆固醇、甘油三酯和高密度脂蛋白胆固醇。
15.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，所述多个亚表型包括：冠心病、体质指数、血压、2型糖尿病、总胆固醇、低密度脂蛋白胆固醇、甘油三酯、高密度脂蛋白胆固醇和脑卒中。即，本发明的冠心病多基因遗传风险评分的构建方法中，构建的多个候选亚表型prs包括：冠心病、脑卒中、2 型糖尿病、血压、体质指数、总胆固醇、低密度脂蛋白胆固醇、甘油三酯和高密度脂蛋白胆固醇的亚表型prs。
16.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，所述单核苷酸多态性位点的集合中纳入全基因组关联研究中被发现与冠心病或冠心病相关表型(冠心病相关危险因素)存在全基因组显著关联。具体地，所述单核苷酸多态性位点的集合中纳入：与冠心病或脑卒中相关的单核苷酸多态性位点，以及与血压、2型糖尿病、血脂、肥胖相关的单核苷酸多态性位点，还可以进一步选择性地纳入和动脉硬化临床表型相关的单核苷酸多态性位点。根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，所述冠心病多基因遗传风险评分是用于评估东亚人群冠心病发病风险，所述单核苷酸多态性位点的集合中纳入的单核苷酸多态性位点可以是所有人群的，例如可包括欧洲人群和东亚人群，其中的与血压、 2型糖尿病、血脂、肥胖和动脉硬化临床表型相关的单核苷酸多态性位点可以主要是东亚人群的。
17.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，进行基因分型的队列人群为东亚人群。
18.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，使用多重聚合酶链反应靶向扩增子测序技术进行基因分型。中位测序深度为982
×
。
19.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，基因分型过程中，可排除基因型检出率低于95％的snp，得到检测合格的snp集合。
20.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，是从大规模东亚人群全基因组关联研究结果中分别提取所测snp对应于多个亚表型的危险等位基因、效应值及p值。
21.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，构建各个亚表型prs的过程包括：
22.根据提取的p值大小分出多组snp，对于每组snp，基于队列人群数据，使用 plink软件clumping命令按照r2<0.2进行修剪，得到多组snp组合；
23.利用基因型数据，将个体snp风险等位基因数(0、1或2)根据其对应的效应值进行加权并求和构建多个纳入不同组合snp的候选prs，采用logistic回归模型评估这些候选prs与冠心病的关联，比值比(odds ratio,or)最大(prs每增加一个标准差)的评分被选作最佳亚表型prs。
24.根据本发明的更具体实施方案，上述构建各个亚表型prs的过程中，可以根据提取的p值大小分出n组snp，n大于等于2。例如，可按照p值0.5,0.4,0.3,0.2,0.1, 0.05,0.01,10
‑3,10
‑4,10
‑5,10
‑6,10
‑7从中选出9组、10组、11组或12组。
25.根据本发明的更具体实施方案，上述构建各个亚表型prs的过程中，当根据提取
的p值大小分出n组snp，按照连锁不平衡r2<0.2时，可得到n组snp组合，即可构建n个纳入不同组合snp的候选prs。
26.本发明中，可进一步通过pearson相关分析计算各个亚表型prs两两之间的相关系数r和p值。
27.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，可从所有队列人群按照预定比例选出部分人群作为训练集(其余部分人群可作为验证集)。所述构建亚表型prs、确定各个亚表型prs的权重的过程在训练集中进行。
28.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，确定各个亚表型prs的权重的过程包括：
29.将各个亚表型prs转化为均值为0、标准差为1的标准化评分；
30.利用训练集，将标化后的各个亚表型prs及要调整的协变量(年龄、性别)共同放入弹性网状logistic回归模型，选择auc最高的模型作为最终模型，从中获得每个prs的系数(β1…
β
n
，共n个prs)作为权重。
31.在本发明的一些具体实施方案中，弹性网状logistic回归模型可校正各个亚表型 prs之间的相关性，本发明利用该模型评估了9个(即n为9)亚表型prs与冠心病的关联，对比分析了弹性网状logistic回归估计的or值与单变量logistic回归估计的 or值。进一步地，本发明通过整合9种亚表型prs，将亚表型prs的权重转化为 snp水平的权重，构建冠心病metaprs并进行验证。
32.根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，将亚表型prs的权重转化为snp水平的权重的过程按照以下模型进行：
[0033][0034]
其中，σ1,
…
,σ
n
是训练集中每个(共n个)亚表型prs的标准差，α
j1
，...，α
jn
是第 i个snp对应于每个亚表型的效应值，如果第k个评分中未包含某个snp，则该snp 的效应值大小α
jk
设为0。
[0035]
根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，构建的冠心病多基因遗传风险综合评分metaprs为：
[0036]
metaprs＝∑βsnp_i
×
ni
[0037]
其中，βsnp_i是指第i个snp的效应值，ni指个体所携带第i个snp的效应等位基因数目。
[0038]
根据本发明的具体实施方案，本发明的冠心病多基因遗传风险综合评分的构建方法，还可进一步包括评价所构建的metaprs对冠心病风险预测和分层的作用的过程。
[0039]
根据本发明的具体实施方案，本发明的冠心病多基因遗传风险评分的构建方法中，优选地，以队列人群所有个体metaprs的20％和80％百分位数为切点，划分个体冠心病遗传发病风险为低、中、高危人群。
[0040]
另一方面，本发明还提供了一种用于构建冠心病多基因遗传风险综合评分的装置，该装置包括：
[0041]
基因分型模块，用于进行基因分型；
[0042]
亚表型prs构建模块，用于从全基因组关联研究结果中分别提取所测snp对应于
多个亚表型的危险等位基因、效应值及p值，并构建候选亚表型prs、筛选最佳亚表型prs；
[0043]
模型训练模块，用于在训练集中确定各个亚表型prs的权重；
[0044]
metaprs构建模块，用于将亚表型prs的权重转化为snp水平的权重并构建冠心病多基因遗传风险综合评分(metaprs)。
[0045]
根据本发明的具体实施方案，本发明的构建冠心病多基因遗传风险综合评分的装置中，还可选择性地包括snp筛选模块，用于筛选与冠心病相关或与冠心病相关表型相关的单核苷酸多态性位点(snp)的集合。
[0046]
根据本发明的具体实施方案，本发明的构建冠心病多基因遗传风险综合评分的装置中，基因分型模块还可用于在基因分型后排除基因型检出率低于95％的snp。
[0047]
根据本发明的具体实施方案，本发明的构建冠心病多基因遗传风险综合评分的装置中，选择性地，所述metaprs构建模块可进一步用于评价所构建的metaprs对冠心病风险预测和分层的作用。
[0048]
另一方面，本发明还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现利用本发明所述方法构建的冠心病多基因遗传风险综合评分评估个体冠心病发病风险。
[0049]
在本发明的具体实施方案中，为了精确评估东亚人群遗传变异与cad发病风险的关联效应值，本发明在51,531例冠心病病例和21,5934例对照中开展了全基因关联研究。然后整合9个冠心病及其相关表型遗传信息在2800例冠心病病例和2055例健康对照中构建多基因遗传风险评分，最后在41,271例中国人群前瞻性队列中进行验证和评价。本发明发现构建的多基因遗传风险评分对冠心病的发生具有很好的预测价值。研究发现，遗传风险高的个体(遗传风险上20％)发生冠心病的风险比遗传风险低的个体(遗传风险下20％)高约3倍(hr:2.93，95％ci:2.44
‑
3.51)，两组的冠心病终生风险分别为16.0％和5.8％。并且在男性和女性人群中，具有类似的预测效果。本研究证实多基因遗传风险综合评分可以实现冠心病风险精细化分层，本发明对于构建冠心病多基因遗传风险综合评分以及冠心病一级预防方面具有重要应用前景。
附图说明
[0050]
图1为本发明的研究流程图。其中，prs，多基因风险评分。
[0051]
图2显示成功分型的588个变异位点的测序深度。
[0052]
图3显示训练集中采用东亚和欧美gwas效应值比较冠心病prs与冠心病的关联。采用logistic回归模型计算比值比(ors)和95％可信区间(cis)，调整年龄和性别。分别使用东亚人群和欧洲uk biobank冠心病gwas数据的效应值作为snps 权重计算评分。设定不同的p值阈值(0.5,0.4,0.3,0.2,0.1,0.05,0.01,10
‑3,10
‑4,10
‑5, 10
‑6,10
‑7)分别构建12个包含不同snps组合的prs(连锁不平衡r2<0.2)。
[0053]
图4显示显示在不同的p值阈值下，训练集中的亚表型prss(每增加一个标准差)与cad的关联。采用logistic回归计算比值比(or)和95％可信区间(ci)，调整年龄和性别。
[0054]
图5为前瞻性队列中亚表型prs和metaprs的相关图。其中，*p<0.05，**p<10
‑3, ***p<10
‑
10
。
[0055]
图6显示训练集中亚表型多基因风险评分(每增加一个标准差)与冠心病的关联。
分别采用logistic回归和弹性网状logistic回归计算比值比(or)和95％可信区间(ci)，调整年龄和性别。
[0056]
图7显示前瞻性队列中metaprs(每增加一个标准差)和亚表型prs与cad 发病的危险比。采用以年龄作为时间尺度，调整队列来源和性别的cox模型来分析。
[0057]
图8显示不同遗传组(<20％，20％
‑
80％，>80％分组)冠心病发病的相对风险和绝对风险。其中采用调整性别和队列来源，以年龄为刻度，并考虑竞争风险的cox 模型估计不同遗传风险组hr和95％ci以及冠心病的累积发病率。虚线表示95％ci。 cad，冠心病；hr，风险比；ci，置信区间。
[0058]
图9显示按照性别分层，不同遗传组(<20％，20％
‑
80％，>80％分组)冠心病发病的相对风险和绝对风险。其中采用调整性别和队列来源，以年龄为刻度，并考虑竞争风险的cox模型估计不同遗传风险组hr和95％ci以及冠心病的累积发病率。虚线表示95％ci。cad，冠心病；hr，风险比；ci，置信区间。
具体实施方式
[0059]
为了对本发明的技术特征、目的和有益效果有更加清楚的理解，现结合具体实施例及对本发明的技术方案进行以下详细说明，应理解这些实例仅用于说明本发明而不用于限制本发明的范围。对本领域技术人员而言，在本发明的精神范围内所轻易思及的各种变化和/或修饰，皆被认定为涵盖于本发明的保护范围内。实施例中，各原始试剂材料均可商购获得，未注明具体条件的实验方法为所属领域熟知的常规方法和常规条件，或按照仪器制造商所建议的条件。
[0060]
实施例1
[0061]
研究设计流程与研究人群
[0062]
研究设计流程参见图1所示。本发明在2800例cad患者和2055例健康对照(表 1)中开发了一种用于cad的多基因风险评分(prs)，然后在大规模前瞻性队列人群中对其进行验证。训练集中的cad病例来自中国医学科学院阜外医院。心肌梗死 (mi)的诊断严格遵循以体征、症状、心电图和心脏酶活性为基础的诊断标准。结合既往是否诊断有心肌梗死病史，或左冠状动脉主干超过50％狭窄，或至少有一条主要心外膜血管狭窄>70％诊断为冠心病。
[0063]
验证队列来自china
‑
par研究的三个子队列，包括中国心血管健康多中心合作研究(interasia)、中国心血管流行病学多中心合作研究(chinamuca
‑
1998)、中国代谢综合征社区干预和中国家庭健康研究(cimic)(yang,x.et al.predicting the10
‑
year risks of atherosclerotic cardiovascular disease in chinese population:thechina
‑
par project(prediction for ascvd risk in china).circulation134,1430
‑
1440 (2016))。简单地说，chinamuca
‑
1998、interasia和cimic基线分别建立于1998 年、2000
‑
2001年和2007
‑
2008年。根据统一标准，2007
‑
2008年对interasia和 chinamuca
‑
1998进行了首次随访，2012
‑
2015以及2018
‑
2020年对所有三个队列进行了统一随访。在本研究中，共收集到独立于训练集的43,582例参与者的血液样本和主要协变量数据。在排除561例基因型缺失率高(>5.0％)或平均测序深度低(<30 层)、1352例基线时<30岁或>75岁、398例基线确诊冠心病的个体之后，最终共有 41,271例参与者纳入分析。
[0064]
所有研究均由中国医学科学院阜外医院伦理审查委员会批准。在数据收集前，每位参与者均签署了知情同意书。
[0065]
表1.训练集一般信息
[0066][0067][0068]
值为平均值(sd)或n(％)。
[0069]
数据收集和危险因素定义
[0070]
在严格的质量控制下，由经过培训的调查人员收集基线和随访期间的重要信息。使用标准问卷收集个人信息(性别、出生日期等)、生活方式信息(饮食习惯、体力活动等)、疾病史和cad家族史。参与者还接受了体格检查(体重、身高、血压等)，并提供空腹血样用以测量血脂和血糖水平。
[0071]
为了在随访期间获得疾病结局和死亡相关信息，研究人员对参与者或其代理人进行了随访，同时还收集了参与者的医疗记录(或死亡证明)。两名不了解基线信息的委员会成员独立地对结局事件进行了核实。如存在不一致的情况，其他委员会成员将参与讨论最后达成共识。冠心病发病定义为首次发生不稳定性心绞痛、非致死性急性心肌梗死或出现冠心病死亡。由心肌梗死或其他冠状动脉疾病引起的致命事件被定义为冠心病死亡。基线日期与冠心病发生日期、死亡日期或最后一次随访到的日期之间的时间间隔为随访人年。
[0072]
遗传变异位点选择和基因分型
[0073]
本发明首先选择了600个遗传变异位点，它们在全基因组关联研究中被发现与冠心病(n＝212)或冠心病相关危险因素存在全基因组显著关联(p<5
×
10
‑8)，包括脑卒中(n＝42)、血压(n＝56)、血脂(n＝130)、t2d(n＝90)和肥胖(n＝79)(表 2)。所有遗传变异位点信息都已在表3中提供。简而言之，对于冠心病本发明选择了东亚和欧洲人群报道的所有遗传变异位点；对于其他危险因素，本发明主要关注东亚人群中报道的遗传变异位点。
[0074]
训练集样本使用infinium公司的multi
‑
ethnic genotyping arrays(mega)芯片进行基因分型获取检测位点的遗传变异信息。在队列人群中，本发明使用多重pcr靶向扩增子测序技术对样本进行基因分型。采用领域中的常规操作针对每个突变设计多重引物，并使用illumina hiseq x ten测序仪对扩增靶区进行高通量测序。在剔除12 个变异位点
检出率<95％或在训练数据集中缺失的变异后，共有588个变异或其替代位点检测成功，平均检出率为99.9％，测序深度中位数为982
×
(图2)。为评估基因分型的可重复性，本发明对1648份样本进行了多次基因分型，鉴定结果一致率>99.4％。
[0075]
表2.本研究中所选遗传变异的来源
[0076][0077]
cad，冠心病；sbp，收缩压；dbp，舒张压；pp，脉压；map，平均动脉压； htn，高血压；t2d，2型糖尿病；bmi，体重指数；wc，腰围；whr，腰臀比； tc，总胆固醇；ldl
‑
c，低密度脂蛋白胆固醇；tg，甘油三酯；hdl
‑
c，高密度脂蛋白胆固醇。
[0078]
metaprs的构建
[0079]
(1)从gwas结果数据提取snp效应值，计算各个亚表型prs
[0080]
本发明首先根据东亚人群大规模全基因组关联研究的效应值构建了9个cad相关表型的遗传评分。为了精确估计所选择的变异在东亚人群中的cad效应值，本发明在东亚人群中进行了冠心病全基因组关联研究，总样本量为267,465例(51,531例冠心病患者和215,934例非冠心病患者)。对于其他8个表型(脑卒中，2型糖尿病，血压，体质指数，总胆固醇，低密度脂蛋白胆固醇，甘油三酯和高密度脂蛋白胆固醇)，本发明从东亚人群发表的大型全基因组关联研究中获得了每个位点的对应于各亚表型的危险等位基因、效应值及p值。所选研究的详细列表见表3。
[0081]
表3.用于多基因风险评分计算的汇总数据来源
[0082][0083]
gwas,全基因组关联研究；ewas,全外显子关联研究；bp,血压；cad,冠状动脉疾病；t2d,2型糖尿病；bmi,体质指数；tc,总胆固醇；ldl
‑
c,低密度脂蛋白胆固醇；tg,甘油三酯；hdl
‑
c,高密度脂蛋白胆固醇。
[0084]
以亚表型cad为例，本发明整合东亚人群和中国人群大规模冠心病病例对照基因组数据，开展冠心病全基因组关联研究，样本达到51,531例冠心病患者和215,934 例非冠心病患者，使用固定效应模型对不同亚队列关联分析结果进行meta分析，得到所测snp的危险等位基因、效应值及p值。根据提取的p值，按照0.5,0.4,0.3,0.2, 0.1,0.05,0.01,10
‑3,10
‑4,10
‑5,10
‑6,10
‑7筛选出12组snp，对于每组snp，基于队列人群数据，使用plink软件(version 1.9)clumping命令按照连锁不平衡r2<0.2修剪，最终得到12组snp组合。利用训练集基因型数据，将个体snp风险等位基因数(0、 1或2)根据其对应的效应值进行加权并求和构建12个纳入不同组合snp的候选prs，采用logistic回归模型评估这些候选prs与冠心病的关联，比值比(odds ratio,or) 最大(prs每增加一个标准差)的评分被选作最佳冠心病prs。对于其他8个表型，通过表3中提供的对应表型的文献获取snp效应值，然后按照上述同样的步骤构建其他8个亚表型prs。其中，最佳亚表型prs利用的snp位点及效应值见表4。
[0085]
(2)在训练集中计算各个亚表型prs的权重
[0086]
将9个亚表型prs转化为均值为0，标准差为1的评分。利用训练集，将标化后的9个亚表型prs及要调整的协变量(年龄、性别)共同放入弹性网状logistic回归模型(cv.glmnet函数，r包“glmnet”)，该模型采用10倍交叉验证的方法评估一系列不同惩罚项(设置alpha＝0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1.0) 的模型，将模型参数type.measure设置为“auc”，模型自动筛选auc(area underreceiving
‑
operator characteristic curve,接收者操作特征曲线下面积)最高的模型作为最终模型，从中获得每个prs的系数(β1…
β9)作为权重。表5提供了各个亚表型 prs的权重，tg、hdl和ldl的亚表型权重为0。
[0087]
(3)将亚表型prs的权重转化为snp水平的权重
[0088][0089]
利用以上公式将prs水平的权重转换为snp水平的权重，其中σ1,
…
,σ9是训练集中每个亚表型prs的标准差，α
j1
，
…
，α
j9
是第i个snp对应于每个亚表型的效应值，如果第k个评分中未包含某个snp，则该snp的效应值大小α
jk
设为0。
[0090]
(4)计算metaprs
[0091]
利用公式：metaprs＝∑βsnp_i
×
ni计算个体的metaprs,其中βsnp_i是指第i个 snp的效应值(即第3步得到的snp水平的权重)，ni指个体所携带第i个snp的效应等位基因数目。
[0092]
经过统计处理步骤，最终共有510个snp的权重不为0并纳入metaprs的计算，表4中提供了所有符合条件snp的信息和权重。
[0093]
(5)metaprs切点划分
[0094]
以队列人群所有个体metaprs的20％和80％百分位数为切点，划分个体冠心病遗传风险为低、中、高危人群。
[0095]
表4.本发明所确定snps的信息和权重
[0096]
[0097]
[0098]
[0099]
[0100]
[0101]
[0102]
[0103]
[0104]
[0105]
[0106][0107]
表5.各亚表型在冠心病多基因遗传风险综合评分中的权重
[0108]
亚表型名称prs权重冠心病0.452血压0.074体质指数0.072糖尿病0.064总胆固醇0.038脑卒中0.004低密度脂蛋白胆固醇0高密度脂蛋白胆固醇0甘油三酯0
[0109]
统计分析
[0110]
对于连续性变量，人群特征描述为平均值(标准差)；对于分类变量，人群特征描述为数量(百分比)。多基因遗传评分按照<20％，20％
‑
80％，>80％分位数分为三组(高、中、低遗传风险组)。采用经年龄和性别调整，校正队列来源，并考虑非冠心病死亡的竞争风险的cox比例风险回归模型估计不同遗传风险组冠心病事件的风险比(hrs)及其95％置信区间(cis)。采用年龄为时间尺度的cox比例风险回归模型来评估不同遗传风险分组发生冠心病的终生风险(到80岁)。分析使用了r包 survival中的
‘
survfit.coxph’函数。本研究中所有报道的p值均未进行校正，且双侧p 值<0.05认为有统计学意义。统计分析在r软件(r foundation for statistical computing, vienna,austria，版本3.5.0)或sas统计软件(sas institute inc,cary,nc，版本9.4) 中进行。
[0111]
前瞻性队列的基线信息
[0112]
表6显示了队列人群中41,271例研究对象的基线信息。基线时的平均年龄为52.3 岁(标准差，10.6岁)，其中42.5％为男性。相比于女性，男性当前吸烟率更高。经过总计534,701人年(平均随访13.0年)随访，共发生1303例冠心病。
[0113]
表6.前瞻性队列的基线信息
[0114][0115]
值为平均值(sd)或n(％)。cad，冠心病。
[0116]
多基因遗传风险评分对冠心病的预测
[0117]
本发明首先依据东亚人群冠心病gwas结果p值设定12个阈值(0.5,0.4,0.3,0.2, 0.1,0.05,0.01,10
‑3,10
‑4,10
‑5,10
‑6,10
‑7)筛选12组不同snps组合，然后在训练集采用欧洲人群的gwas结果数据作为snp效应值计算冠心病prs，并进一步评估它们与冠心病的关联强度。如图3所示，与使用东亚人群冠心病gwas效应值相比，当使用来自欧洲人群的效应值时，12个纳入不同snp组合的prs(每增加一个sd) 与冠心病关联的or(95％ci)值均显著下降。因此，本研究采用东亚人群的gwas 效应值构建各个亚表型prs，训练集中每个候选亚表型prs与冠心病的关联强度见图4，选择or值最大的一个评分作为最终的亚表型prs。
[0118]
9个亚表型prs之间存在不同程度的相关性(图5)。进一步利用弹性网状logistic 回归模型评估9个亚表型prs与冠心病的关联，该模型可校正各个亚表型prs之间的相关性，弹性网状logistic回归估计的or值与单变量logistic回归估计的or值对比见图6(图6中ldl
‑
c、tg和hdl
‑
c权重为0)。最后，通过整合9种亚表型 prs构建冠心病metaprs并在队列人群中进行验证。
[0119]
与亚表型prs相比，metaprs与冠心病风险的关联强度最大(图7)，metaprs 每增加1个标准差，冠心病的hr为1.44(95％ci:1.36
‑
1.52)(p＝2.84
×
10
‑
39
)。 metaprs与冠心病的关联独立于血脂异常、高血压、bmi、糖尿病、吸烟状况和冠心病家族史(表7)。
[0120]
表7.校正冠心病危险因素后的metaprs与冠心病事件的危险比 (metaprs每增加一个标准差)
[0121]
模型hr(95％ci)p值metaprs1.44(1.36,1.52)2.84
×
10
‑
39
metaprs 血脂异常1.42(1.34,1.50)2.54
×
10
‑
35
metaprs 高血压1.41(1.34,1.49)2.78
×
10
‑
35
metaprs 糖尿病1.43(1.36,1.51)1.33
×
10
‑
37
metaprs 身体质量指数1.42(1.35,1.50)1.74
×
10
‑
36
metaprs 吸烟1.44(1.36,1.52)4.55
×
10
‑
39
metaprs cad家族史1.44(1.36,1.52)9.52
×
10
‑
39
metaprs 6个常见cad危险因素1.39(1.32,1.47)2.75
×
10
‑
31
[0122]
cad，冠心病；prs，遗传风险评分；hr，风险比；ci，置信区间。
[0123]
将metaprs按照20％、80％分位数进行分组，与遗传风险低的个体(遗传风险下20％)相比，遗传风险高的个体(遗传风险上80％)发生冠心病事件的风险要高3 倍(hr＝2.93，95％ci:2.44
‑
3.51)(图8)。这两组人80岁之前发生冠心病的累积风险分别为5.8％和16.0％。按照性别分层进行分析，可以得到类似的结果(图9)。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

冠心病的多基因遗传风险综合评分的构建方法与装置及应用与流程

相关文献

最热文献