一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

冠心病多基因遗传风险评分及联合临床风险评估应用的制作方法

2021-11-15 19:03:00 来源:中国专利 TAG:


1.本发明是关于一种冠心病多基因遗传风险评分(polygenic risk score,prs)及联合临床风险评估应用。


背景技术:

2.心血管疾病(cvd)的发生发展受到遗传因素和环境因素的共同作用。心血管疾病已经成为中国和全球死亡和疾病负担的首要病因。由于中国最近几十年经济的飞速发展、人口老龄化加剧、不健康生活方式流行和环境改变,导致中国冠心病发病率激增。在2019年就有1100万人患有冠心病,187万人死于冠心病。
3.在心血管疾病的一级预防中,风险预测和评估起着至关重要的作用。遗传因素作为稳定且可量化的终生标记,长期以来一直被期望能用于疾病的风险评估,以促进心血管疾病的精准预防。在过去的10年里,全基因组关联研究已经成功识别出了上百个与冠心病以及冠心病相关表型(血脂水平、血压、2型糖尿病和bmi)存在显著关联的区域。最近,整合多个遗传变异信息的冠心病多基因遗传风险评分(prs)已经被成功开发,并用于冠心病风险预测的临床效用评估(eur.heart.j.37,561

567(2016);nat.genet.50,1219

1224(2018);j.am.coll.cardiol.72,1883

1893(2018);eur.heart.j.37,3267

3278(2016);jama323,627

635(2020);jama323,636

645,(2020);jama cardiol...3,693

702(2018);n.engl.j.med.375,2349

2358(2016))。然而,几乎所有这些遗传评分均是基于欧洲人群构建的,不同人群间变异位点频率的不同、连锁不平衡模式的差异导致了欧洲人群的评分不能在东亚和中国人群中使用。其次不同人群间生活方式、其他危险因素以及潜在的基因

环境交互作用的不同,也会导致这种异质性。有研究报道这些遗传评分的预测效果在其他种族群体中预测效能明显下降。
4.此外,不同人群环境危险因素(生活方式、膳食营养和行为因素)的显著差异以及基因环境相互作用也可能造成冠心病风险和干预获益不同。整合多基因遗传风险评分和传统危险因素评分,实现冠心病发病风险的再分层,对于冠心病一级预防有重要意义。


技术实现要素:

5.本发明的一个目的在于提供一种适用于东亚人群的冠心病相关单核苷酸多态性位点及发病风险评估系统。
6.本案发明人通过大量的研究与实际检测分析试验,确定了一组与东亚人群相关的冠心病风险相关基因,其包括311个cad相关单核苷酸多态性位点,通过检测这些cad相关单核苷酸多态性位点,可以良好地评估东亚人群的冠心病发病风险。本发明进一步确定了bp、bmi、dm、tc、stroke相关单核苷酸多态性位点,通过进一步检测这些相关单核苷酸多态性位点中的一种或多种,可以更好地评估东亚人群的冠心病发病风险。
7.具体而言,一方面,本发明提供了检测个体信息的试剂在制备评估冠心病发病风险的检测装置中的应用,其中,所述个体信息包括以下单核苷酸多态性位点信息:
8.cad相关单核苷酸多态性位点:rs10064156、rs10071096、rs10093110、rs10096633、rs10139550、rs10237377、rs10260816、rs10267593、rs1027087、rs10278336、rs10455782、rs10503675、rs10512861、rs10513801、rs10745332、rs10757274、rs10773003、rs10842992、rs10846744、rs10857147、rs10890238、rs10953541、rs10968576、rs11030104、rs11057830、rs11067762、rs11077501、rs11099493、rs11107829、rs11125936、rs11142387、rs1116357、rs11170820、rs11205760、rs11206510、rs11509880、rs11556924、rs11557092、rs115696548、rs11601507、rs11677932、rs1169288、rs1173766、rs11787792、rs11810571、rs11838267、rs11838776、rs11847697、rs11911017、rs12175867、rs12214416、rs12445022、rs12463617、rs1250229、rs12524865、rs12597579、rs12603327、rs12692735、rs12718465、rs12740374、rs12801636、rs12932445、rs12936587、rs12970066、rs130071、rs13078807、rs1317507、rs13209747、rs1321309、rs13306194、rs13359291、rs1344653、rs1351525、rs13723、rs1378942、rs1412444、rs1421085、rs148910227、rs1496653、rs151193009、rs1514175、rs1535500、rs1552224、rs1555543、rs1563788、rs1591805、rs16849225、rs16858082、rs16986953、rs16990971、rs16999793、rs17030613、rs17035646、rs17080102、rs17087335、rs17135399、rs17249754、rs173396、rs17358402、rs17381664、rs174547、rs17465637、rs17477177、rs17514846、rs17612742、rs17678683、rs17695224、rs1800588、rs181360、rs1861411、rs1868673、rs1870634、rs1887320、rs1892094、rs191835914、rs1976041、rs2000999、rs200990725、rs2021783、rs2057291、rs2066714、rs2068888、rs2075260、rs2075291、rs2107595、rs2128739、rs2144300、rs2145598、rs2156552、rs216172、rs2200733、rs2213732、rs2229383、rs2230808、rs2237896、rs2240736、rs2268617、rs2297991、rs2303790、rs2328223、rs2383208、rs2531995、rs2535633、rs2571445、rs2575876、rs261967、rs2782980、rs2815752、rs2819348、rs2820443、rs2925979、rs2954029、rs29941、rs3120140、rs3129853、rs3130501、rs326214、rs351855、rs35332062、rs35337492、rs35444、rs36096196、rs3775058、rs3785100、rs3809128、rs3827066、rs3846663、rs3887137、rs4129767、rs4148008、rs4266144、rs4302748、rs4377290、rs4409766、rs4410190、rs4420638、rs4468572、rs459193、rs4593108、rs4613862、rs46522、rs4713766、rs4719841、rs4731420、rs4735692、rs4752700、rs4766228、rs4776970、rs4788102、rs4812829、rs4821382、rs4836831、rs4845625、rs4883263、rs4911495、rs4917014、rs4918072、rs499974、rs515135、rs5215、rs556621、rs56062135、rs56289821、rs56336142、rs574367、rs582384、rs590121、rs6038557、rs6065311、rs633185、rs635634、rs6494488、rs651821、rs663129、rs667920、rs6700559、rs671、rs6725887、rs6795735、rs6804922、rs6807945、rs6808574、rs6813195、rs6818397、rs6829822、rs6882076、rs6905288、rs6909752、rs6960043、rs699、rs6997340、rs702485、rs7087591、rs7120712、rs7178572、rs7185272、rs7199941、rs7202877、rs7206541、rs7208487、rs7225581、rs7258445、rs72654473、rs72689147、rs73015714、rs7304841、rs7306523、rs73069940、rs738409、rs740406、rs7499892、rs7500448、rs7503807、rs751984、rs7525649、rs7560163、rs7568458、rs7617773、rs7633770、rs7678555、rs76954792、rs7696431、rs7770628、rs780094、rs7810507、rs7901016、rs7903146、rs7916879、rs7955901、rs7980458、rs7989336、rs80234489、rs8030379、rs8042271、
rs806215、rs8090011、rs8108269、rs820429、rs838880、rs867186、rs871606、rs884366、rs885150、rs896854、rs897057、rs9266359、rs9268402、rs9299、rs9319428、rs9349379、rs9357121、rs9367716、rs9376090、rs9390698、rs944172、rs9470794、rs9473924、rs9505118、rs9534262、rs9552911、rs9568867、rs9593、rs9663362、rs9687065、rs975722、rs9810888、rs9815354、rs9818870、rs9828933、rs9892152、rs9970807。
9.根据本发明的具体实施方案,本发明中,所述个体信息优选还包括bp、bmi、dm、tc和stroke相关单核苷酸多态性位点中的一种或多种(优选为一组或多组,即bp组、bmi组、dm组、tc组、stroke组中的一组或多组):
10.bp相关单核苷酸多态性位点:rs10051787、rs11651052、rs12037987、rs1275988、rs12999907、rs13041126、rs13143871、rs1558902、rs16896398、rs174546、rs17843768、rs1799945、rs391300、rs4336994、rs4722766、rs507666、rs6825911、rs7213603、rs7405452、rs880315、rs93138
11.bmi相关单核苷酸多态性位点:rs11257655、rs11604680、rs1470579、rs1982963、rs6545814、rs888789;
12.dm相关单核苷酸多态性位点:rs10010670、rs10160804、rs1029420、rs1037814、rs1052053、rs10830963、rs10886471、rs10923931、rs11067763、rs11624704、rs11660468、rs117601636、rs1211166、rs12229654、rs12242953、rs12549902、rs12571751、rs1260326、rs12679556、rs12946454、rs13233731、rs13266634、rs13342232、rs1334576、rs1359790、rs1436953、rs1532085、rs1575972、rs16927668、rs16967013、rs17301514、rs17517928、rs17609940、rs17791513、rs17843797、rs1801282、rs1832007、rs2028299、rs2074158、rs2075423、rs2081687、rs2123536、rs2245019、rs2258287、rs2261181、rs2296172、rs2334499、rs243019、rs2487928、rs2642442、rs273909、rs2783963、rs2796441、rs2820315、rs2861568、rs2972146、rs3213545、rs340874、rs35879803、rs368123、rs3774472、rs3791679、rs3810291、rs3861086、rs3918226、rs3936511、rs4142995、rs42039、rs4275659、rs4458523、rs4757391、rs4765773、rs4846049、rs4923678、rs55783344、rs579459、rs58542926、rs6093446、rs634501、rs67156297、rs67839313、rs6825454、rs6831256、rs6871667、rs6878122、rs6909574、rs6984210、rs702634、rs7107784、rs7116641、rs7258189、rs7403531、rs748431、rs7528419、rs7610618、rs7616006、rs769449、rs78169666、rs7897379、rs7917772、rs79223353、rs79548680、rs820430、rs840616、rs9309245、rs9512699、rs9591012、rs984222;
13.tc相关单核苷酸多态性位点:rs10401969、rs10889353、rs11136341、rs117711462、rs12027135、rs12453914、rs12927205、rs13115759、rs1367117、rs1495741、rs16844401、rs17122278、rs181359、rs2000813、rs2244608、rs2302593、rs247616、rs4883201、rs5996074、rs7134594、rs7258950、rs737337、rs7965082、rs964184;
14.stroke相关单核苷酸多态性位点:rs10203174、rs1050362、rs10947231、rs11634397、rs11957829、rs12500824、rs12607689、rs13702、rs1424233、rs1467605、rs1508798、rs16933812、rs17080091、rs17608766、rs180327、rs1878406、rs2075650、rs2107732、rs2237892、rs2295786、rs246600、rs2625967、rs2758607、rs2972143、rs34008534、rs35419456、rs376563、rs4471613、rs4724806、rs4777561、rs4939883、
rs60154123、rs6544713、rs7136259、rs7193343、rs73596816、rs736699、rs7859727、rs7947761、rs832552。
15.根据本发明的具体实施方案,本发明中,所述个体信息优选还包括冠心病临床风险因素。在本发明的一具体实施方案中,所述冠心病临床风险因素包括:年龄、收缩压、总胆固醇、高密度脂蛋白胆固醇、腰围、吸烟、南方/北方人群、城市/农村人群、和动脉粥样硬化性心血管疾病家族史。在本发明的一具体实施方案中,可选择性根据冠心病临床危险因素计算china

par评分。
16.根据本发明的具体实施方案,本发明中,根据各单核苷酸多态性位点的信息获得符合以下计算方式的遗传风险评分:
17.遗传风险评分=∑βi
×
ni
18.其中βi是指第i个snp的效应值,ni指个体所携带第i个snp的效应等位基因数目。
19.根据本发明的具体实施方案,本发明中,各snp的效应值参见表4所示。
20.根据本发明的具体实施方案,本发明中,遗传风险评分越高,个体冠心病发病的风险越高。所述冠心病包括心肌梗死和/或心绞痛。
21.根据本发明的具体实施方案,本发明中,待测个体来自东亚人群,特别是中国人。
22.另一方面,本发明还提供了一种冠心病发病风险评估装置,其包括检测单元和数据分析单元,其中:
23.所述检测单元用于检测来自待测个体信息,获得检测结果;其中,所述个体信息同前所述个体信息;
24.所述数据分析单元用于对检测单元的检测结果进行分析处理。
25.根据本发明的具体实施方案,本发明中,所述数据分析单元对检测单元的检测结果进行分析处理时,包括:将所述单核苷酸多态性位点的检测结果配以权重系数,以计算所述待测个体的遗传风险得分。
26.优选地,所述数据分析单元包括:
27.预处理模块,用于将所述单核苷酸多态性位点的检测结果标准化;
28.计算模块,用于将标准化的单核苷酸多态性位点检测结果带入到以下评估模型,得到待测个体的遗传风险评分:
29.遗传风险评分=∑βi
×
ni
30.其中βi是指第i个snp的效应值,ni指个体所携带第i个snp的效应等位基因数目。
31.根据本发明的具体实施方案,本发明中,所述数据分析单元还包括临床因素处理模块,用于获取待测个体china

par的10年心脑血管风险评分。
32.根据本发明的具体实施方案,本发明中,所述计算模块可以用于进一步将遗传风险评分结合临床风险因素,评估冠心病10年发病风险和/或终生风险信息。
33.根据本发明的具体实施方案,本发明中,所述数据分析单元还包括:
34.矩阵输入模块,用于接收所述预处理模块输出的多个所述标准化的检测结果,将所述标准化的检测结果以矩阵形式输入到所述计算模块。
35.优选地,所述数据分析单元还包括:
36.输出模块,用于接收所述计算模块输出的遗传风险评分和/或冠心病10年发病风险和/或终生风险信息,并输出为诊断分类结果。
37.在本发明的一具体实施方案中,本发明将冠心病遗传风险评分与临床风险评分整合,构建了简易的风险评价量表(risk chart),便于推广应用。因此,本发明的冠心病发病风险评估装置,其数据分析单元还可包括本发明的风险评价量表(risk chart)。
38.另一方面,本发明还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现:基于待测个体信息获得个体冠心病发病风险评估结果。其中,所述个体信息如前所述。
39.另一方面,本发明还提供了一种计算机设备,其包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现:基于待测个体信息获得个体冠心病发病风险评估结果。其中,所述个体信息如前所述。
40.在本发明的具体实施方案中,本发明在51,531例冠心病患者和215,934例非冠心病患者中开展了全基因组关联研究。然后整合9个冠心病及其相关表型遗传信息在2800例冠心病病例和2055例健康对照中构建多基因遗传风险评分,最后在41271例中国人群前瞻性队列中进行验证和评价。发现构建的多基因遗传风险评分对冠心病的发生具有很好的预测价值。不同遗传风险组的个体呈现出不同的发病轨迹。metaprs每增加一个标准差,冠心病发病相对风险增加44%。按照三分位数分组(<20%,20%~80%,>80%),高遗传风险者(>80%)冠心病发生风险是低遗传风险者(<20%)的3倍,并且这两组人80岁之前发生冠心病的累积风险分别为5.8%和16.0%。
41.同时本发明的结果显示多基因遗传评分可以在临床风险基础上进一步精细化冠心病发病风险分层。特别是,遗传风险可以在相当大的程度上对中和高临床风险的个体进行再分层。如在高临床风险组,高遗传风险人群的冠心病相对风险是低遗传风险人群3.82倍(hr:3.82;95%ci:2.70

5.41),冠心病10年累积发病率也有3.8倍的差异(低、高遗传风险组的冠心病10年累积发病率分别为2.0%、和7.6%)。也就是说,在本发明的队列中,通过china

par评分确定的6768例高风险个体中,一旦进行遗传风险评估,20%的人将被重新划分为中风险。相反,通过china

par评分确定的8342名中等临床风险的个体,其中遗传风险位于80%

100%分位数的个体对应的冠心病绝对风险(10年风险为3.8%,终生风险为16.9%)已经达到高临床风险且中遗传风险组人群水平(10年风险为4.0%,终生风险为17.4%)。由于年龄是临床风险评分中最重要的驱动因素,从而导致对老年人的风险高估,同时漏诊早发冠心病病例。而遗传风险与年龄无关,可以在生命早期和临床危险因素出现之前确定。
42.本发明的研究证实多基因遗传评分与传统临床风险评分组合,对于冠心病发病风险精细化再分层具有重要应用前景。
附图说明
43.图1显示训练集中采用东亚和欧美gwas效应值比较冠心病prs与冠心病的关联。采用logistic回归模型计算比值比(ors)和95%可信区间(cis),调整年龄和性别。分别使用东亚人群和欧洲uk biobank冠心病gwas数据的效应值作为snps权重计算评分。设定不同的p值阈值(0.5,0.4,0.3,0.2,0.1,0.05,0.01,10
‑3,10
‑4,10
‑5,10
‑6,10
‑7)分别构建12个包含不同snps组合的prs(连锁不平衡r2<0.2)。
44.图2显示在不同的p值阈值下,训练集中的亚表型prss(每增加一个标准差)与cad
的关联。采用logistic回归计算比值比(or)和95%可信区间(ci),调整年龄和性别。
45.图3各个亚表型prs相关图。其中,*p<0.05,**p<10
‑3,***p<10

10

46.图4显示训练集中亚表型多基因风险评分(每增加一个标准差)与冠心病的关联。分别采用logistic回归和弹性网状logistic回归计算比值比(or)和95%可信区间(ci),调整年龄和性别。
47.图5显示前瞻性队列中metaprs(每增加一个标准差)和亚表型prs与cad发病的危险比。采用以年龄作为时间尺度,调整队列来源和性别的cox模型来分析。
48.图6显示不同遗传组(<20%,20%

80%,>80%分组)冠心病发病的相对风险和绝对风险。其中采用调整性别和队列来源,以年龄为刻度,并考虑竞争风险的cox模型估计不同遗传风险组hr和95%ci以及冠心病的累积发病率。虚线表示95%ci。cad,冠心病;hr,风险比;ci,置信区间。
49.图7显示按照性别分层,不同遗传组(<20%,20%

80%,>80%分组)冠心病发病的相对风险和绝对风险。其中采用调整性别和队列来源,以年龄为刻度,并考虑竞争风险的cox模型估计不同遗传风险组hr和95%ci以及冠心病的累积发病率。虚线表示95%ci。cad,冠心病;hr,风险比;ci,置信区间。
50.图8显示根据冠心病家族史和遗传风险评分分组的冠心病相对风险和绝对风险。考虑竞争风险的cox比例风险模型用于估计hr和95%ci以及冠心病的累积风险,以年龄为时间尺度,根据性别和队列进行调整。
51.图9显示不同临床风险下三组遗传风险人群冠心病10年和终生发病风险。a.冠心病10年发病风险采用cox比例风险模型获得,以随访人年为时间尺度,并调整了性别和队列。b.冠心病的终生风险(直到80岁)使用竞争风险比例回归模型获得,该模型以年龄作为时间尺度考虑了竞争风险,并调整了性别和队列。
52.图10显示不同临床风险下三组遗传风险人群冠心病发生的相对风险和绝对风险。经性别、年龄和队列调整的cox比例风险模型用于估计冠心病的危险度(95%置信区间)和累积风险。
53.图11显示综合临床风险评分和遗传评分的冠心病10年发病风险评价量表。不同年龄和性别人群的10年冠心病绝对风险使用cox比例风险模型计算,多基因风险评分按照五分位数分组,临床风险按照动脉粥样硬化性心血管疾病10年风险评分<5%,5

9.9%,10

14.9%,或≥15%分组。
54.图12显示按照临床风险和遗传风险分组的冠心病终生风险评价量表。不同年龄和性别人群的冠心病终生风险(至80岁)使用考虑竞争风险的比例风险模型,多基因风险评分按照五分位数分组,临床风险按照动脉粥样硬化性心血管疾病10年风险评分<5%,5

9.9%,10

14.9%,或≥15%分组。
55.图13显示一具体实施例中待测个体的遗传风险评分在人群中分布。
具体实施方式
56.为了对本发明的技术特征、目的和有益效果有更加清楚的理解,现结合具体实施例及对本发明的技术方案进行以下详细说明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围。对本领域技术人员而言,在本发明的精神范围内所轻易思及的各种变
化和/或修饰,例如在本发明确定的多个snp集合的基础上的部分增加、删除和/或替换而不实质影响评估结果的方案,皆被认定为涵盖于本发明的保护范围内。实施例中,各原始试剂材料均可商购获得,未注明具体条件的实验方法为所属领域熟知的常规方法和常规条件,或按照仪器制造商所建议的条件。
57.实施例1
58.研究设计流程与研究人群
59.本发明在2800例cad患者和2055例健康对照(表1)中开发了一种用于cad的多基因风险评分(prs),然后在大规模前瞻性队列人群中对其进行验证。训练集中的cad病例来自中国医学科学院阜外医院。心肌梗死(mi)的诊断严格遵循以体征、症状、心电图和心脏酶活性为基础的诊断标准。结合既往是否诊断有心肌梗死病史,或左冠状动脉主干超过50%狭窄,或至少有一条主要心外膜血管狭窄>70%诊断为冠心病。
60.验证队列来自china

par研究的三个子队列,包括中国心血管健康多中心合作研究(interasia)、中国心血管流行病学多中心合作研究(chinamuca

1998)、中国代谢综合征社区干预和中国家庭健康研究(cimic)(yang,x.et al.predicting the 10

year risks of atherosclerotic cardiovascular disease in chinese population:the china

par project(prediction for ascvd risk in china).circulation134,1430

1440(2016))。简单地说,chinamuca

1998、interasia和cimic基线分别建立于1998年、2000

2001年和2007

2008年。根据统一标准,2007

2008年对interasia和chinamuca

1998进行了首次随访,2012

2015以及2018

2020年对所有三个队列进行了统一随访。在本研究中,共收集到独立于训练集的43,582例参与者的血液样本和主要协变量数据。在排除561例基因型缺失率高(>5.0%)或平均测序深度低(<30层)、1352例基线时<30岁或>75岁、398例基线确诊冠心病的个体之后,最终共有41,271例参与者纳入分析。
61.所有研究均由中国医学科学院阜外医院伦理审查委员会批准。在数据收集前,每位参与者均签署了知情同意书。
62.表1.训练集一般信息
[0063][0064]
[0065]
值为平均值(sd)或n(%)。
[0066]
数据收集和危险因素定义
[0067]
在严格的质量控制下,由经过培训的调查人员收集基线和随访期间的重要信息。使用标准问卷收集个人信息(性别、出生日期等)、生活方式信息(饮食习惯、体力活动等)、疾病史和cad家族史。参与者还接受了体格检查(体重、身高、血压等),并提供空腹血样用以测量血脂和血糖水平。
[0068]
为了在随访期间获得疾病结局和死亡相关信息,研究人员对参与者或其代理人进行了随访,同时还收集了参与者的医疗记录(或死亡证明)。两名委员会成员独立地对结局事件进行了核实。如存在不一致的情况,其他委员会成员将参与讨论最后达成共识。冠心病发病定义为首次发生不稳定性心绞痛、非致死性急性心肌梗死或出现冠心病死亡。由心肌梗死或其他冠状动脉疾病引起的致命事件被定义为冠心病死亡。基线日期与冠心病发生日期、死亡日期或最后一次随访到的日期之间的时间间隔为随访人年。
[0069]
本发明定义了如下冠心病危险因素:血脂异常、高血压、糖尿病、bmi、吸烟和冠心病家族史。血脂异常的定义为:tc≥240mg/dl和/或ldl

c≥160mg/dl和/或tg≥200mg/dl和/或hdl

c<40mg/dl和/或在过去2周内使用降脂药物。高血压定义为收缩压≥140mmhg和/或舒张压≥90mmhg和/或在过去两周内使用抗高血压药物。糖尿病定义为空腹血糖水平≥126mg/dl和/或使用胰岛素和/或口服降糖药和/或有糖尿病病史。bmi的计算方法是体重(kg)除以身高(m)的平方。是否吸烟通过研究对象自我报告的吸烟情况判断。对于冠心病家族史,本发明考虑了任何一级亲属(父亲、母亲或兄弟姐妹)的cad发病情况。
[0070]
遗传变异位点选择和基因分型
[0071]
本发明首先选择了600个遗传变异位点,它们在全基因组关联研究中被发现与冠心病(n=212)或冠心病相关危险因素存在全基因组显著关联(p<5
×
10
‑8),包括脑卒中(n=42)、血压(n=56)、血脂(n=130)、t2d(n=90)和肥胖(n=79)(表2)。所有遗传变异位点信息都已在表3中提供。简而言之,对于冠心病本发明选择了东亚和欧洲人群报道的所有遗传变异位点;对于其他危险因素,本发明主要关注东亚人群中报道的遗传变异位点。
[0072]
训练集样本使用infinium公司的multi

ethnic genotyping arrays(mega)芯片进行基因分型获取检测位点的遗传变异信息。在队列人群中,本发明使用多重pcr靶向扩增子测序技术对样本进行基因分型。采用领域中的常规操作针对每个突变设计多重引物,并使用illumina hiseq x ten测序仪对扩增靶区进行高通量测序。在剔除12个变异位点检出率<95%或在训练数据集中缺失的变异后,共有588个变异或其替代位点检测成功,平均检出率为99.9%,测序深度中位数为982
×
。为评估基因分型的可重复性,本发明对1648份样本进行了多次基因分型,鉴定结果一致率>99.4%。
[0073]
表2.本研究中所选遗传变异的来源
[0074][0075]
cad,冠心病;sbp,收缩压;dbp,舒张压;pp,脉压;map,平均动脉压;htn,高血压;t2d,2型糖尿病;bmi,体重指数;wc,腰围;whr,腰臀比;tc,总胆固醇;ldl

c,低密度脂蛋白胆固醇;tg,甘油三酸酯;hdl

c,高密度脂蛋白胆固醇。
[0076]
metaprs的构建
[0077]
(1)从gwas结果数据提取snp效应值,计算各个亚表型prs
[0078]
本发明首先根据东亚人群大规模全基因组关联研究的效应值构建了9个cad相关表型的遗传评分。为了精确估计所选择的变异在东亚人群中的cad效应值,本发明在东亚人群中进行了冠心病全基因组关联研究,总样本量为267,465例(51,531例冠心病患者和215,934例非冠心病患者)。对于其他8个表型(脑卒中、2型糖尿病、血压、体质指数、总胆固醇、低密度脂蛋白胆固醇、甘油三酯和高密度脂蛋白胆固醇),本发明从东亚人群发表的大型全基因组关联研究中获得了每个位点的对应于各亚表型的危险等位基因、效应值及p值。所选研究的详细列表见表3。
[0079]
表3.用于多基因风险评分计算的汇总数据来源
[0080][0081]
gwas,全基因组关联研究;ewas,全外显子关联研究;bp,血压;cad,冠状动脉疾病;t2d,2型糖尿病;bmi,体质指数;tc,总胆固醇;ldl

c,低密度脂蛋白胆固醇;tg,甘油三酯;hdl

c,高密度脂蛋白胆固醇。
[0082]
以亚表型cad为例,本发明整合东亚人群和中国人群大规模冠心病病例对照基因组数据,开展冠心病全基因组关联研究,样本达到51,531例冠心病患者和215,934例非冠心病患者,使用固定效应模型对不同亚队列关联分析结果进行meta分析,得到所测snp的危险等位基因、效应值及p值。根据提取的p值,按照0.5,0.4,0.3,0.2,0.1,0.05,0.01,10
‑3,10
‑4,10
‑5,10
‑6,10
‑7筛选出12组snp,对于每组snp,基于队列人群数据,使用plink软件(version 1.9)clumping命令按照连锁不平衡r2<0.2修剪,最终得到12组snp组合。利用训练集基因型数据,将个体snp风险等位基因数(0、1或2)根据其对应的效应值进行加权并求和构建12个纳入不同组合snp的候选prs,采用logistic回归模型评估这些候选prs与冠心
病的关联,比值比(odds ratio,or)最大(prs每增加一个标准差)的评分被选作最佳冠心病prs。对于其他8个表型,通过表3中提供的对应表型的文献获取snp效应值,然后按照上述同样的步骤构建其他8个亚表型prs。其中,最佳亚表型prs利用的snp位点及效应值见表4。
[0083]
(2)在训练集中计算各个亚表型prs的权重
[0084]
将9个亚表型prs转化为均值为0,标准差为1的评分。利用训练集,将标化后的9个亚表型prs及要调整的协变量(年龄、性别)共同放入弹性网状logistic回归模型(cv.glmnet函数,r包“glmnet”),该模型采用10倍交叉验证的方法评估一系列不同惩罚项(设置alpha=0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1.0)的模型,将模型参数type.measure设置为“auc”,模型自动筛选auc(area under receiving

operator characteristic curve,接收者操作特征曲线下面积)最高的模型作为最终模型,从中获得每个prs的系数(β1…
β9)作为权重。表5提供了各个亚表型prs的权重,tg、hdl和ldl的亚表型权重为0。
[0085]
(3)将亚表型prs的权重转化为snp水平的权重
[0086][0087]
利用以上公式将prs水平的权重转换为snp水平的权重,其中σ1,

,σ9是训练集中每个亚表型prs的标准差,α
j1
,


j9
是第i个snp对应于每个亚表型的效应值,如果第k个评分中未包含某个snp,则该snp的效应值大小α
jk
设为0。
[0088]
(4)计算metaprs
[0089]
利用公式:metaprs=∑βsnp_i
×
ni计算个体的metaprs,其中βsnp_i是指第i个snp的效应值(即第3步得到的snp水平的权重),ni指个体所携带第i个snp的效应等位基因数目。
[0090]
经过统计处理步骤,最终共有510个snp的权重不为0并纳入metaprs的计算,表4中提供了所有符合条件snp的信息和权重。
[0091]
(5)metaprs切点划分
[0092]
以队列人群所有个体metaprs的20%和80%百分位数为切点,划分个体冠心病遗传风险为低、中、高危人群。
[0093]
表4.本发明所确定snps的信息和权重
[0094]
[0095]
[0096]
[0097]
[0098]
[0099]
[0100]
[0101]
[0102][0103]
表5.各亚表型在冠心病多基因遗传风险综合评分中的权重
[0104]
亚表型名称prs权重冠心病0.452血压0.074体质指数0.072糖尿病0.064总胆固醇0.038脑卒中0.004低密度脂蛋白胆固醇0高密度脂蛋白胆固醇0甘油三酯0
[0105]
统计分析
[0106]
对于连续性变量,人群特征描述为平均值(标准差);对于分类变量,人群特征描述为数量(百分比)。多基因遗传评分按照<20%,20%

80%,>80%分位数分为三组(高、中、低遗传风险组)。采用经年龄和性别调整,校正队列来源,并考虑非冠心病死亡的竞争风险的cox比例风险回归模型估计不同遗传风险组冠心病事件的风险比(hrs)及其95%置信区间(cis)。采用年龄为时间尺度的cox比例风险回归模型来评估不同遗传风险分组发生冠心病的终生风险(到80岁)。使用china

par公式计算每个个体的10年心脑血管疾病风险评分,然
后将他们分为低、中、高临床风险组,分界点为<5%、5

9.9%和≥10%。另外,使用cox比例风险模型,同时将china

par临床风险评分和遗传风险评分以分类变量进入模型,来计算不同年龄段人群冠心病10年风险和考虑竞争风险后的终生风险,旨在开发简便实用的冠心病风险评估量表(risk chart)。分析使用了r包survival中的

survfit.coxph’函数。本研究中所有报道的p值均未进行校正,且双侧p值<0.05认为有统计学意义。统计分析在r软件(r foundation for statistical computing,vienna,austria,版本3.5.0)或sas统计软件(sas institute inc,cary,nc,版本9.4)中进行。
[0107]
前瞻性队列的基线信息
[0108]
表6显示了队列人群中41,271例研究对象的基线信息。基线时的平均年龄为52.3岁(标准差,10.6岁),其中42.5%为男性。相比于女性,男性当前吸烟率更高。经过总计534,701人年(平均随访13.0年)随访,共发生1303例冠心病。
[0109]
表6.前瞻性队列的基线信息
[0110][0111]
值为平均值(sd)或n(%)。cad,冠心病。
[0112]
多基因遗传风险评分对冠心病的预测
[0113]
本发明首先依据东亚人群冠心病gwas结果p值设定12个阈值(0.5,0.4,0.3,0.2,0.1,0.05,0.01,10
‑3,10
‑4,10
‑5,10
‑6,10
‑7)筛选12组不同snps组合,然后在训练集采用欧洲人群的gwas结果数据作为snp效应值计算冠心病prs,并进一步评估它们与冠心病的关联强度。如图1所示,与使用东亚人群冠心病gwas效应值相比,当使用来自欧洲人群的效应值时,12个纳入不同snp组合的prs(每增加一个sd)与冠心病关联的or(95%ci)值均显著下降。因此,本研究采用东亚人群的gwas效应值构建各个亚表型prs,训练集中每个候选亚表型prs与冠心病的关联强度见图2,选择or值最大的一个评分作为最终的亚表型prs。
[0114]
最佳冠心病亚表型(cad)prs确定了一组与东亚人群相关的冠心病风险相关基因,其包括表4所示的311个cad相关单核苷酸多态性位点,检测这些cad相关单核苷酸多态性位点,通过∑βi
×
ni获得发病风险的遗传风险评分,能良好地评估东亚人群的冠心病发病风险。其中各cad相关各snp的效应值可以统一采用表4中亚表型prs栏内的snp的效应值,也可以统一采用表4中metaprs栏内的snp的效应值。遗传风险评分越高,个体冠心病发病的风险越高。
[0115]
9个亚表型prs之间存在不同程度的相关性(图3)。进一步利用弹性网状logistic
回归模型评估9个亚表型prs与冠心病的关联,该模型可校正各个亚表型prs之间的相关性,弹性网状logistic回归估计的or值与单变量logistic回归估计的or值对比见图4(图4中ldl

c、tg和hdl

c权重为0)。
[0116]
本发明的评估冠心病发病风险方案,可以在检测表4所示的311个cad相关snp基础上,进一步选择性地检测表4所示的21个bp相关snp、6个bmi相关snp、108个dm相关snp、24个tc相关snp、40个stroke相关snp中的一组或多组snp,通过∑βi
×
ni获得发病风险的遗传风险评分,可以更好地评估东亚人群的冠心病发病风险。当本发明的评估冠心病发病风险方案包括检测bp、bmi、dm、tc、stroke相关snp中的一组或多组时,这些snp的效应值可以统一采用表4中亚表型prs栏内的snp的效应值,优选统一采用表4中metaprs栏内的snp的效应值。遗传风险评分越高,个体冠心病发病的风险越高。
[0117]
本发明还通过整合9种亚表型prs构建冠心病metaprs并在队列人群中进行验证。
[0118]
与亚表型prs相比,metaprs与冠心病风险的关联强度最大(图5),metaprs每增加1个标准差,冠心病的hr为1.44(95%ci:1.36

1.52)(p=2.84
×
10

39
)。metaprs与冠心病的关联独立于血脂异常、高血压、bmi、糖尿病、吸烟状况和冠心病家族史(表7)。
[0119]
表7.校正冠心病危险因素后的metaprs与冠心病事件的危险比(metaprs每增加一个标准差)
[0120][0121][0122]
cad,冠心病;prs,遗传风险评分;hr,风险比;ci,置信区间。
[0123]
将metaprs按照20%、80%分位数进行分组,与遗传风险低的个体(遗传风险下20%)相比,遗传风险高的个体(遗传风险上80%)发生冠心病事件的风险要高3倍(hr=2.93,95%ci:2.44

3.51)(图6)。这两组人80岁之前发生冠心病的累积风险分别为5.8%和16.0%。按照性别分层进行分析,可以得到类似的结果(图7)。如果同时考虑遗传风险与冠心病家族史,将有助于进一步实行冠心病风险精细化分层。例如,在低遗传风险且没有家族史的人群中,冠心病终生风险为5.6%;但是如果同时合并高遗传风险和家族史,冠心病终生风险将达到28.2%,两者相差5.79倍(图8)。
[0124]
表8.遗传风险分层速查表
[0125]
分组<20%中(20%

40%)中(40%

60%)中(60%

80%)高(>80%)遗传风险评分<

0.186

0.186~0.1100.110~0.3630.363~0.650>0.650
[0126]
联合多基因遗传风险和临床风险对冠心病风险分层
[0127]
本发明评估了考虑临床风险评分(china

par的10年心脑血管风险评分)联合遗传风险进行冠心病风险再分层的潜力。观察到,遗传风险对各个china

par组中cad的10年发病风险以及终生发病风险再分层都发挥了重要的作用(图9),遗传风险评分与china

par评
分可能存在潜在的交互作用(p=0.02)。尤其是,高遗传风险与低遗传风险组之间的相对风险在高china

par评分组中更大(hr:3.82;95%ci:2.70

5.41),高于低china

par评分组(hr:1.96;95%ci:1.46,2.65)(图10)。计算绝对风险也能发现类似的差异,在高china

par评分人群中,低、高遗传风险组的冠心病10年累积发病率分别为2.0%、和7.6%;他们对应的冠心病终生风险分别为9.2%和31.0%。在那些高临床风险但遗传风险较低的人群中,冠心病10年和终生风险要低于那些中度临床风险人群平均风险值。更具有临床意义的是,中临床风险个体如果同时伴有高遗传风险,冠心病10年和终生发病风险(10年风险为3.8%,终生风险为16.9%)与高临床风险且中遗传风险个体类似(10年风险为4.0%,终生风险为17.4%)。
[0128]
基于遗传和临床风险的冠心病风险评价量表
[0129]
为了增加本发明的实用性,本发明进一步开发了同时整合遗传评分和临床评分的简易评价量表。研究发现,遗传评分在临床评分的基础上能够进一步对冠心病发病绝对风险进行精细化再分层(图11、图12)。例如,对于65~69岁的男性,冠心病临床风险≥15%,其对应的冠心病10年发病风险受到遗传因素的影响,范围变异为4.1%~13.2%;对应的女性冠心病10年发病风险范围可达5.9%~11.1%。类似的,任一临床风险分层下,冠心病终生风险随着遗传风险的增加都显著增加,35~39岁的男性或女性同时合并高遗传风险和高临床风险,分别达到36%和27%。值得关注的是,对于那些临床风险中危的人群,如果同时合并高遗传风险,那么他们的冠心病10年或终生风险将超过那些高临床风险(临床风险为10%

14%)平均水平。
[0130]
china

par模型计算ascvd 10年风险的方法
[0131]
该模型的计算方法简单概括如下:
[0132]
男、女性ascvd发病的10年风险预测纳入变量及其参数如表9。
[0133]
表9.ascvd10年风险预测模型所需变量及对应参数
[0134]
变量男性 女性ln(年龄),年31.97 24.87ln(治疗后收缩压),mmhg27.39 20.71ln(未治疗收缩压),mmhg26.15 19.98ln(总胆固醇),mg/dl0.62 0.16ln(高密度脂蛋白胆固醇),mg/dl

0.69
ꢀ‑
0.22ln(腰围),cm

0.71 1.48吸烟(1=是,0=否)3.96 0.49糖尿病(1=是,0=否)0.36 0.57居住地(1=北方,0=南方)0.48 0.54城乡(1=城市,0=农村)

0.16 n/aascvd家族史(1=是,0=否)6.22 n/aln(年龄)
×
吸烟

0.94 n/aln(年龄)
×
ln(治疗后收缩压)

6.02
ꢀ‑
4.53ln(年龄)
×
ln(未治疗收缩压)

5.73
ꢀ‑
4.36ln(年龄)
×
ascvd家族史(1=是,0=否)

1.53 n/a
meanx

b140.68 117.26基线10年生存率0.97 0.99
[0135]
注:ln,自然对数转换;n/a,该变量未包含在模型中;meanx'b,本研究人群中各变量与其参数乘积之和的平均值;ascvd,动脉粥样硬化性心血管疾病.
[0136]
如果一个成年人,知道了自身的年龄、治疗或未治疗的收缩压水平等变量的具体数值,再乘以表9中不同变量所对应的参数,可以计算出indx'b(即该成年人各变量具体数值与对应参数的乘积之和),将indx'b代入以下公式,求得ascvd发病的10年风险:
[0137]1‑
s
10exp(indx

b

meanx

b)
[0138]
其中,s
10
为基线10年生存率,男性为0.97,女性为0.99;meanx

b为“本研究人群各变量与其参数乘积之和的平均值”,男性为140.68,女性为117.26(见表9);indx

b为某个个体各变量具体数值与对应参数(见上表)的乘积之和。
[0139]
实施例2
[0140]
实际应用案例1:
[0141]
待测个体李某,中国汉族人,利用本发明的用于评估冠心病遗传风险的检测装置评估其患冠心病的遗传风险高低,并给予指导建议。主要按照如下步骤进行:采集空腹血,分离待测个体抗凝血中dna,利用illumina hiseq x ten测序仪检测李某的包括本发明前述510位点在内的多个位点的基因型。
[0142]
将各snp的检测结果对照表4查找出各位点相应效应等位基因的遗传贡献,加权求和,得到遗传风险评分=∑βi
×
ni。计算得到李某的冠心病遗传风险评分为0.730,查阅表8,在人群中分布处于高冠心病遗传风险(80%~100%)(图13),该人群冠心病的终生风险(到80岁)为16.0%。
[0143]
李某的冠心病遗传风险较高,建议通过严格强化并养成良好的生活方式和行为习惯,如戒烟、控制体重、增加体力活动、健康饮食等;如存在高血压、高脂血症和糖尿病等危险因素,应在临床医生的指导下严格控制血压、血脂和血糖水平。至少每年进行一次体检,并进一步评估心脑血管病风险。
[0144]
实际应用案例2:
[0145]
待测个体李某,中国汉族人,男性,45岁,收缩压160mmhg,总胆固醇280mg/dl,高密度脂蛋白胆固醇80mg/dl,腰围85cm,吸烟,患有糖尿病,住在我国北方农村地区,合并有动脉粥样硬化性心血管疾病家族史。利用本发明的用于评估冠心病遗传风险的检测装置评估其患冠心病的遗传风险高低,联合china

par临床风险评分给予指导建议。主要按照如下步骤进行:采集空腹血,分离待测个体抗凝血中dna,利用illumina hiseq x ten测序仪检测李某的包括本发明前述510位点在内的多个位点的基因型。
[0146]
进行遗传风险评估:对李某的检测结果进行分析处理,将各snp的检测结果对照表4查找出各位点相应效应等位基因的遗传贡献,加权求和,得到遗传风险评分=∑βi
×
ni。计算得到李某的冠心病遗传风险评分为0.730,查阅表8,在人群中分布处于高冠心病遗传风险(80%~100%)(图13)。
[0147]
进行临床风险评估:基于china

par临床风险模型,根据表9提供的模型参数进行计算,李某的ascvd10年风险为17.7%,处于高临床风险组。
[0148]
综合遗传风险与临床风险,李某,男性,45岁,高遗传风险(80%~100%)合并高临
床风险(>15%),查阅图11和图12,李某冠心病10年风险为9.2%,终生风险为32.6%。因此,应当严格强化并养成良好的生活方式和行为习惯,如戒烟、控制体重、增加体力活动、健康饮食等;并且要在临床医生的指导下严格控制血压、血脂和血糖水平。至少每年进行一次体检,并进一步评估冠心病风险。
[0149]
实际应用案例3:
[0150]
前述应用案例1的待测个体李某,如果个体信息为:中国汉族人,男性,45岁,收缩压145mmhg,总胆固醇280mg/dl,高密度脂蛋白胆固醇80mg/dl,腰围85cm,吸烟,患有糖尿病,住在我国北方农村地区。
[0151]
进行遗传风险评估:对李某的检测结果进行分析处理,将各snp的检测结果对照表4查找出各位点相应效应等位基因的遗传贡献,加权求和,得到遗传风险评分=∑βi
×
ni。计算得到李某的冠心病遗传风险评分为0.730,查阅表8,在人群中分布处于高冠心病遗传风险(80%~100%)(图13)。
[0152]
进行临床风险评估:基于china

par临床风险模型,根据表9提供的模型参数进行计算,李某的ascvd10年风险为8.3%,处于中等临床风险组。
[0153]
综合临床风险与遗传风险,李某,男性,45岁,高遗传风险(80%~100%)合并中等临床风险(5%

9.9%),查阅图11和图12,李某冠心病10年风险为4.1%,冠心病终生风险为17.2%。虽然李某临床风险处于中等水平,但是综合遗传评分后,他的冠心病风险与部分高临床风险人群(临床风险位于10%~14.9%)的冠心病风险类似甚至更高。因此,应当建议在严格遵循健康的生活方式基础上,进一步按照临床指南加强血压、血糖、血脂强化管理。
[0154]
实际应用案例4:
[0155]
前述应用案例1的待测个体李某,如果个体信息为:中国汉族人,男性,35岁,同时合并有冠心病家族史。
[0156]
进行遗传风险评估:对李某的检测结果进行分析处理,将各snp的检测结果对照表4查找出各位点相应效应等位基因的遗传贡献,加权求和,得到遗传风险评分=∑βi
×
ni。计算得到李某的冠心病遗传风险评分为0.730,查阅表8,在人群中分布处于高冠心病遗传风险(80%~100%)(图13),该人群冠心病的终生风险(到80岁)为16.0%。
[0157]
李某同时合并高遗传风险(>80%)和冠心病家族史,根据图8,李某的冠心病终生风险为28.2%。结合遗传风险和家族史预测李某的冠心病发生风险较高,建议其在采取健康生活方式管理基础上,进一步注意控制血压、血糖、血脂和体重,定期进行健康体检,如有异常及时就医。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献