一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

泌尿系统结石术后复发风险预测模型、评估系统及方法与流程

2022-02-21 07:59:54 来源:中国专利 TAG:


1.本发明涉及基因检测领域,特别是涉及泌尿系统结石术后复发的风险评估,更具体地说,是涉及基于高通量测序平台snp检测的泌尿系统结石术后复发风险预测模型的构建,以及基于该模型的泌尿系统结石术后复发风险评估系统和评估方法。


背景技术:

2.泌尿系统结石病是一种常见疾病。据估计,泌尿系统结石的终身患病率为5%~12%。通常,成年男性罹患泌尿系统结石的比例大于成年女性,男女之比为2:1或3:1。有研究结果显示,成人结石的发病高峰为三十至六十岁,虽然结石在20岁以前相对少见,但近年来儿童和青少年中结石的发病率日益升高。中国是泌尿系统结石高发地区之一,许多病人存在结石病反复发作的困扰。根据广州医科大学附属第一医院曾国华教授领衔完成的流行病研究显示,中国成人泌尿系统结石患病率为5.8%,其中男性患病率为6.5%,女性患病率为5.1%,据此可估算,目前中国约有6120万成人泌尿系统结石患者,其中男性约3470万人,女性约2650万人,几乎每17人里就有1人患泌尿系统结石。此外华南及西南地区的泌尿系统结石患病率明显高于华北及西北地区;农村居民泌尿系统结石患病率(7.8%)明显高于城镇居民(4.9%)。泌尿系统结石的危险因素包括性别、年龄、饮食、疾病、家族史等。
3.虽然地域条件、饮食习惯和水质等高危因素在流行病的调查下被逐渐揭示和控制,但是泌尿系统结石发病率和复发率仍然在持续增加,说明仍然有部分患者受到遗传因素的影响,导致遗传性泌尿系统结石病患没有得到及时有效的干预和咨询。近年来,随着芯片技术、测序技术等相关遗传学研究技术的进步,泌尿系统结石遗传因素的研究越来越受到关注和重视。全基因组关联分析(genome-wide association study,gwas)是一种对全基因组范围内的常见遗传变异(单核苷酸多态性和拷贝数)与基因总体关联分析的方法。在全基因组范围内进行整体研究,能够一次性对疾病进行轮廓性概览,适用于复杂疾病的研究。迄今为止,gwas已涉及到包括肿瘤、i型和ⅱ型糖尿病、冠心病、高血压、双相情感障碍和记忆能力等在内的约30多种复杂疾病或表型,并鉴定出一大批各类复杂疾病和表型的相关基因。在复杂疾病的研究中起到了重要的作用。在泌尿系统结石方面,gwas研究已经发现了一些风险候选基因中存在与泌尿系统结石风险明显相关的snp(单核苷酸多态性)位点,如维生素d受体基因(vdr)的rs1544410、rs2228570、rs731236和rs7975232;骨桥蛋白(opn)基因的rs1126616;klotho基因的rs3752472;钙离子敏感受体(casr)基因的rs1501899和arg990gly等等。
4.近年来已经采用基因多态性明确结石疾病的病理、生理机制及个人患结石病的风险,从而采取相应策略预防。病例对照研究相对于家系研究是可选或辅助的方法,包括整个基因组的检测或候选基因检测。未来全基因检测可能广泛应用,但现在候选基因检测更为可行。应用病例对照研究的候选基因检测方法时,其影响因素如研究设计、病例组及对照组选择的方法、候选基因的选择、所研究多态性的功能意义和数据分析应该保证真实关联才能够进行检测。并且,对于已确定的相关候选基因的关联性分析,连锁不平衡及单体型结构
是很重要的。当一个确定的多态性等位基因被发现与疾病有关,可进一步在连锁不平衡(linkage disequilibriu,ld)及单体型结构基础上解释一个或更多的等位基因。一旦确定某单体型携带风险等位基因,通过分子生物学功能分析,即可确定真正有影响的单体型等位基因变异。
5.尽管在过去几十年进行了大量的研究,但是当前尿石症的确切病因仍不十分清楚,导致其发病率居高不下,治疗后复发率也很高,预防措施并不令人满意。因此,对尿石症的病因研究具有重要的临床意义。泌尿系统结石的许多方面仍然需要进一步研究阐明,虽然遗传因素已经被广泛研究,但是仍然没有特发性高尿钙结石患者的染色体图谱。基于遗传学研究的唯一广泛认可的结论是这是一种多基因缺陷和插入的疾病。尽管存在相当大的经济和社会影响,但是对于这一疾病仍然没有有效预测标记物,有许多病人是在有了症状后才被确诊。
6.泌尿系统结石是基因和环境因素混杂的多因素疾病,约有50-70%的结石患者有一个近亲属患有结石。将增加的风险归因于遗传性因素、环境因素还是混杂因素仍然让人疑惑。curhan等人发现限制有结石病史的家庭成员的钙摄入可能增加结石形成的风险。基因分析可以鉴别个人患结石的易感性,还有助于理解结石形成的机制和预测对药物和营养的敏感性。可能在不久的将来,基因组分型将使我们根据个体的基因档案就能够描述个体易患结石的风险,制定适当治疗和饮食指导。最近有几个候选基因的功能研究支持有结石家族史的家庭成员存在常染色体显性遗传。如维生素d受体(vitamin d receptor,vdr)、e-钙粘蛋白、降钙素受体基因(calcitonin receptor gene,ctr)和细胞因子已经被提议作为相关性的候选基因。可能少数几个基因的贡献比较小,因此泌尿系统结石的主要遗传因素还没有阐明。基因序列的微小改变对泌尿系统结石易感性的贡献仅仅能够决定一对基因型-表型相关性,这一说法已经明确。而在整个基因组这些区域存在的多态性,比如重复序列的变异,是连锁研究的基础。因此snp已经成为研究复杂疾病的一种工具,使得寻找结石疾病病因的钙离子代谢的候选基因成为可能。
7.除了泌尿系统结石的发病机制,结石复发也是一个需要关注的核心问题。泌尿系统结石中占比最高的草酸钙结石(60%-80%)也是复发率最高的结石类型。据统计,泌尿系统结石10年内复发率约为50%,20年内约为75%,部分患者在一生中甚至会经历10次或10次以上的复发。同时泌尿系统结石及其复发也是慢性肾脏疾病(chronic kidney disease,ckd)的重要表征和风险因子,我国与泌尿系统结石相关的死亡率也高于欧美国家。
8.药物治疗和饮食的改变有助于防治泌尿系统结石复发,但是这些防范措施可能是需要大量经济支持、难以执行或者导致副作用的,如果我们知道哪些病人有引发第二次有症状泌尿系统结石的高风险,那我们就可以更好地建议病人是否需要进行一些预防性饮食或者服用药物来防止结石复发。
9.在以往的国外研究中,泌尿系统结石复发评分(recurrence of kidney stone score,roks)系统已被用于建立预测结石复发的模型,其中包含了较多独立的复发危险因素,如年龄、性别、家族病史、结石侧、类型等。表1是3个独立的研究。国外这些研究预测模型的缺点是只基于患者临床信息,没有考虑个体的遗传背景,因此准确定较低。
10.表1
[0011][0012]
国内四川大学华西医院披露了一种预测草酸钙泌尿系统结石发生的预测系统(中国发明专利申请号cn202011080261.0),该系统将3个临床指标以及4个菌属的相对丰度值结合,使用常规算法,预测泌尿系统结石的发生的风险。但国内目前基于中国人群的预测复发风险的研究还较少,也未见有关于预测泌尿系统结石复发风险的预测模型。


技术实现要素:

[0013]
本发明要解决的技术问题之一是提供一种泌尿系统结石术后复发风险预测模型,该模型可以准确预测泌尿系统结石术后复发的风险。
[0014]
为解决上述技术问题,本发明的泌尿系统结石术后复发风险预测模型将接受过泌尿系统结石手术的患者的与泌尿系统结石术后复发风险相关的临床特征与所述患者的snp风险值相结合,来预测患者的泌尿系统结石术后复发风险。
[0015]
所述的与泌尿系统结石术后复发风险相关的临床特征,包括如下11个与泌尿系统结石术后复发风险显著相关的临床特征:性别、是否糖尿病、是否甲旁亢、既往结石病史、结石侧、结石位置、结石大小、是否肌酐异常、是否尿路感染、是否草酸钙结石、是否感染性结石。
[0016]
所述的snp风险值根据14个与泌尿系统结石术后复发风险相关的snp位点的突变信息来计算,这14个snp位点及其系数如下表所示:
[0017]
编号snp位点系数1rs10735810-0.0611261492rs117464430.063208853rs130031980.0026229894rs13041834-0.0383764435rs15449350.1157367396rs2043211-0.0563198157rs2286526-0.0193860028rs3798519-0.006515652
9rs4793434-0.03613156910rs562358450.0160006811rs6464214-0.00704623912rs70573980.01044169713rs7556220.04553418914rs780093-0.039971052
[0018]
snp风险值的计算公式为:
[0019][0020]
式中,s为样本的snp风险值,β为snp位点的系数,x为样本对应snp位点的突变信息,i为snp位点的编号。
[0021]
所述snp位点的突变信息包括:野生型,赋值0;杂合突变,赋值1;纯合突变,赋值2。
[0022]
所述的复发风险包括复发时间、复发概率、生存率中的一项或多项。
[0023]
本发明要解决的技术问题之二是提供上述泌尿系统结石术后复发风险预测模型的构建方法,该方法包括如下步骤:
[0024]
采集经过手术的泌尿系统结石患者的血液样本;
[0025]
收集所述患者的可能与泌尿系统结石术后复发风险相关的临床特征的信息,进行单因素回归分析,筛选出与泌尿系统结石术后复发风险相关的临床特征并赋值;
[0026]
根据文献初步筛选出可能与泌尿系统结石术后复发风险相关的候选snp位点,检测并统计所有候选snp位点在每个血液样本中的突变信息并赋值;
[0027]
将所述血液样本随机划分为训练集和测试集,将训练集中候选snp位点的突变信息作为输入数据,采用lasso-cox方法建模并验证,选择最优模型,得到系数非零的snp位点,按照以下公式计算每个样本的snp风险值:
[0028][0029]
其中,s为样本的snp风险值,β为snp位点的系数,x为样本对应snp位点的突变信息,i为系数非零的snp位点的编号,m为系数非零的snp位点的总个数;
[0030]
以所述与泌尿系统结石术后复发风险相关的临床特征和snp风险值为变量,构建多因素回归模型,计算各变量的回归系数,以最大回归系数为标准,计算各变量的取值得分,构建预测泌尿系统结石术后复发风险的列线图。
[0031]
进一步的,为了评估和验证所述泌尿系统结石术后复发风险预测模型的性能,可以分别绘制训练集和测试集的roc曲线,进行模型性能的评估和验证。
[0032]
本发明要解决的技术问题之三是提供一种包含有上述预测模型的泌尿系统结石术后复发风险评估系统,该系统包括有:
[0033]
输入模块,用于输入并向计算模块传递患者的与泌尿系统结石术后复发风险相关的临床特征的取值和snp位点的突变信息取值;
[0034]
计算模块,内置有用上述方法构建的泌尿系统结石术后复发风险预测模型,用于
根据所述snp位点的突变信息取值,计算snp风险值,结合所述临床特征的取值,计算该患者泌尿系统结石术后复发的时间、复发概率、生存率,并传递给输出模块;
[0035]
输出模块,用于输出计算模块计算得到的患者泌尿系统结石术后复发的时间、复发概率、生存率。
[0036]
本发明要解决的技术问题之四是提供一种基于上述评估系统的泌尿系统结石术后复发风险评估方法,该方法包括如下步骤:
[0037]
随访获得患者的与泌尿系统结石术后复发风险相关的临床特征信息;
[0038]
采集该患者血液样本,进行核酸提取、多重pcr高通量测序,分析测序数据,得到该患者的与泌尿系统结石术后复发风险相关的snp位点的突变信息;
[0039]
将所述临床特征信息和snp位点的突变信息的取值输入到所述泌尿系统结石术后复发风险评估系统中,预测该患者泌尿系统结石术后复发时间、复发概率、生存率。
[0040]
本发明要解决的技术问题之五是提供上述预测模型在泌尿系统结石术后复发风险评估中的应用,所述复发风险评估包括复发时间、复发概率、生存率等中的一项或多项的评估。
[0041]
本发明利用1001例随访7年左右的泌尿系统结石患者样本,筛选出与泌尿系统结石复发风险相关的11个临床特征指标和14个snp位点,并建立泌尿系统结石术后复发风险预测模型,大大提高了泌尿系统结石术后复发预测的精度(7年复发率的auc分别达到0.75和0.727,比国外已发表文献的准确性更高),有助于减少因结石复发带来的后续健康问题。此外,本发明的泌尿系统结石术后复发风险评估方法,基于高通量测序技术,可以一次性检测14~48个可能与泌尿系统结石复发风险相关的snp位点,不仅检测效率高,而且操作简单,成本低,准确率高。
附图说明
[0042]
图1是训练集lasso-cox方法参数筛选图;
[0043]
图2是训练集列线(nomogram)图;
[0044]
图3是训练集预测泌尿系统结石术后复发率结果图;
[0045]
图4是训练集预测泌尿系统结石术后复发率模型效果(auc)图;
[0046]
图5是测试集预测泌尿系统结石术后复发率模型效果(auc)图。
具体实施方式
[0047]
为对本发明的技术内容、特点与功效有更具体的了解,现结合附图及具体实施例,对本发明的技术方案做进一步详细的说明。
[0048]
实施例1泌尿系统结石术后复发风险评估系统的建立
[0049]
1.样本来源
[0050]
本实施例采用1001例经过手术的泌尿系统结石患者的血液样本,其中草酸钙结石438例,磷酸钙结石7例,尿酸结石72例,感染性结石220例,其他结石7例,未知类型257例。全部病例随访中位时间7年,无复发生存期中位时间4年。
[0051]
2.筛选临床特征
[0052]
随访收集上述泌尿系统结石患者的21种临床特征并赋值,参见表2。
[0053]
表2泌尿系统结石患者的21种临床特征
[0054][0055][0056]
将表2中的21种临床特征作为输入数据,调用r语言survival包的surv()函数进行单因素cox回归分析,筛选出p值《0.1的统计学上与泌尿系统结石术后复发风险显著相关的11个临床特征(参见表3)。
[0057]
表3与泌尿系统结石术后复发风险相关的11个临床特征
[0058][0059][0060]
3.筛选snp位点并计算风险值
[0061]
依据文献调研收集到48个候选snp位点,利用多重pcr和高通量测序检测方法,测得所有48个snp位点在1001例泌尿结石术后患者中野生型、杂合突变和纯合突变的情况,统计结果参见表4。
[0062]
表4 48个候选snp位点的野生型、纯合突变和杂合突变统计结果
[0063]
[0064][0065]
将1001例样本随机划分为训练集(500例)和测试集(501例),将训练集中48个位点的突变信息(野生型:0,杂合突变:1,纯合突变:2)作为输入数据,调用r语言中glmnet包的lasso-cox方法建模并进行10折交叉验证,选择最小λ=0.03013884(λ为调整模型复杂度的参数,该参数选择方法参见图1,横坐标为log转换的λ值,纵坐标c-index为评估模型预测精度的值,c-index值越大精度越高,综合考虑模型预测精度和模型复杂度选择λ的最小值)对应的模型为最优模型,得到14个系数非零的snp位点(参见表5)。按照公式:(β:snp位点系数,x:样本对应snp位点突变信息)计算每个样本的snp风险值s(risk score)。
[0066]
表5与泌尿系统结石术后复发相关的14个snp位点及其系数
[0067]
[0068][0069]
4.构建泌尿系统结石术后复发风险预测模型
[0070]
将步骤3中训练集(500例)的11个临床特征(参见表3)的取值和计算出的snp风险值作为输入数据,调用r语言survival包的cph函数和surv函数构建多因素回归模型,计算得到上述11个临床特征和snp风险值的回归系数(coef),参见表6。
[0071]
表6 12个变量的回归系数
[0072]
[0073][0074]
调用r语言rms包的nomogram函数建立列线图(即泌尿系统结石术后复发风险预测模型,参见图2),预测泌尿系统结石术后复发时间和3年、5年、7年的复发概率(复发概率=1-生存率)。nomogram列线图中分数为变量的打分刻度;分数以下为预测模型中的各变量的名称,例如性别、是否糖尿病、snp风险值等;变量对应的线段代表该变量的取值范围;变量的分数以所有变量的回归系数中最大的回归系数为标准进行转化:最大回归系数变量为snp风险值2.0520(见表6),500例训练集对应的每个样本的snp风险值取值范围从-0.50到0.25,每变动一个单位其变化为2.0520
×
(0.25-(-0.50))=1.539,0.50))=1.539,(coef为变量对应回归系数,x为变量取值,x0为得分为0时变量取值);总分为所有变量取值后对应分数的加和,代表预测复发月数;3、5、7年生存率通过随访得到,与总分相对应,其中,某个时间点上的生存率=上一个时间点的存活率
×
(当前时间存活人数/(当前时间存活人数 删失人数))。图3是根据图2的列线图绘制的总分和复发概率的关系图,其中,横坐标为11个临床特征和snp风险值的总得分,纵坐标为复发概率。
[0075]
调用r语言survivalroc包的survivalroc函数绘制时间相关的roc(receiver operating characteristic)曲线评估模型效果(auc值为roc曲线与坐标轴形成的面积,auc值越接近1.0,模型性能越好)。训练集中预测3年复发概率的效果为0.645的auc,预测5年复发概率的效果为0.723的auc,预测7年复发概率的效果为0.75的auc,参见图4。
[0076]
使用步骤3中的测试集(501例)验证模型预测的稳定性。首先,根据步骤3得到的14个snp位点的突变信息(野生型:0,杂合突变:1,纯合突变:2)和对应的系数β(参见表5),计算测试集中每个样本的snp风险值;然后,将snp风险值与步骤2得到的11个临床特征(参见表3)取值作为输入数据,用列线图预测泌尿系统结石术后3年、5年和7年的复发概率;通过绘制roc曲线对模型效果进行验证,得到预测3年复发概率的效果为0.631的auc,预测5年复发概率的效果为0.708的auc,7年复发概率效果达到0.727的auc,参见图5。
[0077]
5.泌尿系统结石术后复发风险评估系统
[0078]
利用上述步骤4得到的泌尿系统结石术后复发风险预测模型,开发预测泌尿系统结石术后复发风险评估的系统。该系统可以通过收集接受过泌尿系统结石手术的患者的与泌尿系统结石术后复发风险相关的11个临床特征信息和14个snp位点突变信息,预测该患者术后结石复发的时间和概率。
[0079]
该预测泌尿系统结石术后复发风险评估系统包括输入模块、计算模块和输出模块,其中:
[0080]
输入模块,用于输入并向计算模块传递患者的与泌尿系统结石术后复发风险相关的11个临床特征的取值(包括:性别、是否糖尿病、是否甲旁亢、既往病史、结石侧、结石位置、结石大小、是否肌酐异常、是否尿路感染、是否为草酸钙结石以及是否为感染性结石,取值参见表2)和14个snp位点的突变信息取值(野生型:0,杂合突变:1,纯合突变:2);所述临床特征的信息根据随访得到;所述snp位点的突变信息采用多重pcr和高通量测序的方法检测得到;
[0081]
计算模块,连接在输入模块之后,内置有经过训练的泌尿系统结石术后复发风险预测模型,用于根据所述14个snp位点的突变信息取值,计算snp风险值,结合所述11个临床特征的取值,计算经过手术的泌尿系统结石患者的结石复发时间,以及在术后3年、5年、7年的生存率和结石复发概率,并将计算结果传递给输出模块;该计算模块使用r语言中的glmnet包、survival包、rms包和survivalroc包;
[0082]
输出模块,连接在计算模块之后,用于输出计算模块计算得到的患者泌尿系统结石术后复发的时间、复发概率、生存率;依据复发概率值可以预测泌尿系统结石术后的复发风险。
[0083]
实施例2 1例泌尿系统结石患者术后复发风险评估
[0084]
本实施例的泌尿系统结石患者的11个临床特征的信息及取值如表7所示。
[0085]
表7 1例泌尿系统结石患者的临床特征
[0086]
编号临床特征信息(取值)1性别男(1)2糖尿病否(0)3甲旁亢否(0)4既往结石病史否(0)5结石侧是(1)6结石位置否(0)7结石大小是(1)8肌酐异常否(0)9尿路感染否(0)10草酸钙结石是(1)11感染性结石否(0)
[0087]
使用该患者的静脉采血样本,进行核酸提取、多重pcr高通量测序,通过生信分析,得到该患者的遗传snp信息如下:
[0088]
表8 1例泌尿系统结石患者的snp位点突变信息
[0089]
编号snp位点信息(取值)1rs10735810野生型(0)2rs11746443野生型(0)3rs13003198野生型(0)4rs13041834野生型(0)5rs1544935野生型(0)6rs2043211杂合型(1)7rs2286526野生型(0)8rs3798519杂合型(1)9rs4793434杂合型(1)10rs56235845野生型(0)11rs6464214野生型(0)12rs7057398野生型(0)
13rs755622野生型(0)14rs780093杂合型(1)
[0090]
计算得到该患者的snp风险值:s=-0.138938088。
[0091]
将该患者的上述临床特征信息取值和snp风险值输入到实施例1的泌尿系统结石术后复发风险评估系统中,预测得到该患者泌尿系统结石术后87个月复发,3年复发率为41%,5年复发率为67%,7年复发率为74%,参见表9。
[0092]
表9 1例泌尿系统结石患者的复发风险预测结果
[0093][0094][0095]
以上实施例仅为本发明的可行或较佳实施例而已,是用来说明本发明的,并非用以限制本发明申请专利的范围,因此,凡依本发明申请专利范围所作的均等变化与修饰,均应属于本发明专利涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献