一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用AI来辅助早期诊断前列腺癌的算法模型的制作方法

2022-12-07 01:00:41 来源:中国专利 TAG:

一种用ai来辅助早期诊断前列腺癌的算法模型
技术领域
1.本发明涉及前列腺癌辅助诊断领域,具体来说涉及一组模型标志物组合,其包括dnah5、f5和slc2a5,其可应用于前列腺癌的分子诊断评估,以提高前列腺癌的检出率。


背景技术:

2.前列腺癌(prostate cancer,pca)是常见的男性泌尿生殖系肿瘤,严重威胁男性健康,占全球肿瘤发病率第二位、死亡率第六位。而在我国前列腺癌是男性泌尿生殖系统最常见的恶性肿瘤之一,发病率在男性肿瘤中排第六位。
3.目前针对前列腺癌进行诊断的方法主要包括以下几个:
4.1.组织活检:侵入性检测,伤害病人组织,有易感染等副作用;昂贵;特异性低:假阴性率高,阴性活检需重复检测以获得准确的诊断;不能用于癌症筛查或预后预测。
5.2.现有的和正在开发的生物标志物和生物标志物组合诊断试剂(psa,pca3,tmprss2:erg,pca3 tmprss2:erg):低灵敏度/特异性,不能得到准确的诊断;需要使用活检组织或前列腺按摩后的尿液;都是侵入性检测。
6.3.polaris,promark:低灵敏度/特异性,不能得到准确的预后预测;需要使用活检组织或前列腺按摩后的尿液,都是侵入性检测。
7.4.临床参数(如年龄,gleason评分,癌症分期):低灵敏度/特异性,不准确的诊断或预测。
8.目前本领域中仍然需要能够切实地应用于前列腺癌诊断的相关基因,以及开发出具有较高检测准确性的检测试剂。前列腺癌的发生可能受多种基因表达共同影响,因此可以针对前列腺癌发生发展的不同阶段,联合进行多基因表达检测,可以明显的提高前列腺癌的检出率,及时给患者提供有效的规范化手术、辅助治疗等干预措施,以延长生存时间,提高生存质量。


技术实现要素:

9.为了克服上述现有技术中的缺点,本发明提供一种标志物组合,其能够用于前列腺癌辅助诊断,可以明显地提高肿瘤的检出率,其设计巧妙,使用方便,适于大规模推广应用。
10.本发明的第一方面提供一种用ai来辅助早期诊断前列腺癌的算法模型组合,该模型标志物组合包括dnah5、f5和slc2a5。
11.在一个优选的技术方案中,标志物组合由dnah5、f5和slc2a5组成。
12.本发明的第二方面提供上述本发明的标志物组合在制备前列腺癌辅助诊断的基因表达检测模型中的用途。
13.在一个实施方式中,上述本发明的用途中,基因表达检测模型的判断公式为:
14.15.其中,nadj
dnah5
、nadj
f5
、nadj
slc2a5
分别为dnah5、f5和slc2a5归一化后的基因表达量。
16.本发明的第三方面提供上述本发明的标志物组合在制备前列腺癌辅助诊断试剂盒中的用途。
17.本发明的第四方面提供一种前列腺癌辅助诊断试剂盒,该试剂盒包括上述本发明的标志物组合的定量检测试剂。
18.在一个实施方式中,在上述本发明的试剂盒中,定量检测试剂包括上述本发明的标志物组合的特异性引物和探针。
19.本发明提供的用于前列腺癌辅助诊断的标志物组合及其检测模型、检测试剂盒,其可以明显地提高肿瘤的检出率,提供敏感度,以便及时给患者提供有效的规范化手术、辅助治疗等干预措施,以延长生存时间,提高生存质量,并且简单并方便操作。
附图说明
20.图1示出独立验证集的roc曲线:(a)独立验证集1;(b)独立验证集2;(c)独立验证集3。
具体实施方式
21.本发明的试剂盒通过荧光实时定量rt-pcr的方法对前列腺组织活检标本提取物的总mrna进行检测,以对前列腺癌进行辅助诊断。
22.该试剂盒至少包括:dnah5、f5和slc2a5各自的引物和探针。该试剂盒还包括适用于荧光实时定量rt-pcr所需的各种试剂,比如逆转录酶、dntp等。
23.本发明通过具体实施方式进一步阐述本发明的技术方案,但是本领域普通技术人员可以理解的是:以下具体实施方式以及实施例旨在阐述本发明,而不应理解为以任何方式限制本发明。本领域技术人员公知,在不背离本发明精神的情况下,可以对本发明做出许多修改,这样的修改也落入本发明的范围。
24.下述实验方法如无特殊说明,均为本领域常规的实验方法,所使用的实验材料如无特别说明,均属于可以容易的从商业公司获取的实验材料。
25.实施例
26.材料与方法
27.组织来源
28.pca组织来自诊断为前列腺癌的患者的前列腺活检标本,良性组织来自诊断为良性的患者的前列腺活检标本。
29.基因表达数据集
30.从geo(gene expression omnibus)数据库获取4个基因表达数据集:gse17951、gse3325、gse7307和gse46602。其中gse17951作为模型训练集,其余3个数据集作为独立验证集。
31.肿瘤含量在10%以上的肿瘤标本被归类为pca标本,而肿瘤含量在10%以下或来自良性疾病患者的标本被归类为非pca标本。
32.表1列出了每个数据集来源于前列腺组织的可用样本量、pca样本量和非pca样本
量。
33.表1前列腺组织基因表达数据集
[0034][0035]
微阵列预处理
[0036]
这4个数据集均使用affymetrix u133 plus 2.0微阵列对前列腺癌和良性前列腺标本进行基因分析,包含定量的基因表达数据。u133 plus 2.0平台(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=gpl570)大约有55000个探针。采用affy r包的rma函数对geo的基因表达数据集进行归一化。
[0037]
特征选择方法
[0038]
区分pca样本与非pca样本的特征选择方法包括三个步骤:limma线性模型、迭代bma(iterative bayesian model averaging)算法、向后逐步多变量逻辑回归(backward stepwise multiple logistic regression)模型。limma r包用于检测显著差异表达基因(|logfc|≥2且校正后的p值《0.01)。为了减少特征基因的数量,我们采用iterativebma r包进行进一步的筛选。最后使用向后逐步多变量逻辑回归模型建立pca预测模型并筛选显著的(p《0.05)特征基因。
[0039]
模型训练与验证
[0040]
用于正常前列腺组织活检标本与前列腺癌组织比较的特征基因被用于训练多变量逻辑回归诊断分类器。考虑到每个数据集来源的不同实验室、实验或平台之间的批次效应,训练集和验证集中的基因表达值被归一化为0-1。换句话说,一个基因的表达值用以下公式进行归一化:
[0041][0042]
其中,nadj为训练集和验证集中使用的调整值;n为该基因在一个微阵列数据集中的原始表达值;min(dataset)是该基因在一个微阵列数据集中最小的表达水平;max(dataset)是该基因在一个微阵列数据集中最大的表达水平。
[0043]
采用受试者工作特征曲线法(roc),分别评估3个独立验证集的准确性、敏感性、特异性、错误遗漏率(for)、错误发现率(fdr)、f1评分和roc曲线下面积(auc)。pca鉴别预测概率的截断值为0.5,故预测概率》0.5则将检测样本归类为pca,反之为良性。
[0044]
结果
[0045]
特征选择
[0046]
通过limma识别出43个探针在pca样本与非pca样本之间有显著差异表达;然后通过迭代bma算法进一步筛选出4个探针;其中3个探针在向后逐步多变量逻辑回归模型中显著,分别对应3个基因标志物:dnah5、f5和slc2a5,其dna序列分别如序列表中seq id no.1(dnah5)、seq id no.2(f5)、seq id no.3(slc2a5)所示。
[0047]
模型训练与验证
[0048]
基于多变量分析建立的pca的预测公式如下:
[0049][0050]
其中,nadj
dnah5
、nadj
f5
、nadj
slc2a5
分别为dnah5、f5和slc2a5归一化后的基因表达量。
[0051]
3个独立验证集的评估结果如表2所示。
[0052]
表2独立验证集评估结果
[0053][0054]
3个独立验证集的roc曲线如图1所示,其auc结果也列于表2中。
[0055]
从表2可以看出,三个独立验证集的auc均大于0.8,说明其可用于前列腺癌的检测。准确性大于0.82,说明82%以上的样本能够被检测正确;敏感性大于0.76,说明76%以上的真阳性能够被检出,漏诊率小于24%;特异性大于0.84,说明84%以上的真阴性能够被检出,误诊率小于16%。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献