一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于NGS和深度学习的肿瘤免疫治疗效果预测系统

2022-12-02 22:40:58 来源:中国专利 TAG:

基于ngs和深度学习的肿瘤免疫治疗效果预测系统
技术领域
1.本发明属于下一代测序(ngs)和免疫治疗技术领域,具体涉及基于ngs和深度学习的肿瘤免疫治疗效果预测系统。


背景技术:

2.癌症免疫治疗领域近年来取得了多项重大突破,其中免疫检查点抑制剂(icbs)被用于治疗多种癌症,包括晚期非小细胞肺癌、黑色素瘤和肾细胞癌的一线治疗。除了免疫检查点抑制剂,过继细胞疗法和肿瘤疫苗也是常见的癌症免疫疗法。这些癌症免疫治疗的基本机制是t细胞通过识别肿瘤细胞膜上的主要组织相容性复合物(mhc)所递呈的肿瘤新抗原来发挥免疫功能,进而摧毁癌细胞。
3.所以,肿瘤新抗原在当前肿瘤免疫治疗中发挥着重要作用。最常被研究的肿瘤新抗原包括来自单核苷酸变异(snv)和插入或缺失(indel)的新生抗原,另外,基因融合也被报道是其理想来源。理论上,肿瘤新抗原是理想的癌症免疫治疗靶点,因为它们是正常人体组织中不存在的外源性蛋白。因此,对这些新抗原具有特异性的肿瘤杀伤t细胞可以逃避胸腺的阴性选择,并且不太可能触发自身免疫毒性。
4.测序技术的飞速发展,尤其是二代测序技术的应用降低了体细胞突变(snv&indel)和染色体结构变异(sv)等的检测难度。临床相关数据与技术创新相结合,对肿瘤进行测序,并对肿瘤患者的个体化t细胞反应进行功能性解剖,促进了以新抗原为靶点的免疫疗法的发展。肿瘤免疫原性是启动肿瘤免疫治疗的基础,所以能够产生与mhc高亲和力结合的新生抗原,免疫应答的可能性就会越高;作为新抗原形成的指标,一些临床研究已经检验了肿瘤突变负荷(tmb)是否与肿瘤免疫治疗的临床反应性相关。pd-1阻断的非小细胞肺癌临床益处与tmb相关;在接受抗ctla-4治疗的黑色素瘤患者中也观察到了类似的相关性,但是较弱。tmb最近被报道为一个不完美的生物标志物,尚无法预测纳武利尤单抗联合伊匹木单抗相比化疗带来的总体生存期的改善,而仅能预测pfs。此外,一项包含120名晚期实体瘤患者的抗pd-1/ctla-4联合免疫疗法的二期临床研究表示,tmb在免疫治疗中并不能预测治疗效果。tmb越高,最后能够被t细胞识别的新抗原理论上产生也越多。但是,tmb仅代表产生肿瘤新抗原的可能性,不代表新抗原质量。
5.要准确鉴定患者的新抗原是困难的,目前主流的新生抗原预测的主要依赖体细胞错义突变来源(如snv和indel)的多肽,由于这些方法没有考虑当两个基因在基因组中重排异常转录产生的融合基因,相关研究者也开发了关于融合基因的新抗原预测流程,基于mhc分子与多肽结合预测的新抗原筛选流程详细的有:pvac-seq,tsnad,neopepsee和integrate-neo等。总的来说, 目前新抗原预测的流程“核心”基本一致,但是,均只考虑了多肽和mhc分子结合或者pmhc的潜在免疫原性(体外t细胞识别可能性预测),忽视了肿瘤微环境的影响,以及肿瘤患者体内针对这些抗原的t细胞反应的数量。此外,尚缺乏一个整合肿瘤基因组和转录组检测新抗原负荷预测的流程和可靠的综合性标志物以准确预测肿瘤免疫应答。
6.目前预测免疫治疗疗效的方法仅局限于预测肿瘤的突变数量或者新生抗原数量,忽视了肿瘤微环境的影响,以及肿瘤患者体内针对这些抗原的t细胞分化,即cd8 t细胞扩增、耗竭状态。这使得免疫治疗的预后准确性存在较大的问题。因此,开发更加准确的免疫治疗预后方法仍然是本领域亟需解决的问题。


技术实现要素:

7.针对现有技术的问题,本发明提供一种基于ngs数据和深度学习的肿瘤免疫治疗的预后预测方法和系统,目的在于实现更加准确的肿瘤免疫治疗疗效和预后预测。
8.一种基于ngs和深度学习的肿瘤免疫治疗效果预测方法,其包括如下步骤:步骤1,分析患者肿瘤组织和单细胞的测序数据,分析hla-i的分型,并预测snv、indel和fusion来源的多肽;步骤2,分析所述多肽,筛选可信度高的新生抗原;步骤3,采用循环神经网络rnn构建的模型对步骤2得到的新生抗原进行打分,得到新生抗原负荷评分;步骤4,将步骤3得到的新生抗原负荷评分代入多元线性回归模型,预测免疫治疗的治疗结局。
9.优选的,步骤1具体包括如下步骤:步骤1.1,使用polysolver预测hla-i的分型结果;步骤1.2,利用gatk、mutect2、vep和annovar检测出高质量的snv和indel并进行突变注释;步骤1.3,利用genefuse检测dna层面上的融合基因并用star-fusion和arriba获得rna-seq数据中高可信度的融合转录本;步骤1.4,通过neopredpipe输出突变多肽的信息。
10.优选的,步骤2具体包括如下步骤:步骤2.1,利用netmhcpan分析步骤1得到的hla-i和多肽的亲和力;步骤2.2,保留输出为“strong binding,%rank《0.5”的多肽,将其作为可信度高的新生抗原。
11.优选的,所述模型为deephlapan。
12.优选的,所述新生抗原评分包括:对多肽和mhc分子的相互作用的评分,和/或,对t细胞受体和多肽-mhc复合物(tcr-pmhc)的相互作用的评分。
13.优选的,所述cd8-tex多元线性回归模型纳入的预测变量包括:所述新生抗原负荷评分、hla-i类分子mrna表达水平、hla-i/b2m体细胞突变、共刺激分子cd28和cd86的表达水平、免疫微环境中的细胞因子的含量、免疫细胞的含量和临床协变量。
14.优选的,所述多元回归模型为:neo2isii=β1
×
s1i β2
×
s2i β3
×
s3i εi其中,neo2isii为肿瘤样本i中由新生抗原刺激引起的cd8
t 细胞的扩增、耗竭状态,s1i、s2i、s3i分别为肿瘤样本i中的snv,indel和fusion来源的新生抗原负荷评分,β1、β2、β3为系数,εi为肿瘤样本i的肿瘤微环境中的其他变量的影响,即残差值。
15.本发明还提供一种基于ngs和深度学习的肿瘤免疫治疗效果预测系统,其包括:
多肽预测模块,用于分析患者肿瘤组织和单细胞的测序数据,分析hla分型,并预测snv、indel和fusion来源的多肽;新生抗原筛选模块,用于分析所述多肽,筛选可行度高的新生抗原;评分模块,用于采用循环神经网络rnn构建的模型对新生抗原进行打分,得到新生抗原负荷评分;预后预测模块,用于将新生抗原负荷评分代入多元线性回归模型,预测免疫治疗的治疗结局。
16.优选的,所述多肽预测模块的工作具体包括如下步骤:步骤1.1,使用polysolver预测hla-i的分型结果;步骤1.2,利用gatk、mutect2、vep和annovar检测出高质量的snv和indel并进行突变注释;步骤1.3,利用genefuse检测dna层面上的融合基因并用star-fusion和arriba获得rna-seq数据中高可信度的融合转录本;步骤1.4,通过neopredpipe输出突变多肽的信息。
17.优选的,所述新生抗原筛选模块的工作具体包括如下步骤:步骤2.1,利用netmhcpan分析步骤1得到的hla-i和多肽的亲和力;步骤2.2,保留输出为“strong binding,%rank《0.5”的多肽,将其作为可信度高的新生抗原。
18.优选的,所述模型为deephlapan。
19.优选的,所述新生抗原评分包括:对多肽和mhc分子的相互作用的评分,和/或,对t细胞受体和多肽-mhc复合物的相互作用的评分。
20.优选的,所述多元线性回归模型纳入的预测变量包括:所述新生抗原负荷评分、hla-i/b2m体细胞突变、共刺激分子cd28和cd86的表达水平、免疫微环境中的细胞因子的含量、免疫细胞的含量和临床协变量。
21.优选的,所述综合性新生抗原负荷评分为:neo2isi=β1
×
s1i β2
×
s2i β3
×
s3i εi其中,neo2isi为肿瘤样本i中由新生抗原刺激引起的cd8
t 细胞的扩增、耗竭状态,s1i、s2i、s3i分别为肿瘤样本i中的snv,indel和fusion来源的新生抗原负荷评分,β1、β2、β3为系数,εi为肿瘤样本i的肿瘤微环境中的其他变量的影响。
22.本发明还提供一种计算机可读存储介质,其上存储有用于实现上述基于ngs数据和深度学习的肿瘤免疫治疗的预后预测方法的计算机程序。
23.本发明综合考虑了新生抗原的免疫原性和患者体内的肿瘤免疫微环境,构建了综合的新生抗原负荷评分模型,提高了免疫治疗疗效的预测效能。本发明应用于临床能够为临床医生提供治疗用药指导,具有很好的应用前景。
24.显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
25.以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
附图说明
26.图1为实施例1中基于ngs数据和深度学习的肿瘤免疫治疗的预后方法的流程示意图;图2为实施例1的方法和以肿瘤突变负荷(tmb)为指标对anti-pd1/ctla4 抑制剂治疗疗效预测性能评估的roc曲线。
具体实施方式
27.需要特别说明的是,实施例中未具体说明的数据采集、传输、储存和处理等步骤的算法,以及未具体说明的硬件结构、电路连接等均可通过现有技术已公开的内容实现。
28.实施例1 基于ngs数据和深度学习的肿瘤免疫治疗的预后预测方法和系统本实施例的系统包括:多肽预测模块,用于分析患者肿瘤组织和单细胞的测序数据,分析hla分型,并预测snv、indel和fusion来源的多肽;新生抗原筛选模块,用于分析所述多肽,筛选可行度高的新生抗原;评分模块,用于采用循环神经网络rnn构建的模型对新生抗原进行打分,得到新生抗原负荷评分;预后预测模块,用于将新生抗原负荷评分代入多元线性回归模型,预测免疫治疗的治疗结局。
29.采用该系统进行预后预测的方法流程如图1所示,具体步骤如下:1.见图1(步骤1),基于dna-seq和bulk rna-seq数据,分析患者hla分型并预测snv、indel、fusion三种来源的短肽:1)使用polysolver预测hla-i类分子的分型结果;2)利用gatk、mutect2、vep和annovar等检测出高质量的snv和indel并进行突变注释,genefuse检测dna层面上的基因融合,并结合gdc的两个标准融合基因检测的pipeline(star-fusion和arriba)得到高可信度的融合转录本;3)最后通过neopredpipe输出突变多肽信息(8-13个氨基酸序列)。
30.2. 见图1(步骤2),mhc-肽结合预测软件分析mhc呈递的多肽,筛选可信度高的新抗原(%rank《0.5,与mhc i类分子强结合),具体步骤为:利用netmhcpan分析上述hla-i和突变多肽的亲和力,保留输出结果中注释为sb(strong binding,%rank《0.5)的短肽,定义该突变多肽为新生抗原。
31.3. 见图1(步骤3),向深度学习模型工具中输入过滤后的pmhc,对预测新生抗原进行打分,用以表示候选新抗原中具有免疫原性的部分,并定义为新生抗原评分(ns),具体步骤为:基于循环神经网络(rnn)构建的deephlapan模型,考虑多肽和mhc分子的相互作用,同时对t细胞受体和多肽-mhc复合物(tcr-pmhc)的相互作用进行了预测,根据该模型输出的两个打分生成上述候选新抗原对应的新生抗原评分(ns = 结合评分
×ꢀ
免疫原性评分),该评分表示基于体外实验数据预测的pmhc免疫原性。
32.最后使用以下标准筛选候选新抗原:(1)免疫原性评分》0.5的预测新抗原;(2)过滤掉ns较低的5%的新抗原。(3)剔除表达量(tpm)=0的snv和indel新抗原。将样本i中所有过滤后的候选新抗原数量求和为ni,并计算新抗原负荷评分(nls)为。
33.4. 见图1(步骤4),利用单细胞数据划分的细胞群(memory t cells, b cells, plasma cells, monocytes/macrophages, dendritic cells, lymphocytes, regulatory t cells, cytotoxicity (lymphocytes), exhausted cd8
t cells, exhausted/hs cd8
t cells, lymphocytes exhausted/cell-cycle),通过cibersort的方法分析大样本tcga数据集(非小细胞肺癌和黑色素瘤的bulk rna-seq data,训练集)中cd8
t细胞不同亚群的含量,将肿瘤预测新抗原负荷评分与耗竭型的cd8亚群比例联系起来,进行多元线性回归建模,纳入的预测变量包括:1)signal 1,即snv、indel、fusion三种来源的新抗原负荷评分nls,以及hla-i/b2m体细胞突变;2)signal 2,共刺激分子cd28和cd86的表达水平[log2(tpm 1)];3)免疫微环境中的细胞因子(il12,ifn-γ等)及其他免疫细胞(cd4
t细胞,巨噬细胞等);4)临床协变量(性别,年龄,肿瘤纯度等),以解释tme中持续的抗原负荷最终迫使cd8
t细胞持续分化为丧失功能的cd8
tex。
[0034]
5.基于上述cd8-tex的多元线性回归模型,最后构建新生抗原负荷评分模型。
[0035]
模型表达式为:neo2isii=β1*s1i β2*s2i β3*s3i εi,其中,neo2isii为肿瘤样本i中由新生抗原刺激引起的cd8
t 细胞的扩增、耗竭状态,s1i、s2i、s3i分别为肿瘤样本i中的snv,indel和fusion来源的新生抗原负荷评分,β1、β2、β3为系数,εi为肿瘤样本i的肿瘤微环境中的其他变量的影响,即残差值。
[0036]
未预测到snv,indel或fusion新生抗原的情况下,相应的评分取值为0。
[0037]
将新生抗原负荷评分输入上述模型,计算得到neo2isii,并根据预设的阈值(neo2is》1),即可对肿瘤免疫治疗的预后进行预测。
[0038] 下面通过实验对本技术的技术方案作进一步说明。
[0039]
实验例1 预后预测性能的比较一、实验方法本实验例分别通过实施例1的方法和以tmb为指标对anti-pd1/ctla4 抑制剂治疗疗效的预后进行预测,并比较其预后性能。
[0040]
本实验例采用的样本数据:按照7:3比例划分tcga数据库肺癌队列(n=1008)和黑色素瘤队列(n=469)为本次实验的训练集和测试集;验证集为外部数据集,即两个非小细胞肺癌(smc,n=146;rizvi,n=34)和三个黑色素瘤(abbott,n=48;synder,n=64;amato,n=52)。
[0041]
二、实验结果利用两个非小细胞肺癌(smc,n=146;rizvi,n=34)和三个黑色素瘤(abbott,n=48;synder,n=64;amato,n=52)的独立数据集预测免疫治疗队列(验证集)中的治疗结局。roc曲线和auc如图2所示,从图中可以看到,在5个数据集中,实施例1的方法的预测性能均显著优于以tmb为指标进行预测。这表明本发明的方法能够对肿瘤免疫治疗进行更加准确的预后预测。
[0042]
通过上述实施例和实验例可以看到,本发明提供的方法能够筛选出可信度高的新生抗原,并对这些新生抗原的免疫原性进行评分,通过整合建模以评估预测新抗原在肿瘤
微环境中的持续性暴露对cd8
t细胞耗竭的影响,进而对肿瘤免疫治疗进行更加准确的预后预测。本发明应用于临床能够为临床医生提供治疗用药指导,具有很好的应用前景。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献