一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于影像组学建立炎症细胞浸润模型预测肿瘤治疗预后的方法与流程

2022-07-27 21:27:53 来源:中国专利 TAG:


1.本发明涉及肿瘤治疗技术领域,具体涉及一种基于影像组学建立 炎症细胞浸润模型预测肿瘤治疗预后的方法。


背景技术:

2.肿瘤是指机体在各种致瘤因子作用下,局部组织细胞增生所形成 的新生物,因为这种新生物多呈占位性块状突起,也称赘生物。
3.研究表明肿瘤内炎症细胞的浸入情况与肿瘤放化疗预后存在极 大的相关性。目前,通过活检对肿瘤组织进行实验室检测是获得肿瘤 内炎症细胞浸润情况的唯一标准。但是,该方法存在以下问题:
4.(1)有创性,增加转移风险:活检过程存在创伤,容易造成肿 瘤沿腔道转移。
5.(2)时间久:检测前需要对标本进行处理,因此需要至少一周 的时间,才能获得结果。
6.(3)不可重复性:由于存在多风险性,不建议患者多次取活检 检测。
7.综上所述,研发一种基于影像组学建立炎症细胞浸润模型预测肿 瘤治疗预后的方法,仍是肿瘤治疗技术领域中急需解决的关键问题。


技术实现要素:

8.针对现有技术所存在的上述缺点,本发明在于提供一种基于影像 组学建立炎症细胞浸润模型预测肿瘤治疗预后的方法,本发明通过患 者基因组数据得到免疫浸润比例,接着与对应的影像学资料(ct或 核磁)进行影像组学分析或神经网络学习,输出结果为对应的免疫浸 润结果,建立免疫细胞浸润模型,最后运用该模型对新患者的影像进 行预测,获得新患者的浸润情况,和传统方法相比,有无创、快速、 可重复等优点。
9.为实现本发明的目的,本发明提供了如下技术方案:
10.一种基于影像组学建立炎症细胞浸润模型预测肿瘤治疗预后的 方法,包括以下步骤:
11.(1)通过患者肿瘤活检获得基因检测序列,运用分析算法对核 酸序列rna-seq进行数据分析获得各种炎症细胞浸润比例,获得的免 疫细胞浸润数据作为后面模型训练的输出;
12.(2)获得与步骤(1)中采集核酸序列rna-seq数据患者的对应 时间附近的影像数据,处理后作为模型训练的输入端数据,将获取的 影像资料导入计划设计系统或影像处理系统上,在系统上手动勾画出 肿瘤区域,对勾画的肿瘤范围进行处理;
13.(3)获取环形感兴趣区域roi的影像特征;
14.(4)将步骤(3)中得到的特征值在python上运用方差检验和 拉索回归进行特征筛选,并与对应的免疫细胞浸润结果建立lasso回 归模型、多项式回归模型以及主成分分析,
对lasso回归模型、多项 式回归模型进行k折交叉检验筛选最优;
15.(5)用筛选出的模型预测另一组患者的免疫浸润情况,并与实 验室获得的免疫浸润结果进行比对,进行模型验证;
16.(6)调整模型中样本数据优化模型,并对模型验证。
17.本发明进一步设置为:在步骤(1)中,所述分析算法为timer 算法,所述timer算法通过核酸序列rna-sque得到不同炎症细胞浸 润百分比,筛选其中一种细胞百分比作为影像组学模型训练的输出结 果。
18.本发明进一步设置为:在步骤(2)中,所述影像数据为ct数据 或mri数据中的任意一种。
19.本发明进一步设置为:在步骤(2)中,对勾画的肿瘤范围进行 处理的方法为:同时向内和向外扩3mm距离,形成环形感兴趣区域 roi,用3d-slicer或python编程软件将环形感兴趣区域roi内部密 度设为1,外部设为0,得到掩膜mask,作为后续获取影像组学信息 时的影像范围。
20.本发明进一步设置为:在步骤(3)中,所述影像特征包括直方 图特征和纹理特征。
21.本发明进一步设置为:在步骤(6)中,所述样本数据包括ct数 据或核磁影像数目、靶区勾画数目、靶区精确程度以及模型中正则化 参数、迭代次数和阈值大小。
22.本发明进一步设置为:在步骤(6)中,所述对模型验证是指导 入新一批病人,预测结果通过接受者操作特性曲线roc的好坏确定最 终模型情况。
23.有益效果
24.采用本发明提供的技术方案,与已知的公有技术相比,具有如下 有益效果:
25.本发明通过患者基因组数据得到免疫浸润比例,接着与对应的影 像学资料(ct或核磁)进行影像组学分析或神经网络学习,输出结 果为对应的免疫浸润结果,建立免疫细胞浸润模型,最后运用该模型 对新患者的影像进行预测,获得新患者的浸润情况,和传统方法相比, 有无创、快速、可重复等优点,为肿瘤疾病治疗过程中免疫变化、预 后情况的判断提供一种完全无创的手段。
附图说明
26.图1为本发明运用算法获得免疫细胞浸润比例的流程图;
27.图2为本发明肿瘤内不同细胞比例图;
28.图3为本发明timer分析结果热图;
29.图4为本发明靶区处理的示例图;
30.图5为本发明roc曲线的示例图。
31.具体实施方式
32.为使本发明实施例的目的、技术方案和优点更加清楚,下面将对 本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的 实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得 的所有其他实施例,都属于本发明保护的范围。
33.为了实现本发明的效果,下面结合实施例对本发明作进一步的描 述。
34.实施例:
35.参照图1-5所示,一种基于影像组学建立炎症细胞浸润模型预测 肿瘤治疗预后的方法,包括以下步骤:
36.(1)通过患者肿瘤活检获得基因检测序列,运用分析算法对核 酸序列rna-seq进行数据分析获得各种炎症细胞浸润比例,获得的免 疫细胞浸润数据作为后面模型训练的输出。
37.进一步的,分析算法为timer算法,timer算法通过核酸序列 rna-sque得到不同炎症细胞浸润百分比,筛选其中一种细胞百分比 作为影像组学模型训练的输出结果。
38.在本步骤中,目前关于免疫浸润的评估算法包括timer,cibersort,quantiseq,xcell,mcp-counter等,这些算法中很多需要自 己下载代码来实现,但是timer算法有网页版,分析过程相对简单, 因此本发明采用timer算法。获得免疫细胞浸润比例的基本的过程如 下图1所示。
39.此外,需要说明的是,timer算法中的timer数据库可以进行三 个方面的分析:(a)免疫的相关性分析;(b)肿瘤基因的扩展(类 似于gepia的分析);(c)上传自己的数据进行免疫情况评估。操作 方法简单:将rna-seq数据以excel的格式上传到timer数据库即可 自动分析各种细胞的比例,结果可以以数据表格、热图的形式显示出 来,也可以手动保存到本地,如图2和图3所示。
40.(2)获得与步骤(1)中采集核酸序列rna-seq数据患者的对应 时间附近的影像数据,处理后作为模型训练的输入端数据,将获取的 影像资料导入计划设计系统或影像处理系统上,在系统上手动勾画出 肿瘤区域,对勾画的肿瘤范围进行处理。
41.进一步的,影像数据为ct数据或mri数据中的任意一种。
42.进一步的,对勾画的肿瘤范围进行处理的方法为:同时向内和向 外扩3mm距离,形成环形感兴趣区域roi,用3d-slicer或python 编程软件将环形感兴趣区域roi内部密度设为1,外部设为0,得到 掩膜mask,作为后续获取影像组学信息时的影像范围。
43.在本步骤中,由于炎症细胞浸润的位置大多位于肿瘤周围区域, 因此,需要进一步对勾画的肿瘤范围进行处理。其处理结果如图4所 示。
44.(3)获取环形感兴趣区域roi的影像特征。
45.进一步的,影像特征包括直方图特征和纹理特征。
46.在本步骤中,将灰度值宽度(bin width)设置为10,取样大小 为1x1x1mm,对上述的直方图特征和纹理特征进行提取。
47.其中,需要说明的是:
48.1)直方图特征
49.最简单的统计描述符基于全局灰度直方图,包括灰度均值、最大 值、最小值、方差和百分位数。由于这些特征基于单像素或单体素分 析,因此称为一阶特征(first order)。更复杂的特征包括偏度和 峰度,它们描述了数据强度分布的形状:偏度反映了数据分布曲线向 左(负偏,低于均值)或向右(正偏,高于均值)的不对称性;而峰 度则反映了数据分布相对于高斯分布由于异常值而导致的拖尾。
50.2)纹理特征
51.绝对梯度(absolute gradient):反映了图像中灰度强度波动 的程度或突然性。对于2个相邻像素或体素,如果一个是黑色,另一 个是白色,则梯度最高,而如果两个像素都是黑色(或都是白色), 则该定位处的梯度为零。灰度是从黑变白(正梯度)还是从白变黑(负 梯度)与梯度大小无关。到直方图特征相似,梯度特征包括梯度平均 值、方差、偏度和峰度。
52.灰度共生矩阵(glcm):灰度共生矩阵(gray level co-occurencematrix,简称glcm)是二阶灰度直方图,glcm在不同方向(2d分析 的水平、垂直或对角线或3d分析13个方向)以及像素或体素之间的 预定义距离,捕获具有预定义灰度强度的像素对或体素对的空间关 系。glcm特征包括:熵,它是灰度级不均匀性或随机性的度量;角 二阶矩(也称为均匀性或能量),反映灰度级的均匀性或有序性;对 比度,它强调属于像素或体素对(像素或体素之间灰度差)。
53.灰度游程矩阵(glrlm):灰度游程矩阵(gray level run-lengthmatrix,简称glrlm)提供了关于具有相同灰度级的连续像素在一个 或多个方向上,2维或3维的空间分布的信息。glrlm特征包括分数, 它评估作为运行一部分的roi内像素或体素的百分比,因此反映了 颗粒度;长期强调和短期强调(逆)矩,分别针对长期和短期运行 的数量进行加权;灰度级和游程长度的不均匀性。
54.灰度大小区域矩阵(glszm):灰度大小区域矩阵(gray levelsize zone matrix,简称glszm)基于与glrlm类似的原理,但在这 里,具有相同灰度级的互连相邻像素或体素的组(所谓的区域)的数 量的计数构成了矩阵的基础。更均匀的纹理将导致更宽更平坦的矩 阵。glszm不是针对不同方向计算的,而是可以针对定义邻域的不同 像素或体素距离计算的。glszm特征可以在2维(8个相邻像素) 或3维(26个相邻体素)中计算。
55.邻域灰度差矩阵(ngtdm):邻域灰度差矩阵(neighbouring graytone difference matrix,简称ngtdm)量化像素或体素的灰度级与 其在预定义距离内的相邻像素或体素的平均灰度级之间的差异总和。 主要特性包括ngtdm的粗糙性、繁忙度和复杂性。粗糙度反映中心 像素或体素与其邻域之间的灰度差异,从而捕捉灰度强度变化的空间 速率;也就是说,由具有相对均匀灰度级(即空间强度变化率较低) 的较大区域组成的roi将具有较高的粗糙度值。另一方面,忙碌反 映了中心像素或体素与其相邻像素之间的快速灰度变化(即强度变化 的高空间频率)。
56.灰度依赖矩阵(gldm):灰度依赖矩阵(gray level dependencematrix,简称gldm)也是基于中心像素或体素与其邻域之间的灰度 关系。如果在定义的灰度级差范围方面满足相关性标准,则将预定距 离内的相邻像素或体素视为连接到中心像素或体素。然后分析roi 是否存在强度依赖于i和j的相邻像素或体素的中心像素或体素。同 样,与glrlm类似,gldm的特征包括反映异质性和同质性的大依赖 性强调和小依赖性强调,以及反映整个roi中灰度级相似性和灰度 级依赖性的灰度级非均匀性和依赖性均匀性。
57.(4)将步骤(3)中得到的特征值在python上运用方差检验和 拉索回归进行特征筛选,并与对应的免疫细胞浸润结果建立lasso回 归模型、多项式回归模型以及主成分分析,对lasso回归模型、多项 式回归模型进行k折交叉检验筛选最优。
58.在本步骤中,k折验证的具体方法如下:将数据集d随机分为k 个包(这里假定k=6),每次将其中一个包作为测试集test,剩下 k-1个包作为训练集train进行训练,此时训
练集train由d变成了 k*d,最后计算k次求得的分类率的平均值,作为该模型或者假设函 数的真实分类率,它有效的避免过学习以及欠学习状态的发生,最后 得到的结果也比较具有说服性。
59.(5)用筛选出的模型预测另一组患者的免疫浸润情况,并与实 验室获得的免疫浸润结果进行比对,进行模型验证。
60.在本步骤中,筛选出的模型是指步骤(4)中,k折交叉检验筛 选最优的模型。
61.(6)调整模型中样本数据优化模型,并对模型验证。
62.进一步的,样本数据包括ct数据或核磁影像数目、靶区勾画数 目、靶区精确程度以及模型中正则化参数、迭代次数和阈值大小。
63.进一步的,对模型验证是指导入新一批病人,预测结果通过接受 者操作特性曲线roc的好坏确定最终模型情况。
64.在本步骤中,模型测试获得的roc曲线如图5所示,roc曲线是 反映敏感度和特异度连续变量的综合指标,是被试在特定刺激条件下 由于采用不同的判断标准得出的不同结果画出的曲线,模型满足要求 后,即可以用该模型预测肿瘤内部炎症细胞浸润情况,将炎症细胞浸 润结果与放疗、化疗和免疫治疗效果之间建立对应关系。
65.本发明有无创(仅仅需要获取患者的ct或核磁图像即可)、快 速(模型建成后预测一组患者需要的时间最多为几分钟)、可重复(扫 描不同时期的影像数据均可以用模型随时进行预测)等优点,能够为 肿瘤治疗预后情况判断提供一种新的手段。
66.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管 参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员 应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不 会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范 围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献