一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于纳米孔测序技术评估肿瘤纯度的方法

2022-11-30 22:00:37 来源:中国专利 TAG:

技术特征:
1.一种基于纳米孔测序技术评估肿瘤纯度的方法,其特征在于,包括如下步骤:将肿瘤细胞系进行纳米孔测序获得肿瘤细胞系的纳米孔测序数据;基于所述纳米孔测序数据筛选出肿瘤细胞系的pmd区域和hmd区域;基于筛选出的pmd区域和hmd区域信息,计算所述肿瘤细胞系的pmd系数;基于hx1个体的纳米孔测序数据、所述肿瘤细胞系的pmd区域和hmd区域信息,计算所述hx1个体的pmd系数;分别随机抽取肿瘤细胞系的纳米孔测序数据和hx1个体的纳米孔测序数据,并将二者按照一定比例混合作为混合数据集,基于混合数据集的纳米孔测序数据以及所述肿瘤细胞系的pmd区域和hmd区域信息,计算所述混合数据集的pmd系数;基于所述肿瘤细胞系的pmd系数、所述hx1个体的pmd系数和所述混合数据集的pmd系数评估所述混合数据集的肿瘤纯度。2.根据权利要求1所述方法,其特征在于,所述肿瘤细胞系的纳米孔测序数据在用于筛选出pmd区域、hmd区域和计算pmd系数之前以及hx1个体的纳米孔测序数据在用于计算pmd系数之前,均需进行进行纳米孔测序数据的预处理,所述预处理的方法如下:将所述纳米孔测序数据文件中的电信号进行识别并转换为包含碱基信息的文件,并滤除质量小于7.0的reads,保留其余reads。3.根据权利要求1所述方法,其特征在于,基于肿瘤细胞系的纳米孔测序数据筛选出所述肿瘤细胞系的pmd区域和hmd区域的方法包括如下步骤:基于隐马尔可夫模型对纳米孔测序数据进行pmd区域筛选,筛选条件为:每个pmd区域至少包含100个cg位点,pmd区域的长度至少为20000bp;相邻两个pmd区域之间的hmd区域长度至少为10000bp。4.根据权利要求3所述方法,其特征在于,基于所述纳米孔测序数据筛选出所述肿瘤细胞系的pmd区域和hmd区域的方法还包括如何判断pmd区域是否为正确的pmd区域的方法:将肿瘤细胞系的pmd区域进行可视化,显示pmd区域中所有的cg位点,若在所述肿瘤细胞系中所述pmd区域的cg位点均处于非甲基化状态,同时其两边侧翼的区域均处于甲基化状态,则表明所述pmd区域为正确的pmd区域。5.根据权利要求1所述方法,其特征在于,基于所述肿瘤细胞系的pmd区域和hmd区域信息,计算所述肿瘤细胞系的pmd系数,包括如下步骤:筛选出同时与pmd区域和hmd区域有交集的reads作为边界reads;计算每一条边界reads中的所有cg位点的甲基化情况,筛选出甲基化的cg占总cg的比例在0.3和0.7之间的reads作为pmd reads;统计pmd reads占边界reads数的比例即为所述肿瘤细胞系的pmd系数,记为pmd1。6.根据权利要求1所述方法,其特征在于,基于hx1个体的纳米孔测序数据、所述肿瘤细胞系的pmd区域和hmd区域信息,计算所述hx1个体的pmd系数,包括如下步骤:筛选出同时与pmd区域和hmd区域有交集的reads作为边界reads;计算每一条边界reads中的所有cg位点的甲基化情况,筛选出甲基化的cg占总cg的比例在0.3和0.7之间的reads作为pmd reads;统计pmd reads占边界reads数的比例即为所述hx1个体的pmd系数,记为pmd2。7.根据权利要求1所述方法,其特征在于,基于混合数据集的纳米孔测序数据以及所述
肿瘤细胞系的pmd区域和hmd区域信息,计算所述混合数据集的pmd系数,包括如下步骤:筛选出同时与pmd区域和hmd区域有交集的reads作为边界reads;计算每一条边界reads中的所有cg位点的甲基化情况,筛选出甲基化的cg占总cg的比例在0.3和0.7之间的reads作为pmd reads;统计pmd reads占边界reads数的比例即为所述混合数据集的pmd系数,记为pmd3。8.根据权利要求1所述方法,其特征在于,基于所述肿瘤的pmd系数、hx1个体的pmd系数以及混合数据集的pmd系数评估所述混合数据集的肿瘤纯度的方法如下:混合数据集的肿瘤纯度=(pmd3-pmd2)/(pmd1-pmd2),其中,pmd1为所述肿瘤细胞系的pmd系数;pmd2为所述hx1个体的pmd系数;pmd3为所述混合数据集的pmd系数。9.根据权利要求1所述方法,其特征在于,所述肿瘤细胞系为hct116细胞系,所述肿瘤为结直肠癌。10.根据权利要求1所述方法,其特征在于,所述混合数据集中随机抽取的肿瘤细胞系的纳米孔测序数据与随机抽取的hx1个体的纳米孔测序数据的混合比例为1:9、3:7、7:3或9:1。11.一种基于纳米孔测序技术评估肿瘤纯度的模型,其特征在于,由权利要求1~10任一项所述方法构建得到。12.根据权利要求11所述模型,其特征在于,所述模型为基于肿瘤细胞系的pmd系数、hx1个体的pmd系数以及混合数据集的pmd系数,评估混合数据集的肿瘤纯度;所述混合数据集的肿瘤纯度=(pmd3-pmd2)/(pmd1-pmd2),其中,pmd1为所述肿瘤细胞系的pmd系数;pmd2为所述hx1个体的pmd系数;pmd3为所述混合数据集的pmd系数。13.一种评价权利要求12所述模型对肿瘤纯度评估的准确度的方法,其特征在于,包括如下步骤:将所述肿瘤细胞系测序数据与hx1个体测序数据按照一定比例分别随机抽样混合作为混合数据集,基于权利要求12所述模型,由所述肿瘤细胞系的pmd系数、hx1个体的pmd系数以及混合数据集的pmd系数计算所述混合数据集的肿瘤纯度;将所述混合数据集的肿瘤纯度与实际肿瘤纯度值进行差异分析,以评价本发明所述模型对肿瘤纯度评估的准确度。14.根据权利要求13所述方法,其特征在于,所述混合数据集中肿瘤细胞系的测序数据与hx1个体的测序数据的混合比例为1:9、3:7、7:3或9:1。

技术总结
本发明属于肿瘤纯度检测领域,具体涉及一种基于纳米孔测序技术评估肿瘤纯度的方法,包括如下步骤:基于肿瘤细胞系的纳米孔测序数据筛选出相应的PMD区域和HMD区域;基于筛选出的PMD区域和HMD区域分别计算肿瘤细胞系的PMD系数与HX1正常个体的PMD系数,并用于评估肿瘤纯度。本发明充分利用纳米孔测序reads长度较长并且可以横跨PMD和高甲基化区域的特性,通过横跨二者边界区域的reads来筛选并计算含有PMD类型的reads的比例作为肿瘤纯度评估指标,所需肿瘤样本量少,且对肿瘤纯度的评估准确度较高。较高。较高。


技术研发人员:李昕 卢洋 许晗 刘嘉颖
受保护的技术使用者:中山大学
技术研发日:2022.08.17
技术公布日:2022/11/29
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献