一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种拷贝数变异检测方法、装置、设备和计算机可读介质

2022-11-12 22:13:24 来源:中国专利 TAG:

技术特征:
1.一种拷贝数变异检测方法,其特征在于,包括:将基因组划分为基因组箱,生成所述基因组的信息配置文件,所述信息配置文件包括:各所述基因组箱的读深信号和比对质量;根据所述信息配置文件对所述基因组进行全局分割,并对所述全局分割后的至少部分所述基因组进行局部分割,获得基因片段以及所述基因片段的读深信号和比对质量;将所述基因片段的读深信号和比对质量作为分类特征,计算所述基因片段的异常分数,识别所述基因组的拷贝数变异区域。2.如权利要求1所述的方法,其特征在于,所述将基因组划分为基因组箱,生成所述基因组的信息配置文件,包括:获取所述基因组的测试样本和参考样本;将所述测试样本和所述参考样本进行比对,获得比对结果;根据所述比对结果将所述基因组划分为所述基因组箱;计算所述基因组箱中的读深信号和比对质量,生成所述信息配置文件。3.如权利要求2所述的方法,其特征在于,所述计算所述基因组箱中的读深信号和比对质量,生成所述信息配置文件,包括:计算所述基因组箱中的原始读深信号;对所述原始读深信号进行归一化处理校正。4.如权利要求1所述的方法,其特征在于,所述根据所述信息配置文件对所述基因组进行全局分割,包括:确定一组读深信号连续的所述基因组箱;根据最大统计量,将所述基因组箱的读深信号的平均值与剩余所述基因组箱的读深信号的平均值比较;若比较结果符合变化阈值条件,则确定连续的所述基因组箱中存在所述基因组箱对应有变化的读深信号,将连续的所述基因组箱划分为一个基因段。5.如权利要求1所述的方法,其特征在于,所述对所述全局分割后至少部分所述基因组进行局部分割,包括:获取预设的分割长度;根据所述分割长度将部分所述基因段划分为多个连续且不重叠的基因片段;计算所述基因片段的读深信号和比对质量。6.如权利要求1所述的方法,其特征在于,在获得所述基因片段还包括:对所述基因片段中的读深信号进行去噪处理。7.如权利要求1所述的方法,其特征在于,所述将所述基因片段的读深信号和比对质量作为分类特征,计算所述基因片段的异常分数,识别所述基因组的拷贝数变异区域,包括:将所述基因片段的读深信号和比对质量表示为一个标准化矩阵,所述标准化矩阵中一个所述基因片段的读深信号和比对质量作为一个数据样本;根据所述标准化矩阵计算协方差矩阵;计算所述协方差矩阵的特征值和特征向量;计算各所述数据样本在所述特征向量上的投影距离作为异常分数;根据所述异常分数以及设定的阈值判定所述数据样本中的异常样本;
根据所述异常样本对应的所述基因片段的读深信号确定基线,并声明所述拷贝数变异区域。8.一种拷贝数变异检测装置,包括:文件生成模块,用于将基因组划分为基因组箱,生成所述基因组的信息配置文件,所述信息配置文件包括:各所述基因组箱的读深信号和比对质量;分段模块,用于根据所述信息配置文件对所述基因组进行全局分割,并对所述全局分割后的至少部分所述基因组进行局部分割,获得基因片段以及所述基因片段的读深信号和比对质量;检测模块,用于将所述基因片段的读深信号和比对质量作为分类特征,计算所述基因片段的异常分数,识别所述基因组的拷贝数变异区域。9.一种电子设备,其特征在于,包括:一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如权利要求1~7中任一所述的方法。10.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1~7中任一所述的方法。

技术总结
本发明公开了一种拷贝数变异检测方法、装置、设备和计算机可读介质,属于基因工程技术领域。所述方法包括:将基因组划分为基因组箱,生成基因组的信息配置文件,信息配置文件包括:各基因组箱的读深信号和比对质量;根据信息配置文件对基因组进行全局分割,并对全局分割后的至少部分基因组进行局部分割,获得基因片段以及基因片段的读深信号和比对质量;将基因片段的读深信号和比对质量作为分类特征,计算基因片段的异常分数,识别基因组的拷贝数变异区域。本发明实施例公开的检测方法可提高拷贝数变异检测的敏感性,在检测低幅度拷贝数变异方面有效、可靠。可靠。可靠。


技术研发人员:姜华 张童 董金新 赵祖耀 周梦娇 袁甜婷
受保护的技术使用者:聊城大学
技术研发日:2022.08.19
技术公布日:2022/11/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献