一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多组学数据集的癌症亚型识别方法及系统与流程

2021-10-24 06:58:00 来源:中国专利 TAG:癌症 识别 亚型 多组 特别

技术特征:
1.一种基于多组学数据集的癌症亚型识别方法,其特征在于,包括:获取各患者的样本数据;采用主成分分析方法对所述样本数据进行降维处理;基于降维后的数据构建相似图;所述相似图用于表示各患者之间的相似性;将各相似图投影到低维子空间;在格拉斯曼流形上合并各子空间;基于合并后的子空间,通过k

means聚类算法识别癌症亚型。2.根据权利要求1所述的基于多组学数据集的癌症亚型识别方法,其特征在于,所述样本数据包括基因表达、mirna表达以及dna甲基化。3.根据权利要求1所述的基于多组学数据集的癌症亚型识别方法,其特征在于,所述相似图的表达式如下:g
(m)
={v
(m)
,e
(m)
}其中,g
(m)
表示第m个相似图,节点v
(m)
表示患者,边e
(m)
表示患者之间的连接。4.根据权利要求1所述的基于多组学数据集的癌症亚型识别方法,其特征在于,在所述基于降维后的数据构建相似图,之后还包括:计算相似图的相似度矩阵;根据所述相似度矩阵,采用k近邻算法保留各相似图的局部结构。5.一种基于多组学数据集的癌症亚型识别系统,其特征在于,包括:样本获取膜,用于获取各患者的样本数据;降维模块,用于采用主成分分析方法对所述样本数据进行降维处理;相似图构建模块,用于基于降维后的数据构建相似图;所述相似图用于表示各患者之间的相似性;投影模块,用于将各相似图投影到低维子空间;合并模块,用于在格拉斯曼流形上合并各子空间;识别模块,用于基于合并后的子空间,通过k

means聚类算法识别癌症亚型。6.根据权利要求5所述的基于多组学数据集的癌症亚型识别系统,其特征在于,所述样本数据包括基因表达、mirna表达以及dna甲基化。7.根据权利要求5所述的基于多组学数据集的癌症亚型识别系统,其特征在于,所述相似图的表达式如下:g
(m)
={v
(m)
,e
(m)
}其中,g
(m)
表示第m个相似图,节点v
(m)
表示患者,边e
(m)
表示患者之间的连接。8.根据权利要求5所述的基于多组学数据集的癌症亚型识别系统,其特征在于,还包括:计算模块,用于计算相似图的相似度矩阵;保留模块,用于根据所述相似度矩阵,采用k近邻算法保留各相似图的局部结构。

技术总结
本发明公开了一种基于多组学数据集的癌症亚型识别方法及系统。该方法包括:获取各患者的样本数据;采用主成分分析方法对所述样本数据进行降维处理;基于降维后的数据构建相似图;所述相似图用于表示各患者之间的相似性;将各相似图投影到低维子空间;在格拉斯曼流形上合并各子空间;基于合并后的子空间,通过k


技术研发人员:蔡宏民 阿里
受保护的技术使用者:华南理工大学
技术研发日:2021.07.19
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜