一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于肠道微生物的疾病风险评估模型构建方法及应用与流程

2022-05-27 00:07:19 来源:中国专利 TAG:

技术特征:
1.一种基于肠道微生物的疾病风险评估模型构建方法,其特征在于,至少包括:对样本测序数据进行质控和预处理;构建微生物种水平的相对丰度矩阵并提取特征矩阵;基于分类列和所述特征矩阵构建第一训练矩阵并且进行数据集训练;筛选所述第一训练矩阵中的若干最优特征列和样本分类列以构建第二训练矩阵;对所述第二训练矩阵进行数据集训练并基于训练结果构建风险评估模型。2.根据权利要求1所述的基于肠道微生物的疾病风险评估模型构建方法,其特征在于,构建微生物种水平的相对丰度矩阵并提取特征矩阵的步骤至少包括:筛选样本微生物种水平的相对丰度信息并合并形成所述相对丰度矩阵,对所述相对丰度矩阵进行特征过滤;基于等距log-ratio转化公式对所述相对丰度矩阵中的特征值进行转化并形成样本特征矩阵。3.根据权利要求1或2所述的基于肠道微生物的疾病风险评估模型构建方法,其特征在于,所述相对丰度矩阵进行转化的方式至少包括:采用较小的正数值替换所述相对丰度矩阵中的0值;选定一组标准正交基,得到相应的等距log-ratio转化公式;将所述相对丰度矩阵代入所述等距log-ratio转化公式进行转化并形成样本特征矩阵。4.根据权利要求1~3任一项所述的基于肠道微生物的疾病风险评估模型构建方法,其特征在于,所述等距log-ratio转化公式为:对于任意的i=1,2,3,

,n-1,转化值n为相对丰度矩阵的特征数量,a
i
表示第i个特征值,g(a1,a2,a3,

a
i
)表示a1,a2,a3,

a
i
的几何平均数,公式转化形成的所述样本特征矩阵为m*(n-1)矩阵,转化后的特征名称采用n
i
/n
i 1
替换,其中n
i
表示所述相对丰度矩阵的第i个特征的名称。5.根据权利要求1~4任一项所述的基于肠道微生物的疾病风险评估模型构建方法,其特征在于,基于分类列和所述特征矩阵构建第一训练矩阵并且进行数据集训练的步骤至少包括:基于样本分组信息和所述样本特征矩阵的特征列构建第一训练矩阵,第一训练矩阵为m*n矩阵;将随机森林算法代入第一训练矩阵并且基于测试集进行训练和/或测试,在训练参数循环变化的情况下,选择与测试准确性最高对应的第一训练矩阵的参数值为第一有效参数。6.根据权利要求1~5任一项所述的基于肠道微生物的疾病风险评估模型构建方法,其特征在于,筛选所述第一训练矩阵中的若干最优特征列和样本分类列以构建第二训练矩阵的步骤包括:将第一训练矩阵中的特征列基于平均进度下降指标按照由高到低的顺序进行重要性排序;对所述第一训练矩阵进行十折交叉验证,在重复验证的情况下获取cv值临界点的特征
数量,基于所述cv值临界点的特征数量选取最优特征列,将选取出的最优特征列和样本分类列构建第二训练矩阵。7.根据权利要求1~6任一项所述的基于肠道微生物的疾病风险评估模型构建方法,其特征在于,对所述第二训练矩阵进行数据集训练并基于训练结果构建风险评估模型的步骤至少包括:将随机森林算法代入第二训练矩阵并且基于测试集进行训练和/或测试,在训练参数循环变化的情况下,选择与测试准确性最高对应的第二训练矩阵的参数值为第二有效参数,将由第二训练矩阵训练形成的第二训练结果构成风险评估模型。8.一种基于肠道微生物的疾病风险评估系统,其特征在于,至少包括:预处理模块,用于对样本测序数据进行质控和预处理;提取模块,用于构建微生物种水平的相对丰度矩阵并提取特征矩阵;评估模块,用于根据由权利要求1~7任一项所述的基于肠道微生物的疾病风险评估模型构建方法形成的疾病风险评估模型,对所述特征矩阵进行疾病风险评估,得到评估结果。9.一种基于肠道微生物的疾病风险评估方法,其特征在于,所述方法至少包括:对样本测序数据进行质控和预处理;构建微生物种水平的相对丰度矩阵并提取特征矩阵;根据由权利要求1~7任一项所述的基于肠道微生物的疾病风险评估模型构建方法形成的疾病风险评估模型对所述特征矩阵进行疾病风险评估,得到评估结果。10.根据权利要求9所述的基于肠道微生物的疾病风险评估方法,其特征在于,所述构建微生物种水平的相对丰度矩阵并提取特征矩阵的步骤至少包括:筛选样本微生物种水平的相对丰度信息并合并形成所述相对丰度矩阵,对所述相对丰度矩阵进行特征过滤;基于等距log-ratio转化公式对所述相对丰度矩阵中的特征值进行转化并形成样本特征矩阵。

技术总结
本发明涉及一种基于肠道微生物的疾病风险评估模型构建方法及应用,所述方法至少包括:对样本测序数据进行质控和预处理;构建微生物种水平的相对丰度矩阵并提取特征矩阵;基于分类列和所述特征矩阵构建第一训练矩阵并且进行数据集训练;筛选所述第一训练矩阵中的若干最优特征列和样本分类列以构建第二训练矩阵;对所述第二训练矩阵进行数据集训练并基于训练结果构建风险评估模型。本发明通过等距log-ratio和机器学习等算法对数据集进行标准化处理、数据挖掘和建模等,在疾病风险预测准确性上有了较大的提升,可以用于多种慢性疾病的发病风险提示和健康监测。的发病风险提示和健康监测。的发病风险提示和健康监测。


技术研发人员:李玉帅 王秀呈 张洵 孙龙
受保护的技术使用者:北京浩鼎瑞生物科技有限公司
技术研发日:2022.02.15
技术公布日:2022/5/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献