一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种变异数据降维输入的驴种群自然选择分类系统

2022-05-18 12:38:43 来源:中国专利 TAG:


1.本发明涉及生物种群基因组数据挖掘领域,特别是涉及基于神经网络的自然选择分类系统。


背景技术:

2.群体遗传学是研究生物群体遗传特点、遗传规律的生命科学。在农业生产上,对于病虫害管理、选种育种有重大经济价值;在医学医疗上,对疾病的感染规律具有巨大贡献;对于生物多样性保护和研究有重大科学意义。
3.目前,国内外相继出现了一些针对果蝇、鱼类的自然选择分类的系统,这些系统将变异节点位置信息和变异矩阵数据分开处理,形成多输入网络,且变异节点位置信息通过全连接网络结合,导致参数量过大和过拟合问题,影响了模型的准确度以及难以应用到具体生产实践中。另外,对于驴种群的自然选择分类系统较少,这些系统未能很好解决驴种群的自然选择分类问题。以上问题,制约了驴的农业生产、选种育种效率,制约了驴的科学饲养。


技术实现要素:

4.本发明针对作用于自然选择分类的神经网络参数过大导致的模型训练困难,模型准确率低的问题以及目前国内外模型对驴种群自然选择研究略少的情况,为了探究驴种群所受自然选择影响以及提高模型准确度的情况并能够应用到具体的生产实践中,本发明提供了一种变异数据降维输入的驴种群自然选择分类系统。通过变异位点融合数据和神经网络,输出自然选择分类结果。所述系统采用cnn神经网络进行自然选择判断。
5.本发明所采用的技术方案是:
6.一种变异数据降维输入的驴种群自然选择分类系统,包括:输入模块,驴基因组序列数据处理模块,分类模块;
7.所述输入模块,用于获取驴基因组序列数据;
8.所述驴基因组序列数据处理模块,与输入模块相联,用于对输入模块获取的基因组序列数据进行处理,输出驴基因组序列的变异位点位置数据和变异矩阵数据;
9.所述驴基因组序列数据处理模块包括:驴基因组序列数据预处理单元、驴基因组序列数据融合单元;
10.所述驴基因组序列数据预处理单元,用于对驴基因组序列数据划分、清洗;
11.所述驴基因组序列数据预处理单元包括:驴基因组序列数据切片分割器,变异节点位置计算器,驴基因组序列数据转换器,驴基因组序列数据清洗器;
12.所述驴基因组序列数据切片分割器用于将驴基因组序列切分为若干大小相等的片段;
13.所述变异节点位置计算器用于计算驴基因片段中的位点在相应片段的相对位置;
14.所述驴基因组序列数据转换器用于将划分的驴基因组片段数据转换为0,1二值数
据矩阵,即变异矩阵数据,其中0表示祖先基因,1表示变异基因;
15.所述驴基因组序列数据清洗器用于删除过短和过长的数据,合并重复位点数据,将重复位点的数据通过或运算得出结果;
16.所述驴基因组序列数据融合单元用于将变异位点位置数据和变异矩阵数据进行运算生成变异位点融合数据,所述运算具体过程为:
17.m
ij
=h
ij
*posj18.其中h
ij
指变异矩阵的第i行第j列数据,posj指第j个变异位点在片段区间内的相对位置,*表示乘法,m
ij
指变异位点融合数据的第i行第j列数据;
19.所述分类模块包括:驴基因组序列模型构建单元、驴基因组序列模型分类单元,分类模块利用卷积神经网络构建驴种群自然选择分类模型,利用所述驴基因组序列数据处理模块输出的数据进行驴种群的自然选择分类;
20.所述驴基因组序列模型构建单元采用卷积神经网络,构建自然选择模型,模型构建按照如下次序进行:调用input层,cnn层,dropout层,搭建分类模型;其中cnn层用于向量表征学习,dropout层用于防止模型过拟合,然后根据每个特征调整权重,最后对权重和特征值向量相乘后求和输出;
21.其中cnn层的计算过程为:
22.v=conv(w,x) b
[0023][0024]
w是权值矩阵,x是变异位点融合数据,b是偏置,是激活函数,conv是卷积函数,v是卷积函数输出结果,y是激活函数的输出结果;
[0025]
所述驴基因组序列模型分类单元将驴基因组序列数据处理模块得到的变异位点融合数据输入到基因组序列模型构建单元构建的模型,利用训练集数据对模型进行训练,并将测试集读入训练好的模型进行自然选择分类;其中,自然选择预测分类过程按照如下次序进行:(1)读入驴基因组序列数据处理模块输出的变异位点融合数据,将读入的数据按照8:2划分成训练集和测试集,(2)采用独热编码方式对离散后的类型数据进行编码,最终得到变异位点数据的向量表示,(3)将转化成向量表示的训练集数据输入到模型中进行模型训练,(4)利用训练好的模型,读入测试集数据,进行自然选择分类。
[0026]
与现有技术相比,本发明的有益效果是:
[0027]
本发明一种变异数据降维输入的驴种群自然选择分类系统,能够分析驴种群的自然选择分类,并且变异位点融合数据可以减少输入大小从而减少神经网络参数,通过神经网络对驴种群的变异位点融合数据自动提取特征和分析,从而获得准确率高、可靠的结果,对于分析驴种群的变异节点所收到的自然选择效应,对驴的农业生产,选种育种,科学饲养等方面具有应用价值。
附图说明
[0028]
图1为一种变异数据降维输入的驴种群自然选择分类系统。
具体实施方式
[0029]
下面结合附图对本发明进一步说明。
[0030]
图1给出了本发明实施例提出的一种变异数据降维输入的驴种群自然选择分类系统。
[0031]
参照图1,本发明实施例提出的一种变异数据降维输入的驴种群自然选择分类系统,包括:输入模块,数据处理模块,分类模块;
[0032]
所述输入模块,用于获取驴基因组序列数据;
[0033]
所述驴基因组序列数据处理模块,与输入模块相联,用于对输入模块获取的基因组序列数据进行处理,输出驴基因组序列的变异位点位置数据和变异矩阵数据;
[0034]
所述驴基因组序列数据处理模块包括:驴基因组序列数据预处理单元、驴基因组序列数据融合单元;
[0035]
所述驴基因组序列数据预处理单元,用于对驴基因组序列数据划分、清洗;
[0036]
所述驴基因组序列数据预处理单元包括:驴基因组序列数据切片分割器,变异节点位置计算器,驴基因组序列数据转换器,驴基因组序列数据清洗器;
[0037]
所述驴基因组序列数据切片分割器用于将驴基因组序列切分为若干大小相等的片段;
[0038]
所述变异节点位置计算器用于计算驴基因片段中的位点在相应片段的相对位置;
[0039]
所述驴基因组序列数据转换器用于将划分的驴基因组片段数据转换为0,1二值数据矩阵,即变异矩阵数据,其中0表示祖先基因,1表示变异基因;
[0040]
所述驴基因组序列数据清洗器用于删除过短和过长的数据,合并重复位点数据,将重复位点的数据通过或运算得出结果;
[0041]
所述驴基因组序列数据融合单元用于将变异位点位置数据和变异矩阵数据进行运算生成变异位点融合数据,所述运算具体过程为:
[0042]mij
=h
ij
*posj[0043]
其中h
ij
指变异矩阵的第i行第j列数据,posj指第j个变异位点在片段区间内的相对位置,*表示乘法,m
ij
指变异位点融合数据的第i行第j列数据;
[0044]
所述分类模块包括:驴基因组序列模型构建单元、驴基因组序列模型分类单元,分类模块利用卷积神经网络构建驴种群自然选择分类模型,利用所述驴基因组序列数据处理模块输出的数据进行驴种群的自然选择分类;
[0045]
所述驴基因组序列模型构建单元采用卷积神经网络,构建自然选择模型,模型构建按照如下次序进行:调用input层,cnn层,dropout层,搭建分类模型;其中cnn层用于向量表征学习,dropout层用于防止模型过拟合,然后根据每个特征调整权重,最后对权重和特征值向量相乘后求和输出;
[0046]
其中cnn层的计算过程为:
[0047]
v=conv(w,x) b
[0048][0049]
w是权值矩阵,x是变异位点融合数据,b是偏置,是激活函数,conv是卷积函数,v是卷积函数输出结果,y是激活函数的输出结果;
[0050]
所述驴基因组序列模型分类单元将驴基因组序列数据处理模块得到的变异位点融合数据输入到基因组序列模型构建单元构建的模型,利用训练集数据对模型进行训练,并将测试集读入训练好的模型进行自然选择分类;其中,自然选择预测分类过程按照如下
次序进行:(1)读入驴基因组序列数据处理模块输出的变异位点融合数据,将读入的数据按照8:2划分成训练集和测试集,(2)采用独热编码方式对离散后的类型数据进行编码,最终得到变异位点数据的向量表示,(3)将转化成向量表示的训练集数据输入到模型中进行模型训练,(4)利用训练好的模型,读入测试集数据,进行自然选择分类。
[0051]
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献