一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种非破坏性禽蛋品质性状预测方法及系统与流程

2022-04-06 19:50:06 来源:中国专利 TAG:


1.本发明涉及蛋品质无损检测技术领域,特别涉及一种非破坏性禽蛋品质性状预测方法及系统。


背景技术:

2.蛋品质性状是家禽在育种和生产中关注的重要的经济性状,家禽的蛋品质表型性状包括外在品质和内在品质两个方面,是典型的由微效多基因控制的数量性状,同时受环境、营养以及饲养管理等多个因素的影响。
3.虽然目前国内外有一些检测装置和实验室方法能检测禽蛋(家禽产出的蛋)相应的指标,但禽蛋品质的测定往往是破坏性的,现有的禽蛋品质检测的化学方法都是将蛋打破来测定一些理化因子,如蛋白品质和蛋黄品质等,这无疑是不利于育种生产实际的,而且破坏后的种蛋无法再孵化,也难以有效的揭示蛋品质性状对育种个体生长性能或繁殖性能的选择或影响。


技术实现要素:

4.本发明旨在至少解决现有技术中存在的技术问题。为此,本发明提出一种非破坏性禽蛋品质性状预测方法及系统。能无损的反演出必须破坏后才能测定的禽蛋的表型性状,提升表型性状预测的结果的准确性。
5.本发明的第一方面,提供了一种非破坏性禽蛋品质性状预测方法,包括如下步骤:
6.采集样品禽蛋的图像数据集以及其相应蛋鸡的基因型数据集,所述图像数据集中包括多张已标注蛋品质表型性状的禽蛋图像,所述基因型数据集包括所述蛋鸡的dna序列,所述dna序列通过全基因组dna重测序或靶向测序获得;
7.根据所述图像数据集和所述基因型数据集对预设的蛋品质性状预测模型进行训练,得到训练完成后的蛋品质性状预测模型;
8.根据训练完成后的蛋品质性状预测模型从目标禽蛋的目标图像和目标dna序列中预测所述目标禽蛋的表型性状。
9.根据本发明的实施例,至少具有如下技术效果:
10.本方法克服现有检测装置检测的局限性及其实验室方法的复杂性与破坏性等问题,利用人工智能技术,结合禽蛋的外在图像数据与基因型数据,利用融合外部图像数据的外部特征和基因型信息,通过构建蛋品质性状预测模型无损的反演出必须破坏后才能测定的禽蛋的表型性状,提升表型性状预测的结果的准确性。本预测方法相较于现有方案更准确、简便、易行。
11.根据本发明的一些实施例,所述禽蛋图像包括可见光图像、红外图像和高光谱图像,所述高光谱图像包括多个波段的光谱图像。
12.根据本发明的一些实施例,所述根据所述图像数据集和所述基因型数据集对预设的蛋品质性状预测模型进行训练,包括:
13.根据深度卷积神经网络从所述图像数据集中提取图像特征;
14.根据dna编码算法对所述基因型数据集中的dna序列进行编码,得到编码结果,根据深度递归神经网络从所述编码结果中提取dna序列特征;
15.融合所述图像特征和所述dna序列特征,得到融合特征,并根据全连接层和softmax层从所述融合特征中预测所述样品禽蛋的表型性状。
16.根据本发明的一些实施例,所述深度卷积神经网络依次包括:卷积层、池化层、正则化层、递归层以及全连接层。
17.根据本发明的一些实施例,所述根据dna编码算法对所述基因型数据集中的dna序列进行编码,得到编码结果,根据深度递归神经网络从所述编码结果中提取dna序列特征,包括:
18.根据onehot对所述dna序列进行编码,得到第一编码结果,根据dbe对所述dna序列进行编码,得到第二编码结果,根据ncp对所述dna序列进行编码,得到第三编码结果,根据k_mer对所述dna序列进行编码,得到第四编码结果;
19.对所述第一编码结果至所述第四编码结果进行序列集成学习,得到序列集成学习结果;
20.将所述序列集成学习结果输入至所述深度递归神经网络中,得到所述深度递归神经网络提取的dna序列特征。根据本发明的一些实施例,根据xgboost对所述第一编码结果至所述第四编码结果进行序列集成学习。
21.根据本发明的一些实施例,所述表型性状包括蛋白质含量、蛋白ph值、哈氏单位、卵磷脂含量、蛋黄颜色以及蛋黄比例。
22.本发明的第二方面,提供了一种非破坏性禽蛋品质性状预测系统,包括:
23.样本获取单元,用于采集样品禽蛋的图像数据集和所述样品禽蛋相应蛋鸡的基因型数据集,所述图像数据集中包括多张已标注蛋品质表型性状的禽蛋图像,所述基因型数据集包括所述蛋鸡的dna序列,所述dna序列通过全基因组dna重测序或靶向测序获得;
24.模型训练模块,用于根据所述图像数据集和所述基因型数据集对预设的蛋品质性状预测模型进行训练,得到训练完成后的蛋品质性状预测模型;
25.模型预测单元,用于根据训练完成后的蛋品质性状预测模型从目标禽蛋的目标图像和目标dna序列中预测所述目标禽蛋的表型性状。
26.本发明的第三方面,提供了一种电子设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行上述的非破坏性禽蛋品质性状预测方法。
27.本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述的非破坏性禽蛋品质性状预测方法。
28.需要注意的是,本发明的第二方面至第四方面与现有技术之间的有益效果与上述的非破坏性禽蛋品质性状预测方法与现有技术之间的有益效果相同,此处不再细述。
29.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
30.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
31.图1为本发明一个实施例提供的一种非破坏性禽蛋品质性状预测方法的流程示意图;
32.图2为本发明一个实施例提供的非破坏性禽蛋品质性状预测方法的总体流程框图;
33.图3为本发明另一个实施例提供的非破坏性禽蛋品质性状预测方法的总体流程框图;
34.图4为本发明一个实施例提供的一种非破坏性禽蛋品质性状预测系统的结构示意图;
35.图5为本发明一个实施例提供的一种电子设备的结构示意图;
36.图6为本发明一个实施例提供的一种可读存储介质的结构示意图。
具体实施方式
37.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
38.在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
39.此外,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
40.蛋品质表型性状是家禽在育种和生产中关注的重要的经济性状,家禽(蛋鸡)的蛋品质性状包括外在品质性状和内在品质性状两个方面,是典型的由微效多基因控制的数量性状,同时受环境、营养以及饲养管理等多个因素的影响。虽然目前国内外有一些检测装置和实验室方法能检测禽蛋(蛋鸡生产的蛋)相应的指标,但禽蛋品质的测定往往是破坏性的,现有的禽蛋品质检测的化学方法都是将蛋打破来测定一些理化因子(如蛋白品质(蛋白质含量、蛋白ph值、哈氏单位)、蛋黄品质(卵磷脂含量、蛋黄颜色、蛋黄比例)或其他指标(化学成分、蛋的功能特性、血斑和肉斑、滋味和气味、微生物状况等)),这无疑是不利于育种生产实际的,而且破坏后的种蛋无法再孵化,也难以有效的揭示蛋品质性状对育种个体生长性能或繁殖性能的选择或影响。目前对于禽蛋品质性状的无损检测方法大多依靠外观或一些穿透光及光谱方法,很难精准预测禽蛋的内在化学品质。
41.本发明的目的在于克服现有检测装置检测的局限性及其实验室方法的复杂性与破坏性等问题。利用人工智能技术,结合禽蛋的外在图像数据与蛋鸡的基因型数据,利用融合外部图像数据的外部特征和基因型数据,无损的反演出必须破坏后才能测定的禽蛋的表型性状,提升表型性状预测的结果的准确性。
42.参照图1至图3,本发明的一个实施例,提供了一种非破坏性禽蛋品质性状预测方法,包括如下步骤:
43.步骤s200、采集样品禽蛋的图像数据集和样品禽蛋相应蛋鸡的基因型数据集,图像数据集中包括多张已标注蛋品质表型性状的禽蛋图像,基因型数据集包括蛋鸡的dna序列,dna序列通过全基因组dna重测序或靶向测序获得。
44.基因组dna序列由单个核苷酸(a、t、c或g)组成,也是遗传的基本单位,决定了生物体的性状特征,因此选择有利的dna序列或者位点是动植物分子育种的主要手段。在本技术实施例中,蛋品质的表型性状包括但不仅限于蛋白品质(蛋白质含量、蛋白ph值、哈氏单位)和蛋黄品质(卵磷脂含量、蛋黄颜色、蛋黄比例)等,因此,首先确定禽蛋品质性状相关候选基因标记(根据需要预测的表型性状选择相关候选基因标记),获取其dna序列。需要说明的是,dna序列的相关数据来源于育种中心,育种中心在实际育种生产中,会收集相应基因型与表型性状数据,用于指导育种的工作。
45.在一些实施例中,禽蛋图像包括可见光图像、红外图像和高光谱图像,高光谱图像包括多个波段的光谱图像。在相关对蛋品质表型性状的研究方案中,通常使用可见光图像(rgb图像)和红外图像进行研究,即将可见光图像和红外图像作为神经网络的输入数据,从可见光图像和红外图像中虽然能提取较多特征,但在复杂情况下往往还存在众多的可用特征,这些可用特征没有得到充分利用。高光谱图像在全波段具备更为丰富的光谱信息(更多维度的信息),不仅可以反映不同禽蛋物理特性的细微变化,还可以检测禽蛋的内部结构和化学成分的变化,通过模型能够从高光谱图像中提取更为丰富的特征,从而提高模型的识别精度。还需要说明的是,图像数据可以来源于育种中心,可以自行通过摄像设备进行获取。
46.步骤s400、根据图像数据集和基因型数据集对预设的蛋品质性状预测模型进行训练,得到训练完成后的蛋品质性状预测模型。步骤s400具体包括如下步骤:
47.步骤s410、根据深度卷积神经网络从图像数据集中提取图像特征。在一些实施例中,本实施例设定深度卷积神经网络依次包括如:卷积层

池化层

正则层(dropout层或bn层)

递归层

正则层

全连接层(降维)。值得说明的是,根据深度卷积神经网络提取图像特征为神经网络技术领域的公知常识,此处不再细述。
48.步骤s420、根据dna编码算法对基因型数据集中的dna序列进行编码,得到编码结果,根据深度递归神经网络从编码结果中提取dna序列特征。具体的,步骤s420中包括步骤:
49.步骤s4201、根据onehot对dna序列进行编码,得到第一编码结果,根据dbe对dna序列进行编码,得到第二编码结果,根据ncp对dna序列进行编码,得到第三编码结果,根据k_mer对dna序列进行编码,得到第四编码结果。
50.(1)onehot是分类任务编码的重要方式之一。onehot编码形成的向量维度等于字典的大小。其编码方法是将字典中所有字排序后,在对应的位置编码为1,其余位置为0。对于dna序列,一共有四种碱基类型:a、c、g、t,即字典大小为4。这四种碱基的编码结果:
51.a=[0,0,0,1],c=[0,0,1,0],g=[0,1,0,0],t=[1,0,0,0]
[0052]
(2)dbe是对dna序列所代表的字符串中相邻的两个碱基进行编码。如下表1所示,对于每一组二核苷酸都用一个长度为4的向量表示。
[0053]
碱基编码碱基编码
aa[0,0,0,0]at[0,0,0,1]ac[0,0,1,0]ag[0,0,1,1]ta[0,1,0,0]tt[0,1,0,1]tc[0,1,1,0]tg[0,1,1,1]ca[1,0,0,0]ct[1,0,0,1]cc[1,0,1,0]cg[1,0,1,1]ga[1,1,0,0]gt[1,1,0,1]gc[1,1,1,0]gg[1,1,1,1]
[0054]
表1
[0055]
(3)ncp利用dna序列中核苷酸的三种化学性质进行编码。这三种化学性质分别为:环结构类型(嘌呤或者嘧啶)、官能团类型(氨基或者酮基)、碱基配对形成的氢键数量(3个或者2个)。将嘌呤、氨基、2个氢键编码为1,嘧啶、酮基、3个氢键编码为0,可以得到每种碱基的编码结果:
[0056]
a=[1,1,1],c=[0,1,0],g=[1,0,0],t=[0,0,1]
[0057]
(4)k_mer是指dna序列所代表的字符串中长度为k的连续子序列。本方法例,对dna序列中的2_mer、3_mer和4_mer进行频次统计。对于2_mer一共有16种(aa、ac、ag、at、ca、cc、cg、ct、ga、gc、gg、gt、ta、tc、tg、tt),_mer有64种(aaa、aac、...、gtt、ttt),4_mer有256种(aaaa、aaac、...、gttt、tttt)。按照2_mer、3_mer、4_mer的顺序排列,将排列好的频次作为编码结果,得到的特征是长度为336的一维向量。
[0058]
步骤s4201中,选用了onehot、dbe、ncp以及k-mer四种基因编码方法对dna序列进行了较为全面的表征,同时要说明的是,上述编码是为了将dna序列编码成向量的形式,从而作为神经网络的输入。
[0059]
步骤s4202、根据adaboost或xgboost对第一编码结果至第四编码结果进行集成学习,得到集成学习结果。
[0060]
为了进一步提升预测性能,对不同编码方式得到的编码结果,使用序列集成学习方法进行特征选择,以达到减小方差、偏差或改进预测的效果,本实施例采用adaboost或xgboost对上述的所有编码结果进行集成学习,从而获得集成学习结果。以xgboost为例,xgboost对上述所有编码结果(编码结果为一维向量或二维向量)的重要性进行评估,提升重要性高的编码结果的比重,降低重要性低的编码结果的比重,如k_mer编码得到的一维向量特征的重要性低时,可以删除。
[0061]
步骤s4203、根据深度递归神经网络从集成学习结果中提取dna序列特征。
[0062]
由于步骤s4201和s4202,首先,将dna序列编码成向量形式,作为神经网络的输入向量,然后利用xgboost对所有的编码结果进行集成学习,以提升预测性能,集成学习之后的特征直接输入至深度递归神经网络中,提供该深度递归神经网络中的全连接层(dense/fc)提取出与图像特征相似的特征向量。
[0063]
需要注意的是,本技术实施例并未对深度递归神经网络本身的网络结构做出改进,在一最优实施例中,是采用标准的深度递归神经网络架构,具有多个输入和多个输出(与特征数量有关),每个输入输出对应一个标准的递归神经网络单元,每个单元双隐层,每个隐层100个节点,具体的网络结构为领域公知常识,此处便不再细述。
[0064]
步骤s430、融合图像特征和dna序列特征,得到融合特征,并根据全连接层和softmax层从融合特征中预测样品禽蛋的表型性状。融合的方式有多种,本实施例选择拼接(concat)。
[0065]
在预设的蛋品质性状预测模型中,深度卷积神经网络(cnn)采用权重共享策略来捕获禽蛋图像(禽蛋的可见光图像、红外图像和高光谱图像)中的局部模式,而深度递归神经网络(rnn或lstm)可以使用其内部状态(存储器)来学习dna序列模式。即在设计的模型中,深度卷积神经网络被用于学习基元特征,而深度递归神经网络被用于学习基元特征之间的长期依赖关系。模型构建完成后,使用训练数据集(步骤s200的图像数据集和基因型数据集)训练,完成对深度学习模型的训练与优化。
[0066]
步骤s600、根据训练完成后的蛋品质性状预测模型从目标禽蛋的目标图像和目标dna序列中预测目标禽蛋的表型性状。
[0067]
在模型训练完成之后,利用训练完成后的蛋品质性状预测模型从目标禽蛋的目标图像(包括可见光、红外以及高光谱图像)和目标dna序列中预测目标禽蛋的表型性状。这里的预测表型性状包括上述提到的蛋白品质(蛋白质含量、蛋白ph值、哈氏单位)和蛋黄品质(卵磷脂含量、蛋黄颜色、蛋黄比例)。
[0068]
在相关方案中,对于禽蛋品质性状的无损检测方法大多依靠外观或一些穿透光及光谱方法,很难精准预测禽蛋的内在品质;而且,现有的禽蛋品质检测的化学方法都是将蛋打破来测定一些理化因子,不利于育种生产实际,而且破坏后的种蛋无法再孵化,也难以有效的揭示蛋品质性状对育种个体生长性能或繁殖性能的选择或影响。本方法克服现有检测装置检测的局限性及其实验室方法的复杂性与破坏性等问题,利用人工智能技术,结合禽蛋的外在图像数据与蛋鸡的基因型数据,通过构建蛋品质性状预测模型无损的反演出必须破坏后才能测定的禽蛋的表型性状,提升表型性状预测的结果的准确性。本预测方法相较于现有方案更准确、简便、易行。
[0069]
参照图4,本发明的一个实施例,提供了一种非破坏性禽蛋品质性状预测系统,包括样本获取单元1000、模型训练模块2000和模型预测单元3000:
[0070]
样本获取单元1000用于采集样品禽蛋的图像数据集和样品禽蛋相应蛋鸡的基因型数据集,图像数据集中包括多张已标注蛋品质表型性状的禽蛋图像,基因型数据集包括蛋鸡的dna序列,dna序列通过全基因组dna重测序或靶向测序获得;
[0071]
模型训练模块2000用于根据图像数据集和基因型数据集对预设的蛋品质性状预测模型进行训练,得到训练完成后的蛋品质性状预测模型。
[0072]
模型预测单元3000用于根据训练完成后的蛋品质性状预测模型从目标禽蛋的目标图像和目标dna序列中预测目标禽蛋的表型性状。
[0073]
在相关方案中,对于禽蛋品质性状的无损检测方法大多依靠外观或一些穿透光及光谱方法,很难精准预测禽蛋的内在品质;而且,现有的禽蛋品质检测的化学方法都是将蛋打破来测定一些理化因子,不利于育种生产实际,而且破坏后的种蛋无法再孵化,也难以有效的揭示蛋品质性状对育种个体生长性能或繁殖性能的选择或影响。本系统克服现有检测装置检测的局限性及其实验室方法的复杂性与破坏性等问题,利用人工智能技术,结合禽蛋的外在图像数据与具有禽蛋品质遗传特征和生物调控等生理生化特征的蛋鸡的内在基因型数据,通过构建蛋品质性状预测模型无损的反演出必须破坏后才能测定的禽蛋的表型
性状,提升表型性状预测的结果的准确性。本预测系统相较于现有方案更准确、简便、易行。需要注意的是,本系统实施例与上述方法实施例是基于同一个发明构思,因此上述方法实施例的相关内容同样适用于本系统实施例,细节部分便不再重复赘述。
[0074]
参照图5,本技术还提供一种计算机设备301,包括:存储器310、处理器320及存储在存储器310上并可在处理器上运行的计算机程序311,处理器320执行计算机程序311时实现:如上述的非破坏性禽蛋品质性状预测方法。
[0075]
处理器320和存储器310可以通过总线或者其他方式连接。
[0076]
存储器310作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器310可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器310可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0077]
实现上述实施例的非破坏性禽蛋品质性状预测方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例中的非破坏性禽蛋品质性状预测方法,例如,执行以上描述的图1中的方法步骤s200至步骤s600。
[0078]
参照图6,本技术还提供一种计算机可读存储介质401,存储有计算机可执行指令410,计算机可执行指令410用于执行:如上述的非破坏性禽蛋品质性状预测方法。
[0079]
该计算机可读存储介质401存储有计算机可执行指令410,该计算机可执行指令410被一个处理器或控制器执行,例如,被上述电子设备实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的非破坏性禽蛋品质性状预测方法,例如,执行以上描述的图1中的方法步骤s200至步骤s600。
[0080]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储数据(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的数据并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何数据递送介质。
[0081]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0082]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0083]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0084]
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献