1.本发明涉及计算机技术领域,尤其涉及一种嗅觉受体筛选、模型训练、酒类产品鉴定的方法与装置。
背景技术:
2.酒类产品是我国饮食文化传承中的一种的酒类饮料,其入鼻气香、入口味醇,深受国人喜爱。其中,白酒是我国特有的一种通过粮食发酵而成酒类产品,白酒的香气是白酒中所有挥发性气味化合物共存以及相互反应的总和。已知不同风味、品牌和年份的白酒可呈现迥然不同的香气。因此,明确白酒的香气特征,控制白酒的风味和质量,是白酒企业的重要生产环节。
3.目前,人们主要使用化学分析法联合感官鉴定对白酒香气进行检测。化学分析法例如液相色谱、气相色谱、气质联用仍然受灵敏度和香气成分数据库完善程度所限,经常有理化指标全部合格,但感官鉴定不合格;感官鉴定对气味的反映也相当主观,或受诸多因素影响,其结果可靠性和一致性难以保证,且无法实现高通量检测。受以上因素影响,即使经过双重检测的不同生产批次白酒也存在一定的香气差异。
4.目前对于酒类产品的鉴定手段仍有待改进。
技术实现要素:
5.本发明旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。为此,本发明提供了一种嗅觉受体筛选、模型训练、酒类产品鉴定的方法与装置,通过模型训练得到的机器学习模型能够对酒类产品进行鉴定,具有高准确度和高精度的优点,有助于完善酒类产品的品质控制体系,筛查假冒伪劣产品,适于推广应用。
6.在本发明的一个方面,本发明提出了一种筛选用于酒类产品鉴定的嗅觉受体的方法。根据本发明的实施例,所述方法包括:获取初筛嗅觉受体对酒类产品响应的特征值;将所述特征值输入训练器,以所述酒类产品的已知属性作为标记,便获得用于酒类产品鉴定的优选嗅觉受体。
7.根据本发明的实施例的筛选方法对初筛嗅觉受体进行筛选,优化初筛嗅觉受体的数目和组合,减少了气味检测的成本,节省了后续采用这些嗅觉受体训练酒类产品鉴定机器学习模型以及相应的酒类产品鉴定的计算量、时间以及物力成本。
8.根据本发明的实施例,上述方法还可以进一步包括如下附加技术特征至少之一:根据本发明的实施例,所述训练器是极端随机树。发明人采用极端随机树作为训练器,能够对嗅觉受体鉴定酒类产品的能力进行评分和排序,并最终得到优选嗅觉受体,从而进一步提高后续应用这些嗅觉受体进行酒类判断的效率。
9.根据本发明的实施例,所述极端随机树采用嵌入式的特征选择方法。嵌入式的特征选择方法对酒类产品刺激嗅觉受体得到的特征值进行学习拟合,通过将特征选择过程和数据训练过程融为一体,以实现在训练器训练过程中自动进行特征选择,最终得到优选嗅
觉受体,从而进一步提高后续应用这些嗅觉受体进行酒类判断的效率。
10.根据本发明的实施例,所述初筛嗅觉受体包括选自下列的至少之一:mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p、mor260
‑
8p、mor270
‑
1、mor103
‑
3、mor103
‑
7、mor103
‑
1、mor242
‑
1、mtaar1、mor14
‑
2、mor260
‑
3、olfr614、mor178
‑
1、olfr100、mor32
‑
1、mor7
‑
2、mor13
‑
1、mor179
‑
7、mtaar5、mor106
‑
4、mor106
‑
14、mor17
‑
1、mor286
‑
1、mor286
‑
2、mor268
‑
6、mor272
‑
1、mor256
‑
17、mor23
‑
1、mor10
‑
2、mor256
‑
31、mor286
‑
3p、mor31
‑
6、mor174
‑
13、mor268
‑
2、mor256
‑
20、mor13
‑
3、mor256
‑
8、mor1
‑
3、mor125
‑
5_p。发明人通过大量实验总结出,上述初筛嗅觉受体分别能够被酒类产品中的特定化合物激活,获得特征值。
11.根据本发明的实施例,所述优选嗅觉受体包括选自下列的至少之一:mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p和mor260
‑
8p。发明人通过大量实验总结出,通过选择上述优选嗅觉受体,可以减少嗅觉受体的使用种类,从而减小嗅觉受体的使用成本。
12.在本发明的另一方面,本发明提出了一种训练机器学习模型的方法。根据本发明的实施例,所述机器学习模型用于酒类产品鉴定,所述方法包括:获取嗅觉受体对酒类产品响应的特征值;采用所述特征值作为机器学习模型的输入特征,所述酒类产品的已知属性作为标记,对所述机器学习模型进行训练,获得用于酒类产品鉴定的所述机器学习模型。
13.根据本发明的实施例的训练机器学习模型的方法训练得到的机器学习模型对酒类产品鉴定,具有准确度高、鉴定成本低、鉴定效率高等优点,其平均准确度可达99.59%。
14.根据本发明的实施例,所述嗅觉受体包括选自下列的至少之一:mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p、mor260
‑
8p、mor270
‑
1、mor103
‑
3、mor103
‑
7、mor103
‑
1、mor242
‑
1、mtaar1、mor14
‑
2、mor260
‑
3、olfr614、mor178
‑
1、olfr100、mor32
‑
1、mor7
‑
2、mor13
‑
1、mor179
‑
7、mtaar5、mor106
‑
4、mor106
‑
14、mor17
‑
1、mor286
‑
1、mor286
‑
2、mor268
‑
6、mor272
‑
1、mor256
‑
17、mor23
‑
1、mor10
‑
2、mor256
‑
31、mor286
‑
3p、mor31
‑
6、mor174
‑
13、mor268
‑
2、mor256
‑
20、mor13
‑
3、mor256
‑
8、mor1
‑
3、mor125
‑
5_p。发明人通过大量实验总结出,上述嗅觉受体能够被酒类产品中的特定化合物激活,获得响应的特征值,这些特征值能够有效地用于训练机器学习模型来对酒类产品进行鉴定;并且发明人采用这些特征值训练机器学习模型所需要的训练集数目较少,训练速度快,效率高,成本低,训练后得到的机器学习模型对酒类产品鉴定的平均准确度可达99.59%。
15.根据本发明的实施例,所述嗅觉受体是利用上述筛选用于酒类产品鉴定的嗅觉受体的方法确定的。发明人通过采用上述筛选用于酒类产品鉴定的嗅觉受体的方法,对嗅觉受体进行筛选,减少了嗅觉受体的数目,在进行机器学习模型训练时,可以提高机器学习模型分类的效率,并且在保证鉴定酒类产品准确度的同时,减少气味检测的成本,以及节省了训练和判别的计算量和时间。
16.根据本发明的实施例,所述嗅觉受体包括选自下列的至少之一:mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p和mor260
‑
8p。发明人通过大量实验总结出,采用上述10种嗅觉受体对机器学习模型进行训练,训练后得到的机器学习模型对酒类产品鉴定的平均准确度可达98.50%,其与采用46种
嗅觉受体对酒类产品鉴定的平均准确度(99.59%)相当。由此,发明人在保证鉴定酒类产品准确度的同时,通过对46种嗅觉受体进一步筛选,减少了嗅觉受体的数目,同时,降低了模型训练以及气味检测的成本,以及节省了训练和判别的计算量和时间。
17.根据本发明的实施例,所述嗅觉受体对所述酒类产品响应的特征值是通过使所述酒类产品与嗅觉受体接触而获得的;其中,所述嗅觉受体表达在重组细胞的细胞膜上,所述重组细胞还表达报告蛋白,所述报告蛋白适于在所述嗅觉受体与所述酒类产品接触后产生可检测的信号。根据本发明的实施例,当酒类产品的化合物刺激重组细胞时,当细胞膜上的重组蛋白被激活后,通过对报告蛋白发出的可检测的信号进行检测,以便得到特征值,具有操作简单、方便获取结果等优点。另外,由于嗅觉受体是表达在重组细胞的细胞膜上,对相应重组细胞的生命周期影响较小,从而重组细胞的使用周期比较长,细胞活性较高。
18.根据本发明的实施例,在所述接触前,预先将所述酒类产品稀释至酒精浓度在0.07%
‑
3.00%之间(例如0.07%、0.16%、0.32%、0.5%、0.9%、1.3%、1.825%、2.6%、3.00%)。由于酒类产品中含有大量酒精(乙醇),对细胞有毒害作用,因此发明人通过将待测酒类产品稀释至上述酒精浓度,可使嗅觉受体容易被激活,且嗅觉受体可保持较好状态。另外,在该浓度范围内的酒类产品所产生的嗅觉受体响应,能够有效地用于训练机器学习模型来对酒类产品进行鉴定,并且,采用这些特征值训练机器学习模型所需要的训练集数目较少,训练速度快,效率高,成本低。
19.根据本发明的实施例,所述机器学习模型为神经网络模型,所述机器学习模型用于输出酒类产品的身份信息。采用神经网络模型对特征值和已知属性进行训练,最终得到的机器学习模型对酒类产品鉴定的平均准确度可达99.59%。
20.另外,本领域技术人员能够理解的是,前面针对筛选用于酒类产品鉴定的嗅觉受体的方法所描述的特征和优点同样适用于该训练机器学习模型的方法,在此不再赘述。
21.在本发明的又一方面,本发明提出了一种对酒类产品进行鉴定的方法。根据本发明的实施例,所述方法包括:获取嗅觉受体对酒类产品响应的特征值;采用所述特征值作为机器学习模型的输入特征,利用预先采用上述方法训练的所述机器学习模型获得所述酒类产品的属性。
22.根据本发明的实施例的对酒类产品进行鉴定的方法能够对酒类产品进行鉴定,且具有操作简单、检测快、准确率高等优点。
23.根据本发明的实施例,所述嗅觉受体包括选自下列的至少之一:mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p、mor260
‑
8p、mor270
‑
1、mor103
‑
3、mor103
‑
7、mor103
‑
1、mor242
‑
1、mtaar1、mor14
‑
2、mor260
‑
3、olfr614、mor178
‑
1、olfr100、mor32
‑
1、mor7
‑
2、mor13
‑
1、mor179
‑
7、mtaar5、mor106
‑
4、mor106
‑
14、mor17
‑
1、mor286
‑
1、mor286
‑
2、mor268
‑
6、mor272
‑
1、mor256
‑
17、mor23
‑
1、mor10
‑
2、mor256
‑
31、mor286
‑
3p、mor31
‑
6、mor174
‑
13、mor268
‑
2、mor256
‑
20、mor13
‑
3、mor256
‑
8、mor1
‑
3、mor125
‑
5_p。发明人经过大量实验总结出,上述嗅觉受体能够被酒类产品中的特定化合物激活,获得的特征值,这些特征值输入至训练后的机器学习模型中,能够实现机器学习模型对酒类产品进行鉴定,并且,采用这些特征值输入至机器学习模型进行鉴定,鉴定速度快,效率高,成本低,其对酒类产品鉴定的平均准确度可达99.59%。
24.根据本发明的实施例,所述嗅觉受体包括选自下列的至少之一:mor106
‑
1、
mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p和mor260
‑
8p。发明人经过大量实验总结出,采用上述嗅觉受体得到响应的特征值,采用这些特征值输入至机器学习模型中,并实现对酒类产品的鉴定,其鉴定的平均准确度可达98.50%。上述10种嗅觉受体对酒类产品鉴定的平均准确度(98.5%)与采用46种嗅觉受体对酒类产品鉴定的平均准确度(99.59%)相当。由此,发明人在保证鉴定酒类产品准确度的同时,通过减少嗅觉受体的数目,提高了机器学习模型分类的效率,降低了酒类产品的属性检测的成本,并且节省了鉴定的计算量和时间。
25.另外,本领域技术人员能够理解的是,前面针对训练机器学习模型的方法所描述的特征和优点同样适用于该对酒类产品进行鉴定的方法,在此不再赘述。
26.在本发明的又一方面,本发明提出了一种对酒类产品进行鉴定的装置。根据本发明的实施例,所述装置包括:预处理单元,用于对所述酒类产品进行预处理;检测单元,用于获取嗅觉受体对进行预处理的所述酒类产品响应的特征值;分析单元,用于采用所述特征值作为机器学习模型的输入特征,然后利用预先采用上述训练机器学习模型的方法训练的所述机器学习模型获得所述酒类产品的属性。
27.根据本发明的实施例的用于对酒类产品进行鉴定的装置能够对酒类产品进行鉴定,且具有操作简便、鉴定快、准确度高等优点。
28.另外,本领域技术人员能够理解的是,前面针对训练机器学习模型的方法所描述的特征和优点同样适用于该对酒类产品进行鉴定的的装置,在此不再赘述。
29.在本发明的又一方面,本发明提出了一种电子设备。根据本发明的实施例,所述电子设备包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序以实现上述对酒类产品进行鉴定的方法。
30.根据本发明的实施例的电子设备基于待测酒类产品响应的特征值可对酒类产品进行鉴定,且具有操作简便、鉴定快、准确度高等优点。
31.另外,本领域技术人员能够理解的是,前面针对对酒类产品进行鉴定的方法所描述的特征和优点同样适用于该电子设备,在此不再赘述。
32.在本发明的又一方面,本发明提出了一种可执行的存储介质。根据本发明的实施例,所述存储介质存储有计算机程序指令,所述计算机程序指令在处理器上运行时,使得所述处理器执行上述对酒类产品进行鉴定的方法。
33.根据本发明的实施例的可执行的存储介质基于待测酒类产品响应的特征值可对酒类产品进行鉴定,且具有操作简便、鉴定快、准确度高等优点。
34.另外,本领域技术人员能够理解的是,前面针对对酒类产品进行鉴定的方法所描述的特征和优点同样适用于该可执行的存储介质,在此不再赘述。
35.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
36.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本发明一个实施例的筛选用于酒类产品鉴定的嗅觉受体的方法流程示
意图;图2为根据本发明一个实施例的训练机器学习模型的方法流程示意图;图3为根据本发明另一个实施例的对酒类产品进行鉴定的方法流程示意图;图4为根据本发明一个实施例的对酒类产品进行鉴定的方法流程示意图;图5为根据本发明一个实施例的对酒类产品进行鉴定的装置流程示意图;图6为根据本发明实施例1的响应值图谱;图7为根据本发明实施例1的训练损失图;图8为根据本发明实施例1的radviz雷达图真实分布图;图9为根据本发明实施例1的radviz雷达图预测分布图;图10为根据本发明实施例1的热谱图;图11为根据本发明实施例1的不同嗅觉受体的重要性评分示意图;图12为根据本发明实施例1的训练损失图;图13为根据本发明实施例1的radviz雷达图真实分布图;图14为根据本发明实施例1的radviz雷达图预测分布图。
具体实施方式
37.下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
38.需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
39.为了便于理解本发明的实施例,首先对本发明实施例涉及到的相关概念进行如下简单介绍:人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
40.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
41.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
42.神经网络(neural network,nn),在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。神经网络由大量的人工神经元联结进行计算。大多数情况下神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。神经网络通常是通过一个基于数学统计学类型的学习方法(learning method)得以优化,所以也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间。和其他机器学习方法一样,神经网络已经被用于解决各种各样的问题,例如机器视觉和语音识别。这些问题都是很难被传统基于规则的编程所解决的。
43.极端随机树(extremely randomized trees),是一种集成学习技术,包含多个决策树的分类器,它将森林中收集的多个去相关决策树的结果聚集起来输出分类结果。极端随机树的每棵决策树都是由原始训练样本构建的,在每个测试节点上,每棵树都有一个随机样本,样本中有k个特征,每个决策树都必须从这些特征集中选择最佳特征,然后根据一些数学指标(一般是基尼指数)来拆分数据。在构建森林的过程中,对于每个特征,计算用于分割特征决策的数学指标(如使用基尼指数)的归一化总缩减量,这个值称为基尼要素的重要性。基尼重要性按降序排列后,可根据需要选择前k个特征。
44.在本文中使用的术语“嗅觉受体(odorant receptor,or)”是指在嗅觉细胞中具有七次跨膜结构的g蛋白偶联受体(gpcr)家族的一个或多个成员,其对有气味物质的识别特异性高。
45.在本文中使用的术语“报告蛋白”是指在生物体内容易被鉴定和测量的蛋白质。报告蛋白包括,但不限于胭脂碱合成酶、章鱼碱合成酶、新霉素磷酸转移酶基因、氯霉素乙酰转移酶、庆大霉素转移酶、葡萄糖苷酶、荧光素酶、荧光蛋白、分泌型碱性磷酸酶。
46.筛选用于酒类产品鉴定的嗅觉受体的方法在本发明的一个方面,本发明提出了一种筛选用于酒类产品鉴定的嗅觉受体的方法,如图1所示,该方法包括s100
‑
s110:s100:获取初筛嗅觉受体对酒类产品响应的特征值。
47.根据本发明的实施例,通过酒类产品刺激初筛嗅觉受体,不同嗅觉受体被酒类产品中不同的化学物初筛的激活程度不同,以得到不同的特征值。
48.需要说明的是,本实施例及其他实施例中所使用的“特征值”的形式可为声音、图片、数值等,且在本文中所指的“特征值”为响应值图谱中的响应值。
49.根据本发明的实施例,初筛嗅觉受体是通过酒类产品对多种嗅觉受体(例如,上千种嗅觉受体)进行检测后确定的。
50.具体地,将酒类产品的化合物刺激1113种嗅觉受体,酒类产品中不同的化合物对不同的嗅觉受体的刺激强度不同,得到的特征值不同,发明人根据特征值的大小,最终确定了46种初筛嗅觉受体,初筛嗅觉受体包括mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p、mor260
‑
8p、mor270
‑
1、mor103
‑
3、mor103
‑
7、mor103
‑
1、mor242
‑
1、mtaar1、mor14
‑
2、mor260
‑
3、olfr614、mor178
‑
1、olfr100、mor32
‑
1、mor7
‑
2、mor13
‑
1、mor179
‑
7、mtaar5、mor106
‑
4、mor106
‑
14、mor17
‑
1、mor286
‑
1、mor286
‑
2、mor268
‑
6、mor272
‑
1、mor256
‑
17、mor23
‑
1、mor10
‑
2、mor256
‑
31、mor286
‑
3p、mor31
‑
6、mor174
‑
13、mor268
‑
2、mor256
‑
20、mor13
‑
3、mor256
‑
8、mor1
‑
3、mor125
‑
5_p。
51.需要说明的是,在本文中所使用的“嗅觉受体”的来源并不受特别限制,只要该嗅觉受体能够有效地对酒类产品中的特定物质做出应答即可。根据本发明的实施例,可以采用的“嗅觉受体”可以来源于哺乳动物、昆虫、鱼类等,其中,哺乳动物可以包括但不限于人、狗、猫、猪、小鼠、大鼠等。
52.在本文中所使用的术语“酒类产品”应做广义理解,其可以指任何包含乙醇(酒精)成分的液态饮品,尤其是白酒产品(或者在本文中有时直接称为“白酒”),由于白酒产品中的酒精浓度高,其挥发性强,因此,白酒中的化合物更容易刺激嗅觉受体,以便容易获得足够训练机器学习模型以及进行酒类鉴定的特征值。
53.s110:将特征值输入训练器,以酒类产品的已知属性作为标记,获得用于酒类产品鉴定的优选嗅觉受体。
54.根据本发明的实施例,在获得特征值后,可以将特征值输入至训练器中,以酒类产品的已知属性作为标记,可以通过机器学习模型,训练得到与酒类产品的鉴定关联度较高的嗅觉受体,从而可以提高后续采用经过训练的模型进行酒类产品鉴定的效率。
55.根据本发明的实施例,可以采用的训练器是集成学习中的极端随机树(extremely randomized trees),该方法可以对酒类产品刺激初筛嗅觉受体得到的特征值进行学习,对每一种嗅觉受体鉴定酒类产品的重要性进行评分和排序,最终筛选出优选嗅觉受体。通过对初筛嗅觉受体的数目和组合进行优化,减少了气味检测的成本,以及节省了训练和判别的计算量和时间。
56.具体地,本发明实施例的训练器中采用嵌入式(embedded)的特征选择方法对酒类产品刺激嗅觉受体得到的特征值进行学习拟合,该方法主要是通过将特征选择过程和数据训练过程融合为一体,两者在同一优化过程中完成,即可在训练过程中自动进行特征选择。
57.需要说明的是,在本文中的“特征”是指嗅觉受体。
58.根据本发明的实施例,在本文中的“特征选择”是指对初筛嗅觉受体的选择。
59.具体地,本发明中的特征选择是通过计算每两种初筛嗅觉受体的特征值的皮尔森(pearson)相关系数,发现不同初筛嗅觉受体之间在酒类产品判别时存在相关性和冗余性,采用极端随机树模型对上述初筛嗅觉受体被酒类产品刺激后得到的特征值进行学习,并对每一种嗅觉受体鉴定酒类产品的重要性进行评分和排序,最终筛选出优选嗅觉受体。
60.示例性地,可采用极端随机树模型对上述的46种初筛嗅觉受体进行筛选,得到10种优选嗅觉受体。例如,优选嗅觉受体包括mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p和mor260
‑
8p。发明人采用极端随机树对特征值进行拟合学习,将特征选择过程和数据训练过程在同一优化过程中完成,并对每一种嗅觉受体鉴定酒类产品的重要性进行评分和排序,最终得到的上述优选嗅觉受体,发明人通过减少嗅觉受体数目,提高了机器学习模型分类的效率,降低了酒类产品的属性检测的成本,并且节省了鉴定的计算量和时间。
61.本实施例公开的筛选用于酒类产品鉴定的嗅觉受体的方法,通过对初筛嗅觉受体进行筛选,获得初筛嗅觉受体的特征值,基于该特征值进行特征选择和数据训练,获得优选嗅觉受体,以用于酒类产品的鉴定。该方法可以减少嗅觉受体的使用种类,降低嗅觉受体的使用成本、提高机器学习模型分类的效率,保证了机器学习模型分类的准确度,并且,还能在嗅觉受体种类和成本最大化降低的基础上确保酒类产品鉴定的准确度。
62.训练机器学习模型的方法在本发明的又一方面,本发明提出了一种训练机器学习模型的方法,该机器学习模型用于酒类产品鉴定,需要说明的是,“机器学习模型”是指根据多种酒类产品在嗅觉受体上的特征值,建立该特征值与酒类产品的身份信息的分类规则,用于对酒类产品的身份信息进行鉴定。
63.如图2所示,训练方法按照如下过程进行:s220:获取嗅觉受体对酒类产品响应的特征值。
64.根据本发明的实施例,将嗅觉受体表达在重组细胞的细胞膜上,重组细胞还表达报告蛋白,报告蛋白适于在嗅觉受体与酒类产品接触后产生可检测的信号。然后将酒类产品与重组细胞接触,酒类产品中的化合物刺激位于不同重组细胞上的多种嗅觉受体(例如,上千种嗅觉受体),酒类产品中不同的化合物对不同的嗅觉受体的刺激强度不同,报告蛋白发出的信号强度也不同,通过对报告蛋白发出的可检测的信号进行检测,得到不同的特征值。
65.需要说明的是,嗅觉受体的构建方法包括:从ordb(olfactory receptor database)数据库获取嗅觉受体的dna序列,通过基因合成或者从基因组扩增(pcr)获得基因片段,通过酶切连接法或者同源重组法插入到表达质粒中,并进行测序验证,将含有嗅觉受体基因的表达质粒库转染到细胞中。
66.具体地,上述嗅觉受体基因名来源可参见olfactory receptor database (ordb):https://senselab.med.yale.edu/ordb/。
67.在一些实施例中,s220中所应用的嗅觉受体可包括选自下列的至少之一:mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p、mor260
‑
8p、mor270
‑
1、mor103
‑
3、mor103
‑
7、mor103
‑
1、mor242
‑
1、mtaar1、mor14
‑
2、mor260
‑
3、olfr614、mor178
‑
1、olfr100、mor32
‑
1、mor7
‑
2、mor13
‑
1、mor179
‑
7、mtaar5、mor106
‑
4、mor106
‑
14、mor17
‑
1、mor286
‑
1、mor286
‑
2、mor268
‑
6、mor272
‑
1、mor256
‑
17、mor23
‑
1、mor10
‑
2、mor256
‑
31、mor286
‑
3p、mor31
‑
6、mor174
‑
13、mor268
‑
2、mor256
‑
20、mor13
‑
3、mor256
‑
8、mor1
‑
3、mor125
‑
5_p。上述嗅觉受体能够被酒类产品中的特定化合物激活,获得的特征值,这些特征值能够有效地用于训练机器学习模型来对酒类产品进行鉴定,并且,采用这些特征值训练机器学习模型所需要的训练集数目较少,训练速度快,效率高,成本低。
68.在一些实施例中,s220中所应用的嗅觉受体可包括选自下列的至少之一:mor106
‑
1、mor271
‑
1、mor22
‑
4、olfrb6、mor213
‑
1、mor110
‑
10、mor103
‑
2、mor103
‑
12、mor273
‑
3p和mor260
‑
8p。通过对嗅觉受体进行筛选,发明人经过大量实验总结出,采用上述嗅觉受体对机器学习模型进行训练,训练后得到的机器学习模型对酒类产品鉴定的平均准确度可达98.50%,且具有降低了模型训练以及气味检测的成本、节省了训练和判别的计算量和时间等优点。
69.本领域技术人员能够理解的是,酒类产品中的酒精含量,对于嗅觉受体能否产生可以有效地用于训练机器学习模型以及通过机器学习模型进行酒类产品鉴定有着显著的影响。为此,本发明的发明人通过大量实验对酒类产品中的酒精含量进行稀释,总结出最佳浓度范围。由此,根据本发明的实施例,如图3所示,在s220之前,还可以进一步包括:s210:预先将酒类产品稀释至酒精浓度在0.07%
‑
3.00%之间(例如0.07%、0.16%、
0.32%、0.5%、0.9%、1.3%、1.825%、2.6%、3.00%)。
70.根据本发明的实施例,由于酒类产品中含有大量酒精(乙醇),对细胞有毒害作用,因此,通过将待测酒类产品稀释至上述酒精浓度,可使嗅觉受体容易被激活,且嗅觉受体可保持较好状态。
71.s230:采用特征值作为机器学习模型的输入特征,酒类产品的已知属性作为标记,对机器学习模型进行训练,获得用于酒类产品鉴定的机器学习模型。
72.根据本发明的实施例,以s21中获取的特征值及其对应的已知属性作为训练集,将该训练集作为输入特征输入至待训练的机器学习模型中进行迭代训练。直到训练结果(酒类产品的身份信息)与作为标记的酒类产品的身份信息相匹配,则无需调整机器学习模型的分类规则。
73.需要说明的是,在对机器学习模型进行训练时,需要将所获得的特征值以及相应的酒类产品的已知属性转化为数字信息,从而可以方便地进行计算和模型的优化。
74.在训练过程中,可以将机器学习模型的输出结果与真实的酒类产品的身份信息之间的差异作为损失,进而可以通过迭代优化,逐步获得经过优化的机器学习模型。另外,还可以利用一部分已知属性的样本作为测试样本来对所得到的的机器学习模型进行测试,以提高机器学习模型的准确率,避免过拟合。
75.例如,根据本发明的实施例,可以将已知属性的白酒样本中的75%作为训练集,剩余的25%作为测试集,对机器学习模型进行检测并优化,由此,可以进一步提高机器学习模型的训练准确度,使训练后的机器学习模型能够准确鉴定酒类产品的身份信息,且具有高准确度、高效率等优点。
76.本发明实施例的机器学习模型可以是神经网络模型,例如:bp神经网络模型、卷积神经网络模型、决策树模型、支持向量机或knn(k近邻分类)。
77.示例性地,机器学习模型可以是bp(back propagation)神经网络模型,主要包括输入层、隐藏层和输出层,其具有较高的区分度,且模型的复杂度较小。在另一些示例中,机器学习模型还可以是卷积神经网络(cnn)模型、决策树模型、支持向量机或knn(k近邻分类)。
78.需要说明的是,发明经过大量的实验总结出,采用不超过1000个总样本,例如不超过500,诸如不超过300个总样本,利用本发明所提出的嗅觉受体组合所产生的特征值,就能够训练得到能够有效预测酒类产品属性的神经网络模型。
79.需要说明的是,在本文中,可以采用机器学习模型,基于嗅觉受体的特征值进行预测的“酒类产品的已知属性”是指预先获得的酒类产品的身份信息,例如,酒类产品的身份信息可以包括酒类产品的香型、年份或品牌,其中,酒类产品的香型包括馥郁香型、酱香型、浓香型、清香型、凤香型、米香型、芝麻香型或兼香型等。当然,本领域技术人员能够理解的是,在机器学习模型学习时,可以将这些参数进行数字化处理,例如,对年份进行量化,提供相应的量化数值,构建多维度的矩阵进行机器训练和相应的结果输出。
80.在本发明的一个本实施例中公开的训练机器学习模型的方法,通过嗅觉受体对酒类产品响应的特征值及其对应的已知属性作为训练集,将该训练集作为输入特征输入至待训练的机器学习模型中进行迭代训练,并不断调整机器学习模型的分类规则,获得用于酒类产品鉴定的机器学习模型。该训练后的机器学习模型具有训练速度快、效率高、成本低等
优点,并且,还提高了机器学习模型对酒类产品鉴定的准确度。
81.在本发明的另一个实施例中公开的训练机器学习模型的方法,通过对初筛嗅觉受体进行筛选,获得初筛嗅觉受体的特征值,基于该特征值进行特征选择和数据训练,获得优选嗅觉受体;然后通过优选嗅觉受体对酒类产品响应的特征值及其对应的已知属性作为训练集,将该训练集作为输入特征输入至待训练的机器学习模型中进行迭代训练,并不断调整机器学习模型的分类规则,获得用于酒类产品鉴定的机器学习模型。该训练后的机器学习模型所需要的训练集数目较少,具有训练速度快、效率高、成本低、准确度高等优点。
82.另外,本领域技术人员能够理解的是,前面针对训练机器学习模型的方法所描述的特征和优点同样适用于该对酒类产品进行鉴定的方法,在此不再赘述。
83.对酒类产品进行鉴定的方法在本发明的又一方面,本发明提出了一种对酒类产品进行鉴定的方法,如图4所示,包括如下s310~s320:s310:获取嗅觉受体对酒类产品响应的特征值。
84.根据本发明的实施例,采用酒类产品刺激多种嗅觉受体(例如,上千种嗅觉受体),使嗅觉受体被激活,根据嗅觉受体的激活强度可得到嗅觉受体的特征值。
85.s320:采用特征值作为机器学习模型的输入特征,利用预先采用上述方法训练的机器学习模型获得酒类产品的属性。
86.根据本发明的实施例,以s310中获取的多个特征值作为输入特征输入至训练后的机器学习模型中进行检测,以获得酒类产品的身份信息。
87.本实施例公开的对酒类产品进行鉴定的方法,将嗅觉受体对酒类产品响应的特征值输入至训练后的机器学习模型中,通过训练后的机器学习模型可获取酒类产品的属性。该方法具有操作简便、鉴定快、准确度高等优点。
88.本领域技术人员能够理解的是,前面针对嗅觉受体在训练机器学习模型的方法所描述的特征和优点,同样适用于该对酒类产品进行鉴定的方法,在此不再赘述。
89.对酒类产品进行鉴定的装置在本发明的又一方面,本发明提出了一种对酒类产品进行鉴定的装置,如图5所示,鉴定装置100包括预处理单元101、检测单元102和分析单元103。
90.其中,预处理单元101用于对酒类产品进行预处理,通过将待测酒类产品稀释,可使嗅觉受体容易被激活,避免由于酒类产品的酒精浓度过高对嗅觉受体造成毒害作用。
91.示例性地,预处理单元101预先将酒类产品稀释至酒精浓度在0.07%
‑
3.00%之间,例如,酒精浓度为0.07%、0.16%、0.32%、0.5%、0.9%、1.3%、1.825%、2.6%、3.00%。
92.检测单元102用于获取嗅觉受体对进行预处理的酒类产品响应的特征值。
93.可以理解的是,检测单元102包括多种嗅觉受体(例如,上千种嗅觉受体),采用检测单元102对经过预处理的酒类产品进行检测,酒类产品刺激嗅觉受体而使嗅觉受体被激活,检测单元102可根据嗅觉受体的激活强度得到嗅觉受体的特征值。
94.分析单元103与检测单元102电连接,用于接收来自检测单元102的特征值。分析单元103中适于采用上述训练机器学习模型的方法训练的机器学习模型,其中嗅觉受体的特征值可以作为机器学习模型的输入特征,然后利用机器学习模型获得酒类产品的属性。
95.可以理解的是,分析单元103将来自检测单元102的特征值作为输入特征输入至分
析单元103的机器学习模型中进行检测,以准确地获得酒类产品的身份信息。
96.示例性地,机器学习模型可以是bp神经网络模型、卷积神经网络模型、决策树模型、支持向量机或knn(k近邻分类)。
97.本领域技术人员能够理解的是,前面针对嗅觉受体在训练机器学习模型的方法所描述的特征和优点,同样适用于该对酒类产品进行鉴定的装置,在此不再赘述。
98.电子设备在本发明的又一方面,本发明一种电子设备,包括存储器和处理器。其中,存储器用于存储计算机程序。处理器用于执行计算机程序以实现上述对酒类产品进行鉴定的方法。
99.上述电子设备基于待测酒类产品的特征值可对酒类产品进行鉴定,且具有操作简便、鉴定快、准确度高等优点。根据本发明的实施例,该电子设备可以是电子鼻类设备。
100.本领域技术人员能够理解的是,前面针对对酒类产品进行鉴定的方法所描述的特征和优点,同样适用于该电子设备,在此不再赘述。
101.可执行的存储介质在本发明的又一方面,本发明提出了一种可执行的存储介质,存储介质存储有计算机程序指令,计算机程序指令在处理器上运行时,使得处理器执行上述对酒类产品进行鉴定的方法。
102.示例性的,上述计算机可执行的储介质可以包括,但不限于:磁存储器件(例如,硬盘、软盘或磁带等),光盘(例如,cd(compact disk,压缩盘)、dvd(digital versatile disk,数字通用盘)等),智能卡和闪存器件(例如,eprom(erasable programmable read
‑
only memory,可擦写可编程只读存储器)、卡、棒或钥匙驱动器等)。本发明描述的各种计算机可读存储介质可代表用于存储信息的一个或多个设备和/或其它机器可读存储介质。术语“机器可读存储介质”可包括,但不限于无线信道和能够存储、包含和/或承载指令和/或数据的各种其它介质。
103.示例性地,已知属性的编码方式包括,但不限于独热编码、哑编码、二进制编码、标签编码。
104.本领域技术人员能够理解的是,前面针对对酒类产品进行鉴定的方法所描述的特征和优点,同样适用于该可执行的存储介质,在此不再赘述。
105.下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
106.实施例1:1、白酒样品预处理由于白酒中含大量乙醇,对细胞有毒害作用,因此需要对白酒进行稀释后再刺激细胞。以52
°
白酒为例,将其进行7次梯度稀释,分别稀释5、10、20、40、80、160以及320倍,对应得到7个白酒样品。将稀释后的7个白酒样品分别对表达三种嗅觉受体(mor120
‑
2、mor256
‑
17和mor203
‑
1)的细胞进行刺激,fluc为萤火虫荧光素酶响应值,体现嗅觉受体激活强度,数值越大表示响应越强;rluc为海肾荧光素酶响应值,体现细胞的生理状态,数值
越大表示细胞状态越好。由下表结果可知,与空白对照相比,随着稀释倍数的增加,三种嗅觉受体对应的fluc值和rluc值均呈先上升后下降的趋势,其中,稀释40~320倍所对应的fluc值和rluc值均较高,具体见表1。因此,稀释40
‑
320倍范围内均可利用本检测方法进行检测,所对应的稀释后的白酒样品中酒精浓度为0.16%
‑
1.3%(v/v),本发明后续白酒香气检测过程中统一稀释100倍。
107.以上实施例以52
°
白酒为例,实际是为了调整白酒样品中的乙醇浓度到细胞可以承受的浓度范围内。52
°
白酒稀释40
‑
320倍范围内均可利用本检测方法进行检测,即乙醇浓度范围大约为0.07%
‑
3%(v/v),最优浓度范围大约为0.3%
‑
0.65%(v/v)。
108.表1 不同稀释倍数的响应值(2)嗅觉受体的筛选采用1113种小鼠嗅觉受体对4种白酒样品(分别为五粮液、15年份茅台、30年份茅台、政通人和,其中五粮液为浓香型,其余为酱香型)进行检测,响应值图谱参见图6。结果表明,两种不同风格的白酒(浓香型和酱香型)具有显著不同的响应值图谱,同种风格(酱香型)内的不同白酒样品的响应值图谱较为相似,但在某些嗅觉受体的响应强度上有差异。初步白酒香气检测实验中,一共获得了46个被激活的嗅觉受体(此处定义为初筛嗅觉受体)。
109.(3)构建神经网络模型大部分嗅觉受体对不同白酒样品差异响应,通过检测利用嗅觉受体产生的响应值,将响应值作为神经网络模型的输入特征。本实施例中,采用bp(back propagation)神经网络,利用5种白酒在46种初筛嗅觉受体上的响应值建立分类(身份鉴定)模型。例如,建立一个3层的bp神经网络模型,包括:1层输入层,1层隐藏层,1层输出层,以此构建一个具有良好区分度且模型复杂度最小的模型。
110.采用75%的响应值作为训练集,剩下的25%响应值作为测试集。经过10000次迭代训练(epochs)后,训练损失已经稳定收敛,此时用测试集进行测试,可以看到模型对测试集的预测结果和真实结果完全一致,判别准确度可以达到100.00%,为了避免训练集和测试集选择的随机性,采用了十折交叉验证(10
‑
fold cross
‑
validation)对样本集进行实验,平均
准确度可以达到99.59%。图7是模型训练的损失(loss)图,图8和图9分别是测试集的响应值在radviz雷达图中对应的真实分布情况和预测分布情况,反应了测试集的响应值在46种嗅觉受体下的可视化分类图,可以看到模型对测试集的预测结果和真实结果完全一致,因此也证明利用嗅觉受体可以实现检测和鉴别白酒香气的目标。
111.(4)优选嗅觉受体的筛选由于46种初筛嗅觉受体中可能存在鉴别性能的冗余,通过进一步优化嗅觉受体数目和组合,一方面将减少气味检测的成本,另一方面将节省神经网络训练和判别的计算量和时间。计算每两种嗅觉受体的实验响应值的皮尔森(pearson)相关系数,建立了46种初筛嗅觉受体的热谱图(图10),发现有多重嗅觉受体具有较强的相关性,因此,将对46种初筛嗅觉受体进行进一步筛选(即特征选择)。
112.采用嵌入式(embedded)的特征选择方法对白酒的响应值图谱数据进行学习拟合,该方法主要是通过将特征选择过程和数据训练过程融合为一体,两者在同一优化过程中完成,即可在训练过程中自动进行特征选择。采用的训练器是集成学习中的极端随机树(extremely randomized trees),该方法可以对响应值图谱数据进行学习,对每一种嗅觉受体鉴别白酒的重要性进行评分和排序,嗅觉受体的评分排序图参见图11,最终筛选出10种优选嗅觉受体。
113.参考步骤(3)中构建神经网络模型的方法,采用优选嗅觉受体的响应值图谱数据进行神经网络模型的训练,构建新的神经网络模型,结果显示,这10种优选嗅觉受体对5种白酒鉴别能力的准确度依然可以达到100.00%。其中,训练损失图参见图12,10种优选嗅觉受体对5种白酒测试集在radviz雷达图中的真实分布情况和预测分布情况分别参见图13和图14,结果显示,这10种优选嗅觉受体仍然可以做到100.00%准确度的预测能力,同样为了避免对训练集和测试集划分的随机性,针对优选嗅觉受体的响应值图谱数据进行了十折交叉验证,其平均准确度可以达到98.50%,因此,筛选的优选嗅觉受体依然可以达到精准鉴别现有白酒的能力。
114.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、
ꢀ“
示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
115.尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。