一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

传感器调谐-针对使用梯度提升决策树的物联网电子鼻应用的传感器特定选择的制作方法

2022-07-10 17:06:01 来源:中国专利 TAG:


1.本发明总体上涉及气体传感器,并且更具体地涉及用于调谐目标应用的气体传感器的系统和方法。


背景技术:

2.电子鼻是通过应用模式识别检测气味或味道的智能感测设备。典型的电子鼻包括气味检测系统、样本递送系统和模式识别计算系统。气味检测系统是气体传感器阵列;样本递送系统将样本顶部空间递送到检测系统中;以及模式识别系统评估气味的成分、分析其化学组成、并且将该气味的成分和化学组成与已知的香味进行比较,以便标识该气味。电子鼻的典型用途包括感测环境voc(挥发性有机化合物)、感测生物voc、以及感测由食物排放的voc。目前使用的电子鼻对于不同的应用缺乏选择性。本发明解决了该缺点。
3.因此,在本领域中需要解决前述问题。


技术实现要素:

4.本发明提供了用于调谐气体传感器阵列和选择阵列中的合适气体传感器以用于特定应用的系统和方法。
5.从第一方面来看,本发明提供了一种系统,包括:传感器阵列;以及处理器,在该处理器中存储有至少一个算法,其中从传感器阵列获得的原始数据被输入到处理器中以形成所提取特征的输入集合,该至少一个算法对来自输入集合的所提取特征进行排名,其中每个所提取特征被给予重要性值,并且基于针对每个传感器对所提取特征进行排名来确定针对传感器阵列的每个传感器的重要性得分。
6.从另一方面来看,本发明提供了一种系统,包括:传感器阵列,以及处理器,在其中存储有至少一个算法,其中从传感器阵列获得的原始数据被输入到处理器中以形成所提取特征的输入集合,其中每个所提取特征被给予重要性值,该至少一个算法对来自输入集合的所提取特征进行排名,并且包括所提取特征的聚合值的阈值被建立,其中传感器阵列中的具有被排名等于或高于阈值的所提取特征的个别传感器适用于目标应用。
7.从又一方面来看,本发明提供了一种系统,包括:传感器阵列;以及处理器,在该处理器中存储有至少一个算法,其中从传感器阵列获得的原始数据被输入到处理器中以形成所提取特征的输入集合,该至少一个算法对来自输入集合的所提取特征进行排名,其中每个所提取特征被给予重要性值,包括所提取特征的聚合值的阈值被建立,并且基于针对每个传感器对所提取特征进行排名来确定针对传感器阵列的每个传感器的重要性得分。
8.从又一方面来看,本发明提供了一种方法,包括如下步骤:从输入集合提取特征,该输入集合是从传感器阵列获得的;利用至少一个算法对所提取特征进行排名,其中每个所提取特征被给予重要性值;计算针对经排名的所提取特征的阈值;基于对所提取特征进行排名来计算针对传感器阵列的个别传感器的重要性得分;以及选择传感器阵列的具有等
于或高于针对目标应用的阈值的重要性得分的个别传感器。
9.从又一方面来看,本发明提供了一种方法,包括如下步骤:准备针对目标应用的传感器阵列并且将信息应用于该传感器阵列以形成输入集合;从输入集合提取特征并且对所提取特征进行排名,其中每个所提取特征被给予重要性值;计算所提取特征的阈值;基于对所提取特征进行排名来计算针对传感器阵列的个别传感器的重要性得分;以及针对目标应用选择具有等于或高于阈值的重要性得分的个别传感器。
10.从又一方面来看,本发明提供了一种用于调谐针对目标应用的气体传感器的计算机程序产品,该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质由处理电路可读并且存储用于由该处理电路执行以用于执行用于执行本发明的步骤的方法的指令。
11.从又一方面来看,本发明提供了一种存储在计算机可读介质上并且可加载到数字计算机的内部存储器中的计算机程序,该计算机程序包括软件代码部分,当程序在计算机上运行时,该软件代码部分用于执行本发明的步骤的。
12.在一个实施例中,提供了一种系统,包括:传感器阵列;以及处理器,在该处理器中存储有至少一个算法,其中从传感器阵列获得的原始数据被输入到处理器中以形成所提取特征的输入集合,该至少一个算法对来自输入集合的所提取特征进行排名,其中每个所提取特征被给予重要性值,并且基于针对每个传感器对所提取特征进行排名来确定针对传感器阵列的每个传感器的重要性得分。
13.在另一个实施例中,提供了一种系统,包括:传感器阵列,以及处理器,在其中存储有至少一个算法,其中从传感器阵列获得的原始数据被输入到处理器中以形成所提取特征的输入集合,其中每个所提取特征被给予重要性值,该至少一个算法对来自输入集合的所提取特征进行排名,并且包括所提取特征的聚合值的阈值被建立,其中传感器阵列中的具有等于或高于阈值的所提取特征的个别传感器适用于目标应用。
14.在又一个实施例中,提供了一种系统,包括:传感器阵列;以及处理器,在该处理器中存储有至少一个算法,其中从传感器阵列获得的原始数据被输入到处理器中以形成所提取特征的输入集合,至少一个算法对从输入集合提取的特征进行排名,其中每个提取的特征被给予重要性值,包括所提取特征的聚合值的阈值被建立,并且基于针对每个传感器对所提取特征进行排名来确定针对传感器阵列的每个传感器的重要性得分。
15.在一个方面中,提供了一种方法,包括如下步骤:从输入集合中提取特征,该输入集合是从传感器阵列获得的;利用至少一个算法对所提取特征进行排名,其中每个所提取特征被给予重要性值;计算针对经排名的所提取特征的阈值;基于对所提取特征进行排名来计算针对传感器阵列的个别传感器的重要性得分;以及选择传感器阵列的具有等于或高于针对目标应用的阈值的重要性得分的个别传感器。
16.在另一个方面中,提供了一种方法,包括如下步骤:准备针对目标应用的传感器阵列,并且将信息应用于传感器阵列以形成输入集合;从输入集合提取特征并且对所提取特征进行排名,其中每个所提取特征被给予重要性值;计算针对所提取特征的阈值;基于对所提取特征进行排名来计算针对传感器阵列的个别传感器的重要性得分;以及针对目标应用选择具有高于阈值的重要性得分的个别传感器。
17.在另一个实施例和方面中,阈值对输入集合进行细化,并且针对目标应用选择具
有等于或高于阈值的重要性得分的个别传感器。
18.在又一个实施例和方面中,阈值thres是根据公式1来计算的:公式1
[0019][0020]
其中fi是针对来自输入集合的每个所提取特征的重要性值,并且#feat是来自输入集合的所提取特征的总数目。
[0021]
在另一个实施例和方面中,传感器阵列中的单个传感器的重要性得分impsn是根据公式2来计算的:
[0022]
公式2
[0023][0024]
其中fis是针对单个传感器的每个所提取特征的重要性值,并且#feats是针对单个传感器的所提取特征的总数目。
[0025]
在又一个实施例和方面中,至少一个算法包括梯度提升决策树。
[0026]
在另一个实施例和方面中,传感器阵列包括多个气体传感器。
[0027]
在又一个实施例和方面中,气体传感器测量挥发性有机化合物(vocs)。
[0028]
在另一个实施例和方面中,目标应用选自包括以下项及其组合的组:空气质量分析、空气污染分析、水污染分析、土壤分析、实验室测试、医学测试、过敏原测试、体内酒量测定器测试、食品和饮料有效期分析、食品和饮料腐坏分析、酒精含量分析、产品真实性。
[0029]
在又一个实施例和方面中,产品真实性包括嵌入在产品中的密码货币数字足迹的标识。
[0030]
将在下面所阐述的具体实施方式中提供本发明的附加的实施例和方面而不受限制。
附图说明
[0031]
现在将参考如在以下附图中所图示的优选实施例来仅通过示例的方式描述本发明:
[0032]
图1是配备有六个气体传感器(示出了这些传感器中的三个传感器,另外三个传感器在平台的相对侧上)的电子挥发性分析仪(eva)电子鼻平台的照片。
[0033]
图2是示出了如本文中所描述的用于调谐传感器阵列的步骤的流程图。
[0034]
图3a-图3c示出了将六传感器电子鼻平台应用于生物(尿液)样本以用于预测正常样本与被感染样本的结果。
[0035]
图4a-图4c示出了将六传感器电子鼻平台应用于五个饮料样本的结果和预测结果。
[0036]
图5a-图5c示出了将六传感器电子鼻平台应用于在从新鲜(第1天)到腐坏(第4天)的5天的过程内测试的鱼样本的结果。
具体实施方式
[0037]
下面所阐述的是当前被认为是所要求保护的发明的优选实施方式的描述。功能、目的或结构上的任何备选或修改旨在被本技术的权利要求书覆盖。如本说明书和所附权利要求书中所使用的,除非上下文另外明确规定,否则单数形式“一”、“一个”和“该”包括复数指示物。如本说明书和所附权利要求中所使用的,术语“包括”和/或“包含”指定所陈述的特征、整体、步骤、操作、元件和/或组件的存在,但是不排除一个或多个其他特征、整体、步骤、操作、元件、组件和/或其组合的存在或添加。
[0038]
如本文中所使用的,术语“重要性值”或“fi”意指从来自气体传感器阵列的原始数据中提取的特征的重要性。
[0039]
如在本文中所使用的,术语“重要性得分”或“impsn”是指传感器阵列的每个个别的传感器的重要性,该重要性是根据本文中所描述的方法和系统计算的。
[0040]
如本文中所使用的,术语“电子鼻”是指使用气体传感器阵列和模式标识系统来标识气味的特定成分并且分析其化学组成以标识气味。本文中所描述的电子鼻方法、系统和应用意在包括基于物联网(iot)的电子鼻;因此,如本文中所使用的,关于单个设备、平台或应用的术语“电子鼻”意在包括iot-电子鼻设备、平台和应用。在iot电子鼻的情况下,电子鼻将包括用于与接收设备(诸如,计算机或移动设备)无线通信的rf(射频)天线,其中用户可以查看气体感测数据并且请求电子鼻开始和停止感测数据。
[0041]
如本文中所使用的,术语“处理器”是指计算机处理器或微处理器,这是由于那些术语在本领域中是已知的。在本文中所描述的实施例的上下文中,处理器的目的是从传感器阵列的气体传感器接收输入,执行计算,并且提供适当的输出。由处理器执行的计算是被编程到处理器中并且存储在处理器内的算法的结果。
[0042]
图1示出了配备有六个气体传感器的电子挥发性分析仪(eva)电子鼻平台(在本文中也被称为“eva平台”),这些气体传感器中的每个气体传感器被安装到模块,这些模块被整合到eva平台中。在图1中示出了六个传感器中的仅三个传感器;其他三个传感器被安装到eva平台的相对侧上的模块。
[0043]
为了增加电子鼻针对其目标应用的精度,必须调谐气体传感器阵列。本文所描述的系统和方法定义专用技术以使用基于决策树的系统的输出来通过适当的分类对传感器阵列中的最适合于目标应用的传感器的组合进行优化。
[0044]
图2概述了在本文中所描述的传感器选择系统和方法中涉及的步骤。传感器选择方法中的第一步骤是预处理和从传感器阵列提取样本的相关特征,以便准备输入子集。可以通过本领域已知的任何方法进行预处理和提取。机器学习应用中的特征提取方法的一些示例包括(但是不限于)线性判别分析(lda)、主分量分析(pca)、内核pca、多线性pca、人工神经网络(ann)、独立分量分析、潜在语义分析、部分最小二乘、多因子降维、非线性降维、多线性子空间学习、半定嵌入、等距映射、自动编码器及其组合。在预处理和提取步骤之后,对输入集合内的所提取特征进行排名,以形成经排名的子集。排名涉及构造梯度提升决策树,初始化所有节点的权重,通过计算来自拆分的权重降低纯度来通过节点进行迭代,基于性能测量(即,误差函数)来计算每个树的重要性得分,并且跨所有树对重要性得分求平均。
[0045]
为了确定传感器阵列的哪个传感器最适合于特定应用,有利地使用两个计算。第一计算是根据公式1的阈值thres计算:
[0046]
公式1其中thres是对所提取特征的集合的排名进行细化的值;fi是经排名的子集中的个别个别所提取特征的重要性,并且#feat是经排名的子集中所提取特征的总数目。阈值计算设置将针对目标应用判断传感器阵列中的个别传感器的下限。第二计算是根据公式2的重要性得分impsn计算:
[0047]
公式2其中impsn是阵列中的单个传感器(传感器n)的重要性得分,fis是传感器n中所提取特征的重要性值,并且#features是传感器n中所提取特征的总数。重要性得分计算对公式1的排名信息进行细化以适用于传感器阵列的个别传感器。具有大于或等于阈值的重要性得分的传感器被选择用于目标应用的传感器阵列中。从传感器阵列中省略落在阈值以下的传感器。
[0048]
图3a至图3c示出了将阈值和重要性得分应用于用于生物应用(示例2)的六传感器电子鼻平台(示例1)。如示例2中所描述逇,六个传感器记录关于以下三个生物样本的数据:正常人类血清(nhu);感染大肠杆菌的nhu;以及感染大肠杆菌和胰蛋白大豆肉汤(tsb)的nhu。如图3a中所示,六个传感器中的每个传感器记录其相应的特征(x轴)的特征值(y轴)。
[0049]
为了达到六个传感器的阈值,六个传感器的120个个别特征的特征值被加在一起并且除以120,以获得阈值00.00769。然后使用重要性得分公式来确定阵列中每个传感器的重要性得分。对于传感器ggs1330(图3a中的第一传感器),重要性得分是0.00832,其是通过聚合所有的y轴重要性特征值并且将该数除以15(ggs1330的特征的总数)来计算的。因为ggs1330传感器的重要性得分高于0.00769,所以该传感器是针对目标生物应用的推荐传感器。当重要性得分公式被应用于阵列中的六个传感器中的每个传感器时,六个传感器中的三个传感器具有高于阈值的重要性得分;因此,六个传感器中的三个传感器中被推荐用于生物应用(ggs1330、tgs2611和tgs8100)。
[0050]
图3b和图3c示出了将六个传感器与三个推荐传感器应用于nhu的训练和测试样本、两个大肠杆菌样本和作为对照的实验室空气的测试结果。在图3b中,示出了使用所有六个传感器的预测结果,300个nhu样本中的大约80个被误标识为uti样本,200个uti样本中的大约50个被误标识为nhu样本。虽然图3b中的测试的预测精度达到97.54%,但是该附图包括650个实验室空气样本,其中没有被误标识。当三个推荐样本被用于生物应用时,测试的预测精度为100%,如图3c中所示。
[0051]
图4a-图4c示出了针对饮料应用(示例3)的阈值和重要性得分的应用。对以下五种饮料测试六个传感器:苹果汁、橙汁、柠檬汁、啤酒和白葡萄酒。如图4a中所示,将阈值公式应用于特征值得到0.00325的阈值。重要性公式的应用得到六个传感器中的四个传感器具有高于阈值的重要性得分;具体地,传感器ggs1330、mics5914、tgs2600和tgs8100。
[0052]
图4b和图4c示出了应用六个传感器与四个推荐传感器以训练和测试五个饮料加作为对照的实验室空气的样本测试结果。当应用所有六个传感器时,预测精度是98.9%,其中在大约50个样本中实验室空气被误标识为苹果汁(图4b)。当使用四个推荐传感器时,测试精度为100%(图4c)。
[0053]
图5a-图5c示出了将传感器重要性得分应用于食品应用(实施例4)。对从第1天(新鲜的鱼)至第4天(腐坏的鱼)的鱼样本测试了六个传感器。如图5a中所示,将阈值公式应用
scientific,tucson,az,usa)测量样本蒸气通过系统的流量。在所有实验中,将具有实验室空气的20ml小瓶用作对照。
[0062]
示例2
[0063]
针对生物应用的eva平台
[0064]
对于生物应用,用正常人类尿样本(nhu)、用大肠杆菌(e.coli)接种的nhu样本、以及用大肠杆菌和胰蛋白大豆肉汤(tsb)接种的nhu样本,测试实施例1的eva平台,两个大肠杆菌样本形成类似于尿路感染(uti)的感染的尿液样本。将nhu和两个uti样本分别置于4ml wheaton隔膜顶部小瓶(dwk life sciences,millville,nj,usa)中。三个4ml样本小瓶加上具有对照实验室空气的第四个20ml小瓶被附接到选择器元件。通过将三个个别的样本小瓶经由选择器元件依次连接到传感器室10分钟的持续时间来获取测量数据,在该持续时间期间从每个小瓶进行顶部空间测量。在测量期间,将三个样本在27℃下温育以帮助捕获的挥发物的蒸发。在数据获取之间,mox传感器用实验室空气冲洗5分钟以通过将空的20ml小瓶连接到传感器室并允许气流去除先前样本的蒸汽来促进传感器恢复。通过选择器元件,每个小瓶以循环方式在八小时收集时段的过程内被重复地选择,其中空气冲洗在不同的小瓶收集之间。在八小时收集时段之后,将包含生物样本的小瓶丢弃并且用新鲜小瓶中的新鲜生物样本替换。测量总共34周。每个mox传感器的输出包括以下数据:传感器模块id、时间戳、传感器电阻和加热器电压。在实验的持续时间内实时地记录传感器输出数据并且针对每个样本暴露存储在单独的文本文件中。34周的收集数据产生总计4459个原始数据点。
[0065]
使用人工神经联网(ann)来提取原始数据的特征,以针对总共120个特征产生每个传感器20个所提取特征。使用xgbapi开源软件(python软件基金会,beaverton,oregon,usa)建立梯度增强决策树以对从六个传感器提取的所有特征进行排名。图3a中示出了在生物测量的分级之后的特征提取数据。本文中所描述的阈值公式被应用于图3a的所提取特征数据以产生0.00769的阈值。本文中所描述的重要性得分公式产生具有高于阈值的重要性得分的以下三个传感器:ggs1330、tgs2611和tgs8100。三个所选择的传感器表示总共120个特征中的50个特征。
[0066]
图3b示出了所有六个mox传感器的训练和测试结果,图3c示出了重要性得分高于阈值的三个所选择的传感器的训练和测试结果。为了获得训练集和测试集,将34周收集数据集打乱;70%的数据用作训练集,30%的数据用作测试集。训练集包括六个传感器的692个数据点和三个所选传感器的3121个数据点。测试集包括六个传感器的244个数据点和三个所选传感器的1337个数据点。在将训练和测试集数据应用于样本以测试模型的预测精度时,六个传感器产生97.5373%的精度,而三个所选择的传感器产生100%的精度。
[0067]
实施例3
[0068]
用于食品/饮料应用的eva平台
[0069]
对于食品/饮料应用,用以下五个饮料样本测试示例1的eva平台:苹果汁、橙汁、柠檬汁、啤酒和白葡萄酒,其中每个饮料样本放置在5ml wheaton隔膜顶部小瓶中。五个5ml样本小瓶加上具有对照实验室空气的第四个20ml小瓶被附接到选择器元件。通过将五个个别的样本小瓶经由选择器元件依次连接到传感器室10分钟的持续时间来获取训练和测试数据,在该持续时间期间从每个小瓶进行顶部空间测量。在测量期间,在27℃下温育五个样本以帮助捕获的挥发物的蒸发。在数据获取之间,mox传感器用实验室空气冲洗5分钟以通过
将空的20ml小瓶连接到传感器室并允许气流去除先前样本的蒸汽来促进传感器恢复。通过选择器元件,每个小瓶以循环方式在八小时收集时段的过程内被重复地选择,其中空气冲洗在不同的小瓶收集之间。在八小时收集时段之后,将包含饮料样本的小瓶丢弃并且用新鲜小瓶中的新鲜饮料样本替换。测量总共34周。每个mox传感器的输出包括以下数据:传感器模块id、时间戳、传感器电阻和加热器电压。在实验的持续时间内实时地记录传感器输出数据并且针对每个样本暴露被存储在单独的文本文件中。34周的收集数据产生总共1662个原始数据点。
[0070]
使用人工神经联网(ann)来提取原始数据的特征,以针对总共120个特征产生每个传感器20个所提取特征。使用xgbapi开源软件,建立梯度提升决策树以对来自六个传感器的所有提取的特征进行排名。在图4a中示出了在生物测量的分级之后的特征提取数据。本文中所描述的阈值公式被应用于图4a的所提取特征数据以产生0.00325的阈值。本文中所描述的重要性得分公式得到以下四个传感器具有高于阈值的重要性得分:ggs1330、mics5914、tgs2600和tgs8100。四个选择的传感器表示总共120个特征中的80个特征。
[0071]
图4b示出了使用所有六个mox传感器的训练和测试结果,图4c示出了重要性得分高于阈值的四个所选择的传感器的训练和测试结果。为了获得训练和测试集数据,如实施例2,将34周收集数据打乱,其中70%的打乱数据用于训练集,其余30%的打乱数据用于测试集。训练集包括六个传感器和四个选定传感器两者的2410个数据点,测试集包括六个传感器和四个选定传感器两者的1662个数据点。在将训练和测试集数据应用于样本以测试模型的预测精度时,六个传感器产生98.9%的精度,而四个所选择的传感器产生100%的精度。
[0072]
示例4
[0073]
针对食品腐坏应用的eva平台
[0074]
对于食品腐坏应用,用冷冻的鲑鱼样本测试实施例1的eva平台。为了确定鱼的腐坏,将冷冻的鱼解冻,并且从第1天(新鲜)到第4天测试鱼的多个样本,其中将鱼的每个个别样本放置在5ml wheaton隔膜顶部小瓶中进行测试。5ml样本小瓶加上具有对照实验室空气的附加的20ml小瓶被附接到选择器元件。通过将样本小瓶经由选择器元件依次连接到传感器室10分钟的持续时间来获取训练和测试数据,在该持续时间期间从每个小瓶进行顶部空间测量。在测量过程中,将样本小瓶在27℃下温育以帮助捕获的挥发物的蒸发。在数据获取之间,mox传感器用实验室空气冲洗5分钟以通过将空的20ml小瓶连接到传感器室并允许气流去除先前样本的蒸汽来促进传感器恢复。通过选择器元件,每个小瓶以循环方式在八小时收集时段的过程内被重复地选择,其中空气冲洗在不同的小瓶收集之间。在八小时收集时段之后,将包含鱼样本的小瓶丢弃并且用新鲜小瓶中的新鲜鱼样本替换。测量总共34周。每个mox传感器的输出包括以下数据:传感器模块id、时间戳、传感器电阻和加热器电压。在实验的持续时间内实时地记录传感器输出数据并且针对每个样本暴露被存储在单独的文本文件中。34周的收集数据产生总共939个原始数据点。
[0075]
使用人工神经联网(ann)来提取原始数据的特征,以针对总共120个特征产生每传感器20个所提取特征。使用xgbapi开源软件,建立梯度提升决策树以对来自六
个传感器的所有所提取特征进行排名。在对生物测量进行排名之后的特征提取数据如图5a中所示。本文中所描述的阈值公式被应用于图5a的所提取特征数据以产生0.00325的阈值。本文中所描述的重要性得分公式产生具有高于阈值的重要性得分的以下两个传感器:mics5914和tgs2611。两个所选择的传感器表示总共120个特征中的40个特征。
[0076]
图5b示出了使用所有六个mox传感器的训练和测试结果,图5c示出了具有高于阈值的重要性得分的两个所选择的传感器的训练和测试结果。为了获得训练和测试集数据,如示例2和3中所描述的将34周收集数据打乱,其中70%的打乱数据用于训练,而30%的打乱数据用于测试。训练集包括6个传感器和两个选定传感器的692个数据点,测试集包括6个传感器和两个选定传感器的244个数据点。在将训练和测试集数据应用于样本以测试模型的预测精度时,六个传感器和两个所选择的传感器都产生100%的精度。
[0077]
示例5
[0078]
针对区块链应用的eva平台
[0079]
对于区块链应用,eva平台用于确认食品、饮料或农产品的真实性,食品、饮料或农产品已用发出数字足迹的密码锚定标记。为了测试,使用eva平台和示例2-4中描述的测试程序在小瓶中制备voc排放食品、饮料或农产品的样本用于测试。运行eva平台的软件被编程以标识从密码锚定发出的数字足迹的存在。对于密码锚定数字足迹测试为肯定的产品被认为是真实的,而对于密码锚定数字足迹测试为否定的产品被认为是伪造的。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献