一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

波形信息估计方法及装置以及峰波形处理方法及装置与流程

2022-11-28 14:46:38 来源:中国专利 TAG:


1.本发明涉及一种对与由各种分析装置、测量装置获得的信号波形相关的信息进行估计的方法及装置、以及使用了该方法及装置的峰波形处理方法及装置。此外,在本说明书中,“信号波形”除了通过分析、测量获得的波形本身之外,还包含对通过分析、测量获得的信号进行处理而制作出的波形。


背景技术:

2.在液相色谱(lc)装置、气相色谱(gc)装置中,通过对试样实施色谱分析,来获取被观测与该试样中含有的成分(一般而言为化合物)对应的峰的色谱。在色谱中被观测的峰的位置(保留时间)与试样中的成分的种类对应,因此能够根据该峰位置来确定成分、也就是能够对成分进行定性。另外,在色谱中被观测的峰的面积值、高度值对应于与该峰对应的成分的含量、浓度,因此能够根据该面积值、高度值来对该成分进行定量。因此,为了提高基于色谱的定性、定量的精度,重要的是高精度地求出色谱中出现的峰的峰顶的位置、峰的面积值或高度值。
3.一般而言,色谱上的峰波形理想上是按照高斯分布的形状。然而,在实际上获得的色谱上的峰中,由于各种因素而产生前延(leading)、拖尾(tailing)。另外,也存在基线漂移的情况,由于分离不充分而源自不同成分的多个峰叠加的情况也较多。在这样的各种状况下,准确地检测峰并且高精度地求出峰的面积值、高度值并不容易,以往,利用了用于峰检测的各种方法、算法。
4.例如在非专利文献1中公开了一种波形处理方法,在该波形处理方法中,对所提供的色谱设定适当的基线校正线,并且基于该基线校正线来将叠加的峰适当地分离,并计算分离出的各峰的面积的累计值。
5.另外,在专利文献1中记载了将预先准备的模型函数与色谱上的峰波形拟合并基于其结果来计算峰的面积值、高度值等特征量的方法。
6.对这样的模型函数进行拟合的方法也用于并非峰状波形的各种观测波形。例如在基于色谱的定量分析中,经常使用表示峰面积值与物质的浓度(或含量)的关系的校准曲线,将这样的校准曲线设为多项式或指数函数来进行最小二乘拟合。另外,在医药品的稳定性试验、药代动力学试验中,对目标物质的分解能力的时间上的变化、代谢物的时间上的变化进行观察,在这样的情况下也对平滑地变动的观测波形应用模型函数,之后执行统计解析。
7.一般而言,非专利文献1中公开的那样的经典的峰检测法以噪声比较微小、信号稳定等波形的状态比较良好为前提。因此,在不满足这样的条件的情况下,无法进行准确的峰检测的情况较多,一般而言,利用了模型函数的拟合方法能够进行更准确的峰检测。
8.现有技术文献
9.专利文献
10.专利文献1:国际公开第2016/035167号
11.非专利文献
12.非专利文献1:
“ピーク
波形処理

確認
しましょう”
、[online]、株式会社島津製作所、[2019年12月2日検索]、
インターネット
《url:http://www.an.shimadzu.co.jp/hplc/support/lib/lctalk/23/23lab.htm》
[0013]
非专利文献2:alec radford、
ほか
2名、“unsupervised representation learning with deep convolutional generative adversarial networks”、[online]、[2019年12月2日検索]、
インターネット
《url:https://arxiv.org/abs/1511.06434》
[0014]
非专利文献3:ian j.goodfellow、
ほか
7名、“generative adversarial nets”、[online]、[2019年12月2日検索]、
インターネット
《url:https://arxiv.org/pdf/1406.2661.pdf》


技术实现要素:

[0015]
发明要解决的问题
[0016]
在将上述的专利文献1所记载那样的利用了模型函数的拟合的峰检测法应用于色谱的情况下,作为模型函数,经常使用emg(exponential modified gaussian:指数修正高斯)函数。其理由是因为,虽然色谱中的峰波形理想上接近高斯波形,但实际上该峰波形由于拖尾而变为非对称波形的情况较多。然而,即使使用考虑这样的拖尾而进行校正所得到的模型函数,也难以进行连峰的末端部的形状都严格一致那样的拟合,容易产生峰的形状误差。
[0017]
为了提高基于拟合的峰波形形状的一致程度,有效的是增加用于规定模型函数的参数、即形状参数。然而,参数的数量越是增加,则表示模型函数的式子越接近退化问题,越容易受到噪声的影响。其主要原因在于,本来追加的用于形状校正的参数组应该与emg函数的拖尾参数等密切地协作而收敛于特定的范围(分布),但这样的计算花费极大的劳力和时间,因此设计这样精细的模型函数是不实用的。
[0018]
在作为观测对象的峰为源自单个成分的峰的情况下,因上述的因素引起的峰的形状误差对峰面积值带来的影响小。然而,在源自不同成分的多个峰叠加而需要将其分离的情况下,峰的形状误差有时会对各峰的面积值带来较大的影响。在仪器分析的领域中,近年来要求对试样中的多成分同时进行分析,当然存在难以仅通过色谱分析来将多成分完全分离的情况,也存在即使将色谱与质谱分析组合也无法将多个成分完全分离的情况。因此,在利用模型函数的拟合来获取峰面积值等时,无需增加形状参数就抑制峰的形状误差在改善成分的定量性能方面是重要的。
[0019]
本发明是为了解决这样的问题而完成的,其主要目的在于提供一种无需花费极大的劳力或时间就能够针对在峰检测或峰特征值的提取等中利用的模型函数一边抑制参数的增加一边提高其精度的波形信息估计方法及装置。
[0020]
另外,本发明的另一目的在于提供一种通过利用这样的波形信息估计方法及装置而能够准确地检测在色谱或谱中被观测的峰、或者高精度地分离叠加的峰、或者计算与检测到的峰有关的高精度的特征值的峰波形处理方法及装置。
[0021]
用于解决问题的方案
[0022]
为了解决上述问题之一而完成的本发明所涉及的波形信息估计方法的一个方式
是估计与信号波形有关的波形信息的方法,所述波形信息估计方法使用计算机执行以下步骤:
[0023]
波形提取步骤,从基于使用规定的分析装置进行的实测的信号波形中提取作为模型化对象的部分波形;以及
[0024]
对抗学习步骤,将在所述波形提取步骤中获得的部分波形作为输入来执行使用了生成模型和识别模型这两个相互对抗的模型的对抗学习,由此获取与所述部分波形对应的模型函数或者获取该模型函数及该函数中的形状的分布信息。
[0025]
另外,为了解决上述问题之一而完成的本发明所涉及的波形信息估计装置的一个方式是用于实施本发明所涉及的上述方式的波形信息估计方法的装置,该波形信息估计装置具备:
[0026]
波形提取部,其从基于使用规定的分析装置进行的实测的信号波形中提取作为模型化对象的部分波形;以及
[0027]
对抗学习部,其将由所述波形提取部获得的部分波形作为输入来执行使用了生成模型和识别模型这两个相互对抗的模型的对抗学习,由此获取与所述部分波形对应的模型函数或者获取该模型函数及该函数中的形状的分布信息。
[0028]
另外,为了解决上述问题之一而完成的本发明所涉及的峰波形处理方法的一个方式是使用了上述方式的波形信息估计方法的峰波形处理方法,其中,
[0029]
所述部分波形为峰波形,
[0030]
所述峰波形处理方法还执行利用在所述对抗学习步骤中获得的模型函数来生成峰模型波形的模型波形生成步骤,
[0031]
在所述峰波形处理方法中利用所述峰模型波形来进行针对目标信号波形的峰检测。
[0032]
另外,本发明所涉及的峰波形处理方法的另一方式是使用了上述方式的波形信息估计方法的峰波形处理方法,其中,
[0033]
所述部分波形为峰波形,
[0034]
所述峰波形处理方法还执行处理步骤,在该处理步骤中,利用在所述对抗学习步骤中获得的模型函数,来进行将在目标信号波形中叠加的多个峰分离的波形处理。
[0035]
另外,为了解决上述问题之一而完成的本发明所涉及的峰波形处理装置的一个方式是使用了上述方式的波形信息估计装置的峰波形处理装置,其中,
[0036]
所述部分波形为峰波形,
[0037]
所述峰波形处理装置还具备模型波形生成部,该模型波形生成部利用由所述对抗学习部获得的模型函数来生成峰模型波形,所述峰波形处理装置利用所述峰模型波形来进行针对目标信号波形的峰检测。
[0038]
另外,本发明所涉及的峰波形处理装置的另一方式是使用了上述方式的波形信息估计装置的峰波形处理装置,其中,
[0039]
所述部分波形为峰波形,
[0040]
所述峰波形处理装置还具备波形处理部,该波形处理部利用由所述对抗学习部获得的模型函数,来进行将在目标信号波形中叠加的多个峰分离的波形处理。
[0041]
在本发明中,不问分析装置中的分析、测量的方法,典型地能够采用色谱装置、质
谱分析装置、核磁共振装置、光学分析装置、x射线分析装置等能够获取被观测与试样中的成分(化合物、元素等)对应的峰的信号波形的装置。另外,未必是被观测峰的信号波形,只要是被观测特征性波形的信号波形即可。另外,不限于通过分析装置中的分析、测量而直接获得的信号波形,基于分析结果、测量结果而制作的校准曲线等也能够包含于在此所说的信号波形。
[0042]
发明的效果
[0043]
在本发明所涉及的上述方式的波形信息估计方法及装置中,例如能够利用非专利文献2、3等中公开的作为机器学习的一个方法的对抗生成网络(generative adversarial network:以下称为“gan”),来获取与从信号波形中提取的部分波形对应的模型函数以及与该模型函数的变动(偏差)相关的分布(概率分布)信息。在利用gan进行学习时,例如提供从利用色谱装置实际分析试样而获得的色谱中提取出的峰波形来作为真实的数据。
[0044]
即使分析装置的种类相同,也存在信号波形的形状根据作为分析对象的试样的种类或试样中含有的成分的种类(类别等)而大不相同的情况。即使将这样的形状大不相同的多个信号波形作为真实的数据提供给基于gan的学习,也无法适当地进行学习而难以获得作为目标的高精度的生成模型。因而,并非是不限定试样的种类等的通用的分析,而是优选通过在某种程度上限定试样的种类或成分的种类、分析的目的、应用领域等,来执行将波形形状的倾向相近、也就是波形形状在某种程度上一致的部分波形作为真实的数据的gan的学习。
[0045]
此外,对抗学习未必需要是使用了神经网络的gan(在此所说的gan是具有gan的基本构造的广义的gan,包含wgan(=wasserstein gan)、wgan-gp等各种改良版),也可以取代神经网络而使用基于学习对象的数据来输出能够近似该数据的分布的函数的算法。
[0046]
根据本发明所涉及的上述方式的波形信息估计方法及装置,例如能够以高精度获取用于将由色谱装置获得的色谱中的峰等部分波形高精度地模型化的模型函数、该模型函数的波形形状的分布的信息。
[0047]
另外,根据本发明所涉及的一个方式的峰波形处理方法及装置,通过将如上所述那样获得的高精度的模型函数、波形分布信息用于峰检测,能够更准确地检测在作为解析对象的色谱等中被观测的峰。另外,根据本发明所涉及的其它方式的峰波形处理方法及装置,即使在色谱、谱上多个峰叠加的情况下,也能够高准确度地分离这些峰。另外,能够高精度地求出这样检测出的峰或者分离出的峰的面积值、高度值等峰特征值。由此,能够提高试样中的成分的定量的精度。
[0048]
另外,通过判明模型函数、该函数的波形分布信息,能够合理地计算根据作为解析对象的色谱求出的峰的面积值、高度值等峰特征值能取的误差的范围。由此,例如能够准确地进行通过其它波形处理法获得的峰的特征值是否适当等评价。
附图说明
[0049]
图1是具备包括本发明所涉及的波形信息估计装置的数据解析装置的lc装置的一个实施方式的概要结构图。
[0050]
图2是本发明所涉及的波形信息估计装置的一个实施方式的功能块结构图。
[0051]
图3是图2所示的波形信息估计装置中的对抗学习执行部的功能块结构图。
[0052]
图4是示出图3中的生成器中的网络结构例的图。
[0053]
图5是示出gan的输入数据(真实的波形数据)的一例的图。
[0054]
图6是示出gan的输出数据(伪波形数据)的一例的图。
[0055]
图7是示出以校准曲线为对象时的gan的输入数据(真实数据)的一例的图。
[0056]
图8是示出以校准曲线为对象时的gan的输出数据(伪数据)的一例的图。
具体实施方式
[0057]
以下,参照附图来对利用了作为本发明的一个实施方式的波形信息估计装置的数据解析装置进行说明。
[0058]
在以下的例子中,解析对象的信号波形为色谱波形,通过数据解析,来检测在色谱上被观测的峰,并且求出该峰的峰顶的位置(保留时间)和峰面积值(或高度值)。
[0059]
[一个实施方式的lc装置的整体结构和概要动作]
[0060]
图1是具备包括本发明所涉及的波形信息估计装置的数据解析装置的lc装置的一个实施方式的整体结构图。
[0061]
在图1中,测定部10包括流动相容器11;泵12,其抽吸流动相并以大致固定的流速(或流量)供给该流动相;喷射器13,其向流动相中注入试样液;柱14,其根据保留时间来分离试样液中含有的成分;以及检测器15,其检测从柱14洗脱的洗脱液中的成分。作为检测器15,例如能够使用光电二极管阵列(pda)检测器等光学检测器、质谱分析装置等。
[0062]
数据解析部20具有将从检测器15输出的检测信号数字化后来进行处理的功能,数据解析部20包括数据收集部21、峰检测处理部22、定性/定量解析部23等功能块。峰检测处理部22包括先验信息存储部221、贝叶斯估计处理部222、峰特征值决定部223等功能块。该数据解析部20与作为用户界面的输入部24及显示部25连接。
[0063]
数据解析部20的实体是通用的计算机,通过由该计算机执行安装于该计算机的专用的软件(计算机程序)来实现图1所示那样的各功能块的功能。当然,也能够通过专用的硬件电路等来实现这样的功能块中的功能的一部分。
[0064]
在该lc装置中,泵12抽吸流动相容器11中贮存的流动相,并将该流动相以大致固定流速供给到柱14。喷射器13在与来自未图示的控制部的指示相应的规定的定时,将规定量的预先准备的试样液注入到流动相中。所注入的试样液随着流动相的流动而被导入柱14,试样液中含有的各种成分在通过柱14的期间在时间方向上分离而洗脱。检测器15检测洗脱液中含有的成分,时时刻刻输出与该成分的量相应的强度的检测信号。
[0065]
在数据解析部20中,数据收集部21以规定时间间隔对上述检测信号进行采样,将该检测信号转换为数字数据并存储于存储装置。该存储的数据是构成色谱波形的数据(色谱数据),在检测器15中检测出的成分在色谱上作为峰被观测到。峰检测处理部22接收色谱数据来检测显著的峰,求出检测出的峰的峰顶的位置(时间)和峰的面积值(或高度值)。定性/定量解析部23根据色谱上的各峰的位置的信息来确定成分,并且利用预先制作出的校准曲线,根据峰面积值(或高度值)来计算各成分的含量。也就是,定性/定量解析部23实施试样中含有的各成分的定性和定量,并将其结果输出至显示部25。
[0066]
[峰检测方法和峰特征值的计算方法]
[0067]
在本实施方式的lc装置中,为了检测作为解析对象的色谱中出现的峰并获得作为
其特征值的峰面积值,利用了基于贝叶斯估计的峰拟合。
[0068]
色谱中与试样中的成分对应的峰波形能够由取形状参数z和保留时间t作为自变量的函数f(t,z)表示。在此,形状参数z例如是与峰的宽度、末端部的扩展方式相关联或被推测为与峰的宽度、末端部的扩展方式相关联的参数。众所周知,在贝叶斯估计中,能够根据某个函数的参数的先验分布和实际的数据来估计后验分布。现在,如果峰模型函数f(t,z)和该形状参数z的概率分布这两者已知,则通过使用贝叶斯估计,能根据与上述模型函数相关联的概率p(d|z)和形状参数z的概率p(z)来求出提供了某个色谱波形d作为观测波形时的后验概率p(z|d)。如果假定例如标准偏差σ的正态噪声跟随峰模型函数f(t,z),则概率p(d|z)能够通过p(d|z)=n(f(t,z),σ)提供。其中,函数n为正态分布。
[0069]
如果像这样通过贝叶斯估计来求出作为参数z的概率分布的后验分布,则能够从该后验分布获得峰模型函数f(t,z0)的形状的概率分布。即,针对在色谱波形d上被观测的峰波形,概率性地求出表示被适当地进行了拟合的波形形状的峰模型函数。因而,如果例如表示某个波形形状的函数的概率显著高,则能够判断为该波形形状表示所提供的色谱上的峰波形。并且,能够基于该函数f(t,z0)来计算峰的面积值、高度值或峰位置等期望的峰特征值。
[0070]
另外,还能够根据峰模型函数f(t,z0)的形状的概率分布来计算色谱上的峰的面积值、高度值等峰特征值的概率分布。由此,例如也能够将概率分布的信用区间设为95%来求出峰面积、高度或位置等可取的值的范围等。
[0071]
此外,如专利文献1所示,即使在接近地存在的多个峰的末端部叠加的状况下,也能够通过进行嵌套了以存在多个峰为前提的混合分布的贝叶斯估计,来将各峰分离并求出各自的峰特征值。
[0072]
[模型函数和波形分布信息的计算方法]
[0073]
如上所述,为了对峰波形应用基于贝叶斯估计的拟合方法,需要峰模型函数和该函数中的形状参数的分布(先验分布)。一般而言,作为针对峰波形的模型函数,使用高斯函数、emg函数等。与此相对地,在此,不使用这样显示模型函数而利用对表示峰波形的函数自身和该函数可能具有的形状的分布(形状参数的分布)同时进行学习的机器学习的方法,来估计与色谱装置的种类/方式、其分析的应用领域的特性等相应的峰模型函数以及该函数的参数分布信息。
[0074]
图2是用于估计峰模型函数和参数分布信息的波形信息估计装置的一个实施方式的概要结构图。该装置包括实测数据输入部30、峰波形提取部31、对抗学习执行部32、峰模型函数决定部33等功能块。该装置的实体是计算机,通过执行安装于计算机的规定的程序(软件),来将图2所示的各功能块具体化。
[0075]
图3是在图2中的对抗学习执行部32中使用的gan的功能块结构图。此外,图2和图3所示的装置也可以包括于图1所示的lc装置的数据解析部20。也就是,也可以通过lc装置的数据解析用计算机实现上述功能,但实现上述功能的单元也可以与数据解析部20分开设置。
[0076]
在图2和图3所示的波形信息估计装置中,作为基于gan的对抗学习时的真实数据,使用通过实测获得的色谱波形。即,将通过使用图1所示的lc装置的测定部10或与其同等的lc装置来实际测定试样而获取到的色谱波形用作真实数据。
[0077]
但是,一般而言,虽说是色谱上的峰波形,但峰波形的形状会根据试样的种类也就是成分的种类、解析的应用领域或目的、lc分离条件等而产生较大的差异。如果想要将这样的形状存在较大差异的多个峰波形、例如处于拖尾较大的倾向的峰波形和处于几乎不出现拖尾的倾向的峰波形均作为解析的对象,则会产生峰模型函数的分布的宽度过宽而该函数的精度降低、或者参数的分布过宽这样的问题。因此,通过缩小解析的应用领域等,能够避免这样的问题。具体而言,在此,将解析对象的领域限定为源自生物体的代谢物的解析。即,试样为生物体试样,试样中的成分为代谢物。当然,这是一例,关于各种试样、成分或解析目的,能够应用在此描述的那样的方法。
[0078]
在图2所示的波形信息估计装置中,实测数据输入部30读取通过实测获得的许多色谱数据。峰波形提取部31进行以下处理:针对所输入的各色谱数据,去除例如sn比极端低的峰、分离不充分的峰等,提取波形形状良好的峰。然后,峰波形提取部31针对提取出的峰,求出拖尾(或前延)程度、峰宽度这样的规定的峰形状参数。此外,例如在能够预测保留时间与峰宽度存在比例关系这样的参数之间的相关性的情况下,为了容易地进行后述的学习,能够事先进行预先用保留时间对峰宽度进行标准归一化这样的减弱参数之间的相关性的标准归一化处理。
[0079]
如上所述,峰波形提取部31获取许多单个峰的峰形状参数。对抗学习执行部32实施将具有良好的波形形状的单个峰的峰形状参数作为真实数据的基于gan的学习。
[0080]
如图3所示,对抗学习执行部32包括随机噪声产生部40、生成器41、数据选择部44、识别器45、判定部46以及更新处理部47。生成器41包括时间失真函数生成部411、时间输入部412以及高斯函数运算部413。在此,在生成器41中的时间失真函数生成部411和识别器45中均使用非专利文献2、3中记载那样的神经网络。
[0081]
在一般的gan的观点中,生成器生成模仿真实数据的伪数据,识别器交替地识别该伪数据和真实数据。即,生成器学习峰波形本身的参数。与此相对地,对本实施方式中的对抗学习执行部32中使用的gan中的算法施加了以下的改良。
[0082]
如已经叙述的那样,色谱上的峰波形理想上是按照高斯函数的形状,但实际上由于各种因素相对于高斯波形形状产生偏离。因此,将该偏离定义为表示时间上的失真的时间失真函数s(t,z),在生成器41中,时间失真函数生成部411利用神经网络生成该时间失真函数s(t,z)。时间输入部412对作为色谱的横轴的参数的时间t加上时间失真函数s(t,z)后传递到高斯函数运算部413。高斯函数运算部413进行将t s(t,z)设为自变量的高斯函数的运算,输出按照包含时间失真要素的高斯函数gauss(t s(t,z))的波形。
[0083]
其中,时间失真函数s(t,z)、表示原来的峰波形的函数f(t,z)是与时间t相关的连续函数,与此相对地,通过测定获得的实测数据是按每个采样时间观测到的离散的数据的集合。因此,不能将这样的函数直接用于gan的生成器41。因此,在此,取代作为连续函数的时间失真函数s(t,z),而输出使用了表示实测数据的各采样时刻的向量t的离散的时间失真函数s(t,z)作为由时间失真函数生成部411生成的函数。
[0084]
即,在执行学习时,时间失真函数生成部411利用神经网络,基于从随机噪声产生部40输入的噪声来制作时间失真函数s(t,z)。时间输入部412将与时刻t对应的向量t同从时间失真函数生成部411输出的离散的时间失真函数s(t,z)相加,该向量t的大小与所提供的真实数据的向量大小相同。高斯函数运算部413接受相加得到的结果而生成按照高斯函
数gauss(t s(t,z))的波形、即伪峰波形。此时输出的伪波形数据的大小与作为学习对象的真实的波形向量的大小相同。
[0085]
数据选择部44将从生成器41输出的伪波形数据和上述真实的波形数据以交替地切换的方式输入到识别器45。识别器45识别所输入的数据是否为真,判定部46判定其识别结果是否正确,即,在真实数据被输入至识别器45时判定该识别器45是否识别为真,另一方面,在伪数据被输入至识别器45时判定该识别器45是否识别为假。
[0086]
更新处理部47基于判定部46的判定结果来更新时间失真函数生成部411中的神经网络的系数,以使伪数据接近真实数据。另外,一并更新该识别器45中的神经网络的系数,以提高识别器45的识别性能。众所周知,在gan中,一边这样使生成器41与识别器45竞争,一边以提高各自的性能的方式执行学习。
[0087]
通过上述那样的gan中的学习,生成器41生成与真实的峰波形极其接近的伪峰波形,在该学习的过程中,获得对该峰波形进行近似的峰模型函数和该函数的参数的分布(也就是波形形状的概率分布)信息。峰模型函数决定部33基于对抗学习执行部32实施了上述那样的gan中的学习的结果,来决定表示峰波形形状的峰模型函数及其形状参数的分布。
[0088]
在本实施方式的波形信息估计装置中的生成器41中,将由时间失真函数生成部411生成的函数限定为微小的时间失真,将嵌套了该函数的gauss(t s(t,z))用作峰模型函数。由此,通过gan的学习不是生成色谱上的峰波形整体,而是仅生成用高斯函数近似色谱上的峰波形时的微小的时间失真部分即可,因此能够容易地进行高精度的学习。
[0089]
在gan中,形状参数z的分布是概率分布。因而,该形状参数z的分布能够直接用作贝叶斯估计时的先验分布。因此,峰模型函数f(t,z)的分布本身不需要清楚地描述,在进行贝叶斯估计时,能够设为存在单纯对随机变量z进行转换的函数f(t,z)来进行推论。
[0090]
图4是示出图3中的生成器41的时间失真函数生成部411中的网络结构的一例的图。如图示那样,在该例子中,时间失真函数生成部411将从随机噪声产生部40提供的随机数向量z与作为标量值的时间t耦合后来作为一个向量进行接收。然后,将该向量应用于全连接(fc)层和激活函数的网络。通常,峰的拖尾会直接受到参数t的强影响,因此,在该例子中,将起始层的输入添加到以后的各层的输入。但是,不限于该结构,当然能够将自由的神经网络的结构用作时间失真函数生成部411。
[0091]
另一方面,作为识别器45,也可以使用一般的神经网络,但在此,为了更好地捕捉高斯函数那样的吊钟形状的波形,使用具有一维卷积层和线性组合层的神经网络。
[0092]
另外,为了成为由s(t,z)≈t表示的分布,更优选的是在函数s(t,z)的网络中使用跳跃式连接(skipped connection)(跳跃连接),或者优选的是,以设为s(t,z)=t s’(t,z)并使s’(t,z)以适当的宽度取0附近的值的方式调整网络权重的参数的初始值分布。
[0093]
另外,也考虑吊钟状函数的末端迟钝等存在对强度大致一样地施加的失真的情况。在该情况下,使用强度校正神经网络函数i(y),将函数i(gauss(s(t,z))用作生成器41也是有用的。该函数i的网络结构也与函数s同样,能够用与图4所示的网络结构同样的网络结构来描述。
[0094]
此外,在上述说明中,对抗学习执行部32的本质上的目的在于学习与数据点群的分布一致的分布,在上述例子中,使用gan作为该学习的方法。如非专利文献2、3所示,在gan中一般使用神经网络,但根据非专利文献3的记载也可知,能够使用能用微分(梯度)将函数
进行最优化的适当的算法来取代神经网络。另外,在此,作为相对于根据观测波形d和形状参数z生成的函数f的分布的相似度,利用了kl(kullback-leibler)距离,但除了kl距离之外,还能够使用js(jensen-shannon)距离、wasserstein距离等用于评价分布的一致程度的各种指标。
[0095]
另外,若考虑峰波形的前延和拖尾的形状,则对时间失真函数s(t,z)假定单调性是妥当的。因此,也可以使用嵌套了单调性的神经网络。
[0096]
例如将(t,z)设为自变量,来制作用于输出a、a、b、c、d的值的神经网络。其中,a、a、c是非负的。具有非负的输出的神经网络能够通过将对elu(exponential linear units)函数加上1得到的函数、relu函数等用作激活函数来制作。通过使用像这样获得的输出a、a、b、c、d来计算s(t,z)=c*t d σa*sigmoid(t*a b),能够制作满足了单调性的时间失真函数。在上述例子中,时间失真函数为在由ct d表示的直线上存在由多个sigmoid函数的合成形成的拐点这样的模型。
[0097]
图5是示出在基于gan的学习时使用的真实的峰波形数据的一部分的图。另一方面,图6是示出由生成器41生成的伪峰波形数据的一部分的图。图5和图6均是随机地叠加多条波形的图。若将它们进行比较可知,能够通过gan中的学习来获得能够输出与真实的峰波形数据极其接近(实质上无法区别)的伪峰波形数据的生成模型。
[0098]
通过上述那样的处理,能够获取基于在实测的色谱上被观测的峰波形来模拟地生成该波形的生成模型、也就是峰模型函数和形状参数的分布信息。通过将这些数据储存于图1所示的装置中的先验信息存储部221,并用作贝叶斯估计处理部222中的贝叶斯估计时的先验分布,峰检测处理部22能够高精度地检测峰,并且能够更准确地计算峰定量值等峰特征值。
[0099]
即,在利用贝叶斯估计进行参数推论时,针对成为对象的观测波形数据d0,获得形状参数z的后验分布z0。通过对这样获得的推论完毕的后验分布z0进行采样,来获得具体的峰形状的样本gauss(t f(t,z0))的形状,因此只要基于该形状来计算峰面积值等期望的峰特征值的分布即可。通过上述那样的机器学习获得的f(t,z)是与emg函数等同样的将t作为自变量的函数,因此保留有能够使用基于贝叶斯估计的参数z的分布、函数f的后验预测分布这样的模型函数的优点,能够容易地应用于贝叶斯估计。
[0100]
在实用上,需要对相邻的峰的末端部彼此叠加的混合峰等进行处理的情况较多,但对于lc装置、gc装置等大多数分析装置而言,视为确保了分析中的线性的装置。因此,在解析对象是色谱波形的情况下,混合峰的信号值也可以设为将与多个单个峰对应的信号值单纯地相加而得到的值。另外,为了进行贝叶斯估计,除了峰的宽度、末端部的扩展程度等信息之外,还需要峰的位置、高度等分布的信息,但在色谱的情况下,一般分别独立地考虑这些参数的分布,能够与峰宽度等形状参数分开地估计该分布。因而,即使在多个峰叠加的混合分布中,通过在存在多个峰的前提下进行贝叶斯估计,也能够实质上分离峰,求出各自的峰面积等峰特征值。
[0101]
另外,本发明所涉及的上述的方法除了计算峰面积之外当然也能够用于有无峰的检验、峰位置的估计等峰特征值的计算。另外,为了利用峰模型函数进行峰检测、峰分离或峰特征值的计算,也可以利用贝叶斯估计以外的方法。具体而言,也可以利用峰波形的拟合中频繁使用的最大似然估计法、最小二乘法等更简单的方法。在该情况下,也高精度地获得
原来的峰模型函数,因此能够进行高精度的峰检测、峰分离等。
[0102]
[向峰波形解析以外的应用]
[0103]
另外,在上述说明中,将本发明所涉及的方法应用于色谱上的峰的解析,但能够用于除此以外的波形的解析。例如,在根据峰面积求出成分浓度(含量)等时使用的校准曲线也是一种信号波形,对于校准曲线也能够进行同样的解析。当然,校准曲线的形状通常不按照高斯函数,但能够取代使用高斯函数而使用函数g(t f(t,z),z)来进行模型化。另外,在表示药剂反应量的变化量的时间经过等的波形的解析中也能够应用本方法。
[0104]
图7是示出在通过基于gan的学习来制作用于模拟校准曲线的生成模型时使用的真实数据的一部分的图。另一方面,图8是示出与此相对地在生成器中生成的伪数据的一部分的图。图7和图8均是随机地叠加多条波形的图。若将它们进行比较可知,在模拟校准曲线时,也能够获得能够输出与真实数据极其接近(实质上无法区别)的伪数据的生成模型。
[0105]
另外,在上述例子中,利用神经网络仅制作与时间t有关的时间失真函数f并描述了转换函数,但也能够使用与强度x有关而不是与时间有关的函数g(x,z)来描述转换函数g(gauss(t),z)。这是设想了产生不是与时间而是与强度相应的失真的情况,例如,在将吸光光度计等作为检测器的lc装置中,适于描述在高浓度区域中产生信号饱和而峰顶变形那样的情况下的模型函数。当然,也能够组合函数f和函数g并描述为g(gauss(t f(t,z)),z)。
[0106]
另外,上述实施方式是将本发明应用于lc装置的例子,但显然能够在对由lc装置、gc装置以外的各种分析装置获得的信号波形进行处理或解析时应用本发明。
[0107]
[各种方式]
[0108]
本领域技术人员理解的是,上述的例示性的实施方式是以下的方式的具体例。
[0109]
(第一项)本发明所涉及的波形信息估计方法的一个方式是估计与信号波形有关的波形信息的方法,所述波形信息估计方法使用计算机执行以下步骤:
[0110]
波形提取步骤,从基于使用规定的分析装置进行的实测的信号波形中提取作为模型化对象的部分波形;以及
[0111]
对抗学习步骤,将在所述波形提取步骤中获得的部分波形作为输入,执行使用了生成模型和识别模型这两个相互对抗的模型的对抗学习,由此获取与所述部分波形对应的模型函数或者获取该模型函数及该函数中的形状的分布信息。
[0112]
(第九项)本发明所涉及的波形信息估计装置的一个方式具备:
[0113]
波形提取部,其从基于使用规定的分析装置进行的实测的信号波形中提取作为模型化对象的部分波形;以及
[0114]
对抗学习部,其将由所述波形提取部获得的部分波形作为输入来执行使用了生成模型和识别模型这两个相互对抗的模型的对抗学习,由此获取与所述部分波形对应的模型函数或者获取该模型函数及该函数中的形状的分布信息。
[0115]
根据第一项所记载的波形信息估计方法或第九项所记载的波形信息估计装置,例如,能够以高准确度获取用于将由色谱装置获得的色谱中的峰等部分波形高精度地模型化的模型函数、该模型函数的形状参数例如峰的拖尾程度、峰宽度等的分布的信息。
[0116]
通过将这样获得的模型函数、参数分布的信息例如用于峰检测,能够更准确地检测在作为解析对象的色谱等中被观测的峰。另外,能够提高这样的峰的面积值、高度值等峰特征值的计算的精度。由此,能够提高试样中的成分的定性精度和定量精度。
[0117]
另外,通过判明模型函数和参数分布信息,能够合理地计算根据作为解析对象的色谱求出的峰的位置、或者面积值、高度值等峰特征值的误差的范围。由此,例如能够准确地进行通过其它波形处理法获得的峰的特征值是否适当等评价。
[0118]
(第二项)在第一项所记载的波形信息估计方法中,能够设为,在所述对抗学习步骤中进行以下处理:生成表示以规定的函数近似了所述部分波形时的失真要素的偏函数,将该偏函数导入所述规定的函数,并且将所述信号波形的横轴的参数设为该函数的自变量,由此输出与所输入的所述部分波形进行比较的伪波形。
[0119]
(第十项)在第九项所记载的波形信息估计装置中,能够设为,所述对抗学习部进行以下处理:生成表示以规定的函数近似了所述部分波形时的失真要素的偏函数,将该偏函数导入所述规定的函数,并且将所述信号波形的横轴的参数设为该函数的自变量,由此输出与所输入的所述部分波形进行比较的伪波形。
[0120]
在一般的gan中,生成模型生成用于制作模仿上述真实的数据的伪数据的函数,但在第二项所记载的波形信息估计方法和第十项所记载的波形信息估计装置中,生成模型不是生成表示部分波形的数据本身,而是仅生成表示以规定的函数近似了部分波形时的失真要素的偏函数。也就是,该偏函数不是制作部分波形本身的函数,而是表示想要用例如高斯函数等近似部分波形时的失真的函数。然后,将部分波形的横轴的参数作为自变量,将所生成的偏函数导入规定的函数,由此求出表示伪波形的数据。使用识别模型来识别该伪数据和上述真实的数据。
[0121]
表示失真要素的偏函数与表示原来的部分波形本身的函数相比,为强度的变动大幅减小的函数,因此gan等中的生成模型的学习以扩大微小的强度变动的方式进行学习。因此,与学习部分波形本身的情况相比,能够进行精度高的学习,能够提高模型函数以及该模型函数的形状参数的分布的计算精度。
[0122]
(第三项)在第二项所记载的波形信息估计方法中,能够设为,所述部分波形为峰波形,所述失真要素为与该峰波形的横轴的参数有关的失真的函数。
[0123]
(第十一项)同样地,在第十项所记载的波形信息估计装置中,能够设为,所述部分波形为峰波形,所述失真要素为与该峰波形的横轴的参数有关的失真的函数。
[0124]
即,在第三项所记载的方法和第十一项所记载的装置中,在部分波形为从色谱中提取出的峰波形的情况下,横轴的参数是时间,因此上述偏函数是时间失真函数。
[0125]
(第四项、第十二项)在第三项所记载的波形信息估计方法和第十一项所记载的波形信息估计装置中,能够设为,所述横轴的参数是时间。
[0126]
根据第四项所记载的波形信息估计方法和第十二项所记载的波形信息估计装置,例如能够获得与色谱上的峰有关的模型函数、其形状参数的分布等精度高的波形信息。
[0127]
(第五项)第五项所记载的发明是使用了第一项~第四项中的任一项所记载的波形信息估计方法的峰波形处理方法,其中,能够设为:
[0128]
所述部分波形为峰波形,
[0129]
所述峰波形处理方法还执行利用在所述对抗学习步骤中获得的模型函数来生成峰模型波形的模型波形生成步骤,
[0130]
在所述峰波形处理方法中利用所述峰模型波形来进行针对目标信号波形的峰检测。
[0131]
(第十三项)第十三项所记载的发明是使用了第九项~第十二项中的任一项所记载的波形信息估计装置的峰波形处理装置,其中,能够设为,
[0132]
所述部分波形为峰波形,
[0133]
所述峰波形处理装置还具备模型波形生成部,该模型波形生成部利用由所述对抗学习部获得的模型函数来生成峰模型波形,所述峰波形处理装置利用所述峰模型波形来进行针对目标信号波形的峰检测。
[0134]
根据第五项所记载的峰波形处理方法和第十三项所记载的峰波形处理装置,能够利用精度高的模型函数来准确地进行峰检测。另外,由于能够高精度地求出峰的高度值、面积值等峰特征值,因此例如能够提高目标成分的定量精度。
[0135]
(第六项)另外,第六项所记载的发明是使用了第一项~第四项中的任一项所记载的波形信息估计方法的峰波形处理方法,其中,能够设为,
[0136]
所述部分波形为峰波形,
[0137]
所述峰波形处理方法还执行处理步骤,在该处理步骤中,利用在所述对抗学习步骤中获得的模型函数,来进行将在目标信号波形中叠加的多个峰分离的波形处理。
[0138]
(第十四项)同样地,第十四项所记载的发明是使用了第九项~第十二项中的任一项所记载的波形信息估计装置的峰波形处理装置,其中,能够设为,
[0139]
所述部分波形为峰波形,
[0140]
所述峰波形处理装置还具备波形处理部,该波形处理部利用由所述对抗学习部获得的模型函数,来进行将在目标信号波形中叠加的多个峰分离的波形处理。
[0141]
根据第六项所记载的峰波形处理方法和第十四项所记载的峰波形处理装置,能够利用精度高的模型函数将叠加的多个峰高精度地分离,之后高精度地求出各峰的高度值、面积值等峰特征值。由此,例如,对于在以往方法中在色谱上难以分离的叠加的峰,也能够对与各峰对应的成分进行高精度的定量分析。
[0142]
(第七项)在第五项或第六项所记载的峰波形处理方法中,能够设为,还执行特征值推算步骤,在该特征值推算步骤中,针对检测出或分离出的各峰求出规定的特征值。
[0143]
(第十五项)在第十三项或第十四项所记载的峰波形处理装置中,能够设为,还具备特征值推算部,该特征值推算部针对检测出或分离出的各峰求出规定的特征值。
[0144]
根据第七项所记载的峰波形处理方法和第十五项所记载的峰波形处理装置,例如能够进行基于色谱、谱的高精度的定量分析。
[0145]
(第八项、第十六项)在第五项~第七项中的任一项所记载的峰波形处理方法或者第十三项~第十五项中的任一项所记载的峰波形处理装置中,能够设为,使用贝叶斯估计来进行峰检测、峰的分离和/或与峰有关的规定的特征值的推算。
[0146]
在第八项所记载的峰波形处理方法和第十六项所记载的峰波形处理装置中,作为利用贝叶斯估计来检测例如色谱中的峰或者求出面积值等峰特征量时的先验分布,使用上述模型函数的形状的分布信息。因而,能够准确地检测或分离峰,并且还能够高精度地求出峰面积值等峰特征量,其结果,能够提高定性精度、定量精度。
[0147]
附图标记说明
[0148]
10:测定部;11:流动相容器;12:泵;13:喷射器;14:柱;15:检测器;20:数据解析部;21:数据收集部;22:峰检测处理部;221:先验信息存储部;222:贝叶斯估计处理部;223:
峰特征值决定部;23:定性/定量解析部;24:输入部;25:显示部;30:实测数据输入部;31:峰波形提取部;32:对抗学习执行部;33:模型函数信息决定部;40:随机噪声产生部;41:生成器;411:时间失真函数生成部;412:时间输入部;413:高斯函数运算部;44:数据选择部;45:识别器;46:判定部;47:更新处理部。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献