一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

学习用数据的评价方法、程序、学习用数据的生成方法、学习完毕模型的生成方法以及学习用数据的评价系统与流程

2022-07-14 04:49:00 来源:中国专利 TAG:


1.本公开一般涉及学习用数据的评价方法、程序、学习用数据的生成方法、学习完毕模型的生成方法以及学习用数据的评价系统。更详细而言,本公开涉及用于模型的机器学习的学习用数据的评价方法、该程序、学习用数据的生成方法、学习完毕模型的生成方法、以及学习用数据的评价系统。


背景技术:

2.在非专利文献1中,公开了用于改善现代图像分类器的精度的数据扩展的方法。
3.在先技术文献
4.非专利文献
5.非专利文献1:ekin d.cubuk et al.,“autoaugment:learning augmentation strategies from data”,arxiv:1805.09501v3[cs.cv],11apr2019


技术实现要素:

[0006]
本公开的目的在于,提供容易生成能够有助于模型的识别率的提高的学习用数据的学习用数据的评价方法、程序、学习用数据的生成方法、学习完毕模型的生成方法、以及学习用数据的评价系统。
[0007]
本公开的一个方式所涉及的学习用数据的评价方法具有第一评价步骤和第二评价步骤。第一评价步骤是对使用通过数据扩展处理生成的学习用数据来评价进行了机器学习的学习完毕模型的性能的步骤。第二评价步骤是基于第一评价步骤中的评价和数据扩展处理的参数的能取范围来评价所述参数的步骤。
[0008]
本公开的另一个方式所涉及的程序使1个以上的处理器执行上述的学习用数据的评价方法。
[0009]
本公开的另一个方式所涉及的学习用数据的生成方法具有第一评价步骤、第二评价步骤、更新步骤以及数据生成步骤。第一评价步骤是对使用通过数据扩展处理生成的学习用数据来评价进行了机器学习的学习完毕模型的性能的步骤。第二评价步骤是基于第一评价步骤中的评价和数据扩展处理的参数的能取范围来评价参数的步骤。更新步骤是基于第二评价步骤中的评价来更新参数的步骤。数据生成步骤是通过基于在更新步骤中进行了更新的参数的数据扩展处理来生成学习用数据的步骤。
[0010]
本公开的另一个方式所涉及的学习完毕模型的生成方法具有第一评价步骤、第二评价步骤、更新步骤、数据生成步骤以及模型生成步骤。第一评价步骤是对使用通过数据扩展处理生成的学习用数据来评价进行了机器学习的学习完毕模型的性能的步骤。第二评价步骤是基于第一评价步骤中的评价和数据扩展处理的参数的能取范围来评价参数的步骤。更新步骤是基于第二评价步骤中的评价来更新参数的步骤。数据生成步骤是通过基于在更新步骤中进行了更新的参数的数据扩展处理来生成学习用数据的步骤。模型生成步骤是通
过使用在数据生成步骤中生成的学习用数据进行机器学习来生成学习完毕模型的步骤。
[0011]
本公开的另一个方式所涉及的学习用数据的评价系统具备第一评价部和第二评价部。第一评价部使用通过数据扩展处理生成的学习用数据来评价进行了机器学习的学习完毕模型的性能。第二评价部基于第一评价部中的评价和数据扩展处理的参数的能取范围来评价参数。
[0012]-发明效果-[0013]
本公开具有容易生成能够有助于提高模型的识别率的学习用数据的优点。
附图说明
[0014]
图1是表示包括本公开的一实施方式所涉及的学习用数据的评价系统的模型生成系统的框图。
[0015]
图2是在上述的模型生成系统中学习完毕模型的识别对象的一例的概要图。
[0016]
图3a是上述的识别对象的不合格品的一例的说明图。
[0017]
图3b是上述的识别对象的不合格品的另一例的说明图。
[0018]
图3c是上述的识别对象的不合格品的又一例的说明图。
[0019]
图4是表示在上述的模型生成系统中,原始学习用数据所包括的图像数据的一例的概要图。
[0020]
图5是表示在上述的模型生成系统中,基于原始学习用数据而生成的学习用数据所包括的图像数据的一例的概要图。
[0021]
图6a是表示在上述的模型生成系统中拍摄了焊道的合格品的图像数据的一例的概要图。
[0022]
图6b是表示对图6a所示的图像数据追加附加图像而生成的学习用数据所包括的图像数据的一例的概要图。
[0023]
图7是表示上述的模型生成系统的动作的流程图。
具体实施方式
[0024]
(1)概要
[0025]
本实施方式所涉及的学习用数据的评价方法是用于对用于机器学习模型的学习用数据进行评价的方法。本公开中所说的“模型”是当输入与识别对象有关的数据时,推断识别对象处于怎样的状态,并输出推断结果的程序。以下,将使用了学习用数据的机器学习完成了的模型称为“学习完毕模型”。此外,本公开中所说的“学习用数据”是将输入到模型的输入信息(在本实施方式中为图像数据)和对输入信息赋予的标签进行组合而得到的数据集,是所谓的教示数据。换句话说,在本实施方式中,学习完毕模型是通过有监督学习的机器学习完成了的模型。在本实施方式中,学习用数据的评价方法通过图1所示的学习用数据的评价系统10(以下,也简称为“评价系统10”)来实现。图1是表示包括本公开的一实施方式所涉及的学习用数据的评价系统10在内的模型生成系统100的框图。图2是在图1所示的模型生成系统100中,学习完毕模型的识别对象的一例的概要图。
[0026]
在本实施方式中,如图2所示,识别对象是在对2个以上的构件(在此为第一板b11以及第二板b12)进行了焊接时形成于焊接部位的焊道b1。然后,学习完毕模型m1(参照图1)
在输入包括焊道b1的图像数据时,推断焊道b1的状态,并输出推断结果。具体而言,学习完毕模型m1作为推断结果,输出焊道b1是合格品还是不合格品,在是不合格品的情况下输出不合格品的种类。换句话说,学习完毕模型m1用于检查焊道b1是否为合格品、换言之是否正确地进行了焊接的焊接外观检查。
[0027]
作为一例,根据焊道b1的长度、焊道b1的高度、焊道b1的上升的角度、焊道b1的焊缝厚度、焊道b1的余料、以及焊道b1的焊接部位的位置偏移(包括焊道b1的始端的偏移)是否收敛于允许范围来判定焊道b1是否为合格品。例如,如果上述列举的条件中的1个也不在允许范围内,则判定为焊道b1为不合格品。图3a~图3c是作为识别对象的焊道b1的不合格品的例子的说明图。图3a~图3c是包括焊道b1的剖视图。作为一例,根据焊道b1的咬边b2(参照图3a)的有无、焊道b1的凹坑b3(参照图3b)的有无、焊道b1的溅射b4(参照图3c)的有无、以及焊道b1的突起的有无来判定焊道b1是否为合格品。例如,产生了在上述列举的不合格部分中的1个的情况下,也判定为焊道b1为不合格品。
[0028]
在此,为了进行模型的机器学习,需要准备包括识别对象的不合格品在内的多个图像数据作为学习用数据d1(参照图1)。然而,在识别对象的不合格品产生的频度较少的情况下,为了生成识别率较高的学习完毕模型m1所需的学习用数据d1往往不足。因而,考虑通过对实际通过摄像装置拍摄焊道b1而得到的学习用数据d1(以下,也将实际通过摄像装置拍摄焊道b1而得到的学习用数据称为“原始学习用数据”)执行数据扩展(data augmentation)处理,从而增加学习用数据d1的数量来进行模型的机器学习。这里所说的“数据扩展处理”是指通过对学习用数据d1施加平行移动、放大/缩小、旋转、反转或者噪声的赋予等处理,人为地增大学习用数据的处理。
[0029]
然而,并非仅对作为原始学习用数据的学习用数据d1进行数据扩展处理,根据情况,也存在通过使用新生成的学习用数据d1进行机器学习,也有学习完毕模型m1的识别率降低的可能性。换句话说,优选进行能够有助于提高学习完毕模型m1的识别率的、能够生成适合于模型的机器学习的学习用数据d1这样的数据扩展。
[0030]
因而,在本实施方式中,通过利用学习用数据d1的评价方法来评价学习用数据d1,从而容易在数据扩展处理中生成适合于模型的机器学习的学习用数据d1。图7是表示模型生成系统100的动作的流程图。本实施方式的学习用数据d1的评价方法具有第一评价步骤st1(参照图7)和第二评价步骤st2(参照图7)。
[0031]
第一评价步骤st1是对使用通过数据扩展处理生成的学习用数据d1进行了机器学习的学习完毕模型m1的性能进行评价的步骤。本公开中所说的“数据扩展处理”除了对原始学习用数据执行的处理之外,还可以包括不使用原始学习用数据而基于数据扩展处理的参数重新生成学习用数据d1的处理。例如,数据扩展处理也可以包括通过cg(computer graphics,计算机图形)技术,不使用作为原始学习用数据的学习用数据d1而生成包括合格品的焊道b1在内的图像数据、或者包括不合格品的焊道b1的在内的图像数据的处理。
[0032]
第二评价步骤st2是基于第一评价步骤st1中的评价和数据扩展处理的参数的能取范围来评价(数据扩展处理的)参数的步骤。本公开中所说的“数据扩展处理的参数”是指对处理对象的数据的一部分或者全部执行的平行移动、放大/缩小、旋转、反转、或者噪声的赋予等数据扩展处理的程度。例如,在将在表面具有突起的不合格品的焊道b1的图像数据作为处理对象的数据的情况下,数据扩展处理的参数可以包括使突起移动的移动量、突起
的尺寸、突起的旋转量等。
[0033]
在此,数据扩展处理的参数被设定为能够按照每个处理的种类进行变更的范围。例如,在参数为使突起移动的移动量的情况下,移动量能够在0~数十mm的范围内变更。另外,数据扩展处理的参数也可以是1值即给定的一个值。此外,数据扩展处理的参数在给定的处理中的上限值与下限值之间被决定。在进行数据扩展时,该参数也可以在上限值、下限值的范围内随机地来决定值。此外,数据扩展处理的参数也可以是在进行数据扩展时移动量等的值所采用的平均、方差等的统计值。
[0034]
如上所述,在本实施方式中,评价学习完毕模型m1的性能,并基于该评价来评价数据扩展处理的参数。因此,在本实施方式中,通过数据扩展处理生成的学习用数据d1能够间接地评价在学习完毕模型m1的生成中是否为适当的数据。其结果,在本实施方式中,具有如下优点:基于数据扩展处理的参数的评价更新下次以后的数据扩展处理的参数等,容易生成能够有助于模型的识别率的提高的学习用数据d1。
[0035]
(2)详细情况
[0036]
以下,参照图1详细地说明用于实现本实施方式的学习用数据的评价方法的评价系统10、以及使用评价系统10生成学习完毕模型m1的模型生成系统100。如图1所示,模型生成系统100具备评价系统10、更新部3、数据生成部4、模型生成部5以及存储部6。此外,评价系统10具备第一评价部1和第二评价部2。
[0037]
在本实施方式中,模型生成系统100(包括评价系统10)除了存储部6以外,以具有1个以上的处理器以及存储器的计算机系统为主结构。因此,通过1个以上的处理器执行存储器中记录的程序,作为第一评价部1、第二评价部2、更新部3、数据生成部4、以及模型生成部5发挥功能。程序可以预先记录在存储器中,也可以通过互联网等电气通信线路来提供,也可以记录在存储卡等非暂时性记录介质中来提供。
[0038]
数据生成部4通过基于由更新部3进行了更新的参数的数据扩展处理,生成学习用数据d1。本公开中所说的“学习用数据的生成”除了与现有的学习用数据d1不同地生成新的学习用数据d1以外,还可以包括通过更新现有的学习用数据d1来生成新的学习用数据d1。此外,数据生成部4在通过更新部3更新参数之前的初始时,通过基于预先设定的初始参数的数据扩展处理,来生成学习用数据d1。
[0039]
在本实施方式中,数据扩展处理的参数存在多种。而且,多个种类的参数分别被设定为能够变更的范围。在此,作为一例,假设数据生成部4对任意的原始学习用数据执行数据扩展处理。在这种情况下,数据生成部4针对多种参数中的1个以上的参数,在可变更的范围内变更处理量,并对该原始学习用数据依次执行数据扩展处理。由此,数据生成部4能够基于1个原始学习用数据生成多个学习用数据d1。
[0040]
图4是表示在模型生成系统100中,原始学习用数据所包括的图像数据的一例的概要图。图5是表示在模型生成系统100中,基于原始学习用数据生成的学习用数据所包括的图像数据的一例的概要图。作为一例,假设存在包括图4所示的图像数据在内的原始学习用数据。该图像数据是突起c1从焊道b1的表面突出的不合格品的焊道b1的数据。因此,该原始学习用数据的标签为“不合格品:有突起”。数据生成部4通过对该图像数据执行例如使突起c1平行移动的数据扩展处理,能够生成如图5所示的图像数据。在图5所示的例子中,用双点划线表示数据扩展处理的执行前的突起c1。此外,在图5所示的例子中,用“c2”表示数据扩
展处理的执行后的突起。
[0041]
然后,数据生成部4通过对该图像数据赋予与原始学习用数据相同的标签即“不合格品:有突起”,从而生成学习用数据d1。在此,数据生成部4通过在可变更的范围内阶段性地变更使突起c1平行移动的移动量,从而生成突起c1的位置相互不同的多个学习用数据d1。
[0042]
在本实施方式中,数据生成部4通过对包括合格品的焊道b1的图像数据在内的原始学习用数据附加表示不合格品的特征的图像(例如,焊道b1的突起等图像),从而生成包括不合格品的焊道b1的图像数据在内的学习用数据d1。换句话说,学习用数据d1通过对包括学习完毕模型m1的识别对象(在此为焊道b1)在内的图像数据追加基于(数据扩展处理的)参数的附加图像d11而生成。
[0043]
图6a是表示在模型生成系统100中拍摄了焊道b1的合格品的图像数据的一例的概要图。图6b是表示对图6a所示的图像数据追加附加图像而生成的学习用数据所包括的图像数据的一例的概要图。作为一例,假设存在包括图6a所示的图像数据在内的原始学习用数据。该图像数据是合格品的焊道b1的数据。因此,该原始学习用数据的标签为“合格品”。数据生成部4通过对该图像数据执行例如追加从焊道b1的表面突出的突起e1作为附加图像d11的数据扩展处理,能够生成如图6b所示的图像数据。然后,数据生成部4通过对该图像数据赋予作为与原始学习用数据不同的标签的“突起(不合格品)”,生成学习用数据d1。另外,在将识别不合格的位置和种类的语义分割作为学习的对象的情况下,针对学习用数据d1的标签成为e1(d11)的范围和不合格种类的“突起”的位置。
[0044]
模型生成部5通过使用由数据生成部4生成的学习用数据d1进行机器学习,从而生成学习完毕模型m1。本公开中所说的“学习完毕模型的生成”除了与现有的学习完毕模型m1分开地生成新的学习完毕模型m1以外,还可以包括通过更新现有的学习完毕模型m1来生成新的学习完毕模型m1。在本实施方式中,模型生成部5以前者的方式生成学习完毕模型m1。
[0045]
模型生成部5例如除了svm(support vector machine,支持向量机)等线性模型以外,还生成使用了神经网络的模型、或者基于使用了多层神经网络的深层学习(深度学习)的模型等作为学习完毕模型m1。在本实施方式中,模型生成部5生成使用神经网络的模型作为学习完毕模型m1。神经网络例如可包括cnn(convolutional neural network:卷积神经网络)、或者bnn(bayesian neural network:贝叶斯神经网络)等。
[0046]
存储部6具有1个以上的存储装置。存储装置例如是ram(random access memory,随机存取存储器)或者eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)等。存储部6存储后述的q表。
[0047]
第一评价部1使用通过数据扩展处理生成的学习用数据d1来评价进行了机器学习的学习完毕模型m1的性能。换句话说,第一评价部1是第一评价步骤st1的执行主体。第一评价部1基于通过将评价用数据d2输入到学习完毕模型m1而得到的、学习完毕模型m1的输出,评价学习完毕模型m1的性能。
[0048]
评价用数据d2是将输入到学习完毕模型m1的输入信息(在本实施方式中为图像数据)和对输入信息赋予的标签进行组合而得到的数据集。在本实施方式中,评价用数据d2例如是原始学习用数据等实际拍摄焊道b1而得到的图像数据和对该图像数据赋予的标签的组合。作为一例,标签是图像数据所包括的焊道b1是合格品还是不合格品的信息。此外,作
x100000000x200000000x300000000x400000000x500000000
[0058]
在表1所示的例子中,“x1”~“x5”分别表示状态。具体而言,“x1”表示学习完毕模型m1的识别率小于25%的状态,“x2”表示学习完毕模型m1的识别率在25%以上且小于50%的状态,“x3”表示学习完毕模型m1的识别率在50%以上且小于75%的状态。此外,“x4”表示学习完毕模型m1的识别率在75%以上且小于95%的状态,“x5”表示学习完毕模型m1的识别率在95%以上的状态。
[0059]
在表1所示的例子中,“y11 ”、“y11
‑”
、“y12 ”、“y12
‑”
、“y21 ”、“y21
‑”
、“y22 ”、“y22
‑”
分别表示行动。具体而言,“y11 ”表示提高第一参数的上限值的行动,“y11
‑”
表示降低第一参数的上限值的行动,“y12 ”表示提高第一参数的下限值的行动,“y12
‑”
表示降低第一参数的下限值的行动。在此,第一参数是能够变更从焊道b1的表面突出的突起c1的直径尺寸的范围。此外,“y21 ”表示提高第二参数的上限值的行动,“y21
‑”
表示降低第二参数的上限值的行动,“y22 ”表示提高第二参数的下限值的行动,“y22
‑”
表示降低第二参数的下限值的行动。在此,第二参数是使突起c1平行移动的情况的移动量的可变更的范围。
[0060]
例如,假设通过在状态“x3”中选择行动“y12
‑”
来过渡为状态“x4”。在该情况下,由于学习完毕模型m1的识别率提高,因此第二评价部2对从状态“x3”向状态“x4”的过渡赋予“ α”的报酬。然后,第二评价部2参照上述的报酬等更新状态“x3”的行与行动“y12
‑”
的列交叉的单元中的q值。
[0061]
更新部3基于第二评价部2中的评价,更新数据扩展处理的参数。换言之,更新部3是基于第二评价部2(第二评价步骤st2)中的评价来更新参数的更新步骤st3的执行主体。换句话说,本实施方式的学习用数据d1的评价方法还具有更新步骤st3。在本实施方式中,更新部3通过在q表中按照给定的算法选择行动,来更新数据扩展处理的参数。更新部3在q表的初始状态下,从多个行动中随机选择任意的行动。之后,作为一例,更新部3根据ε-greedy法,从多个行动中选择一个行动。换句话说,更新部3在选择行动时生成0~1之间的随机数,如果生成的随机数为“ε”以下,则随机选择行动,如果生成的随机数比“ε”大,则选择q值大的行动。由此,具有不依赖于q值的初始值而容易进行针对各种行动的适当的q值的学习这样的优点。
[0062]
(3)动作
[0063]
以下,使用图7对本实施方式的模型生成系统100(包括评价系统10)的动作的一例进行说明。作为前提,假设数据生成部4基于原始学习用数据执行数据扩展处理,由此准备对于模型进行机器学习足够数量的学习用数据d1。然后,假设模型生成部5使用所准备的学习用数据d1,预先生成学习完毕模型m1。此外,在第二评价部2参照的q表中,假设初始状态为“x1”。
[0064]
首先,第一评价部1评价学习完毕模型m1的性能(s1)。处理s1相当于第一评价步骤st1。具体而言,第一评价部1通过将多个评价用数据d2输入到学习完毕模型m1,求出学习完毕模型m1相对于多个评价用数据d2的识别率。
[0065]
在此,如果学习完毕模型m1的识别率未达到目标(在此为100%)(s2:否),则第二评价部2基于第一评价部1中的学习完毕模型m1的性能的评价,评价数据扩展处理的参数(s3)。处理s3相当于第二评价步骤st2。具体而言,第二评价部2在存储于存储部6的q表中,更新对应的单元的q值。
[0066]
另一方面,如果学习完毕模型m1的识别率达到目标(s2:是),则模型生成系统100(换句话说,评价系统10)停止其动作。换言之,模型的机器学习完成。换句话说,评价系统10在第一评价部1中的评价达到了目标(在此为对全部的评价用数据给出正解)时,停止动作,换言之,停止第一评价部1以及第二评价部2。这样,在本实施方式的学习用数据d1的评价方法中,当第一评价步骤st1中的评价达到目标时,停止第一评价步骤st1以及第二评价步骤st2。
[0067]
在经过了处理s3的情况下,更新部3基于第二评价部2中的数据扩展处理的参数的评价,更新(数据扩展处理的)参数(s4)。处理s4相当于更新步骤st3。具体而言,更新部3通过在q表格中按照给定的算法选择行动,来更新参数。
[0068]
然后,数据生成部4通过基于由更新部3进行了更新的参数的数据扩展处理,生成学习用数据d1(s5)。处理s5相当于后述的数据生成步骤st4。然后,模型生成部5使用由数据生成部4生成的学习用数据d1进行机器学习,由此生成学习完毕模型m1(s6)。处理s6相当于后述的模型生成步骤st5。
[0069]
以下,反复进行处理s1~s6,直到在处理s2中学习完毕模型m1的识别率达到目标为止。
[0070]
(4)优点
[0071]
如上所述,在本实施方式中,对学习完毕模型m1进行评价,并基于该评价来评价数据扩展处理的参数。因此,在本实施方式中,通过数据扩展处理生成的学习用数据d1能够间接地评价在学习完毕模型m1的生成中是否为适当的数据。其结果,在本实施方式中,具有如下优点:基于数据扩展处理的参数的评价更新下次以后的数据扩展处理的参数等,容易生成能够有助于模型的识别率的提高的学习用数据d1。
[0072]
换句话说,在本实施方式中,通过由计算机系统反复试错,能够搜索数据扩展处理的最佳的参数。而且,在本实施方式中,基于通过搜索得到的参数,容易生成能够有助于提高学习完毕模型的识别率的学习用数据d1。其结果,在本实施方式中,通过使用所生成的学习用数据d1来执行模型的机器学习,从而容易生成具有所希望的识别率的学习完毕模型m1。
[0073]
(5)变形例
[0074]
上述的实施方式只不过是本公开的各种实施方式之一。上述的实施方式只要能够实现本公开的目的,则能够根据设计等进行各种变更。此外,与上述的实施方式所涉及的学习用数据d1的评价系统10同样的功能除了学习用数据d1的评价方法以外,也可以由计算机程序、或者记录有计算机程序的非暂时性的记录介质等具体化。一个方式所涉及的(计算机)程序使1个以上的处理器执行上述的学习用数据d1的评价方法。
[0075]
此外,与上述的实施方式所涉及的模型生成系统100同样的功能也可以通过学习完毕模型m1的生成方法、计算机程序、或者记录有计算机程序的非暂时性记录介质等来具体化。进而,与上述的实施方式所涉及的模型生成系统100中的生成学习用数据d1的结构相
同的功能也可以通过学习用数据d1的生成方法、计算机程序、或者记录有计算机程序的非暂时性记录介质等来具体化。
[0076]
一个方式所涉及的学习用数据d1的生成方法具有第一评价步骤st1、第二评价步骤st2、更新步骤st3以及数据生成步骤st4。第一评价步骤st1是对使用通过数据扩展处理生成的学习用数据d1进行了机器学习的学习完毕模型m1的性能进行评价的步骤。第二评价步骤st2是基于第一评价步骤st1中的评价和数据扩展处理的参数的能取范围来评价参数的步骤。更新步骤st3是基于第二评价步骤st2中的评价来更新参数的步骤。数据生成步骤st4是通过基于在更新步骤st3中进行了更新的参数的数据扩展处理来生成学习用数据d1的步骤。在上述实施方式中,数据生成步骤st4的执行主体是数据生成部4。
[0077]
一个方式所涉及的学习完毕模型m1的生成方法具有第一评价步骤st1、第二评价步骤st2、更新步骤st3、数据生成步骤st4以及模型生成步骤st5。第一评价步骤st1是对使用通过数据扩展处理生成的学习用数据d1进行了机器学习的学习完毕模型m1的性能进行评价的步骤。第二评价步骤st2是基于第一评价步骤st1中的评价和数据扩展处理的参数的能取范围来评价参数的步骤。更新步骤st3是基于第二评价步骤st2中的评价来更新参数的步骤。数据生成步骤st4是通过基于在更新步骤st3中进行了更新的参数的数据扩展处理来生成学习用数据d1的步骤。模型生成步骤st5是通过使用在数据生成步骤st4中生成的学习用数据d1进行机器学习来生成学习完毕模型m1的步骤。在上述的实施方式中,模型生成步骤st5的执行主体是模型生成部5。
[0078]
以下,列举上述的实施方式的变形例。以下说明的变形例能够适当组合应用。
[0079]
本公开中的模型生成系统100例如在第一评价部1、第二评价部2、更新部3、数据生成部4以及模型生成部5等中包括计算机系统。计算机系统将作为硬件的处理器以及存储器设为主要结构。通过由处理器执行记录在计算机系统的存储器中的程序,实现作为本公开中的模型生成系统100的功能。程序可以预先记录在计算机系统的存储器中,也可以通过电气通信线路来提供,也可以记录在计算机系统可读取的存储卡、光盘、硬盘驱动器等非暂时性记录介质中来提供。计算机系统的处理器由包括半导体集成电路(ic)或者大规模集成电路(lsi)的1个或者多个电子电路构成。这里所说的ic或者lsi等集成电路根据集成的程度而称呼不同,包括系统lsi、vlsi(very large scale integration,超大规模集成电路),或者ulsi(ultra large scale integration,巨大规模集成电路)的集成电路。进而,对于lsi的制造后编程的fpga(field-programmable gate array)、或者lsi内部的接合关系的重构或lsi内部的电路分区的可重构的逻辑设备,也能够作为处理器而采用。多个电子电路可以汇集于1个芯片,也可以分散设置于多个芯片。多个芯片既可以集中在1个装置中,也可以分散设置在多个装置中。这里所说的计算机系统包括具有1个以上的处理器以及1个以上的存储器的微控制器。因此,微控制器也由包括半导体集成电路或者大规模集成电路在内的1个或者多个电子电路构成。
[0080]
此外,模型生成系统100中的多个功能汇集在1个框体内是模型生成系统100所必须的结构,模型生成系统100的结构要素也可以分散设置在多个框体中。进而,模型生成系统100的至少一部分的功能也可以通过云(云计算)等来实现。
[0081]
在上述的实施方式中,评价系统10也可以构成为,即使第一评价部1中的评价不达到目标,如果收敛于固定值,则停止动作,换言之,也可以构成为停止第一评价部1以及第二
评价部2。换言之,在本实施方式的学习用数据d1的评价方法中,也可以在第一评价步骤st1中的评价收敛为固定值时,停止第一评价步骤st1以及第二评价步骤st2。
[0082]
在上述的实施方式中,第一评价部1将在学习完毕模型m1中输入了全部的评价用数据d2的情况下的识别率评价为学习完毕模型m1的性能,但不限于此。例如,第一评价部1也可以针对输入到学习完毕模型m1的多个评价用数据d2的每一个,评价学习完毕模型m1的性能。换言之,在本实施方式的学习用数据d1的评价方法中,第一评价步骤st1也可以针对输入到学习完毕模型m1的多个评价用数据d2的每一个,评价学习完毕模型m1的性能。
[0083]
在该方式中,第二评价部2通过更新存储于存储部6的以下的表2所示的q表的各单元(场)的状态行动价值(q值),来评价数据扩展处理的参数。在表2所示的例子中,q表的全部的单元的q值为初始值(零)。在此,为了简化说明,假设多个评价用数据d2仅为第一评价用数据以及第二评价用数据这两个。
[0084]
[表2]
[0085] y11 y11-y12 v12-y21 y21-y22 y22-x10、x2000000000x10、x2100000000x11、x2000000000x11、x2100000000
[0086]
在表2所示的例子中,“x10,x20”、“x10,x21”“x11,x20”、“x11,x21”分别表示状态。“x10”表示学习完毕模型m1相对于第一评价用数据的识别正确,“x11”表示学习完毕模型m1相对于第一评价用数据的识别错误。此外,“x20”表示学习完毕模型m1相对于第二评价用数据的识别正确,“x21”表示学习完毕模型m1相对于第二评价用数据的识别错误。换句话说,在该方式中,如果将多个评价用数据d2的数量设为“n(n是自然数)”,则q表中的状态的数量为“2
n”。
[0087]
在该方式中,针对多个评价用数据d2的每一个评价学习完毕模型m1的性能,因此与上述的实施方式相比,具有更容易生成能够有助于模型的识别率的提高的学习用数据d1这样的优点。
[0088]
在上述的实施方式中,第二评价部2也可以基于与预处理有关的预处理参数来评价数据扩展处理的参数。预处理是在使用学习用数据d1进行机器学习的过程中对学习用数据d1(在此为图像数据)执行的处理。作为一例,在预处理中包括去除白噪声等平滑处理。换言之,在本实施方式的学习用数据d1的评价方法中,第二评价步骤st2也可以基于预处理来评价(数据扩展处理的)参数。
[0089]
例如,在数据扩展处理中包括对图像数据加上白噪声的处理的情况下,如果在预处理中去除白噪声,则存在数据扩展处理被无效化的可能性。在这样的情况下,如果如上述那样基于预处理参数来评价数据扩展处理的参数,则在数据扩展处理中不选择增加白噪声这样的行动,具有容易避免数据扩展处理的无效化这样的优点。
[0090]
在上述的实施方式中,在表1所示的q表的例子中,状态数为5个(“x1”~“x5”),但也可以小于5个,还可以是多个。此外,在表1所示的例子中,数据扩展处理的参数的种类的数量是2个(第一参数以及第二参数),但也可以是1个,还可以是多个。
[0091]
在上述的实施方式中,第二评价部2通过更新q表的各单元的q值,来评价数据扩展
处理的参数,但不限于此。例如,第二评价部2也可以通过更新状态价值函数或者状态行动价值函数代替q表,来评价数据扩展处理的参数。在此,状态价值函数是定义处于某个状态的价值的函数。此外,状态行动价值函数是定义在某个状态下选择某个行动的价值的函数。此外,例如,第二评价部2也可以通过使用dqn(deep q network)代替q表,来评价数据扩展处理的参数。这些方式在状态的种类与行动的种类的组合的数量庞大的情况下是有效的。
[0092]
在上述的实施方式中,第一评价部1也可以代替识别率而通过损失来评价学习完毕模型m1的性能。本公开中所说的“损失”是指将评价用数据d2输入到学习完毕模型m1的情况下的评价用数据d2的标签与学习完毕模型m1的推断结果的偏差的程度。假设例如在将包括具有溅射b4的焊道b1的图像数据在内的评价用数据d2输入到学习完毕模型m1的情况下,学习完毕模型m1以80%的概率将焊道b1具有溅射b4这样的推断结果输出。在这种情况下,第一评价部1将针对该评价用数据d2的学习完毕模型m1的损失评价为20%(=100%-80%)。在该方式中,更新部3只要更新数据扩展处理的参数以使得学习完毕模型m1的损失最小化即可。
[0093]
在上述的实施方式中,模型生成系统100在每次由更新部3更新数据扩展处理的参数时,丢弃更新前的学习完毕模型m1而重新生成学习完毕模型m1。然而,在该方式中,直到机器学习完成为止所需的时间容易变长。
[0094]
因此,模型生成系统100也可以在每次由更新部3更新数据扩展处理的参数时,将更新前的学习完毕模型m1存储于存储部6,再学习更新前的学习完毕模型m1。在该方式中,在第一评价部1中学习完毕模型m1的识别率降低的情况下,丢弃该学习完毕模型m1,使用存储于存储部6的学习完毕模型m1进行再学习即可。在该方式中,与每次更新数据扩展处理的参数而另行新生成学习完毕模型m1的情况相比,具有容易缩短直到机器学习完成为止所需的时间的优点。
[0095]
在上述的实施方式中,学习用数据d1通过对合格品的焊道b1的图像数据附加表示不合格品的特征的附加图像d11而生成,但不限于此。例如,学习用数据d1也可以通过对不合格品的焊道b1的图像数据变更表示不合格品的特征的部位来生成。此外,学习用数据d1也可以通过从不合格品的焊道b1的图像数据中去除表示不合格品的特征的部位来生成。
[0096]
在上述的实施方式中,学习完毕模型m1用于检查焊道b1是否为合格品、换言之是否正确地进行了焊接的焊接外观检查,但不限于此。换句话说,评价系统10只要是能够评价数据扩展处理的参数的方式,则与学习完毕模型m1的用途无关。
[0097]
在上述的实施方式中,第一评价部1将在学习完毕模型m1中输入了全部的评价用数据d2的情况下的识别率评价为学习完毕模型m1的性能,但不限于此。以下,对这一点详细地进行说明。
[0098]
如上述的实施方式那样,进行数据扩展处理的情况是评价用数据d2少的情况,本来绝大多数仅集中评价用数据d2。在该情况下,即使使数据扩展处理的参数稍微变动,学习完毕模型m1的识别率也不变化,或者即使变化,变化量也小。因此,无论使参数的上限值或者下限值如何变化,第二评价部2中的评价也不会变化,或者即使变化,变化量也小,因此可能产生强化学习等的学习难以进展的问题。
[0099]
因此,在上述的实施方式中,在学习完毕模型m1的识别率相同的情况下(或者为相同程度的情况下),也可以通过第二评价部2进行评价,使得参数的能取范围越宽,则越成为
越高的评价。具体而言,第二评价部2通过学习完毕模型m1的识别率和通过数据扩展处理而生成的数据的多样性(换言之,参数的多样性)来进行评价。即,第二评价部2的评价用以下的式(1)表示。在式(1)中,“e1”表示第二评价部2的评价,“r1”表示学习完毕模型m1的识别率,“pd1,pd2,...,pd
n”(“n”表示自然数)表示各参数的多样性。此外,在式(1)中,“γ1,γ2,...,γ
n”是学习完毕模型m1的识别率与参数的多样性的相关系数,作为一例,能够取0.01~0.001的值。
[0100]
[式1]
[0101]
e1=r1 γ11pd1 γ2pd2

γnpdn…
(1)
[0102]
在此,例如第k参数(“k”是“n”以下的自然数)是表示进行数据扩展处理时的放大率的值,假设其上限值、下限值分别为“pk_max”、“pk_min”。在这种情况下,第k参数的多样性pdk用“pdk=pk_max/p
k_
min”这样的式子表示。另外,即使在第k参数是表示在进行数据扩展处理时作为噪声而追加的粒的尺寸的值、且其上限值、下限值分别为“pk_max”、“pk_min”的情况下,也能够通过上述式来表示该参数的多样性pdk。在此,例如第k参数(“k”是“n”以下的自然数)是表示进行数据扩展处理时的放大率的值,假设其方差为“σ”。在这种情况下,第k参数的多样性pdk用“pdk=σ”这样的式子表示。方差是一例,也可以是表示其他分布的多样性的统计值。
[0103]
此外,例如第k参数是表示进行数据扩展处理时的旋转角的值,假设其上限值、下限值分别为“pk_max”、“pk_min”。在这种情况下,第k参数的多样性pdk用“pdk=|pkmax-pk_min|”这样的式子表示。另外,即使在第k参数是表示进行数据扩展处理时的平行移动的偏移量的值、且其上限值、下限值分别为“pk_max”、“pk_min”的情况下,也能够用上述的式子表示该参数的多样性pdk。
[0104]
此外,在通过强化学习进行学习的情况下,在参数的多样性增加的情况下作为正的报酬,在参数的多样性减少的情况下成为负的报酬。例如,将学习完毕模型m1的识别率提高的情况下的报酬设为 1,将下降的情况下的报酬设为-1,将识别率未变化但参数的多样性增加的情况下的报酬设为 0.2,将识别率未变化但参数的多样性减少的情况下的报酬设为-0.2。
[0105]
如上所述,第二评价部2也可以根据学习完毕模型m1的识别率和通过数据扩展处理生成的数据的多样性(换言之,参数的多样性),进行数据扩展处理的参数的评价。在该方式中,具有即使在评价用数据d2少的情况下也容易实现参数的最佳化这样的优点。特别是,参数的多样性越高,则越提高参数的评价,参数的多样性越低,则越降低参数的评价,由此评价生成与评价用数据d2不相似的学习用数据d1,因此具有容易生成泛化性能高的学习完毕模型m1这样的优点。
[0106]
(总结)
[0107]
如上所述,第一方式所涉及的学习用数据的评价方法具有第一评价步骤(st1)和第二评价步骤(st2)。第一评价步骤(st1)是对使用通过数据扩展处理生成的学习用数据(d1)进行了机器学习的学习完毕模型(m1)的性能进行评价的步骤。第二评价步骤(st2)是基于第一评价步骤(st1)中的评价和数据扩展处理的参数的能取范围来评价参数的步骤。
[0108]
根据该方式,具有容易生成能够有助于模型的识别率的提高的学习用数据(d1)这样的优点。
[0109]
第二方式相关的学习用数据的评价方法在第一方式中,在第一评价步骤(st1)中的性能的评价越高则第二评价步骤(st2)中的评价越高。在第二评价步骤(st2)中的评价中,参数的能取范围越宽,则评价越高。
[0110]
根据该方式,具有如下优点:即使在输入到学习完毕模型(m1)的评价用数据(d2)的数量少的情况下,也容易实现参数的最佳化。
[0111]
第三方式所涉及的学习用数据的评价方法在第一或者第二方式中,还具有更新步骤(st3)、存储步骤以及比较步骤。更新步骤(st3)是基于第二评价步骤(st2)中的评价来更新参数的步骤。存储步骤是在执行更新步骤(st3)之前存储学习完毕模型(m1)的步骤。比较步骤是将执行更新步骤(st3)后的学习完毕模型(m1)与在存储步骤中存储的学习完毕模型(m1)进行比较的步骤。
[0112]
根据该方式,与在每次更新参数时另外重新生成学习完毕模型(m1)的情况相比,具有容易缩短直到完成机器学习为止所需的时间的优点。
[0113]
在第四方式所涉及的学习用数据的评价方法中,在第一~第三中的任一方式中,学习用数据(d1)通过对包括学习完毕模型(m1)的识别对象在内的图像数据(d10)追加基于参数的附加图像(d11)而生成。
[0114]
根据该方式,具有能够使用现有的学习用数据(d1)中不存在的种类的学习用数据(d1)对模型进行机器学习这样的优点。
[0115]
在第五方式所涉及的学习用数据的评价方法中,在第一~第四中的任一方式中,当第一评价步骤(st1)中的评价达到目标时,停止第一评价步骤(st1)以及第二评价步骤(st2)。
[0116]
根据该方式,具有即使学习完毕模型(m1)的性能达到目标,也容易防止因持续学习而导致的过度学习这样的优点。
[0117]
在第六方式所涉及的学习用数据的评价方法中,在第一~第四中的任一方式中,当第一评价步骤(st1)中的评价收敛为固定值时,停止第一评价步骤(st1)以及第二评价步骤(st2)。
[0118]
根据该方式,具有即使学习完毕模型(m1)的性能饱和也容易防止因持续学习而导致的过度学习这样的优点。
[0119]
在第七方式所涉及的学习用数据的评价方法中,在第一~第六中的任一方式中,第一评价步骤(st1)针对输入到学习完毕模型(m1)的多个评价用数据(d2)的每一个,评价学习完毕模型(m1)的性能。
[0120]
根据该方式,具有更容易生成能够有助于模型的识别率的提高的学习用数据(d1)这样的优点。
[0121]
在第八方式所涉及的学习用数据的评价方法中,在第一~第七中的任一方式中,第二评价步骤(st2)基于与预处理有关的预处理参数来评价参数。预处理是在使用学习用数据(d1)进行机器学习的过程中对学习用数据(d1)执行的处理。
[0122]
根据该方式,具有容易避免基于预处理的数据扩展处理的无效化这样的优点。
[0123]
第九方式所涉及的程序使1个以上的处理器执行第一~第八中的任一个方式的学习用数据的评价方法。
[0124]
根据该方式,具有容易生成能够有助于模型的识别率的提高的学习用数据(d1)这
样的优点。
[0125]
第十方式所涉及的学习用数据的生成方法具有第一评价步骤(st1)、第二评价步骤(st2)、更新步骤(st3)以及数据生成步骤(st4)。第一评价步骤(st1)是对使用通过数据扩展处理生成的学习用数据(d1)进行了机器学习的学习完毕模型(m1)的性能进行评价的步骤。第二评价步骤(st2)是基于第一评价步骤(st1)中的评价和数据扩展处理的参数的能取范围来评价参数的步骤。更新步骤(st3)是基于第二评价步骤(st2)中的评价来更新参数的步骤。数据生成步骤(st4)是通过基于在更新步骤(st3)中进行了更新的参数的数据扩展处理来生成学习用数据(d1)的步骤。
[0126]
根据该方式,具有容易生成能够有助于模型的识别率的提高的学习用数据(d1)这样的优点。
[0127]
第十一方式所涉及的学习完毕模型的生成方法具有第一评价步骤(st1)、第二评价步骤(st2)、更新步骤(st3)、数据生成步骤(st4)以及模型生成步骤(st5)。第一评价步骤(st1)是对使用通过数据扩展处理生成的学习用数据(d1)进行了机器学习的学习完毕模型(m1)的性能进行评价的步骤。第二评价步骤(st2)是基于第一评价步骤(st1)中的评价和数据扩展处理的参数的能取范围来评价参数的步骤。更新步骤(st3)是基于第二评价步骤(st2)中的评价来更新参数的步骤。数据生成步骤(st4)是通过基于在更新步骤(st3)中进行了更新的参数的数据扩展处理来生成学习用数据(d1)的步骤。模型生成步骤(st5)是通过使用在数据生成步骤(st4)中生成的学习用数据(d1)进行机器学习来生成学习完毕模型(m1)的步骤。
[0128]
根据该方式,具有容易生成具有所希望的识别率的学习完毕模型(m1)这样的优点。
[0129]
第十二方式所涉及的学习用数据的评价系统(10)具备第一评价部(1)和第二评价部(2)。第一评价部(1)对使用通过数据扩展处理生成的学习用数据(d1)进行了机器学习的学习完毕模型(m1)的性能进行评价。第二评价部(2)基于第一评价部(1)中的评价和数据扩展处理的参数的能取范围来评价参数。
[0130]
根据该方式,具有容易生成能够有助于模型的识别率的提高的学习用数据(d1)这样的优点。
[0131]
关于第二~第八方式所涉及的方法,不是学习用数据的评价方法所必须的方法,可以适当省略。
[0132]
产业上的可利用性
[0133]
根据本公开所涉及的学习用数据的评价方法、程序、学习用数据的生成方法、学习完毕模型的生成方法、以及学习用数据的评价系统,具有容易生成能够有助于模型的识别率的提高的学习用数据这样的优点。因此,本公开所涉及的发明有助于不合格品分析等的效率化,在产业上是有用的。
[0134]-符号说明-[0135]
10
ꢀꢀ
评价系统
[0136]1ꢀꢀꢀ
第一评价部
[0137]2ꢀꢀꢀ
第二评价部
[0138]
st1 第一评价步骤
[0139]
st2 第二评价步骤
[0140]
st3 更新步骤
[0141]
st4 数据生成步骤
[0142]
st5 模型生成步骤
[0143]
d1
ꢀꢀ
学习用数据
[0144]
d11 附加图像
[0145]
d2
ꢀꢀ
评价用数据
[0146]
m1
ꢀꢀ
学习完毕模型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献