一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

分析装置、控制方法和程序与流程

2022-06-09 01:36:13 来源:中国专利 TAG:


1.本发明涉及数据分析。


背景技术:

2.已开发一种用于分析公司业务内容的系统。例如,专利文献1公开了一种通过测试来确定产品中有无异常的装置。更具体而言,专利文献1的装置通过针对表示产品最终品质特性的变量进行目标值与实际值的比较测试来确定有无异常。然后,在最终品质特性包括异常的情况下,专利文献1的装置还通过针对与最终品质特性相关联的其他变量进行目标值与实际值的比较测试来确定有无异常。
3.现有技术文献
4.专利文献
5.[ptl1]日本专利申请公开no.2019-36061


技术实现要素:

[0006]
技术问题
[0007]
专利文献1的前提是预先知道表示适当变量的值的目标值。因此,ptl1中的装置不一定用于确定变量的目标值。
[0008]
考虑到上述问题构思了本发明,本发明的目的之一是提供一种便于识别可能影响结果的因素的适当值的技术。
[0009]
问题的解决方案
[0010]
根据本发明的分析装置,包括:(1)获取单元,获取对象数据的集合和划分数量信息,每个对象数据指示因素数据和结果数据的对,因素数据是与因素相关的值,结果数据是与结果相关的值,划分数量信息指示用于划分因素数据的数值范围的数量;(2)计算单元,针对多个边界值的每个边界值计算测试统计量,多个边界值用于将数值范围划分成数量,测试统计量表示与要通过在边界值将包括在对象数据的集合中的对象数据划分成两个部分而获取的两个样本的结果数据相关的差异;以及(3)生成单元,生成测试统计量信息,测试统计量信息指示针对每个边界值计算的多个测试统计量。
[0011]
根据本发明的控制方法通过计算机来执行。控制方法包括:(1)获取单元,获取对象数据的集合和划分数量信息,每个对象数据指示因素数据和结果数据的对,因素数据是与因素相关的值,结果数据是与结果相关的值,划分数量信息指示用于划分因素数据的数值范围的数量;(2)计算单元,针对多个边界值的每个边界值计算测试统计量,多个边界值用于将数值范围划分成数量,测试统计量表示与要通过在边界值将包括在对象数据的集合中的对象数据划分成两个部分而获取的两个样本的结果数据相关的差异;以及(3)生成单元,生成测试统计量信息,测试统计量信息指示针对每个边界值计算的多个测试统计量。
[0012]
根据本发明的程序使得计算机执行根据本发明的控制方法。
[0013]
发明的有益效果
[0014]
提供了便于识别可能影响结果的因素的适当值的技术。
附图说明
[0015]
图1是示出本示例性实施例的分析装置的概况的示意图。
[0016]
图2是概念性示出计算针对每个样本对的测试统计量的处理的示意图。
[0017]
图3是示出根据示例性实施例1的分析装置的功能配置的示意图。
[0018]
图4是示出用于实现分析装置的计算机的示意图。
[0019]
图5是示出分析装置的使用环境的示意图。
[0020]
图6是示出要通过根据示例性实施例1的分析装置进行的处理流程的流程图。
[0021]
图7是示出要实现为表格的测试统计量信息的示意图。
[0022]
图8是示出要实现为测试统计量图的测试统计量信息的示意图。
[0023]
图9是示出要提供给用户的画面的示意图。
[0024]
图10是示出包括直方图和测试统计量信息的画面的示意图。
[0025]
图11是示出包括时序图、直方图和测试统计量图的画面的示意图。
[0026]
图12是示出根据变型例的分析装置2000中的第一样本和第二样本的示意图。
[0027]
图13是示出使用两个边界值的对将对象数据集合10划分成两个样本的另一个方法的示意图。
[0028]
图14是示出要通过根据变型例的分析装置2000输出的信息的示意图。
具体实施方式
[0029]
下面使用附图来描述本发明的示例性实施例。注意,在所有附图中,用相似的附图标记指示相似的构成元件,并视情况省略其描述。此外,在每个方框图中,每个块表示基于功能的配置而非基于硬件的配置,除非特别描述。
[0030]
[示例性实施例1]
[0031]
《概况》
[0032]
图1是示出本示例性实施例的分析装置2000的概况的示意图。注意,图1是为了便于理解分析装置2000的说明图,分析装置2000的功能并不限于图1所示的功能。
[0033]
分析装置2000获取作为多个对象数据20的集合的对象数据集合10。对象数据20是其中因素值(因素数据22)与结果值(结果数据24)相互关联的数据。例如,在制造产品时,特定材料的含量会影响产品的质量。有鉴于此,构思对指示特定材料的含量(作为因素数据22)以及指示产品是否为缺陷产品(作为结果数据24)的标志进行处理。
[0034]
分析装置2000通过多个不同模式将每个对象数据20划分成两部分,对每个模式计算测试统计量,测试统计量表示要通过划分成两部分来获取的两个集合(样本)之间的差异。为此,分析装置2000进一步获取划分数量信息30。划分数量信息30指示表示将因素数据22的数值范围划分成的数量(以下称为划分数量)。
[0035]
分析装置2000计算用于将因素数据22的数值范围划分成划分数量信息30所指示的划分数量的每个边界值。例如,假设因素数据22的数值范围为从0到100,且划分数量为4。将数值范围等分成四部分的边界值是25、50和75。因此,这三个边界值由分析装置2000来确定。
[0036]
分析装置2000对确定的多个边界值的每个边界值进行以下处理。首先,分析装置2000以边界值作为边界,将对象数据集合10划分成两个集合(以下称为第一样本和第二样本)。因此,获取第一样本和第二样本的对(以下称为样本对),对数量等于划分数量。
[0037]
此外,针对每个边界值,分析装置2000针对基于边界值的划分所获取的样本对,计算表示与结果数据24有关的差异的测试统计量。例如,假设结果数据24为缺陷标志。在这种情况下,例如,分析装置2000计算测试统计量,测试统计量表示第一样本中产品的缺陷率(缺陷产品相对产品总数的比率)与第二样本中产品的缺陷率之间的差异。
[0038]
图2是概念性示出计算针对每个样本对的测试统计量的处理的示意图。图2中的图在横轴上指示因素数据22的值,在纵轴上指示结果数据24的值。结果数据24指示缺陷率。在本示例中,划分数量为4。因此,计算三个边界值b1、b2和b3。注意,横轴上的min和max分别是因素数据22的数值范围的上限和下限。
[0039]
分析装置2000通过使用边界值b1将对象数据集合10划分成第一样本和第二样本,第一样本包括其中一个因素数据22等于或小于bl的对象数据20,第二样本包括其中一个因素数据22大于bl的对象数据20。然后,分析装置2000计算表示与第一样本和第二样本的结果数据24相关的差异的测试统计量,作为与边界值b1相关联的测试统计量。例如,在结果数据24指示产品是否为缺陷产品的情况下,构思计算第一样本和第二样本的每个样本的缺陷率,并计算表示计算的缺陷率之间的差异的测试统计量。同样地,分析装置2000还计算表示与要通过使用边界值b2获取的第一样本和第二样本的结果数据24相关的差异的测试统计量,以及要通过使用边界值b3获取的第一样本和第二样本的结果数据24相关的差异的缺陷率的差异的测试统计量。
[0040]
分析装置2000生成指示多个计算的测试统计量的测试统计量信息。例如,测试统计量信息是指示边界值与以边界值作为参考进行划分所获得的样本对之间的相关性的图表。在图1中,生成在横轴上指示边界值、在纵轴上指示在边界值处计算的测试统计量的线图,作为测试统计量信息40。
[0041]
《有利效果的一个示例》
[0042]
在根据本示例性实施例的分析装置2000中,通过多个模式进行“基于一个因素数据22的值来将对象数据集10划分成两个样本,并计算表示与这两个样本的结果数据24相关的差异的测试统计量”的处理,每个模式使用不同的边界值。然后,将表示针对多个模式的每个模式获取的测试统计量的测试统计量信息40输出。查看如上所述测试统计量信息40的用户可以容易地识别“一个因素数据22的什么值适合于获取良好结果”。具体而言,分析装置2000能够准确且容易地识别,在相对于结果数据24的关系方面一条因素数据22的什么值是合适的。
[0043]
在此,需要先进的统计知识来适当地进行数据分析。因此,当具有这种知识的专家之外的人员试图进行数据分析时,可能需要大量的时间,或者可能在分析中出现错误。就此而言,分析装置2000自动进行将数据划分成多个模式的处理,以及计算每个模式的测试统计量的处理,因此,甚至不具备高级统计知识的人员(例如公司中的业务人员等)也可以准确且容易地识别可能影响结果数据24的因素数据22的适当值。
[0044]
下面进一步详细描述本示例性实施例。
[0045]
《功能配置示例》
[0046]
图3是示出根据示例性实施例1的分析装置2000的功能配置的示意图。分析装置2000包括获取单元2020、计算单元2040和生成单元2060。获取单元2020获取对象数据集合10和划分数量信息30。计算单元2040计算多个边界值,其用于将因素数据22的数值范围划分成划分数量信息30指示的划分数量。此外,对于多个边界值的每个边界值而言,计算单元2040计算测试统计量,测试统计量表示与要通过在边界值将对象数据集合10划分成两部分来获取的第一样本和第二样本的结果数据24相关的差异。生成单元2060生成测试统计量信息,测试统计量信息指示多个计算的测试统计量。
[0047]
《分析装置2000的硬件配置示例》
[0048]
分析装置2000的每个功能配置单元可通过用于实现每个功能构成单元的硬件(示例:硬接线电子电路等)来实现,也可通过硬件与软件的组合来实现(示例:电子电路与控制电子电路的程序的组合等)。下面进一步描述通过硬件与软件的组合来实现分析装置2000的每个功能配置单元的情况。
[0049]
图4是示出用于实现分析装置2000的计算机1000的示意图。计算机1000是任意计算机。例如,计算机1000是诸如个人计算机(pc)和服务器机器的固定计算机。除此之外,例如,计算机1000是诸如智能手机或平板终端的便携式计算机。
[0050]
计算机1000可以是为实现分析装置2000而设计的专用计算机,也可以是通用计算机。在后一种情况下,例如,通过在计算机1000中安装预定应用,计算机1000实现分析装置2000的每个功能。上述应用被配置为实现分析装置2000的功能配置单元的程序。
[0051]
计算机1000包括总线1020、处理器1040、存储器1060、存储设备1080、输入/输出接口1100和网络接口1120。总线1020是处理器1040、存储器1060、存储设备1080、输入/输出接口1100和网络接口1120相互发送和接收数据的数据传输路径。但是,将处理器1040等相互连接的方法并不限于总线连接。
[0052]
处理器1040是诸如中央处理单元(cpu)、图形处理单元(gpu)和现场可编程门阵列(fpga)的各种处理器。存储器1060是使用随机存取存储器(ram)等实现的主存储装置。存储设备1080是使用硬盘、固态驱动器(ssd)、存储卡、只读存储器(rom)等实现的辅助存储装置。
[0053]
输入/输出接口1100是将计算机1000连接到输入/输出设备的接口。例如,将输入/输出接口1100连接到诸如键盘的输入装置和诸如显示装置的输出装置。
[0054]
网络接口1120是将计算机1000连接到通信网络的接口。通信网络例如是局域网(lan)或广域网(wan)。
[0055]
存储设备1080存储用于实现分析装置2000的每个功能配置单元的程序(实现上述应用的程序)。处理器1040通过将程序读取到存储器1060中并执行程序来实现分析装置2000的每个功能配置单元。
[0056]
《分析装置2000的使用环境的示例》
[0057]
为了便于理解分析装置2000,描述分析装置2000的使用环境的一个示例。图5是示出分析装置2000的使用环境的示意图。
[0058]
在图5中,分析装置2000经由网络连接到用户终端60。用户操作用户终端60,并向分析装置2000传输请求,使得能够提供关于对象数据集合10的测试统计量信息40。例如,请求包括表示与对象数据集合10相关的条件的信息和划分数量信息30。分析装置2000获取与
请求中指示的条件相关联的对象数据集合10,并通过使用对象数据集合10和划分数量信息30来进行测试统计量信息40的生成。然后,分析装置2000将生成的测试统计量信息40发送到用户终端60。
[0059]
例如,分析装置2000向用户终端60提供包括测试统计量信息40的画面数据(例如网页)。在这种情况下,用户终端60通过浏览器显示接收的网页。通过这样做,用户可以浏览测试统计量信息40。
[0060]
分析装置2000的使用环境并不限于图4所示。例如,分析装置2000可通过用户直接操作,而非经由用户终端60使用。
[0061]
《处理流程》
[0062]
图6是示出要通过根据示例性实施例1的分析装置2000进行的处理流程的流程图。获取单元2020获取对象数据集合10(s102)。获取单元2020获取划分数量信息30(s104)。计算单元2040计算用于将因素数据22的数值范围划分成划分数量信息30指示的划分数量的多个边界值(s106)。
[0063]
s108至s114是要针对每个边界值进行的循环处理a。在s108中,计算单元2040确定是否已经对作为对象的所有边界值进行循环处理a。在已经对作为对象的所有边界值进行循环处理a的情况下,图6中的处理进行到s116。另一方面,在存在作为对象尚未进行循环处理a的边界值的情况下,计算单元2040选择其中一个边界值。然后,图6中的处理进行到s110。注意,在此选择的边界值称为边界值i。
[0064]
计算单元2040通过在边界值i将对象数据集合10划分成两部分来生成第一样本和第二样本(s110)。计算单元2040计算与第一样本和第二样本的结果数据24相关的测试统计量(s112)。因为s114是循环处理a的终止,所以图6中的处理进行到s108。
[0065]
在循环处理a之后,生成单元2060针对多个计算的测试统计量生成测试统计量信息40(s116)。生成单元2060将测试统计量信息40输出(s118)。
[0066]
《关于对象数据集合10》
[0067]
对象数据集合10是包括多个对象数据20的集合,其每个是因素数据22和结果数据24的对。每条对象数据20例如针对分别在不同的时间进行相同处理或相同操作的每种情况来指示数据。例如,如上所述,假设对象数据20指示特定材料的含量,以及通过使用包含含量的材料制造的产品对于因素数据22和结果数据24的每个数据而言是否为缺陷产品。在这种情况下,例如对于分别在不同时间制造的产品而言,每条对象数据20指示具有上述特性并且在此时制造的产品中使用的材料的含量以及产品是否为缺陷产品。
[0068]
在此,可将用于学习根据多个说明变量的值估计目的变量的值的估计模型的学习数据用作对象数据20。例如,假设生成这样的估计模型:基于与表示产品制造条件的指标高一个级别的每个指标来估计与制造条件中的要生成的产品相关的指标。在这种情况下,表示制造条件的每个指标表示说明指标,而与制造的产品相关的指标表示目的变量。表示制造条件的指标例如是诸如温度和湿度的环境条件、每种材料的含量等。与产品相关的指标例如是表示产品是否为缺陷产品的标志、表示与产品相关的特定性能的指标等。
[0069]
可以分别上述说明变量的值和目的变量的值,作为因素数据22和结果数据24。有鉴于此,例如,可将在这种估计模型的生成中要使用的学习数据用作对象数据20。
[0070]
获取单元2020获取对象数据集合10(s102)。有各种通过获取单元2020获取对象数
据集合10的方法。例如,获取单元2020从存储对象数据集合10的存储装置中获取对象数据集合10。除此之外,例如,获取单元2020可通过接收从另一个装置发送的对象数据集合10来获取对象数据集合10。
[0071]
在此,在存储装置中存储多个对象数据集合10的情况下,获取单元2020确定要从其生成测试统计量信息40的对象数据集合10,并从存储装置获取所确定的对象数据集合10。在这种情况下,例如,获取单元2020获取与要获取的对象数据集合10相关的条件,并获取与条件匹配的对象数据集合10。
[0072]
与对象数据集合10相关的条件例如是诸如对象数据集合10的识别信息(例如名称)、获取对象数据集合10的时间段、与对象数据集合10相关的地点(例如,有关的产品的制造地点等)等。在此,在将对象数据集合10用于生成估计模型的情况下,可将使用对象数据集合10生成的估计模型的识别信息用作对象数据集合10的识别信息。表示与对象数据集合10相关的这些条件的信息例如包括在要从上述用户终端60发送的请求中。
[0073]
注意,存储在存储装置中的对象数据20不一定以对象数据集合10为单位进行划分。在这种情况下,例如,获取单元2020获取与包括在对象数据集合10中的对象数据20相关的条件,并从存储装置中获取符合条件的对象数据20。然后,获取单元2020对所获取的对象数据20的群组进行处理,作为对象数据集合10。与对象数据20相关的条件例如是获取对象数据20的时间段、与对象数据20相关的地点(例如产品的制造地点)等。
[0074]
除此之外,例如,在生成测试统计量信息40之前已经进行使用对象数据集合10的另一个处理的情况下,分析装置2000可通过接管来自如上所述的另一个处理的对象数据集合10来获取对象数据集合10。例如,将通过对象数据集合10生成估计模型的处理、使用图等将对象数据集合10可视化的处理等视为使用对象数据集合10的另一个处理。
[0075]
例如,在表示处理结果的画面上提供请求生成与处理中使用的对象数据集合10相关的测试统计量信息40的界面(例如按钮)。分析装置2000响应于使用界面的请求,生成并输出测试统计量信息40。因此,对于在生成估计模型时使用的对象数据集合10或可视化的对象数据集合10,用户可以容易地获取所谓“测试统计量信息40”的信息,从另一个角度来讲,通过分析对象数据集合10来获取该信息。
[0076]
注意,在进行诸如生成估计模型的处理的装置不同于分析装置2000的情况下,对象数据集合10的识别信息和对象数据集合10本身都包括在来自该装置的请求中。因此,分析装置2000可以获取对象数据集合10。
[0077]
注意,在对象数据20中包括多个因素的每个因素的数据的情况下,必须确定将哪个因素作为对象来将对象数据集合10划分成样本(具体而言,要处理因素的哪个数据来作为因素数据22)。确定方法是可选的。例如,获取单元2020从用户接受输入,该输入指定要处理因素的哪个数据来作为因素数据22。除此之外,例如,在对象数据集合10是从如上所述的另一个处理接管的情况下,可对在另一个处理中作为对象的因素的数据进行处理,作为因素数据22。例如,在对象数据集合10是从将某个因素的数据可视化的处理中接管的情况下,可对因素的可视化数据进行处理,作为因素数据22。
[0078]
《获取划分数量信息30:s104》
[0079]
获取单元2020获取划分数量信息30(s104)。有各种通过获取单元2020获取划分数量信息30的方法。例如,获取单元2020获取存储在存储装置中的划分数量信息30。除此之
外,例如,获取单元2020可通过接受用户输入划分数量的操作来获取划分数量信息30。除此之外,例如,获取单元2020可通过接收从另一个装置传输的划分数量信息30来获取它。在这种情况下,例如,划分数量信息30包括在要从上述用户终端60传输的请求中。
[0080]
《计算边界值:s106》
[0081]
计算单元2040计算多个边界值(s106),边界值用于将因素数据22的数值范围划分成划分数量信息30所指示的划分数量。有鉴于此,计算单元2040确定因素数据22的数值范围。例如,计算单元2040对于其中将包括在对象数据集合10中的因素数据22的最小值设置为下限并将包括在对象数据集合10中的因素数据22的最大值设置为上限的数值范围进行处理,作为因素数据22的数值范围。
[0082]
除此之外,例如,计算单元2040可以在消除包括在对象数据集合10中的一部分对象数据20之后确定因素数据22的数值范围。在这种情况下,例如,计算单元2040对于在所述消除之后包括在对象数据集合10中的因素数据22的最小值和最大值分别设置为下限和上限的数值范围进行处理,作为因素数据22的数值范围。要从对象数据集合10中消除的对象数据20例如是其中一个因素数据22指示异常值的数据。注意,现有各种方法可用作从多个数值中确定异常值的方法。
[0083]
除此之外,例如,计算单元2040可以获取其中限定因素数据22的数值范围的信息。在这种情况下,因素数据22的数值范围的下限可以小于包括在对象数据集合10中的一个因素数据22的最小值,或者因素数据22的数值范围的上限可以大于包括在对象数据集合10中的一个因素数据22的最大值。
[0084]
计算单元2040计算用于将因素数据22的数值范围划分成划分数量信息30所指示的划分数量的每个边界值。例如,可通过以下方程(1)来计算所述边界值。
[0085]
b_i=(max-min)/n*i
ꢀꢀꢀ
(1)
[0086]
在此,bi表示从最小值开始计数的第i个边界值。max表示因素数据22的数值范围的上限,min表示因素数据22的数值范围的下限。n表示划分数量。注意,边界值的数量变为n-1。
[0087]
《生成样本对:s110》
[0088]
通过在边界值将对象数据集合10划分成两部分,计算单元2040针对每个边界值生成样本对(第一样本和第二样本)(s110)。例如,计算单元2040将对象数据集合10划分成两部分,也就是说,指示因素数据22等于或小于边界值的对象数据20的集合,以及指示因素数据22大于边界值的对象数据20的集合。前者作为第一样本处理,后者作为第二样本处理。但是,计算单元2040可以生成并设置指示一个因素数据22小于边界值的对象数据20的集合作为第一样本,以及生成并设置指示一个因素数据22等于或大于边界值的对象数据20的集合作为第二样本。
[0089]
《计算测试统计量:s112》
[0090]
计算单元2040针对每个边界值计算测试统计量,测试统计量表示与使用边界值生成的第一样本和第二样本的结果数据24相关的差异(s112)。在此,作为比较如上所述两个样本的测试,可以使用比率差测试、平均值差测试等。计算单元2040计算可用于这些测试的测试统计量。作为测试统计量的类别而言,可以采用诸如双样本t测试量的各种类别。
[0091]
例如,假设对第一样本和第二样本进行关于比率差异的测试。在这种情况下,计算
单元2040计算表示与包括在第一样本中的结果数据24相关的预定类别的比率和与包括在第二样本中的结果数据24相关的预定类别的比率之间的差异的测试统计量。例如,在一个结果数据24为缺陷标志的情况下,作为与结果数据24相关的规定类别的比率,可以使用缺陷率(其中因素数据22指示缺陷产品的对象数据20的数量相对于包括在样本中的对象数据20的总数的比率)。
[0092]
注意,测试的类别和测试统计量的类别可以预先固定定义,也可通过用户输入等方式来指定。
[0093]
《生成测试统计量信息:s116》
[0094]
生成单元2060生成指示针对每个边界值计算的测试统计量的测试统计量信息40(s116)。测试统计量信息40表示边界值与针对边界值计算的测试统计量相关联。作为这样的信息,可以采用诸如图表的各种形式信息。
[0095]
例如,测试统计量信息40包括表示边界值与测试统计量之间相关性的表格。图7是示出要实现为表格的测试统计量信息40的示意图。图7中的表格称为表格50。表格50包括边界值52和测试统计量54。在图7中,表格50中的一个记录指示相互关联的边界值以及针对通过在边界值划分对象数据集合10来获取的两个样本计算的测试统计量。
[0096]
测试统计量信息40可以是表示边界值与测试统计量之间相关性的图(以下称为测试统计量图)。图8是示出要实现为测试统计量图70的测试统计量信息40的示意图。在测试统计量图70中,x轴表示边界值,y轴表示测试统计量。
[0097]
在测试统计量图70中,标出边界值与测试统计量之间的每个相关性,并显示连接这些标记的线72。注意,图的类别并不限于线图,可以采用诸如条形图的各种图。
[0098]
测试统计量图70包括表示测试统计量阈值的阈值指示74。阈值指示74表示要基于显著性水平获取的测试统计量的阈值。在测试统计量图70中,阈值指示74所表示的等于或大于阈值的测试统计量是统计上的有效值。具体而言,在测试统计量超过阈值的情况下,可以说在与测试统计量相关联的边界值划分的两个样本之间存在统计上的显著差异。通过这种方式,通过在测试统计量图70中包括阈值指示74,可以容易地识别与每个边界值相关联的测试统计量是否为统计上的有效值。
[0099]
例如,在图8中,假设一条结果数据24是缺陷标志,且因素数据22表示成分a的含量。此外,假设进行对于样本之间缺陷率的差异的测试。此外,假设在第二样本的缺陷率高于第一样本的情况下,测试统计量具有正值。
[0100]
观察测试统计量图70,在边界值等于或小于b3的情况下,测试统计量变为小于阈值。另一方面,在边界值等于或大于b4的情况下,测试统计量变为大于阈值。有鉴于此,当将成分a的含量等于或大于b4的产品与成分a的含量小于b4的产品进行比较时,产品的缺陷率明显存在显著性差异。因此,用户在观察图8的测试统计量图70时,能够容易地认识到“为了降低缺陷率,将成分a的含量设置为小于b4是适当的”。
[0101]
注意,在图8中,通过向阈值指示74上侧的区域给予颜色(为了便于说明的图案),变得更容易识别测试统计量等于或大于阈值的区域和除此之外的区域。也可以在阈值指示74下侧的区域中进行着色。此外,可以在阈值指示74上侧的区域中不进行着色,也可以仅在阈值指示74下侧的区域中进行着色。
[0102]
此外,生成单元2060可以在测试统计量图70中以强调的方式显示表示等于或大于
阈值的测试统计量的标记。作为强调显示的方法,可以采用诸如增大标记的大小、改变标记的形状、使标记闪烁的各种方法。
[0103]
通过将显著性水平转换为测试统计量,可以获取测试统计量的阈值。例如,假设显著性水平为5%,测试统计量的类别为t值。在这种情况下,通过将表示5%的显著性水平的p值=0.05转换为t值,可以获取t值的阈值。注意,作为将表示显著性水平的值转换为测试统计量的具体方法,可以使用根据测试统计量类别的现有方法。
[0104]
显著性水平可以预先固定定义,也可通过用户指定。例如,分析装置2000向用户提供画面,通过画面可以指定诸如划分数量、测试类别和显著性水平的信息。
[0105]
图9是示出要提供给用户的画面的示意图。图9中的画面80包括输入区域82、84和86。这些区域每个都是输入区域,通过这些区域可以指定测试的类别、显著性水平和划分数量。注意,因为划分数量也可以说是测试的粒度,所以在图9中,将划分数量表示为“测试粒度”。在将信息输入到这些输入区域之后,用户按下按钮88来进行测试。因此,显示图8所示的测试统计量图70。注意,测试统计量图70可以显示在画面80上,也可以显示在画面80之外的画面上。注意,按钮88并非必须的元件,并且反映输入内容的测试统计量图70可以响应于对每个输入区域的输入来自动生成和显示。
[0106]
《输出测试统计量信息40:118》
[0107]
生成单元2060将生成的测试统计量信息40输出(s118)。测试统计量信息40的输出目的地是可选的。例如,生成单元2060使得可从分析装置2000访问的显示装置显示测试统计量信息40。除此之外,例如,生成单元2060将测试统计量信息40存储在可从分析装置2000访问的存储装置中。除此之外,例如,生成单元2060将测试统计量信息40传输给可从分析装置2000访问的另一个装置(例如用户终端60)。
[0108]
《显示直方图》
[0109]
生成单元2060可以生成与包括在对象数据集合10中的因素数据22相关的直方图,并连同测试统计量信息40一起输出直方图。例如,通过将直方图和测试统计量信息40包括在同一个画面中来输出。图10是示出包括直方图90和测试统计量信息40的画面的示意图。在图10中,直方图90包括在上述检查统计量图70中。注意,如以下要描述的图11所示,也可以分别显示测试统计量图70和直方图90。
[0110]
例如,生成直方图90如下。首先,生成单元2060通过在每个边界值划分因素数据22的数值范围来生成局部范围。生成单元2060针对每个局部范围对其因素数据22属于该局部范围的对象数据20进行计数。然后,生成单元2060生成表示局部范围和对象数据20数量之间相关性的直方图90。
[0111]
通过这种方式,通过除了测试统计量信息40之外还输出直方图90,用户可以准确和容易地识别因素数据22的值是多少才能使得结果更好,同时了解因素数据22是怎样分布的。
[0112]
《更具体的输出示例》
[0113]
除了上述信息之外,生成单元2060还可以生成各种信息。图11是示出要通过生成单元2060生成的信息的更具体示例的示意图。在该示例中,通过生成单元2060生成画面130。画面130包括显示区131、显示区132、显示区133、显示区134和显示区135。
[0114]
在显示区131中显示表示对象数据20的时间变化的时序图100。在时序图100中,线
102表示因素数据22的时间变化。在这种情况下,例如,对象数据集合10是其中每个对象数据20与时间相关联的时序数据。但是通过按特定周期累积数据,可以对数据进行处理并用作时序数据。
[0115]
在显示区132中显示直方图90。在显示区133中显示用于指定测试方法和测试粒度(相当于划分数量)的输入界面以及用于指令进行测试的按钮。
[0116]
在显示区134中显示用于指定显著性水平的输入界面和测试统计量图70。图11中的测试统计量图70包括条72和说明指示76。条72是指定所需边界值的界面。用户可通过左右移动条72来改变所需边界值。说明指示76指示条72所指定的边界值以及边界值的测试统计量。
[0117]
直方图90在低于条72指定的边界值的等级和高于边界值的等级中具有不同的显示方案。具体而言,对于值小于条72指定的边界值b3的每个等级的数据以及值大于边界值b3的每个等级的数据给予不同的模式。注意,要区分的显示方案并不限于图案,可以采用颜色的类别、边框线的类别等。
[0118]
此外,在显示区132中的直方图90上指示线110,线110指示每个等级的缺陷率。此外,每个等级中缺陷率的置信区间由虚线指示。
[0119]
显示区135基于条72指定的边界值,指示对于与结果数据24相关的值的改善程度的模拟。例如,假设针对缺陷率来计算测试统计量。此外,假设通过减少因素数据22的值来降低缺陷率。在这种情况下,显示区135包括显示区136和显示区137,显示区136指示整个对象数据20中的缺陷率等,而显示区137指示在因素数据22被限制为等于或小于由条72指定的边界值的值的情况下的缺陷率等。
[0120]
可以说,在显示区137中指示的信息表示通过将因素(在该示例中为成分a的含量)调整为使得因素数据22变为等于或小于指定边界值可以期望有多大的改善。因此,根据这种显示,可以容易地识别通过调整因素可期望的效果(在该示例中为缺陷率的改善)。
[0121]
在此,如上所述,通过允许用户左右移动条72,可以改变指定的边界值。生成单元2060响应于条72的移动(改变边界值的指定)而改变显示区137的内容。因此,用户可以在移动条72的同时确认通过调整因素可期望的效果。
[0122]
此外,生成单元2060还响应于条72的移动而改变直方图90中数据的显示方案。通过这样做,用户可以容易地确认在对于改善的模拟中使用的样本。
[0123]
注意,在图11的示例中,因为是通过减少因素数据22来降低缺陷率,所以显示区137显示“调整到b3或更小”。就此而言,在通过增加因素数据22来降低缺陷率的情况下,显示变为“调整到b3或更大”。
[0124]
预先获取用于确定是减少还是增加因素数据22来进行改善的信息。例如,如上所述,假设将用于学习估计模型的学习数据用作对象数据20,估计模型根据多个说明变量的值来估计目的变量的值。在这种情况下可以确定,是减少还是增加与某个说明变量相关联的因素数据22来进行改善取决于说明变量将正面影响或负面影响中的什么影响给予了估计模型中的目的变量。
[0125]
[变型例]
[0126]
在至此所述的示例中,对象数据20将一条因素数据22与一条结果数据24相关联。或者,对象数据20可将两条因素数据22与一条结果数据24相关联。在这种情况下,在将对象
数据集合10划分成两个样本时,通过关注两个因素来进行划分。以下将进行这种处理的分析装置2000称为根据变型例的分析装置2000。
[0127]
在根据变型例的分析装置2000中,获取单元2020获取包括多个对象数据20的对象数据集合10,其中第一因素数据22(以下称为因素数据22-1)、第二因素数据22(以下称为因素数据22-2)与结果数据24相互关联。
[0128]
计算单元2040将因素数据22-1的数值范围和因素数据22-2的数值范围的每个数值范围划分成划分数量信息30指示的划分数量。注意,划分数量信息30可以指示因素数据22-1和因素数据22-2之间共同的划分数量,也可以指示对于因素数据22-1和因素数据22-2的每一个而言不同的划分数量。例如,假设因素数据22-1的划分数量为4,因素数据22-2的划分数量为5。在这种情况下,计算单元2040将因素数据22-1的数值范围等分成四部分,将因素数据22-2的数值范围等分成五部分。具体而言,计算单元2040对于因素数据22-1确定三个边界值,而对于因素数据22-2确定四个边界值。
[0129]
针对因素数据22-1的边界值和因素数据22-2的边界值的多个对的每个对,计算单元2040在通过所述对定义的边界将对象数据集合10划分成两部分,并生成第一样本和第二样本。然后,如上所述,计算单元2040针对所生成的第一样本和第二样本计算测试统计量。
[0130]
图12是示出根据变型例的分析装置2000中的第一样本和第二样本的示意图。在该示例中,在因素数据22-1的边界值b2和因素数据22-2的边界值c2的对定义的边界生成第一样本和第二样本。具体而言,计算单元2040生成满足条件“因素数据22-1为b2或更小且因素数据22-2为c2或更小”的对象数据20的集合作为第1样本12,并生成满足条件“因素数据22-1大于b2,或因素数据22-2大于c2”的对象数据20的集合作为第二样本14。
[0131]
但是,如上所述,作为通过使用两个边界值的对将对象数据集合10划分成两个样本的方法,可以采用图1所示方法(以下称为第一方法)之外的方法。图13是示出使用两个边界值的对将对象数据集合10划分成两个样本的另一个方法的示意图。如图13所示,除了上述方法之外,还有划分成“因素数据22-1等于或小于边界值,且因素数据22-2等于或大于边界值”的部分和“因素数据22-1大于边界值,或因素数据22-2小于边界值”的部分的第二方法;划分成“因素数据22-1等于或大于边界值,且因素数据22-2等于或小于边界值”的部分和“因素数据22-1小于边界值,或因素数据22-2大于边界值”的部分的第三方法;划分成“因素数据22-1等于或大于边界值,且因素数据22-2等于或大于边界值”的部分和“因素数据22-1小于边界值,或因素数据22-2小于边界值”的部分的第四方法;等等。通过这些方法中的哪个方法来划分对象数据集合10可以预先定义,也可通过用户选择。
[0132]
图14是示出要通过根据变型例的分析装置2000输出的信息的示意图。图14所示的画面140中将图11的画面130表示的信息应用于使用两个因素的情况。
[0133]
画面140包括显示区141至145。显示区141包括时序图100,时序图100表示因素数据22-1和因素数据22-2的每一个的时间变化。显示区142包括因素数据22-1的直方图90-1和因素数据22-2的直方图90-2。
[0134]
类似于显示区133,显示区143包括输入界面和按钮,输入界面用于指定测试方法和测试粒度,按钮用于指令进行测试。显示区143还包括输入界面146,用于指定划分成第一样本和第二样本的方法。输入界面146包括4部分矩形构成的四个区域,并且被配置为使得用户能够指定四个区域的其中一个区域。向指定区域给予颜色。
[0135]
输入界面146模拟由两个因素数据22的数值范围构成的平面,其在图12和图13中示出。当用户指定四个区域的其中一个区域时,将对象数据集合10划分成两个样本,使得由两个因素数据22的数值范围构成的平面分为指定区域和除此之外的区域。例如,在图14的示例中,指定左上区域。因此,将对象数据集合10划分成两个样本,也就是说,“因素数据22-1等于或小于边界值,且因素数据22-2等于或小于边界值”的部分和除此之外的部分。
[0136]
显示区144表示测试统计量图150。针对因素数据22-1的边界值和因素数据22-2的边界值的多个对的每个对,计算单元2040相对于通过所述对获取的两个样本计算测试统计量,并生成表示多个测试统计量的统计信息40(在此为测试统计量图150)。测试统计量图150的每个单元表示针对与该单元相关联的边界值的对获取的测试统计量。例如,在图14的示例中,每个单元表示针对由单元的右下端表示的边界值的对获取的测试统计量的大小。
[0137]
在测试统计量图150中,测试统计量的大小由颜色、图案等表示。例如,随着测试统计量增加,颜色变暗,或图案变粗。在图14的示例中,向测试统计量大的单元给予较大的点图案。此外,向测试统计量等于或大于阈值th的单元给予边框152。
[0138]
用户可以指定期望的边界值的对。具体而言,用户指定与期望的边界值的对相关联的一个单元。生成单元2060响应于指定而生成与要通过指定的单元和指定的样本划分方法生成的样本对的缺陷率的改善相关的信息。
[0139]
在图14的示例中,指定表示边界值的对“成分a的边界值=b2,成分b的边界值=c2”的单元。此外,指定将数值范围的平面划分成左上部分和除此之外的部分的方法。有鉴于此,将数值范围的平面划分成“成分a的值≤b2且成分b的值≤c2”的样本和“成分a的值》b2或成分b的值》c2”的样本。注意,直方图90-1和90-2的显示方案响应于所述指定而改变。具体而言,如示例性实施例1所述,在值等于或小于指定边界值的等级与除此之外的等级之间,将颜色或图案设置为相互不同。
[0140]
生成单元2060在显示区145中显示指示针对上述划分的缺陷率改善的模拟的信息。显示区145指示对于缺陷产品的数量、合格产品的数量的比较,以及相对于满足条件“将成分a设置为等于或小于b2,并将成分b设置为等于或小于c2”的对象数据20的缺陷率和所有对象数据20中的缺陷率的比较。通过上述比较,用户可以容易地认识到,通过在“将成分a设置为等于或小于b2,并将成分b设置为等于或小于c2”的制造条件下制造产品,可将缺陷率改善到什么程度。
[0141]
虽然参照附图描述了本发明的示例性实施例,但是上述示例性实施例只是本发明的示例,还可以采用上述示例性实施例的组合或除此之外的各种配置。
[0142]
可将上述示例性实施例的一部分或全部描述为以下补充说明但不限于此。
[0143]
1.一种分析装置,包括:
[0144]
获取单元,其获取对象数据的集合和划分数量信息,每个对象数据指示因素数据和结果数据的对,因素数据是与因素相关的值,结果数据是与结果相关的值,划分数量信息指示用于划分因素数据的数值范围的数量;
[0145]
计算单元,其针对多个边界值中的每个边界值计算测试统计量,多个边界值用于将数值范围划分成数量,测试统计量表示与要通过在边界值将包括在对象数据的集合中的对象数据划分成两个部分而获取的两个样本的结果数据相关的差异;以及
[0146]
生成单元,其生成测试统计量信息,测试统计量信息指示针对每个边界值计算的
多个测试统计量。
[0147]
2.根据补充说明1所述的分析装置,其中,
[0148]
结果数据指示有无缺陷,以及
[0149]
计算单元针对每个边界值计算两个样本中的每个样本的缺陷率,并且计算表示计算的两个错误率之间的差异的测试统计量。
[0150]
3.根据补充说明2所述的分析装置,其中,
[0151]
因素数据指示表示产品的制造条件的指标的值,以及
[0152]
结果数据指示产品是否为缺陷产品。
[0153]
4.根据补充说明1至3中的任一项所述的分析装置,其中,
[0154]
测试统计量信息是指示边界值与测试统计量的组合的图。
[0155]
5.根据补充说明4所述的分析装置,其中,
[0156]
生成单元在图中包括表示用于表示显著性水平的测试统计量的阈值的指示。
[0157]
6.根据补充说明4或5所述的分析装置,其中,
[0158]
生成单元连同图一起输出表示因素数据的分布的直方图。
[0159]
7.根据补充说明6所述的分析装置,其中,
[0160]
生成单元
[0161]
接受对于图指定边界值的输入,以及
[0162]
响应于接受输入,使得在直方图中,在与等于或小于指定边界值的每个边界值相关联的等级中数据的显示方案和在与大于指定值的每个边界值相关联的等级中数据的显示方案相互不同。
[0163]
8.根据补充说明1至7中的任一项所述的分析装置,其中,
[0164]
对象数据指示第一因素数据、第二因素数据和结果数据的集合,
[0165]
计算单元针对多个第一边界值和多个第二边界值的每个集合计算要基于边界值的集合通过将包括在对象数据集合中的对象数据划分成两个部分来获取的两个样本的测试统计量,第一边界值用于将第一因素数据的数值范围划分成数量,第二边界值用于将第二因素数据的数值范围划分成数量。
[0166]
9.一种要由计算机执行的控制方法,包括:
[0167]
获取单元,其获取对象数据的集合和划分数量信息,每个对象数据指示因素数据和结果数据的对,因素数据是与因素相关的值,结果数据是与结果相关的值,划分数量信息指示用于划分因素数据的数值范围的数量;
[0168]
计算单元,其针对多个边界值中的每个边界值计算测试统计量,多个边界值用于将数值范围划分成数量,测试统计量表示与要通过在边界值将包括在对象数据的集合中的对象数据划分成两个部分而获取的两个样本的结果数据相关的差异;以及
[0169]
生成单元,其生成测试统计量信息,测试统计量信息指示针对每个边界值计算的多个测试统计量。
[0170]
10.根据补充说明9所述的控制方法,其中,
[0171]
结果数据指示有无缺陷,
[0172]
控制方法进一步包括,
[0173]
在计算步骤中,针对每个边界值计算两个样本的每个样本的缺陷率,并计算表示
计算的两个错误率之间的差异的测试统计量。
[0174]
11.根据补充说明10所述的控制方法,其中,
[0175]
因素数据指示表示产品制造条件的指标的值,以及
[0176]
结果数据指示产品是否为缺陷产品。
[0177]
12.根据补充说明9至11中任一项所述的控制方法,其中,
[0178]
测试统计量信息是指示边界值与测试统计量的组合的图。
[0179]
13.根据补充说明12所述的控制方法,进一步包括:
[0180]
在生成步骤中,在图中包括表示测试统计量的表示显著性水平的阈值的指示。
[0181]
14.根据补充说明12或13所述的控制方法,进一步包括:
[0182]
在生成步骤中,连同图一起输出表示因素数据的分布的直方图。
[0183]
15.根据补充说明14所述的控制方法,进一步包括,
[0184]
在生成步骤中,
[0185]
接受对于图指定边界值的输入,以及
[0186]
响应于接受输入,使得在直方图中,在与等于或小于指定边界值的每个边界值相关联的等级中数据的显示方案和在与大于指定边界值的每个边界值相关联的等级中数据的显示方案相互不同。
[0187]
16.根据补充说明9至15中的任一项所述的控制方法,其中,
[0188]
对象数据指示第一因素数据、第二因素数据和结果数据的集合,
[0189]
控制方法进一步包括:
[0190]
在计算步骤中,针对多个第一边界值和多个第二边界值的每个集合计算要基于边界值的集合通过将包括在对象数据集合中的对象数据划分成两个部分来获取的两个样本的测试统计量,第一边界值用于将第一因素数据的数值范围划分成数量,第二边界值用于将第二因素数据的数值范围划分成数量。
[0191]
17.一种程序,该程序使得计算机执行根据补充说明9至16中任一项所述的控制方法。
[0192]
本技术基于2019年11月1日提交的日本专利申请no.2019-199613并要求其优先权,通过引用将其全部公开内容合并于此。
[0193]
附图标记列表
[0194]
10对象数据集合
[0195]
12第一样本
[0196]
14第二样本
[0197]
20对象数据
[0198]
22因素数据
[0199]
24结果数据
[0200]
30划分数量信息
[0201]
40测试统计量信息
[0202]
50表格
[0203]
52边界值
[0204]
54测试统计量
[0205]
60用户终端
[0206]
70测试统计量图
[0207]
72线
[0208]
72条
[0209]
74阈值指示
[0210]
76说明指示
[0211]
80画面
[0212]
82,84,86输入区
[0213]
88按钮
[0214]
90直方图
[0215]
100时序图
[0216]
102线
[0217]
110线
[0218]
130画面
[0219]
131,132,133,134,135,136,137显示区
[0220]
140画面
[0221]
141,142,143,144,145显示区
[0222]
146输入接口
[0223]
150测试统计量图
[0224]
152帧
[0225]
1000计算机
[0226]
1020总线
[0227]
1040处理器
[0228]
1060存储器
[0229]
1080存储设备
[0230]
1100输入/输出接口
[0231]
1120网络接口
[0232]
2000分析装置
[0233]
2020获取单元
[0234]
2040计算单元
[0235]
2060生成单元
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献