一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

输入数据生成系统、输入数据生成方法及输入数据生成程序与流程

2022-06-22 20:53:39 来源:中国专利 TAG:


1.本发明的一方式涉及一种输入数据生成系统、输入数据生成方法及输入数据生成程序。


背景技术:

2.以往,以规定的格式获取分子的结构,将其变换为矢量信息,并输入到机器学习算法中,预测特性。例如,已知有使用机器学习预测生物高分子的立体结构与化合物的立体结构的键合性的方法(参考下述专利文献1)。在该方法中,根据生物高分子的立体结构和化合物的立体结构,生成生物高分子与化合物的复合体的预测立体结构,将该预测立体结构变换为预测立体结构矢量,使用机器学习算法判别该预测立体结构矢量,由此预测生物高分子的立体结构与化合物的立体结构的键合性。
3.以往技术文献
4.专利文献
5.专利文献1:日本特开2019-28879号公报


技术实现要素:

6.发明要解决的技术课题
7.近年来,已知有通过以分子图为输入的神经网络预测物质的特性的技术。然而,在该技术中,未实现高效地预测以各种配合比混合多种成分的多成分物质的特性。并且,关于多成分物质,一般存在难以预先得知立体结构的倾向,因此也无法使用上述专利文献1的方法预测多成分物质的特性。因此,期望一种用于高效地预测混合了多种成分的多成分物质的特性的结构。
8.用于解决技术课题的手段
9.本发明的一方式的输入数据生成系统具备至少一个处理器,至少一个处理器至少接受确定与第1分子对应的分子图的第1分子图数据、确定与第2分子对应的分子图的第2分子图数据、及表示第1分子及第2分子的混合率的混合率数据的输入,至少组合第1分子图数据和第2分子图数据,生成合成分子图数据,将合成分子图数据变换为特征矢量,通过在特征矢量中反映混合率数据,生成机器学习用输入数据。
10.或者,本发明的另一方式的输入数据生成方法由具备至少一个处理器的计算机执行,所述输入数据生成方法包括:至少接受确定与第1分子对应的分子图的第1分子图数据、确定与第2分子对应的分子图的第2分子图数据、及表示第1分子及第2分子的混合率的混合率数据的输入的步骤;至少组合第1分子图数据和第2分子图数据,生成合成分子图数据的步骤;将合成分子图数据变换为特征矢量的步骤;及通过在特征矢量中反映混合率数据,生成机器学习用输入数据的步骤。
11.或者,本发明的另一方式的输入数据生成程序使计算机执行如下步骤:至少接受确定与第1分子对应的分子图的第1分子图数据、确定与第2分子对应的分子图的第2分子图
数据、及表示第1分子及第2分子的混合率的混合率数据的输入的步骤;至少组合第1分子图数据和第2分子图数据,生成合成分子图数据的步骤;将合成分子图数据变换为特征矢量的步骤;及通过在特征矢量中反映混合率数据,生成机器学习用输入数据的步骤。
12.根据上述方式,组合确定第1分子的分子结构的数据和确定第2分子的分子结构的数据生成合成分子图数据,将该合成分子图数据变换为特征矢量,在该特征矢量中反映表示第1分子及第2分子的混合率的数据,生成机器学习用输入数据。通过这样的结构,能够有效地生成与用于输入到以分子图为输入的神经网络中的多成分物质有关的输入数据。其结果,即使是含有多种成分的多成分物质,也能够通过利用神经网络处理输入数据来高精度地预测多成分物质的特性。
13.发明效果
14.根据本发明的方式,能够高精度地预测含有多种成分的多成分物质的特性。
附图说明
15.图1是表示构成实施方式所涉及的输入数据生成系统的计算机的硬件结构的一例的图。
16.图2是表示实施方式所涉及的输入数据生成系统的功能结构的一例的图。
17.图3是表示根据由图2的获取部11获取的分子图数据确定的分子图的一例的图。
18.图4是表示图2的合成部12组合图3所示的第1分子图及第2分子图而生成的多成分物质的分子图的一例的图。
19.图5是表示实施方式所涉及的输入数据生成系统的动作的一例的流程图。
20.图6是表示在实施方式所涉及的输入数据生成系统的动作中处理的分子数据的一例的图。
具体实施方式
21.以下,参考附图,对本发明的实施方式详细地进行说明。另外,在说明中,对于相同要件或具有相同功能的要件使用相同符号,省略重复的说明。
22.[系统的概要]
[0023]
实施方式所涉及的输入数据生成系统10是执行输入数据的生成处理的计算机系统,该输入数据表示通过以各种混合比混合多种成分而生成的多成分物质。成分是指用于生成多成分物质的具有特定的分子结构的化学物质,例如是单体、聚合物、或低分子添加剂、溶质分子、气体分子等单分子。一个成分中可以含有多种分子。多成分物质是指通过以规定的混合比混合多个成分而生成的化学物质,例如,在成分为单体的情况下是聚合物合金,在成分为聚合物的情况下是聚合物混合物,在成分为溶质分子或者溶剂的情况下是混合溶液,在成分为气体分子的情况下是混合气体。
[0024]
由输入数据生成系统10生成的输入数据作为机器学习用输入数据,用于预测多成分物质的特性。所谓的多成分物质的特性,例如在多成分物质为树脂的情况下,是玻璃化转变温度及熔点等热物性、机械物性、或黏合性等。并且,在多成分物质为其他种类的物质的情况下,多成分物质的特性是药剂的药效或者毒性、可燃物的燃点等危险性、外观上的特性、或对特定的用途的适当性等。输入输入数据的机器学习是指通过根据给定的信息反复
地学习而自主地找出定律或规则的方法。机器学习的具体的方法没有限定。例如,机器学习可以是使用作为包含神经网络而构成的计算模型的机器学习模型的机器学习。神经网络是指模拟人的脑神经系统的结构的信息处理模型。作为更具体的例子,机器学习使用以图为输入的神经网络及以图为输入的卷积神经网络中的至少一个。
[0025]
[系统的结构]
[0026]
输入数据生成系统10由1台以上的计算机构成。在使用多台计算机的情况下,这些计算机经由互联网、内部网等通信网络连接,从而逻辑上构建一个输入数据生成系统10。
[0027]
图1是表示构成输入数据生成系统10的计算机100的一般硬件结构的一例的图。例如,计算机100具备执行操作系统、应用程序等的处理器(例如cp u)101、由rom及ram构成的主存储部102、由硬盘、闪存等构成的辅助存储部103、由网卡或无线通信模块构成的通信控制部104、键盘、鼠标、触摸面板等输入装置105、及监视器、触摸面板显示器等输出装置106。
[0028]
输入数据生成系统10的各功能要件通过在处理器101或主存储部102上读入预先设定的程序并使处理器101执行该程序来实现。处理器101按照该程序,使通信控制部104、输入装置105、或输出装置106动作,进行主存储部102或辅助存储部103中的数据的读出及写入。处理所需的数据或数据库存储在主存储部102或辅助存储部103内。
[0029]
图2是表示输入数据生成系统10的功能结构的一例的图。输入数据生成系统10具备获取部11、合成部12、追加部13、矢量变换部14及混合率反映部15作为功能要件。
[0030]
获取部11是接受多个成分的分子图数据和混合率数据的输入的功能要件,该混合率数据表示假设将这些多个成分进行混合而生成混合物时的各个多个成分的混合率。获取部11可以根据输入数据生成系统10的用户的选择输入从输入数据生成系统10内的数据库获取这些数据,也可以根据用户的选择从外部的计算机等获取这些数据。
[0031]
具体而言,获取部11至少获取确定与第1成分中包含的第1分子对应的分子图的第1分子图数据和确定与第2成分中包含的第2分子对应的分子图的第2分子图数据。这些分子图数据是确定用节点及边缘表示分子结构的无向图的结构的数据。分子图数据例如可以是通过数字、英文字符、文本、矢量等确定无向图的结构的数据,也可以是通过二维图像、三维图像等使该结构可视化的数据,还可以是这些数据中的任意2个以上的组合的数据。构成分子图数据的各个数值可以用十进制表示,也可以用二进制、十六进制等其他标记法表示。更详细而言,获取部11至少获取确定作为第1成分的第1单体的分子图的第1分子图数据和确定作为第2成分的第2单体的分子图的第2分子图数据。
[0032]
在图3中,(a)部表示第1分子图的结构的一例,(b)部表示第2分子图的结构的一例。图3的(a)部所示的第1分子图具有原子“a”的节点n1与原子“b”的节点n2通过边缘e12结合,节点n2与原子“c”的节点n3通过边缘e23结合的结构。在第1分子图数据中包含确定各节点n1~n3的节点信息和确定各边缘e12、e23的边缘信息。而且,在第1分子图中,节点n1及节点n3是具有能够与其他节点进一步随机地结合的性质的节点。例如,在第1分子图为直链结构的单体的情况下,端部的节点n1、n3具有能够随机地结合的性质。这里所说的“能够随机地结合”是指与其他节点随机地产生结合,换言之,能够产生结合的情况和不结合的情况。在第1分子图具有这样的节点的情况下,在第1分子图数据中还包含确定能够进一步结合的节点(例如,节点n1、n3)的结合节点信息。在该结合节点信息中也可以包含限定该节点的结合目的地的节点或者结合目的地的节点的种类(原子等)的限定信息。
[0033]
同样地,图3的(b)部所示的第2分子图具有原子“d”的节点n4与原子“e”的节点n5通过边缘e45结合,节点n5与原子“f”的节点n6通过边缘e56结合的结构。在第2分子图数据中包含确定各节点n4~n6的节点信息和确定各边缘e45、e56的边缘信息。而且,在第2分子图中,与第1分子图同样地,节点n4及节点n6是具有能够与其他节点进一步结合的性质的节点。在第2分子图具有这样的节点的情况下,在第2分子图数据中还包含确定能够进一步结合的节点的结合节点信息。在该结合节点信息中也可以包含限定该节点的结合目的地的节点或者结合目的地的节点的种类的信息。
[0034]
并且,作为表示多个成分的混合率r的混合率数据,获取部11可以获取表示各个成分的混合率本身的数据,也可以获取表示多个成分之间的混合比的数据,还可以获取以绝对值或者相对值表示多个成分各自的混合量(重量、体积等)的数据。例如,获取作为第1成分的第1单体的混合率r1=“0.5”和作为第2成分的第2单体的混合率r2=“0.5”。
[0035]
合成部12组合多个成分的分子图,生成与多成分物质的分子图对应的合成分子图数据。在此,合成部12至少参考第1分子图数据和第2分子图数据,生成确定组合了第1分子图和第2分子图的多成分物质的分子图的合成分子图数据。图4表示组合图3所示的第1分子图及第2分子图而生成的多成分物质的分子图的一例。如此,合成部12通过将与根据第1分子图数据确定的节点n1、n2、n3有关的节点信息及与边缘e12、e23有关的边缘信息,和与根据第2分子图数据确定的节点n4、n5、n6有关的节点信息及与边缘e45、e56有关的边缘信息按原样组合,生成合成分子图数据。并且,合成部12生成确定所生成的合成分子图数据中的节点的集合的集合数据v和确定合成分子图数据中的边缘的集合的集合数据e。例如,合成部12在图4的例子中,使用识别各节点的分子的识别符,生成集合数据v={a,b,c,d,e,f}、集合数据e={ab,bc,de,ef},将组合了这些集合数据v、e的图数据g=(v,e)作为代表合成分子图数据的数据。
[0036]
追加部13通过对由合成部12生成的合成分子图数据追加将根据该合成分子图数据确定的多成分物质的分子图中的2个节点进行结合的追加边缘信息,重新生成合成分子图数据。详细而言,追加部13至少参考第1分子图数据中包含的结合节点信息和第2分子图数据中包含的结合节点信息,从第1分子图中的能够进一步结合的节点和第2分子图中的能够进一步结合的节点中提取2个节点的组合。并且,追加部13将结合所提取的节点的组合的追加边缘信息追加到合成分子图数据中。例如,在图4的例子中,由于节点n1、n3、n4、n6被指定为能够进一步结合的节点,因此追加部13追加与将节点n1与节点n3进行结合的边缘e13、将节点n1与节点n6进行结合的边缘e16、将节点n3与节点n4进行结合的边缘e34、及将节点n4与节点n6进行结合的边缘e46有关的追加边缘信息。此时,追加部13在提取节点的组合时,可以参考结合节点信息中包含的限定信息来限定能够结合的组合,也可以判断在节点之间能够产生化学键的原子的组合来提取。图4所示的分子图是追加部13参考限定信息提取组合的例子,是根据限定信息将节点n1的结合目的地限定为节点n3、n6,将节点n3的结合目的地限定为节点n1、n4的例子。并且,追加部13对合成分子图数据中的集合数据e追加追加边缘信息所示的边缘而生成集合数据e’,将组合了集合数据v、e’的图数据g’=(v,e’)作为代表合成分子图数据的数据。例如,根据图4的例子,追加部13生成集合数据e’={ab,ac,af,bc,cd,de,df,ef}。
[0037]
矢量变换部14将代表由追加部13生成的合成分子图数据的图数据g’变换为特征
矢量f。具体而言,矢量变换部14在变换与图数据g’中包含的节点有关的集合数据v时,将表示构成集合数据v的各元素的节点的原子的特征的数值变换为依次排列的矢量要素。表示原子的特征的数值是指原子序号、电负性等。并且,矢量变换部14在变换与图数据g’中包含的边缘有关的集合数据e’时,将表示集合数据e’的各元素的边缘的特征的数值变换为依次排列的矢量要素。表示边缘的特征的数值是指结合次数、结合距离等。矢量变换部14生成特征矢量f,该特征矢量f包含变换集合数据v而得的矢量要素和变换集合数据e’而得的矢量要素作为单独的矢量。
[0038]
混合率反映部15在由矢量变换部14生成的特征矢量f中反映混合率数据,基于反映了混合率的特征矢量f生成机器学习用输入数据。即,混合率反映部15对特征矢量f的要素中与成分的分子图的节点对应的要素,反映与该成分对应的混合率r。例如,混合率反映部15对与第1分子图的节点的原子对应的矢量要素,反映由第1分子构成的第1成分的混合率r1,对与第2分子图的节点的原子对应的矢量要素,反映由第2分子构成的第2成分的混合率r2。并且,混合率反映部15对特征矢量f的要素中与成分的分子图的边缘对应的要素,反映与该成分对应的混合率。例如,混合率反映部15对与第1分子图的边缘对应的矢量要素,反映由第1分子构成的第1成分的混合率r1,对与第2分子图的边缘对应的矢量要素,反映由第2分子构成的第2成分的混合率r2。通过将混合率r与矢量要素的各要素相乘、相加,或者将混合率r的要素与矢量要素连结来进行混合率的反映。
[0039]
并且,混合率反映部15对特征矢量f的矢量要素中与由追加部13追加的追加边缘信息对应的边缘的矢量要素,如下反映混合率数据。即,混合率反映部15将与通过边缘结合的2个节点所属的分子图对应的1个或者2个成分的混合率r反映到该边缘的矢量要素中。即,混合率反映部15在其中一个节点所属的成分的混合率为ri,另一个节点所属的成分的混合率为rj的情况下,在该边缘的矢量要素中反映2个成分的混合率ri、rj的相乘值ri
×
rj。例如,在对应的边缘为将一个分子图的节点之间进行结合的边缘的情况下,在该边缘的矢量要素中反映与该一个分子图对应的成分的混合率r的平方值,在对应的边缘为将2个分子图的节点之间进行结合的边缘的情况下,在该边缘的矢量要素中反映与该2个分子图对应的2个成分的混合率r的相乘值。换言之,在对应的边缘为将第1分子图内的2个节点之间进行结合的边缘的情况下,在该边缘的矢量要素中仅反映由第1分子构成的成分的混合率r1,在对应的边缘为将第1分子图的节点与第2分子图的节点之间进行结合的边缘的情况下,在该边缘的矢量要素中反映由第1分子构成的第1成分的混合率r1和由第2分子构成的第2成分的混合率r2这两者。通过将混合率的相乘值与矢量要素的各要素相乘、相加,或者将混合率的相乘值的要素与矢量要素连结来进行混合率的相乘值的反映,通过反映将2个成分的混合率相乘的数值r1×
r2来进行2个成分的混合率r1、r2的反映。
[0040]
而且,混合率反映部15将所生成的输入数据输出到外部。所输出的输入数据由与输入数据生成系统10的外部连接的计算机内的训练部20读入。并且,在训练部20中,将该输入数据作为说明变量与任意教师标签一同输入到机器学习模型,从而生成学习完毕模型。而且,基于由训练部20生成的学习完毕模型,设定预测器30内的机器学习模型。但是,训练部20和预测器30可以是相同的功能部。并且,通过将由输入数据生成系统10生成的输入数据输入到预测器30内的机器学习模型,由预测器30生成并输出多成分物质的特性的预测结果。另外,这些训练部20及预测器30可以设置在与构成输入数据生成系统10的计算机100相
同的计算机内,也可以设置在与计算机100分体的计算机内。
[0041]
在一例中,由训练部20生成的机器学习模型是期待推算精度最高的学习完毕模型,因此能够称为“最佳机器学习模型”。然而,应该注意,该学习完毕模型并不限于“现实中最佳”。通过计算机处理包含输入数据和输出数据的多个组合的教师数据来生成学习完毕模型。计算机通过将输入数据输入到机器学习模型来计算输出数据,并求出所计算的输出数据与由教师数据表示的输出数据的误差(即,推算结果与正确答案之差)。并且,计算机根据该误差更新作为机器学习模型的神经网络的给定的参数。计算机通过重复这样的学习来生成学习完毕模型。生成学习完毕模型的处理能够称为学习阶段,利用该学习完毕模型的预测器30的处理能够称为运用阶段。
[0042]
[系统的动作]
[0043]
参考图5及图6,对输入数据生成系统10的动作进行说明,并且对本实施方式所涉及的输入数据生成方法进行说明。图5是表示输入数据生成系统10的动作的一例的流程图。图6是表示在输入数据生成系统10的动作中处理的分子数据的一例的图。
[0044]
首先,当以输入数据生成系统10的用户的指示输入为契机开始输入数据生成处理时,由获取部11获取针对多个成分的每一个的分子图数据及与各个多个成分有关的混合率数据(步骤s1)。此时,由获取部11至少获取确定第1成分中包含的第1分子的分子图的第1分子图数据、确定第2成分中包含的第2分子的分子图的第2分子图数据、及与这些第1成分及第2成分有关的混合率数据。图6的(a)部表示由获取部11获取的第1分子图数据所示的分子图的一例,图6的(b)部表示由获取部11获取的第2分子图数据所示的分子图的一例。在该例子中,作为第1分子例示了聚丙烯,作为第2分子例示了聚丁烯。例如,作为混合率数据,获取作为第1成分的聚丙烯的混合率r1=“0.5”及作为第2成分的聚丁烯的混合率r2=“0.5”。
[0045]
然后,由合成部12通过组合多个成分的分子图数据来生成与混合物有关的合成分子图数据,并且通过组合识别各分子图的节点的信息来生成确定合成分子图数据中的节点的集合的集合数据v(步骤s2)。此外,由合成部12通过组合识别各分子图的边缘的信息来生成确定合成分子图数据中的边缘的集合的集合数据e,生成代表组合了集合数据v、e的合成分子图数据的图数据g=(v,e)(步骤s3)。例如,在图6中的(a)部及(b)部的例子中,组合第1分子图数据所示的节点的集合数据v1={c
α
,c
β
,c
γ
}和第2分子图数据所示的节点的集合数据v2={c
δ
,c
ε
,c
ζ
,c
η
},生成与合成分子图数据有关的节点的集合数据v={c
α
,c
β
,c
γ
,c
δ
,c
ε
,c
ζ
,c
η
}。并且,组合第1分子图数据所示的边缘的集合数据e1={c
αcβ
,c
βcγ
}和第2分子图数据所示的边缘的集合数据e2={c
δcε
,c
εcζ
,c
ζcη
},生成与合成分子图数据有关的边缘的集合数据e={c
αcβ
,c
βcγ
,c
δcε
,c
εcζ
,c
ζcη
}。
[0046]
接着,由追加部13提取在多个成分的分子图上能够进一步结合的2个边缘(反应点),将结合这2个反应点的追加边缘信息追加到合成分子图数据中(步骤s4)。此时,通过由追加部13对集合数据e追加追加边缘信息所示的边缘,重新生成确定合成分子图数据中的边缘的集合的集合数据e’,重新生成代表组合了集合数据v、e’的合成分子图数据的图数据g’=(v,e’)。例如,在图6中的(a)部及(b)部的例子中,追加追加边缘信息所示的边缘{c
αcδ
,c
βcδ
,c
αcε
,c
βcε
},重新生成集合数据e’={c
αcβ
,c
βcγ
,c
δcε
,c
εcζ
,c
ζcη
,c
αcδ
,c
βcδ
,c
αcε
,c
βcε
}。
[0047]
而且,由矢量变换部14将代表合成分子图数据的图数据g’以恒定的变换规则变换为特征矢量f(步骤s5)。作为该变换规则,关于集合数据v的元素,适用将表示各元素的原子
的特征(例如,电负性、原子序号)排列在矢量要素中,关于集合数据e’的元素,适用将表示各元素的边缘的特征(例如,结合次数、结合距离)排列在矢量要素中。通过将从图数据g’的各元素变换的矢量依次一维地连结来生成特征矢量f。例如,集合数据v的元素{c
α
}变换为排列了原子序号及电负性的矢量[12,2.55],集合数据e’的元素{c
αcβ
}变换为排列了结合次数及结合距离(埃)的矢量[1,1.53]。
[0048]
然后,由混合率反映部15在特征矢量f中反映混合率数据,生成特征矢量f。而且,由混合率反映部15组合特征矢量f和合成分子图数据而生成输入数据,并将该输入数据输出到训练部20(步骤s6)。在反映混合率时,对特征矢量f的要素中与某个成分的分子图的节点及边缘对应的要素,反映该成分的混合率r,对特征矢量f的要素中与对应于追加边缘信息的边缘对应的要素,反映通过边缘连接的2个节点所属的成分的混合率r。例如,在图6中的(a)部及(b)部的例子中,在与对应于追加边缘信息的边缘对应的要素以外,反映混合率r1=r2=“0.5”,在与对应于追加边缘信息的边缘对应的要素中,在通过该边缘连接的2个节点属于相同的分子图的情况下,反映混合率r
12
(或r
22
)=“0.25”,在通过该边缘连接的2个节点属于单独的分子图的情况下,反映混合率r1×
r2=“0.25”。此时,通过将混合率与矢量要素相乘、相加或者连结来进行混合率的反映。例如,在将混合率r=“0.5”与矢量要素[12,2.55]相乘而反映的情况下,设定为[12
×
0.5,2.55
×
0.5]=[6,1.275]。并且,例如,在将混合率r=“0.5”与矢量要素[12,2.55]连结而反映的情况下,设定为[12,2.55,0.5]。
[0049]
接着,在训练部20中,执行学习阶段,并且通过使用输入数据和教师数据重复训练来生成学习完毕模型(步骤s7)。并且,在预测器30中设定所生成的学习完毕模型,由预测器30使用从输入数据生成系统10新获取的输入数据执行运用阶段,生成并输出多成分物质的特性的预测结果(步骤s8)。
[0050]
[程序]
[0051]
用于使计算机或计算机系统作为输入数据生成系统10发挥功能的输入数据生成程序包含用于使该计算机系统作为获取部11、合成部12、追加部13、矢量变换部14及混合率反映部15发挥功能的程序代码。该输入数据生成程序可以在固定地记录在cd-rom、dvd-rom、半导体存储器等有形记录介质的基础上提供。或者,输入数据生成程序也可以作为叠加在载波上的数据信号而经由通信网络提供。所提供的输入数据生成程序例如存储在辅助存储部103中。处理器101从辅助存储部103读出并执行该输入数据生成程序,由此实现上述各功能要件。
[0052]
[效果]
[0053]
如以上说明,根据上述实施方式,组合确定第1分子的分子结构的数据和确定第2分子的分子结构的数据生成合成分子图数据,将该合成分子图数据变换为特征矢量,在该特征矢量中反映表示第1分子及第2分子的混合率的数据,生成机器学习用输入数据。通过这样的结构,能够有效地生成与用于输入到以分子图为输入的神经网络中的多成分物质有关的输入数据。其结果,即使是含有多种成分的多成分物质,也能够通过利用神经网络处理输入数据来高精度地预测多成分物质的特性。尤其,能够高精度地预测混合单体生成的聚合物合金的特性。
[0054]
并且,在上述实施方式中,通过在构成成分的分子的原子的信息即节点信息中反映该分子的混合率,能够适当地生成表示多成分物质的输入数据。其结果,能够更高精度地
预测多成分物质的特性。尤其,通过将成分的混合率与对应于分子图数据的节点信息的矢量相乘、相加或者连结,能够在表示多成分物质的输入数据中简单且适当地反映混合率。
[0055]
并且,在上述实施方式中,通过在构成成分的分子的原子之间的结合信息即边缘信息中反映该分子的混合率,能够适当地生成表示多成分物质的输入数据。其结果,能够更高精度地预测多成分物质的特性。尤其,通过将成分的混合率与对应于分子图数据的边缘信息的矢量相乘、相加或者连结,能够在表示多成分物质的输入数据中简单且适当地反映混合率。
[0056]
而且,在上述实施方式中,能够生成在多成分物质中能够结合的原子之间的结合信息作为追加的边缘信息,通过在追加的边缘信息中反映该分子的混合率,能够适当地生成表示多成分物质的输入数据。其结果,能够更高精度地预测多成分物质的特性。尤其,在以共聚物等单体的排列顺序具有无规性的聚合物合金为对象的情况下,在以往的以图为输入的神经网络中,难以构建输入对象的分子图。在本实施方式中,将单体之间的化学键取入到分子图中,将“聚合物合金”等多成分物质表示为图,能够将该多成分物质的图有效地输入到神经网络中。
[0057]
并且,在上述实施方式中,采用以图为输入的神经网络作为机器学习的模型。由此,能够将分子图数据作为输入,高精度地预测多成分物质的特性。
[0058]
[变形例]
[0059]
以上,根据其实施方式对本发明详细地进行说明。然而,本发明并不限定于上述实施方式。本发明能够在不脱离其主旨的范围内进行各种变形。
[0060]
在上述实施方式中,示出了输入数据生成系统10组合2个成分的分子图而生成分子图数据及与其有关的特征矢量的例子,但也可以发挥将3个以上的成分的分子图与它们的混合率一同组合的功能。
[0061]
并且,输入数据生成系统10的矢量变换部14中设置的恒定的变换规则也可以是其他规则。例如,也可以根据原子或者键的相似性,使用机器学习获取特征矢量本身。例如,也可以使用与作为在自然语言处理中对单词进行矢量化时使用的神经网络的word2vec相同的方法,获取特征矢量作为分散表示。并且,也可以与训练部20的学习阶段一同执行特征矢量的生成。
[0062]
由至少一个处理器执行的输入数据生成方法的处理顺序并不限定于上述实施方式中的例子。例如,可以省略上述步骤(处理)的一部分,也可以以其他顺序执行各步骤。并且,可以组合上述步骤中的任意2个以上的步骤,也可以修正或删除步骤的一部分。或者,除了上述各步骤以外,还可以执行其他步骤。例如也可以省略步骤s7、s8的处理。
[0063]
在本发明中,“至少一个处理器执行第1处理,执行第2处理,

执行第n处理。”的表述、或与其对应的表述表示包含从第1处理到第n处理的n个处理的执行主体(即处理器)在中途改变的情况的概念。即,该表述表示包含n个处理全部由相同的处理器执行的情况和在n个处理中处理器以任意方针改变的情况这两种情况的概念。
[0064]
产业上的可利用性
[0065]
本发明的一方式将输入数据生成系统、输入数据生成方法及输入数据生成程序作为使用用途,能够高效地预测混合了多种成分的多成分物质的特性。
[0066]
符号说明
[0067]
10-输入数据生成系统,100-计算机,101-处理器,11-获取部,12-合成部,13-追加部,14-矢量变换部,15-混合率反映部,20-训练部,30-预测器。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献