一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

生成用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的方法与流程

2021-11-10 04:17:00 来源:中国专利 TAG:


1.本发明涉及一种生成用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的方法。
现有技术
2.用于油漆、清漆、印刷油墨组合物、研磨树脂、颜料浓缩物和其它涂料的组合物是由原料组成的复杂混合物。用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的常见组合物或配伍或配方包含约20种原材料,其以下也被称为“组分”。所述组合物例如由选自以下项的原材料构成:固体例如颜料和/或填料、粘合剂、溶剂、树脂、硬化剂和各种添加剂如增稠剂、分散剂、润湿剂、粘合促进剂、消泡剂、表面改性剂、流平剂、催化活性添加剂如干燥剂和催化剂以及特效添加剂如杀虫剂、光引发剂和腐蚀抑制剂。
3.迄今为止,已根据经验值指定具有某些期望特性的新组合物、配方和重组配方,且随后以化学方式来合成和测试。由于相互作用的复杂性,故对于本领域技术人员而言,在化学、物理、光学、触觉和其它可通过测量来识别的特性方面满足特定期望的新的组合物的组成仍是难预见的。鉴于原材料之间相互作用的多样性以及随之而来的大量不成功试验,这种做法既耗时又成本高昂。
4.us 2018/0276348 a1公开了一种用于生产化学配方的认知计算机系统。该系统确定满足某些限制条件的化学配方,并生产和检查该化学配方。该计算机系统基于的是用现有的化学配方数据训练学习系统。然而,创建足够大的数据组用以训练学习逻辑是非常复杂的,并且因为耗用大量时间和材料而也是昂贵的。在许多情况下也无法简单地动用事先被合成并分析的组合物的存在于大多数实验室中的数据组。这可能有以下各种原因:实验室是新成立的,还没有相应的数据库。实验室在建新的产品线,还没有关于这条新产品线特性的任何经验和相应的数据组。或者,虽然有数据,但其就范围而言太小或就其由历史决定的组成而言太不平衡(“有侧重),以致不能用作训练数据组。因此,关于具有所需特性的组合物的组分,由人执行的评估和计算机辅助评估和预测目前都遇到很窄的瓶颈。这尤其适用于具有许多相关特性和许多组分的复杂组合物,就像针对油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料那样,因为这些组分以复杂的方式相互作用并决定了相应化学品的特性。
5.因此,目前须首先以化学方法真正生产新的组合物,然后测量其特性以便能够评估所述组合物是否具有某些所需特性。虽然已经有用于自动预测化学物质特性的方法,但创建足够大小和质量的训练数据组通常比直接生产和测试相关组成还更复杂。在油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料领域的新组合物的开发是尤其复杂的并且需要大量时间。
6.概述
7.因此本发明的任务是提供一种方法,借此以更节省时间且廉价的方式来达成新组
合物的开发或重组配方的开发。
8.该任务通过根据权利要求1的用于生成用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的方法以及一种相应的计算机系统和计算机程序产品来完成。在从属权利要求中说明了本发明的实施方式。本发明的实施方式可以相互自由组合,除非它们相互排斥。
9.一方面,本发明涉及一种生成用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的方法。该组合物通过计算机系统来生成。该计算机系统访问数据库,该数据库中存储有已知组合物及其组分和特性。该计算机系统与用于生产并检查用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的设备相连。该计算机系统包括卷积神经元网络(所谓的cnn)和主动学习模块。该方法包括以下步骤:
10.a.使用存储在数据库中的已知组合物来训练卷积神经元网络,其中,为了训练将损失函数最小化,
11.b.检查该损失函数的值是否满足规定标准,其中,选择性地针对未满足该标准的情况执行以下步骤:
12.i.通过主动学习模块从预先规定的试验组合物的集合中选择一种试验组合物,
13.ii.通过该计算机系统控制该设备来生产并检查所选的试验组合物,
14.iii.在使用所选的试验组合物及其由该设备采集的特性情况下训练该卷积神经元网络,
15.iv.重复执行步骤b.,
16.c.通过将输入向量输入到该卷积神经元网络来生成用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的预测组合物,
17.d.通过卷积神经元网络输出该预测组合物。
18.这可能是有利的,因为在全自动或半自动的迭代方法中,给现有的训练数据组逐步且有目的地扩充呈试验组合物及其凭借经验确定的特性形式的有说服力的其它数据组,在这里,在每次迭代中都基于扩展训练数据组来重新训练神经元网络,由此,网络的预测质量在每次迭代之后都得到提升,直到损失函数满足所述标准,即网络的预测误差已变得足够小。
19.由于已知组合物的数量有限,故在初始训练阶段之后获得的经过训练的神经元网络通常还不能可靠预测具有许多期望特性的预测配方。对此,所用数据库通常太小。
20.通过由主动学习模块扩展训练数据组,允许有针对性地选择少量若干试验组合物,神经元网络及其预测的质量尤其从中受益。因而在多次迭代中,通过自动且有目的地选择保证极好地改善神经元网络预测模型的试验组合物以及通过基于所选的相应试验组合物自动执行合成和分析步骤,可高效快速地提高神经元网络预测能力。如果在迭代后确定损失函数满足标准,则不再需要扩展训练数据组,因为经过训练的神经元网络的预测能力可被视为足够。
21.在另一个有利方面,该主动学习模块可以通过自动选择尤其提高神经元网络预测能力的试验组合物来扩展已知组合物的现有数据库存,从而可以基本上自动补偿训练数据中的不平衡。
22.根据本发明的实施方式,试验组合物的量由试验计划程序来自动生成。例如,试验
组合物可以基于已知组合物通过添加或去除组分或通过修改一种或多种组分的量或浓度来自动生成。
23.这可能是有利的,因为可以自动生成非常多的试验组合物。因此可以界定出具有诸多候选组合物的大数据空间。由试验组合物所界定的数据空间可以特别有以下优点,即,例如如果试验计划程序被设计成如此生成试验组合物,即,基本上每个组分都历经类似的且覆盖大数据空间的变化(去除、添加、浓度变化)而生成试验组合物,则数据空间的“侧重性”更少。
24.根据本发明的实施方式,已知组合物和/或试验组合物的组分选自如下的组,该组包括固体例如颜料和/或填料、粘合剂、溶剂、树脂、硬化剂和各种添加剂如增稠剂、分散剂、润湿剂、增附剂、消泡剂、表面改性剂、流平剂、催化活性添加剂和特殊活性添加剂。
25.根据本发明的实施方式,由该设备测知的试验配方特性选自以下组,该组包括储存稳定性、ph值、流变学且特别是粘度、密度、相对质量、颜色学且特别是颜色强度、生产时的成本降低和颜料产量提高。
26.根据本发明的实施方式,通过计算机系统的用户接口来输出预测组合物。用户接口例如可以是屏幕、扬声器和/或打印机。
27.这可能是有利的,因为在将预测组合物传输至化工设备以进行合成之前,用户可以再次人工检查预测组合物的合理性。
28.根据实施方式,该设备具有至少两个加工站。所述至少两个加工站经由输送系统相连,自走式运输工具可在该输送系统上在所述加工站之间移动,用于输送组合物的和/或所产生组合物的成分。
29.根据实施方式,该方法还包括:向控制该设备的处理器输入组合物,其中,输入到处理器中的组合物是所选的试验组合物或预测组合物,其中,该处理器控制该设备以生产输入的组合物,其中,在所述至少两个加工站中进行输入的组合物的生产和输入的组合物的特性的测量,接着,通过计算机系统的用户接口来输出测量特性和/或将所测量特性存储在数据库中。处理器可以是例如该设备的主控制计算机的处理器,其是该设备的组成部分或通过网络有效连接到该设备。
30.用于扩展训练数据组的试验组合物的迭代合成和检查(特性的确定)可能是有利的,因为提供一种全自动的系统或在需要用户确认时的半自动的系统,其用于有针对性地扩展特定已有的训练数据组来迭代改善神经元网络。因此通过相应控制化工设备且自动使用如此产生的经验数据来扩展训练数据组,进而主动自动地以迭代方式改进基于神经元网络的预测方法。
31.预测组合物的合成和检查(特性的确定)可能是有利的,因为提供一种系统,在该系统中,用户只需详细说明化学品的期望特性,为此所需的组分之确定以及具有期望性能的产品之产生都是自动运行的,前提是神经元网络能针对在输入向量中所详细说明的期望特性确定预测组合物。
32.根据实施方式,该计算机系统被设计成通过通信接口与数据库和/或用于生产和检查用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的设备通信。该通信接口可以通过usb、以太网、wlan、lan、蓝牙或其它网络接口实现。
33.根据实施方式,所述组合物包含配方或由配方构成。
34.在另一方面,本发明涉及一种用于生成用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的计算机系统。该计算机系统包括数据库和用户接口,并被配置成执行根据本发明实施方式的用于生成组合物的方法。
35.在另一方面,本发明涉及一种具有可由处理器运行的指令的计算机程序、数字存储介质或计算机程序产品,所述指令在由处理器执行时促使处理器执行根据本发明实施方式的用于生成组合物的方法。
36.在另一方面,本发明涉及一种包括所述计算机系统和设备的系统。该设备是用于生产和检查用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的设备。该设备具有至少两个加工站。所述至少两个加工站经由输送系统相连,用于运送组合物的和/或所生产组合物的组分的自走式运输工具可在该输送系统上在所述加工站之间移动。
[0037]“组合物”在此是指化学品的详细说明,其至少指定用以形成化学品的原料(“组分”)的类型。当在本技术的上下文中提到组合物的生产或检查时,它应被理解为对以下信息的概述,即,化学品按照摘要所明确指出的关于组分和可选还有其浓度的说明来生产,或者该化学品被“检查”、即其性能依靠测量技术被测知。
[0038]“配方”在此是指如下组合物,其除了组分说明外还包含针对相应组分的量或浓度说明。
[0039]“已知组合物”是指如下组合物,它详细说明如下化学品,在训练神经元网络时执行训练的人或组织已知该化学品的特性,因为已知组合物事先曾经被用于生产化学品,且该产品的特性已凭经验测量。测量不一定必须由现在确定预测组合物的化学实验室运营者进行,而是也可以由其它实验室进行和发布,因此在这种情况下,从专业文献中获得所述特性。因为根据上述定义的组合物还包含作为子集的配方,故根据本发明实施方式,“已知组合物”也可以包含“已知配方”,或者可以是“已知配方”。
[0040]“试验组合物”是指如下组合物,其指定如下化学品,在训练神经元网络时执行训练的人或组织并不知道该化学品的特性。例如试验组合物可以是以人工或自动方式详细说明的但尚未被用于实际生产相应化学品的组合物。相应地,该产品的特性也不为人知。因为根据以上定义的组合物还包含作为子集的配方,故根据本发明实施方式,“试验组合物”也可包含“试验配方”,或者可以是“试验配方”。
[0041]“预测组合物”在此是指如下组合物,经过训练的神经元网络对此预测(预言)由该组合物指定的化学品的特性对应于由用户设定的期望特性详细说明。例如,可以将期望特性的详细说明作为输入向量提供给神经元网络,该输入向量针对每个期望特性说明期望的或可接受的参数值或参数值范围。
[0042]“数据库”在此是指可存储数据且特别是结构化数据的任何数据存储器或存储区。数据库可以是一个或多个文本文件、电子表格文件、目录树中的目录或关系数据库管理系统(dbms)的数据库例如mysql或postgresql。
[0043]
预测问题的“损失函数”(也称为“目标函数”)是如下函数,其被用在神经元网络训练中并输出如下值,该值的大小指明经过训练的神经元网络的预测模型的质量并且在训练过程中应被最小化,这是因为该值的大小说明神经元网络的预测误差率。
[0044]
用于生产和检查组合物的“设备”在此是指由多个实验室设备和输送单元组成的系统,该系统能够以协调方式共同控制实验室设备和输送单元,以便自动或半自动地执行
化学工作流程。例如,工作流程可以是合成工作流程或分析工作流程或这两种工作流程的组合。
[0045]
借助该设备的“组合物检查”是指依靠测量技术来检测(分析)根据组合物中的说明所产生的化学产品的特性。
[0046]“主动学习模块”是指软件程序或软件程序模块,其设计用于从试验组合物的集合中有目的地选择试验组合物的(较小)子集,从而在合成且依据经验测量所选试验组合物的特性之后并且在神经元网络训练中考虑所述数据之后出现极强的学习效果。
附图简介
[0047]
在以下的图中将举例详细说明本发明的实施方式:
[0048]
图1示出用于训练神经元网络并适用经过训练的网络来预测液态介质的特性和/或预测组成的方法的流程图;
[0049]
图2示出用于训练神经元网络并适用经过训练的网络的分布式系统框图;
[0050]
图3示出多维数据空间的2d局部,“主动学习模块”从中有目的地选择数据点;
[0051]
图4示出具有输入向量和输出向量的神经元网络的架构。
[0052]
详细说明
[0053]
图1示出用于生成用于油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物的计算机实施方法的流程图。该方法例如可以由如图2所示的计算机系统224执行。
[0054]
在第一步骤102a)中,已知组合物被用作“初始训练数据组”以如此训练卷积神经元网络,即,响应于所接收的包含上述类别的化学产品的一个或多个期望特性的输入向量来预测表现出所述期望特性的预测组合物。预测组合物至少详细说明构成上述类型的化学产品(油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料)的组分的类型,并且可选地还详细说明其相应的量或浓度。已知组合物与由已知组合物指定的化学产品的已知的且凭经验确定的特性的组合代表在初始训练数据总体之内的单独数据点或数据组。
[0055]
在下一个步骤104(b)中检查损失函数的值是否满足规定标准。如满足了标准,则表明经过训练的神经元网络的预测精度被视为足够。对于未满足标准的情况,选择性地执行下述步骤106

112。否则,训练结束(步骤114)并返回完成训练的神经元网络。
[0056]
在步骤106中,主动学习模块从规定试验组合物的集合中自动选择试验组合物。存在可根据本发明实施方式使用的许多不同的主动学习方法。
[0057]
根据一个变型实现方式,主动学习模块遵循“预期模型变化”方法并选择如下试验组合物,其(当在考虑该试验组合物及其真正测量的特性之情况下重新训练网络时)将会最大程度地改变经过训练的神经元网络的当前预测模型。
[0058]
根据另一个变型实现方式,主动学习模块遵循“预期误差减小”方法并选择如下试验组合物,其将会最大程度地减小经过训练的神经元网络的当前预测模型的误差。
[0059]
根据另一个变形实现方式,主动学习模块遵循“最小边界超平面”方法并选择如下的试验组合物,其最接近在多维数据空间内由训练神经元网络的当前预测模型所界定的分界线或分界面。分界线或分界面是多维数据空间内的界面,预测模型在该数据空间中做出分类判断,即,在分界线或分界面一侧的数据点被归属为与在分界线另一侧的数据点不同的类或类别。“数据点靠近分界面”被解释为预测模型就分类判断而言是不可靠的,并且将
在很大程度上受益于如下情况,即,还从该分界面附近测得实测数据组(由组分且可选由其浓度以及根据该组分组合物所产生的化学品的测量特性的组合构成),以借此进一步训练神经元网络。
[0060]
在从数据库中选择其中一种试验组合物后,在步骤108中,计算机系统控制用于生产并检查化学组合物的设备,以根据在所选试验组合物中的说明来自动生产和检查化学品。该检查被理解为依靠测量技术采集化学品的一种或多种特性,例如测量ph值、色值、粘度等。
[0061]
在步骤108中获得的实测特性被用于补充所选的试验组合物,以产生由已知组合物和已知特性构成的完整的另一数据点,其用于扩展在a)或先前迭代中所用的训练数据组。因而在步骤110中,神经元网络基于扩展的训练数据组被重新训练。这可取决于变型实现方式来进行,因此再一次完全基于扩展训练数据组来完成训练,或者在步骤110中的训练是逐步进行的,因而迄今所学内容得以保留并且仅通过考虑新的训练数据点被改动。
[0062]
在步骤112中开始对经过训练的神经元网络的预测质量的重复检查,并且一直重复步骤104

112,直到网络具有足够的预测质量,这可以通过损失函数满足标准、即例如由损失函数计算出的“误差值”低于规定最大值来识别。
[0063]
训练完的神经元网络现在可被用于非常快速可靠地预测具有一个或多个期望特性的组合物(所谓的“预测组合物”)。为此,用户在步骤116中将输入向量输入到经过训练的神经元网络中,该输入向量详细说明一个或多个期望特性。例如,输入向量的元素可以由数值或值范围构成,其将被理解为期望的或可接受的值或值范围。例如可能要求生产粘度在一定值范围内且其颜色在一定颜色范围内的清漆。
[0064]
因为网络在多次迭代中已基于合理且专门扩展的训练数据组习得了在组分(和可选还有其浓度)与所得到的化学品的特性之间的统计相关性,故经过训练的神经元网络现在可以在步骤118中预测具有期望特性的预测配方并将其输出给用户和/或化学设备以便立即合成。
[0065]
训练神经元网络的目的是,经过训练的网络可以依据所输入的期望特性集合和相应的参数值范围来预测预测组合物,即,用以指定具有期望特性的化学品的至少类型和数量和可选还有相应组分的量。如果将所述预测应用于组分已知且实际特性已根据经验被测定的试验组合物,则存在正确或错误的预测结果。如上所述,“损失函数”被用于评估经过训练的神经元网络的预测质量。
[0066]
用于也可被理解为分类问题的预测问题的“损失函数”(也称为“目标函数”)例如在最简单情况下可以仅统计来自预测集合的正确识别的预测。正确预测的比例越高,经过训练的神经元网络的预测模型质量就越高。例如,流变特性如粘度是否在规定可接受范围内的问题可被理解为分类问题。
[0067]
但是,用于评估经过训练的神经元网络的预测精度的许多替代损失函数和相应标准也是可能的。例如网络可以接收呈输入向量形式的期望特性并使用该数据来预测组合物的组分的类型。在所述应用场合下,神经元网络应估计值而不是类别,即,例如组合物的组分的量。这些应用场合被称为回归问题。为此需要其它目标函数。例如用于回归问题的损失函数可能是如下函数,其计算网络预测值与实际测量值的相差程度。例如损失函数可以是如下函数,其输出值与在合成组合物的每个预测组分与当前所用组分之间偏差的集合值呈
正相关。例如该集合值可以是算术平均值。例如如果组合物的由网络预测的所有组分的关于当前所用组分而言的集合偏差(误差)低于规定阈值,则可将经过训练的神经元网络的质量视为足够。在这种情况下,神经元网络可被用于预测指定具有一种或多种期望特性的化学品的未知组合物。而如果在预测组分与当前所用组分之间的集合偏差比规定最大值偏差更大,则主动学习模块将自动促使通过选择另一试验组合物来扩展训练数据组,另一个试验组合物的合成和特性分析通过化工设备来促成,且所选的试验组合物与为此测量的特性一起作为附加数据点用在扩展训练数据组中,以在扩展训练数据组基础上重新训练神经元网络。
[0068]
在每次以迭代方式重新训练期间基于由设备确定的特性形成的输入向量包含根据所选试验组合物所合成的产品的凭经验所测定的特性。输出向量包含所选试验组合物的预测组分的集合,因而可以使用损失函数将预测组分与试验组合物的实际组分相比较。被用于测试损失函数的输入向量优选在每次迭代中都相同,使得由损失函数计算出的误差值的变化可追溯到网络预测模型的变化,而不是输入向量的变化。在一些实施方式中,损失函数也被用于具有凭经验所知道的特性的多个试验组合物,以便在确定损失函数是否满足一定标准时扩展数据库。
[0069]
在网络训练结束后,用于对预测组合物加以预测的经过训练的神经元网络可以依据输入向量来生成并输出,输入向量详细说明多个期望特性和相应的参数值范围。所述输出可以针对用户来进行和/或针对该设备来进行并且自动促使该设备根据预测组合物来生产化学品并凭经验检查其是否具有期望特性。
[0070]
概括地讲,所述方法尤其对于在油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物和其它涂料的生产范围内的预测组合物计算来说可能是有利的,因为有许多组分及其相互作用而导致几乎无法预测合适的组合物。例如,分散剂(也称为分散添加剂)通常被用于将固体(如颜料、填料或染料)分散在液体介质中,以达成固体的有效分散、进而减小分散所需的机械剪切力且同时实现尽可能高的填充度。分散剂有助于团聚体的破碎,作为表面活性材料湿润和/或覆盖待分散固体或颗粒的表面并且使其稳定以防止不希望的再团聚。在油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物和其它涂料的生产中,分散剂简化了固体如颜料、染料和填料的添加,其作为组合物的重要成分主要决定了这种系统的视觉外观和物理化学特性。为了最佳利用,所述固体一方面必须应当分散在组合物中,另一方面使所达到的分散保持稳定。当今,大量不同的物质被用作固体分散剂。除了很简单的低分子化合物如卵磷脂、脂肪酸及其盐和烷基酚乙氧基化物外,更复杂的高分子结构也被用作分散剂。在此尤其是被广泛使用的氨基和酰胺基官能系。分散剂的选择和浓度会显著影响产品特性。
[0071]
图2示出分布式系统200的框图,其用于训练神经元网络226和使用经过训练的网络来预测组合物、特别是油漆、清漆、印刷油墨、研磨树脂、颜料浓缩物或其它涂料的组合物。
[0072]
该系统包括具有已知组合物206和试验组合物208的数据库204。如上所述,在最简单的情况下,数据库可以由存储区组成,在存储区中存储有一个或多个文件如文本文件或逗号分隔文件。在图2所示的实施方式中,数据库200是数据库管理系统(dbms)的数据库,例如关系型dbms如mysql。特别是在较大的数据组情况下,使用关系型dbms来管理和快速查询数据组是有利的,因为可以更精确指定且更快执行所述查询。例如,已知组合物206可被存
储在第一数据库表中,而试验组合物208可被存储在另一个数据库表中。但也可能的是,所有已知组合物和试验组合物都被存储在唯一的表中,并通过元数据/“标志”来相应标示不同类型的数据组。数据存储类型可以由本领域技术人员自由选择,前提是存储类型允许两种组合物类型的逻辑区分。
[0073]
已知组合物206例如可以是数据组的集合,每个数据组包含实际上已至少一次被用来合成相应化学品的组合物和该产品的物理、化学、触觉、光学和/或其它可依据测量技术来测知的特性。例如,已知组合物206可以是所有如下组合物,其先前已由某个组织、由某个实验室或某个实验室设备244合成且其至少一个上述可依据测量技术采集的参数已凭借经验被测得。
[0074]
存储在数据库204中的已知组合物206因此有以下特点,即,不仅知道了其组分(即单独的化学成分及其相应的量或浓度说明),也知道了根据所述组合物所合成的化学品的至少若干可依据测量技术测知的特性。因此,化学品的每个已知组合物在数据库204中以数据组形式来表示,该数据组包含该产品的组分以及该产品的依据测量技术所测知的所述特性。
[0075]
而存储在数据库204中的试验组合物208是如下组合物,其物理、化学、触觉、光学和/或其它可以依据计量技术测知的特性至少尚未被数据库和/或实验室设备244的运营者所知。这在图2中用问号来表示。即,试验组合物在数据库204中以数据组形式来表示,该数据组虽然表征化学品的组分(即,单独的化学成分以及可选地还有其相应的量或浓度说明),但未表征该产品的依据测量技术所测得的所述特性。例如所述特性可能并不存在,因为相应的组合物尚未被任何人或至少未被相应的实验室或实验室设备用来合成相应的化学品。
[0076]
在一些实施方式中,试验组合物208可由本领域技术人员人工创建并被存储在数据库中。例如,化学家能够基于其在合成油漆和清漆方面的经验及其相应特性来详细说明本领域技术人员期望有某些期望材料特性的新试验组合物。例如,试验组合物可如此来生成,即,本领域技术人员通过省略或新增单独组分来修改已知组合物。如果该组合物也包含一种或多种组分的浓度(“配方”、“扩展的组合物”),则也可以通过改变在已知组合物中的组分浓度来形成这种扩展的试验组合物。
[0077]
在其它实施方式中,试验组合物208是自动创建的并被存储在数据库204中。例如每个已知组合物206可以由20种不同的化学组分构成。试验组合物208现在如此自动生成,即,该组合物的单独组分被其它物质取代。
[0078]
如果组合物是具有浓度说明的“扩展”组合物,则还可以通过改变已知组合物206的单独组分的量、即例如增加10%和/或减少10%来形成试验组合物。如果分别总是通过采用该组分的增加10%的量以及减少10%的量来仅改变唯一的组分,则因此对每个组分形成两种变体。在使用20个组分情况下,利用该方法出现40个试验组合物。自动生成的试验组合物的数量优选还被进一步增加,做法是与在已知组合物中的浓度相比两种或更多种的组分的浓度同时被增减10%。通过这种方式,可以单纯以组合的方式自动产生2
20
=1048576种扩展试验组合物。试验组合物的数量还可以被显著增加,做法是更多的浓度变体、即例如

20%、

10%、 10%、 20%被用于20种组分中的每一组分,和/或省掉或附加适用化学组分。因此,试验组合物的量可能非常高,尤其在自动生成试验组合物时。
[0079]
在一些实施例中,试验组合物208不仅包括人工创建的试验组合物、也包括自动生成的试验组合物。
[0080]
例如,试验组合物的自动生成可能是有利的,因为由此可以通过快速方式覆盖由组分和或许还有其浓度构成的很大的参数空间,其通常在使用口头试验组合物生成算法时广泛且粗略地覆盖单独的组分及其浓度。
[0081]
人工补充的试验组合物可以是本领域技术人员依据其经验知识满足神经元网络的很好学习效果的试验组合物,或者本领域技术人员通过合成而因其它缘故保证认知优势的试验组合物。
[0082]
在图2中如此示出通常大量的试验组合物,即,数据库204仅包括100个已知组合物、但包括900个试验组合物。然而,已知组合物和试验组合物的实际数量比主要取决于具体情况,即,例如取决于某个实验室已产生多少组合物且确定其化学特性、取决于数据库是否整合有来自外部源的已知组合物及其特性和/或取决于试验组合物是否是人工创建或自动创建的。因此,完全可能的是数据库204包括数千个已知组合物。通常,试验组合物的量明显高于就成本和盈利而言真正能由实验室实际执行的凭经验的合成试验的量。
[0083]
分布式系统200还包括计算机系统224,其包括神经元网络226和主动学习模块222。主动学习模块222访问数据库204。访问至少是读访问,以便能从数据库204中读取一种或多种所选的试验组合物及其组分。根据一些实施方式,主动学习模块和/或根据所选的试验组合物来合成并依靠测量技术来分析化学品的化工设备244也具有对数据库204的写权限,以便在数据库内存储针对所选试验组合物依靠测量技术所测得的特性。例如,所选的新合成试验组合物的依靠测量技术测得的特性的存储可能导致该试验组合物变成已知组合物并且相应地被存储在数据库204内的另一位置和/或带有其它元数据(“标记”)。例如dbms 202可被安装在数据库服务器上,从而主动学习模块和/或化工设备244借助网络来访问数据库204。网络尤其可以是组织的内网,但也可以是互联网。
[0084]
其它系统架构也是可能的。因此,例如数据库204或dbms 202也可以是计算机系统224或主控计算机246的组成部分,和/或神经元网络226和主动学习模块222可以安装在彼此不同的计算机系统上。不管实际所选的架构如何,可以如图2所示地如此达成数据210、212、214、218的交换,即,参与该过程的所有组成部件都能从其它组成部件收到所需输入数据。在此,数据交换能直接或间接通过其它组成部件例如网关进行。例如在一些实施方式中,化工设备可以将针对所选试验组合物依靠测量技术所测得的特性直接存储在数据库204中或仅将其发送到计算机系统224,计算机系统然后如此将其存储在数据库204中,即,试验组合物的数据组被补充所述特性,由此成为“已知组合物”。
[0085]
根据另一个替代系统架构,计算机系统224和主控计算机246是彼此相同的计算机系统。
[0086]
根据本发明的实施方式,计算机系统224或安装在其上的组成部件226、222被设计成首先从数据库中读取已知组合物206并将已知组合物206作为训练数据组210用于神经元网络226的初始训练。在训练神经元网络的过程中生成神经元网络的预测模型,该模型基于该训练数据组来描绘合成化学品所用组分(即组合物)与合成产物的依靠测量技术所测得的特性之间关系。借助在训练过程中获得的该预测模型,经过训练的神经元网络可以依据呈输入向量形式所输入的期望特性来预测组合物,该组合物详细说明可能具有期望特性的
产品。例如期望特性可以是化学品粘度在某个参数值范围内。
[0087]
因为已知组合物206及其特性的数量有限,在初始训练阶段后所获得的训练神经元网络226在某些情况下尚不能基于期望特性清单来充分可靠地预测组合物的组分。对此,所用数据库通常太小。
[0088]
如果通过在设备244中合成所有试验组合物且随后依靠测量技术确定其特性来扩展训练数据组,通常过于昂贵和/或过于复杂。根据本发明的实施方式,主动学习模块的使用允许有针对性地选择少量的若干试验组合物并仅借此在化学设备244中合成并分析相应的化学品,以便通过尽可能少的合成(进而尽可能低的成本和努力)来扩展训练数据组,从而通过基于扩展训练数据组重新训练来明显改善神经元网络226的预测模型的预测能力。在基于扩展数据组重新训练神经元网络后,使用损失函数228来再次检查神经元网络的预测能力。如果此时未满足规定标准,即,如果损失值超过规定最大值,这例如意味着神经元网络或其预测模型的质量仍还是不够高并且应基于还要更进一步扩展的训练数据组来重新训练。在这种情况下,主动学习模块执行与迄今尚未被选择且未被用于合成相应介质的试验组合物相关的重新选择步骤。如上所述,基于所选的试验组合物和该产物的依据测量技术所测得的特性来达成化学品的合成,从而可以将所选的试验组合物连同测定特性作为新训练数据组添加到现有的训练数据中,以便基于被更进一步扩展的训练数据组来重新训练神经元网络226。因而在多次迭代中,通过自动且有针对性地选择保证很显著地改善神经元网络预测模型的试验组合物以及基于相应所选的试验组合物自动执行合成和分析步骤,可以快速高效地改善神经元网络预测能力。当在迭代后确定损失函数满足标准时,不再需要扩展训练数据组,因为经过训练的神经元网络的预测能力可被视为足够。
[0089]
待选的试验组合物的鉴别例如可以如图3所示地进行。主动学习模块222被配置用于从数据库204中读取所鉴别的试验组合物(例如借助针对关系数据库的选择指令214)并将其传输到化工设备244。计算机系统224因此包含用于与设备224通信的接口和/或是该设备的组成部分。该设备配置用于基于所选试验组合物212合成化学品并测量合成产物的一种或多种特性。例如该设备可包括多个合成机器254、256或合成模块和多个分析仪252(或分析模块),它们分别在合成或分析化学品或其中间产物时执行一个或多个步骤。该设备还具有一个或多个输送单元258如传送带或机械臂,其在各不同合成和/或分析单元之间来回运送组分、中间产品和耗材。设备244包括具有控制软件248的主控计算机246或通过网络以可操作的方式链接至这样的计算机248。
[0090]
控制软件248配置用于协调由合成和分析单元和输送单元所执行的合成、分析和/或输送步骤,从而根据在所选组合物212中的说明来合成化学品并且以测量技术来测知其特性。优选地,控制软件将新合成的所选组合物的测知特性218(直接或在计算机224的帮助下)存储在数据库204中,使得所述特性与所选试验组合物以相关联的方式被存储起来。因而在此情况下,所选试验组合物的“不完整”数据组借助于依靠测量技术在设备244中测知的特性而被补充,由此被转换为“已知组合物”。
[0091]
此外,所选试验组合物的特性218被传输给计算机系统244,从而由主动学习模块选择的组合物212及其特性218的组合表示新的完整数据组,以此扩展整个训练数据。在扩展的训练数据组基础上,神经元网络被再训练,并借助损失函数228来测试训练数据扩展对神经元网络预测质量的影响。如果损失函数的值满足规定标准、即例如只具有低于最大值
的损失值,则可以结束训练。否则,标准检查结果被传输给主动学习模块并促使它选择另一个试验组合物。
[0092]
根据一些实施方式,用于化学产品的合成和分析的设备244或还有多个设备是分布式系统200的组成部分。
[0093]
设备244可以是高通量设备(hte系统)、例如用于分析和生产油漆和清漆的高通量设备。例如,hte设备可以是如wo 2017/072351 a2所描述的用于自动测试和自动生产化学品的系统。
[0094]
本领域技术人员因此可借助图2所示的系统而无需以盲目复杂的方式合成和分析多个滴定级和组分组合物以获得足够大的训练数据组。由于组分、其相应组合和浓度彼此之间极其复杂的关系以及化学品的各种依据测量技术可测得的特性与其组分和浓度的相关性的复杂性,本领域技术人员通常几乎无法在心中整体掌握所有这些相关性并且有目的地人工详细说明可预见的组合物。鉴于组分和浓度的可能组合空间的巨大规模,技术员总是实际上只能凭经验测试该可能性空间的比较小且基本随机所选的一部分。因此,迄今为止不可避免的是,花费大量时间和材料来合成和分析的化合物最终具有不希望的产品特性和/或在用作训练数据组的一部分时并未造成神经元网络的预测模型质量的任何明显改善。通过使用主动学习模块来针对性地选择少量若干试验组合物,可以显著加速提供适于开发准确的神经元网络的训练数据组的过程。
[0095]
在另一有利方面,根据本发明的实施方式,系统200可被用于提供如下训练数据组,其通过有针对性地选择试验组合物来最佳补充由历史决定的现有已知组合物组。已知组合物206可以是在实验室或实验室设备的运行过程中已合成、分析且相应数据被存储的组合物及其特性。因此,已知组合物可能并未均匀分布在由组分和可选还有浓度组合而成的可能空间范围内,而是随机来自实验室或设备的运行历史。主动学习模块可被使用和配置成以少量的其它试验性合成和分析来补充神经元网络的最初基于依据已知组合物206的初始训练所形成的预测模型,以便例如现在借助有目的地选择的试验组合物来覆盖仅被已知组合物206不充分覆盖的组分和浓度。
[0096]
在神经元网络迭代训练结束后,经过训练的神经元网络可被用于预测如下组合物(“预测组合物”),其具有某些可依据测量技术测得的特性、即例如关于化学或物理或其它参数位于规定的期望值范围内。为此,期望特性作为输入向量被表示并被输入到经过训练的神经元网络中。神经元网络随后确定能产生具有期望特性的化学品的组分的类型(以及可选还有其量)。预测组合物可以由神经元网络自动传输给设备244并与控制指令一起产生根据预测组合物的化学品。可选地,控制指令还能促使设备自动测量该产品的特性并将预测组合物连同为此获得的特性存储在数据库中并由此扩展已知组合物的集合。
[0097]
图3示出多维数据空间300的2d局部,“主动学习模块”从中有目的地选择数据点308以扩展训练数据组。训练过程中,依据详细说明组合物特性的输入向量,神经元网络学习计算代表组合物、即化学品组分规格的输出向量。根据本发明的实施方式,输入向量所详细说明的特性尤其包含以下特性以及两种或更多种以下特性的组合:储存稳定性,ph值,流变学特别是粘度,密度,相对质量,颜色学尤其是颜色强度,生产时的成本降低和颜料产量提高。生产时的成本降低例如可以在组合物合成过程中由化工设备来自动测知,并且例如参照规定的参考值。但也可行的是人也能人工获知成本。通常,只能在输入向量中详细说明
如下特性,其也是用以训练神经元网络的训练数据组的组成部分。
[0098]
在神经元网络被初始训练之后,它已经基于已知组合物“学到”了组合物组分及若干特性之间的某些关系。这些学到的关系在此由分界线316说明,分界线将关于“粘度”特性的数据空间300划分为在分界线318左下方的具有流变学上可接受的产品特性的数据空间320和具有在分界线右上方的流变学上不可接受的产品特性的数据空间318。图3只能显示出数据空间300的局限于二维或两个对应分量(“颜料p1浓度”和“分散剂浓度”)的部分方面。数据空间300本身是多维的,它例如可以在20个组分下具有20个相应维度,并且由这20个维度形成的空间中的每个空间都关于所关注的相应特性具有自己的分界线或多维分界平面(“超平面”)。
[0099]
在图3中以圆圈表示的数据点分别代表试验组合物208之一。可以根据所谓的“最小边界超平面”方法来选择试验数据点之一。例如,主动学习模块可被设计为支持向量机或其它的算法,其为此能够依据已被神经元网络226学到的预测模型将由试验组合物所界定的关于一个或多个特性(或组分)的数据空间划分为子空间。已学会的神经元网络模型因此在这里由分界线或分界平面316表示。“最小边际超平面”方法假设,具有至分界线316的最小距离的数据点是如下数据点,此时也由分界线316表示的已学习的预测模型是最不可靠的,因此属于该数据点的试验组合物应被选择、合成和分析,以凭经验确定实际特性、在此例如是粘度。在在此所示的例子中,主动学习模块在仅考虑性能“粘度”的情况下因此将选择由数据点308表示的试验组合物,并促使化工设备244合成并分析该组合物,以用该试验组合物的组分及其靠经验测量的特性来扩展该训练数据,并通过基于扩展训练数据组的训练来改善神经元网络。例如可能的是,根据由点306表示的组合物的靠经验的测量表明其粘度处于在流变学上不可接受的范围320内。因此,基于扩展训练数据组的重新训练导致了在此由分界线316以图形方式所表示的神经元网络预测模型如此调整,即,就诸如由点306表示的组合物而言未来预测其粘度位于范围320内。因此,分界线/分界平面316将通过基于扩展训练数据组的重新训练而被修改,使得所述线或平面获得朝向右上方的“隆凸”,从而改进的神经元网络现在可识别并预测由点308表示的组合物位于在流变学上不可接受的范围320中。在实践中,在选择数据点或相应的试验组合物时优选考虑相应数据点至多个特性的分界线的距离,例如做法是选择具有距数据空间300的所有分界线/分界平面的最小平均距离的数据点。
[0100]
图4示出了经过训练的神经元网络的架构,其被配置和训练用于作为输入接收输入向量402并从中计算和输出输出向量406。输入向量详细说明组合物的期望特性或相应的参数值范围,该组合物的组分(以及可选地还有相应组分的浓度或量)应由神经元网络来预测(预言)。输出向量406详细说明预测组合物的组分以及可选地还有预测组合物中的这些组分的量或浓度,其中,预测组合物是如下组合物,神经元网络预测其特性位于输入向量中预先规定的参数值范围内。网络包括多个神经元层404,它们通过加权数学函数与其它层的神经元相关联,使得网络可依据输入向量所详细说明的期望特性来计算、即预测相应组合物的组分,并且能以输出向量406的形式输出所述组分和进而预测配方本身。
[0101]
在训练之前,神经元网络的神经元先用规定的或随机的激活项(权重)被初始化。在训练期间,网络接收表示已知组合物的凭经验测量的特性的输入向量,计算具有该组合物的预测组分(和可选的组分集合)的输出向量,并针对预测组分与实际所用组分的偏差而
由损失函数惩罚。所确定的预测误差通过被称为反向传播的过程被反向分配给造成预测误差的相应神经元,并造成某些神经元的激活项(权重)被如此改变,即,预测误差(进而损失函数的值)减小。从数学角度来看,为此可以确定损失函数的斜率,从而可以有针对性地改变神经元的激活项,使得由损失函数所输出的值最小化。一旦预测误差或损失函数值低于规定阈值,则经过训练的神经元网络被视为足够精确,故不需要进一步训练。
[0102]
例如所述任务可以是生成一种新的未知组合物,其具有在值范围vwb内的一定粘度、在值范围fwb内的一定颜色和在值范围awb内的耐磨性。在其在实验室中实际合成之前,应首先使用神经元网络来自动确定详细说明化学品组分的组合物的组分,所述组分的粘度、颜色和耐磨性位于期望的值范围vwb、fwb和awb之内。如果没有找到特性位于期望值范围内的预测组合物,则可以从一开始就放弃合成并可以节约成本。在这里可能有意义的是改变与特性相关的设定条件。
[0103]
该新组合物的组分和可选还有其相应期望浓度作为神经元网络的输出向量406被输出给用户以便人工评估和/或被输出给化工设备。输出向量可以包含例如预测组合物的20个组分,神经元网络预测其或根据预测组合物所合成的化学品具有期望的特性。所输入的特性是在训练神经元网络时也已被考虑在内的特性根据组合物的或被视为相关的特性的类型,向量402、406在其它实施方式中也可以包括更多或更少的元素。
[0104]
附图标记列表
[0105]
102

118
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
步骤
[0106]
200
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
分布式系统
[0107]
202
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
dbms
[0108]
204
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
数据库
[0109]
206
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
具有特性的已知组合物
[0110]
208
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
试验组合物(特性未知)
[0111]
210
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
初始所用的训练数据组
[0112]
212
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
所选试验组合物
[0113]
214
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
关于试验组合物的选择指令
[0114]
218
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
所选试验组合物的凭经验确定的特性
[0115]
222
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
主动学习模块
[0116]
224
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
计算机系统
[0117]
226
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
神经元网络
[0118]
228
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
损失函数
[0119]
244
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化工设备
[0120]
246
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
主控计算机
[0121]
248
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
控制软件
[0122]
252
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
分析仪
[0123]
254
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
合成机器
[0124]
256
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
合成机器
[0125]
258
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
输送单元
[0126]
300
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
试验组合物的多参数数据空间的2d局部
[0127]
302

312
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
数据点(分别代表相应的试验组合物)
[0128]
316
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
经过训练的神经元网络的预测模型的分界线
[0129]
318
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
流变学上的可接受区
[0130]
320
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
流变学上的不可接受区
[0131]
400
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
神经元网络结构
[0132]
402
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
输入向量
[0133]
404
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
神经元网络层
[0134]
406
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
输出向量
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献