一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于预测工厂中菌株性能的方法和系统与流程

2022-07-24 03:40:49 来源:中国专利 TAG:


1.本发明涉及用于通过生物质发酵来预测菌株在生物乙醇生产过程中的性能的方法、系统和计算机程序。


背景技术:

2.随着诸如化石燃料的有限的能源得到补充,可再生能源变得越来越重要。此外,化石燃料燃烧导致的温室污染日益严重,这也导致了全球变暖和其他生态灾难。诸如生物乙醇的生物燃料可以在未来的能源解决方案中提供重要优势。
3.生物乙醇是一种可再生燃料源,未来可以开发成完全可持续的。燃烧生物乙醇的二氧化碳净释放量为零,硫含量极低。因此,生物乙醇对温室气体的影响以及由此产生的对全球变暖的影响大大降低,因此具有远优于化石燃料的环境特性。最后,与开采化石燃料相比,生物乙醇的生产在经济上应该是可行的。最后一个论点应考虑多种因素;一方面,化石燃料源变得越来越稀缺,因此开发成本更高,另一方面,进行研究以使生物乙醇的生产尽可能高效。
4.生物乙醇由生物质源生产。目前,许多研究都集中在开发用于生产生物乙醇的理想原料以及如何优化所述理想原料的生物乙醇生产工艺。需要考虑多种因素:生物质的化学成分,耕作方式,可用土地及其土地利用方式,生物质资源的使用方式以及生物质中有多少可用作生物乙醇和/其他可再生资源,整个过程的总能量平衡,温室气体、酸化气体和臭氧消耗气体的平衡,矿物质对生物质生长土地的水和土壤的吸收,是否存在农药,土壤侵蚀的可能性,生物质生产是否有助于生物多样性,经济方面,例如生物质的农场出场价值、生物质运输和储存的物流成本、生物乙醇生产后副产品的价值、就业机会、最后是水的需求和水的供应。
5.生物质包含的成分大致可分为以下几类:纤维素、半纤维素、木质素、提取物、灰分和其他化合物。其中,纤维素、半纤维素和木质素是生物质中最丰富的。纤维素是由成百上千个β-[1

4]-连接的d-葡萄糖单元组成的直链多糖。它是绿色植物、许多藻类和卵菌的初生细胞壁的结构成分之一。半纤维素是一种杂聚物和多糖,很容易被酸或碱或酶水解。半纤维素的实例包括木聚糖、葡糖醛酸木聚糖、葡甘聚糖和木葡聚糖。最后,木质素是一类复杂的有机聚合物,是交联的酚类聚合物。木质素在细胞壁的形成中很重要,并导致生物质变硬。通常,木质素是造纸过程中的副产品,通常作为燃料燃烧。
[0006]
生物质可以通过化学或酶水解或通过微生物发酵分解成生物乙醇,例如啤酒酿造中的情况。
[0007]
预测生物质的微生物发酵是否会成功可能具有挑战性。许多因素在这个过程中发挥作用,并且不能确定在一种原料上表现良好的特定微生物菌株在另一种类型的原料上也表现良好。在这种情况下,代谢过程通常过于复杂以至于无法理解或建模,因此通常无法根据这些过程以准确的方式做出预测。此外,实验室环境中的实验并不总是能很好地转化为工业规模的生产工厂,从而导致巨大的损失和研究的巨大挫折。
[0008]
需要克服这些问题和/或避免在新工厂中对特定菌株进行昂贵且耗时的全面测试。


技术实现要素:

[0009]
本发明的一个目的是提供一种消除上述缺点中的至少一个的方法和系统。
[0010]
另外或替代地,本发明的一个目的是提供对工厂中菌株性能的改进预测。
[0011]
此外,本发明提供了一种用于预测菌株在过程中的性能的方法,所述菌株能够发酵生物质以生产至少生物乙醇。该方法包括以下步骤:接收与在第一地点生产生物乙醇的第一过程中的第一菌株的性能有关的第一过程数据集,接收与在第一地点生产生物乙醇的第一过程中的第二菌株的性能有关的第二过程数据集,接收与在第二地点生产生物乙醇的第二过程中的第一菌株的性能有关的第三过程数据集,第二地点不同于第一地点,并且其中第一、第二和第三过程数据集各自包括一个或多个过程简况(process profile)和/或过程响应,确定第一过程数据集和第二过程数据集之间的第一相关性,以及确定第一过程数据和第三过程数据之间的第二相关性,以及通过缺失数据插补来重构与在第二地点生产生物乙醇的第二过程中的第二菌株的性能有关的第四过程数据集,其中第四过程数据集是基于第一相关性和第二相关性估计的。
[0012]
因此,该方法允许预测性能,而不需要试错。试错法成本高,耗时长,并且结果不可预测。通过提供对特定工厂结果的预测,可能需要更少的时间,并且结果可以变得更加可预测。因此,所涉及的成本可以大大降低。
[0013]
根据本发明的方法允许利用各地点处的菌株数据集之间的特定关系来估算新的未测量数据集。通过这种方式,可以建立改进的预测模型,以适用于分析菌株在新地点或工厂中的表现。在第一地点的过程中可能已经分析了一定数量的菌株,并且这些菌株的亚组也在与第一地点不同的第二地点的相同过程中被表征。该数据可用于确定在第二地点对未测试菌株的缺失数据插补所需的相关相关性。
[0014]
在将生物质发酵成生物乙醇时需要考虑许多参数。通过比较不同菌株例如酵母在特定工厂中的性能,当放置在不同的工厂中时,可以基于该不同工厂中其他菌株的性能做出预测。
[0015]
在一个示例中,第二菌株是第一菌株的改进,其中第一菌株用于在工厂中由生物质发酵生产生物乙醇。通过比较两个菌株,例如在实验室环境中,可以预测改进的菌株在工厂中如何起作用。
[0016]
应当理解,地点可以广义地解释为执行过程的位置。在一些示例中,地点代表工厂,该工厂可以是工业生产设施(参见制造厂)。
[0017]
可以使用各种数据类型来执行基于缺失数据插补的预测。数据可以包括过程简况、过程响应和/或过程条件。也可以考虑其他附加的过程参数/变量。不同工厂的过程设置可能不同(例如,一个工厂使用在过程中使用更大量的成分)。最终产品,尤其是生物乙醇,是通过使用菌株的过程获得的。过程可能有相同的步骤,但不同地点的过程的尺寸、参数等可能不同。
[0018]
过程简况可以包括时间序列数据,例如在过程期间监测的指示糖、乙醇、其他相关化合物、温度、ph曲线等的值。此外,可以为该过程提供设定点或目标值。过程简况还可以包
括过程响应,例如乙醇产量是该过程的关键性能指标。应当理解,存在该过程的各种其他响应,例如甘油水平、细胞计数、过程中使用的酵母量等。
[0019]
可选地,重构的第四过程数据集用于拟合预测模型,该预测模型被配置为预测在第二地点的第二过程中的第二菌株的性能。
[0020]
通过缺失数据插补,可以利用可用的主要和次要数据集中包含的所有信息来完全重构与在第二地点未分析的菌株相关联的简况。这些简况可以可选地用于拟合适用于评估新工厂中菌株的性能的改进的预测模型。
[0021]
可以对预测的数据集进行建模,以便更好地预测其他工厂中菌株的性能。在这种情况下,预测模型对实现第二工厂中第二菌株的性能的最佳预测是理想的。在一些示例中,预测模型可以被配置为使用统计数据来预测结果。
[0022]
可选地,预测模型被用于调整操作参数,以改善在第二地点的第二过程中的第二菌株的性能。
[0023]
预测模型允许输入过程简况和/或过程响应。然后,预测模型可以通过优化过程响应来为预测的数据集提供优化的过程简况。因此,模型可以根据输入参数预测模型的结果。
[0024]
基于对新地点菌株的预测,可以对过程条件和/或参数进行更改,以提高性能(优化),例如考虑到季节性因素。有利地,从不同地点(例如乙醇工厂)获得的数据可用于优化新地点或现有地点的过程。
[0025]
在一些示例中,添加了带有在地点的过程中使用的配方(参见成分)的额外2d数据、温度、ph等。此信息也可以添加到新工厂的预测模型。可以执行优化以设置工厂设置,以改进一个或多个过程简况。
[0026]
预测的缺失数据可以包括响应。基于该响应,可以执行优化。可以理解,可以使用不同的优化算法。例如,可以做出多个预测(基于许多过程输入),并且可以观察哪个输入提供了改进的结果。在一些示例中,可以执行实验优化的设计。实验响应模型的设计可以预测过程的优化参数集。
[0027]
当菌株x被引入新工厂时,在某些情况下,可能会获得不同工厂的菌株x的数据。该信息还可用于优化第一工厂。然后可以反馈该信息,可能与预测算法相结合。
[0028]
在一些示例中,机器学习模型(例如人工智能模型)可以用于预测。可以配置机器学习模型来描述(一个或多个)输入和(一个或多个)响应之间的关系。
[0029]
可选地,在第一地点的第一过程在实验室中进行,并且其中在第二地点的第二过程在工厂中进行,该工厂优选地是工业规模的生物乙醇生产工厂。
[0030]
已经获得的数据集可用于预测缺失数据。然而,有利地,实验室实验也可用于获得用于执行预测的新数据集。
[0031]
在一些示例中,可能需要来自两个不同地点/工厂中的两种不同菌株的数据来获得预测。然而,在某些情况下,为两个不同的地点/工厂获取正确的数据(例如工业工厂的多种条件)可能具有挑战性。在一些示例中,可以使用可从其中进行菌株追踪的一个工厂获得的数据。例如,另一工厂中的基线可能仅具有与菌株y相关的数据。根据本发明,可以预测如果在新工厂中使用菌株x,在使过程在新工厂中操作之前结果是什么。例如,如果预测不令人满意,则可以跳过使过程在新工厂中操作(参见昂贵的程序)。在一些有利示例中,第一地点是实验室。进行小规模实验室测试会容易得多。
[0032]
可选地,在实验室中进行一个或多个小规模实验室实验以确定第一过程数据集或第二过程数据集中的至少一个。
[0033]
新菌株的研究可以在实验室环境中初步进行,这在进行更大规模的实验之前通常是期望的和可取的。通过允许将实验室规模的实验转化为生产工厂,可以大大降低初始生产成本。
[0034]
在一些示例中,与工厂1中的菌株x有关的信息可能不可用。为此,可以进行小规模测试,例如在实验室中。这种实验室规模的测试可用于填写信息,以便能够使用根据本发明的方法进行预测。例如,工厂1可以是实验室规模的,例如在实验室甚至小型测试模块中进行。有利地,以这种方式,工厂1可能不需要来自大规模工厂的信息。可以更容易地进行实验室规模的实验,从而允许更容易的变化。
[0035]
可选地,第一地点处的第一过程通过计算模型来建模,其中计算模型用于确定第一过程数据集或第二过程数据集中的至少一个。
[0036]
计算模型可用于对生物乙醇生产过程进行建模。计算模型允许更灵活地调整过程中的条件和/或参数,从而实现更大的设计自由度。在一些示例中,计算模型具有比非计算模型更准确的可能性的优点,因为可以考虑许多参数。
[0037]
可选地,至少部分地使用回归模型预测与在第二地点的第二过程中的第二菌株的性能有关的缺失数据。
[0038]
回归分析是一种众所周知的模拟缺失数据的方法。这可以包括线性和/或非线性回归模型,具体取决于数据集。
[0039]
可选地,回归模型包括以下中的至少一者用于缺失数据插补:多元回归、主成分回归、偏最小二乘回归或修剪分数回归。
[0040]
通过实施任何上述回归模型,可以对第四数据集的缺失数据做出更准确的预测,其中包括与在第二地点的第二过程中的第二菌株的性能有关的数据。
[0041]
可选地,在确定第二相关性之前,将与第一过程数据和第三过程数据中的不同批次有关的数据集中的数据阵列相对于彼此打乱。
[0042]
与批次相关的数据可能来自不同的地点(例如工厂),例如在第一地点的第一菌株和在第二地点的第一菌株。例如,菌株可能是这种情况下的唯一共性。因此,一个地点的批次可能不对应于另一个地点的批次。可选地,数据可以在第一地点的第一菌株的数据和/或第二地点的第一菌株的数据中打乱。打乱可以产生足够的变化来更好地捕捉差异。这样,可以提高预测的准确性。
[0043]
可选地,数据阵列被随机或伪随机地打乱。
[0044]
可以以不同的方式排列行。例如,可以随机或准随机地排列行以进行打乱来获得更好的预测。
[0045]
可选地,至少部分地使用经过训练的人工神经网络模型来预测与在第二地点的第二过程中的第二菌株的性能有关的缺失数据。
[0046]
可以使用历史数据训练人工神经网络。人工神经网络的优点是可以很容易地适应即将来临的过程。应当理解,也可以采用其他机器学习算法。
[0047]
可选地,在第一地点的第一过程和在第二地点的第二过程在彼此不同的工业规模的生物乙醇生产工厂中进行,优选也在相对于彼此远离的位置进行。
[0048]
生物原料的生物乙醇生产的主要问题之一是在原料批次或源之间存在变化,例如由于不同的气候或不同的土壤,所述原料的不同变体等。因此,我们在此提供预测任何过程参数的变化将如何影响输出参数的解决方案,例如在两个工厂之间,不同的过程参数是需要或必要的。
[0049]
可选地,过程数据集包括针对多个时间点的指示糖消耗、乙醇生产、ph值、反应温度、生物质组成、酶组成、酵母细胞计数或甘油生产中的至少一项的值,其中优选地,过程数据集还包括与多个批处理过程相关的数据。
[0050]
可选地,该过程至少部分地涉及乙醇的生产。在一些示例中,该过程涉及使用酵母菌株生产生物乙醇。例如,可以提供玉米浆。可以将该浆引导至繁殖槽,酵母在其中繁殖。然后可以将生产的产品引导至发酵罐。这之后可以是蒸馏步骤。在一些示例中,提供了后退步骤,例如来自蒸馏的产物(例如水)可以返回到较早的过程步骤。在该过程中,可以在一个或多个过程步骤中控制温度。因此,可以设置一个或多个目标温度。然而,全年室外温度可能存在差异,因此冷却单元可能无法充分应对这些室外温度波动。通常,该过程可以是预定义和/或预设的。例如,相同的单元操作可以用于“相同”的过程。然而,在执行该过程的条件中可能存在相对较小的差异。例如,某些地点(例如工厂)的温度变化可能很小;过程中使用的(固体)生物质例如玉米的量可以不同;ph值可以不同;用于制造浆的酶可以不同(例如不同的生产商);生物质本身例如玉米可以不同;季节性影响(夏季-冬季);操作条件略有不同;等等。这些可能会导致相同预定义/预设过程中的微小差异。
[0051]
根据一方面,本发明提供一种用于预测菌株在过程中的性能的系统,该系统包括用于执行用于预测菌株在过程中的性能的方法的装置,所述菌株能够发酵生物质以生产至少生物乙醇。该方法包括以下步骤:接收与在第一地点生产生物乙醇的第一过程中的第一菌株的性能有关的第一过程数据集,接收与在第一地点生产生物乙醇的第一过程中的第二菌株的性能有关的第二过程数据集,接收与在第二地点生产生物乙醇的第二过程中的第一菌株的性能有关的第三过程数据集,第二地点不同于第一地点,并且其中第一、第二和第三过程数据集各自包括一个或多个过程简况和/或过程响应,确定第一过程数据集和第二过程数据集之间的第一相关性,以及确定第一过程数据和第三过程数据之间的第二相关性,以及通过缺失数据插补重构与在第二地点生产生物乙醇的第二过程中的第二菌株的性能有关的第四过程数据集,其中第四过程数据集是基于第一相关性和第二相关性估计的。
[0052]
该系统能够基于能够在某个工厂的过程中发酵生物质的菌株在另一个工厂的过程中的性能和另一个菌株在两个工厂的过程中的性能来预测所述菌株的性能。
[0053]
有利地,用于预测能够在特定工厂的过程中发酵生物质的菌株的性能的系统可以用于执行酵母优化。
[0054]
根据一方面,本发明提供了一种计算机程序产品,该计算机程序产品被配置为在机器上运行以预测菌株在过程中的性能,所述菌株能够发酵生物质以生产至少生物乙醇。计算机程序产品被配置为:接收与在第一地点生产生物乙醇的第一过程中的第一菌株的性能有关的第一过程数据集,接收与在第一地点生产生物乙醇的第一过程中的第二菌株的性能有关的第二过程数据集,接收与在第二地点生产生物乙醇的第二过程中的第一菌株的性能有关的第三过程数据集,第二地点不同于第一地点,并且其中第一、第二和第三过程数据集各自包括一个或多个过程简况和/或过程响应,确定第一过程数据集和第二过程数据集
之间的第一相关性,并且确定第一过程数据和第三过程数据之间的第二相关性,以及通过缺失数据插补重构与在第二地点生产生物乙醇的第二过程中的第二菌株的性能有关的第四过程数据集,其中第四过程数据集是基于第一相关性和第二相关性估计的。
[0055]
有利地,本发明提供了一种计算机程序,该计算机程序能够预测特定菌株在特定工厂的过程中的性能,在该工厂中没有可用于特定菌株的数据。
[0056]
可以使用不同的回归模型来执行缺失数据预测步骤。多元回归模型可以提供准确的结果,但也可以使用其他技术,例如投影模型平面技术、修剪分数回归、联合y偏最小二乘回归、最大似然主成分分析、分段直接标准化等。应当理解,许多变体是可能的。也可以使用多元回归模型和/或混合模型。
[0057]
应当理解,鉴于该方法所描述的任何方面、特征和选项同样适用于该方法以及所描述的系统和计算机程序产品。还将清楚的是,可以组合上述方面、特征和选项中的任何一个或多个。
附图说明
[0058]
本发明将在附图中表示的示例性实施例的基础上进一步阐明。示例性实施例以非限制性说明的方式给出。应当注意,附图仅是通过非限制性示例给出的本发明实施例的示意性表示。
[0059]
在附图中:
[0060]
图1示出了用于预测菌株在过程中的性能的方法的实施例的示意图;
[0061]
图2示出了输入参数和过程数据集的实施例的示意图;
[0062]
图3示出了方法的实施例的示意图,其中第一地点的第一过程是实验室环境,并且其中第二地点的第二过程是工厂;
[0063]
图4示出了方法的实施例的示意图,其中重构的第四过程数据集用于拟合预测模型,该预测模型被配置为预测在第二地点的第二过程中的第二菌株的性能;和
[0064]
图5示出了方法的示意图。
具体实施方式
[0065]
图1示出了用于预测菌株在过程中的性能的方法的实施例的示意图。由x表示的值代表与第一菌株的性能有关的过程数据集,由y表示的值代表与第二菌株的性能有关的过程数据集。所述值中的索引1表示过程数据集与第一过程中的性能相关,所述值中的索引2表示过程数据集与第二过程中的性能相关。
[0066]
因此x1代表与在第一地点生产生物乙醇的第一过程中的第一菌株的性能有关的第一过程数据集,y1代表与在第一地点生产生物乙醇的第一过程中的第二菌株的性能有关的第二过程数据集,x2代表与在第二地点生产生物乙醇的第二过程中的第一菌株的性能有关的第三过程数据集,第二地点不同于第一地点。包括x1和y1的垂直椭圆表示第一过程数据集和第二过程数据集之间的第一相关性,包括x1和x2的水平椭圆表示第一过程数据和第三过程数据之间的第二相关性。y2表示通过缺失数据插补的与在第二地点生产生物乙醇的第二过程中的第二菌株的性能有关的第四重构过程数据集,其中第四过程数据集是基于第一相关性和第二相关性估计的。
[0067]
如本文所用,“菌株”是微生物菌株,即微生物的菌株。在优选实施例中,菌株是细菌或真菌菌株,更优选真菌菌株,最优选酵母菌株。“第一菌株”和“第二菌株”优选为不同的菌株。在优选实施例中,第一菌株和第二菌株来自相同的微生物,优选两种真菌,更优选两种酵母。优选地,第一菌株和第二菌株来自同一属,更优选来自同一物种。
[0068]
用于生物乙醇生产的微生物的示例包括酿酒酵母(saccharomyces cerevisiae)、马克斯克鲁维酵母(kluyveromyces marxianus)、树柄毕赤酵母(pichia stipites)、东方伊萨肯菌(issatchenkia orientalis)和运动发酵单胞菌(zymomonas mobilis)等。
[0069]
菌株在过程中的性能可以通过一种方法来预测,该方法包括:接收与用于在第一地点生产生物乙醇的第一过程中的第一菌株的性能有关的第一过程数据集x1;接收与在第一地点生产生物乙醇的第一过程中的第二菌株的性能有关的第二过程数据集y1;接收与在第二地点生产生物乙醇的第二过程中的第一菌株的性能有关的第三过程数据集x2,第二地点不同于第一地点,并且其中第一、第二和第三过程数据集x1、x2、y1各自包括一个或多个过程简况和/或过程响应;确定第一过程数据集x1和第二过程数据集y1之间的第一相关性,以及确定第一过程数据集x1和第三过程数据集x2之间的第二相关性;通过缺失数据插补来重构与在第二地点生产生物乙醇的第二过程中的第二菌株的性能有关的第四过程数据集y2,其中第四过程数据集y2是基于第一相关性和第二相关性估计的。
[0070]
数据集可以包括多个时间简况,例如糖的消耗或乙醇的生产。也可以监控和使用各种其他量的简况。可以按照每个工厂中每个批次的时间的函数观察简况。可以通过比较一个工厂的数据与另一工厂的数据来确定测量值之间的相关性。这提供了将特定菌株的不同工厂(例如菌株y的工厂1和工厂2)相关联的第一关系。此外,可以通过比较具有第一菌株的一个工厂的数据与具有另一菌株的同一工厂的数据来确定另一种关系。
[0071]
图2示出了输入参数和过程数据集的实施例的示意图。每个过程数据集包含多个过程参数(过程变量)和输出参数(响应),由每个过程数据集后面的矩形表示。多个参数可以在多维网格中可视化,这里描绘为三维网格,其中每个轴代表不同的参数。参数的示例包括ph、温度、酶浓度、原料组成、时间、批号、性能(以每体积原料的体积生物乙醇测量)、co2浓度。缺失数据通过缺失数据插补求解。存在许多缺失数据插补方法,包括单插补和多插补方法。
[0072]
在示例中,确定同一工厂中菌株x和菌株y之间的第一相关性。此外,确定一个工厂中的菌株y和不同工厂中的菌株y的第二相关性。这些相关性可用于通过缺失数据插补来预测第二工厂中菌株x的性能。该技术可以假设数据的一部分缺失,并且基于上述关系/相关性,可以推断出缺失的部分。例如,可以使用回归模型。然而,如上所述,可以采用多种模型和技术。
[0073]
数据集可以由包含在第一和第二地点收集的数据(参见简况)的矩阵表示。x1可对应于与工厂1中的菌株x相关的数据;x2可对应于与工厂2中的菌株x相关的数据;y1可对应于与工厂1中的菌株y相关的数据;y2可对应于与工厂2中的菌株y相关的数据。x1和x2之间的相关性以及x1和y1之间的相关性可以通过缺失数据插补来确定以用于预测y2。
[0074]
可以根据时间(t)收集多个响应和简况。例如,可以在48小时的总持续时间内以每小时一次测量(t=1:1:48)执行测量。这可以针对多个批次进行。可以基于简况确定批次的性能。收集的数据可以用3d阵列表示。收集的3d阵列可以以不同方式展开,其中每个时间点
或过程变量以多个2d阵列展开。
[0075]
虽然在本示例中检索了3d数据集,但也可以观察较少的参数,从而获得2d数据集。还设想了2d和3d数据集的组合。
[0076]
与工厂1中的菌株x相关的数据(参见x1)可以展开,从而导致三个数据矩阵分批串接。这种展开类似于工厂2中的菌株x(参见x2)和工厂1中的菌株y(参见y1)。工厂1中的菌株y(y1)、工厂1中的菌株x(x1)和工厂2中的菌株y(y2)的矩阵可用于通过缺失数据插补算法确定工厂2中的菌株y(y2)的矩阵(矩阵块y2的数据缺失)。基于y1和y2的列之间的相关性,以及y1和x1之间的关系,可以使用回归模型来预测缺失块y2中的值。类似地,如果y2已知,则可以预测x2。
[0077]
有利地,本发明能够预测菌株y将如何在工厂2中起作用和/或发挥作用。能够准确预测或估计菌株y将如何在工厂2中起作用是非常重要的。例如,工厂2可能是新地点,需要估计或确定新菌株将如何在那里起作用。在此基础上,可以在新的地点上选择更好的菌株,甚至可以进行过程优化。
[0078]
尽管本发明中的许多示例涉及生物乙醇生产过程,但本发明也适用于涉及使用菌株生产产品的其他过程。
[0079]
与x1和x2的批次有关的数据可能来自不同的地点(例如工厂),因此唯一的共同点是菌株。因此,一个地点的批次可能不对应于另一个地点的批次。可选地,数据可以在x1和/或x2中打乱。打乱可以产生足够的变化来更好地捕捉差异。这样,可以提高预测的准确性。可以以不同的方式(例如随机地)排列行。
[0080]
图3示出了方法的实施例的示意图,其中第一地点的第一过程是实验室环境p1(例如小规模),并且其中第二地点的第二过程是工厂p2,例如大型工业厂房。实验室环境p1包括仅生产少量生物乙醇并且通常不用于生产和/或出售的地点。实验室环境p1优选地是生化实验室环境,其中酵母和/或其他微生物可以存活,例如由于孵化器的存在。工厂p2优选地是工业生产工厂,其中可以分批或以连续进料方式插入大量原料。一般来说,生产的生物乙醇是用于销售的,要求每批质量相同,或连续质量相同。
[0081]
在一些实施例中,可以调整和/或改进现有菌株,或者可以制备新菌株。本发明能够预测(改进的)菌株如何在另一个地点起作用。例如,菌株x可以是目前由一些生物乙醇生产商在p2环境中使用的众所周知的菌株。根据p1环境中x和改进的菌株y的测量数据,可以预测菌株y在可以使用不同过程(过程设置)的另一个地点如何起作用。应当理解,不同类型的生物质可用于生物乙醇生产。生物质可以例如是玉米。在生产生物乙醇的过程中可以使用不同的酶和/或预处理。
[0082]
图4示出了方法的实施例的示意图,其中重构的第四过程数据集用于拟合预测模型,该预测模型被配置为预测在第二地点的第二过程中的第二菌株的性能。在上图中,示意性地示出了将过程参数输入到地点中,该地点优选地是实验室环境或工业生产工厂中的至少一个。
[0083]
下图示出了优化在第二过程中第二菌株的生产过程所采取的决策的示意表示。为每个过程数据集选择模型。存在许多可能足够的计算模型。可以通过回归模型中的至少一种来对缺失数据进行建模,该回归模型可以可选地包括用于缺失数据插补的多元回归、主成分回归、偏最小二乘回归或修剪分数回归。
[0084]
建模后,修改模型中的过程参数并模拟输出参数,从而预测性能。如果与修改过程参数之前相比过程的性能得到了改善,可以以同样的方式修改过程本身的过程参数,以改进过程。如果过程没有得到改进,可以再次更改模型的过程参数,重新开始决策过程。过程参数的更改可以随机进行,但更优选的是通过实验设计。可以采用各种优化算法。
[0085]
图5示出了用于预测菌株在过程中的性能的方法100的示意图。在一些示例中,该方法是被配置为在机器上运行的计算机实现的方法。在第一步骤101中,接收与在第一地点生产生物乙醇的第一过程中的第一菌株的性能有关的第一过程数据集。在第二步骤102中,接收与用于在第一地点生产生物乙醇的第一过程中的第二菌株的性能有关的第二过程数据集。在第三步骤103中,接收与在第二地点生产生物乙醇的第二过程中的第一菌株的性能有关的第三过程数据集,第二地点不同于第一地点,并且其中第一、第二和第三过程数据集各自包括一个或多个过程简况和/或过程响应。在第四步骤104中,确定第一过程数据集和第二过程数据集之间的第一相关性,以及第一过程数据和第三过程数据之间的第二相关性。在第五步骤105中,通过缺失数据插补来重构与在第二地点生产生物乙醇的第二过程中的第二菌株的性能有关的第四过程数据集,其中第四过程数据集是基于第一相关性和第二相关性估计的。
[0086]
应当理解,该方法可以包括计算机实现的步骤。上述所有步骤都可以是计算机实现的步骤。实施例可以包括计算机装置,其中处理在计算机装置中执行。本发明还扩展到计算机程序,特别是载体上或载体中的计算机程序,适用于将本发明付诸实践。该程序可以是源代码或目标代码的形式,或者是适用于实施根据本发明的过程的任何其他形式。载体可以是任何能够承载程序的实体或设备。例如,载体可以包括存储介质,例如rom,例如半导体rom或硬盘。此外,载体可以是可传输的载体,例如电或光信号,其可以通过电缆或光缆或通过无线电或其他方式传送,例如通过互联网或云。
[0087]
一些实施例可以例如使用可以存储指令或一组指令的机器或有形计算机可读介质或物品来实现,指令如果由机器执行,则可以使机器执行根据实施例的方法和/或操作。
[0088]
可以使用硬件元件、软件元件或两者的组合来实现各种实施例。硬件元件的示例可以包括处理器、微处理器、电路、专用集成电路(asic)、可编程逻辑器件(pld)、数字信号处理器(dsp)、现场可编程门阵列(fpga)、逻辑门、寄存器、半导体器件、微芯片、芯片组等。软件的示例可以包括软件组件、程序、应用程序、计算机程序、应用程序、系统程序、机器程序、操作系统软件、移动应用程序、中间件、固件、软件模块、例程、子例程、功能、计算机实现的方法、程序、软件接口、应用程序接口(api)、方法、指令集、计算代码、计算机代码等。
[0089]
在此,参照本发明实施例的具体示例来描述本发明。然而,显然可以在其中做出各种修改、变化、替代和改变,而不背离本发明的本质。为了清楚和简明描述的目的,本文将特征描述为相同或单独实施例的一部分,然而,具有在这些单独实施例中描述的所有或一些特征的组合的替代实施例也被设想和理解为落入如权利要求所概述的本发明框架内。因此,说明书、附图和示例应被视为说明性意义而非限制性意义。本发明旨在涵盖落入所附权利要求的精神和范围内的所有替代、修改和变化。此外,所描述的许多元素是功能实体,它们可以以任何合适的组合和位置实现为离散或分布式组件或与其他组件结合。
[0090]
在权利要求中,放置在括号之间的任何参考符号不应被解释为限制权利要求。“包括”一词不排除存在除权利要求中列出的特征或步骤之外的其他特征或步骤。此外,“一”和“一个”这两个词不应被解释为限于“仅一个”,而是用来表示“至少一个”,并且不排除多个。在相互不同的权利要求中列举了某些措施的单纯事实并不表明这些措施的组合不能发挥优势。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献