一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

通过使用神经网络合成目标产物的方法和装置与流程

2022-02-25 20:53:16 来源:中国专利 TAG:

通过使用神经网络合成目标产物的方法和装置
1.相关申请的交叉引用
2.本技术基于于2020年7月29日在韩国知识产权局提交的第10-2020-0094615号韩国专利申请和于2021年2月08日在韩国知识产权局提交的第10-2021-0017869号韩国专利申请,并要求其优先权,其公开内容通过引用整体并入本文。
技术领域
3.本公开涉及一种通过使用神经网络合成目标产物的方法和装置。


背景技术:

4.神经网络是指模型化生物大脑的计算架构。随着神经网络技术的发展,神经网络已经被各个领域和系统用于分析输入数据和提取有效信息。
5.最近,神经网络技术正被用于推导有效和合适的反应物(reactant),并提供各种候选反应物。


技术实现要素:

6.提供了一种通过使用神经网络合成目标产物的方法和装置。示例实施例要实现的技术目标不限于上述技术任务,并且其他技术目的可以从下文描述的实施例中导出。
7.附加方面将在下面的描述中部分阐述,并且部分将从描述中明显,或者可以通过本公开的所呈现的示例实施例的实践来了解。
8.根据实施例的一方面,提供了一种使用神经网络合成目标产物的方法,该方法包括:基于预先训练的逆合成预测模型,预测用于生成目标产物的候选反应物组合;基于预先训练的反应预测模型,预测关于候选反应物组合中的每个候选反应物组合的预测产物;以及基于目标产物与预测产物的比较结果,确定候选反应物组合的实验优先级顺序。
9.该方法还包括接收测试反应物组合和对应于测试反应物组合的测试产物,以及使用预先训练的逆合成预测模型和预先训练的反应预测模型,基于测试反应物组合和测试产物,学习包括多个种类(class)的类别隐变量(categorical latent variable)。
10.类别隐变量的学习包括学习对应于表示测试产物中的每个测试产物的输入的类别隐变量的条件概率分布。
11.类别隐变量的学习包括基于由预先训练的产出率(yield rate)预测模型提供的预测产出率来学习类别隐变量。
12.候选反应物组合的预测和预测产物的预测基于所学习的类别隐变量。
13.候选反应物组合的预测包括:接收对应于目标产物的信息;基于对应于目标产物的信息预测包括多个种类的类别隐变量;以及基于对应于目标产物的信息和类别隐变量,获得对应于候选反应物组合的信息。
14.对应于候选反应物组合的信息的获得包括:基于表示目标产物的输入,计算候选反应物组合中的每个候选反应物组合的每个种类的似然(likelihood);计算对应于表示目
标产物的输入和表示类别隐变量的输入的逆合成预测结果的似然;和基于每个种类的似然和逆合成预测结果的似然,选择预定数量的最终候选反应物组合。
15.类别隐变量的预测包括提供用于生成目标产物的预期反应方法作为类别隐变量的输入值。
16.预测产物的预测包括:接收对应于候选反应物组合的信息;接收包括多个种类的类别隐变量;以及基于对应于候选反应物组合的信息和类别隐变量,获得对应于关于候选反应物组合中的每个候选反应物组合的预测产物的信息。
17.候选反应物组合的实验优先级顺序的确定包括:基于表示候选反应物组合中的每个候选反应物组合的输入,确定预测产物和目标产物是否彼此对应;以及基于预测产物和目标产物是否彼此对应来确定候选反应物组合的实验优先级顺序。
18.在另一实施例中,有一种包括神经网络的装置,该装置包括:存储器,存储至少一个程序;和处理器,被配置为执行至少一个程序以:基于预先训练的逆合成预测模型,预测用于生成目标产物的候选反应物组合;基于预先训练的反应预测模型,预测关于候选反应物组合中的每个候选反应物组合的预测产物;以及基于目标产物与预测产物的比较结果,确定候选反应物组合的实验优先级顺序。
19.处理器还被配置为使用预先训练的逆合成预测模型和预先训练的反应预测模型,基于测试反应物组合和对应于测试反应物组合的测试产物,学习包括多个种类的类别隐变量。
20.预先训练的逆合成预测模型和预先训练的反应预测模型学习关于表示测试产物中的每个测试产物的输入的类别隐变量的条件概率分布。
21.预先训练的逆合成预测模型和预先训练的反应预测模型基于由预先训练的产出率预测模型提供的预测产出率来学习类别隐变量。
22.处理器还被配置为预测候选反应物组合,并且预测产物的预测基于所学习的类别隐变量。
23.处理器还被配置为执行至少一个程序以:接收对应于目标产物的信息;基于对应于目标产物的信息预测包括多个种类的类别隐变量;以及基于对应于目标产物的信息和类别隐变量,获得对应于候选反应物组合的信息。
24.处理器还被配置为执行至少一个程序以:基于表示目标产物的输入,计算候选反应物组合中的每个候选反应物组合的每个种类的似然;计算关于表示目标产物的输入和表示类别隐变量的输入的逆合成预测结果的似然;和基于每个种类的似然和逆合成预测结果的似然,选择预定数量的最终候选反应物组合。
25.提供用于生成目标产物的预期反应方法作为类别隐变量的输入值。
26.处理器还被配置为执行至少一个程序以:接收对应于候选反应物组合的信息;接收包括多个种类的类别隐变量;以及基于对应于候选反应物组合的信息和类别隐变量,获得对应于与候选反应物组合中的每个候选反应物组合相对应的预测产物的信息。
27.处理器还被配置为执行至少一个程序以:基于表示候选反应物组合中的每个候选反应物组合的输入,确定预测产物和目标产物是否彼此对应;以及基于预测产物和目标产物是否彼此对应来确定候选反应物组合的实验优先级顺序。
28.在又一实施例中,有一种装置,包括:存储器,存储至少一个程序;和处理器,被配
置为执行至少一个程序以:基于预先训练的逆合成预测模型,预测针对目标产物的候选反应物组合;基于预先训练的反应预测模型,预测对应于候选反应物组合中的每个候选反应物组合的预测产物;基于候选反应物组合和预测产物,识别一个或多个包括多个种类的类别隐变量;以及基于一个或多个类别隐变量,确定候选反应物组合的实验优先级顺序。
附图说明
29.从以下结合附图的描述中,本公开的特定实施例的上述和其他方面、特征和优点将变得更加明显,在附图中:
30.图1是根据示例实施例的神经网络设备的硬件组件的框图;
31.图2是根据示例实施例的用于描述基于目标产物和预测产物之间的比较结果来确定候选反应物组合的实验优先级顺序的过程的图;
32.图3是用于描述类别隐变量的图;
33.图4是根据示例实施例的用于描述在逆合成预测模型和反应预测模型中执行的计算的图;
34.图5是根据另一示例实施例的用于描述在逆合成预测模型和反应预测模型中执行的计算的图;
35.图6是根据另一示例实施例的用于描述在逆合成预测模型和反应预测模型中执行的计算的图;
36.图7是根据示例实施例的神经网络设备的操作方法的流程图;
37.图8是根据示例实施例的逆合成预测模型和反应预测模型的学习方法的流程图;
38.图9是根据示例实施例的逆合成预测模型的操作方法的流程图;
39.图10是根据示例实施例的反应预测模型的操作方法的流程图;并且
40.图11是根据示例实施例的确定候选反应物组合的实验优先级顺序的方法的流程图。
具体实施方式
41.现在将详细参考实施例,实施例的示例在附图中示出,其中相同的附图标记始终指代相同的元件。在这点上,示例实施例可以具有不同的形式,并且不应被解释为限于本文阐述的描述。因此,下面仅通过参考附图来描述示例实施例,以解释各方面。如本文所使用的,术语“和/或”包括相关列出项中的一个或多个的任何和所有组合。当在元件列表之前时,诸如“···
中的至少一个”的表述修饰整个元件列表,而不是修饰列表中的单个元件。
42.在本说明书的各个部分中描述的诸如“在一些示例实施例中”、“根据示例实施例”等的表述不一定指与另一元件相同的元件。
43.本公开的一个或多个示例实施例可以被描述为功能块组件和各种处理操作。这些功能块的全部或部分可以通过被配置为执行指定功能的任意数量的硬件和/或软件组件来实现。例如,本公开的功能块可以用一个或多个微处理器或者用于特定功能的电路结构来实施。此外,例如,本公开的功能块可以用各种编程或脚本语言来实施。功能块可以用由一个或多个处理器执行的算法来实施。此外,本公开可以采用用于电子配置、信号处理和/或数据控制的传统技术。诸如“机构”、“元件”、“组件”等的术语不限于机械和物理组件。
44.此外,附图中所示的连接线或连接器旨在表示各种元件之间的示例功能关系和/或物理或逻辑耦合。应当注意,在实际设备中可以存在许多替代的或附加的功能关系、物理连接或逻辑连接。
45.关于本说明书中使用的术语,作为神经网络系统中使用的数据,结构(structure)可以表示材料的原子级结构。结构可以是基于原子和原子之间的键的结构式。例如,结构可以是具有简单格式的字符串类型(一维)。指示结构的字符串类型包括简化分子线性输入系统(simplified molecular-input line-entry system,smiles)码、smiles任意目标规范(smiles arbitrary target specification,smarts)码、国际化合物标识(international chemical identifier,inchi)码等。
46.此外,描述符是用于指示材料的特性的索引值,并且可以通过对给定材料执行相对简单的计算过程来获得。例如,在实施例中,描述符可以包括:指示是否包括特定的部分结构的分子结构指纹(例如,摩根指纹或扩展连接指纹(extended connectivity fingerprint,ecfp))的描述符;或者由可以直接计算的值形成的定量结构-属性关系(quantitative structure-property relationship,qspr)的描述符,诸如分子结构中包括的分子量或部分结构(例如,环)的数量。
47.此外,属性可以表示由材料所拥有或表达的特性,并且可以对应于通过实验测量的或通过模拟计算的实数的值。例如,当材料是显示器材料时,属性可以表示光的透射波长、发射波长等,当材料是电池材料时,属性可以表示电压。与描述符不同,可能需要复杂的模拟和/或大量的时间来计算属性。
48.图1是根据示例实施例的神经网络设备100的硬件组件的框图。
49.神经网络设备100可以被实现为各种类型的设备,诸如个人计算机(pc)、服务器设备、移动设备、嵌入式设备等。具体地,神经网络设备100可以对应于使用神经网络执行语音识别、图像识别、图像分类等的智能手机、平板设备、增强现实(ar)设备、物联网(iot)设备、自主车辆、机器人设备、医疗设备等,但不限于此。此外,神经网络设备100可以对应于安装在如上所述的设备中的专用硬件(hw)加速器。例如,神经网络设备100可以对应于hw加速器,诸如作为用于驱动神经网络的专用模块的神经处理单元(neural processing unit,npu)、张量处理单元(tensor processing unit,tpu)、神经引擎等。然而,神经网络设备100不限于这些示例中的任何一个或多个,因此,根据其他示例实施例,神经网络设备100可以由其他电子设备实施。
50.参考图1,神经网络设备100可以包括处理器110、存储器120和用户接口130。图1仅示出了与实施例相关的神经网络设备100的组件。因此,对于本领域普通技术人员来说明显的是,神经网络设备100还可以包括除了图1所示的组件之外的其他组件。根据示例实施例,其他组件可以是通用组件。
51.处理器110可以控制用于神经网络设备100的执行的通用功能。例如,处理器110可以执行存储在神经网络设备100的存储器120中的程序,以总体控制神经网络设备100。根据实施例,处理器110可以执行存储在神经网络设备100的存储器120中的程序,以控制神经网络设备100的一个或多个操作。处理器110可以被实现为提供在神经网络设备100中的中央处理单元(cpu)、图形处理单元(gpu)、应用处理器(ap)等。然而,本公开不限于此,因此,根据其他示例实施例,处理器110可以由其他电路实施。
52.存储器120可以是存储在神经网络设备100中处理的各种数据的hw组件。例如,存储器120可以存储在神经网络设备100中处理和要在神经网络设备100中处理的数据。此外,存储器120可以存储要由神经网络设备100驱动的应用、驱动程序等。存储器120可以包括随机存取存储器(ram)(诸如动态ram(dram)、静态ram(sram)等)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、cd-rom、蓝光或其他光盘存储装置、硬盘驱动器(hdd)、固态驱动器(ssd)或闪存。然而,本公开不限于此,因此,根据其他示例实施例,存储器120可以由其他电路实施。
53.处理器110可以驱动逆合成预测模型、合成预测模型、产出率预测模型和反应方法模型中的至少一个。
54.逆合成预测模型、合成预测模型、产出率预测模型和反应方法模型可以被实现为转换器模型。当神经网络设备100驱动转换器模型时,数据的并行处理和快速计算是可能的。
55.根据示例实施例,处理器110可以通过使用测试数据集来训练转换器模型,并且在训练过程期间,可以确定或学习类别隐变量。例如,处理器110可以学习关于测试产物中的每个测试产物的输入的类别隐变量的条件概率分布。此外,可以提供预测产出率和反应方法来教导类别隐变量的条件概率分布。
56.测试数据集可以分别包括对应于测试反应物组合的测试反应物和测试产物。此外,测试数据集还可以包括基于测试反应物组合中的每个测试反应物组合的实验条件和反应方法的测试产物的预测产出率。
57.实验条件可以表示被配置用于执行通过使用反应物来生成产物的实验的各种条件。例如,实验条件可以包括催化剂、碱、溶剂、试剂、温度和反应时间中的至少一种。
58.预测产出率可以表示当反应物在预定的反应方法和预定的实验条件下进行实验时,关于从反应物生成的产物的产出率的期望值。预测产出率可以不同于根据实际实验的实际产出率。
59.反应方法可以表示用于通过使用反应物来生成产物的化学反应方程式。例如,当通过使用反应物有机硼(r1-by2)生成产物卤化物(r2-by2)时,反应方法可以对应于suzuki-miyaura方法。根据反应物的结构信息和产物的结构信息,反应方法可以以复数的形式提供。
60.处理器110可以通过使用预先训练的逆合成预测模型来预测用于生成目标产物的候选反应物组合。
61.处理器110可以接收作为字符串类型(一维)的目标产物的化学结构。该结构可以是基于原子和原子之间的键的结构式。例如,处理器110可以接收目标产物的化学结构,如smiles码、smarts码或inchi码。根据示例实施例,关于目标产物的描述符的信息和关于目标产物的属性的信息可以与化学结构一起作为字符串类型输入。尽管化学结构被表示为字符串类型,但是本公开不限于此,因此,根据另一示例实施例,该结构可以由向量表示或基于图的表示来表示。
62.根据示例实施例,处理器110可以通过执行预先训练的逆合成预测模型并使用目标产物的字符串作为输入数据来执行计算。此外,基于计算结果,处理器110可以生成候选反应物组合作为字符串类型的输出数据。
63.根据示例实施例,处理器110可以通过使用预先训练的反应预测模型来预测关于候选反应物组合中的每个候选反应物组合的预测产物。
64.根据示例实施例,处理器110可以通过使用候选反应物组合作为输入数据执行预先训练的反应预测模型来执行计算。此外,基于计算结果,处理器110可以生成预测产物作为字符串类型的输出数据。
65.根据示例实施例,处理器110可以通过使用候选反应物组合作为输入数据驱动预先训练的产出率预测模型来执行计算。此外,基于计算结果,处理器110可以生成目标产物的预测产出率和用于生成目标产物的反应方法作为输出数据。目标产物的预测产出率可以用作用于学习类别隐变量的数据。
66.根据示例实施例,处理器110可以通过使用目标产物作为输入数据驱动预先训练的反应方法预测模型来执行计算。此外,基于计算结果,处理器110可以生成用于生成目标产物的反应方法作为输出数据。用于生成目标产物的反应方法可以用作用于学习类别隐变量的数据。
67.处理器110可以将目标产物与预测产物进行比较,并且基于比较结果,可以确定候选反应物组合的实验优先级顺序。因此,用于生成目标产物的最优候选反应物组合可以根据优先级顺序输出。
68.用户接口130可以表示用于接收关于实验结果的反馈的输入设备。例如,用户接口130可以包括键盘、圆顶开关、触摸板(触摸电容法、压阻层法、红外感测法、表面超声波传导法、积分张力测量法、压电效应法等)、微动轮、微动开关等,但不限于此。处理器110可以通过接收关于实验结果的反馈来更新转换器模型。
69.在下文中,将根据示例实施例详细描述通过使用如上所述的神经网络设备100来优先提供优化的实验条件的方法。在下文中描述的方法可以由神经网络设备100的处理器110、存储器120和用户接口130来执行。
70.图2示出了根据示例实施例的用于描述基于目标产物与预测产物的比较结果来确定候选反应物组合的实验优先级顺序的过程的图,并且图3是用于描述类别隐变量的图。
71.参考图2,处理器110可以接收作为字符串类型的目标产物210的化学结构。
72.目标产物210的字符串类型表示211可以输入到逆合成预测模型220中。此外,类别隐变量230可以输入到逆合成预测模型220中。
73.类别隐变量230可以表示不被直接观察到但影响关于候选反应物组合240的信息的变量。根据示例实施例,类别隐变量230可以指示反应的类型。反应的类型可以指示例如反应类型(诸如分解、燃烧、复分解和置换)、实验条件(诸如催化剂、碱、溶剂、试剂、温度和反应时间)、以及反应方法(诸如suzuki-miyaura)。然而,本公开不限于此,因此,根据其他示例实施例,反应类型可以包括其他反应类型,实验条件可以包括其他实验条件,并且反应方法可以包括其他反应方法。
74.类别隐变量230可以包括多个种类。可以对应于反应的类型生成多个种类。一组候选反应物或候选反应物组合可以根据类别隐变量而改变。
75.根据示例实施例,逆合成预测模型可以是取决于未观察到的类别隐变量的概率模型。根据示例实施例,逆合成预测模型可以是由其中根据类别隐变量,关于候选反应物或候选反应物组合的信息具有不同的参数(例如,期望值、方差等)的多个正态分布组成的高斯
组合模型,但不限于此。
76.处理器110可以通过使用预先训练的逆合成预测模型220来输出用于生成目标产物210的候选反应物组合240。候选反应物组合240可以作为字符串类型输出。换句话说,处理器110可以基于目标产物210和类别隐变量230输出字符串类型表示211的候选反应物组合240。根据示例实施例,处理器110可以输出最大化关于目标产物210的输入的每个种类的似然和逆合成预测结果的似然两者的候选反应物组合240,但不限于此。
77.候选反应物组合240可以表示由处理器110预测的用于生成目标产物210的反应物组合的集合。候选反应物组合可以包括多个候选反应物,但不限于此。换句话说,候选反应物组合可以仅包括一个候选反应物。
78.根据示例实施例,因为类别隐变量230可以输入到逆合成预测模型220中,所以可以获得各种候选反应物组合240,如图3所示。
79.参考图3,当处理器110将类别隐变量230中包括的任何一个种类设置为初始令牌(token)并基于设置的初始令牌执行解码时,可以针对一个目标产物210生成多个候选反应物组合220a、220b和220c。候选反应物组合220a、220b和220c可以基于目标产物210的输入,根据候选反应物组合220a、220b和220c的每一个种类的条件概率进行聚类。图3示出了当存在三个种类时,基于目标产物210的输入的候选反应物组合220a、220b和220c的聚类过程。
80.处理器110可以基于目标产物210的输入来计算候选反应物组合240中的每个候选反应物组合的每个种类的似然。此外,处理器110可以基于候选反应物组合240中的每个候选反应物组合的每个种类的似然,从候选反应物组合240中选择多个最终候选反应物组合。根据示例实施例,由处理器110选择的最终候选反应物组合的数量可以是预定的。根据示例实施例,处理器110可以计算候选反应物组合240中的每个候选反应物组合的每个种类的对数似然,并且可以基于每个种类的对数似然选择预定数量的最终候选反应物组合。最终候选反应物组合可以输入到图2中的反应预测模型250中,并且可以用于预测图2中的预测产物260。
81.参考图2,候选反应物组合240可以输入到反应预测模型250中。此外,根据示例实施例,所有相同的类别隐变量230也可以输入到反应预测模型250中。在另一实施例中,输入到逆合成预测模型220中的一个或多个类别隐变量230没有输入到反应预测模型250中。在另一实施例中,输入到反应预测模型250中的一个或多个类别隐变量没有输入到逆合成预测模型220中。
82.处理器110可以通过使用预先训练的反应预测模型250,输出关于候选反应物组合240中的每个候选反应物组合的预测产物260。预测产物260可以作为字符串类型输出。换句话说,处理器110可以基于字符串类型的候选反应物组合240和类别隐变量230输出字符串类型的预测产物261。在实施例中,处理器110可以输出最大化关于候选反应物组合240的输入的每个种类的似然和反应预测结果的似然两者的预测产物260,但不限于此。
83.预测产物260可以指基于候选反应物组合240中包括的反应物预测的产物。
84.类别隐变量230可以输入到反应预测模型250中,因此,也可以获得预测产物260的多样性。
85.处理器110可以将基于候选反应物组合240中的每个候选反应物组合的输入的预测产物260与目标产物210进行比较。此外,处理器110可以基于预测产物260和目标产物210
之间的比较结果来确定候选反应物组合240的实验优先级顺序。根据示例实施例,处理器110可以将目标产物210的字符串类型表示211与预测产物260的字符串类型表示261进行比较,并且可以基于比较结果确定候选反应物组合240的实验优先级顺序。
86.处理器110可以输出为其调整了实验优先级顺序的重新排列的候选反应物组合270。处理器110可以输出化学式类型和/或字符串类型的重新排列的候选反应物组合270。处理器110可以将化学式类型(例如,结构式280)和/或字符串类型270的重新排列的候选反应物组合270输出到预定的显示设备。
87.根据本公开的神经网络设备100可以通过反应预测模型250来验证通过逆合成预测模型220推导的候选反应物组合240,因此,可以防止输出与化学式语法不一致的候选反应物组合240的情况和目标产物210不能被合成为字符串类型的情况。
88.图4是根据示例实施例的用于描述在逆合成预测模型和反应预测模型中执行的计算的图。
89.参考图4,处理器110可以接收关于目标产物210的信息。关于目标产物210的信息可以被指示为字符串类型表示211。目标产物210的字符串类型表示211可以输入到逆合成预测模型220中。
90.处理器110可以基于关于目标产物210的信息来预测类别隐变量230。类别隐变量230可以表示不被直接观察到但影响关于候选反应物组合240的信息的变量,并且可以包括多个种类。
91.根据示例实施例,通过基于关于目标产物210的信息和类别隐变量230驱动逆合成预测模型220,处理器110可以预测用于生成目标产物210的候选反应物组合240。
92.逆合成预测模型220可以包括字嵌入器411、第一至第四位置编码器412a、412b、412c和412d(在下文中,当不需要区分时被指示为位置编码器412)、逆合成编码器413、逆合成解码器414和字生成器415。在图4中,字嵌入器411、位置编码器412、逆合成编码器413、逆合成解码器414和字生成器415中的每一个被示出为包括在逆合成预测模型220中的一个单元。然而,字嵌入器411、位置编码器412、逆合成编码器413、逆合成解码器414和字生成器415可以表示逆合成预测模型220中包括的层。
93.字嵌入器411可以以字母为单位嵌入输入数据。字嵌入器411可以将目标产物210的字符串类型表示211映射到向量。根据示例实施例,字嵌入器411可以将目标产物210的字符串类型表示211映射到预定维度的向量。此外,字嵌入器411可以将类别隐变量230映射到向量。根据示例实施例,字嵌入器411可以将类别隐变量230映射到预定维度的向量。
94.位置编码器412可以执行位置编码,以识别输入数据中包括的每个字母的位置。根据示例实施例,位置编码器412可以通过使用具有不同频率的正弦波来编码输入数据。
95.第一位置编码器412a可以对目标产物210的字符串类型表示211执行位置编码。第一位置编码器412a可以将位置信息组合到嵌入的输入数据,并将组合的数据提供给逆合成编码器413。
96.第二位置编码器412b可以通过将类别隐变量230设置为初始令牌来执行位置编码。第二位置编码器412b可以将位置信息组合到嵌入的输入数据,并将组合的数据提供给逆合成编码器413。
97.逆合成编码器413可以包括自注意力(self-attention)子层和前馈子层。为了便
于解释,图4示出了一个逆合成编码器413。然而,逆合成编码器413可以包括堆叠的n个编码器。
98.逆合成编码器413可以通过自注意力子层指定针对来自目标产物210的输入序列的注意力的信息。指定的信息可以被传输到前馈子层。前馈子层可以包括前馈神经网络,并且输入序列的变换序列可以通过前馈神经网络输出。变换序列可以作为逆合成编码器413的编码器输出提供给逆合成解码器414。
99.为了便于解释,图4示出了一个逆合成解码器414。然而,逆合成解码器414可以包括堆叠的n个解码器。
100.逆合成解码器414可以包括自注意力子层、编码器-解码器注意力子层和前馈子层。编码器-解码器注意力子层可以不同于自注意力子层,因为在编码器-解码器注意力子层中,查询是解码器的向量,而键(key)和值(value)是编码器的向量。
101.根据示例实施例,残差连接子层和归一化子层可以被分别应用于所有从属层(subordinate layer),并且掩蔽(masking)可以被应用于自注意力子层,使得当前输出位置不被用作关于下一输出位置的信息。此外,解码器输出可以被线性变换,或者softmax函数可以被应用于解码器输出。
102.逆合成解码器414可以通过使用波束搜索过程输出对应于类别隐变量230的输入序列和目标产物210的输入序列的输出序列。输出序列可以由字生成器415转换为字符串类型,并且可以被输出。因此,逆合成预测模型220可以输出对应于目标产物210的输入的字符串类型的候选反应物组合240。此外,类别隐变量230可以由反应预测模型250共享,以用于预测产物的计算。
103.根据示例实施例,通过基于关于候选反应物组合240的信息和类别隐变量230驱动反应预测模型250,处理器110可以预测关于每个候选反应物组合240的预测目标260。
104.反应预测模型250可以包括字嵌入器411、位置编码器412、反应预测编码器413、反应预测解码器416和字生成器415。如下所述,逆合成预测模型220和反应预测模型250可以共享编码器,因此,逆合成编码器413和反应预测编码器413可以被称为共享编码器413。此外,在图4中,字嵌入器411、位置编码器412、反应预测编码器413、反应预测解码器416和字生成器415中的每一个被示出为包括在反应预测模型250中的一个单元。然而,字嵌入器411、位置编码器412、反应预测编码器413、反应预测解码器416和字生成器415可以表示包括在反应预测模型250中的层。
105.除了输入序列的类型和输出序列的类型之外,反应预测模型250的计算方法和逆合成预测模型220的计算方法可以彼此基本相同。换句话说,字嵌入器411可以接收候选反应物组合240和类别隐变量230作为输入数据,并且可以以字母为单位嵌入输入数据。此外,第三位置编码器412c可以将位置信息组合到嵌入的输入数据,并将组合的数据提供给反应预测编码器413,第四位置编码器412d可以通过将类别隐变量230设置为初始令牌来执行位置编码,并将对其执行了位置编码的类别隐变量230提供给反应预测编码器413。
106.反应预测编码器413可以通过自注意力子层指定给予来自候选反应物组合240的输入序列的注意力的信息,并将指定的信息提供给前馈子层,并且前馈子层可以通过使用前馈神经网络输出变换序列。
107.反应预测解码器416可以包括自注意力子层、编码器-解码器注意力子层和前馈子
层。此外,残差连接子层和归一化子层可以分别应用于所有从属层,并且掩蔽可以应用于自注意力子层,以免当前输出位置被用作关于下一输出位置的信息。此外,解码器输出可以被线性变换,或者softmax函数可以被应用于解码器输出。
108.反应预测解码器416可以通过使用波束搜索过程输出对应于类别隐变量230的输入序列和候选反应物组合240的输入序列的输出序列。输出序列可以由字生成器415转换为字符串类型,并且可以被输出。因此,反应预测模型250可以输出对应于候选反应物组合240的输入的字符串类型的预测产物261。
109.处理器110可以将目标产物210的字符串类型表示211与预测产物260的字符串类型表示261进行比较,并且可以基于比较结果确定候选反应物组合240的实验优先级顺序。处理器110可以基于目标产物210的字符串类型表示211和预测产物260的字符串类型表示261是否彼此对应来确定候选反应物组合240的实验优先级顺序,并且可以输出基于所确定的实验优先级顺序重新排列的候选反应物组合270。
110.在图4中,源语言和目标语言作为字符串类型(例如,smiles)彼此相同,因此,逆合成预测模型220和反应预测模型250可以共享字嵌入器411、字生成器415和编码器。此外,逆合成预测模型220和反应预测模型250可以共享参数,诸如类别隐变量230,因此,模型复杂度可以降低,并且模型的正则化可以变得容易。
111.图5是根据示例实施例的用于描述在逆合成预测模型和反应预测模型中执行的计算的图。
112.在图5中,组件与图4的组件相同,除了在图5中,反应方法被提供作为类别隐变量的输入值。在图5中,与图4的组件相同的组件可以用相同的附图标记来指代,并且将不给出重复的描述。
113.参考图5,神经网络设备100还可以包括被示出为类型分类器417的反应方法预测模型。在图5中,类型分类器417被示出为逆合成预测模型220的组件。然而,在实施例中,类型分类器417可以是与逆合成预测模型220分离的组件。
114.通过类型分类器417示出的反应方法预测模型可以基于被编码的关于目标产物210的信息来预测反应方法。根据示例实施例,类型分类器417可以从目标产物210的编码描述中获得目标产物210的属性信息、描述符信息和结构信息中的至少一个。此外,类型分类器417可以基于目标产物210的属性信息、描述符信息和结构信息中的至少一个来预测用于生成目标产物210的反应方法510。
115.处理器110可以接收来自预测的反应方法510当中的预期反应方法511。预期反应方法511可以经由通过用户界面130的用户输入输入到处理器110中。预期反应方法511可以用作类别隐变量230中的输入值。
116.处理器110可以通过解码编码的目标产物210和预期反应方法511,输出对应于预期反应方法511的候选反应物组合240。例如,当预期反应方法511是suzuki-miyaura方法时,处理器110可以输出用于通过使用suzuki-miyaura方法生成目标产物210的候选反应物组合240。
117.根据示例实施例,因为预期反应方法511被提供作为类别隐变量230的输入值,所以最优候选反应物组合240可以在试剂的使用受到限制的环境中输出。
118.图6是根据示例实施例的用于描述在逆合成预测模型和反应预测模型中执行的计
算的图。
119.在图6中,组件与图5的组件相同,除了在图6中,当学习类别隐变量230时,使用根据实验条件的产出率。在图6中,与图5的组件相同的组件可以用相同的附图标记来指代,并且将不给出重复的描述。
120.参考图6,神经网络设备100还可以包括产出率预测模型610。在图6中,产出率预测模型610被示出为与逆合成预测模型220分离的组件。然而,在实施例中,产出率预测模型610可以是逆合成预测模型220的组件。
121.产出率预测模型610可以被实现为转换器模型。产出率预测模型610可以经由测试数据集来训练,并且可以基于实验条件输出目标产物210的预期产出率。
122.产出率预测模型610可以包括字嵌入器411、第五位置编码器412e、产出率预测编码器413、产出率预测器611和实验条件预测器612。产出率预测模型610可以与逆合成预测模型220和反应预测模型250共享字嵌入器411。此外,产出率预测模型610可以与逆合成预测模型220和反应预测模型250共享编码器。产出率预测器611和实验条件预测器612可以执行与包括在逆合成预测模型220和反应预测模型250中的解码器相同的功能。
123.实验条件预测器612可以预测用于生成目标产物210的重新排列的候选反应物组合270的实验条件。此外,当在由实验条件预测器612预测的实验条件下进行实验时,产出率预测器611可以预测目标产物210的预测产出率。
124.由产出率预测器611预测的目标产物210的预测产出率可用于学习类别隐变量230。处理器110可以通过预定的显示设备输出目标产物210的预测产出率。因此,用户可以通过考虑预测产出率来选择最优候选反应物组合240。
125.图7是根据示例实施例的神经网络设备100的操作方法的流程图。
126.参考图7,在操作s710中,处理器110可以通过使用预先训练的逆合成预测模型220来预测用于生成目标产物210的候选反应物组合240。
127.当处理器110接收到关于目标产物210的信息时,处理器110可以基于关于目标产物210的信息预测包括多个种类的类别隐变量230。此外,处理器110可以基于类别隐变量230自回归地预测候选反应物组合240。
128.当关于目标产物210的信息是x,类别隐变量230是z,候选反应物组合240是y时,基于目标产物210的输入的类别隐变量230和候选反应物组合240可以通过似然p(z,y|x)来预测。处理器110可以基于似然p(z,y|x)的值来预测类别隐变量230和候选反应物组合240。
129.在操作s720中,处理器110可以通过使用预先训练的反应预测模型250来预测关于候选反应物组合240中的每个候选反应物组合的预测产物260。
130.处理器110可以基于类别隐变量230和候选反应物组合240获得关于预测产物260的信息。
131.在操作s730中,处理器110可以基于目标产物210与预测产物260的比较结果来确定候选反应物组合240的实验优先级顺序。
132.处理器110可以基于目标产物210和预测产物260是否彼此对应来确定候选反应物组合240的实验优先级顺序。
133.当预测产物260是(x-波浪符)时,目标产物210和基于类别隐变量230和候选反应物组合240的输入的预测产物260之间的对应概率可以通过似然来确定。处
理器110可以根据似然的值增加的顺序来确定候选反应物组合240的实验优先级顺序。
134.图8是根据实施例的逆合成预测模型和反应预测模型的学习方法的流程图。
135.参考图8,在操作s810中,处理器110可以分别接收测试反应物组合和对应于测试反应物组合的测试产物。
136.根据示例实施例,处理器110还可以接收根据每个测试反应物组合的实验条件和反应方法的测试产物的预测产出率。
137.在操作s820中,处理器110可以基于测试反应物组合和测试产物学习包括多个种类的类别隐变量230。
138.根据示例实施例,处理器110可以进一步基于由预先训练的产出率预测模型提供的预测产出率来学习类别隐变量230。
139.处理器110可以学习关于测试产物中的每个测试产物的输入的类别隐变量230的条件概率分布。
140.根据示例实施例,当关于测试产物的信息是x
ts
并且关于测试反应物的信息是y
ts
时,处理器110可以设置类别隐变量230,使得逆合成预测模型220的似然p(z,y
ts
|x
ts
)和反应预测模型250的似然p(x
ts
|y
ts
,z)的交叉熵损失最小化,如等式1所示。
141.[等式1]
[0142][0143]
例如,处理器110可以通过使用期望最大化算法(硬em)来学习类别隐变量230。
[0144]
当当前模型的参数是θ时,处理器110可以重复地执行估计类别隐变量230以最小化交叉熵损失l的操作,如下等式2所示,以及更新对应于输入变量的参数的操作,如下式3所示。当处理器110重复地更新模型时,可以导出最优类别隐变量230。
[0145]
[等式2]
[0146][0147]
[等式3]
[0148][0149]
在等式2和3中,lh表示处理器110使用硬em,并且在等式3中,θ

表示更新的参数。
[0150]
图9是根据示例实施例的逆合成预测模型的操作方法的流程图。
[0151]
参考图9,在操作s910中,处理器110可以接收关于目标产物210的信息。
[0152]
处理器110可以接收作为字符串类型的目标产物210的化学结构。例如,处理器110可以接收目标产物210的化学结构,如smiles码、smarts码或inchi码。
[0153]
在操作s920中,处理器110可以预测包括多个种类的类别隐变量230。
[0154]
处理器110可以驱动逆合成预测模型220来预测类别隐变量230作为初始令牌。根据示例实施例,目标产物210的预期反应方法511可以被提供作为类别隐变量230的输入值。当预期反应方法511被提供作为类别隐变量230的输入值时,最优候选反应物组合240可以在试剂的使用受到限制的环境中输出。
[0155]
在操作s930中,处理器110可以基于关于目标产物210的信息和类别隐变量230来获得关于候选反应物组合240的信息。
[0156]
处理器110可以基于关于目标产物210的信息和预测的类别隐变量230,自回归地预测关于候选反应物组合240的令牌。基于目标产物210的输入的类别隐变量230和候选反应物组合240的似然可以由下面的等式4确定。
[0157]
[等式4]
[0158][0159]
在等式4中,t表示令牌序列的长度,并且y
《t
表示y
t
之前的目标令牌。
[0160]
处理器110可以输出最大化关于目标产物210的输入的每个种类的似然和关于目标产物210和类别隐变量230的输入的逆合成预测结果的似然两者的候选反应物组合240。
[0161]
根据示例实施例,处理器110可以基于每个种类的似然和逆合成预测结果的似然来选择预定数量的最终候选反应物组合。例如,处理器110可以根据基于目标产物210的输入的类别隐变量230和候选反应物组合240的似然增加的顺序来选择预定数量的集合。集合可以包括类别隐变量230和最终候选反应物组合240的对(pair)。类别隐变量230和最终候选反应物组合240的对可以输入到反应预测模型250中,并用于计算预测产物260。
[0162]
图10是根据示例实施例的反应预测模型的操作方法的流程图。
[0163]
参考图10,在操作s1010中,处理器110可以接收关于候选反应物组合240的信息。
[0164]
处理器110可以接收作为字符串类型的候选反应物组合240的结构。这里,候选反应物组合240的字符串类型可以与目标产物210的字符串类型相同。例如,当目标产物210的字符串类型是smiles码时,候选反应物组合240的字符串类型也可以是smiles码。
[0165]
在操作s1020中,处理器110可以接收包括多个种类的类别隐变量230。
[0166]
换句话说,处理器110可以接收类别隐变量230和最终候选反应物组合240的对。
[0167]
在操作s1030中,处理器110可以基于关于候选反应物组合240的信息和类别隐变量230来获得关于候选反应物组合240中的每个候选反应物组合的预测产物260的信息。
[0168]
处理器110可以基于似然p(x|z,y)来生成预测产物260的令牌。预测产物260可以用于逆合成预测模型220的验证。
[0169]
图11是根据示例实施例的确定候选反应物组合240的实验优先级顺序的方法的流程图。
[0170]
参考图11,在操作s1110中,处理器110可以基于候选反应物组合240中的每个候选反应物组合的输入来确定预测产物260和目标产物210是否彼此对应。
[0171]
处理器110可以基于似然基于类别隐变量230和候选反应物组合240的输入,确定目标产物210和预测产物260是否彼此对应。
[0172]
在操作s1120中,处理器110可以基于预测产物260和目标产物210是否彼此对应的结果来确定候选反应物组合240的实验优先级顺序。
[0173]
处理器110可以根据似然的值增加的顺序来确定候选反应物组合240的实验优先级顺序。
[0174]
上述示例实施例可以被编写为可在计算机中执行的程序,并且可以由通过使用计算机可读记录介质执行该程序的通用数字计算机来实现。此外,实施例中使用的数据结构可以通过各种方法写入计算机可读记录介质。计算机可读记录介质可以包括存储介质,诸如磁存储介质(例如,rom、软盘、硬盘等)和光学读取介质(例如,cd rom、dvd等)。
[0175]
应该理解,本文描述的示例实施例应该被认为仅仅是描述性的,而不是为了限制的目的。每个示例实施例中的特征或方面的描述通常应被认为可用于其他示例实施例中的其他类似特征或方面。虽然已经参考附图描述了一个或多个示例实施例,但是本领域普通技术人员将理解,在不脱离由所附权利要求限定的精神和范围的情况下,可以在形式和细节上进行各种改变。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献