一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于真实生物数据标签的合成生物特征生成器的制作方法

2022-06-09 00:41:22 来源:中国专利 TAG:

基于真实生物数据标签的合成生物特征生成器
1.交叉引用
2.本专利申请要求2019年6月20日提交的美国临时申请号62/864,334的优先权,该申请通过具体引用将其整体并入本文。


背景技术:

3.随着人口向老年人口的重大转变,越来越需要能够延长寿命的干预。同时,此类干预可能需要在个体水平上测量生物衰老,这可以量化年龄的加速和减速。
4.虽然衰老可能是非单一原因或治疗的复杂多因素过程,但是否可以将衰老归类为疾病的问题受到广泛争议。动物的生存强烈地取决于其维持稳态的能力,这部分地是通过不同组织内和不同组织之间的细胞内和细胞间通讯来实现的。维持稳态的生理活动为不同的细胞、组织、器官或整个动物生物体提供了生物数据标签(signature)。此生物数据标签可以通过标准生物技术方案从动物的生物样本来获得。生物数据标签可以用于评估动物的健康以及确定动物的生物年龄。生物年龄可能与时序年龄不同,并且从而提供有关健康、疾病潜势、和与时序年龄偏差(例如,过早衰老)的信息。
5.本领域中存在至少两种普遍的年龄概念。一种是“时序年龄”,单纯地是生物体或人类活着的实际日历时间。另一种称为“生物年龄”或“生理年龄”,这是本发明的特别关注点,与个体的生理健康及其生物标志物有关,无论是转录组学或蛋白质组学数据标签还是其他生物数据标签。生物年龄与身体的器官和调节系统的运作有多好以及生物体在所有水平上总体稳态维持的程度有关,因为此类功能通常随着时间和年龄而下降。
6.已知不同细胞和组织的寿命显著不同。尽管衰老在不同组织中对基因表达和蛋白质产生以及其他生物标签的影响不同,但生物标签(例如,基因组学)是高度组织特异性的并且取决于在组织中的功能,诸如通过作为基因表达最终产物而产生的蛋白质。由于再生速率和与之相关的基因表达和蛋白质产生模式变化,外部效应器诸如小分子对不同的组织具有不同的影响。结果是,基因表达和蛋白质产生可以为细胞、组织、器官、体液或生物体提供特定标签,可以对这些标签进行研究以找到用于干预的信息,这种干预可以使组织、器官或生物体(例如,人)回到更年轻的生物年龄状态而不对其他组织产生额外不利影响。
7.生物体的任何生理过程的测量典型地用一套预定义的生物标志物来完成。生物标志物可以被定义为客观测量和评价的特征,作为正常生物过程、致病过程或对治疗性干预的药理学反应的指标。科学家选择生物标志物以便测量体内非常明确的过程。
8.生物标志物是客观测量和评价的特征,作为正常生物过程、致病过程或对治疗性干预的药理学反应的指标。衰老时钟是基于一套生物标志物预测个体生物年龄的模型。在某种意义上,它可以被视为独立的复合生物标志物。根据美国衰老研究联合会(american federation for aging research,afar),生物标志物应满足以下条件才被视为衰老生物标志物:1)其是比时序年龄更好的死亡预测器;2)其预测衰老速率;3)其对衰老而不是疾病有反应;4)可以应用于人类和模型生物体两者;以及5)其可以被重复测试。
9.已经提出了许多衰老生物标志物,包括端粒长度、细胞内和细胞外聚集体、氨基酸
的外消旋化、和遗传不稳定性。基因表达和dna甲基化谱在衰老过程中变化,也可以用作衰老生物标志物。因此,从基因表达的mrna翻译的蛋白质产生谱可以相应地用作衰老生物标志物。分析各种疾病中活检的转录组或蛋白质组的许多研究表明,患者的年龄和性别对基因表达和随后的蛋白质产生具有显著影响,并且随着小鼠和人类年龄的增长,基因表达存在明显变化,从而导致开发出小鼠衰老基因表达数据库。
10.生物学和医学数据的生成的进步导致开发出多种新型衰老生物标志物,包括表观遗传时钟(hannum等人,2013;horvath,2013)、转录组学时钟(peters等人,2015)。并且尽管所有这些模型都是通过主要使用正则化线性回归的常规浅层机器学习方法开发的,但这些结果表明,可以使用包括转录组在内的各种数据类型以合理的准确性来跟踪衰老过程中的逐渐变化。
11.随着图形处理计算的出现,深度学习彻底改变了许多领域,包括生物医学(mamoshina等人,2016)。于2016年首次公开的使用深度学习(dl)开发的时序年龄和生物年龄预测器正在衰老研究界迅速流行。已经公开了多种基于深度学习的衰老时钟,包括血液学衰老时钟(mamoshina等人,2018a,2019;putin等人,2016)、面部衰老时钟(bobrov等人,2018)、转录组学衰老时钟(mamoshina等人,2018b)、微生物组学衰老时钟(galkin等人,2020)。
12.研究与衰老相关的变化的常用策略是建立回归模型,所述回归模型接收患者谱值(诸如基因表达水平或蛋白质水平)的向量并且输出患者年龄的连续值。同时,预后衰老标志物的鉴定仍然是一种挑战。
13.先前,研究已经利用从动物的生物样本中获得的生物数据标签。然而,获得身体生物样本并且获得相应的生物数据谱并非总是可能的。因此,能够获得不是直接来自生物样本的生物数据可能是有利的。


技术实现要素:

14.在一些实施方案中,用于为受试者创建合成生物数据的方法可以包括:(a)接收源自所述受试者的生物样本的真实生物数据标签;(b)基于所述真实生物数据标签创建输入向量;(c)将所述输入向量输入机器学习平台;(d)通过所述机器学习平台基于所述输入向量生成所述受试者的预测生物数据标签,其中所述预测生物数据标签包括特定于所述受试者的合成生物数据;以及(e)准备报告,所述报告包括所述受试者的合成生物数据。在一些方面,所述真实生物数据标签基于基因组学、转录组学、蛋白质组学、代谢组学、脂质组学、糖组学、甲基化组学或分泌组学的生物通路激活标签,并且所述预测生物数据对应于所述生物激活标签。
15.在一些实施方案中,所述方法可以包括:将所述预测生物数据标签与所述受试者的真实生物数据标签进行比较;确定所述受试者的合成生物数据与所述受试者的真实生物样本之间的差异;以及准备鉴定所述受试者的合成生物数据与真实生物样本之间的差异的报告。
16.在一些实施方案中,所述方法包括用所述受试者的属性的至少一个约束条件调整所述机器学习平台的潜在空间中所述输入向量的潜在代码,使得所述预测生物数据标签基于所述至少一个约束条件。在一些方面,所述预测生物数据标签是基于所述受试者的至少
一种属性生成的,其中所述属性选自所述受试者的年龄、性别、组织类型、种族、预期寿命或其组合。
17.在一些实施方案中,所述合成生物数据是针对所述受试者的限定生物年龄的,其中所述预测生物数据标签表示处在所述限定生物年龄的所述受试者的生物数据标签。在一些方面,所述合成生物数据针对以下中的一种:衰老模拟,以增加所述受试者的生物数据标签的生物年龄;或复壮模拟,以减小所述受试者的生物数据标签的生物年龄。
18.在一些实施方案中,将接收的真实生物数据标签与所生成的预测生物数据标签进行比较以鉴定至少一种可用于预测以下中的至少一项的生物通路:年龄、性别、组织类型、细胞类型、种族、预期寿命及其组合。在一些方面,所述机器学习平台预测所述合成生物数据的生物年龄、性别、组织类型、细胞类型、种族、预期寿命或其组合。
19.在一些实施方案中,一种计算机程序产品,所述计算机程序产品包括其上存储有计算机可读程序代码的有形非暂态计算机可读介质,所述代码可由处理器执行以执行本文所述的方法。
20.在一些实施方案中,可以使用具有所述计算机程序产品的计算系统来执行本文所述的方法。
附图说明
21.结合附图,从以下描述和所附权利要求中,本公开文本的前述和以下信息以及其他特征将变得更加充分明显。了解到这些附图仅描绘了根据本公开文本的几个实施方案并且因此不应被认为是对其范围的限制,将通过使用附图以额外的特定性和细节来描述本公开文本。
22.图1a示出了使用生成模型在基于真实生物样本的数据集的给定年龄、性别、种族和批次id的情况下产生合成转录组谱的方案的示意图。
23.图1b包括用生成模型由测量生物数据生成合成生物数据的流程图。
24.图1c示出了用于产生合成转录组谱的生成模型的示意图。
25.图2展示了用于生成模型的潜在空间的个性化转录向量以及转化给定数据集的id的真实数据(上)以消除合成转录向量(下)中的批次效应。
26.图3展示了年龄一致性损失与实际时序年龄与目标年龄之间的差异的依赖性。
27.图4示出了neto2基因年龄迹线的聚类,示出了四类表达谱。
28.图5a-5e示出了alox5基因年龄迹线的聚类(图5a)与四类表达谱(图5b-5e)的图。
29.图6a示出了生物数据谱,其中前9个信号传导通路受衰老方案干扰,其中上调基因(通路)以红色示出并且下调基因(通路)以绿色示出,其中饱和颜色表示干扰幅度:401-整合素连接激酶标签;402-快速糖皮质激素标签;403-血栓素a2受体标签;404-由vegfr1和vegfr2介导的信号传导事件;405-有丝分裂激酶aurora b标签;406-磷脂酰肌醇聚糖2网络通路标签;407-par4介导的凝血酶标签;408-质膜雌激素受体标签;以及409-cxcr3介导的标签。
30.图6b示出了生物数据谱,其中前9个信号传导通路受复壮方案(例如,逆向以减小年龄或“去衰老”)干扰,其中上调基因(通路)以红色示出并且下调基因(通路)以绿色示出,其中饱和颜色表示干扰幅度:421-aurora b标签;422-快速糖皮质激素标签;423-血栓素a2
受体标签;424-par4介导的凝血酶标签;425-cxcr3介导的标签;426-由hdac类别ii介导的信号传导事件;427-由vegfr1和vegfr2介导的信号传导事件;428-视觉信号转导;以及429-il8和cxcr2介导的标签。
31.图7展示了可以执行本文所述计算方法的计算系统的实施方案。
32.图中的要素是根据本文所述的至少一个实施方案布置的,并且本领域普通技术人员可以根据本文提供的公开内容来修改所述布置。
具体实施方式
33.在以下详细说明中,参考构成说明一部分的附图。在附图中,相似的标记通常标识相似的部件,除非上下文另有规定。具体实施方式、附图和权利要求中所述的说明性实施方案不意在限制。在不背离本文呈现的主题的精神或范围的情况下,可以使用其他实施方案并且可以进行其他改变。将容易理解的是,如本文一般描述的和图中所展示的本公开文本的各方面可以以各种各样的不同配置进行布置、取代、组合、分离和设计,所有这些都被明确考虑在本文中。
34.总体而言,本发明涉及人类生物衰老的生物标志物。在一些方面,本发明涉及基于基因表达的生物标志物,也称为转录组学数据,其提供对包括人类在内的生物体的生物年龄的度量和估计。然而,所述生物标志物可以是如本文所列举的其他组学生物标志物,并且生物数据可以包括生物数据的组学标签。例如,组学标签是基因组学、转录组学、蛋白质组学、代谢组学、脂质组学、糖组学、甲基化组学或分泌组学。虽然本文描述了转录组学生物标志物和生物数据,但讨论也适用于其他组学生物标志物和数据。基于此类生物标志物及其用途提供了组学预后衰老标志物。例如,方法可以包括:获得来自受试者的生物样本;以及通过执行基因组学、转录组学、蛋白质组学、代谢组学、脂质组学、糖组学、甲基化组学或分泌组学的测量来获得所述真实生物数据标签。
35.另外,使用机器学习和深度学习技术来评估转录组学数据和/或蛋白质组学数据和/或其他组学数据以及人类生物衰老的生物标志物。本发明提供了可用于评估转录组生物衰老过程的方法(例如,对受试者的转录组学数据进行的计算机方法)以及然后治疗生物衰老的方法(例如,对受试者进行的治疗方法)。本发明包括方法、系统、装置、计算机程序产品等,其执行以下方案,诸如用于基于受试者的真实生物数据标签生成受试者的预测生物数据标签。预测生物数据标签可以基于用于合成数据标签,对受试者的至少一种属性的干扰或设置。所述预测生物数据标签可以基于计算机程序对基因组学、转录组学、蛋白质组学、代谢组学、脂质组学、糖组学、甲基化组学或分泌组学的生物通路激活标签的模拟。
36.在一些实施方案中,所述预测生物数据标签是基于所述受试者的至少一种属性生成的,其中所述属性选自所述受试者的年龄、性别、组织类型、种族、预期寿命或其组合。在一些方面,可以设置这些属性中的一种的参数(例如,65岁)以提供针对该限定属性的预测生物数据。
37.在一些实施方案中,提供了一种创建预后衰老标志物的方法。所述方法可以包括接收源自患者组织或器官等的生物数据标签(例如,转录组标签),其可以通过处理生物样本以确定生物数据标签(诸如生物标志物标签)来获得。基于生物数据标签,所述方法可以包括向机器学习平台提供输入向量。机器学习平台处理输入向量以便生成输出,所述输出
包括在给定年龄或期望年龄的情况下生成的生物数据标签。在一些方面,所生成的生物数据标签特定于组织、体液、细胞或器官,或特定于组织、体液、细胞或器官的特征。在一些方面,所述方法可以包括重复一个或多个步骤(例如,接收生物数据标签和/或输入输入向量和/或生成输出)以确定或创建第二生成的生物数据标签,诸如是针对相同的受试者、细胞、器官或组织或者不同的受试者、细胞、器官或组织的。在一些方面,将两种预后衰老标志物组合以产生合成预后标志物,所述合成预后标志物解决受试者或多于一个受试者的在组织、器官、体液、细胞或生物体水平上的生物衰老。在一些方面,所述方法可以包括多次重复一个或多个步骤以产生多个预后衰老标志物,诸如是针对受试者的两种或更多种生物样本来源的或针对两个或更多个受试者的。在一些方面,转录组标签和/或输入向量和/或生成的输出源自患者或另一个生物体的非老化组织或器官。
38.在一些实施方案中,选择所生成的生物数据(例如,转录)标签的生物标志物子集(例如,基因或基因集)作为抗衰老疗法的靶标。这可以基于生物数据标签和/或生成的生物数据标签输出。在一些方面,生物标志物可以提供生物通路或者相关的基因子集或基因集,其可以被选择作为衰老复壮疗法的靶标,其中靶标可以是与所选生物通路或基因子集或基因集对应的蛋白质子集或蛋白质集。在一些方面,使用用患者的期望年龄生成的标签,选择基因子集或基因集作为个性化复壮疗法的靶标。
39.在一些实施方案中,生物数据包括转录组标签,其基于信号传导通路激活标签。在一些方面,输入转录组标签谱源自微阵列平台。在一些方面,输入转录组标签谱源自rna测序平台。在一些方面,输入转录组标签谱源自定量逆转录聚合酶链反应。在一些方面,输入转录组标签谱源自用于模拟基因表达数据的计算机模型。在一些方面,转录标签特定于组织或器官,或特定于组织或器官的特征。各种组学生物数据可以通过已知方法获得其生物标志物。
40.在一些实施方案中,为受试者创建合成数据的方法可以包括:接收源自相同患者的转录组标签;向机器学习平台提供输入向量;以及生成具有患者的特征的合成样本。可以重复所述步骤来为单个受试者创建另外的合成数据或为多个受试者创建多个合成数据。合成数据可以特定于样本类型,诸如组织、器官、体液、细胞或其他。合成数据可以提供受试者的生物学特征。可以基于受试者的限定或给定年龄、性别、组织类型、种族、预期寿命或其组合来生成合成样本。机器学习平台可以针对受试者的年龄、性别、组织类型、种族、预期寿命或其组合中的任一项预测合成样本的特征。可以改变或指定受试者的给定年龄、性别、组织类型、种族、预期寿命或其组合,以基于变化或特定性确定合成生物数据的变化。例如,时序年龄为45岁的受试者可以加速衰老至限定生物年龄(例如,60)以在此约束条件下获得预测合成生物样本,或衰老复壮至限定生物年龄(例如,30)以获得预测合成生物样本作为复壮目的的靶标。将真实生物数据标签与预测生物数据标签进行比较可以提供关于年龄、性别、组织类型、细胞类型、种族、预期寿命预测及其组合的生物标志物的指示,所述生物标志物对于评估健康或生物年龄可能很重要。
41.在一些实施方案中,机器学习平台包括一个或多个深度神经网络。在一些方面,机器学习平台包括一个或多个生成对抗网络。在一些方面,机器学习平台包括对抗自编码器架构。在一些方面,机器学习平台包括特征重要性分析,用于按其在年龄预测方面中的重要性对生物标志物诸如基因或基因集进行排序。
42.在一些实施方案中,机器学习平台可以被配置为用合成生物数据执行生物信号激活分析并且确定受试者的健康状态。例如,健康状态可以是受试者的预测未来健康状态。如本文所述,健康状态可以用于鉴定改善受试者的预测未来健康状态的治疗方案。在一些方面,受试者的健康状态是受试者的衰老速率。在一些方面,所述方法可以包括跟踪在一定时间段内受试者的衰老速率。
43.在一些实施方案中,机器学习平台可以处理合成样本,并且然后对合成生物数据标签进行年龄、性别、组织类型、细胞类型、种族、预期寿命预测及其组合的预测。此外,机器学习平台可以处理合成样本以预测受试者的属性,诸如年龄、性别、组织类型、细胞类型、种族、预期寿命预测及其组合。
44.在一些实施方案中,机器学习平台包括特征重要性分析模块,用于按其在年龄预测方面中的重要性对生物标志物进行排序。特征重要性分析还可以用于按其在性别预测方面的重要性对生物标志物进行排序。另外,特征重要性分析用于按其在年龄病理学预测方面的重要性对生物标志物进行排序。另外,真实和合成的生物标志物标签可以与提供生物样本的受试者相关联。因此,真实和合成的生物标志物标签和相关通路可以与受试者的实际年龄、性别、种族或预期寿命相关联。真实和合成的生物标志物标签的关联可以用于在干预或疗法之前、期间或之后进行预期寿命和生存概率的预后。因此,所述方法可以包括通过使用所述真实生物数据标签进行特征重要性分析,以按在年龄预测方面的重要性对生物数据进行排序,以及鉴定其生物通路激活标签的子集生物标志物,所述子集生物标志物被选择作为所述受试者的状况的指标。在一些方面,所述方法可以包括鉴定与所述状况相关的至少一种生物靶标,其中调节所述至少一种生物靶标会调节所鉴定的生物标志物子集中的至少一种生物标志物。
45.在一些实施方案中,用于为受试者创建合成生物数据的方法可以包括:(a)接收源自所述受试者的生物样本的真实生物数据标签;(b)基于所述真实生物数据标签创建输入向量;(c)将所述输入向量输入机器学习平台;(d)通过所述机器学习平台基于所述输入向量生成所述受试者的预测生物数据标签,其中所述预测生物数据标签包括特定于所述受试者的合成生物数据;以及(e)准备报告,所述报告包括所述受试者的合成生物数据。在一些方面,所述方法可以包括通过重复步骤(a)、(b)、(c)和/或(d)中的任何一个或多个来创建至少第二生物数据标签,其中所述第二生物数据标签基于来自所述受试者的所述生物样本、所述受试者的不同生物样本或第二受试者的第二生物样本的第二真实生物数据标签。任选地,可以准备包括第二生物数据标签的第二合成生物数据的报告。
46.在一些实施方案中,所述方法可以包括:将所述预测生物数据标签与所述受试者的真实生物数据标签进行比较;确定所述受试者的合成生物数据与所述受试者的真实生物样本之间的差异;以及准备鉴定所述受试者的合成生物数据与真实生物样本之间的差异的报告。在一些方面,所述方法可以包括鉴定至少一种在所述受试者的合成生物数据与真实生物样本之间具有差异的生物标志物。在一些方面,所述方法可以包括鉴定至少一种生物靶标,其中调节所述至少一种生物靶标会调节所鉴定的至少一种生物标志物。
47.在一些实施方案中,在限定时间段后,所述方法可以包括在第二迭代中执行步骤(a)、(b)、(c)、(d)和(e);将初始报告与第二迭代的报告进行比较;以及确定在所述限定时间段内所述预测生物数据标签中的变化。限定时间段还可以包括治疗或治疗方案或生活方
式的改变。然后,所述方法可以包括确定治疗、治疗方案或生活方式是否改变预测生物数据标签。如果其改变预测生物数据标签,则确定是否:继续治疗方案,改变治疗方案,或停止治疗方案。如果其未改变预测生物数据标签,则确定是否:继续治疗方案,改变治疗方案,或停止治疗方案。在一些方面,所述方法可以包括鉴定至少一种在所述限定时间段内具有变化的生物标志物。在一些方面,所述方法可以包括鉴定至少一种生物靶标,其中调节所述至少一种生物靶标会调节所鉴定的至少一种生物标志物。在一些方面,所述方法可以包括基于所述预测生物数据标签中的变化确定在所述限定时间段内的衰老速率;以及跟踪在所述限定时间段内所述预测生物数据标签中的变化。
48.在一些实施方案中,所述真实生物数据标签基于基因组学、转录组学、蛋白质组学、代谢组学、脂质组学、糖组学、甲基化组学或分泌组学的生物通路激活标签,并且所述预测生物数据对应于所述生物激活标签。在一些方面,所述方法可以包括:将基因组学谱与所述受试者的预测生物数据标签相关联;将蛋白质组学谱与所述受试者的预测生物数据标签相关联;将转录组学谱与所述受试者的预测生物数据标签相关联;将代谢组学谱与所述受试者的预测生物数据标签相关联;将脂质组学谱与所述受试者的预测生物数据标签相关联;将糖组学谱与所述受试者的预测生物数据标签相关联;将分泌组学谱与所述受试者的预测生物数据标签相关联;或将甲基化组学谱与所述受试者的预测生物数据标签相关联。所述方法还可以包括将所述预测生物数据标签与所述受试者的预测生物年龄相关联。
49.在一些实施方案中,所述合成生物数据是针对所述受试者的限定生物年龄的,其中所述预测生物数据标签表示处在所述限定生物年龄的所述受试者的生物数据标签。这可以允许预测受试者在未来某个时间的健康。可替代地,如果他们过着更健康的生活方式或试图治疗或克服不良健康状态的活动,则这可以允许预测受试者的健康可能如何。合成生物数据可以针对以下中的一种:衰老模拟,以增加所述受试者的生物数据标签的生物年龄;或复壮模拟,以减小所述受试者的生物数据标签的生物年龄。在一些方面,所述方法可以包括鉴定至少一种在所述受试者的真实生物样本与所述衰老模拟或所述复壮模拟的生物数据标签之间具有差异的生物标志物。在一些方面,所述方法可以包括鉴定至少一种生物靶标,其中调节所述至少一种生物靶标会调节所鉴定的至少一种生物标志物。
50.在一些实施方案中,将接收的真实生物数据标签与所生成的预测生物数据标签进行比较以鉴定至少一种可用于预测以下中的至少一项的生物通路:年龄、性别、组织类型、细胞类型、种族、预期寿命及其组合。机器学习平台可以预测所述合成生物数据的生物年龄、性别、组织类型、细胞类型、种族、预期寿命或其组合。
51.在一些实施方案中,所述方法可以包括将个体的生成合成生物数据谱与个体的实际生物数据谱进行比较。在一些方面,所述方法可以包括将基因表达水平与生成的转录标签的基因表达水平相关联。
52.在一些实施方案中,所述方法可以包括将个体的生成生物数据谱与个体的实际生物数据谱进行比较,其中所述比较进一步包括预期寿命的预后。在一些方面,所述方法可以包括将个体的生成生物数据谱与个体的实际生物数据谱进行比较,其中所述比较进一步包括生成信号传导通路标签。在一些方面,所述方法可以包括将个体的生成生物数据谱与个体的实际生物数据谱进行比较,其中所述比较进一步包括在治疗期间患者的预期寿命和生存概率的预后。在一些方面,所述方法可以包括将个体的生成生物数据谱与个体的实际生
物数据谱进行比较,其中所述比较包括疗法功效的结果测量。在一些方面,所述方法可以包括将个体的生成生物数据谱与个体的实际生物数据谱进行比较,其中所述比较包括患者对疗法产生不良反应的结果测量概率。在一些方面,所述方法可以包括将个体的生成生物数据谱与个体的实际生物数据谱进行比较,其中所述比较包括优化疗法。
53.在一些实施方案中,方法可以包括基于输出开发干预。在一些实施方案中,方法可以包括基于输出开发医学疗法。在一些方面,方法可以包括基于所生成的输出开发衰老细胞裂解(senolytic)疗法。在一些方面,方法可以包括基于所生成的输出开发衰老修复(senoremdiation)疗法。在一些方面,方法可以包括基于所生成的输出开发组合多种干预的疗法。
54.部分地,因为所述方法包括一种或多种预后衰老生物标志物,因此它可以用于跟踪抗衰老疗法(诸如衰老细胞裂解疗法和衰老修复疗法)的功效。所述方法可以用于生成给定期望条件的生物数据(例如,转录)标签,并且此生物数据标签可以与当前的生物数据标签进行比较以鉴定需要对生物数据标签作出以降低其衰老水平的变化(例如,使转录组更年轻或增加患者的预期寿命等)。
55.所提出的方法可以与生物衰老时钟结合以预测生成的生物数据标签的年龄。
56.本发明还包括用于为患者创建预后衰老标志物的方法,所述方法包括:(a)接收源自患者组织或器官的第一生物数据标签;(b)计算所生成的生物数据标签;(c)计算实际生物数据标签(a)与预测生物数据标签(b)之间的差异。
57.在一些方面,所述方法可以向机器学习平台提供输入向量,其中机器学习平台输出包括生物衰老时钟的分量的向量。
58.在一些实施方案中,提供了在有形非暂态计算机可读介质上的计算机程序产品,所述介质具有嵌入其中的计算机可读程序代码,所述程序代码可由计算机或计算系统的处理器执行以执行如本文所述的方法。
59.在一些实施方案中,可以执行所述方法以生成或确定患者的预后衰老生物标志物。此类方法可以包括接收源自患者组织或器官的生物数据标签(步骤(a))。所述方法可以包括基于生物数据标签创建输入向量。所述方法可以包括向机器学习平台提供输入向量(步骤(b))。所述方法可以包括机器学习平台生成输出,所述输出包括在给定患者组织或器官的样本的年龄的情况下生成的生物数据标签(步骤(c))。在一些方面,预后衰老生物标志物特定于组织或器官,或特定于组织或器官的特征。在一些方面,机器学习平台包括本文所述或本领域已知的其实施例和实施方案。预后衰老生物标志物可以被认为是这样的方法,可以操作所述方法以在给定组织、器官或受试者的年龄的情况下生成转录标签,并且然后将预测生物年龄与受试者的实际年龄进行比较。
60.在一些实施方案中,由计算机程序产品执行的方法可以包括重复任何步骤(a)、(b)和(c)以创建第二预后衰老生物标志物。在一些方面,将两种或更多种预后衰老生物标志物组合以创建合成预后衰老生物标志物,其解决在组织、器官或生物体水平上的生物衰老过程。在一些方面,所述方法可以包括多次重复步骤(a)和(b)以创建多个预后衰老生物标志物。在一些方面,步骤(a)的生物数据标签和/或步骤(b)的谱源自患者或另一个生物体的非老化组织或器官。
61.可以使用不同的方法/不同的组织来开发预后衰老生物标志物。在一些情况下,可
以使用从血液谱中提取的生物数据(例如,转录组学数据)或针对皮肤组织和血液构建的生物标志物开发预后衰老生物标志物。在“合成”时钟的情况下,通过组合的多个预后衰老生物标志物,可以存在生成的生物数据(转录)标签。
62.在一些方面,至少一种生物数据标签(例如,转录组标签和/或蛋白质组标签)基于计算机模拟(in silico)信号传导通路激活网络分解,所述分解是用机器学习平台(诸如本文所述或以其他方式已知或创建的机器学习平台)执行的分解。计算方法可以包括本文所述的任何其他计算步骤。预后衰老生物标志物可以特定于组织或器官,或特定于组织或器官的特征。
63.在一些实施方案中,本发明技术涉及使用生成神经网络(gnn),所述生成神经网络可以用于处理受试者的生物数据(例如,生物数据谱)并且然后针对受试者的不同生物年龄为该受试者生成合成生物数据。即,gnn为受试者生成在期望年龄点的预测生物数据谱。例如,受试者可能具有50岁的时序年龄,gnn鉴于目标年龄来处理此生物数据标签,并且然后为该受试者提供在增加衰老至60岁的生物年龄时预测的合成生物数据标签(例如,图4a)或在复壮至45岁的生物年龄时(例如,图4b)预测的合成生物数据标签,以显示受试者的生物学谱在更年轻时看起来如何。然后,所述信息可以用于确定受试者的健康以及鉴定用于降低该受试者的衰老过程的方案,以试图帮助受试者获得更年轻的生物年龄。本文提供的深度学习模型可以用于预测转录组衰老或复壮的过程。
64.为了创建和验证模型,从公共域(基因表达汇编(gene expression omnibus))收集全血的基因表达谱。在多个国家(例如,美国、英国、爱沙尼亚、德国、澳大利亚、意大利、西班牙、荷兰和新加坡)收集了10,000个带有时序年龄的血液转录组样本(24个数据集)。数据与以下元信息相关联:年龄、性别、种族和批次id。gnn是基于由lample提出的网络(lample等人“fader networks:manipulating images by sliding attributes”,nips,2017)配置的,并且用编码器(例如,将转录谱映射到潜在空间表示)和解码器(例如,用给定的约束条件重建转录组)修饰。ipanda(ozeror等人,“in silico pathway activation network decomposition analysis(ipanda)as a method for biomarker development,nature communications,2016)软件套件用于对来自nci通路相互作用数据库(nci pathway interaction database)的775种通路进行信号传导通路分析。
65.在一些实施方案中,gnn可以被配置为深度学习模型,所述深度学习模型可以用于分析受试者的生物数据谱并且为该受试者生成合成生物数据谱,其中所述合成生物数据谱用于某个特征。例如,合成生物学谱可以是某个生物年龄的生物数据谱。虽然合成生物学谱可以基于受试者的转录数据谱,但也可以使用其他类型的生物数据,诸如本文所述的那些。gnn可以产生:1)生成的生物数据谱(例如,合成转录组样本)是针对特定受试者(例如,提供真实生物样本的受试者)个性化的;2)合成生物数据谱(例如,转录组学水平数据谱)中健康个体的衰老变化的异质性是显著的并且被模型保存;以及3)提出的gnn模型可以用于鉴定与衰老相关的生物数据(例如,基因)和生物通路。
66.图1a展示了根据本发明的方案的实施方案。所述方案包括从受试者获得生物样本(1),并且然后处理样本以获得生物数据谱(2),诸如通过用测量技术(rna-seq、微阵列或单细胞rna-seq)剖析组织、单细胞或器官的转录谱。计算生物数据谱的真实标签,呈生物谱的生物要素(例如,基因和/或遗传要素)的绝对表达值的形式或呈通路标签的形式(3)。然后
将真实标签(例如,转录标签)用作生成模型的输入向量并且进行处理(4)。生成模型可以用作预后衰老生物标志物分析器。通过gnn生成合成生物数据谱的合成标签(5)。然后,将合成标签与真实标签进行比较,以鉴定它们之间的任何差异(6)。所鉴定的差异然后被鉴定为有助于衰老谱的生物靶标或生物通路。然后可以分析这些鉴定的生物靶标或生物通路,以了解如何调节它们以便减小受试者的生物年龄以减小合成生物年龄,并且此信息可以用于复壮治疗。
67.图1b展示了用于生成合成生物数据谱的方法的实施方案。所述方法可以包括在框102中从受试者获得测量生物数据。测量生物可以按照图1a的项目(3)进行处理,并且然后用作gnn的输入。然后,在框104中,gnn用编码器处理测量生物数据,并且在框106中从编码器获得潜在空间中的潜在代码。在框108中,在潜在空间中用独立约束条件调整潜在代码。独立约束条件可以是受试者的时序年龄、性别、种族、批次id或其他调整信息或属性(例如,真实的或假设的属性)。然后在框110中用解码器处理经调整的潜在代码,并且然后在框112中获得合成翻译的生物数据。合成翻译的生物数据可以提供针对受试者的限定生物年龄的生物数据谱。例如,所提出的生成模型可以用于在给定受试者的年龄、性别、种族和批次id的情况下产生合成转录组谱。
68.例如,所述方法可以包括用所述受试者的属性的至少一个约束条件调整所述机器学习平台的潜在空间中所述输入向量的潜在代码,使得所述预测生物数据标签基于所述至少一个约束条件。
69.在一些实施方案中,编码器(例如,神经网络)接收具有生物数据标签的真实生物数据,并且然后将生物数据映射到潜在空间表示。解码器由此潜在空间重新创建生物数据标签。独立约束条件在潜在空间中起判别器的功能,其可以添加条件以为相同受试者重新创建生物数据标签。例如,这些条件可以是年龄、性别、种族等。因此,用特定条件生成重新创建的合成生物数据标签。
70.图1c示出了可以执行图1b方法的gnn 120的实施方案。gnn 120可以包括测量生物数据122的输入,将所述输入提供给编码器124,所述编码器在潜在空间126中产生潜在代码。潜在空间中的潜在代码可以通过独立约束条件128进行调整,所述独立约束条件可以包括关于提供测量生物数据的受试者的信息130。潜在空间中经调整的潜在代码可以由解码器132处理以提供合成生物数据134。在一些情况下,判别器136在潜在空间中起独立约束条件的功能,所述独立约束条件可以添加条件以为相同受试者重新创建生物数据标签。gnn 120可以包括机器学习平台,所述机器学习平台包括一个或多个深度神经网络。gnn 120可以包括机器学习平台,所述机器学习平台包括至少两个生成对抗网络,并且可以包括对抗自编码器架构。至于图1c,它只是生成模型如何组织的一个实施例。并入的参考文献提供了其他实施例。
71.任何一个方法步骤都可以单独执行或与如本文所列举的其他步骤组合执行。在一些情况下,所述方法可以包括获得数据并且处理数据以获得对治疗方案的推荐。然后可以根据治疗方案的参数对患者实施推荐的治疗方案。即,在不计算生成治疗方案的情况下,治疗方案的各方面在没有这样做的指令的情况下不能执行。因此,获得指令(诸如药物和/或天然产物或特定药物和/或天然产物或药物和/或天然产物组合的类型)对于执行治疗方案而言可能至关重要。
72.生物数据标签(例如,转录组)可以基于在计算机上的标签信号传导通路激活网络分析。一个生物数据标签可以是转录组标签和/或蛋白质组标签,其基于计算机模拟信号传导通路激活网络分解。一个谱可以包括皮尔逊(pearson)相关系数矩阵。
73.在一些实施方案中,由方案确定的个性化药物治疗可以包括针对患者的老化治疗。得到的生物数据标签谱可以来自基线,所述基线可以源自患者或另一个受试者的非老化组织或器官。可以通过以其最低有效剂量开出由分类向量标识的药物来创建个性化药物治疗。
74.计算机处理可以包括输入和/或处理老化生物化学的完整或部分示意概述。关于可用作输入的生物通路以及处理以确定治疗(诸如用于治疗的特定药物),可以在并入的临时申请中获得额外的信息。因此,生物通路可以用于本文所述的方法中。本文描述了此类生物通路,并描述了将其进行计算机处理以植入如本文所列举的治疗方案设计的一些实施例。
75.可以激活细胞老化程序的各种细胞内在和外在应激可以用作模拟或其他计算机处理的输入。可以对已知(诸如在文献中)的生物通路进行分析以了解所执行的特定生物步骤。调节生物步骤以增加活性或降低活性会导致响应于调节的活性的级联系列事件。可以用影响生物通路调节的药物、物质或其他积极活动来调节。可以针对限定的生物步骤测量这种调节。所述生物步骤和响应于调节活动的变化可以用作计算机模型的输入,并且可以用数据来训练此类计算机模型。现在,随着人工智能和深度学习算法的增加,此类生物步骤、调节活动、和变化的响应可以与此类计算机模型一起用于生物通路的建模。这可以允许确定针对一个或多个生物步骤的调节活动。此类调节活动可以是真实的和基于模拟的,诸如是真实的药物、物质或医学活动。计算机模型的输出可以是指令或其他信息,用于引起调节活动以便获得特定类型的生物步骤调节,使得可以获得特定调节的生物通路的最终目标。因此,在本文中或在并入的参考文献和临时申请中所述的生物通路可以用作用于本文所述治疗方案的生物通路。
76.为了检查支持人体内不同细胞类型的寿命的基因表达策略,可以获得可用的rna-seq数据集并且询问各种体细胞类型和组织的转录组与报告的细胞更替以及寿命估计,范围从2天(单核细胞)至终生有效(神经元)。在不同的细胞谱系中,可以获得人类细胞和组织更替的基因表达标签。特别地,更替显示出与能耗高昂的细胞周期和支持基因组稳定性的因素、衰老相关病理的伴随风险因素呈负相关。
77.长寿和短寿哺乳动物的对比转录组研究以及检查一大组哺乳动物中的长寿性状的分析(逐个组织的调查,重点是脑、肝脏和肾脏)已揭示出候选的长寿相关过程。可以使用由联盟(诸如人类蛋白质图谱(human protein atlas,hpa)或由基因型组织表达(genotype-tissue expression,gtex)项目或癌症基因组图谱(cancer genome atlas,tcga)计划生成的公开可用的转录组数据集(例如,rna-seq)。
78.本文描述了用于开发老化药物治疗的方法,即药物、剂量和周期的选择。在这部分中,我们概述了药物治疗本身,即,在优选实施方案中,个性化治疗一旦被设计,就应用于患者。在该患者中,鉴定将被应用老化治疗的组织或器官。
79.在一些实施方案中,治疗的一个阶段涉及衰老修复,即衰老修复剂的药物方案,所述衰老修复剂是恢复或增加衰老前细胞(典型的细胞或年轻健康的组织或器官)的量的药
物。治疗的另一个阶段涉及衰老细胞裂解治疗,即涉及恢复或涉及消除或破坏目的组织或器官中的衰老细胞的药物方案。
80.在一些实施方案中,治疗的一个阶段涉及抗纤维化阶段,即解决目的组织或器官中的纤维化细胞的药物方案。抗纤维化可以涉及将衰老细胞恢复到衰老前非纤维化状态、消除或破坏纤维化细胞、或两者兼有。
81.可以使用评级方法来对治疗的老化治疗特性进行排序,其首先涉及从年轻患者和年老患者收集转录组数据集并且对每种细胞和组织类型的数据进行归一化,评价每个单独通路的通路激活强度(pas)并且构建通路云和筛选药物或组合,其通过作用于通路云的一个或多个要素来最小化信号传导通路云干扰。药物和组合可以通过其使信号传导通路激活模式回到更接近较年轻组织样本的信号传导通路激活模式的能力来评级。然后可以在人类细胞和模型生物体(诸如啮齿动物、线虫和蝇)上对预测进行体外和体内两种测试,以验证筛选和评级算法。通路激活和通路激活网络分解分析(pathway activation and pathway activation network decomposition analysis,ipanda)(ozerov等人,2016)是用于本文所述方法的优选网络分析方法。
82.如作者考虑的老化治疗(特别是药物组合和方案)的开发与如例如在us 2018/0125865和ozerov等人,“in silico pathway activation network decomposition analysis(ipanda)as amethod for biomarker development”,nature communications,7:13427,2016中(并且两者均通过具体引用整体并入)所述的信号传导通路激活网络分析特别相容。此类方法包括大规模转录组学数据分析,其涉及计算机模拟通路激活网络分解分析(in silico pathway activation network decomposition analysis)(ipanda)。此方法的能力适用于多个数据集,其含有例如从基因表达汇编(geo)获得的数据或其他生物数据。geo中的数据集通过标识符或登录号(诸如gse5350)来获取。
83.在优选实施方案中,使用与例如aliper等人,“deep learning applications for predicting pharmacological properties of drugs and drug repurposing using transcriptomic data”,mol pharm,2016年7月5日;13(7):2524-2530和mamoshina等人,“applications of deep learning in biomedicine”,mol pharm,2016年3月13(5)中所述的类似深度神经网络,与细胞标签数据库(诸如lincs数据库)和药物治疗性用途数据库(诸如mesh)组合,作为dnn的输入,以便输出药物分类以开发治疗性方案,在这种情况下用于归类和选择药物用于老化或其他治疗方案。lincs是美国基于网络的细胞标签文库项目(us library of network-based cellular signatures program),目的是通过对当细胞暴露于各种干扰剂时发生的基因表达和其他细胞过程的变化进行归类来创建基于网络的生物学理解。mesh是(医学主题词表(medical subject headings)),是美国国家医学图书馆(us national library of medicine)管理的用于索引pubmed的文章的词汇表,pubmed是也来自美国国家医学图书馆的生命科学和生物医学主题的参考文献和摘要的免费搜索引擎。
84.aae通过将聚合后验与先验匹配来工作,确保从先验空间的任何部分的生成产生有意义的样本。结果是,对抗自编码器的解码器学习了深度生成模型,所述深度生成模型将强加的先验映射到数据分布。aae可以用于诸如半监督分类、解缠图像的风格和内容、无监督聚类、降维和数据可视化的应用。例如,aae用于生成建模和半监督分类任务。因此,aae将自编码器转变为生成模型。通常用双重目标训练aae-传统的重建误差标准以及将自编码器
的潜在表示的聚合后验分布与任意先验分布匹配的对抗训练标准。
85.在源自kadurin的优选实施方案中,所述方法使用7层aae架构,其中潜在中间层用作判别器。作为输入和输出,aae使用二进制指纹和分子浓度的向量。在潜在层中,我们还引入了负责生长抑制百分比的神经元,当为负时其指示在治疗后肿瘤细胞数量的减少。为了训练aae,使用在细胞系中剖析的针对化合物的细胞系测定数据。然后可以使用aae的输出来筛选药物化合物,诸如pubchem中的7200万种化合物,然后选择具有潜在抗老化或特性的候选分子。
86.用于深度生成模型的最新一类非参数方法被称为生成对抗网络(gan)。在由goodfellow最初提出的这种新框架中,生成模型是通过对抗过程来评估。在实践中,同时训练两个模型:捕获数据分布的生成模型g,以及判别模型d,判别模型d评估样本来自训练数据而不是g的概率。用于g的训练程序用于最大化d出错的概率。因此,此框架不对应于标准优化问题,因为它基于一个模型寻求最大化并且另一个模型寻求最小化的价值函数。所述过程在鞍点处终止,所述鞍点对于一个模型的策略而言是最小值,而对于另一个模型的策略而言是最大值。因为gan不需要明确表示似然性,因此既不需要近似推理也不需要马尔可夫链。因此,gan为最大化似然性技术提供了有吸引力的替代方案。
87.深度对抗网络技术的生成能力为新的视角打开了大门,因为它可以有助于克服当前数据驱动的计算方法的若干限制。例如,我们可以将gan应用于转录组学数据以针对所期望的表型组生成新样本,并且在化学信息学中用于预测分子的物理、化学或生物学特性和结构。定量结构活性关系(qsar)和定量结构特性关系(qspr)仍然被认为是预测新型分子的特性的现代标准。为此目的,已经开发了许多基于ml的方法来解决此类问题,但最近的结果显示,基于dl的方法匹配或表现优于其他最先进的方法,并且证明了更好的预测性能、简约性和可解释性,并且在某些情况下可以使用基于网络的预测器。此外,基于卷积神经网络的新方法能够通过直接使用任意大小和形状的图而不是固定的特征向量作为输入来执行预测,并且可以预期看到开发出更灵活的深度生成架构,所述架构可以直接应用于其他结构化数据,诸如序列、树、图和3d结构。因此,深度对抗网络技术可以用于改善准确性、生成能力和预测能力,并且解决若干问题,包括计算成本、在每个层的计算有限、和在图上的信息传播有限。
88.通过分析结合亲和力和化学特性对生物活性小化合物和分子进行目标预测和映射是另一个研究领域,所述研究领域广泛使用数据驱动的计算方法以便优化现有资源库中可用数据的使用。尽管存在有前途的结果以及可利用网平台来通过计算鉴定未表征分子的新靶标或已知分子的二级靶标,诸如swisstargetprediction,但总的来说,可用的方法对于系统结合预测仍然太不准确,并且对于结合确定,物理实验仍然是最先进的。在此领域中,基于dl的方法,诸如最近发布的基于深度卷积神经网络的atomnet方法,已经允许规避若干限制并且表现优于更传统的计算方法,包括rf、qsar的svm和基于配体的虚拟筛选。可以预期,利用gan框架开发dl方法也将导致预测准确性和能力的显著改善。
89.在一些实施方案中,用sgd在以每个小批次执行的两个阶段-重建阶段和正则化阶段-中联合地训练对抗网络和自编码器。在重建阶段,自编码器更新编码器和解码器以最小化输入的重建误差。在正则化阶段中,对抗网络首先更新其判别网络,以辨别真实样本(使用先验生成)与生成样本(由自编码器计算的隐藏代码)。然后对抗网络更新其生成器(也是
自编码器的编码器)以混淆判别网络。一旦训练程序完成,自编码器的解码器将限定生成模型,所述生成模型将p(z)的强加先验映射到数据分布。
90.在一些实施方案中,输入层分为指纹部分和浓度输入神经元。在一些方面,训练aae以不仅编码和重建分子指纹而且还有实验浓度。编码器包括两个后续层l1和l2,分别具有128和64个神经元。解码器包括两个层l'1和l'2,分别包含64和128个神经元。潜在层包括5个神经元,其中一个是gi,并且另外四个被判别为具有正态分布。由于所述方案训练编码器网在潜在层的单个神经元中预测对抗“老化”的“效率”,因此潜在向量分为两部分
‑“
gi”和“表示”。将回归项添加到编码器成本函数中。此外,我们的编码器被限制于将相同的指纹映射到相同的潜在向量,独立于通过另外的“流形”成本的输入浓度。通过所有数据集计算浓度的平均值和方差,然后用于对“流形”步骤进行浓度采样。在每个步骤中,从训练集采集指纹样本并且从给定平均值和方差的正态分布采集浓度批次。通过最大化具有不同浓度的相似指纹的“表示”之间的余弦相似度来执行具有“流形”损失的训练网。
91.所有这些改变导致5步骤训练迭代,而不是aae基本模型中的3步骤:(a)判别器经训练以区分给定潜在分布与编码的“表示”;(b)编码器经训练以使判别器使对生成的“表示”混淆;(c)联合训练编码器和解码器作为自编码器;(d)编码器经训练以拟合潜在向量的“得分”部分;(e)用“流形”成本训练编码器。
92.前两个步骤(a、b)作为通常的对抗网络进行训练。自编码器成本函数计算为指纹部分的log损失和浓度部分的均方误差(mse)之和,并且mse也用作回归成本函数。优选aae的示例代码可在github.com/spoilt333/onco-aae上获得。
93.实验/模拟/模型
94.单活检(或现有的个体谱)。
95.根据如nhlbi.hih.gov网站中所述的医疗中心的标准程序,对患者进行肝脏或肺部的单活检测试。对于肺部活检,将从肺部的若干位置采集少量肺部组织样本。在显微镜下检查样本,还分析转录组和基因表达谱和/或蛋白质组和蛋白质产生谱。此程序可以帮助排除其他病症,诸如结节病、癌症或感染。肺部活检还可以显示疾病进展的程度。
96.存在若干种获取肺部组织样本的程序。
97.视频辅助胸腔镜检查。这是用于获取肺部组织样本的最常见程序。将内窥镜经由肋骨之间的小切口与附接的灯和摄像头一起插入胸部中。内窥镜提供肺部的视频图像并且允许收集组织样本。此程序必须在医院进行。
98.支气管镜检查。对于支气管镜检查,将细的柔性管穿过鼻或嘴,沿着喉咙向下,并且进入气道。在管的尖端处是轻便且微型的相机。它们允许看到气管和气道。然后将镊子插入管中以收集组织样本。
99.支气管肺泡灌洗。在支气管镜检查期间,将少量盐水(salt water,saline)经由管注射到肺部中。此流体清洗肺部并且帮助带出肺泡周围区域的细胞。在显微镜下检查这些细胞。
100.胸廓切开术。对于此程序,经由肋骨之间的胸壁中的切口取出几小块肺部组织。胸廓切开术在医院进行。
101.对于肝脏活检,将从肝脏的若干位置采集少量肝脏组织样本。在显微镜下检查样本,还分析转录组和基因表达谱。
102.存在若干种获取肝脏组织样本的程序。
103.经皮肝脏活检。医疗保健提供者轻拍腹部以定位肝脏或使用以下成像技术中的一种:超声波或计算机断层扫描(ct),并且用针头采集样本。
104.经静脉肝脏活检。当人的血液缓慢凝结或人具有腹水(腹部积液)时,医疗保健提供者可以进行经静脉肝脏活检。医疗保健提供者将局部麻醉剂应用于颈部的一侧并且在那里做一个小切口,将造影剂注射到鞘中并且拍摄x光片。如果需要多个样本,则在此之后插入并且取出活检针头若干次。
105.腹腔镜肝脏活检。医疗保健提供者使用这种类型的活检从肝脏的特定区域或多个区域获得组织样本,或者当存在扩散癌症或感染的风险时进行。医疗保健提供者可能在出于其他原因(包括肝脏手术)而进行的腹腔镜手术期间采集肝脏组织样本。
106.通路标签测量
107.转录组学数据:
108.从geo数据库(ncbi.nlm.nih.gov/geo/)下载含有与特发性肺纤维化(ipf)患者和用作参考的正常健康肺部组织相关的基因表达数据的数据集(21个数据集)。将来自不同数据集的ipf和正常数据使用gcrma算法进行预处理,并且使用来自brainarray存储库的更新的芯片定义文件对每个数据集独立地进行汇总。
109.使用limma和deseq2算法计算差异基因用于多组比较:ipf(ipf肺部组织与参考健康肺部组织);老化(年老肺部组织与参考年轻健康肺部组织);吸烟(当前吸烟者与参考非吸烟者);年龄状态数据可用于2个数据集,并且吸烟状态数据可用于1个数据集。
110.将差异表达基因数据用作ipanda算法的输入,以便测量每个比较组的通路标签。
111.通路数据库概述:
112.存在若干个广泛使用的信号传导通路集合,包括京都基因和基因组百科全书(kyoto encyclopedia of genes and genomes)、qiagen和nci通路相互作用数据库(nci pathway interaction database)。在此研究中,我们使用从sabiosciences集合(sabiosciences.com/pathwaycentral.php)获得的与人类细胞中各种类型的恶性转化最强烈相关的信号传导通路的集合。
113.比较标签谱。
114.可以基于ipanda p-值截止限(p-值《=0.05)和不同数据集之间的共同重叠来构建用于每个比较组的标签谱:对于ipf数据使用等于15的交叉点截止阈值,对于老化数据使用2,对于吸烟数据使用1。
115.个性化治疗。
116.dnn可以用作预测活性化合物并且生成具有期望功效的化合物的工具。基于dnn的模型的应用可以用于针对单独患者进行化合物的个性化以及评价治疗功效和安全性。
117.机器学习方法提供了在不先验假定生物医学数据的功能关系的情况下分析此数据的工具。并且基于深度神经网络(dnn)的方法,诸如多层前馈神经网络,能够拟合复杂和稀疏的生物医学数据并且在不修改目的特征的情况下学习原始数据的高度非线性依赖性。并且深度学习是从机器视觉到语言翻译的许多任务的最先进方法。但尽管生物医学已进入“大数据”时代,但生物医学数据集通常受到样本量的限制。并且特征选择和特征空间的降维通常会增加被应用于生物医学领域的dnn的预测能力(aliper,plis等人2016)。
118.可以提供一种系统,所述系统利用具有深度架构的定量模型,所述深度架构能够通过基于单独患者的个人谱通过化合物对他或她的功效将化合物分层。部分地,个人谱可以包括用定量模型分析的生物通路。以下数据可以用作系统的输入特征:基因表达谱和信号传导通路谱、血液测试(putin等人2016)、蛋白质表达谱、临床病史以及电子健康记录的深度表示(miotto等人2016)。
119.可以提供一种系统,所述系统利用具有深度架构的定量模型,所述深度架构能够通过定量评估患者的健康状态(诸如生物年龄、预期寿命、存活概率)来评价所提出的治疗的功效。以下数据可以用作系统的输入特征:基因表达谱和信号传导通路谱、血液测试、蛋白质表达谱、临床病史以及电子健康记录的深度表示。
120.可以提供一种系统,所述系统利用具有深度架构的定量模型,所述深度架构能够预测治疗的潜在副作用。以下数据可以用作系统的输入特征:基因表达谱和信号传导通路谱、血液测试、蛋白质表达谱、临床病史以及电子健康记录的深度表示。
121.可以提供一种系统,所述系统基于具有深度架构的生成模型(kadurin等人2017),所述深度架构能够生成具有诸如高功效、低毒性、高生物利用度等期望特性的分子。可以由基于dnn的系统通过功效和安全性预测来评价生成的分子。
122.实施例
123.本发明包括进行以下操作的方法、系统、装置、计算机程序产品等。
124.无论由与本发明相容的生物年龄评估来评估的生物标志物的具体类型如何,用于本发明和生物年龄评估两者的深度学习计算方法的优选实施方案如下。使用反向传播算法对深度学习模型用血液表达谱进行训练。所提出的模型基于这样的假设,即年龄相关基因表达变化的基本动态取决于用于每个样本潜在特征(z)的某些个体。z是从单一数据点(x,y,s)推断出的,其中x是基因表达值的向量,y是时序年龄,并且s是其他特征,诸如性别。然后神经网络g定义基因表达向量的动态x=g(y;z,s)。从年龄y到年龄y’的转变表示为:
[0125][0126]
深度学习模型的特定架构基于由lample等人(lample等人,2017)公开的架构。所提出的深度学习模型是用损失函数训练的深度前馈神经网络。示例性损失函数表达如下:
[0127][0128]
其中:
[0129]
1)身份损失(identity loss)是一种重建损失,其说明基因表达动态应在年龄y时通过点x:
[0130][0131]
2)感知损失将生成基因表达谱的预测年龄与真实年龄进行比较。我们使用外部预训练的年龄预测器p:
[0132][0133]
3)独立性损失使用对抗学习鼓励潜在空间z=e(x,y,s)独立于性别和其他特征(s)和年龄(y):方案替代地训练神经网络qy(z)和qs(z)以相应地预测y和s,然后训练e以改
变预测器的性能(lample等人,2017)。如果没有模型可以比随机预测器更好地预测y和s,则z独立于y和s。
[0134][0135]
其中ls是比较预测特征与真实观察特征s的损失函数。
[0136]
4)映射z=e(x,y,s)是确定性的,并且重建损失鼓励x=d(y;z,s)。如果在某个点动态确实在点x=d(y;z1,s)=d(y;z2,s)相交,则e(x,y,s)=z1=z2。因此,对于不同z的动态不应相交。然而,由于重建,增加循环一致性损失(zhu等人,2017)以防止相交。所述模型预测在随机年龄y’的训练对象(x,y,s)的基因表达x’。然后,所述模型为新对象(x',y',s)推断z’并且预测在原始年龄y的基因表达x”。如果迹线不相交,则原始对象与重获对象之间的误差应接近于零:
[0137][0138]
5)最终损失通过惩罚非单调行为来减少动态变化:
[0139][0140]
当动态在y附近非单调时,损失是非零的。
[0141]
图1c展示了深度学习计算方法的优选实施方案的架构。所述模型包括编码器124网络和解码器132网络。编码器网络接收呈转录标签形式的测量基因表达值并且将其映射到潜在空间。解码器网络接收潜在空间向量和目标年龄以及其他样本特征,诸如性别、种族和批次id,并且产生翻译或生成的基因表达标签。因此,用此条件生成重新创建的转录组学标签。
[0142]
所提出的深度学习模型是生成对抗模型,所述生成对抗模型除了编码器和解码器网络之外,还具有判别器136网络,其用于传递年龄和其他样本特征。
[0143]
使用反向传播算法同时训练模型中的所有网络。通过优化损失函数来选择所提出的模型的最佳架构。
[0144]
例如,用与时序年龄、健康状态、性别和种族关联的并且从获自公共域(基因表达汇编)的总共20个数据集中收集的9560个全血基因表达谱训练此深度神经网络。
[0145]
表a提供了在优选实施方案中用于训练深度神经网络的此类数据集的列表。
[0146]
表a
[0147]
[0148][0149]
图2展示了生成模型的潜在空间的个性化转录向量的2d表示。给定数据集id的真实数据(上)的转化消除了批次效应(下)。图上的每个点代表单独的样本。给定数据集id(下)的生成样本没有显示出根据批次id的聚类。经训练的生成模型消除了数据集中的批次效应(图2),同时保留了个性化特征。
[0150]
图3展示了生成转录谱的品质。如从诸如实际年龄与目标年龄之间的差异为0(目标年龄等于实际时序年龄)的δ可以看出,观察到对真实年龄的最小偏差(3.2岁)。随着δ的增加,误差率变高。所提出的模型还被分配任务以执行多个年龄的样本的同时生成。以这种方式,获得单独基因的连续迹线。以这种方式,分析已知在不同组织类型、细胞中显示出恒定表达水平并且常规用于基因表达分析的参考基因(caracausi等人,2017)的生成年龄迹线。
[0151]
图4展示了编码神经毡蛋白和tolloid样2(neuropilin and tolloid like 2,neto2)蛋白的基因的年龄迹线。如所预期,neto2的年龄迹线是常数函数,其没有显示出年龄依赖性。因此,所提出的模型可以用于分析先前未表征基因的年龄迹线。
[0152]
图5a-5e展示了alox5基因(例如,编码参与调节人体炎症过程的蛋白质生物合成的酶)年龄迹线的聚类,示出了四类表达谱。簇0迹线显示出50岁前表达水平增加并且50岁后表达水平恒定。簇1迹线显示出表达水平单调增加。与簇1相比,簇2迹线显示出表达水平更快的增加。簇3迹线显示出恒定的表达水平。表明年龄相关变化在人中不普遍。并且存在很多异质性。
[0153]
对生成转录组谱的进一步分析显示,信号传导通路因个体而异(图5a-5e)。例如,衰老迹线花生四烯酸5-脂氧合酶(alox5)基因在个体之间变化显著。这在信号传导通路水平方面同样观察到。同时,“复壮”(-15岁)与“衰老”( 15岁)之间存在共同的通路,包括“由vegfr1和vegfr2介导的信号传导事件”和“血栓素a2受体信号传导”,如图6a-6b所示。
[0154]
图6a-6b展示了受“复壮”(图6b)和“衰老”(图6a)干扰的前9个信号传导通路。上调
和下调的基因(通路)分别以呈灰色标度的红色和绿色示出。颜色的饱和度表示干扰幅度。数据表明,“复壮”(-15岁)与“衰老”( 15岁)之间存在共同的通路,包括“由vegfr1和vegfr2介导的信号传导事件”和“血栓素a2受体信号传导”。ipanda(ozerov等人,2016)软件用于信号传导通路分析和来自nci通路相互作用数据库的775种通路。
[0155]
因此,本发明提供了用于生成转录数据的深度学习模型。结果显示,1)生成转录组样本是个性化的,2)健康个体在转录组学水平上的衰老变化的异质性是显著的并且由模型保存,以及3)所提出的模型可以用于识别与衰老相关的基因和通路。
[0156]
本发明可以提供衰老研究和/或治疗的模型。同时,它也可以用于从标签中去除一些敏感信息。例如,如果出于某种原因想要从转录组学标签中去除种族,这可以用此类模型轻松完成。因此,可以从模型中去除任何特征,诸如本文所列举的那些。
[0157]
本文提供的数字是报告的例子或可以包含在合成生物数据的报告中。可以将报告提供给受试者或医疗专业人员,诸如受试者的医生。
[0158]
在一些实施方案中,生物数据标签基于基因组学、转录组学、蛋白质组学、甲基化组学、代谢组学、脂质组学、糖组学或分泌组学。在一些方面,所述方法包括获得受试者组织或器官的生物样本;以及通过执行基因组学、转录组学、蛋白质组学、代谢组学、脂质组学、糖组学或分泌组学的测量来获得生物数据。在一些方面,所述生物数据标签基于由计算机程序对基因组学、转录组学、蛋白质组学、甲基化组学、代谢组学、脂质组学、糖组学或分泌组学的模拟。在一些方面,所述生物数据是生物数据的组学标签。在一些方面,所述组学标签是基因组学、转录组学、蛋白质组学、代谢组学、甲基化组学、脂质组学、糖组学或分泌组学。
[0159]
上面描述了在本方案中使用基因组学、转录组学和蛋白质组学(例如,生物数据标签)来确定生物衰老时钟和在其他方案中的使用。这些方案也可以应用于其他生物标志物或其他组学,其中所述组学也可以被认为是生物标志物。
[0160]
基因组学是对基因组的结构、功能、进化、映射和编辑的研究。基因组是生物体的完整dna集,包括其所有基因。与遗传学(是指单独基因及其在遗传中的作用的研究)形成对照,基因组学的目的是对生物体的所有基因、它们的相互关系和对生物体的影响的集体表征和量化。因此,基因组学提供了用于制备本文所述的生物衰老时钟和其他方案的生物数据标签。所述基因可以在酶和信使分子的帮助下指导蛋白质的产生。蛋白质进而构成诸如器官和组织的身体结构以及控制化学反应并且在细胞之间传递信号。因此,基因组学生物数据标签可以提供重要信息。基因组学还涉及基因组的测序和分析,通过使用高通量dna测序和生物信息学来组装和分析整个基因组的功能和结构。
[0161]
转录组学是对转录组的研究,转录组是个体或细胞群体中所有rna转录物(包括编码的和非编码的)集。该术语有时也可以用来指代所有rna,或仅mrna,取决于具体实验。术语转录组是词语转录物和基因组的混成词;它与转录的生物学过程中的转录物产生过程相关。转录组的研究可以提供细胞、组织或器官或整个生物体的生物数据标签。此数据可以如本文所述使用。
[0162]
蛋白质组学是对蛋白质组中蛋白质的研究,其可以获得细胞、体液、组织、器官或受试者中蛋白质的生物数据标签。蛋白质组是由生物体或系统产生或修饰的全部蛋白质集。蛋白质组学已经能够鉴定不断增加的蛋白质数量和蛋白质水平。蛋白质标签随时间和
细胞或生物体所经历的不同需求或应激而变化。
[0163]
代谢组学包括研究涉及代谢的代谢物、小分子底物、中间体和产物的化学过程。具体地,代谢组学是对特定细胞过程留下的独特化学指纹的系统研究、对其小分子代谢物谱的研究。因此,可以研究代谢组学以从受试者的组织或器官中获得标签。代谢组表示生物细胞、组织、器官或生物体中的完整代谢物集,其为细胞过程的最终产物。mrna基因表达数据和蛋白质组学分析揭示了细胞中产生的基因产物集、表示细胞功能的一个方面的数据。相反,代谢剖析和获得其生物数据标签可以给出该细胞的生理学的即时快照,并且因此,代谢组学提供了生物体生理状态的直接功能读数。代谢组学的这种生物数据标签可以提供用于创建如本文所述的生物衰老时钟和其他方案的信息。同样,所述方案可以用于整合基因组学、转录组学、蛋白质组学和代谢组学信息,以提供对细胞生物学以及生物衰老时钟和其他方案的创建的更好理解。
[0164]
脂质组学是对生物系统中细胞脂质的通路和网络的研究,可以提供脂质的生物数据标签。词语脂质组用于描述细胞、组织、生物体或生态系统内的完整脂质谱,并且是代谢组的子集,代谢组还包括其他三大类生物分子:蛋白质/氨基酸、糖和核酸。脂质组学可以通过诸如质谱法(ms)、核磁共振(nmr)波谱法、荧光光谱法、双偏振干涉法和计算方法的技术进行评估。此外,由于脂质在诸如肥胖症、动脉粥样硬化、中风、高血压和糖尿病的许多代谢疾病中的作用,脂质组学的生物数据标签可以用于确定生物衰老时钟。
[0165]
糖组学是对糖组的研究,其包括糖的全部补充物,无论是游离的还是存在于生物体的更复杂分子中的,包括遗传、生理、病理和其他方面。糖组学是对给定细胞类型或生物体的所有聚糖结构的系统研究并且是糖生物学的子集。因此,糖组学给出聚糖结构的生物数据标签,可以用于本文所述的方案和生物衰老时钟。术语糖组学源自针对甜味或糖的化学前缀“糖-(glyco-)”,并且遵循由基因组学(其应对基因)和蛋白质组学(其应对蛋白质)建立的组学命名惯例而形成。
[0166]
分泌组学是涉及分析分泌组的研究,分泌组包括细胞、组织或生物体的所有分泌蛋白质。分泌的蛋白质参与多种生理过程,包括细胞信号传导和基质重塑,但也整合于恶性细胞的侵袭和转移。分泌组学在发现癌症生物标志物和理解发病机制的分子基础方面尤其重要。因此,分泌组学可以用于获得细胞、体液、组织、器官和生物体的生物数据标签,所述生物数据标签可以用于确定本文所述的生物衰老时钟和其他方案。
[0167]
甲基化组学是涉及分析甲基化组的研究,甲基化组包括生物体基因组的核酸修饰。甲基化导致dna的表观遗传修饰,因此导致基因表达减少并且由此导致蛋白质合成减少。此类表观遗传修饰参与细胞内许多生物过程(包括衰老)的调节。甲基化减少与组织和细胞的衰老相关。甲基化数据给出生物数据标签,所述生物数据标签可以用于本文所述的生物衰老时钟和其他方案。
[0168]
对于本文公开的过程和方法,在所述过程和方法中执行的操作可以以不同的顺序实现。此外,所概述的操作仅作为示例提供,并且一些操作可以是任选的、组合成更少的操作、被其他操作消除、补充、或扩展成另外的操作,而不偏离所公开的实施方案的本质。
[0169]
本文提供的数字是报告的例子或可以包含在生物合成样本和合成特征的报告中。可以将报告提供给受试者或医疗专业人员,诸如受试者的医生。
[0170]
本公开文本不限于本技术中所述的具体实施方案,所述实施方案旨在作为各个方
面的说明。在不背离其精神和范围的情况下,可以进行许多修改和变化。除了本文枚举的那些之外,根据前面描述,在本公开文本的范围内的功能等效的方法和装置是可能的。此类修改和变化旨在落入所附权利要求的范围内。本公开文本仅受限于所附权利要求的术语以及此权利要求有权要求的等效形式的全部范围。本文所用的术语仅用于描述具体实施方案的目的,而不非旨在进行限制。
[0171]
在一个实施方案中,本发明方法可以包括在计算系统上执行的方面。因此,所述计算系统可以包括存储器设备,所述存储器设备具有用于执行所述方法的计算机可执行指令。计算机可执行指令可以是计算机程序产品的一部分,其包括用于执行根据任一项权利要求所述的任何方法的一种或多种算法。
[0172]
在一个实施方案中,可以响应于存储在计算机可读介质上并且可由一个或多个处理器执行的计算机可读指令的执行,来执行或导致执行本文所述的任何操作、过程或方法。计算机可读指令可以由来自桌面计算系统、便携式计算系统、平板计算系统、手持式计算系统以及网络元件和/或任何其他计算设备的多种多样的计算系统的处理器来执行。计算机可读介质不是暂态的。计算机可读介质是一种物理介质,所述物理介质具有存储在其中的计算机可读指令,以便计算机/处理器可从物理介质中物理读取。
[0173]
存在由其可以进行本文所述的过程和/或系统和/或其他技术的各种介质(例如,硬件、软件和/或固件),并且优选的介质可能随着过程和/或系统和/或其他技术的部署环境而变化。例如,如果实现者确定速度和准确性是首要的,则实现者可以选择主要是硬件和/或固件介质;如果灵活性是首要的,则实现者可以选择主要是软件实现;或者,再又可替代地,实现者可以选择硬件、软件和/或固件的某种组合。
[0174]
本文所述的各种操作可以单独地和/或集合地通过多种多样的硬件、软件、固件或几乎其任何组合来实现。在一个实施方案中,本文所述主题的若干部分可以经由专用集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)或其他集成形式来实现。然而,本文公开的实施方案的一些方面可以整体地或部分地等效地在集成电路中实现,作为在一个或多个计算机上运行的一个或多个计算机程序(例如,作为在一个或多个计算机系统上运行的一个或多个程序),作为在一个或多个处理器上运行的一个或多个程序(例如,作为在一个或多个微处理器上运行的一个或多个程序),作为固件,或作为几乎其任何组合,并且根据本公开文本,为软件和/或固件设计电路系统和/或编写代码是可能的。另外,本文所述主题的机制能够以多种形式作为程序产品被分配,并且无论用于实际执行分配的信号承载介质的具体类型如何,本文所述主题的说明性实施方案都适用。物理信号承载介质的例子包括但不限于以下:可记录型介质,诸如软盘、硬盘驱动器(hdd)、压缩光盘(cd)、数字通用光盘(dvd)、数字磁带、计算机存储器、或非暂态性或传输的任何其他物理介质。具有计算机可读指令的物理介质的例子省略了暂态或传输型介质,诸如数字和/或模拟通信介质(例如,光纤电缆、波导、有线通信链路、无线通信链路等)。
[0175]
通常以本文阐述的方式描述设备和/或过程并且之后使用工程实践将此类描述的设备和/或过程集成到数据处理系统中。即,可以通过合理量的实验将本文所述设备和/或过程的至少一部分集成到数据处理系统中。典型的数据处理系统通常包括以下中的一个或多个:系统单元外壳;视频显示设备;存储器,诸如易失性和非易失性存储器;处理器,诸如微处理器和数字信号处理器;计算实体,诸如操作系统、驱动器、图形用户界面和应用程序;
一个或多个交互设备,诸如触摸板或屏幕;和/或控制系统,包括反馈回路和控制电机(例如,用于感测位置和/或速度的反馈;用于移动和/或调节部件和/或数量的控制电机)。典型的数据处理系统可以利用任何合适的可商购部件(诸如通常在数据计算/通信和/或网络计算/通信系统中找到的那些)来实现。
[0176]
本文所述的主题有时说明在不同其他部件中含有的不同部件或与不同其他部件连接的不同部件。此类描绘的架构仅是示例性的,并且事实上,可以实现许多其他的实现相同功能的架构。在概念意义上,实现相同功能的任何部件布置都是有效地“关联”的,使得实现所希望的功能。因此,本文中组合以实现特定功能的任何两个组件可以被看作彼此“关联”,使得实现所希望的功能,而与架构或中间部件无关。同样,如此关联的任何两个部件也可以被视为彼此“可操作地连接”或“可操作地偶联”,以实现所希望的功能,并且能够如此关联的任何两个部件也可以被视为彼此“可操作地偶联”以实现所希望的功能。可操作地可偶联的具体例子包括但不限于:以物理方式可配合和/或以物理方式相互作用的部件,和/或以无线方式可相互作用和/或以无线方式相互作用的部件,和/或在逻辑上相互作用和/或在逻辑上可相互作用的部件。
[0177]
图7示出了示例性计算设备600(例如,计算机),其可以被布置在一些实施方案中以执行本文所述的方法(或其部分)。在非常基本的配置602中,计算设备600通常包括一个或多个处理器604和系统存储器606。存储器总线608可以用于处理器604与系统存储器606之间的通信。
[0178]
取决于所希望的配置,处理器604可以是任何类型的,包括但不限于:微处理器(μp)、微控制器(μc)、数字信号处理器(dsp)或其任何组合。处理器604可以包括一级或多级缓存,诸如一级缓存610和二级缓存612、处理器核614和寄存器616。示例性处理器核614可以包括算术逻辑单元(alu)、浮点单元(fpu)、数字信号处理核(dsp核)或其任何组合。示例性存储器控制器618也可以与处理器604一起使用,或者在一些实现方式中,存储器控制器618可以是处理器604的内部部分。
[0179]
取决于所希望的配置,系统存储器606可以是任何类型的,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或其任何组合。系统存储器606可以包括操作系统620、一个或多个应用程序622、和程序数据624。应用程序622可以包括确定应用程序626,所述确定应用程序被设置用于执行如本文所述的操作,包括关于本文所述方法所描述的那些。确定应用程序626可以获得数据,诸如压力、流速和/或温度,并且然后确定系统的变化以改变压力、流速和/或温度。
[0180]
计算设备600可以具有另外的特征或功能,以及另外的接口以促进基本配置602与任何所需设备和接口之间的通信。例如,总线/接口控制器630可以用于促进基本配置602与一个或多个数据存储设备632之间经由存储接口总线634的通信。数据存储设备632可以是可移除存储设备636、不可移除存储设备638或其组合。可移除存储设备和不可移除存储设备的例子包括:仅举几例,磁盘设备,诸如软盘驱动器和硬盘驱动器(hdd);光盘驱动器,诸如压缩光盘(cd)驱动器或数字多功能光盘(dvd)驱动器,固态驱动器(ssd)和磁带驱动器。示例性计算机存储介质可以包括:以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据的信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除的介质。
[0181]
系统存储器606、可移除存储设备636和不可移除存储设备638是计算机存储介质
的例子。计算机存储介质包括但不限于:ram、rom、eeprom、闪存或其他存储技术、cd-rom、数字多功能光盘(dvd)或其他光学存储设备、磁带盒、磁带、磁盘存储设备或其他磁存储设备、或可用于存储所需的信息并且可由计算设备600访问的任何其他介质。任何此类计算机存储介质都可以是计算设备600的一部分。
[0182]
计算设备600还可以包括接口总线640,用于促进从各种接口设备(例如,输出设备642、外围接口644和通信设备646)经由总线/接口控制器630到基本配置602的通信。示例性输出设备642包括图形处理单元648和音频处理单元650,它们可以被配置用于经由一个或多个a/v端口652与诸如显示器或扬声器的各种外部设备通信。示例性外围接口644包括串行接口控制器654或并行接口控制器656,它们可以被配置用于与诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备等)的外部设备或其他外围设备(例如,打印机、扫描仪等)经由一个或多个i/o端口658通信。示例性通信设备646包括网络控制器660,所述网络控制器可以被设置用于促进经由一个或多个通信端口664在网络通信链路上与一个或多个其他计算设备662的通信。
[0183]
网络通信链路可以是通信介质的一个例子。通信介质通常可以由计算机可读指令、数据结构、程序模块或调制数据信号中的其他数据(诸如载波或其他传输机制)来体现,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,其具有以编码所述信号中的信息的方式设置或改变的其一个或多个特征。通过举例而非限制,通信介质可以包括有线介质,诸如有线网络或直接有线连接;以及无线介质,诸如声学、射频(rf)、微波、红外线(ir)和其他无线介质。如本文所用的术语计算机可读介质可以包括存储介质和通信介质。
[0184]
计算设备600可以被实现为小型化便携式(或移动)电子设备的一部分,所述电子设备诸如手机、个人数据助理(pda)、个人媒体播放器设备、无线网手表设备、个人耳机设备、专用设备、或包括以上任何功能的混合设备。计算设备600也可以实现为个人计算机,包括膝上型计算机和非膝上型计算机配置两者。计算设备600也可以是任何类型的网络计算设备。计算设备600也可以是如本文所述的自动化系统。
[0185]
本文所述的实施方案可以包括使用专用或通用计算机,包括各种计算机硬件或软件模块。
[0186]
在本发明范围内的实施方案还包括用于承载或具有存储在其上的计算机可执行指令或数据结构的计算机可读介质。此类计算机可读介质可以是可被通用或专用计算机访问的任何可用介质。通过举例而非限制,此类计算机可读介质可以包括ram、rom、eeprom、cd-rom或其他光盘存储器、磁盘存储设备或其他磁存储设备、或可用于承载或存储呈计算机可执行指令或数据结构形式的所需程序代码含义并且可被通用或专用计算机访问的任何其他介质。当信息通过网络或其他通信连接(硬连线、无线或者硬连线或无线的组合)传输或提供给计算机时,计算机将连接适当地视为计算机可读介质。因此,任何此类连接被适当地称为计算机可读介质。以上的组合也应包括在计算机可读介质的范围内。
[0187]
计算机可执行指令包括例如使通用计算机、专用计算机或专用处理设备执行某个功能或功能组的指令和数据。尽管已经以特定于结构特征和/或方法动作的语言描述了主题,但应当理解,在所附权利要求中定义的主题不一定限于上述特定特征或动作。相反,上述特定特征和动作是以实现权利要求的示例形式被公开。
[0188]
关于本文中基本上任何复数和/或单数术语的使用,本领域技术人员可以根据上下文和/或应用在适当时由复数转变成单数和/或由单数转变成复数。为了清楚起见,可以在本文中明确阐述各种单数/复数排列。
[0189]
本领域的技术人员应当理解,一般而言,本文使用的术语并且尤其是在所附权利要求中的术语(例如,所附权利要求的主体)通常旨在是“开放性”术语(例如,术语“包括”应当被解释为“包括但不限于”,术语“具有”应当被解释为“具有至少”,术语“包括”应当被解释为“包括但不限于”等)。本领域技术人员另外应当理解,如果意图是存在特定数量的所引入权利要求陈述,则将在权利要求中明确陈述此类意图,在不存在此类陈述的情况下,不存在此类意图。例如,为了帮助理解,所附权利要求可能包括使用介绍性短语“至少一个/种”和“一个/种或多个/种”来介绍权利要求陈述。然而,此类短语的使用不应被解释为暗示,由不定冠词“一个/种”引入权利要求陈述将含有此类引入的权利要求陈述的任何具体权利要求限制为仅包含此类陈述的实施方案,即使当同一权利要求包括介绍性短语“一个/种或多个/种”或“至少一个/种”以及不定冠词诸如“一个/种”时(例如,“一个和/或一种”应被解释为意指“至少一个/种”或“一个/种或多个/种”);这对用于引入权利要求陈述的定冠词的使用同样适用。另外,即使明确地陈述了所引入的权利要求陈述的特定数量,本领域的技术人员也应认识到,此类陈述应被解释为意指至少所述陈述的数量(例如,在无其他修饰语的情况下仅陈述“两个陈述”意指至少两个陈述或者两个或更多个陈述)。此外,在使用类似于“a、b和c等中的至少一项”的惯例的那些情况下,通常,此类构造旨在具有本领域的技术人员将理解所述惯例的意义(例如,“具有a、b和c中的至少一项的系统”将包括但不限于具有单独的a、单独的b、单独的c、a和b一起、a和c一起、b和c一起、和/或a、b和c一起等的系统)。在使用类似于“a、b或c中的至少一项等”的惯例的那些情况下,通常,此类构造旨在具有本领域技术人员将理解所述惯例的意义(例如,“具有a、b或c中的至少一项的系统”将包括但不限于具有单独的a、单独的b、单独的c、a与b一起、a与c一起、b与c一起和/或a、b和c一起等的系统)。本领域技术人员应进一步理解,无论是在说明书、权利要求还是附图中,呈现两个或更多个替代性术语的几乎任何分隔性词语和/或短语都应当理解为考虑到了包括所述术语中的一者、所述术语中的任一者或这两个术语的可能性。例如,短语“a或b”应被理解为包括“a”或“b”或“a和b”的可能性。
[0190]
另外,在根据马库什组描述本公开文本的特征或方面的情况下,本领域技术人员应认识到,由此也可根据马库什组的任何单独成员或成员的子组描述本公开文本。
[0191]
如本领域技术人员应理解,出于任何和所有目的,诸如就提供书面描述而言,本文公开的所有范围还涵盖任何和所有可能的子范围及其子范围的组合。任何列出的范围可以容易地被认识为充分地描述并且能够将相同范围分解成至少相等的二分之一、三分之一、四分之一、五分之一、十分之一等。作为非限制性例子,在本文中讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。如本领域技术人员还应理解,诸如“高达”、“至少”等所有语言包括所陈述的数字,并且是指可以随后分解成如上所讨论的子范围的范围。最后,如本领域技术人员应理解,范围包括每个单独的成员。因此,例如,具有1-3个细胞的组是指具有1、2或3个细胞的组。类似地,具有1-5个细胞的组是指具有1、2、3、4或5个细胞的组,等等。
[0192]
从前述内容中,应当理解,本文已出于说明的目的描述了本公开文本的各种实施
方案,并且在不背离本公开文本的范围和精神的情况下,可以进行各种修改。因此,本文公开的各种实施方案不旨在进行限制,并且真实的范围和精神由所附权利要求来指示。
[0193]
本专利交叉引用:2019年5月17日提交的美国申请号16/415,855、2018年8月17日提交的美国申请号16/104,391、2018年7月25日提交的美国申请号16/044,784、2017年7月25日提交的美国临时申请号62/536,658、和2017年8月17日提交的美国临时申请号62/547,061,将所述申请通过具体引用将其整体并入本文。
[0194]
将本文列举的所有参考文献通过具体引用将其整体并入本文。
[0195]
参考文献:
[0196]
buzdin,et.al.,us 2017/0073735
[0197]
goodfellow et.al.,“generative adversarial networks”,arxiv:1406.2661v1,2014.
[0198]
makhzani et.al.,“adversarial autoencoders”,arxiv:1511.05644v2,2015.
[0199]
kadurin,et.al.,“the cornucopia of meaningful leads:applying deep adversarial autoencoders for new molecule development in oncology”,oncotarget,2017,vol.8,(no.7),pp:10883-10890.
[0200]
seim et.al.,“gene expression signatures of human cell and tissue longevity”,npj aging and mechanisms of disease,2,16014(2016).
[0201]
ozerov,us 62/401789,filed sept 2016.
[0202]
aliper et.al.,“deep learning applications for predicting pharmacological properties of drugs and drug repurposing using transcriptomic data”,mol pharm,2016july 5;13(7):2524

2530.
[0203]
mamoshina et.al.,“applications of deep learning in biomedicine”,mol pharm,2016 march 13(5),
[0204]
ozerov et.al.,“in silico pathway activation network decomposition analysis(ipanda)as a method for biomarker development”,nature communications,7:13427,2016.
[0205]
munoz-espin,d.,&serrano,m.(2014).cellular senescence:from physiology to pathology.nature reviews molecular cell biology,15(7),482-496.
[0206]
acosta,juan carlos,ana banito,torsten wuestefeld,athena georgilis,peggy janich,jennifer p.morton,dimitris athineos,et al.2013.“a complex secretory program orchestrated by the inflammasome controls paracrine senescence.”nature cell biology 15(8):978-90.
[0207]
baar,marjolein p.,renata m.c.brandt,diana a.putavet,julian d.d.klein,kasper w.j.derks,benjamin r.m.bourgeois,sarah stryeck,et al.2017.“targeted apoptosis of senescent cells restores tissue homeostasis in response to chemotoxicity and aging.”cell 169(1):132-47.e16.
[0208]
baker,darren j.,robbyn l.weaver,and jan m.van deursen.2013.“p21 both attenuates and drives senescence and aging in bubr1 progeroid mice.”cell reports 3(4):1164-74.
cancer microenvironment society 5(1):39-44.
[0233]
lomas,nicola j.,keira l.watts,khondoker m.akram,nicholas r.forsyth,and monica a.spiteri.2012.“idiopathic pulmonary fibrosis:immunohistochemical analysis provides fresh insights into lung tissue remodelling with implications for novel prognostic markers.”international journal of clinical and experimental pathology 5(1):58-71.
[0234]
malavolta,marco,elisa pierpaoli,robertina giacconi,laura costarelli,francesco piacenza,andrea basso,maurizio cardelli,and mauro provinciali.2016.“pleiotropic effects of tocotrienols and quercetin on cellular senescence:introducing the perspective of senolytic effects of phytochemicals.”current drug targets 17(4):447-59.
[0235]
mallette,fr
édé
rick a.,and gerardo ferbeyre.2007.“the dna damage signaling pathway connects oncogenic stress to cellular senescence.”cell cycle 6(15):1831-36.
[0236]
minagawa,s.,j.araya,t.numata,s.nojiri,h.hara,y.yumino,m.kawaishi,et al.2010.“accelerated epithelial cell senescence in ipf and the inhibitory role of sirt6 in tgf
‑‑
induced senescence of human bronchial epithelial cells.”ajp:lung cellular and molecular physiology 300(3):l391-401.
[0237]
daniel,martaantonio maraver,gonzalo g
ó
mez-l
ó
pez,julio contreras,silvia murillo-cuesta,alfonso rodr
í
guez-baeza,et al.2013.“programmed cell senescence during mammalian embryonic development.”cell 155(5):1104-18.
[0238]
polina mamoshina,kirill kochetov,evgeny putin,franco cortese,alexander aliper,won-suk lee,sung-min ahn,lee uhn,neil skjodt,olga kovalchuk,morten scheibye-knudsen,alex zhavoronkov;population specific biomarkers of human aging:a big data study using south korean,canadian,and eastern european patient populations,the journals of gerontology:series a,gly005,doi.org/10.1093/gerona/gly005.
[0239]
mamoshina,p.,volosnikova,m.,ozerov,i.v,putin,e.,skibina,e.,cortese,f.,and zhavoronkov,a.(2018b).machine learning on human muscle transcriptomic data for biomarker discovery and tissue-specific drug target identification.front.genet.9,242.
[0240]
mamoshina,p.,kochetov,k.,cortese,f.,kovalchuk,a.,aliper,a.,putin,e.,scheibye-knudsen,m.,cantor,c.r.,skjodt,n.m.,kovalchuk,o.,et al.(2019).blood biochemistry analysis to detect smoking status and quantify accelerated aging in smokers.sci.rep.9,142.
[0241]
nelson,glyn,james wordsworth,chunfang wang,diana jurk,conor lawless,carmen martin-ruiz,and thomas von zglinicki.2012.“a senescent cell bystander effect:senescence-induced senescence.”aging cell 11(2):345-49.
[0242]
nikolich-zugich,janko.2008.“ageing and life-long maintenance of t-cell subsets in the face of latent persistent infections.”nature reviews.immunology 8(7):512-22.
[0243]
noble,paul w.,carlo albera,williamson z.bradford,ulrich costabel,marilyn k.glassberg,david kardatzke,talmadge e.king jr,et al.2011.“pirfenidone in patients with idiopathic pulmonary fibrosis(capacity):two randomised trials.”the lancet 377(9779):1760-69.
[0244]
ohtani,naoko,kimi yamakoshi,akiko takahashi,and eiji hara.2004.“the p16ink4a-rb pathway:molecular link between cellular senescence and tumor suppression.”the journal of medical investigation:jmi 51(3,4):146-53.
[0245]
ozerov,ivan v.,ksenia v.lezhnina,evgeny izumchenko,artem v.artemov,sergey medintsev,quentin vanhaelen,alexander aliper,et al.2016.“in silico pathway activation network decomposition analysis(ipanda)as a method for biomarker development.”nature communications 7(november):13427.
[0246]
parrinello,simona,jean-philippe coppe,ana krtolica,and judith campisi.2005.“stromal-epithelial interactions in aging and cancer:senescent fibroblasts alter epithelial cell differentiation.”journal of cell science 118(pt 3):485-96.
[0247]
putin,e.,mamoshina,p.,aliper,a.,korzinkin,m.,and moskalev,a.(2016).deep biomarkers of human aging:application of deep neural networks to biomarker development.8,1-13.
[0248]
seki,ekihiro,and david a.brenner.2015.“recent advancement of molecular mechanisms of liver fibrosis.”journal of hepato-biliary-pancreatic sciences 22(7):512-18.
[0249]
seki,ekihiro,and robert f.schwabe.2015.“hepatic inflammation and fibrosis:functional links and key pathways.”hepatology 61(3):1066-79.
[0250]
storer,mekayla,alba mas,alexandre robert-moreno,matteo pecoraro,m.carmen ortells,valeria di giacomo,reut yosef,et al.2013.“senescence is a developmental mechanism that contributes to embryonic growth and patterning.”cell 155(5):1119-30.
[0251]
takeuchi,shinji,akiko takahashi,noriko motoi,shin yoshimoto,tomoko tajima,kimi yamakoshi,atsushi hirao,et al.2010.“intrinsic cooperation between p16ink4a and p21waf1/cip1 in the onset of cellular senescence and tumor suppression in vivo.”cancer research 70(22):9381-90.
[0252]
wang,jianrong,glenn j.geesman,sirkka liisa hostikka,michelle atallah,benjamin blackwell,elbert lee,peter j.cook,et al.2011.“inhibition of activated pericentromeric sine/alu repeat transcription in senescent human adult stem cells reinstates self-renewal.”cell cycle 10(17):3016-30.
[0253]
li,yifeng,chih-yu chen,and wyeth w.wasserman."deep feature selection:
cell,8(4),484-495.
[0267]
zahn,j.m.,poosala,s.,owen,a.b.,ingram,d.k.,lustig,a.,carter,a.,&becker,k.g.(2007).agemap:a gene expression database for aging in mice.plos genetics,3(11),e201.
[0268]
blalock,e.m.,chen,k.c.,sharrow,k.,herman,j.p.,porter,n.m.,foster,t.c.,&landfield,p.w.(2003).gene microarrays in hippocampal aging:statistical profiling identifies novel processes correlated with cognitive impairment.the journal of neuroscience,23(9),3807-3819.
[0269]
welle,s.,brooks,a.i.,delehanty,j.m.,needler,n.,&thornton,c.a.(2003).gene expression profile of aging in human muscle.physiological genomics,14(2),149-159.
[0270]
park,s.k.,&prolla,t.a.(2005).gene expression profiling studies of aging in cardiac and skeletal muscles.cardiovascular research,66(2),205-212.
[0271]
hong,m.g.,myers,a.j.,magnusson,p.k.,&prince,j.a.(2008).transcriptome-wide assessment of human brain and lymphocyte senescence.plos one,3(8),e3024.
[0272]
dej.p.,curado,j.,&church,g.m.(2009).meta-analysis of age-related gene expression profiles identifies common signatures of aging.bioinformatics,25(7),875-881.
[0273]
zhavoronkov,a.,&cantor,c.r.(2011).methods for structuring scientific knowledge from many areas related to aging research.plos one,6(7),e22597.
[0274]
trindade,l.s.,aigaki,t.,peixoto,a.a.,balduino,a.,da cruz,i.b.m.,&heddle,j.g.(2013).a novel classification system for evolutionary aging theories.frontiers in genetics,4.
[0275]
putin,e.et al.(2016)deep biomarkers of human aging:application of deep neural networks to biomarker development.aging 8(5):1021-1033.
[0276]
lavecchia,a.and cerchia,c.(2016)in silico methods to address polypharmacology:current status,applications and future perspectives.drug discov.today 21(2):288-298.
[0277]
oquab,m.et al.(2014)learning and transferring mid-level image representations using convolutional neural networks.2014 ieee conference on computer vision and pattern recognition[internet].ieee.1717-24.doi:10.1109/cvpr.2014.222.
[0278]
ma,j.et al.(2015)deep neural nets as a method for quantitative structure-activity relationships.j chem inf model.55(2):263-74.
[0279]
wang,c.et al.(2014)pairwise input neural network for target-ligand interaction prediction.bioinformatics and biomedicine(bibm),2014 ieee international conference.67-70.
[0280]
xu,y.et al.(2015)deep learning for drug-induced liver injury.j.chem.inf.model.55(10):2085-2093.doi:10.1021/acs.jcim.5b00238
related disease.-pubmed-ncbi.”accessed march 17.ncbi.nlm.nih.gov/pubmed/26342919.
[0303]
nozaki,hiroaki,taisuke kato,megumi nihonmatsu,yohei saito,ikuko mizuta,tomoko noda,ryoko koike,et al.2016.“distinct molecular mechanisms of htra1 mutants in manifesting heterozygotes with carasil.”neurology 86(21):1964-74.
[0304]
ogneva,irina v.,nikolay s.biryukov,toomas a.leinsoo,and irina m.larina.2014.“possible role of non-muscle alpha-actinins in muscle cell mechanosensitivity.”plos one 9(4).public library of science:e96395.
[0305]
peters,m.j.,joehanes,r.,pilling,l.c.,schurmann,c.,conneely,k.n.,powell,j.,reinmaa,e.,sutphin,g.l.,zhernakova,a.,schramm,k.,et al.(2015).the transcriptional landscape of age in human peripheral blood.nat.commun.6,8570.
[0306]
petkovich da,podolskiy di,lobanov av,lee s-g,miller ra,gladyshev vn.using dna methylation profiling to evaluate biological age and longevity interventions.cell metabolism.2017;25(4):954-960.e6.doi:10.1016/j.cmet.2017.03.016.
[0307]
phillips,catherine m.,louisa goumidi,sandrine bertrais,martyn r.field,l.adrienne cupples,jose m.ordovas,jolene mcmonagle,et al.2010.“acc2 gene polymorphisms,metabolic syndrome,and gene-nutrient interactions with dietary fat.”journal of lipid research 51(12):3500-3507.
[0308]
pinto,elisabete.2007.“blood pressure and ageing.”postgraduate medical journal 83(976).bmj group:109.
[0309]
pledgie,allison,yi huang,amy hacker,zhe zhang,patrick m.woster,nancy e.davidson,and robert a.casero jr.2005.“spermine oxidase smo(paoh1),not n1-acetylpolyamine oxidase pao,is the primary source of cytotoxic h2o2 in polyamine analogue-treated human breast cancer cell lines.”the journal of biological chemistry 280(48):39843-51.
[0310]
qian,hao,na luo,and yuling chi.2012.“aging-shifted prostaglandin profile in endothelium as a factor in cardiovascular disorders.”journal of aging research 2012(february).hindawi publishing corporation.doi:10.1155/2012/121390.
[0311]
savolainen,kalle,tiina j.kotti,werner schmitz,teuvo i.savolainen,raija t.sormunen,mika ilves,seppo j.vainio,ernst conzelmann,and j.kalervo hiltunen.2004.“a mouse model for alpha-methylacyl-coa racemase deficiency:adjustment of bile acid synthesis and intolerance to dietary methyl-branched lipids.”human molecular genetics 13(9):955

65.
[0312]
eija m.,remya r.nair,werner schmitz,ari-pekka kvist,myriam baes,j.kalervo hiltunen,and kaija j.autio.2015.“phytol is lethal for amacr-deficient mice.”biochimica et biophysica acta 1851(10):1394-1405.
[0313]
sergio sol
ó
rzano-vargas,r.,diana pacheco-alvarez,and alfonso le
ó
n-del-r
í
o.2002.“polycarboxylate synthetase is an obligate participant in biotin-mediated regulation of its own expression and of biotin-dependent carboxylases mrna levels in human cells.”proceedings of the national academy of sciences of the united states of america 99(8).national academy of sciences:5325-30.
[0314]
suzuki,yoichi,xue yang,yoko aoki,shigeo kure,and yoichi matsubara.2005.“mutations in the monocarboxylate synthetase gene hlcs.”human mutation 26(4):285-90.
[0315]
tang,eva h.c.,and paul m.vanhoutte.2008.“gene expression changes of prostanoid synthases in endothelial cells and prostanoid receptors in vascular smooth muscle cells caused by aging and hypertension.”physiological genomics 32(3):409-18.
[0316]
thomas,inas,and brigid gregg.2017.“metformin;a review of its history and future:from lilac to longevity.”pediatric diabetes 18(1):10

16.
[0317]
thomas,t.,and t.j.thomas.2017.“polyamine metabolism and cancer.-pubmed-ncbi.”accessed april 11.ncbi.nlm.nih.gov/pubmed/12927050.
[0318]
tong,liang.2013.“structure and function of biotin-dependent carboxylases.”cellular and molecular life sciences:cmls 70(5).nih public access:863.
[0319]
unno,keiko,tomokazu konishi,aimi nakagawa,yoshie narita,fumiyo takabayashi,hitomi okamura,ayane hara,et al.2015.“cognitive dysfunction and amyloidβaccumulation are ameliorated by the ingestion of green soybean extract in aged mice.”journal of functional foods 14:345-53.
[0320]
verdura e,et al.2017.“heterozygous htra1 mutations are associated with autosomal dominant cerebral small vessel disease.-pubmed-ncbi.”accessed april 11.ncbi.nlm.nih.gov/pubmed/26063658.
[0321]
weller j,et al.2017.“age-related decrease of adenosine-mediated relaxation in rat detrusor is a result of a2b receptor downregulation.-pubmed-ncbi.”accessed april 17.ncbi.nlm.nih.gov/pubmed/25728851.
[0322]
zhang,yongyou,amar desai,sung yeun yang,ki beom bae,monika i.antczak,stephen p.fink,shruti tiwari,et al.2015.“tissue regeneration.inhibition of the prostaglandin-degrading enzyme 15-pgdh potentiates tissue regeneration.”science 348(6240):aaa2340.
[0323]
seim,inge,siming ma,and vadim n.gladyshev.2016.“gene expression signatures of human cell and tissue longevity.”npj aging and mechanisms of disease 2(1).doi:10.1038/npjamd.2016.14.
[0324]
lample et al.

fader networks:manipulating images by sliding attributes’.nips 2017.
[0325]
ozerov et al.

in silico pathway activation network decomposition analysis(ipanda)as a method for biomarker development’.nature communications 2016.
[0326]
zhu,j.-y.,park,t.,isola,p.,and efros,a.a.(2017).unpaired image-to-image translation using cycle-consistent adversarial networks.in computer vision(iccv),2017 ieee international conference on,p.
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献