一种构建药物肝毒性预测模型的方法及其用途

2022-07-02 02:18:06 来源：中国专利 TAG：

humans and in animals[j].regulatory toxicology and pharmacology:rtp 2000；32(1):56-67)。而且其预测的肝毒性基本上是固有型的dili(intrinsic drug induced liver injury)，又称为非特异性dili，且对于特异质dili(idiosyncratic drug induced liver injury,idili)的预测率更低(funk c,roth a.current limitations and future opportunities for prediction of dili from in vitro[j].arch toxicol 2017；91(1):131-42)。即使候选药物通过临床ⅲ期实验，然而由于暴露的人群有限，大多数idili仍难于发现，最终导致药物上市后被撤市(seung-hyun k,naisbitt dj.update on advances in research on idiosyncratic drug-induced liver injury[j].allergy asthma&immunology research 2016；8(1):3-11)。鉴于传统肝毒性预测方法本质上的局限性，并且动物安全性评价方法耗时长、耗费高、用药量大，不适用于现代药物研发早期的高通量筛选，加之国际上对于动物福利的日益重视，倡导3r原则(减少、替代、优化)，因此寻找动物替代的毒性评价方法成为药物肝毒性评价方法发展的策略(macdonald js,robertson rtjts.toxicity testing in the 21st century:a view from the pharmaceutical industry[j].2009；110(1):40-6；krewski d,andersen me,tyshenko mg,et al.toxicity testing in the 21st century:progress in the past decade and future perspectives[j].archives of toxicology 2020；94(1):1-58)。
[0004]
近十余年来，随着现代生命科学、计算机、生物信息学等技术的快速发展，毒理学科的发展也进入了新的阶段。基于已有对dili机制的认识，以人源细胞为模型发展体外测试方法已经成为dili药物预测技术的发展方向，科学家们进行了各种尝试，并将生命组学包括基因组学、蛋白组学、代谢组学等技术应用其中，建立了各种体外肝毒性测试预测系统，包括以肝细胞组分(如代谢酶、转运体等)、2d或3d细胞、类肝组织、微肝芯片、肝切片等为测试模型，以及整合了化合物各类信息的计算机预测方法。然而，一方面，由于dili机制的复杂性导致dili,特别是特异质dili(idili)的机制的认识还十分有限，另一方面，一些类生理的体外模型尚有许多技术上的瓶颈有待突破，截止目前，尚没有一种药物肝毒性筛选方法被业界和监管机构广泛接受和许可。
[0005]
高内涵分析(hca，high content analysis)技术是为了满足高效新药筛选需求而开发的基于细胞图像定量测定的分析技术，能在单次实验获得受试药物毒性机制与效应相关的多维信息。目前，只有基于各类人肝细胞hca的药物肝毒性测试方法经过了批量药物验证,也适合于新药研发早期候选药物肝毒性的筛选的方法。然而，现有的方法主要是基于几个简单、非特异的细胞毒参数的测试,这些指标既与临床dili因果关系不明确，不能反映多样复杂的dili药物特点，也未经过系统的筛选。并且，由于在建模过程中，不同研究者使用的药物选择和分类标准不一，直接影响了已有方法预测的一致性与可信性，更是无法预测具有idili的药物。因此，新的基于2d细胞hca技术的药物肝毒性预测方法有待发现和发展。
[0006]
公开内容
[0007]
本公开通过批量已知dili药物肝细胞毒表型谱的hca测定，结合药物的人体暴露水平，利用机器学习方法识别和验证与dili具有最强相关性的机制模式(由特定细胞表型组合)，从而构建一个全新的基于2d人源细胞hca、适合药物发现与临床研究早期、高效的dili药物识别和预测的体系。该体系可以为降低新药研发成本、提高新药研发效率、保证临床用药安全提供技术支撑。
[0008]
本公开提供一种构建药物肝毒性预测模型的方法，包括：
[0009]
收集n个已知的具有严重dili(severe dili，sdili)和非dili(non-dili，ndili)药物，收集药物的c
max
信息；
[0010]
用不同浓度的药物处理细胞，通过hca测定细胞的特定细胞表型的参数变化率，确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,lec)，并利用公式ti
lec
＝lec/c
max
，计算每一个细胞表型的ti
lec
值；
[0011]
利用sdili和ndili药物的特定细胞表型的ti
lec
值对机器学习模型进行训练，以构建药物肝毒性预测模型，
[0012]
其中，n为大于或等于10的整数(例如大于或等于50，大于或等于60，例如55，60，65，70，80)，
[0013]
lec为引起细胞表型的参数变化率大于或等于25％的药物浓度，
[0014]
所述特定细胞表型包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h和gsh_24h，或者
[0015]
所述特定细胞表型包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h，gsh_24h，ph2ax_16h，atf6_5h，hif1α_3h，nrf2_6h，hif1α_24h和nrf2_24h，
[0016]
优选地，所述机器学习模型为fisher线性判别分析模型或朴素贝叶斯(bayes)分类模型。
[0017]
在一个实施中，所述构建药物肝毒性预测模型的方法，其中利用sdili和ndili药物的特定细胞表型的ti
lec
值对机器学习模型进行训练包括：
[0018]
从n个药物样本中随机提取55％～95％(例如60％，65％，75％，85％或90％)的样本作为训练集，利用训练集对机器学习模型进行训练，构建药物肝毒性预测模型。
[0019]
在一个实施中，所述构建药物肝毒性预测模型的方法，其中利用sdili和ndili药物的特定细胞表型的ti
lec
值对机器学习模型进行训练包括：
[0020]
从n个药物样本中随机提取55％～95％(例如60％，65％，75％，85％或90％)的样本作为训练集，随机提取m次，得到m个训练集，利用m个训练集分别对机器学习模型进行训练，构建得到m个药物肝毒性预测模型，将m个药物肝毒性预测模型集成为药物肝毒性集成预测模型，
[0021]
其中m为大于或等于200的整数，例如300，400，600，800，1000，1200，1500，2000，
[0022]
优选地，所述机器学习模型为fisher线性判别分析模型或朴素贝叶斯(bayes)分类模型。
[0023]
在一个实施中，所述构建药物肝毒性预测模型的方法，其中所述细胞选自肝细胞(例如hepg2细胞)、p65-egfp_cho、hif1a-egfp_cho、atf6-egfp_u2os、nrf2-egfp_a549或其任意组合，
[0024]
优选地，所述细胞为肝细胞(例如hepg2细胞)，细胞表型的参数变化率＝(药物处理组荧光强度-溶剂对照组荧光强度)/溶剂对照组荧光强度
×
100％，或者细胞表型的参数变化率＝(受试药物处理组荧光强度-溶剂对照组荧光强度)/(阳性药物处理组荧光强度-溶剂对照组荧光强度)
×
100％；
[0025]
优选地，所述细胞为p65-egfp_cho和/或atf6-egfp_a549时，细胞表型的参数变化
率＝(药物处理组r值-溶剂对照组r值)/溶剂对照组r值
×
100％，或者细胞表型的参数变化率＝(受试药物处理组r值-溶剂对照组荧光强度)/(阳性药物处理组r值-溶剂对照组r值)
×
100％，其中r值＝(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)；
[0026]
优选地，所述细胞为hif1a-egfp_cho和/或nrf2-egfp_a549时，细胞表型的参数变化率＝(药物处理组r值-溶剂对照组r值)/溶剂对照组r值
×
100％，或者细胞表型的参数变化率＝(受试药物处理组r值-溶剂对照组荧光强度)/(阳性药物处理组r值-溶剂对照组r值)
×
100％，其中r值＝受试药物处理细胞/细胞核内荧光蛋白的荧光强度-背景荧光强度。
[0027]
本公开还提供一种药物肝毒性预测模型，其由本公开所述的构建药物肝毒性预测模型的方法构建而成。
[0028]
本公开还提供所构建的药物肝毒性预测模型在预测药物肝毒性中的用途。
[0029]
本公开还提供一种预测药物肝毒性的方法，包括：
[0030]
用不同浓度的待测药物处理细胞，通过hca测定细胞的特定细胞表型的参数变化率，确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,lec)，利用公式ti
lec
＝lec/c
max
，计算每一个细胞表型的ti
lec
值；
[0031]
将待测药物的特定细胞表型的ti
lec
值输入本公开所构建的药物肝毒性预测模型，判定待测药物是否具有肝毒性，或者
[0032]
将待测药物的特定细胞表型的ti
lec
值输入本公开所构建的药物肝毒性集成预测模型，根据m个药物肝毒性预测模型输出的结果，得到m个预测值(即，判定药物的肝毒性为阳性或阴性)，如果在m个预测值中，有50％以上判定为肝毒性为阳性，则判断该待测药物具有肝毒性，
[0033]
其中lec为引起细胞表型的参数变化率大于或等于25％的药物浓度，
[0034]
所述特定细胞表型包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h和gsh_24h，或者
[0035]
所述特定细胞表型包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h，gsh_24h，ph2ax_16h，atf6_5h，hif1α_3h，nrf2_6h，hif1α_24h和nrf2_24h。
[0036]
本公开还提供一种预测药物肝毒性的系统，包括：高内涵分析(hca)仪、计算模块和预测模块，
[0037]
高内涵分析(hca)仪用于测定用不同浓度的待测药物处理后细胞的细胞表型的参数变化率；
[0038]
计算模块用于确定药物最低起效浓度(lowest effective concentration,lec)，并利用公式ti
lec
＝lec/c
max
计算ti
lec
值；
[0039]
预测模块包括本公开所构建的药物肝毒性预测模型或药物肝毒性集成预测模型，用于预测待测药物的肝毒性。
[0040]
本公开还提供一种预测药物肝毒性的装置，包括：
[0041]
存储器，被配置为存储指令；
[0042]
处理器，耦合到存储器，处理器被配置为基于存储器存储的指令执行实现如本公开所述的预测药物肝毒性的方法。
[0043]
本公开还提供一种计算机可读存储介质，其中，计算机可读存储介质存储有计算机指令，指令被处理器执行时实现如本公开所述的预测药物肝毒性的方法。
[0044]
本公开还提供特定细胞表型组合在预测药物肝毒性中的用途，其中所述特定细胞表型组合包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h和gsh_24h，或者
[0045]
所述特定细胞表型组合包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h，gsh_24h，ph2ax_16h，atf6_5h，hif1α_3h，nrf2_6h，hif1α_24h和nrf2_24h。
[0046]
在一个实施例中，所述特定细胞表型组合为lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h和gsh_24h的组合。
[0047]
在一个实施例中，所述特定细胞表型组合为lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h，gsh_24h，ph2ax_16h，atf6_5h，hif1α_3h，nrf2_6h，hif1α_24h和nrf2_24h的组合。
[0048]
在一个实施例中，所述的特定细胞表型组合在预测药物肝毒性中的用途，其中在预测药物肝毒性时，用不同浓度的药物处理细胞，通过高内涵分析(hca)测定所述特定细胞表型组合中每个细胞表型的参数变化率，确定每个细胞表型的药物最低起效浓度(lowest effective concentration,lec)，利用公式ti
lec
＝lec/c
max
，计算每个细胞表型的ti
lec
值，利用特定细胞表型组合中每个细胞表型的ti
lec
值预测药物的肝毒性。
[0049]
术语定义
[0050]
在本公开中，除非另有说明，否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且，本文中所用的细胞培养、分子遗传学、核酸化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时，为了更好地理解本公开，下面提供相关术语的定义和解释。
[0051]
如本文中所使用的，术语“lc3b_16h”为待测药物孵育hepg2细胞16h后，荧光标记的微管相关蛋白1轻链3b蛋白通过高内涵分析输出的荧光强度的变化率，所述荧光强度的变化率的计算方法如下：
[0052]
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度；
[0053]
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
[0054]
如本文中所使用的，术语“mmp_72h”为待测药物孵育hepg2细胞72h后，线粒体膜电位通过高内涵分析输出的荧光强度的变化率，所述荧光强度的变化率的计算方法如下：
[0055]
(待测药物组的发光值-溶剂对照组的荧光强度)/溶剂对照组的荧光强度；
[0056]
(受试药物组的发光值-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)；
[0057]
如本文中所使用的，术语“mnsod_24h”为待测药物孵育hepg2细胞24h后，荧光标记的锰超氧化物歧化酶通过高内涵分析输出的荧光强度的变化率，所述荧光强度的变化率的计算方法如下：
[0058]
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度；
[0059]
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶
剂对照组的荧光强度)。
[0060]
如本文中所使用的，术语“nuclear_24h”为待测药物孵育hepg2细胞24h后，荧光标记的细胞核通过高内涵分析输出的反映细胞核形态参数的数值的变化率，所述反映细胞核形态参数的数值的变化率的计算方法如下：
[0061]
(待测药物组的数值-溶剂对照组的数值)/溶剂对照组的数值；
[0062]
(受试药物组的数值-溶剂对照组的数值)/(阳性药物组的数值-溶剂对照组的数值)。
[0063]
如本文中所使用的，术语“α-tubulin_24h”为待测药物孵育hepg2细胞24h后，荧光标记的β微管蛋白通过高内涵分析输出的荧光强度的变化率，所述荧光强度的变化率的计算方法如下：
[0064]
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度；
[0065]
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
[0066]
如本文中所使用的，术语“nuclear_72h”为待测药物孵育hepg2细胞72h后，荧光标记的细胞核通过高内涵分析输出的反映细胞核形态的参数数值的变化率，所述反映细胞核形态的参数数值的变化率的计算方法如下：
[0067]
(待测药物组的数值-溶剂对照组的数值)/溶剂对照组的数值；
[0068]
(受试药物组的数值-溶剂对照组的数值)/(阳性药物组的数值-溶剂对照组的数值)。
[0069]
如本文中所使用的，术语“gsh_24h”为待测药物孵育hepg2细胞24h后，荧光标记的谷胱甘肽通过高内涵分析输出的荧光强度的变化率，所述荧光强度的变化率的计算方法如下：
[0070]
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度；
[0071]
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
[0072]
如本文中所使用的，术语“ph2ax_16h”为待测药物孵育hepg2细胞16h后，荧光标记的磷酸化组蛋白h2ax通过高内涵分析输出的荧光强度的变化率，所述荧光强度的变化率的计算方法如下：
[0073]
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度；
[0074]
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
[0075]
如本文中所使用的，术语“atf6_5h”为待测药物孵育atf6-egfp_u2os细胞5h后内质网应激的程度(r)。atf6-egfp_u2os细胞为活化转录因子6核转位的激活反应模式，细胞静息状态下，荧光标记的转录因子蛋白在胞浆中分布，被激活时，荧光标记标志分子转位至细胞核中，因此，通过定量分析细胞荧光蛋白的核转位数量即可表征该通路激活的程度(r)。内质网应激的程度(r)可通过高内涵分析输出的细胞核中荧光蛋白和细胞胞质荧光蛋白的荧光强度来计算，具体计算方法如下：
[0076]
r＝(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
[0077]
如本文中所使用的，术语“hif1α_24h”为待测药物孵育hif1α-egfp_cho细胞24h后缺氧应激反应通路被激活的程度(r)。hif1a-egfp_cho细胞为低氧诱导因子-1α细胞内积累的激活反应模式，细胞静息状态下，荧光标记蛋白低表达，被激活时，荧光标记蛋白表达量升高甚至转移至细胞核中，表现为细胞中荧光强度增加，因此通过分析细胞核或细胞内累积荧光蛋白含量来表征相应通路的激活程度(r)。缺氧应激反应通路被激活的程度(r)可通过高内涵分析输出的细胞和/或细胞核内荧光蛋白的荧光强度来计算，具体计算方法如下：
[0078]
r＝待测药物组处理的细胞和/或待测药物组处理的细胞的细胞核内荧光蛋白的荧光强度-背景荧光强度。
[0079]
如本文中所使用的，术语“hif1α_3h”为待测药物孵育hif1α-egfp_cho细胞3h后缺氧应激反应通路被激活的程度(r)。hif1a-egfp_cho细胞为hif1a细胞内积累的激活反应模式，细胞静息状态下，荧光标记蛋白低表达，被激活时，荧光标记蛋白表达量升高甚至转移至细胞核中，表现为细胞中荧光强度增加，因此通过分析细胞核或细胞内累积荧光蛋白含量来表征相应通路的激活程度(r)。缺氧应激反应通路被激活的程度(r)可通过高内涵分析输出的细胞和/或细胞核内荧光蛋白的荧光强度来计算，具体计算方法如下：r＝待测药物组处理的细胞和/或待测药物组处理的细胞的细胞核内荧光蛋白的荧光强度-背景荧光强度。
[0080]
如本文中所使用的，术语“nrf2_6h”为待测药物孵育nrf2-egfp_a549细胞6h后氧化应激通路被激活的程度(r)。nrf2-egfp_a549细胞为nrf2(nuclear factor erythroid-2 related factor 2，核因子e2相关因子2)细胞内积累的激活反应模式，细胞静息状态下，荧光标记蛋白低表达，被激活时，荧光标记蛋白表达量升高甚至转移至细胞核中，表现为细胞中荧光强度增加，因此通过分析细胞核或细胞内累积荧光蛋白含量来表征相应通路的激活程度(r)。氧化应激通路被激活的程度(r)可通过高内涵分析输出的细胞和/或细胞核内荧光蛋白的荧光强度来计算，具体计算方法如下：
[0081]
r＝待测药物组处理的细胞和/或待测药物组处理的细胞的细胞核内荧光蛋白的荧光强度-背景荧光强度。
[0082]
如本文中所使用的，术语“nf-κb_0.67h”为待测药物孵育p65-egfp_cho细胞0.67h后炎性应激nf-κb通路被激活的程度细胞(r)。p65-egfp_cho细胞为p65转录因子核转位的激活反应模式，细胞静息状态下，荧光标记的p65蛋白在胞浆中分布，被激活时，荧光标记的p65转位至细胞核中，因此，通过定量分析细胞荧光蛋白的核转位数量即可表征该通路激活的程度(r)。炎性应激nf-κb通路被激活的程度细胞(r)可通过高内涵分析输出的细胞核中荧光蛋白和细胞胞质荧光蛋白的荧光强度来计算，具体计算方法如下：
[0083]
r＝(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
[0084]
如本文中所使用的，术语“c
max”为药物在人体体内暴露的最大浓度。
[0085]
本公开的有益效果
[0086]
本公开提供的预测药物肝毒性的方法可通过对肝细胞进行最少3组(7个参数)，最多6组(13个参数)的高内涵分析测试实验，结合药物人体体内暴露c
max
值，即可鉴定待测药物对肝细胞的毒性，并且该方法的准确性最高可达87％，敏感性和特异性最高分别为84％、94％，显著高于已报道的基于hca甚至是其他技术构建的预测方法。
附图说明
[0087]
图1显示了本公开的构建药物肝毒性预测模型的方法的一个实施例的流程示意图；
[0088]
图2显示了本公开的预测药物肝毒性的方法的一个实施例的流程示意图；
[0089]
图3显示了本公开的预测药物肝毒性的系统的一个实施例的结构示意图；
[0090]
图4显示了本公开的预测药物肝毒性的装置的一个实施例的结构示意图；
[0091]
图5显示了建立本公开预测药物肝毒性的方法的流程；
[0092]
图6显示了受试药物分组特征。其中，a显示了受试药物涵盖的适应症类型及数量；b显示了测试集药物的肝损伤类型、logp值和每日给药剂量、c
max
值分布图；c显示了验证集药物的肝损伤类型、logp值和每日给药剂量、c
max
值分布图；cad代表cardiovascular diseases心血管疾病药物；gid代表gastrointestinal diseases胃肠疾病药物。
[0093]
图7显示了应用tclass分类系统构建基于特定细胞表型组合的药物肝毒性预测模型的流程图。
[0094]
图8显示了测试集药物hepg2细胞表型参数初筛结果；
[0095]
图9显示了测试集药物细胞应激反应表型参数初筛结果；
[0096]
图10显示了测试集药物细胞表型参数效应的测定结果。其中，a显示了药物细胞表型参数ec
50
和lec值热图；b显示了基于药物细胞表型参数的ti
50
和ti
lec
值热图；c显示了不同dili损伤类型药物的ti
50
值分布；图d显示了不同dili损伤类型药物的ti
lec
值分布；ti
50
＝ec
50
/c
max
，ti
lec
＝lec/c
max
；*p《0.05,**p《0.01,***p《0.001vs ndili类药物；
[0097]
图11显示了测试集药物基于药物表型ti
50
和ti
lec
值的dili判定。其中，a显示了sdili、mdili和ndili药物肝毒性阳性参数热图；b和e显示了三类药物肝毒性阳性参数的数量及比较；c和f显示了基于ti
50
和ti
lec
值判断dili的敏感性和特异性；d和g显示了基于药物ti
50
和ti
lec
值，单细胞表型参数对sdili、mdili和ndili类药物的敏感性；*p《0.05,**p《0.01,***p《0.001vs ndili类药物；
[0098]
图12显示了基于药物影响细胞表型参数的ti
50
和ti
lec
值的roc曲线分析，其中基于ti
50
预测时，所用细胞表型参数为全部的23个参数，基于ti
lec
预测时，所用细胞表型参数为去除ir_72h、f-actin_24h、mmp_24h这三个参数后剩余的20个参数；
[0099]
图13显示了tclass分类系统确定优化的测试组合盘及特性。其中a显示了不同测试组合盘的参数组成；b显示了不同测试组合盘的roc曲线分析；
[0100]
图14显示了验证集药物优化测试组合盘参数初筛结果；
[0101]
图15显示了验证集药物优化表型测试组合参数结果。其中，a显示了药物优化测试组合盘参数lec值热图；b显示了药物优化测试组合盘参数ti
lec
值热图；c显示了sdili、mdili、adili和ndili类药物肝毒性阳性参数热图；
[0102]
图16显示了基于细胞表型参数组合1和组合4的受试药物阳性参数的分布图；
[0103]
图17显示了预测方法对不同肝损伤类型的受试药物的敏感性。其中，c为胆汁淤积型损伤，h为肝细胞型损伤，m为混合型损伤。
具体实施方式
[0104]
下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完
egfp_cho、atf6-egfp_u2os、nrf2-egfp_a549或其任意组合。
[0117]
步骤2中，所述细胞可以为肝细胞(例如hepg2细胞)，此时细胞表型的参数变化率＝(药物处理组荧光强度-溶剂对照组荧光强度)/溶剂对照组荧光强度
×
100％，或者细胞表型的参数变化率＝(受试药物处理组荧光强度-溶剂对照组荧光强度)/(阳性药物处理组荧光强度-溶剂对照组荧光强度)
×
100％，其中，所述细胞表型参数选自lc3b，mnsod，α-tubulin，gsh，ph2ax，mmp。
[0118]
步骤2中，所述细胞可以为所述细胞为肝细胞(例如hepg2细胞)，细胞表型的参数变化率＝(药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)/溶剂对照组反应细胞核形态的数值
×
100％，或者细胞表型的参数变化率＝(受试药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)/(阳性药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)
×
100％，其中，所述细胞表型参数为细胞核。
[0119]
步骤2中，所述细胞可以为所述细胞为p65-egfp_cho和/或atf6-egfp_u2os，细胞表型的参数变化率＝(药物处理组r值-溶剂对照组r值)/溶剂对照组r值
×
100％，或者细胞表型的参数变化率＝(受试药物处理组r值-溶剂对照组荧光强度)/(阳性药物处理组r值-溶剂对照组r值)
×
100％，其中r值＝(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
[0120]
步骤2中，所述细胞可以为hif1a-egfp_cho和/或nrf2-egfp_a549，细胞表型的参数变化率＝(药物处理组r值-溶剂对照组r值)/溶剂对照组r值
×
100％，或者细胞表型的参数变化率＝(受试药物处理组r值-溶剂对照组荧光强度)/(阳性药物处理组r值-溶剂对照组r值)
×
100％，其中r值＝受试药物处理细胞或细胞核内荧光蛋白的荧光强度-背景荧光强度。
[0121]
由上述构建药物肝毒性预测模型的方法构建而成的药物肝毒性预测模型或药物肝毒性集成预测模型可以用于预测新药物的肝毒性。
[0122]
图2为本公开的预测药物肝毒性的方法的一个实施例的流程示意图。其中
[0123]
步骤1，用不同浓度的待测药物处理细胞，通过hca测定细胞的特定细胞表型的参数变化率，确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,lec)，利用公式ti
lec
＝lec/c
max
，计算每一个细胞表型的ti
lec
值。
[0124]
步骤1中lec为引起细胞表型的参数变化率大于或等于25％的药物浓度。
[0125]
步骤1中特定细胞表型包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h和gsh_24h，或者
[0126]
所述特定细胞表型包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h，gsh_24h，ph2ax_16h，atf6_5h，hif1α_3h，nrf2_6h，hif1α_24h和nrf2_24h。
[0127]
步骤2，将待测药物的每一个细胞表型的ti
lec
值输入所构建的药物肝毒性预测模型，判定待测药物是否具有肝毒性，或者
[0128]
将待测药物的每一个细胞表型的ti
lec
值输入所构建的药物肝毒性集成预测模型，根据m个药物肝毒性预测模型输出的结果，得到m个预测值(肝毒性阳性或阴性)，如果在m个预测值中，有50％以上判定为肝毒性为阳性，则判断该待测药物具有肝毒性。
[0129]
图3为本公开的预测药物肝毒性的系统的一个实施例的结构示意图。如图3所示，预测药物肝毒性的系统包括：高内涵分析(hca)仪、计算模块和预测模块。其中：
[0130]
高内涵分析(hca)仪用于测定用不同浓度的待测药物处理后细胞的细胞表型的参数变化率；
[0131]
计算模块用于确定药物最低起效浓度(lowest effective concentration,lec)，并利用公式ti
lec
＝lec/c
max
计算ti
lec
值；
[0132]
预测模块包括本公开所构建的药物肝毒性预测模型或药物肝毒性集成预测模型，用于预测待测药物的肝毒性。
[0133]
图4为本公开的预测药物肝毒性的装置的一个实施例的结构示意图。如图4所示，预测药物肝毒性的装置包括：存储器41和处理器42。
[0134]
存储器41用于存储指令，处理器42耦合到存储器41，处理器42被配置为基于存储器存储的指令执行实现如图2中任一实施例涉及的方法。
[0135]
如图4所示，该预测药物肝毒性的装置还包括通信接口43，用于与其它设备进行信息交互。同时，该预测药物肝毒性的装置还包括总线44，处理器42、通信接口43、以及存储器41通过总线44完成相互间的通信。
[0136]
存储器41可以包含高速ram存储器，也可还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器41也可以是存储器阵列。存储器41还可能被分块，并且块可按一定的规则组合成虚拟卷。
[0137]
此外，处理器42可以是一个中央处理器cpu，或者可以是专用集成电路asic，或是被配置成实施本公开实施例的一个或多个集成电路。
[0138]
本公开同时还涉及一种计算机可读存储介质，其中计算机可读存储介质存储有计算机指令，指令被处理器执行时实现如图2中任一实施例涉及的方法。
[0139]
本公开还涉及特定细胞表型组合在预测药物肝毒性中的用途，其中所述特定细胞表型组合包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h和gsh_24h，或者
[0140]
所述特定细胞表型组合包括：lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h，gsh_24h，ph2ax_16h，atf6_5h，hif1α_3h，nrf2_6h，hif1α_24h和nrf2_24h。
[0141]
例如，所述特定细胞表型组合可以为lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h和gsh_24h的组合。
[0142]
再例如，所述特定细胞表型组合可以为lc3b_16h，mmp_72h，mnsod_24h，nuclear_24h，α-tubulin_24h，nuclear_72h，gsh_24h，ph2ax_16h，atf6_5h，hif1α_3h，nrf2_6h，hif1α_24h和nrf2_24h的组合。
[0143]
在预测药物肝毒性时，用不同浓度的药物处理细胞，通过高内涵分析(hca)测定所述特定细胞表型组合中每个细胞表型的参数变化率，确定每个细胞表型的药物最低起效浓度(lowest effective concentration,lec)，利用公式ti
lec
＝lec/c
max
，计算每个细胞表型的ti
lec
值，利用特定细胞表型组合中每个细胞表型参数的ti
lec
值预测药物的肝毒性。
[0144]
下面通过一个具体实施例对本公开进行详细说明。
[0145]
除非特别指明，本公开中所使用的分子生物学实验方法和免疫检测法，基本上参
照j.sambrook等人，分子克隆：实验室手册，第2版，冷泉港实验室出版社，1989，以及f.m.ausubel等人，精编分子生物学实验指南，第3版，john wiley&sons,inc.，1995中所述的方法进行；限制性内切酶的使用依照产品制造商推荐的条件。实施例中未注明具体条件者，按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品。本领域技术人员知晓，实施例以举例方式描述本公开，且不意欲限制本公开所要求保护的范围。
[0146]
实施例：药物肝毒性预测模型的构建
[0147]
本实施例基于细胞表型参数的高内涵技术分析平台，hepg2细胞为实验测试模型，以规范定义肝损伤严重程度的四类不同肝损伤程度(严重，中等、定义不明确、非毒)的223个上市药物为研究对象，分为测试集(120个药物)和验证集(103个药物)两组，通过定量测定药物处理肝细胞不同时间点对全细胞毒相关表型(共计23个)特征的影响，建立药物肝细胞毒表型谱数据库，再结合人体最大血药浓度(maximum total concentration，cmax)，构建dili相关肝细胞表型特征谱。采用tclass分类识别软件，结合测试集药物临床肝损伤程度和体外肝细胞表型谱特征数据通过逐步工作流程(stepwise workflow)和roc回归分析，识别和验证用于预测sdili药物的最佳细胞表型组合。利用最佳细胞表型组合构建dili集成预测模型。最后用验证集药物的细胞表型进行验证，最终确定dili预测组合及预测模型。具体的工作流程如图5所示。
[0148]
一、实验材料
[0149]
1.1主要药品与试剂：
[0150]
1)药品
[0151]
223个受试药物购自美国selleck公司和中国efebio公司(fda-approved drug library,l1300)。工具药二联吡啶(2,2
’‑
bipyridyl,bp)、衣霉素(tunicamycin,tm)、苯二酚(tertiary butylhydroquinone,tbhq)、羟氯喹(hydroxychloroquine，hcq)，依托泊苷(etoposide，ept)购自美国sigma公司；工具药白细胞介素1β(interleukin-1β,il-1β)购自美国peprotech公司。
[0152]
2)荧光染料和抗体
[0153]
染料：细胞核染料hoechst 33342、微丝f-actin染料alexa flour 488-phalloidin、线粒体膜电位染料mito tracker red cmxros、溶酶体ph染料lyso tracker deepred、gsh染料cm-h2dcfda、死细胞核染料toto-3、谷胱甘肽染料mbci均购买于美国life technologies公司。
[0154]
抗体：兔抗lc3b单克隆抗体、小鼠抗a-微管蛋白单克隆抗体、小鼠抗mnsod单克隆抗体、小鼠抗ph2ax单克隆抗体以及alexa fluor 488标记的驴抗小鼠igg二抗、alexa fluor 549标记的驴抗小鼠igg二抗、alexa fluor 549标记的驴抗兔igg二抗均购买于美国life technologies公司。
[0155]
3)细胞培养相关试剂
[0156]
dmem高糖培养基、rpmi1640基础培养基、f12培养基、胎牛血清(fetal bovine serum，fbs)和hank's平衡盐溶液(hank's balanced salt solution,hbss)购买于美国thermo scientific hyclone公司；牛血清白蛋白(bovine serum albumin,bsa)购自美国sigma-aldrich公司；g418、l-glutamine和hepes缓冲液购买于美国life technologies公
司。胰蛋白酶购买于美国merk公司；dmso溶液、甲醛溶液、tritonx-100、青霉素、链霉素及其他常规化学试剂为国产试剂。
[0157]
1.2主要仪器及耗材
[0158]
高内涵成像系统(in cell analyzer 1000或者in cell analyzer 2000)及分析工作站(in cell analyzer workstation 3.7.2)购买于美国ge healthcare life science。
[0159]
黑边底透的96孔板购买于美国corning公司。
[0160]
1.3细胞系
[0161]
肝癌细胞系hepg2细胞(由中国人民解放军军事科学院军事医学科学院提供)、hif1α-egfp_cho(cho细胞系稳定表达hif1α-egfp荧光蛋白)、p65-egfp_cho(cho细胞系稳定表达nf-κb-egfp荧光蛋白)和atf6-egfp_u2os(u2os细胞系稳定表达atf6-egfp荧光蛋白)细胞株购自美国thermo fisher scientific公司；nrf2-egfp_a549(a549细胞系稳定表达nrf2-egfp荧光蛋白)细胞株按照文献方法(angela schoolmeesters,daniel d brown,yuriy fedorov.kinome-wide functional genomics screen reveals a novel mechanism of tnfα-induced nuclear accumulation of the hif-1αtranscription factor in cancer cells.plos one.2012；7(2):e31270.doi:10.1371/journal.pone.0031270)构建。
[0162]
二、实验方法
[0163]
2.1受试药物选择、分类和分组
[0164]
由美国nih pubmed数据库和肝毒性网站(http://www.livertox.nih.gov)livertox数据库,中国肝毒性专业网站(http://www.hepatox.org/)hepatox数据库，结合实验室药物实体子库，选取223个受试药物。并从drug bank数据库(https://www.drugbank.ca/)收集受试药物化学结构smiles表达式、脂溶性系数logp值、适应症、每日服药剂量、c
max
、药物靶点等信息。
[0165]
目前dili损伤分类主要有两大体系，一是livertox数据库依据肝损伤的“可能性分值(likelihood score)”将药物肝毒性损伤程度分为a到e，分别定义为明确可能、高度可能、很可能、可能及不可能等级。另一个是minjun chen教授等人依据药物fda发布的药品使用说明书，建立的dilirank数据库将其中的药物分为dili最相关(most-dili concern，)、dili较相关(less-dili concern)、dili不相关(no-dili concern)和不明确(ambiguous-dili concern)四类(chen m,suzuki a,thakkar s,yu k,hu c,tong w.dilirank:the largest reference drug list ranked by the risk for developing drug-induced liver injury in humans[j].drug discovery today 2016；21(4):648-53；chen m,vijay v,shi q,liu z,fang h,tong w.fda-approved drug labeling for the study of drug-induced liver injury[j].drug discov today 2011；16(15-16):697-703.)。本技术兼顾上述两类分类体系的优势，将入选受试药物分为严重dili(severe dili，sdili)、中度dili(moderate dili，mdili)、不明确(ambiguous dili，adili)和非dili(non-dili，ndili)四类，具体的分类准则如表1所示。入选药物中有81个sdili、81个mdili、30个adili和31个ndili药物。
[0166]
此外，根据建模和验证需求，本研究将223个受试药物随机分为测试集和验证集两
部分。测试集共120个药物，其中sdili、mdili和ndili分别50、50和20个；验证集包含了31个sdili、31个mdili、30个adili和11个ndili药物。测试集和验证集药物名称见表2，表3。
[0167]
受试药物涉及抗生素、非甾体抗炎药、抗精神病药(主要为抗抑郁和抗躁狂)、抗肿瘤药物、抗病毒药、心血管疾病药物，降脂药、抗真菌药物和激素类药物等，各类药物所占比例如图6中a所示。对比两组药物肝损伤类型、logp值、给药剂量及c
max
值分布，结果如图6中b和c所示，可以看出，本实验两组药物的上述特性基本均衡，无明显的偏向性。
[0168]
表1.受试药物肝损伤程度分类及准则
[0169][0170]
表2.测试集药物清单
[0171]
[0172][0173]
表3.验证集药物清单
[0174]
[0175][0176]
2.2细胞培养与药物处理
[0177]
2.2.1药物溶液配置
[0178]
药物干粉溶解于dmso溶液中，配置成10～30mm的储存液，分装并储存于-20℃冰箱备用。每次实验时，取相应药物储存液用培养液稀释成3
×
终浓度的工作液。
[0179]
2.2.2细胞株培养
[0180]
hif1a-egfp_cho和p65-egfp_cho细胞用f12完全培养基(含有10％的胎牛血清(fbs)、100ku/l青霉素及链霉素、氨苄霉素和0.5mg/ml的遗传霉素(g418))、atf6-egfp_u2os和nrf2-egfp_a549细胞用dmem完全培养基(含有10％的fbs、100ku/l的青霉素及链霉素、氨苄霉素、0.5mg/ml的g418和2mm l-谷氨酰胺)、hepg2用rpmi 1640完全培养基(含有10％的fbs、100ku/l青霉素及链霉素、氨苄霉素)在37℃，5％co2条件的细胞培养箱中培养。atf6-egfp_u2os和p65-egfp_cho细胞系进行药物测试时使用分析培养基，分别为含有1％fbs的dmem培养液和含有0.1％fbs、10mm hepes的f12培养液。
[0181]
2.2.3hepg2细胞药物孵育处理
[0182]
用rpmi 1640完全培养基(含有10％fbs、100ku/l青霉素、链霉素和氨苄霉素)在37℃，5％co2的细胞培养箱中培养。实验前，将生长接近融合的hepg2细胞消化成单个细胞，使用完全培养基稀释，并以合适的密度种于黑边底透的96孔板中。16、24、72h药物处理的种板密度分别为8
×
103、8
×
103、4
×
103/100μl/孔；细胞种板培养18-24h后，hepg2细胞加入受试药物前16、24、72h，分别用新鲜培养基100、100、150μl/孔换液，再分别加入50、50、75μl/孔3
×
终浓度的受试药物工作液，培养箱中孵育。不同测试组合中受试药物孵育时间和使用的阳性对照药物详见表4。
[0183]
表4.hepg2细胞表型参数实验检测条件
w,li ff,li h,wang l.dynamic cytotoxic profiles of sulfur mustard in human dermal cells determined with multiparametric high-content analysis[j].toxicology research 2016；5(2):583-93。
[0192]
1)细胞核、微管相关蛋白1轻链3b(lc3b)蛋白、溶酶体和磷酸化组蛋白(ph2ax)荧光标记
[0193]
药物处理细胞16h后直接加入50l/孔含细胞核(4m hoechst33342)和溶酶体(200nm lysotracker deepred)染料的培养液，置于细胞培养箱中孵育30min；直接加入100l/孔固定液(含12％甲醛的pbs)室温固定20min；弃液，加入200l/孔透膜液(含0.1％triton x-100的pbs溶液)透膜30min；弃液，使用200l/孔pbs溶液洗1次，再加入200l/孔封闭液(含5％的bsa的pbs溶液)室温孵育1h；弃液，加入40l/孔含小鼠抗ph2ax单克隆抗体的封闭液(1:1000封闭液稀释)，4℃避光孵育过夜；弃液，使用100l/孔封闭液洗3次后加入40l/孔含兔抗lc3b单克隆抗体的封闭液(1:1000封闭液稀释)，室温孵育1h；弃液，加入50l/孔含alexa flour 488标记的驴抗小鼠igg二抗和alexa flour 549标记的驴抗兔igg二抗的封闭液(均为1:500封闭液稀释)，室温避光孵育1h；弃液，使用200l/孔pbs溶液洗3次，最后加入200l/孔pbs溶液，上机检测分析。
[0194]
2)细胞核、线粒体膜电位(mmp)、锰超氧化物歧化酶(mnsod)、核膜通透性(nmp)荧光标记
[0195]
具体实验操作步骤如1)中所述。药物暴露处理细胞24h后加入50l/孔含细胞核、线粒体(2m mitotracker red cmxros)和死细胞核(0.4m toto-3)染料的培养液，置于细胞培养箱中孵育30min；固定20min，透膜30min，封闭1h；分别使用含小鼠抗mnsod单克隆抗体的封闭液(1:500封闭液稀释)和含alexa flour 488标记的驴抗小鼠igg二抗的封闭液(1:500封闭液稀释)进行mnsod的标记；最后标记好的细胞置于200l的pbs溶液中，上机检测分析。
[0196]
3)细胞核、谷胱甘肽(gsh)和细胞骨架荧光标记
[0197]
药物孵育24h后，使用hbss溶液100l/孔洗1次，再加入100l/孔含细胞核和gsh染料的hbss溶液(细胞核染料10mm hoechst33342按每10mlhbss溶液加入1l，gsh染料1mm cm-h2dcfda按每10ml hbss溶液加入10l)，37℃孵育45min；室温固定液(含0.1％triton x-100的hbss溶液)固定20min，使用hbss溶液洗1次，透膜30min，加入50l/孔含488标记鬼笔环肽微丝染料(27.5l alexa 488-phalloidin甲醇母液溶于5.5ml pbs溶液中)的pbs溶液，室温避光孵育1h；封闭1h，使用含40l/孔含小鼠a-抗微管蛋白单克隆抗体的封闭液(1:500封闭液稀释)和含alexa flour 549标记的驴抗小鼠igg二抗的封闭液(1:500封闭液稀释)标记α-tubulin；最后标记好的细胞置于200l的pbs溶液中，上机检测分析。
[0198]
4)细胞核、mmp、溶酶体(lysosome)和ph2ax检测标记
[0199]
具体实验操作步骤如1)中所述。药物暴露处理72h后加入75l/孔含细胞核、线粒体和溶酶体染料的培养液，置于细胞培养箱中孵育30min；固定20min，透膜30min，封闭1h；使用含小鼠抗ph2ax单克隆抗体和含alexa flour 488标记的驴抗小鼠igg二抗的封闭液标记ph2ax；最后标记好的细胞置于200l的pbs溶液中，上机检测分析。
[0200]
2.3.2应激反应通路细胞的核标记
[0201]
四种应激反应通路细胞在药物处理后，先加入75μl/孔室温预暖固定液(含12％甲醛的pbs)，室温20min；pbs缓冲溶液洗后，加入1μm hochst 33342的pbs，室温孵育1h，上机
检测分析。
[0202]
2.4图像采集及分析
[0203]
使用高内涵成像系统in cell analyzer 1000/2000采集细胞荧光图像，各细胞表型对应的荧光检测通道设置如表6所示；采用20
×
物镜，每孔采集9个视野。使用in cell analyzer workstation中的multi target analysis分析模块对采集的细胞图像进行分析，每个测试分析3孔共27个视野，不少200个细胞，各表型输出参数如表6所示，具体分析与表示方法如下：
[0204]
hepg2细胞各参数测试值均是通过分析细胞荧光成像中特定表型的荧光强度、面积、数量获得。受试药物影响每个细胞表型的参数变化率(％)＝(药物处理组-溶剂对照组)/溶剂对照组
×
100％或为(受试药物处理组-溶剂对照组)/(阳性药物处理组-溶剂对照组)
×
100％。
[0205]
p65-egfp_cho和atf6-egfp_u2os细胞为转录因子核转位的激活反应模式，细胞静息状态下，荧光标记的转录因子蛋白在胞浆中分布，被激活时，荧光标记标志分子转位至细胞核中，因此，通过定量分析细胞荧光蛋白的核转位数量即可表征该通路激活的程度。荧光蛋白的细胞核转位系数的计算公式为：r＝(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
[0206]
hif1a-egfp_cho和nrf2-egfp_a549细胞为转录因子细胞内积累的激活反应模式。细胞静息状态下，荧光标记蛋白低表达，被激活时，荧光标记蛋白表达量升高甚至转移至细胞核中，表现为细胞中荧光强度增加。因此可以通过分析细胞核和/或细胞内累积荧光蛋白含量来表征相应通路的激活程度，蛋白细胞核或细胞的累积系数的计算公式为：r＝受试药物处理细胞和/或细胞核内荧光蛋白的荧光强度-背景荧光强度。
[0207]
表6.各个表型参数实验检测条件
[0208]
[0209][0210]
2.5数据处理及统计学分析
[0211]
2.5.1数据处理及主要分析方法
[0212]
采用excel软件进行数据处理，实验结果以3复孔的平均值及标准差(means
±
sd)表示，并以每个96孔板的阴性和阳性对照组为标准，进行数据归一化处理。细胞抑制率ir(％)＝(对照组细胞数-受试药物处理组细胞数)/对照组细胞数
×
100％；受试药物荧光蛋白激活率(％)＝(受试药物处理组r值-溶剂对照组r值)/(阳性药处理组r值-溶剂对照组r值)
×
100％。细胞表型参数变化率(％)＝(药物处理组-溶剂对照组)/溶剂对照组
×
100％或为(受试药物处理组-溶剂对照组)/(阳性药物处理组-溶剂对照组)
×
100％。
[0213]
使用origin 6.1软件(sigmoidal fit方法)计算ec
50
/ic
50
值，绘制roc曲线(receiver operating characteristic curve)考察和评价表型参数及其组合与sdili相关性。
[0214]
表型参数高内涵测试方法的可靠性用z'因子(z'factor)评价，z'因子＝1-(3
×
阳性对照标准差-3
×
阴性对照标准差)/(对照均值-阴性对照均值)(参见zhang xd,espeseth as,johnson en,et al.integrating experimental and analytic approaches to improve data quality in genome-wide rnai screens[j].j biomol screen 2008；13(5):378-89)。此外，分别采用graphpad prism 6.0、r语言、mev软件进行实验结果散点图和柱状图等、热图、聚类图的绘制，采用单因素方差分析(one-way anova)进行统计学检验，p《0.05视为有显著差异。
[0215]
2.5.2敏感性、特异性和准确性计算方法
[0216]
本研究使用两种方法对构建的肝毒性预测方法进行评价。第一种方法通过roc(receiver operating characteristic curve)曲线分析获得方法的敏感性和特异性。roc曲线分析得到的曲线越接近坐标轴左上角，方法的敏感性和特异性越高。另一种方法采用公式计算得到方法的敏感性、特异性及准确性结果(parikh r,mathai a,parikh s,chandra sekhar g,thomas r.understanding and using sensitivity,specificity and predictive values[j].indian j ophthalmol 2008,56(1):45-50)：
[0217]
敏感性＝检出dili阳性药物数量/dili阳性药物总数
×
100％；
[0218]
特异性＝检出dili阴性药物数量/dili阴性药物总数
×
100％；
[0219]
准确性为100％
×
(检出dili阳性药物数量 dili阴性药物数量)/(dili阳性药物总数 dili阴性药物总数)。
[0220]
2.6预测sdili药物的最佳细胞表型组合的识别和验证
[0221]
tclass系统是一个整合了fisher线性判别分析方法和特征向前选择(feature forward selection)方法的分类系统(wuju l,momiao x.tclass:tumor classification system based on gene expression profile[j].bioinformatics(oxford,england)2002；18(2):325-6)。tclass系统中的fisher线性判别分析方法也可以替换为朴素贝叶斯(bayes)分类方法。为了获得预测sdili药物的最佳表型组合，首先以测试集药物中sdili和ndili药物细胞表型lec/cmax值作为训练数据集，运用tclass系统寻找一个或多个具有最强分类能力的特征组合。然后，将测试集数据按照3:1的比例随机分为两个部分，以较大部分数据作为训练数据构建分类器，以较小部分数据作为测试数据评价模型，该过程重复1000次，通过选择稳定性指数最高的候选特征组合，建立一个具有1000个分类器的dili集成预测模型。最后用验证集药物的细胞表型lec/cmax值进行验证，最终确定dili预测组合。具体的操作流程如图7所示。
[0222]
三、实验结果
[0223]
3.1基于细胞表型的hca测试方法的可靠性分析
[0224]
细胞表型的hca测定内容包括：hepg2细胞11个细胞表型(cell count、nuclear、α-tubulin、f-actin、gsh、mnsod、ph2ax、mmp、nmp、lysosome、lc3b)，细胞应激反应通路的4个通路(hif1α、nrf2、atf6、nf-κb)，考虑到一些细胞表型在药物处理不同时间其反映的细胞毒机制有所不同，因此，还在药物处理不同时间测定这些参数的变化，包括cell count、nuclear、ph2ax、mmp、lysosome，hif1α、nrf2、nf-κb。为了考察上述细胞表型的hca方法是否适合hts(高通量药物筛选)，我们计算了各测试方法的z'因子值，如表7所示。
[0225]
结果显示，除了nrf2_6h为0.43，其它测试方法的z'因子均大于0.5，表明本实验所
采用的基于hca细胞表型谱的测试方法是可靠的。
[0226]
表7.基于hca的细胞表型测试方法的z'因子值
[0227][0228][0229]
3.2测试集药物细胞表型谱的测定
[0230]
首先，根据药物溶解性及细胞毒性，分别采用10、100μm或3、30μm的药物浓度分别在hepg2细胞和4个报告细胞系上进行进行了初筛。以同一测试中药物的细胞抑制率为横坐标，表型参数变化率为纵坐标绘制药物初筛结果的散点图，结果如图8、图9所示。以细胞表型参数变化率≥25％(纵坐标)为阳性反应、细胞抑制率(inhibition rate，ir)(纵坐标)≥15％为毒性临界值，判断药物影响细胞表型效应的类型。结果显示，在每一表型效应中，药物导致的阳性效应有两类：一是细胞毒非依赖的即特异性反应，也就是说，表型参数出现阳性变化不伴随细胞毒效应(ir《15％)出现；另一种是细胞毒依赖的即非特异性反应，即该表型参数出现阳性变化伴随细胞毒效应(ir≥15％)。测试集药物对20个细胞表型参数的初筛结果如表8所示，可以看出，相同表型在不同细胞状态(出现毒性和非毒性)下，有影响的药物数量不同；一些表型在药物处理早期引发变化的药物较多，如hif1、actin、lc3b，提示这些表型参数了药物引发的细胞扰动或适应性反应机制；此外，随着药物处理细胞时间的延长，细胞毒依赖的细胞表型参数改变增多，这与药物处理时间增加，细胞毒增强的结果相一致，但细胞毒依赖表型变化的药物与细胞毒非依赖表型变化的药物并不完全相同，说明时间点的表型变化代表的细胞毒的机制并不完全相同。
[0231]
以细胞表型参数变化率≥45％为复检标准，各表型复筛的药物数量如表8所示，约占初筛阳性药物50％以上。这些药物选择5～7个浓度进行复筛，并计算ec
50
或ic
50
值。考虑到未进入复筛的药品数量占比较大，因此结合初复筛结果，确定药物最低起效浓度(lowest effective concentration，lec)。在本实验中，lec为表型参数变化率约25％(而细胞抑制率是15％)的浓度。对ec
50
和lec负对数值做热图(参见图10中的a)，可以看出，在ec
50
/ic
50
图中，可获得ec
50
或ic
50
的数据点有493个，仅占总数据点的17.86％；可测出lec的数据点为823个，占总数据点的29.82％。在两图中sdili、mdili两类药物可测得的比率相当，稍高于ndili类药物，但差异有限，说明不同类型dili药物，包括ndili药物都会在体外影响多个细胞表型，也说明，仅基于药物在体外细胞表型的效应是不能区分dili和非dili药物。
[0232]
表8.测试集药物细胞表型谱初筛结果汇总
[0233][0234]
3.3建模用细胞表型参数的选择
[0235]
体外实验预测药物人体效应有一个体外效应内推体内效应的过程。一般认为，药物体外细胞毒浓度小于在体内暴露最大浓度(c
max
)的100倍为安全浓度(falgun s,louis l,barton ha,et al.setting clinical exposure levels of concern for drug-induced liver injury(dili)using mechanistic in vitro assays[j].toxicological sciences an official journal of the society of toxicology 2015,147(2):500-14；o'brien pj,irwin w,diaz d,et al.high concordance of drug-induced human hepatotoxicity with in vitro cytotoxicity measured in a novel cell-based model using high content screening[j].arch toxicol 2006,80(9):580-604)。因此，
我们用c
max
校正体外表型效应浓度，以ti(in vivo toxicity idex)表示，ti＝体外表型效应浓度/c
max
。相应的，ec
50
和lec对应的ti值分别以ti
50
和ti
lec
表示，数据绘制热图如图10中b所示。可以看出，sdili、mdili、ndili类药物的ti
50
和ti
lec
值具有较强规律性，sdili药物的ti值最低(以黄色为主)、mdili次之，而ndili药物值则较高(以蓝色为主)；三类药物ti
50
和ti
lec
值分布(参见图10中的c和d)和统计学分析也证实上述事实，且sdili、mdili药物与ndili药物间具有统计学差异。由此可见，药物体外细胞表型效应结合c
max
与临床dili程度具有较好的相关性，说明，这些数据可以作为dili预测建模的基础数据。
[0236]
为了提高建模基础数据的质量，我们进一步考察了ti
50
、ti
lec
以及每个细胞表型与dili相关性。以ti≥100，为体内肝毒性阴性，ti《100，为体内肝毒性阳性为标准，对测试集药物各个细胞表型效应进行定性判定，结果如图11中的a所示，红色表示dili阳性。该结果与ti热图(图10中的c和d)基本一致，无论是以ti
50
还是ti
lec
为基础数据判定体内肝毒性阳性，都是sdili药物最多，mdili次之，而ndili极少，sdili和mdili类与ndili类相比具有统计学差异(参见图11的b和e)；在此基础上，首先，我们以全部表型数据比较了基于ti
50
、ti
lec
数据预测临床dili的特异性，结果如图11的d和g所示，可以看到，基于ti
50
数据，预测sdili和mdili类的敏感性较低，特异性较高(80％)，而基于ti
lec
数据的敏感性较高，对于sdili类药物最高可达90％，但特异性明显降低仅为39％；进一步考察所有参数的特异性，发现，基于ti
lec
数据预测时，除表型参数ir_72h、f-actin_24h、mmp_24h的特异性分别为70％、60％、75％，假阳性率较高外，其他参数特异性均95％及以上(参见图11的g)。提示，在以ti
lec
数据进行预测时，这三个参数的过于敏感。据此，我们去除这三个参数，并采用剩余参数的数据进行了表型与dili的roc曲线分析，结果与如图12和表9所示，相比于基于ti
50
数据，优化的基于ti
lec
值预测方法的roc的auc值更大，敏感性和特异性更高。因此，本实验将去除ir_72h、f-actin_24h、mmp_24h三个参数，用其它20个细胞表型参数的ti
lec
值作为建模数据。20个细胞表型参数为：1,nuclear_72h；2,mmp_72h；3,lysosome_72h；4,ph2ax_72h；5,nuclear_24h；6,α-tubulin_24h；7,gsh_24h；8,mnsod_24h；9,nmp_24h；10,nf-κb_24h；11,hif1α_24h；12,nrf2_24h；13,nuclear_16h；14,lc3b_16h；15,lysosome_16h；16,ph2ax_16h；17,nf-κb_0.67h；18,hif1α_3h；19,atf6_5h；20,nrf2_6h。
[0237]
表9.细胞表型参数ti
50
和ti
lec
值与临床dili的roc分析结果
[0238][0239]
3.4最优表型测试组合的识别及预测模型的构建
[0240]
为了获得最优预测效能、且实用性、便捷性更强的细胞表型测试组合和预测模型，
我们以dili损伤效应最为明确的sdili和肝损伤阴性(ndili)两类药物的20个表型参数的ti
lec
值作为建模训练数据(包括50个sdili样本和20个ndili样本)，采用tclass分类系统，通过fisher线性判别分析或朴素贝叶斯(bayes)分类结合特征向前选择(feature forward selection)方法对细胞表型参数进行识别和分类。将样本随机分为训练集(例如样本的75％)和测试集，计算在训练和测试集中正确分类的样本数，并计算精度(train_ac)和稳定性(test_ac)。精度定义为训练集样本中正确分类的样本的百分比；稳定性定义为测试集样本中正确分类的样本的百分比。选取训练精准度(train_ac)和检测稳定性值(test_ac)最高的一系列组合，如图13的a所示。由13个参数组成的测试组合1的train_ac和test_ac值最高，之后，随着测定组合参数的减少，精准度有所减低，稳定性至5个参数仍保持最高的水平，但7参数以上组合达到了近84％的精准度；roc及统计学分析(参见图13的b)显示趋势一致(表10)，13和11个参数组成的测试组合1和2的auc曲线下面积最高，几乎一致，二者的敏感性和特异性相同，分别为86％和90％；而9，7，5，3个参数组合的特异性也都能达到90％，但敏感性逐步降低，分别为84％、82％、78％、74％。另外，根据多参数测试的便利性，如图13的a所示，相同颜色测试指标同一测试中实施，组合4(7个参数)仅由三个独立的测试实验组成，而组合3(9个参数)则需要4个实验，组合1(13个参数)组合2(11参数)均由6个测试实验组成；因此，我们确定组合1和组合4作为最佳的dili预测检测组合，从而满足不同灵敏度需求时使用。
[0241]
从样本中随机提取75％作为训练集，剩下25％作为测试集，随机提取1000次，得到“训练”和“测试”集的1000种不同分配，利用fisher线性判别分析模型或朴素贝叶斯(bayes)分类模型构建1000个分类器，将这1000个分类器集成为dili集成预测模型，将未知药物在上述确定的测试组合上获得的实验结果，输入模型，根据1000个分类器输出的结果，即可预测其dili的潜力。根据1000个分类器输出的结果，得到1000个预测值(阳性或阴性)，如果在1000个预测值中，有500个或500个以上的阳性值，则判断该样本为阳性，其概率为p/1000(p值为预测值为阳性的个数)，否则为阴性。
[0242]
表10.不同细胞表型参数组合盘roc分析结果
[0243][0244]
注：ci为confidence interval。
[0245]
3.5预测模型的验证
[0246]
为了验证上述构建的模型的有效性，本实验用优选的表型测试组合测定了验证集药物(103个)，分别进行了初筛和复筛，方法同3.2，结果见见表11和图14，获得了相应ec
50
、lec，并结合人体暴露c
max
获得了ti
lec
值。验证集不同损伤类型药物中lec和ti
lec
值热图如图
15的a和b所示，与测试集药物相同，ti
lec
值与dili损伤程度具有相关性。我们将验证集药物ti
lec
值输入dili集成预测模型，进行dili阳性参数判断，结果如图15的c所示，sdili药物肝毒性阳性参数明显多于mdili和adili药物，ndili药物无肝毒性阳性参数。进一步，计算了验证集药物以2个最佳测试组合盘1和4测试的敏感性、特异性和准确率，结果如表12所示。测试组合盘1和4的特异性均为100％，准确性分别为88.1％和85.7％；此外，测试组合盘1对于验证组sdili、mdili和adili药物的敏感性分别为83.87％、54.84％和66.67％，而组合盘4也分别达到80.65％、51.61％和63.33％；与建模使用的测试组合的预测性能相当。表明，本公开建立的方法既具有良好的预测能力还具有重复性，是成功的。
[0247]
表11.验证集药物在最佳测试组合盘初筛小结
[0248][0249][0250]
表12.最佳测试组合对于测试集和验证集药物预测性能的比较
[0251][0252]
3.6预测模型的综合评价
[0253]
本公开的测试组合1对于测试集和验证集药物sdili和mdili类预测的准确性在85.7～88.1％，特异性在90～100％，灵敏度分别在83.87～84％和54～54.84％之间；组合4虽略低，但特异性同组合1，对于测试集和验证集药物sdili和mdili类预测的准确性在82.86～85.7％，灵敏度分别在80～80.65％和48～51.61％之间。为了综合评价预测模型的
能力，我们合并全部受试药物，考察了预测方法对于不同类型药物预测的敏感性。图16显示了基于组合1和组合4测试数据的dili阳性参数的分布情况，可以看出本预测方法与dili损伤类型具有较强的相关性。统计结果显示基于组合1(13参数)预测时，对于sdili、mdili和adili药物的敏感性分别为83.95％、54.32％和66.67％，特异性为93.55％，准确性为86.61％，其中idili类别药物的敏感性为70.97％；基于组合4(7参数)预测时，sdili、mdili和adili药物的敏感性分别为80.25％、49.38％和63.33％，特异性为93.55％，准确性为83.95％；其中对于idili类别药物的敏感性为61.29％，仅略低于组合1的结果。
[0254]
ro2原则是指每日剂量daily dose≥100mg/day及logp≥3(chen m,tung cw,shi q,et al.a testing strategy to predict risk for drug-induced liver injury in humans using high-content screen assays and the'rule-of-two'model[j].arch toxicol 2014；88(7):1439-49)。为了考察ro2是否有助提高本模型的预测精度，将ro2作为一个独立参数纳入预测方法中，比较了结合ro2后对于预测性能的影响。结果如表13所示，ro2结合测试组合1，对于各类药物预测的灵敏度有轻度的提升，如对于sdili、mdili和adili类药物分别提高了1.24％，8.64％和3.33％，但对于idili药物影响相明显，增加了12.9％，但特异性和准确性有所下降；ro2结合测试组合4的结果类似。可见，ro2作为独立因素纳入预测参数组合，对预测的精准度影响不大，也提示，本公开基于细胞毒全表型谱测定获得的dili药物的最佳测试组合已涵盖了dili药物的ro2特性。鉴于idili危害极大，而评价idili药物时，ro2的结合可显著提高预测方法的敏感性，因此，对于idili药物预测可以结合药物ro2值。
[0255]
表13.基于最佳测试组合1和4及结合ro2的预测方法的比较
[0256][0257]
此外，本公开还考察基于组合1测试预测模型对不同肝损伤类型药物的敏感性。结果如图17所示，对于胆汁淤积、肝细胞损伤与混合损伤型共有的药物敏感性最高(83.7％)，其次是肝细胞损伤型(75.9％)、未知类型(73.1％)，而胆汁淤积与混合型共有、胆汁淤积型、胆汁淤积与肝细胞损伤型共有药物的敏感性则分别为60％、58.3％、54.8％。结果提示，本实验建立的预测方法对胆汁淤积、肝细胞损伤与混合损伤型共有和肝细胞损伤型的药物预测能力较强。
[0258]
3.7结论：
[0259]
总之，本公开通过对临床肝损伤类型基本明确的223个药物细胞毒全表型谱的分析，结合人类暴露c
max
，采用hca、基于机器学习tclass分类识别系统、roc分析等技术和方法，通过建模、验证以及综合分析，创新性地建立了基于特定细胞表型组合(特定细胞表型模式)分析的体外肝毒性预测体系，具体而言构建了由7或13个细胞表型参数测试组合和由
1000分类器组成的用于药物肝毒性预测的集成分类模型。该方法的敏感性、特异性和准确性分别为84％、94％、87％。该预测方法最多可通过3组细胞表型参数(lc3b ph2ax、nuclear mnsod gsh α-tubulin、nuclear mmp)和3个应激通路(hif1a、atf6和nrf2)检测完成；当结合ro2原则时，对idili类药物预测的敏感性最高可达84％，本公开方法实现了基于体外细胞测试预测dili，特别是idili预测的突破。
[0260]
尽管本公开的具体实施方式已经得到详细的描述，但本领域技术人员将理解：根据已经公布的所有教导，可以对细节进行各种修改和变动，并且这些改变均在本公开的保护范围之内。本公开的全部分为由所附权利要求及其任何等同物给出。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种构建药物肝毒性预测模型的方法及其用途

相关文献

最热文献