肽文库及其使用方法与流程

2022-02-19 11:13:12 来源：中国专利 TAG：

肽文库及其使用方法
交叉引用
1.本技术要求于2019年1月4日提交的美国临时申请62/788,678和2019年1月11日提交的美国临时申请62/791,601的权益，这些申请以其全部内容通过引用纳入本文。背景
2.在生产和使用不同的肽文库方面存在着许多挑战。通过引用纳入
3.本说明书中提到的所有发表物、专利和专利申请通过引用纳入本文，就好像将各篇单独的发表物、专利或专利申请专门和单独地通过引用纳入本文那样。

技术实现要素：

4.本发明提供肽文库的组合物和这些肽文库的使用方法。
5.在一些实施方式中，本文公开了包含多种肽的肽文库，其中多种肽包含多于1000、多于2000、多于5000、多于10000、多于106、多于107、多于108、多于109或多于10
10
种独特肽。
6.在一些实施方式中，本文公开了一种分离淋巴细胞肽对的方法，包括：(a)将多个淋巴细胞与肽文库接触，其中肽库的多样性大于1000；和(b)产生多个隔室，其中多个隔室包括(i)与肽文库的肽结合的多个淋巴细胞中的淋巴细胞，以及(ii)捕获载体。
7.在一些实施方式中，本文公开了一种鉴定淋巴细胞
‑
肽对的方法，包括：(a)将多个淋巴细胞与肽文库接触，其中肽文库的多样性大于1000；(b)将与肽文库的肽结合的多个淋巴细胞中的淋巴细胞分隔在单个隔室中，其中肽包含独特肽标识符；和(c)确定与分隔的淋巴细胞结合的每种肽的独特肽标识符。
8.在一些实施方式中，本文公开了一种使用无偏肽文库的方法，该方法包括使样品接触无偏肽文库，所述文库包含多种肽，其中多种肽包含多于100、多于1000、多于2000、多于5000、多于10000、多于106、多于107、多于108、多于109或多于10
10
种独特肽。
9.在一些实施方式中，本文公开了一种组合物，其包含附接到独特标识符上的pmhc多聚体。
10.在一些实施方式中，本文公开了一种隔室，其包括：(a)编码sc
‑
pmhc的序列；和(b)t细胞。
11.为了更好地理解本发明的本质和优势，参考以下与附图结合的详细说明。本发明能够在不偏离本发明的情况下进行各个方面的修改。因此，这些实施方式的附图和描述不是限制性的。附图简要说明
12.本专利或申请文件包含至少一幅有色附图。本专利或专利申请公开的带彩色附图的副本将根据要求，在支付所需的费用之后由政府机关提供。所附权利要求书中具体说明了本发明的新特征。可参考以下详述更好地理解本发明的特征和优点，这些详述阐述了利用本发明原理的说明性实施方式和附图，其中：
13.图1提供了不同多样性的肽文库的示范性实施方式。
14.图2a显示酶切以增加肽多样性。泳道对1
‑
2、3
‑
4、5
‑
6、7
‑
8和9
‑
10分别表示在没有切割部分的模板、具有未添加蛋白酶的切割部分的模板、具有反应完成后添加蛋白酶的切割部分的模板、具有反应期间存在蛋白酶的切割部分的模板上进行无细胞蛋白合成(cfps)反应以及缺乏模板的反应。进行蛋白质印迹以确定总蛋白质产量。
15.图2b显示了来自cfps反应的样品，其中包含有或没有切割部分的多聚体和单体模板。用抗flag
‑
hrp抗体对样品进行印迹分析和检测。
16.图2c显示由cfps产生并经蛋白水解切割的肽折叠成可识别的三维结构。测试cfps蛋白的抗体构象识别。该图表明通过构象表位抗体的识别证明了蛋白酶切割的肽或未切割的肽(包含fmet)是否为正确折叠。
17.图2d提供单链肽mhc(sc
‑
pmhc)多聚体与抗原特异性t细胞的结合。通过cfps和蛋白酶切割产生多聚体。将t细胞与多聚体孵育，然后用荧光检测抗体染色，并通过流式细胞术进行分析。
18.图3是一种印迹，显示标记有一个或多个肽标识符的肽，如肽带向上漂移所示。
19.图4显示裸露cmv肽、用肽标识符标记的cmv肽或阴性对照与cmv或非cmv特异性t细胞的相对结合的流式细胞术结果。
20.图5显示肽与t细胞结合后检测到的肽标识符相对量的qpcr结果。数量对管家基因标准化。
21.图6说明了本发明文库中折叠肽的富集。
22.图7说明了基于核酸标识符测序的文库多样性验证。
23.图8显示了通过分析使用本发明的组合物和方法生成的测序数据来鉴定肽(抗原)
‑
受体(tcr)对。
24.图9说明了使用本发明的组合物和方法生成的肽(抗原)
‑
受体(tcr)对数据的分析。图9a示出了通过tcr进行聚类以显示抗原特异性图谱。图9b示出了通过抗原的tsne聚类以显示tcr结合收敛。图9c示出了不同tcr对象间的收敛。
25.图10说明了sc
‑
pmhc与tcr的结合以及抗原突变对结合的影响。
26.图11说明了基于使用本文所述方法鉴定的感兴趣细胞的基因表达的示例性免疫表型分型。
27.图12说明了sc
‑
pmhc与使用本文所述方法鉴定的示例性抗原的抗原特异性t细胞的特异性和剂量依赖性结合。
28.图13说明了响应使用本文所述方法鉴定的示例性抗原的关联sc
‑
pmhc时t细胞的增殖和细胞因子生产。
29.图图14显示了示例性文库大小。图14a示出了示例性病毒组文库大小。图14b示出了示例性癌症文库大小。
30.图图15示出了本发明(例如，根据实施例21
‑
25)的肽文库生产的示例性概述。
31.图16提供了可用于本发明组合物和方法中的核酸构建体的示意图。该构建体可编码本发明的肽(例如，sc
‑
pmhc)和标识符(例如，对应于肽的全部或部分编码序列的自身标识符)。指示了正向和反向引物的位置(例如，可在实施例21
‑
23中使用的引物)。
32.图17显示了如实施例22和23所述，在水凝胶上pcr扩增全长抗原编码模板(图17a)和标识符(图17b)。
33.图18显示了本发明的折叠和标识符标记的sc
‑
pmhc的生成。图18a提供了显微镜图像，其证明本发明的sc
‑
pmhc是如实施例24所述在体外转录和翻译的。图18b提供elisa结果，证明折叠的sc
‑
pmhc多聚体的释放，如实施例25所述。图18c提供了蛋白质印迹，证明sc
‑
pmhc标有一个标识符，如实施例25所述。
34.图19提供了流式细胞术分析的结果，证明通过本发明方法产生的sc
‑
pmhc与关联t细胞特异性结合，如实施例26所述。
35.图20提供了单细胞测序分析的结果，证明通过本发明方法产生的sc
‑
pmhc与关联t细胞特异性结合，如实施例26所述。
具体实施方式
定义
36.如本文所使用的，术语“标识符”是指提供与标识符相对应的信息(例如特性)的数据的可读表示。
37.如本文所用，术语“多聚体”指的是多个单元。一些实施方式中，多聚体包含一种或多种不同单元。在一些实施方式中，多聚体中的单元是相同的。在一些实施方式中，多聚体中的单元是不同的。在一些实施方式中，多聚体包含相同和不同单元的混合物。
38.如本文所用，术语“肽文库”指的是多种肽。在一些实施方式中，文库包含具有独特序列的一种或多种肽。在一些实施方式中，文库中的每种肽具有不同的序列。在一些实施方式中，文库包含具有相同和不同序列的肽的混合物。
39.如本文所使用的，术语“无偏”指缺少一个或多个选择标准。
40.如本文所使用的，术语“捕获载体”指相互作用表面。在一些实施方式中，捕获载体可以是固相表面。在一些实施方式中，捕获载体可以包含基质。在一些实施方式中，捕获载体可以包含纳米粒。在一些实施方式中，捕获载体可以包含珠。在一些实施方式中，捕获载体可以包含磁珠。在一些实施方式中，捕获载体可以包含水凝胶。在一些实施方式中，捕获载体可以是油包水乳液液滴的内表面。在一些实施方式中，捕获载体可以包含核酸分子。在一些实施方式中，捕获载体可以包含蛋白质。在一些实施方式中，捕获载体可包含抗体或其衍生物。在一些实施方式中，捕获载体可以包含凝胶。在一些实施方式中，捕获载体可以包含聚合物。在一些实施方式中，捕获探针可以改变。在一些实施方式中，捕获载体可以是荧光的，例如，用一种或多种荧光染料标记。引言
41.本公开提供了一种肽文库。肽文库可包含具有不同氨基酸序列的多种肽。肽文库可用于一系列筛选试验，以鉴定潜在的诊断或治疗靶点或试剂。例如，肽文库可用于筛选疾病特异性、器官特异性肽、或其它隔室特异性肽，用于筛选具有治疗应用的肽，筛选具有诊断应用的肽，筛选肿瘤靶向肽，筛选抗体表位或抗原，筛选t细胞表位或抗原，筛选抗微生物肽，或其任何组合。因此，具有适当质量的多种肽文库具有许多有价值的用途。
42.肽文库可以是抗原文库。抗原文库应用的非限制性示例包括用于与免疫抗原相关的分析、治疗和诊断。例如，抗原文库可用于筛选以鉴定蛋白质表位，例如抗体或t细胞表位。抗体和t细胞表位可以极大地影响适应性免疫系统的功能，因为它们是抗体、b细胞受体(bcr)和t细胞受体(tcr)识别的特定序列。免疫系统的许多效应机制可由抗体表位或t细胞
表位触发，因此抗原文库具有潜在的应用，包括但不限于在传染病、癌症免疫治疗和自身免疫中的应用。抗体和t细胞表位可适应于广泛的用途，包括，例如，用于治疗或实验室用途的抗体或抗原结合片段的生产，使用抗体或t细胞表位的疫苗生产，以及已知抗原特异性t细胞的工程化改造，例如，用于癌症免疫治疗。
43.在生产和使用不同的肽文库方面存在着许多挑战。可能的肽序列绝对数量之多可能给文库的生产带来挑战。对于长度为9个残基的肽(9
‑
聚体)，蛋白质中最常见的20种氨基酸有209(约5.1x10
11
)种可能序列组合。感兴趣的潜在抗原肽源(例如，病原体、癌细胞、组织)可表达数百或数千种蛋白质，每种蛋白质包含多个潜在肽抗原。
44.已经开发了许多技术来产生肽，但是许多技术具有局限性(例如，缺乏肽多样性的充分覆盖，倾向于高亲和力相互作用，肽生产的使用条件导致蛋白质变性或错误折叠等)。本发明提供肽文库，包括例如具有本文所述的有用应用的高多样性肽文库。还提供了制备肽文库的方法，包括例如制备无偏肽文库的方法。肽文库的组合物
45.本发明提供肽文库，包括例如在一系列治疗、诊断和研究应用中有用的高多样性肽文库。例如，所提供的肽文库可用于筛选疾病特异性、器官特异性肽、或其它隔室特异性肽，用于筛选具有治疗应用的肽，筛选具有诊断应用的肽，筛选肿瘤靶向肽，筛选抗体表位或抗原，筛选t细胞表位或抗原，筛选抗微生物肽，或其任何组合。
46.本发明的肽文库可以是无偏的或有偏的，并且可以包含任意数量的肽。图1中提供了各种多样性的肽文库的示例性实施方式，并在下文中描述。无偏肽文库
47.本文公开的肽文库可以是无偏文库，例如，缺少一个或多个选择标准。在一些实施方式中，本发明的文库包含给定大小的肽的所有可能氨基酸组合，包含标准的20个氨基酸中的任何一个的20
k
种可能的k聚肽，例如包含标准20个氨基酸中的任何一个的209种可能的9聚肽。
48.在一些实施方式中，该文库包含具有一定长度范围的肽，例如，从约2个氨基酸(2聚体)到约20个氨基酸(20聚体)或任何合适范围。在一些实施方式中，该文库包含具有基本相同长度的肽，例如，2聚体、3聚体、4聚体、5聚体、6聚体、7聚体、8聚体、9聚体、10聚体、11聚体、12聚体、13聚体、14聚体、15聚体、16聚体、17聚体、18聚体、19聚体、20聚体或更长。
49.在一些实施方式中，本发明的文库包括特定位置处的受约束残基，例如，位置2和9处用于对接hla
‑
a2的受约束残基。在一些实施例中，本发明的文库包括非约束残基处的所有可能氨基酸组合，例如，9
‑
聚体序列的位置3、4、5、6、7和8处的206个可能的6
‑
聚序列，以及位置1、2和9处的受约束残基。在一些实施方式中，本发明的文库包含给定大小的肽中除受约束残基之外的所有可能氨基酸组合，例如，当位置2和9受到约束时，207个可能的9
‑
聚体序列，其中位置1、3、4、5、6、7和8发生变化。
50.受约束的残基可以约束为单个残基或任何残基子集(例如，约束为缬氨酸、亮氨酸或异亮氨酸)。在一些实施方式中，受约束残基可以是氨基酸亚类中的任何一个，例如，任何疏水性氨基酸、任何亲水性氨基酸、任何带电氨基酸、任何碱性氨基酸、任何酸性氨基酸、任何环状氨基酸、任何芳族氨基酸、任何脂肪族氨基酸、任何极性氨基酸、任何非极性氨基酸，或其任何组合。可以从所有可能的残基中，也可以从残基的任何子集中选择改变的残基。例
如，任何疏水性氨基酸、任何亲水性氨基酸、任何带电氨基酸、任何碱性氨基酸、任何酸性氨基酸、任何环状氨基酸、任何芳族氨基酸、任何脂肪族氨基酸、任何极性氨基酸、任何非极性氨基酸或其任何组合。
51.在一些实施方式中，本发明的文库包含可通过任何计算机生产方法制备的所有k
‑
聚肽。在一些实施方式中，文库可包含来自任何翻译产物的k
‑
聚肽，例如表位、抗原、蛋白质或蛋白质组。在一些实施方式中，该文库包含从一个或多个基因组、外显子组、转录物组、蛋白质组、orf组或其任何组合计算机衍生的k
‑
聚肽。
52.在一些实施方式中，文库包含通过转录和翻译任何感兴趣的多核苷酸序列而产生的所有k
‑
聚肽，例如，在所有六个阅读框中计算机产生基因组或宏基因组正向和反向链的转录和翻译产物。在一些实施方式中，本发明的文库包含可从哺乳动物基因组(例如，小鼠基因组、人类基因组、患者基因组、自身免疫患者基因组或癌症基因组)计算机转录和翻译衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从微生物基因组(例如，细菌基因组、病毒基因组、原生动物基因组、原生生物基因组、酵母基因组、古细菌基因组或噬菌体基因组)计算机转录和翻译衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从病原体基因组，例如，细菌病原体基因组、病毒病原体基因组、真菌病原体基因组、机会致病病原体基因组、条件病原体基因组或真核寄生虫基因组计算机转录和翻译衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库可来自植物基因组或真菌基因组。在一些实施方式中，本发明的文库包含衍生自基因组的计算机转录和翻译的k
‑
聚肽，其中基因组在计算机转录和翻译期间被修饰，例如，计算机突变以产生包含突变(例如，替换、插入、删除)的k
‑
聚肽。
53.在一些实施方式中，本发明的文库包含可从感兴趣的外显子组(例如，哺乳动物外显子组、人类外显子组、小鼠外显子组、患者外显子组、自身免疫患者外显子组、癌症外显子组、病毒外显子组、原生动物外显子组、原生生物外显子组、酵母外显子组、病原体外显子组、真核寄生虫外显子组、植物外显子组或真菌外显子组)的计算机翻译中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含衍生自外显子组的计算机翻译的k
‑
聚肽，其中外显子组在计算机翻译期间被修饰，例如，计算机突变以产生包含突变(例如，替换、插入、删除)的k
‑
聚肽。
54.在一些实施方式中，本发明的文库包含可从感兴趣的转录组(例如，哺乳动物转录组、人类转录组、小鼠转录组、患者转录组、自身免疫患者转录组、癌症转录组、微生物转录组、细菌转录组、病毒转录组、原生动物转录组、原生生物转录组、酵母转录组、古细菌转录组、噬菌体转录组、病原体转录组、真核寄生虫转录组、植物转录组、真菌转录组，来自rna测序的转录组、微生物组转录组或来自宏基因组rna测序的转录组)的计算机翻译中衍生的所有k
‑
聚肽。在一些实施例中，本发明的文库包含衍生自转录组的计算机翻译的k
‑
聚肽，其中转录组在计算机翻译期间被修饰，例如，计算机突变以产生包含突变(例如，替换、插入、删除)的k
‑
聚肽。
55.在一些实施方式中，本发明的文库包含可从感兴趣的蛋白质组(例如，哺乳动物蛋白质组、人类蛋白质组、小鼠蛋白质组、患者蛋白质组、自身免疫患者蛋白质组、癌症蛋白质组、微生物蛋白质组、细菌蛋白质组、病毒蛋白质组、原生动物蛋白质组、原生生物蛋白质组、酵母蛋白质组、古细菌蛋白质组、噬菌体蛋白质组、病原体蛋白质组、真核寄生虫蛋白质
组、植物蛋白质组或真菌蛋白质组)衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含源自蛋白质组的k
‑
聚肽，其中k
‑
聚肽从蛋白质组序列修饰而来，例如，包含突变(例如，替换、插入、删除)的k
‑
聚肽。
56.在一些实施方式中，本发明的文库包含可从感兴趣的orf组(例如，哺乳动物orf组、人类orf组、小鼠orf组、患者orf组、自身免疫患者orf组、癌症orf组、微生物orf组、细菌orf组、病毒orf组、原生动物orf组、原生生物orf组、酵母orf组、古细菌orf组、噬菌体orf组、病原体orf组、真核寄生虫orf组、植物orf组、真菌orf组，来自rna测序的orf组、微生物组orf组或来自宏基因组rna测序的orf组)的计算机翻译中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含衍生自orf组的计算机翻译的k
‑
聚肽，其中orf组在计算机翻译期间被修饰，例如，计算机突变以产生包含突变(例如，替换、插入、删除)的k
‑
聚肽。
57.在一些实施方式中，本发明的文库包含可从一组基因组、蛋白质组、转录组、orf组或其任何组合的计算机转录和翻译或翻译中衍生的所有k
‑
聚肽。在一些实施例中，本发明的文库包含可从一组样品(例如，来自患者群体的临床样品或一组病原体基因组)的多核苷酸序列的计算机转录和翻译或翻译中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从一组病毒基因组，例如人病毒组的计算机转录和翻译中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含衍生自一组基因组、蛋白质组、转录组、orf组或其任意组合的计算机转录和翻译的所有k
‑
聚肽，其中来源序列在计算机翻译期间被修饰，例如，计算机突变以产生包含突变(例如，替换、插入、删除)的k
‑
聚肽。
58.在一些实施方式中，本发明的文库包含可从差异基因组、蛋白质组、转录组、orf组或其任何组合衍生的所有k
‑
聚肽，其中比较两个或更多基因组、蛋白质组、转录组、orf组或其组合以鉴定为差异序列(在其之间区分)的序列(例如，核苷酸序列、氨基酸序列、核苷酸丰度或蛋白质丰度不同)。在一些实施方式中，通过比较感兴趣的组织来生成基因组、蛋白质组、转录组或orf组的差异序列。在一些实施方式中，通过比较来自感兴趣细胞(例如，健康细胞与癌细胞)的序列来产生基因组、蛋白质组、转录组或orf组的差异序列。在一些实施方式中，通过比较感兴趣生物体的序列来生成基因组、蛋白质组、转录组或orf组的差异序列。在一些实施方式中，通过比较感兴趣的对象(例如患病对健康对象)来生成基因组、蛋白质组、转录组或orf组的差异序列。在一些实施方式中，差异序列相差至少为100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％、5％或1％。在一些实施方式中，差异序列相差1％至100％、5％至100％、10％至100％、15％至100％、20％至100％、25％至100％、30％至100％、40％至100％、50％至100％、60％至100％、70％至100％、80％至100％、90％至100％、95％至100％、30％至90％、40％至90％、50％至90％、60％至90％、80％至90％或60％至80％。在一些实施方式中，差异序列在比较的序列之间具有至少为100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％、5％或1％的差异。在一些实施方式中，在比较的序列之间，差异序列具有1％至100％、5％至100％、10％至100％、15％至100％、20％至100％、25％至100％、30％至100％、40％至100％、50％至100％、60％至100％、70％至100％、80％至100％、90％至100％、95％至100％、30％至90％、
40％至90％、50％至90％、60％至90％、80％至90％或60％至80％的差异。
59.在一些实施方式中，本发明的文库包含可从基因组、蛋白质组、转录组、orf组或其任何组合的同源序列衍生的所有k
‑
聚肽，其中比较两个或更多基因组、蛋白质组、转录组、orf组，或其组合以鉴定同源序列(例如，具有一定程度的同源性)的序列，例如同源核苷酸序列、同源氨基酸序列、同源核苷酸丰度或同源蛋白质丰度。在一些实施方式中，通过比较感兴趣的组织来生成基因组、蛋白质组、转录组或orf组的同源序列。在一些实施方式中，基因组、蛋白质组、转录组或orf组的同源序列是通过比较来自感兴趣的细胞(例如，健康细胞与涉及自身免疫的细胞(例如，诱导自身免疫的细胞或在自身免疫期间被靶向的细胞)的序列来生成的。在一些实施方式中，通过比较感兴趣的生物体的序列来生成基因组、蛋白质组、转录组或orf组的同源序列。在一些实施方式中，通过比较感兴趣的对象(例如患病对健康对象)来生成基因组、蛋白质组、转录组或orf组的同源序列。在一些实施方式中，同源序列具有至少为100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％、5％或1％的同源性。在一些实施方式中，同源序列具有1％至100％、5％至100％、10％至100％、15％至100％、20％至100％、25％至100％、30％至100％、40％至100％、50％至100％、60％至100％、70％至100％、80％至100％、90％至100％、95％至100％、30％至90％、40％至90％、50％至90％、60％至90％、80％至90％或60％至80％的同源性。
60.在一些实施方式中，本发明的文库包含编码与感兴趣序列(例如，如上鉴定的差异序列或同源序列)具有一定程度同源性的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含两个或多个感兴趣序列之间最接近的同源物。
61.在一些实施方式中，本发明的文库包含可从感兴趣的多肽序列衍生的所有k
‑
聚肽，例如，覆盖病毒蛋白质的完整蛋白质序列的所有可能的9
‑
聚肽。在一些实施方式中，本发明的文库包含可从感兴趣的多肽序列产生的k
‑
聚肽，其中感兴趣的多肽序列被修饰，例如在计算机中突变以生成包含突变(例如，取代、插入、删除)的k
‑
聚肽。
62.在一些实施方式中，本发明的文库包含可从感兴趣序列中的突变衍生的所有k
‑
聚肽，例如，可从编码抗原或表位的多核苷酸序列中的单核苷酸突变生成的所有9
‑
聚肽。例如，本发明的文库包含可由编码抗原或表位的多核苷酸序列中的两个、三个、四个、五个、六个、七个、八个或九个核苷酸突变产生的所有9
‑
聚肽。在一些实施方式中，本发明的文库包含可从丙氨酸取代衍生的所有k
‑
聚肽，例如，本文所述序列中任何位置的丙氨酸取代(例如，蛋白质、一组蛋白质、蛋白质组、计算机转录和翻译的基因组)。在一些实施方式中，本发明的文库包括位置扫描文库，其中所选氨基酸残基依次被所有其他天然氨基酸取代。在一些实施方式中，本发明的文库包括组合位置扫描文库，其中所选氨基酸残基每次在两个或多个位置依次被所有其他天然氨基酸取代。在一些实施方式中，本发明的文库包含重叠肽库，其包含来自模板序列(例如，在计算机中翻译的基因组)的重叠肽，其中设定长度的重叠肽被确定数量的残基抵消。在一些实施方式中，本发明的文库包含t细胞截短肽文库，其中文库的每个复制物包含在一末端截短的等摩尔肽混合物(例如，可从标称11
‑
聚体的c
‑
末端截短衍生8
‑
聚体、9
‑
聚体、10
‑
聚体和11
‑
聚体)。在一些实施方式中，本发明的文库包含定制肽组，其中定制肽组以列表形式提供。
63.在一些实施方式中，本发明的基因组、外显子组、转录组、蛋白质组或orf组是病毒基因组、外显子组、转录组、蛋白质组或orf组。病毒的非限制性实例包括腺病毒、腺相关病毒、aichi病毒、澳大利亚蝙蝠丽沙病毒、bk多瘤病毒、版纳(banna)病毒、巴马森林病毒、布尼亚韦拉病毒、拉克罗斯本扬病毒(bunyavirus la crosse)、雪鞋兔布尼亚病毒(bunyavirus snowshoe hare)、猕猴疱疹病毒(cercopithecine herpesvirus)、金迪普拉病毒(chandipura virs)、基孔肯亚病毒(chikungunya virus)、柯萨病毒(cosavirus)a、牛痘病毒、柯萨奇病毒(coxsackievirus)、克里米亚
‑
刚果出血热病毒、巨细胞病毒(cmv)、登革热病毒、多理病毒(dhori virus)、杜比病毒(dugbe virus)、杜文黑基病毒(duvenhage virus)、东部马脑炎病毒、埃博拉病毒、埃博拉病毒、埃可病毒(echovirus)、脑心肌炎病毒、爱泼斯坦
‑
巴尔病毒(ebv)、欧洲蝙蝠丽沙病毒、gb病毒c/庚型肝炎病毒、汉他病毒(hantaan virus)、亨德拉病毒(hendra virus)、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、戊型肝炎病毒、丁型肝炎病毒、马痘病毒、人腺病毒、人星状病毒、人冠状病毒、人巨细胞病毒、人内源性反转录病毒(herv)、人肠病毒、人疱疹病毒(例如，hhv
‑
1、hhv
‑
2、hhv
‑
6a、hhv
‑
6b、hhv
‑
7、hhv
‑
8)、人免疫缺陷病毒(例如，hiv
‑
1、hiv
‑
2)，人乳头瘤病毒(如hpv
‑
1、hpv
‑
2、hpv
‑
16、hpv
‑
18)、人副流感病毒、人细小病毒b19、人呼吸道合胞病毒(rsv)、人鼻病毒、人sars冠状病毒、人泡沫反转录病毒(spuma retrovirus)、人类嗜t淋巴细胞病毒(htlv，如htlv
‑
1、htlv
‑
2、htlv
‑
3)、人ι病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、伊斯法罕病毒(isfahan virus)、jc多瘤病毒、日本脑炎病毒、胡宁沙状病毒(junin arenavirus)、ki多瘤病毒、昆津病毒、拉各斯
‑
蝙蝠病毒、维多利亚湖
‑
马尔堡病毒、兰加特病毒(langat virus)、拉沙病毒(lassa virus)、lordsdale病毒、跳跃病病毒(louping ill virus)、淋巴细胞性脉络丛脑膜炎病毒(lymphocytic choriomeningitis virus)、马丘波病毒(machupo virus)、马亚罗病毒(mayaro virus)、mers冠状病毒、麻疹病毒、门戈脑心肌炎病毒(mengo encephalomyocarditis virus)、梅克尔细胞多瘤病毒(merkel cell polyomavirus)、蒙古拉病毒(mokola virus)、传染性软疣病毒(molluscum contagiosum virus)、猴痘病毒、腮腺炎病毒、墨莱溪谷脑炎病毒(murray valley encephalitis virus)、纽约病毒、尼帕病毒(nipah virus)、诺如病毒(norovirus)、诺沃克病毒、阿尼昂
‑
尼昂病毒(o’nyong
‑
nyong virus)、羊接触传染性化脓性口炎病毒(orf virus)、奥罗普切病毒(oropouche virus)、皮钦德病毒(pichinde virus)、脊髓灰质炎病毒、蓬塔托罗白蛉病毒(punta toro phlebovirus)、普马拉病毒(puumala virus)、狂犬病病毒、裂谷热病毒、罗沙病毒a(rosavirus a)、罗斯河病毒(ross river virus)、轮状病毒(例如，轮状病毒a、轮状病毒b、轮状病毒c、轮状病毒x)、风疹病毒(rubella virus)、鹭山病毒(sagiyama virus)、赛利病毒(salivirus)a、西西里白蛉热病毒(sandfly fever sicilian virus)、札幌病毒、塞姆利基森林病毒(semliki forest virus)、汉城病毒、猴泡沫病毒(simian foamy virus)、猴病毒5、辛德比斯病毒(sindbis virus)、南安普敦病毒、圣路易斯脑炎病毒、蜱传波瓦桑病毒(tick
‑
borne powassan virus)、细环病毒(torque teno virus)、托斯卡纳病毒、乌库涅米病毒(uukuniemi virus)、痘苗病毒、水痘
‑
带状疱疹病毒(varicella
‑
zoster virus)、天花病毒(variola virus)、委内瑞拉马脑炎病毒、水泡性口炎病毒(vesicular stomatitis virus)、西部马脑炎病毒、wu多瘤病毒、西尼罗河病毒、亚巴猴肿瘤病毒(yaba monkey tumor virus)、亚巴样病病毒、黄热病病毒、和寨卡病毒。
64.在一些实施方式中，本发明的基因组、外显子组、转录组、蛋白质组或orf组是癌基因组、外显子组、转录组、蛋白质组或orf组。在一些实施方式中，本发明的文库包含已知的癌症新表位。在一些实施方式中，本发明的文库包含可从已知癌症抗原蛋白中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从参与上皮间质转化的基因中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从癌症相关基因中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从突变性癌症驱动基因中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从原癌基因、癌基因或肿瘤抑制基因中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从原癌基因、癌基因或肿瘤抑制基因衍生的所有k
‑
聚肽，其中k
‑
聚肽包含如本文所述的突变(例如，氨基酸取代、丙氨酸取代、位置扫描、组合位置扫描等)。
65.癌症的非限制性示例包括急性淋巴细胞白血病(all)、急性髓细胞白血病(aml)、肾上腺皮质癌、艾滋病相关癌、艾滋病相关淋巴瘤、肛门癌、阑尾癌、星状细胞瘤、非典型畸胎瘤样/横纹肌样瘤、基底细胞癌、胆管癌、膀胱癌、骨癌、大脑瘤、乳腺癌、支气管肿瘤、伯基特氏淋巴瘤、类癌肿瘤、原发部位不明转移癌(carcinoma of unknown primary)、心脏肿瘤、中枢神经系统癌、宫颈癌、胆管癌(cholangiocarcinoma)、脊索瘤、慢性淋巴细胞白血病(cll)、慢性粒细胞白血病(cml)、慢性骨髓增生性肿瘤、结直肠癌、颅咽管瘤(craniopharyngioma)、皮肤t细胞淋巴瘤、原位乳腺导管癌(ductal carcinoma in situ)、胚芽肿瘤(embryonal tumor)、子宫内膜癌、上皮癌、室管膜瘤、食管癌、成感觉神经细胞瘤(esthesioneuroblastoma)、尤因氏肉瘤、颅外生殖细胞瘤、性腺外生殖细胞瘤、眼癌、输卵管癌、骨纤维组织细胞瘤、胆囊癌、胃癌、胃肠道类癌肿瘤、胃肠道间质瘤(gist)、生殖细胞瘤、妊娠滋养细胞疾病(gestational trophoblastic disease)、毛细胞白血病、头颈癌、肝细胞癌、组织细胞增多病、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞瘤、卡波济氏肉瘤、肾(肾细胞)癌、朗格汉斯细胞组织细胞增生症、喉癌、白血病、唇和口腔癌、肝癌、肺癌(非小细胞和小细胞)、淋巴瘤、男性乳腺癌、骨的恶性纤维组织细胞瘤和骨肉瘤、黑色素瘤、默克尔细胞癌、间皮瘤、转移癌、原发性隐匿的转移性颈鳞状细胞癌、中线束癌、口癌、多发性内分泌腺瘤综合征、多发性骨髓瘤、蕈样肉芽肿、骨髓增生异常综合征、骨髓增生异常/骨髓增生性肿瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌、唇癌和口腔癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、胰腺神经内分泌肿瘤、乳头瘤、副神经节瘤、副鼻窦癌、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、垂体瘤、浆细胞瘤、胸膜肺母细胞瘤、原发性中枢神经系统(cns)淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、复发癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、肉瘤、s
é
zary综合征、皮肤癌、小细胞肺癌、小肠癌、软组织肉瘤、皮肤鳞状细胞癌、隐匿原发性颈部鳞状细胞癌、胃癌、t细胞淋巴瘤、睾丸癌、喉癌、胸腺瘤和胸腺瘤、甲状腺癌、移行细胞癌、输尿管和肾盂癌、尿道癌、子宫癌、子宫肉瘤、阴道癌、血管瘤、外阴癌和肾母细胞瘤。
66.在一些实施方式中，本发明的基因组、外显子组、转录组、蛋白质组或orf组是炎症或自身免疫病基因组、外显子组、转录组、蛋白质组或orf组。在一些实施方式中，本发明的文库包含已知的炎症或自身免疫性新表位或自身表位。在一些实施方式中，本发明的文库包含可从已知炎症或自身免疫性抗原蛋白中衍生的所有k
‑
聚肽。在一些实施方式中，本发明的文库包含可从炎症或自身免疫相关基因中衍生的所有k
‑
聚肽。在一些实施方式中，本
发明的文库包含可从炎症或自身免疫相关驱动基因的突变中衍生的所有k
‑
聚肽。
67.炎症或自身免疫病或病症的非限制性例子包括急性播散性脑脊髓炎(adem)；急性坏死性出血性白质脑炎；爱迪生病；佐剂诱导的关节炎；丙种球蛋白缺乏血症；斑秃；淀粉样变性；强直性脊柱炎；抗gbm/抗tbm肾炎；抗磷脂综合征；自身免疫性血管水肿；自身免疫性再生障碍性贫血；自身免疫性自主神经障碍；自身免疫性胃萎缩；自身免疫性溶血性贫血；自身免疫性肝炎；自身免疫性高脂血症；自身免疫性免疫缺陷；自身免疫性内耳病；自身免疫性心肌炎；自身免疫性卵巢炎；自身免疫性胰腺炎；自身免疫性视网膜病变；自身免疫性血小板减少性紫癜；自身免疫性甲状腺疾病；自身免疫性荨麻疹；轴突神经病变；巴洛病；白塞氏病；大疱性类天疱疮；心肌病；卡斯特尔曼代病(castleman disease)；乳糜泻；恰加斯病；慢性炎性脱髓鞘性多发性神经病(cidp)；慢性复发性多灶性骨髓炎(crmo)；嗜酸性肉芽肿性多血管炎；瘢痕性类天疱疮/良性粘膜类天疱疮；克罗恩病；耳蜗前庭综合征；胶原诱导性关节炎；冷凝集素病；先天性心脏传导阻滞；柯萨基病毒性心肌炎；crest病；原发性混合性冷球蛋白血症；脱髓鞘性神经病；疱疹样皮炎；皮肌炎；德维克病(视神经脊髓炎)；盘状狼疮；德莱斯勒综合征；子宫内膜异位症；嗜酸性食管炎；嗜酸性筋膜炎；结节性红斑；实验性变态反应性脑脊髓炎；实验性自身免疫性脑脊髓炎；伊文斯综合征；纤维肌痛；纤维化性肺泡炎；巨细胞动脉炎(颞动脉炎)；巨细胞心肌炎；肾小球肾炎；肺出血肾炎综合征；肉芽肿伴多血管炎(gpa)(以前称为韦格纳肉芽肿)；格雷夫斯病；格林
‑
巴利综合征；桥本脑炎；桥本甲状腺炎；溶血性贫血；过敏性紫癜；妊娠疱疹；低丙种球蛋白血症；特发性血小板减少性紫癜；iga肾病；igg4相关硬化性疾病；免疫调节脂蛋白；包涵体肌炎；间质性膀胱炎；炎症性肠病；幼年型关节炎；幼年少发性关节炎；青少年糖尿病(1型糖尿病)；青少年肌炎；川崎综合征；兰伯特
‑
伊顿综合征；白细胞分裂性脉管炎；扁平苔癣；硬化性苔癣；木质性结膜炎；线状iga病(lad)；狼疮；慢性莱姆病；梅尼埃病；显微镜下多血管炎；混合性结缔组织病；摩尔溃疡；穆
‑
哈二氏病；多发性硬化；重症肌无力；肌炎；嗜睡症；视神经脊髓炎；中性粒细胞减少；非肥胖型糖尿病；眼部瘢痕性类天疱疮；视神经炎；复发性风湿病；pandas(与链球菌相关的儿童自身免疫性神经精神疾病)；副肿瘤性小脑变性；阵发性夜间血红蛋白尿(pnh)；帕里
‑
隆伯格综合征；帕森纳格
‑
特纳综合征；扁桃体炎(周围性葡萄膜炎)；天疱疮；寻常性天疱疮；周围神经病变；静脉周围脑脊髓炎；恶性贫血；poems综合征；结节性多动脉炎；i型、ii型和iii型自身免疫性多腺体综合征；风湿性多肌痛；多发性肌炎；心肌梗死后综合征；心包切开术后综合征；孕酮皮炎；原发性胆汁性肝硬化；原发性硬化性胆管炎；银屑病；斑块型银屑病；银屑病性关节炎；特发性肺纤维化；坏疽性脓皮病；纯红细胞再生障碍性贫血；雷诺现象；反应性关节炎；反射性交感神经营养不良；雷特综合征；复发性多软骨炎；不宁腿综合征；腹膜后纤维化；风湿热；类风湿性关节炎；类肉瘤病；施密特综合征；巩膜炎；硬皮病；硬化性胆道炎；硬化性涎腺炎；干燥综合征；精子与睾丸自身免疫；僵硬人综合征；亚急性细菌性心内膜炎；苏萨克综合征；交感性眼炎；系统性红斑狼疮；系统性硬化；高安动脉炎；颞动脉炎/巨细胞动脉炎；血小板减少性紫癜(ttp)；疼痛性眼肌麻痹；横贯性脊髓炎；1型糖尿病；溃疡性结肠炎；未分化结缔组织病(uctd)；葡萄膜炎；血管炎；水泡性大疱性皮肤病；白癜风；韦格纳肉芽肿(现称肉芽肿伴多血管炎(gpa))。炎症或自身免疫病或病况的非限制性例子包括感染，例如慢性感染、潜伏感染、缓慢感染、持续病毒感染、细菌感染、真菌感染、支原体感染或寄生虫感染。
68.在一些实施方式中，本发明的文库可包含具有翻译后修饰的肽，包括例如乙酰化、酰胺化、生物素化、脱酰胺化、法尼基化、甲酰化、香叶基香叶基化、谷胱甘肽基化、糖化、糖基化、羟基化、甲基化、单adp核糖基化、肉豆蔻酰化、n
‑
乙酰化、n
‑
糖基化、n
‑
肉豆蔻酰化、亚硝基化、氧化、棕榈酰化、磷酸化、聚(adp
‑
核糖基)化、硬脂酰化、硫酸化、sumo化、泛素化或其任何组合。在一些实施方式中，本发明的肽可包含一个或多个硒代半胱氨酸残基。
69.在一些实施方式中，本发明文库中的肽是蛋白质mrna复合物的一部分。在一些实施方式中，本发明文库中的肽是包含嘌呤霉素连接的蛋白质mrna复合物的一部分。在一些实施方式中，本发明文库中的肽是蛋白质
‑
mrna
‑
cdna复合物的一部分。在一些实施方式中，本发明文库中的肽是蛋白质dna复合物的一部分。在一些实施方式中，本发明文库中的肽是包含生物素
‑
链霉亲和素连接的蛋白质dna复合物的一部分。在一些实施方式中，本发明文库中的肽是蛋白质cdna复合物的一部分。在一些实施方式中，本发明文库中的肽是蛋白质
‑
核糖体
‑
mrna复合物的一部分。在一些实施方式中，本发明文库中的肽是蛋白质
‑
核糖体
‑
mrna复合物的一部分，其中mrna包含缺少终止密码子的间隔子序列。在一些实施方式中，本发明文库中的肽是蛋白质
‑
核糖体
‑
mrna
‑
cdna(prmc)复合物的一部分。
70.在一些实施方式中，本发明文库中的肽通过亲和标签纯化(例如，使用flag标签)来纯化。在一些实施方式中，本发明文库中的肽包含halotag酶序列。在一些实施方式中，本发明文库中的肽包含亲和素或链霉亲和素。
71.在一些实施方式中，本发明文库中的肽可结合或融合到另一分子。在一些实施方式中，本发明文库中的肽可结合或融合到另一多肽。在一些实施方式中，本发明文库中的肽可结合或融合到一多核酸。在一些实施方式中，本发明文库中的肽可结合或融合到一dna。在一些实施方式中，本发明文库中的肽可结合或融合到一rna。在一些实施方式中，本发明文库中的肽可存在于较大的支架内，例如作为较大的蛋白质序列或蛋白质复合物的一部分。
72.本发明的文库可包括约100,500,1000,2000,5000,104,105,106,107,108,109,10
10
,10
11
,10
12
,10
13
,10
14
,10
15
,10
16
,10
17
,10
18
,10
19
,10
20
,202,203,204,205,206,207,208,209,20
10
,20
11
,20
12
,20
13
,20
14
,20
15
,20
16
,20
17
,20
18
,20
19
,20
20
,20
21
,20
22
,20
23
,20
24
,20
25
,20
26
,20
27
,20
28
,20
29
,或20
30
个肽或抗原。
73.本发明的文库可包括超过至少约100,500,1000,2000,5000,104,105,106,107,108,109,10
10
,10
11
,10
12
,10
13
,10
14
,10
15
,10
16
,10
17
,10
18
,10
19
,10
20
,202,203,204,205,206,207,208,209,20
10
,20
11
,20
12
,20
13
,20
14
,20
15
,20
16
,20
17
,20
18
,20
19
,20
20
,20
21
,20
22
,20
23
,20
24
,20
25
,20
26
,20
27
,20
28
,20
29
,或20
30
个肽或抗原。
74.本发明的文库可包括至多约100,500,1000,2000,5000,104,105,106,107,108,109,10
10
,10
11
,10
12
,10
13
,10
14
,10
15
,10
16
,10
17
,10
18
,10
19
,10
20
,202,203,204,205,206,207,208,209,20
10
,20
11
,20
12
,20
13
,20
14
,20
15
,20
16
,20
17
,20
18
,20
19
,20
20
,20
21
,20
22
,20
23
,20
24
,20
25
,20
26
,20
27
,20
28
,20
29
,或20
30
个肽或抗原。
75.本发明的k聚体可以是1聚体、2聚体、3聚体、4聚体、5聚体、6聚体、7聚体、8聚体、9聚体、10聚体、11聚体、12聚体、13聚体、14聚体、15聚体、16聚体、17聚体、18聚体、19聚体、20聚体、21聚体、22聚体、23聚体、25聚体、26聚体、27聚体、28聚体、29聚体、30聚体、31聚体、32聚体、33聚体、34聚体、35聚体、36聚体、37聚体、38聚体、39聚体，40聚体、41聚体、42聚体、43
聚体、44聚体、45聚体、46聚体、47聚体、48聚体、49聚体或50聚体。
76.本发明的文库可包括每个肽具有约0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,200,225,250,275,300,350,400,450,500,600,700,800,900,或1000个受约束残基的肽。本发明的文库可包括每个肽具有约1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,200,225,250,275,300,350,400,450,500,600,700,800,900,或1000个可变残基的肽。
77.本发明的文库可包括每个肽具有超过至少约0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,200,225,250,275,300,350,400,450,500,600,700,800,900,或1000个受约束残基的肽。本发明的文库可包括每个肽具有多于至少约1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,200,225,250,275,300,350,400,450,500,600,700,800,900,或1000个可变残基的肽。
78.本发明的文库可包括每个肽具有至多约0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,200,225,250,275,300,350,400,450,500,600,700,800,900,或1000个受约束残基的肽。本发明的文库可包括每个肽具有至多约1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,200,225,250,275,300,350,400,450,500,600,700,800,900,或1000个可变残基的肽。肽文库亚组
79.肽文库可以是无偏文库的亚组。在一些实施方式中，算法可用于选择本发明肽文库中的肽。例如，可以使用算法来预测最有可能折叠或停靠在mhc/hla结合口袋中的肽，并且可以选择高于特定阈值的肽包含在文库中。在一些实施方式中，为本发明文库选择肽包括基于对特定hla类型的预测结合亲和力对肽进行优先级排序。在一些实施方式中，为本发明文库选择肽基于群体(例如，人类人群)中的流行程度优先考虑hla类型或等位基因。
80.在一些实施方式中，本发明的文库包含基于筛选分析(例如用于折叠的功能分析)选择的肽。分析可用于测试本发明肽的成功折叠。例如，单克隆抗体可用于测定多肽的成功折叠，例如，bb7.2单克隆抗体的结合可指示hla
‑
a2的成功折叠。在一些实施方式中，将正确折叠的肽与错误折叠的肽分离，可以确定正确折叠和错误折叠的肽序列(例如，通过对本文公开的标识符测序)，并且可以为正确折叠的肽富集后续文库(图6)。
81.在一些实施方式中，本发明的文库包含来自癌症(例如，结直肠癌或非小细胞肺癌)的已知的、检测得到的或预测的新表位。在一些实施方式中，本发明的文库包含与特定疾病或状况相关或富集的序列。
抗原文库
82.本说明书提供了肽文库，其可用于一系列筛选试验，以鉴定潜在的诊断或治疗靶点或试剂。肽文库可以是抗原文库。本发明包括抗原文库，其应用于与免疫抗原相关的分析，包括包含t细胞表位的t细胞抗原。t细胞抗原和表位可以极大地影响适应性免疫系统的功能，因为它们是t细胞受体(tcr)识别的特定序列。关联抗原的tcr识别对于例如针对病原体的免疫识别和效应物免疫应答、针对癌细胞的免疫识别和效应物免疫应答以及自身免疫应答(例如，针对导致疾病的自身组织的免疫应答)是重要的。
83.因此，用于筛选t细胞表位的抗原文库在例如与传染病、癌症和自身免疫性疾病相关的研究、诊断、治疗和预防措施中具有潜在用途。鉴定t细胞识别的抗原肽序列对于例如疫苗开发(例如，鉴定特定病原体的保护性抗原或鉴定用于癌症疫苗的新抗原)、癌症治疗(例如，鉴定基于t细胞的治疗靶点包括鉴定新抗原)，以及自身免疫研究和治疗(例如，鉴定自身免疫抗原)至关重要。
84.然而，在t细胞抗原和表位相关的应用中，肽文库的生产和使用面临许多挑战。可能相关的肽序列绝对数量之多可能给文库生产带来挑战。对于长度为9个残基的肽(9
‑
聚体)，蛋白质中最常见的20种氨基酸有209(约5.1x10
11
)种可能序列组合。如下所述，一些递呈给t细胞的肽可以超过9个残基，因此tcr识别的潜在肽的多样性可以超过5.1x10
11
。另外，感兴趣的潜在抗原肽源(例如，病原体、癌细胞、组织)可表达数千种蛋白质，每种蛋白质包含多个潜在肽抗原。需要高效、高通量的方法来生成任何具有这种多样性的文库。
85.其他挑战涉及肽必须递呈到tcr的方式，以启动足够亲和力的结合，从而在实验或治疗环境中有用。在体内，tcr识别主要组织相容性复合物(mhc)分子递呈的肽。为了结合tcr，肽文库的肽抗原也必须在mhc环境下递呈。此外，为了实现在实验或治疗环境中有用的足够亲和力的结合，需要肽mhc(pmhc)复合物的多聚体。传统的制备pmhc多聚体的方法通量低，劳动强度大，所得的多肽容易发生错误折叠和肽抗原负载不良。
86.本文提供了各种pmhc多聚体文库及其生产方法，包括高通量方法。在一些实施方式中，pmhc多聚体进一步包含核酸标识符，允许如本文他处所述方便地检测和量化结合。pmhc多聚体
87.肽通过两大类mhc递呈给tcr：mhc i类(mhc
‑
i)和mhc ii类(mhc
‑
ii)。在人类中，mhc也称为人白细胞抗原(hla)。编码hla的基因在不同个体之间高度可变，不同的hla基因在肽结合和抗原呈递方面可能具有不同的特征。人类有三种主要的mhc i类基因，即hla
‑
a、hla
‑
b和hla
‑
c。由这些基因产生的蛋白质几乎存在于所有细胞的表面。另外，非经典i类基因包括hla
‑
e、hla
‑
f和hla
‑
g。人类有六种主要的mhc ii类基因：hla
‑
dpa1,hla
‑
dpb1,hla
‑
dqa1,hla
‑
dqb1,hla
‑
dra,和hla
‑
drb1。许多mhc基因有多种等位基因形式，每种等位基因都可以在一个浅抗原结合沟中递呈多种肽，该浅抗原结合沟由位于β片层顶部的两个反平行α
‑
螺旋产生。mhc
‑
i递呈的肽可以以延伸构象结合，n端和c端都结合在封闭的沟内，从而限制其大小(例如，8
‑
10个残基)。mhc
‑
ii递呈的肽也可以以延伸构象结合，但由于沟的开放性，可以更长(例如，14
–
20个残基)。
88.为了产生pmhc，可以产生亚基的表达构建体。例如，可以产生表达mhc
‑
i重链和β
‑2‑
微球蛋白(β2m)的构建体。可以基因删除重链的跨膜结构域以促进纯化，并且在c末端添加生物素识别位点。重链、β2m和肽都可以表达，例如，在大肠杆菌培养物中重组表达为包涵
体，或在真核细胞(如昆虫或哺乳动物细胞)中表达。例如，可以使用bira酶对生物素识别位点进行生物素化。然后可以用变性剂处理重链、β2m和肽，重新折叠成pmhc单体，并通过尺寸排除色谱法纯化。与肽不正确结合的mhc分子可能不稳定、解离和错折叠。类似的技术可用于生成肽mhc ii复合物(pmhc ii)。
89.然后，mhc单体可以多聚化，形成例如二聚体、四聚体、五聚体、八聚体、链霉聚体或葡聚体。二聚体可以通过mhc分子胞外结构域的遗传融合产生，例如，作为与结合第二mhc的免疫球蛋白骨架的融合物。例如，可以通过向具有生物素化c
‑
末端的mhc单体添加链霉亲和素或亲和素“骨架”来生成四聚体。或者，链霉亲和素结构域可以表达为与mhc链的c
‑
末端的融合物，促进自组装成四聚体。mhc四聚体和八聚体也可通过在mhc链c端的游离半胱氨酸中引入点突变来生成，该游离半胱氨酸可被含生物素的碘乙酰胺或马来酰亚胺衍生物烷基化。链霉亲和素结合物可用于寡聚。通过使用含有一个生物素和两个马来酰亚胺部分(dmg)的分枝肽，该策略允许制备八聚体mhc复合物。mhc五聚体可以通过自组装螺旋结构域与五个mhc单体复合生成。mhc葡聚体可通过将多个mhc复合物(例如，十个或更多个)附接到葡聚糖聚合物骨架来生成。可通过将mhc链的生物素化c末端连接到strep
‑
tactin或strep
‑
tag骨架来生成mhc链霉聚合物，从而形成包含8
‑
12个mhc单体的复合物。单链pmhc
90.mhc分子可以被设计为单链肽
‑
mhc多肽(sc
‑
pmhc)，其包含组装的pmhc的亚基。例如，这种sc
‑
pmhc可以简化肽抗原在mhc结合沟中的装载。例如，与可占据结合沟的其他污染肽相比，这种sc
‑
pmhc还可促进连接的肽抗原的有效装载。sc
‑
pmhc多聚体可表现出与抗原特异性t细胞的特异性和剂量依赖性的结合(图12)。
91.sc
‑
pmhc可包含对应于mhc
‑
i的抗原肽、重链和/或β
‑2‑
微球蛋白(β2m)。mhc
‑
i sc
‑
pmhc可包含抗原肽和重链。mhc
‑
i sc
‑
pmhc可包含抗原肽和β2m。mhc
‑
i sc
‑
pmhc可包含抗原肽、β
‑2‑
微球蛋白(β2m)和重链。在一些实施方式中，mhc
‑
i sc
‑
pmhc可包含具有抗原肽和将抗原肽连接到重链的柔性接头的单条多肽。在一些实施方式中，mhc
‑
i sc
‑
pmhc可进一步包含将β2m连接到抗原肽或重链的另一柔性接头。在一些实施方式中，mhc
‑
i sc
‑
pmhc可包含具有抗原肽和将抗原肽连接到β2m的柔性接头的单条多肽。在一些实施方式中，mhc
‑
i sc
‑
pmhc可进一步包含将重链连接到抗原肽或β2m的另一柔性接头。
92.sc
‑
pmhc可包含对应于mhc
‑
ii的抗原肽、α链和/或β链。mhc
‑
i sc
‑
pmhc可包含抗原肽和α链。mhc
‑
ii sc
‑
pmhc可包含抗原肽和β链。mhc
‑
ii sc
‑
pmhc可包含抗原肽、α链和β链。mhc
‑
ii sc
‑
pmhc可包含具有抗原肽和将抗原肽连接到β链的柔性接头的单条多肽。在一些实施方式中，mhc
‑
ii sc
‑
pmhc可进一步包含将α链连接到抗原肽或β链的另一柔性接头。在一些实施方式中，mhc
‑
ii sc
‑
pmhc可包含具有抗原肽和将抗原肽连接到α链的柔性接头的单条多肽。在一些实施方式中，mhc
‑
ii sc
‑
pmhc可进一步包含将β链连接到抗原肽或α链的另一柔性接头。
93.sc
‑
pmhc可以是任何顺序，例如，单条多肽c端的肽，以允许抗原肽n端的更大多样性。如果抗原肽位于n
‑
端，则可采用其他机制在n
‑
端产生更大的多样性，例如，酶切n
‑
端。sc
‑
pmhc单体可如上述mhc单体所述进行多聚，例如，形成二聚体、四聚体、五聚体、八聚体、链霉聚体或葡聚体。
94.在一些实施方式中，本发明的文库包括多个sc pmc。在一些实施方式中，本发明的
文库包含多个sc
‑
pmhc，其中k聚体序列定位于sc
‑
pmhc的抗原肽部分内。
95.肽
‑
mhc多聚体或特异性结合pmhc多聚体的抗体可与荧光标签结合，从而允许鉴定结合肽mhc多聚体的t细胞，例如，通过流式细胞术或显微镜检。也可以基于荧光标签通过荧光活化细胞分选的方式选择t细胞。然而，这种方法的局限性与可用的不同荧光标签和检测物的数量有关，这限制了高通量抗原文库筛选中基于荧光的方法的使用。
96.在一些实施方式中，本发明的文库包含如别处所述与核苷酸标识符偶联的sc
‑
pmhc多聚体，能够方便地检测和量化与tcr的抗原特异性结合。例如，该文库可允许检测对特定抗原特异性的t细胞，多重检测给定样品中的t细胞特异性，将tcr序列与特异性匹配(例如，通过单细胞测序)，比较性tcr亲和力测定，确定给定tcr的共有特异性序列，或针对感兴趣的序列绘制t细胞的抗原反应性。接头
97.在一些实施方式中，本发明提供了多肽序列，其中两个多肽序列或结构域通过接头连接。在一些实施方式中，本发明提供了多肽序列，其中三个或更多多肽序列或结构域通过接头连接。在一些实施方式中，本发明提供了多肽序列，其中四个或更多多肽序列或结构域通过接头连接。在一些实施方式中，本发明提供了多肽序列，其中五个或更多多肽序列或结构域通过接头连接。在一些实施方式中，本发明提供了多肽序列，其中六个或更多多肽序列或结构域通过接头连接。
98.接头可以是化学键，例如，一个或多个共价键或非共价键。在一些实施方式中，接头是共价键。在一些实施方式中，接头是非共价键。在一些实施方式中，接头是肽接头。这种接头可以介于2
‑
30个氨基酸之间，或更长。在一些实施方式中，接头可用于，例如，将多肽序列或结构域彼此隔开。在一些实施方式中，接头可以位于结构域之间，例如，以提供二级和三级结构的分子柔性。接头可包括柔性、刚性和/或可切割接头，如本文所述。在一些实施方式中，接头包含至少一个甘氨酸、丙氨酸和丝氨酸氨基酸以提供柔性。在一些实施方式中，接头是疏水性接头，例如包括带负电荷的磺酸根基团、聚乙二醇(peg)基团或焦磷酸二酯基团。在一些实施方式中，接头是可切割的，以选择性地使得多肽序列或结构域相对彼此释放，但足够稳定以防止过早切割。
99.柔性肽接头可具有主要由gly和ser残基片段组成的序列(“gs”接头)。柔性肽接头可用于连接需要一定程度运动或相互作用的域，并且可以包括小的、非极性(例如gly)或极性(例如ser或thr)氨基酸。ser或thr的纳入还可以通过与水分子形成氢键来促进接头在水溶液中的稳定性，从而减少接头和蛋白质部分之间不利的相互作用。柔性接头可以包括，例如，表1中列出的任何序列的单拷贝或重复。
100.刚性接头可用于在结构域之间保持固定距离。当结构域的空间分隔对于保持一个
或多个组件的稳定性或生物活性至关重要时，刚性接头也很有用。刚性接头可以具有α
‑
螺旋结构或富含pro的序列。例如，刚性接头可包含序列(eaaak)
n
、a(eaaak)
n
a(xp)
n
，其中n表示任意数量的重复(例如，2
‑
5)，x表示任意氨基酸(例如，ala、lys或glu)。
101.可切割的肽接头可用于移除或释放多肽序列或结构域。在一些实施方式中，接头可以在特定情况下被切割，例如存在还原剂或酶的情况下。融合体中接头的体内切割还可以通过在某些条件、特定细胞或组织中、或限制在某些细胞隔室中表达的酶或蛋白酶进行。许多酶或蛋白酶的特异性提供了在限制的隔室中较慢的接头切割。例如，可切割的接头可包含基质金属蛋白酶(mmp)或另一蛋白酶的切割序列。另一个例子包括两个cys残基之间的凝血酶敏感序列(例如，prs)。cprsc的体外凝血酶处理导致凝血酶敏感序列的切割，而可逆的二硫键保持完整。这种接头是已知的并描述于，例如，chen等.2013.融合蛋白接头：特性、设计和功能。(fusion protein linkers:property,design and functionality.)adv drug deliv rev.65(10):1357
–
1369。
102.在一些实施方式中，接头可以是肽键，例如，肽序列或结构域的c端可以通过肽键与另一肽序列或结构域的n端融合。
103.接头的另一个例子包括疏水接头，例如带负电荷的磺酸根基团；脂质，例如聚(
‑‑
ch2
‑‑
)烃链，例如聚乙二醇(peg)基团，其不饱和变体，其羟基化变体，其酰胺化或其他含n变体，非碳接头；碳水化合物接头；磷酸二酯接头，或能够共价连接两个或多个多肽的其他分子。也可使用非共价接头，例如生物素
‑
链霉亲和素接头。肽标识符
104.本发明提供肽文库，包括例如在一系列治疗和诊断筛选中有用的高多样性肽文库。例如，提供的肽文库可用于筛选疾病特异性或器官特异性肽、筛选具有治疗应用的肽、筛选具有诊断应用的肽、筛选肿瘤靶向肽、筛选抗体表位或抗原、筛选t细胞表位或抗原、筛选抗微生物肽，或其任何组合。
105.利用肽文库的分析可能受到检测和量化单个肽所需的方法的限制。核酸标识符可用于标记文库中具有独特核酸序列的每个肽，允许使用基于核酸的方法(例如pcr扩增或dna测序)检测和定量单个肽。核酸标识符可以是独特的核酸序列。在一些实施方式中，当多种肽在共同的实验条件下合并时，核酸标识符允许检测和定量单个肽。在一些实施方式中，当多种肽在共同的实验条件下合并时，核酸标识符允许检测和定量单个肽。在一些实施方式中，核酸标识符可用于在一定实验条件下标记核酸(例如，dna、mrna、cdna)，用于匹配肽文库中存在于相同实验条件下且具有相同核酸标识符的肽。在一些实施方式中，核酸标识符允许对文库多样性进行验证，其中对核酸标识符进行dna测序，并将观察到的读数映射到预测的文库序列，以鉴定文库中是否存在肽(图7)。在一些实施方式中，标识符还用于基于读数的定量的定标。在一些实施方式中，标识符是自身标识符，其对应于编码其识别的肽的核酸序列的全部或部分。在一些实施方式中，标识符不是自身标识符(例如，不包含编码其识别的肽的核酸序列)。
106.标识符可以具有任何核酸序列。在一些实施方式中，标识符可以是单链或双链dna多核苷酸。在一些实施方式中，标识符可以是rna多核苷酸。在一些实施方式中，标识符可以是杂合的dna和rna多核苷酸。在一些实施方式中，标识符可包含合成或化学修饰的核苷酸或偶联物(例如，用于增强稳定性或促进与肽的附接)。
107.核酸标识符可以共价或非共价附接到肽上。
108.蛋白质或肽可具有通过体外翻译方法附接的标识符，以生成蛋白质mrna复合物、蛋白质
‑
mrna
‑
cdna复合物、蛋白质
‑
dna复合物、蛋白质
‑
cdna复合物、蛋白质
‑
核糖体
‑
mrna复合物或蛋白质
‑
核糖体
‑
mrna
‑
cdna(prmc)复合物，其可以包含蛋白质开放阅读框(orf)5
′
端的合成标识符。在一些实施方式中，可以使用包含嘌呤霉素的mrna模板和包含纯化组分的体外翻译(ivt)系统来执行mrna展示。携带感兴趣蛋白质的mrna
‑
蛋白质复合物可通过亲和标记纯化来富集，例如，flag
‑
标记纯化。在一些实施方式中，核糖体展示可使用包含缺少终止密码子的间隔子序列的mrna模板和包含纯化的组分的体外翻译(ivt)系统来执行。携带感兴趣蛋白质的蛋白质
‑
核糖体
‑
mrna复合物可通过亲和标记纯化，例如，flag标记纯化来富集。在一些实施方式中，核糖体展示可使用mrna
‑
cdna杂合物作为模板和包含纯化的组分的体外翻译(ivt)系统来执行。携带感兴趣蛋白质的prmc复合物可通过亲和标记纯化，例如，flag标记纯化来富集。在一些实施方式中，dna展示可使用生物素化dna模板和包含纯化的组分的体外转录和翻译系统来执行。蛋白质dna复合物可以通过生物素
‑
链霉亲和素结合形成，通过亲和标记纯化(例如flag
‑
标记纯化)富集蛋白质dna复合物。在一些实施方式中，mrna作为体外转录和翻译系统的一部分从dna合成。在一些实施方式中，在纯化包含肽和mrna的复合物之前或之后，从mrna反转录cdna。
109.标识符可以通过酶法附接到蛋白质或肽上。例如，可以生成包含halotag酶序列的融合蛋白，并且酶活性可以将融合蛋白共价偶联到halotag配体修饰的双链dna上。
110.标识符可通过非共价作用附接到蛋白质或肽上。例如，生物素化的多核苷酸标识符可结合到与肽结合的亲和素或链霉亲和素上。亲和素或链霉亲和素可以是肽序列的一部分，或者可以以其他方式与其结合，例如，用于组装蛋白质多聚体的链霉亲和素骨架。
111.在一些实施方式中，独特标识符可用于文库中的每个独特肽。在一些实施方式中，例如当肽包含相同序列时，可在肽文库中的两个或多种肽之间共享标识符。在一些实施方式中，标识符可包括文库的多个或所有肽之间共有的序列，以及文库中的肽独特的序列。在一些实施方式中，标识符可包括文库的多个或所有肽之间共有的一个或多个序列部分，以及文库中肽独特的一个或多个其他序列部分。在一些实施方式中，标识符之间共有的序列可用于标识符扩增(例如，使用合适的引物进行pcr扩增)。在一些实施方式中，对一个标识符独特的或在标识符子集之间共有的序列可用于经由qpcr进行检测或量化(例如，水解探针的序列，例如taqman探针)。在一些实施方式中，一个标识符的独特序列或标识符子集之间的共有序列可用于通过测序进行检测或量化。
112.在一些实施方式中，核酸标识符可包括编码氨基酸的序列。在一些实施方式中，两个或多个核酸标识符可包含编码相同氨基酸的不同序列(例如，使用不同密码子)。在一些实施方式中，核酸标识符中的差异密码子利用可允许在标识符中存储额外信息。
113.在一些实施方式中，标识符可包括独特的计算机上生成的序列；每个标识符序列可分配给文库内包含独特序列的肽，并且标识符
‑
肽的分配可存储在数据库中。在一些实施方式中，标识符可包含编码其所识别的肽的全部或部分的核苷酸序列。在一些实施方式中，标识符可包括编码开放阅读框的核苷酸序列。在一些实施方式中，标识符可包含包括启动子序列的核苷酸序列。在一些实施方式中，标识符可包括核苷酸序列，其包括dna结合蛋白(例如转录因子或聚合酶)的结合位点。在一些实施方式中，标识符可包括核酸酶(例如限制
性内切酶)靶向的一个或多个序列。在一些实施方式中，标识符可包括序列的体外转录和翻译所需的至少一个序列元件。
114.在一些实施方式中，标识符可包含编码主要组织相容性复合物(mhc)分子或其片段的核苷酸序列。在一些实施方式中，标识符可包含编码单链肽
‑
mhc多肽(sc
‑
pmhc)或其片段的核苷酸序列。在一些实施方式中，标识符可包含编码sc
‑
pmhc的抗原肽的核苷酸序列。
115.在一些实施方式中，标识符可以是蛋白质
‑
mrna复合物的一部分。在一些实施方式中，标识符可以是包含嘌呤霉素连接的蛋白质
‑
mrna复合物的一部分。在一些实施方式中，标识符可以是蛋白质
‑
mrna
‑
cdna复合物的一部分。在一些实施方式中，标识符可以是蛋白质
‑
dna复合物的一部分。在一些实施方式中，标识符可以是包含生物素
‑
链霉亲和素连接的蛋白质
‑
dna复合物的一部分。在一些实施方式中，标识符可以是蛋白质
‑
cdna复合物的一部分。在一些实施方式中，标识符可以是蛋白质
‑
核糖体
‑
mrna复合物的一部分。在一些实施方式中，标识符可以是蛋白质
‑
核糖体
‑
mrna复合物的一部分，其中mrna包含缺少终止密码子的间隔子序列。在一些实施方式中，标识符可以是mrna
‑
cdna杂合物的一部分。在一些实施方式中，标识符可以是prmc复合物的一部分。
116.在一些实施方式中，标识符可包含halotag配体，例如，结合到官能团(例如生物素或荧光染料)的氯代烷烃接头。
117.在一些实施方式中，标识符可包含生物素化核苷酸序列。在一些实施方式中，标识符可通过使用生物素化引物的pcr扩增进行生物素化。在一些实施方式中，标识符可通过使用klenow dna聚合酶、缺口翻译或混合引物标记rna聚合酶(包括t7、t3和sp6 rna聚合酶)酶促纳入生物素化标签(例如，生物素dutp标签)来生物素化。在一些实施方式中，标识符可通过光生物素化进行生物素化，例如，可将光可活化生物素添加到样品中，且用紫外光照射样品。
118.在一些实施方式中，例如通过模板dna的pcr扩增，可从模板多核苷酸生成标识符。在一些实施方式中，标识符可以从头生成，例如通过化学合成、固相dna合成、基于柱的寡核苷酸合成、基于微阵列的寡核苷酸合成或其他合成方法。在一些实施方式中，模板多核苷酸可包括编码开放阅读框的核苷酸序列。在一些实施方式中，模板多核苷酸可包含包括启动子序列的核苷酸序列。在一些实施方式中，模板多核苷酸可包括核苷酸序列，其包括dna结合蛋白(例如转录因子或聚合酶)的结合位点。在一些实施方式中，模板多核苷酸可包括核酸酶(例如限制性内切酶)靶向的一个或多个序列。在一些实施方式中，模板多核苷酸可包括序列的体外转录和翻译所需的全部序列元件。在一些实施方式中，模板多核苷酸不包括序列的体外转录和翻译所需的全部序列元件。在一些实施方式中，编码两个或多个核酸标识符的模板多核苷酸可包含编码相同氨基酸的不同序列(例如，使用不同密码子)。在一些实施方式中，模板多核苷酸中的差异密码子利用可用于鉴定文库中一类肽或其子集。在一些实施方式中，核酸标识符中的差异密码子利用可允许在模板多核苷酸中存储额外信息。
119.本文的标识符可以是任何长度。在一些实施方式中，标识符的长度可以是约4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,
106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149,150,155,160,165,170,175,180,185,190,195,200,210,220,230,240,250,260,270,280,290,300,320,340,360,380,400,420,440,460,480,500,或更多核苷酸。
120.在一些实施方式中，标识符的长度可大于至少约4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149,150,155,160,165,170,175,180,185,190,195,200,210,220,230,240,250,260,270,280,290,300,320,340,360,380,400,420,440,460,480,或500个核苷酸。
121.在一些实施方式中，标识符的长度可以是至多约4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149,150,155,160,165,170,175,180,185,190,195,200,210,220,230,240,250,260,270,280,290,300,320,340,360,380,400,420,440,460,480,500,或更多核苷酸。
122.在一些实施方式中，标识符的长度可在约4
‑
500个核苷酸的范围内。在一些实施方式中，标识符的长度可在约25
‑
500个核苷酸的范围内。在一些实施方式中，标识符的长度可在约27
‑
300个核苷酸的范围内。在一些实施方式中，标识符的长度可在约27
‑
120个核苷酸的范围内。在一些实施方式中，标识符的长度可在约50
‑
120个核苷酸的范围内。在一些实施方式中，标识符的长度可在约80
‑
120个核苷酸的范围内。在一些实施方式中，标识符的长度可在约40
‑
50个核苷酸的范围内。在一些实施方式中，标识符的长度可在约5
‑
15个核苷酸的范围内。在一些实施方式中，标识符的长度可在约6
‑
10个核苷酸的范围内。合成方法
123.肽文库的肽可以通过化学方法合成，例如，茶包(tea bag)合成、数字光刻、针式(pin)合成和spot合成。例如，可以通过spot合成产生肽阵列，其中氨基酸链通过添加氨基酸和切割侧链保护基团的重复循环构建在纤维素膜上。
124.生物肽文库，如噬菌体展示、细菌展示或酵母展示，涉及融合肽而非分离分子。生物肽库可能经历多样性限制和冗余性。噬菌体或细菌成分的存在可导致混杂效应，例如，分析成分与细菌成分而非感兴趣的肽结合，或在包含细胞的分析中，通过先天免疫机制免疫活化。
125.可使用重组dna技术表达肽，例如，将表达构建体引入细菌细胞、昆虫细胞或哺乳
动物细胞，并从细胞提取物中纯化重组蛋白。然而，以这种方式产生的重组蛋白通常以可溶性聚集物的形式不溶性表达，可能被蛋白水解或在细胞提取物中检测不到。
126.可通过体外转录和翻译合成肽，其中合成利用无细胞环境中转录和翻译的生物学原理，例如，通过提供核酸模板、相关构建模块(例如rna、氨基酸)、酶(例如rna聚合酶、核糖体)和条件。体外转录和翻译可以包括无细胞蛋白质合成(cfps)。可以使用ivtt系统合成肽，该系统既可以转录，例如，dna构建体转录为rna，也可以将rna翻译为蛋白质。在一些实施方式中，dna或rna构建体包含嘌呤霉素。在一些实施方式中，dna或rna构建体包含缺少终止密码子的间隔子序列。
127.在一些实施方式中，本文公开的核酸可以从头生成，例如通过化学合成、固相dna合成、基于柱的寡核苷酸合成、基于微阵列的寡核苷酸合成或其他合成方法。在一些实施方式中，例如通过模板dna的pcr扩增，可从模板多核苷酸生成本文公开的核酸。
128.编码肽的n
‑
末端甲硫氨酸残基和可切割部分的核苷酸序列可在dna构建体或rna构建体中被编码。可切割部分位于使得该肽的至少一个n
‑
末端氨基酸残基在可切割部分之前或之内。在一些实施方式中，该方法包括编码可切割部分，其位于使得肽的一个n
‑
末端氨基酸残基在可切割部分之前或之内。在一些实施方式中，一个n
‑
末端氨基酸残基是甲硫氨酸残基。可以使用酶，例如对可切割部分特异的蛋白酶切割可切割部分，该蛋白酶也可以从肽的剩余部分切掉可切割部分。
129.如本文所述的dna或rna构建体中编码的可切割部分的实例包括任何可被酶切割的可切割部分。在一些实施方式中，可由蛋白酶切割可切割部分。可使用对切割部分特异性的酶从肽中切下可切割部分。例如，该酶可以是因子xa、人鼻病毒3c蛋白酶、actev
tm
蛋白酶，welqut蛋白酶，genenase
tm
,小泛素样修饰物(sumo)蛋白、ulp1蛋白酶或肠激酶。通过识别三级结构而非氨基酸序列，ulp1蛋白酶可以特定的方式切下可切割部分。肠激酶(肠肽酶)也可用于从候选肽中切割可切割部分。肠激酶也可用于在以下切割位点的赖氨酸后切割：asp
‑
asp
‑
asp
‑
asp
‑
lys(seq id no.:7)。肠激酶还可以在其他碱性残基处切割，取决于蛋白质底物的序列和构型。
130.在编码肽的构建体翻译之后，n
‑
末端氨基酸残基可被切割以产生用于高多样性肽文库的肽。在一些实施方式中，至少一个n
‑
末端氨基酸残基被切割以产生肽。在一些实施方式中，一个或多个n
‑
末端氨基酸被切割，例如2,3,4,5,6,7,8,9,10,11,12,13,14,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,140,150,160,170,180,190,200,250或更多n
‑
末端氨基酸残基被切割，以产生肽。该n
‑
末端氨基酸可以是任何氨基酸残基。该n
‑
末端氨基酸残基可以是甲硫氨酸氨基酸残基。制备和使用肽文库的方法
131.本文所述肽文库可用于各种分析。
132.在一些实施方式中，本文所述肽文库可用于分离细胞
‑
肽对。在一些实施方式中，分离细胞
‑
肽对的方法包括将多个细胞与肽文库接触，其中肽文库具有大于10、大于100、大于500、大于1000、大于2000、大于5000、大于10000、大于106、大于107、大于108、大于109，或大于10
10
以上的独特肽的多样性；以及产生多个隔室，其中所述多个中的隔室包括与所述肽文库的肽结合的所述多个细胞中的细胞，从而在所述隔室中分离所述细胞
‑
肽对。在一些实施方式中，肽文库用于肽文库评估，以在从头发现靶点后分离细胞
‑
肽对。细胞
‑
肽对可以是
受体
‑
配体对。细胞
‑
肽对可以是tcr
‑
抗原对。细胞
‑
肽对可以是bcr
‑
抗原对。在一些实施方式中，可转染或转导细胞以表达受体。在一些实施方式中，可转染或转导细胞以表达tcr。在一些实施方式中，可转染或转导细胞以表达bcr。在一些实施方式中，可转染或转导非淋巴细胞以表达tcr。在一些实施方式中，可转染或转导非淋巴细胞以表达bcr。在一些实施方式中，多种肽中的肽包含如本文所述的标识符。隔室可以是单独的空间，例如孔、平板、分离的边界、相漂移、容器、囊泡、细胞等。
133.本文所述的方法和组合物可用于鉴定细胞
‑
肽对。在一些实施方式中，鉴定细胞
‑
肽对的方法包括将多个细胞与肽文库接触，其中肽文库具有大于10、大于100、大于500、1000、大于2000、大于5000、大于10000、大于106、大于107、大于108、大于109、大于10
10
的独特肽的多样性；分隔与所述肽库的肽在一个隔室内结合的多个细胞中的细胞，其中肽包含独特肽标识符；并确定与分隔的细胞结合的每条肽的独特肽标识符。在一些实施方式中，肽文库用于肽文库评估，以在从头发现靶点后鉴定细胞
‑
肽对。细胞
‑
肽对可以是受体
‑
配体对。细胞
‑
肽对可以是tcr
‑
抗原对。细胞
‑
肽对可以是bcr
‑
抗原对。在一些实施方式中，可转染或转导细胞以表达受体。在一些实施方式中，可转染或转导细胞以表达tcr。在一些实施方式中，可转染或转导细胞以表达bcr。在一些实施方式中，可转染或转导非淋巴细胞以表达tcr。在一些实施方式中，可转染或转导非淋巴细胞以表达bcr。在一些实施方式中，肽文库是抗原文库。多种肽可以是多个抗原。多种肽可以是如本文所述的多个pmhc多聚体。多种肽可以是如本文所述的多个sc
‑
pmhc。在一些实施方式中，多种肽中的肽包含如本文所述的标识符。
134.在一些实施方式中，本文所述肽文库可用于分离淋巴细胞
‑
肽对。在一些实施方式中，分离淋巴细胞
‑
肽对的方法包括将多个淋巴细胞与肽文库接触，其中肽文库具有大于10、大于100、大于500、大于1000、大于2000、大于5000、大于10000、大于106、大于107、大于108、大于109，或大于10
10
以上的独特肽的多样性；以及产生多个隔室，其中所述多个中的隔室包括与所述肽库的肽结合的所述多个淋巴细胞中的淋巴细胞，从而在所述隔室中分离所述淋巴细胞
‑
肽对在一些实施方式中，肽文库用于肽文库评估，以在从头发现靶点后分离淋巴细胞
‑
肽对。淋巴细胞可以是t细胞、b细胞或nk细胞。在一些实施方式中，肽文库是抗原文库。多种肽可以是多个抗原。多种肽可以是如本文所述的多个pmhc多聚体。多种肽可以是如本文所述的多个sc
‑
pmhc。淋巴细胞
‑
肽对可以是tcr
‑
抗原对。淋巴细胞
‑
肽对可以是bcr
‑
抗原对。在一些实施方式中，多种肽中的肽包含如本文所述的标识符。隔室可以是单独的空间，例如孔、平板、分离的边界、相漂移、容器、囊泡、细胞等。
135.本文所述的方法和组合物可用于鉴定淋巴细胞
‑
肽对。在一些实施方式中，鉴定淋巴细胞
‑
肽对的方法包括将多个淋巴细胞与肽文库接触，其中肽文库具有大于10、大于100、大于500、1000、大于2000、大于5000、大于10000、大于106、大于107、大于108、大于109、大于10
10
的独特肽的多样性；分隔与所述肽文库的肽在一个隔室内结合的多个淋巴细胞中的淋巴细胞，其中肽包含独特肽标识符；并确定与分隔的淋巴细胞结合的每条肽的独特肽标识符。在一些实施方式中，肽文库用于肽文库评估，以在从头发现靶点后鉴定淋巴细胞
‑
肽对。淋巴细胞可以是t细胞、b细胞或nk细胞。在一些实施方式中，肽文库是抗原文库。多种肽可以是多个抗原。多种肽可以是如本文所述的多个pmhc多聚体。多种肽可以是如本文所述的多个sc
‑
pmhc。在一些实施方式中，多种肽中的肽包含如本文所述的标识符。淋巴细胞
‑
肽对
可以是tcr
‑
抗原对。淋巴细胞
‑
肽对可以是bcr
‑
抗原对。
136.在一些实施方式中，本文公开的组合物和方法可用于鉴定结合到受体、免疫受体、tcr、bcr或抗体的多种肽、配体、激动剂、拮抗剂、抗原或表位。在一些实施方式中，本文公开的组合物和方法可用于鉴定结合肽的多个受体、免疫受体、tcr、bcr或抗体。在一些实施方式中，本文公开的组合物和方法可用于鉴定结合多种肽、配体、激动剂、拮抗剂、抗原或表位的多个受体、免疫受体、tcr、bcr或抗体(例如，结合癌症文库，自身免疫文库，或病原体文库中抗原的多个tcr(图8))。
137.在一些实施方式中，本文公开的组合物和方法用于鉴定受体
‑
配体特异性。在一些实施方式中，本文公开的组合物和方法用于鉴定受体
‑
激动剂特异性。在一些实施方式中，本文公开的组合物和方法用于鉴定受体
‑
拮抗剂特异性。在一些实施方式中，本文公开的组合物和方法用于鉴定免疫受体
‑
抗原特异性(例如，tcr
‑
抗原特异性、bcr
‑
抗原特异性)。在一些实施方式中，本文公开的组合物和方法用于鉴定抗体
‑
抗原特异性。
138.在一些实施方式中，本发明的受体、免疫受体、tcr、bcr或抗体的身份通过测序确定(例如，对tcr、bcr或抗体的可变区、高变区或互补决定区(cdr)进行测序)。在一些实施方式中，针对tcrα链、tcrβ链、tcrγ链、tcrδ链、抗体重链或抗体轻链鉴定cdr1、cdr2或cdr3序列。
139.在一些实施方式中，肽、配体、激动剂、拮抗剂、抗原或表位的身份通过测序(例如，使用本文所公开的标识符)确定。
140.在一些实施方式中，本文公开的组合物和方法用于鉴定结合tcr的肽、抗原或表位。在一些实施方式中，本文公开的组合物和方法用于确定所鉴定的肽、抗原或表位中的突变如何影响tcr结合(图10)。在一些实施方式中，本文公开的组合物和方法用于鉴定所鉴定的肽、抗原或表位中导致tcr结合亲和力的增强或减弱的突变。在一些实施方式中，本文公开的组合物和方法用于鉴定所鉴定的肽、抗原或表位中维持tcr结合亲和力的突变。在一些实施方式中，本文公开的组合物和方法用于鉴定所鉴定的肽、抗原或表位中导致tcr结合亲和力的丧失的突变。
141.在一些实施方式中，本文公开的组合物和方法用于确定使用本文所述方法鉴定的受体、免疫受体、tcr、bcr或抗体中的突变如何改变肽、配体、激动剂、拮抗剂、抗原或表位的结合。在一些实施方式中，本文公开的组合物和方法用于鉴定所鉴定的受体、免疫受体、tcr、bcr或抗体中导致肽、配体、激动剂、拮抗剂、抗原或表位的结合减少或增加的突变。在一些实施方式中，本文公开的组合物和方法可用于鉴定所鉴定的受体、免疫受体、tcr、bcr或抗体中维持肽、配体、激动剂、拮抗剂、抗原或表位的结合的突变。在一些实施方式中，本文公开的组合物和方法可用于鉴定所鉴定的受体、免疫受体、tcr、bcr或抗体中导致肽、配体、激动剂、拮抗剂、抗原或表位结合的丧失的突变。
142.在一些实施方式中，本文公开的组合物和方法可用于在多种tcr群体中鉴定结合肽文库的给定肽、抗原或表位的tcr。然后，可将所鉴定的tcr与来自不同对象的样品或来自同一对象的不同样品(例如，来自不同组织的样品)的所鉴定的tcr进行比较。
143.在一些实施方式中，本文公开的方法在来自多个对象的t细胞上进行。在一些实施方式中，对来自多个对象的数据分析能鉴定由多个对象识别的抗原。在一些实施方式中，对来自多个对象的数据分析能鉴定由多个tcr克隆型识别的抗原。在一些实施方式中，对来自
多个对象的数据分析能鉴定由多个患者识别的抗原，例如，多个癌症患者、多个具有自身免疫状况的患者或具有针对病原体的保护性免疫的多个患者。在一些实施方式中，对来自多个对象的数据分析能鉴定包括不同hla型或等位基因的对象中识别的抗原。在一些实施方式中，对来自多个对象的数据分析允许鉴定显示趋集型抗原结合的不同高变或互补决定区序列。
144.在一些实施方式中，本文公开的方法使用多个文库来执行。在一些实施方式中，对来自多个文库的数据分析允许鉴定文库之间共有的反应性抗原，例如，呈现tcr亲和力的抗原，其存在于病原体的多个菌株、多个癌症类型、多个癌症患者、多个自身免疫疾病或多个自身免疫状况中。在一些实施方式中，对来自多个文库的数据分析允许在文库中鉴定不同的反应性抗原，例如存在于病原体菌株、癌症、病况或患者的子集中的抗原。
145.在一些实施方式中，使用本发明的肽文库调查的细胞进行基因表达分析(例如，rna
‑
seq、qpcr)。在一些实施方式中，对在本发明文库中被鉴定为具有对肽表现出特异性的受体的细胞进行基因表达分析(图11)。例如，确定要表达与病原体文库、癌症文库或自身免疫文库中的抗原结合的tcr的细胞进行基因表达分析。基因表达分析可以是全局性的，也可以是针对性的。分析表达的基因包括但不限于具有已知功能的基因、编码免疫效应分子(例如穿孔素、颗粒酶、细胞因子、趋化因子)、免疫检查点分子、促炎分子、抗炎分子、谱系标志物、整合素、选择素、淋巴细胞记忆标志物、死亡受体、胱冬酶、细胞周期检查点分子、酶、磷酸酶、激酶、脂肪酶和代谢基因的基因。在一些实施方式中，基因表达分析可与肽文库筛选同时进行。在一些实施方式中，基因表达分析可在肽文库筛选结果分析之后进行。在一些实施方式中，基因表达分析可在肽文库筛选结果分析之前进行。在一些实施方式中，基因表达分析允许对使用本文所述方法产生的肽受体配对中鉴定出的感兴趣的细胞进行免疫分型。
146.在一些实施方式中，可针对功能特性筛选肽文库。例如，包含多种肽的肽文库，其中多种肽包含10种以上、100种以上、500种以上、1000种以上、2000种以上、5000种以上、10000种以上、106种以上、107种以上、108种以上、109种以上或10
10
种以上的独特肽，可以在功能分析中进行筛选。在一些实施方式中，肽文库用于肽文库评估初始功能筛选后的功能特性或额外功能特性。例如，肽文库可与样品接触，然后测试功能特性的诱导。可根据肽诱导功能特性的能力确定肽文库子集。样品可以是生物样品。样品可以是细胞样品。样品可以是t细胞样品。样品可来自对象。对象可以是哺乳动物。对象可以是人。
147.本文所述的方法和组合物可用于筛选分析。例如，肽文库可包含如本文所述的与t细胞样品接触的多个pmhc多聚体。例如，肽库可包含如本文所述的与t细胞样品接触的多个sc
‑
pmhc。接触后，可针对肽文库的pmhc多聚体或sc
‑
pmhc确定t细胞的增殖、t细胞的细胞毒性、对t细胞的抑制、t细胞引起的抑制或t细胞的细胞因子产生(图13)。然后，可以诱导功能特性的pmhc多聚体或sc
‑
pmhc可以制成肽文库子集。例如，肽文库子集可包含pmhc多聚体或sc
‑
pmhc，其在与tcr结合时诱导t细胞增殖，在与tcr结合时诱导细胞毒性，在与tcr结合时抑制t细胞，在与tcr结合时t细胞引起的抑制，在与tcr结合时产生细胞因子，或其任何组合。例如，可通过染料稀释试验(例如，cfse稀释试验)或dna复制定量(例如，brdu掺入试验)来确定增殖。细胞毒性可通过例如基于死亡细胞释放细胞内酶(例如乳酸脱氢酶)的分析，染料排阻分析(例如碘化丙啶)，或细胞裂解标志物(例如颗粒酶、cd107a)的表达，通过流式细胞术或qpcr来确定。例如，可以通过elisa、多重免疫分析、胞内细胞因子染色、elispot、
western印迹法或qpcr来确定细胞因子的产生。例如，可通过将t细胞克隆与效应细胞和靶抗原共同孵育，测定增殖、细胞毒性、细胞因子产生、活化标志物的表达等来确定t细胞抑制。
148.在一些实施方式中，本文所述肽库可用于分离受体
‑
肽对。在一些实施方式中，分离受体细胞
‑
肽对的方法包括将多个受体与肽文库接触，其中肽文库具有大于10、大于100、大于500、大于1000、大于2000、大于5000、大于10000、大于106、大于107、大于108、大于109，或大于10
10
以上的独特肽的多样性；以及产生多个隔室，其中所述多个中的隔室包括与所述肽文库的肽结合的所述多个受体中的受体，从而在所述隔室中分离所述受体
‑
肽对。例如，多个受体中的受体可以是tcr、bcr、受体酪氨酸激酶(rtk)、g蛋白偶联受体(gpcr)、配体门控离子通道、细胞因子受体、趋化因子受体或生长因子受体等。在一些实施方式中，受体可以是可溶的。在一些实施方式中，受体可结合到表面。在一些实施方式中，肽文库是抗原文库。多种肽可以是多个抗原。多种肽可以是如本文所述的多个pmhc多聚体。多种肽可以是如本文所述的多个sc
‑
pmhc。受体
‑
肽对可以是tcr
‑
抗原对。受体
‑
肽对可以是bcr
‑
抗原对。在一些实施方式中，多种肽中的肽包含如本文所述的标识符。隔室可以是单独的空间，例如孔、平板、分离的边界、相漂移、容器、囊泡、细胞等。
149.本文所述的方法和组合物可用于鉴定受体
‑
肽对。在一些实施方式中，鉴定受体
‑
肽对的方法包括将多个受体与肽文库接触，其中肽文库具有大于10、大于100、大于500、1000、大于2000、大于5000、大于10000、大于106、大于107、大于108、大于109、大于10
10
的独特肽的多样性；分隔与所述肽文库的肽在一个隔室内结合的多个受体中的受体，其中肽包含独特肽标识符；并确定与分隔的受体结合的每条肽的独特肽标识符。例如，多个受体中的受体可以是tcr、bcr、受体酪氨酸激酶(rtk)、g蛋白偶联受体(gpcr)、配体门控离子通道、细胞因子受体、趋化因子受体或生长因子受体等。在一些实施方式中，受体可以是可溶的。在一些实施方式中，受体可结合到表面。在一些实施方式中，肽文库是抗原文库。多种肽可以是多个抗原。多种肽可以是如本文所述的多个pmhc多聚体。多种肽可以是如本文所述的多个sc
‑
pmhc。在一些实施方式中，多种肽中的肽包含如本文所述的标识符。受体
‑
肽对可以是tcr
‑
抗原对。受体
‑
肽对可以是bcr
‑
抗原对。
150.本发明提供了用于鉴定例如肽和细胞、肽和受体、肽和免疫受体、肽和tcr、肽和bcr、肽和抗体、配体和细胞、配体和受体、配体和免疫受体、配体和tcr、配体和bcr、配体和抗体、激动剂和细胞、激动剂和受体、激动剂和免疫受体、激动剂和tcr、激动剂和bcr、激动剂和抗体、拮抗剂和细胞、拮抗剂和受体、拮抗剂和免疫受体、拮抗剂和tcr、拮抗剂和bcr、拮抗剂和抗体、抗原和细胞、抗原和受体、抗原和免疫受体、抗原和tcr、抗原和bcr、抗原和抗体、表位和细胞、表位和受体、表位和免疫受体、表位和tcr、表位和bcr、表位和抗体之间配对的组合物和方法。可以在不同的对象(横向)、同一对象在不同的时间点(纵向)或两者中鉴定配对。鉴定的肽、受体或配对可与例如健康、疾病、早期疾病、中期疾病、晚期疾病、进展性疾病、治疗反应、缓解、保护性免疫、自身免疫等相关。在一些实施方式中，缺乏肽或缺乏受体特异性与例如健康、疾病、早期疾病、中期疾病、晚期疾病、进展性疾病、治疗反应、缓解、保护性免疫、自身免疫等相关。
151.在一些实施方式中，本文公开的组合物和方法用于鉴定与保护性免疫、非保护性免疫或自身免疫相关的抗原特异性t细胞效应子克隆。在一些实施方式中，本文公开的组合
物和方法用于鉴定抗原特异性t细胞效应子克隆，其表现出无反应性、衰竭、耐受性、自身免疫性、炎症性或抗炎性(例如，treg)。在一些实施方式中，本文所公开的组合物和方法用于鉴定表现出某些效应子或记忆特性(例如，未成熟、末端效应子、效应子记忆、中央记忆、驻留记忆、t
h
1、t
h
2、t
h
17、t
h
9、t
c
1、t
c
2、t
c
17、某些细胞因子的产生)的抗原特异性t细胞效应子克隆。
152.在一些实施方式中，使用本文公开的组合物和方法鉴定的tcr、bcr或抗体用作治疗干预的一部分。例如，将tcr序列、tcr可变区序列或cdr序列转染或转导到t细胞中以产生具有相同特异性的t细胞。t细胞可以扩增、极化为所需的效应子表型(例如t
h
1、t
c
1、treg)，并注入对象体内。在一些实施方式中，使用本文公开的组合物和方法鉴定的多个tcr、bcr或抗体用于寡克隆治疗。
153.在一些实施方式中，使用本文公开的方法鉴定的肽、配体、激动剂、拮抗剂、抗原或表位用作治疗干预的一部分。在一些实施方式中，肽、抗原或表位用于例如使用抗原呈递细胞、人工抗原呈递细胞、固定化肽或可溶性肽离体扩增细胞群。在一些实施方式中，将扩增的细胞注入患者体内。在一些实施方式中，扩增外周血淋巴细胞。在一些实施方式中，扩增肿瘤浸润性淋巴细胞(til)。在一些实施方式中，扩增t
h
1细胞。在一些实施方式中，扩增细胞毒性t淋巴细胞。在一些实施方式中，扩增调节性t细胞。
154.在一些实施方式中，本文公开的组合物和方法用于鉴定用于疫苗开发的抗原，例如亚单位疫苗、引发覆盖一系列保护性抗原的疫苗，或通用疫苗。
155.在一些实施方式中，本文公开的组合物和方法可用于诊断医学病况。在一些实施方式中，本文公开的组合物和方法用于指导临床决策制定，例如，治疗选择、预后因素的鉴定、治疗反应或疾病进展的监测，或预防措施的实施。
156.本发明的组合物和方法可包括捕获载体。在一些实施方式中，本发明的肽或核酸可逆或不可逆地连接到捕获载体。在一些实施方式中，本发明的肽或核酸化学连接到捕获载体。在一些实施方式中，本发明的肽或核酸共价连接到捕获载体。在一些实施方式中，本发明的肽或核酸非共价连接到捕获载体。在一些实施方式中，本发明的肽或核酸可通过带电相互作用(例如离子键)连接到捕获载体。在一些实施方式中，本发明的肽或核酸可通过氢键连接到捕获载体。在一些实施方式中，本发明的肽或核酸可通过极性键连接到捕获载体。在一些实施方式中，本发明的肽或核酸可通过生物素
‑
链霉亲和素或生物素
‑
亲和素相互作用连接到捕获载体。在一些实施方式中，本发明的肽或核酸可以例如通过化学处理或酶加工从捕获载体有条件地释放。
157.在一些实施方式中，捕获载体可以是固相表面。在一些实施方式中，捕获载体可以包含基质。在一些实施方式中，捕获载体可以包含纳米粒。在一些实施方式中，捕获载体可以包含珠。在一些实施方式中，捕获载体可以包含磁珠。在一些实施方式中，捕获载体可以包含水凝胶。在一些实施方式中，捕获载体可以是油包水乳液液滴的内表面。在一些实施方式中，捕获载体可以包含核酸分子。在一些实施方式中，捕获载体可以包含蛋白质。在一些实施方式中，捕获载体可包含抗体或其衍生物。在一些实施方式中，捕获载体可以包含凝胶。在一些实施方式中，捕获载体可以包含聚合物。在一些实施方式中，捕获探针可以带电。在一些实施方式中，捕获载体可以是荧光的，例如，用一种或多种荧光染料标记。
158.在一些实施方式中，本发明的肽或核酸可通过酶消化从捕获载体上切割。在一些
实施方式中，本发明的肽或核酸可通过限制性内切酶消化从捕获载体上切割。在一些实施方式中，本发明的肽或核酸可通过化学处理或消化从捕获载体上切割。实施例
159.以下实施例被包括以进一步描述本公开的一些方面，不应用于限制本发明的范围。实施例1：无偏9聚肽的设计
160.该实施例显示了包含特定长度肽的完整化学空间的9
‑
聚肽文库的鉴定。
161.该实施例与过去的工作不同，在过去的工作中，肽文库受到感兴趣的目标的知识的限制。这些文库的设计基于物理相互作用、目标/伴侣特征、生产限制或其他使文库宽度偏移的参数。因此，文库的呈现方式高度偏向。本实施例中的文库设计为包含可能来自由遗传密码编码的20个氨基酸的所有9
‑
聚肽。
162.该文库设计成包括来自20种已知氨基酸的9聚体的所有序列组合，例如5x10^11独特肽序列。实施例2：偏向hla
‑
a2的9聚肽化学空间调查
163.该实施例展示了9
‑
聚肽文库的鉴定，该肽文库包含特定长度抗原的完整化学空间，该抗原对与主要组织相容性复合物蛋白质(例如hla
‑
a2)的相互作用具有特异性。
164.如实施例1所示，该肽文库不受感兴趣靶点或相互作用抗原的知识的限制。hla
‑
a2有一个众所周知的结合基序，其具有2位和9位处的关键氨基酸，其可包括i、v或l。该文库设计用于包含在两个指定位置具有任意这些序列的所有9
‑
聚肽。得到的文库是实施例1中描述的9聚体文库的子集，因为该文库在2和9位处限制了9聚体的可变性。
165.该文库设计成包括来自20种已知氨基酸的9聚体的所有序列组合，其在2位和9位有约束。共有1x10^10个独特的9聚肽序列被鉴定为hla
‑
a2限制性。其他mhc复合物也有类似的限制。实施例3：人病毒组9聚肽文库
166.该实施例显示了包含特定长度的人病毒抗原的完整化学空间的9
‑
聚肽文库的鉴定。
167.如在线数据库uniprot所示，选择纳入肽文库的病毒为综合人类定殖病毒蛋白质组，并补充了uniprot蛋白质组程序搜索确定的毒株的分类群标识符。使用rest api从uniprot的蛋白质组标识符下载完整和部分蛋白质组。人工验证所选毒株的蛋白质组覆盖率。该文库随后进一步扩展，以包括来自现有正汉坦病毒的所有蛋白质组，以及高度可变分类群(hiv和流感)的额外多样性。
168.已鉴定的蛋白质组中每种蛋白质的每个9
‑
聚体都包含在该文库中。该文库也是实施例1中所述9聚体无偏文库的子集，因为该文库限制了9聚体的可变性是衍生自综合人病毒蛋白质组。
169.另一个文库被鉴定为限制于mhc复合蛋白之一的9
‑
聚体，如实施例2中所述。3x10^6种肽中共有1.5x10^5个独特的9聚肽被鉴定为hla
‑
a2限制性。实施例4：巨细胞病毒9聚肽文库
170.本实施例展示了包含巨细胞病毒(cmv)完整蛋白质组的9
‑
聚肽文库的鉴定。
171.该文库设计用于包括cmv蛋白质组中每种蛋白质的每个9
‑
聚体。产生的文库包括
7x10^4个独特的9聚肽。该文库也是实施例3中所述9聚人病毒文库的子集，因为该文库限制了9聚体的可变性衍生自cmv。
172.另一个文库被鉴定为限制于mhc复合蛋白之一的9
‑
聚体，如实施例2中所述。7x10^4种肽中共有4x10^3个独特的9聚肽被鉴定为hla
‑
a2限制性。实施例5：巨细胞病毒pp65蛋白的9聚肽文库
173.本实施例展示了包含巨细胞病毒(cmv)蛋白pp65的完整蛋白序列的9
‑
聚肽文库的鉴定。
174.来自pp65蛋白的每个9聚体都包含在该文库中。产生的文库包括571个独特的9聚肽。这也是实施例4中所述9
‑
聚体文库的子集，因为这些9
‑
聚体与pp65蛋白质相关。
175.另一个文库被鉴定为限制于mhc复合蛋白之一的9
‑
聚体，如实施例2中所述。571种肽中共有26个独特的9聚肽被鉴定为hla
‑
a2限制性。实施例6：9聚肽文库的表位特异性位置扫描突变
176.本实施例展示了9
‑
聚肽文库的鉴定，包括表位的完整突变扫描。
177.如hoppes等人在j immunol，2014，193中所述，为pp65蛋白的nlvpmvatv表位设计了一个具有单突变的9聚体库。产生的文库包括172个独特的9聚肽。这也是实施例1中所述9
‑
聚体文库的子集，因为这些9
‑
聚体在基于nlvpmvatv的9聚体整条序列上包括位点突变。
178.为pp65蛋白的nlvpmvatv表位设计了一个含有两个突变的9
‑
聚体的文库。产生的文库包括13,168个独特的9聚肽。
179.为pp65蛋白的nlvpmvatv表位设计了一个含有三个突变的9
‑
聚体的文库。产生的文库包括589,324个独特的9聚肽。
180.为pp65蛋白的nlvpmvatv表位设计了具有所有突变的9
‑
聚体库。产生的文库包括5.12x10
11
个独特的9聚肽。实施例7：9
‑
聚肽文库的产生
181.根据本领域已知的方法，或由商业供应商合成生产，或根据制造商的说明使用肽合成仪，产生任何先前实施例中描述的肽文库。实施例8：肽mhc文库的体外翻译
182.该实施例证明了蛋白质的无细胞合成(cfps)。
183.肽文库的无细胞合成(cfps)能够产生范围广泛的各种肽。通过cfps获得高产量需要使用细菌系统，其中翻译序列的第一个氨基酸是n
‑
甲酰甲硫氨酸(fmet)。该残基与甲硫氨酸的不同之处在于包含中性甲酰基团(hco)而不是带正电荷的氨基
‑
末端(nh
3
)。因此，每个肽文库变体将包含fmet。然而，mhc i类分子的肽结合沟的结构被设计为特异性容纳任何给定肽的带正电的氨基末端，并且不能充分契合具有fmet序列起始的肽。肽装载不成功会影响折叠，并会导致错误折叠、无功能的mhc，因为这两个过程是相互关联的。尽管细菌能使用内源性氨肽酶来切割fmet，但其去除可能不完全或被取消，这取决于序列中第二个氨基酸的身份。例如，甲硫氨酸氨肽酶在fmet和天冬氨酸之间的切除效率低。因此，cmv衍生肽，该系统中的模型肽，最终将在单链设计中生产为fmet
‑
nlvpmvatv；整个分子不正确折叠，且不会结合其同源t细胞受体。如果蛋白质是在由粗细胞提取物制成的细菌cfps系统中产生的，预期是这样的结果。此外，在文库的情况下，如果处理效率低，单独模板可能会产生有或没有fmet的肽，或两者的混合物。在一个仅由纯化的组分构成且完全缺乏甲硫氨酸氨肽酶
的重构cfps系统中，所有文库变体都将由fmet残基起始。
184.为了解决这个问题，构建体被工程改造为包括编码酶促切割结构域和文库多肽的基因。去除至少初始甲硫氨酸氨基酸可以成功折叠肽并将其装载到mhc蛋白上。此外，去除至少初始甲硫氨酸氨基酸允许肽库多样性的上限更大，例如，20
x
，其中x是肽的长度，而包含该残基会将文库多样性限制为20
(x
‑
1)
。
185.在该实施例中，在无细胞条件下合成肽。将所有cfps组分在冰上解冻并混合，然后移至相关温度以启动反应。加入试剂：40％(v/v)purexpress溶液a，30％(v/v)of purexpress溶液b(e6800l,新英格兰生物实验室公司(new england biolabs,inc.))，0.8u/μl rna酶抑制剂(10777019,赛默飞世尔科技公司(thermofischer scientific))，4％(v/v)每种二硫化物增强剂1和2(e6820l,新英格兰生物实验室公司)，0.004u/μl稀释于pbs的蛋白酶反应(英杰公司(invitrogen))，无核酸酶水和20ng/μl编码所需cfps产物的相应质粒dna的反应。试验了四种不同的cfps温度：20、25、30和37℃。在每个指定的时间点，取样并通过将试管置于冰上并添加edta至终浓度2mm来停止反应。
186.图2a显示酶切以增加肽多样性。泳道对1
‑
2、3
‑
4、5
‑
6、7
‑
8和9
‑
10分别表示在没有可切割部分的模板上、具有未添加蛋白酶的可切割部分的模板、具有反应完成后添加蛋白酶的可切割部分的模板、具有反应期间存在蛋白酶的可切割部分的模板上进行cfps反应以及缺乏模板的反应。在加入100mm dtt的还原条件下制备奇数泳道中的样品用于凝胶电泳。在室温下4小时后，通过将试管置于冰上来终止所有反应。将4u/反应的蛋白酶添加到样品3
‑
8中。在泳道5
‑
6上样的反应中，将管置于冰上后将蛋白酶与10mm edta一起加入，然后转移到室温3.5小时，然后再次置于冰上。
187.进行蛋白质印迹以确定总蛋白质产量。每个cfps样品与水、4x样品缓冲液和1m dtt混合，在95℃下煮沸5分钟，然后加载到10％sds
‑
page凝胶上。使用hrp
‑
抗
‑
flag抗体对样品进行印迹。
188.图2b显示了来自cfps反应的样品，其中包含有或没有可切割部分的多聚体和单体模板。用抗flag
‑
hrp抗体对样品进行印迹分析和检测。在室温下4小时后，通过将试管置于冰上来终止反应。实施例9：评估体外翻译蛋白质的3
‑
d结构
189.本实施例展示了cfps蛋白折叠成可识别的三维结构。
190.在本实施例中，通过抗体测试实施例8中生成的cfps蛋白质的构象识别。错误折叠或未折叠的蛋白质不被抗体识别。下面的实施例表明，在酶切割结构域切割后，cfps蛋白被折叠并被抗体构象识别。
191.通过elisa测量蛋白表达。用在100mm碳酸氢盐/碳酸盐包被缓冲液中稀释的抗链霉亲和素抗体(410501，白乐津公司(biolegend))包被板，并在4℃下孵育过夜。然后，通过用洗涤缓冲液(补充有0.05％吐温
‑
20的pbs)填充孔将板洗涤3次，并通过用封闭缓冲液(补充有2％(v/v)bsa的洗涤缓冲液)填充孔在室温下封闭2小时。然后用封闭缓冲液中每种cfps蛋白质的系列稀释液填充孔，然后在室温下孵育1小时。然后，用洗涤缓冲液洗涤板三次，并用封闭缓冲液中稀释的含有0.15μg/ml辣根过氧化物酶偶联的对蛋白质特异性的抗体室温下孵育1小时。
192.再洗涤三次后，通过向每个孔中加入3,3’,5,5’四甲基联苯胺底物显色，并通过加
入市售终止溶液终止反应。使用平板阅读器测量450nm处的吸光度。值是多次重复的均值。平板用粘性塑料覆盖并在所有孵育期间在旋转器上轻轻搅拌。每个样品的浓度是从阳性对照蛋白质的标准曲线中内推的。
193.图2c显示由cfps产生并经蛋白水解切割的肽折叠成可识别的三维结构。用elisa检测线性表位或构象表位，并计算正确折叠百分比。蛋白酶被添加到两个cfps反应中。该图表明通过构象表位抗体的识别证明了蛋白酶切割的肽或未切割的肽(包含fmet)是否为正确折叠。
194.图2d提供单链肽mhc(sc
‑
pmhc)多聚体与抗原特异性t细胞的结合。通过cfps和酶切割产生多聚体。将t细胞与多聚体孵育，然后用荧光检测抗体染色，并通过流式细胞术进行分析。富含cmv的t细胞(供体153,astarte3835fe18,目录号1049)被用于facs染色。96孔圆底微量滴定板的孔中充满t细胞，细胞用冰冷的facs缓冲液(d
‑
pbs、2mm edta和2％(v/v)胎牛血清)洗涤一次，以300g在4℃离心，去除上清液。然后，将相应孔用fc受体封闭液在4℃温和搅拌下封闭30分钟，用facs缓冲液洗涤，去除上清液。将facs缓冲液添加到补偿对照孔中。
195.在下一步中，将细胞与20nm阳性对照或取自实施例8的指定cfps反应的样品稀释液在4℃下孵育30分钟，然后用facs缓冲液洗涤一次。将在facs缓冲液中稀释的100nm检测抗体加入每个孔中，将板在4℃下避光孵育30分钟，然后用pbs洗涤两次，并用可固定活力染料apc
‑
efluor780(1:8000稀释，50μl/孔)染色，在室温下放置15分钟。然后将板用facs缓冲液洗涤两次，并用固定缓冲液pbs、3.7％甲醛(v/v)、2％fbs(v/v))固定。最后，将样品转到facs管中进行分析。实施例10：哺乳动物细胞中的肽文库产生
196.如实施例8所述，肽在哺乳动物细胞中通过无细胞蛋白质合成产生，或如实施例7所述通过合成产生。
197.对于哺乳动物表达，在哺乳动物表达载体中设计了一种编码cmv肽的构建体，其具有带或不带c
‑
末端his标记的c
‑
末端flag标记。根据厂商的建议，通过瞬时转染expi293f或expicho
‑
s细胞(生命技术(life technologies))表达肽。
198.用抗flag亲和层析(genscript)或ni亲和层析从细胞培养上清液中纯化肽。在亲水性树脂(ge生命科学)上进行尺寸排阻层析(sec)，该树脂在20mm hepes，150mm nacl，ph 7.2中预平衡。
199.或者，使用23mm磷酸钠，500mm氯化钠，500mm咪唑(ph 7.4)的柱缓冲液，通过ni亲和层析纯化肽，而无需sec纯化。
200.哺乳动物细胞中产生的肽通过280nm处的uv进行定量，而cfps产生的肽通过夹心elisa相对于标准蛋白质进行定量。实施例11：将肽标识符附接到文库肽
201.此实施例示范如何使用肽标识符标记文库肽。
202.通过实施例7所述的合成，或通过实施例8所述的无细胞蛋白质合成，或如实施例10所述在哺乳动物细胞中产生cmv肽。
203.如本文所述产生的肽用一个或多个肽标识符(例如，dna片段)标记。商业合成(integrated dna technologies)或pcr扩增每个肽标识符。通过混合50％v/v肽和50％v/v
肽标识符实现标记，并通过wester印迹法向上漂移进行确认。
204.图3显示具有一个或多个肽标识符的cmv肽的western印迹。底部箭头表示裸露肽。中间的箭头表示具有一个肽标识符的肽。上部的箭头表示具有两个肽标识符的肽。实施例12：hla
‑
a2的9聚肽文库
205.该实施例显示了包含对hla
‑
a2特异性的抗原一定长度的完整化学空间的9
‑
聚肽文库的鉴定。
206.这与过去的工作不同，在过去的工作中，通过物理相互作用鉴定感兴趣的特定目标，然后以高度偏向的方式呈现。hla
‑
a2有一个众所周知的结合基序，其具有2位和9位处的关键氨基酸，其可包括i、v或l。该实施例中的文库设计成仅包括在两个指定位置具有这些序列的所有9
‑
聚肽，得到1x10^10个肽。
207.构建体经过工程改造，以包括编码一个酶切结构域和1x10^10个独特9聚肽之一的基因。
208.根据实施例8中所述的类似方法生成肽文库。然后将肽文库装载到hla
‑
a2分子上以生成肽/mhc(pmhc)文库。
209.得到的pmhc文库可用于t细胞筛选，以确定抗原反应性t细胞。例如，见simon等，cancer immunol res，2014，2(12)：1230
‑
1244。实施例13：与细胞结合的肽文库
210.该实施例演示了检测与细胞结合的肽。
211.为了测试用肽标识符标记的肽的功能性，获得了肽特异性(cmv)和非肽特异性(hpv)t细胞(astarte biologics)。冷冻t细胞根据制造商的指南解冻。在4℃，用20％v/v fc
‑
block和0.1mg/ml鲑鱼精封闭细胞30分钟。然后将细胞与10％v/v肽标识符标记的肽在4℃的facs缓冲液(d
‑
pbs、2mm edta和2％(v/v)fbs)中孵育30分钟并洗涤。
212.细胞进一步分为两部分，其中使用流式细胞术检测肽结合，并通过qpcr检测标识符。对于基于蛋白质的检测，将细胞与2％v/v的抗flag抗体(biolegend)在4℃下孵育30分钟并洗涤。最后，将细胞固定在固定缓冲液(d
‑
pbs、3.7％甲醛和2％fbs)中，并在流式细胞仪上进行分析。
213.图4显示裸露肽、肽标识符标记的肽或阴性对照与肽特异性或非肽特异性t细胞的相对结合。与非肽特异性t细胞相比，裸露肽和肽标识符标记的肽显示与肽特异性t细胞结合。
214.对于基于肽标识符的检测，使用细胞裂解和rna稳定试剂盒(life technologies corporation)裂解细胞，并根据制造商的方案制备qpcr主混合物。使用管家基因特异性引物(如rpl13)将ct值对内部对照定标。使用δ
‑
δct法将相对值与来自不含肽的t细胞的相对值进行比较。
215.图5显示了对管家基因定标的肽标识符标记的肽的相对量。与肽标识符标记的肽一起孵育的肽特异性t细胞比与肽标识符标记的肽孵育的非肽特异性t细胞具有更多的信号，表明t细胞与肽之间存在特异性相互作用。此外，裸露肽对肽特异性和非肽特异性t细胞几乎没有可检测的信号。实施例14：tcr抗原特异性谱的鉴定如实施例6所述，设计包含nlvpmvatv表位的完整突变扫描的9
‑
聚体文库。如实施
例8所述合成包含9
‑
聚体的sc
‑
pmhc，并如实施例11所述附接标识符。该文库与多个t细胞一起孵育，并且t细胞被分选到单细胞隔室中。裂解t细胞，并从裂解的t细胞产生包含标识符的核酸。合并这些核酸并测序。读数中的标识符允许肽标识符与来自同一隔室的t细胞序列相匹配。通过从一个隔室中鉴定tcr序列(例如，可变区、高变区或cdr)并定量来自同一隔室中的肽标识符读数来确定tcr抗原特异性谱(图9a)。鉴定出导致tcr结合亲和力增加或降低的所鉴定tcr
‑
抗原对的抗原中的表位突变。实施例15：结合靶抗原的tcr的鉴定
216.如实施例14所述产生测序数据。对于测序的每个肽标识符，鉴定相应的tcr序列(例如，可变区、高变区或cdr)。鉴定出对肽文库的肽具有结合亲和力的多个tcr，并鉴定出对特定tcr具有结合亲和力的多种肽(图9b)。实施例16：不同tcr的汇集
217.使用实施例14和实施例15中描述的方法进行实验。t细胞是来源于不同对象的原代t细胞。鉴定对肽库的肽具有结合亲和力的来自不同个体的tcr(图9c)。实施例17：cmv抗原发现和疫苗设计
218.该实施例展示本文所公开的组合物和方法用于发现特定抗原和t细胞受体序列，以及疫苗和细胞疗法的后续设计。
219.计划接受造血干细胞移植(hsct)的对象被纳入研究。在hsct后第0天和第30天抽血。从血液中分离并培养t细胞。将培养的t细胞与本发明的sc
‑
pmhc文库(例如，包含源自具有位置扫描的cmv基因组、转录组或蛋白质组的肽的文库)一起孵育，并且将细胞分选入单细胞隔室。
220.裂解t细胞，并从裂解的t细胞产生包含标识符的核酸。合并这些核酸并测序。读数中的标识符允许肽标识符与来自同一隔室的t细胞序列相匹配。通过从一个隔室中鉴定tcr序列(例如，可变区、高变区或cdr)并定量来自同一隔室中的肽标识符读数来确定tcr抗原特异性谱。对于测序的每个肽标识符，鉴定相应的tcr序列。鉴定出对肽库的一种或多种肽显示结合亲和力的多个tcr，并鉴定出对一个或多个tcr显示结合亲和力的多种肽。对象分为cmv血清阳性或血清阴性，并根据cmv控制或再活化情况进行额外分类。比较来自对象的结果。已鉴定出与cmv控制相关的肽和tcr序列，并用于设计cmv疫苗和细胞疗法。实施例18：检查点抑制剂无应答者的疫苗和tcr细胞治疗
221.该实施例展示本文所公开的组合物和方法用于发现与检查点抑制剂治疗的反应相关的特定抗原和tcr序列，以及疫苗和细胞疗法的后续设计。
222.计划接受非小细胞肺癌(nsclc)或结直肠癌(crc)检查点抑制剂治疗的对象被纳入研究。在给予检查点抑制剂之前，以及给予检查点抑制剂之后对对象进行纵向活检，并留出实现治疗效果的时间。从活检中分离并培养t细胞。将培养的t细胞与本发明的sc
‑
pmhc文库(例如，包含源自nsclc/crc基因组、转录组或蛋白质组的肽的文库)一起孵育，并且将细胞分选入单细胞隔室。
223.裂解t细胞，并从裂解的t细胞产生包含标识符的核酸。合并这些核酸并测序。读数中的标识符允许肽标识符与来自同一隔室的t细胞序列相匹配。通过从一个隔室中鉴定tcr序列(例如，可变区、高变区或cdr)并定量来自同一隔室中的肽标识符读数来确定tcr抗原特异性谱。对于测序的每个肽标识符，鉴定相应的tcr序列。鉴定出对肽库的一种或多种肽
显示结合亲和力的多个tcr，并鉴定出对一个或多个tcr显示结合亲和力的多种肽。
224.可对对象进行纵向跟踪，并在使用检查点抑制剂的两个或多个治疗周期内对活检进行分析。
225.对象分为检查点抑制剂应答者和无应答者。比较来自对象的结果。鉴定了与检查点抑制剂治疗的成功响应相关的肽和tcr序列。已鉴定的肽和tcr序列可在第二个或随后的检查点抑制剂治疗周期中确认，或在随后纳入的对象中确认。已鉴定的肽和tcr序列用于设计癌症疫苗和细胞疗法。实施例19：通用流感疫苗
226.该实施例展示本文所公开的组合物和方法用于发现与对流感株的免疫应答相关的特定抗原和tcr序列，以及疫苗，包括通用流感疫苗的后续设计。
227.纳入对象以接种疫苗或感染各种流感株。对象感染流感，接种减毒活流感株或接种流感亚单位疫苗。
228.在第7天(感染/接种前)、感染/接种后第10天和感染/接种后第45天从对象获取纵向血样。
229.从血样中分离t细胞并培养。将培养的t细胞与本发明的sc
‑
pmhc文库(例如，包含源自具有位置扫描的流感基因组、转录组或蛋白质组的肽的文库)一起孵育，并且将细胞分选入单细胞隔室。
230.裂解t细胞，并从裂解的t细胞产生包含标识符的核酸。合并这些核酸并测序。读数中的标识符允许肽标识符与来自同一隔室的t细胞序列相匹配。通过从一个隔室中鉴定tcr序列(例如，可变区、高变区或cdr)并定量来自同一隔室中的肽标识符读数来确定tcr抗原特异性谱。对于测序的每个肽标识符，鉴定相应的tcr序列。鉴定出对肽文库的一种或多种肽显示结合亲和力的多个tcr，并鉴定出对一个或多个tcr显示结合亲和力的多种肽。通过分析感染/接种不同对象的肽
‑
mhc汇集物，可以鉴定保护性抗原。保护性抗原被连接到疫苗中，以提供广泛或普遍的保护，抵御多种流感病毒株。实施例20：糖尿病的treg治疗
231.该实施例展示本文所公开的组合物和方法用于发现与自身免疫有关的特异性抗原和tcr序列，以及耐受性细胞疗法的后续设计。
232.该研究的一部分利用了从0/1期1型糖尿病对象(以及匹配的健康对照组)采集的尸检组织样品。组织样品包括β岛、血液、脾脏、淋巴结和骨髓。在研究的第二部分中，纳入0/1期1型糖尿病的活对象(以及匹配的健康对照组)。定期从对象抽取血样。
233.从血液和组织样品中分离t细胞并培养。将培养的t细胞与本发明的sc
‑
pmhc文库(例如，包含源自健康或自身免疫人对象的基因组、转录组或蛋白组的肽的文库)一起孵育，并且将细胞分选入单细胞隔室。
234.裂解t细胞，并从裂解的t细胞产生包含标识符的核酸。合并这些核酸并测序。读数中的标识符允许肽标识符与来自同一隔室的t细胞序列相匹配。通过从一个隔室中鉴定tcr序列(例如，可变区、高变区或cdr)并定量来自同一隔室中的肽标识符读数来确定tcr抗原特异性谱。对于测序的每个肽标识符，鉴定相应的tcr序列。鉴定出对肽库的一种或多种肽显示结合亲和力的多个tcr，并鉴定出对一个或多个tcr显示结合亲和力的多种肽。
235.比较来自对象的结果。鉴定了与1型糖尿病相关的肽和tcr序列。鉴定的肽和tcr序
列用于耐受性细胞治疗，例如，离体扩增的寡克隆treg极化t细胞，其表达对自身免疫抗原特异性的tcr。实施例21：多孔水凝胶的制备
236.该实施例显示了可用于本发明组合物和方法中的多孔水凝胶的制备。水凝胶珠是通过在不同相对浓度下混合丙烯酰胺单体单元和双丙烯酰胺交联剂单元以及丙烯酸化寡核苷酸引物的混合物，使用微流体drop
‑
maker封装在液滴中，并孵育混合物直到交联完成而制备的。在该实施例中，预交联水性混合物包括10％tebst(tris
‑
edta缓冲盐水加吐温
‑
20)中的0.75％双丙烯酰胺、3％丙烯酰胺、5μm 5
’‑
丙烯酸化反向引物#1、25μm 3
’‑
封端(磷酸化)和5
’‑
丙烯酸化反向引物#2(图16)，0.5％过硫酸铵。引物可设计为包括用于酶切的序列，例如限制性内切酶靶向的序列，以允许部分引物从水凝胶中释放。可以使用任何合适的限制性内切酶。在该实施例中，反向引物1包括xhoi消化位点，反向引物2包括foki消化位点。混合并搅拌水性混合物的所有试剂。向混合物中添加1.5％的temed和1％的008
‑
fluorosurfactant，封装在液滴中，在室温下孵育1小时，然后转移到60℃的烘箱中过夜孵育，从而形成水凝胶。水凝胶珠用20％的1h,1h,2h,2h
‑
全氟
‑1‑
辛醇(pfo)洗涤一次，然后用tebst洗涤3次，然后用低te(1mm tris
‑
cl ph 7.5，0.1mm edta)洗涤3次。水凝胶珠4℃储存在tebst中直至使用。实施例22：水凝胶上全长抗原编码模板的pcr(pcr1)
237.本实施例显示了水凝胶上全长抗原编码模板的pcr。编码单链多聚肽
‑
mhc的线性dna模板在单模板条件下以液滴形式pcr扩增到水凝胶珠上，每滴最多得到一个dna模板。将实施例21中制备的1.4ml水凝胶珠与如下的pcr组分在2ml反应体积中混合：400μl q5反应缓冲液(新英格兰生物实验室(new england biolabs))、40μl 10mm dntp、40μl 25μm正向引物#1、40μl 1μm非丙烯酸化反向引物#1(图16)、40μl 0.1pg/ul线性dna模板(或模板混合物)、8μl 20％igepal和20μl q5 dna聚合酶(新英格兰生物实验室(new england biolabs))。以液滴形式包封混合物，并进行35轮pcr。通过添加等体积的100％全氟辛醇(pfo)使液滴裂解后，用10体积的低te洗涤水凝胶五次。用限制性内切酶(本实施例中为xhoi)在37℃下切割反向引物#1 1小时，消化水凝胶珠的等分(10μl每等份)，并在1.2％琼脂糖凝胶上跑胶，在水凝胶上定量扩增子的产量和质量。如图17a所示，全长抗原编码模板pcr扩增到水凝胶(“珠”)上。实施例23：标识符的pcr(pcr2)
238.该实施例显示了实施例21和22中产生的水凝胶上标识符的pcr扩增。可以使用本文公开的任何合适的标识符。在该实施例中，使用自身标识符，其对应于编码其识别的肽的核酸序列的全部或部分。pcr1后经洗涤的水凝胶珠用虾碱性磷酸酶(新英格兰生物实验室(new england biolabs))消化，以去除反向引物#2上的3'帽，然后用10体积的低te进一步洗涤5次。将300μl水凝胶珠与如下pcr组分在400μl反应体积中混合：80μl q5反应缓冲液(新英格兰生物实验室)、8μl 10mm dntp、8μl 25um 5
’‑
生物素化正向引物#2、1.6μl 20％igepal和4μl q5 dna聚合酶(新英格兰生物实验室)。以液滴形式包封混合物，并进行20轮pcr。通过添加等体积的100％pfo使液滴裂解后，用10体积的低te洗涤水凝胶五次。用切割反向引物2的限制性内切酶(本实施例中为foki)在37℃下消化水凝胶珠的小等分一小时，并在1.2％琼脂糖凝胶上跑胶，在水凝胶上确定扩增子的产量和质量。如图17b所示，将标识
符pcr扩增到水凝胶上(“自识别核酸”)。分析了三种独立的珠制备物：一个具有对应于cmv肽的模板，一个具有hpv肽，一个具有编码两种肽的模板混合物(混合物)。pcr2产生的自识别核酸片段显示为约100bp。实施例24：单链多聚肽
‑
mhc的体外转录/翻译(ivtt)
239.该实施例显示单链肽
‑
mhc可在体外转录和翻译，例如，使用实施例21和22中产生的水凝胶上抗原编码dna模板。120μl水凝胶珠与240μl ivtt主混合液共同包封在液滴中，包括120μl purexpress溶液a(新英格兰生物实验室)、90μl purexpress溶液b(neb)、6μl rna酶out(invitrogen)、12μl的每种二硫键增强剂#1和#2(neb)以及12μl ulp1蛋白酶(invitrogen)。液滴在22℃下无振摇培养20小时。将d
‑
生物素添加到ivtt反应中，使其最终浓度达到500μm，然后添加等体积的100％pfo，破碎液滴。用10体积的pbs加2％的bsa洗涤水凝胶珠五次。一等份的水凝胶在室温下用1:10稀释的alexa
‑
488标记的抗β
‑2‑
微球蛋白(b2m)抗体(r&d系统)在pbs 2％bsa中免疫荧光染色1小时，然后在pbs 2％bsa中进行5次10倍洗涤，并通过共聚焦显微镜(imagexpress micro，molecular devices，图18a)显影。在21％的珠中观察到染色，证实了pcr1中的单模板条件，和单链肽
‑
mhc的成功产生。实施例25：标识符标记的单链多聚肽
‑
mhc从水凝胶的释放与分析
240.该实施例展示了折叠的标识符标记的单链肽
‑
mhc(sc
‑
pmhc)多聚体从水凝胶中释放。使用实施例21、22、23和24的方法生成sc
‑
pmhc。sc
‑
pmhc多聚体通过dna标识符与水凝胶结合。通过dna与水凝胶结合的sc
‑
pmhc可通过任何合适的核酸酶消化从水凝胶中释放。在该实施例中，在cutsmart缓冲液(neb)中用benzonase核酸酶(一种非特异性核酸内切酶)或foki(一种限制性内切酶)消化dna，在22℃孵育20小时。elisa检测消化释放的蛋白质，以确定产量和折叠。采用1:1333稀释的hrp偶联的抗b2m(biolegend)或构象敏感抗hla抗体(santa cruz)，以hek生产的sc
‑
pmhc为标准品进行检测。elisa证实了高度折叠的sc
‑
pmhc多聚体的释放(图18b)。还通过western印迹进行检测，在3
‑
8％的tris醋酸盐凝胶上进行电泳，用硝化纤维素进行印迹，用pbs加3％bsa封闭，并用1μg/ml大鼠抗flag(biolegend)一抗和1:1000偶联alexa647的抗大鼠igg二抗(invitrogen)检测，测试了消化释放的蛋白质。foki释放的sc
‑
pmhc多聚体相对于benzonase核酸酶释放的sc
‑
pmhc或相对于来自体外转录/翻译上清液的上清液的缓慢迁移证明了使用核酸标识符成功标记sc
‑
pmhc(图18c)。实施例26：水凝胶/液滴中单链多聚肽
‑
mhc的功能分析
241.该实施例证明通过本发明方法产生的sc
‑
pmhc特异性结合关联t细胞。通过流式细胞术和单细胞包封/测序，证实如实施例25所述从水凝胶释放的sc
‑
pmhc与关联肽扩增的t细胞特异性结合。
242.对于流动，用hpv肽或cmv肽扩增的105个供体t细胞用大量溶液或如上所述的液滴中由cmv肽编码模板产生的sc
‑
pmhc多聚体染色。与hek细胞中产生的多聚体cmv或hpv pmhc相对应的对照蛋白也用于染色。所有pmhc均在pbs加10％fbs中稀释，并使用抗flag
‑
apc(biolegend)作为二抗。如图19所示，在水凝胶/液滴中产生的cmv sc
‑
pmhc多聚体对cmv扩增的t细胞的染色与大量溶液或hek细胞产生的类似。尽管hpv扩增的t细胞对hek产生的hpv
‑
pmhc多聚体的染色接近100％阳性，但这些细胞上液滴产生的cmv pmhc多聚体没有明显的染色，证实了特异性。
243.对于单细胞测序，使用t7核酸外切酶(neb)处理液滴中产生的具有自识别核酸标
识符标记(如实施例21
‑
25所述)的cmv
‑
sc
‑
pmhc多聚体。然后将cmv
‑
sc
‑
pmhc多聚体与hek产生的hpv
‑
pmhc多聚体混合，用不同的标识符标记。该抗原混合物用于对hpv和cmv扩增的t细胞的混合物进行染色，随后对其进行单细胞测序。单细胞测序显示水凝胶/液滴产生的cmv sc
‑
pmhc多聚体具有极好的特异性。如图20所示，与液滴产生的cmv pmhc相对应的umi与用cmv肽扩增的t细胞结合，而不与用hpv扩增的t细胞结合。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种包含蛋白纤维的乳酸菌发酵剂及其制备方法与流程

肽文库及其使用方法与流程

相关文献

最热文献