一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于增加地衣芽孢杆菌中蛋白质生产的组合物和方法与流程

2022-06-16 07:45:47 来源:中国专利 TAG:
1.本公开总体上涉及细菌学、微生物学、遗传学、分子生物学、酶学、工业蛋白质生产等领域。更特别地,本公开涉及用于获得具有增加的蛋白质生产能力的地衣芽孢杆菌菌株的组合物和方法。2.相关申请的交叉引用3.本技术要求于2019年8月14日提交的美国临时专利申请号62/886,571的优先权,将其通过援引以其全文特此并入。4.序列表的引用5.命名为“nb41514-wo-pct_sequencelisting.txt”的文本文件序列表的电子提交的内容创建于2020年6月23日,并且大小为316kb,将其通过援引以其全文特此并入。
背景技术
::6.革兰氏阳性细菌如枯草芽孢杆菌(bacillussubtilis)、地衣芽孢杆菌和解淀粉芽孢杆菌(bacillusamyloliquefaciens)由于其优异的发酵特性和高产率(例如,高达25克/升培养物;vandijl和hecker,2013年),经常被用作微生物工厂,用于产生工业相关蛋白质。例如,枯草芽孢杆菌因其产生食品、纺织品、洗衣、医疗器械清洁、制药工业等所必需的α-淀粉酶(jensen等人,2000;raul等人,2014)和蛋白酶(brode等人,1996)而为人熟知(westers等人,2004)。由于这些非致病性革兰氏阳性细菌产生完全不含毒性副产物(例如脂多糖;lps,也称为内毒素)的蛋白质,因此它们已经获得了欧洲食品安全局的“安全资格认定”(qps)状态,并且其许多产品获得了美国食品和药品管理局的“通常认为安全”(gras)状态(olempska-beer等人,2006;earl等人,2008;caspers等人,2010)。7.因此,微生物宿主细胞中蛋白质(例如,酶、抗体、受体等)的产生在生物
技术领域
:中是特别有意义的。同样,用于产生和分泌一种或多种目的蛋白的芽孢杆菌属宿主细胞的优化具有高度相关性,特别是在如下工业生物技术环境中,其中当蛋白质以大的工业产量生产时该蛋白质产率的微小改善具有重大意义。更特别地,地衣芽孢杆菌(bacilluslicheniformis)是具有高工业重要性的芽孢杆菌属物种宿主细胞,因此,对于构建新的和改善的地衣芽孢杆菌生产菌株,高度希望具有修饰和工程化地衣芽孢杆菌宿主细胞以获得增强的/增加的蛋白质表达/生产的能力。因此,本公开涉及对于获得和构建具有增加的蛋白质生产能力的地衣芽孢杆菌细胞(例如,蛋白质生产宿主细胞)的高度希望和未满足的需求。技术实现要素:8.本公开总体上涉及用于构建和获得具有增加的蛋白质生产表型的地衣芽孢杆菌细胞(菌株)的组合物和方法。更特别地,某些实施例涉及衍生自包含天然rghr(染色体)基因座的亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,其中这些经修饰的细胞包含rghr基因座的选自由以下组成的组的至少一个修饰:(i)经修饰的rghr1基因,(ii)经修饰的rghr2基因,(iii)经修饰的rghr1基因和经修饰的rghr2基因,以及(iv)经修饰的rghr1基因、经修饰的rghr2基因、经修饰的yvzc基因和经修饰的bli3644基因,其中该经修饰的细胞生产增加量的目的蛋白(相对于在相同条件下培养时的亲本细胞)。9.在某些实施例中,经修饰的rghr1基因包含使编码的rghr1蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的rghr1基因包含使rghr1基因的5′‑utr序列和/或3′‑utr序列突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的rghr1基因不表达或生产该编码的rghr1蛋白。10.在某些实施例中,经修饰的rghr2基因包含使编码的rghr2蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的rghr2基因包含使rghr2基因的5′‑utr序列和/或3′‑utr突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的rghr2基因不表达或生产该编码的rghr2蛋白。11.在某些实施例中,经修饰的yvzc基因包含使编码的yvzc蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的yvzc基因包含使yvzc基因的5′‑utr序列和/或3′‑utr突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的yvzc基因不表达或生产编码的yvzc蛋白。12.在某些实施例中,经修饰的bli3644基因包含使编码的bli3644蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的bli3644基因包含使bli3644基因的5′‑utr序列和/或3′‑utr突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的bli3644基因不表达或生产编码的bli3644蛋白。13.因此,在某些实施例中,包含rghr基因座的至少一个遗传修饰的经修饰的地衣芽孢杆菌细胞包含经修饰的rghr1基因。在其他实施例中,包含rghr基因座的至少一个遗传修饰的经修饰的地衣芽孢杆菌细胞包含经修饰的rghr2基因。在其他实施例中,包含rghr基因座的至少一个遗传修饰的经修饰的地衣芽孢杆菌细胞包含经修饰的rghr1基因和经修饰的rghr2基因。在其他实施例中,包含rghr基因座的至少一个遗传修饰的经修饰的地衣芽孢杆菌细胞包含经修饰的rghr1基因、经修饰的rghr2基因、经修饰的yvzc基因和经修饰的bli3644基因。在某些其他实施例中,经修饰的地衣芽孢杆菌细胞包含rghr基因座缺失。在某些其他实施例中,经修饰的细胞生产减少量的红色色素(相对于在相同条件下培养时的亲本细胞)。在又其他实施例中,地衣芽孢杆菌细胞包含编码目的蛋白的一个或多个表达盒。在某些实施例中,该一个或多个表达盒编码淀粉酶蛋白。14.在其他实施例中,本公开涉及衍生自包含天然rghr2基因的亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,其中这些经修饰的细胞包含使rghr2基因突变、破坏、部分缺失、或完全缺失的至少一个遗传修饰,其中这些经修饰的细胞生产减少量的红色色素(相对于在相同条件下培养时的亲本细胞)。在某些实施例中,这些细胞包含编码目的蛋白的一个或多个表达盒。在特定的实施例中,该一个或多个表达盒编码淀粉酶蛋白。在某些其他实施例中,经修饰的细胞生产增加量的目的蛋白(相对于在相同条件下培养时的亲本细胞)。15.因此,本公开的某些其他实施例涉及用于在经修饰的地衣芽孢杆菌细胞中产生增加量的目的蛋白的方法,这些方法包括:(a)获得地衣芽孢杆菌细胞,并且遗传修饰rghr基因座的选自由以下组成的组的至少一个基因:(i)rghr1基因,(ii)rghr2基因,(iii)yvzc基因和(iv)bli3644基因,或其组合,以及(b)在适合生产目的蛋白的条件下,发酵步骤(a)的经修饰的细胞,其中该经修饰的细胞产生增加量的该目的蛋白(相对于在相同条件下培养时的亲本细胞)。16.在该方法的某些实施例中,经修饰的rghr1基因包含使编码的rghr1蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的rghr1基因包含使rghr1基因的5′‑utr序列和/或3′‑utr序列突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的rghr1基因不表达编码的rghr1蛋白。17.在其他实施例中,经修饰的rghr2基因包含使编码的rghr2蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的rghr2基因包含使rghr2基因的5′‑utr序列和/或3′‑utr突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的rghr2基因不表达编码的rghr2蛋白。18.在另一实施例中,经修饰的yvzc基因包含使编码的yvzc蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的yvzc基因包含使yvzc基因的5′‑utr序列和/或3′‑utr突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的yvzc基因不表达编码的yvzc蛋白。19.在该方法的某些其他实施例中,经修饰的bli3644基因包含使编码的bli3644蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰,和/或经修饰的bli3644基因包含使bli3644基因的5′‑utr序列和/或3′‑utr突变、破坏、部分缺失、或完全缺失的遗传修饰,其中该经修饰的bli3644基因不表达编码的bli3644蛋白。20.在该方法的另一个实施例中,这些细胞包含编码目的蛋白的一个或多个表达盒。在某些实施例中,该一个或多个表达盒编码淀粉酶蛋白。在该方法的另一个实施例中,经修饰的地衣芽孢杆菌细胞生产减少量的红色色素。21.在其他实施例中,本公开涉及用于在经修饰的地衣芽孢杆菌细胞中生产目的蛋白的方法,其中这些经修饰的细胞在发酵期间生产减少量的红色色素,该方法包括(a)获得地衣芽孢杆菌细胞,并且遗传修饰其中的rghr2基因,以及(b)在适合生产目的蛋白的条件下,发酵该经修饰的细胞,其中该经修饰的细胞生产减少的红色色素(相对于在相同条件下培养时的亲本细胞)。在某些实施例中,经修饰的rghr2基因包含使编码的rghr2蛋白突变、破坏、部分缺失、或完全缺失的遗传修饰。在其他实施例中,这些细胞包含编码目的蛋白的一个或多个表达盒。在某些实施例中,该一个或多个表达盒编码淀粉酶蛋白。在其他实施例中,经修饰的细胞产生增加量的目的蛋白(相对于在相同条件下培养时的亲本细胞)。附图说明22.图1是地衣芽孢杆菌染色体“rghr基因座”的示意图,其中野生型rghr基因座(图1a)包含rghr1基因(白色箭头)、rghr2基因(黑色箭头)、yvzc基因(灰色箭头)和bli3644基因(线条填充的箭头)。如下文实例部分中进一步描述的,图1b示出了经修饰的rghr基因座,该基因座包含rghr2终止等位基因(白色箭头,示出了指示终止密码子的三个(3)星号),天然rghr1基因(黑色箭头),天然yvzc基因(灰色箭头)和天然bli3644基因(线条填充的箭头);图1c示出了经修饰的rghr基因座,该基因座包含rghr1等位基因缺失(δrghr1),天然rghr2基因(白色箭头),天然yvzc基因(灰色箭头)和天然bli3644基因(线条填充的箭头);图1d示出了rghr基因座,该基因座包含rghr2等位基因缺失(δrghr2),天然rghr1基因(黑色箭头),天然yvzc基因(灰色箭头)和天然bli3644基因(线条填充的箭头);图1e示出了经修饰的rghr基因座,该基因座包含rghr2等位基因缺失(δrghr2),rghr1等位基因缺失(δrghr1),天然yvzc基因(灰色箭头)和天然bli3644基因(线条填充的箭头);并且图1f示出了经修饰的(空)rghr基因座,该基因座包含以下的缺失:rghr2、rghr1、yvzc和bli3644等位基因(δrghr2/δrghr1/δyvzc/δ3644)。23.生物学序列简述24.seqidno:1是化脓链球菌(s.pyogenes)cas9蛋白的氨基酸序列。25.seqidno:2是编码seqidno:1的cas9蛋白的核酸序列,其中该核酸序列已经针对在芽孢杆菌属宿主菌株中的表达进行了密码子优化。26.seqidno:3是氨基酸n-末端核定位序列(nls)。27.seqidno:4是氨基酸c-末端核定位序列(nls)。28.seqidno:5是十组氨酸(his)标签氨基酸序列。29.seqidno:6是枯草芽孢杆菌apre启动子核酸序列。30.seqidno:7是合成的终止子核酸序列。31.seqidno:8是正向引物核酸序列。32.seqidno:9是反向引物核酸序列。33.seqidno:10是pkb320主链核酸序列。34.seqidno:11是质粒pkb320的核酸序列。35.seqidno:12是正向引物核酸序列。36.seqidno:13是反向引物核酸序列。37.seqidno:14是反向测序引物。38.seqidno:15是反向测序引物。39.seqidno:16是正向测序引物。40.seqidno:17是正向测序引物。41.seqidno:18是正向测序引物。42.seqidno:19是正向测序引物。43.seqidno:20是正向测序引物。44.seqidno:21是正向测序引物。45.seqidno:22是正向测序引物。46.seqidno:23是反向测序引物。47.seqidno:24是正向测序引物。48.seqidno:25是质粒prf694的核酸序列。49.seqidno:26是质粒prf801的核酸序列。50.seqidno:27是质粒prf806的核酸序列。51.seqidno:28是地衣芽孢杆菌靶位点1(ts1)核酸序列。52.seqidno:29是地衣芽孢杆菌靶位点2(ts2)核酸序列。53.seqidno:30是地衣芽孢杆菌sera可读框核酸序列。54.seqidno:31是地衣芽孢杆菌靶位点1(ts1)pam核酸序列。55.seqidno:32是编码地衣芽孢杆菌可变靶向(vt)位点1的核酸序列。56.seqidno:33是编码cas9核酸内切酶识别(cer)结构域的核酸序列。57.seqidno:34是指导rna(grna)核酸序列靶向位点1。58.seqidno:35是spac启动子核酸序列。59.seqidno:36是t0终止子核酸序列。60.seqidno:37是地衣芽孢杆菌sera1同源臂1核酸序列。61.seqidno:38是合成的sera1同源臂1正向引物序列。62.seqidno:39是合成的sera1同源臂1反向引物序列。63.seqidno:40是地衣芽孢杆菌sera1同源臂2核酸序列。64.seqidno:41是合成的sera1同源臂2正向引物序列。65.seqidno:42是合成的sera1同源臂2反向引物序列。66.seqidno:43是编码靶位点1(ts1)grna的表达盒。67.seqidno:44是合成的sera1缺失编辑模板。68.seqidno:45是地衣芽孢杆菌rghr1可读框核酸序列。69.seqidno:46是靶向位点2(ts2)pam核酸序列。70.seqidno:47是编码可变靶向(vt)位点2的核酸序列。71.seqidno:48是grna核酸序列靶向位点2。72.seqidno:49是地衣芽孢杆菌rghr1同源臂1核酸序列。73.seqidno:50是合成的rghr1同源臂1正向序列。74.seqidno:51是合成的rghr1同源臂1反向序列。75.seqidno:52是地衣芽孢杆菌rghr1同源臂2核酸序列。76.seqidno:53是合成的rghr1同源臂2正向序列。77.seqidno:54是合成的rghr1同源臂2反向序列。78.seqidno:55是编码靶位点2(ts2)grna的合成核酸表达盒。79.seqidno:56是合成的rghr1缺失编辑模板序列。80.seqidno:57是cas9(y155h)变体蛋白的氨基酸序列。81.seqidno:58是cas9(y155h)正向引物序列。82.seqidno:59是cas9(y155h)反向引物序列。83.seqidno:60是质粒prf827的核酸序列。84.seqidno:61是编码变体cas9(y155h)蛋白的表达盒。85.seqidno:62是质粒prf856的核酸序列。86.seqidno:63是合成的cas9(y155h)片段核酸序列。87.seqidno:64是cas9(y155h)片段正向引物序列。88.seqidno:65是cas9(y155h)片段反向引物序列。89.seqidno:66是质粒prf694的核酸序列。90.seqidno:67是prf694片段核酸序列。91.seqidno:68是prf694片段正向引物序列。92.seqidno:69是prf694片段反向引物序列。93.seqidno:70是质粒prf869的核酸序列。94.seqidno:71是地衣芽孢杆菌rghr2可读框核酸序列。95.seqidno:72是合成的rghr2终止片段核酸序列。96.seqidno:73是合成的rghr2终止编辑模板序列。97.seqidno:74是rghr2grna表达盒。98.seqidno:75是合成的片段正向引物。99.seqidno:76是合成的片段反向引物。100.seqidno:77是prf862主链的核酸序列。101.seqidno:78是prf862主链正向引物。102.seqidno:79是prf862主链反向引物。103.seqidno:80是质粒prf874的核酸序列。104.seqidno:81是prf874靶位点和pam核酸序列。105.seqidno:82是prf874编辑模板。106.seqidno:83是质粒prf879的核酸序列。107.seqidno:84是prf879靶位点和pam核酸序列。108.seqidno:85是prf879编辑模板。109.seqidno:86是质粒prf899的核酸序列。110.seqidno:87是prf899和prf901靶位点和pam核酸序列。111.seqidno:88是prf899编辑模板。112.seqidno:89是质粒prf901的核酸序列。113.seqidno:90是prf901编辑模板。114.seqidno:91是野生型rghr2基因座核酸序列。115.seqidno:92是lysa可读框核酸序列。116.seqidno:93是sera_α-淀粉酶表达盒。117.seqidno:94是合成的p3启动子核酸序列。118.seqidno:95是apre5'-非翻译区(utr)核酸序列。119.seqidno:96是编码amyl信号序列的核酸序列。120.seqidno:97是编码α-淀粉酶蛋白的核酸序列。121.seqidno:98是编码amyl终止子序列的核酸序列。122.seqidno:99是合成的amyl_α-淀粉酶表达盒。123.seqidno:100是地衣芽孢杆菌amyl启动子序列。124.seqidno:101是pbl.comk核酸序列。125.seqidno:102是编码壮观霉素标记的核酸序列。126.seqidno:103是地衣芽孢杆菌xylr可读框。127.seqidno:104是地衣芽孢杆菌xyla启动子序列。128.seqidno:105是编码comk蛋白的核酸序列。129.seqidno:106是正向引物序列。130.seqidno:107是反向引物序列。131.seqidno:108是地衣芽孢杆菌rghr2靶区域核酸序列。132.seqidno:109是合成的rghr2终止核酸序列。133.seqidno:110是正向引物序列。134.seqidno:111是正向引物序列。135.seqidno:112是反向引物序列。136.seqidno:113是地衣芽孢杆菌天然rghr1序列。137.seqidno:114是rghr1缺失pcr产物。138.seqidno:115是正向引物序列。139.seqidno:116是反向引物序列。140.seqidno:117是地衣芽孢杆菌天然rghr2pcr产物。141.seqidno:118是rghr2缺失pcr产物。142.seqidno:119是正向引物序列。143.seqidno:120是反向引物序列。144.seqidno:121是地衣芽孢杆菌天然rghr1rghr2pcr产物。145.seqidno:122是rghr1rghr2缺失pcr产物。146.seqidno:123是正向引物序列。147.seqidno:124是反向引物序列。148.seqidno:125是地衣芽孢杆菌天然基因座pcr产物。149.seqidno:126是合成的基因座缺失pcr产物。150.seqidno:127是地衣芽孢杆菌ldn143菌株rghr2基因座核酸序列。151.seqidno:128是地衣芽孢杆菌bf314菌株rghr2基因座核酸序列。152.seqidno:129是地衣芽孢杆菌bf324菌株rghr2基因座核酸序列。153.seqidno:130是地衣芽孢杆菌bf377菌株rghr2基因座核酸序列。154.seqidno:131是地衣芽孢杆菌bf389菌株rghr2基因座核酸序列。155.seqidno:132是地衣芽孢杆菌bf391菌株rghr2基因座核酸序列。具体实施方式156.本公开总体上涉及用于构建和获得具有增加的蛋白质生产表型的地衣芽孢杆菌细胞(菌株)的组合物和方法。因此,某些实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞。在某些实施例中,经修饰的地衣芽孢杆菌细胞包含经修饰的rghr基因座,其中衍生出它的亲本细胞包含野生型rghr基因座。在某些实施例中,具有经修饰的rghr基因座的经修饰的地衣芽孢杆菌细胞包含增加的蛋白质生产力表型。在某些其他实施例中,具有经修饰的rghr基因座的经修饰的地衣芽孢杆菌细胞生产减少量的红色色素。在某些其他实施例中,经修饰的地衣芽孢杆菌细胞包含增加的蛋白质生产力表型并且生产减少量的红色色素。157.i.定义158.鉴于本文所述的本公开的经修饰的芽孢杆菌属细胞及其方法,定义了以下术语和短语。本文未定义的术语应当符合本领域中所使用的常规含义。159.除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。虽然类似于或等同于本文描述的那些的任何方法和材料也可以用于本发明的组合物和方法的实践或测试中,但现在将对代表性示例方法和材料进行描述。本文中引用的所有公开物和专利均通过援引以其全文并入。160.还需注意的是,权利要求书可以经撰写而排除任何任选的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定的前提基础(或其条件)。161.如将对于本领域技术人员显而易见的是,在阅读本公开时,本文描述和展示的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明的组合物和方法的范围或精神的情况下容易地与任何其他几个实施例的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。162.如本文使用的,“宿主细胞”是指具有作为新引入的dna序列的宿主或表达媒介物的能力的细胞。因此,在本公开的某些实施例中,宿主细胞是例如芽孢杆菌属物种细胞或大肠杆菌细胞。163.如本文使用的,“经修饰的细胞”是指包含至少一个遗传修饰的重组(宿主)细胞,该遗传修饰不存在于衍生出经修饰的细胞的“亲本”宿主细胞中。164.例如,在某些实施例中,“亲本”细胞被改变(例如,经由引入亲本细胞的一个或多个遗传修饰)以产生其“经修饰的”(子代)细胞。165.在某些实施例中,亲本细胞可以被称为“对照细胞”,特别是当与“经修饰的”的芽孢杆菌属物种(子代)细胞进行比较或相对于“经修饰的”的芽孢杆菌属物种(子代)细胞时。如本文使用的,当将“未经修饰的”(亲本)细胞(例如,对照细胞)中的目的蛋白(poi)的表达和/或生产与“经修饰的”(子代)细胞中的相同poi的表达和/生产相比较时,应该理解的是,在相同的条件(例如,相同的条件如培养基、温度、ph等)下生长/培养/发酵“经修饰的”和“未经修饰的”细胞。166.如本文使用的,“芽孢杆菌属”或“芽孢杆菌属物种”细胞包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于:枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌(b.lentus)、短芽孢杆菌(b.brevis)、嗜热脂肪芽孢杆菌(b.stearothermophilus)、嗜碱芽孢杆菌(b.alkalophilus)、解淀粉芽孢杆菌、克劳氏芽孢杆菌(b.clausii)、耐盐芽孢杆菌(b.halodurans)、巨大芽孢杆菌(b.megaterium)、凝结芽孢杆菌(b.coagulans)、环状芽孢杆菌(b.circulans)、灿烂芽孢杆菌(b.lautus)、和苏云金芽孢杆菌(b.thuringiensis)。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于:例如嗜热脂肪芽孢杆菌(现在称为“嗜热脂肪土芽孢杆菌(geobacillusstearothermophilus)”)的生物体。167.如本文使用的,术语“野生型”和“天然”可互换地使用,并且是指如自然界中发现的基因、启动子、蛋白质、蛋白质混合物、细胞或菌株。168.如本文使用的,“天然地衣芽孢杆菌rghr2基因”包含编码“天然rghr2蛋白”的核苷酸序列,并且“变体-18-bp地衣芽孢杆菌rghr2基因”包含编码“变体rghr2蛋白”(rghr2dup)的核苷酸序列,见描述于pct公开号wo2018/156705(该文献通过援引以其全文并入本文)中。例如,变体-18-bprghr2基因(在下文中为“rghr2dup”)包含编码变体rghr2蛋白(在下文中为“rghr2dup”)的核苷酸序列,该变体rghr2dup包含六(6)氨基酸残基重复/重复序列(即残基“aaasir”被重复)。169.如本文使用的,“天然rghr1基因”编码天然rghr1蛋白,“天然rghr2基因”编码天然rghr2蛋白,“天然yvzc基因”编码天然yvzc蛋白,并且“天然bli3644基因”编码天然bli3644蛋白。170.如本文使用的,“天然地衣芽孢杆菌(染色体)rghr基因座”(在下文中为“天然rghr基因座”)包含“天然rghr1基因”、“天然rghr2基因”、“天然yvzc基因”和“天然bli3644基因”,如图1a中所示意性示出地。171.如本文使用的,名命名为“ldn143”的亲本地衣芽孢杆菌细胞包含天然rghr基因座。172.如本文使用的,“经修饰的地衣芽孢杆菌(染色体)rghr基因座”(在下文中为“经修饰的rghr基因座”)包含选自rghr1、rghr2、yvzc和/或bli3644的基因(或其可读框)的至少一个遗传修饰(相对于天然rghr基因座)。在某些实施例中,包含经修饰的rghr基因座的经修饰的地衣芽孢杆菌细胞衍生自包含天然rghr基因座的亲本地衣芽孢杆菌细胞。173.如本文使用的,命名为“bf314”的经修饰的地衣芽孢杆菌(子代)细胞包含经修饰的rghr基因座,该基因座包含天然rghr1基因、经修饰的rghr2基因(命名为“rghr终止”;包含三(3)个提前终止密码子)、天然yvzc基因和天然bli3644基因,如图1b中所示意性示出地。174.如本文使用的,名为“bf324”的经修饰的地衣芽孢杆菌(子代)细胞包含经修饰的rghr基因座,该基因座包含rghr1基因缺失(δrghr1)、天然rghr2基因、天然yvzc基因和天然bli3644基因,如图1c中所示意性示出地。175.如本文使用的,命名为“bf377”的经修饰的地衣芽孢杆菌(子代)细胞包含经修饰的rghr基因座,该基因座包含天然rghr1基因、rghr2基因缺失(δrghr2)、天然yvzc基因和天然bli3644基因,如图1d中所示意性示出地。176.如本文使用的,命名为“bf389”的经修饰的地衣芽孢杆菌(子代)细胞包含经修饰的rghr基因座,该基因座包含rghr1基因缺失(δrghr1)、rghr2基因缺失(δrghr2)、天然yvzc基因和天然bli3644基因,如图1e中所示意性示出地。177.如本文使用的,命名为“bf391”的经修饰的地衣芽孢杆菌(子代)细胞包含经修饰的(空)rghr基因座,该基因座包含rghr1基因缺失(δrghr1)、rghr2基因缺失(δrghr2)、yvzc基因缺失(δyvzc)和bli3644基因缺失(δbli3644),如图1f中所示意性示出地。178.如本文使用的,术语“等效位置”意指在与特定多肽序列比对后的氨基酸残基位置。179.术语“修饰”和“遗传修饰”互换地使用,并包括:(a)引入、取代、或去除基因(或其orf)中的一个或多个核苷酸,或者引入、取代、或去除基因或其orf的转录或翻译所需要的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)特异性诱变,和/或(g)随机诱变本文公开的任何一个或多个基因。例如,如本文使用的,遗传修饰包括但不限于选自由rghr1、rghr2、yvzc、bli3644等组成的组的一个或多个基因的修饰。180.如本文使用的,“基因的破坏”、“基因破坏”、“基因的灭活”和“基因灭活”互换地使用,并且广泛地是指基本上防止宿主细胞生产功能性基因产物(例如,蛋白质)的任何遗传修饰。基因破坏的示例性方法包括基因的任何部分(包括多肽编码序列、启动子、增强子或另一种调控元件)的完全或部分缺失、或其诱变,其中诱变涵盖取代、插入、缺失、倒位、及其任何组合和变化,该诱变破坏/灭活一个或多个靶基因并基本上减少或防止功能性基因产物(即蛋白质)的生产。181.如本文所定义的,组合术语“表达/生产”(如在短语如“相对于亲本(宿主)细胞,经修饰的宿主细胞表达/生产增加量的目的蛋白”中使用的),术语(“表达/生产”)意指包括涉及在本公开的宿主细胞中表达和生产目的蛋白的任何步骤。182.因此,如本文使用的,“增加”蛋白质生产或“增加的”蛋白质生产意指生产的蛋白质(例如,内源和/或异源poi)的量增加。蛋白质可以在宿主细胞内生产,或分泌(或转运)到培养基中。在某些实施例中,目的蛋白被生产(分泌)到培养基中。如与亲本宿主细胞相比,增加的蛋白质生产可以被检测为例如蛋白或酶活性(例如像蛋白酶活性、淀粉酶活性、纤维素酶活性、半纤维素酶活性等)、或生产的总细胞外蛋白的更高的最大水平。183.如本文使用的,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合成起点的dna、cdna和rna,其可能是双链或单链,无论代表正义或反义链。应该理解,由于遗传密码的简并性,许多核苷酸序列可以编码给定的蛋白质。184.应该理解,本文描述的多核苷酸(或核酸分子)包括“基因”、“载体”和“质粒”。185.因此,术语“基因”是指编码氨基酸的特定序列的多核苷酸,其包含所有或部分蛋白编码序列,并且可以包括调控(非转录的)dna序列,如启动子序列,该启动子序列决定例如基因在其下表达的条件。基因的转录区可以包括非翻译区(utr)(该非翻译区包括内含子、5'-非翻译区(utr)、和3'-utr),以及编码序列。186.如本文使用的,术语“编码序列”是指直接明确指出其(编码的)蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界一般由通常以atg起始密码子开始的可读框(下文称为“orf”)确定的。编码序列典型地包括dna、cdna和重组核苷酸序列。187.如本文所使用的术语“启动子”是指能够控制编码序列或功能性rna表达的核酸序列。通常,编码序列位于启动子序列3'(下游)。启动子可以全部衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同元件构成,或者甚至包含合成的核酸区段。本领域技术人员应该理解,不同启动子可以在不同细胞类型中、或在不同发育阶段、或响应于不同环境条件或生理条件来指导基因表达。引起基因在大多数细胞类型中表达的启动子大多数时候通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下还不能完全确定调控序列的确切边界,不同长度的dna片段可具有相同的启动子活性。188.如本文所使用的术语“有效地连接”是指核酸序列在单个核酸片段上的缔合,这样使得一个核酸片段的功能受到另一个影响。例如,当能够实现该编码序列的表达(即编码序列在启动子的转录控制下)时,启动子与该编码序列(例如orf)有效地连接。编码序列可以在正义或反义方向上有效地连接到调控序列上。189.当核酸置于与另一核酸序列的功能关系时,该核酸与另一核酸序列“有效地连接”。例如,如果编码分泌性前导子(即信号肽)的dna表达为参与多肽分泌的前蛋白,那么该编码分泌性前导子的dna有效地连接到该多肽的dna;如果启动子或增强子影响编码序列的转录,那么该启动子或增强子有效地连接到该序列;或者如果核糖体结合位点被定位以便促进翻译,那么该核糖体结合位点有效地连接到编码序列。通常,“有效地连接”意指被连接的dna序列是连续的,并且在分泌性前导子的情况下,是连续的并且处于阅读相中。然而,增强子不必是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用合成的寡核苷酸衔接子或接头。190.如本文使用的,“控制与目的基因的蛋白质编码序列连接的目的基因(或其可读框)的表达的功能性启动子序列”是指控制芽孢杆菌属中编码序列的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含5′启动子(或5′启动子区、或串联5′启动子等)的多核苷酸,其中启动子区有效地连接到编码本公开的蛋白的核酸序列。因此,在某些实施例中,功能性启动子序列控制编码本文公开的蛋白质的基因的表达。在其他实施例中,功能性启动子序列控制编码目的蛋白的异源基因(或内源基因)在芽孢杆菌属细胞(更特别是地衣芽孢杆菌宿主细胞)中的表达。191.如本文定义的,“合适的调控序列”是指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码序列的转录、rna加工或稳定性或翻译的核苷酸序列。调控序列可以包括启动子、翻译前导序列、rna加工位点、效应子结合位点、和茎环结构。192.如本文所定义的,术语“引入”,如短语中所使用的,如“向细菌细胞中引入”或“向地衣芽孢杆菌细胞中引入”至少一种多核苷酸可读框(orf)、或其基因、或其载体,包括本领域已知用于将多核苷酸引入细胞的方法,这些方法包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染、缀合等(例如,参见ferrari等人,1989)。193.如本文使用的,“转化的”或“转化”意指通过使用重组dna技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、orf或基因)插入细胞中而发生。所插入的核苷酸序列可以是异源核苷酸序列(即在待转化的细胞中不是天然存在的序列)。例如,在本公开的某些实施例中,通过向亲本细胞引入多核苷酸构建体(该多核苷酸构建体包含有效地连接到编码目的蛋白的核酸序列的启动子)来修饰(例如,转化)亲本地衣芽孢杆菌细胞,从而生成衍生自亲本细胞的经修饰的地衣芽孢杆菌(子代)宿主细胞。194.如本文使用的,“转化”是指将外源dna引入宿主细胞中,使得dna保持为染色体整合体或自我复制的染色体外载体。如本文使用的,“转化dna”、“转化序列”、和“dna构建体”是指用于将序列引入宿主细胞或生物体中的dna。转化dna是用于将序列引入宿主细胞或生物体中的dna。可以通过pcr或任何其他合适的技术在体外生成dna。在一些实施例中,转化dna包含输入序列,而在其他实施例中,其还包含同源盒侧翼的输入序列。在又另一个实施例中,转化dna包含其他非同源序列,添加到末端(即,填充序列或侧翼)。末端可以闭合,这样使得转化dna形成闭环,例如像,插入载体中。195.如本文使用的,在将核酸序列引入细胞中的上下文中,术语“引入”是指适合于将核酸序列转移到细胞中的任何方法。此类用于引入的方法包括但不限于原生质体融合、转染、转化、缀合和转导(参见例如,ferrari等人,1989)。196.如本文使用的,“输入序列”是指引入芽孢杆菌属染色体中的dna序列。在一些实施例中,输入序列是dna构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因、和/或突变型或经修饰的基因。在可替代的实施例中,输入序列编码功能性野生型基因或操纵子、功能性突变的基因或操纵子、或非功能性基因或操纵子。在一些实施例中,可以将非功能性序列插入基因中以破坏基因的功能。在另一实施例中,输入序列包括选择性标记。在一个另外的实施例中,输入序列包括两个同源盒。197.如本文使用的,“同源盒”是指与芽孢杆菌属染色体中的序列同源的核酸序列。更具体地,根据本发明,同源盒是上游或下游区,该上游或下游区与被缺失、破坏、灭活的、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导在芽孢杆菌属染色体中,dna构建体被整合,并且指导哪一部分芽孢杆菌属染色体被输入序列替代。尽管不欲限制本公开,但同源盒可以包括约1个碱基对(bp)至200千碱基(kb)。优选地,同源盒包括约1bp与10.0kb之间、1bp与5.0kb之间、1bp与2.5kb之间、1bp与1.0kb之间、和0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5'和3'端在同源盒侧翼,其中该同源盒包含紧密位于基因的编码区侧翼的核酸序列。198.如本文使用的,术语“编码可选择标记的核苷酸序列”是指如下核苷酸序列,该核苷酸序列能够在宿主细胞中表达并且其中可选择标记的表达赋予含有表达的基因的细胞在相应的选择性试剂的存在下或在缺乏必需营养素的情况下生长的能力。199.如本文使用的,术语“可选择标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择包含载体的那些宿主。这样的可选择标记的实例包括但不限于抗微生物剂。因此,术语“可选择标记”是指提供宿主细胞已经摄取了输入性目的dna或者已经发生了一些其他反应的指示的基因。典型地,可选择标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将包含外源dna的细胞与未接受任何外源序列的细胞区分开来。[0200]“驻留可选择标记(residingselectablemarker)”是位于待转化微生物的染色体上的标记。驻留可选择标记编码与转化dna构建体上的可选择标记不同的基因。选择性标记是本领域技术人员所熟知的。如上所述,标记可以是抗微生物抗性标记(例如,ampr、phleor、specr、kanr、eryr、tetr、cmpr和neor(参见例如,guerot-fleury,1995;palmeros等人,2000;和trieu-cuot等人,1983)。在一些实施例中,本发明提供氯霉素抗性基因(例如,存在于pc194上的基因,以及存在于地衣芽孢杆菌基因组中的抗性基因)。此抗性基因在本发明中以及涉及染色体整合的盒和整合质粒的染色体扩增的实施例中特别有用(参见例如,albertini和galizzi,1985;stahl和ferrari,1984)。根据本发明有用的其他标记包括但不限于营养缺陷型标记,如丝氨酸、赖氨酸、色氨酸;和检测标记,如β-半乳糖苷酶或荧光蛋白。[0201]如本文所定义的,宿主细胞“基因组”,细菌(宿主)细胞“基因组”或地衣芽孢杆菌(宿主)细胞“基因组”包括染色体基因和染色体外基因。[0202]如本文使用的,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈环状双链dna分子的形式。此类元件可以是衍生自任何来源的单链或双链dna或rna的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和dna序列连同适当3'未翻译序列引入到细胞中。[0203]如本文使用的,“转化盒”是指包含基因(或其orf)并且除了该外源基因之外,还具有促进特定宿主细胞的转化的元件的特定载体。[0204]如本文使用的,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或dna区段到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括为“附加体(episome)”(即,其自主复制或可以整合到宿主生物体的染色体中)的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子、和人工染色体如yac(酵母人工染色体)、bac(细菌人工染色体)、plac(植物人工染色体)等。[0205]“表达载体”是指具有在细胞中并入并表达异源dna的能力的载体。许多原核和真核表达载体可商购获得并且是本领域技术人员已知的。适当的表达载体的选择在本领域技术人员的知识范围内。[0206]如本文使用的,术语“表达盒”和“表达载体”是指重组或合成生成的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件(即,这些是载体或载体元件,如上所述)的核酸构建体。重组表达盒可以并入质粒、染色体、线粒体dna、质粒dna、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括(除了其他序列之外)待转录的核酸序列和启动子。在一些实施例中,dna构建体还包括一系列允许靶细胞中特定核酸转录的特定核酸元件。在某些实施例中,本公开的dna构建体包含如本文定义的选择性标记和灭活的染色体或基因或dna区段。[0207]如本文使用的,“靶向载体”是如下载体,该载体包括与该靶向载体转化至其中的宿主细胞的染色体中的区同源的多核苷酸序列,并且该载体可以驱动在该区处的同源重组。例如,靶向载体可用于通过同源重组将突变引入宿主细胞的染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端(即,填充序列或侧翼序列)。在一些实施例中,靶向载体包括用来增加与染色体的同源重组的元件,包括但不限于rna指导的核酸内切酶、dna指导的核酸内切酶、和重组酶。末端可以闭合,这样使得靶向载体形成闭环,例如像,插入载体中。[0208]如本文使用的,术语“质粒”是指用作克隆载体的环状双链(ds)dna构建体,并且其在许多细菌和一些真核生物中形成染色体外的自我复制遗传元件。在一些实施例中,质粒被并入宿主细胞的基因组中。[0209]如本文使用的,术语“目的蛋白”或“poi”是指期望在芽孢杆菌属宿主细胞中表达的目的多肽,其中该poi优选地以增加的水平表达。因此,如本文使用的,poi可以是酶、底物结合蛋白质、表面活性蛋白质、结构蛋白质、受体蛋白质等。在某些实施例中,本公开的经修饰的细胞,相对于亲本细胞,生产增加量的异源poi或增加量的内源poi。在特定的实施例中,由本公开的经修饰的细胞生产的poi的增加量是相对于亲本细胞增加至少0.5%、增加至少1.0%、增加至少5.0%、或增加超过5.0%。[0210]类似地,如本文定义的,“目的基因”或“goi”是指编码poi的核酸序列(例如,多核苷酸、基因、或orf)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、突变型基因或合成的基因。[0211]如本文使用的,术语“多肽”和“蛋白质”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文使用用于氨基酸残基的常规单(1)字母或三(3)字母代码。多肽可以是线性的或支化的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖已经天然地或通过干预而修饰(例如,通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰(如与标记组分缀合))的氨基酸聚合物。这些定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。[0212]在某些实施例中,本公开的基因编码商业上相关的工业目的蛋白,例如酶(例如,乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。[0213]如本文使用的,“变体”多肽是指典型地通过重组dna技术,通过取代、添加或缺失一个或多个氨基酸,衍生自亲本(或参照)多肽的多肽。变体多肽与亲本多肽可以相差小数量的氨基酸残基,并且可以通过它们与亲本(参照)多肽在一级氨基酸序列同源性/同一性的水平来定义。[0214]优选地,变体多肽与亲本(参照)多肽序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%的氨基酸序列同一性。如本文使用的,“变体”多核苷酸是指编码变体多肽的多核苷酸,其中该“变体多核苷酸”与亲本多核苷酸具有特定程度的序列同源性/同一性,或与亲本多核苷酸(或其互补序列)在严格杂交条件下杂交。优选地,变体多核苷酸与亲本(参照)多核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%的核苷酸序列同一性。[0215]如本文使用的,“突变”是指核酸序列中的任何变化或改变。存在几种类型的突变,包括点突变、缺失突变、沉默突变、移码突变、剪接突变等。突变可以特异性地(例如,经由定点诱变)或随机地(例如,经由化学试剂、通过修复减去细菌菌株传代)进行。[0216]如本文使用的,在多肽或其序列的上下文中,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。[0217]如本文定义的,“内源基因”是指位于生物体基因组的其天然位置中的基因。[0218]如本文定义的,“异源”基因、“非内源”基因、或“外源”基因是指通常不在宿主生物体中被发现,但通过基因转移引入宿主生物体中的基因(或orf)。如本文使用的,术语一个或多个“外源”基因包含插入非天然生物体中的天然基因(或orf)和/或插入天然或非天然生物体中的嵌合基因。[0219]如本文定义的,“异源”核酸构建体或“异源”核酸序列具有不是其被表达的细胞的天然的序列的一部分。[0220]如本文定义的,“异源控制序列”是指在自然界中不起调控(控制)目的基因表达的作用的基因表达控制序列(例如,启动子或增强子)。通常,异源核酸序列对于它们存在的细胞或基因组的一部分而言不是内源(天然)的,并且已经通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源”核酸构建体可以含有与在天然宿主细胞中发现的控制序列/dna编码(orf)序列组合相同或不同的控制序列/dna编码序列组合。[0221]如本文使用的,术语“信号序列”和“信号肽”是指可以参与成熟蛋白或蛋白质的前体形式的分泌或定向转运的氨基酸残基的序列。典型地,信号序列位于前体或成熟蛋白序列的n-末端。信号序列可以是内源的或外源的。成熟蛋白中一般不存在信号序列。典型地,在蛋白转运后,信号序列通过信号肽酶从该蛋白质切割。[0222]术语“衍生的”涵盖术语“起源的”、“获得的”“可获得的”和“创建的”,并且通常表示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源或具有可以参照另一种指定材料或组合物描述的特征。[0223]如本文使用的,术语“同源性”涉及同源多核苷酸或多肽。如果两个或更多个多核苷酸或两个或更多个多肽是同源的,则这意味着同源多核苷酸或多肽具有至少60%、更优选至少70%、甚至更优选至少85%、仍更优选至少90%、更优选至少95%、并且最优选至少98%的“同一性程度”。两个多核苷酸或多肽序列是否具有如本文定义的同源程度足够高的同一性,可以通过使用本领域已知的计算机程序对齐两个序列来适当地研究,该计算机程序是例如,gcg程序包中提供的“gap”(programmanualforthewisconsinpackage[威斯康星程序包手册],第8版,1994年8月,遗传学计算机集团(geneticscomputergroup),科学车道575号(575sciencedrive),麦迪逊,威斯康星州,美国53711)(needleman和wunsch,(1970))。使用具有以下设置的gap进行dna序列比较:gap产生罚分5.0和gap扩展罚分0.3。[0224]如本文使用的,术语“百分比(%)同一性”是指当使用序列比对程序对齐时,编码多肽或多肽的氨基酸序列的核酸序列之间的核酸或氨基酸序列同一性的水平。[0225]如本文使用的,“比生产力”是在给定时间段内生产的蛋白的总量/细胞/时间。[0226]如本文所定义的,术语“纯化的”、“分离的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通过将其与它在自然界中相关联的天然存在的成分中的一些或所有分离而被从其天然状态改变。这样的分离或纯化可以通过本领域公认的分离技术如离子交换色谱法、亲和色谱法、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其他蛋白盐沉淀、离心、尺寸排阻色谱法、过滤、微量过滤、凝胶电泳或梯度分离进行,以去除最终组合物中所不希望的全细胞、细胞碎片、杂质、外来蛋白、或酶。然后可以进一步向纯化的或分离的生物分子组合物中添加提供额外益处的成分,例如活化剂、抗抑制剂、期望的离子、控制ph的化合物、或其他酶、或化学品。[0227]如本文使用的,术语“comk多肽”定义为comk基因的产物;该基因是转录因子,在感受态发展之前作为最终的自动调控控制开关;涉及激活参与dna结合和摄取以及重组的晚期感受态基因的表达(liu和zuber,1998,hamoen等人,1998)。[0228]如本文使用的,“同源基因”是指来自不同的、但通常相关的物种的基因对,这些基因彼此对应并且彼此相同或非常相似。该术语涵盖通过物种形成(即,新物种的发育)分离的基因(例如,直系同源基因)、以及通过遗传重复分离的基因(例如,旁系同源基因)。[0229]如本文使用的,“直系同源物”和“直系同源基因”是指通过物种形成从共同祖先基因(即,同源基因)演化的不同物种中的基因。通常,直系同源物在进化过程中保持相同的功能。直系同源物的鉴定可用于新测序基因组中基因功能的可靠预测。[0230]如本文使用的,“旁系同源物”和“旁系同源基因”是指与基因组内重复相关的基因。虽然直系同源物在进化过程中保持相同的功能,但旁系同源物发展出新的功能,即使一些功能通常与原始功能相关。旁系同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶、和凝血酶的基因,上述酶都是丝氨酸蛋白酶并且在同一物种内一起发生。[0231]如本文使用的,“同源性”是指序列相似性或同一性,同一性优先。使用本领域已知的标准技术来确定这种同源性(参见,例如,smith和waterman,1981;needleman和wunsch,1970;pearson和lipman,1988;程序如在wisconsingeneticssoftwarepackage[威斯康星州遗传学软件包]中的gap、bestfit、fasta、和tfasta(遗传学计算机集团,麦迪逊,威斯康星州)和devereux等人,1984)。[0232]如本文使用的,术语“杂交”是指通过碱基配对将核酸链与互补链连接的过程,如本领域已知的。如果两个序列在中至高严格杂交和洗涤条件下彼此特异性杂交,则认为核酸序列可与参照核酸序列“选择性杂交”。杂交条件是基于核酸结合复合物或探针的解链温度(tm)。例如,“最大严格”典型地发生在约tm-5℃(比探针的tm低5°);“高严格”发生在低于tm约5℃-10℃;“中等严格”发生在比探针的tm低约10℃-20℃;并且“低严格”发生在低于tm约20℃-25℃。[0233]在功能上,最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的序列;而中或低严格杂交可用于鉴定或检测多核苷酸序列同源物。中和高严格杂交条件是本领域熟知的。高严格条件的实例包括以下杂交:在约42℃在50%甲酰胺、5xssc、5x登哈特溶液(denhardt'ssolution)、0.5%sds和100pg/ml变性载剂dna中进行,随后在室温(rt)在2xssc和0.5%sds中洗涤两次,并在42℃在0.1xssc和0.5%sds中再洗涤两次。中严格条件的实例包括在37℃在包含20%甲酰胺、5xssc(150mmnacl、15mm柠檬酸三钠)、50mm磷酸钠(ph7.6)、5x登哈特溶液、10%葡聚糖硫酸盐和20mg/ml变性剪切的鲑鱼精子dna的溶液中过夜孵育,然后在约37℃-50℃以1xssc洗涤滤器来进行。如果需要,本领域技术人员知道如何调节温度、离子强度等以适应如探针长度等因素。[0234]如本文使用的,“重组体”包括提及细胞或载体,其已经通过引入异源核酸序列而被修饰,或者该细胞衍生自已如此经修饰的细胞。因此,例如,重组细胞表达未在细胞的天然(非重组)形式内发现的相同形式的基因或表达以其他方式异常表达的、低表达的或根本不表达的天然基因(由于故意的人为干预)。“重组(recombination、recombining)”或生成“重组的(recombined)”核酸是两个或更多个核酸片段的组装,其中该组装产生嵌合基因。[0235]如本文使用的,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,针对基因a-b-c,基因b以a和c基因序列为侧翼)。在某些实施例中,输入序列在每侧侧翼有同源盒。在另一实施例中,输入序列和同源盒包含在每侧侧翼有填充序列的单元。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),但在优选的实施例中,序列的每侧均有侧翼序列。每个同源盒的序列与芽孢杆菌属染色体中的序列同源。这些序列指导了在芽孢杆菌属染色体中新构建体的整合位置以及芽孢杆菌属染色体的哪部分将被输入序列替代。在其他实施例中,选择性标记的5'和3'端侧翼有包含灭活的染色体区段的部分的多核苷酸序列。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),而在其他实施例中,序列的每侧均存在侧翼序列。在一些实施例中,同源盒直接在彼此侧翼,并且缺乏间插序列(例如,对于基因d-e-f,构建体为d-f),使得如果构建体在基因组内重组,则将从基因组中去除基因e。[0236]ii.地衣芽孢杆菌rghr基因座[0237]枯草芽孢杆菌yvan基因已经被鉴定为rapg、raph和rapd基因的阻遏物,并且被重新命名为“rghr”,(即,rapg和raph阻遏物;hayashi等人,2006;ogura&fujita,2007)。例如,地衣芽孢杆菌rghr基因座编码枯草芽孢杆菌rghr/yvao(转录调控因子)的两(2)个同源物,它们被命名为“rghr1”和“rghr2”。地衣芽孢杆菌rghr1基因的上游(5′)(例如,参见图1a)是两(2)个另外的基因,yvzc(bli3645)和bli3644,分别编码转录调节蛋白yvzc和bli3644。更特别地,如上文通常定义的,天然地衣芽孢杆菌rghr(染色体)基因座包含天然rghr1基因、天然rghr2基因、天然yvzc基因和天然bli3644基因,如图1a所示。例如,pct公开号wo2018/156705公开了突变体地衣芽孢杆菌菌株,其包含突变的rghr2基因,该基因具有编码变体rghr2蛋白的核苷酸序列,该变体蛋白命名为“rghr2dup”(即包含“aaasir”的六氨基酸重复序列)。如在pct公开号wo2018/156705中一般性描述地,来自rghr2dup序列的这十八(18)bp重复的缺失(即,产生等位基因rghr2剩余)导致生物质的减少,伴随异源蛋白质生产的增加。[0238]如本文和下文实例部分所述,申请人进一步设计、构建并且测试了经修饰的地衣芽孢杆菌细胞,从而评估rghr基因座并且鉴定具有增强的蛋白质生产(或其他有益)表型的地衣芽孢杆菌细胞。更特别地,在本发明的实例中,将命名为ldn143的亲本地衣芽孢杆菌细胞(包含具有sera和lysa基因缺失的天然rghr基因座(图1a),并且包含两(2)个异源α-淀粉酶表达盒)针对包含经修饰的rghr基因座的经修饰的地衣芽孢杆菌(子代)细胞(即衍生自ldn143亲本)进行评估。因此,使用一系列经修饰的rghr基因座等位基因构建了本文所述的经修饰的地衣芽孢杆菌(子代)细胞,将这些等位基因引入亲本地衣芽孢杆菌细胞(ldn143)。[0239]更具体地,构建了衍生自ldn143亲本的以下地衣芽孢杆菌(子代)细胞,其包含以下经修饰的rghr基因座之一:地衣芽孢杆菌细胞bf314,其包含天然rghr1基因、经修饰的rghr2基因(rghr2终止)、天然yvzc基因和天然bli3644基因(图1b);地衣芽孢杆菌细胞bf324,其包含rghr1基因缺失(δrghr1)、天然rghr2基因(rghr2终止)、天然yvzc基因和天然bli3644基因(图1c);地衣芽孢杆菌细胞bf377,其包含天然rghr1基因、rghr2基因缺失(δrghr2)、天然yvzc基因和天然bli3644基因(图1d);地衣芽孢杆菌细胞bf389,其包含rghr1基因缺失(δrghr1)、rghr2基因缺失(δrghr2)、天然yvzc基因和天然bli3644基因(图1e);以及地衣芽孢杆菌细胞bf391,其包含rghr1基因缺失(δrghr1)、rghr2基因缺失(δrghr2)、yvzc基因缺失(δyvzc)和bli3644基因缺失(δbli3644)(图1f,空rghr基因座)。[0240]因此,如下文实例4(例如,参见表20)中所述,在rghr基因座中具有突变的经修饰的地衣芽孢杆菌细胞表现出增加的生产表型,与可比较的亲本细胞(ldn143)(其为rghr基因座的野生型)相比,生产的淀粉酶蛋白多约23%-62%。因此,本公开的某些实施例涉及这样的经修饰的芽孢杆菌属细胞,其具有经修饰的rghr基因座并且包含增加的蛋白质生产力表型。某些其他实施例涉及这样的用于构建和获得经修饰的芽孢杆菌属细胞的组合物和方法。因此,某些其他实施例涉及内源和/或异源目的蛋白在本公开的经修饰的芽孢杆菌属细胞中的表达/生产。[0241]iii.生产减少量的红色色素的地衣芽孢杆菌细胞[0242]如本领域技术人员通常理解的,芽孢杆菌已经被很好地确立为用于生产天然蛋白质和重组蛋白质的宿主系统。然而,已知某些芽孢杆菌属物种(例如,枯草芽孢杆菌、蜡样芽孢杆菌、地衣芽孢杆菌等)会合成衍生自环-l-亮氨酰-l-亮氨酰的普切明酸(pulcherriminicacid),其中普切明酸被分泌到生长培养基中并且螯合铁离子(通过非酶促反应),从而形成称为普切明(pulcherrimin)的细胞外红色色素(macdonald,1965;uffen和canale-parola,1972)。因此,芽孢杆菌属(宿主)细胞以足以形成可见红色色素的量生产普切明(即在发酵/培养期间),这一般需要在目的蛋白的回收和/或纯化期间进行一个或多个普切明去除步骤,或普切明(红色色素)可以与目的蛋白一起共纯化。[0243]例如,具有希望的表型(例如像增加的蛋白质生产)的芽孢杆菌属宿主细胞可能并不一定具有对于成功发酵、回收和/或纯化宿主细胞生产的目的蛋白而言最希望的特征(例如像红色色素表型)。因此,用来减少芽孢杆菌属细胞中普切明生产的某些遗传方法已经描述于现有技术文献中,例如国际pct公开号wo2004/011609,其描述了芽孢杆菌属中cypx基因和/或yvmc基因的缺失,作为用来减少普切明生产的方式。[0244]如本文和下文实例部分所述,申请人已经鉴定出了一种新的用来减少地衣芽孢杆菌细胞中红色色素(普切明)的生产的方式。更具体地,如下文实例5中所示出和描述的,rghr基因座的被鉴定的特征是对如下操纵子进行转录控制,该操纵子负责生产铁清除色素普切明酸。如此实例中所示,地衣芽孢杆菌细胞bf314(即包含经修饰的(rghr2终止)基因)和bf377(即包含基因缺失(δrghr2))二者表明了红色色素的生产减少了约30%-50%,而几种其他的突变使得普切明的生产增加了约10%-20%(例如参见表21),这表明rghr基因座中的突变控制普切明酸的生物合成。[0245]因此,本公开的某些实施例涉及这样的具有经修饰的rghr基因座的经修饰的芽孢杆菌属细胞,该经修饰的细胞生产减少量的红色色素。某些其他实施例涉及这样的用于构建和获得经修饰的芽孢杆菌属细胞的组合物和方法,该经修饰的芽孢杆菌属细胞生产减少量的红色色素。因此,某些其他实施例涉及内源和/或异源目的蛋白在本公开的经修饰的芽孢杆菌属细胞中的表达/生产。[0246]iv.分子生物学[0247]如上文所示,本公开的某些实施例涉及衍生自包含天然rghr基因座的亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞。在特定的实施例中,经修饰的地衣芽孢杆菌细胞包含经修饰的rghr基因座。因此,某些其他实施例涉及用于遗传修饰亲本地衣芽孢杆菌细胞从而生成经修饰的地衣芽孢杆菌(子代)细胞的组合物和方法。[0248]因此,某些实施例涉及用于遗传修饰芽孢杆菌属细胞的方法,该方法包括但不限于(a)在基因(或其orf)中引入、取代、或去除一个或多个核苷酸,或者在基因(或其orf)的转录或翻译所需的调控元件中引入、取代、或去除一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)位点特异性诱变,和/或(g)随机诱变。例如,如本文使用的,遗传修饰包括但不限于选自由以下组成的组的一个或多个基因的修饰:地衣芽孢杆菌rghr1基因、rghr2基因、yvzc基因和bli3644基因。[0249]因此,在某些实施例中,通过使用本领域熟知的方法(例如,插入、破坏、替代、或缺失)减少或消除上述基因的表达来构建本公开的经修饰的芽孢杆菌属细胞。待修饰或灭活的基因的部分可以是,例如,编码区或编码区表达所需的调控元件。[0250]这样的调控或控制序列的实例可以是启动子序列或其功能部分(即,足以影响核酸序列的表达的部分)。用于修饰的其他控制序列包括但不限于前导序列、前肽序列、信号序列、转录终止子、转录激活子等。[0251]在某些其他实施例中,通过基因缺失构建经修饰的芽孢杆菌属细胞以消除或减少本公开的至少一种前述基因的表达。基因缺失技术能够部分或完全去除一个或多个基因,从而消除它们的表达、或表达非功能性(或活性降低的)蛋白产物。在这样的方法中,一个或多个基因的缺失可以通过使用质粒进行同源重组来完成,该质粒已构建成连续含有基因侧翼的5'和3'区。可以将连续的5'和3'区引入芽孢杆菌属细胞中,例如,在温度敏感的质粒(如pe194)上,在允许温度下与第二可选择标记缔和以允许质粒在细胞中建立。然后将细胞移至非允许温度,以选择在同源侧翼区之一处具有整合到染色体中的质粒的细胞。通过选择第二可选择标记来实现质粒整合的选择。整合后,通过将细胞移至允许温度持续几代而不进行选择来刺激第二同源侧翼区处的重组事件。将细胞铺板以获得单菌落,并检查菌落是否损失两种可选择标记(参见例如,perego,1993)。因此,本领域技术人员(例如,通过参考rghr1、rghr2、yvzc、bli3644(核酸)序列和其所编码的蛋白质序列)可以容易地在适合于完全或部分缺失的基因的编码序列和/或基因的非编码序列中鉴定核苷酸区。[0252]在其他实施例中,通过在基因或其转录或翻译所需的调控元件中引入、取代、或去除一个或多个核苷酸来构建本公开的经修饰的芽孢杆菌属细胞。例如,可以插入或去除核苷酸,以便导致引入终止密码子、去除起始密码子、或可读框的移码。这样的修饰可以根据本领域中已知的方法,通过定点诱变或pcr生成的诱变来完成(例如,参见botstein和shortle,1985;lo等人,1985;higuchi等人,1988;shimada,1996;ho等人,1989;horton等人,1989以及sarkar和sommer,1990)。因此,在某些实施例中,通过完全或部分缺失灭活本公开的基因。[0253]在另一实施例中,通过基因转换的过程构建经修饰的芽孢杆菌属细胞(例如,参见iglesias和trautner,1983)。例如,在基因转换方法中,对应于一个或多个基因的核酸序列在体外诱变以生产缺陷核酸序列,然后将该缺陷核酸序列转化到亲本芽孢杆菌属细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列将内源基因替代。可能期望的是,缺陷基因或基因片段也编码可用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择标记缔和引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。通过检查菌落损失可选择标记和获得突变型基因来实现导致基因替代的第二重组事件的选择(perego,1993)。替代性地,缺陷核酸序列可以含有基因的一个或多个核苷酸的插入、取代、或缺失,如下所述。[0254]在其他实施例中,通过建立的反义技术使用与基因的核酸序列互补的核苷酸序列来构建经修饰的芽孢杆菌属细胞(parish和stoker,1997)。更具体地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除芽孢杆菌属细胞的基因的表达,该核苷酸序列可以在细胞中转录并且能够与细胞中产生的mrna杂交。在允许互补的反义核苷酸序列与mrna杂交的条件下,由此降低或消除了所翻译的蛋白质的量。这样的反义方法包括但不限于rna干扰(rnai)、小干扰rna(sirna)、微小rna(mirna)、反义寡核苷酸等,所有这些都是本领域技术人员熟知的。[0255]在其他实施例中,经由crispr-cas9编辑产生/构建经修饰的芽孢杆菌属细胞。例如,编码rghr1、rghr2、yvzc和/或bli3644的基因可以以核酸指导的核酸内切酶的方式被破坏(或缺失或下调),该方式通过将指导rna(例如,cas9)和cpfl或指导dna(例如,ngago)结合发现其靶dna,这将核酸内切酶募集到dna上的靶序列上,其中该核酸内切酶可以在dna中生成单链或双链断裂。此靶向dna断裂成为dna修复的底物,并且可以与提供的编辑模板重组以破坏或缺失该基因。例如,编码核酸指导的核酸内切酶(出于此目的,来自化脓链球菌的cas9)的基因或编码cas9核酸酶的密码子优化的基因有效地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子,从而产生芽孢杆菌cas9表达盒。同样地,本领域技术人员容易鉴定目的基因特有的一个或多个靶位点。例如,为了使用化脓链球菌cas9构造编码grna的针对目的基因内的靶位点的dna构建体,可变的靶向(vt)结构域将包含为(pam)原间隔子邻近基序(ngg)5'的靶位点的核苷酸,该核苷酸与编码化脓链球菌cas9的cas9核酸内切酶识别结构域(cer)的dna融合。将编码vt结构域的dna和编码cer结构域的dna组合,从而产生编码grna的dna。因此,通过将编码grna的dna有效地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子来产生grna的芽孢杆菌属表达盒。[0256]在某些实施例中,由核酸内切酶诱导的dna断裂用输入序列修复/替代。例如,为了精确修复由上述cas9表达盒和grna表达盒生成的dna断裂,提供核苷酸编辑模板,使得细胞的dna修复机制可以利用编辑模板。例如,靶基因的约500-bp5'可以与靶基因的约500-bp3'融合以生成编辑模板,该模板由芽孢杆菌宿主的机器用于修复由rgen生成的dna断裂。[0257]可以使用许多不同的方法将cas9表达盒、grna表达盒和编辑模板共同递送至细胞。通过用正向和反向引物扩增基因座,通过pcr扩增靶基因座来筛选转化的细胞。这些引物可以扩增野生型基因座或已经由rgen编辑的经修饰的基因座。然后使用测序引物对这些片段进行测序以鉴定编辑的菌落(例如,参见下文实例部分)。[0258]在又其他实施例中,使用本领域熟知的方法(包括但不限于化学诱变(参见例如,hopwood,1970)和转座(参见例如,youngman等人,1983)),通过随机或特异性诱变构建经修饰的芽孢杆菌属细胞。可以通过对亲本细胞进行诱变并筛选其中基因表达已经减少或消除的突变细胞来进行基因的修饰。诱变可以是特异性的或随机的,可以通过例如使用适合的物理或化学诱变剂进行、通过使用合适的寡核苷酸进行、或通过使该dna序列经受pcr产生的诱变来进行。此外,诱变可通过使用这些诱变方法的任何组合来进行。[0259]适用于本发明目的的物理或化学诱变剂的实例包括紫外线(uv)照射、羟胺、n-甲基-n'-硝基-n-亚硝基胍(mnng)、n-甲基-n'-亚硝基胍(ntg)、邻甲基羟胺、亚硝酸、甲烷磺酸乙酯(ems)、亚硫酸氢钠、甲酸、和核苷酸类似物。当使用这样的药剂时,典型地通过如下方法来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并选择表现出基因表达降低或无基因表达的突变的细胞。[0260]国际pct公开号wo2003/083125公开了用于修饰芽孢杆菌属细胞的方法,如使用pcr融合来产生芽孢杆菌属缺失菌株和dna构建体以绕过大肠杆菌。pct公开号wo2002/14490公开了用于修饰芽孢杆菌属细胞的方法,这些方法包括(1)构建和转化整合的质粒(pcomk),(2)随机诱变编码序列、信号序列和前肽序列,(3)同源重组,(4)通过向转化dna添加非同源侧翼提高转化效率,(5)优化双交叉整合,(6)定向诱变和(7)无标记缺失。[0261]本领域技术人员充分意识到用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌和芽孢杆菌属物种)中的适合方法(例如,ferrari等人,1989;saunders等人,1984;hoch等人,1967;mann等人,1986;holubova,1985;chang等人,1979;vorobjeva等人,1980;smith等人,1986;fisher等人,1981和mcdonald,1984)。实际上,包括原生质体转化和中板集合、转导、和原生质体融合在内的此类方法如转化是已知的并且适合用于本公开。转化方法特别优选地用于将本公开的dna构建体引入宿主细胞中。[0262]除了通常使用的方法之外,在一些实施例中,直接转化宿主细胞(即,在引入宿主细胞之前,中间细胞不用于扩增或以其他方式处理dna构建体)。将dna构建体引入宿主细胞中包括本领域已知的将dna引入宿主细胞而不插入质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸dna、脂质体等。在额外的实施例中,dna构建体与质粒一起共转化而不插入该质粒。在另外的实施例中,通过本领域已知的方法,将选择性标记从经修饰的芽孢杆菌属菌株中缺失或基本上切除(例如,stahl等人,1984;palmeros等人,2000)。在一些实施例中,载体从宿主染色体上分解下来,将侧翼区留在染色体上,而将固有的染色体区去除。[0263]用于在芽孢杆菌属细胞中表达基因、其可读框(orf)和/或其变体序列的启动子和启动子序列区通常是本领域技术人员已知的。通常选择本公开的启动子序列,使得它们在芽孢杆菌属细胞中起作用。某些示例性芽孢杆菌属启动子序列包括但不限于枯草芽孢杆菌碱性蛋白酶(apre)启动子、枯草芽孢杆菌的α-淀粉酶启动子、解淀粉芽孢杆菌的α-淀粉酶启动子、来自枯草芽孢杆菌的中性蛋白酶(npre)启动子、突变体apre启动子(例如pct公开号wo2001/51643)或来自地衣芽孢杆菌或其他相关的芽孢杆菌属的任何其他启动子。在pct公开号wo2003/089604中描述了用于在芽孢杆菌属细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。[0264]v.培养用于生产目的蛋白的经修饰的细胞[0265]如上文一般性描述,某些实施例涉及用于构建和获得具有增加的蛋白质生产表型的芽孢杆菌属细胞/菌株的组合物和方法。因此,某些实施例涉及通过在适合的培养基中发酵/培养细胞,在芽孢杆菌属细胞中生产目的蛋白的方法。本领域熟知的发酵方法可用于发酵本公开的亲本和经修饰的(子代)芽孢杆菌属细胞。[0266]在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的系统,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,用一种或多种所需生物体接种培养基。在这种方法中,允许发酵发生而不向该系统添加任何组分。通常,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(例如ph和氧浓度)进行尝试。分批系统的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,最后进入生长速率减少或停止的稳定期。如果不经处理,处于稳定期的细胞最终死亡。通常,在对数期的细胞负责产物的大量生产。[0267]标准分批系统的合适的变体是“补料分批”发酵系统。在典型分批系统的这种变体中,随着发酵的进展,将底物以增量添加。当分解代谢物阻遏可能抑制细胞的代谢时并且在培养基中希望具有有限量的底物的情况下,补料分批系统是有用的。在补料分批系统中实际底物浓度的测量是困难的,并且因此基于可测量因素(例如ph、溶解的氧和废气(例如co2)的分压)的变化对其进行估计。分批和补料分批发酵是常用的并且在本领域中是已知的。[0268]连续发酵是开放的系统,在该系统中,将定义的发酵培养基连续添加到生物反应器中,同时去除等量的条件培养基以用于处理。连续发酵通常将培养物保持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对影响细胞生长和/或产物浓度的一种或多种因素进行调节。例如,在一个实施例中,将限制营养素(例如碳源或氮源)保持在固定的速率,并且允许使所有其他参数保持适中。在其他系统中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续系统努力保持稳定态的生长条件。因此,由于转移培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养素和生长因子的方法以及最大化产物形成速率的技术在工业微生物学领域中是熟知的。[0269]在某些实施例中,可以通过常规程序从培养基中回收由本公开的芽孢杆菌属细胞表达/生产的目的蛋白,这些常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。通常经过澄清后,上清液或滤液的蛋白性组分通过盐(例如硫酸铵)沉淀。然后将沉淀的蛋白质溶解,并且可以通过各种色谱程序(例如离子交换色谱法、凝胶过滤)进行纯化。[0270]vi.目的蛋白[0271]本公开的目的蛋白(poi)可以是任何内源或异源蛋白质,并且它可以是这种poi的变体。蛋白质可以包含一个或多个二硫桥,或者是其功能形式是单体或多聚体的蛋白质,即蛋白质具有四级结构并且由多个相同(同源的)或不相同的(异源的)亚基构成,其中poi或其变体poi优选是具有目的特性的poi。例如,在某些实施例中,相对于其未经修饰的(亲本)细胞,本公开的经修饰的芽孢杆菌属细胞多生产至少约0.1%、多生产至少约0.5%、多生产至少约1%、多生产至少约5%、多生产至少约6%、多生产至少约7%、多生产至少约8%、多生产至少约9%、或多生产至少约10%或更多的poi。[0272]在某些实施例中,相对于(未经修饰的)亲本细胞,本公开的经修饰的芽孢杆菌属细胞表现出poi的增加的比生产力(qp)。例如,比生产力(qp)的检测是用于评估蛋白质生产的适合的方法。比生产力(qp)可以使用以下等式确定:[0273]“qp=gp/gdcw·hr”[0274]其中,“gp”是罐中生产的蛋白质的克数;“gdcw”是罐中的干细胞重量(dcw)的克数,并且“hr”是从接种时间开始的以小时表示的发酵时间,包括生产时间以及生长时间。[0275]因此,在某些其他实施例中,相对于未经修饰的(亲本)细胞,本公开的经修饰的芽孢杆菌属细胞包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产力(qp)增加。[0276]在某些实施例中,poi或其变体poi选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。[0277]因此,在某些实施例中,poi或其变体poi是选自酶学委员会(ec)编号ec1、ec2、ec3、ec4、ec5或ec6的酶。[0278]在某些其他实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码淀粉酶的表达构建体。多种淀粉酶及其变体是本领域技术人员已知的。例如,国际pct公开号wo2006/037484和wo2006/037483描述了具有改善的溶剂稳定性的变体α-淀粉酶,pct公开号wo1994/18314公开了氧化稳定的α-淀粉酶变体,pct公开号wo1999/19467、wo2000/29560和wo2000/60059公开了termamyl-样α-淀粉酶变体,pct公开号wo2008/112459公开了衍生自芽孢杆菌属物种编号707的α-淀粉酶变体,pct公开号wo1999/43794公开了生麦芽的α-淀粉酶变体,pct公开号wo1990/11352公开了超热稳定的(hyper-thermostable)α-淀粉酶变体,pct公开号wo2006/089107公开了具有颗粒淀粉水解活性的α-淀粉酶变体,等等。[0279]本领域普通技术人员已知有用于检测和测量细胞内和细胞外所表达的蛋白质的活性的各种测定。[0280]pct公开号wo2014/164777公开了可用于检测本文所述淀粉酶活性的ceralphaα-淀粉酶活性测定。[0281]实例[0282]根据以下实例可以进一步理解本发明的某些方面,这些实例不应被解释为限制性的。材料和方法的修改对本领域技术人员而言是显而易见的。[0283]实例1[0284]靶向rghr基因座的cas9载体的构建[0285]对来自化脓链球菌的cas9蛋白(seqidno:1)进行密码子优化用于芽孢杆菌(seqidno:2),其中添加n-末端核定位序列(nls;“apkkkrkv”;seqidno:3)、c-末端nls(“kkkklk”;seqidno:4)、十组氨酸标签(“hhhhhhhhhh”;seqidno:5)、来自枯草芽孢杆菌的apre启动子序列(seqidno:6)和终止子序列(seqidno:7),并使用q5dna聚合酶(neb)(按照制造商的说明书)用下面表1中列出的正向(seqidno:8)和反向(seqidno:9)引物对扩增。[0286]表1[0287]正向和反向引物对[0288]正向atatatgagtaaacttggtctgacagaattcctccattttcttctgctatseqidno:8反向tgcggccgcgaattcgattacgaatgccgtctcccseqidno:9[0289]使用q5dna聚合酶(neb)(按照制造商的说明书)用下表2中列出的正向(seqidno:12)和反向(seqidno:13)引物对扩增质粒pkb320(seqidno:11)的主链(seqidno:10)。[0290]表2[0291]正向和反向引物对[0292]正向gggagacggcattcgtaatcgaattcgcggccgcaseqidno:12反向atagcagaagaaaatggaggaattctgtcagaccaagtttactcatatatseqidno:13[0293]按照制造商的说明书用zymo清洁和浓缩(zymocleanandconcentrate)5柱纯化pcr产物。随后,用q5聚合酶(neb)与等摩尔比的两(2)个片段混合,使用延长重叠延伸pcr(poe-pcr)组装pcr产物。poe-pcr反应循环如下进行:98℃持续五(5)秒,64℃持续十(10)秒,和72℃持续四(4)分钟(15)十五秒,持续30个循环。将五(5)μlpoe-pcr(dna)按照制造商的说明书转化进入top10大肠杆菌(英杰公司(invitrogen)),并在含有五十(50)μg/ml硫酸卡那霉素并用1.5%琼脂固化的溶源性(l)培养液(miller配方;1%(w/v)胰蛋白胨、0.5%酵母提取物(w/v)、1%nacl(w/v))中选择。允许菌落在37℃生长十八(18)小时。挑取菌落,并使用qiaprepdna迷你制备试剂盒(按照制造商的说明书)制备质粒dna,并用五十五(55)μlddh2o进行洗脱。使用下面表3中列出的测序引物对质粒dna进行桑格(sanger)测序以验证正确组装。[0294]测序引物[0295]表3[0296][0297][0298]将正确组装的质粒prf694(seqidno:25)用于构建质粒prf801(seqidno:26)和prf806(seqidno:27),用于编辑地衣芽孢杆菌基因组的靶位点1(ts1;seqidno:28)和靶位点2(ts2;seqidno:29),如下所述。[0299]地衣芽孢杆菌的sera1可读框(seqidno:30)含有独特的靶位点(ts),即反向定向的靶位点1(ts1;seqidno:28)。ts1与反向定向的原间隔子邻近基序(pam;seqidno:31)相邻。靶位点可转换为编码可变靶向(vt)结构域(seqidno:32)的dna。编码vt结构域的dna序列(seqidno:32)有效地融合到编码cas9核酸内切酶识别结构域(cer,seqidno:33)的dna序列,使得当被细菌细胞的rna聚合酶转录时,它产生靶向靶位点1的功能性指导rna(grna)(seqidno:34)。编码grna的dna有效地连接到在芽孢杆菌属物种细胞中有效的启动子(例如spac启动子;seqidno:35)和在芽孢杆菌属物种细胞中有效的终止子序列(例如噬菌体λ的t0终止子序列;seqidno:36),使得该启动子位于编码grna的dna(seqidno:33)的5',并且该终止子位于编码grna的dna(seqidno:33)的3'。[0300]通过扩增地衣芽孢杆菌基因组dna(gdna)的两个同源臂,创建了编辑模板,用以响应cas9/grna切割而缺失sera1基因。第一片段(同源臂1)对应于sera1orf(seqidno:37)直接上游(5′)的五百(500)个核苷酸。使用q5dna聚合酶(按照制造商的说明书),以及下表4中列出的正向(seqidno:38)和反向(seqidno:39)引物扩增此片段。这些引物在第一片段的3'末端并入了与第二片段5'末端同源的十八(18)个核苷酸,并在第一片段的5'末端并入了与prf694同源的二十(20)个核苷酸。[0301]表4[0302]正向和反向引物对[0303]正向tgagtaaacttggtctgacaaatggttctttcccctgtccseqidno:38反向aggttccgcagcttctgtgtaagatttcctcctaaataagcgtcatseqidno:39[0304]第二片段(同源臂2)对应于sera1orf(seqidno:40)的3′末端的直接下游的五百(500)个核苷酸。使用q5dna聚合酶(按照制造商的说明书),以及下表5中列出的正向(seqidno:41)和反向(seqidno:42)引物扩增此片段。这些引物在第二片段的5'末端并入了与第一片段3'末端同源的二十八(28)个核苷酸,并在第二片段的3'末端并入了与prf694同源的二十一(21)个核苷酸。[0305]表5[0306]正向和反向引物对[0307]正向atgacgcttatttaggaggaaatcttacacagaagctgcggaacctseqidno:41反向cagaagaaaatggaggaattcgaatatcgaccggaacccacseqidno:42[0308]使用标准分子生物学技术将编码靶位点1grna表达盒(seqidno:43)、第一同源臂(seqidno:37)和第二同源臂(seqidno:40)的dna组装到prf694(seqidno:25)中,产生质粒prf801(seqidno:26),其为含有以下的大肠杆菌-地衣芽孢杆菌穿梭质粒:cas9表达盒(seqidno:2)、编码靶向sera1orf内的ts1的grna的grna表达盒(seqidno:43)和由第一同源臂(seqidno:37)和第二同源臂(seqidno:40)构成的编辑模板(seqidno:44)。使用以上表3中列出的寡核苷酸(引物)通过桑格测序验证质粒。[0309]地衣芽孢杆菌的rghr1可读框(seqidno:45)在反向链上含有唯一的靶位点(ts),即靶位点2(ts2;seqidno:28)。靶位点与反向链上的原间隔子邻近基序(pam;seqidno:46)相邻。靶位点可转换为编码可变靶向(vt)结构域(seqidno:47)的dna。编码vt结构域的dna序列(seqidno:47)有效地融合到编码cas9核酸内切酶识别结构域(cer;seqidno:33)的dna序列,使得当被细菌细胞的rna聚合酶转录时,它产生靶向靶位点2的功能性grna(seqidno:48)。编码grna的dna有效地连接到在芽孢杆菌属物种细胞中有效的启动子(例如来自枯草芽孢杆菌的spac启动子;seqidno:35)和在芽孢杆菌属物种细胞中有效的终止子(例如噬菌体λ的t0终止子;seqidno:36),使得该启动子位于编码grna的dna(seqidno:48)的5',并且该终止子位于编码grna的dna(seqidno:48)的3'。[0310]通过扩增地衣芽孢杆菌基因组dna(gdna)的两个同源臂,构建了编辑模板,用以响应cas9/grna切割而修饰rghr1基因。第一片段对应于rghr1orf(同源臂1;seqidno:49)直接上游(5′)的500个核苷酸。使用q5dna聚合酶(按照制造商的说明书),以及下表6中列出的正向(seqidno:50)和反向(seqidno:51)引物扩增此片段。这些引物在第一片段的3'末端并入了与第二片段5'末端同源的二十三(23)个核苷酸,并在第一片段的5'末端并入了与prf694同源的二十(20)个核苷酸。[0311]表6orf的包含y155h(变体)取代的片段(seqidno:63)并且使用下表9中示出的正向(seqidno:64)和反向(seqidno:65)引物扩增该片段。[0328]表9[0329]正向和反向引物对[0330]正向cacgtcgtaaaaatcgtattseqidno:64反向caaacagaccatttttctttseqidno:65[0331]从prf694(seqidno:66)扩增第二片段(seqidno:67),这样使得它包含整个质粒,除了以上prf827片段(seqidno:60)上含有的片段。此片段与prf827片段(seqidno:60)的5′和3′末端共享同源性用于组装,并且使用下表10中列出的正向(seqidno:68)和反向(seqidno:69)引物进行扩增。[0332]表10[0333]正向和反向引物对[0334]正向aaagaaaaatggtctgtttgseqidno:68反向aatacgatttttacgacgtgseqidno:69[0335]根据制造商的说明书,使用nebuilder组装两(2)个片段,并且转化到大肠杆菌感受态细胞中。使用如以上表3中列出的寡核苷酸(引物)通过桑格的方法验证质粒序列。经序列验证的分离物以质粒prf862(seqidno:77)存储。[0336]使用两(2)个部分构建prf869(seqidno:70),它是靶向rghr2orf(seqidno:71)并且插入三(3)个框内终止密码子的质粒。通过idt合成第一部分(seqidno:72),其包含用来修饰rghr2orf(seqidno:71)的编辑模板(seqidno:73),和靶向rghr2orf(seqidno:71)的grna表达盒(seqidno:74),并且使用下表11中列出的正向(seqidno:75)和反向(seqidno:76)引物扩增该第一部分。[0337]表11[0338]正向和反向引物对[0339]正向cgtgcggccgcgaattcseqidno:75反向cctgataccgggagacggcattcgtaatcseqidno:76[0340]来自prf862(seqidno:77)的包含cas9表达盒和所有质粒组分的第二部分(seqidno:77)使用下表12中列出的正向(seqidno:78)和反向(seqidno:79)引物来扩增。[0341]表12[0342]正向和反向引物对[0343]正向gaattcgcggccgcacgseqidno:78反向gattacgaatgccgtctcccggtatcaggseqidno:79[0344]根据制造商的说明书,使用nebuilder组装这两个部分并且转化到大肠杆菌中。使用以上表3中列出的寡核苷酸(引物)通过桑格的方法验证质粒序列。经序列验证的分离物以prf869(seqidno:70)存储。[0345]如以上实例1和2中所述组装几个另外的cas9质粒。下表13中列出了那些质粒,连同靶位点(ts)序列和编辑模板效应。如下表13中使用,术语“sid”是“seqid”编号的缩写。[0346]表13[0347]用于编辑地衣芽孢杆菌细胞的另外的cas9质粒[0348][0349]实例3[0350]包含各种rghr基因座等位基因的表达淀粉酶的芽孢杆菌属菌株的构建[0351]在本发明的实例中,将一系列rghr基因座等位基因引入亲本地衣芽孢杆菌菌株中,该菌株包含编码变体噬细胞菌属物种α-淀粉酶(例如描述于pct公开号wo2017/100720中的变体噬细胞菌属物种α-淀粉酶,该文献通过援引以其全文并入本文)的表达盒。更特别地,命名为ldn143的亲本地衣芽孢杆菌包含(a)天然rghr基因座,(b)sera基因(seqidno:30)的缺失、lysa基因(seqidno:92)的缺失,以及两(2)个α-淀粉酶表达盒。[0352]例如,整合在sera基因座中的第一表达盒(seqidno:93)包含seraorf(seqidno:30)和合成的p3启动子(seqidno:94;描述于pct公开号wo2017/152169中),该启动子有效地连接到编码枯草芽孢杆菌apre5′‑utr的dna(seqidno:95),所述dna有效地连接到编码地衣芽孢杆菌amyl信号序列的dna(seqidno:96),所述dna有效地连接到编码噬细胞菌属物种变体α-淀粉酶的dna序列(seqidno:97),所述dna序列有效地连接到地衣芽孢杆菌amyl转录终止子(seqidno:98)。整合在amyl基因座中的第二表达盒(seqidno:99)包含lysa营养缺陷型标记(seqidno:92)和地衣芽孢杆菌amyl启动子(seqidno:100),该启动子有效地连接到编码枯草芽孢杆菌apre5′‑utr的dna(seqidno:95),所述dna有效地连接到编码amyl信号序列的dna(seqidno:96),所述dna有效地连接到编码噬细胞菌属物种变体α-淀粉酶的dna序列(seqidno:97),所述dna序列有效地连接到地衣芽孢杆菌amyl转录终止子(seqidno:98)。[0353]将包含pbl.comk质粒(seqidno:101)(该质粒含有壮观霉素标记(seqidno:102)、编码xylr阻遏物的dna(seqidno:103)和xyla启动子(seqidno:104),该启动子有效地连接到编码地衣芽孢杆菌comk蛋白的dna(seqidno:105)(例如参见liu和zuber,1998;hamoen等人,1998;us专利公开号2006/0199222))的ldn143细胞/菌株的一个版本用使用滚环扩增(trueprimerca,lucigen公司)进行扩增的prf869(seqidno:70)、prf874(seqidno:80)、prf879(seqidno:83)、prf899(seqidno:86)、或prf901(seqidno:89)质粒转化。[0354]简而言之,产生了ldn143/pbl.comk感受态细胞。在37℃和250rpm振荡下,在含有一百(100)ppm壮观霉素的l培养液中将ldn143/pbl.comk菌株生长过夜。在含有一百(100)ppm壮观霉素的新鲜l培养液中将培养物稀释至0.7的od600。将此新培养物在37℃和250rpm下生长一(1)小时。将d-木糖添加至0.1%w·v-1,并且将培养物再生长四(4)小时。将细胞以1700·g收获七(7)分钟。以含有10%v·v-1dmso的用过的培养基的四分之一(1/4)培养体积重悬细胞。将一百(100)μl的细胞与十(10)μl的prf869(seqidno:70)、prf874(seqidno:80)、prf879(seqidno:83)、prf899(seqidno:86)、或prf901(seqidno:89)质粒rca扩增产物混合。将细胞/dna混合物在37℃1400rpm孵育一个半(1.5)小时。然后将混合物铺板到含有二十(20)ppm卡那霉素的l琼脂板上。将接种的板在37℃孵育四十八至七十二(48-72)小时。使用菌落pcr筛选含有二十(20)ppm卡那霉素的l琼脂上形成的菌落,从而确认如以下描述的基因座的修饰。[0355]对于用prf869(seqidno:70)转化的细胞,使用标准pcr技术,使用下表14中列出的正向(seqidno:106)和反向(seqidno:107)引物扩增rghr2基因。[0356]表14[0357]正向和反向引物对[0358]正向gcgaatcgaaaacggaaagcseqidno:106反向tcatcgcgatcggcattacgseqidno:107[0359]此pcr产物是1,164个核苷酸的片段,该片段包含rghr2的靶区域(seqidno:108);使用桑格的方法,使用下表15中列出的正向(seqidno:110)引物,将该产物测序,从而确认rghr2终止等位基因(seqidno:109)的引入,该等位基因包含三(3)个框内无义突变。将具有rghr2终止等位基因(seqidno:109)的分离株作为菌株bf314存储。[0360]表15[0361]rghr2终止测序引物[0362]正向tttcgactttctcgtgcaggseqidno:110[0363]对于用prf874(seqidno:80)转化的细胞,使用下表16中列出的正向(seqidno:111)和反向(seqidno:112)引物扩增rghr1基因区。[0364]表16[0365]正向和反向引物对[0366]正向atcaaacatgccatgtttgcseqidno:111反向aggttgagcaggtcttcgseqidno:112[0367]由表16中的引物产生的天然rghr1片段(seqidno:113)的长度是1,499个核苷酸。当rghr1基因缺失(δrghr1)时,由表16中的引物产生的片段(seqidno:114)的长度是1,097个核苷酸,并且在电泳时明显更小。将包含rghr1等位基因缺失(δrghr1;seqidno:114)的ldn143的分离株作为菌株bf324存储。[0368]对于用prf879(seqidno:83)转化的细胞,使用下表17中列出的正向(seqidno:115)和反向(seqidno:116)引物扩增rghr2基因基因座。[0369]表17[0370]正向和反向引物对[0371]正向gagattgcgaggttttggccseqidno:115反向ggcatacggcgtattgttcgseqidno:116[0372]由表17中的引物产生的天然rghr2片段(seqidno:117)的长度是1,629个核苷酸。当rghr2基因缺失(δrghr2)时,由表17中的引物产生的片段(seqidno:118)的长度是1,248个核苷酸,并且在电泳时明显更小。将包含δrghr2基因座等位基因(seqidno:118)的ldn143的分离株作为菌株bf377存储。[0373]对于用prf899(seqidno:86)转化的细胞,使用下表18中列出的正向(seqidno:119)和反向(seqidno:120)引物扩增rghr2rghr1区。[0374]表18[0375]正向和反向引物对[0376]正向atgatattttcgccgtcggtseqidno:119反向aacgatgcaggagctcaattseqidno:120[0377]由表18中的引物从亲本菌株ldn143产生的天然rghr2rghr1片段(seqidno:121)的长度是2,353个核苷酸。当rghr2和rghr1基因缺失(δrghr2δrghr1)时,由表18中的引物产生的片段(seqidno:122)的长度是1,401个核苷酸,并且在电泳时明显更小。将包含δrghr2δrghr1等位基因(seqidno:122)的ldn143的分离株作为bf389存储。[0378]对于用prf901(seqidno:89)转化的细胞,使用下表19中列出的正向(seqidno:123)和反向(seqidno:124)引物扩增rghr2基因座。[0379]表19[0380]正向和反向引物对[0381]正向catgacgtctttccaccagtseqidno:123反向aacgatgcaggagctcaattseqidno:124[0382]由表19中的引物从亲本菌株ldn143产生的天然rghr2片段(seqidno:125)的长度是3,265个核苷酸。当rghr2、rghr1、yvzc和3644基因缺失(δrghr2、δrghr1、δyvzc和δ3644)时,由表19中的引物产生的片段(seqidno:126)的长度是1,596个核苷酸,并且在电泳时明显更小。将包含δrghr2、δrghr1、δyvzc和δ3644等位基因的ldn143的分离株作为bf391存储。[0383]实例4[0384]在具有经修饰的rghr基因座的芽孢杆菌属菌株中的淀粉酶生产[0385]为了确定各种rghr基因座等位基因对α-淀粉酶生产的影响,在标准小规模测定条件下,一式三份使菌株生长,如pct公开号wo2018/156705(该文献通过援引以其全文并入本文)中一般性描述地。按照制造商的说明书,使用bradford蛋白测定(pierce),测定变体(噬细胞菌属物种)α-淀粉酶的产量。因此,确定了每种菌株的平均α-淀粉酶生产,并且归一化到亲本菌株ldn143,如下表20中示出。[0386]表20[0387]不同rghr基因座等位基因的淀粉酶生产的相对产量[0388]菌株相对基因型rghr基因座seqid相对产量±semldn143seqidno:1271.00±0.10bf314rghr2终止seqidno:1281.23±0.07bf324δrghr1seqidno:1291.26±0.13bf377δrghr2seqidno:1301.62±0.08bf389δrghr2δrghr1seqidno:1311.35±0.02bf391δrghr2δrghr1δyvzcδ3644seqidno:1321.30±0.02[0389]如上表20中示出,在rghr基因座中具有突变的地衣芽孢杆菌细胞/菌株表现出增加的异源α-淀粉酶蛋白生产,与可比较的亲本细胞(ldn143)(其rghr基因座为野生型)相比,生产的淀粉酶蛋白多大约23%-62%。[0390]实例5[0391]在具有经修饰的rghr基因座的芽孢杆菌属菌株中的普切明生产[0392]如以上在部分iii中简要陈述,rghr基因座的独特特征是对如下操纵子进行转录控制,该操纵子负责生产铁清除色素普切明酸。例如,已知普切明酸与细胞外的铁离子反应,从而形成不溶性红色色素。此红色色素可以重新溶解为钠盐,并且使用410nm处的吸光度进行定量(uffen和canale-parola,1972)。简而言之,在4000rpm,经十(10)分钟收获十(10)ml的培养物上清液。用水洗涤沉淀物2次。将沉淀物重悬在一(1)ml的1nnaoh中,并且在室温孵育十(10)分钟,从而允许不溶性普切明转化为可溶性普切明酸钠(sodiumpulcherrimate)。用14000rpm短暂离心去除剩余碎片。针对1nnaoh空白对照,测量410nm处的吸光度。[0393]表21[0394]普切明酸的定量[0395]菌株相对基因型rghr2基因座seqidno相对a410ldn143seqidno:1271.0bf314rghr2终止seqidno:1280.7bf324δrghr1seqidno:1291.1bf377δrghr2seqidno:1300.5bf389δrghr2δrghr1seqidno:1311.2bf391δrghr2δrghr1δyvzcδ3644seqidno:1321.1[0396]因此,如上表21中所示,rghr基因座中的几个突变使普切明生产相对于亲本显著降低了约30%-50%(例如bf314和bf377),而几个其他突变使普切明生产相对于亲本增加了约10%-20%(例如bf324、bf389和bf391),这说明rghr基因座中的突变控制普切明酸的生物合成。[0397]在生产异源淀粉酶蛋白时,为测量各种菌株的生物质的相对产量,在600nm处测量了二百(200)μl的培养物的光密度(od),如下表22中示出。[0398]表22[0399]相对光密度[0400]publishingcorp.,1989.[0425]fisheret.al.,arch.microbiol.,139:213-217,1981.[0426]guerot-fleury,gene,167:335-337,1995.[0427]hamoenetal.,“controllingcompetenceinbacillussubtilis:sharedusedofregulators”,microbiology,149:9-17,2003.[0428]hamoenetal.,genesdev.12:1539-1550,1998.[0429]hamptonetal.,seroloαicalmethods,alaboratorymanual,apspress,st.paul,mn,1990.[0430]hardwoodandcutting(eds.)molecularbiologicalmethodsforbacillus,johnwiley&sons,1990.[0431]hayashietal.,2006[0432]hayashietal.,mol.microbiol.,59(6):1714-1729,2006[0433]higuchietal.,nucleicacidsresearch16:7351,1988.[0434]hoetal.,gene77:61,1989.[0435]hochetal.,j.bacteriol.,93:1925-1937,1967.[0436]holubova,foliamicrobiol.,30:97,1985.[0437]hopwood,theisolationofmutantsinmethodsinmicrobiology(j.r.norrisandd.w.ribbons,eds.)pp363-433,academicpress,newyork,1970.[0438]hortonetal.,gene77:61,1989.[0439]hsiaetal.,analbiochem.,242:221-227,1999.[0440]iglesiasandtrautner,moleculargeneralgenetics189:73-76,1983.[0441]jensenetal.,“cell-associateddegradationaffectstheyieldofsecretedengineeredandheterologousproteinsinthebacillussubtilisexpressionsystem”microbiology,146(pt10:2583-2594,2000.[0442]liuandzuber,1998,[0443]loetal.,proceedingsofthenationalacademyofsciencesusa81:2285,1985.[0444]maddoxetal.,j.exp.med.,158:1211,1983.[0445]mannetal.,currentmicrobiol.,13:131-135,1986.[0446]mcdonald,j.gen.microbiol.,130:203,1984.[0447]macdonald,“biosynthesisofpulcherriminicacid”,biochem.j.,96:533-538,1965.[0448]needlemanandwunsch,j.mol.biol.,48:443,1970.[0449]ogura&fujita,femsmicrobiollett.,268(1):73-80.2007.[0450]olempska-beeretal.,“food-processingenzymesfromrecombinantmicroorganisms‑‑areview”’regul.toxicol.pharmacol.,45(2):144-158,2006.[0451]palmerosetal.,gene247:255-264,2000.[0452]parishandstoker,femsmicrobiologyletters154:151-157,1997.[0453]pearsonandlipman,proc.natl.acad.sci.usa85:2444,1988.[0454]perego,1993,ina.l.sonneshein,j.a.hoch,andr.losick,editors,bacillussubtilisandothergram-positivebacteria,chapter42,americansocietyofmicrobiology,washington,d.c.[0455]rauletal.,“productionandpartialpurificationofalphaamylasefrombacillussubtilis(mtcc121)usingsolidstatefermentation”,biochemistryresearchinternational,2014.[0456]sarkarandsommer,biotechniques8:404,1990.[0457]saundersetal.,j.bacteriol.,157:718-726,1984.[0458]shimada,meth.mol.biol.57:157;1996[0459]smithandwaterman,adv.appl.math.,2:482,1981.[0460]smithetal.,appl.env.microbiol.,51:6341986.[0461]stahlandferrari,j.bacteriol.,158:411-418,1984.[0462]stahletal,j.bacteriol.,158:411-418,1984.[0463]tarkinen,etal,j.biol.chem.258:1007-1013,1983.[0464]trieu-cuotetal.,gene,23:331-341,1983.[0465]uffenandcanale-parola,“synthesisofpulcherriminicacidbybacillussubtilis”,j.bacteriol111(1):86-93,1972.[0466]vandijlandhecker,“bacillussubtilis:fromsoilbacteriumtosuper-secretingcellfactory”,microbialcellfactories,12(3).2013.[0467]vorobjevaetal.,femsmicrobiol.lett.,7:261-263,1980.[0468]ward,"proteinases,"infogarty(ed.).,microbialenzymesandbiotechnology.appliedscience,london,pp251-317,1983.[0469]wellsetal.,nucleicacidsres.11:7911-7925,1983.[0470]westersetal.,“bacillussubtilisascellfactoryforpharmaceuticalproteins:abiotechnologicalapproachtooptimizethehostorganism”,biochimicaetbiophysicaacta.,1694:299-310,2004.[0471]yangetal,j.bacteriol.,160:15-21,1984.[0472]yangetal.,nucleicacidsres.11:237-249,1983.[0473]youngmanetal.,proc.natl.acad.sci.usa80:2305-2309,1983.当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献