CN102224242A

CN102224242A - 新基因簇

Info

Publication number: CN102224242A
Application number: CN2009801466167A
Authority: CN
Inventors: 刘�文; 姜楠; 瞿旭东
Original assignee: Shanghai Institute of Organic Chemistry of CAS
Current assignee: Shanghai Institute of Organic Chemistry of CAS
Priority date: 2008-09-24
Filing date: 2009-09-24
Publication date: 2011-10-19
Anticipated expiration: 2029-09-24
Also published as: EP2342335B1; WO2010034243A1; JP5789190B2; CN102224242B; US8962329B2; EP2342335A4; JP2012503478A; US20110229941A1; EP2342335A1; ES2556211T3

Abstract

本发明涉及新的分离的DNA序列，其包含全部或部分编码萨菲菌素合酶的基因簇、参与非核糖体肽/聚酮化合物混合化合物的生物合成的加工及调控基因，或具有改变的生物合成能力的突变体，由该DNA或突变体编码的多肽或其突变体，含有该DNA或其突变体的载体，由该DNA、其突变体或载体转化的宿主细胞，以及产生萨菲菌素化合物的方法。本发明还提供了具有亲环蛋白抑制活性的化合物，其用作免疫抑制剂、抗病毒剂或心脏保护剂。

Description

新基因簇

引言

本发明涉及包含编码萨菲菌素(sanglifehrin)合酶的基因簇的新的分离DNA序列，参与非核糖体肽/聚酮化合物混合化合物的生物合成的加工和调节基因，或具有改变的生物合成能力的突变体，由该DNA或突变体编码的多肽或其突变体，含有该DNA或其突变体的载体，由该DNA、其突变体或载体转化的宿主细胞，以及生产萨菲菌素化合物的方法。本发明还提供了具有亲环蛋白抑制活性的化合物，其可用作免疫抑制剂、抗病毒剂或心脏保护剂。

发明领域

本发明涉及微生物遗传资源和基因工程领域，并且尤其涉及免疫抑制剂萨菲菌素A及相关类似物的生物合成基因簇的克隆、序列分析、体内功能验证及其应用。

背景技术

免疫抑制剂萨菲菌素A(SFA)是由链霉菌A92-308110(Streptomyces sp.A92-308110，也称为淡黄链霉菌(Streptomyces flaveolus)或链霉菌DSM9954)产生的聚酮化合物-肽混合天然产物(Sanglier等，1999；Fehr等，1999；WO 97/02285)。至今已经公开了20多种萨菲菌素结构类似物的分离，SFA在这些类似物中具有最高的免疫抑制活性之一(Kallen等，2005；Sanglier等，1999)。从结构上来看SFA中22元大环内酯骨架由聚酮化合物碳链和三肽链组成。该肽链包含一个天然氨基酸：缬氨酸，以及两个非天然氨基酸：(S)-m-酪氨酸和(S)-六氢哒嗪-3-羧酸((S)-piperazic acid)，它们以酰氨键连接，并且六氢哒嗪-3-羧酸1位β-氮原子参与酰氨键的形成，这是在迄今分离的所有含有六氢哒嗪-3-羧酸结构的天然产物中唯一一例。此外，一个螺环单元通过一条聚酮化合物长链和大环内酯相连，形成提篮式结构。螺环部分含有九个手性中心(SFA总共具有17个)，中间含有一个季碳中心，这在目前描述的天然产物中是独特的。已从链霉菌A92-308110(淡黄链霉菌)的发酵肉汤中直接分离了一系列类似物，包括萨菲菌素B、C、D、E、F、G、H、I、J、K和L(Fehr等，1999，Sanglier等，1999，WO98/07743)。特别地，已显示萨菲菌素B(SFB)在MLR测试法中具有比SFA更高的免疫抑制活性(Sanglier等，1999)。尽管经过大量的努力实现了SFA及其大环类似物的总合成(Sedrani等2003；Nicolau等，1999；Paquette等，2002；Metternich等，1999)，但是没有对其生物合成途径进行具体的体内和体外研究。

SFA具有强的免疫抑制活性(Powell和Zheng，2006)，抑制HIV和HCV感染(Zander等，2003；Sokolskaja等，2004；Watashi等，2005)，以及阻止由于线粒体膜通透性转运孔(MPTP)病理性开放导致的严重的心脏细胞死亡(Clarke等，2002)。与目前临床使用的免疫抑制剂，诸如环孢菌素(CsA)、FK506和雷帕霉素(rapamycin)相比，SFA有相似的作用机制，但是又具有不同的效应靶点(

等，2006，Zhang&Liu.，2001；Zenke等，2001)。CsA作用于亲环蛋白A(CypA)(Handschumacher等，1984)，FK506和雷帕霉素与FKBP结合形成复合物(Schreiber，1991)；而CsA-CypA复合物及FK506-FKBP复合物与相同的目标蛋白钙依赖磷酸酶(calcineurin)相互作用，由此抑制钙依赖磷酸酶的丝氨酸/苏氨酸磷酸酶活性，并且阻断细胞因子产生，尤其是阻断了白细胞介素2(IL-2)的转录，其最终导致T细胞阻滞在G₀-G₁期(Liu等，1991)。Rap-FKBP复合物与蛋白激酶FRAP(也称为RAFT或mTOR)相互作用(Brown等，1994)，并且阻止了T细胞上IL-2受体的磷酸化，使T细胞生长被阻断在G1-S期。而已显示SFA与亲环蛋白诸如亲环蛋白A和B结合，并且抑制它们的异构酶活性(Zenke等，2001)，目前SFA-CypA复合物的效应蛋白仍然未知。

由于现在仍未能发现SFA-CypA复合物的效应蛋白，所以提示SFA的免疫抑制活性并不是通过SFA-CypA复合物直接介导的。近3年来，众多的科学小组研究发现，SFA可以竞争性阻止NF-κB与P53基因上游的转录位点结合从而活化P53，进而抑制信号通路下游的Cyclin E-cdk2的磷酸化，由此抑制应答IL-2引起的Rb高磷酸化，使得细胞对IL-2不敏感，其使得细胞停留在G1-S期(Zhang&Liu，2001)。其次，SFA以一种未知的机制在不影响人类树突细胞生长的情况下抑制了IL-12p⁷⁰的产生(Steinschulte等，2003)。IL-12p⁷⁰在调控Th1和NK细胞增殖方面起着关键的作用，是连接先天性免疫和获得性免疫的桥梁。此外，由于现有可商购的免疫抑制药物会产生严重的肾毒性和中枢神经系统毒性副作用(Paquette等，2002)，因此阻碍了它们在一些免疫失调疾病方面的应用(例如，钙依赖磷酸酶(calcineurin)同时是CsA和FK506的免疫抑制活性和毒性的根本原因)。为了开发可替代的免疫抑制剂或免疫修饰剂，其他组已经将SFA作为新一代低毒的高效免疫抑制剂进行了一些开发(WO97/02285)。

利用X射线衍射对SFA大环片段和CypA之间结构-活性关系研究表明三肽结构嵌入在CypA的沟内并且对结合至关重要，而分别位于17位和14位上的侧链羟基和羰基对于结合不太重要；饱和C18-C20位反式二烯的缺失使结合常数降低7倍，提示反式二烯对构象有稳定作用(Sedrani等，2003)。计算机建模研究显示SFA螺环单元也对稳定SFA-CypA的结合有贡献(Pemberton等，2003)。完整的SFA-CypA复合物的晶体结构显示SFA-CypA和CsA-CypA的结合区域基本相同，并且SFA和CsA都主要和W121、R55、H126、N102和Q63残基相互作用；大环和螺环部分之间的C24-C32链和CypA的I57、T119和W121残基有范德华作用，另外与CypA的晶体结构相比，SFA聚酮化合物长链的存在改变了W121侧链取向；螺环单元中，只有甲基C45和CypA的I57和F60的侧链原子有范德华作用(Kallen等，2005)。

SFA-CypA复合物可以以二聚体形式稳定存在，如通过凝胶过滤色谱所证实的那样。根据晶体分析发现，除了螺二环和α-酮基丁酸酯部分之外，SFA所有的剩余部分都深深的埋入二聚体中；E，E-二烯区域C18-C22虽然不参与和CypA的直接接触，但却和二聚体中相邻SFA的间位酪氨酸有范德华作用，其有利于复合物中二聚体的缔合；两个SFA分子在C18-C22中彼此间有范德华力作用；并且，二聚体复合物中一个CypA分子的W121和另一CypA分子的R148有直接氢键连接。

应用已知产生SFA的链霉菌，即链霉菌A92-308110(淡黄链霉菌)，本发明人克隆了其生物合成基因簇，并采用微生物学、分子生物学、生物化学及有机化学相结合的方法进一步研究SFA的生物合成。通过对生物合成的研究，揭示了产生诸如六氢哒嗪-3-羧酸的独特化学结构的酶学机理。在此基础上，对SFA的生物合成途径进行了遗传修饰，并产生了新的化合物。

由于本发明能够商业应用重组DNA技术和生物合成工程，以提高萨菲菌素的产量和新萨菲菌素类似物的产生，因此本发明尤其有用。

发明概述

本发明有利地提供了参与产生生物合成基因产物、尤其是萨菲菌素生物合成的新DNA序列和蛋白质。该基因和蛋白的特定实施方案在所附序列表和以下描述中得以详细描述。SEQ ID No.1提供了负责萨菲菌素A生物合成的的核酸。

因此，本发明涉及一种由链霉菌A92-308110(淡黄链霉菌)(可从DSMZ，Braunschweig，Germany作为链霉菌DSM 9954获得)产生的免疫抑制性的聚酮化合物-非核糖体肽天然产物SFA的生物合成基因簇的克隆、序列分析、功能验证、体外生化分析及其应用。此外，对产生萨菲菌素的生物合成途径的编码基因进行了靶向改变，导致了产生新萨菲菌素类似物的微生物菌株。

本发明允许通过对参与萨菲菌素A生物合成的基因和蛋白的生物合成工程，从而直接操作萨菲菌素A及相关的化学结构。这些化学修饰可能是由于结构的复杂性而不能或不容易通过化学方法而实现的。

以这一方式分离和表征的基因簇使得能够靶向优化萨菲菌素和萨菲菌素类似物的产生，例如，通过加倍基因簇、或该基因簇的一部分，通过应用质粒载体和非天然启动子过量表达基因(尤其是正向调控基因)，或通过失活负向调控子。此外，该测序的和所表征的基因簇使得能够靶向性生物合成制备萨菲菌素类似物，其许多实例均包括在本发明中。

实例包括以下：

●失活编码参与分别的生物合成步骤的蛋白的基因，例如通过基因破坏(例如参见，WO 2004/007709；WO 2004/058976)

●替换编码参与分别的生物合成步骤的蛋白的基因，通过基因替换或通过破坏并随后分开表达来自其它生物合成途径的基因(例如，参见Gaisser等，2001；WO 01/79520；WO 2005/054266；WO2005/054265)。

●用来自其它PKS或NRPS簇的模块或结构域替换聚酮化合物合酶(“PKS”)或非核糖体肽合酶(“NRPS”)中的分别的模块或结构域，从而使得产生新的萨菲菌素类似物(例如，如在Oliynyk等，1996；WO98/01546；WO 00/01827；Staunton和Wilkinson，2001；Sheehan等，2006中所描述的那样。)

●应用该基因序列以鉴定来自其它生物的相关生物合成簇，例如通过用作DNA探针(参见例如，Shen等，2002；Liu等，2002；Li等，2004；Huang等，2005；Jia等，2006；Fang等，2008)。

因此，根据本发明的第一方面，提供了分离的核酸分子，其包含：

(a)包含SEQ ID No.1的萨菲菌素A生物合成基因簇核酸；

(b)与(a)的核酸具有至少80％序列同一性(例如，至少85％或90％或95％或96％或97％或98％或99％的序列同一性)，并且其编码的多肽和由(a)的核酸编码的那些多肽具有用于制备聚酮化合物或聚酮化合物起始单元的相同的用酶活性和调控活性；

(c)核酸，其编码与由(a)的核酸编码的一种或多种多肽具有至少80％氨基酸序列同一性(例如，至少85％或90％或95％或96％或97％或98％或99％的序列同一性)的一种或多种多肽，并且其编码的一种或多种多肽具有制备聚酮化合物或聚酮化合物起始单元或前体所需的一种或多种酶活性或调控活性；

(d)(a)、(b)或(c)的核酸部分，其编码聚酮化合物合酶或非核糖体肽合酶多肽；或者任一聚酮化合物合酶或非核糖体肽合酶多肽、或聚酮化合物起始单元或前体生物合成基因产物或聚酮化合物生物合成调控多肽的酶活性模块；或

(e)(d)的核酸部分，其编码聚酮化合物合酶或非核糖体肽合酶多肽的酶活性结构域；或者任一聚酮化合物合酶或非核糖体肽合酶多肽、或聚酮化合物起始单元或前体生物合成基因产物或聚酮化合物生物合成调控多肽的酶活性模块的酶活性结构域。

在下述内容中将详细描述本发明的这一方面和其他方面。

定义：

本文所使用的冠词“一”、“一个”涉及一个或超过一个(即至少一个)该冠词的文法客体。例如，“一种类似物”的意思是一种类似物或超过一种类似物。

本文所使用的术语“类似物”是指与另一化学物结构上类似、但是在构成上有细微区别的化合物(如通过另一原子置换一个原子，或存在或缺失特定的官能团)。

本文所使用的术语“聚酮化合物”是指由涉及聚酮化合物合酶(PKS)的生物合成产生的任何分子。这还可以包括来自非核糖体肽合酶(NRPS)结构域的一些元件和/或其他生物合成修饰，诸如甲基化或羟基化。

本文所使用的术语“杂化聚酮化合物(hybrid polyketide)”是指由涉及聚酮化合物合酶(PKS)的生物合成产生的任何分子，其中通过人为干预改变了编码该聚酮化合物合酶的基因簇，从而产生不同的生物合成产物。这还可以包括来自非核糖体肽合酶结构域的一些元件和/或其他生物合成修饰，诸如甲基化或羟基化。改变本身可包括但不限于，结构域(例如，酰基转移酶结构域)的定向诱变，来自相同或异源PKS或NRPS簇的结构域、模块或基因的置换。

如本文所使用的术语“高严格条件”是指其中仅有非常密切相关或同一的DNA序列可杂交的条件。这在Southern杂交中通常通过升高洗涤缓冲液的温度来实现。对于寡核苷酸探针，可在比T_m高5℃的温度对完全匹配的序列进行杂交步骤，其中应用公式计算T_m，诸如T_m＝4×(GC碱基对数)+2×(AT碱基对数)。在以下标题“核酸杂交”中给出了高严格条件的实例。

本文所使用的与核酸序列、尤其是萨菲菌素生物合成簇或其部分相关的术语“异源宿主”是指天然不含有此类核酸序列的宿主。

本文所使用的术语“异源”，例如与萨菲菌素PKS或NRPS的结构域或模块相关时，其意思是在该PKS或NRPS中不天然存在的结构域或模块。

本文所使用的术语“非天然的”，例如与萨菲菌素PKS或NRPS的结构域或模块相关时，其意思是在该PKS或NRPS中不天然存在于该位置中的结构域或模块；例如其可能是异源的(即，来自不同的PKS或NRPS)，或其可以是存在于该同一PKS或NRPS的不同位置。

本发明化合物诸如式(I)化合物的可药用盐包括从可药用无机的或有机的酸或碱形成的常规盐，以及季铵酸加成盐。合适的酸盐的更具体实例包括：盐酸盐、氢溴酸盐、硫酸盐、磷酸盐、硝酸盐、高氯酸盐、富马酸盐、醋酸盐、丙酸盐、琥珀酸盐、乙醇酸盐、蚁酸盐、乳酸盐、马来酸盐、酒石酸盐、柠檬酸盐、棕榈酸盐、丙二酸盐、羟基马来酸盐、苯醋酸盐、谷氨酸盐、苯甲酸盐、水杨酸盐、富马酸盐、甲苯磺酸盐、甲磺酸盐、萘-2-磺酸盐、苯磺酸羟萘甲酸盐、氢碘酸盐、苹果酸盐、硬脂酸盐、单宁酸盐等。盐酸盐是特别有益的。其他酸，诸如草酸，尽管其本身不是可药用的，但可用于制备用作中间体的有用盐，获得本发明的化合物及其可药用盐。合适的碱盐的更具体的实例包括钠盐、锂盐、钾盐、镁盐、铝盐、钙盐、锌盐、N，N′-二苄乙烯二胺盐、氯普鲁卡因盐、胆碱盐、二乙醇胺盐、乙二胺盐、N-甲葡糖胺盐和普鲁卡因盐。下文提及根据本发明的化合物时，其包括式(I)化合物及它们的可药用盐。

烷基、烯基和炔基可以是直链或支链的。

烷基，例如C1-C4烷基的实例包括甲基、乙基、正丙基、异丙基和正丁基。

发明详述

根据本发明的全基因簇包含24个基因(SEQ ID NO：1)的核苷酸序列或其互补序列，其包括：

●1个非核糖体肽合酶(NRPS)基因sfaD，其包含共包含3个模块，10个功能结构域，并且负责大环骨架的肽部分的形成；

●5个线性聚酮化合物合酶(PKS)基因sfaE、sfaF、sfaG、sfaH、sfaI，负责螺环、聚酮化合物长链和大环骨架聚酮化合物部分的形成；

●1个重复型聚酮化合物合酶基因sfaK，其包含4个功能结构域，负责在生物合成不寻常的7-碳延伸单元途经中使用的特殊6-碳前体的生物合成；

●3个基因，sfaA、sfaB、sfaJ，其负责非天然氨基酸前体结构单元的生物合成；

●7个基因，sfaM、sfaN、sfaP、sfaQ、sfaL、sfaR、sfaO，其负责前体诸如用于起始单元的那些前体的生物合成；

●1个调控基因sfaC，其与SFA发酵产量相关；

●1个MbtH蛋白的编码基因，sfaS，认为与NRPS的调控相关联；以及

●5个未知功能基因sfaU1、sfaU2、sfaV1、sfaV2、sfaV3。

因此，本发明还提供了包含以下一种或多种的分离核酸分子：(a)选自sfaE、sfaF、sfaG、sfaH和sfaI的线性PKS基因，或(b)NPRS基因sfaD，或(c)重复型PKS基因sfaK，或(d)选自sfaA、sfaB、sfaJ、sfaM、sfaN、sfaP、sfaQ、sfaL、sfaO的起始单元或前体生物合成基因，或(e)调控基因sfaC，或(f)MtbH蛋白编码基因sfaS，或(g)或巴豆酰辅酶A还原酶基因sfaR，或(h)选自sfaU1、sfaU2、sfaV1、sfaV2和sfaV3的未知功能基因。

前述基因一般地由编码SEQ ID No.2-25的蛋白质的核酸定义。

具体地，本发明提供了分离的核酸分子，其包含以下一种或多种：(a)选自SEQ ID No.1残基30707-37360处的sfaE、SEQ ID No.1残基37394-50014处的sfaF、SEQ ID No.1残基50017-60903处的sfaG、SEQ ID No.1残基60918-85823处的sfaH和SEQ ID No.1残基85823-96040处的sfaI的线性PKS基因，或(b)SEQ ID No.1残基19885-30714处的NPRS基因sfaD，或(c)SEQ ID No.1残基97396-101840处的重复型PKS基因sfaK，或(d)选自SEQ ID No.1残基17024-17854处的sfaA、SEQ ID No.1残基17851-19191处的sfaB、SEQ ID No.1残基96225-97391处的sfaJ、SEQ ID No.1残基103210-103929处的sfaM、SEQ ID No.1残基104001-105023处的sfaN、SEQ ID No.1残基105366-107216处的sfaP、SEQ ID No.1残基107366-108145处的sfaQ、SEQ ID No.1残基101936-103213处的sfaL、SEQ ID No.1残基105091-105345处的sfaO的起始单元或前体生物合成基因，或(e)SEQ ID No.1残基19193-19888处的调控基因sfaC，或(f)SEQ ID No.1残基109583-109798处的MtbH蛋白编码基因sfaS，或(g)或SEQ ID No.1残基108150-109511处的巴豆酰辅酶A还原酶基因sfaR，或(h)选自SEQ ID No.1残基14973-15413处的sfaU1、SEQ ID No.1残基15596-16063处的sfaU2、SEQ ID No.1残基109776-110312处的sfaV1、SEQ ID No.1残基111285-111743处的sfaV2和SEQ ID No.1残基112218-112652处的sfaV3的未知功能基因；或包含编码一种或多种与上述基因编码的那些多肽相同的多肽、但其仅由于遗传密码的丰余性而不同的核酸序列；或包含在高严格条件下能与一种或多种上述基因序列杂交的核酸序列；或包含这样的核酸序列，所述核酸序列与一种或多种上述基因序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性，并编码与相应的基因产物具有相同功能的多肽；或包含编码一种或多种和前述基因编码的一种或多种多肽具有至少80％氨基酸序列同一性(例如，至少85％或90％或95％或96％或97％或98％或99％序列同一性)、并且具有相同功能的多肽的核酸序列；或包含一种或多种前述基因的至少50、100、200或500个连续核苷酸的片段；或任一前述核酸序列的互补序列。

还提供了分离的核酸分子，其包含以下一种或多种：(a)来自PKS基因的模块或结构域，其中所述的PKS基因选自SEQ ID No.1残基30707-37360处的sfaE、SEQ ID No.1残基37394-50014处的sfaF、SEQ ID No.1残基50017-60903处的sfaG、SEQ ID No.1残基60918-85823处的sfaH或SEQ ID No.1残基85823-96040处的sfaI，或(b)SEQ ID No.1残基19885-30714处的NPRS基因sfaD的模块或结构域，或(c)SEQ ID No.1残基97396-101840处的重复型PKS基因sfaK的模块或结构域；或包含编码与上述基因编码的那些多肽相同的多肽的一个或多个模块或结构域、但其仅由于遗传密码的丰余性而不同的核酸序列；或包含在高严格条件下能与一种或多种上述核酸分子杂交的核酸序列；或包含这样的核酸序列，所述核酸序列与一种或多种上述核酸分子具有至少70％的同一性，并编码与相应的基因产物的模块或结构域具有相同功能的多肽；或包含编码一种或多种和由前述基因的模块或结构域编码的一种或多种多肽具有至少80％氨基酸序列同一性、并且具有相同功能的多肽的核酸序列；或包含前述基因的一个或多个模块或结构域的至少50个连续核苷酸的片段；或任一前述核酸序列的互补序列。

基因的模块或结构域是基因中的一部分，其编码相应基因产物的模块或结构域。

还提供了基于SEQ ID No.1的产生杂化聚酮化合物的基因簇核酸，其中一个或多个(例如，一个)结构域、模块或基因被缺失、被突变以使酶功能或调节功能失活或减少活性，被突变以具有改变的功能，或由替代物替换，或其中插入了一个或多个(例如，一个)非天然的结构域、模块或基因，例如，其中由(a)来自萨菲菌素A生物合成基因簇其他位置的结构域、模块或基因或(b)与萨菲菌素A生物合成基因簇异源的结构域、模块或基因替换一个或多个(例如，一个)结构域、模块或基因，或其中一个或多个(例如，一个)结构域、模块或基因被突变，以使酶功能或调节功能失活或减少活性。

例如，提供了产生杂化聚酮化合物的基因簇核酸，其中修饰了一个或多个选自sfaE、F、G、H和I的PKS基因，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块，例如由此插入了一个或多个来自SFA生物合成基因簇其他位置、或来自异源聚酮化合物生物合成基因簇的结构域或模块。

可参考图7看到PKS基因sfaE、F、G、H和I的模块。因此，所述模块可一般地包含KS-AT-ACP或KS-AT-DH-KR-ACP或KS-AT-KR-ACP或KS-AT-DH-ER-KR-ACP结构域。

例如：

-AT结构域可由具有不同底物特异性的来自异源PKS或来自该SFAPKS中其他位置的AT结构域替换；和/或

-DH结构域可被缺失或使其失活；和/或

-可将来自SFA PKS或来自异源PKS的DH结构域插入模块中；

-ER结构域可被缺失或使其失活；和/或

-可将来自SFA PKS或来自异源PKS的ER结构域插入模块中；

-给定模块(意思是当存在时的DH-KR或DH-ER-KR或KR结构域)中的还原环可由具有不同元件的还原环替换。

在一个实施方案中，模块13的AT结构域可由具有不同底物特异性(例如，对甲基丙二酰基具有特异性)的来自SFA PKS或来自异源PKS的AT结构域替换。这一特定的突变导致在14位中引入甲基。

在一个实施方案中，模块1、3、6、7、8、10、11中13中的一个或多个模块的DH结构域被缺失或失活。这些特定的突变导致将一个或多个羟基引入分子，例如在位置21和/或25。

还提供了产生杂化聚酮化合物的基因簇核酸，其中修饰了NRPS基因sfaD，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块。

还提供了产生杂化聚酮化合物的基因簇核酸，其中修饰了调节基因sfaC，以提高或降低其活性，或该基因被缺失。

还提供了产生杂化聚酮化合物的基因簇核酸，其中修饰了重复型PKS基因sfaK，由此一个或多个结构域被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然结构域，例如由此插入了一个或多个来自SFA生物合成基因簇其他位置、或来自异源聚酮化合物生物合成基因簇的结构域。

可参考图7看到重复型PKS基因sfaK的模块。因此，该模块包含KS-AT-ACP-KR结构域。

还提供了产生杂化聚酮化合物的基因簇核酸，其中缺失了选自sfaA、B、J、M、N、P、Q、L和O的一个或多个起始单元或前体生物合成基因，或对其进行了修饰，以降低它们的活性，或对它们进行修饰或替换以改变它们的底物选择性。

还提供了产生杂化聚酮化合物的基因簇核酸，其中一个或多个起始单元或前体生物合成基因或一个或多个含有一个或多个起始单元或前体生物合成基因的操纵子被缺失、或被突变以失活、或与天然基因或操纵子相比在产生所述起始单元或前体方面的活性减少。

本发明这一方面的更优选的实施方案包括编码SEQ ID No.1的PKS或NRPS的结构域的分离的核酸，残基19885-30714、30707-37360、37394-50014、50017-60903、60918-85823、85823-96040。这些核酸可单独使用，或与编码其他PKS或NRPS结构域或模块的核酸联合作为中间体使用，例如，用于构建重组载体。

本发明还提供了用于鉴定、分离和克隆包括任一个上述DNA片段的核酸的方法。优选的方法例如包括以下步骤：

a)建立基因组DNA库(例如，粘粒文库)

b)在本发明DNA序列的帮助下筛选这一库

c)分离鉴定为阳性的克隆。

用于鉴定参与萨菲菌素生物合成的DNA片段的一般方法例如包括以下步骤：

a.可通过对粘粒文库实施DNA印迹法，用来自SEQ ID No.1的DNA片段(例如～1kb)作为探针，找出与萨菲菌素簇同源的克隆片段，从而分离与萨菲菌素基因簇同源的DNA片段。

b.然后获得看起来与探针杂交的粘粒，并DNA测序。

c.然后通过用经标记的上述分离的粘粒作为探针探测粘粒文库，获得含有重叠DNA的粘粒，从而分离相邻DNA区域。

其他方法描述于Maniatis等，1998，Sambrook and Russell，2001以及Kieser等，1999。

本发明还提供了编码一种未知功能蛋白的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：2所示，并且命名为sfaU1，其相应的核苷酸序列如SEQ ID NO：1中碱基位置14976至碱基位置15413所示。

本发明还提供了编码另一未知功能蛋白的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：3所示，并且命名为sfaU2，其相应的核苷酸序列如SEQ ID NO：1中碱基位置15596至碱基位置16063所示。

本发明还提供了编码苯丙氨酸间位羟化酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：4所示，并且命名为sfaA，其相应的核苷酸序列如SEQ ID NO：1中碱基位置17024至碱基位置17854所示。

本发明还提供了编码鸟氨酸N5-加氧酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：5所示，并且命名为sfaB，其相应的核苷酸序列如SEQ ID NO：1中碱基位置17851至碱基位置19191所示。

本发明还提供了编码转录调控因子的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：6所示，并且命名为sfaC，其相应的核苷酸序列如SEQ ID NO：1中碱基位置19193至碱基位置19888所示。

本发明还提供了编码非核糖体肽合成酶的核苷酸序列，其中所述的非核糖体肽合成酶包含功能结构域C、A、PCP、C、A、PCP、C、A、PCP、C，并且负责大环骨架的肽部分的生物合成。其编码的氨基酸序列如SEQ ID NO：7所示，并且命名为sfaD，其相应的核苷酸序列如SEQ ID NO：1中碱基位置19885至碱基位置30714所示。

本发明还提供了编码聚酮化合物合酶的核苷酸序列，其中所述的聚酮化合物合酶包含功能结构域ACP、KS、AT、DH、ER、KR、ACP，并且负责螺环部分的前体的生物合成。其编码的氨基酸序列如SEQ ID NO：8所示，并且命名为sfaE，其相应的核苷酸序列如SEQ ID NO：1中碱基位置30707至碱基位置37360所示。

本发明还提供了对应用2-乙基丙二酰-S-硫酯(2-ethylmalonamyl-S-thioester)底物起始PKS生物合成特异的加载结构域(loading domain)，其由来自sfaE的第一个ACP组成，其相应的核苷酸序列如SEQ ID NO：1中碱基位置30707至碱基位置31082所示。

本发明还提供了编码聚酮化合物合酶的核苷酸序列，其中所述的聚酮化合物合酶包含功能结构域KS、AT、ACP、KS、AT、KR、ACP、KS、AT、KR、ACP，并且负责聚酮化合物长链的生物合成。其编码的氨基酸序列如SEQ ID NO：9所示，并且命名为sfaF，其相应的核苷酸序列如SEQID NO：1中碱基位置37394至碱基位置50014所示。

本发明还提供了编码聚酮化合物合酶的核苷酸序列，其中所述的聚酮化合物合酶包含功能结构域KS、AT、KR、ACP、KS、AT、DH、ER、KR、ACP，并且负责大部分聚酮化合物长链的生物合成。其编码的氨基酸序列如SEQ ID NO：10所示，并且命名为sfaG，其相应的核苷酸序列如SEQ ID NO：1中碱基位置50017至碱基位置60903所示。

本发明还提供了编码聚酮化合物合酶的核苷酸序列，其中所述的聚酮化合物合酶包含功能结构域KS、AT、DH、KR、ACP、KS、AT、DH、KR、ACP、KS、AT、KR、ACP、KS、AT、DH、KR、ACP、KS、AT、DH、KR、ACP，并且负责大环骨架的聚酮化合物部分之一部分的生物合成。其编码的氨基酸序列如SEQ ID NO：11所示，并且命名为sfaH，其相应的核苷酸序列如SEQ ID NO：1中碱基位置60918至碱基位置85823所示。

本发明还提供了编码聚酮化合物合酶的核苷酸序列，其中所述的聚酮化合物合酶包含功能结构域KS、AT、KR、ACP、KS、AT、KR、ACP，并且负责大环骨架的聚酮化合物部分之一部分的生物合成。其编码的氨基酸序列如SEQ ID NO：12所示，并且命名为sfaI，其相应的核苷酸序列如SEQ ID NO：1中碱基位置85823至碱基位置96040所示。

本发明还提供了编码锌指脱氢酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：13所示，并且命名为sfaJ，其相应的核苷酸序列如SEQ ID NO：1中碱基位置96225至碱基位置97391所示。

本发明还提供了编码包含功能结构域KS、AT、ACP、KR的重复型聚酮化合物合酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：14所示，并且命名为sfaK，其相应的核苷酸序列如SEQ ID NO：1中碱基位置97396至碱基位置101943所示。

本发明还提供了编码酰基转移酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：15所示，并且命名为sfaL，其相应的核苷酸序列如SEQ ID NO：1中碱基位置101936至碱基位置103213所示。

本发明还提供了编码短链脱氢酶/还原酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：16所示，并且命名为sfaM，其相应的核苷酸序列如SEQ ID NO：1中碱基位置103210至碱基位置103929所示。

本发明还提供了编码酰基酮酸合酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：17所示，并且命名为sfaN，其相应的核苷酸序列如SEQ ID NO：1中碱基位置104001至碱基位置105023所示。

本发明还提供了编码游离酰基载体蛋白的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：18所示，并且命名为sfaO，其相应的核苷酸序列如SEQ ID NO：1中碱基位置105091至碱基位置105345所示。

本发明还提供了编码天冬酰胺合酶类似物的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：19所示，并且命名为sfaP，其相应的核苷酸序列如SEQ ID NO：1中碱基位置105366至碱基位置107216所示。

本发明还提供了编码游离硫酯酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：20所示，并且命名为sfaQ，其相应的核苷酸序列如SEQ ID NO：1中碱基位置107366至碱基位置108145所示。

本发明还提供了编码巴豆酰辅酶A还原酶的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：21所示，并且命名为sfaR，其相应的核苷酸序列如SEQ ID NO：1中碱基位置108150至碱基位置109511所示。

本发明还提供了编码MbtH家族蛋白的核苷酸序列，其编码的氨基酸序列如SEQ ID NO：22所示，并且命名为sfaS，其相应的核苷酸序列如SEQID NO：1中碱基位置109583至碱基位置109798所示。

本发明还提供了编码一种未知功能蛋白的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：23所示，并且命名为sfaV1，其相应的核苷酸序列如SEQ ID NO：1中碱基位置109776至碱基位置110312所示。

本发明还提供了编码另一未知功能蛋白的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：24所示，并且命名为sfaV2，其相应的核苷酸序列如SEQ ID NO：1中碱基位置111285至碱基位置111743所示。

本发明还提供了编码另一未知功能蛋白的核苷酸序列。其编码的氨基酸序列如SEQ ID NO：25所示，并且命名为sfaV3，其相应的核苷酸序列如SEQ ID NO：1中碱基位置112218至碱基位置112652所示。

SEQ ID NO：1的互补序列可根据DNA碱基互补原则得到。SEQ ID NO：1的核苷酸序列或部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性酶酶切相应的DNA、或使用其他合适的技术得到。本发明还提供了获得至少包含部分SEQ ID NO：1中DNA序列的重组DNA质粒的方法。

本发明还提供了含有间断的SFA生物合成基因的微生物的方法，至少其中之一的基因包含有SEQ ID NO：1所示的核苷酸序列。

根据本发明的核苷酸序列或部分核苷酸序列可通过基于聚合酶链式反应(PCR)的方法获得，或与SFA生物合成基因相似的基因可通过利用包含根据本发明序列的DNA片段作为探针以Southem杂交法等方法从其他生物体中得到。

包含根据本发明的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从链霉菌A92-308110(淡黄链霉菌)基因组文库中鉴定更多的文库质粒。这些文库质粒至少包含根据本发明的部分序列，并且还包含有来自链霉菌A92-308110(淡黄链霉菌)基因组中邻近区域的未克隆的DNA。

因此，例如根据本发明任一方面的核酸或核苷酸序列是DNA。

根据本发明的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些方法包括插入、替换或缺失，聚合酶链式反应，易错聚合酶链式反应，位点特异性诱变，不同序列的重新连接，序列的不同部分或与其他来源的同源序列进行DNA改组(DNA shuffling)，或通过UV或化学试剂诱变等。

本发明还提供了包含上述核酸的重组载体，诸如DNA表达载体。载体一般含有前述DNA以及一种或多种启动子或其他调控元件。本发明的这些载体和方法使得本领域技术人员获得能产生聚酮化合物的重组宿主细胞。因此，本发明提供了制备聚酮化合物，诸如萨菲菌素A或萨菲菌素A类似物的方法，所述方法包括培养转化的宿主细胞，其中所述宿主细胞被包含编码SEQ ID No.1所述全部或部分萨菲菌素基因簇的核酸的表达载体转化。本发明另一方面还提供了可由前述方法产生的、非萨菲菌素A的聚酮化合物。希望的是载体包含编码功能PKS的核酸，当在合适的培养基中培养时，其能够产生萨菲菌素A或萨菲菌素A类似物。在一些实施方案中，转化的宿主细胞能天然地产生萨菲菌素A。在一些实施方案中，转化的宿主细胞不能天然地产生萨菲菌素A。本发明另一方面还提供了此类转化的宿主细胞。一个具体的实施方案是用包含编码所有或部分萨菲菌素A生物合成基因簇的核酸的载体(例如，其编码由SEQ ID No.1的核酸例示的萨菲菌素A生物合成基因簇)转化的宿主细胞，其中所述的宿主细胞不天然产生萨菲菌素A。

因此，本发明还提供了：

-由任一前述核酸编码的一个多肽或多个多肽；

-由前述编码一个或多个聚酮化合物生物合成蛋白的核酸编码的聚酮化合物合酶；以及

-由模块核酸或基因簇编码的杂化蛋白，其中至少一个结构域或模块或基因对该萨菲菌素A生物合成基因簇而言是非天然的。

另一方面，本发明提供了包含选自SEQ ID No.2-25的序列的分离多肽；由SEQ ID No.2-25的多肽中至少10、50、100、200或500个连续氨基酸组成的分离的多肽；与上述序列具有至少50％、60％、80％、85％、90％、95％、97％或99％同源性的分离的多肽，其中所述同源性通过BLASTP(Altschul等，1990)使用缺省参数确定。

本发明还提供了制备杂化聚酮化合物的方法，所述方法包括用重组载体转化宿主细胞，其中所述的载体包含编码SEQ ID No.1所述全部或部分萨菲菌素基因簇的核酸并且其中至少一个结构域或模块或基因对萨菲菌素A生物合成基因簇而言是非天然的，然后培养该转化的宿主细胞。

本发明提供了可由前述方法产生的、非萨菲菌素A的聚酮化合物。

包含根据本发明的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达系统在异源宿主中表达以得到相应的或更高的酶活性或其他生物活性或产量。这些异源宿主包括链霉菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。

本领域技术人员公知聚酮化合物基因簇可在异源宿主中表达(Pfeifer等，2001)。因此，本发明包括转化萨菲菌素生物合成基因簇，其具有或没有抗性或调控基因、可以是完整的、工程化的、含有突变或含有缺失，用于补充异源宿主。用于转化上述定义的如此大的DNA片段的方法和载体是本领域公知的(Rawlings，2001；Staunton和Weissman，2001)，或在本文公开的方法中得以提供。

在本发明中，优选的异源宿主细胞株是原核生物，更优选是放线菌或大肠杆菌，甚至更优选包括但不限于：吸水链霉菌(S.hygroscopicus)、吸水链霉菌中的物种(S.hygroscopicus sp.)、吸水链霉菌子囊霉素变种(S.hygroscopicus var.ascomyceticus)、筑波链霉菌(Streptomyces tsukubaensis)、天蓝色链霉菌(Streptomyces coelicolor)、变铅青链霉菌(Streptomyces lividans)、红色糖多孢菌(Saccharopolyspora erythraea)、弗氏链霉菌(Streptomyces fradiae)、除虫链霉菌(Streptomyces avermitiliis)、肉桂色链霉菌(Streptomyces cinnamonensis)、龟裂链霉菌(Streptomyces rimosus)、白色链霉菌(Streptomyces albus)、灰褐链霉菌(Streptomyces griseofuscus)、黄色长孢链霉菌(Streptomyces longisporoflavus)、委内瑞拉链霉菌(Streptomyces venezuelae)、灰略红小单孢菌(Micromonospora griseorubida)、地中海拟无枝菌酸菌(Amycolatopsis mediterranei)或游动放线菌N902-10(Actinoplanes sp.N902-10)。

因此，在其他方面，本发明提供了新的菌株，其中失活或缺失了一个或多个编码萨菲菌素生物合成的基因。

在其他方面，本发明提供了新的菌株，其中失活、缺失、或通过非天然例如异源结构域或模块替换了PKS基因sfaE、sfaF、sfaG、sfaH或sfaI的一个或多个模块或结构域。这些菌株可产生新的萨菲菌素。特别地提供了基于产SFA菌株的工程菌株，其中修饰了一个或多个选自sfaE、F、G、H和I的PKS基因，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块，例如由此插入了一个或多个来自SFA生物合成基因簇其他位置、或来自异源聚酮化合物生物合成基因簇的结构域或模块。

在其他方面，本发明提供了新的菌株，其中失活、缺失、或通过非天然例如异源结构域或模块替换了NRPS基因sfaD的一个或多个模块或结构域。这些菌株可产生新的萨菲菌素。特别地提供了基于产SFA菌株的工程菌株，其中修饰了NRPS基因sfaD，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块。

本发明的其他方面还包括：

-基于产SFA菌株的工程菌株，其中调控基因sfaC被修饰以增加或减少其活性，或被缺失，或与其相关的控制sfaC表达的调控元件(诸如启动子)被修饰、替换或缺失。例如，其中调控基因sfaC或其控制被修饰以增加其活性或表达水平的菌株可以以更高的产量产生SFA(或SFA类似物)。例如，可通过应用过量表达sfaC的启动子(诸如permE)例如在载体(诸如Kieser等，1999中描述的那些)中以及任选地与可选择标记(诸如阿泊拉霉素)一起在菌株中过量表达sfaC。

-工程菌株，其不是天然产SFA菌株(即，异源宿主)，含有在一个或多个异源启动子控制下的SFA生物合成基因簇。通过使用强启动子，此类菌株可用于通过包括培养该菌株以及任选地分离SFA等的方法高产量地产生SFA。

-用于产生更高水平的萨菲菌素的方法，其包括过量表达sfaC。

-基于产SFA菌株的工程菌株，其中一个或多个选自sfaA、B、J、M、N、P、Q、L和O的起始单元或前体生物合成基因已被缺失，或被修饰以降低它们的活性，或被修饰或替换以改变它们的底物特异性。

前述基于产SFA菌株的工程菌株若适当补料则可产生SFA或SFA类似物。工程菌株可具有任意的上述修饰或其全部组合，并且可具有其他的基因修饰。

根据本发明的氨基酸序列可以用来分离所需要的蛋白，并可用于抗体的制备。

包含根据本发明的氨基酸序列或至少部分序列的多肽可能在缺失或替换某些氨基酸之后仍具有生物活性或甚至具有新的生物学活性，或者其他期望的性质，诸如提高了产量或优化了蛋白动力学或其他。

包含根据本发明的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达，并可通过DNA芯片技术研究它们在宿主代谢链中的功能。

可以通过遗传重组从包含根据本发明的核苷酸序列或至少部分核苷酸序列的基因或基因簇来构建重组质粒，以建立生物合成途径，或者插入、置换、缺失或失活的方法可用来建立其生物合成途径。

包含根据本发明的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断SFA生物合成的一个或几个步骤而用于产生新的SFA结构类似物。DNA片段或基因可以用来提高SFA或其衍生物的产量，本发明提供了在基因工程微生物中提高产量的途径。其实例包括失活或缺失负调节物。

根据本发明的非核糖体肽合成酶可以通过缺失、插入、改变或失活来自于相同或不同的非核糖体肽合成酶系统的一个或多个非核糖体多肽合成酶的结构域、模块或基因而用于产生新的肽化合物。

根据本发明的聚酮化合物合酶可以通过缺失、插入、改变或失活来自于相同或不同的聚酮化合物合酶系统的一个或多个聚酮化合物合酶的结构域、模块或基因而用于产生新的聚酮化合物或杂化聚酮化合物。

包含根据本发明的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来构建非核糖体肽合成酶文库、或非核糖体多肽合成酶衍生物文库或组合文库。

包含根据本发明的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来构建聚酮化合物合酶文库、或聚酮化合物合酶衍生物文库、或组合文库。

总之，本发明所提供的与SFA生物合成相关的所有基因和蛋白信息可以帮助人们理解SFA天然产物的生物合成机制，为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物、基因或蛋白。

此外，在本发明中，对萨菲菌素生物合成基因簇进行了特定的改变，其最初的目的是想了解生物合成途径、例证本发明、以及产生用于研究免疫抑制剂活性机制的分子。

一般地，可通过应用缺省参数的BLASTN(核酸)或BLASTP(蛋白)(Altschul等，1990)确定序列同一性百分数。

因此，在本发明的一个方面，提供了式(I)或(II)的萨菲菌素类似物化合物，或其可药用盐：

式(I)

式(II)

其中：

R₁表示部分A、B或C之一：

R₂代表OH以及R₃代表H，或R₂和R₃代表键；

R₄代表OH以及R₅代表H，或R₄和R₅代表键；

R₆代表OH以及R₇代表H，或R₆和R₇代表键；

R₈代表OH以及R₉代表H，或R₈和R₉代表键；

R₁₀代表Me或CH₂CH₂C(O)CH₃；

R₁₁代表H或Me；

其条件是：当R₁₀代表CH₂CH₂C(O)CH₃时，R₂和R₄不能都代表OH和/或R₆和R₈不能都代表OH；

和条件是：当R₁₀代表CH₂CH₂C(O)CH₃时，R₂和R₄、以及R₆和R₈不能都代表键。

在一个实施方案中，R₂代表OH，R₃代表H，以及R₄和R₅、R₆和R₇以及R₈和R₉代表键，并且R₁₀代表CH₂CH₂C(O)CH₃

在一个实施方案中，R₅代表OH，R₆代表H以及R₂和R₃、R₆和R₇以及R₈和R₉代表键，并且R₁₀代表CH₂CH₂C(O)CH₃

在一个实施方案中，R₇代表OH，R₈代表H以及R₄和R₅、R₆以及R₂和R₃和R₉代表键，并且R₁₀代表CH₂CH₂C(O)CH₃

在一个实施方案中，R₈代表OH，R₉代表H以及R₄和R₅、R₆和R₇以及R₂和R₃代表键，并且R₁₀代表CH₂CH₂C(O)CH₃

优选地，R₁代表部分C。

优选地，R₁₁代表H；

特别的实施方案包括以下：

预期其可通过在SFA生物合成基因簇中缺失/失活sfaK，任选地用接受甲基丙二酸酯的AT模块替换模块13的AT，从而得以制备；

预期其可通过在SFA生物合成基因簇中缺失/失活模块8的DH，从而得以制备；

预期其可通过在SFA生物合成基因簇中缺失/失活模块10的DH，从而得以制备；

预期其可通过在SFA生物合成基因簇中缺失/失活模块11的DH，从而得以制备；

预期其可通过在SFA生物合成基因簇中缺失/失活模块7的DH，从而得以制备；

及其可药用盐。

上述结构显示了代表性的互变异构体，本发明包含了式(I)和(II)化合物例如酮化合物的所有互变异构体，其中示例了烯醇化合物，反之亦然。

本发明包括上述式(I)和(II)所定义化合物的所有立体异构体。

在其他方面，本发明提供了通过培养产菲菌素类似物菌株以及任选地分离所产生的化合物，从而产生萨菲菌素类似物诸如由上述式(I)和(II)所定义的那些的方法。

在其他方面，本发明提供了萨菲菌素类似物，诸如由上述式(I)和(II)所定义化合物，或其可药用盐，用作药物的用途。

可通过常规方法施与前述式(I)和(II)化合物、或其可药用盐或其制剂，所述方法包括局部地(例如通过吸入、阴道地、鼻内或通过滴眼剂或滴耳剂)、肠内地(例如口服或直肠地)或肠胃外地(例如通过静脉内、海绵体内(intracavernosal)、皮下、肌肉内、心内的或腹膜内注射)或通过医药装置(例如通过斯坦特固定模)。治疗可由单剂量组成，或由一段时间内的多剂量组成。

尽管萨菲菌素A、或类似物诸如式(I)和(II)化合物、或其可药用盐可单独施与，但优选其作为与一种或多种可药用稀释剂或载体一起的药物组合物呈现。在与本发明的化合物可相容以及不会对其接受者有害的意义上，所述稀释剂或载体必须是“生理学可接受的”。在一些情况下，稀释剂或载体可以是无菌和无致热原的水或盐水。

制剂可便利地作为单位剂型存在，并且可根据药物领域公知的任意方法制备。此类方法包括使活性成分(本发明化合物)与构成一种或多种附加成分的载体组合在一起的步骤。一般地，通过将活性组分与液体载体、或精细切分的固体载体、或其两者均匀且紧密地结合在一起，并且然后若需要则塑形该产物，从而制备组合物。

片剂可以含有赋形剂，诸如微晶纤维素、乳糖、柠檬酸钠、碳酸钙、磷酸氢二钙和甘氨酸；崩解剂，诸如淀粉(优选玉米淀粉、马铃薯淀粉或木薯淀粉)、羟基乙酸淀粉钠(sodium starch glycollate)、交联羧甲基纤维素钠和某些复合硅酸盐，以及颗粒粘合剂诸如聚乙烯吡咯烷酮、羟丙基甲基纤维素(HPMC)、羟丙纤维素(HPC)、蔗糖、明胶和阿拉伯胶。此外，还可包括润滑剂，诸如硬脂酸镁、硬脂酸、甘油二十二烷酸酯和滑石粉。

类似类型的固体组合物还可用作明胶胶囊中的填充物。这一方面的优选赋形剂包括乳糖、淀粉、纤维素、奶糖(milk sugar)或高分子量聚乙二醇。对于水性混悬剂和/或酏剂，本发明的化合物可与各种增甜剂或矫味剂、色素或染料结合、与乳化剂和/或悬浮剂结合、以及与诸如水、乙醇、丙二醇和甘油的稀释剂结合，以及它们的组合。

可通过压制或模制制造片剂，任选地还包括一种或多种附属组分。可通过在合适的机器中压缩自由流动形式(诸如粉剂或颗粒剂)的活性组分而制备压缩片剂，所述活性组分任选地与粘合剂(例如，聚维酮(povidone)、明胶、羟丙基甲基纤维素)、润滑剂、惰性稀释剂、防腐剂、崩解剂(例如，羟基乙酸淀粉钠、交联的聚维酮、交联的羧甲基纤维素钠盐)、表面活性剂或分散剂一起。可通过在合适的机器中模制用惰性流体稀释剂湿润的粉末化合物混合物而制备模制片剂。可任选地对片剂进行包衣或刻痕，以及可对其进行制剂以提供其中活性组分的缓释或控释，例如应用不同比例的羟丙基甲基纤维素，以提供期望的释放模式。

适于口服施与的根据本发明的组合物可呈现为分离的单位，诸如胶囊剂、扁囊剂或片剂，每一剂均含有预定量的活性组分；作为粉剂或颗粒剂；作为在水性流体或非水性流体中的溶液剂或混悬剂；或作为水包油流体乳化剂或油包水流体乳化剂。活性组分还可呈现为大丸剂、药糖剂或糊剂。

适于通过吸入施与的气雾剂组合物也可应用本领域公知的方法制得。其实例包括以粉末形式(例如，微粒化的)或雾化溶液或混悬剂的形式通过吸入施与本发明的化合物。可将气雾剂组合物置于合适的加压推进剂中，并且可与额外的器械诸如喷雾器或吸入器一起使用。

对于施与至外部组织，例如嘴部和皮肤，优选作为局部药膏或霜剂施与化合物。当在药膏中配制时，可与石蜡族或水可混溶软膏基质一起应用活性组分。备选地，可应用水包油霜剂基质或油包水基质将活性组分配制为霜剂。

还可应用本领域公知的药学装置施与本发明的化合物。例如，在一个实施方案中，可应用无针头皮下注射装置施与本发明的药物组合物，诸如U.S.5,399,163、U.S.5,383,851、U.S.5,312,335、U.S.5,064,413、U.S.4,941,880、U.S.4,790,824或U.S.4,596,556中公开的装置。在本发明中有用的熟知的植入物和组件实例包括：US 4,487,603，其公开了用于以可控速率分配药物的可植入微输注泵；US 4,486,194，其公开了用于通过皮肤施与药物的治疗装置；US 4,447,233，其公开了用于以精确输注速率递送药物的药物输注泵；US 4,447,224，其公开了用于连续递送药物的变流可植入输注设备；US 4,439,196，其公开了具有多室舱的渗透药物递送系统；以及US4,475,196，其公开了渗透药物递送系统。许多其他的此类植入物、递送系统和组件是本领域技术人员公知的。

该化合物可作为单独的活性剂施与，或与其他药剂联合施与。

在其他方面，本发明提供了萨菲菌素类似物，诸如式(I)和(II)的化合物，或其可药用盐，用于治疗或预防免疫疾病、炎性疾病、心脏病、病毒疾病(诸如HIV和HCV)和/或移植排斥。

在其他方面，本发明提供了萨菲菌素类似物，诸如式(I)和(II)的化合物或其可药用盐在制备用于治疗或预防免疫疾病、炎性疾病、心脏病、病毒疾病(诸如HIV和HCV)和/或移植排斥的药物中的用途。

在其他方面，本发明提供了治疗或预防免疫疾病、炎性疾病、心脏病、病毒疾病(诸如HIV和HCV)和/或移植排斥的方法，其包括给受试者(尤其是人受试者)施与治疗有效量的萨菲菌素类似物，诸如式(I)和(II)的化合物或其可药用盐。

为了完整性，我们提供了本发明的以下其他方面：

-免疫抑制剂萨菲菌素A的生物合成基因簇，其特征在于其包含24个负责萨菲菌素A的生物合成的基因，它们是：

1)一个非核糖体肽骨架合成酶(NRPS)基因sfaD，其中：

sfaD位于该基因簇核苷酸序列的碱基19885-30714处，长度为10830个碱基对，并且编码3609个氨基酸的非核糖体肽合成酶；

2)五个I型线性聚酮化合物合酶(PKS)基因sfaE、sfaF、sfaG、sfaH、sfaI，其中：

sfaE位于该基因簇核苷酸序列的碱基30707-37360处，长度为6654个碱基对，并且编码2217个氨基酸的聚酮化合物合酶；

sfaF位于该基因簇核苷酸序列的碱基37394-50014处，长度为12621个碱基对，并且编码4206个氨基酸的聚酮化合物合酶；

sfaG位于该基因簇核苷酸序列的碱基50017-60903处，长度为10887个碱基对，并且编码3628个氨基酸的聚酮化合物合酶；

sfaH位于该基因簇核苷酸序列的碱基60918-85823处，长度为24906个碱基对，并且编码8301个氨基酸的聚酮化合物合酶；

sfaI位于该基因簇核苷酸序列的碱基85823-96040处，长度为10218个碱基对，并且编码3405个氨基酸的聚酮化合物合酶；

3)一个I型重复型聚酮化合物合酶基因sfaK，其中

sfaK位于该基因簇核苷酸序列的碱基97396-101943处，长度为4548个碱基对，并且编码1515个氨基酸的聚酮化合物合酶；

4)十个用于前体合成的功能基因sfaA、sfaB、sfaJ、sfaM、sfaN、sfaP、sfaQ、sfaR、sfaL、sfaO，其中

sfaA位于该基因簇核苷酸序列的碱基17024-17854处，长度为831个碱基对，并且编码276个氨基酸的苯丙氨酸间位羟化酶；

sfaB位于该基因簇核苷酸序列的碱基17851-19191处，长度为1341个碱基对，并且编码446个氨基酸的N5-鸟氨酸加氧酶；

sfaJ位于该基因簇核苷酸序列的碱基96225-97391处，长度为1167个碱基对，并且编码388个氨基酸的锌指脱氢酶；

sfaM位于该基因簇核苷酸序列的碱基103210-103929处，长度为720个碱基对，并且编码239个氨基酸的短链脱水酶/还原酶；

sfaN位于该基因簇核苷酸序列的碱基104001-105023处，长度为1023个碱基对，并且编码340个氨基酸的酮合酶；

sfaP位于该基因簇核苷酸序列的碱基105366-107216处，长度为1851个碱基对，并且编码616个氨基酸的天冬酰胺合酶类似物；

sfaQ位于该基因簇核苷酸序列的碱基107366-108145处，长度为780个碱基对，并且编码259个氨基酸的硫酯酶；

sfaR位于该基因簇核苷酸序列的碱基108150-109511处，长度为1362个碱基对，并且编码543个氨基酸的巴豆酰辅酶A还原酶；

sfaL位于该基因簇核苷酸序列的碱基101936-103213处，长度为1278个碱基对，并且编码与聚酮化合物合酶酰基转移结构域高度同源的425个氨基酸的酰基转移酶；

sfaO位于该基因簇核苷酸序列的碱基105091-105345处，长度为255个碱基对，并且编码84个氨基酸的酰基载体蛋白；

5)两个调控基因sfaC和sfaS，其中

sfaC位于该基因簇核苷酸序列的碱基19193-19888处，长度为696个碱基对，并且编码231个氨基酸的转录调控因子；

sfaS位于该基因簇核苷酸序列的碱基109583-109798处，长度为216个碱基对，并且编码71个氨基酸的MbtH因子；

6)五个编码未知功能蛋白的基因sfaU1、sfaU2、sfaV1、sfaV2、sfaV3，其中：

sfaU1位于该基因簇核苷酸序列的碱基14973-15413处，长度为441个碱基对，并且编码146个氨基酸的未知功能蛋白；

sfaU2位于该基因簇核苷酸序列的碱基15596-16063处，长度为468个碱基对，并且编码155个氨基酸的未知功能蛋白；

sfaV1位于该基因簇核苷酸序列的碱基109776-110312处，长度为537个碱基对，并且编码178个氨基酸的未知功能蛋白；

sfaV2位于该基因簇核苷酸序列的碱基111285-111743处，长度为459个碱基对，并且编码152个氨基酸的未知功能蛋白；

sfaV3位于该基因簇核苷酸序列的碱基112218-112652处，长度为435个碱基对，并且编码144个氨基酸的未知功能蛋白；

-萨菲菌素A生物合成基因簇中的非核糖体肽合成酶，其特征在于包含以下模块或结构域：肽基缩合酶结构域C、腺苷酸化结构域A、肽基载体蛋白PCP、以及用于端基环化的终止结构域C。

-萨菲菌素A生物合成基因簇中的聚酮化合物合酶，其特征在于其包含以下模块或结构域：酮缩合结构域KS、酰基转移结构域AT、酰基载体蛋白结构域ACP、脱水结构域DH、酮还原结构域KR以及烯醇还原结构域ER。

-由萨菲菌素A生物合成基因簇编码的任何蛋白质用于催化合成免疫抑制剂萨菲菌素A及其家族的任何相应类似物的用途。

-由萨菲菌素A生物合成基因簇编码的任何蛋白质用于催化合成杂化聚酮化合物-非核糖体肽骨架的用途。

-萨菲菌素A生物合成基因簇的用途，其中对该基因簇进行了遗传修饰，并且所获得的突变体的生物发酵产生萨菲菌素A的非天然类似物，诸如在21位和25位羟基化的那些。

-萨菲菌素A生物合成基因簇的用途，其中对该基因簇进行了遗传修饰，并且所获得的突变体的生物发酵产生代偿产物，即其中在14位甲基取代的萨菲菌素A非天然类似物。

附图描述：

图1：萨菲菌素(萨菲菌素A和类似物B、C和D)的化学结构。

图2：SFA生物合成基因簇的基因组织形式和限制性图谱。(A)代表链霉菌A92-308110(淡黄链霉菌)基因组的～150kb DNA区域的4个交叠的粘粒，B表示限制性酶BamHI，实线表示已DNA测序的部分，探针P1至P4表示标记的探针；(B)SFA生物合成基因簇的基因组织形式：Unknown：未知基因；PKS：聚酮化合物合酶基因；NRPS：非核糖体肽合成酶基因；Beyond Cluster：边界外基因；Transposase：转座子；Modification：前体合成基因

图3：提出的萨菲菌素各结构单元的生物合成途径。(A)六氢哒嗪-3-羧酸；(B)起始单元；(C)特别延伸单元。在标注SfaX的步骤中，X对应本说明书中描述的基因簇中的各基因所编码的蛋白；标注问号“？”的步骤表示暂不清楚是否由本基因簇基因编码的酶完成，还是在体内借助参与初级代谢的酶完成；未作任何标注的步骤表示可能借助初级代谢过程。

图4：SFA骨架形成途径。PKS：聚酮化合物合酶；NRPS：非核糖体肽合成酶；KS：酮合成功能结构域；AT：酰基转移功能结构域；KR：酮还原功能结构域；ER：烯醇还原功能结构域；DH：脱水功能结构域；ACP：酰基载体蛋白；C：肽缩合功能结构域；A：腺苷酸化功能结构域；PCP：肽基载体蛋白。

图5：萨菲菌素生物合成基因簇序列被克隆探针中断而得的发酵产物的高效液相色谱(HPLC)分析。WT：野生型；Standard：萨菲菌素A标准品；Mutant：突变株。

图6：由基因替换得到的突变菌株发酵产物的高效液相色谱(HPLC)分析。(A)野生型，(B)锌结合脱氢酶基因sfaJ敲除突变株；(C)重复型线性聚酮化合物合酶基因sfaK敲除突变株；(D)酰基转移酶基因sfaL敲除突变株；(E)短链脱氢酶基因sfaM敲除突变株；(F)苯丙氨酸羟化酶基因sfaA敲除突变株；(G)鸟氨酸加氧酶基因sfaB敲除突变株；(H)脂肪酸酮基合酶基因sfaN敲除突变株；(I)天冬酰胺合酶类似物基因sfaP敲除突变株；(J)巴豆酰辅酶A还原酶基因sfaR敲除突变株；(K)左侧翼未知蛋白sfaU1敲除突变株；(L)右侧翼TetR调控因子敲除突变株；(M)模块8的DH结构域定点诱变，(N)模块10的DH结构域定点诱变。链霉菌A92-308110(淡黄链霉菌)；mv.突变株(区别于野生型的标识)；tsekangensis：T突变体(产生SFT)；hasangensis：H突变体(产生SFH)；xuwengensis：X突变体(产生SFX)。

图7：含有提出的生物合成途径的概要图。

图3的模块编号由图7的那些编号代替。因此，当在本文中提及模块编号时，所述模块编号是图7提及的那些。

序列表的序列描述

SEQ ID No.1：SFA生物合成基因簇的核酸序列

SEQ ID No.2：SfaU1的氨基酸序列

SEQ ID No.3：SfaU2的氨基酸序列

SEQ ID No.4：SfaA的氨基酸序列

SEQ ID No.5：SfaB的氨基酸序列

SEQ ID No.6：SfaC的氨基酸序列

SEQ ID No.7：SfaD的氨基酸序列

SEQ ID No.8：SfaE的氨基酸序列

SEQ ID No.9：SfaF的氨基酸序列

SEQ ID No.10：SfaG的氨基酸序列

SEQ ID No.11：SfaH的氨基酸序列

SEQ ID No.12：SfaI的氨基酸序列

SEQ ID No.13：SfaJ的氨基酸序列

SEQ ID No.14：SfaK的氨基酸序列

SEQ ID No.15：SfaL的氨基酸序列

SEQ ID No.16：SfaM的氨基酸序列

SEQ ID No.17：SfaN的氨基酸序列

SEQ ID No.18：SfaO的氨基酸序列

SEQ ID No.19：SfaP的氨基酸序列

SEQ ID No.20：SfaQ的氨基酸序列

SEQ ID No.21：SfaR的氨基酸序列

SEQ ID No.22：SfaS的氨基酸序列

SEQ ID No.23：SfaV1的氨基酸序列

SEQ ID No.24：SfaV2的氨基酸序列

SEQ ID No.25：SfaV3的氨基酸序列

SEQ ID No.26-29：实施例1中描述的引物序列

SEQ ID No.30和31：实施例11中描述的引物序列

SEQ ID No.32-47：实施例12中描述的引物序列

SEQ ID No.48-63：实施例14中描述的引物序列

SEQ ID No.64-67：实施例16中描述的引物序列

一般方法

一般地，使用如在Maniatis等，1998；Sambrook和Russell，2001或在Kieser等，1999中描述的方法。以下详细描述了实施例或替代方法。

细菌菌株和质粒

如Sambrook和Russell(2001)描述的那样在2xTY培养基中培养大肠杆菌DH10B(GibcoBRL)，以及如Paget等(1999)描述的那样在含有卡那霉素(25mg/L)和氯霉素(12.5mg/L)的2xTY培养基中培养大肠杆菌ET12567(pUZ8002)。用100mg/L氨苄青霉素或50mg/L阿泊拉霉素选择大肠杆菌转化体。

多数所使用的质粒描述于Kieser等，1999和Sambrook等，2001中。pTV1也称为pBS3030，描述于Cheng等，2003；pIJ773描述于GenBank登录号AX657066.1。pANT841描述于Genbank：AF438749。

萨菲菌素生产者链霉菌A92-308110(淡黄链霉菌)可从DSMZ，Braunschweig，德国作为链霉菌DSM 9954获得。

培养基配方：

AS-1琼脂培养基：

加蒸馏水至100ml

通过NaOH将培养基调节至pH 7.5；

ISP4琼脂培养基：

加蒸馏水至1000ml，灭菌前调节至pH 7.2

ISP痕量盐溶液：

加蒸馏水至1000ml

IWL-4琼脂培养基

通过将1g胰蛋白胨和0.5g酵母提取物加至每升ISP-4培养基中，并通过NaOH调节培养基至pH 7.2，从而制备IWL-4琼脂培养基。

接合的一般方法

将含有目标质粒的供体菌大肠杆菌S17-1接种到含有补充有50μg/mL阿泊拉霉素的3-4mL LB肉汤的试管中，振摇过夜。然后在37℃将500μL菌液接种到250mL烧瓶中补充有50μg/mL阿泊拉霉素的50mL LB肉汤中，生长至0.5的OD600。通过在3800转/分钟离心10分钟在50mL EP管中回收细胞。然后通过涡旋振荡将它们重悬于20mL LB中，并再次回收。重复两次，并将回收的细胞重悬于1mL LB中。在12000转/分钟离心受体菌链霉菌A92-309110(淡黄链霉菌)3分钟，以回收孢子，并重悬于500μL0.1M TES中两次，然后在50℃热休克10分钟，再加入500μL TSB肉汤。然后在37℃温育孢子4-5小时。回收孢子并重悬于1ml LB中。以1∶99至99∶1的比例混合细菌，其中1∶1通常产生成功的转化。将混合菌涂布在MS琼脂上，并在层流柜中干燥该板。然后在30℃温育该板14-16小时。用3-4mL无菌水再次涂布该板，以移除多数大肠杆菌，并在层流柜中干燥该板1小时。用1mL含有1mg/mL阿泊拉霉素和1mg/mL萘啶酮酸的无菌水覆盖该板，并在30℃温育3-5天。选择一个或两个或更多个单克隆并接种至3mL含有30μg/mL阿泊拉霉素的TSB肉汤中，在30℃振摇数天。将100μL新鲜培养物涂布在ISP-4琼脂上，并通过温育2-3天允许双交换发生。

从链霉菌A92-309110(淡黄链霉菌)提取总DNA

将-80℃冷藏的链霉菌A92-309110(淡黄链霉菌)孢子悬液接种到3mLYEME培养基中。30℃温育该培养物12小时，分两次转移至1.5mL EP管中，离心回收细菌。用500μL STE溶液重悬浮细菌，加入溶菌酶至终浓度4mg/mL，然后在37℃水浴中温育30-45分钟。待菌体变为透明胶状物质时，加入250μL 2％SDS和60μL 5mol/L KAc，并充分混合，冷冻于-20℃10分钟，然后12000转/分钟离心10分钟。转移上清到新的1.5mL微量离心管中。加入500μL 1∶1(v/v)酚/氯仿混合物，10000转/分钟离心3分钟。重复几次该步骤，至界面处不再有白色变性蛋白出现。然后用氯仿单独最终提取一次。移出上清，与等体积异丙醇充分混合，室温下放置30分钟以沉淀DNA，10000转/分钟离心5分钟。70％醇洗涤并通过吸滤器干燥后，加入200μL TE缓冲液和10μL 10mg/mL无DNA酶的RNA酶，并在-20℃冷冻保存。

SFA产生菌链霉菌A92-309110(淡黄链霉菌)及相关菌株的发酵、产物分离、纯化和鉴定

a)液体发酵

从孢子储存液中转移50μl(平均浓度为每ml 1×10⁸个)至含有相应抗生素压力(取决于突变体的抗性标记物，为阿泊拉霉素50μg/ml或红霉素50μg/ml)的3mL TSB(Tryptic Soytone Broth，Sigma)中，并振摇(27℃，250转/分钟)30小时。从初级培养基中将1ml转移至250ml锥形瓶(直径，底部为8.5cm并且嘴部为3.5cm；高度15cm)中的50ml种子培养基中，并振摇(27℃，250转/分钟)。

从种子培养物中转移5mL至500ml锥形瓶(直径：底部10.5cm且嘴部4cm，高：18cm)中的90mL生产培养基中，并在25℃培养24小时(250rpm)，此时将含有4g树脂XAD-16的10ml新鲜生产培养基加入到生产培养物中(在100mL生产培养基中总共4g XAD-16)。在上述条件(25℃，220转/分钟)下再温育培养物3天。

在第4天完成发酵后，通过抽吸使发酵肉汤通过滤纸。将滤纸连同其上留存的物质一同转移至烧杯中，于-80℃冷冻30分钟，并冻干过夜。加入80-100mL甲醇至干燥的物质中，搅拌40分钟，应用抽滤过滤。用甲醇第二次萃取过滤物质，并应用抽滤过滤。弃去树脂，合并甲醇溶液，于35-37℃在真空中干燥。蒸干后应用两等分的750μL甲醇转移物质。合并该两次的甲醇溶液，并将1.5mL等分试样转移至Ependurf管中，并在-20℃冷冻1小时。在4℃以12000转/分钟离心该管10分钟。将上清液转移至新的Eppendorf管中，真空干燥至液体剩余约500μL，然后将其储存于4℃。

将约300μL的如上所述的粗提物经快速柱层析(RP-18)纯化，其使用40ml的40％乙腈水溶液预漂洗。然后用40mL 50％乙腈水溶液洗脱柱子，分管收集40ml级份，然后浓缩。经过预处理的样品进一步应用LC-MS(应用含有1％甲酸的80％乙腈水溶液)纯化，用于分离和鉴定。

b)固体发酵：

为接种数个琼脂板，将40μL孢子储存液转移至3mL TSB培养基中，并在37℃温育过夜(同时250转/分钟振摇)。从这一过夜培养物吸取400-500μL转移并均匀涂布在琼脂板(150mm)表面，所述琼脂板由R2YE、IWL-4、ISP-4或AS-1琼脂培养基制得。备选地，可将等分试样(50μL)的孢子储存液直接接种该琼脂板。将接种的琼脂板在30℃温育6-7天。

在温育期结束后，将琼脂培养基上的培养物回收到250mL烧杯中并切碎。往来自一块琼脂板的材料中加入200mL甲醇并搅拌混合物2小时，然后通过抽吸过滤通过滤纸。弃去固体材料，在旋转式蒸发器中干燥滤液。为回收发酵产物，应用两份500μL等分试样的甲醇将干燥材料重悬并转移至1.5mL Eppendorf管中。按照上述液体发酵方法所解释的相同的程序从甲醇浓缩物纯化材料。然而，鉴于固体培养基水分较少，可以省去冷冻干燥步骤。样品进一步应用LC-MS(应用含有1％甲酸的80％乙腈水溶液)纯化，用于分离和鉴定。

通过PCR克隆SFA生物合成基因

PCR体系包含：DMSO(8％，v/v)、MgCl₂(25mM)、dNTP(2.5mM)、简并引物(10μM)、Taq DNA聚合酶(2.5u)及适量链霉菌A92-309110(淡黄链霉菌)总DNA作为模板。首先，95℃，3分钟，1个循环；然后94℃，1分钟，68℃，1分钟，72℃，2分钟，5个循环；94℃，1分钟，65℃，1分钟，72℃，2分钟，30个循环；最后72℃，10分钟，1个循环。PCR结束后，1％琼脂糖凝胶电泳检查结果。从低熔点凝胶回收目的大小的DNA片段，并与pGEM T Easy载体连接。转化大肠杆菌DH5α感受态细胞，并涂布在含有氨苄青霉素，IPTG(异丙基-β-D-硫代吡喃半乳糖苷)和X-gal(5-溴-4-氯-3-吲哚-β-D-半乳糖苷)的LB平板上进行蓝白斑筛选。挑取白色菌落过夜培养，提取质粒。通过EcoRI酶切鉴定质粒是否含有预期大小的DNA插入片段。然后对这些质粒进行测序。

核酸杂交

将待鉴定突变株数微升菌丝或孢子接种到3mL TSB培养基中，220转/分钟振摇，在30℃培养至培养基变浓。然后提取基因组DNA。根据序列分析设计杂交策略，制备探针并且选择合适的限制性酶位点用于消化基因组DNA。

将15μL探针(含有0.5-3μg DNA)在沸水浴中温育10分钟，立即转入冰盐浴冷却。依次加入2μL六核苷酸混合物(Hexanucleotide Mix)(10x)、2μL dNTP Labeled Mix、1μL Klenow Enzyme Labeled，充分混合，然后在37℃水浴温育混合物16小时。加入0.8μL 0.8M EDTA(pH＝8.0)以终止反应，加入2.5μL 4M LiCl，并充分混合。加入75μL预冷的无水醇沉淀。将该混合物在-80℃冷冻40分钟，4℃12000转/分钟离心20分钟。收集DNA，70％预冷醇洗涤，真空干燥并溶于50μL TE缓冲液，4℃保存。电泳后，将琼脂糖凝胶浸泡于0.25M HCl中20分钟，用去离子水漂洗，然后加入碱性缓冲液轻轻摇动浸泡20分钟。换缓冲液一次后，继续浸泡20分钟。用去离子水洗涤数次后转移DNA到尼龙膜上。使用转移设备(BioRed)转移。根据该设备的使用方法，在底板上放置润湿的滤纸一张，然后加盖大小合适的尼龙膜。膜在每一侧均应当比凝胶大1cm，再加盖塑料膜并固定夹。如上述处理琼脂糖凝胶，并然后置于膜孔处。将该设备与真空泵连通后，调节压力保持5-8mmHg。真空密封后，加入1L左右的10×SSC杂交缓冲液，液面应盖过琼脂糖凝胶。转膜进行2小时。然后可通过在120℃烘箱中烘烤40分钟进行固定，或者通过暴露在紫外灯下照射(2J/cm²)。然后在黑暗阴凉处保存该膜待用。将已固定的尼龙膜装入杂交管中，加入杂交液。于64℃进行预杂交30分钟，然后加入探针，在需要的温度下进行杂交16小时。将膜依次在室温下用2×SSC严紧洗涤缓冲液洗涤两次5分钟，然后在64℃用0.5×SSC严紧洗涤缓冲液洗涤两次，15分钟。将严紧洗涤后的尼龙膜首先用洗涤缓冲液平衡1-5分钟，然后用封闭溶液温育30分钟，然后用抗体溶液温育30分钟。用洗涤缓冲液洗涤1-2次后，用检测缓冲液平衡2-5分钟。加入显色缓冲液，使该膜在黑暗处显色。当达到适当强度时，用去离子水洗膜终止反应，完成杂交。

实施例

以下结合附图对本发明作进一步说明。

实施例1：克隆SFA基因簇中巴豆酰辅酶A还原酶基因片段

当前尽管对于SFA的总合成研究已经成功完成，但是对其天然产生途径知之甚少，特别是对于六氢哒嗪-3-羧酸单元的N-N键形成机制以及可能应用重复型聚酮化合物合酶的不寻常聚酮化合物延伸单元更是如此。近年来，同位素标记研究发现，谷氨酸和谷氨酰胺可能在某些产生含六氢哒嗪-3-羧酸单元的天然产物的体系中是六氢哒嗪-3-羧酸生物合成的前体(Umezawa等，2001；Miller等，2007)。根据对现有基因簇以及对其他报道的含有六氢哒嗪-3-羧酸的天然产物的基因簇的分析，不排除鸟氨酸作为底物的可能；另外，作为大环骨架上的侧取代基的不寻常延伸单元的形成可能基于不寻常的重复型聚酮化合物合酶。上述两个单元在新药研发和结构-活性关系研究中占有重要地位。因此需要分析SFA的生物合成基因簇，以阐明SFA的生物合成机制，进而开发其潜在的药用价值。

基于对大环骨架的杂化PKS-NRPS结构的分析，推测该基因簇中具有长的线性PKS-NRPS区域，没有已知的同源物，导致增加了分离和克隆生物合成基因簇的难度。实际上，通过用PKS和NRPS基因的元件作为探针，分离了来自11个PKS和7个NRPS基因簇的DNA，然后用于基因失活研究。这些均对萨菲菌素产生没有影响。最后，本发明人尝试使用其他特异性的单元作为探针进行基因簇的克隆。通过对含有基于乙基的结构的聚酮化合物天然产物的天然存在的生物合成基因簇进行分析，本发明人发现乙基单元一般是由乙基丙二酰辅酶A作为结构单元引入的。本发明人推测SFA基因簇可能含有CCR同源物。因此，设计简并CCR引物克隆链霉菌A92-308110(淡黄链霉菌)基因组中我们认为可能存在的负责乙基单元生物合成的巴豆酰辅酶A合成酶高度保守区域序列。然后将该克隆的序列标记为探针进行文库筛选。所述简并引物序列如下：CCR Long-For(SEQ ID：26)：AGGAAT TCATGG CCTCCK CSRTSA ACTACA AY，CCR Long-Rev(SEQ ID：27)：TCGGAT CCGCCG AAGTTS GTCTCR WABCCC CA；CCR Short-For(SEQ ID：28)：AGGAAT TCGACA TCGACA TSGTBW TCGAG CA，CCR Short-Rev(SEQ ID：29)TCGGATCCGATG ATGCGC TTSWSB KDCATC CA。应用这些引物，从链霉菌A92-309110(淡黄链霉菌)基因组中扩增出900bp和300bp的2个序列。切凝胶回收PCR片段，用EcoRI和BamHI酶切，而后克隆至pSP72的EcoRI/BamHI位点。重组质粒经过酶切鉴定，并测序。总共克隆到了3组不同的、彼此间高度同源的CCR基因片段。

实施例2：SFA生物合成基因簇的克隆、序列分析和功能分析

将上述实施例1中克隆到的片段进行地高辛标记，并进行文库筛选。将得到的3组粘粒进行重新分组，并根据酶切图谱建立其相对位置。选择pTL3101(cQXD03-126-6)的6.4kb BamHI末端片段作为探针进行染色体步移，得到粘粒pSL36。然后选取1.4kb的BamHI片段进行染色体步移，得到粘粒pTL3104(cQXD04-49-1～50)。然后选择最左侧的BamHI片段，步移得到粘粒pTL3106(cQXD04-64-1～40)。经过这3轮染色体步移，总共克隆到了约150kb的染色体DNA。分别利用PKS和NRPS简并引物对一些粘粒进行PCR分析，从部分粘粒扩增到了特异条带。这证实了该基因簇包含CCR以及杂化PKS-NRPS。

表1：SFA生物合成基因簇基于序列的功能分析

选取覆盖程度最高的三个粘粒进行全长测序，本发明人获得了118,372bp连续核苷酸序列。生物信息学分析表明其包含了44个可读框(open reading frame，ORF)，推测其中至少有19个ORF与SFA生物合成相关，包括1个NRPS基因(sfaD)负责大环三肽骨架的合成；5个PKS基因(sfaE-I)，其完成大环聚酮化合物骨架的合成；11个推定的前体合成基因(sfaA-B、sfaJ-R)，其负责起始和各缩合单元的合成和骨架修饰；2个调控基因(sfaC和sfaS)，其参与SFA生物合成的调控。各基因功能分析结果见上表。

实施例3：SFA生物合成基因簇的边界的确定

依照序列分析，距上游测序起点大约40kb处具有不完整的转座痕迹(位于sfaU1和sfaU2上游)；距下游测序终点大约20kb处明显具有两个转座酶基因(即sfaT2和sfaT3)存在，但上游转座基因有部分残缺。以上述两个序列为边界，可以将全部ORF分为三个部分：

其中间大约120kb序列为上述负责SFA骨架的生物合成的核心。

上游部分包含16个推定与SFA生物合成无关的基因，包括9个功能基因(细胞色素p450单加氧酶基因orf16、酰基载体蛋白基因orf14、腺苷酸化酶基因orf13、甲基转移酶基因orf12、细胞色素p450羟化酶基因orf11，脱氧鸟嘌呤激酶基因orf10、脱氢酶基因orf9和蛋白酶M23S基因orf6)、5个编码未知蛋白的基因(orf15、orf7、orf5、sfaJ1和sfaJ2)、2个编码调控因子的基因(orf4和orf8，分别属于TetR和LysR家族)和1个糖基转运偶联的蛋白基因(orf3)。

下游部分包含推定与SFA生物合成无关的基因，包括3个编码未知蛋白的基因(sfaV1、slaV2和slaV3)和2个转座酶基因(sfaT2和sfaT3)。还存在1个编码TetR家族调控因子的基因(orf23)，1个编码与TetR偶联的膜蛋白基因orf24)，一个FAD单加氧酶基因(orf25)，和1个不完整的核酸内切酶基因(orf26)。

基因簇序列的初步分析帮助本发明人确定了SFA生物合成基因簇的推定边界。左边界正好位于sfaA上游，包括两个未知功能基因(sfaU1和sfaU2)。右边界正好位于MbtH基因下游，包括3个未知功能基因和2个转座酶基因(slaV1～3、orf21和22)。由于MbtH家族蛋白通常与NRPS连锁，本发明人推测其参与前体生物合成的调控。但是该家族蛋白的活性能由该基因簇其他处的同源物互补，即需要敲除全基因组中存在的所有MbtH基因，否则它会被位于基因组其他位置的相应基因所互补。由于宿主细菌中MbtH的总数量未知，故选择下游未知蛋白和转座子进行分析。此外，距orf10起始82bp处有一35bp的启动子序列；距orf18末尾52bp处有一不依赖ρ-因子的部分终止子序列。整个基因簇位于上述大的转录单位中。基于下文对下游转座酶的分析，推测该基因簇由基因的平行转移而来。

3.1左边界研究

左边界研究集中在sfaU1和sfaU2。sfaUI全长453bp，编码150个氨基酸残基的功能未知蛋白，与斯维链霉菌(Streptomyces sviceus)中未知蛋白有60％同源性；sfaU2全长468bp，编码155个氨基酸残基的功能未知蛋白，经分析与肿痂链霉菌(Streptomyces turgidiscabies)中解离酶/整合酶有81％的同源性。对sfaUI基因进行敲除，并证实其与SFA生物合成无关。同时，sfaU1上下游的转座子序列也暗示了基因簇平行转移的边界。

3.2右边界研究

右边界研究集中在sfaV1、sfaV2、slaV3和sfaT2。sfaV1全长537bp，编码178个氨基酸残基的未知蛋白，与牲畜链霉菌(Streptomyces cattleya)中未知蛋白有81％同源性；sfaV2全长459bp，编码152个氨基酸残基的未知功能基因，与天蓝色链霉菌(Streptomyces coelicolor)中未知功能基因有46％同源性；sfaV3全长435bp，编码144个氨基酸残基的未知蛋白，与天蓝色链霉菌中未知蛋白有45％的同源性，并与丁香假单孢菌马铃薯致病变种(Pseudomonas syringae pv.tomato)中UDP-N-乙酰氨基葡糖转移酶有一定同源性。SfaT2全长534bp，编码177个氨基酸残基的转座酶，与越南伯克霍尔德氏菌(Burkholderia vietnamiensis)中IS-4插入序列部分同源。基于对转座子序列的分析，确定下游边界位于转座子区域附近。

实施例4：SFA起始单元的生物合成的提出

内源乙酰乙酰辅酶A在sfaM编码的短链脱氢酶/还原酶作用下还原为羟丁酰辅酶A，然后通过未知初级代谢脱水酶而得到巴豆酰辅酶A。然后，巴豆酰辅酶A经sfaR编码的巴豆酰辅酶A还原酶还原羧化、以及由sfaP编码的天冬酰胺合成酶类似物酰胺化。然后，在起始酰基载体蛋白(由sfaE-ACP1编码)自酰化作用下完成通过整合后续两碳单元的延伸。同时，认为sfaL编码的带有修饰功能的游离酰基转移酶负责将自酰化错误添加的其他单元水解下来。

实施例5：SFA中的间位酪氨酸的生物合成的提出

常规苯丙氨酸/酪氨酸/色氨酸羟化体系均依靠亲电取代反应在芳香体系的富电子区域发生羟化。相反，苯丙氨酸间位羟化位置则发生在相对弱电子的苯丙氨酸间位。对NRPS中第二腺苷酸化结构域(A2)的生物信息学分析表明，其活性指纹区与其他体系中负责识别苯丙氨酸的腺苷酸化结构域指纹区没有同源性，与酪氨酸也没有明显关联。在大肠杆菌中表达推定的间位羟化酶SfaA，并应用标准方法分离。在AMP PPi测试法中(方法参见Garneau等，2005)对该蛋白质的体外研究显示其对游离苯丙氨酸并无活性，但是对乙酰半胱胺(SNAC)硫酯衍生物的确表现出活性。这表明苯丙氨酸是整合入多肽骨架的最适底物，即整合后发生原位修饰以得到间位酪氨酸单元。

实施例6：SFA六氢哒嗪-3-羧酸单元的生物合成的提出

SFA结构中短肽部分的第三结构单元是以2，3-区域选择性方式参与肽骨架整合的六氢哒嗪-3-羧酸单元。起初认为六氢哒嗪-3-羧酸单元由脯氨酸前体经1，2-位脱氢、氨解、N⁵氧化成环再还原得到。然而，之前的标记测试显示六氢哒嗪-3-羧酸单元的真正前体是谷氨酸(Umezawa等，2001，Miller等，2007)。因此，推测六氢哒嗪-3-羧酸单元从前体分子谷氨酸/谷氨酰胺经氢化和脱水、N⁵氧化并然后氢化形成。虽然在其他的标记测试法体系并未获得以鸟氨酸为前体的直接证据，但本发明人认为鸟氨酸可能直接经N⁵氧化成环参与该体系中六氢哒嗪-3-羧酸的形成，如在其他体系中看到的那样(Fujimori等，2007)。

实施例7：不寻常的延伸单元的生物合成的提出

sfaK编码的重复型聚酮化合物合酶被认为参与6碳不寻常延伸单元的生物合成。应用乙酰辅酶A或丙二酰辅酶A为起始单元，进行两轮两碳延伸，得到三酮己酰辅酶A。然后经该酶末端不寻常的氧化还原结构域选择性还原中间位置的酮基，得到部分还原的具有共轭双键的辅酶A衍生物。然后经由sfaR编码的巴豆酰辅酶A还原酶的还原羧化作用，其被活化整合到聚酮化合物链延伸过程中。在衍生自sfaK敲除突变株的发酵产物的鉴定中，本发明人检测到了m/z 1033.4的信号(图6C)。这支持推定的代偿性生物合成产物的产生，即特殊延伸单元侧链被底物甲基丙二酰辅酶A(其为PKS中相应的酰基转移结构域非最适底物)所替代，由此得到具甲基侧链的取代产物。

实施例8：通过遗传学方法产生SFA非天然类似物

利用定点诱变失活SFA生物合成基因簇中相应于各DH结构域的区段，使编码出缺少活性部位残基的脱水酶。使这一脱水酶作用于经上游AT识别转移到ACP上由KS催化缩合并经KR还原后的中间产物。由于所述脱水酶不能行使脱水功能而形成双键，因此获得了具有羟基的SFA类似物。脱水酶结构域(DH)是催化衍生自酮基还原的羟基脱水，从而形成双键的酶结构域。该功能结构域具有以下高度保守的基序LXXHXXXGXXXXP，其中组氨酸残基为催化活性中心，亮氨酸和甘氨酸维持正常折叠，脯氨酸有时并不保守且功能未知。故选择组氨酸残基作为突变靶。选择SfaA4(sfaH)中DH3/DH4/DH5/DH6(模块7、8、10和11的DH结构域)(分别负责大环内酯酯基内外侧两组两个双键的形成)为目标功能结构域进行定点诱变失活。采用聚合酶链式反应(PCR)扩增上述功能结构域基序侧翼1kb左右共8条DNA片段，并将这些片段用作同源臂。将组氨酸残基变为诸如甘氨酸/丙氨酸等的非极性氨基酸残基，以去除脱水功能。改变的密码子由引物引入，将两条携带突变的片段进行连接(此类连接所需的限制性位点可由沉默突变引入)。以这一方式，构建定点诱变所需的同源重组质粒。对相应突变株进行发酵。液相色谱/质谱检测到M+18信号峰(LC-ESI-MS m/z1109.3，1131.5)，表明目的化合物的产生。

为帮助理解本发明，以下进一步提供实施例，这些实施例仅用作说明而不限制本发明的范围。

实施例9：SFA产生菌链霉菌A92-309110(淡黄链霉菌)遗传转移系统的构建

将待接合转移用的目标质粒首先转化到大肠杆菌S17-1内。挑取平板上单克隆接种到含有3mL LB培养基和相应抗生素选择压力的管中，37℃过夜温育。第二天收获培养物，吸取1mL培养物并接种到含有50mL LB培养基和相应抗生素选择压力的250mL摇瓶中。37℃温育摇床至OD₆₀₀值达到0.5左右。转移培养液到50mL EP管中，在16℃3800转/分钟离心10分钟。回收细菌，然后用20mL LB培养基洗涤两次，然后在相同条件离心。然后回收细菌，并重悬于1mL LB，待用。

取冷藏保存的孢子悬液一管，12000转/分钟室温离心3分钟。去除上清液后，用1mL TES缓冲液洗涤两次，并用500μL TES缓冲液重悬。在50℃水浴中热休克10分钟，再加入500μL TSB培养基。充分混匀溶液，37℃温育4-5小时，然后离心去除全部上清液。然后用1.5mL LB重悬沉淀，待用。

取受体细菌和供体细菌(各100μL)涂布在MS培养基(含有10mMMgCl₂)的平板上，30℃培养12-16小时。此外，取一块板仅涂布受体细菌作为阴性对照。培养后，每块板加入4-5mL无菌ddH₂O并用刮板轻刮表面。吸干水后，干燥该板1小时，然后再覆盖1mL无菌ddH₂O(含12.5μg/mLAm和50μg/mL NA)，在30℃培养3-5天。

挑取转化成功的生长良好的单克隆，接种到3mL TSB培养基(如需要，含有抗生素选择)中。30℃振摇培养物。1天后，取1μL左右培养物并涂布在150mm含有AmR ISP-4的平板上，37℃培养2天。用含有卡那霉素ISP-4的固体平板培养基直接覆盖该板，37℃培养6-7小时。然后将两块培养基分开，分别在37℃再培养2天。挑取在AmR上生长但是在卡那霉素板相应位置没有长出的单克隆，并接种到3mL TSB培养基中。振摇培养物，准备用于发酵。

实施例10：SFA产生菌株链霉菌A92-309110(淡黄链霉菌)基因文库的构建

10.1小规模酶消化测试法

首先通过系列稀释实验来确定Sau3AI的用量。先制备250μl的反应体系(含有基因组DNA(例如，gDNAQXD01-82-1)40μl、BSA(100x)2.5μl)，而后将250μl反应体系分为1×50μl和7×25μl，并置于冰上。接着将2μl事先稀释到0.5u/μl的Sau3AI加入含有50μl反应体系的管#1中，充分混合。然后转移25μl至管#2的25μl中，重复这样的转移步骤7次。所有体系均在37℃水浴中温育15分钟，然后在70℃失活10分钟。在冷室中于4℃运行0.4％琼脂糖凝胶电泳，溴乙锭染色。紫外灯下或应用凝胶成像系统检测酶消化的质量。

10.2大规模酶消化测试法

根据预实验所确定的反应条件，应用4倍的总DNA的量和相应浓度的酶来制备构建文库所需的DNA片段：将体系在冰上充分混匀，平均分为五份，37℃水浴中温育。分别于12、14、16、18和20分钟取出，并在70℃失活10分钟。冷室中于4℃经0.4％琼脂糖凝胶电泳，溴乙锭染色。紫外灯下或应用凝胶成像系统检测酶消化的质量。

10.3去磷酸化作用

将大小合适的经消化DNA片段依次用饱和酚和氯仿-异戊醇溶液提取。加入0.1倍体积的3M NaAc和3倍体积的无水醇沉淀DNA。然后用70％醇洗涤DNA沉淀，干燥，然后重悬于200μl水中。取出10μl作为对照，并且其余的DNA进行去磷酸化作用。往190μl Sau3AI消化的DNA中加入10μl SAP(Promega，1单位/μl)和25μl 10x缓冲液，然后用水补足至250μl。体系在37℃温浴1小时，补加7μl SAP，然后充分混匀。温浴1小时后，70℃热变性使酶失活。依次用饱和酚，氯仿：异戊醇溶液提取。加0.1倍体积的3M NaAc和3倍体积的无水醇，以沉淀DNA。然后用70％醇洗涤DNA，干燥，重悬于15μl TE溶液。然后检查去磷酸化作用是否完全。在冷室中4℃经0.3％琼脂糖凝胶电泳，溴乙锭染色凝胶。紫外灯下或应用凝胶成像系统检测酶消化的质量。

10.4SuperCos1载体的制备

用XbaI单酶切SuperCos1，使其从两个cos位点之间线性化，然后进行去磷酸化作用(防止自连接)。然后，为了插入部分消化的基因组DNA片段，用BamHI进行消化，得到1kb和7kb的两个臂。制备好的载体的浓度为1μg/μl。

10.5衍生自总DNA的片段连接入SuperCos1载体

将6μl去磷酸化的DNA(约2μg/μl)和4μl制备好的SuperCos1(约1μg/μl)混合，并取出1.2μl作为对照。向剩下的8.8μl混合液中加入1.2μl T4DNA连接酶(NEB 400u/μl)以及1.2μl缓冲液，然后充分混匀。16℃连接16小时。在冷室中4℃经琼脂糖凝胶电泳。溴乙锭染色凝胶，并紫外灯下或应用凝胶成像系统检测凝胶。

10.6文库包装

从-80℃冰箱中取出一支Stratagene Gig Pack III XL包装试剂，用手速融。加入4μl连接产物，轻轻吹打三次。使混合物在22℃水浴中温育2小时，然后取出并加入500μl SM缓冲液，颠倒数次。加入50μl氯仿，颠倒混合物数次(这时可以看到一些蛋白状沉淀)。然后将混合物离心数秒。用移液枪转移上清，4℃储存。

10.7滴定

首先，从平板上挑取大肠杆菌VCS257的单菌落，并接种于LB中过夜培养。取500μl菌液，并接种至50ml LB(10mM MgSO₄、0.2％麦芽糖)中，37℃振摇培养。当大肠杆菌OD₆₀₀达到0.84时，添加5μl包装溶液到45μl SM缓冲液中，然后加入50μl大肠杆菌VCS257。轻轻敲打管以混匀，然后放在22℃水浴中温育30分钟。加入400μl LB，颠倒该管数次，然后再37℃水浴中温育75分钟(每隔15分钟颠倒管数次)。吸取250μl涂于各LB平板上(Amp100μg/ml)，并在37℃温育过夜。

10.8证实文库真实性

为了证明所生长的细菌菌落不是假阳性的，而是真正含有重组粘粒的菌落，随机挑取了10个菌落接种到LB(Amp100μg/ml)中并培养。根据用于大肠杆菌质粒DNA小量制备的碱裂解法提取粘粒，BamHI酶切，于0.5％琼脂糖凝胶上电泳。

10.9文库扩增

将大肠杆菌VCS257接到50ml LB(含10mM MgSO₄，0.2％麦芽糖)中，并培养至OD₆₀₀＝0.84，然后马上进行转染。轻轻混匀细胞培养物(100μl)与包装液(100μl)，在22℃水浴中温育30分钟，而后向5个微离心管中分别加入800μl LB，轻轻混匀，在37℃水浴中温育75分钟，期间每隔15分钟轻轻混匀。在温育的同时，将5块大平板(Amp浓度为100μg/ml)放入37℃培养箱中，预暖。水浴完后进行涂板，一个微离心管的内容物涂一块板，在37℃温育过夜。培养18小时后(直到细菌菌落生长良好)，向每块板上加入3～4ml LB。而后用刮板将细菌菌落刮下，然后用移液枪将培养液转移到50ml离心管中。合并5块大板的培养液，加入氨苄青霉素和无菌甘油，终浓度为50μg/ml和18％(V/V)。分装成250μl/管放于-80℃保存。

实施例11：工程链霉菌A92-309110(淡黄链霉菌)菌株的产生，其通过PCR-靶向导致sfaK基因发生基因替换

通过PCR-靶向产生了工程链霉菌A92-309110(淡黄链霉菌)菌株，其具有萨菲菌素生物合成基因簇的sfaK基因的阅读框内缺失，包括应用PCR-靶向的标准方法(Gust等2002)由阿泊拉霉素抗性标记和oriT替换sfaK编码区的大部分。

根据PCR-靶向方法设计引物201-1L(SEQ ID NO：30)和201-1R(SEQ ID NO：31)，以从模板pIJ773(GenBank登录号AX657066.1)扩增阿泊拉霉素抗性标记和oriT。每一引物的5’区域(没有下划线)与sfaK同一，从而使得来自pIJ773的含有FRT、oriT、aac(3)IV和FRT的替换盒在该寡核苷酸结合区域之间对sfaK序列的替换将移除SfaK的活性。每一寡核苷酸的下划线标记的3’区域与pIJ773中的序列同一，用于扩增替换盒。在该替换盒中，FRT是FLP-重组酶识别靶序列，并且该两个FRT序列位于来自RK2转移的起始点(oriT)和阿泊拉霉素抗性基因(aac(3)IV)的侧翼。本领域技术人员熟悉这一技术，并且其在Gust等2002中得以详细描述，且通过引入进一步支持。

201-1L(SEQ ID NO：30)：

5’-CTCGACCGGTACTGGGCCAACGTGGTGGCCGGTGTCGAC ATTCCGGGGATCCGTCGACC-3’

201-1R(SEQ ID NO：31)：

5’-GGCCAGTTCGCGCAGGAAGGCCCGTACGCCGTCGTCCGG TGTAGGCTGGAGCTGCTTC-3’

应用引物201-1L(SEQ ID NO：26)和201-1R(SEQ ID NO：27)，以pIJ773作为模板，以及Primer Star聚合酶(Takara Co.Ltd.)，利用标准条件以及50℃的退火温度，完成～1.4kb PCR-靶向DNA盒的扩增。粘粒pTL3102覆盖了萨菲菌素簇合适的区域，并且首先用于转化大肠杆菌BW25113/pIJ790，得到菌株大肠杆菌BW25113/pIJ790/3102。在含有氯霉素(25μg/mL)的LB(Luria-Bertani培养基；Sambrook等，1998)中在30℃维持大肠杆菌BW25113/pIJ790。为制得基因替换构建物pTL3122，进行了以下概述的步骤。通过电穿孔将凝胶纯化的DNA盒转化至大肠杆菌BW25113/3102中，电穿孔后37℃在LB中温育细菌1小时，以诱导重组和表达抗生素抗性，然后置于含有100μg/mL阿泊拉霉素的LB琼脂中在相同的温度下温育过夜，从而实现PCR-靶向。将阿泊拉霉素抗性菌落接种至补充有100μg/mL阿泊拉霉素的LB中，并在37℃温育过夜。分离粘粒DNA，通过限制性酶消化和DNA序列分析确认抗性盒的存在，将所产生的粘粒命名为pTL3111。为促进转化至链霉菌，通过用BglII酶切pTL3111减少该粘粒的大小。将该含有失活的sfaK及含acc(3)IV抗性盒的13kb BglII片段亚克隆至pKC5201，得到最终的替换构建物pTK3122。通过用supercos1的新霉素抗性基因替代acc(3)IV从而从pKC1139得到pKC5201。为在链霉菌A92-309110(淡黄链霉菌)中产生sfaK替换突变，通过电穿孔将pTL3122转化至大肠杆菌S17-1中，以产生用于接合的大肠杆菌供体菌株。如上一般方法所述，通过与大肠杆菌S17-1/pTL3122接合，从而转化链霉菌A92-309110(淡黄链霉菌)。匀化表达阿泊拉霉素抗性的接合后体，在补充有50μg/mL阿泊拉霉素的ISP-4琼脂上划线，并在37℃培养直到实现生长良好的菌落。应用一系列单克隆接种3mL补充有30μg/mL阿泊拉霉素的TSB肉汤，37℃以250转/分钟振摇4天。将100μL每一培养物涂布在ISP-4琼脂上，并在37℃温育2-3天，以诱导二次交换事件。将单菌落铺板+/-新霉素，以确定质粒骨架的丧失。新霉素敏感性表明质粒序列的丧失，并且通过PCR分析具有该表型的菌落，以确认实现了由DNA盒对sfaK的替换。将一个此菌落命名为淡黄链霉菌xuwengensis突变株(Streptomyces flaveolus mv.xuwengensis)，其另一名字是链霉菌TL3011。

根据上述方法培养菌株，观察到该菌株产生萨菲菌素X(参见图6C)。

实施例12：工程链霉菌A92-309110(淡黄链霉菌)菌株的产生，其通过PCR-靶向导致一系列萨菲菌素生物合成基因发生基因替换

应用如上述实施例11描述的类似的方法，构建了sfaA、sfaB、sfaC、sfaJ、sfaL、sfaM、sfaN和sfaP的替换突变体。在每种情况下，均应用PCR-靶向的标准方法(Gust等2002)，由阿泊拉霉素抗性标记和oriT替换靶基因编码区的大部分。根据PCR-靶向方法为每一靶基因设计一对引物(表2)，以从模板pIJ773(GenBank登录号AX657066.1)扩增阿泊拉霉素抗性标记和oriT。每一引物的5’区域(没有下划线)与靶基因同一，从而使得来自pIJ773的含有FRT、oriT、aac(3)IV和FRT的替换盒在该寡核苷酸结合区域之间对该基因序列的替换将移除由该基因编码的活性。每一寡核苷酸的下划线标记的3’区域与pIJ773中的序列同一，用于扩增替换盒。在该替换盒中，FRT是FLP-重组酶识别靶序列，并且该两个FRT序列位于来自RK2转移的起始点(oriT)和阿泊拉霉素抗性基因(aac(3)IV)的侧翼。本领域技术人员熟悉这一技术，并且其在Gust等2002中得以详细描述，且通过引入进一步支持。

应用表2所示引物，以pIJ773作为模板，以及Primer Star聚合酶(Takara Co.Ltd.)，利用标准条件，完成～1.4kb PCR-靶向DNA盒的扩增。

表2：用于PCR-靶向的引物

为制备基因替换构建物，通过电穿孔将凝胶纯化的盒片段转化至大肠杆菌Bw25113/pIJ790/3106(对于sfaA、sfaB和sfaC，如表3所示)或大肠杆菌Bw25113/3102(对于sfaJ、sfaL、sfaM、sfaN和sfaP，如表3所示)中，从而实现PCR靶向。通过电穿孔将粘粒pTL3106或pTL3102转化至大肠杆菌Bw25113/pIJ709中，从而事先制得这些菌株。转化后，37℃在LB中温育细菌1小时，以诱导重组和表达抗生素抗性，并然后置于含有100μg/mL阿泊拉霉素的LB琼脂中，在37℃温育过夜。用阿泊拉霉素抗性菌落接种补充有100μg/mL阿泊拉霉素的LB，并在37℃温育过夜。通过质粒分离试剂盒(Dingguo Co.Ltd.)分离重组粘粒，通过限制性酶消化和DNA序列分析确认，并给出如表3所示的命名。由于较大粘粒DNA转化受体链霉菌的转化效率低，通过接合将重组粘粒直接转化至链霉菌仅有pTL3113和pTL3114是成功的，所述粘粒分别含有失活sfaB和sfaC的盒，并且分别产生突变菌株TL3003和TL3004。对于其他的，通过用如表3所示的限制性酶酶切重组粘粒而使插入物的大小变短。将得到的DNA片段亚克隆至pKC5201中而得到表3中列出的质粒，所述pKC5201通过用supercos1的新霉素抗性基因替代acc(3)IV从pKC1139得到。这些质粒导致预期突变的掺入，并且给突变菌株命名为表3中所示名称；由此，菌株链霉菌TL3002具有由含acc(3)IV抗性盒替换的sfaA；链霉菌TL3005具有由含acc(3)IV抗性盒替换的sfaJ；链霉菌TL3006具有由含acc(3)IV抗性盒替换的sfaL；链霉菌TL3007具有由含acc(3)IV抗性盒替换的sfaM；链霉菌TL3008具有由含acc(3)IV抗性盒替换的sfaN；链霉菌TL3009具有由含acc(3)IV抗性盒替换的sfaP。

表3：重组粘粒和质粒

首先将用于转化链霉菌的质粒或粘粒转化至大肠杆菌s17-1中，然后如上述实施例9所述的那样与链霉菌接合。匀化阿泊拉霉素抗性接合体，在补充有50μg/mL阿泊拉霉素的ISP-4琼脂培养基上划线，并在37℃培养直到达到生长良好的菌落。应用每一个的系列单克隆接种3mL补充有30μg/mL阿泊拉霉素的TSB肉汤，37℃以250转/分钟振摇4天。将100μL培养物涂布在ISP-4琼脂上，在37℃2-3天，以诱导二次交换事件。用新霉素或无新霉素铺板单菌落，以确定质粒骨架的丧失。新霉素敏感性表明质粒序列的丧失，并且通过PCR分析具有该表型的菌落，以确认实现了由DNA盒对靶基因的替换。将最终的突变菌株命名为表3所示的菌株名称。

实施例13：工程链霉菌A92-309110(淡黄链霉菌)菌株的产生，其导致了sfaR的基因缺失

用BglII和KpnI消化粘粒pTL3102。将得到的4.7kbp DNA片段克隆至用BglII/KpnI消化的pSP72中，产生pTL3132。通过Eco72I消化移除pTL3132的内部674bp DNA片段，并使该载体自连，产生pTL3133。将pTL3133的BglII和HindIII片段克隆至BamHI/HindIII消化的pKC1139中，得到pTL3129，将其用于工程化基因缺失sfaR。

应用与上面描述类似的方法产生期望的双重组菌株。应用大肠杆菌S17-1/pTL3129通过接合转化链霉菌A92-309110(淡黄链霉菌)。匀化阿泊拉霉素抗性接合体，在补充有50μg/mL阿泊拉霉素的ISP-4琼脂上划线，并在37℃培养直到达到生长良好的菌落。应用每一个的系列单克隆接种3mL补充有30μg/mL阿泊拉霉素的TSB肉汤，37℃以250转/分钟振摇4天。将100μL培养物涂布在ISP-4琼脂上，并在37℃2-3天，以诱导二次交换事件。在37℃诱导双交换重组后，挑取阿泊拉霉素阴性表型的菌落，通过PCR确认基因型。预期的PCR产物为约700bp，与1.4kbp的野生型模式不同。将缺失了sfaR的最终菌株命名为链霉菌TL3010。

实施例14：在sfaH的4个DH结构域的每一个中产生DH突变体

sfaH的4个DH结构域包含在PKS模块7、8、10和11中。如在专利说明书上文中所述，可通过定点诱变将活性部位的组氨酸改变为非极性氨基酸，从而移除DH结构域的活性。通过应用以下表4所示引物扩增每一DH的两臂，从而对模块7、8、10和11的4个DH结构域进行定点诱变。

表4：

因此，为了产生用于突变模块7的DH的合适序列，用引物105A-2和105C-2扩增左臂，然后将得到的1.2kbp DNA片段克隆至pANT841，得到01-44-1；以及用引物105B-2和105D-2扩增右臂，并将得到的1.2kbpDNA片段克隆至pANT841(Genbank：AF438749)，得到01-44-2。

为了产生用于突变模块8的DH的合适序列，用引物106A-2和106C-2扩增左臂，然后将得到的1kbp DNA片段克隆至pANT841，得到01-44-3；以及用引物106B-2和106D-2扩增右臂，并将得到的1kbp DNA片段克隆至pANT841，得到01-44-4。

为了产生用于突变模块10的DH的合适序列，用引物107A和107C扩增左臂，然后将得到的1kbp DNA片段克隆至pTLV1，得到01-28-1；以及用引物107B和107D扩增右臂，并将得到的1kbp DNA片段克隆至pTLV1，得到01-28-2。

为了产生用于突变模块11的DH的合适序列，用引物108A和108C扩增左臂，然后将得到的1kbp DNA片段克隆至pTLV1，得到01-28-3；以及用引物108B和108D扩增右臂，并将得到的1kbp DNA片段克隆至pTLV1，得到01-28-4。

用于每一靶向突变的最终质粒的构建需要3片段连接。用合适的限制性酶消化含有携带有同源物靶左区域和右区域的PCR片段的质粒，并连接至适当消化的载体pKC1139中(BamHI/KpnI用于105AC；KpnI/HindIII用于105BD；BamHI/EcoRI用于106AC；EcoRI/HindIII用于106BD；EcoRI/SpeI用于107AC；HindIII/SpeI用于107BD；EcoRI/SpeI用于108AC；HindIII/SpeI用于108BD)。将连接反应物用于转化大肠杆菌DH5α。通过限制性消化分析质粒DNA。将用于转化链霉菌以实现双交换事件的最终质粒首先转化至大肠杆菌s17-1，然后如上面实施例9所述与链霉菌接合。匀化阿泊拉霉素抗性接合体，在补充有50μg/mL阿泊拉霉素的ISP-4琼脂上划线，并在37℃培养直到达到生长良好的菌落。应用每一个的系列单克隆接种3mL补充有30μg/mL阿泊拉霉素的TSB肉汤，37℃以250转/分钟振摇4天。将100μL培养物涂布在ISP-4琼脂上，并在37℃培养2-3天，以诱导二次交换事件。将单菌落铺板+/-阿泊拉霉素，以确定质粒骨架的丧失。阿泊拉霉素敏感性表明质粒序列的丧失，并且通过PCR分析具有该表型的菌落，随后在每种情况下用限制性酶消化扩增片段，以确认DH结构域的突变。这些DH突变体PCR产物的限制性酶消化产生了两个片段，这是因为随同突变一起引入了限制性位点，这与野生型相反。在如上所述的标准发酵条件下培养菌株，并且观察到产生了预期产物(参见图6)。

实施例15：SfaR作为途径特异性还原酶/羧化酶的表征

为评估SfaR在所提出的途径中提供不寻常结构单元的中心作用，我们首先通过阅读框内缺失失活了sfaR。得到的突变体完全丧失了产生SFA的能力，表明其作为途径特异性ccr同源物起作用，对SFA生物合成非常关键(参见实施例16)。其次，我们异源表达并纯化了N-端6x His-标记的SfaR，以接近体外研究的均匀性。如预期的那样，在NADPH和碳酸氢盐的存在下，巴豆酰-S-辅酶A(图7.4)由SfaR高效地转化为主要产物乙基丙二酰-S-辅酶A(图7.5)以及支路产物丁酰-S-辅酶A(图7.7)。在该反应混合物中省去碳酸氢盐，巴豆酰-S-辅酶A相应地被还原为丁酰-S-辅酶A。对于巴豆酰-S-辅酶A，K_m＝8.4×10^-4M、K_cat＝6.8×10^-3/分钟、以及K_m/K_cat＝1.2×10^-1M.分钟。为排除该反应直接在ACP上发生的可能性，作为N-端6x His-标记的衍生物表达并纯化SfaO。试图用巴豆酰-S-SfaO作为底物，没有检测到任何的SfaR活性，这提供了这样的证据，即SfaR携带有对辅酶A基巴豆酰-S-辅酶A的活性，而非对ACP基巴豆酰-S-SfaO的活性(图7.3)。第三，为检测SfaR的底物适应性，我们合成了5碳底物戊烯基-S-辅酶A。令人感兴趣的是，在有或没有碳酸氢盐的条件下，SfaR均对戊烯基-S-辅酶A快速地进行还原及还原性羧化作用(图7.8)，分别产生戊酰基-S-辅酶A和丙基丙二酰辅酶A(图7.10)，其显示出与对4碳底物巴豆酰-S-辅酶A的活性相当的效率。在所使用的条件下，还原性羧化作用发生得太快以至于无法测量用于动力学分析；对于还原产生戊酰基-S-辅酶A中的戊烯基-S-辅酶A，K_m、K_cat和K_m/K_cat值分别是1.4×10^-3M、4.2×10^-2/分钟以及＝3.4×10^-2M.分钟。

实施例16：工程链霉菌A92-309110(淡黄链霉菌)菌株的产生，其导致了sfaK的基因缺失，以及产生新的化合物

应用基因组DNA或粘粒DNA作为模板进行PCR，引物对sfaK-L-for(SEQ ID：64)和sfaK-L-rev(SEQ ID：65)产生一种PCR产物(命名为SfaK-L)，以及sfaK-R-for(SEQ ID：66)和SfaK-R-rev(SEQ ID：67)产生另一PCR产物(命名为SfaK-R)。分离这些PCR产物，然后用限制性酶消化(sfaK-L用EcoRI和BamHI，以及sfaK-R用BamHI和HindIII)，然后连接至之前用EcoRI和HindIII消化的pKC1139中。分离质粒psfaKKO。应用与前述实施例描述的那些类似的方法产生所需的双重组菌株。应用大肠杆菌S17-1/psfaKKO通过接合转化链霉菌A92-309110(淡黄链霉菌)。匀化阿泊拉霉素抗性接合体，在补充有50μg/mL阿泊拉霉素的ISP-4琼脂培养基上划线，并在37℃培养直到达到生长良好的菌落。应用每一个的系列单克隆接种3mL补充有30μg/mL阿泊拉霉素的TSB肉汤，37℃以250转/分钟振摇4天。将100μL培养物涂布在ISP-4琼脂上，并在37℃培养2-3天，以诱导二次交换事件。在37℃诱导双交换重组后，挑取阿泊拉霉素阴性表型的菌落通过PCR确定基因型。预期的PCR产物是约1700bp，这与野生型模式不同。最后的sfaK缺失的菌株命名为链霉菌sfaKKO。

在上述标准发酵条件下培养链霉菌sfaKKO。观察到发酵肉汤含有相应于分子量为1034.3的萨菲菌素的新峰，推测为产物萨菲菌素X。应用标准方法分离产物。

参考文献

Altschul，S.F.，W.Gish，等(1990).″Basic local alignment search tool.″J Mol Biol 215(3)：403-10.

Banteli，R.，J.Wagner，等(2001).″Synthesis of derivatives of the novel cyclophilin-binding immunosuppressant sanglifehrin A with reduced numbers of polar functions.″Bioorg Med Chem Lett 11(12)：1609-12.

Brown，E.J.，M.W.Albers，等(1994).″A mammalian protein targeted by G1-arresting rapamycin-receptor complex.″Nature 369(6483)：756-758.

Cheng，Y.Q.，G.L.Tang，等(2003).″Type I polyketide synthase requiring a discrete acyltransferase for polyketide biosynthesis.″Proc Natl Acad Sci U S A 100(6)：3149-54.

Clarke，S.J.，G.P.McStay，等(2002).″ Sanglifehrin A acts as a potent inhibitor of the mitochondrial permeability transition and reperfusi

Fang，J.，Y.Zhang，等(2008).″Cloning and characterization of the tetrocarcin A gene cluster from Micromonospora chalcea NRRL 11289reveals a highly conserved strategy for tetronate biosyn thesis in spirotetronate antibiotics.″J Bacteriol 190(17)：6014-25.

Fehr，T.，J.Kallen，等(1999).″Sanglifehrins A，B，C and D，novel cyclophilin-binding compounds isolated from Streptomyces sp.A92-308110.II.Structure elucidation，stereochemistry and physico-chemical properties.″J Antibiot(Tokyo)52(5)：474-9.

Fujimori，D.G.，S.Hrvatin，等(2007).″Cloning and characterization of th e biosynthetic gene cluster for kutznerides.″Proc Natl Acad Sci U S A104(42)：16498-503.

Fujimori，D.G.，S.Hrvatin，等(2007).″Cloning and characterization of the biosynthetic gene cluster for kutznerides.″Proc Natl Acad Sci U S A104(42)：16498-503.

Gaisser，S.，R.Lill，等(2001).″New erythromycin derivatives from Saccharopolysporae erythraea using sugar O-methyltransferases from the spinosyn biosynthetic gene cluster.″Molecular Microbiology 41(5)：1223-1231.

Garneau，S.，P.C.Dorrestein，等(2005).″Characterization of the formation of the pyrrole moiety during clorobiocin and coumermycin A1biosynthesis.″Biochemistry 44(8)：2770-80.

Handschumacher，R.E.，M.W.Harding，等(1984).″Cyclophilin：a specific cytosolic bindingprotein for cyclosporin A.″Science 226(4674)：544-7.

Hartel，C.，P.Iblher，等(2006).″Immunosuppressive activity of the immunophilin-binding drug Sanglifehrin A in human whole blood：potent inhibition of interleukin-6 produced by lymphocytes and monocytes.″Scand J Immunol 63(1)：26-34.

Huang，F.，S.F.Haydock，等(2005).″The neomycin biosynthetic gene cluster of Streptomyces fradiae NCIMB 8233：characterisation of an aminotransferase involved in the formation of 2-deoxystreptamine.″Org Biomol Chem 3(8)：1410-8.

Jia，X.Y.，Z.H.Tian，等(2006).″Genetic characterization of the chlorothricin gene cluster as a model for spirotetronate antibiotic biosynthesis.″Chem Biol 13(6)：575-85.

Kallen，J.，R.Sedrahi，等(2005).″Structure of human cyclophilin A in complex with the novel immunosuppressant sanglifehrin A at 1.6 A resolution.″J Biol Chem 280(23)：21965-71.

Kazuo Umezawa，Y.I.，Osamu Kawase，Hiroshi Naganawa和Shinichi Kondo(2001).″Biosynthesis of polyoxypeptin A：novel amino acid 3-hydroxy-3-methylproline derived from isoleucine.″J.Chem.Soc..Perkin Trans.1：1550-1553.

Kieser，T.，M.J.Bibb，等编辑(1999).Practical Streptomyces Genetics，John Innes Foundation.

Li，T.L.，F.Huang，等(2004).″Biosynthetic gene cluster of the glycopeptide antibiotic teicoplanin：characterization of two glycosyltransferases and the key acyltransferase.″Chem Biol 11(1)：107-19.

Liu，J.，F.JD.，等(1991).″Calcineurin is a common target of cyclophilin-cyclosporin A and FKBP-FK506 complexes.″Cell 66(4)：807-815.

Liu，W.，S.D.Christenson，等(2002).″Biosynthesis of the enediyne antitumor antibiotic C-1027.″Science 297(5584)：1170-3.

Maniatis，T.，E.F.Fritsch，等编辑(1998).Molecular Cloning.A Laboratory manual，Cold Spring Harbor Laboratory.

Metternich，R.，Denni，D.，Thai，B，Sedrani，R.(1999).″Toward a Total Synthesis of the Immunosuppressant Sanglifehrin A.Preparation of Two Relay Compounds by Degradation and Their Use in the Reassembly of the Natural Product.″J.Org.Chem.64：9632-9639.

Miller，E.D.，C.A.Kauffman，等(2007).J Org Chem 72：323-330.

Oliynyk，M.，M.J.B.Brown，等(1996).″A hybrid modular polyketide synthase obtained by domain swapping.″Chemistry&Biology 3(10)：833-839.

Paquette，L.A.，M.Duan，等(2002).″A convergent three-component total synthesis of the powerful immunosuppressant(-)-sanglifehrin a.″J Am Chem Soc 124(16)：4257-70.

Pemberton，T.J.和J.E.Kay(2003).″Cyclophilin sensitivity to sanglifehrin A can be correlated to the same specific tryptophan residue as cyclosporin A.″FEBS Lett 555(2)：335-40.

Pfeifer，B.A.和C.Khosla(2001).″Biosynthesis of polyketides in heterologous hosts.″Microbiology and Molecular Biology Reviews 65(1)：106-118.

Powell，J.D.和Y.Zheng(2006).″Dissecting the mechanism of T-cell anergy with immunophilin ligands.″Curr Opin Investig Drugs 7(11)：1002-7.

Rawlings，B.J.(2001).″Type I polyketide biosynthesis in bacteria(Part A-erythromycin biosynthesis).″Nat Prod Rep 18(2)：190-227.

Rawlings，B.J.(2001).″Type I polyketide biosynthesis in bacteria(Part B).″Natural Product Reports 18(3)：231-281.

Sambrook，J.和D.Russel，Eds.(2001).Molecular Cloning：A laboratory manual(third edition)，Cold Spring Harbor Laboratory Press.

Sanglier，J.J.，V.Quesniaux，等(1999).″Sanglifehrins A，B，C and D，novel cyclophilin-binding compounds isolated from Streptomyces sp.A92-308110.I.Taxonomy，fermentation，isolation and biological activity.″J Antibiot(Tokyo)52(5)：466-73.

Schreiber，S.(1991).″Chemistry and biology of the immunophilins and their immunosuppressive ligands.″Science 251(4991)：283-287.

Sedrani，R.，J.Kallen，等(2003).″Sanglifehrin-cyclophilin interaction：degradation work，synthetic macrocyclic analogues，X-ray crystal structure，and binding data.″J Am Chem Soc 125(13)：3849-59.

Sheehan，L.S.，R.E.Lill，等(2006).″Engineering of the SpinosynPKS：Directing Starter Unit Incorporation.″J Nat Prod 69(12)：1702-10.

Sokolskaja，E.，D.M.Sayah，et al.(2004).″Target cell cyclophilin Amodulates human immunodeficiency virus type 1 infectivity.″J Virol 78(23)：12800-8.

Staunton，J.和K.J.Weissman(2001).″Polyketide biosynthesis：a millennium review.″Natural Product Reports 18(4)：380-416.

Staunton，J.和B.Wilkinson(2001).″Combinatorial biosynthesis ofpolyketides and nonribosomal peptides.″Current Opinion in Chemical Biology 5(2)：159-164.

Steinschulte，C.，T.Taner，等(2003).″Cutting edge：sanglifehrin A，anovel cyclophilin-binding immunosuppressant blocks bioactive IL-12production by human dendritic cells.″J Immunol 171(2)：542-6.

Umezawa，K.，Y.Ikeda，等(2001).J Chem Soc Perkin Trans 1：1550-1553.

Watashi，K.，N.Ishii，等(2005).″Cyclophilin B is a functional regulator of hepatitis C virus RNA polymerase.″Mol Cell 19(1)：111-22.

Zander，K.，M.P.Sherman，等(2003).″Cyclophilin A interacts with HIV-1 Vpr and is required for its functional expression.″J Biol Chem 278(44)：43202-13.

Zenke，G.，U.Strittmatter，等(2001).″Sanglifehrin A，a novel cyclophilin-binding compound showing immunosuppressive activity with anew mechanism of action.″J Immunol 166(12)：7165-71.

Zhang，L.H.和J.O.Liu(2001).″Sanglifehrin A，a novel cyclophilin-binding immunosuppressant，inhibits IL-2-dependent T cell proliferation at the G1phase of the cell cycle.″J Immunol 166(9)：5611-8.

Zhang，L.H.，H.D.Youn，等(2001).″Inhibition of cell cycle progression by the novel cyclophilin ligand sanglifehrin A is mediated through the NFkappa B-dependent activation of p53.″J Biol Chem 276(47)：43534-40.

在说明书和以下权利要求书中，除非上下文有例外需要，应将词语“包含”及其变化形式理解为意味着包括所指出的整数、步骤、整数组或步骤组，但不排除任何其他的整数、步骤、整数组或步骤组。

本发明说明书中提及的所有专利和专利申请在此将其全文引入本文作为参考。

本发明包括优选和更优选组以及合适的和更合适的组的所有组合，以及上述组的实施方案。

Claims

1.分离的核酸分子，其包含：

(a)包含SEQ ID No.1的萨菲菌素A生物合成基因簇核酸；

(b)核酸，其与(a)的核酸具有至少80％序列同一性并且其编码的多肽和由(a)的核酸编码的那些多肽具有用于制备聚酮化合物或聚酮化合物起始单元的相同的酶活性和调控活性；

(c)核酸，其编码与由(a)的核酸编码的一种或多种多肽具有至少80％氨基酸序列同一性的一种或多种多肽，并且其编码的一种或多种多肽具有制备聚酮化合物或聚酮化合物起始单元或前体所需的一种或多种酶活性或调控活性；

(e)(d)的核酸部分，其编码聚酮化合物合酶或非核糖体肽合酶多肽的酶活性结构域；或者任一聚酮化合物合酶或非核糖体肽合酶多肽、或聚酮化合物起始单元或前体生物合成基因产物或聚酮化合物生物合成调控多肽的的酶活性模块的酶活性结构域。

2.分离的核酸分子，其包含以下一种或多种：(a)选自sfaE、sfaF、sfaG、sfaH和sfaI的线性PKS基因，或(b)NPRS基因sfaD，或(c)重复型PKS基因sfaK，或(d)选自sfaA、sfaB、sfaJ、sfaM、sfaN、sfaP、sfaQ、sfaL、sfaO的起始单元或前体生物合成基因，或(e)调控基因sfaC，或(f)MtbH蛋白编码基因sfaS，或(g)或巴豆酰辅酶A还原酶基因sfaR，或(h)选自sfaU1、sfaU2、sfaV1、sfaV2和sfaV3的未知功能基因。

3.分离的核酸分子，其包含以下一种或多种：(a)选自SEQ ID No.1残基30707-37360处的sfaE、SEQ ID No.1残基37394-50014处的sfaF、SEQ ID No.1残基50017-60903处的sfaG、SEQ ID No.1残基60918-85823处的sfaH和SEQ ID No.1残基85823-96040处的sfaI的线性PKS基因，或(b)SEQ ID No.1残基19885-30714处的NPRS基因sfaD，或(c)SEQ ID No.1残基97396-101840处的重复型PKS基因sfaK，或(d)选自SEQ ID No.1残基17024-17854处的sfaA、SEQ ID No.1残基17851-19191处的sfaB、SEQ ID No.1残基96225-97391处的sfaJ、SEQ ID No.1残基103210-103929处的sfaM、SEQ ID No.1残基104001-105023处的sfaN、SEQ ID No.1残基105366-107216处的sfaP、SEQ ID No.1残基107366-108145处的sfaQ、SEQ ID No.1残基101936-103213处的sfaL、SEQ ID No.1残基105091-105345处的sfaO的起始单元或前体生物合成基因，或(e)SEQ ID No.1残基19193-19888处的调控基因sfaC，或(f)SEQ ID No.1残基109583-109798处的MtbH蛋白编码基因sfaS，或(g)或SEQ ID No.1残基108150-109511处的巴豆酰辅酶A还原酶基因sfaR，或(h)选自SEQ ID No.1残基14973-15413处的sfaU1、SEQ ID No.1残基15596-16063处的sfaU2、SEQ ID No.1残基109776-110312处的sfaV1、SEQ ID No.1残基111285-111743处的sfaV2和SEQ ID No.1残基112218-112652处的sfaV3的未知功能基因；或包含编码一种或多种与上述基因编码的那些多肽相同的多肽、但其仅由于遗传密码的丰余性而不同的核酸序列；或包含在高严格条件下能与一种或多种上述基因序列杂交的核酸序列；或包含这样的核酸序列，所述核酸序列与一种或多种上述基因序列具有至少70％的同一性，并编码与相应的基因产物具有相同功能的多肽；或包含编码一种或多种和前述基因编码的一种或多种多肽具有至少80％氨基酸序列同一性、并且具有相同功能的多肽的核酸序列；或包含一种或多种前述基因的至少50个连续核苷酸的片段；或任一前述核酸序列的互补序列。

4.分离的核酸分子，其包含以下一种或多种：(a)来自PKS基因的模块或结构域，其中所述的PKS基因选自SEQ ID No.1残基30707-37360处的sfaE、SEQ ID No.1残基37394-50014处的sfaF、SEQ ID No.1残基50017-60903处的sfaG、SEQ ID No.1残基60918-85823处的sfaH或SEQ ID No.1残基85823-96040处的sfaI，或(b)SEQ ID No.1残基19885-30714处的NPRS基因sfaD的模块或结构域，或(c)SEQ ID No.1残基97396-101840处的重复型PKS基因sfaK的模块或结构域；或包含编码与上述基因编码的那些多肽相同的多肽的一个或多个模块或结构域、但其仅由于遗传密码的丰余性而不同的核酸序列；或包含在高严格条件下能与一种或多种上述核酸分子杂交的核酸序列；或包含这样的核酸序列，所述核酸序列与一种或多种上述核酸分子具有至少70％的同一性，并编码与相应的基因产物的模块或结构域具有相同功能的多肽；或包含编码一种或多种和由前述基因的模块或结构域编码的一种或多种多肽具有至少80％氨基酸序列同一性、并且具有相同功能的多肽的核酸序列；或包含前述基因的一个或多个模块或结构域的至少50个连续核苷酸的片段；或任一前述核酸序列的互补序列。

5.基于SEQ ID No.1的产生杂化聚酮化合物的基因簇核酸，其中SEQID No.1的一个或多个结构域、模块或基因被缺失、被突变以使酶功能或调节功能失活或减少活性，被突变以具有改变的功能，或由替代物替换，或其中插入了一个或多个非天然的结构域、模块或基因。

6.根据权利要求5的产生杂化聚酮化合物的基因簇核酸，其中一个或多个结构域、模块或基因(a)被来自萨菲菌素A生物合成基因簇其他位置的结构域、模块或基因替换；或(b)被与萨菲菌素A生物合成基因簇异源的结构域、模块或基因替换。

7.根据权利要求5的产生杂化聚酮化合物的基因簇核酸，其中一个或多个结构域、模块或基因被突变，以使酶功能或调节功能失活或减少活性。

8.根据权利要求5-7任一项的产生杂化聚酮化合物的基因簇核酸，其中修饰了一个或多个选自sfaE、F、G、H和I的PKS基因，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块。

9.根据权利要求5-8任一项的产生杂化聚酮化合物的基因簇核酸，其中修饰了NRPS基因sfaD，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块。

10.根据权利要求5-9任一项的产生杂化聚酮化合物的基因簇核酸，其中修饰了调节基因sfaC，以提高或降低其活性，或该基因被缺失。

11.根据权利要求5-10任一项的产生杂化聚酮化合物的基因簇核酸，其中修饰了重复型PKS基因sfaK，由此一个或多个结构域被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然结构域。

12.根据权利要求5-11任一项的产生杂化聚酮化合物的基因簇核酸，其中缺失了选自sfaA、B、J、M、N、P、Q、L和O的一个或多个起始单元或前体生物合成基因，或对其进行了修饰以降低它们的活性，或对它们进行了修饰或替换以改变它们的底物特异性。

13.根据权利要求5的产生杂化聚酮化合物的基因簇核酸，其中一个或多个起始单元或前体生物合成基因或一个或多个含有一个或多个起始单元或前体生物合成基因的操纵子被缺失、或被突变以失活、或与天然基因或操纵子相比在产生所述起始单元或前体方面的活性减少。

14.根据权利要求1-13任一项的核酸，其为DNA。

15.由根据权利要求14的核酸编码的一个多肽或多个多肽。

16.聚酮化合物合酶，其由根据权利要求14的编码一个或多个聚酮化合物生物合成蛋白的核酸编码。

17.载体，其包含根据权利要求14的DNA以及一个或多个启动子或其他调控元件。

18.用根据权利要求17的载体转化的宿主细胞。

19.用包含编码全部或部分萨菲菌素A生物合成基因簇的核酸的载体转化的宿主细胞，其中所述宿主细胞不天然地产生萨菲菌素A。

20.产生萨菲菌素A的方法，其包括培养根据权利要求18或权利要求19的经转化的宿主细胞。

21.产生聚酮化合物的方法，其包括培养根据权利要求18或权利要求19的经转化的宿主细胞。

22.由根据权利要求1-13任一项的模块核酸或基因簇编码的杂化蛋白，其中至少一个结构域或模块或基因对萨菲菌素A生物合成基因簇而言是非天然的。

23.可由根据权利要求20或21的方法产生的聚酮化合物，并且其不是萨菲菌素A。

24.式(I)或(II)的化合物，或其可药用盐：

式(I)

式(II)

其中：

R₁表示部分A、B或C之一：

R₂代表OH以及R₃代表H，或R₂和R₃代表键；

R₄代表OH以及R₅代表H，或R₄和R₅代表键；

R₆代表OH以及R₇代表H，或R₆和R₇代表键；

R₈代表OH以及R₉代表H，或R₈和R₉代表键；

R₁₀代表Me或CH₂CH₂C(O)CH₃；

R₁₁代表H或Me；

25.根据权利要求24的化合物，其中代表OH，R₃代表H，以及R₄和R₅、R₆和R₇以及R₈和R₉代表键，并且R₁₀代表CH₂CH₂C(O)CH₃。

26.根据权利要求24的化合物，其中R₅代表OH，R₆代表H以及R₂和R₃、R₆和R₇以及R₈和R₉代表键，并且R₁₀代表CH₂CH₂C(O)CH₃。

27.根据权利要求24的化合物，其中R₇代表OH，R₈代表H以及R₄和R₅、R₆以及R₂和R₃和R₉代表键，并且R₁₀代表CH₂CH₂C(O)CH₃。

28.根据权利要求24的化合物，其中R₈代表OH，R₉代表H以及R₄和R₅、R₆和R₇以及R₂和R₃代表键，并且R₁₀代表CH₂CH₂C(O)CH₃。

29.根据权利要求24-28任一项的化合物，其中R₁代表部分C。

30.根据权利要求24-29任一项的化合物，其中R₁₁代表H。

31.选自以下的化合物，或其可药用盐：

32.药物组合物，其包含根据权利要求31的化合物或其可药用盐，以及一种或多种可药用稀释剂或载体。

33.基于产萨菲菌素A菌株的工程菌株，其中调控基因sfaC被修饰以增加或减少其活性，或被缺失，或控制sfaC表达的调控元件被修饰、替换或缺失。

34.根据权利要求33的工程菌株，其中调控基因sfaC或其控制被修饰以增加其活性或表达水平。

35.基于产萨菲菌素A菌株的工程菌株，其中选自sfaA、B、J、M、N、P、Q、L和O的一个或多个起始单元或前体生物合成基因已被缺失，或被修饰以降低它们的活性，或被修饰或替换以改变它们的底物特异性。

36.基于产萨菲菌素A菌株的工程菌株，其中修饰了选自sfaE、F、G、H和I的一个或多个PKS基因，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块。

37.基于产萨菲菌素A菌株的工程菌株，其中修饰了NRPS基因sfaD，由此一个或多个结构域或模块被缺失、被突变以使酶功能失活或减少活性或使得具有改变的功能，或由替代物替换，或由此插入一个或多个非天然的结构域或模块。