Nucleinsäuren, die für Enzymaktivitäten der Spinosyn-Biosynthese codieren
Die vorliegende Erfindung betrifft Nucleinsäuren, die für Enzymaktivitäten der Spinosyn-Biosynthese codieren, sowie die entsprechenden Enzyme per se.
Spinosyne stellen eine neue Gruppe von makrolidischen Verbindungen dar, die aus dem Actinomyceten Saccharopolyspora spinosa isoliert worden sind (Mertz und Yao, 1990). Sie werden zur Bekämpfung von Insekten eingesetzt (WO 97/00265, WO 94/20518, WO 93/09126, US 5670364, US 5362634, US 5227295, US 5202242). Spinosyne zeigen eine starke insektizide, jedoch keine antibakterielle
Aktivität, wodurch sie von den konventionellen Makroliden, wie Tylosin, Spiramycin und Erythromycin, die keine insektizide, jedoch antimikrobielle Wirksamkeit aufweisen, unterscheidbar sind.
Die Struktur der Spinosyne setzt sich zusammen aus einem tetracyclischen Poly- ketidgrundgerüst (Aglycon) mit einem 12-gliedrigen Makrolidring und einem 5,6,5- cis-anti-trans-Tricyclus, sowie einem D-Forosamin- und einem 2,3,4-Tri-O-Methyl- L-Rhamnose-Zuckeranteil (Kirst et al., 1991). Mehr als 20 verschiedene natürliche Spinosyn-Derivate, der sogenannte A83543 Komplex, ist bisher beschrieben worden (WO 97/00265, WO 94/20518, WO 93/09126). Diese Derivate variieren in der Substitution von einer oder einigen Methylgruppen am tetracyclischen Grundgerüst, am Forosamin- oder am Tri-Methyl-Rhamnose-Zuckeranteil. Ein 17-Pseudoaglycon, dem der Forosamin-Zuckeranteil fehlt, ist ebenfalls aus Kulturbrühen von S. spinosa isoliert worden.
Die Hauptkomponenten des von S. spinosa gebildeten A83543 Komplexes stellen die Varianten Spinosyn A und Spinosyn D dar, die die wesentlichen Bestandteile des Produktes Spinosad darstellen (vgl. Pesticide Manual, British Crop Protection Council, 1 lth Ed., 1997, Seite 1272 und Dow Elanco trade maganzine Down to Earth, Vol. 52, NO:. 1, 1997 und die darin zitierte Literatur).
Aufbauend auf Untersuchungen zum Einbau von C -markiertem Acetat, Propionat, Butyrat oder Isobutyrat konnte gezeigt werden, dass die Biosynthese von A83543 einem Polyketid-Biosyntheseweg folgt (Nakatsukasa et al., 1990). Polyketide werden durch multifunktionelle Enzyme, den sog. Polyketidsynthasen (PKS's) aus kurz- kettigen Säurebausteinen wie Acetat, Propionat oder Butyrat aufgebaut. Ähnlich wie die verwandten Fettsäuresynthasen (FAS's) katalysieren sie decarboxylierende Poly- kondensationsschritte der als CoA-Thioester aktivierten Bausteine. Während FAS's nach jedem Kondensationsschritt eine vollständige Reduktion der intermediär an der wachsenden Polyketidkette entstehenden ß-Oxoester durch Ketoreduktion, Dehy- dratation und Enoylreduktion katalysieren, können PKS's bestimmte Reduktionsschritte auslassen. Modulare Typ I PKS's bestehen aus einem oder mehreren großen multifunktionalen Proteinen. Iterative Typ II PKS 's stellen dagegen einen Komplex aus weitgehend monofunktionalen Proteinen dar.
Die enzymatischen Aktivitäten von modularen Typ I PKS's lassen sich zu sogenannten Modulen zusammenfassen. Hierbei trägt ein Modul eine Anordnung von drei enzymkatalytisch aktiven Domänen, die zu einer Verlängerung der wachsenden Polyketidkette um eine biosynthetische Verlängerungseinheit führen. Bei diesen Domänen handelt es sich um eine ß-Ketoacyl:Acyl Carrier Protein Synthase- Domäne, eine Acyltransferase-Domäne und eine ß-Ketoacyl:Acyl Carrier Protein-
Domäne. Ein Modul kann auch eine Ketoreduktase-, eine Dehydratase-, eine Enoyl- reduktase- und eine Thioesterase-Domäne tragen. Ein sog. Ladungsmodul, das am Beginn der Biosynthese steht kann von den genannten Domänen lediglich eine Acyltransferase-Domäne und eine ß-Ketoacyl:Acyl-Carrier Protein-Domäne tragen, sowie eine enzymatisch inaktive ß-Ketoacyl:Acyl Carrier Protein Synthase-Domäne. Eine
Polyketidsynthase-Domäne umfasst jeweils eine dieser genannten enzymatischen Aktivitäten.
Aufgrund der potenten insektiziden Wirkung sowie der bemerkenswerten Struktur der Spinosyne besteht ein großes Interesse, die genetischen Informationen für deren
Biosynthese zu entschlüsseln.
Gegenstand der Erfindung sind Nucleinsäuren, welche zumindest eine Region umfassen, die für eine Enzymaktivität codiert, welche an der Biosynthese von Spinosynen beteiligt ist.
Die vorliegende Erfindung stellt ein Cluster von offenen Leserahmen (ORF 's) bereit, deren Translationsprodukte an der Biosynthese von Spinosynen beteiligt sind. Weiterhin werden zusätzliche Gene bzw. ORF 's bereitgestellt, die außerhalb des ca. 120 kb großen Spinosyn-Biosyntheseclusters liegen, und deren Translationsprodukte an der Rhamnose-Zuckerbiosynthese beteiligt sind.
Bei den erfindungsgemäßen Nucleinsäuren handelt es sich insbesondere um einzel- strängige oder doppelsträngige Desoxyribonucleinsäuren (DNA) oder Ribonuclein- säuren (RNA). Bevorzugte Ausführungsformen sind Fragmente genomischer DNA und cDNA's.
Der Ausdruck "zumindest eine Region", wie er hierin verwendet wird, bedeutet, dass die erfindungsgemäße Nucleinsäure eine oder mehrere Sequenzen umfassen kann, welche jeweils für einzelne Aktivitäten codieren, die Schritte bei der Synthese von Spinosynen durchfuhren. Es werden demnach auch Nucleinsäuren als erfindungsgemäß betrachtet, die nur für eine einzige Enzymaktivität der Spinosyn-Biosynthese codieren.
Der Ausdruck "Enzymaktivität", wie er hierin verwendet wird, bedeutet, dass ausgehend von den hierin betrachteten Nucleinsäuren zumindest derjenige Teil eines vollständigen Enzyms exprimiert werden kann, der noch die Katalyseeigenschaften des Enzyms ausübt.
Insbesondere codieren die erfindungsgemäßen Nucleinsäuren für Enzymaktivitäten von Polyketidsynthasen, Methyltransferasen, Epimerasen, Glycosyltransferasen,
Aminotransferasen, Dimethyltransferasen, Reduktasen, Dehydratasen und/oder Cyclisierungsenzymen.
Bevorzugt handelt es sich bei den erfindungsgemäßen Nucleinsäuren um DNA- Fragmente, die genomischer DNA von S. spinosa entsprechen.
Besonders bevorzugt umfassen die erfindungsgemäßen Nucleinsäuren zumindest eine Sequenz ausgewählt aus
(a) den Sequenzen gemäß SEQ ID NOS: 1, 2, 3, 4, 5, 7, 9, 11, 13, 15, 17,
19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 52 oder 54,
(b) zumindest 14 Basenpaare langen Teilsequenzen der unter (a) defi- nierten Sequenzen,
(c) Sequenzen, welche an die unter (a) definierten Sequenzen hybridisieren,
(d) Sequenzen, welche eine zumindest 70 %ige, bevorzugt eine 80 %ige, besonders bevorzugt eine 90 %ige Identität zu den unter (a) definierten Sequenzen aufweisen,
(e) Sequenzen, welche zu den unter (a) definierten Sequenzen komple- mentär sind, und
(f) Sequenzen, welche aufgrund der Degeneriertheit des genetischen Codes für dieselbe Aminosäuresequenz kodieren wie die unter (a) bis (d) definierten Sequenzen.
Der Ausdruck "hybridisieren", wie er hierin verwendet wird, beschreibt den Vorgang, bei welchem ein einzelsträngiges Nucleinsäuremolekül mit einem komplementären Strang eine Basenpaarung eingeht. Auf diese Weise können beispielsweise ausgehend von genomischer DNA aus Organismen, die phylogenetisch mit S. spinosa verwandt sind und die Fähigkeit der Biosynthese von Spinosynen besitzen,
DNA-Fragmente isoliert werden, welche dieselben Eigenschaften wie die aus S. spinosa isolierten Fragmente aufweisen.
Bevorzugte Hybridisierungsbedingungen sind nachstehend angegeben: Hybridisie- rungslösung: 5 x SSC; Blocking Reagens (Röche Diagnostics GmbH, Mannheim,
Deutschland), 1 %; N-Lauroylsarcosin, 0,1 %; SDS (Sodiumdodecylsulfate) 0,02 %; Hybridisierungstemperatur: 60°C; erster Waschschritt: 2 x SSC bei 60°C; zweiter Waschschritt: 2 x SSC bei 60°C; bevorzugt zweiter Waschschritt: 0,5 x SSC bei 60°C; besonders bevorzugt zweiter Waschschritt: 0,2 x SSC bei 60°C.
Der Grad der Identität der Nucleinsäuren wird vorzugsweise bestimmt mit Hilfe des Programms GAP aus dem Programmpaket GCG (Devereux et al., 1984), Version 9.1 unter Standardeinstellungen.
Besonders hervorgehoben werden Nucleinsäuren, die
(1) entweder alle Sequenzen, die für Schritte der Forosamin- und Trimethyl- Rhamnose-Biosynthese codieren, umfassen, insbesondere die Sequenzen gemäß SEQ ID NOS: 4 und 51, oder (2) alle Sequenzen, die für Schritte der Polyketidsynthese codieren, umfassen, insbesondere die Sequenzen gemäß SEQ LD NOS: 5 und 6, oder (3) alle Sequenzen, die für alle Schritte der Forosamin-, Trimethyl-Rhamnose- und Polyketidsynthese codieren, umfassen, insbesondere die Sequenzen gemäß SEQ ID NOS: 1, 2, 3 und 51.
Alle zur Spinosyn-Biosynthese oder zur Synthese von Vorstufen, wie sie nachstehend definiert sind, benötigten DNA-Sequenzen können sich somit auf einem einzelnen Vektor befinden. Diese Nucleinsäuren können aber auch auf zwei oder mehreren Vektoren vorliegen und gleichzeitig oder nacheinander in einer Wirtszelle exprimiert werden.
Alle ORF 's der erfindungsgemäßen Nucleinsäuren können von ihren eigenen Promotoren oder von heterologen Promotoren angeschaltet werden.
Gegenstand der vorliegenden Erfindung sind auch die regulatorischen Regionen, welche natürlicherweise, d.h. im Ursprungsorganismus S. spinosa, die Transkription der erfindungsgemäßen Nucleinsäuren kontrollieren.
Der Ausdruck "regulatorische Regionen", wie er hierin verwendet wird, bezieht sich auf Promotoren, Repressor- oder Aktivator-Bindungsstellen, Repressor- oder Aktivatorsequenzen, und Terminatoren. Ferner sind genetisch mobile Elemente, welche natürlicherweise, d.h. im Ursprungsorganismus S. spinosa vorkommen, ebenfalls von diesem Ausdruck umfasst. Solche genetisch mobilen Elemente können transposable oder mobilisierbare Elemente oder funktionelle Teile davon, IS-Elemente oder an- dere Insertionselemente sein. Weiterhin sind auch amplifizierbare DNA-Elemente
(Amplifiable Units of DNA, AUD; Fishman and Hershberger, 1983), welche natürlicherweise, d.h. im Ursprungsorganismus S. spinosa vorkommen, von diesem Ausdruck umfasst. Die Erfindung betrifft auch jede Kombination dieser regulatorischen Regionen untereinander oder mit heterologen DNA-Fragmenten, wie z.B. Promo- toren, Repressor oder Aktivator-Bindungsstellen, transposablen, mobilisierbaren oder transduzierbaren Elementen.
Gegenstand der vorliegenden Erfindung sind weiterhin DNA-Konstrukte, die zumindest eine erfindungsgemäße Nucleinsäure und einen heterologen Promotor um- fassen.
Der Ausdruck "heterologer Promotor", wie er hierin verwendet wird, bezieht sich auf einen Promotor, der im Ursprungsorganismus nicht die Expression des betreffenden Gens (ORF 's) kontrolliert.
Die Auswahl von heterologen Promotoren ist davon abhängig, ob zur Expression pro- oder eukaryotische Zellen oder zellfreie Systeme verwendet werden. Ein bevorzugtes Beispiele für einen heterologen Promotor ist der Promotor des mel-Gcns aus dem Vektor pIJ702 (The John Innes Foundation, Norwich, UK 1985). Die heterologe Expression kann z.B. eingesetzt werden, um zu einer Steigerung der Produktion von Spinosyn im Vergleich zum natürlichen Spinosyn-Produzenten zu gelangen.
Gegenstand der Erfindung sind ferner Vektoren, die zumindest eine der erfindungsgemäßen Nucleinsäuren enthalten. Als Vektoren können alle in molekularbiologischen Laboratorien verwendeten Phagen, Plasmide, Phagmide, Phasmide, Cosmide, YACs, BACs, PACs, künstliche Chromosomen oder Partikel, die für einen
Partikelbeschuss geeignet sind, verwendet werden.
Bevorzugt sind BAC- Vektoren. BAC- Vektoren (Bacterial Artificial Chromosome) sind entwickelt worden zur Klonierung von großen DNA-Fragmenten (Shizuya et al., 1992). Es handelt sich um "single-copy" Plasmide mit einem F-Faktor Origin, die
DNA-Fragmente mit einer durchschnittlichen Größe von 120 Kilobasenpaaren (kb) tragen können. Sie sind replizierbar in Escherichia coli. Der BAC-Vektor pBeloBACl l (Kim et al., 1996) trägt einen T7 und einen SP6 Promotor, welche die Klonierungsstelle flankieren und als Startbereich für Sequenzierungsprimer sowie zur Generierung von RNA-Transkripten verwendet werden können.
Besonders bevorzugt sind die am 18. August 1999 bei der Deutschen Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ), Mascheroder Weg lb, D-38124 Braunschweig, in Übereinstimmung mit den Bestimmungen des Budapester Ver- träges unter den Hinterlegungsnummern DSM 13010, DSM 13011 und DSM 13012 hinterlegten B AC-Shuttleklone, die Gegenstand der vorliegenden Erfindung sind.
Die hinterlegten BAC-Shuttleklone P11/G6, P8/G11 und P11/B10 tragen jeweils ein mindestens 100 kb großes DNA-Fragment aus S. spinosa. Die Klone P11/G6 und P11/B10 tragen jeweils einen Teil der Nucleinsäuresequenz gemäß SEQ ID NO: 4, sowie die angrenzenden vollständigen Nucleinsäuresequenzen gemäß SEQ ID NOS:
5 und 6, sowie einen an die Nucleotidsequenz gemäß SEQ ID NO: 6 3 'angrenzende DNA-Bereich (Abb. 7). Der Klon P8/G11 trägt einen Teil der Nucleinsäuresequenz gemäß SEQ ID NO: 6, die vollständigen Nucleinsäuresequenzen gemäß SEQ ID NOS: 5 und 4, sowie einen an die Sequenz gemäß SEQ ID NO: 4 3 '-angrenzenden DNA-Bereich (Abb. 7).
In gleicher Weise sind auch PAC- und alle anderen funktioneil gleichwertigen Vektoren, die es erlauben, große DNA-Fragmente, insbesondere solche DNA- Fragmente, die größer als 30 kb, vorzugsweise größer als 40 kb, besonders bevorzugt größer als 60 kb sind, in heterologe Wirtszellen zu übertragen und dort eine
Etablierung von Fremd-DNA zu gewährleisten, für eine Spinosyn-Produktion geeignet. Vorzugsweise werden solche BAC-, PAC- und funktionell gleichwertigen Vektoren verwendet, die zu einem Shuttle- Vektor modifiziert sind und z.B. eine Plasmidreplikation sowohl in Gram-negativen Bakterien, wie Escherichia coli, als auch in Gram-positiven Bakterien, wie Streptomyces, erlauben. Solche bevorzugten
Shuttle- Vektoren können DNA-Fragmente einer Größe tragen, die in üblichen Vektoren, wie z.B. Cosmidvektoren, nicht klonierbar sind und nicht in heterologe Wirte, wie Actinomyceten, z.B. Streptomyceten, übertragbar sind. Letztere Vektoren können sowohl durch Transformation, Konjugation, Elektroporation, Protoplasten- transformation oder andere geeignete Verfahren übertragen • werden. In hervorragender Weise sind solche Shuttle- Vektoren innerhalb einer heterologen Population Gram-negativer oder Gram-positiver Bakterien, zwischen Gram-positiven und Gramnegativen Bakterien, zwischen Bakterien und Archea, zwischen Pro- und Eukaryonten konjugativ übertragbar. Die in heterologe Wirte, wie z.B. Streptomyceten, übertragenen BAC-, PAC- oder funktionell gleichwertigen Shuttle-
Vektoren können autonom repliziert werden oder ins Genom des Wirtes integriert
werden. Letztere Integration kann über homologe Rekombination, über einen ΦC31- Integrationsmechanismus (Hopwood et al., 1985), über ortsspezifische Integration, die von pSAM2 (Smokvina et al., 1990; WO 95/16046) determinierten Funktionen abhängt oder über Mini-Circle vermittelte Funktionen (Motamedi et al., 1995; WO 96/00282) erfolgen.
Solche Shuttle- Vektoren erlauben es, spezifische, durch außerordentlich große DNA- Bereiche determinierte Biosynthesewege von Primär- oder Sekundärmetaboliten, durch Transfer eines einzigen rekombinanten Vektors heterolog in besonders ge- eigneten Wirtszellen zu exprimieren. So kann das identifizierte Cluster für die Biosynthese von Spinosyn in Organismen, wie Actinomyceten, z.B. Streptomyces, durch Transfer eines einzigen rekombinanten Shuttle- Vektors ausgeprägt werden. Aufgrund der Größe dieses Biosyntheseclusters ist diese heterologe Expression der Spinosyn- Biosynthese mit einem einzigen Cosmidvektor nicht möglich. Die Übertragung eines rekombinanten BAC-, PAC- oder funktionell gleichwertigen Shuttle- Vektors, der die erfindungsgemäßen Nucleinsäuren trägt, kann zu einer signifikanten Steigerung der Produktion von Spinosyn im Vergleich zur Spinosyn-Produktion des Stammes S. spinosa oder abgeleiteter Mutanten mit erhöhter Spinosyn-Bildung fuhren. Zudem kann ein solcher, für die Spinosyn-Biosynthese codierender Shuttle-Vektor genutzt werden, um nach Übertragung in heterologe Wirtszellen deren Biosynthese- und
Modifizierungsleistung auszunutzen, um zu einer signifikanten Modifizierung von Spinosyn oder Spinosyn-Biosynthesevorstufen zu gelangen. Hierdurch ist es zudem möglich, neue Spinosyn-Derivate durch den Transfer eines einzigen rekombinanten Vektors in heterologe Wirtszellen herzustellen.
Weiterhin können solche Shuttle- Vektoren verwendet werden, klonierte Biosynthesewege von Sekundärmetaboliten als Bestandteil eines einzigen rekombinanten Shuttle- Vektors genetisch zu modifizieren. Solche Modifizierungen können z.B. in einem E. coli Wirt durchgeführt werden, z.B. unter Ausnutzung von Re- kombinationsereignissen unter Beteiligung des recA-Genproduktes oder der recE- und recT-Genprodukte (Muyrers et al., 1999). Weiterhin können solche Vektoren
durch in vitro-V erfahren, wie z.B. das Template Generation System (Finnzymes, FLN-02201, Espoo, Finnland) oder das Transposomics-System (Epicentre Technologies, Biozym Diagnostika GmbH, Oldendorf, Deutschland) modifiziert werden. Solche, für veränderte Biosynthesewege codierende Shuttle-Vektoren können dann in geeignete Wirtszellen übertragen werden, um zur Produktion veränderter Sekundärmetabolite zu gelangen. In analoger Weise können die genannten Shuttle-Vektoren genutzt werden, die erfindungsgemäßen Nucleinsäuren zu modifizieren, um sie dann, nach Transfer in geeignete Wirtszellen zur Produktion veränderter Spinosyne einzusetzen.
Teile der erfindungsgemäßen Nucleinsäuren können auch als Bestandteil von zwei oder mehreren Vektoren, wie z.B. Cosmidvektoren, eine genetische Information determinieren, die in Kombination miteinander zur Biosynthese von Spinosyn oder Spinosyn- Vorstufen, wie z.B. Pseudoaglycon oder Spinosyn- Aglycon geeignet sind. Solche Kombinationen von rekombinanten Vektoren können eingesetzt werden, um zu einer Spinosyn-Produktion in anderen Organismen als S. spinosa zu gelangen. Dies kann bei einer Expression in besonders geeigneten Wirten zu einer signifikanten Steigerung der Spinosyn-Produktion im Vergleich zu S. spinosa oder abgeleiteten produktionsverstärkten Mutanten führen. Weiterhin ist es möglich, erfmdungsge- mäße Nucleinsäuren in einzelnen rekombinanten Vektoren dieser Vektorkombination so zu verändern, dass eine heterologe Produktion von Spinosyn-Derivaten in Wirtszellen möglich ist. Desweiteren kann eine solche Kombination von rekombinanten Vektoren durch deren Transfer in heterologe Wirte zur Bildung neuer Spinosyn- Derivate unter Ausnutzung des wirtseigenen Enzymsystems geeignet sein.
Gegenstand der vorliegenden Erfindung sind auch Wirtszellen, die zumindest eine der erfindungsgemäßen Nucleinsäuren enthalten. Als Wirtszelle eignen sich sowohl prokaryotische Zellen, vorzugsweise Actinomyceten, besonders bevorzugt Streptomyceten, als auch eukaryotische Zellen, wie Säugerzellen, Pflanzenzellen oder Hefe- zellen.
In besonderer Weise können die erfindungsgemäßen Nucleinsäuren in pflanzliche Zellen übertragen und exprimiert werden. Hierdurch können transgene Pflanzen hergestellt werden, die das pflanzenschützende, insektizide Spinosyn bzw. Derivate davon produzieren. Eine Übertragung der erfindungsgemäßen Nucleinsäuren in die Pflanzenzellen oder pflanzliche Zellkulturen kann mit üblichen Verfahren u.a. auch durch Partikelbeschuss erfolgen.
Gegenstand der vorliegenden Erfindung sind weiterhin die Polypeptide, die von den erfindungsgemäßen Nucleinsäuren codiert werden. Die erfindungsgemäßen Poly- peptide können ein vollständiges Enzym darstellen, das einen Schritt der Spinosyn-
Biosynthese katalysiert. Jedoch sind auch solche Polypeptide von der Erfindung er- fasst, die nur einen Teil der vollständigen Aminosäuresequenz des betreffenden Enzyms aufweisen.
Der Ausdruck "Teilsequenz", wie er hierin verwendet wird, bezieht sich somit auf die
Aminosäuresequenz eines Polypeptids, das noch die Aktivität des entsprechenden vollständigen Enzyms oder einer enzymatisch aktiven Domäne ausüben kann.
Im Folgenden werden bevorzugte erfindungsgemäße Nucleinsäuren und Polypeptide mit Bezug auf die entsprechenden SEQ ID NOS näher charakterisiert.
SEQ ID NOS: 7 und 8, ORF1:
Nucleotidpositon 828 bis 1 der SEQ ID NO: 4, 275 Aminosäuren; das ableitbare Genprodukt ist eine Methyltransferase.
SEQ ID NOS: 9 und 10, ORF2:
Nucleotidposition 1.283 bis 2.455 der SEQ ID NO: 4, 390 Aminosäuren; das ableitbare Genprodukt ist eine Glycosyltransferase.
SEQ ID NOS: 11 und 12, ORF3:
Nucleotidposition 2.495 bis 3.247 der SEQ ID NO: 4, 250 Aminosäuren; das ableitbare Genprodukt ist eine Methyltransferase.
SEQ ID NOS: 13 und 14, ORF4:
Nucleotidposition 4.440 bis 3.253 der SEQ ID NO: 4, 395 Aminosäuren; das ableitbare Genprodukt ist eine Methyltransferase.
SEQ ID NOS: 15 und 16, ORF5: Nucleotidposition 4.578 bis 6.197 der SEQ ID NO: 4, 539 Aminosäuren; das ableitbare Genprodukt ist ein C-C verknüpfendes Enzym, das Cyclisierungsreaktionen durchführt.
SEQ ID NOS: 17 und 18, ORF6: Nucleotidposition 6.211 bis 7.404 der SEQ ID NO: 4, 397 Aminosäuren; das ableitbare Genprodukt ist eine Methyltransferase.
SEQ ID NOS: 19 und 20, ORF7:
Nucleotidposition 7.401 bis 8.300 der SEQ ID NO: 4, 299 Aminosäuren; das ableitbare Genprodukt ist eine Methyltransferase.
SEQ ID NOS: 21 und 22, ORF8:
Nucleotidposition 8.300 bis 9.466 der SEQ ID NO: 4, 388 Aminosäuren; das ableitbare Genprodukt ist ein Enzym, das an Cyclisierungsreaktionen beteiligt ist.
SEQ ID NOS: 23 und 24, ORF9:
Nucleotidposition 10.572 bis 9.562 der SEQ ID NO: 4, 336 Aminosäuren. das ableitbare Genprodukt ist eine 2,3-Reduktase.
SEQ ID NOS: 25 und 26, ORF10:
Nucleotidposition 12.029 bis 10.569 der SEQ ID NO: 4, 486 Aminosäuren; das ableitbare Genprodukt ist eine 2,3-Dehydratase.
SEQ ID NOS: 27 und 28, ORF11 :
Nucleotidposition 12.549 bis 12.109 der SEQ ID NO: 4, 146 Aminosäuren; das ableitbare Genprodukt hat Homologien zu einer Thioesterase.
SEQ ID NOS: 29 und 30, ORF12: Nucleotidposition 13.865 bis 12.546 der SEQ ID NO: 4, 439 Aminosäuren; das ableitbare Genprodukt ist eine Glykosyltransferase.
SEQ ID NOS: 31 und 32, ORF13:
Nucleotidposition 14.245 bis 15.633 der SEQ ID NO: 4, 462 Aminosäuren; das ableitbare Genprodukt ist eine 3,4-Dehydratase.
SEQ ID NOS: 33 und 34, ORF14:
Nucleotidposition 15.671 bis 16828 der SEQ ID NO: 4, 385 Aminosäuren; das ableitbare Genprodukt ist eine 4-Aminotransferase.
SEQ DP NO: 35 und 36, ORF15:
Nucleotidposition 16.831 bis 17.580 der SEQ ID NO: 4, 249 Aminosäuren; das ableitbare Genprodukt ist eine N-Dimethyltransferase.
SEQ LP NOS: 37 und 38, ORF16:
Nucleotidposition 18.930 bis 18.205 der SEQ LD NO: 4, 241 Aminosäuren; das ableitbare Genprodukt ist eine 3,4-Reduktase.
SEQ ID NOS: 39 und 40, ORF17: Nucleotidposition 19.025-19.861 der SEQ ID NO: 4, 278 Aminosäuren; das ableitbare Genprodukt ist ein Transkriptions-Regulator.
SEQ ID NOS: 41 und 42, ORF18:
Nucleotidpositionen 116-7903 der SEQ ID NO: 5, Aminosäurepositionen 1 bis
2595: Nucleotidpositionen 128-1402, Aminosäure Positionen 5-429 codieren eine ß-
KetoacyhAcyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 1691-2656, Aminosäurepositionen 526-847 codieren eine
Acyltransferase-Domäne;
Nucleotidpositionen 2798-3052, Aminosäurepositionen 895-979 codieren eine ß- KetoacyhAcyl Carrier Protein-Domäne;
Nucleotidpositionen 3107-4372, Aminosäurepositionen 998-1419 codieren eine ß-
Ketoacyl: Acyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 4688-5662, Aminosäurepositionen 1525-1849 codieren eine
Acyltransferase-Domäne; Nucleotidpositionen 6587-7138, Aminosäurepositionen 2158-2341 codieren eine
Ketoreduktase-Domäne;
Nucleotidpositionen 7409-7666, Aminosäurepositionen 2432-2517 codieren eine ß-
Ketoacyl: Acyl Carrier Protein-Domäne.
SEQ ID NOS: 43 und 44, ORF19:
Nucleotidpositionen 7921-14379 der SEQ ID NO: 5, Aminosäurepositionen 1 bis
2152:
Nucleotidpositionen 8029-9318, Aminosäurepositionen 37-466 codieren eine ß-
KetoacyhAcyl Carrier Protein Synthase-Domäne; Nucleotidpositionen 9634-10608, Aminosäurepositionen 572-896 codieren eine
Acyltransferase-Domäne;
Nucleotidpositionen 10705-11259, Aminosäurepositionen 929-1113 codieren eine
Dehydratase-Domäne;
Nucleotidpositionen 12043-13080, Aminosäurepositionen 1375-1720 codieren eine Enoylreduktase-Domäne;
Nucleotidpositionen 13093-13635, Aminosäurepositionen 1725-1905 codieren eine
Ketoreduktase-Domäne;
Nucleotidpositionen 13885-14142, Aminosäurepositionen 1989-2074 codieren eine ß-Ketoacyl:Acyl Carrier Protein-Domäne.
SEQ ID NOS: 45 und 46, ORF20:
Nucleotidpositionen 14424-23936 der SEQ ID NO: 5, Aminosäurepositionen 1 bis
3170:
Nucleotidpositionen 14523-15824, Aminosäurepositionen 34-467 codieren eine ß- Ketoacyl:Acyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 16110-17075, Aminosäurepositionen 563-884 codieren eine
Acyltransferase-Domäne;
Nucleotidpositionen 17997-18536, Aminosäurepositionen 1192-1371 codieren eine
Ketoreduktase-Domäne; Nucleotidpositionen 18795-19052, Aminosäurepositionen 1458-1543 codieren eine ß-Ketoacyl:Acyl Carrier Protein-Domäne;
Nucleotidpositionen 19107-20387, Aminosäurepositionen 1562-1988 codieren eine ß-Ketoacyl:Acyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 20718-21692, Aminosäurepositionen 2099-2423 codieren eine Acyltransferase-Domäne;
Nucleotidpositionen 22620-23171, Aminosäurepositionen 2733-2916 codieren eine
Ketoreduktase-Domäne;
Nucleotidpositionen 23436-23693, Aminosäurepositionen 3005-3090 codieren eine ß-Ketoacyl:Acyl Carrier Protein-Domäne.
SEQ ID NOS: 47 und 48, ORF21:
Nucleotidpositionen 23983-38757 der SEQ ID NO: 5, Aminosäurepositionen 1 bis
4924:
Nucleotidpositionen 24082-25392, Aminosäurepositionen 34-470 codieren eine ß- KetoacykAcyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 25696-26661, Aminosäurepositionen 572-893 codieren eine
Acyltransferase-Domäne;
Nucleotidpositionen 26761-27315, Aminosäurepositionen 927-1111 codieren eine
Dehydratase-Domäne; Nucleotidpositionen 28231-28782, Aminosäurepositionen 1417-1600 codieren eine
Ketoreduktase-Domäne;
Nucleotidpositionen 29035-29265, Aminosäurepositionen 1685-1761 codieren eine ß-Ketoacyl:Acyl Carrier Protein-Domäne;
Nucleotidpositionen 29329-30624, Aminosäurepositionen 1783-2214 codieren eine ß-Ketoacyl:Acyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 30928-31902, Aminosäurepositionen 2316-2640 codieren eine
Acyltransferase-Domäne;
Nucleotidpositionen 32827-33378, Aminosäurepositionen 2949-3132 codieren eine
Ketoreduktase-Domäne; Nucleotidpositionen 33652-33900, Aminosäurepositionen 3224-3306 codieren eine ß-Ketoacyl:Acyl Carrier Protein-Domäne;
Nucleotidpositionen 33952-35262, Aminosäurepositionen 3324-3760 codieren eine ß-Ketoacyl:Acyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 35554-36522, Aminosäurepositionen 3858-4180 codieren eine Acyltransferase-Domäne;
Nucleotidpositionen 37453-37998, Aminosäurepositionen 4491-4672 codieren eine
Ketoreduktase-Domäne;
Nucleotidpositionen 38254-38511, Aminosäurepositionen 4758-4843 codieren eine ß-Ketoacyl:Acyl Carrier Protein-Domäne.
SEQ ID NOS: 49 und 50, ORF22:
Nucleotidpositionen 38808-50000 der SEQ ID NO: 5 und die Nukleotidpositionen 1 bis 5574 der SEQ ID NO: 6, Aminosäurepositionen 1 bis 5588:
Nucleotidpositionen 38907-40226 der SEQ ID NO: 5, Aminosäurepositionen 34-473 codiert eine ß-Ketoacyl:Acyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 40494-41453 der SEQ ID NO: 5, Aminosäurepositionen 563-
882 codieren eine Acyltransferase-Domäne;
Nucleotidpositionen 41556-42119 der SEQ LD NO: 5, Aminosäurepositionen 917-
1104 codieren eine Dehydratase-Domäne; Nucleotidpositionen 43017-43568 der SEQ ID NO: 5, Aminosäurepositionen 1404-
1587 codieren eine Ketoreduktase-Domäne;
Nucleotidpositionen 43833-44090 der SEQ ID NO: 5, Aminosäurepositionen 1676-
1761 codieren eine ß-Ketoacyl:Acyl-Carrier Protein Domäne;
Nucleotidpositionen 44151-45473 der SEQ JO NO: 5, Aminosäurepositionen 1782- 2222 codieren eine ß-Ketoacyl:Acyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 45765-46730 der SEQ ID NO: 5, Aminosäurepositionen 2320-
2641 codieren eine Acyltransferase-Domäne;
Nucleotidpositionen 46827-47459 der SEQ ID NO: 5, Aminosäurepositionen 2674-
2884 codieren eine Dehydratase-Domäne; Nucleotidpositionen 48378-48935 der SEQ ID NO: 5, Aminosäurepositionen 3191-
3376 codieren eine Ketoreduktase-Domäne;
Nucleotidpositionen 49182-49412 der SEQ ID NO: 5, Aminosäurepositionen 3459-
3535 codieren eine ß-Ketoacyl:Acyl Carrier Protein-Domäne;
Nucleotidpositionen 49482-50000 der SEQ ID NO: 5 und Nucleotidposition 1 bis 759 der SEQ ID NO: 6, Aminosäurepositionen 3559-3984 codieren eine ß-
KetoacykAcyl Carrier Protein Synthase-Domäne;
Nucleotidpositionen 1084-2049 der SEQ ID NO: 6, Aminosäurepositionen 4093-
4414 codieren eine Acyltransferase-Domäne;
Nucleotidpositionen 2146-2697 der SEQ ID NO: 6, Aminosäurepositionen 4447- 4630 codieren eine Dehydratase-Domäne;
Nucleotidpositionen 3604-4155 der SEQ ID NO: 6, Aminosäurepositionen 4933-
5116 codieren eine Ketoreduktase-Domäne;
Nucleotidpositionen 4420-4677 der SEQ ID NO: 6, Aminosäurepositionen 5205-
5290 codieren eine ß-Ketoacyl: Acyl Carrier Protein-Domäne; Nucleotidpositionen 4864-5538 der SEQ ID NO: 6, Aminosäurepositionen 5353-
5577 codieren eine Thioesterase-Domäne.
SEQ ID NOS: 52 und 53, ORF23:
Nucleotidposition 344 bis 1333 der SEQ ID NO: 51, 329 Aminosäuren; das ableitbare Genprodukt ist eine dNDP-Glucose-4,6-Dehydratase.
SEQ ID NOS: 54 und 55, ORF24:
Nucleotidposition 1330 bis 2247 der SEQ ID NO: 51, 305 Aminosäuren; das ableitbare Genprodukt ist eine dNDP-4-keto-6-Deoxyglucose-3,5-Epimerase.
Die an der Cyclisierung des 5, 6, 5- Tricyclus beteiligten Produkte des ORF 5 (SEQ
ID NO: 16) und des ORF 8 (SEQ JD NO: 22) sind aufgrund der ungewöhnlichen Cyclisierungsreaktionen von besonderem Interesse. Daher beinhaltet die vorliegende Erfindung insbesondere auch homologe Nucleinsäuren oder homologe Genprodukte. Vorzugsweise zeigen diese homologen Genprodukte mindestens eine 50 %ige, bevorzugt eine 60 %ige und besonders bevorzugt eine 70 %ige Identität auf Aminosäureebene.
Weiterhin sind Antikörper Gegenstand der Erfindung, die spezifisch an die vorstehend genannten Polypeptide binden. Die Herstellung solcher Antikörper erfolgt auf die übliche Weise. Diese Antikörper können genutzt werden, um Expres- sionsklone z.B. einer Genbank zu identifizieren, die die erfindungsgemäßen Nucleinsäuren tragen.
Gegenstand der vorliegenden Erfindung sind auch Verfahren zum Herstellen der erfindungsgemäßen Nucleinsäuren. Die erfindungsgemäßen Nucleinsäuren können auf die übliche Weise hergestellt werden. Beispielsweise können die Nucleinsäure- moleküle vollständig chemisch synthetisiert werden. Man kann auch kurze Stücke der erfindungsgemäßen Nucleinsäuren chemisch synthetisieren und solche Oligonucleotide radioaktiv oder mit einem Fluoreszenzfarbstoff markieren. Die markierten Oligonucleotide können auch verwendet werden, um Genbanken von
Organismen zu durchsuchen. Klone, an die die markierten Oligonucleotide hybridi-
sieren, werden zur Isolierung der betreffenden DNA ausgewählt. Nach der Charakterisierung der isolierten DNA erhält man auf einfache Weise die erfindungsgemäßen Nucleinsäuren. Die erfindungsgemäßen Nucleinsäuren können auch mittels PCR- Verfahren unter Verwendung chemisch synthetischer Oligonucleotide hergestellt werden.
Gegenstand der vorliegenden Erfindung sind weiterhin Verfahren zum Herstellen der erfindungsgemäßen Polypeptide. Zur Herstellung der Polypeptide, die von den erfindungsgemäßen Nucleinsäuren codiert werden, können Wirtszellen, die zumindest eine der erfindungsgemäßen Nucleinsäuren enthalten, unter geeigneten Bedingungen kultiviert werden. Die gewünschten Polypeptide können danach auf übliche Weise aus den Zellen oder dem Kulturmedium isoliert werden. Die Polypeptide können auch in in vz'tro-Systemen hergestellt werden.
Das isolierte und charakterisierte Gencluster und benachbarte oder assoziierte DNA-
Regionen stellen ein Target zur Steigerung der Spinosyn-Biosynthese durch genetische Manipulation, Über- oder Unterexpression von direkt oder indirekt an der Biosynthese involvierten Genen oder regulatorischen Sequenzen dar. Diese Manipulationen können sowohl in natürlichen Spinosyn-produzierenden Organismen als auch in gentechnisch hergestellten Spinosyn-produzierenden Organismen durchgeführt werden. Beispielsweise können ausgewählte ORF 's unter die Kontrolle üblicher starker Promotoren wie dem me/-Promotor des Plasmides pIJ702 (John Innes Foundation, Norwich, UK, 1985) gestellt werden.
Durch die Klonierung und Identifizierung der Spinosyn-Biosynthesegene schafft die vorliegende Erfindung die genetische Basis, mittels molekulargenetischer Verfahren neue Spinosyn- Vorstufen und -Derivate herzustellen.
Der Ausdruck "Spinosyn- Vorstufen", wie er hierin verwendet wird, bezieht sich auf alle nachweisbaren und alle postulierbaren Biosynthesevorstufen von Spinosyn.
Der Ausdruck "Spinosyn-Derivate", wie er hierin verwendet wird, bezieht sich auf Strukturderivate aller bisher bekannten Spinosyne.
Gegenstand der vorliegenden Erfindung ist somit auch ein Verfahren zum Herstellen von Spinosyn- Vorstufen und -Derivaten.
Die erfindungsgemäßen Nucleinsäuren können beispielsweise eingesetzt werden, um durch kombinatorische Biosynthese neue Spinosyn-Derivate mit Veränderungen des Spinosyn- Aglycons herzustellen. Dies kann z.B. dadurch erreicht werden, dass die von ORF 19 codierte, eine Acetat-Einheit einbauende Acyltransferase-Domäne ausgetauscht wird gegen eine Acyltransferase-Domäne, die eine Propionat-Einheit einbaut. In gleicher Weise kann die, eine Acetat-Einheit einbauende Acyltransferase- Domäne des ORF 18 gegen eine Acyltransferase-Domäne ausgetauscht werden, die eine Propionat-Einheit einbaut. Femer ist es möglich beide oder jeweils eine Ketoreduktase-Domäne, die von beiden genannten ORF 's codiert werden zu inaktivieren, durch eine inaktive Ketoreduktase-Domäne zu ersetzen oder zu deletieren, wodurch eine Hydroxygruppe an der entsprechenden Position im Makrocyclus biosynthetisch hergestellt werden kann. Alle Acyltransferase-, Ketoreduktase-, Dehydratase-, Enoylreduktase-, ß-Ketoacyl:Acyl Carrier Protein und Thioesterase- Domänen können einzeln oder in beliebiger Kombination durch entsprechende Poly- ketidsynthase-Domänen mit anderer Substrat- oder Reaktionsspezifität ersetzt werden, in beliebiger Kombination miteinander fusioniert, einzeln oder in beliebiger Kombination mutagenisiert, deletiert oder dupliziert werden. Femer können Modulcodierende Sequenzen ausgetauscht werden. So ist es denkbar die Modul 2- codierende DNA-Sequenz (Abb. 6) gegen die Modul 1- oder Modul 3, 4, 5, 6, 7, 8- oder Modul 9-codierende DNA-Sequenz (Abb. 6) zu ersetzen und funktionell zu exprimieren. Es ist auch denkbar die Modul 2-codierende DNA-Sequenz oder jede andere Modul-codierende DNA-Sequenz des Spinosyn-Polyketidsynthase-Gen- clusters gegen eine andere Modul-codierende DNA-Sequenz des Spinosyn-Poly- ketidsynthase-Genclusters, die eine andere biosynthetische Verlängerungseinheit einbaut, auszutauschen. Darüber hinaus kann jede andere Modul-codierende DNA-
Sequenz des Spinosyn-Polyketidsynthase-Genclusters gegen eine andere Modulcodierende DNA-Sequenz einer anderen Polyketidsynthase-Nukleinsäuresequenz aus S. spinosa oder einem anderen Organismus als S. spinosa, wie z.B. Saccharopolyspora erythraea, ausgetauscht werden. Diese Veränderungen können unter Ausnutzung der ET-Rekombination (WO 99/29837; Muyrers et al., 1999) oder anderer Klonierungs- und Rekombinationstechniken durchgeführt werden.
Gegenstand der Erfindung sind somit auch alle Modul- oder Domänen-codierenden Nucleinsäuren, die natürlicher oder gentechnisch erzeugter Bestandteil der Spinosyn- Polyketidsynthase sind.
Der Ausdruck "Modul", sowie er hierin verwendet wird, bedeutet, dass eine Anordnung von drei enzymkatalytisch aktiven Domänen vorliegt, die zu eine Verlängerung der wachsenden Polyketidkette um eine biosynthetische Verlängerungseinheit führen. Bei diesen Domänen handelt es sich um eine ß-Ketoacyl:Acyl Carrier Protein
Synthase-Domäne, eine Acyltransferase-Domäne und eine ß-Ketoacyl:Acyl-Caπier Protein-Domäne. Ein Modul kann auch eine Ketoreduktase-, eine Dehydratase-, eine Enoylreduktase- und eine Thioesterase-Domäne tragen. Ein sog. Ladungsmodul, das am Beginn der Biosynthese steht kann von den genannten Domänen lediglich eine Acyltransferase-Domäne und eine ß-Ketoacyl:Acyl-Carrier Protein-Domäne tragen, sowie eine enzymatisch inaktive ß-Ketoacyl:Acyl Carrier Protein Synthase-Domäne. Eine Polyketidsynthase-Domäne umfasst jeweils eine dieser genannten enzymatischen Aktivitäten.
Die erfindungsgemäßen Nucleinsäuren können weiterhin genutzt werden, um im
Zuge einer kombinatorischen Biosynthese durch Neuanordnung und Expression von Spinosyn-Polyketidsynthase-Nucleinsäuresequenzen oder durch Kombination und Expression zusammen mit Polyketidsynthase-Nucleinsäuresequenzen einer anderen Polyketidsynthase codierenden Nucleinsäuresequenz aus S. spinosa oder einem anderen Organismus, wie z.B. Saccharopolyspora erythaea, Bibliotheken von rekombinanten Polyketidsynthase-Nucleinsäuresequenzen, rekombinanten Polyketid-
synthase-Proteinen oder rekombinant erzeugten Polyketiden herzustellen. Diese Polyketide können durch die Verwendung der erfindungsgemäßen Nucleinsäuren oder die Verwendung anderer Nucleinsäuren, deren ableitbaren Produkte an der Biosynthese anderer Zucker und Ankopplung ans Aglycon beteiligt sind, glycosyliert werden. Es ist bekannt, dass die Glycosylierung des Aglycons eine entscheidende
Rolle bei der biologischen Aktivtät am Wirkort spielt. Diese Veränderungen können sowohl in natürlichen als auch in gentechnisch hergestellten Spinosyn-produzierenden Organismen, insbesondere Bakterien, erfolgen. Weiterhin können diese Veränderungen unter Ausnutzung der ET-Rekombination (WO 99/29837; Muyrers et al., 1999) oder anderer Klonierungs- und Rekombinationstechniken durchgeführt werden.
Die erfmdungsgemäßen Nucleinsäuren, Vektoren und regulatorischen oder genetisch mobilen Regionen können außerdem zum Auffinden von Genen verwendet werden, die für Polypeptide codieren, welche funktionell ähnliche Polyketidsynthasen oder funktionell ähnliche Produkte, die an einer Zuckerbiosynthese beteiligt sind, codieren.
Da die erfindungsgemäßen Nucleinsäuren einen umfangreichen Teil des Genoms von S. spinosa ausmacht, können die erfindungsgemäßen Nucleinsäuren als Marker bei der Sequenzierung des Genoms von S. spinosa eingesetzt werden, wodurch die Anordnung von Teilsequenzen eines Genomsequenzierungsprojektes erheblich erleichtert wird.
Somit liefern die erfindungsgemäßen Nucleinsäuren Daten, die im Rahmen eines
Genomsequenzierungsprojektes und eines sich darauf aufbauenden Metabolie Engineering zur Steigerung der Spinosynproduktion eingesetzt werden können.
Erläuterungen zu den Abbildungen;
Abbildung 1 : Modell für die Biosynthese der Spinosyn-Zucker D-Forosamin und 2, 3, 4-Tri-O-Methyl-L-Rhamnose.
Abbildung 2: Lage, der an der Spinosyn-Biosynthese direkt oder indirekt beteiligten DNA-Regionen 1 (SEQ ID NO: 4) und DNA-Region 2 (SEQ ED NOS: 5 und 6). Die schwarzen Balken im unteren Teil der Abbildung geben schematisch die Positonen der Cosmid-DNA Inserts zueinander und in Bezug zu den DNA-Regionen 1 und 2 an. Die dargestellen Cosmid-Inserts wurden zur Sequenzierung der SEQ ID NOS: 1 bis 3 herangezogen.
Abbildung 3: Schematische Darstellung der Lage der Insert-DNA (schwarze Balken im unteren Teil der Abbildung) der benannten Cosmide, die zur Ankopplung eines Forosamin-Restes oder eines Trimethyl-Rhamnose-Restes durch Biotransformation des Spinosyn-Aglycons und Spinosyn-Pseudoaglycons herangezogen worden sind.
Abbildung 4: Schematische Darstellung der offenen Leserahmen (ORF 's) der DNA- Region 3, die der SEQ ID NO: 51 entspricht, auf Cosmid 16-2-2.
Abbildung 5: Schematische Darstellung offener Leserahmen (ORF 's) der DNA- Regionen 1 und 2. Die ORF 's sind nummeriert von 1 bis 22 entsprechend SEQ ID NOS: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47 und 49.
Abbildung 6: Schematische Darstellung offener Leserahmen (ORF 's) der DNA- Region 2 (SEQ ED NOS: 5 und 6) und ableitbarer Module und Domänen. SM, Startmodul; Ml bis MIO, Modul 1 bis Modul 10; KS, ß-Ketoacyl:Acyl Carrier Protein Synthase; AT, Acyltransferase; ACP, ß-Ketoacyl:Acyl Carrier Protein; KR, Ketoreduktase; DH, Dehydratase; ER, Enoylreduktase; TE, Thioesterase.
Abbildung 7: Schematische Darstellung der Lage von BAC-Shuttleklon Insert-DNA als schwarze Balken im unteren Teil der Abbildung. Die Größe der Insert-DNA beträgt mindestens 100 kb. Durchgezogene Balken: DNA-Sequenz ist identisch mit Teilen der DNA-Region 1 und der Gesamtheit der DNA-Region 2 (P11/G6 und Pl l/BlO) bzw. mit der Gesamtheit der DNA-Region 1 und Teilen der DNA-Region 2 (P8/G11). Gestrichelte Balken: DNA-Sequenz liegt außerhalb des sequenzierten Bereichs.
Beispiele
Bakterienstämme und Plasmide
Escherichia coli XLl-Blue MRF' und die Cosmidvektoren SuperCosl (Stratagene, Europe) und pOJ446 (Biermann et al., 1992) wurden verwendet zur Erstellung von
Genbanken von S. spinosa ATCC49460 (American Type Culture Collection, U.S.A., EP-A 0 375 316). E. coli JM110 (Stratagene, Europe) wurde verwendet zur Propagierung von Plasmiden, die durch Transformation nach Streptomyces übertragen wurden. Streptomyces albus J1074 (Chater and Wilde, 1980; John Innes Institut in Norwich, UK) wurde zur heterologen Expression von und zur Biotransformation mit
Spinosyn-Biosynthesegenen eingesetzt.
Plasmid pBeloBACl 1 (Kim et al., 1996) und pOJ446 (Biermann et al, 1992) wurden verwendet zur Herstellung eines E. coli - Streptomyces BAC-Shuttlevektors.
Molekularbiologische Methoden
Molekularbiologische Methoden wie DNA-Restriktion, Agarose-Gelelektrophorese von DNA, Ligation von Restriktionsfragmenten, Kultivierung und Transformation von E. coli wurden durchgeführt wie beschrieben in Sambrook et. al (1989).
Plasmide wurden mit Qiagen Plasmid Kit (Qiagen, Hilden, Deutschland) isoliert. Die verwendeten Enzyme stammten von Röche Diagnostics GmbH (Mannheim, Deutschland).
Anzucht Bedingungen and molekulargenetische Methoden mit S. spinosa und
Streptomyceten sind beschrieben in (Hopwood et al., 1985). Alle Anzuchten in Flüssigkultur von S. spinosa oder Streptomyceten erfolgten aerob in Erlenmeyer- kolben bei 28°C.
Die DNA-DNA-Hybridisierungen erfolgten unter Verwendung des DIG-High Prime DNA Labeling and Detection Kit nach Angaben des Herstellers (Röche Diagnostics GmbH, Mannheim, Deutschland).
Wachstumsmedien:
LB Sambrook et. al., 1989
TS Difco Bestell-Nummer 0 370-17-3 (Difco Detroit, MI, USA)
R5A Illing et al., 1985
Herstellung einer Cosmid Genbank von S. spinosa
Um eine Genbank von S. spinosa zu erhalten, wurde chromosomale DNA von S. spinosa ATCC49460 mit Mbol partiell geschnitten und durch Zentrifugation im Glucosedichtegradienten aufgetrennt. Die Cosmid-DNA (SuperCosl, Stratagene Europe) wurde nach Angaben des Herstellers vorbereitet, mit den S. spinosa DNA- Fragmenten zwischen 35 und 45 kb ligiert und mit Hilfe des Gigapack-Verpackungs- system (Stratagene Europe) in Phagenpartikel verpackt. Die Transfektion erfolgte in
E. coli XL-1 blue MRF'. Diese Methode wurde ebenfalls dazu verwendet eine zweite S. spinosa Genbank anzulegen unter Verwendung des E. coli-Streptomyces Shuttle- Cosmids pOJ446.
Sequenzierung des Spinosynbiosynthese-Genclusters und eines DNA-Fragmentes das außerhalb dieses Clusters liegt, dessen Produkte aber an der Biosynthese von Spinosyn beteiligt sind
Die Insert-DNA der SuperCosl Cosmide 16-1-8, 16-59-1, und 16-59-8 wurden sequenziert. Eine ca. 4 kb große Lücke zwischen den Cosmiden 16-59-1 und 16-1-8
wurde durch pimer walking Sequenzierung eines entsprechenden Teilbereiches von Cosmid 16-59-6 geschlossen.
Eine ca. 2,3 kb große DNA-Sequenz auf dem SuperCosl Cosmid 16-2-2 wurde sequenziert.
Identifizierung und Charakterisierung von chromosomalen DNA-Fragmenten einer BAC-Shuttlevektor-Genbank aus S. spinosa. die Spinosyn-Biosynthesegensequenzen tragen
Zur Herstellung des BAC-Shuttlevektors, der nicht nur in E. coli sondern auch in Actinomyceten wie Streptomyces übertragen und vermehrt werden kann, wurde der Vektor pBeloBACl 1 mit Xhol linearisiert, und durch die Anwendung von Klenow Polymerase wurden glatte DNA-Enden hergestellt. Ein ca. 6 kb großes Dral - EcoRV DNA-Fragment des Cosmidvektors pOJ446, das den Replikationsursprung des Plasmides SCP2*, das Apramycinresistenzgen sowie den oriT zum konjugativen Transfer trägt, wurde mit dem linearisierten BAC-Vektor ligiert. Der resultierende Vektor erhielt die Bezeichnung pΕBZ333.
Ausgehend von partiell mit Mbol geschnittener genomischer DNA des Stammes S. spinosa ATCC49460 und dem mit BamΑI geschnittenen Vektor pEBZ333 wurde eine BAC-Genbank erstellt.
Analyse und Annotation offener Leserahmen direkt oder indirekt an der Spinosyn- Biosynthese beteiligter DNA-Sequenzen
Ausgehend von der Sequenz gemäß SEQ JD NOS: 1 bis 3 wurden offene Lese- rahmen (ORF 's) identifiziert, die direkt oder indirekt an der Biosynthese von Spinosyn beteiligt sind. Diese ORF 's wurden in zwei DNA-Regionen unterteilt, die als DNA-Region 1 und DNA-Region 2 (Abb. 2 und 5) bezeichnet werden und die
Sequenzen gemäß SEQ ID NO: 4 bzw. 5 und 6 tragen. Die DNA-Region 1 trägt
offene Leserahmen, deren Produkte an der Modifizierung und Tricyclusbildung des Spinosyn-Aglycons beteiligt sind, während die DNA-Region 2 (Abb. 2, 5 und 6) offene Leserahmen umfasst, deren Produkte die Spinosyn-Polyketidsynthase codieren. Die beiden jeweils ersten Nucleotide dieser DNA-Regionen liegen un- mittelbar nebeneinander (Abb. 2, 3 und 5).
Eine weitere DNA-Region 3 (SEQ ID NO: 51) liegt außerhalb dieses Clusters von DNA-Sequenzen und trägt offene Leserahmen, deren Produkte ebenfalls an der Biosynthese des Spinosyn-Zuckers Trimethyl-Rhamnose beteiligt sind.
Herstellung des Spinosyn-Aglycons und 17-Pseudoaglycons aus Tracer®
Ausgehend von 18,7 g des kommerziell erhältlichen Produktes Tracer® wurden nach Gefriertrocknung und Säulenchromatographie an Kieselgel 8,92 g Spinosyn A und D in einem Verhältnis von 82: 18 gewonnen.
Die Hydrolyse des Aminozuckers Forosamin gelang mit 2.7 N Schwefelsäure in Ethanol unter Rückfluß. Dabei fiel der Großteil des entstehenden 17-Pseudoaglycons von Spinosyn A/D aus. Im Filtrat wurden neben weiterem 17-Pseudoaglycon in Ab- hängigkeit von der Reaktionsdauer geringe bis mittlere Mengen des Spinosyn-
Aglycons gefunden.
Eine vollständige Hydrolyse zum Aglycon gelang unter etwas drastischeren Bedingungen (7.2 N Schwefelsäure in Methanol unter Rückfluß). Die Aglycon-Fraktion enthielt ausschließlich Aglycon von Spinosyn A. Dies stimmt sehr gut mit der
Literatur überein (Creemer et al., 1998), die unter entsprechenden Reaktionsbedingungen eine vollständige Zersetzung des Pseudoaglycons von Spinosyn D beschreibt. Als Ursache nehmen die Autoren eine leichtere Protoni erung der 5,6- Doppelbindung bei Spinosyn D unter Bildung eines tertiären Carbokations und an- schließende Umlagerungen an.
Es konnten somit ausgehend von 18,7 g käuflichem Tracer 3,0 g Aglycon von Spinosyn A hergestellt werden.
Tracer (Dow AgroScience) 18.7 g
Gefriertrocknung
grauer Feststoff 10.0 g
Spinosyn A/D (A, R = H, 82 %; D, R = CH3, 18 %)
8.92 g
2.7 N H2S04 / EtOH 3 h Rückfluß
69 % 16 %
17-Pseudoaglycon von Spinosyn A/D Aglycon von Spinosyn A
(A, R = H, 82 %; D, R = CH3, 18 %)
7.2 N H2S04 / MeOH 3 h Rückfluß
Gewinnung von Spinosyn A/D aus Tracer®
Die Gefriertrocknung von 18,7 g Tracer lieferten 10,0 g grauen Feststoff. Nach Säulenchromatographie dieses Feststoffes an 800 cm3 Kieselgel (Eluent: Dichlor- methan/Methanol 95:5) erhielt man 8,92 g reines Spinosyn A/D (82 % A, 18 % D).
- DC: R{ (SiO2, Dichlormethan/Methanol 9:1) = 0,46. - 1H-NMR: CDC13, δ = 6,77 (s, 13-H); 5,88 (d, 5-H von Spinosyn A); 5,80 (m, 6-H von Spinosyn A); 5,49 (m, 5-H von Spinosyn D); 4,87 (d, l '-H); 4,67 (m, 21-H); 4,43 (d, 1"-H); 4,31 (m, 9-H) u. a. - LC/MS: Elektrospray Positiv; Peak bei RT 44,0 min: m/z = 733 (100 %) [M+H]+ (Spinosyn A); Peak bei 44,7 min: m z = 747 (100 %) [M+H]+ (Spinosyn D).
Darstellung des 17-Pseudoaglycons von Spinosyn A/D:
8,65 g (11,81 mmoi) Spinosyn A/D wurden in 61 ml Ethanol gelöst und mit 104 ml Wasser und 208 ml 4 N H2SO4 versetzt. Nach 3 h Erwärmen unter Rückfluß wurde der ausgefallene Feststoff (A) abfiltriert und getrennt vom Filtrat (B) aufgearbeitet. Der Feststoff (A) wurde mit 1 N H2SO4 gewaschen, in 140 ml Dichlormethan aufgenommen, nacheinander mit gesätt. NaHCO -Lösung und gesätt. NaCl-Lösung gewaschen, über Na2SO4 getrocknet und im Vakuum eingeengt. Umkristallisation aus Ethanol lieferten 3,03 g 17-Pseudoaglycon von Spinosyn A/D und Mutterlauge (C).
Das Filtrat (B) wurde mehrmals mit Dichlormethan extrahiert. Die Extrakte wurden nacheinander mit gesätt. NaHCO -Lösung und gesätt. NaCl-Lösung gewaschen, über Na2SO4 getrocknet und im Vakuum eingeengt. Der Rückstand wurde vereint mit der im Vakuum eingeengten Mutterlauge (C) und durch Säulenchromatographie an 650 cm3 Kieselgel (Eluent: Cyclohexan/Essigsäureethylester 1:1, dann 100 % Essig- säureethylester) aufgetrennt. Man erhielt neben weiteren 1,76 g 17-Pseudoaglycon von Spinosyn A/D 0,78 g (16 %) Aglycon von Spinosyn A. Die Gesamtausbeute von 17-Pseudoaglycon von Spinosyn A/D betrug 4,79 g (69 %). - a) 17-Pseudoaglycon von Spinosyn A D (82 % A, 18 % D): DC: R{ (SiO2, Essigsäureethylester) = 0,48. -1H-NMR: CDC13, δ = 6,78 (s, 13-H); 5,88 (d, 5-H von Spinosyn A); 5,80 (m, 6-H von Spinosyn A); 5,49 (m, 5-H von Spinosyn D); 4,86 (d, l'-H); 4,70 (m, 21-H);
4,32 (m, 9-H) u. a. - LC/MS: Elektrospray Positiv; Peak bei RT 40,7 min: m/z = 609 (100 %) [M+NH4]+, m/z = 641 (10 %) [M+NH.,+CH3OH]+ (Pseudoaglycon von Spinosyn A); Peak bei RT 41,4 min: m/z = 623 (100 %) [M+NIL^, m/z = 655 (8 %) [M+NH4+CH3OH]+ (Pseudoaglycon von Spinosyn D). - b) Aglycon von Spinosyn A: DC: R{ (SiO2, Essigsäureethylester) = 0,29. - 1H-NMR: CDC13, δ = 6,80
(s, 13-H); 5,89 (d, 5-H); 5,80 (m, 6-H); 4,70 (m, 21-H); 4,44 (m, 9-H) u. a. - LC/MS: Elektrospray Positiv; Peak bei RT 36,8 min: m/z = 420 (100 %) [M+NIL;]*, m/z = 452 (10 %) [M+NH4+CH3OH]+.
Darstellung des Aglycon von Spinosyn A/D
4,30 g (7,29 mmol) Pseudoaglycon von Spinosyn A/D wurden in 190 ml Methanol gelöst und mit 285 ml 7,2 N H SO4 versetzt. Nach 3 h Erwärmen unter Rückfluß wurde die abgekühlte Reaktionsmischung vorsichtig in 1700 ml gesättigte NaHCO3- Lösung gegeben. Man extrahierte mit Diethylether, wusch die Extrakte nacheinander mit gesätt. NaHCO3-Lösung und gesätt. NaCl-Lösung, trocknete über Na2SO4 und engte im Vakuum ein. Nach Säulenchromatographie dieses Feststoffes an 650 cm Kieselgel (Eluent: Cyclohexan/Essigsäureethylester 1:2, dann 100 % Essigsäureethylester) erhielt man 1,88 g (64 %) Aglycon von Spinosyn A. - DC: i?f (SiO2, Essigsäureethylester) = 0,29. - 1H-NMR: CDC13, δ = 6,80 (s, 13-H); 5,89 (d, 5-H);
5,80 (m, 6-H); 4,70 (m, 21-H); 4,44 (m, 9-H) u. a. - LC/MS: Elektrospray Positiv; Peak bei RT 36,6 min: m/z = 420 (100 %) [M+NEU , m z = 452 (14 %) [M+NH +CH3OH]+ (Aglycon von Spinosyn A).
Forosaminylierung des Spinosyn-Aglycons und Anknüpfung eines Trimethyl-
Rhamnosezuckers an das Spinosyn-Aglycon durch Biotransformation mit einem rekombinanten Streptomyces Stamm, der Spinosyn-Zuckerbiosvnthesegene heterolog exprimiert
20 ml R5A Medium (Illing et al., 1989) mit 5 μg Apramycin / ml wurde mit Mycel des rekombinanten Stammes S. albus (165-1) oder S. albus (165-8) angeimpft und
24 h aerob bei 28°C bebrütet. Diese Kultur wurde mit 50 μg/ml des hergestellten Spinosyn-Aglycons (100 μl einer 1 %igen Stammlösung in Methanol; Herstellung siehe Kapitel "Herstellung des Spinosyn-Aglycons und 17-Pseudoaglycons aus Tracer®", „Gewinnung von Spinosyn A/D aus Tracer®" und „Darstellung des Aglycon von Spinosyn A/D") versetzt und ca. 120 h bei 28°C aerob inkubiert. Als
Kontrolle wurde in gleicher Weise S. albus (pEBZ340; pOJ446- Vektor mit einem ca. 1,8 kb großen Spinosyn-PKS tragenden DNA-Fragment aus Cosmid 16-1-8) kultiviert und mit Spinosyn-Aglycon versetzt. Die Kulturen wurden nach Inkubation zur Abtrennung von Zellmycel zentrifugiert und der Überstand (20 ml) wurde mit 25 ml Methanol versetzt.
Je 35 ml des mit Methanol versetzten Kulturüberstandes wurden lyophylisiert, mit 15 ml Wasser aufgenommen und zweimal mit je 10 ml Essigsäureethylester extrahiert. Die vereinten organischen Phasen wurden zur Trockene eingeengt und mit 350 μl Methanol aufgenommen. Ein Aliquot dieser Extrakte wurde mittels LC/MS mit Elektrospray Positiv-Ionisation untersucht.
Der Kulturüberstand der Anzucht von S. albus (165-1) enthielt eine Verbindung mit dem Molekulargewicht eines forosaminylierten Aglycons von Spinosyn A sowie Spinosyn A.
Peak 1 : RT = 41,0 min: m/z = 544 (100 %) [M+H]+, m/z = 576 (16 %) [M+H+CH3OH]+ (Forosaminyliertes Aglycon von Spinosyn A); LC/MS/MS: m/z = 142 (38 %) (Forosamin-Fragment).
Forosaminyliertes Aglycon von Spii riosyn A Molekulargewicht = 543 Summenformel = C32H4gN06
Peak 2: RT = 44,2 min: m/z = 733 (100 %) [M+H]+ (Spinosyn A); LC/MS/MS: m/z = 142 (21 %) (Forosamin-Fragment).
Der Kulturüberstand von S. albus (165-8) enthielt eine Verbindung mit dem Molekulargewicht eines Forosaminylierten Aglycons von Spinosyn A. Peak 1: RT = 40,9 min: m/z = 544 (100 %) [M+H]+, m/z = 576 (16 %) [M+H+CH3OH]+ (Forosaminyliertes Aglycon von Spinosyn A); LC/MS/MS: m z = 142 (39 %) (Forosamin-Fragment).
Der Kulturüberstand von S .albus (pEBZ340) enthielt keine Verbindungen mit MW 543 und kein Spinosyn A.
Forosaminylierung des Spinosyn- 17-Pseudoaglycons durch Biotransformation mit einem rekombinanten Streptomyces Stamm, der Spinosyn Zuckerbiosynthesegene heterolog exprimiert
20 ml R5A Medium (Illing et al., 1989) mit 5 μg Apramycin / ml wurde mit Mycel des rekombinanten Stammes S. albus (165-1) oder S. albus (165-8) angeimpft und
24 h aerob bei 28 °C bebrütet. Diese Kultur wurde mit 50 μg/ml des hergestellten 17- Pseudoaglycons von Spinosyn (100 μl einer 1 %igen Stammlösung in Methanol; Herstellung siehe Kapitel "Herstellung des Spinosyn-Aglycons und 17-Pseudo- aglycons aus Tracer®", „Gewinnung von Spinosyn A/D aus Tracer®" und „Dar-
stellung des 17-Pseudoaglycon von Spinosyn A/D") versetzt und ca. 120 h bei 28°C aerob inkubiert. Die Kulturen wurden nach Inkubation zur Abtrennung von Zellmycel zentrifugiert und der Überstand (20 ml) wurde mit 25 ml Methanol versetzt.
Je 35 ml des mit Methanol versetzten Kulturüberstandes wurden lyophylisiert, mit 15 ml Wasser aufgenommen und zweimal mit je 10 ml Essigsäureethylester extrahiert. Die vereinten organischen Phasen wurden zur Trockene eingeengt und mit 350 μl Methanol aufgenommen. Ein Aliquot dieser Extrakte wurde mittels LC/MS mit Elektrospray Positiv-Ionisation untersucht.
Der Kulturüberstand von S. albus (165-1) enthielt Spuren von Spinosyn A und D. Peak 1: RT = 44,2 min: m z = 733 (100 %) [M+H]+ (Spinosyn A); LC/MS/MS: m/z = 142 (8 %) (Forosamin-Fragment). Peak 2: RT = 44,7 min: m/z = 747 (100 %) [M+H]+ (Spinosyn D); LC/MS/MS: m/z = 142 (37 %) (Forosamin-Fragment).
Der Kulturüberstand von S. albus (165-8) enthielt Spuren von Spinosyn A und D. Peak 1: RT = 44,1 min: m/z = 733 (100 %) [M+H]+ (Spinosyn A). Peak 2: RT= 44,7 min: m/z z = 747 (100 %) [M+H]+ (Spinosyn D).
Hinterlegung von Mikroorganismen
Folgende Mikroorganismen und Plasmide sind bei der Deutschen Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ), Mascheroder Weg lb, D- 38124
Braunschweig, in Übereinstimmung mit den Bestimmungen des Budapester Vertrages hinterlegt worden.
Mikroorganismus und Plasmid Hinterlegungs- Datum nummer
E. coli XLl-Blue MRF'mit Cosmid 16-1-8 DSM 12961 1999-08-02 E. coli XL 1 -Blue MRF'mit Cosmid 16-2-2 DSM 12962 1999-08-02
E. coli XLl-Blue MRF'mit Cosmid 16-59-1 DSM 12963 1999-08-02
E. coli XLl-Blue MRF'mit Cosmid 16-59-6 DSM 12964 1999-08-02
E. coli XLl-Blue MRF'mit Cosmid 16-59-8 DSM 12965 1999-08-02
E. coli XLl-Blue MRF'mit Cosmid 165-1 DSM 13005 1999-08-18 E. coli XLl-Blue MRF'mit Cosmid 165-8 DSM 13007 1999-08-18
E. coli DH10B mit dem BAC Shuttle-Klon P8 / Gl 1 DSM 13012 1999-08-18
E. coli DH10B mit dem BAC Shuttle-Klon Pl 1 / BIO DSM 13011 1999-08-18
E. coli DH10B mit dem BAC Shuttle-Klon Pl 1 / G6 DSM 13010 1999-08-18
Literatur
Biermann M., Logan R., O'Brien K, Seno E.T., Nagaraja R., Schoner B.E. (1992) Plasmid cloning vectors for the conjugal transfer of DNA from Escherichia coli to Streptomyces spp. Gene 116: 43-49
Chater K., Wilde L. (1980) Streptomyces albus G Mutants defective in the SalGl restriction-modification System. J. Gen. Microbiol. 116: 323-334.
Devereux J., Haeberli P., Smithies (1984) A comprehensive set of sequence analysis programs for the VAX. Nucleic Acids Research 12: 387-395.
Mertz F., Yao R.C. (1990) Saccharopolyspora spinosa sp. nov. isolated from soil collected in a sugar mill rum still. Int. J. Syst. Bacteriol. 40: 34-39.
Creemer L.C., Kirst H.A., Paschal J.W. (1998) Conversion of spinosyn A and spinosyn D to their respective 9- and 17-pseudoaglycones and their aglycones. J. Antibiotics 51: 795-800.
Fishman S.E., Hershberger C.L. (1983) Amplified DNA in Streptomyces fr adiae. J. Bacteriol. 155: 459-466.
Hopwood D.A., Bibb M.J., Chater K.F., Kieser T., Bruton C.J., Kieser H.M., Lydiate DJ., Smith C.P., Ward J.M., Schrempf H. (1985) Gentic manipulation of streptomyces a laboratory manual, The John Innes Foundation, Norwich, 1985.
Illing G.T., Normansell I.D., Peberdy J.F. (1989) Protoplast isolation and regeneration in Streptomyces clavuligerus. J. Gen. Microbiol. 135: 2289-2297.
Kim U.J. Birren B.W. Slepak T. Mancino: V. Boysen C. Kang H.L. Simon MI. Shizuya H. (1996), Construction and characterization of a human bacterial artificial chromosome library. Genomics 34: 213-218.
Kirst H.A., Michel K.H., Martin J.W., Creemer L.C., Chao E.H., Yao R.C.,
Nakatsukasa W.M., Boeck L.D., Occolowitzh J.L., Paschal J.W., Deeter J.B., Jones N.D., Thompson GD. (1991) Tetrahedron Lext. 32: 4839-4842.
Motamedi H., Shafiee A., Sheng-Jian C. (1995) Integrative vectors for heterologous gene expression in Streptomyces spp. Gene 160: 25-31.
Muyrers J.P.P., Zhang Y., Testa G., Stewart A.F. (1999) Rapid modification of bacterial artificial chromosomes by ET-recombination. Nucleic Acids Research 27: 1555-1557.
Nakatsukasa W.M., Mabe J.A., Michel K.H., Martin J.W., Paschal J.W., Elzey T.K. (1990) Abstracts of 2nd Int. Conf. on Biotechnology of Microbial Prod.: P-21.
Sambrook J., Fritsch E.F., Maniatis T. (1989) Molecular cloning - A laboratory manual. Second edition. Cold Spring Harbor Laboratory Press.
Shizuya H., Birren B., Kim U.-J., Mancino V., Slepak T., Tachiiri Y., Simon M.I. (1992) Cloning and stable maintenance of 300-kilobase-pair fragments of human DNA in Escherichia coli using an F-factor-based vector. Proc. Natl. Acad. Sei. USA 89: 8794-8797.
Smokvina T., Mazodier P., Boccard F., Thompson C.J., Guerineau M. (1990) Construction of a series of pSAM2-based integrative vectors for use in actinomycetes. Gene 94: 53-59.