Nothing Special   »   [go: up one dir, main page]

WO2010072600A1 - Polyketid biosynthesegene - Google Patents

Polyketid biosynthesegene Download PDF

Info

Publication number
WO2010072600A1
WO2010072600A1 PCT/EP2009/067033 EP2009067033W WO2010072600A1 WO 2010072600 A1 WO2010072600 A1 WO 2010072600A1 EP 2009067033 W EP2009067033 W EP 2009067033W WO 2010072600 A1 WO2010072600 A1 WO 2010072600A1
Authority
WO
WIPO (PCT)
Prior art keywords
seq
polyketide
nucleic acid
gene
primer pair
Prior art date
Application number
PCT/EP2009/067033
Other languages
English (en)
French (fr)
Inventor
Jörn PIEL
Katja Fisch
Cristian Gurgui
Original Assignee
Rheinische Friedrich-Wilhelms-Universität Bonn
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rheinische Friedrich-Wilhelms-Universität Bonn filed Critical Rheinische Friedrich-Wilhelms-Universität Bonn
Publication of WO2010072600A1 publication Critical patent/WO2010072600A1/de

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • C12P17/162Heterorings having oxygen atoms as the only ring heteroatoms, e.g. Lasalocid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin

Definitions

  • the invention relates to a method for the isolation of gene sequences, as well as the gene sequence isolated by this method and fragments thereof, which codes for peptides for the biosynthesis of polyketides.
  • the resulting sponge metagenome may therefore contain hundreds of individual (prokaryotic) genomes, each providing its own PKS genes (Kim et al., Diversity of polyketide synthase genes from bacteria associated with the marine sponge Pseudoceratina clavata: eulture-dependent and eulture-independent approaches, Environ Microbiol 8, 1460-1470, 2006).
  • the present invention provides a solution to this problem and discloses a novel approach to specific amplification of PKS gene regions based on the substrate specificity of kethosynthase domains.
  • the present invention relates to a nucleic acid comprising at least one biosynthesis gene for a polyketide selected from the group consisting of psymberin or mycalamide.
  • the nucleic acid comprises a sequence selected from the group consisting of SEQ ID Nos. 1-19, 39, 75, a homolog of these sequences and the complement of the sequences or the homolog, the homolog having at least 75% sequence identity , or hybridized with the nucleic acid under high salt conditions.
  • the present invention relates to a peptide encoding one of the nucleic acids of the invention.
  • the peptide has an amino acid sequence selected from the group consisting of SEQ ID NOs 20-38 or a homolog of these sequences, wherein the homolog has at least one sequence identity to SEQ ID NO 20 of 36%, to SEQ ID NO 21 from 54%, to SEQ ID NO 22 from 44%, to SEQ ID NO 23 from 41%, to SEQ ID NO 24 from 52%, to SEQ ID NO 25 from 42%, to SEQ ID NO 28 from 44% to SEQ ID NO 29 of 94%, to SEQ ID NO 30 of 96%, to SEQ ID NO 31 of 96%, to SEQ ID NO 32 of 94%, to SEQ ID NO 33 of 98%, to SEQ ID NO 34 of 95%, to SEQ ID NO 35 of 97%, to SEQ ID NO 36 of 98%, to SEQ ID NO 37 of 96% or to SEQ ID NO 38 of 96%.
  • the present invention relates to a vector comprising the nucleic acids according to the invention and to a recombinant host cell which comprises the nucleic acids or the vector according to the invention.
  • the present invention relates to a process for producing a polyketide comprising the step of cultivating a recombinant host cell of the invention under conditions permitting expression of the biosynthetic genes and production of the polyketide by the host cell.
  • the present invention relates to a method of isolating at least one polyketide biosynthetic gene, comprising the steps of: a) providing at least one primer pair based on the substrate specificity of a ketosynthase domain of a trans-AT polyketide synthase; and b) isolating at least one polyketide biosynthetic gene using the at least one primer pair from step a).
  • step b) comprises the amplification of the nucleic acid region enclosed by the primer pair.
  • the at least one primer pair is specific for a motif conserved in phylogenetically adjacent kethosynthase domains of trans-AT polyketide synthases, or at least one primer of the primer pair is specific for at least 4 contiguous amino acid residues of any of those depicted in FIG. 3, FIG SEQ ID NO: 40-71 defined amino acid motifs.
  • the isolated polyketide biosynthesis gene is involved in the biosynthesis of psymberin or mycalamide.
  • the present invention provides a novel method for the targeted isolation of polyketide biosynthesis genes from metagenomes, taking advantage of the substrate specificity of the polyketide chain-extending ketosynthase (KS) domains.
  • KS ketosynthase
  • nucleic acid in the context of the present invention particularly, but not limited to, natural, preferably linear, branched or circular nucleic acids such as RNA, in particular mRNA, single-stranded and double-stranded viral RNA, siRNA, miRNA, snRNA, tRNA, hnRNA or Ribozymes, genomic, bacterial or viral DNA (single-stranded and double-stranded), chromosomal and episomal DNA, free-circulating nucleic acid and the like, synthetic or modified nucleic acids, for example plasmids or oligonucleotides, in particular primers used for PCR, - A -
  • nucleic acid often consists of two complementary strands Therefore, in a nucleic acid claimed by this invention, always the reverse complement of this nucleic acid to be considered as claimed.
  • high salt buffer in particular, but not limited to, a buffer having a high salt concentration (preferably chaotropic substances), preferably> 100 mM, more preferably> 500 mM and more preferably> 1 M.
  • high salt conditions is understood below to mean a medium which uses a high salt buffer, preferably a high salt buffer containing chaotropic salts
  • High salt preferably containing chaotropic salts
  • a polar surface as a hydrogen bond donor
  • the nucleic acids bind to this surface, where they undergo better stabilization than in water Water again a better hydrogen bond donor than the polar surface, and the nucleic acids can be detached again from the surface.
  • chaotropic substances or “chaotropic salts” are in particular - but not limited to - substances that alter the secondary, tertiary and / or quaternary structure of proteins and / or nucleic acids and leave at least the primary structure intact, the solubility reduce polar substances in water and / or enhance hydrophobic interactions, understood.
  • Preferred chaotropic substances are guanidine hydrochloride, guanidinium (iso) thiocyanate, sodium iodide, sodium perchlorate, potassium iodide, sodium (iso) thiocyanate and / or urea.
  • amplification or "amplification reaction” is understood to mean a process which makes it possible to increase the concentration of one or more analytes, preferably nucleated - to double at least.
  • isothermal and thermocyclic amplification reactions In the former, the temperature remains the same throughout the process, while in the latter, thermal cycles are passed through which the reaction and amplification are controlled.
  • Preferred isothermal amplification reactions are e.g.
  • LAMP Loop mediated isothermal amplification
  • NASBA Nucleic Acid Sequence Based Amplification
  • thermocyclic amplification reactions are e.g.
  • Ligase chain reaction (LCR), and / or
  • PCR polymerase chain reaction
  • LCR ligase chain reaction
  • LAMP loop-mediated isothermal amplification
  • NASBA nucleic acid sequence based amplification
  • RNA RNA
  • a first primer binds to the complementary sequence in the region of The DNA strand complementary to the matrix is then polymerized with a reverse transcriptase, and the RNA matrix is then digested using RNase H (RNase H digests only RNA in RNA-DNA hybrids, not single-stranded)
  • RNase H RNase H digests only RNA in RNA-DNA hybrids, not single-stranded
  • a second primer is attached to the 5 'end of the DNA strand, which is used by the T7 RNA polymerase as a starting point for the synthesis of a DNA strand complementary RNA molecule, which then used again as the starting matrix NASBA is performed at a constant temperature of normally 41 ° C and under certain circumstances gives faster and better results than PCR.
  • TMA Transcription Mediated Amplification
  • rolling circle chain reaction (RCCR) or “rolling circle amplification” (RCA) refers to an amplification method that mimics the general nucleic acid replication according to the rolling circle principle and is described inter alia in US5854033.
  • nested PCR is understood to mean a process in which an already amplified DNA fragment (or a part thereof) is amplified a second time; this process is done with a second primer pair located within the primer pair used in the first reaction.
  • promoter is understood as meaning a nucleic acid sequence which permits the regulated expression of a gene, which is located upstream, ie 5 'to the RNA-coding region of the gene
  • An important property of a promoter is the specific interaction with particular DNA-binding proteins which mediate the initiation of transcription of the gene by RNA polymerase and are referred to as transcription factors
  • the most important prokaryotic transcription factors are the sigma factors. By far the most promoters in, for example, E.
  • coli are recognized by the factor Sigma-70 and have the following promoter elements: 1) an AT base-pair-rich UP element above the -35 region (which also corresponds directly to the ⁇ subunit of 2) the -35 region, with the consensus sequence: 5'-TTGACA-3 ', 3) the -10 region (Pribnow box), with the consensus sequence: 5'-TATAAT- 3 '.
  • promoter elements 1) an AT base-pair-rich UP element above the -35 region (which also corresponds directly to the ⁇ subunit of 2) the -35 region, with the consensus sequence: 5'-TTGACA-3 ', 3) the -10 region (Pribnow box), with the consensus sequence: 5'-TATAAT- 3 '.
  • strong promoters are rich in AT base pairs just before the start of transcription.
  • the consensus sequences give only an approximate guide to building a promoter.
  • a particular sigma-70 dependent promoter may differ from these sequences in several places.
  • the promoter is an inducible
  • an inducible promoter is the artificially generated tac promoter, which can be used to increase gene expression levels in bacterial cells (eg E. coli) and thus to overexpress recombinant proteins.
  • This synthetic promoter consists of the -35 region of the strong trp promoter from E. coli and the -10 region of the IPTG and lactose regulatable / inducible lac promoter.
  • the inducible tac promoter is about 3 times stronger than the trp promoter and about 10 times stronger than the lac promoter.
  • biosynthesis means the enzymatic production of a polyketide, preferably by means of one or more polyketide synthases, preferably a trans-AT polyketide synthase
  • biosynthesis gene thus encompasses any gene coding for a protein as part of one Polyketide synthase is.
  • biosynthesis gene also encompasses fragments of a biosynthetic gene coding for a truncated protein of a polyketide synthase which has the same function as the full-length protein.
  • the same function is understood here to mean the basically identical biochemical function, irrespective of whether it is carried out with an increased or decreased efficiency or speed, as an example of a biosynthesis gene is a gene for a KS Domain whose biochemical function is to lengthen ⁇ -saturated intermediates (see, for example, the KS of Klade V), or a gene whose gene product in a PKS has the biochemical function exercises to transfer a methyl residue (eg psyB).
  • biosynthetic gene any truncated version of such genes resulting in truncated gene products still performing the same biochemical function will also fall under the term “biosynthetic gene.”
  • biosynthetic genes and specific embodiments of the invention are psyA -psyN genes listed in Table 1.
  • metagenome is understood here to mean an amount of at least two genomes of different species, ie, a metagenome comprising the entire genomic information of at least two species
  • the metagenome comprises the genome of a sponge and that of at least one prokaryote
  • the prokaryote lives in symbiosis with the sponge.
  • a primer is considered to be "specific" for a given amino acid sequence if it hybridizes, preferably under stringent conditions, with or is identical to the sense or antisense strand of a nucleic acid which corresponds to the given amino acid sequence Since the amino acid code is degenerate, a number of suitable primers can be used for a given amino acid sequence It is known to those skilled in the art which base triplets encode which amino acid residues The primer should have a minimum length which allows it to react with a nucleic acid In a specific embodiment, the primer hybridizes to a nucleic acid comprising at least 5, 6, 7 or more than 7 contiguous amino acid residues of the given amino acid encoded sequence.
  • a primer is considered in the context of the invention as specific for the defined amino acid motifs, even if it is specific for an amino acid sequence containing at least 2, at least 3, or at least 4 contiguous amino acid residues one of the in Fig. 3 and Fig. 4 or SEQ ID NOs: 40-71 defined amino acid motifs and additionally at the 3'- or 5 'end further nucleotides for not in the defined amino acid motifs contained amino acid residues.
  • the number of nucleotides of the primer that are specific for amino acid residues that are not contained in the defined amino acid motif up to 30% of the total number of nucleotides of the primer can be.
  • a primer which is specific for the amino acid motif "YYQAGML" defined in FIG. 3 can also be prepared so that it is specific for the amino acid sequence "YYQ AGMLA", wherein the additional nucleotides for the alanine which is not contained in the defined amino acid motif 12.5% of the total primer sequence.
  • Polyketide synthases can be divided into three classes based on their structure and function.
  • Type I enzymes are multifunctional, often modular proteins.
  • Bacterial modular type I PKSs produce a large amount of therapeutically important natural products, e.g. Erythromycin, Epothilone and FK506 (Fischbach & Walsh Assembly-line enzymology for polypeptides and nonribosomal peptide antibiotics: logic, machinery and mechanisms, Chem. Rev. 106, 3468, 2006).
  • Fig. 1 shows some exemplary polyketides which, as far as their gene clusters are known, are formed by Type I PKS.
  • Each of these enzymes comprises at least one ⁇ -ketosynthase (KS), an acyltransferase (AT) and an acyl carrier protein (ACP), which select the next building block for the formation of the polyketide, and activate to form a ⁇ -ketoacyl-S ACP intermediates, catalyze a decarboxylative Claisen condensation between the next building block and the growing polyketide chain.
  • KS ⁇ -ketosynthase
  • AT acyltransferase
  • ACP acyl carrier protein
  • trans-AT-PKSs A special and evolutionarily delimited enzyme family of PKSs are the trans-AT-PKSs, which use free-standing AT to trans select the building blocks needed to make the polyketide (Cheng et al., Type I polyketide synthase requiring a discrete acetyltransferase for polyketide biosynthesis Proc. Natl. Acad., USA 100, 3149-3154, 2003).
  • ice-AT PKS have integrated AT domains.
  • the previously published studies on complex polyketides have shown that all previously cloned from symbionts PKS clusters belong to this family of trans-AT-PKS.
  • the present invention is based on the surprising discovery that the KS of trans AT-PKS have a unique phylogenetic pattern in which the closest related KS domains are specific for the same or similar substrates.
  • different substrates eg .beta.-hydroxylated and olefinic
  • the phylogenetic analysis of one or more CSs thus provides useful information about the structure of the intermediates involved.
  • the reverse approach is adopted, in which, due to the chemical structure of the polyketide, conclusions can be drawn about the KS involved. It has surprisingly been found that this approach allows the identification of conserved sequence patterns / motifs within these substrate-specific KS domains. Because of these conserved motifs, it is then possible in accordance with the invention to generate primers which are specific for KS domains having a specific, desired substrate specificity. These primers then allow the amplification of such KS domains that are specific to a particular substrate. These amplicons may then be used to identify and isolate one or more polyketide biosynthetic genes, e.g. in gene clusters, e.g. by PCR, screening of fosmid libraries or genome walking.
  • One of the main advantages of the present invention thus lies in the fact that, starting from the polyketide, a KS domain of a trans-AT PKS involved in its biosynthesis can be identified in a targeted manner in order to obtain, in a next step, its nucleotide sequence and the nucleotide sequence of the polyketide biosynthesis complex comprising it. To identify and isolate gene clusters.
  • the present invention is therefore based on the surprising discovery that, based on the chemical structure, ie the functional groups of a polyketide, conserved motifs can be identified within KS domains involved in the biosynthesis of this polyketide. Based on these conserved motifs, primers can then be deduced which can be used to amplify and isolate the genes involved in the biosynthesis of this polyketide.
  • nucleic acid comprising at least one gene coding for a polypeptide involved in the biosynthesis of the polyketides psymberin (also known as ircinamin A), or mycamide.
  • the nucleic acid is in isolated form.
  • nucleic acid is the complement of a nucleic acid comprising at least one gene coding for a polypeptide involved in the biosynthesis of the polyketides psymberin or mycalamide.
  • the gene is a prokaryotic gene and / or part of a polycistronic gene segment or gene cluster that encodes at least one protein involved in the biosynthesis of a polyketide.
  • the gene belongs to the type I PKS; In a preferred embodiment, the gene belongs to the evolutionarily delimited enzyme family of trans-ATP PKS.
  • TransAT PKSs use free-standing acetyltransferases (AT) to trans select the building blocks needed to make the polyketide (Cheng et al., Type I polyketide synthase requiring a discrete acetyltransferase for polyketide biosynthesis., Proc. Natl. Acad 100, 3149-3154, 2003), while cis AT PKS has integrated AT domains.
  • the nucleic acid according to the invention was amplified from the metagenome of a sponge.
  • Eukaryotic sponges enter into symbiosis with various prokaryotes, although these prokaryotes can often not be cultured in isolation.
  • the resulting sponge and prokaryote metagenome includes the genome of the eukaryotic sponge and the prokaryotic genomes of the individual symbionts.
  • the sponge belongs to the Demospongiae, the Dictyoceratida or the Irciniidae.
  • the sponge belongs to Psammocinia sp .; more preferably, the sponge is Psammocinia äff. bulbosa. In a preferred embodiment, the sponge belongs to the Demospongiae. In further preferred embodiments, the sponge belongs to the family of Spongiidae, Thorectidae, Halichondriidae, Callyspongiidae, Chalinidae, Mycalidae, Coelosphaeridae, Tedaniidae, Plakinidae, or Triaenosina. For the purposes of this invention, preferred representatives of these families are Spongia spp., Cacospongia spp., C.
  • the amplification of the nucleic acid from the metagenome can be carried out by means of any method of nucleic acid amplification known to the person skilled in the art.
  • the amplification of the nucleic acid according to the invention takes place by means of an isothermal or a thermocyclic amplification reaction.
  • the amplification is preferably carried out by means of ligase chain reaction (LCR), and / or polymerase chain reaction (PCR); more preferably, the PCR is a nested PCR.
  • the nucleic acid according to the invention comprises at least one sequence which is selected from the group consisting of SEQ ID NO 1-19, 39, 75, a homolog of these sequences and the complement of the sequences or the homolog.
  • the nucleic acid according to the invention comprises at least one sequence which is selected from the group consisting of SEQ ID NO 4, 5, 6, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 (psy A, psyB, psyC, psyD, psyE, psyF, psyG, psyH, psyl, psyJ, psyK, psyL, psyM and psyN), a homolog of these sequences and / or the complement of the sequences or the homolog.
  • the homolog has at least 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, preferably 97%, 98%, 99%. , 99.5%, 99.7%, 99.9% sequence identity with the nucleic acid being compared, and / or hybridizes with the nucleic acid under high salt conditions.
  • the nucleic acid according to the invention codes for a protein which has at least one identity to SEQ ID NO 23 of 41%, to SEQ ID NO 24 of 52%, to SEQ ID NO 25 of 42%, to SEQ ID NO 28 of 44 %, to SEQ ID NO 29 of 94%, to SEQ ID NO 30 of 96%, to SEQ ID NO 31 of 96%, to SEQ ID NO 32 of 94%, to SEQ ID NO 33 of 98%, to SEQ ID NO 34 of 95%, to SEQ ID NO 35 of 97%, to SEQ ID NO 36 of 98%, to SEQ ID NO 37 of 96% or to SEQ ID NO 38 of 96%.
  • the nucleic acid according to the invention encodes a protein, which has at least one identity to SEQ ID NO 23 of 50%, to SEQ ID NO 24 of 55%, to SEQ ID NO 25 of 50% or to SEQ ID NO 28 of 50%.
  • Another aspect of the present invention is a peptide, polypeptide, protein or enzyme encoded by one of the nucleic acids of the invention.
  • the peptide has an amino acid sequence selected from the group consisting of SEQ ID NOs 20-38.
  • the peptide has at least one identity to SEQ ID NO 20 of 36%, to SEQ ID NO 21 of 54%, to SEQ ID NO 22 of 44%, to SEQ ID NO 23 of 41%, to SEQ ID NO 24 from 52%, to 42% SEQ ID NO 25, 44% to SEQ ID NO 28, 94% to SEQ ID NO 29, 96% to SEQ ID NO 30, 96% to SEQ ID NO 31, to SEQ ID NO 32 of 94%, to SEQ ID NO 33 of 98%, to SEQ ID NO 34 of 95%, to SEQ ID NO 35 of 97%, to SEQ ID NO 36 of 98%, to SEQ ID NO 37 of 96% or to SEQ ID NO 38 of 96%.
  • the peptide has at least one identity to SEQ ID NO 23 of 50%, to SEQ ID NO 24 of 55%, to SEQ ID NO 25 of 50% or to SEQ ID NO 28 of 50%.
  • the peptide has a sequence identity of at least 60%, 70%, 75%, 80%, 90%, 92%, 95%, 97%, 98%, 99% or 99.5%.
  • the invention relates to a vector comprising the nucleic acid according to the invention.
  • this vector is a cosmid, a YAC, BAC or a virus, more preferably the vector is a plasmid.
  • the vector further comprises a promoter under the control of which the expression of the nucleic acid according to the invention is.
  • this promoter is an inducible promoter.
  • the nucleic acid according to the invention is under the control of an inducible expression system.
  • the inducible expression system is the tetracycline operator / repressor (TetO2 / TetR) system.
  • the invention relates to a recombinant host cell which comprises one of the nucleic acids or vectors according to the invention.
  • the present invention also provides an expression / production system for polyketides.
  • this recombinant host cell is able to synthesize polyketides.
  • the recombinant host cell is an E. coli cell, in further embodiments, the recombinant host cell is a host cell of Pseudomonas spp., Bacillus spp., Streptomyces spp. or Acinetobacter baylyi.
  • a further aspect of the invention relates to the use of the nucleic acids, vectors or recombinant host cells according to the invention in a process for the preparation of a polyketide.
  • an expression system is used which allows the expression of the nucleic acids according to the invention.
  • the expression system is a recombinant host cell comprising the nucleic acids or vectors of the invention and capable of expressing the gene products of the nucleic acids of the invention.
  • the expressed gene products can then be used to synthesize the polyketide in vivo or in vitro.
  • the polyketide produced is psymberin or mycalamide.
  • the method or the expression system comprises the use of at least one nucleic acid comprising a sequence selected from the group consisting of SEQ ID NO 4, 5, 6, 9, 10, 11, 12, 13, 14, 15, 16 , 17, 18, 19 (psyA, psyB, psyC, psyD, psyE, psyF, psyG, psyH, psyl, psyJ, psyK, psyL, psyM and psyN) or a homologue of these sequences.
  • the cultivation of a recombinant host cell according to the invention takes place under conditions which allow expression of the biosynthetic genes and production of the polyketide by the host cell. Such conditions are well known to those skilled in the art or can be obtained by simple routine experimentation for a given polyketide.
  • the recombinant host cell is a host cell of Pseudomonas spp., Bacillus spp., Streptomyces spp., Corynebacterium spp., Acinetobacter baylyi, Pseudomonas tripe, Bacillus subtilis or Bacillus amyloliquefaciens.
  • the expression of the gene product can be specifically induced by addition of the respective inducing substance.
  • an inducible expression system eg the tetracycline operator / repressor (TetO2 / TetR) system
  • the genes of the gene cluster are integrated into the genome of the expression hosts. The integration takes place successively by homologous recombination of shorter (in about 40 kb) sections of the gene cluster.
  • transformable bacteria such as Pseudomonas, Acinetobacter baylyi, Bacillus subtilis or Bacillus amyloliquefaciens, which can receive linearized DNA.
  • the natural promoters of the gene cluster are replaced by their own promoters (eg the baeB- ⁇ xovaotox in B. amyloliquefaciens).
  • genes on or distributed on several compatible plasmids can be transferred into the expression hosts by conjugation, protoplast transformation or electroporation. The expression then takes place of freely replicating plasmids or again after integration into the genome.
  • the method further comprises the step of isolating the produced polyketide.
  • this isolation is carried out by means of HPLC and / or preparative column chromatography.
  • the isolation of the at least one polyketide biosynthesis gene using the at least one primer pair comprises, in one embodiment, the amplification of the nucleic acid region enclosed by the respective primer pair by means of the primer pair.
  • a nucleic acid region of the kethosynthase domain is amplified.
  • this amplification is performed by PCR, more preferably by nested PCR.
  • the present invention is directed to a method for isolating at least one polyketide biosynthetic gene, and comprises the steps of providing at least one primer pair which, due to the substrate specificity of a Kethosynthasedomäne a trans-AT polyketide synthase has been created, and the isolation of at least one polyketide Biosynthesegen using this at least one primer pair.
  • the inventive provision, i. the "design" of the primers is based on the surprising discovery that the KS of trans-AT PKS have a unique phylogenetic pattern in which the closest related KS domains are specific for the same or similar substrates, thus starting from the functional groups of a polyketide to identify a conserved motif within KS domains on the basis of which primers can be produced that are specific for such a conserved motif - and thus for a KS domain involved in the biosynthesis of the polyketide KS domain and thus the KS domain comprising PKS and other genes involved in the biosynthesis of the polyketide, which are often present in a gene cluster, is thus made possible according to the invention.
  • Whether a given KS or KS domain is similar or phylogenetically adjacent to a second KS or KS domain can be determined, for example, by sequence comparisons in which mutually more similar sequences correspond to phylogenetically more closely adjacent KS or KS domains.
  • a phylogenetic analysis is used for this purpose.
  • a cladogram is created for the phylogenetic analysis.
  • the cladogram is generated by the Bayesian method and as described in Example 3.
  • the domain architecture of the N-terminal adjacent module is analyzed according to the phylogenetic analysis for KS and derived from the polyketide structure, the substrate of the KS domain.
  • domain architecture is meant the sequence of domains in a module, such as e.g. KS DH KR ACP.
  • the method according to the invention is directed to the directed isolation of at least one gene involved in the polyketide biosynthesis, ie is / are based on the functional groups of a polyketide / s necessary for the preparation of this polyketide gene (s) isolated.
  • the polyketide biosynthesis gene is involved in the biosynthesis of psymberin.
  • Psymberin Figure 1, 1 does not carry a fully reduced residue but an acetyl-derived starter unit, which is usually extended by a very particular type of KS.
  • FIG. 2 it was found that KS with such a substrate specificity belongs to clade VI.
  • Klade VI can be further differentiated into KS domains that follow a module with a GCN5-related N-acetyltransferase (GNAT) domain (clade VIa) and those that do not have a GNAT domain (clade VIb).
  • GNAT GCN5-related N-acetyltransferase
  • clade VIa GCN5-related N-acetyltransferase domain
  • clade VIb GNAT domain
  • a sequence alignment of the Klade VIa contained KS domains together with all known sequences of Klade VI revealed two conserved motifs: the EDAGY motif, as well as the Klade VIa motif YYQ / KAGML, which is a module with a GCN5-related N-acetyltransferase (GNAT) domain followed (Figure 3). These conserved motifs did not appear in the sequences of the other clades.
  • a tyrosine residue was identified in the EDAGY motif, which is conserved in 84% of trans-AT KS, but does not occur in the ubiquitous sup KS. Therefore, due to the identified conserved motifs, primers that are specific for the EDAGY motif in the forward orientation and specific for the YYQ / KAGML motif in reverse orientation can now be generated to isolate a gene involved in psymberin biosynthesis.
  • the amplicons generated using these primers can then be used to isolate the nucleic acid sequence for the KS domain, the nucleic acid sequence for the KS domain-containing PKS, and the nucleic acid sequence of the entire gene cluster necessary for polyketide synthesis. Methods for isolating such nucleic acid sequences are well known to those skilled in the art and include, for example, genome walking or screening of cosmid or fosmid libraries. The isolated nucleic acids can then be identified / identified by sequencing.
  • At least one primer is specific for 2, 3, 4, 5, 6, or more than 6 contiguous amino acid residues of one of the defined in Fig. 3 or Fig. 4 ten kladpezif ⁇ schen amino acid motifs, which are also shown in SEQ ID NO 40-71.
  • the at least one primer of the primer pair at the 3 'end of the primer is specific for the said amino acid residues.
  • both primers of the primer pair are specific for at least 2, 3, 4, 5, 6 or more than 6 contiguous amino acid residues of the amino acid motifs of a clade defined in FIG. 3 or 4, wherein the two primers are based on the nucleic acid with which they hybridize, keep a sufficient distance from each other to allow amplification.
  • the primer pair used has the nucleotide sequence: 5'-GCN HTN GAR GAY GCN GGN TAY GC-3 '(EDAGY; SEQ ID NO: 72) and 5'-C NAR CAT NCC NGC YTK RTA RTA- 3 '(YYQAGMLA; SEQ ID NO: 73).
  • a second primer pair is used for the amplification of the nucleic acid region of the KS domain enclosed by the at least one primer pair in addition to the at least one primer pair according to the invention, wherein the first and the second primer pair are nested, i. one pair of primers lies completely within the nucleic acid region to be amplified by the other primer pair.
  • the second primer pair is a primer pair prepared according to the invention and is therefore likewise based on the substrate specificity of a ketosynthase domain of a trans-AT polyketide synthase.
  • the second primer pair is a degenerate primer pair.
  • this primer pair is specific for the amino acid sequence KSDPQQF (forward) or KSHGTGR (reverse).
  • the second primer pair has the nucleotide sequence 5'-MGN GAR GCN NWN SMN ATG GAY CCN CAR CAN MG-3 'and 5'-GGR TCN CCN ARN SWN GTN CCN GTN CCR TG-3', respectively.
  • amplification with the two primer pairs is performed simultaneously or in two stages.
  • the outer primer pair is used in the first round of amplification.
  • the amplificates from the first round of amplification are amplified with the internally interleaved primers.
  • the amplification to be carried out with the at least two primer pairs is a nested PCR.
  • the isolation of the at least one polyketide biosynthesis gene from a metagenome takes place.
  • the metagenome comprises the genome of at least one eukaryote and at least one prokaryote.
  • eukaryotic and prokaryotic are in symbiosis.
  • the eukaryote is a sponge, preferably this sponge belongs to the Demospongiae, the Dictyoceratida or the Irciniidae.
  • the sponge belongs to Psammicinia sp .; more preferably, the sponge is Psammocinia äff. bulbosa.
  • the method according to the invention further comprises the step of isolating the entire gene region required for the polyketide synthesis based on the sequence information of the isolated at least one polyketide biosynthesis gene.
  • this isolation of the entire gene region is done using a library.
  • the library is a cosmid, YAC, BAC, or fosmid library.
  • the library was generated from a metagenome.
  • the metagenome is the metagenome of a sponge.
  • Figure 1 shows an overview of some exemplary complex polyketides isolated from sponges, except for pederin, which are synthesized by symbionts or suspected of being synthesized by symbionts.
  • psymberin iriniastatin A
  • 2 onnamides A 3 pederin
  • 4 myclamide A 5 laulimalide (Fijianolide B)
  • 6 latrunculin A 7 mycothiazole
  • 8 pateamine A 9 spongistatin 1 (altohyrtin A).
  • the zodiac sign (*) indicates the position of the ß branches.
  • Figure 2 is a Bayesian cladogram of full-length KS domains from trans AT-PKS.
  • the KS numbering refers to the position within the gene cluster starting from the upstream end.
  • LkcKS3 is the third lankacidin KS domain.
  • the cis-AT KS4 of erythromycin PKS was used as an outgroup. Probability values> 0.6 are given at the nodes.
  • Clade types are specified in Roman numerals along with the main substratum type. Bae, Bacillaene; BT, uncharacterized PKS from B.
  • thailandensis Chi
  • Chi chivosazole
  • Dif difficidin
  • Dz disorazole
  • GU uncharacterized PKS from Geobacter uraniumreducens
  • Lkc lankacidin
  • Lm Leinamycin
  • MIn Macrolactin
  • Mmp mupirocin
  • Onn Onnamide
  • Ped Pederin
  • Ta myxovirescin.
  • FIG. 3 shows the sequence alignment of KS protein sequences of individual clades.
  • the numbering refers to the amino acid positions of Pedl, which includes PedKSl.
  • the arrows indicate regions to which primers were prepared according to the invention, which were used for the amplification of the PKS gene fragments. Clade-specific amino acid residues within these regions are shown in bold.
  • the zodiac marks the conserved cysteine of the active site.
  • SupA is from Burkholderia pseudomallei 1710b (BURPS 1710b_A2618, first KS domain);
  • KAKS 1 comes from Kordia algicida (KAOT 1 04270, first KS);
  • SupA.Tsl is from Theonella swinhoei (GenBank accession ABE03935, first CS);
  • SupA.Aal is from Aptysina aerophoba (ABE03915, first CS);
  • SupA.Aa2 is from A.
  • SupA.Pcl is from Pseudoceratina clavata (ABB73286, first CS); SupA.PKSA is from Discodermia dissoluta (SA1_PKSA, second CS).
  • Figures 4A-4I show a sequence alignment of the clad-specific motifs suitable for a group-specific primer design according to the invention.
  • the group specific amino acids are shown as white letters against a black background; Generally conserved amino acids are grayed out (80% treshold) and amino acids conserved in some but not all groups are shown in bold.
  • the division into the clades is based on a phylogenetic analysis according to Nguyen, T., Ishida, K., Jenke-Kodama, H., Dittmann, E., Gurgui, C, Hochmuth, T., Taudien, S., Platzer, M ., Hertweck, C. and Piel J. Nat.
  • supAl ABK01346.1
  • supA2 ABK01347.1
  • supA4 ABK01355.1 were also added to the sequence alignment to avoid ubiquitous PKS sequences from sponges.
  • Figure 5A shows the genomic organization of the isolated PKS gene cluster for psymberin biosynthesis.
  • Figure 5B schematically illustrates the structure of the identified PsyA and PsyD proteins, illustrating the individual modules as well as the biochemical transformations occurring thereon.
  • Figure 5C compares the structures of the corresponding PKS proteins for pederin and onnamide biosynthesis.
  • the amino acid sequences of 138 known trans-AT PKS modules were taken from the GenBank database and ordered and aligned ("alignment") under manual control using ClustalX, thereby excluding deletions and unalignable sequence regions.
  • a phylogenetic analysis of the full-length KS domains of the processed amino acid sequences was performed using the MrBayes software (v3) using "WAG replacement mode” and a four-category gamma distribution.
  • the Marko vketten Monte Carlo analysis ran for 2.5 million Cycles were sampled every 100 generations and the convergence was assessed by plots of the maximum likelihood values and a standard deviation of ⁇ 0.05
  • the consensus tree and the later plaque probabilities were calculated after discarding the trees that had died before
  • the phylogenetic analysis based on the Neighborhood Joining technique was performed using the Seqboot, Protdist, Neighbor, and Consens programs of the PHYLIP software, and the bootstrap analysis was performed with 1000 pseudo-replicate sequences aximum parsi
  • the derived cladogram shown in Figure 2 clearly shows that individual clades contain KS of different bacteria. Subsequently, the domain architecture of the N-terminal neighboring module was analyzed for all CSs and, together with biosynthetic considerations (predicted from the polyketide structure), the substrates of all KS domains were derived. Phylogenetically clearly defined groups of KS with the same substrates were found, ie a distribution of the domains of the individual biosynthetic pathways to individual clades.
  • FIG. 3 and FIG. 4 show the thus detected consensus sequences from which primers can be derived according to the invention which are each specific only for that KS domain which is involved in the biosynthetic pathway of a particular group found in a polyketide. Furthermore, a tyrosine residue was identified in an EDAGY motif that is conserved in 84% of all trans AT-KS, but does not occur in the ubiquitous sup KS.
  • the total DNA from the samples was isolated by a method known to those skilled in the art to remove the high level of polysaccharides (Murray, MG and WF Thompson (1980) Rapid Isolation of High-Molecular-Weight Plant DNA. Nuc. Acids Res 8: 4321-4325).
  • the frozen sponge material was thawed and a small piece of ca. Ig was cut off which contained both the sponge surface and the interior of the sponge.
  • the tissue was ground under liquid nitrogen using pre-chilled mortar and pestle.
  • the resulting powder was transferred immediately thereafter into a 50 ml Falcon tube containing 10 ml lysis buffer (8 M urea, 2% sarcosyl, 1 M NaCl, 50 mM EDTA and 50 mM Tris-HCl pH 7.5).
  • the Lysere force was carried out at 60 0 C for 15 min, the mixture was carefully mixed every 5 min.
  • the isolated DNA was then extracted twice with 10 ml of phenol / CHCl 3 / isoamyl alcohol (25: 24: 1, v: v: v) and once with 10 ml of C HC I 3 . Each extraction was followed by a centrifugation step at 11,000 rpm for 5 min. To remove polysaccharides, the upper aqueous phase containing the DNA was treated with a 10% (w / v) aqueous cetyltrimethylammonium bromide (CTAB) solution at a final concentration of 0.5%. The mixture was incubated at 60 ° C for 15 min and the precipitate was removed by centrifugation at 11,000 rpm for 15 min.
  • CTAB cetyltrimethylammonium bromide
  • the nucleic acids were precipitated with 2 volumes of precooled ethanol (98%) and 1/10 volume of a 3 M sodium acetate solution (pH 7).
  • the precipitate obtained after a 30 minute centrifugation step at 11000 rpm at 4 ° C was washed twice with cold 70% ethanol.
  • the crude DNA (approximately 5 ⁇ g) was air-dried for 10-15 min and resuspended in Tris buffer (10 mM, pH 8.5).
  • the CopyControl Fosmid Library Production Kit (Epicenter Biotechnologies) was used, whereby the manufacturer's protocol was modified.
  • the DNA was separated in a 1% (w / v) low-melting point agarose gel and fragments about 35 kb in size were isolated by gel digestion with GELase.
  • 1 U of the GELase enzyme solution was added to each 300 ul of molten agarose, followed by incubation for 2 h at 45 0 C.
  • a first step the complexity of the DNA sample was first reduced by means of a first PCR amplification.
  • degenerate primers were used which had previously been used for the isolation of the genes of pederin and omnamide (Piel et al., Anititumor polyketide biosynthesis by an uncultivated bacterial symbiont or the marine sponge Theonella swinhoei., PNAS 101, 16222-16227; 2004; Piel, A polyketide synthase peptide synthetase gene cluster from an uncultured bacterial symbiont of Paederus beetles, PNAS 99, 14002-14007, 2002).
  • the forward primer had the sequence 5 '-MGNGARGCNNWNSMNATG GAYCCNCARCANMG-3'; the reverse primer had the sequence 5'-GGRTCNCCNA RNA WNGTNCCNGTNCCRTG-3 '.
  • the PCR took place under the following conditions: 96 0 C for 45 s, 55 0 C for 45 s, 72 0 C for 1 min (40 x), then 72 0 C for 10 min.
  • Taq polymerase (NEB) was used.
  • the amplificate was separated by agarose gel and the DNA running at 700 bp purified by gel digestion as described above. 1 ⁇ l of this purified PCR amplificate was used as template for a second round of PCR.
  • the target was the acetyl-derived starter unit, which is usually extended by KS belonging to Klade VI.
  • the unique sequence motif YYQ / KAGML was found in all KSs following a module with a GCN5-related N-acetyltransferase (GNAT) domain. This motif was chosen for the primer design, as it could be shown that GNATs incorporate decarboxylation of malonyl-CoA acetyl starter units specifically into polyketides.
  • the primers used were specific for the EDGAY motif as well as for the YYQ AGML motif.
  • the forward primer had the sequence 5'-GCNHTNGARGAYG CNGGNTAYGC-3 '(SEQ ID NO: 72); the reverse primer had the sequence 5'-CANCATNCCNGCY TKRT ART A-3 '(SEQ ID NO: 73).
  • reaction conditions were: 95 0 C for 300 s, 95 0 C for 60 s, 52 0 C for 60 s and 74 0 C for 100 s (35 X), 74 0 C for 10 min.
  • Taq polymerase NEB was used.
  • the amplification yielded a single PCR product of the expected size, the sequencing of which revealed that it indeed belonged to the acetyl-specific clade VIa.
  • a fosmid library of total DNA from the psymberin-positive sponge P. äff. bulbosa was generated (410,000 clones) and assayed for positivity according to a previously known strategy (Hrvatin & Piel, Rapid Isolation of rare clones from highly complex DNA pools, J. Microbiool., Methods 68, 434-436, 2007) Clones screened out.
  • the screening was performed by PCR and using specific primers derived from the clade VI amplicon.
  • five positive fosmids were isolated, and Fig. 5A and Table 1 show the result of sequencing (SEQ ID NO: 39) for these five fosmids, which showed a typical bacterial architecture No introns were detected, Shine-Dalgarno-like sequences were located in front of the individual genes and the close proximity of the genes suggests a polycistronic mRNA.
  • ORF2 426 adenylosuccinate synthetase 2, 21
  • ORF3 367 transposase 3, 22 psyA 3297 PKS 4, 23 psyB 331 methyltransferase 5, 24 psyC 343 PedK-like 6, 25
  • the isolated gene region (SEQ ID NO: 39) in its central region comprises a psy-Gznc chill (psyA to psyN) of 62238 bp length.
  • the large genes psyA and psyD encode PKS with three and ten modules, respectively, with the latter ending with a thioesterase domain (see Figure 5B). This reveals for the first time the complete sequence information of a polyketide biosynthetic cluster.
  • PsyA and the first five modules of PsyD are almost identical to the omnamide (OmnB and OnnI) and pederin (Pedl and PedF) biosynthetic pathways ( Figure 5 B, C).
  • the complexity of the DNA sample was first reduced by means of a first PCR amplification, the primers used also having the sequences 5 '-MGNGARGCNNWNSMNATGGAYCCNCARCANMG-S' (forward) and 5'-GGRTCNCCNARNSWNGTNCCNGTNCCRTG-S '(reverse). had.
  • the first round of PCR took place under the following conditions: 96 0 C for 45 s, 55 0 C for 45 s, 72 0 C for 1 min (40 x), then 72 0 C for 10 min.
  • Taq polymerase (NEB) was used.
  • the amplificate was separated by agarose gel and the DNA running at 700 bp purified by gel digestion as described above. 1 ⁇ l of this purified PCR amplificate was used as template for a second round of PCR.
  • the target for the second round of PCR was a motif detected in KS that prolongs ⁇ -saturated intermediates (Klade V).
  • the identified motif has the consensus sequence EPI / VE / DTAC (see Fig. 4A).
  • the primers used were specific for the EDGAY motif as well as for the EPI / VE / DTAC motif.
  • the forward primer had the sequence 5'-GCNHTNGARGAYG CNGGNT AYGC-3 '(SEQ ID NO: 72); the reverse primer had the sequence 5'-RCANGCNGTNTCDATNGGTTC-3 '(SEQ ID NO: 74).
  • the reaction conditions were: 95 0 C for 105 s, 95 0 C for 60 s, 51 0 C for 60 s and 74 0 C for 100 s (35 X), 74 0 C for 10 min. Hot Start Taq Polymerase (Jena Biosciences) was used.
  • the gene sequence of the entire PKS gene cluster required for mycalamide biosynthesis is determined.
  • Bacillus amyloliquefaciens (strain FZB42 J NCBI Accession Number CP000560) is one of the richest bacterial resources for bioactive natural products, such as polyene anti- biotika bacillaene and difficidin. Therefore, this organism was used for heterologous expression.
  • Bacillaene PKS gene cluster has been replaced by several steps of double crossover recombination by that of the psymberin PKS gene cluster.
  • the Bacillaene PKS gene cluster was deleted in the first step and instead a psymberin recombination cassette was integrated together with a chloramphenicol marker at the beginning of the gene cluster.
  • the plasmid used for this was pBBaeKO (SEQ ID NO: 76). This generated the mutant strain FZB42 Bae (see Fig. 6).
  • a ⁇ -red double crossover was performed to modify the first positive fosmid, pPSKFl, for the integration of the first psymberin regions into the genome of strain FZB42bae.
  • the plasmid used for this was pBPsyI20 (SEQ ID NO: 77).
  • a bacillaene recombination cassette was introduced into the fosmid together with a spectomycin selection marker, immediately downstream of the end of the psymberin sequence. This resulted in pPSKFlBae20 (see Fig. 7, SEQ ID NO: 78).
  • this construct was then transformed into a FZB42 Bae to generate FZB42 Bae-Psy + ( Figure 8).
  • the further downstream psymberin gene regions can be integrated into the genome of FZB42 Bae-Psy + in a similar fashion until the gene cluster is completed.
  • the chloramphenicol resistance cassette (CamR) was obtained from the vector pDG268 by EcoRI and SphI digestion, while the spectinomycin resistance cassette (SpeR) was obtained by digesting the vector pIC333 with XbaI and BamHI.
  • the constructs used for the bacillaene deletion and the modification of the positive fosmids, namely pBBaeKO and pBPsyI20, respectively, were performed by means of two 3-point ligation steps Cloning of the abovementioned fragments into the pBluescript SK II (-) vector (see Figs. 9A and 9B)
  • the pBBaeKO construct was linearized by KpnI and purified from the gel.
  • competent B. amyloliquefaciens cells were prepared by the method of Art and Rapoport (J Bacteriol 1995; 177 (9): 2403-7) with minor modifications introduced (Idris et al., Mol Plant Microbe Interact. 2007; 20 (6): 619-26).
  • Approximately 5 ⁇ g of the linearized pBBaeKO construct was transformed and the recombiinant clones were selected by chloramphenicol (5 ⁇ g / ml).
  • the new mutant strain FZB42bae thus generated was checked by means of the following primer pairs (see PCR 1 and PCR 2 in FIG. 6):
  • PCRl BaeHKO for: 5'-TAGACCATCATACCGGAAGC-3 '(SEQ ID NO: 91) and PsyAKO rev: 5'AATGGAGCGAAGATAGCCG-S' (SEQ ID NO: 92);
  • PCR2 CatKO for: 5'-ACAGCTCCAGATCCTCTACG-S '(SEQ ID NO: 93) and nucBKOrev: 5'-GACTTGCCGCCCATTTCATA-3' (SEQ ID NO: 94).
  • the pPSKF! Positive fosmid can be appropriately modified by the incorporation of a bacillaene recombinant cassette (BaeS) together with a spectinomycin selection marker (SpeR).
  • BaeS bacillaene recombinant cassette
  • SpeR spectinomycin selection marker
  • the resulting construct pPSKFlBae20 was then naturally transformed in circular form into the strain FZB42 Bae.
  • the DNA concentrations ranged from 5 to 20 ⁇ g.
  • the recombinant clones were selected on spectinomycin (100 ⁇ g / ml).
  • the new mutants thus generated were checked by means of the following primer pairs (see PCR in FIG. 8):
  • pPSKFIKanBae SEQ ID NO: 97, Figure 11
  • pPSKFIKanBae SEQ ID NO: 97, Figure 11

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Die vorliegende Erfindung stellt ein neues Verfahren zur gezielten Isolierung von Polyketidbiosynthesegenen aus Metagenomen bereit. Weiterhin werden erstmalig die Nuklein- und Aminosäuresequenzen des PKS-Clusters von Psymberin, sowie Expressionssysteme zur Herstellung dieses Polyketids offenbart.

Description

Polyketid Biosynthesegene
GEBIET DER ERFINDUNG
Die Erfindung betrifft ein Verfahren zur Isolierung von Gensequenzen, sowie die mittels dieses Verfahrens isolierte Gensequenz und Fragmente derselben, die für Peptide zur Biosynthese von Polyketiden codiert.
STAND DER TECHNIK
Schwämme (Porifera) stellen die wichtigste Quelle mariner Produkte mit therapeutischem Potential dar (Blunt et al, Marine natural products. Nat. Prod. Rep. 25, 35-94; 2008). Viele der aus Schwämmen isolierten Wirkstoffkandidaten sind komplexe Polyketide (PK), die auf metabolischer Ebene eine enge Beziehung zu natürlichen Produkten aus Bakterien aufweisen (Sipkema et al., Marine sponges as pharmacy. Mar. Biotechnol. 7, 142-144; 2005). Diese enge Beziehung führte zu der Vermutung, dass die Polyketide nicht von den Schwämmen selbst, sondern von prokaryotischen Symbionten erzeugt werden. Untersuchungen am Schwamm Theonella swinhoei deuten darauf hin, dass diese Vermutung richtig ist (Piel et al., Antitumor polyketide biosynthesis by an uncultivated bacterial symbiont of the marine sponge Theonella swinhoei. Proc. Natl. Acad. Sei. U.S.A. 101, 16222-16227; 2004). Ein Schwamm kann mehrere hundert Arten prokaryotischer Symbionten beherbergen, von denen jede eigene Polyketidsynthase (PKS) Gene für verschiedene Biosynthesewege bereitstellt. Das so entstehende Metagenom eines Schwamms kann daher hunderte von individuellen (prokaryotischen) Genomen enthalten, von denen jedes seine eigenen PKS Gene bereitstellt (Kim et al., Diversity of polyketide synthase genes from bacteria associated with the marine sponge Pseudoceratina clavata: eulture-dependent and eulture-independent approaches. Environ. Microbiol. 8, 1460-1470; 2006).
Eine direkte Kultivierung einzelner Symbionten führte in den meisten Fällen nicht zum Erfolg, womit die Isolierung eines bestimmten, interessierenden PKS Genclusters für die Biosynthese von Polyketiden aus einem solchen Metagenom ein großes Problem darstellt. Unter anderem wird nämlich z.B. die Herstellung und Durchmusterung von extrem großen DNA- Bibliotheken erforderlich und die Identifizierung des korrekten PKS Genclusters stellt eine große Herausforderung dar.
ZUSAMMENFASSUNG DER ERFINDUNG
Die vorliegende Erfindung stellt eine Lösung zu diesem Problem bereit und offenbart einen neuen Ansatz zur spezifischen Amplifϊkation von PKS-Genregionen, der auf der Substratspe- zifität von Kethosynthasedomänen beruht.
In einem ersten Aspekt bezieht sich die vorliegende Erfindung auf eine Nukleinsäure umfasssend zumindest ein Biosynthesegen für ein Polyketid ausgewählt aus der Gruppe bestehend aus Psymberin oder Mycalamid. In einer spezifischen Ausführungsform umfasst die Nukleinsäure eine Sequenz umfasst die ausgewählt ist aus der Gruppe bestehend aus SEQ ID NO 1-19, 39, 75, einem Homolog dieser Sequenzen und dem Komplement der Sequenzen oder des Homologs, wobei das Homolog zumindest 75% Sequenzidentität aufweist, oder unter Hochsalzbedingungen mit der Nukleinsäure hybridisiert.
In einem weiteren Aspekt bezieht sich die vorliegende Erfindung auf ein Peptid für das eine der erfindungsgemäßen Nukleinsäuren codiert. In einer spezifischen Ausführungsform weist das Peptid eine Aminosäuresequenz auf, die ausgewählt ist aus der Gruppe bestehend aus SEQ ID NO 20 - 38 oder einem Homolog dieser Sequenzen, wobei das Homolog zumindest eine Sequenzidentität Identität zu SEQ ID NO 20 von 36%, zu SEQ ID NO 21 von 54%, zu SEQ ID NO 22 von 44%, zu SEQ ID NO 23 von 41%, zu SEQ ID NO 24 von 52%, zu SEQ ID NO 25 von 42%, zu SEQ ID NO 28 von 44%, zu SEQ ID NO 29 von 94%, zu SEQ ID NO 30 von 96%, zu SEQ ID NO 31 von 96%, zu SEQ ID NO 32 von 94%, zu SEQ ID NO 33 von 98%, zu SEQ ID NO 34 von 95%, zu SEQ ID NO 35 von 97%, zu SEQ ID NO 36 von 98%, zu SEQ ID NO 37 von 96% oder zu SEQ ID NO 38 von 96% aufweist.
In einem weiteren Aspekt bezieht sich die vorliegende Erfindung auf einen die erfindungsgemäßen Nukleinsäuren umfassenden Vektor sowie eine rekombinante Wirtszelle, die die erfindungsgemäßen Nukleinsäuren oder den erfindungsgemäßen Vektor umfasst. In einem weiteren Aspekt bezieht sich die vorliegende Erfindung auf ein Verfahren zur Herstellung eines Polyketids umfassend den Schritt der Kultivierung einer erfindungsgemäßen rekombinaten Wirtszelle unter Bedingungen, die die Expression der Biosynthesegene und Produktion des Polyketids durch die Wirtszelle erlauben.
In einem weiteren Aspekt bezieht sich die vorliegende Erfindung auf ein Verfahren zur Isolierung zumindest eines Polyketid-Biosynthesegens, umfassend die Schritte: a) Bereitstellen von zumindest einem Primerpaar, das auf der Substratspezifität einer Kethosynthasedomäne einer trans-AT Polyketidsynthase basiert; und b) Isolierung von zumindest einem Polyketid- Biosynthesegen unter Verwendung des zumindest einen Primerpaars aus Schritt a). In einer spezifischen Ausführungsform umfasst Schritt b) die Amplifikation der vom Primerpaar eingeschlossenen Nukleinsäureregion. In weiteren spezifischen Ausführungsformen ist das zumindest eine Primerpaar spezifisch für ein Motiv das bei phylogenetisch benachbarten Kethosynthasedomänen von trans-AT Polyketidsynthasen konserviert ist, oder ist zumindest ein Primer des Primerpaars spezifisch für zumindest 4 zusammenhängende Aminosäurereste eines der in Fig. 3, Fig. 4 oder SEQ ID NO: 40-71 definierten Aminosäuremotive. In einer weiteren spezifischen Ausführungsform der Erfindung ist das isolierte Polyketid- Biosynthesegen in die Biosynthese von Psymberin oder Mycalamid involviert.
Die vorliegende Erfindung stellt ein neues Verfahren zur gezielten Isolierung von Polyketidbiosynthesegenen aus Metagenomen bereit, wobei sich die Substratspezifität der Polyketidketten-verlängernden Ketosynthase (KS) Domänen zunutze gemacht wird.
Unter dem Term „Nukleinsäure" im Sinne der vorliegenden Erfindung wird insbesondere - aber nicht darauf beschränkt - natürliche, vorzugsweise lineare, verzweigte oder zirkuläre Nukleinsäuren wie RNA, insbesondere mRNA, einzelsträngige und doppelsträngige virale RNA, siRNA, miRNA, snRNA, tRNA, hnRNA oder Ribozyme, genomische, bakterielle oder virale DNA (einzelsträngig und doppelsträngig), chromosomale und episomale DNA, frei zirkulierende Nukleinsäure und dergleichen, synthetische oder modifizierte Nukleinsäuren, beispielsweise Plasmide oder Oligonukleotide, insbesondere für die PCR verwendete Primer, - A -
Sonden oder Standards, mit Digoxigenin, Biotin oder Fluoreszenzfarbstoffen markierte Nukleinsäuren oder sogenannte PNAs („peptide nucleic acids") verstanden. Eine Nukleinsäure besteht häufig aus zwei komplementären Strängen. Daher soll bei einer durch diese Erfindung beanspruchten Nukleinsäure generell auch immer das reverse Komplement dieser Nukleinsäure als mitbeansprucht gelten.
Unter dem Term „Hochsalzpuffer" wird insbesondere - aber nicht darauf beschränkt - ein Puffer aufweisend eine hohe Salzkonzentration (bevorzugt chaotrope Substanzen), bevorzugt > 100 mM, bevorzugter > 500 mM und noch bevorzugter > 1 M, verstanden.
Unter dem Term „Hochsalzbedingungen" wird im Folgenden ein Milieu verstanden, das einen Hochsalzpuffer verwendet, bevorzugt einen Hochsalzpuffer enthaltend chaotrope Salze. Durch Hochsalz, bevorzugt aufweisend chaotrope Salze, wird die Löslichkeit von Nukleinsäuren in Wasser herabgesetzt. Grund ist das Aufbrechen von Wasserstoffbrücken und damit verbunden eine Verringerung der Stabilisierung von Sekundär- und Tertiär- Strukturen der Nukleinsäuren in Wasser. Wird nun eine polare Oberfläche als Wasserstoffbrückendonor angeboten, binden die Nukleinsäuren an dieser Oberfläche, da sie dort eine bessere Stabilisierung erfahren als in Wasser. Wird die Salzkonzentration verringert, wird Wasser wieder ein besserer Wasserstoffbrückendonor als die polare Oberfläche, und die Nukleinsäuren lassen sich wieder von der Oberfläche ablösen.
Unter dem Term „chaotrope Substanzen" bzw. „chaotrope Salze" werden insbesondere - aber nicht darauf beschränkt - Substanzen, die die Sekundär-, Tertiär- und/oder Quartärnärstruktur von Proteinen und/oder Nukleinsäuren ändern und zumindest die Primärstruktur intakt lassen, die Löslichkeit polarer Substanzen in Wasser verringern und/oder hydrophobe Wechselwirkungen verstärken, verstanden. Bevorzugte chaotrope Substanzen sind Guanidinhydrochlorid, Guanidinium(iso)thiocyanat, Natriumiodid, Natriumperchlorat, Kaliumiodid, Natri- um(iso)thiocyanat und/oder Harnstoff.
Die Begriffe „Protein", „Peptid", „Polypeptid" und „Enzym" werden synonym verwendet, sofern nicht Gegenteiliges beschrieben wird.
Unter dem Begriff „Amplifϊkation" oder „Amplifϊkationsreaktion" wird ein Verfahren verstanden, das es ermöglicht, die Konzentration eines oder mehrerer Analyte - bevorzugt Nuk- leinsäuren - mindestens zu verdoppeln. Man unterscheidet hier zwischen isothermen und thermocyclischen Amplifϊkationsreaktionen. Bei ersteren bleibt die Temperatur während des gesamten Verfahren stets gleich, während bei letzterer thermische Zyklen durchlaufen werden, mit deren Hilfe die Reaktion und die Amplifikation gesteuert wird.
Bevorzugte isotherme Amplifikationsreaktionen sind z.B.
• Loop mediated isothermal amplification (LAMP),
• Nucleic Acid Sequence Based Amplification (NASBA),
• Rolling Circle Chain Reaction (RCCR), oder Rolling Circle Amplification (RCA), und/oder
• Transcription mediated amplification (TMA) Bevorzugte thermocyclische Amplifikationsreaktionen sind z.B.
Ligase-Kettenreaktion (LCR), und/oder
• Polymerase Ketttenreaktion (PCR)
Unter dem Term „Polymerase Kettenreaktion" (PCR) wird ein Verfahren zur in vitro- Vervielfältigung von Nukleinsäuren verstanden, wie es z.B. in Bartlett & Stirling (2003) beschrieben ist.
Unter dem Term „Ligase-Kettenreaktion" (LCR) wird ein Nachweisverfahren für geringste Mengen von Nukleinsäuren verstanden, das ähnlich wie die Polymerase-Kettenreaktion funktioniert, nur unter Verwendung eines anderen Enzyms (anstatt der Polymerase eine Ligase). Zwei Proben pro DNA-Strang werden zu einer Probe ligiert. Die entstehenden, oft nur 30-50 bp langen Amplifikate eines Zyklus dienen in den folgenden Zyklen selbst wieder als Ansatzpunkt für die supplementierten Primer.
Unter dem Term „Loop-mediated Isothermal Amplification" (LAMP) wird eine Methode zur isothermalen Nukleinsäureamplifikation verstanden, bei welcher 6 verschiedene Primer eingesetzt werden, die bestimmte Regionen auf der Target-Sequenz erkennen und daran binden. LAMP nutzt eine DNA-Polymerase mit Strand-displacement Aktivität und läuft bei einer konstanten Temperatur von etwa 650C ab. Amplifikation und Detektion der Target-Sequenz findet in einem einzigen Schritt statt. Unter dem Term „Nucleic Acid Sequence Based Amplification" (NASBA), wird ein Verfahren zur Amplifikation von RNA verstanden (Compton 1991). Dabei wird eine RNA-Matrix zu einem Reaktionsgemisch gegeben, und ein erster Primer bindet an die komplementäre Sequenz im Bereich des 3 '-Endes der Matrix. Anschließend wird mit einer Reversen Transkrip- tase der zur Matrix komplementäre DNA-Strang polymerisiert. Mit Hilfe von RNase H wird dann die RNA-Matrix verdaut (RNase H verdaut nur RNA in RNA-DNA Hybriden, nicht single-stranded RNA). Anschließend wird ein zweiter Primer an das 5' Ende des DNA- Stranges gebunden. Dieser wird von der T7 RNA Polymerase als Startpunkt für die Synthese eines zum DNA-Strang komplementären RNA-Moleküls verwendet, welches dann wieder als Ausgangsmatrix verwendet werden kann. NASBA wird bei einer konstanten Temperatur von normalerweise 41°C. durchgeführt und liefert unter bestimmten Umständen schnellere und bessere Resultate als PCR.
Unter dem Term „Transcription Mediated Amplification" (TMA) wird ein von der US-Firma Gen-Probe entwickeltes isothermes Amplifikations verfahren verstanden, das der NASBA ähnlich ist und bei dem ebenfalls RNA Polymerase und Reverse Transkriptase verwendet werden (Hill, 2001)
Der Term „Rolling Circle Chain Reaction" (RCCR) oder "Rolling circle Amplification" (RCA) betrifft ein Amplifikationsverfahren, das die allgemeine Nukleinsäure-Replikation nach dem rolling-circle-Prinzip imitiert und unter anderem in der US5854033 beschrieben ist.
Unter dem Begriff "Nested PCR" wird ein Verfahren verstanden, bei dem ein bereits vervielfältigtes DNA-Fragment (oder ein Teil davon) ein weiteres Mal amplifziert wird; dieser Vorgang erfolgt mit einem zweiten Primerpaar, das innerhalb des in der ersten Reaktion verwendeten Primerpaars angeordnet ist.
Unter dem Begriff „Promotor" wird vorliegend eine Nukleinsäuresequenz verstanden, die die regulierte Expression eines Gens ermöglicht. Sie liegt upstream, d.h. 5 ' zum RNA- kodierenden Bereich des Gens. Eine wichtige Eigenschaft eines Promotors ist die spezifische Wechselwirkung mit bestimmten DNA-bindenden Proteinen, welche den Start der Transkription des Gens durch die RNA-Polymerase vermitteln und als Transkriptionsfaktoren bezeichnet werden. Die wichtigsten prokaryotischen Transkriptionsfaktoren sind die Sigma-Faktoren. Die mit Abstand meisten Promotoren bei z.B. E. coli werden über den Faktor Sigma-70 erkannt und weisen die folgenden Promotorelemente auf: 1) ein AT-basenpaarreiches UP- Element oberhalb der -35-Region (was auch direkt mit der α-Untereinheit der bakteriellen RNA-Polymerase interagieren kann), 2) die -35-Region, mit der Konsensussequenz: 5'- TTGACA-3', 3) die -10-Region (Pribnow-Box), mit der Konsensussequenz: 5'-TATAAT-3'. Weiterhin sind starke Promotoren direkt vor dem Startpunkt der Transkription reich an AT- Basenpaaren. Die Konsensussequenzen geben nur einen ungefähren Anhaltspunkt für den Aufbau eines Promotors. Ein bestimmter Sigma-70-abhängiger Promotor kann an mehreren Stellen von diesen Sequenzen abweichen. In einer bevorzugten Ausführungsform ist der Promotor ein induzierbarer Promotor. Ein Beispiel für einen induzierbaren Promotor ist der künstlich erzeugte tac-Promoter, der zur Erhöhung des Genexpressionslevels in Bakterienzellen (z.B. E. coli) und somit zur Überexpression rekombinanter Proteine genutzt werden kann. Dieser synthetische Promotor besteht aus der -35 Region des starken trp-Promotor aus E. coli und der -10 Region des IPTG und Laktose regulierbaren/induzierbaren lac-Promotors. Der induzierbare tac-Promoter ist ca. 3 -mal stärker als der trp-Promoter und ca. 10-mal stärker als der lac-Promoter.
Unter dem Begriff „Biosynthese" wird vorliegend die enzymatische Herstellung eines Polyketids verstanden, bevorzugt mittels einer oder mehrerer Polyketidsynthasen, bevorzugt einer trans-AT-Polyketidsynthase. Der Begriff „Biosynthesegen" umfasst damit jedes Gen, welches für ein Protein codiert, das Teil einer solchen Polyketidsynthase ist.
Weiterhin umfasst der Begriff „Biosynthesegen" auch Fragmente eines Biosynthesegens, die für ein trunkiertes Protein einer Polyketidsynthase codieren, das die gleiche Funktion aufweist, wie das Volllängenprotein. Dem Fachmann ist hinlänglich bekannt, dass durch Trunkierung (d.h. Deletion einzelner Bereiche, bevorzugt der Enden) eines Proteins eine gesteigerte oder verringerte Enzymaktivität herbeigeführt werden kann. Unter gleicher Funktion wird hier die prinzipiell gleiche biochemische Funktion verstanden, unabhängig davon, ob diese mit einer erhöhten oder erniedrigten Effektivität oder Geschwindigkeit ausgeführt wird. Als Beispiel für ein Biosynthesegen sei ein Gen für eine KS-Domäne genannt, deren biochemische Funktion es ist, αß-gesättigte Intermediate zu verlängern (siehe beispielsweise die KS der Klade V), oder ein Gen, dessen Genprodukt in einer PKS die biochemische Funktion aus- übt, einen Methylrest zu transferieren (z.B. psyB). Jede trunkierte Version solcher Gene, die zu trunkierten Genprodukten führen, die noch dieselbe biochemische Funktion ausführen fallen somit ebenfalls unter den Begriff „Biosynthesegen". Weitere Beispiele für Biosynthesegene und spezifische Ausführungsformen der Erfindung sind die in Tabelle 1 aufgelisteten Gene psyA -psyN.
Unter dem Begriff „Metagenom" wird vorliegend eine Menge von zumindest zwei Genomen verschiedener Spezies verstanden. Ein Metagenom umfasst damit die gesamte genomische Information dieser zumindest zweier Spezies. In einer spezifischen Ausführungsform umfasst das Metagenom das Genom eines Schwamms und das von zumindest einem Prokaryoten. In einer weiteren Ausführungsform lebt der Prokaryot in Symbiose mit dem Schwamm.
Ein Primer wird im Sinne der vorliegenden Anmeldung dann als „spezifisch" für eine gegebene Aminosäuresequenz angesehen, wenn er - bevorzugt unter stringenten Bedingungen - mit dem sense- oder antisense-Strang einer Nukleinsäure hybridisiert oder zu diesem identisch ist, die für die gegebene Aminosäuresequenz oder einen Teil davon kodiert. Da der Aminosäurecode degeneriert ist, können für eine gegebene Aminosäuresequenz mehrere geeignete Primer verwendet werden. Dem Fachmann ist bekannt, welche Basentripletts für welche Aminosäurereste codieren. Der Primer sollte eine minimale Länge aufweisen, die es ihm ermöglicht, mit einer Nukleinsäure zu hybridisieren, die für zumindest 2, zumindest 3, oder zumindest 4 zusammenhängende Aminosäurereste der gegebenen Aminosäuresequenz kodiert. In einer spezifischen Ausführungsform hybridisiert der Primer mit einer Nukleinsäure, die für zumindest 5, 6, 7 oder mehr als 7 zusammenhängende Aminosäurereste der gegebenen Aminosäuresequenz kodiert.
Ein Primer wird im Sinne der Erfindung auch dann als spezifisch für die definierten Aminosäuremotive angesehen, wenn er für eine Aminosäuresequenz spezifisch ist, die zumindest 2, zumindest 3, oder zumindest 4 zusammenhängende Aminosäurereste eines der in Fig. 3 und Fig. 4 oder SEQ ID NOs: 40-71 definierten Aminosäuremotive umfasst und zusätzlich am 3'- oder 5 '-Ende weitere Nukleotide für nicht in den definierten Aminosäuremotiven enthaltene Aminosäurereste aufweist. Hierbei kann die Anzahl der Nukleotide des Primers, die für Aminosäurereste spezifisch sind, die nicht im definierten Aminosäuremotiv enthalten sind, bis zu 30 % der Gesamtanzahl der Nukleotide des Primers betragen. Als Beispiel kann ein Primer, der spezifisch ist für das in Fig. 3 definierte Aminosäuremotiv „YYQAGML" auch so hergestellt werden, dass er für die Aminosäuresequenz „YYQ AGMLA" spezifisch ist, wobei die zusätzlichen Nukleotide für das Alanin, welches nicht im definierten Aminosäuremotiv enthalten ist, 12,5 % der gesamten Primersequenz ausmachen.
Polyketidsynthasen lassen sich über ihre Struktur und Funktion in drei Klassen einteilen. Typ I Enzyme sind multifunktionelle, häufig modular aufgebaute Proteine. Bakterielle modulare Typ I PKS erzeugen eine große Menge therapeutisch wichtiger Naturstoffe, wie z.B. Erythromycin, Epothilone und FK506 (Fischbach & Walsh. Assembly-line enzymology for poli- ketide and nonribosomal peptide antibiotics: logic, machinery and mechanisms. Chem. Rev. 106, 3468; 2006). Fig. 1 zeigt einige beispielhafte Polyketide, die, soweit deren Gencluster bekannt sind, von Typ I PKS gebildet werden.
Jedes dieser Enzyme umfasst wenigstens eine ß-Ketosynthase (KS), eine Acyltransferase (AT) sowie ein Acyl-Carrier-Protein (ACP), die den nächsten Baustein zum Aufbau des Polyketids auswählen, aktivieren und unter Bildung eines ß-Ketoacyl-S-ACP Intermediats, eine decarboxylative Claisen-Kondensation zwischen dem nächsten Baustein und der wachsenden Polyketidkette katalysieren. Während des Syntheseprozesses überträgt eine AT Domäne den korrespondierenden Acyl-CoA Baustein auf eine ACP Domäne und eine KS Domäne verlängert die Polyketidkette mit dieser Acyl-Einheit, wobei zusätzliche Domänen das resultierende ß-oxo Intermediat weiter modifizieren können. Die Reihenfolge der Module in den PKS gibt hierbei die Reihenfolge der Biosyntheseschritte zwingend vor. Somit kann durch Variation der Domänen/Module eine hohe strukturelle Diversität in den entstehenden Polyketiden erzeugt werden.
Eine besondere und evolutionär abgegrenzte Enzymfamile der PKS bilden die trans- AT-PKS, die freistehende AT verwenden, um die zur Herstellung des Polyketids benötigten Bausteine in trans zu selektieren (Cheng et al., Type I polyketide synthase requiring a discrete acetyltransferase for polyketide biosynthesis. Proc. Natl. Acad. Sei. U. S.A. 100, 3149-3154; 2003). Demgegenüber weisen eis- AT PKS integrierte AT Domänen auf. Die bisher veröffentlichten Studien über komplexe Polyketide haben gezeigt, dass alle bisher aus Symbionten geklonten PKS-Cluster zu dieser Familie der trans- AT-PKS gehören. Die vorliegende Erfindung basiert auf der überraschenden Entdeckung, dass die KS von trans- AT-PKS ein einzigartiges phylogenetisches Muster aufweisen, bei dem die nächstverwandten KS-Domänen für dieselben oder ähnliche Substrate spezifisch sind. Demgegenüber werden unterschiedliche Substrate, z.B. ß-hydroxylierte und olefinische, von evolutionär klar unterscheidbaren, d.h. nicht engverwandten, KS prozessiert. Die phylogenetische Analyse eines oder mehrerer KS liefert somit nützliche Informationen über die Struktur der involvierten Intermediate.
Erfindungsgemäß wird der umgekehrte Weg eingeschlagen, bei dem aufgrund der chemischen Struktur des Polyketids Rückschlüsse auf die involvierten KS gezogen werden können. Es zeigte sich überraschender Weise, dass dieser Ansatz die Identifikation von konservierten Sequenzmustern/Motiven innerhalb dieser substratspezifischen KS Domänen ermöglicht. Aufgrund dieser konservierten Motive können dann erfindungsgemäß Primer generiert werden, die spezifisch sind für KS Domänen mit einer bestimmten, gewünschten Substratspezifi- tät. Mithilfe dieser Primer ist dann die Amplifikation solcher KS Domänen möglich, die für ein bestimmtes Substrat spezifisch sind. Diese Amplikons können dann zur Identifizierung und Isolierung eines oder mehrerer Polyketid-Biosynthesegene, z.B. in Genclustern verwendet werden, z.B. durch PCR, Screening von Fosmid-Bibliotheken oder Genome Walking.
Einer der Hauptvorteile der vorliegenden Erfindung liegt somit darin, dass ausgehend vom Polyketid gezielt eine in dessen Biosynthese involvierte KS Domäne einer trans-AT-PKS identifiziert werden kann, um in einem nächsten Schritt deren Nukleotidsequenz, sowie die Nukleotidsequenz des sie umfassenden Polyketid-Biosynthese-Genclusters zu identifizieren und zu isolieren. Der vorliegende Erfindung liegt demnach die überraschende Entdeckung zugrunde, dass ausgehend von der chemischen Struktur, d.h. den funktionellen Gruppen eines Polyketids, konservierte Motive innerhalb von KS Domänen identifiziert werden können, die in die Biosynthese dieses Polyketids involviert sind. Basierend auf diesen konservierten Motiven lassen sich dann Primer ableiten die zur Amplifikation und Isolierung der in die Biosynthese dieses Polyketids involvierten Gene genutzt werden können. Ein Aspekt der vorliegenden Erfindung ist eine Nukleinsäure, die zumindest ein Gen umfasst, das für ein Polypeptid codiert welches an der Biosynthese der Polyketide Psymberin (auch bekannt als Irciniastatin A), oder Mycalamid beteiligt ist. In einer Ausführungsform liegt die Nukleinsäure in isolierter Form vor. In einer weiteren Ausführungsform ist die Nukleinsäure das Komplement einer Nukleinsäure, die zumindest ein Gen umfasst, das für ein Polypeptid codiert welches an der Biosynthese der Polyketide Psymberin oder Mycalamid beteiligt ist. In einer weiteren Ausführungsform ist das Gen ein prokaryotisches Gen und/oder Teil eines polycistronischen Genabschnitts oder Gen-Clusters das/der für zumindest ein Protein codiert, das an der Biosynthese eines Polyketids beteiligt ist. In einer Ausführungsform gehört das Gen zu den Typ I PKS; in einer bevorzugten Ausführungsform gehört das Gen zu der evolutionär abgegrenzten Enzymfamilie der trans-ATP PKS. Trans- AT PKS verwenden freistehende Acetyltransferasen (AT), um die zur Herstellung des Polyketids benötigten Bausteine in trans zu selektieren (Cheng et al., Type I polyketide synthase requiring a discrete acetyltransferase for polyketide biosynthesis. Proc. Natl. Acad. Sei. U.S.A. 100, 3149-3154; 2003), während eis- AT PKS integrierte AT Domänen aufweisen.
In einer bevorzugten Ausführungsform wurde die erfindungsgemäße Nukleinsäure aus dem Metagenom eines Schwamms amplifϊziert. Eukaryotische Schwämme (Porifera) gehen mit diversen Prokaryoten Symbiosen ein, wobei diese Prokaryoten vielfach noch nicht isoliert kultiviert werden konnten. Das dadurch aus Schwamm und Prokaryoten entstehende Metagenom umfasst das Genom des eukaryotischen Schwamms sowie die prokaryotischen Genome der einzelnen Symbionten. In einer Ausführungsform gehört der Schwamm zu den Demospongiae, den Dictyoceratida oder den Irciniidae. In einer bevorzugten Ausführungsform gehört der Schwamm zu Psammocinia sp.; noch bevorzugter ist der Schwamm Psammocinia äff. bulbosa. In einer bevorzugten Ausführungsform gehört der Schwamm zu den Demospongiae. In weiteren bevorzugten Ausführungsformen gehört der Schwamm zu der Familie der Spongiidae, der Thorectidae, der Halichondriidae, der Callyspongiidae, der Chalinidae, der Mycalidae, der Coelosphaeridae, der Tedaniidae, der Plakinidae, oder der Triaenosina. Im Sinne dieser Erfindung bevorzugte Vertreter dieser Familien sind Spongia spp., Cacospongia spp., C. mycofijiensis, Halichondria spp., Callyspongia spp., Haliclona spp., Mycale spp., M. hentscheli, Lyssodendoryx spp., Tedania spp., Plakortis spp., Theonella swinhoei, und Discodermia spp.
Die Amplifikation der Nukleinsäure aus dem Metagenom kann mittels eines beliebigen, dem Fachmann bekannten, Verfahrens zur Nukleinsäureamplifϊkation durchgeführt werden. In einer Ausführungsform erfolgt die Amplifikation der erfindungsgemäßen Nukleinsäure mittels einer isothermen oder einer thermocyclischen Amplifikationsreaktion. Bevorzugt erfolgt die Amplifikation mittels Ligase-Kettenreaktion (LCR), und/oder Polymerase Ketttenreaktion (PCR); noch bevorzugter ist die PCR eine nested PCR.
In einer Ausführungsform umfasst die erfindungsgemäße Nukleinsäure zumindest eine Sequenz, die ausgewählt ist aus der Gruppe bestehend aus SEQ ID NO 1-19,39, 75, einem Homolog dieser Sequenzen und dem Komplement der Sequenzen oder des Homologs. In einer bevorzugten Ausführungsform umfasst die erfmdungsgemäße Nukleinsäure zumindest eine Sequenz, die ausgewählt ist aus der Gruppe bestehend aus SEQ ID NO 4, 5, 6, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 (psy A, psyB, psyC, psyD, psyE, psyF, psyG, psyH, psyl, psyJ, psyK, psyL, psyM und psyN), einem Homolog dieser Sequenzen und/oder dem Komplement der Sequenzen oder des Homologs. In einer weiteren Ausführungsform weist das Homolog zumindest 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, bevorzugt 97%, 98%, 99%, 99,5%, 99,7%, 99,9% Sequenzidentität mit der verglichenen Nukleinsäure auf, und/oder hybridisiert unter Hochsalzbedingungen mit der Nukleinsäure.
In einer weiteren Ausführungsform codiert die erfmdungsgemäße Nukleinsäure für ein Protein, das zumindest eine Identität zu SEQ ID NO 23 von 41%, zu SEQ ID NO 24 von 52%, zu SEQ ID NO 25 von 42%, zu SEQ ID NO 28 von 44%, zu SEQ ID NO 29 von 94%, zu SEQ ID NO 30 von 96%, zu SEQ ID NO 31 von 96%, zu SEQ ID NO 32 von 94%, zu SEQ ID NO 33 von 98%, zu SEQ ID NO 34 von 95%, zu SEQ ID NO 35 von 97%, zu SEQ ID NO 36 von 98%, zu SEQ ID NO 37 von 96% oder zu SEQ ID NO 38 von 96% aufweist. In einer bevorzugten Ausführungsform codiert die erfindungsgemäße Nukleinsäure für ein Protein, das zumindest eine Identität zu SEQ ID NO 23 von 50%, zu SEQ ID NO 24 von 55%, zu SEQ ID NO 25 von 50% oder zu SEQ ID NO 28 von 50% aufweist.
Ein weiterer Aspekt der vorliegenden Erfindung ist ein Peptid, Polypeptid, Protein oder Enzym, für das eine der erfindungsgemäßen Nukleinsäuren codiert.
In einer Ausführungsform weist das Peptid eine Aminosäuresequenz auf, die ausgewählt ist aus der Gruppe bestehend aus SEQ ID NO 20-38.
In einer weiteren Ausführungsform weist das Peptid zumindest eine Identität zu SEQ ID NO 20 von 36%, zu SEQ ID NO 21 von 54%, zu SEQ ID NO 22 von 44%, zu SEQ ID NO 23 von 41%, zu SEQ ID NO 24 von 52%, zu SEQ ID NO 25 von 42%, zu SEQ ID NO 28 von 44%, zu SEQ ID NO 29 von 94%, zu SEQ ID NO 30 von 96%, zu SEQ ID NO 31 von 96%, zu SEQ ID NO 32 von 94%, zu SEQ ID NO 33 von 98%, zu SEQ ID NO 34 von 95%, zu SEQ ID NO 35 von 97%, zu SEQ ID NO 36 von 98%, zu SEQ ID NO 37 von 96% oder zu SEQ ID NO 38 von 96% auf. In einer bevorzugten Ausführungsform weist das Peptid zumindest eine Identität zu SEQ ID NO 23 von 50%, zu SEQ ID NO 24 von 55%, zu SEQ ID NO 25 von 50% oder zu SEQ ID NO 28 von 50% auf. In einer weiteren bevorzugten Ausführungsform weist das Peptid eine Sequenzidentität von mindestens 60 %, 70 %, 75 %, 80 %, 90 %, 92 %, 95 %, 97%, 98 %, 99% oder 99,5% auf.
In einer weiteren Ausführungsform betrifft die Erfindung einen Vektor, der die erfindungsgemäße Nukleinsäure umfasst. Bevorzugt ist dieser Vektor ein Cosmid, ein YAC, BAC oder ein Virus, noch bevorzugter ist der Vektor ein Plasmid. In einer Ausführungsform umfasst der Vektor weiterhin einen Promotor unter dessen Kontrolle die Expression der erfindungsgemäßen Nukleinsäure steht. Bevorzugt ist dieser Promotor ein induzierbarer Promotor. In einer weiteren Ausführungsform steht die erfindungsgemäße Nukleinsäure unter der Kontrolle eines induzierbaren Expressionssystems. In einer spezifischen Ausführungsform ist das induzierbare Expressionssystem das Tetracyclin Operator/Repressor (TetO2/TetR) System. In einer weiteren Ausführungsform betrifft die Erfindung eine rekombinante Wirtszelle, die eine der erfindungsgemäßen Nukleinsäuren oder Vektoren umfasst. Damit stellt die vorliegende Erfindung auch ein Expressions-/ und Produktionssystem für Polyketide bereit. Vorzugsweise ist diese rekombinante Wirtszelle nach der Transformation/Transfektion in der Lage Polyketide zu synthetisieren. In einer Ausführungsform ist die die rekombinante Wirtszelle eine E. coli Zelle, in weiteren Ausführungsformen ist die rekombinante Wirtszelle eine Wirtszelle aus Pseudomonas spp., Bacillus spp., Streptomyces spp. oder Acinetobacter baylyi.
Ein weiterer Aspekt der Erfindung betrifft die Verwendung der erfindungsgemäßen Nukleinsäuren, Vektoren oder rekombinanten Wirtszellen in einem Verfahren zur Herstellung eines Polyketids. Hierbei wird ein Expressionssystem verwendet, welches die Expression der erfindungsgemäßen Nukleinsäuren erlaubt.
In einer Ausführungsform ist das Expressionssystem eine rekombinante Wirtszelle, die die erfindungsgemäßen Nukleinsäuren oder Vektoren umfasst und zur Expression der Genprodukte der erfindungsgemäßen Nukleinsäuren in der Lage ist. Die exprimierten Genprodukte können dann zur Synthese des Polyketids in vivo oder in vitro genutzt werden. In einer bevorzugten Ausführungsform ist das hergestellte Polyketid Psymberin oder Mycalamid. In einer weiteren bevorzugten Ausführungsform umfasst das Verfahren oder das Expressionsystem die Verwendung von zumindest einer Nukleinsäure umfassend eine Sequenz ausgewählt aus der Gruppe Bestehend aus SEQ ID NO 4, 5, 6, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 (psy A, psyB, psyC, psyD, psyE, psyF, psyG, psyH, psyl, psyJ, psyK, psyL, psyM und psyN) oder einem Homolog dieser Sequenzen.
In einer spezifischen Ausführungsform findet die Kultivierung einer erfindungsgemäßen rekombinanten Wirtszelle unter Bedingungen statt, die die Expression der Biosynthesegene und Produktion des Polyketids durch die Wirtszelle erlauben. Solche Bedingungen sind dem Fachmann hinlänglich bekannt oder lassen sich im Wege simpler Routineexperimente für ein gegebenes Polyketid erhalten. In einer spezifischen Ausführungsform ist die rekombinante Wirtszelle eine Wirtszelle aus Pseudomonas spp., Bacillus spp., Streptomyces spp., Corynebacterium spp., Acinetobacter baylyi, Pseudomonas stutzen, Bacillus subtilis oder Bacillus amyloliquefaciens. Falls das zumindest eine erfindungsgemäße Gen, welches sich in der Wirtszelle befindet unter der Kontrolle eines induzierbare Expressionssystem (z.B. des Tetracyclin Operator/Repressor (TetO2/TetR) Systems) steht, kann durch Zugabe der jeweiligen induzierenden Substanz die Expression des Genprodukts gezielt induziert werden. Zur Herstellung des Polyketids werden die Gene des Gene lusters in die Genome der Expressionswirte integriert. Die Integration erfolgt dabei sukzessive durch homologe Rekombination kürzerer (in etwa bis 40 kb) Abschnitte des Genclusters. Um die Gene effizient zu transferieren, können bevorzugt transformierbare Bakterien wie Pseudomonas stützen, Acinetobacter baylyi, Bacillus subtilis oder Bacillus amyloliquefaciens verwendet werden, die linearisierte DNA aufnehmen können. Im Bedarfsfall werden die natürlichen Promotoren des Genclusters gegen wirtseigene Promotoren ersetzt (z.B. den baeB -Ϋxovaotox bei B. amyloliquefaciens). Alternativ zur Integration in das Genom können Gene auf einem oder verteilt auf mehreren kompatiblen Plasmiden durch Konjugation, Protoplastentransformation oder Elektroporation in die Expressionswirte transferiert werden. Die Expression erfolgt dann von frei replizierenden Plasmiden oder wiederum nach Integration in das Genom.
In einer weiteren Ausführungsform umfasst das Verfahren weiterhin den Schritt der Isolierung des produzierten Polyketids. In einer Ausführungsform erfolgt diese Isolierung mittels HPLC und/oder präparativer Säulenchromatographie.
Die Isolierung des zumindest einen Polyketid-Biosynthesegens unter Verwendung des zumindest einen Primerpaars umfasst in einer Ausführungsform die Amplifikation der vom jeweiligen Primerpaar eingeschlossenen Nukleinsäureregion mittels des Primerpaars. Somit wird eine Nukleinsäureregion der Kethosynthasedomäne amplifϊziert. In einer bevorzugten Ausführungsform wird diese Amplifikation mittels PCR durchgeführt, noch bevorzugter mittels einer nested PCR.
In einem weiteren Aspekt ist die vorliegende Erfindung auf ein Verfahren zur Isolierung von zumindest einem Polyketid-Biosynthesegen gerichtet und umfasst die Schritte des Bereitstel- lens von zumindest einem Primerpaar, das aufgrund der Substratspezifität einer Kethosynthasedomäne einer trans-AT Polyketidsynthase erstellt worden ist, und die Isolierung von zumindest einem Polyketid-Biosynthesegen unter Verwendung dieses zumindest einen Primerpaars.
Die erfϊndungsgemäße Bereitstellung, d.h. das „Design" der Primer basiert auf der überraschenden Entdeckung, dass die KS von trans-AT PKS ein einzigartiges phylogenetisches Muster aufweisen, bei dem die nächstverwandten KS Domänen für dieselben oder ähnliche Substrate spezifisch sind. Somit kann, ausgehend von den funktionellen Gruppen eines Polyketids, ein konserviertes Motiv innerhalb von KS Domänen identifiziert werden, auf dessen Basis Primer hergestellt werden können, die für ein solches konserviertes Motiv - und damit für eine KS Domäne, die in die Biosynthese des Polyketids involviert ist - spezifisch sind. Die Amplifikation und Isolierung der KS Domäne und damit der die KS Domäne umfassenden PKS sowie weiteren in die Biosynthese des Polyketids involvierten Genen, die häufig in einem Gencluster vorliegen, wird somit erfindungsgemäß ermöglicht.
Ob eine gegebene KS oder KS Domäne zu einer zweiten KS oder KS Domäne ähnlich oder phylogenetisch benachbart ist, kann zum Beispiel durch Sequenz vergleiche bestimmt werden, bei denen zueinander ähnlichere Sequenzen phylogenetisch enger benachbarten KS oder KS Domänen entsprechen. In einer bevorzugten Ausführungsform wird hierfür eine phylogenetische Analyse eingesetzt. In einer spezifischen Ausführungsform wird für die phylogenetische Analyse ein Kladogramm erstellt. In einer weiteren spezifischen Ausführungsform wird das Kladogramm mit der Bayesischen Methode und wie in Beispiel 3 beschrieben erstellt.
In einer weiteren Ausführungsform wird nach der phylogenetischen Analyse für die KS die Domänenarchitektur des N-terminal benachbarten Moduls analysiert und aus der Polyketidstruktur das Substrat der KS-Domäne abgeleitet. Unter der Domänenarchitektur versteht man hierbei die Abfolge von Domänen in einem Modul, wie z.B. KS DH KR ACP.
In einer bevorzugten Ausführungsform ist das erfindungsgemäße Verfahren auf die gerichtete Isolation zumindest eines in die Polyketid-Biosynthese involvierten Gens ausgerichtet, d.h. es wird/werden ausgehend von den funktionellen Gruppen eines Polyketids das/die zur Herstellung dieses Polyketids nötige(n) Gen(e) isoliert. In einer beispielhaften, jedoch bevorzugten Ausführungsform ist das Polyketid-Biosynthesegen in die Biosynthese von Psymberin involviert. Psymberin (Fig. 1, 1) trägt keinen vollständig reduzierten Rest, sondern eine Acetyl- abgeleitete Startereinheit, die im Regelfall von einer ganz bestimmten Art von KS verlängert wird. In einer phylogenetischen Analyse (Fig. 2) zeigte sich, dass KS mit einer solchen Sub- stratspezifität zu Klade VI gehören. Klade VI läßt sich weiterhin differenzieren in KS Domänen, die einem Modul mit einer GCN5-related N-Acetyltransferase (GNAT) Domäne folgen (Klade VIa) und solchen, die keine GNAT Domäne aufweisen (Klade VIb). Ein Sequenzalignment der in Klade VIa enthaltenen KS Domänen zusammen mit allen bekannten Sequenzen der Klade VI ergab zwei konservierte Motive: das EDAGY Motiv, sowie das Klade VIa Motiv YYQ/KAGML, welches einem Modul mit einer GCN5-related N- Acetyltransferase (GNAT) Domäne folgte (Fig. 3). Diese konservierten Motive traten nicht in den Sequenzen der anderen Kladen auf. Weiterhin wurde im EDAGY Motiv ein Tyrosinrest identifiziert, der in 84% der trans-AT KS konserviert ist, jedoch in den ubiquitären sup KS nicht auftritt. Aufgrund der identifizierten konservierten Motive können daher nun zur Isolation eines in die Psymberinbiosynthese involvierten Gens Primer generiert werden, die in der forward-Orientierung spezifisch sind für das EDAGY-Motiv und in der reverse-Orientierung spezifisch sind für das YYQ/KAGML-Motiv.
Die unter Verwendung dieser Primer erzeugten Amplifikate können dann zur Isolierung der Nukleinsäuresequenz für die KS Domäne, der Nukleinsäuresequenz für die die KS Domäne umfassende PKS, sowie der Nukleinsäuresequenz des gesamten zur Polyketidsynthese nötigen Genclusters verwendet werden. Verfahren zur Isolierung solcher Nukleinsäuresequenzen sind dem Fachmann wohlbekannt und schließen beispielsweise Genome- Walking oder das Screening von Cosmid- oder Fosmid-Bibliotheken ein. Die isolierten Nukleinsäuren können dann mittels Sequenzierung bestimmt/identifiziert werden.
In einer spezifischen Ausführungsform ist zumindest ein Primer spezifisch für 2, 3, 4, 5, 6, oder mehr als 6 zusammenhängende Aminosäurereste eines der in Fig. 3 oder Fig. 4 definier- ten kladenspezifϊschen Aminosäuremotive, die ebenfalls in SEQ ID NO 40-71 wiedergegeben sind. In einer weiteren spezifischen Ausführungsform ist der zumindest eine Primer des Primerpaars am 3' Ende des Primers spezifisch für die besagten Aminosäurereste.
In einer weiteren spezifischen Ausführungsform sind beide Primer des Primerpaars spezifisch für zumindest 2, 3, 4, 5, 6 oder mehr als 6 zusammenhängende Aminosäurereste der in Fig. 3 oder Fig. 4 definierten Aminosäuremotive einer Klade, wobei die beiden Primer bezogen auf die Nukleinsäure, mit der sie hybridisieren, einen ausreichenden Abstand zueinander einhalten, um eine Amplifikation zu ermöglichen.
In einer anderen spezifischen Aus führungs form hat das verwendete Primerpaar die Nukleotidsequenz: 5'-GCN HTN GAR GAY GCN GGN TAY GC-3' (EDAGY; SEQ ID NO: 72) und 5'-C NAR CAT NCC NGC YTK RTA RTA-3' (YYQAGMLA; SEQ ID NO: 73).
In einer weiteren Aus führungs form wird für die Amplifikation der vom zumindest einen Primerpaar eingeschlossenen Nukleinsäureregion der KS Domäne neben dem zumindest einen, erfindungsgemäßen Primerpaar ein zweites Primerpaar verwendet, wobei das erste und das zweite Primerpaar verschachtelt sind, d.h. das eine Primerpaar vollständig innerhalb des vom anderen Primerpaar zu amplifϊzierenden Nukleinsäurebereichs liegt. Das zweite Primerpaar ist in einer bevorzugten Ausführungsform ein erfindungsgemäß hergestelltes Primerpaar und basiert damit ebenfalls auf der Substratspezifität einer Kethosynthasedomäne einer trans-AT Polyketidsynthase. In einer anderen Ausführungsform ist das zweite Primerpaar ein degeneriertes Primerpaar. In einer besonders bevorzugten Ausführungsform ist dieses Primerpaar spezifisch für die Aminosäuresequenz KSDPQQF (for- ward) bzw. KSHGTGR (reverse). In einer noch bevorzugteren Ausführungsform hat das zweite Primerpaar die Nukleotidsequenz 5'-MGN GAR GCN NWN SMN ATG GAY CCN CAR CAN MG-3' bzw. 5'-GGR TCN CCN ARN SWN GTN CCN GTN CCR TG-3'.
In spezifischen Ausführungsformen wird die Amplifikation mit den zwei Primerpaaren gleichzeitig oder zweistufig durchgeführt. Bei der zweistufigen Amplifikation wird in der ersten Amplifikationsrunde das außenliegende Primerpaar verwendet. Danach werden in einer zweiten Amplifikationsrunde die Amplifikate aus der ersten Amplifikationsrunde mit den innenliegenden, verschachtelten Primern amplifi- ziert. In einer weiteren bevorzugten Ausführungsform ist die mit den zumindest zwei Primerpaaren durchzuführende Amplifikation eine nested PCR.
In einer weiteren Ausführungsform erfolgt die Isolation des zumindest einen Polyketid- Biosynthesegens aus einem Metagenom. In einer bevorzugten Ausführungsform umfasst das Metagenom das Genom zumindest eines Eukaryoten und zumindest eines Prokaryoten. Bevorzugt befinden sich Eukaryot und Prokaryot in einer Symbiose. In einer weiteren Ausführungsform ist der Eukaryot ein Schwamm, bevorzugt gehört dieser Schwamm zu den Demospongiae, den Dictyoceratida oder den Irciniidae. In einer bevorzugten Ausführungsform gehört der Schwamm zu Psammicinia sp.; noch bevorzugter ist der Schwamm Psammocinia äff. bulbosa.
In einer weiteren bevorzugten Ausführungsform ist das zu isolierende Polyketid- Biosynthesegen in die Biosynthese von Psymberin, den Mycalamiden, den Onnamiden, den Theopederinen, den Icadamiden, Pederin, den Laulimaliden (Fijianoliden), den Latrunculinen, Mycothiazol, Pateamin A, den Spongistatinen (Altohyrtinen), Discodermolid, Dictyostatin, Tedanolid und/oder Calyculin involviert, d.h. Teil einer Polyketidsynthase, die eines dieser Polyketide synthetisiert.
In einer weiteren Ausführungsform umfasst das erfindungsgemäße Verfahren weiterhin den Schritt der Isolierung des gesamten für die Polyketidsynthese benötigten Genbereichs basierend auf den Sequenzinformationen des isolierten zumindest einen Polyketid- Biosynthesegens. In einer spezifischen Ausführungsform erfolgt diese Isolierung des gesamten Genbereichs unter Verwendung einer Library. In weiteren spezifischen Ausführungsformen ist die Library eine Cosmid-, YAC-, BAC- oder Fosmid-Library. In einer weiteren spezifischen Ausführungsform wurde die Library aus einem Metagenom erzeugt. In weiteren spe- zifϊschen Ausfuhrungsformen der Erfindung ist das Metagenom das Metagenom eines Schwammes.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Fig. 1 zeigt eine Übersicht über einige beispielhaften und mit Ausnahme von Pederin aus Schwämmen isolierte komplexe Polyketide, die von Symbionten synthetisiert werden oder von denen vermutet wird, dass sie von Symbionten synthetisiert werden. 1 Psymberin (Irci- niastatin A), 2 Onnamide A, 3 Pederin, 4 Mycalamid A, 5 Laulimalid (Fijianolid B), 6 La- trunculin A, 7 Mycothiazol, 8 Pateamin A, 9 Spongistatin 1 (Altohyrtin A). Das Sternzeichen (*) gibt die Position der ß- Verzweigungen an.
Fig. 2 ist ein bayesisches Kladogramm von Volllängen-KS-Domänen aus trans- AT-PKS. Die KS-Nummerierung bezieht sich auf die Position innerhalb des Genclusters, wobei vom upstream-Ende her gestartet wird. Beispielsweise ist LkcKS3 die dritte Lankacidin KS Domäne. Die cis-AT KS4 der Erythromycin PKS wurde als Outgroup verwendet. Wahrscheinlichkeitswerte > 0.6 werden an den Knotenpunkten angegeben. Kladentypen werden in römischer Nummerierung zusammen mit dem Haupt-Substrattyp angegeben. Bae, Bacillaene; BT, nicht charakterisierte PKS aus B. thailandensis; Chi, Chivosazol; Dif, Difficidin; Dsz, Disorazol; GU, nicht characterisierte PKS aus Geobacter uraniumreducens; Lkc, Lankacidin; Lnm, Leinamycin; MIn, Macrolactin; Mmp, Mupirocin; Onn, Onnamide; Ped, Pederin; Ta, Myxovirescin.
Fig. 3 zeigt das Sequenzalignment von KS Protein Sequenzen einzelner Kladen. Die Nummerierung bezieht sich auf die Aminosäurepositionen von Pedl, welche PedKSl beinhaltet. Die Pfeile zeigen Regionen an, zu denen erfindungsgemäß Primer hergestellt wurden, die zur Amplifikation der PKS Genfragmente genutzt wurden. Kladen-spezifische Aminosäurereste innerhalb dieser Regionen sind in Fettschrift wiedergegeben. Das Sternzeichen markiert das konservierte Cystein der active-site. V, Sequenzen der Klade V; VI, Sequenzen der Klade VIb; S, Sequenzen von SupA; BPl 7KS l stammt aus Burkholderia pseudomallei 1710b (BURPS 1710b_A2618, erste KS Domäne); KAKS l stammt aus Kordia algicida (KAOT 1 04270, erste KS); SupA.Tsl stammt aus Theonella swinhoei (GenBank accession ABE03935, erste KS); SupA.Aal stammt aus Aptysina aerophoba (ABE03915, erste KS); SupA.Aa2 stammt aus A. aeophoba (ABE03895, erste KS); SupA.Pcl stammt aus Pseudoceratina clavata (ABB73286, erste KS); SupA.PKSA stammt aus Discodermia dissoluta (SA1_PKSA, zweite KS).
Fig. 4A - 41 zeigt ein Sequenzalignment der kladenspezifischen Motive, die für ein erfindungsgemäßes gruppenspezifisches Primerdesign geeignet sind. Die gruppenspezifϊschen Aminosäuren sind als weiße Buchstaben vor schwarzem Hintergrund dargestellt; allgemein konservierte Aminosäuren sind grau unterlegt (80% treshold) und Aminosäuren, die in einigen, jedoch nicht allen Gruppen konserviert sind, sind in Fettdruck dargestellt. Die Aufteilung in die Kladen basiert auf einer phylogenetischen Analyse nach Nguyen, T., Ishida, K., Jenke- Kodama, H., Dittmann, E., Gurgui, C, Hochmuth, T., Taudien, S., Platzer, M., Hertweck, C. and Piel J. Nat. Biotechnol, 2008, 26, 225-233 (siehe Fig. 2). supAl : ABK01346.1, supA2: ABK01347.1 und supA4: ABK01355.1 wurden ebenfalls zu dem Sequenzalignment hinzugefügt, um ubiquitäre PKS Sequenzen aus Schwämmen zu vermeiden.
Fig. 5A zeigt die genomische Organisation des isolierten PKS-Genclusters für die Psymberinbiosynthese. Fig. 5B stellt schematisch die Struktur der identifizierten PsyA und PsyD Proteine dar, wobei die einzelnen Module sowie die daran ablaufenden biochemischen Umwandlungen verdeutlicht werden. Fig. 5C stellt vergleichend die Strukturen der entsprechenden Proteine der PKS für die Pederin- und Onnamidbiosynthese gegenüber.
DETAILLIERTE BESCHRIEBUNG DER ERFINDUNG
BEISPIELE
Beispiel 1
Die Aminosäuresequenzen von 138 bekannten trans-AT-PKS-Modulen wurden aus der Gen- Bank Datenbank entnommen und unter manueller Kontrolle mittels ClustalX geordnet und ausgerichtet („Alignment"). Hierbei wurden Deletionen und nicht ausrichtbare Sequenzbereiche ausgeschlossen. Hiernach wurde eine phylogenetische Analyse der Volllängen-KS-Domänen der bearbeiteten Aminosäuresequenzen mittels der MrBayes Software (v3) unter Verwendung des „WAG replacement modeis" und einer Gammaverteilung mit vier Kategorien durchgeführt. Die Marko vketten-Monte Carlo Analyse lief für 2,5 Millionen Zyklen, wobei alle 100 Generationen ein Sample entnommen wurde. Die Konvergenz wurde mittels Plots der Maximum- Likelihood- Werte und einer Standardabweichung von < 0,05 bewertet. Der Consensus-Baum und die späteren Kladenwahrscheinlichkeiten wurden nach Verwerfen derjenigen Bäume berechnet, die vor dem Erreichen der Konvergenz als Sample entnommen worden waren. Die auf dem Neighborhood-Joining- Verfahren beruhende phylogenetische Analyse wurde mittels der Programme Seqboot, Protdist, Neighbor und Consens der PHYLIP-Software durchgeführt. Die Bootstrap-Analyse wurde mit 1000 Pseudoreplikatsequenzen durchgeführt. Für die M aximum-Parsimony- Analyse wurde die heuristische Suchoption der Software PAUP*4.0bl0 verwendet.
Das in Fig. 2 abgebildete abgeleitete Kladogramm zeigt deutlich, dass einzelne Kladen KS von verschiedenen Bakterien enthalten. Anschließend wurde für alle KS die Domänenarchitektur des N-terminal benachbarten Moduls analysiert und daraus zusammen mit biosynthetischen Überlegungen (vorausgesagt aus der Polyketidstruktur) die Substrate aller KS- Domänen abgeleitet. Es ergaben sich phylogenetisch klar abgegrenzte Gruppen von KS mit gleichen Substraten, also eine Verteilung der Domänen der individuellen Biosynthesewege auf einzelne Kladen.
Alle in diesem Kladogramm gegebenen Kladen wurden weiterhin eingehend getrennt analysiert, um Sequenzmuster aufzuspüren, welche die Bereitstellung von für diese Motive spezifische Primer erlauben.
Fig. 3 und Fig. 4 zeigen die so detektierten Konsensussequenzen, aus denen sich erfindungsgemäß Primer ableiten lassen, die jeweils nur für diejenige KS-Domäne spezifisch sind, die in den Biosyntheseweg einer bestimmten in einem Polyketid gefundenen Gruppe involviert sind. Weiterhin wurde ein Tyrosinrest in einem EDAGY-Motiv identifiziert, der in 84% aller trans- AT-KS konserviert ist, jedoch in den ubiquitären sup KS nicht auftritt.
Beispiel 2: Isolierung der Metagenom-DNA und Bereitstellung einer Library
Isolierung
Proben der Schwämme P. äff. bulbosa und M. hentscheli wurden gesammelt und bei -800C eingefroren. Hierbei wurden Proben von Psammocinia äff. bulbosa in Tauchgängen an der Milne Bay, Papua-Neuguinea durch die Arbeitsgruppe von Prof. Phil Crews (University of California at Santa Cruz) gesammelt und freundlicherweise zur Verfügung gestellt. Das Me- tagenom aus P. äff. bulbos wurde zur Isolierung des Psymberin-PKS-Genclusters verwendet, während das Metagenom aus M. hentscheli die Quelle für die Mycalamid-Biosynthese- Gencluster bereitstellte.
Die Gesamt-DNA aus den Proben wurde mittels eines dem Fachmann bekannten Verfahrens isoliert, um den hohen Gehalt an Polysacchariden zu entfernen (Murray, M. G. and W.F. Thompson (1980). Rapid isolation of high-molecular-weight plant DNA. Nuc. Acids Res. 8:4321-4325). Hierbei wurde das gefrorene Schwammmaterial aufgetaut und ein kleines Stück von ca. Ig wurde abgeschnitten, welches sowohl Schwammoberfläche als auch Innenleben des Schwamms enthielt. Das Gewebe wurde unter flüssigem Stickstoff unter Verwendung von vorgekühlten Mörser und Pistill zerrieben. Das resultierende Puder wurde direkt im Anschluß in eine 50 ml Falcon-Tube überführt, die 10 ml Lysepuffer (8 M Harnstoff, 2% Sarkosyl, 1 M NaCl, 50 mM EDTA und 50 mM Tris-HCl pH 7,5) enthielt. Die Lysereaktion wurde für 15 min bei 60 0C durchgeführt, wobei der Ansatz alle 5 min vorsichtig durchmischt wurde.
Die isolierte DNA wurde danach zweimal mit 10 ml Phenol/CHCls/Isoamylalkohol (25:24:1; v : v : v) und einmal mit 1 0 ml C HC I3 extrahiert. Jeder Extraktion folgte ein Zentrifugationsschritt bei 11.000 rpm für 5 min. Um Polysaccharide zu entfernen, wurde die obere wässrige Phase, die die DNA enthielt, mit einer 10 %igen (w/v) wässrigen Cetyltrimethylammoniumbromid (CTAB) Lösung mit einer Endkonzentration von 0,5 % behandelt. Die Mischung wurde für 15 min bei 60° C inkubiert und das Präzipitat wurde mittels Zentrifugation bei 11.000 rpm für 15 min entfernt.
Die Nukleinsäuren wurden mit 2 Volumina vorgekühlten Ethanols (98%) und 1/10 Volumen einer 3 M Natriumacetatlösung (pH 7) gefällt. Das nach einem 30 minütigem Zentrifugationsschritt bei 11.000 rpm bei 4° C erhaltene Präzipitat wurde zweimal mit kaltem 70%igen Ethanol gewaschen. Die krude DNA (ca. 5 μg) wurde für 10-15 min an der Luft getrocknet und in Tris-Puffer (10 mM, pH 8,5) resuspendiert.
Library
Zur Herstellung der Library wurde das CopyControl Fosmid Library Production Kit (Epicentre Biotechnologies) verwandt, wobei das Protokoll des Herstellers modifiziert wurde. Die DNA wurde in einem 1 % (w/v) low-melting point Agarosegel aufgetrennt und Fragmente mit einer Größe von ca. 35 kb wurden mittels Gelverdaus mit GELase isoliert. Hierbei wurde 1 U der GELase Enzymlösung zu jeweils 300 μl geschmolzener Agarose hinzugegeben, gefolgt von einer Inkubation von 2 h bei 45 0C. Nach Inaktivierung des Enzyms (70 0C, 10 min) und Entfernung von unverdauter Agarose durch Zentrifugation für 20 min bei 11.000 rpm wurde die DNA bei Raumtemperatur mit 2,5 Volumina von 98%igem Ethanol und 1/10 Volumen von 3 M Natriumacetat (pH 5,2) gefällt. Nach einem Zentrifugationsschritt für 30 min bei 11.000 rpm und zwei Waschschritten mit 70 %igem Ethanol bei 4 0C wurde die pelletierte DNA in 50 μl Tris-Puffer (10 mM, pH 8,5) aufgenommen. Diese metagenomische DNA wurde mit Isopropanol und 3 M Nariumacetat (pH 5,2) gefällt.
Ungefähr 250 ng von blunt-ended DNA (mit Tris-Puffer eluiert; 10 mM, pH 8.5) wurden in einem Ligationsschrit mit dem pCCIFOS Vektor über Nacht und bei 16 0C nach Herstellerangaben verwendet, wobei jedoch keine T4 DNA Ligase eingesetzt wurde. Die DNA wurde dann in den Lamdaphagen gepackt und zur Trans fektion den EPI300-TlR E. coli Zellen gemäß den Angaben des Herstellers verwendet. Für die Herstellung von Libraries von großer Größe wurden alle Schritte von der DNA- Präparation bis zum Ausplattieren der Library an einem Tag (und ohne Einfrieren der Proben) durchgeführt.
Beispiel 3 : Isolierung eines Psymberin KS Genfragments
In einem ersten Schritt wurde zunächst die Komplexität der DNA-Probe mittels einer ersten PCR-Amplifikation erniedrigt. Hierbei wurden degenerierte Primer eingesetzt, die bereits zuvor für die Isolierung der Gene von Pederin und Omnamid genutzt wurden (Piel et al., Anititumor polyketide biosynthesis by an uncultivated bacterial symbiont od the marine sponge Theonella swinhoei. PNAS 101, 16222-16227; 2004; Piel, A polyketide synthase- peptide synthetase gene Cluster from an uncultured bacterial symbiont of Paederus beetles. PNAS 99, 14002-14007; 2002).
Diese verwendeten Primer waren für die Aminosäuremotive KSDPQQF bzw. KSHGTGR spezifisch. Der forward-Primer hatte die Sequenz 5 '-MGNGARGCNNWNSMNATG GAYCCNCARCANMG-3 ' ; der reverse-Primer hatte die Sequenz 5'-GGRTCNCCNA RNS WNGTNCCNGTNCCRTG-3 ' .
Die PCR fand unter folgenden Bedingungen statt: 96 0C für 45 s, 55 0C für 45 s, 72 0C für 1 min (40 x), dann 72 0C für 10 min. Verwendet wurde Taq Polymerase (NEB).
Das Amplifikat wurde mittels Agarosegel aufgetrennt und die bei 700 bp laufende DNA mittels Gelverdau wie oben beschrieben aufgereinigt. 1 μl dieses aufgereinigten PCR Amplifϊkats wurde als Template für eine zweite PCR-Runde verwendet.
Für die zweite PCR-Runde wurde als Ziel die Acetyl-abgeleitete Startereinheit ausgewählt, die für gewöhnlich durch KS verlängert wird, die zu Klade VI gehören. In einem zusätzlich durchgeführten Alignment, dass alle veröffentlichten Klade VI Sequenzen enthielt, wurde das einzigartige Sequenzmotiv YYQ/KAGML (Klade VIa-Motiv, Fig. 3) in allen KS gefunden, die einem Modul mit einer GCN5-related N-acetyltransferase (GNAT) Domäne folgen. Dieses Motiv wurde für das Primerdesign ausgewählt, da gezeigt werden konnte, dass GNATs über Decarboxylierung von Malonyl-CoA Acetyl-Startereinheiten spezifisch in Polyketide einbauen.
Die verwendeten Primer waren spezifisch für das EDGAY-Motiv, sowie für das YYQ AGML- Motiv. Der forward-Primer hatte die Sequenz 5'-GCNHTNGARGAYG CNGGNTAYGC-3 ' (SEQ ID NO : 72); der reverse Primer hatte die Sequenz 5 '-CANRCATNCCNGCY TKRT ART A-3 '(SEQ ID NO: 73).
Die Reaktionsbedingungen waren: 95 0C für 300 s, 95 0C für 60 s, 52 0C für 60 s und 74 0C für 100 s (35 X), 74 0C für 10 min. Es wurde Taq Polymerase (NEB) verwendet.
Die Amplifikation ergab ein einzelnes PCR-Produkt mit der erwarteten Größe, dessen Sequenzierung ergab, dass es in der Tat in die Acetyl-spezifϊsche Klade VIa gehörte.
Diese Resultate belegen, dass mittels des erfindungsgemäßen Verfahrens einzelne PKS-Gene in komplexen Metagenomen mit einer außergewöhnlichen Genauigkeit ausgewählt und amp- lifϊziert werden können.
Beispiel 4: Isolierung des Psymberin PKS-Genc lusters
Eine Fosmid-Library aus Gesamt-DNA des Psymberin-positiven Schwamms P. äff. bulbosa wurde erzeugt (410.000 Klone) und nach einer vorbekannten Strategie (Hrvatin & Piel, Rapid isolation of rare clones from highly complex DNA libraries by PCR analysis of liquid gel pools. J. Microbiool. Methods 68, 434-436; 2007) auf positive Klone hin durchmustert.
Die Durchmusterung wurde mittels PCR und unter Verwendung von spezifischen Primern durchgeführt, die aus dem Amplikon der Klade VI abgeleitet wurden. Innerhalb von drei Runden des „Primer Walkings" konnten so fünf positive Fosmide isoliert werden. Fig. 5A und Tabelle 1 geben das Ergebnis der Sequenzierung (SEQ ID NO: 39) dieser fünf Fosmide wieder. Der isolierte Gencluster zeigte eine typisch bakterielle Architektur: es wurden keinerlei Introns detektiert, Shine-Dalgarno-like Sequenzen befanden sich vor den einzelnen Genen und die enge Nachbarschaft der Gene lässt auf eine polycistronische mRNA schließen.
Tabelle 1 :
ORF Proteingröße Vorgeschlagene Funktion SEQ ID NO
ORFl 302 Zn-dependent hydrolase 1, 20
ORF2 426 Adenylosuccinate synthetase 2, 21
ORF3 367 Transposase 3, 22 psyA 3297 PKS 4, 23 psyB 331 Methyltransferase 5, 24 psyC 343 PedK-like 6, 25
ORF4 367 Transposase 7, 26
ORF5 491 Transposase 8, 27 psyD 12644 PKS-NRPS 9, 28 psyE 571 Phosphoenolpyruvate synthase ß + γ subunit 10, 29 psyF 497 Phosphoesterase-like 11, 30 psyG 309 Phosphoenolpyruvate synthase α subunit 12, 31 psyH 369 Acyltransferase 13, 32 psyl 440 HMG-CoA-synthase 14, 33 psyJ 254 Crotonase superfamily 15, 34 psyK 367 Flavin-dependent oxygenase 16, 35 psyL 81 ACP 17, 36 psyM 429 3-Oxoacyl ACP synthase 18, 37 psyN 709 Cation transport ATPase 19, 38
ORF6 Unbekannt
(teilweise) Wie aus z.B. Fig. 5A zu entnehmen ist, umfasst die isolierte Genregion (SEQ ID NO: 39) in ihrer zentralen Region einen psy-Gznc luster (psyA bis psyN) von 62238 bp Länge. Die großen Gene psyA und psyD codieren für PKS mit drei bzw. zehn Modulen, wobei letzterer mit einer Thioesterasedomäne abschließt (siehe Fig. 5B). Damit wird zum ersten Mal die vollständige Sequenzinformation eines Polyketidbiosyntheseclusters offenbart.
Hinsichtlich der Architektur der PKS-Domänen sind PsyA und die ersten fünf Module von PsyD nahezu identisch zu den Omnamid- (OmnB und OnnI) und Pederin- (Pedl und PedF) Biosynthesewegen (Fig. 5 B, C).
Beispiel 5 : Isolierung eines Mycalamid KS Genfragments
Erneut wurde in einem ersten Schritt zunächst die Komplexität der DNA-Probe mittels einer ersten PCR-Amplifikation erniedrigt, wobei die verwendeten Primer ebenfalls die Sequenzen 5 '-MGNGARGCNNWNSMNATGGAYCCNCARCANMG-S ' (forward) und 5'-GGRTCNC CNARNSWNGTNCCNGTNCCRTG-S' (reverse) hatten.
Die erste PCR-Runde fand unter folgenden Bedingungen statt: 96 0C für 45 s, 55 0C für 45 s, 72 0C für 1 min (40 x), dann 72 0C für 10 min. Verwendet wurde Taq Polymerase (NEB).
Das Amplifikat wurde mittels Agarosegel aufgetrennt und die bei 700 bp laufende DNA mittels Gelverdau wie oben beschrieben aufgereinigt. 1 μl dieses aufgereinigten PCR Amplifϊkats wurde als Template für eine zweite PCR-Runde verwendet.
Für die zweite PCR-Runde wurde als Ziel ein Motiv verwendet, welches in KS detektiert wurde, die αß-gesättigte Intermediate verlängert (Klade V). Das identifizierte Motiv hat die Consensussequenz EPI/VE/DTAC (s. Fig. 4A).
Die verwendeten Primer waren spezifisch für das EDGAY-Motiv, sowie für das EPI/VE/DTAC-Motiv. Der forward-Primer hatte die Sequenz 5 '-GCNHTNGARGAYG CNGGNT AYGC-3 ' (SEQ ID NO : 72); der reverse Primer hatte die Sequenz 5 '- RCANGCNGTNTCDATNGGTTC-3'(SEQ ID NO: 74).
Die Reaktionsbedingungen waren: 95 0C für 105 s, 95 0C für 60 s, 51 0C für 60 s und 74 0C für 100 s (35 X), 74 0C für 10 min. Es wurde Hot Start Taq Polymerase (Jena Biosciences) verwendet.
Die Amplifϊkation ergab erneut ein einzelnes PCR-Produkt mit der erwarteten Größe von 211 bp. Weiterhin zeigte eine anschließend durchgeführte Sequenzierung ebenfalls, dass lediglich ein einzelnes KS-Genfragment amplifϊziert worden war, welches perfekt in die vorausgesagte Klade passte (SEQ ID NO: 75).
Diese Resultate belegen erneut, dass mittels des erfindungsgemäßen Verfahrens einzelne PKS-Gene in komplexen Metagenomen mit einer außergewöhnlichen Genauigkeit ausgewählt und amplifϊziert werden können.
Beispiel 6: Isolierung des Mycalamid PKS-Genc lusters
Das oben unter Beispiel 4 beschriebene Durchmusterungsverfahren einer Fosmid-Library aus Mycalamid-positiven Proben des Schwammes M. hentscheli wird mit Primern wiederholt, die für das in Beispiel 5 erhaltene KS-Genfragment spezifisch sind.
Aus den detektierten positiven Fosmiden wird die Gensequenz des gesamten PKS- Genclusters bestimmt, der für die Mycalamidbiosynthese benötigt wird.
Beispiel 7: Expression des Psvmberin PKS-Genc lusters
Bacillus amyloliquefaciens (Stamm FZB42J NCBI Accession Number CP000560) ist eine der reichsten bakteriellen Ressourcen für bioaktive natürliche Produkte, wie z.B. polyenen Anti- biotika Bacillaene und Difficidin. Daher wurde dieser Organismus für die heterologe Expression verwendet.
Als allgemeine Startegie wurde der PKS-Gencluster für Bacillaene über mehrere Schritte von doppelter Crossover-Rekombination durch den des Psymberin PKS Genclusters ersetzt.
Im Detail wurde im ersten Schritt der Bacillaene PKS-Gencluster deletiert und stattdessen eine Psymberin-Rekombinationskassette zusammen mit einem Chloramphenicol-Marker am Beginn des Genclusters integriert. Das hierfür verwendete Plasmid war pBBaeKO (SEQ ID NO: 76). Hierdurch wurde der mutante Stamm FZB42 Bae- generiert (s. Fig. 6). Parallel dazu wurde ein λ-red Doppelcrossover durchgeführt, um das erste positive Fosmid, nämlich pPSKFl, für die Integration der ersten Psymberinregionen in das Genom des Stamms FZB42 Bae- zu modifizieren. Das hierfür verwendete Plasmid war pBPsyI20 (SEQ ID NO: 77). Hierbei wurde eine Bacillaene Rekombinationskassette zusammen mit einem Spectomycinselektionsmarker in das Fosmid, direkt downstream vom Ende der Psymberinsequenz eingebracht. Hieraus resultierte pPSKFlBae20 (s. Fig. 7, SEQ ID NO: 78).
In einem zweiten Schritt wurde dieses Konstrukt dann natürlich in einen FZB42 Bae- transformiert, um FZB42 Bae- Psy+ zu erzeugen (Fig. 8). Die weiteren downstream gelegenen Psymberin-Genregionen können auf eine ähnliche Art und Weise in das Genom von FZB42 Bae- Psy+ integriert werden, bis der Gencluster vervollständigt ist.
Alle Rekombinationskassetten wurden mittels PCR und der in Tabelle 2 gezeigten Primer amplifϊziert und anschließend in den pBluescript SK II (-) Vektor subkloniert. Hier wurden sie unter Verwendung der in korrespondierenden, in Tabelle 2 gezeigten Restriktionsenzyme verdaut und auf die Ligation vorbereitet. Die erzeugten Fragmente wiesen alle die erwarteten Größen auf.
Tabelle 2: Primer Name Primer Sequenz Template Enzym psymberin PKS TACTCGAGCATGAGGAAGGCGCGAAGAT
Xhol
Start For (SEQ ID NO: 79) pPSKFl psymberin PKS GCGAATTCAGCGCTGAGAGTAGATGACG
EcoRI
Start Rev (SEQ ID NO: 80) pPSKFl psymberin PKS CTCGAGCTCTCGGGCAAAATCATGATG
Xhol end For (SEQ ID NO: 81) pPSKFl psymberin PKS TCTAGAACCGAATAATCTCCGCTTTGC
Xbal end Rev (SEQ ID NO: 82) pPSKFl
TAGGTACCTGATCGGCCTGAAGCCAACA B. amylo FZB42
Bae I For Kpnl
(SEQ ID NO: 83) genom. DNA
GCCTCGAGGTCTTATACTCCGTACATCG B. amylo FZB42
Bae I Rev Xhol
(SEQ ID NO: 84) genom. DNA
TCGGATCCAGCGCAGTAAAGGCAATGGA B. amylo FZB42
Bae S For I BamHI
(SEQ ID NO: 85) genom. DNA
GCGTTTAAACCATGAAGGCGGGGAAATCCA B. amylo FZB42
Bae S Rev I Pmel
(SEQ ID NO: 86) genom. DNA
TCGCATGCAGCGCAGTAAAGGCAATGGA B. amylo FZB42
Bae S For II SphI
(SEQ ID NO: 87) genom. DNA
TAGGATCCCATGAAGGCGGGGAAATCCA B. amylo FZB42
Bae S Rev II BamHI
(SEQ ID NO: 88) genom. DNA
GCTCTAGACACTTGTATCGTCGGTCTGA pCCIFos Start For Xbal
(SEQ ID NO: 89) pCCIFos pCCIFos Start GCGTTTAAACCTTAATCGCCTTGCAGCACA
Pmel
Rev (SEQ ID NO: 90) pCCIFos
Die Chloramphenicolresistenzkassette (CamR) wurde aus dem Vektor pDG268 durch EcoRI und SphI Verdau erhalten, während die Spectinomycinresistenzkassette (SpeR) durch Verdau des Vektors pIC333 mit Xbal und BamHI erhalten wurde. Die Konstrukte, welche für die Bacillaene-Deletion und die Modifikation der positive Fosmide, nämlich pBBaeKO bzw. pBPsyI20 verwendet wurden, wurden mittels zweier 3-Punkt-Ligationsschritte durch Klonierung der oben genannten Fragmente in den pBluescript SK II(-) Vektor erhalten (s. Figs. 9A und 9B)
Die Deletion des Bacillaene PKS-Gencluster wurde wie folgt durchgeführt:
Das pBBaeKO-KOnstrukt wurde mittels Kpnl linearisiert und aus dem Gel aufgereinigt. Für die natürliche Transformation wurden kompetente B. amyloliquefaciens Zellen nach dem Verfahren von Kunst und Rapoport (J Bacteriol. 1995; 177(9): 2403-7) hergestellt, wobei kleinere Modifikationen eingeführt wurden (Idris et al., Mol Plant Microbe Interact. 2007; 20(6): 619- 26). Ungefähr 5μg des linearisierten pBBaeKO-Konstrukts wurden transformiert und die rekombiinanten KLone wurden mittels Chloramphenicol (5μg/ml) selektioniert.
Der so erzeugte, neue Mutantenstamm FZB42 Bae- wurde mittels der folgenden Primerpaare (siehe PCR 1 und PCR 2 in Fig. 6) überprüft:
PCRl : BaeHKO for: 5'-TAGACCATCATACCGGAAGC-3' (SEQ ID NO: 91) und PsyAKO rev: 5 '-AATGGAGCGAAGATAGCCG-S ' (SEQ ID NO: 92);
PCR2: CatKO for: 5 '-ACAGCTCCAGATCCTCTACG-S ' (SEQ ID NO: 93) und nucBKO rev: 5'-GACTTGCCGCCCATTTCATA-3' (SEQ ID NO: 94).
Für die Herstellung des die ersten Psymberinregionen enthaltenden FZB42 Bae- Psy+ Stammes im zweiten Schritt, musste zunächst das pPSKF! Positive Fosmid durch den Einbau einer Bacillaene Rekombinattionskassette (BaeS) zusammen mit einem Spectinomycin- selektionsmarker (SpeR) angemessen modifiziert werden. Dies wurde durch lambda-rot vermitteltes Genereplacement (Datsenko KA, Wanner BL. Proc Natl Acad Sei U S A. 2000; 97(12): 6640-5) mit dem Xhol-linearisierten Vektor pBPsyI20 erreicht (s. Fig. 7). Das so erhaltenen Konstrukt pPSKFlBae20 (s. Fig. 10) wurde dann natürlich in zirkulärer Form in den Stamm FZB42 Bae- transformiert. Hierbei reichten die DNA-Konzentrationen von 5-20 μg. Die rekombinanten Klone wurden auf Spectinomycin (100 μg/ml) selektioniert. Die so erzeugten, neuen Mutanten wurden mittels der folgenden Primerpaare (siehe PCR in Fig. 8) überprüft:
SpeKF for: 5 '-AGCGTCCTCTTGTGAAATTAG-S ' (SEQ ID NO: 95) und nucBKO rev: 5'- GACTTGCCGCCCATTTCAT A-3' (SEQ ID NO: 96).
Es wurden fünf positive rekombinante Klone - genannt Bae- Psy+ 12 A-E) - erhalten, die die ersten 12 kb der Psymberin PKS-Gene in sich tragen. Dies repräsentiert ungefähr ein Fünftel des gesamten Psymberin PKS-Genclusters.
Ein weiteres Konstrukt, pPSKFIKanBae (SEQ ID NO: 97; Fig. 11) wurde ebenfalls analog erzeugt. Dieses erlaubt die Integration von weiter downstream gelegenen Genen des Psymberin PKS-Genclusters mit einer Größe von ungefähr 16 kb.

Claims

PATENTANSPRUCHE
1. Nukleinsäure umfassend zumindest ein Biosynthesegen für ein Polyketid ausgewählt aus der Gruppe bestehend aus Psymberin oder Mycalamid.
2. Nukleinsäure gemäß Anspruch 1, wobei die Nukleinsäure eine Sequenz umfasst die ausgewählt ist aus der Gruppe bestehend aus SEQ ID NO 1-19, 39, 75, einem Homolog dieser Sequenzen und/oder dem Komplement der Sequenzen oder des Homologs, wobei das Homolog zumindest 75% Sequenzidentität aufweist, oder unter Hochsalzbedingungen mit der Nukleinsäure hybridisiert.
3. Nukleinsäure gemäß Anspruch 1 - 2, wobei die Nukleinsäure für ein Protein codiert, das zumindest eine Identität zu SEQ ID NO 23 von 41%, zu SEQ ID NO 24 von 52%, zu SEQ ID NO 25 von 42%, zu SEQ ID NO 28 von 44%, zu SEQ ID NO 29 von 94%, zu SEQ ID NO 30 von 96%, zu SEQ ID NO 31 von 96%, zu SEQ ID NO 32 von 94%, zu SEQ ID NO 33 von 98%, zu SEQ ID NO 34 von 95%, zu SEQ ID NO 35 von 97%, zu SEQ ID NO 36 von 98%, zu SEQ ID NO 37 von 96% oder zu SEQ ID NO 38 von 96% aufweist.
4. Peptid für das eine der Nukleinsäuren der vorstehenden Ansprüche kodiert.
5. Peptid ausgewählt aus der Gruppe bestehend aus SEQ ID NO 20 - 38 oder einem Homolog dieser Sequenzen, wobei das Homolog zumindest eine Sequenzidentität Identität zu SEQ ID NO 20 von 36%, zu SEQ ID NO 21 von 54%, zu SEQ ID NO 22 von 44%, zu SEQ ID NO 23 von 41%, zu SEQ ID NO 24 von 52%, zu SEQ ID NO 25 von 42%, zu SEQ ID NO 28 von 44%, zu SEQ ID NO 29 von 94%, zu SEQ ID NO 30 von 96%, zu SEQ ID NO 31 von 96%, zu SEQ ID NO 32 von 94%, zu SEQ ID NO 33 von 98%, zu SEQ ID NO 34 von 95%, zu SEQ ID NO 35 von 97%, zu SEQ ID NO 36 von 98%, zu SEQ ID NO 37 von 96% oder zu SEQ ID NO 38 von 96% aufweist.
6. Vektor umfassend eine Nukleinsäure gemäß Anspruch 1 - 3.
7. Rekombinante Wirtszelle umfassend eine Nukleinsäure gemäß Anspruch 1-3 oder einen Vektor nach Anspruch 6.
8. Verfahren zur Herstellung eines Polyketids umfassend den Schritt:
Kultivierung einer rekombinaten Wirtszelle gemäß Anspruch 7 unter Bedingungen, die die Expression der Biosynthesegene und Produktion des Polyketids durch die Wirtszelle erlauben.
9. Verfahren gemäß Anspruch 8, weiterhin umfassend den Schritt der Isolierung des produzierten Polyketids.
10. Verfahren zur Isolierung zumindest eines Polyketid-Biosynthesegens, umfassend die Schritte: a) Bereitstellen von zumindest einem Primerpaar, das auf der Substratspezifität einer Kethosynthasedomäne einer trans-AT Polyketidsynthase basiert; und b) Isolierung von zumindest einem Polyketid-Biosynthesegen unter Verwendung des zumindest einen Primerpaars aus Schritt a).
11. Verfahren nach Anspruch 10, wobei Schritt b) die Amplifikation der vom Primerpaar eingeschlossenen Nukleinsäureregion umfasst.
12. Verfahren nach Anspruch 10 oder 11, wobei das zumindest eine Primerpaar spezifisch ist für ein Motiv das bei phylogenetisch benachbarten Kethosynthasedomänen von trans-AT Polyketidsynthasen konserviert ist.
13. Verfahren nach Anspruch 10 - 12, wobei zumindest ein Primer des Primerpaars spezifisch ist für zumindest 4 zusammenhängende Aminosäurereste eines der in Fig. 3, Fig. 4 oder SEQ ID NO: 40 - 71 definierten Aminosäuremotive.
14. Verfahren nach Anspruch 11 - 13, wobei, für die Amplifikation der vom Primerpaar eingeschlossenen Nukleinsäureregion neben dem zumindest einen Primerpaar aus Schritt a) ein weiteres Primerpaar verwendet wird, wobei die zwei Primerpaare verschachtelt sind.
15. Verfahren nach Anspruch 10 - 14, wobei das Polyketid-Biosynthesegen aus einem Meta- genom isoliert wird.
16. Verfahren nach Anspruch 10 - 15, wobei das Polyketid-Biosynthesegen in die Biosynthese von Psymberin, den Mycalamiden, den Onnamiden, den Theopederinene A, den Icadamiden, Pederin, den Laulimaliden, den Latrunculinen A, Mycothiazol, Pateamin A, den Spongistatinen 1, Discodermolid, Dictyostatin, Tedanolid und/oder Calyculin involviert ist.
17. Verfahren nach den Ansprüchen 10 - 16, weiterhin umfassend den Schritt der Isolierung des gesamten für die Polyketidsynthese benötigten Genbereichs basierend auf den Sequenzinformationen des in Schritt b) isolierten zumindest einen Polyketid- Biosynthesegens.
PCT/EP2009/067033 2008-12-15 2009-12-14 Polyketid biosynthesegene WO2010072600A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102008054660.7 2008-12-15
DE102008054660A DE102008054660A1 (de) 2008-12-15 2008-12-15 Polyketid Biosynthesegene

Publications (1)

Publication Number Publication Date
WO2010072600A1 true WO2010072600A1 (de) 2010-07-01

Family

ID=41571814

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2009/067033 WO2010072600A1 (de) 2008-12-15 2009-12-14 Polyketid biosynthesegene

Country Status (2)

Country Link
DE (1) DE102008054660A1 (de)
WO (1) WO2010072600A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3938518A4 (de) * 2019-03-12 2023-01-11 Terra Bioworks, Inc. Expressionsvektor

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003044186A2 (en) * 2001-11-22 2003-05-30 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Novel gene cluster of pederin biosynthesis genes

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US6833447B1 (en) * 2000-07-10 2004-12-21 Monsanto Technology, Llc Myxococcus xanthus genome sequences and uses thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003044186A2 (en) * 2001-11-22 2003-05-30 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Novel gene cluster of pederin biosynthesis genes

Non-Patent Citations (14)

* Cited by examiner, † Cited by third party
Title
CICHEWICZ ET AL: "Psymberin. a potent sponge-derived cytotoxin from Psammocluia distantly related to the pederin family", ORGANIC LETTERS, AMERICAN CHEMICAL SOCIETY, US, vol. 6, no. 12, 1 January 2004 (2004-01-01), pages 1951 - 1954, XP002987794, ISSN: 1523-7060 *
DATABASE EMBL [online] 7 January 2010 (2010-01-07), "Uncultured bacterium psy1 psymberin biosynthetic gene cluster, partial sequence.", XP002566895, retrieved from EBI accession no. EMBL:FJ823461 Database accession no. FJ823461 *
DATABASE EMBL [online] 9 August 2005 (2005-08-09), "Uncultured bacterial symbiont of Discodermia dissoluta trans-AT type polyketide synthesis gene cluster, partial sequence.", XP002566886, retrieved from EBI accession no. EMBL:AY907538 Database accession no. AY907538 *
DATABASE UniProt [online] 1 February 2005 (2005-02-01), "SubName: Full=OnnF;", XP002566890, retrieved from EBI accession no. UNIPROT:Q5MP03 Database accession no. Q5MP03 *
FIESELER LARS ET AL: "Widespread occurrence and genomic context of unusually small polyketide synthase genes in microbial consortia associated with marine sponges", APPLIED AND ENVIRONMENTAL MICROBIOLOGY, vol. 73, no. 7, April 2007 (2007-04-01), pages 2144 - 2155, XP002566891, ISSN: 0099-2240 *
FISCH KATJA M ET AL: "Polyketide assembly lines of uncultivated sponge symbionts from structure-based gene targeting", NATURE CHEMICAL BIOLOGY, vol. 5, no. 7, July 2009 (2009-07-01), pages 494 - 501, XP002566894 *
HERTWECK CHRISTIAN: "Hidden biosynthetic treasures brought to light.", NATURE CHEMICAL BIOLOGY JUL 2009, vol. 5, no. 7, July 2009 (2009-07-01), pages 450 - 452, XP002566896, ISSN: 1552-4469 *
HOCHMUTH T ET AL: "Polyketide synthases of bacterial symbionts in sponges - Evolution-based applications in natural products research", PHYTOCHEMISTRY, PERGAMON PRESS, GB, vol. 70, no. 15-16, 1 October 2009 (2009-10-01), pages 1841 - 1849, XP026748846, ISSN: 0031-9422, [retrieved on 20090513] *
KIM TAE KYUNG ET AL: "Diversity of polyketide synthase genes from bacteria associated with the marine sponge Pseudoceratina clavata: culture-dependent and culture-independent approaches.", ENVIRONMENTAL MICROBIOLOGY AUG 2006, vol. 8, no. 8, August 2006 (2006-08-01), pages 1460 - 1470, XP002566893, ISSN: 1462-2912 *
NGUYEN TUANH ET AL: "Exploiting the mosaic structure of trans-acyltransferase polyketide synthases for natural product discovery and pathway dissection.", NATURE BIOTECHNOLOGY FEB 2008, vol. 26, no. 2, February 2008 (2008-02-01), pages 225 - 233, XP002566892, ISSN: 1546-1696 *
PIEL J: "A polyketide synthase-peptide synthetase gene cluster from an uncultured bacterial symbiont of Paederus beetles", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF USA, NATIONAL ACADEMY OF SCIENCE, WASHINGTON, DC, US, vol. 99, no. 22, 29 October 2002 (2002-10-29), pages 14002 - 14007, XP002235149, ISSN: 0027-8424 *
PIEL JOERN ET AL: "Antitumor polyketide biosynthesis by an uncultivated bacterial symbiont of the marine sponge Theonella swinhoei", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, vol. 101, no. 46, 16 November 2004 (2004-11-16), pages 16222 - 16227, XP002566889, ISSN: 0027-8424 *
PIEL JÖRN ET AL: "Targeting modular polyketide synthases with iteratively acting acyltransferases from metagenomes of uncultured bacterial consortia.", ENVIRONMENTAL MICROBIOLOGY SEP 2004, vol. 6, no. 9, September 2004 (2004-09-01), pages 921 - 927, XP002566888, ISSN: 1462-2912 *
SCHIRMER ANDREAS ET AL: "Metagenomic analysis reveals diverse polyketide synthase gene clusters in microorganisms associated with the marine sponge Discodermia dissoluta", APPLIED AND ENVIRONMENTAL MICROBIOLOGY, vol. 71, no. 8, August 2005 (2005-08-01), pages 4840 - 4849, XP009121399, ISSN: 0099-2240 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3938518A4 (de) * 2019-03-12 2023-01-11 Terra Bioworks, Inc. Expressionsvektor

Also Published As

Publication number Publication date
DE102008054660A1 (de) 2010-10-21

Similar Documents

Publication Publication Date Title
EP2271666B1 (de) Nrps-pks gencluster und dessen manipulation und verwendung
DE69930510T2 (de) Polyketide und ihre herstellung
DE69937732T2 (de) Biosynthetische gene zur spinosyn-insektizidherstellung
EP2356211B1 (de) Verbesserte riboflavin-produktion
AU2179101A (en) Method for obtaining nucleic acids from an environment sample, resulting nucleic acids and use in synthesis of novel compounds
CN102762737B (zh) 生产啶南平的方法
KR100945483B1 (ko) pikD 조절유전자의 발현벡터를 이용한 스트렙토미세스베네주엘라에(Streptomycesvenezuelae)에서폴리케타이드(polyketide)의 생산성 증가방법
KR100834488B1 (ko) 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna
CN105176899B (zh) 构建生产或高产目的基因产物重组菌的方法及构建的重组菌与应用
EP1212412A2 (de) Nucleinsäuren, die für enzymaktivitäten der spinosyn-biosynthese codieren
CN101363022A (zh) 替曲卡星a的生物合成基因簇及其应用
WO2010072600A1 (de) Polyketid biosynthesegene
MX2012013099A (es) Cepas spnk.
CN116286574A (zh) 精准调控Bacillus subtilis内源多基因表达的CRISPRa方法及其应用
EP1448767B1 (de) Neuer gen-cluster aus genen der pederin-biosynthese
CN110305881B (zh) 一种聚酮类化合物neoenterocins的生物合成基因簇及其应用
CN105087507B (zh) 一种整合酶及其在改造刺糖多孢菌中的应用
DE19708127A1 (de) Acarbose acb-Cluster: Isolierung von weiteren Genen der Acarbose Biosynthese und des Acarbose-Stoffwechsels aus Actinoplanes sp. SE 50/110 sowie deren Verwendung
DE60130394T2 (de) Gene, die im Zusammenhang mit der Biosynthese von ML-236B stehen
CN113355339B (zh) 一种大型基因簇的无痕定点改造方法及其应用
EP0730029A2 (de) Acarbose-Biosynthesegene aus Actinoplanes sp., Verfahren zu ihrer Isolierung sowie ihrer Verwendung
JP4633519B2 (ja) ミデカマイシン高生産菌
WO2020158839A1 (ja) 母核改変された化合物の製造方法
WO2024199650A1 (de) Crispr-cas9 basierte linearisierung von plasmid dna-templaten
CN114561405A (zh) 木霉菌Harzianolide的合成基因簇在制备提高植物灰霉病抗性制剂中的应用

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09771556

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 09771556

Country of ref document: EP

Kind code of ref document: A1