Nothing Special   »   [go: up one dir, main page]

DE10233047A1 - Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence - Google Patents

Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence Download PDF

Info

Publication number
DE10233047A1
DE10233047A1 DE2002133047 DE10233047A DE10233047A1 DE 10233047 A1 DE10233047 A1 DE 10233047A1 DE 2002133047 DE2002133047 DE 2002133047 DE 10233047 A DE10233047 A DE 10233047A DE 10233047 A1 DE10233047 A1 DE 10233047A1
Authority
DE
Germany
Prior art keywords
amino acid
sequence
amino acids
protein
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE2002133047
Other languages
German (de)
Inventor
Ludger Altrogge
Gudula Riemen
Helmut Brosterhus
Gregor Siebenkotten
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amaxa AG
Original Assignee
Amaxa AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amaxa AG filed Critical Amaxa AG
Priority to DE2002133047 priority Critical patent/DE10233047A1/en
Priority to PCT/DE2003/002437 priority patent/WO2004016649A2/en
Priority to AU2003254630A priority patent/AU2003254630A1/en
Publication of DE10233047A1 publication Critical patent/DE10233047A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43595Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Toxicology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Preparing a synthetic polypeptide (I) with at least one detectable function, is new. Preparing a synthetic polypeptide (I) with at least one detectable function comprises: (1) comparing amino acid (aa) sequences of at least 3 known polypeptides that have at least one function in common; (2) equalizing the position of invariant aa, or similar regions of aa, by mutual alignment and/or introduction of gaps, in one or more sequences, to produce a correspondence between the positions of the invariant aa and similar sequences; (3) establishing an 'average sequence' (AS) over at least a major part of the total length of the aa sequence, by selecting the commonest aa at each position or, where several aa have equal frequencies, selecting one of these according to preselected criteria, with gaps being treated as aa; (4) designing, then synthesizing, a nucleic acid sequence (II) that encodes AS; and (5) linking (II) to a promoter for expression in a suitable system. Independent claims are also included for the following: (1) (I) as new compounds; (2) isolated or synthetic nucleic acids (IIa) that encode (I); (3) a vector for expressing (I) that contains (IIa); and (4) a cell, or kit, that contains (I), (IIa) and/or the vector of (3).

Description

Hintergrund der Erfindungbackground the invention

Die Erfindung betrifft ein Verfahren zur Herstellung eines künstlichen Polypeptids mit mindestens einer nachweisbaren Funktion, sowie ein nach diesem Verfahren hergestelltes künstliches Protein mit mindestens einer nachweisbaren Funktion.The invention relates to a method to make an artificial Polypeptide with at least one detectable function, as well as a artificial protein produced by this process with at least one demonstrable function.

Stand der TechnikState of the art

Die Funktionen eines Polypeptids bzw. Proteins hängen von seiner Konformation ab, die sich aus der Aminosäuresequenz und ggf. der Zusammensetzung aus Untereinheiten ergibt. Innerhalb eines Proteins sind bestimmte Aminosäuren wichtig für Eigenschaften, wie beispielsweise die Spezifität, die Thermostabilität und sonstige nachweisbare Funktionen. Bereits der Austausch eines einzigen Nucleotids im zugehörigen Gen kann zum Einbau einer Aminosäure in das Protein führen, die entweder die normale Funktion des Proteins stört oder eine bestimmte Eigenschaft verbessert. Mit der DNA – Rekombinationstechnik wurde es möglich, in einem Klonierten Gen Nucleotide gezielt zu verändern oder zu ersetzen und so Proteine mit spezifischen Aminosäuren an definierten Positionen herzustellen. Eine solche sequenzspezifische Mutagenese kann mittels verschiedener Techniken erfolgen, wie beispielsweise error-prone PCR (Herlitze et al. (1990), Gene 91, 143-147; Cadwell et al. (1992), PCR Methods Appl. 2, 28-33), Oligonukleotid-gesteuerte Mutagenese (Hermes et al. (1989), Gene 84, 143-151) oder DNA shuffling (Stemmer (1994), Proc.Natl.Acad.Sci. USA 91, 10747-10751). Dabei muss ein bekanntes natürliches Protein solange wiederholt Mutagenesen, funktionellem Screening und einer Isolierung und Bestimmung der erfolgreichen Sequenzen unterworfen werden, bis ein Klon mit den gewünschten Eigenschaften vorliegt. Die Auswahl einer auszutauschenden Aminosäure stützt sich dabei häufig auf Kenntnisse über deren Rolle im funktionsfähigen Protein. Diese Kenntnisse erhält man durch genetische Untersuchungen oder durch Röntgenstrukturanalysen der dreidimensionalen Struktur des Proteins. Auf diese Weise ist es möglich, spezifische Zentren oder Bereiche gezielt zu verändern. Hierdurch lassen sich dann beispielsweise Thermostabilität, pH – Toleranz, Spezifitäten und andere Merkmale von Proteinen beeinflussen, die beispielsweise in industriellen Prozessen oder bei analytischen Methoden eine Rolle spielen. Diese Verfahren eignen sich zwar dazu, bei vorhandenen Proteinen gezielt neue Eigenschaften zu erzeugen bzw. die bekannten Eigenschaften zu verbessern, sie führen aber nicht zur Neuentwicklung künstlicher Proteine.The functions of a polypeptide or protein on its conformation, which results from the amino acid sequence and possibly the composition of subunits. Within of a protein, certain amino acids are important for properties, such as specificity, the thermal stability and other demonstrable functions. Already exchanging one single nucleotide in the associated Gene can be used to incorporate an amino acid lead into the protein which either disrupts the normal functioning of the protein or improved a certain property. With the DNA recombination technique did it become possible to specifically alter nucleotides in a cloned gene or to replace and thus proteins with specific amino acids defined positions. Such a sequence specific Mutagenesis can be done using various techniques, such as error-prone PCR (Herlitze et al. (1990), Gene 91, 143-147; Cadwell et al. (1992), PCR Methods Appl. 2, 28-33), oligonucleotide-directed Mutagenesis (Hermes et al. (1989), Gene 84, 143-151) or DNA shuffling (Stemmer (1994) Proc. Natl. Acad. Sci. USA 91, 10747-10751). there must be a known natural Protein as long as repeated mutagenesis, functional screening and isolation and determination of the successful sequences be subjected until a clone with the desired properties is present. The selection of an amino acid to be exchanged is often based on this Knowledge of their role in working Protein. Receives this knowledge one by genetic studies or by X-ray structure analysis of the three-dimensional Structure of the protein. In this way it is possible to have specific centers or change specific areas. Thereby, for example, thermostability, pH tolerance, specificities and other characteristics of proteins that affect, for example play a role in industrial processes or analytical methods. Although these methods are suitable for existing proteins to specifically create new properties or the known properties to improve them lead but not for the new development of artificial proteins.

Es besteht aber ein grosser Bedarf an neuen, stabilen und funktionalen Proteinen mit neuen Aminosäuresequenzen und neuen Eigenschaften, so dass die „de novo" – Herstellung von Polypeptiden von grossem Interesse ist. Ein Versuch zu neuen Polypeptiden bzw. Proteinen zu gelangen ist das Protein-Design, bei dem die Kenntnisse über die physikalischen Eigenschaften, welche die Struktur der Proteine bestimmen, ausgenutzt werden, um Proteine mit einer gewünschten Struktur herzustellen. Ausgehend von bestimmten Mustern von beispielsweise hydrophoben und hydrophilen Resten in der Sequenz, Wasserstoffbrückenbindungen oder von bestimmten Aminosäuren bevorzugten Ausbildungen der Sekundärstruktur können Proteine erzeugt werden, die erwünschte Strukturen an einer beliebigen Position im gefalteten Protein aufweisen. Das Design erfolgt dabei am Computer mittels bestimmter Algorithmen, welche die sterischen Wechselwirkungen der Seitenketten auf der Grundlage des Verhaltens der einzelnen Moleküle und Atome berücksichtigen.But there is a great need of new, stable and functional proteins with new amino acid sequences and new properties, so that the "de novo" - production of polypeptides is of great interest. An attempt at new polypeptides or To get proteins is the protein design, which is the knowledge of the physical properties that determine the structure of the proteins, can be used to produce proteins with a desired structure. Based on certain patterns, for example hydrophobic and hydrophilic residues in the sequence, hydrogen bonds or of certain amino acids preferred designs of the secondary structure, proteins can be produced, the desired one Have structures at any position in the folded protein. The design is done on the computer using certain algorithms, which the steric interactions of the side chains on the Consider the basis of the behavior of the individual molecules and atoms.

Aus der WO 02/05146 A2 ist beispielsweise ein Verfahren zum automatisierten Design von Proteinen bekannt, welches die Erzeugung von Proteinbanken mit veränderter Immunogenität ermöglicht. Bei diesem Verfahren wird die Struktur des Grundgerüstes eines Zielproteins mit variablen Bereichen in einen Computer eingegeben, in dem dann ein Satz von abweichenden Aminosäure-Sequenzen erzeugt wird. Mittels einer spezifischen Software wird dieser Satz von Sequenzen hinsichtlich seiner erwarteten Immunspezifität gefiltert, so dass ein oder mehrere Proteine mit möglicherweise veränderter Immunogenität identifiziert werden. Diese Proteine können dann daraufhin untersucht werden, ob sie im Vergleich zum Zielprotein eine veränderte Immunogenität aufweisen. Dieses Verfahren ist zum einen sehr aufwendig und verlangt präzise Kenntnisse über die Struktur der Proteine und führt zum anderen nicht zur Erzeugung völlig neuer Aminosäure-Sequenzen bzw. Proteine, sondern lediglich zur Abwandlung bekannter Proteine.From WO 02/05146 A2, for example known a method for the automated design of proteins, which enables the generation of protein banks with altered immunogenicity. In this process, the structure of the basic structure becomes one Target protein with variable ranges entered into a computer, in which a set of different amino acid sequences is then generated. Using specific software, this set of sequences filtered for its expected immune specificity so that one or possibly having multiple proteins modified immunogenicity be identified. These proteins can then be examined whether they have a different immunogenicity compared to the target protein. On the one hand, this process is very complex and requires precise knowledge of the structure of proteins and leads on the other hand not to generate completely new amino acid sequences or proteins, but only for the modification of known proteins.

Aus der WO 01/59066 A2 ist ferner ein Verfahren zum automatisierten Design von Proteinen bekannt, das zur Erzeugung von gefilterten Proteinbanken führt. Bei diesem ebenfalls computergestützten Verfahren wird zunächst eine primäre Proteinbank, d.h. ein Satz aller möglicher Proteine, mit einer Liste primär varianter Sequenzen von Proteingerüsten erstellt. Diese primäre Bank kann beispielsweise durch den Sequenzvergleich verwandter Proteine, d.h. ein sogenanntes „sequence alignment", erzeugt werden. Bei diesen Proteinen muss es sich um Proteine handeln, deren dreidimensionale Struktur bekannt ist oder ermittelt werden kann. Der Sequenzvergleich führt zur Bestimmung von Sequenzabweichungen im Vergleich mit einer Zielstruktur. Diese Abweichungen in der Sequenz werden dann aufgelistet, um die primäre Bank festzulegen. Durch Variation und Neukombination der variablen Bereiche im Sequenzgerüst, beispielsweise durch shuffling oder error-prone PCR, kann aus der primären Bank eine sekundäre Bank erzeugt werden. Die Vielzahl der erzeugten Sequenzen kann dann synthetisiert und auf ihre Eigenschaften hin untersucht werden. Auch dieses, ebenfalls aufwendige, bekannte Verfahren führt nicht zur Erzeugung eines neuen Proteins, sondern lediglich zu einer Vielzahl möglicher Aminosäure-Sequenzen, die anschließend noch einem aufwendigen „Screening" unterworfen werden müssen.From WO 01/59066 A2 a method for the automated design of proteins is known which leads to the generation of filtered protein banks. In this likewise computer-aided method, a primary protein bank, ie a set of all possible proteins, is first created with a list of primarily variant sequences of protein scaffolds. This primary bank can be generated, for example, by the sequence comparison of related proteins, ie a so-called "sequence alignment". These proteins must be proteins whose three-dimensional structure is known or can be determined. The sequence comparison leads to the determination of sequence deviations in the Comparison with a target structure, these deviations in the sequence are then listed to determine the primary bank by variation and A new combination of the variable areas in the sequence framework, for example by shuffling or error-prone PCR, can be used to generate a secondary bank from the primary bank. The large number of sequences generated can then be synthesized and their properties examined. This, also complex, known method also does not lead to the production of a new protein, but rather only to a large number of possible amino acid sequences, which then have to be subjected to extensive "screening".

Ein Beispiel für den Bedarf an neuen Proteinen mit einer gewünschten Eigenschaft liegt auf dem Gebiet der autofluoreszenten Proteine. Seit der Klonierung des grünfluoreszierenden Proteins (GFP) aus der Qualle Aequorea victoria ist dieses ständig verändert und modifiziert worden, um eine Verbesserung der vorteilhaften Eigenschaften zu erzielen. Darüber hinaus wurden verstärkt neue fluoreszierende Proteine aus natürlichen Quellen, wie beispielsweise Anthozoen (Korallen), isoliert und charakterisiert (z.B. Matz et al. (1999), Nat. Biotechnol. 17, 969-973; Fradkov et al. (2000), FEBS Letters 479, 127-130). Eine solche Isolierung von neuen Proteinen aus natürlichen Quellen und deren anschließende Klonierung ist aber ebenfalls sehr aufwendig und kostenintensiv.An example of the need for new proteins with a desired one Property lies in the field of autofluorescent proteins. Since the cloning of the green fluorescent Proteins (GFP) from the jellyfish Aequorea victoria, this is constantly changing and has been modified to improve the beneficial properties to achieve. About that have also been reinforced new fluorescent proteins from natural sources, such as Anthozoa (corals), isolated and characterized (e.g. Matz et al. (1999), Nat. Biotechnol. 17, 969-973; Fradkov et al. (2000) FEBS Letters 479, 127-130). Such isolation of new proteins from natural Sources and their subsequent ones Cloning is also very complex and costly.

Die WO 01/34824 A2 zeigt einen Sequenzvergleich („alignment") verschiedener fluoreszierender Proteine aus Aequorea victoria, Ptilosarcus gurneyi und Renilla mulleri. Dieser Sequenzvergleich dient aber lediglich der Feststellung von Homologien der Proteine, d.h. der Ermittlung der relativen Ähnlichkeiten zwischen diesen Proteinen, und führt nicht zu einer neuen, vollständigen und funktionellen Aminosäure-Sequenz.WO 01/34824 A2 shows a sequence comparison ( "Alignment") different fluorescent proteins from Aequorea victoria, Ptilosarcus Gurneyi and Renilla Mulleri. However, this sequence comparison serves only the determination of homologies of the proteins, i.e. the Determination of the relative similarities between these proteins, and leads not a new, complete one and functional amino acid sequence.

Zusammenfassung der ErfindungSummary the invention

Es ist daher Aufgabe der Erfindung, ein Verfahren zur Verfügung zu stellen, das die Herstellung neuer, künstlicher und funktioneller Polypeptide mit mindestens einer nachweisbaren Funktion auf einfache Art und Weise ohne großen apparativen Aufwand ermöglicht. Es ist ferner Aufgabe der Erfindung neue, nach diesem Verfahren hergestellte künstliche Proteine zu schaffen.It is therefore an object of the invention a procedure is available to represent the manufacture of new, artificial and functional Polypeptides with at least one detectable function on simple Way without big apparatus expenditure allows. It is a further object of the invention to use this method manufactured artificial To create proteins.

Die Aufgabe wird erfindungsgemäß durch ein Verfahren gemäß Patentanspruch 1 und ein Protein gemäß Patentanspruch 11 gelöst. Vorteilhafte Ausgestaltungen der Erfindung bilden die Gegenstände der jeweiligen Unteransprüche.The object is achieved by a method according to claim 1 and a protein according to claim 11 solved. Advantageous embodiments of the invention form the subject of respective subclaims.

Bei dem erfindungsgemäßen Verfahren werden die Aminosäuresequenzen von zumindest drei bekannten Polypeptiden mit mindestens einer gemeinsamen Funktion dadurch verglichen, dass diese zunächst auf eine Weise nebeneinander angeordnet werden, dass sich gegebenenfalls unter Einführung von Lücken eine Übereinstimmung der Positionen von Invarianten Aminosäuren oder ähnlichen Bereichen für alle Polypeptide ergibt. Dabei können die Aminosäuresequenzen beispielsweise derart zueinander ausgerichtet werden, dass die höchstmögliche Anzahl identischer Aminosäuren in Bezug auf ihre jeweilige Position einander zugeordnet sind, wobei dies vorzugsweise unter Beibehaltung der jeweiligen Reihenfolge der Aminosäuren erfolgt. Ähnliche Bereiche sind hierbei alle Sequenzabschnitte, vorzugsweise ein Abschnitt von zumindest drei aufeinandertolgenden Aminosäuren, die eine im wesentlichen identische Primärstruktur aufweisen oder im gefalteten Protein eine Domäne bilden, deren Funktion bereits bekannt ist. Die ähnlichen Bereiche können bei unterschiedlichen Polypeptiden auch an unterschiedlichen Positionen liegen. In diesem Fall kann der Abgleich der ähnlichen Bereiche beispielsweise durch Einfügen von Lücken oder das Verschieben dieser Bereiche in der Sequenz erfolgen.In the method according to the invention become the amino acid sequences of at least three known polypeptides with at least one common Function compared in that these are initially next to each other in a way be arranged that, if necessary, with the introduction of Gaps a match the positions of invariants of amino acids or similar regions for all polypeptides results. You can the amino acid sequences for example, aligned with each other in such a way that the highest possible number identical amino acids are assigned to each other with respect to their respective position, wherein this preferably while maintaining the respective order of amino acids he follows. Similar Areas here are all sequence sections, preferably one section of at least three consecutive amino acids, one essentially identical primary structure have or form a domain in the folded protein, the function of which already is known. The similar Areas can with different polypeptides also at different positions lie. In this case, the comparison of the similar areas, for example by inserting of gaps or moving these areas in the sequence.

Mit Hilfe dieses Abgleichs der jeweiligen Positionen der ausgewählten Aminosäuresequenzen wird eine Durchschnitts-Sequenz über zumindest einen wesentlichen Teil der gesamten Länge der Aminosäuresequenz ermittelt. Dabei wird für jede gegebene Position diejenige Aminosäure ausgewählt, die in den zugrundeliegenden Aminosäuresequenzen an dieser Position am häufigsten auftritt, wobei eine Lücke wie eine Aminosäure behandelt wird. Hieraus ergibt sich eine Folge von Aminosäuren und Lücken mit dazwischen liegenden Positionen, an denen keine Aminosäure am häufigsten auftritt bzw. an denen zwei oder mehr Aminosäuren mit der gleichen Häufigkeit auftreten. An diesen Stellen muss nun eine Aminosäure nach zuvor festgelegten, sinnvollen, reproduzierbaren und allgemein gültigen Kriterien ausgewählt werden. Hierzu stellt das erfindungsgemäße Verfahren mehrere Möglichkeiten zur Verfügung.With the help of this comparison of the respective Positions of the selected amino acid sequences becomes an average sequence over at least a substantial part of the total length of the amino acid sequence determined. In doing so, for any given position, the amino acid selected in the underlying amino acid sequences most common at this position occurs with a gap like an amino acid is treated. This results in a sequence of amino acids and Gaps with intermediate positions where no amino acid is most common occurs or where two or more amino acids occur with the same frequency occur. An amino acid must now be added at these points previously defined, meaningful, reproducible and generally applicable criteria selected become. The method according to the invention provides several options for this to disposal.

Gemäß einer bevorzugten Ausführungsform der Erfindung wird eine Aminosäure an einer solchen Position dadurch ermittelt, dass zunächst vor dem Vergleich der Aminosäuresequenzen eine Rangfolge der zugrundeliegenden Polypeptide festgelegt wird, d.h. den einzelnen Polypeptiden werden Rangnummern von 1 bis n zugeordnet. Ist an einer Position die häufigste Aminosäure nicht eindeutig feststellbar, so wird diejenige Aminosäure eingesetzt, die unter den häufigsten Aminosäuren zu der Polypeptidsequenz gehört, die die niedrigste Rangnummer besitzt.According to a preferred embodiment the invention becomes an amino acid determined at such a position by first before the comparison of the amino acid sequences a ranking of the underlying polypeptides is determined, i.e. Rank numbers from 1 to n are assigned to the individual polypeptides. Is the most common at a position amino acid not clearly identifiable, the amino acid is used among the most common amino acids belongs to the polypeptide sequence, which has the lowest rank number.

Gemäß einer weiteren bevorzugten Ausführungsform der Endung wird eine Aminosäure an einer solchen Position dadurch ermittelt, dass die Aminosäuren aufgrund funktioneller und/oder struktureller Kriterien in Gruppen eingeteilt werden und bei mehreren Aminosäuren mit gleicher Häufigkeit eine Aminosäure aus der Gruppe ausgewählt wird, die an der jeweiligen Position am häufigsten auftritt.According to another preferred embodiment the ending becomes an amino acid determined at such a position that the amino acids due to functional and / or structural criteria divided into groups and with several amino acids with the same frequency an amino acid selected from the group that occurs most frequently at the respective position.

Gemäß einer weiteren bevorzugten Ausführungsform der Erfindung wird eine Aminosäure an einer solchen Position dadurch ermittelt, dass bei mehreren Aminosäuren mit gleicher Häufigkeit die Aminosäure aufgrund funktioneller und/oder struktureller Kriterien unter Berücksichtigung der Eigenschaften der bekannten Polypeptide ausgewählt wird.According to another preferred embodiment the invention becomes an amino acid determined at such a position that with several amino acids with same frequency the amino acid due considering functional and / or structural criteria the properties of the known polypeptides is selected.

Dabei kann beim Erstellen der Durchschnitts-Sequenz die Auswahl einer Aminosäure bei mehreren Aminosäuren mit gleicher Häufigkeit innerhalb einer Aminosäuresequenz auch aufgrund unterschiedlicher Kriterien erfolgen, d.h. die zuvor genannten Ausführungsformen können in vorteilhafter Weise miteinander kombiniert werden. Ferner können funktionelle und strukturelle Kriterien oder sonstige Kenntnisse über die bekannten Polypeptide auch die genannte Festlegung der Rangfolge der Aminosäure-Sequenzen vor deren Vergleich bedingen oder zumindest beeinflussen.You can do this when creating the average sequence the selection of an amino acid with several amino acids with the same frequency within an amino acid sequence also take place on the basis of different criteria, i.e. the before mentioned embodiments can can be combined with one another in an advantageous manner. Furthermore, functional and structural criteria or other knowledge of the known polypeptides also mentioned the ranking of the amino acid sequences condition or at least influence before comparing them.

Das erfindungsgemäße Verfahren ermöglicht überraschender Weise die Herstellung neuer Polypeptide, die sich in einem geigneten System exprimieren lassen und eine gewünschte Funktion aufweisen. Die zuvor beschriebenen Verfahrensschritte führen zu einer vollständigen, künstlichen Aminosäuresequenz, die mit hoher Wahrscheinlichkeit ein Polypeptid repräsentiert, welches die gemeinsame Funktion der ursprünglichen Polypeptide aufweist und in einem geeigneten System exprimierbar ist.The method according to the invention enables more surprising Way the production of new polypeptides, which are in a suitable Have the system expressed and have a desired function. The process steps described above lead to a complete, artificial Amino acid sequence which is very likely to represent a polypeptide, which has the common function of the original polypeptides and is expressible in a suitable system.

Zur Expression des Polypeptids und zum Nachweis der gewünschten Funktion wird zunächst eine künstliche Nukleinsäure-Sequenz, die für die ermittelte Durchschnitts-Sequenz kodiert, erstellt und zumindest ein entsprechendes Nukleinsäure-Molekül synthetisiert. Dieses Nukleinsäure-Molekül wird mit einem geeigneten Promotor verbunden und das Polypeptid dann in einem geeigneten System exprimiert. Das erfindungsgemäße Verfahren führt also zu einem neuen, vollständig funktionsfähigen Polypeptid bzw. Protein, das die gewünschte Eigenschaft aufweist. Das Verfahren kann dabei einfach und ohne grossen apparativen Aufwand durchgeführt werden. Ferner wird bei dem erfindungsgemäßen Verfahren nicht lediglich ein bekanntes Protein verändert, sondern dieses geht vielmehr von mehreren bekannten Polypeptiden aus, so dass die positiven Eigenschaften der verschiedenen Polypeptide in dem neuen Protein vereint werden können.For expression of the polypeptide and to prove the desired Function will be first an artificial one Nucleic acid sequence, the for the determined average sequence is encoded, created and at least one corresponding nucleic acid molecule synthesized. This nucleic acid molecule comes with a suitable promoter and then the polypeptide in one appropriate system expressed. The method according to the invention thus leads to a new, complete functional Polypeptide or protein that has the desired property. The method can be carried out easily and without great expenditure on equipment. Furthermore, the method according to the invention is not merely changes a known protein, rather, this is based on several known polypeptides out so the positive properties of different polypeptides can be combined in the new protein.

In einer bevorzugten Ausführungsform wird dabei die Durchschnitts-Sequenz vor dem Erstellen der künstlichen Nukleinsäure-Sequenz am N-Terminus und/oder C-Terminus durch Austausch zumindest einer Aminosäure modifiziert. Zum Erreichen einer optimalen Kozak-Region im Bereich des Start-Codons kann beispielsweise nach der Startaminosäure Methionin die zusätzliche Aminosäure Valin eingeführt werden. Am C-Terminus kann ferner beispielsweise die zusätzliche hydrophile Aminosäure Serin angefügt werden, um die Löslichkeit des Proteins zu verbessern.In a preferred embodiment is the average sequence before creating the artificial Nucleic acid sequence at the N-terminus and / or C-terminus modified by exchanging at least one amino acid. To reach an optimal Kozak region in the area of the start codon, for example after the start amino acid Methionine the additional amino acid Valine introduced become. At the C-terminus, for example, the additional hydrophilic amino acid Added serine become solubility to improve the protein.

In besonders vorteilhafter Ausgestaltung des erfindungsgemäßen Verfahrens ist vorgesehen, dass anschließend, d.h. nach Erstellung und Expression der Durchschnitts-Sequenz, in dem künstlichen Nukleinsäure-Molekül zumindest ein Codon ausgetauscht und/oder durch Mutagenese verändert wird und hierdurch zumindest eine Aminosäure der Durchschnitts-Sequenz ausgetauscht wird. Durch den Austausch einer oder mehrerer Aminosäuren können bestimmte Eigenschaften des künstlichen Polypeptids, wie beispielsweise Stabilität, Löslichkeit, Kompatibilität oder Funktionalität, in vorteilhafter Weise verändert werden. Dabei kann insbesondere die gewünschte Funktion, d.h. die gemeinsame Funktion der ursprünglichen bekannten Polypeptide, gezielt beeinflusst bzw. verbessert werden.In a particularly advantageous embodiment of the method according to the invention it is envisaged that i.e. after creation and expression of the average sequence, in the artificial Nucleic acid molecule at least a codon is exchanged and / or changed by mutagenesis and thereby at least one amino acid of the average sequence is exchanged. By exchanging one or more amino acids, certain Properties of the artificial Polypeptides, such as stability, solubility, compatibility or functionality, in an advantageous Way changed become. The desired function, i.e. the common Function of the original known polypeptides can be influenced or improved in a targeted manner.

In weiterer Ausgestaltung des erfindungsgemäßen Verfahrens ist vorgesehen, dass das Polypeptid nach der Expression isoliert und/oder aufgereinigt wird, damit es der weiteren Verwendung in geeigneter Form zugeführt werden kann.In a further embodiment of the method according to the invention it is intended that the polypeptide be isolated after expression and / or cleaned up so that it can be used in supplied in a suitable form can be.

In besonders vorteilhafter Ausgestaltung des erfindungsgemäßen Verfahrens ist vorgesehen, dass als bekannte Polypeptide Aminosäuresequenzen fluoreszierender Proteine bzw. Polpeptide ausgewählt werden, und dass die mindestens eine gemeinsame Funktion Fluoreszenz ist. Auf diese Weise können neue fluoreszierende Proteine hergestellt werden, ohne dass bisher unbekannte natürliche Proteine mit viel Aufwand isoliert und kloniert werden müssen.In a particularly advantageous embodiment of the method according to the invention it is provided that amino acid sequences are known as polypeptides fluorescent proteins or polpeptides are selected, and that the at least a common function is fluorescence. In this way, new ones fluorescent proteins can be produced without previously unknown natural Proteins have to be isolated and cloned with a lot of effort.

Die Aufgabe wird ferner durch ein künstliches Protein mit mindestens einer nachweisbaren Funktion gelöst, das in dem zuvor beschriebenen Verfahren hergestellt wurde. Die Erfindung umfasst dabei ferner jedes isolierte oder künstliche Nukleinsäuremolekül, welches für dieses künstliches Protein kodiert. Es können also beispielsweise neue autofluoreszente Proteine bereitgestellt werden, die aufgrund ihrer Fluoreszenz in Zellen nachweisbar sind und daher als Marker für die Genexpression und die Proteinlokalisation beispielsweise in der Zell-, Entwicklungs- und Molekularbiologie verwendet werden können. Dabei können die erfindungsgemäßen Proteine auch teilweise neue Eigenschaften aufweisen, wie beispielsweise die Regenerierbarkeit der Fluoreszenz nach deren Ausbleichen mittels Bestrahlung mit Licht bestimmter Wellenlänge.The task is further enhanced by a artificial Protein with at least one detectable function solved, the was made in the previously described process. The invention further includes any isolated or artificial nucleic acid molecule which for this artificial Encodes protein. It can for example, new autofluorescent proteins are made available which are detectable in cells due to their fluorescence and therefore as a marker for gene expression and protein localization, for example in cell, developmental and molecular biology can. You can the proteins of the invention also sometimes have new properties, such as the regenerability of the fluorescence after its fading by means of Irradiation with light of a certain wavelength.

Die Erfindung schließt auch Vektoren zur Expression eines Polypeptids in einem geeigneten System ein, welche solche Nukleinsäuremoleküle in exprimierbarer Form enthalten.The invention also includes Vectors for the expression of a polypeptide in a suitable system, which such nucleic acid molecules are more expressible Form included.

Im Rahmen der Erfindung werden auch Zellen und Kits, welche das erfindungsgemäße Protein, das entsprechende Nukleinsäuremolekül und/oder den genannten Vektor enthalten, zur Verfügung gestellt.Also within the scope of the invention Cells and kits containing the protein according to the invention, the corresponding one Nucleic acid molecule and / or contain the vector mentioned.

Es werden ferner pharmazeutische Zusammensetzungen geschaffen, welche das erfindungsgemäße Protein, das entsprechende Nukleinsäuremolekül und/oder den genannten Vektor, sowie vorzugsweise übliche Hilfs- und/oder Trägerstoffe enthalten.Furthermore, pharmaceutical compositions are created which contain the protein according to the invention, the corresponding nucleic acid molecule and / or the vector mentioned, and preferably che contain auxiliaries and / or carriers.

Kurze Beschreibung der AbbildungenShort description of the pictures

Die Erfindung wird im weiteren anhand der Figuren beispielhaft näher erläutert.The invention is further illustrated the figures by way of example explained.

1 zeigt einen Vergleich der Aminosäuresequenzen von 9 fluoreszierenden Proteinen (FPs), bei dem die Sequenzen derart untereinander angeordnet sind, dass sich unter Einführung von Lücken eine optimale Übereinstimmung von Invarianten Aminosäuren oder ähnlichen Bereichen für alle Polypeptide ergibt. Dabei wurden den einzelnen FPs jeweils Rangnummern zugeordnet:
Rangnummer 1: Aequorea victoria GFP
Rangnummer 2: Zoanthus sp. zFP506
Rangnummer 3: Zoanthus sp. zFP538
Rangnummer 4: Discosoma striata dsFP483
Rangnummer 5: Discosoma sp. "red" dsFP583
Rangnummer 6: Anemonia majano amFP486
Rangnummer 7: Clavularia sp. cFP484
Rangnummer 8: Renilla mulleri GFP
Rangnummer 9: Ptilosarcus gurneyi GFP
1 shows a comparison of the amino acid sequences of 9 fluorescent proteins (FPs), in which the sequences are arranged in such a way that, with the introduction of gaps, there is an optimal match of invariant amino acids or similar regions for all polypeptides. Rank numbers were assigned to the individual FPs:
Rank 1: Aequorea victoria GFP
Rank 2: Zoanthus sp. zFP506
Rank 3: Zoanthus sp. zFP538
Rank 4: Discosoma striata dsFP483
Rank 5: Discosoma sp. "red" dsFP583
Rank 6: Anemonia majano amFP486
Rank 7: Clavularia sp. cFP484
Rank 8: Renilla mulleri GFP
Rank 9: Ptilosarcus gurneyi GFP

Hieraus wurde die Durchschnitts-Sequenz bzw. durch das Einfügen zusätzlicher Modifikationen das Durchschnitts-FP gemäß dem erfindungsgemäßen Verfahren ermittelt.This became the average sequence or by inserting additional Modifications the average FP according to the inventive method determined.

  • a) Aminosäure-Positionen 1 bis 53a) Amino acid positions 1 to 53
  • b) Aminosäure-Positionen 54 bis 109b) amino acid positions 54 to 109
  • c) Aminosäure-Positionen 110 bis 164c) amino acid positions 110 to 164
  • d) Aminosäure-Positionen 165 bis 222d) amino acid positions 165 to 222
  • e) Aminosäure-Positionen 223 bis 234e) amino acid positions 223 to 234

Die Nummerierung der Positionen bezieht sich hier auf die ermittelte Durchschnitts-Sequenz. An den Stellen, an denen in der Durchschnitts-Sequenz eine Lücke vorliegt, werden die Positionen nicht fortlaufend nummeriert, sondern mit den Zusätzen „b" bzw. „c" versehen. Ausnahmen hiervon bilden lediglich die Positionen 1b und 226b, an denen im Durchschnitts-FP gegenüber der ermittelten Durchschnitts-Sequenz zusätzliche Aminosäuren eingefügt sind.The numbering of the positions relates here on the determined average sequence. In the places at which there is a gap in the average sequence, the positions not consecutively numbered, but with the additions "b" or "c". Exceptions to this are only positions 1b and 226b compared to those in the average FP additional amino acids are inserted into the determined average sequence.

2 zeigt eine schematische Darstellung des Aufbaus der Plasmide, die zur Durchführung des erfindungsgemäßen Verfahrens und zur Expression der beschriebenen fluoreszierenden Proteine in Escherichia coli und Säugetierzellen verwendet werden. 2 shows a schematic representation of the structure of the plasmids which are used to carry out the method according to the invention and to express the fluorescent proteins described in Escherichia coli and mammalian cells.

3 zeigt fluoreszenzmikroskopische Bilder von NIH3T3-Zellen, die mit Expressionsplasmiden für verschiedene Mutageneseprodukte der erfindungsgemäßen Polypeptide transfiziert wurden. A: 9 Stunden nach Transfektion, B: 24 Stunden nach Transfektion. 3 shows fluorescence microscopic images of NIH3T3 cells that were transfected with expression plasmids for various mutagenesis products of the polypeptides according to the invention. A: 9 hours after transfection, B: 24 hours after transfection.

4 zeigt fluoreszenzmikroskopische Bilder von NIH3T3-Zellen (Fluoreszein-Filtersatz) nach Transfektion mit einem Expressionsplasmid für ein Mutageneseprodukt eines erfindungsgemäß hergestellten Proteins (p2A9-c15m3). A: Aufnahme 6 Stunden nach Transfektion bei Bestrahlung mit Fluoreszein-Anregungsfilter, B: Aufnahme nach 10 Sekunden Bestrahlung mit Fluoreszein-Anregungsfilter, C: Aufnahme nach 2 Sekunden Bestrahlung mit DAPI-Anregungsfilter zur Regeneration und anschließender Bestrahlung mit Fluoreszein-Anregungsfilter. 4 shows fluorescence microscopic images of NIH3T3 cells (fluorescein filter set) after transfection with an expression plasmid for a mutagenesis product of a protein produced according to the invention (p2A9-c15m3). A: Recording 6 Hours after transfection with irradiation with fluorescein excitation filter, B: image after 10 seconds irradiation with fluorescein excitation filter, C: image after 2 seconds irradiation with DAPI excitation filter for regeneration and subsequent irradiation with fluorescein excitation filter.

5 zeigt fluoreszenzmikroskopische Bilder von Escherichia coli – Zellen (DH5), die mit je 7,1 μg eines Plasmids ohne fluoreszierendes Protein (pMCS5, Negativkontrolle; A) und eines Expressionplasmids (pExpAcFP; B), welches das Gen für das Durchschnitts-FP enthält, transformiert wurden. Von einer ÜN-Kultur der transformierten Zellen wurden jeweils 2 ml pelletiert, der Überstand dekantiert, das Pellet mit dem letzten Tropfen resuspendiert und von dieser Suspension jeweils 10 μl auf einen Objektträger mit Deckgläschen gegeben. 5 shows fluorescence microscopic images of Escherichia coli cells (DH5), each containing 7.1 μg of a plasmid without fluorescent protein (pMCS5, negative control; A) and an expression plasmid (pExpAcFP; B) which contains the gene for the average FP, were transformed. 2 ml of a culture of the transformed cells were pelleted, the supernatant was decanted, the pellet was resuspended with the last drop and 10 μl of this suspension were placed on a slide with a cover slip.

6 zeigt ein Flussdiagramm einer besonderen Ausführungsform des erfindungsgemäßen Verfahrens, bei der den Aminosäuresequenzen der bekannten Polypeptide Rangnummern von 1 bis n zugeordnet werden und die Auswahl der Aminosäuren bzw. Lücken an einer variablen Position mit mehreren Aminosäuren oder Lücken gleicher Häufigkeit anhand der Rangnummern vorgenommen wird. 6 shows a flow diagram of a particular embodiment of the method according to the invention, in which the amino acid sequences of the known polypeptides are assigned rank numbers from 1 to n and the selection of the amino acids or gaps is carried out at a variable position with several amino acids or gaps of the same frequency using the rank numbers.

Beschreibung der Erfindungdescription the invention

Das nachfolgende Beispiel dient der näheren Erläuterung der Erfindung, ohne diese jedoch auf die beispielhaft offenbarten Stoffe und Verfahren zu beschränken.The following example serves the closer explanation of the invention, but without this to the examples disclosed Restrict substances and processes.

Beispiel: Herstellung eines künstlichen autofluoreszenten Polypeptids Für die Herstellung eines künstlichen autofluoreszenten Proteins nach dem oben beschriebenen Verfahren wurden die Aminosäuresequenzen der folgenden natürlich vorkommenden Polypeptide, die als gemeinsame Funktion Autofluoreszenz aufweisen, unter Festlegung einer Rangfolge zugrundegelegt:
Rangnummer 1: Aequorea victoria GFP
Rangnummer 2: Zoanthus sp. zFP506
Rangnummer 3: Zoanthus sp. zFP538
Rangnummer 4: Discosoma striata dsFP483
Rangnummer 5: Discosoma sp. "red" dsFP583
Rangnummer 6: Anemonia majano amFP486
Rangnummer 7: Clavularia sp. cFP484
Rangnummer 8: Renilla mulleri GFP
Rangnummer 9: Ptilosarcus gurneyi GFP
Example: Production of an Artificial Autofluorescent Polypeptide For the production of an artificial autofluorescent protein according to the method described above, the amino acid sequences zen of the following naturally occurring polypeptides, which have auto-fluorescence as a common function, based on a ranking:
Rank 1: Aequorea victoria GFP
Rank 2: Zoanthus sp. zFP506
Rank 3: Zoanthus sp. zFP538
Rank 4: Discosoma striata dsFP483
Rank 5: Discosoma sp. "red" dsFP583
Rank 6: Anemonia majano amFP486
Rank 7: Clavularia sp. cFP484
Rank 8: Renilla mulleri GFP
Rank 9: Ptilosarcus gurneyi GFP

Die Anordnung der Aminosäuresequenzen erfolgte zunächst in Form eines „alignments", bei dem unter Einführung von Lücken eine Übereinstimmung der Positionen von Invarianten Aminosäuren für alle Polypeptide erzielt wurde, wobei die Aminosäuresequenzen derart zueinander ausgerichtet wurden, dass unter Beibehaltung der jeweiligen Reihenfolge der Aminosäuren die höchstmögliche Anzahl identischer Aminosäuren in Bezug auf ihre jeweilige Position einander zugeordnet sind (vgl. Matz et al. (1999), Nature Biotechnol. 17, 969-973). Die Aminosäuresequenzen von Renilla mulleri GFP und Ptilosarcus gurneyi GFP wurden dann hierzu ergänzend unter Berücksichtigung offensichtlich invarianter Aminosäuren angefügt (siehe 1 a–e). Die sich aus dieser Anordnung ergebende Folge der jeweils eindeutig häufigsten Aminosäuren wurde an den übrigen Positionen durch diejeinige der häufigsten Aminosäuren ergänzt, die an dieser Position die höchste Rangnummer besitzt. Die daraus resultierende Durchschnitts-Sequenz wurde daraufhin sowohl am N-Terminus als auch am C-Terminus modifiziert. Zum Erreichen einer optimalen Kozak-Region im Bereich des Start-Codons wurde nach der Startaminosäure Methionin die zusätzliche Aminosäure Valin eingeführt. Am C-Terminus wurde die zusätzliche hydrophile Aminosäure Serin angefügt, um die Löslichkeit des Proteins nicht durch einen hydrophoben C-Terminus zu erschweren. Für diese Polypeptidsequenz (Seq ID No. 1) wurde nun eine kodierende DNA-Sequenz (Seq ID No. 2) entworfen unter Berücksichtigung der Codons, die in Säugetierzellen besonders häufig auftreten. Für die Klonierung des gewünschten FP-Gens (FP = Fluoreszierendes Protein) in das Expressionsplasmid pExpA wurden 12 teilkomplementäre DNA-Oligonukleotide (Seq ID Nos. 3–14) verwendet, aus denen in zwei aufeinanderfolgenden PCR-Reaktionen das gesamte FP-Gen amplifiziert wurde. Durch anschließenden Restriktionsverdau mit den Restriktionsenzymen Xba I und Not I wurde ein DNA-Fragment erhalten, das nach Ligation mit dem Xba I / Not I Fragment von pExpA das Expressionplasmid pExpA-cFP ergab (siehe 2A). Dieses führt nach Transformation von Escherichia coli – Zellen (DH5) zu Ampicillinresistenten Bakterienkolonien, die im Fluoreszenzmikroskop unter Verwendung von Fluoreszenzfiltern, die Fluoreszenzmoleküle mit Licht im blauen Wellenlängenbereich von 460 nm bis 505 nm anregen und emittiertes Licht im grünen Wellenlängenbereich von 510 nm bis 560 nm passieren lassen (Filtersatz für Fluoreszein), eine grüne Fluoreszenz zeigen (siehe 5B), während bei der entsprechenden Negativkontrolle keine Fluoreszenz detektiert werden konnte (siehe 5A). Bereits für das unmittelbar aus dem Verfahren hervorgegangene Durchschnitts-FP (Seq ID Nr. 1) konnte also Autofluoreszenz nachgewiesen werden, ohne das hierzu eine anschließende Mutagenese notwendig gewesen wäre.The amino acid sequences were initially arranged in the form of an "alignments", in which, with the introduction of gaps, the positions of invariants of amino acids were matched for all polypeptides, the amino acid sequences being aligned with one another in such a way that the highest possible order while maintaining the respective order of the amino acids Number of identical amino acids are assigned to one another in relation to their respective position (cf. Matz et al. (1999), Nature Biotechnol. 17, 969-973). The amino acid sequences of Renilla mulleri GFP and Ptilosarcus gurneyi GFP were then additionally evident, taking into account added invariant amino acids (see 1 a-e). The sequence of the clearly most common amino acids resulting from this arrangement was supplemented at the other positions by that of the most common amino acids which has the highest ranking number at this position. The resulting average sequence was then modified at both the N-terminus and the C-terminus. To achieve an optimal Kozak region in the area of the start codon, the additional amino acid valine was introduced after the start amino acid methionine. The additional hydrophilic amino acid serine was added to the C-terminus in order not to complicate the solubility of the protein with a hydrophobic C-terminus. A coding DNA sequence (Seq ID No. 2) has now been designed for this polypeptide sequence (Seq ID No. 1), taking into account the codons that occur particularly frequently in mammalian cells. For the cloning of the desired FP gene (FP = fluorescent protein) into the expression plasmid pExpA, 12 partially complementary DNA oligonucleotides (Seq ID Nos. 3-14) were used, from which the entire FP gene was amplified in two successive PCR reactions , Subsequent restriction digestion with the restriction enzymes Xba I and Not I resulted in a DNA fragment which, after ligation with the Xba I / Not I fragment from pExpA, gave the expression plasmid pExpA-cFP (see 2A ). After transformation of Escherichia coli cells (DH5), this leads to ampicillin-resistant bacterial colonies, which in a fluorescence microscope using fluorescence filters excite the fluorescence molecules with light in the blue wavelength range from 460 nm to 505 nm and emitted light in the green wavelength range from 510 nm to 560 nm let pass (filter set for fluorescein), show a green fluorescence (see 5B ), while no fluorescence could be detected in the corresponding negative control (see 5A ). It was therefore possible to detect auto-fluorescence for the average FP (Seq ID No. 1) that arose directly from the method, without the need for a subsequent mutagenesis.

6 verdeutlicht in einem Flussdiagramm nochmals die Durchführung des erfindungsgemäßen Verfahrens gemäß dem zuvor beschriebenen Ausführungsbeispiel. 6 once again illustrates in a flow chart the implementation of the method according to the invention in accordance with the exemplary embodiment described above.

Zur Funktionsoptimierung durch Mutagenese des so erhaltenen autofluoreszenten Gens wurden mehrere Strategien angewendet. Zunächst wurden ausgehend von pExpA-cFP mittels PCR Mutationen in das FP-Gen eingeführt. Dies geschah unter Verwendung von Primern, die so gewählt waren, dass sie mit pExPA-cFP in Bereichen außerhalb der kodierenden Sequenz hybridisierten, jedoch so, dass die Erkennungssequenzen für die Restriktionsenzyme Xba I und Not I noch enthalten waren. Dies ermöglichte eine Zufallsmutagenese über den gesamten kodierenden Bereich. Die PCR wurde in Gegenwart von Mn2+-Ionen durchgeführt, was zu einer erwünschten Erhöhung der Fehlerrate der verwendeten Taq-DNA Polymerase führt. Die so erhaltenen PCR-Produkte wurden mit Xba I und Not I verdaut und anschließend mit dem passenden Fragment von pExpA ligiert und in Eschenchia coli – Zellen (DH5) transformiert. Von den Ampicillin-resistenten Kolonien wurden die bei Betrachtung im Fluoreszenzmikroskop deutlich helleren ausgewählt. Die Helligkeitsverbesserung wurde durch nochmalige Transformation in Eschenchia coli – Zellen verifiziert und die Plasmid-DNA präpariert und die Sequnz des FP-Gens ermittelt.Several strategies were used to optimize the function by mutagenesis of the autofluorescent gene obtained in this way. Initially, mutations were introduced into the FP gene from PCR using pExpA-cFP. This was done using primers that were selected to hybridize with pExPA-cFP in areas outside the coding sequence, but in such a way that the recognition sequences for the restriction enzymes Xba I and Not I were still included. This allowed for random mutagenesis across the entire coding area. The PCR was carried out in the presence of Mn 2+ ions, which leads to a desired increase in the error rate of the Taq DNA polymerase used. The PCR products obtained in this way were digested with Xba I and Not I and then ligated with the appropriate fragment of pExpA and transformed into Eschenchia coli cells (DH5). Of the ampicillin-resistant colonies, those that were significantly lighter when viewed under a fluorescence microscope were selected. The improvement in brightness was verified by repeated transformation in Eschenchia coli cells, the plasmid DNA was prepared and the sequence of the FP gene was determined.

In einer weiteren Mutagenese wurden die verbesserten pExpA-cFP Plasmide kombiniert und abermals in Gegenwart von Mn2+-Ionen amplifiziert. Diesmal wurden die restriktionsverdauten PCR-Produkte jedoch mit dem Xba I und Not I geschnittenen p2A9-Fragment ligiert, um Plasmide zu erhalten, die sich für die Expression sowohl in Escherichia coli Zellen, als auch in Säugetierzellen eignen.In a further mutagenesis, the improved pExpA-cFP plasmids were combined and amplified again in the presence of Mn 2+ ions. This time, however, the restriction digested PCR products were ligated with the Xba I and Not I cut p2A9 fragment in order to obtain plasmids which are suitable for expression both in Escherichia coli cells and in mammalian cells.

Alternativ wurden PCR-Reaktionen durchgeführt, um speziell die N- und Cterminalen Bereiche zu verändern. Der 5'-Primer hybridisierte mit dem FP-Gen und enthielt anstelle der ersten 6 Codons an 18 Positionen eine Mischung aller 4 Basen, ebenso der 3'-Primer anstelle der letzten 6 Codons, sodass im translatierten Protein am N- und C- Terminus eine Zufallsfolge von 6 beliebigen Aminosäuren entstand. Diese PCR-Produkte wurden ebenfalls mit Xba I und Not I verdaut und mit dem entsprechenden Fragment von p2A9 ligiert.Alternatively, PCR reactions were carried out to specifically change the N and C terminal areas. The 5 'primer hybridized with the FP gene and contained a mixture of all 4 bases instead of the first 6 codons at 18 positions, as did the 3' primer instead of the last 6 codons, so that in the translated Pro A random sequence of any 6 amino acids was formed at the N and C terminus. These PCR products were also digested with Xba I and Not I and ligated to the corresponding fragment of p2A9.

In einem dritten Ansatz wurden ausgewählte Codons durch PCR mit teilhomologen Primern gezielt mutiert, um einzelne Aminosäurecodons auszutauschen. Auch hier wurden die erhaltenen PCR-Produkte mit Xba I und Not I verdaut und mit dem entsprechenden p2A9-Fragment ligiert. Aus allen drei Ansätzen wurden nach der Ligation und anschließender Transformation von Eschenchia coll Zellen (DH5) 48 Kolonien ausgewählt, die eine hohe Helligkeit in der Fluoreszenz aufwiesen, und die Plasmid-DNA präpariert. Diese wurde daraufhin in einem Folgexperiment in -NIH3T3-Zellen transformiert, um diejenigen Klone für eine Sequenzierung auszuwählen, die bei Transfektion dieser Zellen zu einer höheren Fluoreszenz führen.In a third approach, selected codons specifically mutated by PCR with partially homologous primers to single amino acid codons exchange. Here too, the PCR products obtained were treated with Xba I and Not I digested and ligated to the corresponding p2A9 fragment. From all three approaches were after the ligation and subsequent transformation of Eschenchia coll cells (DH5) selected 48 colonies that have high brightness in the fluorescence, and the plasmid DNA prepared. This was then carried out in a follow-up experiment in -NIH3T3 cells transformed to select those clones for sequencing that lead to higher fluorescence when these cells are transfected.

Klonierung der ExpressionsplasmideCloning the expression plasmids

Für die Expression der oben genannten Proteine in geeigneten Escherichia coli Zellen wurden Plasmide konstruiert, die eine kodierende Sequenz für FP (FP = Fluoreszierendes Protein) unter der Kontrolle des lac-Promoters enthalten (pExpAcFP, siehe 2A). Die Plasmide wurden durch Modifikation von pMCS5 (MoBiTec, Göttingen, Deutschland) hergestellt. pMCS5 ist ähnlich aufgebaut wie pBluescript SK(–) (Stratagene) und unterscheidet sich von diesem nur im 5'-Bereich der kodierenden Sequenz für das IacZα-Fragment. pMCS5 besitzt daher den lac-Promoter und nachgeschaltet den lac-Operator, wodurch die Expression einer eingefügten kodierenden Sequenz von der Abwesenheit von aktivem lac-Repressor abhängt. Um in jedem Fall in Escherichia coli – Zellen eine konstitutive Expression zu erreichen, wurde pMCS5 so modifiziert, dass der lac-Operator nicht mehr enthalten ist. An dessen Stelle wurde das frühe mRNA Polyadenylierungssignal aus SV40 eingesetzt, um ein Umkonstruieren dieses Expressionsplasmides für Escherichia coli in ein Expressionsplasmid für Säugetierzellen vorzubereiten (p2A9-cFP, siehe 2B). Dieses geschah durch zusätzliches Einfügen von regulatorischen Promotersequenzen, die eine Expression des nachgeschalteten Gens in Säugetierzellen hervorrufen. Als besonders wirksam erwies sich eine Kombination aus dem vollständigen „unmittelbar-frühen" Promoter des Cytomegalovirus (CMV), gefolgt von einem 100 Basenpaaren langen Fragment des lac-Promoters aus Escherichia coli sowie dem 180 Basenpaar langen 3'-Ende des „unmittelbar-frühen" CMV-Promoters. Diese Fragmente wurden jeweils per PCR mit Primern hergestellt, die zusätzlich zu den homologen Bereichen Erkennungssequenzen für Restriktionsenzyme enthielten. Für das Einfügen der künstlichen FP Gene wurden zwischen dem kombinierten Promoter und der Polyadenylierungssequenz Erkennunsstellen für die Restriktionsenzyme Xba I und Not I eingefügt.For the expression of the above-mentioned proteins in suitable Escherichia coli cells, plasmids were constructed which contain a coding sequence for FP (FP = fluorescent protein) under the control of the lac promoter (pExpAcFP, see 2A ). The plasmids were produced by modification of pMCS5 (MoBiTec, Göttingen, Germany). pMCS5 has a similar structure to pBluescript SK (-) (Stratagene) and differs from it only in the 5 'region of the coding sequence for the IacZα fragment. pMCS5 therefore has the lac promoter and, downstream, the lac operator, whereby the expression of an inserted coding sequence depends on the absence of an active lac repressor. In order to achieve constitutive expression in Escherichia coli cells in each case, pMCS5 was modified in such a way that the lac operator is no longer included. In its place the early mRNA polyadenylation signal from SV40 was used to prepare a reconstruction of this expression plasmid for Escherichia coli into an expression plasmid for mammalian cells (p2A9-cFP, see 2 B ). This was done by additionally inserting regulatory promoter sequences which cause expression of the downstream gene in mammalian cells. A combination of the complete "immediately early" cytomegalovirus (CMV) promoter, followed by a 100 base pair fragment of the lac promoter from Escherichia coli and the 180 base pair 3 'end of the "immediate early" proved to be particularly effective "CMV promoters. These fragments were each prepared by PCR using primers which, in addition to the homologous regions, contained recognition sequences for restriction enzymes. For the insertion of the artificial FP genes, recognition sites for the restriction enzymes Xba I and Not I were inserted between the combined promoter and the polyadenylation sequence.

Versuchsbeschreibung: Die Expression von FP in Säugetierzellen führt zu Autofluoreszenz der Zellen:Experiment description: Die Expression of FP in mammalian cells leads to Autofluorescence of the cells:

NIH3T3-Zellen (adhärent, 2,5 × 105 Zellen pro Vertiefung in 12-Loch Schale, bis zur 70 – 80 %igen Konfluenz kultiviert) wurden mit 1 μg Vektor-DNA mit Exgene (MBI Fermentas) transfiziert. Die Plasmide p2A9-c15m2 (Seq ID No. 15), p2A9-c15m3 (Seq ID No. 17), p2A9-c15m12 (Seq ID No. 19) und p2A9-c15m48 (Seq 1D No. 21) enthielten verschieden mutierte Gene, c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) und c15m48 (Seq ID No. 22), für das FP (FP = Fluoreszierendes Protein) unter der Kontrolle eines kombinierten Promoters, der zur konstitutiven Expression des nachgeschalteten Gens in Escherichia coli Zellen und Säugetierzellen führt. Nach 9 (siehe 3A) bzw. 24 Stunden (siehe 3B) wurden die Zellen im Fluoreszenzmikroskop analysiert. Unter Verwendung von Fluoreszenzfiltern, die Fluoreszenzmoleküle mit Licht im blauen Wellenlängenbereich von 460 nm bis 505 nm anregen und emittiertes Licht im grünen Wellenlängenbereich von 510 nm bis 560 nm passieren lassen (Filtersatz für Fluoreszein), konnten bei allen Zellen, die mit FP oder mutierten FP enthaltenden Plasmiden transfiziert waren, eine grüne Fluoreszenz beobachtet werden.NIH3T3 cells (adherent, 2.5 × 10 5 cells per well in a 12-well dish, cultured to 70-80% confluence) were transfected with 1 μg vector DNA with Exgene (MBI Fermentas). The plasmids p2A9-c15m2 (Seq ID No. 15), p2A9-c15m3 (Seq ID No. 17), p2A9-c15m12 (Seq ID No. 19) and p2A9-c15m48 (Seq 1D No. 21) contained different mutated genes, c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) and c15m48 (Seq ID No . 22), for the FP (FP = fluorescent protein) under the control of a combined promoter, which leads to the constitutive expression of the downstream gene in Escherichia coli cells and mammalian cells. To 9 (please refer 3A ) or 24 hours (see 3B ) the cells were analyzed in a fluorescence microscope. Using fluorescence filters that excite fluorescence molecules with light in the blue wavelength range from 460 nm to 505 nm and allow emitted light in the green wavelength range from 510 nm to 560 nm to pass (filter set for fluorescein), all cells with FP or mutated FP containing plasmids were transfected, green fluorescence can be observed.

Versuchsbeschreibung: Die Autofluoreszenz von FP bleicht aus und läßt sich durch Bestrahlung mit ultraviolettem Licht regenerieren:Experiment description: Die FP autofluorescence fades and can be irradiated with Regenerate ultraviolet light:

NIH3T3-Zellen (adhärent, 2,5 × 105 Zellen pro Vertiefung in 12-Loch Schale, bis zur 70 – 80 %igen Konfluenz kultiviert) wurden mit 1 μg Vektor-DNA mit Exgene (MBI Fermentas) transfiziert. Das Plasmid p2A9-c15m3 enthielt ein mutiertes Gen c15m3 für FP (FP = Fluoreszierendes Protein) unter der Kontrolle eines kombinierten Promoters, der zur konstitutiven Expression des nachgeschalteten Gens in Escherichia coli Zellen und Säugetierzellen führt. Nach 6 Stunden wurden die Zellen im Fluoreszenzmikroskop analysiert. Unter Verwendung von Fluoreszenzfiltern, die Fluoreszenzmoleküle mit Licht im blauen Wellenlängenbereich von 460 nm bis 505 nm anregen und emittiertes Licht im grünen Wellenlängenbereich von 510 nm bis 560 nm passieren lassen (Filtersatz für Fluoreszein), konnten bei Zellen, die mit diesem mutierten FP enthaltenden Plasmid transfiziert waren, eine grüne Fluoreszenz beobachtet werden (siehe 4A). Diese Fluoreszenz schwächte sich während der Betrachtung innerhalb weniger Sekunden bis zum fast völligen Verschwinden ab (siehe 4B). Nach Bestrahlung des Sichtfeldes mit kurzwelligem Licht im sichtbaren blauen bis ultravioletten Bereich (320 nm bis 400 nm, DAPI – Anregungsfilter) läßt sich die Fluoreszenz mit dem Fluoreszein-Filtersatz wieder beobachten (siehe 4C), d.h sie konnte mit dem kürzerwelligen Licht regeneriert werden. Dieses mutierte FP kann also beispielsweise zum Nachweis von zeitabhängigen zellulären Prozessen, wie Proteindiffusion oder -transport, oder zur optischen Informationsspeicherung verwendet werden.NIH3T3 cells (adherent, 2.5 × 10 5 cells per well in a 12-well dish, cultured to 70-80% confluence) were transfected with 1 μg vector DNA with Exgene (MBI Fermentas). The plasmid p2A9-c15m3 contained a mutated gene c15m3 for FP (FP = fluorescent protein) under the control of a combined promoter, which leads to the constitutive expression of the downstream gene in Escherichia coli cells and mammalian cells. After 6 hours, the cells were analyzed in a fluorescence microscope. Using fluorescence filters that excite fluorescence molecules with light in the blue wavelength range from 460 nm to 505 nm and let emitted light in the green wavelength range from 510 nm to 560 nm pass (filter set for fluorescein), cells that contained this mutant FP-containing plasmid could green fluorescence was observed (see 4A ). This fluorescence diminished within a few seconds until almost completely disappearing (please refer 4B ). After irradiation of the field of view with short-wave light in the visible blue to ultraviolet range (320 nm to 400 nm, DAPI - excitation filter), the fluorescence can be observed again with the fluorescein filter set (see 4C ), ie it could be regenerated with the shorter-wave light. This mutated FP can thus be used, for example, for the detection of time-dependent cellular processes, such as protein diffusion or transport, or for optical information storage.

Vergleich der Aminosäureseguenzen des Durchschnitts-FP und dessen Mutanten mit den bekannten fluoreszierenden Proteinen:Comparison of the amino acid sequences of the average FP and its mutants with the known fluorescent proteins:

Tabelle 1 zeigt die Unterschiede in der Aminosäure-Sequenz zwischen den einzelnen modifizierten Proteinen cFP2, cFP3, cFP12 und cFP48, die durch die mutierten Gene c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) und c15m48 (Seq ID No. 22) kodiert werden, im Vergleich mit dem Durchschnitts-FP (D-FP). Die Nummerierung der Aminosäure-Positionen ist dabei derjenigen der Durchschnitts-Sequenz gemäß 1 entnommen. Hieraus ergeben sich Abweichungen der einzelnen Proteine in Bezug auf das Durchschnitts-FP zwischen 6 % und 8 %, d.h. relative Ähnlichkeiten zwischen 92 und 94 % (Tabelle 2). Dagegen zeigt Tabelle 2, dass die Unterschiede der neuen nach dem erfindungsgemäßen Verfahren hergestellten fluoreszierenden Proteine zu den bekannten Proteinen, die Ausgangspunkt für die Ermittlung der Durchschnitts-Sequenz waren, relativ hoch sind. Es ergeben sich hier lediglich Sequenz-Homologien zwischen 32 % und 69 %. Es konnte mit dem erfindungsgemäßen Verfahren also auf einfache und kostengünstige Weise eine völlig neue Gruppe von Aminosäure-Sequenzen bzw. Proteinen hergestellt werden, die deutliche Autofluoreszenz zeigen und vorteilhafte Anwendungsmöglichkeiten bieten. Darüber hinaus konnte eine zusätzliche Funktion bzw. vorteilhafte Eigenschaft in den nach dem erfindungsgemäßen Verfahren hergestellten Proteinen erzeugt werden.Table 1 shows the differences in the amino acid sequence between the individual modified proteins cFP2, cFP3, cFP12 and cFP48, which are caused by the mutated genes c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) and c15m48 (Seq ID No. 22), in comparison with the average FP (D-FP). The numbering of the amino acid positions is that of the average sequence 1 taken. This results in deviations of the individual proteins in relation to the average FP between 6% and 8%, ie relative similarities between 92 and 94% (Table 2). In contrast, Table 2 shows that the differences between the new fluorescent proteins produced by the process according to the invention and the known proteins, which were the starting point for determining the average sequence, are relatively high. There are only sequence homologies between 32% and 69%. With the method according to the invention it was thus possible to produce a completely new group of amino acid sequences or proteins in a simple and cost-effective manner, which show clear autofluorescence and offer advantageous possible uses. In addition, an additional function or advantageous property could be generated in the proteins produced by the method according to the invention.

Liste der verwendeten Abkürzungen:List of abbreviations used:

Außer den im Duden gebräuchlichen, wurden folgende Abkürzungen verwendet:
CMV Cytomegalovirus
C-Terminus C-terminales Ende einer Aminosäuresequenz
DNA Desoxyribonukleinsäure
FACS Fluoreszenz-aktivierte Zellsortierung (fluorescence activated cell sorting)
FP fluoreszierendes Protein
GFP grün-fluoreszierendes Protein (green fluorescent protein)
nm Nanometer (Einheit der Wellenlänge)
N-Terminus N-terminales Ende einer Aminosäuresequenz
PCR Polymerase-Kettenreaktion (polymerase chain reaction)
Seq ID Nr. Sequenz-Identifikationsnummer (gemäß Sequenzprotokoll)
SV40 Simian Virus 40
μg Mikrogramm

Figure 00200001
Figure 00210001
Tabelle 2: Relative Ähnlichkeiten der fluoreszierenden Proteine in Prozent bezogen auf die jeweiligen Aminosäuresequenzen. In addition to those used in Duden, the following abbreviations were used:
CMV cytomegalovirus
C-terminus C-terminal end of an amino acid sequence
DNA deoxyribonucleic acid
FACS fluorescence activated cell sorting
FP fluorescent protein
GFP green fluorescent protein
nm nanometer (unit of wavelength)
N-terminus N-terminal end of an amino acid sequence
PCR polymerase chain reaction
Seq ID No. Sequence identification number (according to sequence listing)
SV40 Simian Virus 40
μg microgram
Figure 00200001
Figure 00210001
Table 2: Relative similarities of the fluorescent proteins in percent based on the respective amino acid sequences.

(D-FP = Durchschnitts-FP;
cFP2, cFP3, cFP12 und cFP48 = Mutierte D-FP – Klone) SEQUENZPROTOKOLL

Figure 00220001
Figure 00230001
Figure 00240001
Figure 00250001
Figure 00260001
Figure 00270001
Figure 00280001
Figure 00290001
Figure 00300001
Figure 00310001
Figure 00320001
Figure 00330001
Figure 00340001
(D-FP = average FP;
cFP2, cFP3, cFP12 and cFP48 = mutated D-FP clones) SEQUENCE LISTING
Figure 00220001
Figure 00230001
Figure 00240001
Figure 00250001
Figure 00260001
Figure 00270001
Figure 00280001
Figure 00290001
Figure 00300001
Figure 00310001
Figure 00320001
Figure 00330001
Figure 00340001

Claims (16)

Verfahren zur Herstellung eines künstlichen Polypeptids mit mindestens einer nachweisbaren Funktion, gekennzeichnet durch die folgenden Schritte, a) Vergleich der Aminosäuresequenzen von zumindest drei bekannten Polypeptiden, die mindestens eine gemeinsame Funktion aufweisen, b) Abgleich der Positionen der invarianten Aminosäuren oder ähnlichen Bereiche der Aminosäuresequenzen durch gegenseitige Ausrichtung und/oder Einfügen von zumindest einer Lücke in eine oder mehrere Aminosäuresequenzen zur Herstellung einer Übereinstimmung der Positionen der invarianten Aminosäuren oder ähnlichen Bereiche, c) Erstellen einer Durchschnitts-Sequenz über zumindest einen wesentlichen Teil der gesamten Länge der Aminosäuresequenz, wobei die jeweils häufigste Aminosäure an der jeweiligen Position ausgewählt wird oder, bei mehreren Aminosäuren mit gleicher Häufigkeit, eine dieser Aminosäuren aufgrund zuvor festgelegter Kriterien ausgewählt wird, wobei eine Lücke jeweils wie eine Aminosäure behandelt wird, d) Erstellen einer künstlichen Nukleinsäure-Sequenz, die für die Durchschnitts-Sequenz aus Schritt c) kodiert, und Synthese zumindest eines entsprechenden Nukleinsäure-Moleküls, e) Verbinden des Nukleinsäure-Moleküls aus Schritt d) mit einem geeigneten Promotor und Expression des Polypeptids in einem geeigneten System.Method for producing an artificial polypeptide with at least one detectable function, characterized by the following steps, a) Comparison of the amino acid sequences of at least three known polypeptides which have at least one common function, b) comparison of the positions of the invariant amino acids or similar regions of the amino acid sequences by mutual alignment and / or insertion of at least one gap in one or more amino acid sequences to produce a Correspondence of the positions of the invariant amino acids or similar regions, c) creating an average sequence over at least a substantial part of the entire length of the amino acid sequence, the most common amino acid being selected at the respective position or, in the case of several amino acids with the same frequency, one of these Amino acids is selected on the basis of previously defined criteria, a gap being treated like an amino acid, d) creating an artificial nucleic acid sequence which codes for the average sequence from step c), and synt hese at least one corresponding nucleic acid molecule, e) connecting the nucleic acid molecule from step d) with a suitable promoter and expression of the polypeptide in a suitable system. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Aminosäuresequenzen in Schritt b), vorzugsweise unter Beibehaltung der jeweiligen Reihenfolge der Aminosäuren, derart zueinander ausgerichtet werden, dass die höchstmögliche Anzahl identischer Aminosäuren in Bezug auf ihre jeweilige Position einander zugeordnet sind.A method according to claim 1, characterized in that the amino acid sequences in step b), preferably while maintaining the respective order of amino acids, aligned with each other in such a way that the maximum number possible identical amino acids are assigned to each other with respect to their respective position. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in Schritt c) eine Rangfolge der Aminosäuresequenzen festgelegt wird, wodurch den einzelnen Aminosäuresequenzen Rangnummern von 1 bis n zugeordnet werden, und dass bei mehreren Aminosäuren mit gleicher Häufigkeit die Aminosäure mit der niedrigsten Rangnummer für die Durchschnitts-Sequenz ausgewählt wird.A method according to claim 1 or 2, characterized in that in step c) a ranking of the amino acid sequences is determined, whereby the individual amino acid sequences Rank numbers from 1 to n can be assigned, and that with several amino acids with the same frequency the amino acid with the lowest rank number for selected the average sequence becomes. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in Schritt c) die Aminosäuren aufgrund funktioneller und/oder struktureller Kriterien in Gruppen eingeteilt werden und bei mehreren Aminosäuren mit gleicher Häufigkeit eine Aminosäure aus der Gruppe ausgewählt wird, die an der jeweiligen Position am häufigsten auftritt.A method according to claim 1 or 2, characterized in that in step c) the amino acids based on functional and / or structural criteria in groups be classified and with several amino acids with the same frequency an amino acid selected from the group that occurs most frequently at the respective position. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in Schritt c) bei mehreren Aminosäuren mit gleicher Häufigkeit die Aminosäure aufgrund funktioneller und/oder struktureller Kriterien unter Berücksichtigung der Eigenschaften der bekannten Polypeptide ausgewählt wird.A method according to claim 1 or 2, characterized in that in step c) with several amino acids with the same frequency the amino acid based on functional and / or structural criteria the properties of the known polypeptides is selected. Verfahren nach einem oder mehreren der Ansprüche 3 bis 5, dadurch gekennzeichnet, dass beim Erstellen der Durchschnitts-Sequenz die Auswahl einer Aminosäure bei mehreren Aminosäuren mit gleicher Häufigkeit innerhalb einer Aminosäuresequenz aufgrund unterschiedlicher Kriterien erfolgt.Method according to one or more of claims 3 to 5, characterized in that that when creating the averaging sequence, choosing one amino acid with several amino acids with the same frequency within an amino acid sequence based on different criteria. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die Durchschnittssequenz aus Schritt c) vor der Durchführung von Schritt d) am N-Terminus und/oder C-Terminus durch Austausch zumindest einer AS modifiziert wird.Method according to one of claims 1 to 6, characterized in that that the average sequence from step c) before performing Step d) at least at the N-terminus and / or C-terminus by exchange an AS is modified. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass in dem Nukleinsäure-Molekül aus Schritt d) nach Durchführung von Schritt e) zumindest ein Codon ausgetauscht und/oder durch Mutagenese verändert wird und hierdurch zumindest eine Aminosäure der Durchschnitts-Sequenz ausgetauscht wird.Method according to one of claims 1 to 7, characterized in that that in the nucleic acid molecule from step d) after implementation from step e) at least one codon is exchanged and / or by mutagenesis changed and thereby at least one amino acid of the average sequence is exchanged. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass das Polypeptid nach Schritt e) isoliert und/oder aufgereinigt wird.Method according to one of claims 1 to 8, characterized in that that the polypeptide is isolated and / or purified after step e) becomes. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass für Schritt a) Aminosäuresequenzen fluoreszierender Proteine ausgewählt werden, und dass die mindestens eine gemeinsame Funktion Fluoreszenz ist.Method according to one of claims 1 to 9, characterized in that that for Step a) amino acid sequences fluorescent proteins selected and that the at least one common function is fluorescence is. Künstliches Protein, mit mindestens einer nachweisbaren Funktion, hergestellt in dem Verfahren nach einem der Ansprüche 1 bis 10.artificial Protein, with at least one demonstrable function in the method according to one of claims 1 to 10. Isoliertes oder künstliches Nukleinsäuremolekül, welches für das Protein gemäß Anspruch 11 kodiert.Isolated or artificial Nucleic acid molecule, which for the Protein according to claim 11 coded. Vektor zur Expression eines Polypeptids in einem geeigneten System, dadurch gekennzeichnet, dass dieser das Nukleinsäuremolekül nach Anspruch 12 in exprimierbarer Form enthält.Vector for the expression of a polypeptide in a suitable system, characterized in that this contains the nucleic acid molecule according to claim 12 in expressible form. Zelle, welche das Protein nach Anspruch 11, das Nukleinsäuremolekül nach Anspruch 12 und/oder den Vektor nach Anspruch 13 enthält.Cell comprising the protein of claim 11, the nucleic acid molecule of claim 12 and / or contains the vector according to claim 13. Kit, welches das Protein nach Anspruch 11, das Nukleinsäuremolekül nach Anspruch 12 und/oder den Vektor nach Anspruch 13 enthält.Kit comprising the protein of claim 11, the nucleic acid molecule of claim 12 and / or contains the vector according to claim 13. Pharmazeutische Zusammensetzung, welche das Protein nach Anspruch 11, das Nukleinsäuremolekül nach Anspruch 12 und/oder den Vektor nach Anspruch 13, sowie vorzugsweise übliche Hilfs- und/oder Trägerstoffe enthält.A pharmaceutical composition comprising the protein of claim 11, the nucleic acid molecule according to claim 12 and / or the vector according to claim 13, and preferably conventional auxiliary and / or carriers contains.
DE2002133047 2002-07-19 2002-07-19 Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence Withdrawn DE10233047A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE2002133047 DE10233047A1 (en) 2002-07-19 2002-07-19 Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence
PCT/DE2003/002437 WO2004016649A2 (en) 2002-07-19 2003-07-19 Method for the production of an artificial polypeptide and artificial proteins produced by said method
AU2003254630A AU2003254630A1 (en) 2002-07-19 2003-07-19 Method for the production of an artificial polypeptide and artificial proteins produced by said method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2002133047 DE10233047A1 (en) 2002-07-19 2002-07-19 Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence

Publications (1)

Publication Number Publication Date
DE10233047A1 true DE10233047A1 (en) 2004-02-26

Family

ID=30774928

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2002133047 Withdrawn DE10233047A1 (en) 2002-07-19 2002-07-19 Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence

Country Status (3)

Country Link
AU (1) AU2003254630A1 (en)
DE (1) DE10233047A1 (en)
WO (1) WO2004016649A2 (en)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6117679A (en) * 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
DE69810603T2 (en) * 1997-04-11 2003-11-13 California Inst Of Techn DEVICE AND METHOD FOR AUTOMATIC PROTEIN DESIGN
NZ330940A (en) * 1997-07-24 2000-02-28 F Production of consensus phytases from fungal origin using computer programmes
AU774334B2 (en) * 1998-10-16 2004-06-24 Xencor Protein design automation for protein libraries
ES2278463T3 (en) * 1998-12-08 2007-08-01 Biovation Limited METHOD TO REDUCE THE IMMUNOGENICITY OF PROTEINS.
CA2390011A1 (en) * 1999-11-10 2001-05-17 Rigel Pharmaceuticals, Inc. Methods and compositions comprising renilla gfp
DE60113381T2 (en) * 2000-02-10 2006-06-29 Xencor, Monrovia AUTOMATION IN PROTEIN DICE BY PROTEIN LIBRARIES
AU2001278898A1 (en) * 2000-07-10 2002-01-21 Xencor Method for disigning protein libraries with altered immunogenicity

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
[u. a.]: A method für soluble overexpression of the alpha7 nicotinic acetylcoline receptor extracellular domain. 2001. In: PNAS, Vol. 98, S. 3567-3570. *
CORRINGER, P. *
FISCHER, M. *
FISCHER, M.; CORRINGER, P.; SCHOTT, K.; [u. a.]: A method für soluble overexpression of the alpha7 nicotinic acetylcoline receptor extracellular domain. 2001. In: PNAS, Vol. 98, S. 3567-3570.
Internet-Recherche am 10. 04. 2003: <http://www. bimcore.emory.edu/home/MolModeling.html>Molecular Modelling mit Anhang für das "Tutorial" Homology Modelling 09. 2000
Internet-Recherche am 10. 04. 2003: <http://www. bimcore.emory.edu/home/MolModeling.html>Molecular Modelling mit Anhang für das "Tutorial" Homology Modelling 09. 2000 *
SCHOTT, K. *

Also Published As

Publication number Publication date
AU2003254630A8 (en) 2004-03-03
WO2004016649A2 (en) 2004-02-26
WO2004016649A3 (en) 2004-04-22
AU2003254630A1 (en) 2004-03-03

Similar Documents

Publication Publication Date Title
DE69635653T2 (en) PEPTIDES AS VECTORS FOR INTRA-CELLULAR ADDRESSING OF ACTIVE MOLECULES
DE69839425T2 (en) NUCLEIC ACID BINDING PROTEINS
EP1270725B1 (en) Anticalines
DE69922032T2 (en) METHOD FOR PRODUCING INSERTION MUTANTS
DE3486216T2 (en) Hybrid DNA synthesis of mature insulin-like growth factors.
DE69721282T2 (en) IN VITRO TRANSPOSITION SYSTEM USING A MODIFIED TN5 TRANSPOSASE
DE3588168T2 (en) Apoaequorin peptides, recombinant DNA vectors capable of expressing them and microorganisms containing these vectors
DE69032743T2 (en) MANUFACTURE OF FUSION PROTEINS
DE69227519T2 (en) DNA SEQUENCES ENCODING THE POLYPEPTIDE GELONIN
DE112006003608T5 (en) A method of presenting target proteins at the cell surface using Bacillus Anthracis Exosporium
DE69533443T2 (en) THE MANUFACTURE OF BIOLOGICALLY ACTIVE, RECOMBINANT AND NEUROTROPHIC PROTEIN
DE60021188T2 (en) MODIFIED HUMAN GRANULOCYTE COLONY STIMULATING FACTOR AND METHOD FOR THE PRODUCTION THEREOF
DE69222749T2 (en) STREPTOLYSIN O DERIVATE
EP1025253A1 (en) Positive-negative selection for homologous recombination
EP0453969B1 (en) Process for production of stranger protein in streptomycetes
DE3485923T2 (en) DNA GENE, METHOD FOR THE PRODUCTION THEREOF AND PLASMIDE CONTAINING THIS GENE.
DE69128877T2 (en) Pig somatotropins with modifications in the area of Alpha Helix 1 and combinations with other mutations
DE68923496T2 (en) Process for the production of motilin-like polypeptides and its expression.
DE69331434T2 (en) Mutant AOX2 promoter, vector containing this, transformed cells and production of heterologous proteins
DE3881123T2 (en) Cloning of DNA encoding an antibacterial polypeptide precursor and expression of the precursor.
DE10233047A1 (en) Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence
EP0161629A1 (en) Signal peptide for the excretion of polypeptides in Streptomycetes
DE3786947T2 (en) Microbiological process for the production of a protein by culturing a mutant bacterial strain.
WO2004016648A1 (en) Fluorescent protein
DE102010036997A1 (en) LOV domains Protein for photosensitive defunctionalization

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8139 Disposal/non-payment of the annual fee