Nothing Special   »   [go: up one dir, main page]

DE69836971T2 - Methode und apparat zur vorhersage von funktionellen proteindomänen, methode zur verbesserung der proteinfunktion, sowie funktionell verbessertes protein - Google Patents

Methode und apparat zur vorhersage von funktionellen proteindomänen, methode zur verbesserung der proteinfunktion, sowie funktionell verbessertes protein Download PDF

Info

Publication number
DE69836971T2
DE69836971T2 DE69836971T DE69836971T DE69836971T2 DE 69836971 T2 DE69836971 T2 DE 69836971T2 DE 69836971 T DE69836971 T DE 69836971T DE 69836971 T DE69836971 T DE 69836971T DE 69836971 T2 DE69836971 T2 DE 69836971T2
Authority
DE
Germany
Prior art keywords
amino acid
protein
oligopeptide
length
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69836971T
Other languages
English (en)
Other versions
DE69836971D1 (de
Inventor
Hirofumi Funabashi-shi DOI
Hideaki Hiraki
Akio Tsukuba-shi KANAI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP01924897A external-priority patent/JP3679536B2/ja
Priority claimed from JP1924997A external-priority patent/JP3801714B2/ja
Priority claimed from JP33210097A external-priority patent/JP3880173B2/ja
Priority claimed from JP01869998A external-priority patent/JP3792039B2/ja
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Publication of DE69836971D1 publication Critical patent/DE69836971D1/de
Application granted granted Critical
Publication of DE69836971T2 publication Critical patent/DE69836971T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft ein Verfahren zur Voraussage einer funktionellen Stelle eines Proteins, ein System zur Voraussage ihrer Funktion und ein Verfahren zur Modifizierung der Funktion eines Proteins und ein funktions-modifiziertes Protein. Spezieller betrifft die vorliegende Erfindung die Voraussage einer funktionellen Stelle eines Proteins ohne eine durch Genom-Analyse oder cDNA-Analyse erhaltene Information über die Funktion und die Voraussage einer neuen Funktion oder einer neuen funktionellen Stelle eines Proteins mit einer bekannten Funktion. Die vorliegende Erfindung betrifft ferner die Voraussage einer zu modifizierenden Stelle eines Proteins, um die Funktion des Proteins zu verbessern, und ein Protein mit einer modifizierten Funktion auf der Basis dieser Voraussage.
  • Hintergrund der Erfindung
  • Im Anschluss an den Fortschritt der Genom-Analyse und cDNA-Analyse verschiedener Organismen, einschließlich pathogener Mikroorganismen, nimmt die Anzahl neuer Gene, deren Funktionen unbekannt sind, zusammen mit der Anzahl der von den Genen codierten Proteine schnell zu. Bisher wurde die Analyse der Nukleotidsequenz des gesamten Genoms eines Mikroorganismus, beispielsweise Mycoplasma genitalium (Fraser et al., Science 270, 397-403, 1995), Haemophilus influenzae (Fleischman et al., Science 269, 496-512, 1995) und Methanococcus jannaschii (Bult et al., Science 273, 1058-1073, 1996) abgeschlossen, so dass zahlreiche neue Proteine, die anhand der Genom-Sequenz vorausgesagt worden waren, entdeckt wurden. Für Menschen und Mäuse ist die cDNA-Analyse in Kombination mit der Genom-Analyse im Gange, welches die Entdeckung einer großen Anzahl neuer Proteine mit sich bringt.
  • Unter diesen Umständen wurde die Voraussage der Funktion eines Proteins ohne Information bezüglich der Funktion oder einer funktionellen Stelle ein wichtiges Thema. Wenn nicht nur ein neues Protein, sondern auch eine neue Funktion oder eine neue funktionelle Stelle eines Proteins mit einer bekannten Funktion entdeckt wird, ist möglicherweise zu bestimmen, ob diese Proteine für eine industrielle oder klinische Anwendung von Wert sind. Ferner ermöglicht eine solche Voraussage der Funktion möglicherweise die Herstellung eines modifizierten Proteins mit einer weiter verbesserten Funktion.
  • Ob ein Protein, das von einem durch Genom-Analyse oder cDNA-Analyse aufgeklärten Gen codiert wird, neu ist oder eine bekannte Funktion hat, wurde herkömmlicherweise mittels Suche nach Homologie durch Proteindatenbanken wie Swiss-Prot festgestellt. Zur Voraussage einer funktionellen Stelle werden zusätzlich funktionell identische Proteine, abgeleitet von verschiedenen Organismen, aus einer Proteindatenbank extrahiert und dann einer Zuordnung unterworfen, um eine Region zu identifizieren, welche bei ihnen gemeinsam konserviert ist, und die konservierte Region als funktionelle Stelle vorauszusagen.
  • Jedoch kann ein solches Zuordnungsverfahren nachteiliger Weise nicht verwendet werden, falls ein durch Genom-Analyse oder cDNA-Analyse erhaltenes Protein ein absolut neues Protein ist. Sogar wenn das Protein mit bekannten Proteinen in einer Proteindatenbank homolog war, umfasst die konservierte Region den größten Teil der Aminosäuresequenz des Proteins in dem Falle, dass das Protein zu aus eng verwandten Organismen abgeleiteten Proteinen homolog ist, so dass es unmöglich ist, die funktionelle Stelle vorauszusagen. Hinsichtlich der Modifizierung eines Proteins wird im allgemeinen die Funktion eines Proteins potenziell beeinträchtigt sobald die konservierte Region modifiziert ist, unabhängig davon, ob die Funktion bekannt oder unbekannt ist, selbst wenn die funktionelle Stelle durch Zuordnung vorausgesagt wird. Dementsprechend sollten die Aminosäurereste außerhalb der konservierten Region modifiziert werden, um die Funktion zu verbessern. Mit anderen Worten, es ist erforderlich, eine neue funktionelle Stelle in einem solchen zu modifizierenden Protein aufzufinden. Unter Verwendung des herkömmlichen Zuordnungsverfahrens kann nachteiliger Weise eine neue funktionelle Stelle nicht entdeckt werden oder es kann nicht vorausgesagt werden, welcher Aminosäurerest modifiziert werden sollte.
  • Die vorliegende Erfindung wurde unter Berücksichtigung dieser Situation realisiert. Eine Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines neuen Verfahrens zur Voraussage einer funktionellen Stelle eines Proteins ohne eine durch Genom-Analyse oder cDNA-Analyse erhaltene Information über die Funktion.
  • Eine weitere Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines Systems zur Voraussage der Funktion eines Proteins.
  • Ferner besteht eine Aufgabe der vorliegenden Erfindung in der Bereitstellung eines Verfahrens zur Voraussage einer neuen funktionellen Stelle eines Proteins mit einer unbekannten Funktion oder mit einer bekannten Funktion und Unterwerfung der funktionellen Stelle einer Mutation, um ein modifiziertes Protein herzustellen.
  • Eine noch weitere Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines Proteins mit einer mit dem oben beschriebenen Verfahren modifizierten Funktion.
  • Offenbarung der Erfindung
  • Eine erste Erfindung der vorliegenden Anmeldung ist ein Verfahren zur Voraussage einer funktionellen Stelle eines Proteins, abgeleitet von den gesamten mutmaßlichen Proteinen eines Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, welches Verfahren die Schritte umfasst:
    • (1) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a", und Feststellen der kleinsten Länge (n) von Oligopeptiden, welche die folgenden Kriterien erfüllen: Unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen vorkommen; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, größer als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen vorkommen;
    • (2) Berechnen der Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1), welches ein Teil der Aminosäuresequenz der Länge (L) des Proteins als Gegenstand zur Voraussage einer funktionellen Stelle ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-1) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält, in den gesamten Proteinen des Organismus "a"; Aj-Oligopeptid: aj1aj2....Aji....ajnaj (n+1)(worin 1 ≤ i ≤ n+1; Aj = Aji; und Aj der i-te Rest des Oligopeptids ist), und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1), Xi-Oligopeptid: aj1aj2....Xi....ajnaj (n+1)(worin der i-te Rest Xi irgendeine Aminosäure ist),
    • (3) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids,
    • (4) Berechnen des Mittelwerts Yj des Yji;
      Figure 00030001
    • (5) Berechnen des Funktionswerts Zj von Yj; Zj = f(Yj) (worin die Funktion feine monoton abnehmende Funktion oder eine monoton zunehmende Funktion ist), und Definieren des Zj-Werts als repräsentativen Wert der Funktion des j-ten Aminosäurerests Aj der Aminosäuresequenz der Länge (L) und
    • (6) Wiederholen der Schritte (2) bis (5) nacheinander und Bestimmen des Zj-Werts eines jeden Aj aller Aminosäurereste an den Positionen zwischen n+1 ≤ j ≤ L-n in der Aminosäuresequenz der Länge (L), wodurch der Grad der Beteiligung eines jeden Aminosäurerests an der Funktion des Proteins vorausgesagt wird durch Verwendung der Dimension des Zj-Werts als Indikator.
  • Eine zweite Erfindung ist ein Verfahren zur Voraussage einer funktionellen Stelle eines Proteins, abgeleitet von den gesamten mutmaßlichen Proteinen eines Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, welches Verfahren die Schritte umfasst:
    • (1) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a",
    • (2) bezüglich eines Proteins des Organismus "a", (2') Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids einer gegebenen Länge (n) (1 ≤ n ≤ M, mit der Maßgabe, dass M die kleinste Länge von Oligopeptiden ist, welche das Kriterium erfüllen, dass alle Oligopeptide der Länge M mit einer Häufigkeit 1 des Auftretens vorliegen), welches Aj-Oligopeptid ein Teil der Aminosäuresequenz der Länge (L) des Proteins ist und einen Aminosäurerest Aj (n ≤ j ≤ L-n+1) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....aji....ajn(worin 1 ≤ i ≤ n+1; Aj = aji; und Aj der i-te Rest des Oligopeptids ist), und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n) entsprechend der Länge des Aj-Oligopeptids; Xi-Oligopeptid: aj1aj2....Xi....ajn(worin der i-te Rest Xi irgendeine Aminosäure ist),
    • (3) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids,
    • (4) Berechnen des Mittelwerts Y(j,n) des Yji;
      Figure 00050001
    • (5) Berechnen des Funktionswerts Z(j,n) von Y(j,n); Z(j,n) = –log(Y(j,n)),
    • (6) Wiederholen der Schritte (2') bis (5) nacheinander und Bestimmen des Z(j,n)-Werts eines jeden Aminosäurerests Aj an der j-ten Position (n ≤ j ≤ L-n+1) in der Aminosäuresequenz der Länge (L),
    • (7) Wiederholen der Schritte (2) bis (6) nacheinander für die gesamten Proteine des Organismus "a", wodurch die Verteilung des Z(j,n)-Werts eines jeden Aminosäurerests in den gesamten Proteinen bestimmt wird und die Z(j,n)-Werte in 20 gemäß den 20 Aminosäuren klassifiziert werden, und dann Berechnen des Mittelwerts Av(As) der Z(j,n)-Werte für jede Aminosäure As und der Standardabweichung Sd(As) von deren Verteilung, um auf Basis der Verteilung eine Funktion g für den j-ten Aminosäurerest Aj eines Proteins für die Normalisierung der Differenz in der Verteilung aufgrund der Spezies von Aminosäureresten zu berechnen; g = (Z(j,n), Aj) = [Z(j,n) – Av(As)]/Sd(As) (worin Aj = As),
    • (8) Berechnen eines Werts D(j,n) der Funktion g eines jeden Aj aller Aminosäurereste an der j-ten Position (n ≤ j ≤ L-n+1) eines Proteins in den gesamten Proteinen, wie in Schritt (7) gewonnen; D(j,n) = g(Z(j,n),Aj), und
    • (9) Definieren des repräsentativen Werts der Funktion des j-ten Aminosäurerests in der Aminosäuresequenz der Länge (L) als Funktionswert Wj von Z(j,n) und D(j,n); Wj = h(Z(j,1),z(j,2),....,z(j,M),D(j,1),D(j,2)....,D(j,M))und dadurch Voraussagen des Grades der Beteiligung eines jeden Aminosäurerests an der Funktion des Proteins durch Verwendung der Dimension des Wj-Werts als Indikator.
  • Eine dritte Erfindung ist ein System zur automatischen Durchführung des Verfahrens nach Anspruch 1, wobei das System mindestens die folgenden Einheiten (a) bis (g) umfasst;
    • (a) eine äußere Speichereinheit, welche die Aminosäuresequenzdaten der gesamten mutmaßlichen Proteine des Organismus "a", von dem Genomdaten oder cDNA-Daten bekannt sind, speichert, sowie eine existierende Proteindatenbank,
    • (b) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU (Zentralen Prozessierungseinheit), welche die Häufigkeit des Auftretens einer jeden Aminosäure und die Häufigkeit des Auftretens individueller Oligopeptide, gebildet von Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse,
    • (c) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche die kleinste Länge (n) von Oligopeptiden berechnet, welche unter den individuellen Oligopeptiden, von denen die Häufigkeiten des Auftretens in der Einheit (b) gespeichert sind, die folgenden Kriterien erfüllen: unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten, größer als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten, und einer Speichereinheit mit der Speicherung der (n),
    • (d) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1) berechnet, das ein Teil der Aminosäuresequenz der Länge (L) des Proteins als Gegenstand zur Voraussage einer funktionellen Stelle ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-n) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....Aji....ajnaj (n+1)(worin 1 ≤ i ≤ n+1; Aj = Aji; und Aj der i-te Rest des Oligopeptids ist), und in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1) berechnet; Xi-Oligopeptid: aj1aj2....Xji....ajnaj (n+1)(worin der i-te Rest Xji irgendeine Aminosäure ist), und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse,
    • (e) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche das Verhältnis Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids berechnet, und einer Speichereinheit mit der Speicherung von Yji,
    • (f) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Mittelwert Yj des Yji berechnet;
      Figure 00060001
      und einer Speichereinheit mit der Speicherung von Yj, und
    • (g) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Funktionswert Zj von Yj berechnet; Zj = f(Yj) (worin die Funktion feine monoton abnehmende Funktion oder eine monoton zunehmende Funktion ist), und einer Speichereinheit mit der Speicherung von Zj.
  • Eine vierte Erfindung ist ein System zur automatischen Durchführung des Verfahrens nach Anspruch 3, wobei das System mindestens die folgenden Einheiten (a) bis (i) umfasst;
    • (a) eine äußere Speichereinheit, welche die Aminosäuresequenzdaten der gesamten mutmaßlichen Proteine des Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, speichert, sowie eine existierende Proteindatenbank,
    • (b) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche die Häufigkeit des Auftretens einer jeden Aminosäure und die Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse,
    • (c) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids einer gegebenen Länge (n) (1 ≤ n ≤ M, mit der Maßgabe, dass M die kleinste Länge von Oligopeptiden ist, welche das Kriterium erfüllen, dass alle Oligopeptide der Länge M eine Häufigkeit des Auftretens 1 aufweisen) berechnet, welches Aj-Oligopeptid ein Teil der Aminosäuresequenz der Länge (L) eines gegebenen Proteins des Organismus "a" ist und einen Aminosäurerest Aj (n ≤ j ≤ L-n+1) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....aji....ajn(worin 1 ≤ i ≤ n+1; Aj = aji und Aj der i-te Rest des Oligopeptids ist), und in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n) entsprechend der Länge des Aj-Oligopeptids berechnet; Xi-Oligopeptid: aj1aj2....Xji....ajn(worin der i-te Rest Xji irgendeine Aminosäure ist), und einer Speichereinheit, welche die Berechnungsergebnisse speichert,
    • (d) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche das Verhältnis Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids berechnet, und einer Speichereinheit mit der Speicherung von Yji,
    • (e) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Mittelwert Y(j,n) des Yji berechnet;
      Figure 00080001
      und einer Speichereinheit mit der Speicherung von Y(j,n),
    • (f) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Funktionswert Z(j,n) von Y(j,n) berechnet; Z(j,n) = –log(Y(j,n)),und einer Speichereinheit mit der Speicherung von Z(j,n),
    • (g) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Wert Z(j,n) eines jeden Aminosäurerests in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" berechnet, die Verteilung des Z(j,n)-Werts eines jeden Aminosäurerests in den gesamten Proteinen berechnet und die Z(j,n)-Werte entsprechend den 20 Aminosäuren in 20 klassifiziert, und dann den Mittelwert Av(As) der Z(j,n)-Werte für jede Aminosäure As und die Standardabweichung Sd(As) von deren Verteilung berechnet, um auf Basis der Verteilung eine Funktion g für die Normalisierung der Differenz in der Verteilung aufgrund der Spezies der Aminosäurereste zu bestimmen; g = (Z(j,n), Aj) = [Z(j,n) – Av(As)]/Sd(As) (worin Aj = As)und einer Speichereinheit mit der Speicherung von g,
    • (h) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Wert D(j,n) der Funktion g, die in der Einheit (g) gespeichert ist, bezüglich eines jeden der Aminosäurereste Aj an der j-ten Position (n ≤ j ≤ L-n+1) in der Aminosäuresequenz der Länge (L) berechnet; D(j,n) = g(Z(j,n),Aj)und einer Speichereinheit mit der Speicherung des D(j,n)-Werts, und
    • (i) eine Berechnungs/Speichereinheit, aufgebaut aus einer Berechnungseinheit, welche einen angemessenen Funktionswert Wj der Z(j,n) und D(j,n) eines jeden Aminosäurerests in der Aminosäuresequenz berechnet; Wj = h(Z(j,1),Z(j,2),...,Z(j,M),D(j,1),D(j,2),...,D(j,M))und einer Speichereinheit mit der Speicherung des Wj-Werts.
  • Eine fünfte Erfindung ist ein Verfahren zur Modifizierung der bekannten Funktion eines Proteins "A", abgeleitet von den gesamten Proteinen des Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt waren, welches Verfahren die Schritte umfasst:
    • (1) Extrahieren eines Proteins, das eng mit dem Protein "A" verwandt ist, aus einer existierenden Proteindatenbank und Unterwerfen der Proteine einer Zuordnung,
    • (2) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäureresten, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" und Bestimmen der kleinsten Länge (n) von Oligopeptiden, welche die folgenden Kriterien erfüllen: unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen vorkommen; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, größer als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen vorkommen,
    • (3) Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1), welches ein Teil der Aminosäuresequenz der Länge (L) des Proteins "A" ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-n) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....Aji....ajnaj(n+1)(worin 1 ≤ i ≤ n+1; Aj = Aji; und Aj der i-te Rest des Oligopeptids ist), und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1); Xi-Oligopeptid: aj1aj2....Xji....ajnaj(n+1)(worin der Rest Xji irgendeine Aminosäure ist),
    • (4) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids,
    • (5) Berechnen des Mittelwerts Yj des Yji;
      Figure 00090001
    • (6) Berechnen des Funktionswerts Zj von Yj; Zj = f(Yj) (worin die Funktion feine monoton abnehmende Funktion oder eine monoton zunehmende Funktion ist), und Definieren des Zj-Werts als repräsentativen Wert der Funktion des j-ten Aminosäurerests der Aminosäuresequenz der Länge (L) des Proteins "A",
    • (7) Wiederholen der Schritte (3) bis (6) nacheinander und Bestimmen des Zj-Werts eines jeden aller Aminosäurereste an der Position zwischen n+1 ≤ j ≤ L-n in der Aminosäuresequenz der Länge (L),
    • (8) Auswählen mindestens eines Aminosäurerests, der einer Mutation unterworfen werden soll, auf der Basis der in Schritt (1) erhaltenen Zuordnungsdaten aus der Aminosäuresequenz der Länge (L) des Proteins "A", Wiederholen der Schritte (3) bis (6) nacheinander für Varianten-Aminosäurereste in verschiedenen mutierten Aminosäuresequenzen, worin der ausgewählte Aminosäurerest zu einem anderen Aminosäurerest mutiert wurde, um den Zj-Wert der Varianten-Aminosäurereste zu bestimmen,
    • (9) Auswählen einer mutierten Aminosäuresequenz, wobei der Zj-Wert des Varianten-Aminosäurerests wie in Schritt (8) bestimmt größer oder kleiner ist als der Zj-Wert des Wildtyp-Aminosäurerests wie in Schritt (7) bestimmt, und
    • (10) Herstellen eines modifizierten Gens, welches für die modifizierte Aminosäuresequenz von dem Protein "A"-Gen codiert, und Herstellen des modifizierten Proteins als Expressionsprodukt des Gens.
  • Eine sechste Erfindung ist ein Verfahren zur Modifizierung der Funktion eines Proteins "B", abgeleitet von einem Organismus "b", von dem Genom-Daten oder cDNA-Daten unbekannt waren, welches Verfahren die Schritte umfasst:
    • (1) Extrahieren eines Proteins "A", welches mit dem Protein "B" am engsten verwandt ist, aus den gesamten Proteinen des Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, und Unterwerfen des Proteins einer Zuordnung oder Extrahieren eines Proteins, das mit dem Protein "B" eng verwandt ist, aus einer existierenden Proteindatenbank, um das Protein einer Zuordnung zu unterwerfen,
    • (2) Berechnen in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" die Häufigkeit des Auftretens einer jeden Aminosäure und die Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, und Bestimmen der kleinsten Länge (n) von Oligopeptiden, welche die folgenden Kriterien erfüllen; unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, größer als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten,
    • (3) Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1), welches ein Teil der Aminosäuresequenz der Länge (L) des Proteins "A" ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-n) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Ai-Oligopeptid: aj1aj2....Aji....ajnaj(n+1)(worin 1 ≤ i ≤ n+1; Aj = Aji; und Aj der i-te Rest des Oligopeptids ist), und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1); Xi-Oligopeptid: aj1aj2....Xji....ajnaj(n+1)(worin der i-te Rest Xji irgendeine Aminosäure ist),
    • (4) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids,
    • (5) Berechnen des Mittelwerts Yj des Yji;
      Figure 00110001
    • (6) Berechnen des Funktionswerts Zj von Yj; Zj = f(Yj) (worin die Funktion feine monoton abnehmende Funktion oder eine monoton zunehmende Funktion ist), und Definieren des Zj-Werts als repräsentativen Wert der Funktion des j-ten Aminosäurerests Aj der Aminosäuresequenz der Länge (L) des Proteins "A",
    • (7) Wiederholen der Schritte (3) bis (6) nacheinander und Bestimmen des Zj-Werts eines jeden der Aminosäurereste an der Position zwischen n+1 ≤ j ≤ L-n in der Aminosäuresequenz der Länge (L),
    • (8) Auswählen mindestens eines Aminosäurerests, der einer Mutation unterworfen werden soll, auf Grundlage der in Schritt (1) erhaltenen Zuordnungsdaten aus der Aminosäuresequenz der Länge (L) des Proteins "A", Wiederholen der Schritte (3) bis (6) nacheinander für Varianten-Aminosäurereste in verschiedenen mutierten Aminosäuresequenzen, worin der ausgewählte Aminosäurerest zu anderen Aminosäureresten mutiert wurde, um den Zj-Wert der Varianten-Aminosäurereste festzustellen,
    • (9) Auswählen der Mutationsposition und des mutierten Aminosäurerests, wobei der Zj-Wert des Varianten-Aminosäurerests wie in Schritt (8) bestimmt größer oder kleiner ist als der Zj-Wert des Wildtyp-Aminosäurerests wie in Schritt (7) bestimmt, und
    • (10) Herstellen eines modifizierten Gens, welches für die modifizierte Aminosäuresequenz mit dem mutierten Aminosäurerest an der Position von dem Protein "B"-Gen codiert, und Herstellen des modifizierten Proteins als Expressionsprodukt des Gens.
  • Eine siebte Erfindung ist ein Verfahren zur Modifizierung der bekannten Funktion eines Proteins "A", abgeleitet von den gesamten Proteinen des Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt waren, welches Verfahren die Schritte umfasst:
    • (1) Extrahieren von Proteinen, die eng mit dem Protein "A" verwandt sind, aus einer existierenden Proteindatenbank und Unterwerfen der Proteine einer Zuordnung,
    • (2) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a",
    • (3) bezüglich eines Proteins des Organismus "a", (3') Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids einer gegebenen Länge (n) (1 ≤ n ≤ M, mit der Maßgabe, dass M die kleinste Länge von Oligopeptiden ist, welche das Kriterium erfüllen, dass alle Oligopeptide der Länge M eine Häufigkeit 1 des Auftretens haben), welches Aj-Oligopeptid ein Teil der Aminosäuresequenz des Proteins ist und einen Aminosäurerest Aj (n ≤ j ≤ L-n+1) an der j-ten Position vom N-Terminus des Proteins enthält; Aj-Oligopeptid: aj1aj2....aji....ajn(worin 1 ≤ i ≤ n; Aj = aji; und Aj der i-te Rest des Oligopeptids ist), und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n) entsprechend der Länge des Aj-Oligopeptids; Xi-Oligopeptid: aj1aj2....Xji....ajn(worin der i-te Rest Xji irgendeine Aminosäure ist),
    • (4) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids,
    • (5) Berechnen des Mittelwerts Y(j,n) des Yji;
      Figure 00120001
    • (6) Berechnen des Funktionswerts Z(j,n) von Y(j,n); Z(j,n) = –log(Y(j,n)),
    • (7) Wiederholen der Schritte (3') bis (6) nacheinander und Bestimmen des Z(j,n)-Werts eines jeden Aminosäurerests Aj an der Position j (n ≤ j ≤ L-n+1) in der Aminosäuresequenz der Länge (L),
    • (8) Wiederholen der Schritte (3) bis (7) nacheinander für die gesamten Proteine des Organismus "a", wodurch die Verteilung des Z(j,n)-Werts eines jeden Aminosäurerests in den gesamten Proteinen bestimmt und die Z(j,n)-Werte in 20, entsprechend den 20 Aminosäuren, klassifiziert werden, und dann Berechnen des Mittelwerts Av(As) der Z(j,n)- Werte für jede Aminosäure As und der Standardabweichung Sd(As) von deren Verteilung, um auf Basis der Verteilung die Funktion g für den j-ten Aminosäurerest Aj eines Proteins zu bestimmen, um die Differenz in der Verteilung aufgrund der Spezies von Aminosäureresten zu normalisieren; g = (Z(j,n),Aj) = [Z(j,n) – Av(As)]/Sd(As) (worin Aj = As),
    • (9) Berechnen des Werts D(j,n) der Funktion g eines jeden Aj aller Aminosäurereste an der j-ten Position (n ≤ j ≤ L-n+1) eines Proteins in dem gesamten Protein wie in Schritt (8) gewonnen; D(j,n) = g(Z(j,n), Aj),
    • (10) Definieren des repräsentativen Werts der Funktion des j-ten Aminosäurerests in der Aminosäuresequenz der Länge (L) als Funktionswert Wj von Z(j,n) und D(j,n); Wj = h(Z(j,1),Z(j,2),...,Z(j,M),D(j,1),D(j,2),...,D(j,M))
    • (11) Wiederholen der Schritte (3) bis (10) nacheinander, um die individuellen Wj-Werte aller Aminosäurereste an der Position (n+1 ≤ j ≤ L-n) in der Aminosäuresequenz der Länge (L) zu bestimmen,
    • (12) Auswählen mindestens eines Aminosäurerests, der einer Mutation unterworfen werden soll, auf Grundlage der in Schritt (1) erhaltenen Zuordnungsdaten aus der Aminosäuresequenz der Länge (L) des Proteins "A" und Wiederholen der Schritte (3) bis (10) nacheinander für Varianten-Aminosäurereste in verschiedenen mutierten Aminosäuresequenzen, worin der ausgewählte Aminosäurerest zu einem anderen Aminosäurerest mutiert wurde, um den Wj-Wert des Varianten-Aminosäurerests zu bestimmen,
    • (13) Auswählen einer mutierten Aminosäuresequenz, wobei der Wj-Wert des Varianten-Aminosäurerests wie in Schritt (12) bestimmt größer oder kleiner ist als der Wj-Wert des Wildtyp-Aminosäurerests wie in Schritt (10) bestimmt, und
    • (14) Herstellen eines modifizierten Gens, welches für die modifizierte Aminosäuresequenz des Protein "A"-Gens codiert, und Herstellen des modifizierten Proteins als Expressionsprodukt des Gens.
  • Eine achte Erfindung ist eine thermophile DNA-Polymerase, hergestellt durch künstliche Modifizierung der Aminosäuresequenz von Pfu-DNA-Polymerase, so dass die Verlängerung der synthetisierten DNA-Kette nicht zwischenzeitlich während der Katalyse für die Synthese einer DNA-Kette, die komplementär zu einer einzelsträngigen DNA ist, terminiert werden könnte, und spezieller ist die thermophile DNA-Polymerase eine, welche die Aminosäuresequenz von SEQ-ID-Nr. 1 umfasst.
  • In Zusammenhang mit der achten Erfindung stellt die vorliegende Anmeldung eine DNA-Sequenz bereit, welche für die Aminosäuresequenz von SEQ-ID-Nr. 1 codiert, und einen rekombinanten Vektor, welcher die DNA-Sequenz trägt. Ein solcher rekombinanter Vektor umfasst rekombinantes Plasmid pDP320, beherbergt von Escherichia coli HMS174 (DE3)/pDP320 (FERM P-16052).
  • Noch weiter wird gemäß der vorliegenden Erfindung ein Verfahren bereitgestellt zur Herstellung einer thermophilen DNA-Polymerase, umfassend das Kultivieren einer Zelle, die mit einem Expressionsvektor, welcher die DNA-Sequenz trägt, transformiert wurde, und das Isolieren und Reinigen des betreffenden Enzyms, das in einem Kulturmedium gebildet wurde.
  • Eine neunte Erfindung ist eine thermophile DNA-Polymerase, hergestellt durch künstliche Modifizierung der Aminosäuresequenz von Pfu-DNA-Polymerase, so dass die synthetisierte DNA-Kette während der Katalyse zur Synthese einer zu einer einzelsträngigen DNA komplementären DNA-Kette weiter verlängert werden könnte, und spezieller ist die thermophile DNA-Polymerase eine, welche die Aminosäuresequenz von SEQ-ID-Nr. 6 umfasst, oder eine DNA-Polymerase, welche die Aminosäuresequenz von SEQ-ID-Nr. 7 umfasst.
  • In Zusammenhang mit dem neunten Aspekt der vorliegenden Erfindung stellt die vorliegende Anmeldung eine DNA-Sequenz bereit, welche für die Aminosäuresequenz von SEQ-ID-Nr. 6 oder 7 codiert, bzw. rekombinante Vektoren, welche solche DNA-Sequenzen tragen. Als solche Vektoren werden bereitgestellt das rekombinante Plasmid pDP5b17, welches von Escherichia coli HMS174 (DE3)/pDP5b17 (FERM BP-6189) beherbergt wird (Vektor, der die DNA-Sequenz trägt, welche für die Aminosäuresequenz von SEQ-ID-Nr. 1 codiert), und das rekombinante Plasmid pDP5C4, welches von Escherichia coli HMS174 (DE3)/pDP5C4 (FERM BP-6190) beherbergt wird (Vektor, der die DNA-Sequenz trägt, welche für die Aminosäuresequenz von SEQ-ID-Nr. 1 codiert).
  • Noch weiter wird ein Verfahren zur Herstellung einer DNA-Polymerase bereitgestellt, welches das Kultivieren einer Zelle, die mit einem Expressionsvektor, welcher die DNA-Sequenz trägt, transformiert wurde, und das Isolieren und Reinigen des betreffenden Enzyms, das in einem Kulturmedium gebildet wurde, umfasst.
  • Das Verfahren zur Voraussage einer funktionellen Stelle eines Proteins gemäß der ersten Erfindung wurde auf Grundlage eines Prinzips wie folgt entwickelt. Ein Protein ist aus einer Sequenz von 20 Aminosäuren aufgebaut, jedoch ist die Sequenz nicht zufällig. Somit ist die Häufigkeit des Auftretens eines speziellen Oligopeptids als partielle Aminosäuresequenz in den gesamten Proteinen, die von einem Genom codiert werden, das von einer geeigneten Organismus-Spezies stammt, nicht konstant, sondern einige Oligopeptide treten mit hohen Häufigkeiten in verschiedenen Proteinen auf, während andere Oligopeptide darin selten auftreten. Es ist bekannt, dass unter diesen die Oligopeptide, die sehr häufig bei verschiedenen Proteinen gemeinsam auftreten, kein Potential zur Bestimmung der Einzigartigkeit (Spezifität) individueller Proteine haben, nämlich kein Potential, die Funktionen zu bestimmen, während Oligopeptide, die mit geringer Häufigkeit auftreten, umgekehrt die Einzigartigkeit und die Funktionen individueller Proteine bestimmen.
  • Es wird postuliert, dass die funktionelle Stelle eines Proteins aus Oligopeptiden aufgebaut ist, die mit niedrigen Häufigkeiten auftreten. Ferner nehmen längere Peptide, die seltener auftreten, an Zahl zu. Mit anderen Worten das Oligopeptid der Länge (n+1), wie in Schritt (3) gemäß dem Verfahren der ersten Erfindung gezeigt, ist meistens das kürzeste Oligopeptid, das mit einer niedrigen Häufigkeit auftritt, und der berechnete Funktionswert Zj des Aminosäurerests Aj an einer gegebenen Position j im Oligopeptid ist der Koeffizient des Auftretens (nämlich der repräsentative Wert der Funktion) des Aminosäurerests Aj an dieser Position.
  • Gemäß dem Verfahren zur Voraussage einer funktionellen Stelle eines Proteins gemäß der zweiten Erfindung kann der Grad des Beitrags des Aminosäurerests Aj zu der Häufigkeit des Auftretens des Aj-Oligopeptids auf der Basis des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids, wie in Schritt (3) gezeigt, berechnet werden und somit dient der berechnete Funktionswert Z(j,n) des Aminosäurerests Aj an einer gegebenen Position eines Proteins als Koeffizient der Auftretens des Aminosäurerests Aj an der Position (nämlich als der repräsentative Wert der Funktion).
  • Ferner variiert der Wert Z(j,n) in Abhängigkeit von der Spezies des Aminosäurerests Aj. In Schritt (7) des erfindungsgemäßen Verfahrens wird die Verteilung des Z(j,n)-Werts einer jeden von 20 Aminosäuren in den gesamten Proteinen eines Organismus "a" bestimmt, um durch Normalisierung des Z(j,n)-Werts auf der Grundlage des Mittelwerts und der Standardabweichung des Z(j,n)-Werts einer jeden Aminosäure, wie bestimmt auf der Basis der Verteilung, einen D(j,n)-Wert zu bestimmen, welcher nach Korrektur der Bevorzugung aufgrund einer jeden Aminosäurerest-Spezies als repräsentativer Wert der Funktion dient.
  • Ferner nehmen längere Oligopeptide, die seltener auftreten, an Zahl zu. Nachdem die Werte Z(j,n) und D(j,n) im allgemeinen in Abhängigkeit von der Länge (n) variieren, ist dementsprechend der Funktionswert Wj der Z(j,n) und D(j,n) wie bestimmt bei einer Vielfalt von Längen (n) definiert als repräsentativer Wert der Funktion.
  • Die Systeme zur Voraussage einer funktionellen Stelle eines Proteins gemäß der dritten und vierten Erfindung sind individuelle Systeme zur automatischen Durchführung der Verfahren gemäß der ersten und zweiten Erfindung; die Verfahren zur Modifizierung von Proteinen gemäß der fünften und sechsten Erfindung sind Verfahren zur Herstellung von Mutantenproteinen durch Substitution des Aminosäurerests an der funktionellen Stelle, welche mit dem Verfahren der ersten Erfindung vorausgesagt wurde, durch einen anderen Aminosäurerest. Noch weiter ist das Verfahren zur Modifizierung eines Proteins gemäß der siebten Erfindung ein Verfahren zur Herstellung eines Mutantenproteins durch Substitution des Aminosäurerests an der funktionellen Stelle, die mit dem Verfahren gemäß der zweiten Erfindung vorausgesagt wurde, durch einen anderen Aminosäurerest. Gemäß der vorliegenden Erfindung wird eine neue thermophile DNA-Polymerase (die achte und neunte Erfindung) als modifiziertes Protein bereitgestellt.
  • Der Begriff "DNA-Polymerase" ist die generische Bezeichnung von Enzymen, welche die Synthese einer DNA-Kette, die komplementär zu einer einzelsträngigen DNA ist, katalysieren. DNA-Polymerase ist ein essentielles Enzym für die DNA-Sequenzierung und in vitro-DNA-Amplifizierung und "thermophile DNA-Polymerase" ist unerlässlich für die PCR (Polymerasekettenreaktion) zur Automatisierung einer Folge der Reaktionszyklen.
  • Eine solche thermophile DNA-Polymerase umfasst bekannte, beispielsweise Taq, Pfu, KOD, welche je nach dem charakteristischen Leistungsvermögen separat verwendet werden. Pfu-DNA-Polymerase ist insbesondere bekannt als ein Enzym mit einer extrem niedrigen Häufigkeit fehlerhafter Ablesung während der Synthese der DNA-Stränge (mit hoher Wiedergabegenauigkeit). Jedoch ist die Pfu-DNA-Polymerase für die Amplifizierung polymerer DNAs wie genomischer DNA ungeeignet, da die von der Pfu-DNA-Polymerase erhaltene synthetische DNA wenig ist und deren Aktivität zur Verlängerung einer synthetischen Kette ungenügend ist. Somit stellt die vorliegende Anmeldung eine neue Pfu-DNA-Polymerase bereit, welche gemäß dem Verfahren der fünften Erfindung hergestellt wurde.
  • Kurzbeschreibung von Zeichnungen
  • 1 stellt graphisch die individuellen Häufigkeiten des Auftretens von Oligopeptiden der Längen 3, 4 und 5 und die Verteilungen ihrer individueller Häufigkeiten gemäß dem Verfahren der ersten Erfindung dar;
  • 2 stellt ein Beispiel einer Aminosäuresequenz einer Länge von 20 und Beispiele des Aj-Oligopeptids einer Länge von 4, enthaltend den Aminosäurerest Met an Position 5 in der Sequenz, und Beispiele von Xi-Oligopeptiden dar;
  • 3 stellt graphisch die individuellen Häufigkeiten des Auftretens von Oligopeptiden der Längen 2, 3, 4 und 5 und die Verteilungen ihrer individuellen Häufigkeiten gemäß dem Verfahren der zweiten Erfindung dar;
  • 4 stellt ein Beispiel des Fließschemas zur Durchführung des Schritts (1) des Verfahrens der zweiten Erfindung dar;
  • 5 stellt ein Beispiel des Fließschemas zur Durchführung der Schritte (2') bis (3) des Verfahrens der zweiten Erfindung dar;
  • 6 stellt ein Beispiel des Fließschemas zur Durchführung der Schritte (4) bis (5) des Verfahrens der zweiten Erfindung dar;
  • 7 stellt eine Verteilung der Häufigkeit von Z(j,3) einer jeden von drei Aminosäuren, siehe unten, gemäß dem Verfahren der zweiten Erfindung dar, wobei die durchgezogene Linie die Verteilung von Isoleucin (IIe) darstellt; die gestrichelte Linie die Verteilung von Alanin (Ala) darstellt und die Linie mit abwechselnd langen und kurzen Strichen die Verteilung von Methionin (Met) darstellt;
  • 8 stellt ein Beispiel des Fließdiagramms zur Durchführung des Schritts (7) des Verfahrens der zweiten Erfindung dar;
  • 9 stellt ein Beispiel des Fließschemas zur Durchführung des Schritts (8) des Verfahrens der zweiten Erfindung dar;
  • 10 stellt ein Beispiel des Fließschemas zur Durchführung des Schritts (9) des Verfahrens der zweiten Erfindung dar;
  • 11 stellt ein Blockdiagramm dar, welches das System der dritten Erfindung erläutert;
  • 12 stellt ein Blockdiagramm dar, welches das System der dritten Erfindung erläutert;
  • 13 stellt die Elektrophoreseergebnisse herkömmlicher Pfu-DNA-Polymerase und KOD-DNA-Polymerase dar, welche deren Primerverlängerungsaktivitäten anzeigen;
  • 14 stellt eine Verteilungskarte des graphisch dargestellten Zj = –logYj-Werts für die gesamte Aminosäuresequenz der von MJ0885 codierten DNA-Polymerase vom α-Typ dar, wobei der Wert mit der ersten Erfindung berechnet ist;
  • 15 stellt eine Verteilungskarte des graphisch dargestellten Zj = –logYj-Werts für die partiellen Sequenzen (Motiv A und Motiv C) der Aminosäuresequenz dar, deren Verteilungskarte in 4 gezeigt ist;
  • 16 stellt eine Häufigkeitsverteilungskarte des Zj = –logYj-Werts dar, berechnet auf der Basis der Aminosäuresequenz der DNA-Polymerase vom α-Typ, die von MJ0885 codiert wird;
  • 17 stellt Zuordnungskarten der Aminosäuresequenzen der individuellen Motive C der DNA-Polymerasen Pfu, KOD und MJ vom α-Typ dar;
  • 18 stellt Verteilungskarten der graphisch dargestellten Zj = –logYj-Werte für die individuellen Motive C der DNA-Polymerasen Pfu, KOD und MJ vom α-Typ dar;
  • 19 stellt Verteilungskarten der graphisch dargestellten Werte von Wj = Z(j,3) – Z(j,1) (durchgezogene Linie), Wj = Z(j,4) – Z(j,3) (gestrichelte Linie) und Wj = Z(j,5) – Z(j,3) (Linie mit alternierenden langen und kurzen Strichen) der 100 Reste vom N-Terminus der gesamten Aminosäuresequenz der von MJ0885 codierten DNA-Polymerase vom α-Typ dar und diese Werte sind mit dem Verfahren des zweiten Aspekts der vorliegenden Erfindung berechnet;
  • 20 stellt Verteilungskarten des graphisch dargestellten Werts Wj = Z(j,5) – Z(j,3) für partielle Sequenzen (Regionen, welche exol, exoll, Motiv A, Motiv B und Motiv C umfassen) der Aminosäuresequenz der von MJ0885 codierten DNA-Polymerase vom α-Typ dar;
  • 21 stellt Verteilungskarten der graphisch dargestellten Werte von Wj = D(j,3) (in dunkler Farbe) und Wj = D(j,5) (in blasser Farbe) für partielle Sequenzen (Regionen, die exol, exoll, Motiv A, Motiv B und Motiv C umfassen) der Aminosäuresequenz der von MJ0885 codierten DNA-Polymerase vom α-Typ dar;
  • 22 stellt in dunkler Farbe Verteilungskarten der Positionen von Aminosäureresten mit Wj = D(j,3) von 2 oder mehr oder von 2 oder weniger in der dreidimensionalen Struktur der Aminosäuresequenz von Enolase, codiert von MJ0232, in einem dreidimensionalen Strukturmodell dar;
  • 23 stellt die Elektrophoreseergebnissse dar, welche die Primerverlängerungsaktivitäten der herkömmlichen Pfu-DNA-Polymerase (Wildtyp) und der modifizierten Pfu-DNA-Polymerase I der vorliegenden Erfindung anzeigen; und
  • 24 stellt die Elektrophoreseergebnisse dar, welche die Primerverlängerungsaktivitäten der herkömmlichen Pfu-DNA-Polymerase (Wildtyp) und der modifizierten Pfu-DNA-Polymerasen II und III der vorliegenden Erfindung anzeigen.
  • Beste Ausführungsform der Erfindung
  • Das Verfahren zur Voraussage einer funktionellen Stelle eines Proteins gemäß der ersten Erfindung ist ein Verfahren zur Voraussage der funktionellen Stelle eines Proteins eines Organismus "a" mit bekannten Genom-Daten oder cDNA-Analyse-Daten in den gesamten mutmaßlichen Proteinen des Organismus "a", welches im wesentlichen die folgenden Schritte (1) bis (6) umfasst.
  • Schritt (1):
  • Durch Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a", wird die Oligopeptidlänge (n) bestimmt.
  • Die Länge (n) wird dann als kleinste ganze Zahl bestimmt, welche die folgenden Kriterien erfüllt:
    "Unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, größer als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten."
  • Beispielsweise stellt 1 Verteilungskarten der Häufigkeiten des Auftretens von Oligopeptiden einer Länge von 3, Oligopeptiden einer Länge von 4 und Oligopeptiden einer Länge von 5 in den gesamten Proteinen dar, die von dem Genom eines Mikroorganismus Methanococcus jannaschii (Bult et al., Science 273, 1058-1073, 1996) codiert werden. Im Falle der drei Arten von Längen der Oligopeptide, die in 1 gezeigt sind, ist das kleinste n im Schritt (1) 3.
  • Schritt (2):
  • Vorausgesetzt, dass der j-te Aminosäurerest vom N-Terminus der Aminosäuresequenz der Länge (L) des Proteins als Gegenstand zur Voraussage einer funktionellen Stelle hier als Aj (n+1 ≤ j ≤ L-n) beschrieben ist, sollte die Häufigkeit des Auftretens einer partiellen Sequenz der Aminosäuresequenz des Proteins, welche Sequenz dem folgenden Aj-Oligopeptid der Länge (n+1), enthaltend den j-ten Aminosäurerest Aj, entspricht; Aj-Oligopeptid: aj1aj2....Aji....ajnaj (n+1)(worin 1 ≤ i ≤ n+1; Aj = Aji; und Aj der i-te Rest des Oligopeptids ist),
    und die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1); Xi-Oligopeptid: aj1aj2....Xji....ajnaj (n+1)(worin der i-te Rest Xji irgendeine Aminosäure ist)
    in den gesamten Proteinen des Organismus "a" bestimmt werden.
  • Ein solches Aj-Oligopeptid und Xi-Oligopeptid kann beispielsweise in 2 illustriert werden. Die obere Reihe (1) in 2 stellt im einbuchstabigen Code die partielle Sequenz vom N-Terminus bis zum 20. Aminosäurerest der mutmaßlichen abgeleiteten Aminosäuresequenz des Gens MJ0885 dar, von dem angenommen wird, dass es für die α-Typ-DNA-Polymerase von Methanococcus jannaschii codiert (Bult et al., Science 273, 1058-1073, 1996); die mittlere Reihe (2) stellt Beispiele des Aj-Oligopeptids einer Länge von 4 dar, welches den 5. Aminosäurerest Met (M) in der Aminosäuresequenz enthält; und die Reihen (3) bis (6) weiter unten stellen Beispiele des Xi-Oligopeptids dar, welches den 5. Aminosäurerest M enthält.
  • Schritt (3):
  • Berechnung des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids.
  • Schritt (4):
  • Der Mittelwert Yj des Yji wird wie folgt berechnet.
  • Figure 00200001
  • Schritt (5):
  • Ein monoton abnehmender Funktionswert oder monoton zunehmender Funktionswert Zj von Yj wird wie folgt bestimmt: Zj = f(Yj).
  • Der Zj-Wert ist definiert als ein repräsentativer Wert der Funktion des j-ten Aminosäurerests der Aminosäuresequenz der Länge (L).
  • Schritt (6):
  • Durch anschließende Wiederholung der Schritte (2) bis (5) nacheinander und Bestimmung des Zj-Werts eines jeden der Aminosäurereste an der Position n+1 ≤ j ≤ L-n wird der Grad der Beteiligung eines jeden Aminosäurerests an der Funktion des Proteins durch Verwendung der Dimension des Zj-Werts als Indikator vorausgesagt. Konkreter, nachdem die Weise des Auftretens eines jeden Aminosäurerests im Kontext als Funktionswert Zj von Yj ausgedrückt wird, zeigt ein größerer Zj-Wert eine geringere Häufigkeit des Auftretens des Aminosäurerests an, wenn Zj ein monoton abnehmender Funktionswert ist, welches nahe legt, dass der Aminosäurerest eine höhere Verantwortlichkeit für die Leistung der Funktion hat. Falls Zj eine monoton zunehmende Funktion ist, wird zusätzlich nahe gelegt, dass ein Aminosäurerest mit einem kleineren Zj-Wert eine größere Verantwortlichkeit für die Funktion hat.
  • Durch Expression des Zj-Werts eines jeden Aminosäurerests beispielsweise in einer Verteilungskarte, worin der Zj-Wert auf der vertikalen Achse aufgetragen ist, während die Aminosäuresequenz auf der horizontalen Achse dargestellt ist, kann die funktionelle Stelle ferner auf einen Blick bestätigt werden, welches als Ausführungsform der vorliegenden Erfindung bevorzugt ist.
  • Die zweite Erfindung ist ein Verfahren zur Voraussage einer funktionellen Stelle eines entsprechenden Proteins in den gesamten mutmaßlichen Proteinen des Organismus "a" mit bekannten Genom-Daten oder cDNA-Analyse-Daten, welches im Wesentlichen die folgenden Schritte (1) bis (9) umfasst.
  • Schritt (1):
  • Die Häufigkeit des Auftretens einer jeden Aminosäure und die Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" werden berechnet.
  • Beispielsweise zeigt 3 eine Verteilungskarte der Häufigkeiten des Auftretens von Oligopeptiden einer Länge von 3, Oligopeptiden einer Länge von 4 und Oligopeptiden einer Länge von 5, welche in den gesamten Proteinen, die von dem Genom des Mikroorganismus Methanococcus jannaschii (Bult et al., Science 273, 1058-1073, 1996) codiert werden, auf Grundlage der Genom-Daten des Mikroorganismus bestimmt werden.
  • 4 stellt ein Beispiel des Fließschemas zur Durchführung des Schritts (1) dar.
  • Schritt (2):
  • Bezüglich eines Proteins des Organismus "a",
  • Schritt (2'):
  • Werden unter der Voraussetzung, dass der j-te Aminosäurerest vom N-Terminus der Aminosäuresequenz der Länge (L) des Proteins hier als Aj beschrieben ist, die Häufigkeit des Auftretens einer partiellen Sequenz der Aminosäuresequenz des Proteins, welche Sequenz dem folgenden Aj-Oligopeptid einer gegebenen Länge n entspricht (1 ≤ n ≤ M, vorausgesetzt, dass "M" die kleinste Länge von Oligopeptiden ist, welche das folgende Kriterium erfüllen: alle Oligopeptide der Länge M haben eine Häufigkeit 1 des Auftretens), enthaltend den j-ten Aminosäurerest Aj (n ≤ j ≤ L-n+1); Aj-Oligopeptid: aj1aj2....Aji....ajn(worin 1 ≤ i ≤ n; Aj = Aji und Aji der i-te Rest des Oligopeptids ist),
    und die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge n entsprechend der Länge des Aj-Oligopeptids; Xi-Oligopeptid: aj1aj2....Xji....ajn(worin der i-te Rest Xji irgendeine Aminosäure ist),
    in den gesamten Proteinen des Organismus "a" berechnet.
  • In derselben Weise wie bei dem Verfahren der ersten Erfindung sind ein solches Aj-Oligopeptid und Xi-Oligopeptid beispielsweise wie in 2 dargestellt.
  • Schritt (3):
  • Das Verhältnis Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids wird berechnet.
  • 5 stellt ein Beispiel des Fließschemas zur Durchführung der vorgenannten Schritte (2') bis (3) dar.
  • Schritt (4):
  • Der Mittelwert Y(j,n) des Yji wird wie unten beschrieben berechnet:
    Figure 00220001
  • Schritt (5):
  • Der logarithmische Wert Z(j,n) von Y(j,n) wird wie folgt bestimmt: Z(j,n) = –log(Y(j,n))
  • 6 stellt ein Beispiel des Fließschemas zur Durchführung der vorgenannten Schritte (4) bis (5) dar.
  • Schritt (6):
  • Durch anschließendes Wiederholen der Schritte (2') bis (5) nacheinander wird der Z(j,n)-Wert eines jeden aller Aminosäurereste an der Position n ≤ j ≤ L-n+1 in der Aminosäuresequenz der Länge (L) bestimmt.
  • Schritt (7):
  • Durch Wiederholen der Schritte (2) bis (6) nacheinander bei den gesamten Proteinen des Organismus "a", wodurch die Verteilung des Z(j,n)-Werts eines jeden Aminosäurerests in den gesamten Proteinen bestimmt und die Z(j,n)-Werte in 20 gemäß den 20 Aminosäuren klassifiziert werden, und anschließende Berechnung des Mittelwerts Av(As) der Z(j,n)-Werte für jede Aminosäure As und der Standardabweichung Sd(As) von deren Verteilung wird auf der Basis der Verteilung die Funktion g für den j-ten Aminosäurerest Aj eines Proteins zur Normalisierung der Unterschiede in der Verteilung aufgrund der Spezies von Aminosäureresten bestimmt; g = (Z(j,n),Aj) = [Z(j,n) – Ad(As)]/Sd(As) (worin Aj = As).
  • Beispielsweise stellt 7 eine Verteilung der Häufigkeit von Z(j,n) für drei Spezies von Aminosäuren, nämlich Isoleucin (IIe), Alanin (Ala) und Methionin (Met), in den gesamten Proteinen dar, die von dem Genom von Methanococcus jannaschii (Bult et al., Science 273, 1058-1073, 1996) codiert werden. Auf Grundlage der Verteilung werden der Mittelwert und die Standardabweichung der Z(j,n)-Werte für eine Aminosäure Isoleucin (IIe), nämlich Ad(IIe) und Sd(IIe) als Ad(IIe) = 3,16 und Sd(IIe) = 0,17 und die Funktion g für Aj = IIe wie folgt bestimmt. g = (Z(j,n),Aj) = (Z(j,n) – 3,16)/0,17
  • 8 stellt ein Beispiel des Fließschemas zur Durchführung des Schritts (7) dar.
  • Schritt (8):
  • Der Wert D(j,n) der Funktion g eines jeden aller Aminosäurereste Aj an Position n ≤ j ≤ L-n+1 in der Aminosäuresequenz der Länge (L), wie in Schritt (7) gewonnen, wird bestimmt; D(j,n) = g (Z(j,n),Aj).
  • 9 stellt ein Beispiel des Fließschemas zur Durchführung des Schritts (8) dar.
  • Schritt (9):
  • Der Funktionswert Wj des Z(j,n)-Werts und des D(j,n)-Werts wird wie folgt bestimmt: Wj = h (Z(j,1),z(j,2),...,z(j,M),D(j,1),D(j,2),..,D(j,M))
  • Durch Definition des Werts des Wj als repräsentativen Wert der Funktion des j-ten Aminosäurerests in der Aminosäuresequenz der Länge (L) wird der Grad der Verantwortlichkeit eines jeden Aminosäurerests für die Funktion des Proteins durch Verwendung der Dimension des Wj-Werts als Indikator abgeschätzt.
  • 10 stellt ein Beispiel des Fließschemas zur Durchführung des Schritts (9) dar. Durch Darstellung des Wj-Werts eines jeden Aminosäurerests in beispielsweise einer Verteilungskarte, worin der Wj-Wert auf der vertikalen Achse aufgetragen ist, während die Aminosäuresequenz auf der horizontalen Achse dargestellt ist, kann ferner die funktionelle Stelle mit einem Blick bestätigt werden, welches als Ausführungsform zur Durchführung der vorliegenden Erfindung bevorzugt ist.
  • Falls die dreidimensionale Struktur des Proteins als Gegenstand zur Voraussage der funktionellen Stelle bekannt ist oder falls ein dreidimensionales Strukturmodell davon mit bekannten Verfahren hergestellt werden kann (beispielsweise Homologie-Modellierungsverfahren, Peitsch, Proceedings of the Fifth International Conference on Intelligent Systems for Molecular Biology, 1997, 5, 234-236), wird die Verteilung in der dreidimensionalen Struktur dargestellt, wodurch eine räumliche Anordnung eines Aminosäurerests als Kandidat einer neuen funktionellen Stelle bestätigt werden kann, welches als Ausführungsform zur Durchführung der Erfindung bevorzugt ist.
  • Die dritte Erfindung ist ein System zur automatischen Durchführung des Verfahrens zur Voraussage einer funktionellen Stelle gemäß dem Verfahren der ersten Erfindung, wobei das System mindestens die folgenden Einheiten (a) bis (g) zur Durchführung der Schritte (1) bis (6) des Verfahrens der ersten Erfindung umfasst, wie beispielsweise in dem Aufbaubeispiel in 11 gezeigt.
  • Äußere Speichereinheit (a):
  • Eine Einheit, welche die Aminosäuresequenzdaten eines Proteins speichert, oder eine existierende Proteindatenbank zur Verwendung in Schritt (1) der ersten Erfindung.
  • Berechnungs/Speichereinheit (b):
  • Eine Einheit, die aus einer CPU, welche die Häufigkeiten des Auftretens individueller Oligopeptide wie in Schritt (1) bestimmt berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse aufgebaut ist.
  • Berechnungs/Speichereinheit (c):
  • Eine Einheit, die aus einer CPU, welche die kleinste Länge (n) von Oligopeptiden wie in Schritt (1) bestimmt berechnet, und einer Speichereinheit mit der Speicherung der Länge (n) aufgebaut ist.
  • Berechnungs/Speichereinheit (d):
  • Eine Einheit, die aus einer CPU, welche die Häufigkeiten des Auftretens einer jeden Aminosäure und die Häufigkeiten des Auftretens des Aj-Oligopeptids und Xi-Oligopeptids in den gesamten Proteinen wie in Schritt (2) bestimmt berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse aufgebaut ist.
  • Berechnungs/Speichereinheit (e):
  • Eine Einheit, die aus einer CPU, welche den Yji-Wert wie in Schritt (3) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des Yji-Werts aufgebaut ist.
  • Berechnungs/Speichereinheit (f):
  • Eine Einheit, die aus einer CPU, welche den Yj-Wert wie in Schritt (4) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des Yj-Werts aufgebaut ist.
  • Berechnungs-/Speichereinheit (g):
  • Eine Einheit, die aus einer CPU, welche den Zj-Wert wie in Schritt (5) bestimmt berechnet, und einer Speichereinheit mit der Speicherung von Zj aufgebaut ist.
  • Zusätzlich wird das System zur Voraussage einer funktionellen Stelle in einer bevorzugten Ausführungsform mit der folgenden Anzeigeeinheit (h) versehen.
  • Anzeigeeinheit (h):
  • Eine Einheit, welche den Zj-Wert eines jeden Aminosäurerests, der in der Berechnungs/Speichereinheit (g) gewonnen wurde, in einer Verteilungskarte darstellt.
  • Das System der vorliegenden Erfindung kann neben diesen Einheiten (a) bis (h) mit einer Tastatur (i) und einer Steuerungseinheit (j) und dgl. ausgerüstet sein, wie illustriert in 11.
  • Gemäß der vierten Erfindung ist das System zur Voraussage einer funktionellen Stelle eines Proteins ein System zur automatischen Durchführung des Verfahrens der zweiten Erfindung, welches mindestens die folgenden Einheiten (a) bis (i) zur Durchführung der Schritte (1) bis (9) gemäß dem Verfahren der zweiten Erfindung umfasst, wie in dem Aufbaubeispiel in 12 gezeigt.
  • Äußere Speichereinheit (a):
  • Eine Einheit, welche die Aminosäuresequenzdaten speichert, und eine existierende Proteindatenbank zur Verwendung in Schritt (1).
  • Berechnungs/Speichereinheit (b):
  • Eine Einheit, die aus einer CPU, welche die Häufigkeiten des Auftretens individueller Oligopeptide wie in Schritt (1) bestimmt berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse aufgebaut ist.
  • Berechnungs/Speichereinheit (c):
  • Eine Einheit, die aus einer CPU, welche die Häufigkeiten des Auftretens einer jeden Aminosäure und die individuellen Häufigkeiten des Auftretens des Aj-Oligopeptids und Xi-Oligopeptids in den gesamten Proteinen wie in Schritt (2') bestimmt berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse aufgebaut ist.
  • Berechnungs/Speichereinheit (d):
  • Eine Einheit, die aus einer CPU, welche Yji wie in Schritt (3) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des Yji-Werts aufgebaut ist.
  • Berechnungs/Speichereinheit (e):
  • Eine Einheit, die aus einer CPU, welche den Y(j,n)-Wert wie in Schritt (4) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des Y(j,n)-Werts aufgebaut ist.
  • Berechnungs/Speichereinheit (f):
  • Eine Einheit, die aus einer CPU, welche den Z(j,n)-Wert wie in den Schritten (5) und (6) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des Z(j,n)-Werts aufgebaut ist.
  • Berechnungs/Speichereinheit (g):
  • Eine Einheit, die aus einer CPU, welche den g-Wert wie in Schritt (7) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des g-Werts aufgebaut ist.
  • Berechnungs/Speichereinheit (h):
  • Eine Einheit, die aus einer CPU, welche den D(j,n)-Wert wie in Schritt (8) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des D(j,n)-Werts aufgebaut ist.
  • Berechnungs/Speichereinheit (i):
  • Eine Einheit, die aus einer CPU, welche den Wj-Wert wie in Schritt (9) bestimmt berechnet, und einer Speichereinheit mit der Speicherung des Wj-Werts aufgebaut ist.
  • Zusätzlich kann das System zur Voraussage einer funktionellen Stelle gemäß der vierten Erfindung mit einer geeigneten Kombination der folgenden Einheiten (j) bis (l) versehen sein.
  • Anzeigeeinheit (j):
  • Eine Einheit, welche den Wj-Wert eines jeden Aminosäurerests wie mit der Einheit (i) gewonnen, in einer Verteilungskarte darstellt.
  • Berechnungs/Speichereinheit (k):
  • Eine Einheit, welche eine existierende Datenbank von dreidimensionalen Proteinstrukturen speichert, oder eine Einheit, welche ein dreidimensionales Strukturmodell auf der Basis einer Aminosäuresequenz nach einem bekannten Verfahren erstellt und die dreidimensionale Struktur speichert.
  • Anzeigeeinheit (l):
  • Eine Einheit, welche den Wj-Wert eines jeden Aminosäurerests in einer Verteilungskarte in der dreidimensionalen Struktur, die in der Datenbank gespeichert ist oder dem dreidimensionalen Strukturmodell, das in der Einheit (k) registriert ist, darstellt.
  • Das System der vorliegenden Erfindung kann neben diesen Einheiten (a) bis (l) gewünschtenfalls mit einer Tastatur (m) und einer Steuerungseinheit (n) und dgl. ausgerüstet sein, wie in 12 dargestellt.
  • Die fünfte Erfindung ist ein Verfahren zur Modifizierung der bekannten Funktion eines Proteins "A", abgeleitet von den gesamten mutmaßlichen Proteinen eines Organismus "a" mit bekannten Genom-Daten oder cDNA-Analyse-Daten, welches im Wesentlichen die folgenden Schritte (1) bis (10) umfasst.
  • Schritt (1):
  • Extrahieren von Proteinen, die mit dem Protein "A" eng verwandt sind, aus einer existierenden Proteindatenbank und Unterwerfen der Proteine einer Zuordnung.
  • Schritte (2) bis (7):
  • Unterwerfen der Aminosäuresequenzen der gesamten Proteine des Organismus "a" den Schritten (1) bis (6) gemäß dem Verfahren der ersten Erfindung.
  • Schritt (8):
  • Auswählen mindestens eines Aminosäurerests, der einer Mutation unterworfen werden soll, aus der Aminosäuresequenz der Länge (L) des Proteins "A" auf der Grundlage der Zuordnungsdaten, die in Schritt (1) gewonnen wurden, Wiederholen der Schritte (3) bis (6) nacheinander für einen Varianten-Aminosäurerest verschiedener mutierter Aminosäuresequenzen, worin der ausgewählte Aminosäurerest zu einem anderen Aminosäurerest mutiert wurde, um den Zj-Wert des Varianten-Aminosäurerests zu bestimmen.
  • Schritt (9):
  • Auswählen einer mutierten Aminosäuresequenz, worin der Zj-Wert des Varianten-Aminosäurerests wie in Schritt (8) bestimmt größer oder kleiner ist als der Zj-Wert des unveränderten Aminosäurerests wie in Schritt (7) bestimmt.
  • Schritt (10):
  • Herstellen eines modifizierten Gens des Proteins "A", welches Gen für die Mutanten-Aminosäuresequenz codiert, die in Schritt (9) ausgewählt wurde, und Exprimieren des modifizierten Gens in einem geeigneten Wirt-Vektor-System zur Herstellung von modifiziertem Protein "A".
  • Die sechste Erfindung ist ein Verfahren zur Modifizierung der Funktion eines Proteins "B", abgeleitet von dem Organismus "b" mit unbekannten Genom-Daten oder cDNA-Analyse-Daten, welches im Wesentlichen die folgenden Schritte (1) bis (10) umfasst.
  • Schritt (1):
  • Extrahieren eines Proteins "A", das mit dem Protein "B" am engsten verwandt ist, aus den gesamten mutmaßlichen Proteinen des Organismus "a" mit bekannten Genom-Daten oder cDNA-Analyse-Daten und Unterwerfen des Proteins "A" einer Zuordnung oder Extrahieren von Proteinen, die mit dem Protein "B" eng verwandt sind, aus einer existierenden Proteindatenbank, um die Proteine einer Zuordnung zu unterwerfen.
  • Schritte (2) bis (8):
  • Durchführen der Schritte (2) bis (8) des Verfahrens der dritten Erfindung bei den Aminosäuresequenzen der gesamten Proteine des Organismus "a".
  • Schritt (9):
  • Auswählen einer Position, die mutiert werden soll, und eines Aminosäurerests, der ersetzt werden soll, wobei der Zj-Wert des ersetzten Aminosäurerests wie im Schritt (8) bestimmt größer oder kleiner ist als der Zj-Wert des unveränderten Aminosäurerests wie in Schritt (7) bestimmt.
  • Schritt (10):
  • Herstellen eines modifizierten Gens des Proteins "B" nach einem bekannten Verfahren, welches Gen für die Aminosäuresequenz codiert, die an der Position zu einem anderen Aminosäurerest als in Schritt (9) ausgewählt mutiert ist, und Exprimieren des modifizierten Gens in einem geeigneten Wirt-Vektor-System, um modifiziertes Protein "B" herzustellen.
  • Wie oben beschrieben, sind die Verfahren zur Modifizierung der Proteinfunktion in der fünften und sechsten Erfindung, umfassend das Verfahren zur Voraussage einer funktionellen Stelle der ersten Erfindung, dadurch gekennzeichnet, dass eine unbekannte funktionelle Stelle eines Proteins neu gefunden und einer Mutation unterworfen wird.
  • Ferner verwendet das Verfahren zur Modifizierung einer Proteinfunktion gemäß der siebten Erfindung ebenfalls das Verfahren zur Voraussage der Funktion gemäß der zweiten Erfindung, wodurch das Verfahren auf dieselbe Weise wie im Falle der fünften Erfindung durchgeführt werden kann.
  • Die thermophile DNA-Polymerase der achten und neunten Erfindung ist spezieller ein Enzym, welches durch Modifizierung gemäß der sechsten Erfindung einer thermophilen Pfu-DNA-Polymerase, abgeleitet von Pyrococcus furiosus, in einer Genmanipulationstechnik nach dem bekannten Verfahren zur Herstellung eines Mutantengens (Strategies, Bd. 9, S. 3- 4, 1996) hergestellt wurde (die thermophile DNA-Polymerase der vorliegenden Erfindung wird manchmal als "modifizierte Pfu-DNA-Polymerase" bezeichnet). Das Enzym kann wie folgt hergestellt werden.
  • Nachdem die Nukleotidsequenz des Gens von Pfu-DNA-Polymerase bekannt ist (Nucleic Acids Research, Bd. 21, S. 259-265, 1993), wird das Gen von Pfu-DNA-Polymerase mittels PCR, umfassend die synthetische Herstellung eines Oligopeptids, welches zu beiden Enden komplementär ist, unter Verwendung der Genom-DNA des Archaebacteriums als Matrize und Verwendung des Oligopeptids als Primer hergestellt. Das DNA-Fragment des Gens wird in einen Vektor kloniert und das Gen wird anschließend einer Mutation nach dem in der oben zitierten Referenz beschriebenen Verfahren unterworfen. Gemäß der vorliegenden Erfindung wurde insbesondere die Mutation des Gens durch Nukleotidsubstitution durchgeführt, so dass ein Teil der Aminosäuresequenz von Pfu-DNA-Polymerase durch die Aminosäurereste von KOD-DNA-Polymerase ersetzt sein kann. Bezüglich der Aminosäuresequenz hat Pfu-DNA-Polymerase etwa 80 % Homologie mit KOD-DNA-Polymerase und deshalb tritt eine ähnliche Synthesetermination bei der PCR auf (13), jedoch ist die Verlängerungsrate mit KOD-DNA-Polymerase etwa das 6fache der Rate mit Pfu-DNA-Polymerase. Durch Ersatz einiger Aminosäurereste von Pfu-DNA-Polymerase durch einige Aminosäurereste von KOD-DNA-Polymerase könnte die Synthesetermination der Kettenverlängerung verbessert werden oder die Verlängerungsrate erhöht werden, was möglicherweise die Gewinnung eines Enzyms ermöglicht, das zur Verlängerung einer DNA-Kette mittels Synthese länger imstande ist. Durch Expression des in einer solchen Weise mutierten Mutantengens in Escherichia coli und Gewinnung und Reinigung des Expressionsprodukts wurde die modifizierte Pfu-DNA-Polymerase der vorliegenden Erfindung gewonnen.
  • Die thermophile DNA-Polymerase (modifizierte Pfu-DNA-Polymerase I) der achten Erfindung ist spezieller ein Enzym der Aminosäuresequenz von SEQ-ID-Nr. 1. Die Aminosäuresequenz ist eine neue Sequenz, hergestellt durch Identifizierung potentiell funktions-modifizierbarer Aminosäurereste der Aminosäuresequenz der herkömmlicherweise bekannten Pfu-DNA-Polymerase nach dem erfindungsgemäßen Verfahren zur Voraussage einer funktionellen Stelle und Substitution der Aminosäurereste wie in Tabelle 1 gezeigt. Durch anschließende Verwendung des neuen Enzyms zur DNA-Synthese mittels PCR wird beispielsweise die Synthesetermination, welche auftritt, wenn die herkömmlichen DNA-Polymerasen verwendet werden, fast vollständig überwunden, wie in den folgenden Beispielen gezeigt. Es ist unnötig zu sagen, dass Matrizen-DNA-Ketten, die mit der herkömmlichen Polymerase hoch effizient amplifiziert werden sollen, auf dieselbe Weise mit hoher Effizienz amplifiziert werden können.
  • Ferner sind die thermophilen DNA-Polymerasen (modifizierte Pfu-DNA-Polymerasen II und III) der neunten Erfindung spezieller Enzyme der Aminosäuresequenzen von SEQ-ID-Nr. 6 und 7, welche neue Sequenzen sind, hergestellt durch Identifizierung potentiell funktionsmodifizierbarer Aminosäurereste der Aminosäuresequenz der Pfu-DNA-Polymerase gemäß dem erfindungsgemäßen Verfahren zur Voraussage einer funktionellen Stelle und Substitution der Aminosäurereste wie in Tabelle 1 gezeigt. Durch anschließende Verwendung der neuen Enzyme für die DNA-Synthese mittels PCR können beispielsweise synthetische polymere Produkte in großem Maßstab gewonnen werden, wie in den folgenden Beispielen gezeigt.
  • Tabelle 1
    Figure 00310001
  • Die DNA-Sequenzen, welche für diese modifizierten Pfu-DNA-Polymerasen codieren, umfassen beispielsweise die Mutantengene des Pfu-DNA-Polymerase-Gens, wie während des Verfahrens der Enzymherstellung gewonnen. Bezüglich dieser Mutantengene wurden beispielsweise die DNA-Sequenzen, welche für die Aminosäuresequenzen von SEQ-ID-Nr. 1, 6 und 7 codieren, in die rekombinanten Plasmide p320, pDP5b17 bzw. pDP5C4 kloniert, und diese rekombinanten Plasmide wurden in Escherichia coli HMS174 (DE3) integriert und beim National Institute of Bioscience and Human-Technology, der Agency of Industrial Science and Technology, Japan (Hinterlegungs-Nrn. FERM P-16052, FERM BP-6189 bzw. FERM BP-6190), hinterlegt.
  • Ferner können die DNA-Sequenzen der vorliegenden Erfindung in geeigneter Weise als DNA-Sequenzen mit konjugierten Nukleotidcodons, welche den individuellen Aminosäureresten von SEQ-ID-Nr. 1, 6 oder 7 entsprechen, konstruiert werden.
  • Die thermophilen DNA-Polymerasen der vorliegenden Erfindung können in Mikroorganismen wie Escherichia coli exprimiert werden, welche danach gewonnen werden können. Durch Insertion und Integration der DNA-Sequenz in einen Expressionsvektor mit einem Replikationsursprung in einem Mikroorganismus, einem Promotor, einer Ribosomen-Bindungsstelle, einer cDNA-Klonierungsstelle und einem Terminator und dgl. zur Herstellung eines Expressionsvektors, Transformation einer Wirtszelle mit dem Expressionsvektor und danach Kultivierung der resultierenden Transformante kann ein Enzym, das von der DNA-Sequenz codiert wird, von dem Mikroorganismus in großem Maßstab produziert werden.
  • BEISPIELE
  • Die vorliegende Erfindung wird nun spezieller und detaillierter unter Bezugnahme auf Beispiele beschrieben werden, die Erfindung ist jedoch nicht auf die folgenden Beispiele beschränkt.
  • Beispiel 1
  • Gemäß dem Verfahren der ersten Erfindung und basierend auf den Genom-Daten von Methanococcus jannaschii (Bult et al., Science 273, 1058-1073, 1996) wurde Zj = –logYj (f = –log) berechnet bezüglich eines jeden Aminosäurerests in der Aminosäuresequenz (vom N-Terminus bis zum C-Terminus) einer postulierten DNA-Polymerase von dem mikrobiellen Gen MJ0885, von dem angenommen wird, dass es für die DNA-Polymerase vom α-Typ codiert. Die Ergebnisse sind in einer Verteilungskarte in 14 graphisch dargestellt.
  • Unter den Motiven, welche als die funktionellen Stellen der DNA-Polymerase vom α-Typ bekannt sind, wurden ferner das Motiv A und das Motiv C extrahiert und die Zj-Werte der individuellen Aminosäurereste wurden in 15 graphisch dargestellt. 15 und 16 unten legen nahe, dass die Zj = –logYj-Werte von Aminosäureresten, welche für die Funktion verantwortlich sind, größer sind als diejenigen der restlichen Aminosäurereste.
  • 16 stellt eine Verteilungskarte der Häufigkeit des Werts Zj = –logYj für die Aminosäuresequenz der von MJ0885 codierten DNA-Polymerase vom α-Typ dar. Es wird in der Figur bestätigt, dass Aminosäurereste mit einem Wert Zj = –logYj von 4,8 oder mehr sehr wahrscheinlich Aminosäurereste sind, die für die Proteinfunktion verantwortlich sind.
  • Beispiel 2
  • Gemäß der Karte in 15 in Beispiel 1 wurden die charakteristischen Eigenschaften der α-Typ-DNA-Polymerase Pfu (DDBJ-Hinterlegungs-Nr. D12983), welche aus Pyrococcus furiosus stammt, auf Grundlage der Aminosäuresequenz einer α-Typ-DNA-Polymerase KOD (DDBJ-Hinterlegungs-Nr. D29671), weiche aus Pyrococcus sp. stammt, und der Genom-Daten von Methanococcus jannaschii (Bult et al., Science 273, 1058-1073, 1996) und der Aminosäuresequenz der von MJ0885 codierten α-Typ-DNA-Polymerase (hier als MJ bezeichnet) modifiziert.
  • 17 stellt Zuordnungskarten der Aminosäuresequenzen der C-Motive von Pfu, KOD und MJ dar, wobei es keinen Unterschied zwischen der Region 531 bis 544 von Pfu und MJ gibt.
  • 18 stellt die Ergebnisse der Voraussage funktioneller Stellen in den Aminosäuresequenzen der Motive C von Pfu, KOD und MJ nach dem Verfahren der Erfindung auf Basis der Genom-Daten von Methanococcus jannaschii dar. Die Ergebnisse zeigen an, dass die Mutationen IIe540Ser, Leu545Phe, Tyr546Phe und IIe568Thr die Zj = –logYj-Werte der Aminosäurereste erhöhen. Ferner waren die Werte Zj = –logYj von Asp541 und Ala547 erhöht. Durch Unterwerfen der α-Typ-DNA-Polymerase MJ von Methanococcus jannaschii einer solchen Mutation wird die resultierende Sequenz stärker einmalig (spezifisch), welches möglicherweise die Verbesserung einiger Funktionen mit sich bringt.
  • Beispiel 3
  • Basierend auf den Genom-Daten von Methanococcus jannaschii (Bult et al., Science 273, 1058-1073, 1996), wurden die Werte Z(j,1) = –logY(j,1), Z(j,3) = –logY(j,3), Z(j,4) = –logY(j,4) und Z(j,5) = –logY(j,5) bezüglich der individuellen Aminosäurereste der Aminosäuresequenz (von den N- bis C-Termini) einer postulierten DNA-Polymerase auf Basis des mikrobiellen Gens MJ0885, von dem angenommen wird, dass es für die α-Typ-DNA-Polymerase codiert, nach dem Verfahren der zweiten Erfindung berechnet, so dass Wj = Z(j,3) – Z(j,1) (h = Z(j,3) – Z(j,1)) berechnet wurde. Gleichermaßen wurden Wj = Z(j,4) – Z(j,3) (h = Z(j,4) – Z(j,3)) und Wj = Z(j,5) – Z(j,3) (h = Z(j,5) – Z(j,3)) ebenfalls berechnet.
  • 19 stellt die Ergebnisse der 100 Reste vom N-Terminus in einer graphisch dargestellten Verteilungskarte dar. Mit der Maßgabe, dass h = Z(j,5) – Z(j,3), liegen Regionen mit signifikant verschiedenen Verteilungen von denjenigen der verbleibenden beiden Fälle in der Region vom 35. bis 60. Rest vor und dgl. Die Verteilungen zeigen an, dass kleinere Wj = Z(j,5) – Z(j,3) die Aminosäuresequenz spezieller charakterisieren.
  • Unter den Motiven, welche als die funktionellen Stellen der α-Typ-DNA-Polymerasen bekannt sind, wurden ferner Regionen, die exol, exoll, Motiv A, Motiv B und Motiv C enthalten, extrahiert und anschließend wurden die Wj-Werte der individuellen Aminosäurereste in 20 graphisch dargestellt. Wie in 20 gezeigt, stimmen die Regionen mit der charakteristischen Verringerung von Wj mit den funktionellen Stellen überein.
  • Beispiel 4
  • 21 stellt die Werte Wj = D(j,3) und Wj = D(j,5) individueller Aminosäurereste in den Regionen dar, welche exol, exoll, Motiv A, Motiv B und Motiv C, extrahiert unter den Motiven, welche als funktionelle Stellen in den α-Typ-DNA-Polymerasen bekannt sind (h = D(j,3) und h = D(j,5)), enthalten. Aminosäurereste mit Wj = D(j,n) von 2 oder mehr oder 2 oder weniger liegen außerhalb der Motive und diese Aminosäurereste sind Kandidaten für neue funktionelle Stellen.
  • Beispiel 5
  • 22 stellt in dunkler Farbe die Positionen von Aminosäureresten mit Wj = D(j,3) von 2 oder mehr oder 2 oder weniger in der Aminosäuresequenz von MJ0232, welche als Enolase von Methanococcus jannaschii postuliert wird, in einem dreidimensionalen Strukturmodell, hergestellt auf Grundlage der Enolase von knospender Hefe, dar. Es wird angezeigt, dass Reste, welche in der Aminosäuresequenz auseinander liegen, in der dreidimensionalen Struktur nahe beieinander positioniert sind.
  • Beispiel 6
  • Modifizierte Pfu-DNA-Polymerase I wurde mittels Durchführung der Mutation mutmaßlicher Aminosäurereste zur Verbesserung der Funktion der DNA-Polymerase MJ in Beispiel 2 bei der Pfu-DNA-Polymerase hergestellt.
  • (1) Herstellung eines modifizierten Pfu-DNA-Polymerase-Gens
  • Klonierung des Pfu-DNA-Polymerase-Gens:
  • Gemäß der Nukleotidsequenz des Pfu-DNA-Polymerase-Gens (Nucleic Acids Research, Bd. 21, S. 259-265, 1993) wurde ein PCR-Primer hergestellt zur Amplifizierung des betreffenden Gens mittels PCR unter Verwendung der Genom-DNA von P. furiosus als Matrize, welches dann in einen Expressionsvektor für Escherichia coli kloniert wurde. Die Details sind im folgenden beschrieben.
  • P. furiosus DSM3638 wurde nach dem in der oben beschriebenen Referenz beschriebenen Verfahren kultiviert. Zunächst wurde das in der Referenz beschriebene Kulturmedium hergestellt, es folgte eine Sterilisation bei hoher Temperatur unter Druck, und anschließend wurde Stickstoffgas in das resultierende Kulturmedium geblasen. Das Kulturmedium wurde mit dem Bakterium angeimpft für eine stationäre Kultivierung bei 95° C für 15 h. Aus 200 ml Kulturbouillon wurden Bakterien von etwa 0,5 mg mittels Zentrifugation gewonnen. Die gewonnenen Bakterien wurden in Puffer A (10 mM Tris/HCl (pH 8,0), 1 mM EDTA, 100 mM NaCl) suspendiert, gefolgt von Zugabe von 1 ml 10 % SDS und anschließendem Schütteln, und zur resultierenden Suspension wurden 0,5 mg Proteinase K für eine Reaktion bei 55° C für 60 Minuten zugegeben. Die Reaktionslösung wurde nacheinander mit Phenol, Phenol/-Chloroform und Chloroform extrahiert und zu dem Extrakt wurde Ethanol zugegeben, um die DNA unlöslich zu machen, welche dann gewonnen wurde. Die resultierende DNA wurde in 1 ml TE-Puffer (10 mM Tris/HCl (pH 8,0), 1 mM EDTA) gelöst, gefolgt von der Zugabe von 0,5 mg RNase A für eine Reaktion bei 37° C für 60 Minuten und erneute Extraktion nacheinander in Phenol, Phenol/Chloroform und Chloroform und anschließende Ethanolfällung, um die DNA zu gewinnen, welche dann in dem TE-Puffer gelöst wurde, um die DNA mit etwa 0,3 mg zu gewinnen.
  • Zur PCR-Amplifizierung des betreffenden DNA-Polymerase-Gens wurden dann zwei Primer-DNAs von SEQ-ID-Nr. 2 und 3 auf Basis der bekannten Sequenzdaten synthetisiert. Konkreter wurden sie so konstruiert, dass das Initiationscodon ATG des betreffenden Gens und eine Restriktionsnuklease-Ncol-Sequenz (5'-CCATGG-3') in die Vorwärts-Primer-Sequenz eingeführt werden könnte, während der reverse Primer an einer geeigneten Position stromabwärts des Terminationscodons gebunden werden könnte. PCR wurde in einem Reaktionssystem von 50 μl unter Verwendung von 2 μg P. furiosus-DNA und 10 pmol eines jeden der Primer unter Bedingungen für LA-Taq (hergestellt von TaKaRa Brewery) und Begleitpuffern durchgeführt. Die Zyklisierungsbedingungen waren wie folgt: 93° C/3 Minuten vor der Zugabe des Enzyms und 30 Zyklen, wobei jeder Zyklus 94° C für 0,5 Minuten, 55° C für 0,5 Minuten und 72° C für 1,0 Minuten umfasste. Das amplifizierte DNA-Fragment wurde gereinigt, gefolgt von Behandlung mit Ncol, und das resultierende DNA-Fragment wurde gleichermaßen mit Ncol gespalten und anschließend glattendig gemacht und das resultierende Fragment wurde dann stromabwärts des T7-Promotors eines Ncol-behandelten Expressionsvektors pET-15b integriert. Der Expressionsvektor wurde als pDPwT100 definiert, um die Nukleotidsequenz des inserierten Gens zu bestätigen.
  • Modifizierung des Pfu-DNA-Polymerase-Gens:
  • Gemäß dem bekannten Verfahren (Strategies, Bd. 9, S. 3-4, 1996) und für den Expressionsvektor pDPWT100 mit dem darin integrierten Pfu-DNA-Polymerase-Gen wurde ein modifiziertes Pfu-DNA-Polymerase-Gen hergestellt in dem Expressionsvektor pDPWT100 unter Verwendung von Oligopeptiden, welche die gewünschten Mutationen enthielten (SEQ-ID-Nr. 4 und 5), und des von Promega Corporation hergestellten Mutations-Induktionskits, wodurch ein Expressionsvektor pDP320 konstruiert wurde. Durch Bestimmung der Nukleotidsequenz des modifizierten Gens wurde ferner die Aminosäuresequenz der modifizierten Pfu-DNA-Polymerase (SEQ-ID-Nr. 1) verifiziert.
  • (2) Expression und Reinigung der modifizierten Pfu-DNA-Polymerase in Escherichia coli
  • Das Gen der modifizierten Pfu-DNA-Polymerase I wurde in Escherichia coli wie folgt exprimiert, welches dann gereinigt wurde.
  • Der Expressionsvektor pDP320 mit dem modifizierten Pfu-DNA-Polymerase-Gen wurde in Escherichia coli HMS174 (DE3) inseriert und in einem LB-Kulturmedium, das mit IPTG bis zu einer Endkonzentration von 0,1 mM ergänzt worden war, für 14 h kultiviert, um die Expression des Enzyms in den Bakterien von Escherichia coli zu induzieren, Nach Gewinnung der Bakterien durch Zentrifugation wurde eine modifizierte Pfu-DNA-Polymerase unter Ultraschallbehandlung in einem Puffer extrahiert, der 150 mM Tris/HCl (pH 7,5), 2 mM EDTA, 0,24 mM APMSF und 0,2 % Tween 20 enthielt. Die Lösung des Rohextrakts wurde thermisch bei 80° C für 15 Minuten behandelt, um die aus Escherichia coli stammende DNA-Polymerase zu inaktivieren und die DNA-Polymerase der vorliegenden Erfindung teilweise zu reinigen. Die partiell gereinigte Fraktion wurde gegen einen Puffer dialysiert, der aus 50 mM Tris/HCl (pH 7,5), 1 mM EDTA, 0,2 % Tween 20, 7 mM 2-Mercaptoethanol und 10 % Glycerin bestand. In diesem Stadium wurde eine DNA-Polymerase-Aktivität nachgewiesen, weiche spezifisch für die modifizierte Pfu-DNA-Polymerase 1 war.
  • Beispiel 7
  • Unter Verwendung der modifizierten Pfu-DNA-Polymerase I, die in Beispiel 6 teilweise gereinigt worden war, wurde die Primerverlängerungsreaktion einer DNA-Kette, die komplementär zu der Matrizen-DNA war, getestet.
  • 1 μg der oben beschriebenen partiell gereinigten Enzymfraktion wurde in 20 μl einer Reaktionslösung, die 20 mM Tris/HCl (pH 8,0), 2 mM MgCl2, 50 μg/ml BSA, 0,1 % Triton X-100, jeweils 1 mM kalter dNTPs (0,1 mM für dCTP), 0,63 μg von pBLUESCRIPT-Plasmid, präpariert durch Verschmelzen von 10 μCi[α-32P]dCTP und eines Primers von M13 (–21), enthielt, für eine Reaktion bei 75° C für eine Minute und drei Minuten eingebracht. Die verlängerte DNA-Kette wurde mittels Elektrophorese auf einem Polyacrylamidgel, das 8 M Harnstoff enthielt, aufgetrennt und das resultierende Muster wurde mit einem Bild-Analysator analysiert. Als Kontrolle wurde zusätzlich die herkömmliche Wildtyp-Pfu-DNA-Polymerase für dieselbe DNA-Synthese verwendet.
  • Die Ergebnisse sind in 23 gezeigt. Wenn die herkömmliche Wildtyp-Pfu-DNA-Polymerase verwendet wurde, wurden mindestens 10 Banden, welche die Anwesenheit unvollständiger DNA-Fragmente aufgrund von Synthesetermination anzeigten, beobachtet. Jedoch verschwanden diese Banden bei der DNA-Synthese mit der modifizierten Pfu-DNA-Polymerase I der vorliegenden Erfindung. Alternativ wurde kein Unterschied bei der Anhäufung hoch verlängerter DNA-Fragmente um 1000 Basen beobachtet.
  • Beispiel 8
  • Die Pfu-DNA-Polymerasen II und III dieser Erfindung wurden hergestellt.
  • (1) Herstellung von modifiziertem Pfu-DNA-Polymerase-Gen
  • In der gleichen Weise wie in Beispiel 6 (1) wurde das Pfu-DNA-Polymerase-Gen kloniert, um die modifizierten Gene II und III wie folgt herzustellen.
  • Herstellung von modifizierter Pfu-DNA-Polymerase II:
  • Nach dem bekannten Verfahren (Strategies, Bd. 9, S. 3-4, 1996) und für den Expressionsvektor pDPWT100 mit dem darin integrierten klonierten Pfu-DNA-Polymerase-Gen wurde das Gen von modifizierter Pfu-DNA-Polymerase II in dem Expressionsvektor pDPWT100 unter Verwendung von Oligopeptiden, welche die gewünschten Mutationen enthielten (SEQ-ID-Nr. 8 und 9), und des von Promega Corporation hergestellten Mutations-Induktionskits hergestellt, wodurch ein Expressionsvektor pDP5b17 konstruiert wurde. Durch Bestimmung der Nukleotidsequenz des modifizierten Gens wurde ferner die Aminosäuresequenz der modifizierten Pfu-DNA-Polymerase II (SEQ-ID-Nr. 6) bestätigt.
  • Herstellung des Gens von modifizierter Pfu-DNA-Polymerase III:
  • Mit dem gleichen Verfahren wie oben beschrieben, mit Ausnahme der Verwendung der Oligonukleotide der SEQ-ID-Nrn. 10 und 11, wurde das Gen von modifizierter Pfu-DNA-Polymerase III hergestellt, um einen Expressionsvektor pDP5C4 zu konstruieren. Durch Bestimmung der Nukleotidsequenz des modifizierten Gens wurde die Aminosäuresequenz (SEQ-ID-Nr. 7) der modifizierten Pfu-DNA-Polymerase III bestätigt.
  • (2) Expression in Escherichia coli und Reinigung der modifizierten Pfu-DNA-Polymerasen II und III
  • Die so hergestellten Gene der modifizierten Pfu-DNA-Polymerasen II und III wurden in Escherichia coli wie folgt exprimiert und dann gereinigt.
  • Die Expressionsvektoren pDP5b17 und pDP5C4 wurden unabhängig in Escherichia coli HMS174 (DE3) inseriert und in einem LB-Kulturmedium, das mit IPTG auf eine Endkonzentration von 0,1 mM ergänzt worden war, 14 h lang kultiviert, um die Expression der Enzyme in den Escherichia coli zu induzieren. Nach Gewinnung der Bakterien durch Zentrifugation wurden modifizierte Pfu-DNA-Polymerasen II und III extrahiert mittels Ultraschallbehandlung in einem Puffer, der 150 mM Tris/HCl (pH 7,5), 2 mM EDTA, 0,24 mM APMSF und 0,2 % Tween 20 enthielt. Die Lösung des Rohextrakts wurde 15 Minuten lang bei 80° C thermisch behandelt, um die von Escherichia coli stammenden DNA-Polymerasen zu inaktivieren und die modifizierten DNA-Polymerasen II und III partiell zu reinigen. Die partiell gereinigten Fraktionen wurden gegen einen Puffer dialysiert, der aus 50 mM Tris/HCl (pH 7,5), 1 mM EDTA, 0,2 % Tween 20, 7 mM 2-Mercaptoethanol und 10 % Glycerin bestand. In diesem Stadium wurden DNA-Polymerase-Aktivitäten nachgewiesen, welche für die modifizierten Pfu-DNA-Polymerasen II und III spezifisch waren.
  • Beispiel 9
  • Durch Verwendung der in Beispiel 8 teilweise gereinigten modifizierten Pfu-DNA-Polymerasen II und III wurde die Primerverlängerungsreaktion einer DNA-Kette, die komplementär zu der Matrizen-DNA war, getestet.
  • 1 μg einer jeden der oben beschriebenen partiell gereinigten Enzymfraktionen wurde in 20 μl einer Reaktionslösung, die 20 mM Tris/HCl (pH 8,0), 2 mM MgCl2, 50 μg/ml BSA, 0,1 % Triton X-100, jeweils 1 mM kalter dNTPs (0,1 mM für dCTP), 0,63 μg von pBLUESCRIPT-Plasmid, präpariert durch Verschmelzen von 10 μCi von [α- 32P]dCTP und eines Primers M13 (–21), enthielt, zur Reaktion bei 75° C für eine Minute und drei Minuten eingebracht. Die verlängerte DNA-Kette wurde durch Elektrophorese auf einem Polyacrylamidgel, das 8 M Harnstoff enthielt, separiert und das resultierende Muster wurde mit einem Bild-Analysator analysiert. Als Kontrolle wurde zusätzlich die herkömmliche Wildtyp-Pfu-DNA-Polymerase für dieselbe DNA-Synthese verwendet.
  • Die Ergebnisse sind in 24 gezeigt. Wenn die herkömmliche Wildtyp-Pfu-DNA-Polymerase verwendet wurde, wurden Banden beobachtet, welche die Anwesenheit unvollständiger DNA-Fragmente anzeigten, aufgrund der Anwesenheit einer großen Region bei etwa 1000 Basen, wo ein Syntheseabbruch stattfand. Jedoch war die Ausbeute synthetisierter Produkte, welche diese Banden von etwa 1000 Basen einschlossen, bei der DNA-Synthese mit den modifizierten Pfu-DNA-Polymerasen II und III der vorliegenden Erfindung erhöht, zusammen mit Banden, welche die Anwesenheit von stärker polymeren (stärker verlängerten) PCR-Produkten unter Beobachtung anzeigten.
  • Die oben beschriebenen Ergebnisse weisen darauf hin, dass die DNA-Polymerasen der vorliegenden Erfindung DNA-Fragmente im Syntheseverlauf während der DNA-Synthese mittels PCR ausgeprägter verlängern können.
  • Industrielle Anwendbarkeit
  • Gemäß der vorliegenden Erfindung kann die funktionelle Stelle eines Proteins ohne durch Genom-Analyse oder cDNA-Analyse erhaltene Information über die Funktion vorausgesagt werden. Eine neue funktionelle Stelle eines Proteins mit einer bekannten Funktion kann ebenfalls vorausgesagt werden.
  • Die thermophilen DNA-Polymerasen, welche durch die vorliegende Erfindung bereitgestellt werden, können die volle Länge eines DNA-Fragments mittels PCR hoch effizient synthetisieren und amplifizieren, wodurch die in vitro-Synthese und Amplifizierung eines DNA-Fragments und dessen Nukleotidsequenzierung mit hoher Präzision auf einfache Weise erzielt werden kann.
  • SEQUENZVERZEICHNIS
    • SEQ-ID-Nr. 1 Länge: 775 Typ: Aminosäure Molekültyp: Protein Sequenz
      Figure 00400001
      Figure 00410001
      Figure 00420001
      Figure 00430001
      Figure 00440001
    • SEQ-ID-Nr. 2 Länge: 35 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz GTGGGGAGCA CCATGGTTTT AGATGTGGAT TACAT 35
    • SEQ-ID-Nr. 3 Länge: 35 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz GCATGCAGAT AGACCATTTC TAACGAAGGC GTTTG 35
    • SEQ-ID-Nr. 4 Länge: 66 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz CTCGAAGAAA AGTATGGATT TAAAGTCATC TACAGTGACA CTGATGGTTT CTTTGCAACT 60 ATCCCA 66
    • SEQ-ID-Nr. 5 Länge: 66 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz TGGGATAGTT GCAAAGAAAC CATCAGTGTC ACTGTAGATG ACTTTAAATC CATACTTTTC 60 TTCGAG 66
    • SEQ-ID-Nr. 6 Länge: 775 Typ: Aminosäure Molekültyp: Protein Sequenz
  • Figure 00450001
  • Figure 00460001
  • Figure 00470001
  • Figure 00480001
  • Figure 00490001
    • SEQ-ID-Nr. 7 Länge: 775 Typ: Aminosäure Molekültyp: Protein Sequenz
      Figure 00490002
      Figure 00500001
      Figure 00510001
      Figure 00520001
    • SEQ-ID-Nr. 8 Länge: 49 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz AGAGGCGATG GTCGAATTCG CGATAGGGCA ATTCCAGCTG AGGAATACG 49
    • SEQ-ID-Nr. 9 Länge: 49 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz CGTATTCCTC AGCTGGAATT GCCCTATCGC GAATTCGACC ATCGCCTCT 49
    • SEQ-ID-Nr. 10 Länge: 40 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz CCAATTAGCA ATAGGGCAAT TCCAGCTGAG GAATACGATC 40
    • SEQ-ID-Nr. 11 Länge: 40 Typ: Nukleinsäure Strängigkeit: einzelsträngig Topologie: linear Molekültyp: synthetische DNA Sequenz GATCGTATTC CTCAGCTGGA ATTGCCCTAT TGCTAATTGG 40

Claims (11)

  1. System zur automatischen Durchführung eines Verfahrens zur Voraussage einer funktionellen Stelle eines Proteins, abgeleitet von den gesamten mutmaßlichen Proteinen eines Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, welches Verfahren die Schritte umfasst: (1) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" und Feststellen der kleinsten Länge (n) von Oligopeptiden, welche die folgenden Kriterien erfüllen: unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen vorkommen; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, größer als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen vorkommen; (2) Berechnen der Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1), welches ein Teil der Aminosäuresequenz der Länge (L) des Proteins als Gegenstand zur Voraussage einer funktionellen Stelle ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-1) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält, in den gesamten Proteinen des Organismus "a"; Aj-Oligopeptid: aj1aj2....Aji....ajnaj(n+1)(worin 1 ≤ i ≤ n+1; Aj = Aji; und Aj der i-te Rest des Oligopeptids ist); und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1); Xi-Oligopeptid: aj1aj2....Xi....ajnaj(n+1)(worin der i-te Rest Xi irgendeine Aminosäure ist); (3) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids; (4) Berechnen des Mittelwerts Yj des Yji;
    Figure 00540001
    (5) Berechnen des Funktionswerts Zj von Yj; Zj = f(Yj) (worin die Funktion f eine monoton abnehmende Funktion oder eine monoton zunehmende Funktion ist), und Definieren des Zj-Werts als repräsentativen Wert der Funktion des j-ten Aminosäurerests Aj der Aminosäuresequenz der Länge (L) und (6) Wiederholen der Schritte (2) bis (5) nacheinander und Bestimmen des Zj-Werts eines jeden Aj aller Aminosäurereste an den Positionen zwischen n+1 ≤ j ≤ L-n in der Aminosäuresequenz der Länge (L), wodurch der Grad der Beteiligung eines jeden Aminosäurerests an der Funktion des Proteins vorausgesagt wird durch Verwendung der Dimension des Zj-Werts als Indikator, wobei das System mindestens die folgenden Einheiten (a) bis (g) umfasst; (a) eine äußere Speichereinheit, welche die Aminosäuresequenzdaten der gesamten mutmaßlichen Proteine des Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, speichert, sowie eine existierende Proteindatenbank; (b) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU (Zentralen Prozessierungseinheit), welche die Häufigkeit des Auftretens einer jeden Aminosäure und die Häufigkeit des Auftretens individueller Oligopeptide, gebildet von Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse; (c) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche die kleinste Länge (n) von Oligopeptiden berechnet, welche unter den individuellen Oligopeptiden, von denen die Häufigkeiten des Auftretens in der Einheit (b) gespeichert sind, die folgenden Kriterien erfüllen: unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, größer ist als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten; und einer Speichereinheit mit der Speicherung der (n); (d) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1) berechnet, das ein Teil der Aminosäuresequenz der Länge (L) des Proteins als Gegenstand zur Voraussage einer funktionellen Stelle ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-n) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....Aji....ajnaj(n+1)(worin 1 ≤ i ≤ n+1; Aj = Aji; und Aj der i-te Rest des Oligopeptids ist); und in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1) berechnet; Xi-Oligopeptid: aj1aj2....Xji....ajnaj(n+1)(worin der i-te Rest Xji irgendeine Aminosäure ist); und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse; (e) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche das Verhältnis Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids berechnet, und einer Speichereinheit mit der Speicherung von Yji; (f) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Mittelwert Yj des Yji berechnet;
    Figure 00560001
    und einer Speichereinheit mit der Speicherung von Yj; und (g) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Funktionswert Zj von Yj berechnet, Zj = f(Yj) (worin die Funktion f eine monoton abnehmende Funktion oder eine monoton zunehmende Funktion ist), und einer Speichereinheit mit der Speicherung von Zj.
  2. System nach Anspruch 1, wobei in dem mit dem System durchgeführten Verfahren der Zj-Wert (n+1 ≤ j ≤ L-n) eines jeden Aminosäurerests in der Aminosäuresequenz der Länge (L) in einer Verteilungskarte dargestellt wird.
  3. System nach Anspruch 1, welches ferner eine Anzeigeeinheit umfasst, welche den Zj-Wert (n+1 ≤ j ≤ L-n) eines jeden Aminosäurerests in der Aminosäuresequenz der Länge (L) in einer Verteilungskarte darstellt.
  4. System zur automatischen Durchführung eines Verfahrens zur Voraussage einer funktionellen Stelle eines Proteins, abgeleitet von den gesamten mutmaßlichen Proteinen eines Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, welches Verfahren die Schritte umfasst: (1) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a"; (2) bezüglich eines Proteins des Organismus "a", (2') Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids einer gegebenen Länge (n) (1 ≤ n ≤ M, mit der Maßgabe, dass M die kleinste Länge von Oligopeptiden ist, welche das Kriterium erfüllen, dass alle Oligopeptide der Länge M mit einer Häufigkeit 1 des Auftretens vorliegen), welches Aj-Oligopeptid ein Teil der Aminosäuresequenz der Länge (L) des Proteins ist und einen Aminosäurerest Aj (n ≤ j ≤ L-n+1) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....aji....ajn(worin 1 ≤ i ≤ n+1, Aj = aji und Aj der i-te Rest des Oligopeptids ist); und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n) entsprechend der Länge des Aj-Oligopeptids; Xi-Oligopeptid: aj1aj2....Xi....ajn(worin der i-te Rest Xi irgendeine Aminosäure ist), (3) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids; (4) Berechnen des Mittelwerts Y(j,n) des Yji;
    Figure 00570001
    (5) Berechnen des Funktionswerts Z(j,n) von Y(j,n); (6) Wiederholen der Schritte (2') bis (5) nacheinander und Bestimmen des Z(j,n)-Werts eines jeden Aminosäurerests Aj an der j-ten Position (n ≤ j ≤ L-n+1) in der Aminosäuresequenz der Länge (L); (7) Wiederholen der Schritte (2) bis (6) nacheinander für die gesamten Proteine des Organismus "a", wodurch die Verteilung des Z(j,n)-Werts eines jeden Aminosäurerests in den gesamten Proteinen bestimmt wird und die Z(j,n)-Werte in 20 gemäß den 20 Aminosäuren klassifiziert werden, und dann Berechnen des Mittelwerts Av(As) der Z(j,n)-Werte für jede Aminosäure As und der Standardabweichung Sd(As) von deren Verteilung, um auf der Basis der Verteilung eine Funktion g für den j-ten Aminosäurerest Aj eines Proteins für die Normalisierung der Differenz in der Verteilung aufgrund der Spezies der Aminosäurereste zu berechnen; g = (Z(j,n), Aj) = [Z(j,n) – Av(As)]/Sd(As) (worin Aj = As ist);(8) Berechnen eines Werts D(j,n) der Funktion g eines jeden Aj aller Aminosäurereste an der j-ten Position (n ≤ j ≤ L-n+1) eines Proteins in den gesamten Proteinen, wie in Schritt (7) gewonnen; D(j,n) = g(Z(j,n), Aj), und(9) Definieren des repräsentativen Werts der Funktion des j-ten Aminosäurerests in der Aminosäuresequenz der Länge (L) als Funktionswert Wj von Z(j,n) und D(j,n); Wj = h(Z(j,1),Z(j,2),....,Z(j,M),D(j,1),D(j,2),....,D(j,M))und dadurch Voraussagen des Grades der Beteiligung eines jeden Aminosäurerests an der Funktion des Proteins durch Verwendung der Dimension des Wj-Werts als Indikator, wobei das System mindestens die folgenden Einheiten (a) bis (i) umfasst; (a) eine äußere Speichereinheit, welche die Aminosäuresequenzdaten der gesamten mutmaßlichen Proteine des Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt sind, speichert, sowie eine existierende Proteindatenbank; (b) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche die Häufigkeit des Auftretens einer jeden Aminosäure und die Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" berechnet, und einer Speichereinheit mit der Speicherung der Berechnungsergebnisse; (c) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids einer gegebenen Länge (n) (1 ≤ n ≤ M, mit der Maßgabe, dass M die kleinste Länge von Oligopeptiden ist, welche das Kriterium erfüllen, dass alle Oligopeptide der Länge M eine Häufigkeit des Auftretens 1 aufweisen) berechnet, welches Aj-Oligopeptid ein Teil der Aminosäuresequenz der Länge (L) eines gegebenen Proteins des Organismus "a" ist und einen Aminosäurerest Aj (n ≤ j ≤ L-n+1) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....aji....ajn(worin 1 ≤ i ≤ n+1, Aj = aji und Aj der i-te Rest des Oligopeptids ist), und in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n) entsprechend der Länge des Aj-Oligopeptids berechnet; Xi-Oligopeptid: aj1aj2....Xji....ajn(worin der i-te Rest Xji irgendeine Aminosäure ist), und einer Speichereinheit, welche die Berechnungsergebnisse speichert; (d) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche das Verhältnis Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids berechnet, und einer Speichereinheit mit der Speicherung des Yji;, (e) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Mittelwert Y(j,n) des Yji berechnet;
    Figure 00590001
    und einer Speichereinheit mit der Speicherung von Y(j,n); (f) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Funktionswert Z(j,n) von Y(j,n) berechnet; Z(j,n) = –log(Y(j,n)),und einer Speichereinheit mit der Speicherung von Z(j,n); (g) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Z(j,n)-Wert eines jeden Aminosäurerests in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" berechnet, die Verteilung des Z(j,n)-Werts eines jeden Aminosäurerests in den gesamten Proteinen berechnet und die Z(j,n)-Werte entsprechend den 20 Aminosäureresten in 20 klassifiziert, und dann den Mittelwert Av(As) der Z(j,n)-Werte für jede Aminosäure As und die Standardabweichung Sd(As) von deren Verteilung berechnet, um auf Basis der Verteilung eine Funktion g zur Normalisierung der Differenz in der Verteilung aufgrund der Spezies von Aminosäureresten zu bestimmen; g = (Z(j,n), Aj) = [Z(j,n) – Av(As)]/Sd(As) (worin Aj = As)und einer Speichereinheit mit der Speicherung von g; (h) eine Berechnungs/Speichereinheit, aufgebaut aus einer CPU, welche den Wert (D(j,n) der Funktion g, die in der Einheit (g) gespeichert ist, bezüglich eines jeden der Aminosäurereste Aj an der j-ten Position (n ≤ j ≤ L-n+1) in der Aminosäuresequenz der Länge (L) berechnet; D(j,n) = g(Z(j,n), Aj)und einer Speichereinheit mit der Speicherung des D(j,n)-Werts; und (i) eine Berechnungs/Speichereinheit, aufgebaut aus einer Berechnungseinheit, welche einen angemessenen Funktionswert Wj der Z(j,n) und D(j,n) eines jeden Aminosäurerests in der Aminosäuresequenz berechnet; Wj = h(Z(j,1),Z(j,2),....,Z(j,M),D(j,1),D(j,2),....,D(j,M))und einer Speichereinheit mit der Speicherung des Wj-Werts.
  5. System nach Anspruch 4, wobei in dem mit dem System durchgeführten Verfahren der Wj-Wert eines jeden Aminosäurerests in einer zweidimensionalen Verteilungskarte dargestellt wird.
  6. System nach Anspruch 4, wobei in dem mit dem System durchgeführtem Verfahren der Wj-Wert eines jeden Aminosäurerests in einem dreidimensionalen Strukturmodell des Proteins dargestellt wird.
  7. System nach Anspruch 4, welches ferner eine Anzeigeeinheit umfasst, welche den Wj-Wert eines jeden Aminosäurerests in einer zweidimensionalen Verteilungskarte darstellt.
  8. System nach Anspruch 4, welches ferner eine Berechnungs/Speichereinheit umfasst, welche eine existierende Datenbank der dreidimensionalen Struktur von Proteinen speichert oder ein dreidimensionales Strukturmodell auf der Basis einer Aminosäuresequenz nach einem bekannten Verfahren erstellt und das dreidimensionale Strukturmodell speichert, und eine Anzeigeeinheit umfasst, welche den Wj-Wert eines jeden Aminosäurerests in der Aminosäuresequenz in einer Verteilungskarte bezüglich der dreidimensionalen Struktur, die in der Datenbank gespeichert ist, oder des dreidimensionalen Strukturmodells, das in der Berechnungs/Speichereinheit gespeichert ist, darstellt.
  9. Verfahren zur Modifizierung der bekannten Funktion eines Proteins "A", abgeleitet von den gesamten Proteinen eines Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt waren, welches Verfahren die Schritte umfasst: (1) Extrahieren eines Proteins, das eng mit dem Protein "A" verwandt ist, aus einer existierenden Protein-Datenbank und Unterwerfen der Proteine einer Zuordnung; (2) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a", und Bestimmen der kleinsten Länge (n) von Oligopeptiden, welche die folgenden Kriterien erfüllen: unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen vorkommen; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen vorkommen, größer als die Anzahl der Oligopeptide, die zweimal in den gesamten Proteinen vorkommen; (3) Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1), welches ein Teil der Aminosäuresequenz der Länge (L) des Proteins "A" ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-n) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Aj-Oligopeptid: aj1aj2....Aji....ajnaj(n+1)(worin 1 ≤ i ≤ n+1, Aj = Aji, und Aj der i-te Rest des Oligopeptids ist), und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1); Xi-Oligopeptid: aj1aj2....Xji....ajnaj(n+1)(worin der Rest Xji irgendeine Aminosäure ist); (4) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids; (5) Berechnen des Mittelwerts Yj des Yji;
    Figure 00610001
    (6) Berechnen des Funktionswerts Zj von Yj; Zj = f(Yj) (worin die Funktion f eine monoton abnehmende Funktion oder monoton zunehmende Funktion ist), und Definieren des Zj-Werts als repräsentativen Wert der Funktion des j-ten Aminosäurerests der Aminosäuresequenz der Länge (L) des Proteins "A"; (7) Wiederholen der Schritte (3) bis (6) nacheinander und Bestimmen des Zj-Werts eines jeden Aminosäurerests an der Position zwischen n+1 ≤ j ≤ L-n in der Aminosäuresequenz der Länge (L); (8) Auswählen mindestens eines Aminosäurerests, der einer Mutation unterworfen werden soll, auf Basis der in Schritt (1) erhaltenen Zuordnungsdaten aus der Aminosäuresequenz der Länge (L) des Proteins "A", Wiederholen der Schritte (3) bis (6) nacheinander für Varianten-Aminosäurereste in verschiedenen mutierten Aminosäuresequenzen, worin der ausgewählte Aminosäurerest zu einem anderen Aminosäurerest mutiert wurde, um den Zj-Wert der Varianten-Aminosäurereste zu bestimmen; (9) Auswählen einer mutierten Aminosäuresequenz, wobei der Zj-Wert des Varianten-Aminosäurerests wie in Schritt (8) bestimmt größer oder kleiner ist als der Zj-Wert des Wildtyp-Aminosäurerests wie in Schritt (7) bestimmt, und (10) Herstellen eines modifizierten Gens, welches für die modifizierte Aminosäuresequenz von dem Protein "A"-Gen codiert, und Herstellen des modifizierten Proteins als Expressionsprodukt des Gens.
  10. Verfahren zur Modifizierung der Funktion eines Proteins "B",abgeleitet von einem Organismus "b", von dem Genom-Daten oder cDNA-Daten unbekannt waren, welches Verfahren die Schritte umfasst: (1) Extrahieren eines Proteins "A", welches mit dem Protein "B" am engsten verwandt ist, aus den gesamten Proteinen des Organismus "a", von dem genomische Daten oder cDNA-Daten bekannt sind, und Unterwerfen des Proteins einer Zuordnung oder Extrahieren eines Proteins, das mit dem Protein "B" eng verwandt ist, aus einer existierenden Proteindatenbank, um das Protein einer Zuordnung zu unterwerfen; (2) Berechnen in den Aminosäuresequenzen der gesamten Proteine des Organismus "a" die Häufigkeit des Auftretens einer jeden Aminosäure und die Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, und Bestimmen der kleinsten Länge (n) von Oligopeptiden, welche die folgenden Kriterien erfüllen: unter den Oligopeptiden der Länge (n) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, kleiner als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten; unter den Oligopeptiden der Länge (n+1) ist die Anzahl der Oligopeptide, welche einmal in den gesamten Proteinen auftreten, größer als die Anzahl der Oligopeptide, welche zweimal in den gesamten Proteinen auftreten; (3) Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids der Länge (n+1), welches ein Teil der Aminosäuresequenz der Länge (L) des Proteins "A" ist und einen Aminosäurerest Aj (n+1 ≤ j ≤ L-n) an der j-ten Position vom N-Terminus der Aminosäuresequenz des Proteins enthält; Ai-Oligopeptid: aj1aj2....Aji....ajnaj(n+1)(worin 1 ≤ i ≤ n+1, Aj = Aji, und Aj der i-te Rest des Oligopeptids ist), und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n+1); Xi-Oligopeptid: aj1aj2....Xji....ajnaj(n+1)(worin der i-te Rest Xji irgendeine Aminosäure ist); (4) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids; (5) Berechnen des Mittelwerts Yj des Yji;
    Figure 00630001
    (6) Berechnen des Funktionswerts Zj von Yj; Zj = f(Yj) (worin die Funktion feine monoton abnehmende Funktion oder eine monoton zunehmende Funktion ist), und Definieren des Zj-Werts als repräsentativen Wert der Funktion des j-ten Aminosäurerests Aj der Aminosäuresequenz der Länge (L) des Proteins "A"; (7) Wiederholen der Schritte (3) bis (6) nacheinander und Bestimmen des Zj-Werts eines jeden der Aminosäurereste an der Position zwischen n+1 ≤ j ≤ L-n in der Aminosäuresequenz der Länge (L); (8) Auswählen mindestens eines Aminosäurerests, der einer Mutation unterworfen werden soll, auf Grundlage der in Schritt (1) erhaltenen Zuordnungsdaten aus der Aminosäuresequenz der Länge (L) des Proteins "A", Wiederholen der Schritte (3) bis (6) nacheinander für Varianten-Aminosäurereste in verschiedenen mutierten Aminosäuresequenzen, worin der ausgewählte Aminosäurerest zu anderen Aminosäureresten mutiert wurde, um den Zj-Wert der Varianten-Aminosäurereste festzustellen; (9) Auswählen der Mutationsposition und des mutierten Aminosäurerestes, wobei der Zj-Wert des Varianten-Aminosäurerests wie in Schritt (8) bestimmt größer oder kleiner ist als der Zj-Wert des Wildtyp-Aminosäurerests wie in Schritt (7) bestimmt; und (10) Herstellen eines modifizierten Gens, welches für die modifizierte Aminosäuresequenz mit dem mutierten Aminosäurerest an der Position von dem Protein "B"-Gen codiert, und Herstellen des modifizierten Proteins als Expressionsprodukt des Gens.
  11. Verfahren zur Modifizierung der bekannten Funktion eines Proteins "A", abgeleitet von den gesamten Proteinen des Organismus "a", von dem Genom-Daten oder cDNA-Daten bekannt waren, welches Verfahren die Schritte umfasst: (1) Extrahieren von Proteinen, die eng mit dem Protein "A" verwandt sind, aus einer existierenden Proteindatenbank und Unterwerfen der Proteine einer Zuordnung; (2) Berechnen der Häufigkeit des Auftretens einer jeden Aminosäure und der Häufigkeit des Auftretens individueller Oligopeptide, gebildet durch Permutationen von 20 Aminosäuren, in den Aminosäuresequenzen der gesamten Proteine des Organismus "a"; (3) bezüglich eines Proteins des Organismus "a", (3') Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Aj-Oligopeptids einer gegebenen Länge (n) (1 ≤ n ≤ M, mit der Maßgabe, dass M die kleinste Länge von Oligopeptiden ist, welche das Kriterium erfüllen, dass alle Oligopeptide der Länge M eine Häufigkeit 1 des Auftretens haben), welches Aj-Oligopeptid ein Teil der Aminosäuresequenz des Proteins ist und einen Aminosäurerest Aj (n ≤ j ≤ L-n+1) an der j-ten Position vom N-Terminus des Proteins enthält; Aj-Oligopeptid: aj1aj2....aji....ajn(worin 1 ≤ i ≤ n, Aj = aji und Aj der i-te Rest des Oligopeptids ist); und Berechnen in den gesamten Proteinen des Organismus "a" die Häufigkeit des Auftretens des folgenden Xi-Oligopeptids der Länge (n) entsprechend der Länge des Aj-Oligopeptids; Xi-Oligopeptid: aj1aj2....Xji....ajn(worin der i-te Rest Xji irgendeine Aminosäure ist); (4) Berechnen des Verhältnisses Yji der Häufigkeit des Auftretens des Aj-Oligopeptids zu derjenigen des Xi-Oligopeptids; (5) Berechnen des Mittelwerts Y(j,n) des Yji;
    Figure 00640001
    (6) Berechnen des Funktionswerts Z(j,n) von Y(j,n) Z(j,n) = –log(Y(j,n)); (7) Wiederholen der Schritte (3') bis (6) nacheinander und Bestimmen des Z(j,n)-Werts eines jeden Aminosäurerests Aj an der Position j (n ≤ j ≤ L-n+1) in der Aminosäuresequenz der Länge (L); (8) Wiederholen der Schritte (3) bis (7) nacheinander für die gesamten Proteine des Organismus "a", wodurch die Verteilung des Z(j,n)-Werts eines jeden Aminosäurerests in den gesamten Proteinen bestimmt und die Z(j,n)-Werte in 20, entsprechend den 20 Aminosäuren, klassifiziert werden, und dann Berechnen des Mittelwerts Av(As) der Z(j,n)-Werte für jede Aminosäure As und der Standardabweichung Sd(As) von deren Verteilung, um auf Basis der Verteilung die Funktion g für den j-ten Aminosäurerest Aj eines Proteins zu bestimmen, um die Differenz in der Verteilung aufgrund der Spezies von Aminosäureresten zu normalisieren; g = Z(j,n),Aj) =[Z(j,n) – Av(As)]/Sd(As) (worin Aj = As ist); (9) Berechnen des Werts D(j,n) der Funktion g eines jeden Aj aller Aminosäurereste an der j-ten Position (n ≤ j ≤ L-n+1) eines Proteins in den gesamten Proteinen wie in Schritt (8) gewonnen; D(j,n) = g(Z(j,n),Aj);(10) Definieren des repräsentativen Werts der Funktion des j-ten Aminosäurerests in der Aminosäuresequenz der Länge (L) als Funktionswert Wj von Z(j,n) und D(j,n) Wj = h(Z(j,1),Z(j,2)...,Z(j,M),D(j,1),D(j,2)...,D(j,M));(11) Wiederholen der Schritte (3) bis (10) nacheinander, um die individuellen Wj-Werte aller Aminosäurereste an der Position (n+1 ≤ j ≤ L-n) in der Aminosäuresequenz der Länge (L) zu bestimmen; (12) Auswählen mindestens eines Aminosäurerests, der einer Mutation unterworfen werden soll, auf Grundlage der in Schritt (1) erhaltenen Zuordnungsdaten aus der Aminosäuresequenz der Länge (L) des Proteins "A" und Wiederholen der Schritte (3) bis (10) nacheinander für Varianten-Aminosäurereste in verschiedenen mutierten Aminosäuresequenzen, worin der ausgewählte Aminosäurerest zu einem anderen Aminosäurerest mutiert wurde, um den Wj-Wert des Varianten-Aminosäurerests zu bestimmen; (13) Auswählen einer mutierten Aminosäuresequenz, wobei der Wj-Wert des Varianten-Aminosäurerests wie in Schritt (12) bestimmt größer oder kleiner ist als der Wj-Wert des Wildtyp-Aminosäurerests wie in Schritt (10) bestimmt; und (14) Herstellen eines modifizierten Gens, welches für die modifizierte Aminosäuresequenz des Protein "A"-Gens codiert, und Herstellen des modifizierten Proteins als Expressionsprodukt des Gens.
DE69836971T 1997-01-31 1998-02-02 Methode und apparat zur vorhersage von funktionellen proteindomänen, methode zur verbesserung der proteinfunktion, sowie funktionell verbessertes protein Expired - Lifetime DE69836971T2 (de)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP1924897 1997-01-31
JP01924897A JP3679536B2 (ja) 1997-01-31 1997-01-31 耐熱性dna合成酵素
JP1924997A JP3801714B2 (ja) 1997-01-31 1997-01-31 蛋白質の機能部位予測方法と機能部位予測装置 並びに蛋白質の機能改良方法
JP1924997 1997-01-31
JP33210097A JP3880173B2 (ja) 1997-12-02 1997-12-02 Dna合成酵素
JP33210097 1997-12-02
JP01869998A JP3792039B2 (ja) 1998-01-30 1998-01-30 蛋白質機能部位の予測方法と予測装置
JP1869998 1998-01-30
PCT/JP1998/000430 WO1998033900A1 (fr) 1997-01-31 1998-02-02 Procede et dispositif de prediction du site de fonction proteique, procede d'amelioration de la fonction proteique et proteine a fonction amelioree

Publications (2)

Publication Number Publication Date
DE69836971D1 DE69836971D1 (de) 2007-03-15
DE69836971T2 true DE69836971T2 (de) 2007-10-25

Family

ID=27457022

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69841602T Expired - Lifetime DE69841602D1 (de) 1997-01-31 1998-02-02 Thermophile DNA Polymerase mit modifizierter Funktion
DE69836971T Expired - Lifetime DE69836971T2 (de) 1997-01-31 1998-02-02 Methode und apparat zur vorhersage von funktionellen proteindomänen, methode zur verbesserung der proteinfunktion, sowie funktionell verbessertes protein

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69841602T Expired - Lifetime DE69841602D1 (de) 1997-01-31 1998-02-02 Thermophile DNA Polymerase mit modifizierter Funktion

Country Status (3)

Country Link
EP (2) EP1564288B1 (de)
DE (2) DE69841602D1 (de)
WO (1) WO1998033900A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1339006A1 (de) * 2002-02-14 2003-08-27 AgeLab Pharma GmbH Methode und Apparat zur Erkennung funktioneller Proteinsequenzen
US9023633B2 (en) 2008-11-03 2015-05-05 Kapa Biosystems Chimeric DNA polymerases

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266810A (ja) * 1993-03-11 1994-09-22 Fujitsu Ltd 二面角指定方法
JPH08110909A (ja) * 1994-10-13 1996-04-30 Hitachi Ltd 配列検索方法および装置

Also Published As

Publication number Publication date
EP1564288A1 (de) 2005-08-17
EP1013759A1 (de) 2000-06-28
EP1013759A4 (de) 2001-05-30
EP1013759B1 (de) 2007-01-24
DE69841602D1 (de) 2010-05-20
WO1998033900A1 (fr) 1998-08-06
DE69836971D1 (de) 2007-03-15
EP1564288B1 (de) 2010-04-07

Similar Documents

Publication Publication Date Title
DE3855064T2 (de) Selektive Amplifikation von Oligonukleotiden-Zielsequenzen
DE69332665T2 (de) Methode um mrna zu klonieren
DE602004010273T2 (de) Amplifikationsmethode
Xu et al. Sequence non‐specific double‐strand breaks and interhomolog interactions prior to double‐strand break formation at a meiotic recombination hot spot in yeast.
DE69133582T2 (de) Ein system der dna amplifikation zur detektion genetischer erkrankungen durch eine thermostabile ligase
DE60312875T2 (de) Genomteilung
Jarmolowski et al. Identification of essential elements in U14 RNA of Saccharomyces cerevisiae.
DE60126786T2 (de) Verfahren zur ortspezifischen massenmutagenese
DE69835676T2 (de) Dna polymerase-verwandte faktoren
WO1998005765A1 (en) Double-stranded dna with cohesive end(s), and method of shuffling dna using the same
DE68928899T4 (de) Leadersequenz zur induzierung einer posttranslationalen modifikation von polypeptiden in bakterien, sowie dafür kodierendes gen
DE69233253T2 (de) Verfahren zum Klonieren eines Pol-I-Typ DNS-Polymerase-Gens
DE60301325T2 (de) Mutation von dna polymerasen aus archaeobakterien
US7820423B2 (en) Method and a system for predicting protein functional site, a method for improving protein function, and a function-modified protein
EP0460673A1 (de) Rekombinantes Restriktionsenzym Sau3AI kodierendes DNS
DE60317693T2 (de) Methode und verwendung von thermostabilen rna-ligasen
DE69722028T2 (de) Genetische marker und verfahren zur erkennung von listeria monocytogenes und listeriaspezien
DE60219632T2 (de) Verfahren zur herstellung von matrizen-dna und verfahren zur proteinherstellung in einem zellfreien proteinsynthesesystem unter verwendung davon
DE3751100T2 (de) Erhöhte Produktion von Proteinen in Bakterien durch Verwendung einer neuen Ribosombindungsstelle.
DE69836971T2 (de) Methode und apparat zur vorhersage von funktionellen proteindomänen, methode zur verbesserung der proteinfunktion, sowie funktionell verbessertes protein
DE03781176T1 (de) Fluoreszenzproteine aus copepoda-speziesund verfahren zur verwendung davon
DE112022003266T5 (de) Chimäre DNA-Polymerase und zugehöriges Herstellungsverfahren
DE69829240T2 (de) Für temperaturstabile Diaphorase kodierendes Gen
EP1326964B1 (de) THERMOSTABILE POLYMERASE AUS i THERMOCOCCUS PACIFICUS /i
DE3850456T2 (de) Klonierung des isoamylaseenzym kodierenden Gens und seine Verwendung zur Herstellung dieses Enzyms.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition