-
HINTERGRUND
-
In jüngerer Zeit gab es Vermutungen, dass 5-Hydroxymethylcytosin (hmC) eine Rolle bei der Expression von Säugetiergenen spielt, insbesondere bei embryonalen Stammzellen und der Entwicklung von Nervenzellen als Zwischenschritt bei der Demethylierung (
Tahiliani et al., Science 324(5929): 930-5 (2009);
Kriaucionis und Heintz, Science 324(5929): 929–30 (2009)). Es wurde eine TET-Familie von Enzymen beschrieben, die die Umwandlung von 5-methyliertem Cytosin (mC) in hmC katalysiert (
WO 2010/037001 ). Der Nachweis der Hydroxymethylierung hat sich als Herausforderung erwiesen. Chemische Methoden, meistens die zum Nachweis von mC angewandte Natriumhydrogensulfit-Sequenzierung, unterscheiden nicht zwischen mC und hmC (
Cokus et al., Nature 452: 215–219 (2008). In der PCT-Veröffentlichung Nr.
WO 2010/037001 wird die Verwendung von Antikörpern, die direkt an hmC binden, beschrieben. Ein Produkt, das Mischungen von Endonukleasen umfasst, erlaubt den Nachweis von hmC durch Subtraktion (EpiMark
TM, New England Biolabs, Inc. (NEB) und
PCT/US10/46632 ). Bei diesem Produkt wird T4-β-Glucosyltransferase (BGT) zum Glucosylieren des hmC verwendet, welches dann gegenüber einer Spaltung durch Endonuklease resistent ist, was eine Differenzierung gegenüber mC ermöglicht. Es wäre wünschenswert, einfache, schnelle und direkte Verfahren zum Nachweis und zur Analyse des Vorhandenseins von hmC in einem Polynukleotidsequenzusammenhang zu entwickeln, welche zusätzlich dazu fähig sind, Hemi-hmC von symmetrischem hmC zu unterscheiden, so dass sich das hydroxymethylierte Cytosin (C) genau identifizieren lässt.
-
ÜBERSICHT
-
Gemäß einer Ausführungsform der Erfindung wird eine Zubereitung bereitgestellt, die folgendes umfasst: ein oder mehrere aufgereinigte rekombinante Proteine, wobei die Proteine Mitglieder einer Familie von ZZYZ-Proteinen sind; und einen Reaktionspuffer. Gemäß Ausführungsformen der Erfindung hat jedes Mitglied der Familie von ZZYZ-Proteinen eine katalytische Domäne und eine Bindungsdomäne. Gemäß einer Ausführungsform bindet die Bindungsdomäne bevorzugt an hmC und an ein glucosyliertes hydroxymethyliertes Cytosin (ghmC) in einer DNA. Gemäß einer Ausführungsform spaltet die katalytische Domäne DNA in einem festgelegten Abstand (3') vom hmC bzw. ghmC. Der festgelegte Abstand kann weiter charakterisiert sein als 11–13 Nukleotide auf dem Strang mit dem hmC bzw. ghmC und 9–10 Nukleotide auf dem komplementären Strang (3'). Jedes Mitglied der Familie der ZZYZ-Proteine kann weiter dadurch charakterisiert sein, dass es ein modifiziertes, aus ghmC oder hmC ausgewähltes Nukleotid in einer DNA so erkennt, dass das Spaltverhältnis von ghmC bzw. hmC zu mC mindestens 8:1 beträgt.
-
Gemäß einer Ausführungsform der Erfindung weist jedes Mitglied der Familie der ZZYZ-Proteine eine N-terminale Domäne auf, die eine Aminosäuresequenz mit mindestens 95% Aminosäuresequenzhomologie zu RX7KX2EXYX18QQX11-16DLX2PX6EXDEX2HX6-26DX2RX3I umfasst. Gemäß einer anderen Ausführungsform weist jedes Mitglied der Familie der ZZYZ-Proteine eine C-terminale Domäne auf, die eine Aminosäuresequenz mit mindestens 95% Aminosäuresequenzhomologie zu WXNX30-40AX12-13FXGX16-18R in der C-terminalen Domäne umfasst. Gemäß einer weiteren Ausführungsform beinhaltet mindestens ein Mitglied die Aminosäuresequenz RX7KX2EXYX18QQX11-16DLX2PX6EXDEX2HX26DX2RX3I. Gemäß einer anderen Ausführungsform hat mindestens ein aufgereinigtes Protein eine Aminosäuresequenz mit mindestens 95% Sequenzhomologie zu SEQ ID NO: 7. Gemäß einer anderen Ausführungsform hat mindestens ein aufgereinigtes Protein eine Aminosäuresequenz mit mindestens 95% Sequenzhomologie zu einem aus PvuRts1I, PpeHI, EsaSS310P, EsaRBORFBP, PatTI, YkrI, EsaNI, SpeAI, BbiDI, PfrCORF1I80P, PcoORF314P, BmeDI, AbaSDFI, AbaCI, AbaAI, AbaSI, AbaUMB3ORFAP und Asp6ORFAP ausgewählten Enzym. Gemäß einer anderen Ausführungsform ist mindestens eines der aufgereinigten Proteine aus der aus PvuRts1I, PpeHI, EsaSS310P, EsaRBORFBP, PatTI, YkrI, EsaNI, SpeAI, BbiDI, PfrCORF1I80P, PcoORF314P, BmeDI, AbaSDFI, AbaCI, AbaAI, AbaSI, AbaUMB3ORFAP und Asp6ORFAP und katalytisch aktiven Mutanten und Derivaten davon bestehenden Gruppe ausgewählt.
-
Gemäß einer Ausführungsform der Erfindung kann der Puffer in der Zubereitung ein Salz mit einem aus einem Sulfat, einem Phosphat, einem Acetat oder einem Citrat ausgewählten Anion umfassen. Gemäß einer anderen Ausführungsform beinhaltet der Puffer kein Chlorid-, Nitrat-, Carbonat- oder Imidazolsalz. Die Salzkonzentration kann im Bereich von 50–500 mM liegen.
-
Gemäß einer Ausführungsform der Erfindung wird ein Verfahren zum Nachweis eines hmC in einer genomischen DNA-Probe bereitgestellt. Das Verfahren umfasst: Zugeben einer wie oben beschriebenen Zubereitung zu der genomischen DNA-Probe; Zulassen, dass das Protein die genomische DNA an einer Spaltstelle spaltet; Bestimmen der DNA-Sequenz auf mindestens einer Seite der Spaltstelle; gegebenenfalls Zuordnen (mapping) der DNA-Sequenz zu einer genomischen DNA-Vergleichssequenz; und Nachweisen des hmC. Die bei dem Verfahren verwendete Zubereitung kann eine oder mehrere der Folgenden umfassen: DNA-Polymerasen, Primer und Adapter.
-
Gemäß einer weiteren Ausführungsform beinhaltet das Verfahren das Amplifizieren der gespaltenen genomischen DNA vor dem Bestimmen der DNA-Sequenz. Bei den obigen Ausführungsformen des Verfahrens kann man die genomische DNA zunächst mit einer β-Glucosyltransferase (BGT) oder markierter BGT oder einem BGT-Derivat umsetzen, bevor man die genomische DNA in einem Reaktionsgefäß mit der oben definierten Zubereitung mischt. Gemäß einer Ausführungsform kann man das Verfahren in einem einzelnen Reaktionsgefäß oder einer mikrofluidischen Vorrichtung durchführen.
-
Gemäß einer weiteren Ausführungsform wird ein Verfahren zur Aufreinigung eines ZZYZ-Familienproteins bereitgestellt, welches folgendes umfasst: das Klonieren und Exprimieren eines das Protein aus der ZZYZ-Familie, ein Intein und ein affinitätsbindendes Protein – zum Beispiel eine chitinbindende Domäne (CBD), eine maltosebindende Domäne (MBP) oder ein anderes geeignetes, zur Bindung an eine Matrix fähiges Protein – umfassenden Fusionsproteins; das Herbeiführen der Bindung des Fusionsproteins an die Matrix durch das affinitätsbindende Protein; die Abspaltung des Proteins der ZZYZ-Familie vom Intein; und die Isolierung des aufgereinigten Proteins aus dem Eluat. Gemäß einer Ausführungsform ist das affinitätsbindende Protein eine chitinbindende Domäne.
-
Gemäß einer Ausführungsform der Erfindung wird ein Satz Fragmente bereitgestellt, welcher mindestens eines der Folgenden umfasst: (a) Oligonukleotidfragmente mit einer Größe von 20–23 Nukleotiden mit einem in einer zentralen Position befindlichen hmC oder ghmC; oder (b) große DNA- oder Oligonukleotidfragmente mit einem auf einem Einzelstrang einer Duplex-DNA befindlichen, 11–13 Nukleotide vom 3'-Ende des Strangs entfernten hmC oder ghmC.
-
Gemäß einer Ausführungsform der Erfindung wird ein Kit bereitgestellt, welches Folgendes umfasst: ein oder mehrere aufgereinigte rekombinante Proteine aus der ZZYZ-Familie von Proteinen, funktionsfähige Derivative davon oder katalytische Fragmente davon in einem die Entfaltung der Enzymaktivität ermöglichenden Puffer; und Gebrauchsanweisungen. Das Kit kann weiterhin eine BGT und UDP-Glucose umfassen. Das Kit kann weiterhin Primer umfassen. Das Kit kann weiterhin Adapter umfassen, die sich für eine Verwendung mit Sequenzierplattformen eignen.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 zeigt das Produkt der Aufreinigung repräsentativer Enzyme aus der ZZYZ-Familie auf einem 10–20%igen denaturierenden Polyacrylamidgel. Bahn 1 ist ein Größenmarker. Bahn 2 ist PvuRts1I, Bahn 3 PpeHI, Bahn 4 AbaSDFI, Bahn 5 PatTI, Bahn 6 EsaNI und Bahn 7 YkrI.
-
2 zeigt die Sequenz eines DNA-Substrats (SEQ ID NO: 1), das in den 3–5 verwendet wurde. Das Substrat wurde durch PCR-Amplifikation so dargestellt, dass die Cytosine jeweils entweder unmodifiziert waren oder alle durch mC, hmC oder ghmC ersetzt worden waren. Die mCs und hmCs wurden während der PCR in das Substrat eingeführt, während es sich bei dem ghmC um das Produkt einer Glucosyltransferasereaktion mit den hmCs im Substrat handelte. Die Primer-Sequenz innerhalb des Fragments enthielt kein Cytosin. Zur Überprüfung des Glucosylierungsstatus wurde eine interne MfeI-Stelle in die PCR-Sequenz eingefügt.
-
3–5 zeigen das Produkt der Reaktion zwischen 2-fach-Reihenverdünnungen von repräsentativen Enzymen in der ZZYZ-Familie und dem Substrat aus 2, bei dem alle Cs unmodifiziert sind, alle Cs durch mCs ersetzt sind, alle Cs durch ghmCs (βghmCs) ersetzt sind und alle Cs durch hmCs ersetzt sind. Die ersten und letzten Bahnen einhalten die PCR-Marker. Die Bahnen zwischen den Markern zeigen 2-fach-Reihenverdünnungen eines einzelnen Enzyms. Die Reaktionsbedingungen waren 23°C, 20 min in NEB4-Puffer (New England Biolabs, Inc., Ipswich, MA, USA (NEB)) mit einer KOAc-Endkonzentration von 250 mM.
-
3 zeigt die Ergebnisse für PvuRts1I, wobei das Verhältnis von hmC:ghmC:mC:C = 2000:2000:8:1. Die Menge an Enzym in der ersten Bahn neben dem Marker links beträgt 33 μg.
-
4 zeigt die Ergebnisse für PpeHI, wobei das Verhältnis von hmC:ghmC:mC:C = 128:256:2:1. Die Menge an Enzym in der ersten Bahn neben dem Marker links beträgt 123 μg.
-
5 zeigt die Ergebnisse für AbaSDFI, wobei das Verhältnis von hmC:ghmC:mC:C = 500:8000:1:NN (nicht nachgewiesen). Die Menge an Enzym in der ersten Bahn neben dem Marker links beträgt 52 μg.
-
6A und 6B zeigen, das die ZZYZ-Familie von Enzymen voll hydroxymethylierte Oligosubstrate spaltet.
-
6A zeigt die Wirkung von aufgereinigtem rekombinantem PpeHI auf ein aus 56 Basenpaaren bestehendes, AhmCGT enthaltendes synthetisches Oligonukleotidsubstrat. Bahn 1: nur DNA, Bahnen 2-8: 2-fache Verdünnung des Enzyms. Die Ansätze wurden 1 Stunde lang bei 37°C inkubiert und auf einem 20%igen TBE-Polyacrylamidgel aufgetrennt.
-
6B zeigt ein schematisches Verdauungsmuster des Oligonukleotidsubstrats mit Spaltprodukten. PpeHI spaltet auf beiden Seiten der Erkennungsstelle (durch Pfeile angezeigt), wodurch ein Fragment mit einer Größe von 20 Basenpaaren entsteht.
-
7 zeigt die Wirkung von ZZYZ-Enzymen auf symmetrisch hydroxymethylierte Oligonukleotide und hemihydroxymethylierte Oligonukleotides. Das Gel zeigt die Ergebnisse bei Verwendung von PpeHI. Die Verdauungsprodukte wurden auf einem denaturierenden 20%igen Polyacrylamidgel mit 7M Harnstoff analysiert. Die nummerierten Bahnen entsprechen den auf der rechten Seite des Gels in der graphischen Darstellung gezeigten Spaltmustern. Bahn 1 zum Beispiel entspricht dem Spaltmuster, das man mit hmCG/GhmC auf dem oberen und dem unteren Strang erhält, wobei nur der obere Strang markiert ist.
-
8A–B zeigen die für jeden Strang einer DNA-Duplex mit einem hmC oder ghmC auf einem Strang getrennt bestimmten Spaltstellen von Enzymen der ZZYZ-Familie.
-
8A zeigt das Produkt der Spaltung des Strangs der Duplex, der zu dem hmC enthaltenden Strang komplementär ist, was auf dem Gel den Bahnen 3 und 4 entspricht. Die Sequenzen der verwendeten Oligonukleotide sind neben dem Gel gezeigt. Das Gel ist das gleiche wie das in 7 gezeigte. Die synthetischen Oligonukleotidmarker (M1, M5 und M2, M3) bieten Anhaltspunkte für die Bestimmung der Spaltstellen. Die Oligonukleotidsubstrate und die synthetischen Marker wurden mit der fluoreszenten Gruppe FAM markiert und auf einem denaturierenden 20%igen Polyacrylamidgel mit 7M Harnstoff aufgetrennt. Die M2 und M3 (Bahn 3) und M1 und M5 (Bahn 4) entsprechenden Spaltfragmente sind auf der Oligonukleotidsequenz (SEQ ID NO: 2) neben dem Gel markiert.
-
8B zeigt das Produkt der Spaltung des Strangs der Duplex, der ein ghmC enthält. Das Substrat (R2) mit den gezeigten Sequenzen (SEQ ID NOS: 3 und 4) wurde an beiden Enden mit alpha-33P dATP (*) markiert. Die Marker (M1 und M2) sind unter Verwendung von Polynukleotidkinase mit gamma-33P ATP markiert.
-
8C zeigt, dass ein ZZYZ-Protein ghmC oder hmC enthaltende DNA in der gleichen Entfernung 3' vom modifizierten Nukleotid spaltet. Die Glucosylierung hat keine Auswirkung auf die Spaltdistanz. Bei der Reaktion kamen verschiedene Sätze von Substraten zur Anwendung, entweder mit einem hmC (Bahnen 1 und 3) oder mit einem ghmC (Bahnen 2 und 4). Fluoreszenzmarker (FAM) sind in der Figur als ausgefüllte Kreise gezeigt. Erwartete Spaltstellen sind mit Linien markiert. Bei dem hier eingesetzten Enzym handelte es sich um AbaSDFI. Aus dem Vergleich der Bahnen 3 und 4 lässt sich schlussfolgern, dass die Spaltdistanzen auf dem gegenüberliegenden Strang der beiden Modifikationstypen die gleichen sind.
-
9 zeigt ein Verfahren zur Identifizierung von hmC-Stellen in genomischer DNA aus Rattenhirn. Genomische DNA wurde mit T4 BGT behandelt, um alle hmCs zu glucosylieren, und dann mit einem ZZYZ-Enzym (z. B. AbaSDFI) verdaut. Die verdauten Produkte wurden wie gezeigt mit einem synthetischen doppelsträngigen Oligonukleotidadapter ligiert. Das ligierbare Ende wies die 2-bp degenerierten Nukleotide auf. Ligierte Fragmente wurden nach ihrer Größe ausgewählt, die ungefähr 1 kb-3 kb betrug. Sie wurden PCR-amplifiziert, wobei dergemeinsame, für den Adapter spezifische Primer verwendet wurde. Die amplifizierten PCR-Produkte können dann in einen herkömmlichen Klonierungsvektor kloniert und sequenziert werden, um zu bestimmen, welches der benachbarten Cytosine hydroxymethyliert ist.
-
10 zeigt eine Sequenzlogodarstellung der gemäß 9 erhaltenen klonierten Fragmente aus genomischer DNA aus Rattenhirn. Alle klonierten Fragmente wurden dem Ratten-Vergleichsgenom angepasst. Das 40-bp-Fenster links und rechts von der Spaltstelle wurde extrahiert und abgeglichen, wie in der Figur gezeigt.
-
11 beschreibt ein Protokoll für eine Hochdurchsatz-Sequenzierung, um zu bestimmen, welches der Cytosine in benachbarten CpG-Motiven hemihydroxymethyliert ist und als Substrat für eine Spaltung durch Mitglieder der ZZYZ-Familie dient. (A): die freien Enden des zu untersuchenden DNA-Fragments werden blockiert. Die Spaltung erfolgt an einer Stelle, die sich zwischen den beiden identifizierten Cytosinen befindet, mit einem ZZYZ-Enzym, was zu einem Überhang von 1–3 Basen führt. (B): Der Überhang wird durch Abstumpfen (blunt-ending) entfernt. (C): Ein Adapter mit einer bekannten Sequenz wird mit dem abgestumpften Ende der beiden Spaltfragmente ligiert, wobei der Adapter ein nicht modifiziertes CC/GG an dem einen Ende und einen Marker –X am anderen Ende aufweist. Nicht ligierter Adapter wird mittels einer Spin-Säule entfernt. (D): Die mit dem Adapter ligierte DNA wird ein zweites Mal mit dem ZZYZ-Enzym gespalten, um den Adapter freizusetzen, wobei das CC als Überhang an dem das hmC enthaltenden Fragment verbleibt. Das nicht modifiertes Cytosin enthaltende Fragment wird nicht gespalten. Der abgespaltene Adapter wird mittels einer Spin-Säule entfernt. (E): An das abgespaltene Fragment mit dem CC-Überhang wird ein zweiter Adapter angefügt. Der zweite Adapter trägt einen Y-Marker. Das modifizierte Cytosin lässt sich identifizieren, indem man das Fragment mit dem Y-Marker sequenziert. Das nicht modifizierte Cytosin kann durch Sequenzieren des Fragments mit dem X-Marker verifiziert werden. (F): Das nicht gespaltene Fragment wird stromabwärts von den hmC-(5-hmC)-Stellen sequenziert. (G): Das Hemi-hmC (5-hmC) wird dem Vergleichsgenom zugeordnet (mapped).
-
12 zeigt ein Beispiel für eine Sequenzierungspipeline zum Dekodieren eines Hydroxymethyloms. Genomische DNA wird zunächst mit BGT behandelt und dann mit einem Enzym der ZZYZ-Familie (z. B. AbaSDFI) verdaut. Die verdauten Produkte werden dann mit individuellen Adapter entweder mit einem 3'-Überhang mit 2 degenerierten Basen oder mit einem 3'-Überhang mit 3 degenerierten Basen ligiert. Die Adapter-DNA trägt einen Marker (wie Biotin), was die Aufreinigung stromabwärts erleichtert. Die ligierte DNA wird zu kleineren Fragmenten zerschert. Die Fragment mit an den Enden ligierten Adapter werden mit Avidinperlen herausgezogen. Die Fragmente werden dann mit einem zweiten Sequenzierungsadapter ligiert. Die ligierten Produkte werden PCR-amplifiziert, wobei spezifische Primer für die Sequenzierung zum Einsatz kommen.
-
13 zeigt ein Promals-Alignment (Pei & Grishin Bioinformatics 23(7): 802–808 (2007)) von Mitgliedern einer neuen Familie von Enzymen, die hier als ZZYZ-Familie bezeichnet wird (SEQ ID NOS: 5–13). Es sind neun Mitglieder der Familie gezeigt, wobei jedes Enzym in einer doppelsträngigen DNA (dsDNA) bevorzugt hmC oder ghmC im Vergleich zu mC oder unmodifiziertem Cytosin spaltet.
-
14 zeigt, dass PvuRts1I zwischen DNAs mit unterschiedlichen Konzentrationen an hmC in verschiedenen Zellen unterscheiden kann. Hier werden die Konzentrationen von hmC in embryonalen Stammzellen mit Fibroblasten verglichen. Das genomische E-14-DNA wurde zu einem signifikanten smear verdaut, währen die NIH3T3-DNA nur ein wenig verdaut wurde, was das Vorhandensein einer signifikanten Anzahl an hemimethylierten hmC in E-14-Zellen und die signifikant niedrigeren Konzentrationen an hmC in Fibroblasten bestätigt.
-
AUSFÜHRLICHE BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
-
Ein einzigartiges Merkmal der hier beschriebenen Enzymfamilie ist ihre Bindungseigenschaften und ihre Spaltungsspezifität, durch die erstmals ein direktes enzymatisches Verfahren zum Nachweis von hmC in einem Genom bereitgestellt wird, außerdem an hemihydroxymethylierten Stellen quantitativ und im Sequenzzusammenhang.
-
Die neu definierte Familie der hier beschriebenen ZZYZ-Enzyme ist von besonderen Interesse aus Gründen, die ihre Fähigkeit umfassen, hmC-(und auch ghmC-)Reste von mCs oder nicht methylierten Cytosinen zu unterscheiden, was einen Satz von DNA-Fragmenten liefert, bei dem die Spaltung in einem im Wesentlichen festgelegten Abstand stromabwärts von der Enzymerkennungsstelle auf der DNA erfolgt. Die Größe der Mitgliedsfragmente in einem Satz von aus der Spaltung mit ZZYZ-Enzymen herrührenden Fragmenten kann recht heterogen sein. Enthält die DNA ein Hemi-hmC oder Hemi-ghmC, so kommt es nur auf der einen Seite (3') des modifizierten Nukleotids zu Brüchen des Doppelstrangs, wodurch dsDNA-Fragmente unterschiedlicher Länge gebildet werden. Wenn sich hmC oder ghmC symmetrisch verteilt in CpG-Stellen befinden, werden dsDNA-Fragmente mit einer Größe von 20–23 Nukleotiden gebildet.
-
Bestimmte Ausdrücke sind unten beschrieben.
-
„Große DNA” soll sich auf alle natürlich vorkommende oder synthetische DNA mit einer Größe von mehr als 100 Nukleotiden bis zur Größe eines Genoms beziehen.
-
„Ähnliche Größe” in Bezug aus einen „Satz” Fragmente soll sich auf Fragmente beziehen, die sich in ihrer Größe um nicht mehr als etwa +5 Nukleotide unterscheiden.
-
„Zentral positioniert” soll einer Stelle eines modifizierten Nukleotids auf einem Strang entsprechen, die sich in dem gleichen Strang eines dsDNA-Fragments ungefähr in der Mitte befindet. Die Stelle befindet sich im Allgemeinen innerhalb von 5 Nukleotiden des durch Auszählen der Nukleotide von beiden Enden des Fragments aus bestimmten Zentrums.
-
„N-terminale Domäne” bezieht sich auf eine Region, die sich über etwa 50% der Aminosäuresequenz des Proteins erstreckt. „C-terminale Domäne” bezieht sich auf eine Region, die sich über etwa 50% der Aminosäuresequenz des Proteins erstreckt.
-
Eine „Matrix” soll alle Strukturen mit einer zur Immobilisierung eines Moleküls mit Affinität zur Matrix geeigneten Oberfläche einschließen und schließt zum Beispiel Perlen, Säulen, flache Oberflächen wie Papier, die innere Oberfläche einer ganzen oder hohlen Form usw. ein.
-
Einen „Satz Fragmente” erhält man durch Spaltung einer großen dsDNA mit einem Enzymmitglied der ZZYZ-Familie. Der Satz Fragmente schließt doppelsträngige Oligonukleotide ein, die Produkte der Spaltung großer DNA auf beiden Seiten von symmetrischen hmCs oder ghmCs (hmCG/GhmC) sind und Fragmente unterschiedlicher Größe, bei denen sich ein Hemi-hmC oder ghmC in einer festgelegten Entfernung von der Spaltstelle (z. B. 9–13 Nukleotide) befindet. Wird ein aus mehreren großen DNAs bestehendes Genom (z. B. Chromosomen) gespalten, so liefert jede große DNA einen Satz Fragmente. Eine aus der Spaltung eines ganzen humanen Genoms erhaltene Mischung von Fragmenten kann je nach Zusammenhang angesehen werden als mehrere Sätze von Fragmenten, wobei sich jeder Satz von einem Chromosom ableitet, oder als einzelner Satz von Fragmenten. Gemäß einer Ausführungsform umfasst der Satz Fragmente mindestens 6 Oligonukleotidfragmente mit verschiedenen DNA-Sequenzen. So kann der Satz von Oligonukleotiden zum Beispiel mindestens 10 Fragmente mit verschiedenen Sequenzen oder mindestens 20 Fragmente mit verschiedenen Sequenzen umfassen. Gemäß einer Ausführungsform schließt der Satz Oligonukleotide ein oder mehrere Fragmente ähnlicher Größe mit einem zentral angeordneten hmC oder ghmC ein.
-
Eine „Enzymzubereitung” soll sich auf ein Reagens beziehen, und nicht auf etwas, was in seinem natürlichen Zustand in vivo vorkommt.
-
„X” steht, wenn es in einer Aminosäuresequenz verwendet wird, für eine beliebige Aminosäure.
-
Eine neue Familie von DNA-spaltenden Enzymen wird hier als ZZYZ-Familie bezeichnet, wobei die Mitglieder der Familie vorzugsweise ein hmC und ghmC, nicht aber methylierte (mC) oder unmodifizierte Cytosine in dsDNA erkennen und dann die DNA in einem nicht zufälligen Abstand stromabwärts (3'-Richtung) vom hmC- bzw. ghmC-Nukleotid auf jedem DNA-Strang spalten, der das hmC oder ghmc enthält. Zu den Mitgliedern dieser Familie zählen, wobei dies nicht einschränkend ist, bakterielle Restriktionsendonukleasen.
-
Mitglieder der Familie können strukturell gekennzeichnet sein durch eine charakteristische Spaltdomäne und eine Bindungsdomäne und insbesondere durch eine N-terminale konservierte Domäne mit mehr als 85% Aminosäuresequenzhomologie, zum Beispiel mehr als 90% Aminosäuresequenzhomologie, zum Beispiel mehr als 98% Aminosäuresequenzhomologie zu RX7KX2EXYX18 QQX11-16DLX2PX6EXDEX2HX6-26DX2RX3I (SEQ ID NO: 14) in der N-terminalen Domäne und/oder mehr als 85% oder 90% oder 98% Aminosäuresequenzhomologie zu WXNX30-40AX12-13FXGX16-18R (SEQ ID NO: 15) in der C-terminalen Domäne. Gemäß einer Ausführungsform verfügt ein Protein (beispielhaft dargestellt von AbaSDFI) mit einer N-terminalen Sequenz RX7KX2EXYX18 QQX11-16DLX2PX6EXDEX2HX26DX2RX3I (SEQ ID NO: 16) über einen hohen Grad an Selektivität zwischen ghmC/hmC und mC.
-
Mitglieder der ZZYZ-Familie (siehe zum Beispiel 13) schließen rekombinante Proteine, Varianten und Derivate ein. Beispiele für Varianten schließen Mutanten ein, bei denen beispielsweise die katalytische Domäne modifiziert oder vom Protein entfernt wurde und nur noch die DNA-bindende Domäne für hmC und ghmC verbleibt. Zusätzliche Beispiele für Varianten sind Fusionsproteine. Diese Fusionsproteine können als Reagentien dienen, oder es kann sich bei ihnen um Zwischenprodukte aus der Aufreinigung der Enzyme oder der Kartierung (mapping) der hydroxymethylierten Nukleotide handeln.
-
Fusionsproteinvarianten in der Familie der ZZYZ-Proteine können fusioniert sein mit einem zweiten Protein oder mehreren Proteinen, die als Etikett, Tag oder Marker zum In-situ-Visualisieren des an hmC oder ghmC gebundenen Proteins oder zur Affinitätsaufreinigung dienen. Beispiele für Fusionspartner schließen Inteine (
US-Patentschrift Nr. 5,643,758 ), maltosebindende Proteine (MBPs) (
US-Patentschriften Nr. 5,643,758 und
7,825,218 ; und PCT-Veröffentlichung Nr.
WO 2010/114532 ), SNAP-TAG
® (US-Veröffentlichung Nr.
US-2004-0115130 ) ein oder können eine Substitution enthalten, die als Marker dient, wobei zum Beispiel ein Cystein gegen ein Selenocystein ausgetauscht ist (siehe Patentschrift Nr. 7,141,366). Alternativ dazu kann das Fusionsprotein ein Nukleinsäureaptamer zum Markieren oder zur Aufreinigung beinhalten (siehe zum Beispiel
US-Patentschriften 5,670,637 ;
5,696,249 ;
5,874,557 ;
5,693,502 ).
-
Mitglieder der Familie haben untereinander mindestens 30% Aminosäuresequenzidentität, zum Beispiel mindestens 40%, zum Beispiel mindestens 50%, zum Beispiel mindestens 50%, zum Beispiel mindestens 60%, zum Beispiel mindestens 70%, zum Beispiel mindestens 80%, zum Beispiel mindestens 90% oder mindestens 95% Aminosäuresequenzähnlichkeit, definiert mittels eines Promals-Alignments (Pei & Grishin Bioinformatics 23(7): 802–808 (2007)), und schließen PvuRts1I, PpeHI, AbaSDFI, EsaSS310P, EsaRBORFBP, PatTI, YkrI, EsaNI, SpeAI, BbiDI, PfrCORF1I80P, PcoORF314P und BmeD1 ein, von denen einige in Tabelle 1 und 13 beschrieben sind. Ein Familienmitglied beispielsweise ist AbaSDF1, wobei die Varianten AbaCI (GenBank: ACQB1000053), AbaAI (GenBank: ABXK01000045), AbaSI (GenBank: NC_009085), AbaUMB3ORFAP (GenBank: AEPM01000006) und Asp6ORFAP (GenBank: ACYS01000207 mindestens 95% Sequenzähnlichkeit zu AbaSDF1 aufweisen. Diese Enzyme wurden nicht mit in die Tabelle 1 aufgenommen. Ihre Eigenschaften sind im Wesentlichen die gleichen wie die von AbaSDFI. Ein Verweis auf die einzelnen Mitglieder der Familie soll Derivate und katalytisch aktive Fragmente davon einschließen.
-
Unter Anwendung von Standardverfahren zum Erzeugen monoklonaler oder polyklonaler Antikörper oder Antikörperfragmente lassen sich Antikörper gegen Mitglieder der ZZYZ-Enzymfamilie erzeugen. Diese Antikörper oder Fragmente davon können zum In-situ-Markieren eines an die hydroxymethylierte oder glucosylierte hydroxymethylierte große DNA gebundenen Mitglieds der ZZYZ-Enzymfamilie eingesetzt werden.
-
Ein Mitglied der ZZYZ-Familie von Enzymen ist PvuRts1I. Diese Restriktionsendonuklease wurde zuerst von Ishaq & Kaji (Biological Chemistry 255(9): 4040–4047 (1980)) beschrieben, die zeigten, dass es sich um eine hmC-spezifische Restriktionsendonuklease handelt, die durch das Plasmid Rts1 kodiert wird. Das PvuRts1I-Gen wurde kloniert und exprimiert (Janosi und Kaji, FASEB J. 6: A216 (1992); Janosi et al. Journal of Molecular Biology 242: 45–61 (1994)), und das Rts1-Plasmid wurde vollständig sequenziert (Murata et al. Journal of Bacteriology 184(12): 3194–202 (2002)).
-
Es wurde jedoch noch keine eingehende Untersuchung dieses Enzyms durchgeführt bzw.
veröffentlicht. Weiterhin gab es nach den ursprünglichen Veröffentlichungen nur wenig Interesse an diesem Enzym. Dies wurde durch die PCT-Veröffentlichung Nr.
WO 2010/037001 unterstrichen, die einen Abschnitt über Methoden zum Nachweis von hmC und ghmC enthält, jedoch dieses Enzym nicht erwähnt.
WO 2010/037001 beschreibt Methoden, die chemischer Natur sind oder Bindeproteine wie Antikörpern beinhalten. Wird auf Enzyme Bezug genommen, so werden als Beispiele ausschließlich Glucosyltransferasen angeführt.
-
Zur Untersuchung der Eigenschaften dieser Familie wie z. B. der Spezifität war es erforderlich, die Enzyme aufzureinigen. Nach sorgfältiger Analyse und umfangreichen Experimenten wurde entdeckt, dass viele herkömmlicherweise bei der Aufreinigung verwendete ionische Reagentien wie NaCI die Enzyme deaktivierten. Es wurde weiterhin entdeckt, dass die Verwendung verschiedener Typen von Salzen und ihre Konzentrationen die Aktivitätbeeinflussten. Es wurde gefunden, dass die ZZYZ-Familie von Enzymen in Gegenwart von Salzen wie Chloriden, Nitraten, Carbonate oder Imidazolsalzen desaktiviert wurden. Daraus wurde die Schlussfolgerung gezogen, dass man diese Salze vermeiden sollte. Andere Salze wie Sulfate, Phosphate, Acetate und Citrate schienen die Enzymaktivität bei hohen Konzentrationen zu inhibieren, und die Enzyme wurden daher bevorzugt bei Konzentrationen im Bereich von etwa 50–500 mM aufbewahrt oder verwendet.
-
Eine andere wichtige Erwägung war die Eigenschaft des Enzyms, hmC gegenüber mC und C zu bevorzugen. Da vorhergesagt wird, dass hmC im Genom mit einer sehr geringen Häufigkeit vorkommt, könnte eine Spaltung bei mC oder C im geringen Umfang ein hohes Hintergrundsignal herbeiführen, was die Fähigkeit zum Nachweis von hmC beeinträchtigen würde.
-
Eine Aufreinigung der Mitglieder der ZZYZ-Familie würde es erlauben, die Spalteigenschaften der Enzymfamilie zu untersuchen. Die ersten Versuche, natives oder rekombinantes PvuRts1I aufzureinigen, waren problematisch, da alle herkömmlicherweise zur Aufreinigung verwendeten Standardsäulen zu einem signifikanten Verlust von Enzymaktivität führten. Rekombinantes PvuRts1I wurde als Fusionsprotein mit einem an seinem C-Terminus oder N-Terminus angeordneten 6xHis-Tag hergestellt. Der 6xHis-Tag am N-Terminus von PvuRts1I hatte die unerwünschte Wirkung, dass die Spaltungsaktivität des Enzyms auf das nicht modifizierte Substrat in großem Maße erhöht wurde, was den Nutzen des Enzyms für den direkten Nachweis von hmC verminderte. Die Hinzufügung eines 6xHis-Tags am C-Terminus veränderte die relative Aktivität gegenüber den einzelnen Substraten mit verschiedenem Methylierungsstatus nicht, jedoch wurde die spezifische Aktivität des Enzyms signifikant herabgesetzt.
-
Rekombinantes PvuRts1I wurde auch mit einer Intein-CBD (IMPACTTM-Kit, NEB) fusioniert, diedann unter Freisetzung des aufgereinigten Enzyms abgespalten wurde. Auf diese Weise ließen sich hohe Ausbeuten an aktivem Enzym gewinnen (siehe Beispiel 1).
-
Das rekombinante Protein kann entweder alleine, modifiziert oder mit einem Tag fusioniert zur bildlichen Darstellung (Imaging) mit einem spektroskopischen Marker wie einem fluoreszenten oder chemilumineszenten Marker, einem radioaktiven Marker oder einem anderen reaktiven chemischen Mittel oder einem markierten Zucker, einem markierten Antikörper oder einem anderen markierten Proteintag (einschließlich zum Beispiel SNAP-TAG®, NEB) (siehe auch Chun-Xiao Song et al. Nature Biotechnology 29: 68–72 (2011)) markiert werden.
-
Die Anwendung des Assays, der wie in den 3–5 gezeigt die Konzentrationen an Enzym bestimmt, bei denen es zu einer maximal ghmC- und hmC-spezifischen Spaltung kam und eine minimale mC- und C-Spaltung nachgewiesen wurde, erlaubt die Identifizierung der Spaltungseigenschaften von Mitgliedern der ZZYZ-Familie. Die aus dieser Spezifitätsanalyse erhaltenen Ergebnisse (siehe zum Beispiel Tabelle 1) zeigten, dass die Mitglieder dieser Familie ein signifikant verbessertes und vereinfachtes Verfahren zur spezifischen Identifizierung und Kartierung von hmC in DNA boten.
-
Ein Merkmal der Reagentien für die effektive Analyse von hmC in einem Genom beinhaltet die Fähigkeit der Reagentien, hmC und/oder ghmC im Vergleich zu mC und C zu bevorzugen. Es wurden daher für die Enzymspaltungsspezifität Verhältnisse bestimmt. Beispiele für Verhältnisse bei verschiedenen Enzymen in der ZZYZ-Familie sind in Tabelle 1 angeführt.
-
Es wurde gefunden, dass die aufgereinigten Enzyme aus der ZZYZ-Familie ein Mindestspaltverhältnis für hmC oder ghmC:mC von mindestens 8:1 haben, zum Beispiel 50:1, zum Beispiel mindestens 100:1, zum Beispiel mindestens 200:1 oder zum Beispiel mindestens 250:1; und ein Mindestspaltverhältnis für hmC oder ghmC:C von mindestens 50:1, zum Beispiel mindestens 100:1, zum Beispiel mindestens 200:1 oder zum Beispiel mindestens 250:1. Diese Verhältnisse lassen sich nach dem in Beispiel 1 und den 3–5 beschriebenen Assay bestimmen.
-
Zur Verbesserung der Konsistenz des Assays wurden PCR-DNAs anstelle von DNA der Phagen T4 und Lambda verwendet. hmC-, mC- und C-haltige DNA-Substrate wurden erhalten durch PCR eines im Handel (Integrated DNA Technologies (IDT), Coralville, IA, USA) erhältlichen synthetischen Oligonukleotids, bei dem dCTP wie gewünscht durch hydroxymethyliertes Desoxycytidintriphosphat (hmdCTP) oder methyliertes Desoxycytidintriphosphat (mdCTP) ersetzt wurde. Das hmC-PCR-Fragment wurde weiter durch BTG glucosyliert und so in ein ghmC-PCR-DNA-Fragment umgewandelt. Die Ergebnisse dieses Assays zeigten zum Beispiel, dass PvuRts1I ein Aktivitätsverhältnis von hmC:ghmC:5-mC:C = 2000:2000:8:1 hat; bei PpeHI beträgt dieses 120:250:2:1; bei AbaSDFI 500:8000:1:NN. NN bedeutet, dass es selbst bei den höchsten Enzymkonzentrationen keine nachweisbare Spaltung gibt.
-
Ein Merkmal der Mitglieder der ZZYZ-Familie ist, dass die genaue Spaltstelle 3'-stromabwärts vom hmC oder ghmc um nicht mehr als 5 Nukleotide, zum Beispiel nicht mehr als 3 Nukleotide, variieren darf. So wurde zum Beispiel mit synthetischen Substraten (siehe beispielsweise Beispiel 3 und 6–8) gezeigt, dass, wenngleich die Mitglieder der ZZYZ-Familie dsDNA überwiegend in einem einzigen definierten Abstand vom hmC oder ghmC spalteten, die Spaltstelle in einem Abstand von 11–13 Nukleotiden vom hmC oder ghmC auf dem einen Strang und in einem Abstand von 9–10 Nukleotiden vom hmC oder ghmC auf dem gegenüberliegenden Strang (ghmCN11-13/N9-10) vorkommen konnte. Die Spaltung an einer symmetrischen hmC-Stelle (hmCG/GhmC) auf einem Duplex-DNA liefert ein Spaltfragment von etwa 20–23 bp.
-
Eine Würdigung der Schwankungen der Spaltdistanz bei der ZZYZ-Familie von Enzymen ist wichtig für die Kartierung der Stellen der hmC-Basen in einem Genom. In 8C wurde außerdem festgestellt, dass das Vorhandensein eines ghmC anstelle von hmC keine beobachtbare Auswirkung auf die Spaltdistanz hatte. Es wurde jedoch bemerkt, dass die Spaltaktivität verstärkt sein kann, wenn sich ein G 21–22 Nukleotide von der ZZYZ-Erkennungsstelle entfernt auf dem gegenüberliegenden Strang befindet, wenngleich es kein absolutes Erfordernis für ein G an dieser Stelle gibt, und es auch keine signifikante und nicht einmal eine nachweisbare Beeinflussung (bias) durch Nukleotide gibtghmC oder hmC unmittelbar flankieren.
-
Die Stelle, and der sich hmC oder ghmC in einer großen DNA befindet, lässt sich somit erschließen durch Klonieren der Spaltprodukte und/oder durch Sequenzieren, zum Beispiel Sequenzierungsplattformen mit ultrahohem Durchsatz (siehe Beispiel 7). Mittels Mitgliedern der ZZYZ-Familie ist es möglich, in einer einzigen Enzymreaktion hmCs oder ghmCs zu identifizieren und zu kartieren und diese von mCs zu unterscheiden. Befinden sich zwei hemimethylierte CpG-Stellen dicht nebeneinander, ist es möglich festzustellen, in welcher der 4 möglichen Positionen sich das hmC befindet (zum Beispiel 9–11).
-
Die Verwendung der ZZYZ-Familie von Enzymen zum Erzeugen eines Satzes von Fragmenten zur genomischen Analyse der Hydroxymethylierung oder zu einem anderen Zweck kann sich auf ein einzelnes Enzym stützen oder eine Mehrzahl von Enzymen einschließen, wobei einige oder alle der Enzyme folgendes sind: Mitglieder der ZZYZ-Familie; von Mitgliedern der ZZYZ-Familie abgeleitet; Mitglieder der MspJI-Familie (PCT-Veröffentlichung Nr.
WO2010/075375 ) von Enzymen und/oder der MmeI-like-Familie von Restriktionsendonukleasen einschließen; und/oder andere Arten von Restriktionsendonukleasen.
-
Eines der Merkmale, die die ZZYZ-Familie von Proteinen charakterisieren, ist das Vorhandensein einer Bindungsdomäne (C-terminal) und einer katalytischen Domäne (N-terminal). Die Bindungsdomäne von ZZYZ-ähnlichen Enzymen lässt sich sowohl für in-vivo- als auch für in-vitro-Anwendungen nutzen. Beispiele für Anwendungen der Bindungsdomäne schließen die Folgenden ein: In-vitro-Anreicherung hmC-haltiger DNA zum Beispiel als Reagens für die Affinitätsaufreinigung oder das In-vivo-Targeting von hmC. Letzteres lässt sich bewerkstelligen, indem man die Bindungsdomäne markiert oder die Bindungsdomäne mit anderen Domänen fusioniert, um sie in die hmC-Stellen im Genom einzubringen. Man kann die Bindungsdomäne auch mit einer Nukleasedomäne fusionieren, um Brüche des Doppelstrangs in der Nähe der hmC-Stellen zur Aktivierung des DNA-Reparaturwegs herbeizuführen, so dass der epigenetische Status dieser Stellen geändert werden kann.
-
Die Bestimmung des Hydroxymethylierungsniveaus von DNA-Proben ist für epigenetische Studien von Bedeutung. Die epigenetische Regulierung des Genoms schließt die Remodellierung von Chromatin ein, die zum Teil auf der Umwandlung von mC in hmC beruht. Unterschiede bei Hydroxymethylierungsmustern können entscheidende Indikatoren für unangebrachte Entwicklungsprozesse, zum Beispiel bei embryonalen Stammzellen, sein. Diese Unterschiede lassen sich jetzt bequem mit einem Enzym aus der Familie der ZZYZ-Proteine untersuchen, welches selektiv auf hmC und ghmC zielt. Diese Nukleotidmodifikationen lassen sich dann Stellen auf einem Methylom oder Genom zuordnen.
-
In der PCT-Anmeldung Nr.
PCT/US2010/046632 , die in ihrer Gesamtheit Bestandteil der vorliegenden Anmeldung ist, wird näher auf die Bedeutung der Kartierung hydroxymethylierter Nukleotide im Genom für das Verständnis des Phänotyps einer Wirtszelle und eines Organismus eingegangen. Mit der ZZYZ-Familie alleine oder in Verbindung mit anderen Enzymen (zum Beispiel einem Mitglied der MspJI-Familie oder MspI oder funktionell mit MspI verwandten Enzymen) lässt sich ein Methylom und Hydroxymethylom bereitstellen, wobei gleichzeitig eine hier beschriebene Sequenziertechnik oder andere im Stand der Technik bekannte Sequenziertechniken zur Anwendung gelangen.
-
Der/die aus der Enzymspaltung mit einem oder mehreren Enzymen aus der ZZYZ-Familie und gegebenenfalls anderen DNA-spaltenden Enzymen, die modifizierte Nukleotide spalten, hervorgehenden Satz/Sätze von Fragmenten lässt/lassen sich unter Anwendung von Hochdurchsatz-Sequenziermethoden der gegenwärtig verfügbaren Art unter Einsatz zum Beispiel von NextGen-Sequenziermethoden zum Identifizieren und Kartieren von hmCs oder ghmCs in DNA sequenzieren. Eine Auswahl von spezifischen Spaltprodukten, die mit bestimmten Regionen des Genoms hybridisieren, kann bei diagnostischen Schnellverfahren zum Aufdecken der anormalen Gegenwart oder Abwesenheit von hmCs oder ghmCs zum Einsatz gelangen, die mit einer Krankheit wie Krebs korreliert. Zur Bestimmung eines bestimmten Phänotyps bei einem Individuum lassen sich spezielle Oligonukleotide anwenden. So kann zum Beispiel die Hybridisierung eines Satzes von Fragmenten mit einer definierten Sequenz oder einem definierten Satz von Sequenzen, die auf einer festen Oberfläche präsentiert wird/werden (Array-Hybridisierung) oder in einer Lösung markiert (tagged) sind (oder umgekehrt) Diskrepanzen aufdecken zwischen Fragmenten in dem Satz und einem Standardsatz von Fragmenten, die das Methylom charakterisieren. qPCR- oder Array-Hybridisierung kann auch zum Untersuchen einer oder mehrerer bekannter Stellen von Interesse auf Häufigkeit verwendet werden. Das hmC oder ghmC oder die Bindungsdomäne kann zum Erleichtern des Nachweises mit einem fluoreszierenden oder chemilumineszenten Tag oder nach anderen im Stand der Technik bekannten Markierungsmethoden markiert werden.
-
Durch die Aufreinigung von Mitgliedern der ZZYZ-Familie von Enzymen und die Charakterisierung ihrer Spaltungsspezifitäten und ihrer Fähigkeit, Hemi-hmC von symmetrischer hmC zu unterscheiden, steht zum ersten Mal die Art von Datengewinnung zur Verfügung, die in der Forschung, medizinischen Diagnostik und Therapie zum Verstehen der Rolle und der Implikationen von hydroxymethylierter DNA für einen bestimmten Phänotyp benötigt werden.
-
Die ausführlichen Beschreibungen von medizinischen Leiden finden sich in der PCT-Veröffentlichung Nr.
WO2010/037001 , die hiermit durch Verweis in ihrer Gesamtheit Bestandteil der vorliegenden Anmeldung wird. In all den Fällen, bei denen TET-Proteine an der Genexpression beteiligt sind, ist es erforderlich, festzustellen, wo sich das von TET erzeugte hmC befindet, und es wird somit wünschenswert sein, die hier beschriebene ZZYZ-Familie zu verwenden. Tabelle 1: Beispiele für Mitglieder der ZZYZ-Familie von Proteinen
Name | Alternative Bezeichnung | hmC | ghmC | mCG | C | Länge, Ähnlichkeit und Identität zu Pvu Rts1I | Quelle |
PvuRts1I | PvuRts1I | 2000 | 2000 | 8 | 1 | 293,
100%,
100% | Proteus vulgaris (Rts1) |
PpeHI | PROPEN_01738 | 128 | 256 | 2 | 1 | 294,
72,5%,
64,6% | Proteus penneri ATCC 35198 |
PatTI | Pat1_1499 | 2000 | 8000 | 128 | 1 | 306,
51,4%,
36,5% | Pseudoalteromonas atlantica T6c ATCC BAA-1087 |
YkrI | Ykris0001_38440 | 250 | 1000 | 64 | 1 | 299,
49,6%,
36,1% | Yersinia kristensenii ATCC33638 |
EsaNI | GOS_7810815 | 128 | 64 | 8 | 1 | 299,
47,8%,
39,6% | Marine metagenome |
AbaSDFI | ABSDF3356 | 500 | 8000 | 1 | 0 | 317,
47,8%,
35,4% | Acinetobacter baumannii SDF |
SpeAI | Spea_2956 | | | | | 285,
47,1%,
35,6% | Shewanella pealeana ATCC 700345 |
BbiDI | BbifN4_02244 | | | | | 311,
43,3%,
32,0% | Bifidobacterium bifidum NCIMB 41171 |
BmeDI | | | | | | 300,
40,0%,
30,5% | Bacillus megaterium strain DSM319 |
-
Die angeführten experimentellen Vorschriften sollen nicht einschränkend sein. Der Durchschnittsfachmann könnte das experimentelle Schema, so wie es unten angeführt ist, auf beliebige weitere Mitglieder der neu definierten Familie anwenden.
-
Alle hier angegebenen Literaturstellen einschließlich der provisorischen US-Anmeldungsnummern 61/376,932, eingereicht am 25. August 2010, und 61/296,630, eingereicht am 20. Januar 2010, sind durch Verweis Bestandteil der vorliegenden Anmeldung.
-
BEISPIELE
-
Beispiel 1: Aufreinigung von ZZYZ-Proteinen und Assay auf Aktivität und Spezifität
-
Die ausgewählten Sequenzen, die bei einer BLAST-Suche (Zhang et al. J. Comput. Biol. 7(1–2): 203–214 (2000)) erkannt und als Mitglied der ZZYZ-Familie bestimmt wurden, lassen sich durch im Stand der Technik bekannte Methoden, zum Beispiel die in-vitro-Transkription-Translation (PURExpress®, NEB), exprimieren. Das Gen lässt sich gegebenenfalls codonoptimieren und dann wie unten für PvuRts1I beschrieben klonieren.
-
PvuRts1I wurde wie folgt aufgereinigt: ein für PvuRts1I kodierendes Gen wurde in einen pTXB1-Vektor (NEB) eingefügt, in ER2566 (einem T7-Expressionswirt) kloniert und in LB mit Ampicillin (100 μg/ml) bei 30°C als 4 × 10 ml Übernachtkultur kultiviert. Die 4 × 10 ml Übernachtkulturen wurden in 2 × 1I LB mit Ampicillin (100 μg/ml) inokuliert. Nachdem die 1-I-Kultur 6 Stunden lang bei 30°C kultiviert worden war, wurde der Kultur IPTG zu einer Endkonzentration von 500 μM zugesetzt. Die Kultur wurde weiter bei 16°C über Nacht inkubiert. Das PvuRts1I wurde unter Einsatz einer Schwerkraftsäule mit Chitinperlen aufgereinigt. Nachdem das PvuRts1I in einem Hochsalz-Puffer (10 mM Tris-Acetat, 500 mM KoAc, pH 8,0) auf die Säule aufgebracht worden war, wurde die Säule nochmals mit dem Hochsalz-Puffer gewaschen. Die Säule wurde mit drei Säulenvolumina Hochsalz-Puffer mit 30 mM DTT gründlich durchgespült. Die Säule wurde 16 Stunden lang bei 4°C in dem Hochsalz-Puffer mit DTT inkubiert. Das Protein wurde so eluiert und konzentriert. Insgesamt wurden etwa 10 mg PvuRts1I erhalten. Das Protein wurde dann zu 50%igem Glycerin gegeben und bis zur weiteren Gelcharakterisierung bei –20°C aufbewahrt. Ließ man 1 μg des Eluats auf einem 10%igen bis 20%igen Polyacrylamidgel laufen, so wurden Banden von aufgereinigtem Enzym nachgewiesen, was die Reinheit der Enzyme bestätigte (siehe 1). Dieses Verfahren wurde auch zur Aufreinigung anderer Mitglieder der ZZYZ-Familie wie PpeHI, AbaSDFI, PatTI, EsaNI und YkrI angewendet.
-
Für die Untersuchung des aufgereinigten Enzyms auf Substrataktivität und -spezifität wurde ein wie in 2 beschriebenes synthetisches Substrat mittels PCR amplifiziert. Mit Cytosin, mC oder hmC wurde in der PCR-Reaktion ein Produkt entweder mit unmodifiziertem C oder vollmodizifiertem C hergestellt. Das PCR-Produkt mit hmC wurde anschließend mit BGT und UDP-Glucose umgesetzt, um hmC in ghmC umzuwandeln.
-
Die Analyse von Substratspezifität und -aktivität erfolgte wie folgt: es wurde eine Reaktionsmischung angesetzt, die das Enzym (3 μl mit 33–123 μg Enzym), 3 μl Kaliumacetat (Endkonzentration 250 mM) und NEB4-Puffer (NEB), 50 ng des DNA-Substrats, bei dem das Cytosin unsubstituiert oder durch hmC, ghmC oder mC substituiert ist, enthielt, und es wurde mit Wasser bis zu einem Endreaktionsvolumen von 30 μl versetzt.
-
Das Enzym wurde reihenverdünnt und zur Reaktionsmischung gegeben, die 20 min bei Raumtemperatur (23°C) inkubiert und dann auf ein 1,8%iges Agarosegel aufgebracht wurde. Die Reaktion wurde mittels Stopplösung beendet, und die Ergebnisse sind in den 3–5 gezeigt und in Tabelle 1 zusammengefasst. Der Spaltbereich in der Tabelle 1 zeigt, dass hmC erkannt und mindestens 50mal aktiver gespalten wurde als Cytosin, und mehr als 8mal aktiver als mC. Bei AbaSDF1 war die relative Spaltaktivität bei ghmC 8000mal aktiver als bei hmC und bei hmC 500mal aktiver als bei mC, und bei C wurde keine Aktivität nachgewiesen.
-
Zusätzlich zu der Untersuchung auf Aktivität und relative Spezifität (Verhältnisse) lässt sich die Gleichgewichts-Dissoziationskonstante (Kd) für Mitglieder der ZZYZ-Familie bestimmen. Dementsprechend lässt sich die Reaktionsgeschwindigkeit von Enzymen mit verschiedenen modifizierten Substrat-Oligonukleotiden durch Gelmobilitätsverschiebungs-Assays an Micropure-EZ-Säulen (Millipore, Billerica, MA, USA) bestimmen. So kann man zum Beispiel konstante Mengen der markierten Oligonukleotide mit zunehmenden Mengen Enzym unter nicht spaltenden Bedingungen, z. B. ohne Mg2+, mischen und die Enzym-DNA-Mischung auf einem nativen Polyacrylamidgel oder unter Verwendung von Spin-Säulen, die, wenn das Enzym gebunden ist, ausschließlich DNA-Oligonukleotide (Spaltprodukte) zurückhalten, analysieren. Die Kd-Daten lassen sich in Einweichexperimenten zur Gewinnung von Kokristallen verwenden. Darüber hinaus können der Kd der C-terminalen Domäne, die als Bindungsmodul für die hydroxymethylierte Base dient, und ihre flankierenden Sequenzen im Substrat auf ähnliche Weise bestimmt werden.
-
Beispiel 2: Bestimmung der Spaltstelle auf dem Substrat durch Mitglieder der ZZYZ-Familie
-
Um zu bestätigen, dass die ZZYZ-Familie von Proteinen dsDNA 3' stromabwärts vom Erkennungsnukleotid in einer festgelegten Position spaltet, wurden synthetische Oligonukleotide erzeugt, die auf einem Strang oder auf beiden Strängen markiert waren und die symmetrische hmC- oder ghmC-Nukleotide enthielten oder hemihydroxymethyliert waren, wie in 7 gezeigt. Alle Oligonukleotide mit Fluoreszenzmarkern wurden nach Standardvorschriften der organischen Synthese unter Einsatz von hmC-Phosphoramidit (Glen Research, Sterling, VA, USA) hergestellt. Die dsDNAs wurden gebildet, indem man die beiden Oligonukleotiden zu einer 10 μM Lösung verschmelzen (anneal) ließ. Alle Verdauungen wurden in NEB4-Puffer (NEB) durchgeführt. Bei jeder Verdauung wurde 10 pmol Substrat bei 37°C 1 Stunde lang mit 1 Einheit PpeHI inkubiert. Eine Einheit ist definiert als die Menge an Enzym, die benötigt wird, um innerhalb von 1 Stunde bei 37°C 1 μg T4gt-DNA zu einem stabilen Muster von kleinen Fragmenten zu verdauen. Von den Reaktionsmischungen wurden dann jeweils 2 μl auf ein 20%iges Polyacrylamidgel mit 7M Harnstoff gegeben. Die Ergebnisse sind in 7 gezeigt. Die Pfeile zeigen die Banden, die den rechts vom Gel gezeigten Spaltfragmenten entsprechen. Das Ergebnis zeigt, dass das Enzym dazu fähig ist, beide Seiten der Erkennungssequenz in einem ungefähr im Wesentlichen festgelegten Abstand von der Erkennungsstelle zu spalten.
-
Beispiel 3: Bestimmung des Spaltabstands auf den einzelnen Strängen von Duplex-DNA
-
Die Spezifität des Spaltabstands wurde ebenfalls bestimmt. Unter Anwendung von Standardvorschriften der organischen Synthese wurden markierte und unmarkierte, hmC enthaltende Oligonukleotide wie in Beispiel 2 beschrieben synthetisiert. Oligonukleotid-Größenmarker wurden ebenfalls synthetisiert, um die Spaltstellen zu bestimmen, wie in 8A gezeigt. Aus den Bahnen 3 und 4 ist zu ersehen, dass sich die Spaltstellen im zum hmC enthaltenden Strang komplementären Strang 9–10 nt auf der 3'-Seite des hmC befanden.
-
Zur Bestimmung der Spaltstellen im gleichen Strang des hmC wurden dsDNAs gebildet, indem die das hmC enthaltenden Oigonukleotide mit Oligonukleotiden verschmelzen gelassen wurden, die nicht modifiziertes Cytosin in einer 20-μM-Lösung enthielten. 40 μl verschmolzene DNA wurden entsprechend den Anweisungen des Herstellers mit T4 BGT (NEB) behandelt. Nach der Umsetzung wurde die DNA mit dem QlAquick®-Kit zum Entfernen von Nukleotiden (Quigen, Germantown, MD, USA) aufgereinigt und in einem Volumen von 30 μl eluiert. Die 3'-Markierungsreaktion erfolgte unter Verwendung von Taq-Polymerase (NEB) in Gegenwart von alpha33P-dATP gemäß Standardvorschriften. Ungefähr 10 pmol Substrat wurden bei 37°C 1 Stunde lang mit 1 Einheit AbaSDFI in Puffer 4 inkubiert. 2 μl des Ansatzes wurden zusammen mit Markern auf 20%iges Polyacrylamidgel mit 7M Harnstoff aufgebracht. Die Marker wurden synthetisch hergestellt und unter Einsatz von T4-Polynukleotidkinase (NEB) mit gamma-33P-ATP markiert. Das Gel wurde getrocknet, Phosphoscreen ausgesetzt und gescannt. Die Ergebnisse sind in 8B gezeigt. Aus 8B lässt sich ableiten, dass sich die Spaltstellen in einem Abstand von 12–13 Nukleotiden vom hmC im gleichen Strang befinden.
-
Obwohl Spaltfragmente mit einer spezifischen Größe in den 8A und 8B überwiegen, wurde gefunden, dass es durch den Sequenzzusammenhang und die Enzymkonzentration zu einer Unschärfe an der Enzymspaltstelle kommen kann, so dass die Spaltstellen um ein oder zwei Nukleotide variieren können.
-
Beispiel 4: Bestimmung, ob ghmC eine andere oder eine ähnliche Wirkung wie hmC auf die Spaltmuster hat
-
Unter Anwendung der oben beschriebenen Methoden wurde die Spaltspezifität von durch hmC und ghmC modifizierten Stellen miteinander verglichen.
-
Alle Oligonukleotide mit Fluoreszenzmarkern und hmC wurden wie oben beschrieben durch organische Synthese hergestellt. Die hmC enthaltenden Substrate wurden gemäß den Anleitungen des Herstellers unter Verwendung von T4-BGT (NEB) in ghmC-haltige Substrate umgewandelt. Die Ergebnisse in 8C zeigen, dass die hmC enthaltende DNA in den Bahnen 1 und 3 die gleiche Spaltabstandsspezifität wie ghmC in den Bahnen 2 und 4 hatte.
-
Beispiel 5: Klonieren von hmC-Fragmenten aus genomischer DNA aus Rattenhirn
-
Der Nutzen von ZZYZ-Enzymen bei der Entdeckung von hmC-Stellen in genomischer DNA aus Rattenhirn wurde untersucht. 1 μg genomischer DNA aus Rattenhirn wurde zunächst mit T4-BGT behandelt, um hmC in ghmC umzuwandeln. Die DNA wurde nach der Reaktion ausgefällt und einem AbaSDFI-Verdau unterzogen. Die verdauten DNA-Produkte wurden nochmals aufgereinigt und mit einem synthetischen dsDNA-Adapter in die Ligierungsreaktion gegeben. Ein Ende des Adapters hatte einen 3'-Überhang mit zwei degenerierten Basen, so dass er mit einen 3'-Überhang von 2 Basen mit den Enden des Spaltprodukts ligiert werden konnte. Die ligierten Produkte wurden dann auf einem Agarosegel mit niedrigem Schmelzpunkt laufen gelassen und nach einer Größe von 1 kb–3 kb ausgewählt. Die ihrer Größe entsprechend ausgewählte DNA wurde dann unter Verwendung eines für den ligierten Adapter spezifischen Primers PCR-amplifiziert. Der PCR-Primer kann so beschaffen sein, dass er mehrere Restriktionsstellen aufweist. In diesem Beispiel wurde XbaI zum Klonieren verwendet. Die PCR-Produkte wurden aufgereinigt und mit XbaI verdaut und für die Transformation mit einem kompatiblen Vektor ligiert. Kolonien wurden herangezogen und zur Bestimmung der klonierten Inserts sequenziert.
-
Bei der anschließenden rechnerischen Analyse wurden die Sequenzen der klonierten Inserts alle dem Ratten-Vergleichgenom zugeordnet. Die Enden dieser Sequenzen bezeichneten den von AbaSDFI erzeugten 3'-Überhang von 2 Basen. Wir extrahierten dann ein 40-bp-Sequenzfenster sowohl links als auch rechts von den Spaltstellen und glichen die Sequenzen zum Aufzeigen eines möglichen Konsensus ab (aligned), wie in 10 gezeigt. Sowohl auf der rechten als auch auf der linken Seite der Spaltstelle wurden zwei hervorstehende CG-Kluster beobachtet. Der Abstand zwischen diesen CG-Klustern und der Spaltstelle entsprach den Spaltabständen des AbaSDFI-Enzyms. Ohne an eine Theorie gebunden sein zu wollen, wird vorgeschlagen, dass es zu einer Dimerisierung von AbaSDFI kommen könnte, die zu Spaltabständen von etwa 22 Nukleotiden auf der einen Seite des modifizierten Cytosins führt. Es kann somit die Schlussfolgerung gezogen werden, dass mindestens eine der CG-Stellen hydroxymethyliert ist.
-
Beispiel 6: Nachweis von hydroxymethylierten Basen in genomischer DNA
-
Embryonische Stammzellen aus E14-Mäusen und genomische DNA von NIH3T3-Mäusen ~500 ng wurden in NEB4-Puffer bei 25°C einem einstündigen Verdau mit einer erhöhten Konzentration von PvuRts1I unterzogen. Die Molekulargewichtsmarker waren mit MspI DNA-verdauter pBR322, wobei die Größe einiger der Banden auf der rechten Seite angegeben ist. Die verdauten Produkte wurden auf einem 20%igen TBE-Gel über 2 Stunden bei 140 V aufgetrennt, mit SYBER® Gold-Nukleinsäuregelanfärbemittel (Invitrogen, jetzt Life Technologies, Carlsbad, CA, USA) angefärbt und mit einem Typhoon-Scanner (GE Healthcare Life Sciences, Piscataway, NJ, USA) unter Verwendung eines 488-nM-Lasers quantifiziert (siehe 15).
-
Beispiel 7: Kartierung (mapping) von hmCs enthaltenden Sequenzen
-
Wenn im Genom hmC vorkommt, so scheint es gewöhnlich an einer CpG-Stelle vorzukommen. Es ist jedoch auch wahrscheinlich, dass die DNA an dieser CpG-Stelle hemihydroxymethyliert ist. Wenn zwei benachbarte CpG-Stellen in einer DNA-Sequenz vorkommen und die Spaltmuster eine Hemihydroxymethylierung nahelegen, kann es erforderlich sein, festzustellen, welches der beiden möglichen CpGs hydroxymethyliert ist. Das folgende Experiment erläutert, wie sich die Position einer hemihydroxymethylierten Stelle feststellen lässt, selbst wenn zwei benachbarte CpGs vorliegen.
-
DNA-Fragmente werden bei der spezifischen oder nicht spezifischen Spaltung eines Genoms gebildet. Vorhandene freie Enden an diesen Fragmenten werden zum Beispiel durch Abstumpfen und Dephosphorylierung blockiert. Die Spaltfragmente werden mit AdapterOligonukleotiden ligiert. Die Fragmente werden dann einer Spaltung durch ein Enzym aus der ZZYZ-Familie (zum Beispiel AbaSDF1) unterzogen. Um festzustellen, ob DNA auf beiden Seiten einer Spaltstelle ein hmC enthält oder nur eine Seite ein hmC aufweist, wird verdaute genomische DNA abgestumpft (blunted) und unter Einsatz des NEBNext® Quick Ligation Module (NEB M2200) mit einem X-bar-codierten SOLiD-Primer und P1-Primer ligiert. Nach dem Ligieren wird die DNA nochmals durch die ZZYZ-Familie von Enzymen verdaut, und die Fragmente, die von dem X-bar-codierten SOLiDTM-Primer (Applied Biosystems, now Life Technologies, Carlsbad, CA, USA) nicht wegverdaut werden können, enthalten die Sequenz stromabwärts vom hmC. Die Fragmente, die verdaut werden können, liefern ein Produkt mit einem spezifischen 3'-Ende mit 2 nt, welches von den X-barcodierten Primern stammt. Dann wird ein zweiter Y-bar-codierter SOLiDTM-Primer an die freien Ende ligiert; diese Runde von SOLiDTM-Sequenzieren enthüllt die das hmC enthaltende Sequenz. Es ist bei diesem Verfahren ohne Bedeutung, ob die 5-hmC-Stellen gehäuft vorkommen oder zufällig verteilt sind (11).
-
Die Feststellung der Position von hmC in einer DNA-Sequenz und die Zuordnung (mapping) der Sequenz zu einer Genomkarte ermöglicht das Erstellen eines Hydroxymethyloms. Es ermöglicht weiterhin einen diagnostischen Test, mit dem das Vorhandensein von hmC auf einer Target-DNA festgestellt und dieses dann mit einem Vergleichshydroxymethylom verglichen werden kann, um eine Korrelation mit einem Phänotyp herzustellen. Durch den spezifischen Enzymverdau mit oder ohne Glucosylierung, gekoppelt mit qPCR, lässt sich die Hydroxymethylierung an bestimmten Stellen quantifizieren.
-
Durch die Identifizierung der Position und Anzahl an hmC aus verschiedenen Quellen, einschließlich unterschiedlichen Geweben, und durch eine Zellkultur zu verschiedenen Zeitpunkten lassen sich wichtige Erkenntnisse über die Genexpression und -regulierung gewinnen.
-
Beispiel 8: Verfahren zum Nachweis von hmC in einer DNA-Probe
-
Die Charakterisierung der ZZYZ-Familie von Proteinen eröffnet neue Möglichkeiten zur schnellen Analyse einer großen Anzahl von Patientenproben oder zu einem im Sprechzimmer des Arztes durchzuführenden diagnostischen Test.
-
Nachdem die hmCs einem Hydroxymethylom zugeordnet wurden und ausgewählte hmC-Positionen mit einem Phänotyp korreliert wurden, wird es wünschenswert sein, das Vorhandensein von speziellen hmCs in Zielregionen des Genoms bestimmen. Dies lässt sich durch Einsatz eines Enzymes aus der ZZYZ-Familie von Proteinen leicht bewerkstelligen. Ist die DNA symmetrisch hydroxymethyliert, erhält man ein Fragment mit einer spezifischen Größe (20–23 nt). Ist die DNA hemihydroxymethyliert, so lässt sich das Vorhandensein von hmC wie unten angegeben feststellen.
-
Eine genomische DNA wird gegebenenfalls glucosyliert und dann in einem geeigneten Puffer wie 250 mM Kaliumacetat einem Enzym aus der ZZYZ-Familie von Proteinen ausgesetzt, um die Spaltung in Fragmente an einer Stelle 11–13 Nukleotide 3' stromabwärts vom hmC auf dem selben Strang und 9–10 Nukleotide 3' stromabwärts vom hmC auf dem komplementären Strang herbeizuführen. Den Sequenzen auf beiden Seiten der Spaltstelle des ZZYZ-Proteins jeweils komplementäre Primer werden ausgewählt, so dass die nicht gespaltene DNA amplifiziert wird. Die nachgewiesenen Fragmente entsprechen dann einem Nicht-Vorhandensein von hmC. Wäre die DNA durch ein ZZYZ-Protein gespalten worden, was das Vorhandensein hmC anzeigt, so würde kein Amplifikationsprodukt nachgewiesen werden. Durch Vergleich des Amplifikationsproduktes in mit ZZYZ-Protein behandelten und nicht behandelten Proben lässt sich die prozentuale Hydroxymethylierung potentiell abschätzen. Alternativ dazu kann man eine Primersequenz enthaltende Adapter an die versetzt angeordneten Enden an der 3'-Spaltstelle ligieren oder an die DNA mit abgestumpftem Ende ligieren, und nur die Fragmente mit einem hmC werden durch eine primerabhängige Amplifikation amplifiziert. Das Vorhandensein von hmC wird somit als Amplifikationsprodukt nachgewiesen. Die amplifizierten Fragmente können in diesem Fall sequenziert werden.
-
Ein Vorteil des obigen Verfahrens ist es, dass die gesamte Umsetzung in einem einzelnen Reaktionsgefäß oder einer einzelnen mikrofluidischen Vorrichtung oder einem einzelnen Chip durchgeführt werden kann.
-
Beispiel 9: Kit zum Nachweis von hmC in einer DNA-Probe
-
Es wird ein Kit bereitgestellt, welches ein oder mehrere aufgereinigte rekombinante Proteine einer ZZYZ-Familie von Proteinen, funktionelle Derivate davon oder katalytische Fragmente davon, zum Beispiel AbaSDF1, zusammen mit einem geeigneten Reaktionspuffer und zusätzlich eine BGT und UDP-Glucose enthält. Darüber hinaus kann ein Kit Oligonukleotidadapter enthalten, um das Hochdurchsatz-Sequenzieren zu erleichtern. Zusätzlich kann das Kit weitere Enzyme enthalten, die sich für das Abstumpfen und Ligieren eignen, und bei weiteren Ausführungsformen können sie spezielle Primer enthalten. Gemäß einer Ausführungsform der Erfindung enthält das Kit weiterhin Verpackungsmaterialien und Anleitungen zur Anwendung der Kits.
-
Es folgt ein Sequenzprotokoll nach WIPO St. 25.
Dieses kann von der amtlichen Veröffentlichungsplattform des DPMA heruntergeladen werden.
-
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- WO 2010/037001 [0001, 0001, 0048, 0048, 0067]
- US 10/46632 [0001]
- US 5643758 [0044, 0044]
- US 7825218 [0044]
- WO 2010/114532 [0044]
- US 2004-0115130 [0044]
- US 5670637 [0044]
- US 5696249 [0044]
- US 5874557 [0044]
- US 5693502 [0044]
- WO 2010/075375 [0061]
- US 2010/046632 [0064]
-
Zitierte Nicht-Patentliteratur
-
- Tahiliani et al., Science 324(5929): 930-5 (2009 [0001]
- Kriaucionis und Heintz, Science 324(5929): 929–30 (2009) [0001]
- Cokus et al., Nature 452: 215–219 (2008) [0001]
- Pei & Grishin Bioinformatics 23(7): 802–808 (2007) [0028]
- Pei & Grishin Bioinformatics 23(7): 802–808 (2007) [0045]
- Ishaq & Kaji (Biological Chemistry 255(9): 4040–4047 (1980)) [0047]
- Janosi und Kaji, FASEB J. 6: A216 (1992); Janosi et al. Journal of Molecular Biology 242: 45–61 (1994) [0047]
- Murata et al. Journal of Bacteriology 184(12): 3194–202 (2002) [0047]
- veröffentlicht. Weiterhin [0048]
- Chun-Xiao Song et al. Nature Biotechnology 29: 68–72 (2011) [0053]
- Zhang et al. J. Comput. Biol. 7(1–2): 203–214 (2000) [0070]