-
VERWANDTE ANMELDUNG
-
Diese Anmeldung nimmt nach 35 U.S.C. §119 der Vereinigten Staaten die Priorität der vorläufigen Anmeldung 61/938,608 in Anspruch, die am 11. Februar 2014 eingereicht wurde und deren gesamte Lehre hierin durch Referenz aufgenommen ist.
-
HINTERGRUND DER ERFINDUNG
-
Die rationale Manipulation von großen DNA-Konstrukten ist eine zentrale Herausforderung für die aktuelle synthetische Biologie und Bemühungen des Genom Engineerings. In den letzten Jahren ist eine Vielzahl von Technologien entwickelt worden, um diese Herausforderung zu bewältigen und die Spezifität und Geschwindigkeit zu erhöhen, mit der Mutationen erzeugt werden können. Darüber hinaus sind adaptive Mutationen eine zentrale Triebkraft der Evolution, aber über ihre Häufigkeit und ihren relativen Beitrag zu zellulären Phänotypen ist selbst in den am besten untersuchten Organismen nur wenig bekannt. Dies ist zum Großteil auf die technischen Herausforderungen zurückzuführen, die mit der Beobachtung und Rekonstruktion dieser Genotypen und der Korrelation ihrer Anwesenheit mit dem Phänotyp von Interesse assoziiert sind. Beispielsweise führen Genom Editier-Verfahren, die auf zufällige Mutagenese angewiesen sind, zu komplexen Genotypen, die aus vielen Mutationen bestehen, deren relativer Beitrag schwer aufzuschlüsseln ist. Darüber hinaus ist es aufgrund des Fehlens von Informationen bezüglich der individuellen Mutationen schwierig, die epistatischen Interaktionen zwischen den Allelen zuzuordnen.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
”Clustered Regularly Interspersed Short Palindromic Repeats” (CRISPR) kommen in vielen bakteriellen Genomen vor und man hat herausgefunden, dass sie eine wichtige Rolle in der adaptiven bakteriellen Immunität spielen. Transkription dieser Arrays führt zu CRISPR-RNAs, die für die Gen-Repression oder DNA-Spaltung die sequenz-spezifische Bindung der CRISPR/cas-Komplexe zu DNA-Targets in Zellen dirigieren. Die Spezifität dieser Komplexe ermöglicht neuartige in vivo Anwendungen für Stamm-Engineering.
-
Hierin werden Verfahren zur rationalen multiplex Manipulation von Chromosomen innerhalb der offenen Leserahmen (z. B. zur Erzeugung von Protein-Bibliotheken) oder innerhalb mehrerer Gene in einem beliebigen Segment eines Chromosoms beschrieben, in denen verschiedene CRISPR-Systeme verwendet werden. Diese Verfahren stellen ein effizienteres kombinatorisches Genom Engineering als die bisher beschriebenen zur Verfügung.
-
Die Erweiterung der Multiplexing-Fähigkeiten von CRISPR stellt eine aktuelle technologische Herausforderung dar und würde die Verwendung dieser Systeme zum Erzeugen rationaler Bibliotheken im Hochdurchsatzformat ermöglichen. Solche Fortschritte weisen weitreichende Auswirkungen auf die Felder des metabolischen und Protein-Engineerings auf, die die Überarbeitung komplexer genetischer Netzwerke für eine optimale Produktion anstreben.
-
Die Verfahren umfassen Einführen von Bestandteilen des CRISPR-Systems, umfassend die CRISPR-assoziierte Nuklease Cas9 und eine sequenz-spezifische Guide-RNA (gRNA), in Zellen, was zu sequenz-gerichteten Doppelstrangbrüchen unter Verwendung der Fähigkeit des CRISPR-Systems solche Brüche zu induzieren, führt. Die Bestandteile des CRISPR-Systems, umfassend die CRISPR-assoziierte Nuklease Cas9 und eine sequenz-spezifische Guide-RNA (gRNA), können codiert auf einem oder mehreren Vektoren, wie beispielsweise einem Plasmid, in die Zellen eingeführt werden. DNA-Rekombineering-Kassetten oder Editier-Oligonukleotide können rational entworfen werden, so dass sie eine gewünschte Mutation innerhalb des Target-Locus und eine Mutation an einem gemeinsamen Ort außerhalb des Target-Locus enthalten, die von dem CRISPR-System erkannt werden können. Die beschriebenen Verfahren können für viele Anwendungen verwendet werden, umfassend Ändern eines Wegs von Interesse.
-
In einer Ausführungsform ist das Verfahren ein Verfahren zum Genom Engineering, umfassend: (a) Einführen eines Vektors in Zellen, wobei der Vektor codiert: (i) eine Editier-Kassette, die eine Region beinhaltet, die homolog zu der Target-Region der Nukleinsäure in der Zelle ist und eine Mutation (bezeichnet als eine gewünschte Mutation) mindestens eines Nukleotids relativ zu der Target-Region, wie beispielsweise eine Mutation mindestens eines Nukleotids in mindestens einem Codon relativ zu der Target-Region, und eine „Protospacer Adjacent Motif” (PAM) Mutation beinhaltet; (ii) einen Promoter; und (iii) mindestens eine Guide-RNA (gRNA), wobei die gRNA umfasst: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert, wodurch Zellen hergestellt werden, die den Vektor umfassen; (b) Aufrechterhalten der Zellen, die den Vektor umfassen, unter Bedingungen, unter denen Cas9 exprimiert wird, wobei die Cas9 Nuklease auf dem Vektor codiert wird, auf einem zweiten Vektor codiert wird oder in dem Genom der Zellen codiert wird, was zur Herstellung von Zellen führt, die den Vektor umfassen und die PAM-Mutation nicht umfassen und Zellen die den Vektor und die PAM-Mutation umfassen; (c) Kultivieren des Produkts von (b) unter Bedingungen, die für die Lebensfähigkeit der Zelle geeignet sind, wodurch lebensfähige Zellen hergestellt werden; (d) Erhalten von lebensfähigen Zellen, die in (c) hergestellt wurden; und (e) Sequenzieren des Editier-Oligonukleotids des Vektors von mindestens einer lebensfähigen Zelle, die in (d) erhalten wurde und Identifizieren der Mutation mindestens eines Codons.
-
In einer anderen Ausführungsform ist das Verfahren ein Verfahren zum Genom Engineering durch mit verfolgbarem CRISPR angereichertes Recombineering (engl. trackable CRISPR enriched recombineering), umfassend: (a) Einführen eines Vektors in eine erste Population von Zellen, wobei der Vektor codiert: (i) mindestens eine Editier-Kassette, die umfasst: (a) eine Region, die homolog zu einer Target-Region einer Nukleinsäure ist und eine Mutation mindestens eines Nukleotids relativ zu der Target-Region, wie beispielsweise eine Mutation mindestens eines Nukleotids in mindestens einem Codon relativ zu der Target-Region, und (b) eine „Protospacer Adjacent Motif” (PAM) Mutation umfasst; (ii) mindestens einen Promoter; und (iii) mindestens eine Guide-RNA (gRNA), umfassend: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert, wodurch eine zweite Population von Zellen hergestellt wird, die den Vektor umfasst; (b) Aufrechterhalten der zweiten Population von Zellen unter Bedingungen, unter denen die Cas9 Nuklease exprimiert wird, wobei die Cas9 Nuklease auf dem Vektor codiert wird, auf einem zweiten Vektor oder in dem Genom der Zellen codiert wird, was zur DNA-Spaltung in den Zellen, die die PAM-Mutation nicht umfassen, und zum Tod solcher Zellen führt; (c) Erhalten von lebensfähigen Zellen, die in (b) hergestellt wurden; und (d) Identifizieren der Mutation mindestens eines Codons durch Sequenzieren des Editier-Oligonukleotids des Vektors von mindestens einer Zelle der zweiten Population von Zellen.
-
Jede der obigen Ausführungsformen kann weiter Synthetisieren und/oder Erhalten einer Population von Editier-Oligonukleotiden umfassen. Jede Ausführungsform kann weiter Amplifizieren der Population von Editier-Oligonukleotiden umfassen. In jeder der Ausführungsformen kann der Vektor weiter einen Spacer, mindestens zwei Priming-Stellen oder sowohl einen Spacer als auch mindestens zwei Priming-Stellen umfassen. In einigen Ausführungsformen umfasst die Editier-Kassette eine Target-Region, die eine Mutation mindestens eines Codons innerhalb von 100 Nukleotiden von der PAM-Mutation umfasst.
-
Ebenfalls beschrieben ist ein Vektor, umfassend:
- (i) eine Editier-Kassette, die eine Region umfasst, die homolog zu einer Target-Region einer Nukleinsäure in einer Zelle ist und eine Mutation (bezeichnet als eine gewünschte Mutation) mindestens eines Nukleotids relativ zu der Target-Region, und eine „Protospacer Adjacent Motif” (PAM) Mutation beinhaltet;
- (ii) einen Promoter; und
- (iii) mindestens eine Guide-RNA (gRNA), umfassend: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert.
-
Eine weitere Ausführungsform ist ein Vektor, umfassend:
- (i) eine Editier-Kassette, die eine Region beinhaltet, die homolog zu einer Target-Region einer Nukleinsäure in einer Zelle ist und eine Mutation (bezeichnet als eine gewünschte Mutation) mindestens eines Nukleotids in mindestens einem Codon relativ zu der Target-Region und eine „Protospacer Adjacent Motif” (PAM) Mutation beinhaltet;
- (ii) einen Promoter; und
- (iii) mindestens eine Guide-RNA (gRNA), umfassend: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert.
-
Eine weitere Ausführungsform ist ein Vektor, umfassend:
- (i) mindestens eine Editier-Kassette umfassend: (a) eine Region, die homolog zu einer Target-Region einer Nukleinsäure ist und eine Mutation mindestens eines Nukleotids relativ zu der Target-Region und (b) eine „Protospacer Adjacent Motif” (PAM) Mutation umfasst;
- (ii) mindestens einen Promoter; und
- (iii) mindestens eine Guide-RNA (gRNA), umfassend: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert.
-
Eine weitere Ausführungsform des Vektors ist ein Vektor, umfassend:
- (i) eine Editier-Kassette, umfassend: (a) eine Region, die homolog zu einer Target-Region einer Nukleinsäure ist und eine Mutation mindestens eines Nukleotids in mindestens einem Codon relativ zu der Target-Region und (b) eine „Protospacer Adjacent Motif” (PAM) Mutation umfasst;
- (ii) mindestens einen Promoter; und
- (iii) mindestens eine Guide-RNA (gRNA), umfassend: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert.
-
In jeder der Ausführungsformen kann der Vektor weiter einen Spacer; mindestens zwei Priming-Stellen; oder einen Spacer und mindestens zwei Priming-Stellen umfassen. In diesen Vektoren, in denen die Mutation mindestens eines Nukleotids in mindestens einem Codon ist, kann sich die Editier-Kassette beispielsweise innerhalb von 100 Nukleotiden von der PAM-Mutation befinden.
-
Ebenfalls beschrieben ist eine Bibliothek, umfassend eine Population von Zellen, die durch die hierin beschriebenen Verfahren hergestellt wurde. Eine Bibliothek von einer Population von Zellen kann Zellen mit jedem der hierin beschriebenen Vektoren umfassen. Beispielsweise kann eine Population von Zellen einen Vektor umfassen, wobei der Vektor umfasst:
- (i) eine Editier-Kassette, die eine Region beinhaltet, die homolog zu einer Target-Region einer Nukleinsäure in einer Zelle ist und eine Mutation (bezeichnet als eine gewünschte Mutation) mindestens eines Nukleotids relativ zu der Target-Region und eine „Protospacer Adjacent Motif” (PAM) Mutation beinhaltet;
- (ii) einen Promoter; und
- (iii) mindestens eine Guide-RNA (gRNA), umfassend: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert.
-
In einer weiteren Ausführungsform kann eine Population von Zellen einen Vektor umfassen, wobei der Vektor umfasst:
- (i) eine Editier-Kassette, die eine Region beinhaltet, die homolog zu einer Target-Region einer Nukleinsäure in einer Zelle ist und eine Mutation (bezeichnet als eine gewünschte Mutation) mindestens eines Nukleotids in mindestens einem Codon relativ zu der Target-Region, und eine „Protospacer Adjacent Motif” (PAM) Mutation beinhaltet;
- (ii) einen Promoter; und
- (iii) mindestens eine Guide-RNA (gRNA), umfassend: (a) eine Region (RNA), die komplementär zu einem Teil der Target-Region ist; und (b) eine Region (RNA), die eine Cas9 Nuklease rekrutiert.
-
In einer weiteren Ausführungsform ist das Verfahren ein Verfahren für CRISPR-unterstütztes rationales Protein-Engineering (kombinatorisches Genom Engineering), umfassend:
- (a) Konstruieren einer Donor-Bibliothek, die rekombinante DNA umfasst, wie beispielsweise rekombinante Chromosomen oder rekombinante DNA in Plasmiden, durch Einführen beispielsweise durch Co-Transformation, in eine Population von ersten Zellen (i) eines oder mehrerer Editier-Oligonukleotide, wie beispielsweise rational entworfene Oligonukleotide, die die Deletion eines ersten einzelnen „Protospacer Adjacent Motif” Motivs (PAM) mit einer Mutation mindestens eines Codons in einem zu dem PAM benachbarten Gen (das benachbarte Gen) koppeln und (b) eine Guide-RNA (gRNA), die eine Nukleotid-Sequenz 5' von dem offenen Leserahmen eines Chromosoms anzielt, wodurch eine Donor-Bibliothek hergestellt wird, die eine Population von ersten Zellen umfasst, die rekombinante Chromosomen mit gezielten Codon Mutationen umfasst;
- (b) Amplifizieren der in (a) konstruierten Donor-Bibliothek, beispielsweise durch PCR-Amplifikation rekombinanter Chromosome, die ein synthetisches Merkmal der Editier-Oligonukleotide verwenden und gleichzeitig eine zweite PAM-Deletion (Ziel-PAM-Deletion) an dem 3'-Terminus des Gens einbauen, wodurch die gezielten Codon-Mutationen direkt mit der Ziel-PAM-Deletion gekoppelt werden, beispielsweise durch kovalentes Koppeln, und wodurch eine wiedergewonnene Donor-Bibliothek hergestellt wird, die die Ziel-PAM-Deletion und die gezielten Codon-Mutationen trägt; und
- (c) Einführen (z. B. Co-Transformieren) der Donor-Bibliothek, die die Ziel-PAM-Deletion und die gezielten Codon-Mutationen trägt und einem Ziel-gRNA-Plasmid in eine Population von zweiten Zellen, die typischerweise eine Population von naiven Zellen ist, wodurch eine Ziel-Bibliothek hergestellt wird, die die gezielten Codon-Mutationen umfasst.
-
Die Population der ersten Zellen und die Population der zweiten Zellen (z. B. Eine Population von naiven Zellen) sind typischerweise eine Population, in denen die Zellen alle von dem gleichen Typ sind und die prokaryotisch oder eukaryotisch sein können, wie beispielsweise, aber nicht beschränkt auf Bakterien, Säugerzellen, Pflanzenzellen, Insektenzellen.
-
In einigen Ausführungsformen umfasst das Verfahren weiter Aufrechterhalten der Ziel-Bibliothek unter Bedingungen, unter denen Protein hergestellt wird.
-
In einigen Ausführungsformen exprimiert die erste Zelle ein Polypeptid mit Cas9-Nukleaseaktivität. In einigen Ausführungsformen wird das Polypeptid mit Cas9-Nukleaseaktivität unter Kontrolle eines induzierbaren Promoters exprimiert.
-
In einigen Ausführungsformen sind die Editier-Oligonukleotide komplementär zu einer (einer, einer oder mehreren, mindestens einer) Target-Nukleinsäure, die in der ersten Zelle vorliegt. In einigen Ausführungsformen zielen die Editier-Oligonukleotide mehr als eine Target-Stelle oder -Locus in der ersten Zelle an. In einigen Ausführungsformen umfasst die Nukleinsäuresequenz der Editier-Oligonukleotide [gewünschtes Codon] eine oder mehrere Substitutionen, Deletionen, Insertionen oder jegliche Kombinationen von Substitutionen, Deletionen und Insertionen relativ zu der Target-Nukleinsäure. In einigen Ausführungsformen werden die Editier-Oligonukleotide rational entworfen; in weiteren Ausführungsformen werden sie durch zufällige Mutagenese oder unter Verwendung degenerierter Primer-Oligonukleotide hergestellt. In einigen Ausführungsformen stammen die Editier-Oligonukleotide aus einer Sammlung von Nukleinsäuren (Bibliothek).
-
In einigen Ausführungsformen wird die gRNA auf einem Plasmid codiert. In einigen Ausführungsformen werden das Editier-Oligonukleotid und die gRNA durch Transformation in die erste Zelle eingeführt, beispielsweise durch Co-Transformation des Editier-Oligonukleotids und der Guide(g)-RNA. In einigen Ausführungsformen werden das Editier-Oligonukleotid und die gRNA sequenziell in die erste Zelle eingeführt. In anderen Ausführungsformen werden das Editier-Oligonukleotid und die gRNA gleichzeitig in die erste Zelle eingeführt.
-
In einigen Ausführungsformen umfasst Wiedergewinnen der Donor-Bibliothek weiter (a) Screening der Zellen auf Einbau der Editier-Oligonukleotide und (b) Selektieren der Zellen, bei denen bestätigt wurde, dass sie das Editier-Oligonukleotid eingebaut haben. In einigen Ausführungsformen umfasst Wiedergewinnen der Donor-Bibliothek weiter Bearbeitung der wiedergewonnenen Donor-Bibliothek.
-
In einigen Ausführungsformen exprimiert die Zielzelle/naive Zelle ein Polypeptid mit Cas9-Nukleaseaktivität. In einigen Ausführungsformen wird das Polypeptid mit Cas9-Nukleaseaktivität unter Kontrolle eines induzierbaren Promotors exprimiert.
-
Ebenfalls beschrieben ist ein Verfahren für CRISPR-unterstütztes rationales Protein-Engineering, umfassend:
- (a) Einführen (z. B., Co-Transformieren) von (i) synthetischen dsDNA Editier-Kassetten, die Editier-Oligonukleotide umfassen und (ii) einem Vektor, der eine Guide-RNA (gRNA) exprimiert, die die genomische Sequenz direkt stromaufwärts von einem Gen von Interesse in einer Population von ersten Zellen anzielt, unter Bedingungen, unter denen Multiplex Recombineering und selektive Anreicherung der Editier-Oligonukleotide durch gRNA auftritt, wodurch eine Donor-Bibliothek hergestellt wird;
- (b) Amplifizieren der Donor-Bibliothek mit einem Oligonukleotid, dass ein „Protospacer Adjacent Motif” (PAM) Motiv deletiert, das zu dem 3'-Ende des Gens von Interesse benachbart ist (Ziel-PAM), wodurch eine amplifizierte Donor-Bibliothek hergestellt wird, die dsDNA Editier-Kassetten, von denen aus die Ziel-PAM deletiert worden ist (mit einer 3' PAM-Deletion), rationale Codon-Mutationen, und eine P1-Stelle umfasst; und
- (c) Bearbeiten der amplifizierten Donor-Bibliothek mit einem Enzym, wie beispielsweise einem Restriktionsenzym (z. B. BsaI), um die P1-Stelle zu entfernen; und
- (d) Co-Transformieren einer Population von naiven Zellen mit der in (c) bearbeiteten amplifizierten Donor-Bibliothek und der Ziel-gRNA, wodurch eine Population von co-transformierten Zellen hergestellt wird, die dsDNA-Editier-Kassetten, von denen aus die Ziel-PAM deletiert worden ist (mit einer 3' PAM-Deletion), rationale Codon-Mutationen, und die Ziel-gRNA umfassen.
-
In allen beschriebenen Ausführungsformen kann eine Mutation von jedem gewünschten Typ sein, wie beispielsweise eine oder mehrere Insertionen, Deletionen, Substitutionen oder jegliche Kombinationen von zwei oder drei der zuvor genannten (z. B. Insertion und Deletion; Insertion und Substitution; Deletion und Substitution; Substitution und Insertion; Insertion, Deletion und Substitution). Insertionen, Deletionen und Substitutionen können eine beliebige Zahl von Nukleotiden betreffen. Sie können sich in Codons (codierenden Regionen) und/oder in nicht-codierenden Regionen befinden.
-
KURZE BESCHREIBUNG DER FIGUREN
-
1A und 1B geben einen Überblick über CRISPR-unterstütztes, rationales Protein-Engineering (engl. CRISPR assisted rational protein engineering, CARPE). 1A zeigt ein Schema zur Konstruktion einer Donor-Bibliothek. Synthetische dsDNA Editier-Kassetten werden mit einem Vektor co-transformiert, der eine Guide-RNA (gRNA) exprimiert, der die genomische Sequenz stromaufwärts des Gens von Interesse anzielt. Die Co-Transformation erzeugte über Multiplex Recombineering eine Donor-Bibliothek von den Editier-Oligonukleotiden, die selektiv durch die gRNA angereichert werden. Die Donor-Bibliothek wurde dann unter Verwendung eines Oligonukleotids amplifiziert, das ein PAM mutiert (deletiert), das zu dem 3'-Ende des Gens benachbart ist (Ziel-PAM). 1B zeigt ein Schema zur Konstruktion einer finalen Protein-Bibliothek. Die Donor-Bibliothek wurde mit BsaI bearbeitet, um die P1-Stelle zu entfernen, und die Bibliothek der dsDNA-Kassetten mit der 3'PAM-Deletion und den rationalen Codon-Mutationen wurde mit der Ziel-gRNA co-transformiert, um die finale Protein-Bibliothek zu erzeugen.
-
2 zeigt die DNA-Sequenzen von Klonen aus der Konstruktion der galK Donor-Bibliothek, was den hocheffizienten Einbau des P1-Merkmals der Editier-Oligonukleotide (90% Mutationseffizienz), sowie die Mutation an der Target-Codon-Position (unterstrichen; 20% Mutationseffizienz) bestätigt. Die Sequenz von P1 wird in SEQ ID NO: 1 bereitgestellt.
-
3A zeigt das Primer-Design. 3B zeigt die erwartete Dichte relativ zu der Zahl der Primer.
-
4A stellt Linker- und Konstrukt-Ergebnisse dar. 4B zeigt 10 Änderungen in Bezug auf Emulsions-PCR-basiertes Tracking.
-
5 ist ein Schema für rationales Protein-Editieren für metabolisches Engineering, wobei bei paralleler Synthese der Bibliothek 104–105 Merkmale pro Synthese gewonnen werden können.
-
6 ist ein Schema zur Erzeugung von CRISPR-angereicherten, rationalen Protein-Bibliotheken, umfassend die Schritte 1) Multiplex-Rekombination, 2) Wiedergewinnung der Bibliothek und 3) Multiplex-Rekombination durch Koppeln von PAM mit der Bibliothek von Mutationen. CRISPR ermöglicht dabei eine schnelle Selektion rekombinanter Genotypen zum Anreichern der Protein-Bibliotheken von der Platte.
-
7 ist ein Schema des Aufbaus und Demonstration von CARPE.
-
8 zeigt Strategien zur iterativen CRISPR Co-Selektion.
-
9 zeigt eine Strategie für Multiplex Protein-Engineering unter Verwendung von CARPE, umfassend die Schritte 1) Konstruktion der Donor-Bibliothek (Multiplex-Rekombination), 2) Wiedergewinnung der Donor-Bibliothek mittels PCR und 3) Konstruktion der Ziel-Bibliothek (Multiplex-Rekombination). Es liegen zwei PAM-Stellen für jede Gen-Bibliothek vor. Diese Strategie ermöglicht die rationale Konstruktion der Bibliothek für ORFs und ein schnelles Protein-Engineeringpotential.
-
10 zeigt den Konzeptnachweis der Konstruktion einer galK Donor-Bibliothek unter Verwendung von CARPE, umfassend die Schritte 1) Konstruktion der Donor-Bibliothek (Multiplex-Rekombination) und 2) Wiedergewinnung der Donor-Bibliothek mittels PCR, welche aus Flüssigkulturen, 3 Stunden nach der Rekombination erfolgt.
-
11A zeigt ein Schema für Multiplex CRISPR-basiertes Editieren unter Verwendung von CARPE. 11B zeigt ein Schema für Multiplex CRISPR-basiertes Editieren (Multiplex Amplifikation/Klonierung) unter Verwendung von Genom Engineering durch Recombineering, angereichert mit verfolgbarem CRISPR (engl. Genome Engineering by trackable CRISPR enriched recombineering, GEn-TraCER).
-
12 zeigt einen repräsentativen GEn-TraCER Vektor (Konstrukt), der eine Editier-Kassette zum Editieren von Codon 24 von galK, einen Promotor, und einen Spacer beinhaltet.
-
13 zeigt die Ergebnisse einer galK Editierung unter Verwendung von GEn-TraCER. Die oberen Abschnitte zeigen DNA-Sequenzierergebnisse des Chromosoms und des Vektors (Plasmids) der Zellen, die mit dem galK Codon 24 Editier-GEn-TraCER-Vektor transformiert worden sind, was darauf hindeutet, dass die Editier-Kassette (Oligonukleotid) auf dem Vektor als ein „trans-Barcode” sequenziert werden kann, was ein hocheffizientes Verfolgen der gewünschten Genomänderung (Mutation) ermöglicht. Der untere Teil zeigt DNA-Sequenzierchromatographen der Zellen, die den nicht-geänderten, Wildtyp-Phänotyp (rot) zeigen. Das Verfahren ermöglicht die Identifizierung von Zellen mit multiplen Chromosomen, die sowohl das Wildtyp-, nicht-geänderte Allel als auch das geänderte/mutierte Allel tragen.
-
14A–14C zeigen Schemata für GEn-TraCER. 14A zeigt einen Überblick über die Design-Bestandteile. Die GEn-TraCER Kassette enthält Guide-RNA (gRNA) Sequenz(en), um eine spezifische Stelle in dem Zellgenom anzuzielen und dsDNA-Spaltung zu bewirken. Eine homologe Region, die komplementär zur Target-Region ist, mutiert das PAM und andere naheliegende gewünschte Stellen. Die Zellen, die Rekombination durchlaufen, werden selektiv auf hohe Abundanz angereichert. Sequenzieren der GEn-TraCER Editier-Kassette in dem Vektor ermöglicht Verfolgen der genomischen Änderungen/Mutationen mit Genom-weitem Tracking mit kurzer Lesung. 14B zeigt eine beispielhafte Editier-Kassette für das E. coli galK Gen an Codon 145. Das PAM wird mit der am nächsten verfügbaren PAM-Mutation deletiert, die für eine synonyme Änderung an der am nächsten verfügbaren PAM-Position erstellt werden kann. Dies ermöglicht Mutagenese mit einer „stillen Narbe” von 1–2 Nukleotiden an der PAM-Deletionsstelle. 14C zeigt GEn-TraCER Kassetten die unter Verwendung von Array-basierten Syntheseverfahren synthetisiert werden können, wodurch parallele Synthese von mindestens 104–106 Kassetten für ein systematisches Targeting und gleichzeitige Auswertung der Fitness für tausende Mutationen auf einer genomweiten Skala ermöglicht wird.
-
15A zeigt einen Überblick über GEn-TraCER Vektoren. 15B zeigt einen Teil eines repräsentativen GEn-TraCER zur Erzeugung einer Y145* Mutation in dem E. coli galK Gen, in dem die PAM-Mutation und das Codon, das mutiert wird, durch 17 Nukleotide getrennt sind. Die Nukleinsäuresequenz des Teils des repräsentativen GEn-TraCER wird in SEQ ID NO: 28 bereitgestellt und die reverse, komplementäre Sequenz wird durch SEQ ID NO: 33 bereitgestellt.
-
16A–16C zeigen Kontrollen für das GEn-TraCER Design. 16A zeigt die Auswirkung der Größe der Editier-Kassette auf die Effizienz des Verfahrens. 16B zeigt die Auswirkung des Abstands zwischen der PAM-Mutation/Deletion und der gewünschten Mutation auf die Effizienz des Verfahrens. 16C zeigt die Auswirkung der Anwesenheit oder Abwesenheit des MutS-Systems auf die Effizienz des Verfahrens.
-
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
-
Bakterien und Archaea CRISPR-Systeme haben sich als leistungsfähige Werkzeuge für präzises Genom Editieren herausgestellt. Das Typ-II CRISPR-System von Streptococcus pyogenes (S. pyogenes) ist in vitro besonders gut charakterisiert worden, und es sind einfache Design-Regeln zum Umprogrammieren von dessen doppelsträngiger DNA(dsDNA)-Bindungsaktivität aufgestellt worden (Jinek et al. Science (2012) 337 (6096): 816–821). Die Verwendung von CRISPR-vermittelten Genom Editier-Verfahren hat sich in der Literatur schnell für eine breite Vielzahl von Organismen angesammelt, umfassend Bakterien (Cong et al. Science (2013) 339 (6121): 819–823), Saccharomyces cerevisiae (DiCarlo et al. Nucleic Acids Res. (2013) 41: 4336–4343), Caenorhabditis elegans (Waaijers et al. Genetics (2013) 195: 1187–1191) und verschiedene Säugerzelllinien (Cong et al. Science (2013) 339 (6121): 819–823; Wang et al. Cell (2013) 153: 910–918). Wie bei anderen Endonuklease-basierten Genom Editier-Technologien, wie beispielsweise Zink-Finger-Nukleasen (ZFNs), Homing Nukleasen und TALENEN, beruht die Fähigkeit der CRISPR-Systeme präzises Genom Editieren zu vermitteln, auf der hochspezifischen Natur der Target-Erkennung. Beispielsweise benötigt das Typ-I CRISPR-System von Escherichia coli und das S. pyogenes System eine perfekte Komplementarität zwischen der CRISPR RNA (crRNA) und einem 14–15 Basenpaar-langen Erkennungstarget, was darauf hindeutet, dass die Immunfunktionen der CRISPR-Systeme auf natürliche Weise eingesetzt werden (Jinek et al. Science (2012) 337 (6096): 816–821; Brouns et al. Science (2008) 321: 960–964; Semenova et al. PNAS (2011) 108: 10098–10103).
-
Hierin werden Verfahren zum Genom Editieren beschrieben, die eine Endonuklease einsetzen, wie beispielsweise die Cas9 Nuklease, die durch ein cas9 Gen codiert wird, um direkte Genom-Evolution durchzuführen/Änderungen (Deletionen, Substitutionen, Additionen) in der DNA, wie beispielsweise genomischer DNA zu erzeugen. Das cas9 Gen kann aus jeder beliebigen Quelle erhalten werden, wie beispielsweise aus einem Bakterium, wie beispielsweise dem Bakterium S. pyogenes. Die Nukleinsäuresequenz von cas9 und/oder Aminosäuresequenz von Cas9 kann relativ zu der Sequenz eines natürlich vorkommenden cas9 und/oder Cas9 mutiert sein; Mutationen können beispielsweise ein oder mehrere Insertionen, Deletionen, Substitutionen oder jegliche Kombinationen von zwei oder mehr der zuvor genannten sein. In solchen Ausführungsformen kann das resultierende mutierte Cas9 eine erhöhte oder verminderte Nukleaseaktivität relativ zu dem natürlich vorkommenden Cas9 aufweisen.
-
Die 1A, 1B, und 11A zeigen ein CRISPR-vermitteltes Genom Editier-Verfahren, das als CRISPR-unterstütztes rationales Protein-Engineering (engl. CRISPR assisted rational Protein engineering, CARPE) bezeichnet wird. CARPE ist ein zweistufiges Konstruktionsverfahren, das auf der Erzeugung der „Donor-” und „Ziel-”Bibliotheken beruht, die gerichteten Mutationen von Einzelstrang-DNA (ssDNA) oder Doppelstrang-DNA (dsDNA) Editier-Kassetten direkt in das Genom einbauen. In der ersten Stufe der Donor-Konstruktion (1A), werden rational gestaltete Editier-Oligos mit einer Guide-RNA (gRNA), die an eine Target-DNA-Sequenz, wie beispielsweise eine Sequenz 5' eines offenen Leserahmens oder einer anderen Sequenz von Interesse, hybridisiert oder diese anzielt, in Zellen co-transformiert. Eine Schlüsselinnovation von CARPE ist die Gestaltung von Editier-Oligonukleotiden, die die Deletion oder Mutation eines einzigen ”Protospacer Adjacent Motif” (PAM) Motivs mit der Mutation eines oder mehrerer gewünschter Codons in dem benachbarten Gen koppelt, wodurch die Erzeugung der gesamten Donor-Bibliothek in einer einzigen Transformation ermöglicht wird. Die Donor-Bibliothek wird dann durch Amplifikation der rekombinanten Chromosomen wiedergewonnen, z. B. durch eine PCR-Reaktion, unter Verwendung eines synthetischen Merkmals des Editier-Oligonukleotids; eine zweite PAM-Deletion oder Mutation wird gleichzeitig an dem 3'-Ende des Gens eingebaut. Dieser Ansatz koppelt daher die Codon-angezielten Mutationen direkt kovalent an eine PAM-Deletion. In einer zweiten Stufe von CARPE (1B) werden die PCR-amplifizierten Donor-Bibliotheken, die die Ziel-PAM-Deletion/Mutation und die gezielten Mutationen (gewünschte Mutation(en) eines oder mehrerer Nukleotide, wie beispielsweise einem oder mehreren Nukleotiden in einem oder mehreren Codons) tragen, mit einem Ziel-gRNA-Vektor in naive Zellen co-transformiert, um eine Population von Zellen zu erzeugen, die eine rational entworfene Protein-Bibliothek exprimiert.
-
In dem CRISPR-System lenken die CRISPR trans-aktivierende (tracrRNA) und die Spacer-RNA (crRNA) die Auswahl einer Target-Region. Wie hierin verwendet, bezieht sich eine Target-Region auf jeden Locus in der Nukleinsäure einer Zelle oder einer Population von Zellen, in denen mindestens eine Mutation mindestens eines Nukleotids, wie beispielsweise eine Mutation mindestens eines Nukleotids in mindestens einem Codon (einem oder mehreren Codons) gewünscht wird. Die Target-Region kann beispielsweise ein genomischer Locus (genomische Target-Sequenz) oder ein extra-chromosomaler Locus sein. Die tracrRNA und crRNA können als ein einzelnes, chimäres RNA-Molekül exprimiert werden, das als eine Einzel-Guide-RNA, Guide-RNA oder gRNA bezeichnet wird. Die Nukleinsäuresequenz der gRNA umfasst eine erste Nukleinsäuresequenz, die auch als eine erste Region bezeichnet wird, die komplementär zu einer Region der Target-Region ist und eine zweite Nukleinsäuresequenz, die auch als eine zweite Region bezeichnet wird, die eine Haarnadelstruktur (engl: stem loop structure) bildet und zur Rekrutierung von Cas9 zu der Target-Region dient. In einigen Ausführungsformen ist die erste Region der gRNA komplementär zu einer Region, die sich stromaufwärts der genomischen Target-Sequenz befindet. In einigen Ausführungsformen ist die erste Region der gRNA komplementär zu mindestens einem Teil der Target-Region. Die erste Region der gRNA kann vollständig komplementär (100% komplementär) zu der genomischen Target-Sequenz sein oder eine oder mehrere Fehlpaarungen beinhalten, vorausgesetzt, dass sie ausreichend komplementär zu der genomischen Target-Sequenz ist, um Cas9 spezifisch zu hybridisieren/zu lenken und zu rekrutieren. In einigen Ausführungsformen ist die erste Region der gRNA mindestens 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, oder mindestens 30 Nukleotide lang. In einigen Ausführungsformen ist die erste Region der gRNA mindestens 20 Nukleotide lang. In einigen Ausführungsformen ist die Haarnadelstruktur, die durch die zweite Nukleinsäuresequenz gebildet wird, mindestens 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, oder 100 Nukleotide lang. In spezifischen Ausführungsformen ist die Haarnadelstruktur zwischen 80 bis 90 oder 82 bis 85 Nukleotide lang, und in weiteren spezifischen Ausführungsformen ist die zweite Region der gRNA, die eine Haarnadelstruktur bildet, 83 Nukleotide lang.
-
In einigen Ausführungsformen ist die Sequenz der gRNA (von der Donor-Bibliothek), die unter Verwendung des CARPE-Verfahrens in die erste Zelle eingeführt wird, die gleiche, wie die Sequenz der gRNA (von der Ziel-Bibliothek), die in die zweite/naive Zelle eingeführt wird. In einigen Ausführungsformen wird mehr als eine gRNA in die Population der ersten Zellen und/oder der Population der zweiten Zellen eingeführt. In einigen Ausführungsformen umfasst das mehr als eine gRNA-Molekül eine erste Nukleinsäuresequenz, die komplementär zu mehr als einer Target-Region ist.
-
In dem CARPE Verfahren können Doppelstrang-DNA-Kassetten, die auch als Editier-Oligonukleotide bezeichnet werden, zur Verwendung in den beschriebenen Verfahren aus vielen Quellen erhalten werden oder daraus abstammen. Beispielsweise stammen die dsDNA-Kassetten in einigen Ausführungsformen von einer Nukleinsäure-Bibliothek, die durch nicht-homologe zufällige Rekombination (engl. non-homologous random recombination, NRR) diversifiziert wurde; solch eine Bibliothek wird als eine NRR-Bibliothek bezeichnet. In einigen Ausführungsformen werden die Editier-Oligonukleotide synthetisiert, beispielsweise durch Array-basierte Synthese. Die Länge der Editier-Oligonukleotide kann von dem Verfahren abhängen, das zur Gewinnung der Editier-Oligonukleotide verwendet wird. In einigen Ausführungsformen ist das Editier-Oligonukleotid ungefähr 500–200 Nukleotide, 75–150 Nukleotide, oder zwischen 80–120 Nukleotide lang.
-
Ein Editier-Oligonukleotid beinhaltet (a) eine Region, die homolog zu einer Target-Region der Nukleinsäure der Zelle ist und eine Mutation (bezeichnet als eine gewünschte Mutation) mindestens eines Codons relativ zu der Target-Region, und (b) eine ”Protospacer Adjacent Motif” (PAM) Mutation beinhaltet. Die PAM-Mutation kann jede Insertion, Deletion oder Substitution eines oder mehrerer Nukleotiden sein, die die Sequenz des PAM mutieren, so dass es nicht mehr von dem CRISPR-System erkannt wird. Eine Zelle, die eine PAM-Mutation umfasst kann als „immun” gegenüber CRISPR-vermittelter Tötung bezeichnet werden. Die gewünschte Mutation relativ zu der Sequenz der Target-Region kann eine Insertion, Deletion und/oder Substitution eines oder mehrerer Nukleotiden an mindestens einem Codon der Target-Region sein.
-
Das CARPE-Verfahren wird nachfolgend nur zum Zweck der Veranschaulichung in Bezug auf ein bakterielles Gen beschrieben. Diese Verfahren können auf jedes Gen(e) von Interesse angewendet werden, umfassend Gene von jedem Prokaryoten, umfassend Bakterien und Archaea, oder jedem Eukaryonten, umfassend Hefe und Säuger (umfassend humane) Gene. Das CARPE-Verfahren wurde auf dem galK Gen in dem E. coli Genom durchgeführt, teilweise aufgrund der Verfügbarkeit von Aktivitätstests für dieses Gen. Das Verfahren wurde unter Verwendung der BW23115 Elternstämme und des pSIM5-Vektors (Datta et al. Gene (2008) 379: 109–115) durchgeführt, um Recombineering zu vermitteln. Das cas9 Gen wurde unter Kontrolle eines pBAD-Promotors in ein pBTBX-2-Rückrat kloniert, um die Kontrolle der Spaltungsaktivität durch Zugabe von Arabinose zu ermöglichen. Die Beurteilung der Fähigkeit selektiv synthetische dsDNA-Kassetten (127 bp) einzubauen, wurde unter Verwendung von dsDNA-Kassetten aus den NNK-Bibliotheken durchgeführt, die aus degenerierten Primern und/oder aus rational entworfenen Oligonukleotiden (Oligos), konstruiert wurden, die als Teil einer Bibliothek mit 27.000 Mitgliedern mittels Microarray-Technologie synthetisiert wurden. In beiden Fällen wurden die Oligonukleotide so entworfen, dass sie die Reste des aktiven Zentrums des galK Genprodukts mutieren. Die hocheffiziente Rückgewinnung der Donorstamm-Bibliotheken wurde basierend auf den Änderungen der Amplicongrößen verifiziert, die mit Primern gegen den galK Locus erhalten wurden. Sequenzieren dieser Kolonie-PCR-Produkte aus den NRR-Bibliotheken wies darauf hin, dass die synthetische Priming-Stelle (P1) aus der dsDNA-Kassette mit einer Effizienz von ungefähr 90–100% eingebaut wurde. Dies deutet darauf hin, dass diese Bibliotheken mit hoher Effizienz erzeugt werden können ohne von den fehleranfälligen mutS Knockout-Stämmen abhängig zu sein, die typischerweise in anderen Recombineering-basierten Editieransätzen verwendet worden sind (Costantino et al. PNAS (2003) 100: 15748–15753; Wang et al. Nature (2009) 460: 894–898). Es trat ein Rückgang in der Effizienz der Codon-Mutationen auf (ungefähr 20%), der auf mutS-Korrekturen durch allelischen Austausch zurückzuführen sein kann. Eine vorläufige Beurteilung der Klone in den Ziel-Bibliotheken deutet darauf hin, dass die endgültige Codon-Editier-Effizienz ungefähr 10% betrug, wenn beide Phasen der Konstruktion in dem mutS+-Hintergrund durchgeführt wurden.
-
Es wurde ein Vergleich mit anderen kürzlich-veröffentlichten Protokollen für co-selektierbares Editieren durchgeführt, die alternative Protokolle verwenden, die die PAM- und Codon-Mutationen nicht-kovalent verknüpfen, sondern sich stattdessen auf deren Nähe zueinander während der Replikation verlassen (Wang et al. Nat. Methods (2012) 9: 591–593). In diesen nicht-kovalenten Experimenten wurden die gleichen Editier-Oligos wie oben verwendet und es wurden Anstrengungen unternommen, um deren Insertion unter Verwendung der ssDNA-Oligos zu co-selektieren, die die gleichen Donor-/Ziel-PAM-Stellen anzielen. Kolonie-Screening der resultierenden Mutanten zeigte eine hohe Effizienz in der Wiedergewinnung der PAM-Mutanten. Jedoch scheint es keine starke Co-Selektion für die Insertion von dsDNA-Editier-Kassetten zu geben. Dies kann auf die großen Unterschiede in den relativen Recombineering-Effizienzen der PAM-Ziel-Oligonukleotide und der Editier-Kassetten zurückzuführen sein, die beträchtliche chromosomale Deletionen erzeugen.
-
Die Fähigkeit, die endgültigen Editier-Effizienzen des CARPE-Verfahrens zu verbessern, können beispielsweise beurteilt werden durch Durchführen der Donor-Konstruktion in mutS-defizienten Stämmen, bevor sie in einen Wildtyp Donor-Stamm transferiert werden, in dem Bemühen den Verlust der Mutationen während der Donor-Konstruktionsphase zu verhindern. Zusätzlich kann die Allgemeingültigkeit des CARPE-Verfahrens beispielsweise durch Anwenden von CARPE auf eine Reihe von essenziellen Genen, umfassend dxs, metA, und folA, beurteilt werden. Essenzielle Gene sind unter Verwendung der beschriebenen gRNA-Designstrategien effektiv angezielt worden. Die Ergebnisse deuten auch darauf hin, dass trotz der Genzerstörung, die während der Erzeugung der Donor-Bibliothek auftritt, die Donor-Bibliotheken effektiv konstruiert werden können und innerhalb von 1–3 Stunden nach dem Recombineering wiedererlangt werden können.
-
Hierin werden auch Verfahren für verfolgbares, präzises Genom Editieren unter Verwendung eines CRISPR-vermittelten Systems bereitgestellt, bezeichnet als „Genome Engineering by Trackable CRISPR Enriched Recombineering” (GEn-TraCER). Die GEn-TraCER-Verfahren erzielen hocheffizientes Editieren/Mutieren unter Verwendung eines einzigen Vektors, der sowohl für die Editier-Kassette als auch für die gRNA codiert. GEN-TraCER stellt, wenn es zusammen mit paralleler DNA-Synthese, wie beispielsweise Array-basierter DNA-Synthese, verwendet wird, eine einstufige Erzeugung von tausenden präzisen Änderungen/Mutationen bereit und ermöglicht es, die Mutation durch Sequenzieren der Editier-Kassette auf dem Vektor, statt durch Sequenzieren des Genoms der Zelle (genomischer DNA), zuzuordnen. Diese Verfahren finden in Protein- und Genom Engineering-Anwendungen eine breite Verwendung, sowie zur Rekonstruktion von Mutationen, wie beispielsweise Mutationen, die in Labor-Evolutionsexperimenten identifiziert wurden.
-
Die Gen-TraCER-Verfahren und Vektoren kombinieren eine Editier-Kassette, die eine gewünschte Mutation und eine PAM-Mutation umfasst, mit einem Gen, das für eine gRNA codiert, auf einem einzigen Vektor, der die Erzeugung einer Bibliothek von Mutationen in einer einzigen Reaktion ermöglicht. Wie in 11B gezeigt ist, umfasst das Verfahren Einführen eines Vektors, der eine Editier-Kassette umfasst, die die gewünschte Mutation und die PAM-Mutation beinhaltet, in eine Zelle oder eine Population von Zellen. In einigen Ausführungsformen codieren die Zellen, in die der Vektor eingeführt wurde, auch für Cas9. In einigen Ausführungsformen wird ein für Cas9 codierende Gen anschließend in die Zelle oder die Population von Zellen eingeführt. Die Expression des CRISPR-Systems, das Cas9 und die gRNA beinhaltet, wird in der Zelle oder der Zellpopulation aktiviert; die gRNA rekrutiert Cas9 zu der Target-Region, wo dsDNA-Spaltung auftritt. Ohne an irgendeine bestimmte Theorie gebunden sein zu wollen, mutiert die homologe Region der Editier-Kassette, die komplementär zu der Target-Region ist, das PAM und das eine oder mehrere Codon der Target-Region. Zellen der Population von Zellen, die die PAM-Mutation nicht integriert haben, durchlaufen aufgrund der Cas9-vermittelten dsDNA-Spaltung nicht-editierten Zelltod. Zellen der Population von Zellen, die die PAM-Mutation integriert haben, durchlaufen keinen Zelltod; sie bleiben lebensfähig und werden selektiv auf hohe Abundanz angereichert. Es werden lebensfähige Zellen erhalten und eine Bibliothek von gezielten Mutationen bereitgestellt.
-
Das Verfahren des verfolgbaren Genom Editierens unter Verwendung von GEn-TraCER umfasst: (a) Einführen eines Vektors, der für mindestens eine Editier-Kassette, einen Promotor, und mindestens eine gRNA codiert, in eine Zelle oder in eine Population von Zellen, wodurch eine Zelle oder eine Population von Zellen hergestellt wird, die den Vektor umfasst (eine zweite Population von Zellen); (b) Aufrechterhalten der zweiten Population von Zellen unter Bedingungen, unter denen Cas9 exprimiert wird, wobei die Cas9 Nuklease auf dem Vektor, einem zweiten Vektor oder in dem Genom der Zellen der zweiten Population von Zellen codiert wird, was zur DNA-Spaltung und Tod von Zellen der zweiten Population von Zellen führt, die die PAM-Mutation nicht umfassen, wobei Zellen der zweiten Population von Zellen, die die PAM-Mutation umfassen, lebensfähig sind; (c) Erhalten lebensfähiger Zellen; und (d) Sequenzieren der Editier-Kassette des Vektors in mindestens einer Zelle der zweiten Population von Zellen, um die Mutation mindestens eines Codons zu identifizieren.
-
In einigen Ausführungsformen wird ein separater für cas9 codierender Vektor ebenfalls in die Zelle oder die Population von Zellen eingeführt. Einführen eines Vektors in eine Zelle oder eine Population von Zellen kann unter Verwendung jeglicher in der Technik bekannter Verfahren oder Techniken durchgeführt werden, beispielsweise können Vektoren durch Standardprotokolle eingeführt werden, wie beispielsweise Transformation, umfassend chemische Transformation und Elektroporation, Transduktion und Partikelbeschuss.
-
Eine Editier-Kassette umfasst (a) eine Region, die eine Target-Region einer Nukleinsäure in einer Zelle oder einer Population von Zellen erkennt (daran hybridisiert), die homolog zu der Target-Region der Nukleinsäure der Zelle ist und eine Mutation (bezeichnet als eine gewünschte Mutation) mindestens eines Nukleotids in mindestens einem Codon relativ zu der Target-Region, und (b) eine ”Protospacer Adjacent Motif” (PAM) Mutation beinhaltet. Die PAM-Mutation kann jede Insertion, Deletion oder Substitution eines oder mehrerer Nukleotide sein, die die Sequenz des PAM mutiert, so dass das mutierte PAM (PAM-Mutation) nicht durch das CRISPR-System erkannt wird. Eine Zelle, die eine solche PAM-Mutation umfasst, kann auch als „immun” gegenüber CRISPR-vermittelter Tötung bezeichnet werden. Die gewünschte Mutation, relativ zu der Sequenz der Target-Region kann eine Insertion, Deletion, und oder Substitution eines oder mehrerer Nukleotide in mindestens einem Codon der Target-Region sein. In einigen Ausführungsformen beträgt der Abstand zwischen der PAM-Mutation und der gewünschten Mutation auf der Editier-Kassette mindestens 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 Nukleotide auf der Editier-Kassette. In einigen Ausführungsformen befindet sich die PAM-Mutation mindestens 9 Nukleotide von dem Ende der Editier-Kassette. In einigen Ausführungsformen befindet sich die gewünschte Mutation mindestens 9 Nukleotide von dem Ende der Editier-Kassette.
-
In einigen Ausführungsformen ist die gewünschte Mutation, relativ zu der Sequenz der Target-Region, eine Insertion einer Nukleinsäuresequenz. Die in die Target-Region insertierte Nukleinsäuresequenz kann beliebig lang sein. In einigen Ausführungsformen ist die insertierte Nukleinsäuresequenz mindestens 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, oder mindestens 2000 Nukleotide lang. In Ausführungsformen, in denen eine Nukleinsäuresequenz in die Target-Region insertiert wird, umfasst die Editier-Kassette eine Region, die mindestens 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, oder mindestens 60 Nukleotide lang ist und homolog zu der Target-Region ist.
-
Der Ausdruck ”GEn-TraCER Kassette” kann verwendet werden, um sich auf eine Editier-Kassette, Promoter, Spacer-Sequenz und mindestens einen Teil eines für eine gRNA codierenden Gens zu beziehen. In einigen Ausführungsformen codiert ein Teil des für die gRNA codierenden Gens auf der GEn-TraCER Kassette den Teil der gRNA, der komplementär zu der Target-Region ist. In einigen Ausführungsformen ist der Teil der gRNA, der komplementär zu der Target-Region ist, mindestens 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, oder mindestens 30 Nukleotide lang. In einigen Ausführungsformen ist der Teil der gRNA, der komplementär zu der Target-Region ist, 24 Nukleotide lang. In einigen Ausführungsformen umfasst die GEn-TraCER Kassette weiter mindestens zwei Priming-Stellen. In einigen Ausführungsformen können die Priming-Stellen verwendet werden, um die GEn-TraCER Kassetten zu amplifizieren, beispielsweise durch PCR. In einigen Ausführungsformen wird der Teil der gRNA, der komplementär zu der Target-Region ist, als eine Priming-Stelle verwendet.
-
In dem GEn-TraCER-Verfahren können Editier-Kassetten und GEn-TraCER-Kassetten zur Verwendung in den beschriebenen Verfahren aus vielen Quellen erhalten werden, oder daraus stammen. Beispielsweise wird in einigen Ausführungsformen die Editier-Kassette synthetisiert, zum Beispiel durch Array-basierte Synthese. In einigen Ausführungsformen wird die GEn-TraCER-Kassette synthetisiert, zum Beispiel durch Array-basierte Synthese. Die Länge der Editier-Kassette und/oder GEn-TraCER-Kassette kann von den Verfahren abhängen, die zur Gewinnung der Editier-Kassette und/oder der GEn-TraCER-Kassette verwendet werden. In einigen Ausführungsformen ist die Editier-Kassette ungefähr 50–30 Nukleotide, 75–200 Nukleotide, oder zwischen 80–120 Nukleotide lang. In einigen Ausführungsformen ist die GEn-TraCER-Kassette ungefähr 50–300 Nukleotide, 75–200 Nukleotide, oder zwischen 80–120 Nukleotide lang.
-
In einigen Ausführungsformen beinhaltet das Verfahren auch Erhalten der GEn-TraCER-Kassetten, zum Beispiel durch Array-basierte Synthese, und Konstruieren des Vektors. Verfahren zum Konstruieren eines Vektors werden dem Durchschnittsfachmann bekannt sein und können Ligieren der GEn-TraCER-Kassette in einen Vektor beinhalten. In einigen Ausführungsformen werden die GEn-TraCER-Kassetten oder eine Untergruppe (Pool) der GEn-TraCER-Kassetten vor der Konstruktion des Vektors amplifiziert, zum Beispiel durch PCR.
-
Die Zelle oder die Population von Zellen, die den Vektor umfasst, und auch für Cas9 codiert, wird unter Bedingungen Aufrechterhalten oder kultiviert, unter denen Cas9 exprimiert wird. Die Cas9-Expression kann kontrolliert werden. Die hierin beschriebenen Verfahren können aufrechterhalten der Zellen unter Bedingungen beinhalten, unter denen Cas9-Expression aktiviert wird, was zur Herstellung von Cas9 führt. Spezifische Bedingungen, unter denen Cas9 exprimiert wird, werden von Faktoren abhängen, wie beispielsweise der Natur des Promotors, der verwendet wird, um Expression Cas9 zu regulieren. In einigen Ausführungsformen wird die Cas9-Expression in der Anwesenheit eines Induktormoleküls, wie beispielsweise Arabinose, induziert. Cas9-Expression tritt auf, wenn die Zelle oder die Population von Zellen, die die für Cas9-codierende DNA umfasst, sich in der Anwesenheit des Induktormoleküls befinden. In einigen Ausführungsformen wird Cas9-Expression in der Gegenwart eines Repressormoleküls unterdrückt. Expression von Cas9 tritt auf, wenn die Zelle oder die Population von Zellen, die die für Cas9-codierende DNA umfasst, sich in der Abwesenheit eines Moleküls befindet, das die Expression von Cas9 unterdrückt.
-
Die Zellen der Population von Zellen, die lebensfähig bleiben, werden erhalten oder von den Zellen getrennt, die als eine Folge von Cas9-vermittelter Tötung nicht-editierten Zelltod durchlaufen; dies kann beispielsweise durchgeführt werden durch Ausbreiten der Population von Zellen auf einer Kulturoberfläche, Wachsen lassen der lebensfähigen Zellen, die dann zur Beurteilung zur Verfügung stehen.
-
Die gewünschte Mutation, die an die PAM-Mutation gekoppelt ist, ist verfolgbar unter Verwendung des GEn-TraCER-Verfahrens durch Sequenzieren der Editier-Kassette auf dem Vektor in lebensfähigen Zellen (Zellen, die die PAM-Mutation integrieren) von der Population. Dies ermöglicht eine einfache Identifizierung der Mutation, ohne dass das Genom der Zelle sequenziert werden muss. Die Verfahren beinhalten Sequenzieren der Editier-Kassette, um die Mutation eines oder mehrerer Codons zu identifizieren. Sequenzieren der Editier-Kassette kann als ein Bestandteil des Vektors erfolgen oder nach der Trennung des Vektors und gegebenenfalls Amplifikation, durchgeführt werden. Sequenzieren kann unter Verwendung jeglicher in der Technik bekannter Sequenzier-Verfahren durchgeführt werden, wie beispielsweise durch Sanger-Sequenzieren.
-
Die hierin beschriebenen Verfahren können in jedem Zelltyp durchgeführt werden, in dem das CRISPR-System funktionieren kann (z. B. DNA anzielen und schneiden), umfassend prokaryotische und eukaryotische Zellen. In einigen Ausführungsformen ist die Zelle eine bakterielle Zelle, wie beispielsweise Escherichia spp. (z. B., E. coli). In anderen Ausführungsformen ist die Zelle eine Pilzzelle, wie beispielsweise eine Hefezelle, z. B. Saccharomyces spp. In anderen Ausführungsformen ist die Zelle eine Algenzelle, eine Pflanzenzelle, eine Insektenzelle, oder eine Säugerzelle, umfassend eine humane Zelle.
-
Ein „Vektor” ist jede Art von Nukleinsäure, die eine gewünschte Sequenz oder Sequenzen umfasst, die an eine Zelle geliefert oder darin exprimiert werden sollen. Die gewünschte Sequenz(en) kann in einen Vektor eingebaut werden, beispielsweise durch Restriktion und Ligation oder durch Rekombination. Die Vektoren sind üblicherweise aus DNA zusammengesetzt, obwohl RNA-Vektoren ebenfalls erhältlich sind. Vektoren umfassen, aber sind nicht beschränkt auf: Plasmide, Fosmide, Phagemide, Virus-Genome und künstliche Chromosomen.
-
Vektoren, die in dem GEN-TraCER-Verfahren nützlich sind, umfassen mindestens eine wie hierin beschriebene Editier-Kassette, einen Promotor, und mindestens ein für eine gRNA codierendes Gen. In einigen Ausführungsformen ist mehr als eine Editier-Kassette (beispielsweise 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr Editier-Kassetten) auf einem Vektor enthalten. In einigen Ausführungsformen ist die mehr als eine Editier-Kassette homolog zu verschiedenen Target-Regionen (z. B. gibt es verschiedene Editier-Kassetten, von denen jede zu einer anderen Target-Region homolog ist). Alternativ oder zusätzlich kann der Vektor mehr als ein Gen enthalten, das für eine gRNA codiert (z. B. 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr gRNAs). In einigen Ausführungsformen enthält die mehr als eine gRNA Regionen, die komplementär zu einem Teil von verschiedenen Target-Regionen sind (z. B. gibt es verschiedene gRNAs, von denen jede zu einer anderen Target-Region homolog ist).
-
In einigen Ausführungsformen wird eine eine GEn-TraCER-Kassette, die mindestens eine Editier-Kassette, einen Promoter und ein Gen umfasst, das für einen Teil einer gRNA codiert, in einen Vektor ligiert, der für einen anderen Teil einer gRNA codiert. Nach der Ligation ist der Teil der gRNA der GEn-TraCER-Kassette und der andere Teil der gRNA ligiert und bildet eine funktionelle gRNA.
-
Der Promotor und das für die gRNA codierende Gen sind operativ verknüpft. In einigen Ausführungsformen umfassen die Verfahren Einführen eines zweiten Vektors, der für Cas9 codiert. In solchen Ausführungsformen kann der Vektor weiter einen oder mehrere Promotoren umfassen, die operativ an ein Gen verknüpft sind, das für Cas9 codiert. Wie hierin verwendet, bedeutet „operativ” verknüpft, dass der Promotor die Transkription der DNA bewirkt oder reguliert, die für ein Gen codiert, wie beispielsweise das Gen, das für die gRNA codiert oder das Gen, das für Cas9 codiert. Der Promotor kann ein nativer Promotor sein (ein Promoter, der in der Zelle, in die der Vektor eingeführt wird, vorliegt). In einigen Ausführungsformen ist der Promotor ein induzierbarer oder reprimierbarer Promotor (der Promotor wird reguliert, um eine induzierbare oder reprimierbare Transkription eines Gens zu ermöglichen, wie beispielsweise des Gens, das für die gRNA codiert oder des Gens, das für Cas9 codiert), wie beispielsweise Promotoren, die durch die Anwesenheit oder Abwesenheit eines Moleküls reguliert werden (z. B. ein Induktor oder ein Repressor). Die Art des Promotors, der für die Expression der gRNA benötigt wird, kann basierend auf den Spezien oder Zelltypen variieren und wird von einem Fachmann erkannt werden.
-
In einigen Ausführungsformen umfasst das Verfahren Einführen eines separaten für Cas9 codierenden Vektors in die Zelle oder Population von Zellen vor oder gleichzeitig mit dem Einführen des Vektors, der mindestens eine wie hierin beschriebene Editier-Kassette, einen Promotor und mindestens eine gRNA umfasst. In einigen Ausführungsformen wird das für Cas9 codierende Gen in das Genom der Zelle oder Population von Zellen integriert. Die Cas9-codierende DNA kann vor dem Einführen des Vektors, der mindestens eine wie hierin beschriebene Editier-Kassette, einen Promotor, und mindestens eine gRNA umfasst, oder nach dem Einführen des Vektors, der mindestens eine wie hierin beschriebene Editier-Kassette, einen Promotor, und mindestens eine gRNA umfasst, in das zelluläre Genom integriert werden. Alternativ kann ein Nukleinsäuremolekül, wie beispielsweise eine für Cas9-codierende DNA, von der in das Genom integrierten DNA exprimiert werden. In einigen Ausführungsformen wird das für Cas9 codierende Gen in das Genom der Zelle integriert.
-
Vektoren, die für die hierin beschriebenen GEn-TraCER-Verfahren nützlich sind, können weiter eines Spacer-Sequenz, zwei oder mehr Priming-Stellen oder sowohl eine Spacer-Sequenz als auch zwei oder mehr Priming-Stellen umfassen. In einigen Ausführungsformen ermöglicht die Anwesenheit der Priming-Stellen, die die GEn-TraCER-Kassette flankieren, Amplifikation der Nukleinsäuresequenzen der Editier-Kassette, des Promotors und der gRNA.
-
BEISPIELE
-
Beispiel 1: Verwendung des CARPE-Verfahrens um galK zu editieren
-
Der CARPE-Ansatz wurde auf dem Galactokinase Gen, galK, in dem E. coli Genom durchgeführt; es gibt viele verfügbare Assays, um die Aktivität des Genprodukts zu untersuchen. Diese Experimente wurden unter Verwendung des E. coli BW23115 Elternstamms und dem pSIM5 Vektor (Datta et al. Gene (2008) 379: 109–115) durchgeführt, um Recombineering zu vermitteln. Das für Cas9-codierende Gen wurde unter Kontrolle eines pBAD-Promotors in das pBTBX-2-Rückgrat kloniert, um die Kontrolle der Cas9-Spaltungsaktivität durch Zugabe von Arabinose zu dem Kulturmedium zu ermöglichen.
-
Zunächst wurde die Fähigkeit getestet selektiv synthetische dsDNA-Kassetten (127 bp) einzubauen. Die synthetischen dsDNA-Kassetten stammen aus NNR-Bibliotheken, die aus degenerierten Primern oder aus rational entworfenen Oligos konstruiert wurden, die als Teil einer Bibliothek mit 27.000 Mitgliedern mittels Microarray-Technologie synthetisiert wurden. In beiden Fällen wurden die Oligonukleotide entworfen, um die Reste des aktiven Zentrums des galK Genprodukts zu mutieren, als auch die synthetische Priming-Stelle, P1 (SEQ ID NO: 1) zu enthalten. Die hocheffiziente Rückgewinnung der Donorstamm-Bibliotheken wurde basierend auf den Änderungen der Amplicongrößen verifiziert, die durch Kolonie-PCR mit Primern gegen den galK Locus erhalten wurden. Sequenzieren dieser Kolonie-PCR-Produkte aus den NNR-Bibliotheken wies darauf hin, dass die synthetische Priming-Stelle (P1) aus den dsDNA-Kassetten mit einer Effizienz von ungefähr 90–100% eingebaut wurde (2). Dieses überraschende und unerwartete Ergebnis deutet darauf hin, dass Bibliotheken mit hoher Effizienz erzeugt werden können, ohne auf die fehleranfälligen mutS Knockout-Stämme angewiesen zu sein, die typischerweise in anderen Recombineering-basierten Editier-Ansätzen verwendet worden sind (Costantino et al. PNAS (2003) 100: 15748–15753; Wang et al. Nature (2009) 460: 894–898). Jedoch gab es einen Rückgang in der Effizienz der Codon-Mutationen (ungefähr 20%), der auf eine Korrektur durch MutS während dem allelischen Austausch zurückzuführen sein kann. In dieser Arbeit betrug die endgültige Codon-Editier-Effizienz ungefähr 10% wenn beide Phasen der Konstruktion in dem mutS+-Hintergrund durchgeführt wurden.
-
Um die endgültigen Editier-Effizienzen und die Allgemeingültigkeit des CARPE-Verfahrens zu erhöhen, kann die Donor-Konstruktion in mutS-defizienten Stämmen vor dem Transferieren in einen mutS+-Donor Stamm durchgeführt werden, in der Bemühungen den Verlust von Mutationen während der Donor-Konstruktionsphase zu verhindern.
-
Beispiel 2: Verwendung des CARPE-Verfahren, um essenzielle Gene anzuzielen
-
Um die Allgemeingültigkeit des CARPE-Ansatzes zu testen, wurde das oben beschriebene Verfahren auf eine Reihe essenzieller Gene angewendet, umfassend dxs, metA, und folA. Essenzielle Gene können unter Verwendung der gRNA-Designstrategien angezielt werden (3).
-
Daten aus CARPE-Experimenten, die das dxs Gen anzielen, legen auch nahe, dass trotz der Genzerstörung, die während der Erzeugung der Donor-Bibliothek auftritt, es möglich ist, die Donor-Bibliotheken effektiv zu konstruieren und innerhalb von 1–3 Stunden nach dem Recombineering wiederzugewinnen.
-
Beispiel 3: Verwendung des CARPE-Verfahrens, um die Produktion von Isopentenol zu modulieren.
-
Die Jagd nach besseren Treibstoffen für die industrielle Fertigung mittels bakterieller Produktion erfordert die Fähigkeit State-of-the-Art Genom-Design, Engineering, und Screenen für das gewünschte Produkt durchführen zu können. Wir haben bereits die Fähigkeit nachgewiesen, die Expressionslevel jedes Gens in dem E. Coli Genom zu modifizieren (Warner et al. Nat. Biotechnol (2010) 28: 856–862). Dieses Verfahren, genannt verfolgbares Multiplex Recombineering (engl.: trackable multiplex recombineering, TRMR), erzeugt eine Bibliothek von ungefähr 8000 genomisch-modifizierten Zellen (~4000 überexprimierte Gene und ~4000 knock-down Gene). Diese Bibliothek wurde später unter verschiedenen Bedingungen gescreent, was ein tieferes Verständnis der Aktivitäten der Genprodukte ermöglichte und unter diesen Selektionen zu leistungsfähigeren Stämmen führte. TRMR ermöglicht die Modifikation der Proteinexpression auf zwei Ebenen (überexprimiert und knock-down), aber es ermöglichte nicht die Modifikation des offenen Leserahmens (engl. open reading frame; ORF). Hier wollen wir große Bibliotheken von ORF-Modifikationen erzeugen und ganze Stoffwechselwege für die optimale Produktion von Biokraftstoffen konstruieren.
-
Eine Hauptschwierigkeit bei der Produktion solcher Bibliotheken, die (im Gegensatz zu zufälliger Mutagenese) rational entworfen werden, ist die Insertionseffizienz der gewünschten Mutationen in die Target-Zellen. Beim Recombineering, dem kanonischen Verfahren für Genom-Modifikationen in E. coli, werden rekombinante Gene des Lambda Phagen verwendet, um die Insertion fremder DNA in das Wirtsgenom zu erleichtern. Jedoch leidet dieser Prozess an geringen Effizienzen und kann entweder durch Zugabe eines antibiotischen Resistenzgens, gefolgt von Selektion (wie in TRMR), oder durch rekursives Veranlassen von Rekombinationsereignissen überwunden werden (d. h. durch MAGE (Wang et al. Nature (2008) 460: 894–898). Das hierin beschriebene CARPE-Verfahren erhöht die Recombineeringseffizienz durch Einbeziehen der Verwendung des CRISPR-Systems, wodurch alle nicht-rekombinanten Zellen aus der Population entfernt werden. CRISPR ist ein kürzlich entdeckter RNA-basierter, adaptiver Abwehrmechanismus von Bakterien und Archaea gegen eindringende Phagen und Plasmide (Bhaya et al. Ann. Rev. of Genetics (2011) 45: 273–297). Dieses System durchlief massives Engineering, um sequenz-gerichtete Doppelstrangbrüche unter Verwendung von zwei Plasmiden zu ermöglichen; ein Plasmid codiert für die CRISPR-assoziierte Nuklease Cas9 und das zweite Plasmid codiert für die sequenz-spezifische Guide-RNA (gRNA), die Cas9 an seine einzigartige Lage führt (Qi et al. Cell (2013) 45: 273–297). Das CARPE-Verfahren nutzt die Fähigkeit des CRISPR Systems in einer Sequenz-abhängigen Art und Weise Doppelstrangbrüche, und infolgedessen den Zelltod zu induzieren. Wir produzieren DNA-Recombineering-Kassetten, die zusätzlich zu der gewünschten Mutation innerhalb des ORFs, eine Mutation an einem gemeinsamen Ort außerhalb des offenen Leserahmens des Gens beinhalten, der durch die CRISPR-Maschinerie angezielt wird. Dieser Ansatz der Verknüpfung/Kopplung der gewünschten Mutationen mit der Vermeidung von CRISPR-vermitteltem Tod, aufgrund der PAM Mutation/Deletion ermöglicht eine dramatische Anreicherung manipulierter Zellen innerhalb der gesamten Population von Zellen.
-
Das Verfahren wurde weiter unter Verwendung des DXS-Wegs demonstriert. Der DSX-Weg führt zu Produktion von Isopentenyl-Pyrophosphat (IPP), das zur Biosynthese von Terpenen und Terpenoiden führt. Interessanterweise kann IPP auch der Vorläufer von Lycopin und Isopentenol sein, die Zugabe der benötigten Gene vorausgesetzt. Während Lycopin die Bakterienkolonien rot färbt, und daher einfach screenbar ist, wird Isopentenol als ein Biokraftstoff der ,zweiten Generation' mit einer höheren Energiedichte und einer geringeren Wassermischbarkeit als Ethanol betrachtet. Es wurden drei Proteine zum Engineering ausgewählt: 1) DSX, das erste und das geschwindigkeitsbegrenzende der Enzym des Weges, 2) IspB, das den metabolischen Fluss aus dem DXS-Weg umleitet, und 3) NudF, für das gezeigt wurde, dass es IPP sowohl in E. coli als auch B. subtilis in Isopentenol umsetzt (Withers et al. App. Environ. Microbiol (2007) 73: 6277–6283; Zheng et al. Biotechnol. for biofuels (2013) 6: 57). Die Mutationen in den Genen, die für DXS und IspB codieren, werden mit einem neuen Bildanalysewerkzeug, das für die Quantifizierung der Koloniefarbe entwickelt wurde, auf erhöhte Lycpon Produktion gescreent. Die NudF-Aktivität wird direkt durch Messen der Isopentenol-Spiegel durch GC/MS und indirekt durch Isopentenol-auxotrophe Zellen gemessen, die als Biosensoren dienen werden. Dieses Verfahren bietet die Möglichkeit mit hoher Genauigkeit und Effizienz große Mutationsbibliotheken in dem E. coli-Genom und einem Stamm, der hohe Ausbeuten an Isopentenol erzeugt, rational zu konstruieren.
-
Beispiel 4: Verwendung des GEn-TraCER-Verfahrens, um galK zu ändern
-
Das GEn-TraCER-Verfahren wurde verwendet, um das galK-Gen zu editieren, welches als ein Modelsystem für Recombineering in E. coli gedient hat (Vu et al. 2000). Die ersten konstruierten GEn-TraCER-Kassetten wurden so entworfen, dass sie ein Stopp-Codon anstelle eines PAMs im Leseraster am Codon 24 des galK einführen, bezeichnet als galK_Q24 (12). Die Konstrukte und Vektoren wurden unter Verwendung eines benutzerdefinierten Python-Skripts zur Erzeugung der erforderlichen Mutationen in hohem Durchsatz entworfen.
-
Kontroll-Kassetten wurden unter Verwendung des zirkulären Polymerase-Klonier-Verfahrens (engl. Polymerase cloning, OPEC) in den durch Qi et al. Cell (2013) beschriebenen gRNA-Vektor kloniert. Das Rückgrat wurde mit den folgenden Primern linearisiert: CCAGAAATCATCCTTAGCGAAAGCTAAGGAT (SEQ ID NO: 29) und GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCT (SEQ ID NO: 30).
-
Die GenTRACER-Kassetten wurden als gBlocks bestellt und unter Verwendung der folgenden Primer amplifiziert: ATCACGAGGCAGAATTTCAGATAAAAAAAATCCTTAGCTTTCGCTAAGGATGATTTCTGG (SEQ ID NO: 31), ACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC (SEQ ID NO: 32).
-
Die Bestandteile wurden unter Verwendung von OPEC zusammengefügt und in E. coli transformiert, um die Vektoren zu erzeugen. Diese Prozedur ist in multiplex unter Verwendung der gepoolten Oligonukleotid-Bibliotheken mit Klonierungseffizienzen im Bereich von 104–105 CFU/μg durchzuführen.
-
E. coli MG1655 Zellen, die pSIM5 (Lambda-RED Plasmid) und das X2-cas9 Plasmid tragen, wurden bei 30°C in LB mit 50 μg/mL Kanamycin und 34 μg/mL Chloramphenicol bis zur mittleren log-Phase (0.4–0.7 OD) gezüchtet. Die Recombineering-Funktionen des pSIM5-Vektor wurden bei 42°C für 15 min induziert und anschließend für 10 min auf Eis gestellt. Die Zellen wurden dann durch Pelletieren und 2-maliges Waschen mit 10 mL gekühltem H2O elektrokompetent gemacht. Die Zellen wurden mit 100 ng eines GEn-TraCER Plasmids (das auch für eine Carbenicillin-Resistenz codiert) transformiert und erholten sich für 3 Stunden bei 37°. 50–100 μL der Zellen wurden auf das geeignete Medium ausplattiert, das 50 μg/mL Kanamycin und 100 μg/ml Carbenecillin enthält, um die CRISPR-editierten Stämme selektiv anzureichern. Editier-Effizienzen für das galK Gen wurden unter Verwendung eines rotweiß-Screenings auf mit Galaktose supplementiertem MacConkey Agar berechnet.
-
Basierend auf einem Screening auf MacConkey Agar wurden Editier-Effizienzen von ~100% mit dem galK_Q24* Design beobachtet. Interessanterweise gab es, im Gegensatz zu Oligo-vermittelten Recombineering-Verfahren, die Mismatch-Repair-Knockouts benötigen, um hohe Effizienzen zu erzielen (Li et al. 2003; Sawitzke et al. 2011; Wang et al. 2011), keinen Effekt in Stämmen mit oder ohne intakter Mismatch-Reparatur-Maschinerie.
-
Die Sequenzen der Chromosomen und Vektoren wurden anschließend durch Sanger-Sequenzieren verifiziert.
-
Wie erwartet, wurden die entworfenen Mutationen auf dem Chromosom (13) gespiegelt, was darauf hindeutet, dass die Mutation an beiden Orten vorhanden war und dass das Plasmid als transagierende Barcode (trans-Barcode) oder als Aufzeichnung der Genomänderung dient.
-
Das Design wurde für rationale Mutagenese von Protein-codierenden Rastern auf einer genomweiten Skala adaptiert, durch Erzeugen ”stiller, selektierbarer Narben”, die aus synonymen PAM-Mutationen (14B, ΔPAM) bestehen, um die Zellen gegen Cas9-vermittelte Spaltung zu „immunisieren”, aber das Translationsprodukt intakt lassen. Wir schlussfolgerten, dass die stillen Narben eine Co-Selektion auf nahegelegene Änderungen an einem Codon oder anderen Merkmalen von Interesse mit hoher Effizienz erlauben. Die Wirkungen der Armlänge der Homologie und des Abstands zwischen der PAM-Mutation/Deletion und der gewünschten Mutation in galK wurden untersucht und die Effizienzen verglichen (16B). Es wurde ein signifikanter Anstieg in der Mutationseffizienz an der galK Position 145 beobachtet, wenn die Armlänge der Homologie auf 80 bis 100 Nukleotide (~5% bzw. 45%) mit identischen PAM-Änderungen verlängert wurde.
-
Beispiel 5: Verwendung des GEn-TraCER-Verfahrens, um Mutationen zu rekonstruieren
-
Der GEn-TraCER-Ansatz wurde unter Verwendung einer benutzerdefinierten, automatisierten Design-Software auf einen genomischen Maßstab ausgeweitet, die an Targets der Stellen in dem Genom mit einer einfachen Benutzer-Eingabefunktion ermöglicht. Dieser Ansatz wurde durch Rekonstruieren aller nicht-synonymen Punktmutationen einer kürzlich veröffentlichten Studie über die thermale Adaption in E. coli (Tenaillon et al. 2012) getestet. Diese Studie charakterisierte den kompletten Satz von Mutationen, die in 115 Isolaten von unabhängig vermehrten Stämmen auftraten. Dieser Datensatz stellt eine vielfältige Quelle von Mutationen bereit, deren individuelle Fitness-Effekte weiter Licht auf die mechanistische Grundlagen dieses komplexen Phänotyps werfen. Jede dieser Mutationen wurde, sofern möglich, mit einer 2-fachen Redundanz in der Codon Verwendung und ΔPAM rekonstruiert, um eine statistische Korrektur sowohl für die PAM als auch die Codon Target-Mutationen in einer nachfolgenden Fitnessanalyse zu ermöglichen.
-
Beispiel 6: Verwendung des GEn-TraCER-Verfahrens, um genetische Interaktionen zu modulieren
-
Eine Promotor-Neuverkabelungs-Bibliothek wurde durch Integrieren eines Promotors erzeugt, der dynamisch durch ein Umgebungssignal (Sauerstoffspiegel, Kohlenstoffquelle, Stress) stromaufwärts von jedem Gen in dem E. coli Genom reguliert wird. Unter Verwendung des GEn-TraCER-Verfahrens wurden Stämme mit neu-verkabelten Genotypen erzeugt, die beispielsweise für die Toleranz gegenüber Chemikalien von Interesse für die Produktion vorteilhaft sein können.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Nicht-Patentliteratur
-
- 35 U.S.C. §119 [0001]
- Jinek et al. Science (2012) 337 (6096): 816–821 [0043]
- Cong et al. Science (2013) 339 (6121): 819–823 [0043]
- DiCarlo et al. Nucleic Acids Res. (2013) 41: 4336–4343 [0043]
- Waaijers et al. Genetics (2013) 195: 1187–1191 [0043]
- Cong et al. Science (2013) 339 (6121): 819–823 [0043]
- Wang et al. Cell (2013) 153: 910–918 [0043]
- Jinek et al. Science (2012) 337 (6096): 816–821 [0043]
- Brouns et al. Science (2008) 321: 960–964 [0043]
- Semenova et al. PNAS (2011) 108: 10098–10103 [0043]
- Datta et al. Gene (2008) 379: 109–115 [0050]
- Costantino et al. PNAS (2003) 100: 15748–15753 [0050]
- Wang et al. Nature (2009) 460: 894–898 [0050]
- Wang et al. Nat. Methods (2012) 9: 591–593 [0051]
- Datta et al. Gene (2008) 379: 109–115 [0072]
- Costantino et al. PNAS (2003) 100: 15748–15753 [0073]
- Wang et al. Nature (2009) 460: 894–898 [0073]
- Warner et al. Nat. Biotechnol (2010) 28: 856–862 [0077]
- Wang et al. Nature (2008) 460: 894–898 [0078]
- Bhaya et al. Ann. Rev. of Genetics (2011) 45: 273–297 [0078]
- Qi et al. Cell (2013) 45: 273–297 [0078]
- Withers et al. App. Environ. Microbiol (2007) 73: 6277–6283 [0079]
- Zheng et al. Biotechnol. for biofuels (2013) 6: 57 [0079]
- Vu et al. 2000 [0080]
- Qi et al. Cell (2013) [0081]
- Li et al. 2003 [0085]
- Sawitzke et al. 2011 [0085]
- Wang et al. 2011 [0085]
- Tenaillon et al. 2012 [0089]