Nothing Special   »   [go: up one dir, main page]

MX2007013757A - Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas. - Google Patents

Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas.

Info

Publication number
MX2007013757A
MX2007013757A MX2007013757A MX2007013757A MX2007013757A MX 2007013757 A MX2007013757 A MX 2007013757A MX 2007013757 A MX2007013757 A MX 2007013757A MX 2007013757 A MX2007013757 A MX 2007013757A MX 2007013757 A MX2007013757 A MX 2007013757A
Authority
MX
Mexico
Prior art keywords
protein
sequence
nucleotide sequence
detection system
dna
Prior art date
Application number
MX2007013757A
Other languages
English (en)
Inventor
David J Segal
Indraneel Ghosh
Aik T Ooi
Jason Porter
Cliff L Stains
Carlos F Barbas
Original Assignee
Univ Arizona
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Arizona filed Critical Univ Arizona
Publication of MX2007013757A publication Critical patent/MX2007013757A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Food Science & Technology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La presente invencion proporciona un sistema de deteccion de secuencia del nucleotido en el cual una enzima reportero es dividida en dos mitades, cada mitad de la cual se asocia con al menos un dominio de soporte de zinc. Durante el enlace del ADN a la secuencia especifica definida por los dominios de soporte de zinc asociados a las mitades respectivas, los re-ensambles de la proteina dividida reconstituyen una enzima funcional. Como tal, la presente invencion proporciona metodos de uso del sistema de deteccion de secuencia del nucleotido para los varios propositos de diagnostico e identificacion.

Description

REAGRUPACION PERMITIDA DE SECUENCIA (SEER) - MÉTODO DE NOVEDAD PARA VISUALIZAR SECUENCIAS DE ADN ESPECÍFICAS Referencia Cruzada a la Solicitud Relacionada La presente solicitud reivindica la prioridad de la Solicitud Norteamericana No. 60/678,453, presentada el 5 de mayo de 2005, la cual se incorpora mediante este medio por referencia en su totalidad. Campo de la Invención La presente invención proporciona un sistema de detección de la secuencia de nucleótidos en donde una enzima reportera está dividida en dos mitades, cuya cada mitad se asocia por lo menos a un dominio de unión de ADN de secuencia específica. Durante la unión de ADN a la secuencia específica definida por los dominios de unión de ADN de secuencia específica asociados a las mitades respectivas, la proteína dividida se reagrupa para reconstituir una proteína de generación de señal. Como tal, la presente invención proporciona los métodos para usar el sistema de detección de secuencia de nucleótidos para varios propósitos de diagnóstico e identificación. Antecedentes de la Invención En las eucariotas, un conjunto complejo de elementos reguladores controla el inicio de la transcripción genética. Las proteínas de unión de secuencia específica correspondientes reconocen las secuencias específicas de ácido nucleico Estas proteínas son llamadas factores de transcripción Los factores de la transcripción tienen por lo menos dos dominios funcionalmente diferentes, uno que se une a una secuencia específica de ácido nucleico y otro que activa o reprime la transcripción Una clase principal de los factores de transcripción llamados dedos de zinc (ZFPs, por sus siglas en inglés) son las proteínas que contienen por lo menos un dedo de zinc y pueden unirse específicamente a los ácidos nucleicos en una secuencia específica marina Las proteínas de dedo de zinc primero se describieron en 1985 en el factor de transcripción TFIIIA de los oocitos del sapo araña africano, Xenopus laevis El motivo del dedo de zinc es uno de los motivos de unión de ADN más abundante El motivo de unión más común y usado más ampliamente, es la familia Cys2H?s2 de los dedos de zinc Las proteínas pueden contener más de un dedo en una sola cadena y consiste de 2 anti-filamentos beta paralelos seguidos por una hélice alfa Estas proteínas utilizan un solo ion de zinc coordinado por 2 residuos histidma invariantes y 2 residuos de cistina invariantes Cada uno de los dominios del dedo de zinc es capaz de reconocer un tracto de 3 pares de bases en el surco principal que utiliza una hélice alfa Así una proteína con 3 dedos puede reconocer un tracto de 9 pares de bases con afinidad picomolar a nanomolar La identificación de un código de reconocimiento para casi todos los sitios de reconocimiento de 3 pares de bases posibles está permitida para el diseño de dedos de zinc únicos para casi cualquier objeto de ácido nucleico de interés. Los dedos de zinc varían ampliamente en estructura, así como en función, los cuales se extienden de la unión de ADN o ARN a las interacciones proteína-proteína y la asociación de la membrana. Otras familias del factor de transcripción específicas, tal como hélice-giro-hélice o proteínas de unión de ADN diseñadas también pueden servir como agentes de unión de ADN de secuencia específica. Similarmente, las proteínas específicas también existen, las cuales contienen los dominios de unión de metilo (MBD), que pueden reconocer la metilación de ADN específica en las secuencias de dinucleótido CpG que sirven como otra clase distinta de los motivos de unión de ADN. Un sistema útil para identificar las interacciones macromoleculares son los análisis de complementación de proteína (PCA, por sus siglas en inglés). En estos sistemas utilizan los fragmentos de un marcador detectable o moléculas reporteras, tales como una proteína. Cuando los fragmentos están próximos, se genera una señal detectable (Patente Norteamericana No. 6,780,599, Solicitud de Patente Norteamericana No. 20040229240 y Solicitud de Patente Norteamericana No. 20030108869). Tales sistemas incluyen la proteína beta-lactamasa verde fluorescente (GFP) y sus muchas variantes, dihidrofolato reductasa, luciferasa y galactosidasa. Durante algunas décadas pasadas, los clínicos médicos y científicos de investigación han descubierto la importancia de las modificaciones genómicas y su función en el desarrollo de anormalidades genéticas y cáncer. Además, los investigadores han descubierto que la secuenciación de ADN y la identificación del marcador son una herramienta poderosa. Además de la investigación del cáncer y genética (por ejemplo, la consulta prenatal o genética), la secuenciación de ADN y la detección del marcador han encontrado una enorme utilidad en virtualmente todas las condiciones que se extienden de la investigación básica a las cortes legales. En vista de la función siempre expandida de la tecnología basada en ADN, existe una necesidad crítica del desarrollo de nuevas y eficientes técnicas basadas en el reconocimiento de ADN en un sitio específico, que posean un intervalo amplio de aplicaciones, no menos de las cuales serían para el diagnostico clínico. Breve Descripción de la Invención Con la necesidad anterior en mente, la presente ¡nvención proporciona en la presente los constructos de novedad de los módulos de la proteína de unión de ADN agregados a los sistemas reporteros de la proteína dividida para detectar los sitios específicos del ácido nucleico de interés que incluyen los sitios específicos de la metilación de ADN. Es un objeto de la presente invención proporcionar una metodología general para la detección directa del ADN por el diseño de un sistema de proteína dividida que se reagrupa para formar un complejo activo solamente en presencia de una secuencia de ADN objeto. Este proceso llamado reagrupamiento permitido de secuencia (SEER) de proteínas, combina la capacidad de disecar racionalmente las proteínas para construir los sistemas de reagrupamiento de proteína dependientes de la oligomerización y disponibilidad de los motivos del dedo de zinc Cys2-His2 de unión de ADN u otros dominios de unión de ADN en sitios específicos para el reconocimiento de las secuencias específicas de ADN. En los ejemplos, los presentes inventores demuestran la viabilidad del método SEER que utiliza la proteína dividida verde fluorescente (GFP) agregada a los dominios del dedo de zinc, tal que la formación del cromóforo de GFP es catalizada solamente en presencia de las secuencias de ADN que incorporan los sitios de unión para ambos dedos de zinc. En otro ejemplo de la presente ¡nvención se describe otro sistema SEER que se proporciona con capacidad catalítica usando la enzima reportera de división TEM1 ß-lactamasa. Según lo mostrado en los ejemplos, la amplificación de señal permaneció lineal durante el tiempo del análisis, y el ADN objeto se podría distinguir del ADN no objeto en menos de 5 minutos. Una sola sustitución del par de bases en la secuencia de unión de ADN redujo la señal a los niveles base. La sustitución de un diferente dominio de unión de ADN del dedo de zinc común produjo una señal solamente en el objeto similar. Un ejemplo adicional del método SEER se puede utilizar para detectar los sitios específicos de metilación de ADN. En este método una proteína del dominio de unión de metilo (MBD) se utilizo para diseñar un dinucleótido CpG metilado y unido a una mitad de GFP dividida, mientras que la otra mitad de GFP dividida se une a un dominio de unión de ADN de secuencia específica, tal como un dedo de zinc. En este ejemplo, la formación del cromóforo de GFP se cataliza selectivamente cuando una secuencia de nucleótidos contiene un sitio de CpG metilado así como el sitio de unión de ADN del dedo de zinc. Estos resultados presentan a SEER como un método rápido y sensible para la detección de las secuencias de ADN con filamentos dobles así como sitios específicos de la metilación de ADN. La capacidad de novedad de leer la información genética del ADN con filamentos dobles, proporciona varias ventajas sobre los métodos de detección actuales. (1) Un sistema de detección de secuencia de nucleótido comprende: una primera proteína en donde la proteína comprende por lo menos un dominio de unión de ADN de secuencia específica que puede comprender un dominio del dedo de zinc o una proteína de unión de ADN tal como una proteína hélice-giro-hélice, una proteína de unión de ADN miniatura, dominio de unión de metilo-citosina, y el dominio de oligomerización terminal N de una enzima de la proteína dividida, en donde por lo menos un dominio de unión de ADN (por ejemplo, el dominio del dedo de zinc) es separado del dominio de oligomerización terminal N de la enzima de la proteína dividida mediante un enlace; y una segunda proteína en donde la proteína comprende por lo menos el dominio de unión de ADN de secuencia específica que puede comprender un dominio del dedo de zinc o una proteína de unión de ADN alterna tal como una proteína de la hélice-giro-hélice, proteína de unión de ADN miniatura, dominio de unión de metilo-citosina, y el dominio de oligomerización terminal C de la enzima de la proteína dividida, en donde por lo menos un dominio de unión de ADN (por ejemplo, dominio del dedo de zinc) está separado del dominio de oligomerización terminal C de la enzima de la proteína dividida mediante un enlace. (2) El sistema de detección de la secuencia de nucleótidos de (1), en donde el dominio de unión de ADN de secuencia específica se selecciona del grupo que consiste de una proteína hélice-giro-hélice, proteína de unión de ADN miniatura, dominio de unión de metilo-citosina, y un dominio del domino de dedo de zinc. (3) El sistema de detección de la secuencia de nucleótidos de (2), en donde por lo menos una de la primera proteína y la segunda proteína, contiene por lo menos un dominio de unión de metilo-citosina como el dominio de unión de ADN de secuencia específica. (4) El sistema de detección de la secuencia de nucleotidos de (1), en donde por lo menos una de la primera proteína y la segunda proteína, contiene por lo menos un dominio del dedo de zinc como un dominio de unión de ADN de secuencia específica 5 (5) El sistema de detección de secuencia de nucleótidos de (1), en donde cada una de la primera protema y la segunda proteina contiene por lo menos un dominio del dedo de zinc como un dominio de unión de ADN de secuencia específica (6) El sistema de detección de la secuencia de nucleótido i o de (5), en donde por lo menos un dominio del dedo de zinc de la primera proteína está contenido dentro de un modulo del dedo de zinc, se deriva de una proteína del dedo de zinc seleccionada del grupo que consiste de Z?f268, PBSII y PEÍA (7) El sistema de detección de la secuencia de nucleótidos 15 de (5), en donde por lo menos un dominio del dedo de zinc de la segunda proteína está contenido dentro de un módulo del dedo de zinc que se deriva de una proteína del dedo de zinc seleccionada del grupo que consiste de Z?f268, PBSII y PEÍA (8) El sistema de detección de la secuencia de nucleotidos 20 de (5), en donde por lo menos un dominio del dedo de zinc de la primera proteína se localizan en el dominio de ohgomepzación terminal C a la terminal N de la enzima de la proteína dividida (9) El sistema de detección de la secuencia de nucleótidos de (5), en donde por lo menos un dominio del dedo de zinc de la 25 segunda proteína se localiza en el dominio de ohgomepzación terminal C a la terminal C de la enzima de la proteína dividida. (10) El sistema de detección de la secuencia de nucleótidos de (1), en donde la enzima de la proteína dividida se reagrupa para formar una enzima funcional; en donde la primera proteína se une a la secuencia de nucleótidos similar para el dominio de unión de ADN de secuencia específica comprendido en la misma, en donde la segunda proteína se une a la secuencia de nucleótidos similar para el dominio de unión de ADN de secuencia específica comprendido en la misma, y en donde la secuencia de nucleótidos similar para la primera proteína se localiza en 5' a la secuencia de nucleótidos similar para la segundo proteína. (11) El sistema de detección de la secuencia de nucleótidos de (10), en donde la enzima de la proteína dividida se selecciona del grupo que consiste de beta-galactosidasa, beta-lactamasa, dihidrofolato reductasa, proteína verde fluorescente y sus variantes, y luciferasa. (12) El sistema de detección de la secuencia de nucleótidos de (10), en donde la enzima de la proteína dividida es una beta-lactamasa. (13) El sistema de detección de la secuencia de nucleótidos de (1), en donde las enzimas de la proteína dividida es la proteína verde fosforescente y sus variantes. (14) El sistema de detección de la secuencia de nucleótidos de (1), en donde el enlace en la primera proteína oscila de 0 a 30 aminoácidos. (15) El sistema de detección de la secuencia de nucleótidos de (1), en donde el enlace en la primera proteína es de 15 aminoácidos. (16) El sistema de detección de la secuencia de nucleótidos de (1), en donde el enlace en la segunda proteína oscila de 0 a 30 aminoácidos. (17) El sistema de detección de la secuencia de nucleótidos de (1), en donde el enlace en la segunda proteína es de 15 aminoácidos. (18) El sistema de detección de la secuencia de nucleótidos de (1), en donde la primera proteína tiene la secuencia que comprende la SEC ID NO: 16 y la segunda proteína tiene la secuencia que comprende la SEC ID NO: 14. (19) El sistema de detección de la secuencia de nucleótidos de (1), en donde la primera proteína tiene la secuencia que comprender la SEC ID NO: 46 y la segunda proteína tiene la secuencia que comprende la SEC ID NO: 44. (20) El sistema de detección de la secuencia de nucleótidos de (1), en donde la primera proteína tiene la secuencia que comprende la SEC ID NO: 48 y la segunda proteína tiene la secuencia que comprender la SEC ID NO: 44. (21) El sistema de detección de la secuencia de nucleótidos de (1), en donde la primera proteína tiene la secuencia que comprende la SEC ID NO: 16 y la segunda proteína tiene la secuencia que comprende la SEC ID NO: 52. (22) Un polinucleótido aislado que codifica la primera proteína del sistema de detección de la secuencia de nucleótidos 5 de (1). (23) El polinucleótido aislado de (22), en donde el polinucleótido se selecciona del grupo que consiste de SEC ID NO: 15, SEC ID NO: 45, y SEC ID NO: 47. (24) Un polinucleótido aislado que codifica la segunda i o proteína del sistema de detección de la secuencia de nucleótidos de (1). (25) El polinucleótido aislado de (24), en donde el polinucleótido se selecciona del grupo que consiste de la SEC ID NO: 13, SEC ID NO: 43, y SEC ID NO: 51. is (26) Un kit que comprende el sistema de detección de la secuencia de nucleótidos de (1) y un amortiguador de hibridación. (27) El kit de (26), en donde la primera proteína y la segunda proteína están en una forma liofilizada. (28) Un método para detectar la presencia de una 20 secuencia específica de nucleótidos en una muestra que comprende un polinucleótido, en donde el método comprende: poner en contacto la muestra con el sistema de detección de la secuencia de nucleótidos de (1) durante una duración y bajo las condiciones convenientes para facilitar la hibridación, en 25 donde el sistema de detección de la secuencia de nucleótidos se ajusta para detectar la secuencia específica de nucleótidos mediante el arreglo y el numero de dominios de unión de ADN de secuencia específica contenidos dentro de la primera proteina y de la segunda proteina, monitorear la formación de la actividad asociada a la enzima de la proteína dividida cuando está en un estado reagrupado, y correlacionar una actividad positiva observada del monitoreo de la presencia de la secuencia específica en los polinucleótidos (29) El método de (28), en donde la enzima de la proteína dividida es la proteína verde fluorescente y el monitoreo comprende monitorear la emisión de fluorescencia a 509 nm durante la excitación a 395 nm Otras variantes de GFP se pueden utilizar similarmente, las cuales tienen un espectro variante de excitación y emisión (30) El método de (28), en donde la enzima de la proteína dividida es beta-lactamasa y el monitoreo comprende monitorear la hidrólisis de un sustrato seleccionado del grupo que consiste de nitrocefina, CCF2, CCF4, CC2, C-mel, penicilina, ampicilina, y carbenicihna (31) El método de (28), en donde el método es un método para detectar una anormalidad genética en un sujeto en necesidad del mismo (32) El método de (28), en donde el método es un método para detectar solamente el polimorfismo de nucleótidos en un sujeto en necesidad del mismo (33) El método de (28), en donde el método es un método para detectar el acortamiento de telómeros en donde el sujeto en necesidad del mismo. (34) El método de (33), en donde el sujeto en necesidad del mismo es un sujeto que tiene o se sospecha que tiene cáncer. (35) El método de (34), en donde el tema en necesidad del mismo es un sujeto que tiene o se sospecha que tiene una enfermedad relacionada a la edad. (36) El método de (28), en donde el método es un método para determinar la edad de células o animales clonados y la secuencia específica de nucleótidos es la secuencia repetida en los telómeros. (37) El método de (28), en donde el método es un método para diagnosticar el cáncer en un sujeto en necesidad del mismo y la secuencia específica de nucleótidos es un marcador único de un tipo específico cáncer. (38) El método de (28), en donde el método es un método para identificar un agente infeccioso y la muestra se selecciona del grupo que consiste de una muestra de tejido, muestra de sangre, muestra de suero, exudado nasal, exudado vaginal, y un exudado rectal. (39) El método de (28), en donde el método es un método para identificar un agente infeccioso y la muestra se selecciona del grupo que consiste de alimento, bebida, y agua. (40) El método de (28), en donde el método es un método de igualación de muestra-a-fuente en donde la secuencia específica de nucleotidos representa una secuencia única de nucleótidos obtenida de una muestra biológica de interés y la muestra se obtiene de un sujeto que se sospecha que contiene la 5 secuencia único de nucleotidos (41) El método de (40), en donde la muestra biológica de interés se selecciona del grupo que consiste de sangre, pelo, piel, esperma, y semen (42) El método de (40), en donde la muestra se selecciona i o del grupo que consiste de sangre, pelo, piel, esperma, y semen (43) Un método para tratar la eliminación de una infección viral en un sujeto en necesidad del mismo, que comprende adaptar la especificidad de secuencia de los dominios de unión de ADN de secuencia específica del sistema de detección is de la secuencia de nucleótidos de (1), a la infección viral, el sujeto a una secuencia única de ácido nucleico de la misma, en donde la enzima de la proteína dividida facilita la hidrólisis de un sustrato que se vuelve tóxico al virus durante la hidrólisis, administrar una cantidad efectiva de nucleótidos del sistema 20 de detección de la secuencia de nucleótidos de (1) al sujeto, y administrar una cantidad efectiva de sustrato a un sujeto (44) El método de (43), en donde la enzima de la proteína dividida es beta-lactamasa (45) El método de (44), en donde el sustrato es C-mel 25 (46) Un método para tratar el cáncer en un sujeto en necesidad del mismo, que comprende adaptar la especificidad de la secuencia de los dominios de unión de ADN de secuencia específica del nucleotido del sistema de detección de la secuencia de nucleótidos de (1) a un oncogén mutante en el sujeto, a una secuencia única de ácido nucleico del mismo, en donde la enzima de la proteína dividida facilita la hidrólisis de un sustrato que se vuelve tóxico al virus durante la hidrólisis, administrar una cantidad efectiva del sistema de detección de la secuencia de nucleótidos de (1) al sujeto, y administrar una cantidad efectiva de sustrato al sujeto (47) El método de (46), en donde la enzima de la proteína dividida es beta-lactamasa (48) El método de (47), en donde el sustrato es C-mel (49) Un método para detectar la presencia de sitios específicos de la metilación de ADN dentro de una secuencia específica de un polinucleótido de un sujeto en la necesidad del mismo, que comprende adaptar la especificidad de la secuencia de los dominios de unión de ADN de secuencia específica del sistema de detección de la secuencia de nucleótidos de (1) a una secuencia específica de ADN en el sujeto, a una secuencia única de ácido nucleico de la misma, en donde el dominio de unión de ADN de secuencia específica de por lo menos una de la primera proteína y la segunda proteína, es un dominio de unión metilo, liberar una cantidad efectiva del sistema de detección de secuencia de nucleótidos de (1) en una muestra obtenida del sujeto; monitorear la formación de la actividad asociada a la enzima de la proteína dividida cuando está en un estado reagrupado; y correlacionar una actividad positiva observada del monitoreo a la presencia de la metilación de ADN dentro de la secuencia específica en el polinucleótido. (50) El método de (49), en donde el dominio de unión de metilo es un dominio de unión de metilo-citosina. (51) El método de (50), en donde la primera proteína tiene la secuencia que comprende la SEC ID NO: 16 y la segunda proteína tiene la secuencia que comprende la SEC ID NO: 52. (52) El método de (49), en donde la presencia de la metilación de ADN se correlaciona a una predisposición de o a una diagnosis de cáncer. (53) Un método para la detección simultánea de la presencia de las secuencias específicas de nucleótidos múltiples en una muestra que comprende un polinucleótido, en donde el método comprende: poner en contacto la muestra con dos o más diferentes sistemas de detección de la secuencia de nucleótidos de (1) durante un periodo y bajo las condiciones convenientes para facilitar la hibridación, en donde los sistemas de detección de la secuencia de nucleótidos son ajustados para detectar las secuencias específicas de nucleótidos independientes por el arreglo y número de los dominios de unión de ADN de secuencia específica contenidos dentro de la primera proteína y de la segunda proteína y en donde la enzima de la proteína dividida para cada sistema de detección de la secuencia de nucleótídos es distinta de cualquier otra, monitorear la formación de la actividad asociada a las enzimas de la proteína dividida cuando está en un estado reagrupado; y correlacionar una actividad positiva observada del monitoreo a la presencia de las secuencias específicas en el polinucleótido. (54) El método de (53), en donde por lo menos una de las enzimas de la proteína dividida se selecciona del grupo que consiste de beta-galactosidasa, beta-lactamasa, dihidrofolato reductasa, proteína verde fluorescente, y luciferasa, y variantes u homólogos de las mismas. (55) El método de (53), en donde por lo menos una de las enzimas de la proteína dividida es un beta-lactamasa, variantes u homólogos de la misma. (56) El método de (53), en donde por lo menos una de las enzimas de la proteína dividida es una proteína verde fluorescente, variantes u homólogos de la misma. (57) El método de (56), en donde por lo menos una de las enzimas de la proteína dividida se selecciona del grupo que consiste de proteína verde fluorescente, proteína cian fluorescente, proteína amarillo fluorescente, proteína rojo fluorescente, y proteína arrecife de coral fluorescente. (58) El método de (53), en donde el contacto es con tres a cinco de los sistemas de detección de la secuencia de nucleótidos. Los objetos anteriores presentan ciertos aspectos de la invención. Los objetos, aspectos y modalidades adicionales de la invención se encuentran en la siguiente descripción detallada de la invención. Breve Descripción de las Figuras Una apreciación más completa de la invención y muchas de las ventajas relacionadas de la misma, serán obtenidas fácilmente, asimismo se entienden mejor mediante la referencia a las siguientes figuras en combinación con la descripción detallada a continuación. La figura 1 es una visión general de la estrategia SEER. NGFP-ZnFingerA comprende los residuos 1-157 de GFP fusionada por un enlace de 15 residuos al dedo de zinc de unión de ADN Zif268. CGFP-ZnFingerB comprende los residuos 158-238 de GFP fusionada por un enlace de 15 residuos al dedo de zinc PBSII. Figura 2. a) Espectros de emisión de fluorescencia de NGFP-ZnFingerA (15 µM) + CGFP-ZnFingerB (15 µM) en presencia y ausencia de 4 µM de ADN objeto (Zif268-10-PBSII) excitado a 468 nm. La inserción muestra el gel de SDS con los estándares de mp (línea 1), la mezcla equimolar de NGFP-ZnFingerA y CGFP-ZnFmgerB usada en los experimentos SEER (línea 2), NGFP- ZnFmgerA (línea 3), y CGFP-ZnFmgerB (línea 4) b) Emisión de fluorescencia a 505 nm de NGFP-ZnFingerA (5 µM) + CGFP-ZnFingerB (5 µM) en presencia de los controles de ADN con filamentos dobles indicados (5 µM cada uno) c) emisión de fluorescencia relativa a 505 nm de NGFP-ZnFmgerA (5 µM) + CGFP-ZnFmgerB (5 µM) en función de las concentraciones de aumento del ADN objeto (Z?f268-10-PBSII) La figura 3 muestra un esquema del plásmido pETDuet-SEER que muestra la posición de los genes CGFP-PBSII y NGFP-Z?f268, las enzimas de restricción usadas, y los sitios del promotor T7 La figura 4 muestra la fluorescencia de las muestras de SEER que contienen ADN con diferente separación entre los sitios de unión La figura 5 muestra la configuración y orientación de los contructos de LacA-Z?f268 y PBSII-LacB del ejemplo 5 La figura 6 representa la estrategia SEER-LAC LacA-Z?f268 comprende los residuos 26-196 de ß-lactamasa fusionada por un enlace 15-aa a ZF Z?f268 de unión de ADN PBSII-LacB comprende ZF PBSII fusionada por un enlace 15-aa a los residuos 198-290 de ß-lactamasa En presencia del ADN objeto que contiene los sitios de unión para Z?f268 y PBSII con un separador apropiado (se muestra el separador 0-bp), los fragmentos de SEER se reagrupan para formar una enzima reportera activa La figura 7 muestra la señal SEER dependiente de la concentración de ADN A) Imagen digital de los análisis triplicados de nitrocefina después de la incubación de 30 minutos Los oligonucleótidos objeto de ADN (con separaciones del sitio objeto de 0, 6 y 10 bp) y sus concentraciones se indican sobre la imagen, Los fragmentos SEER (05 µM cada uno) se indican a la izquierda B) La representación gráfica de la cinética de reacción para el análisis se muestra en A La absorbencia a 486 nm fue medida en 3 minutos y cada 2 minutos después Fue trazado Vmax (en mih-unidades/mín) del aumento de la absorbencia El control negativo de los fragmentos no similares (LacA-Z?f268 y PElA-LacB) no fue mostrado, pero tuvo esencialmente la misma señal que el control negativo "sin ADN" C) Gráfica de absorbencia contra tiempo para LacA-Z?f268 y PBSII-LacB (diamantes) y LacA-Z?f268 y PElA-LacB no similares (triángulos) con 1 µM Zif-O-PBSIIADN Un ajuste lineal de los datos cinéticos (líneas llenas) confirmó un índice de la hidrólisis de 250 mU/mm (R2 = 09951) y 34 mU/mm (R2 = 09936), respectivamente D) Gráfica del índice de reacción contra la concentración de ADN para LacA-Z?f268 y PBSII-LacB con Zif-O-PBSIIAON en 1 µM (la línea más baja de diamantes), 200 nM (linea superior de diamantes), y 200 pM (la línea más baja de diamantes) La figura 8 muestra la sensibilidad de SEER a las mutaciones en el ADN objeto A) Imagen digital de los análisis triplicados de nitrocefma después de la incubación de 30 minutos Una serie de ohgonucleótidos modificados objeto Z?f-0-PBSII se utilizó a 1 µM, que contiene 1, 2, 3 ó 5 G para las sustituciones de T (en cuadros) en Z?f268 (izquierda más de 9 nucleótidos en el lado izquierdo y derecho de la imagen) o sitios objeto de PBSM (derechos más de 9 nucleótidos en el lado izquierdo y derecho de la imagen), según lo indicado Los fragmentos de SEER LacA-Z?f268 y PBSII-LacB fueron utilizados a 05 µM cada uno B) La representación gráfica de la reacción para el análisis mostrado en A La absorbencia a 486 nm fue medida en 3 minutos y cada 2 minutos después La figura 9 muestra la actividad de SEER usando varias combinaciones de los dominios de unión ZF y objetos ADN Se muestra el Vmax de la cinética de reacción de los análisis triplicados de nitrocefina Los oligonucleótidos objeto a 1 µM se indican en el gráfico, Los fragmentos de SEER a 05 µM cada uno se indican abajo La figura 10 muestra la unión de SEER en presencia de ADN genómico LacA-Z?f268 y PBSII-LacB a 0 5 µM cada uno se incubaron con 1 µM Z?f-0-PBSII (barras oscuras) o 1 µM Z?f-0-PEIA (barras ligeras) durante 20 minutos en presencia o ausencia (según lo indicado) de 32 µg de ADN dividido, con filamentos dobles Herring Sperm Esta concentración es igual en moles de los pares de bases (52 nmoles bp) a 1 µM de los oligonucleótidos objeto. La figura 11 muestra un esquema del plásmido pETDuet CGFP-MBD2 del ejemplo 7 que muestra la posición del gen CGFP-MBD2 y las enzimas de restricción usadas. La figura 12 muestra a una página SDS del ejemplo 8. Los de PM (línea 1); NGFP-Zif268 (línea 2); CGFP-MBD2 (línea 3); y cantidades equimolares de cada proteína (línea 4). La figura 13 muestra el efecto de la separación del sitio objeto en la fluorescencia de SEER-GFP según lo mostrado en el ejemplo 10. Descripción Detallada de la Invención A menos que se defina específicamente, todos los términos técnicos y científicos usados en la presente, tienen el mismo significado según lo entendido comúnmente por un experto en la técnica de la enzimología, bioquímica, biología celular, biología molecular, y ciencias médicas. Todos los métodos y materiales similares o equivalentes descritos en la presente se pueden utilizar en la práctica o prueba de la presente invención, con métodos y materiales convenientes que son descritos en la presente. Todas las Publicaciones, Solicitudes de Patente, Patentes, y otras referencias mencionadas en la presente son incorporadas por referencia en su totalidad. En caso de conflicto, la presente especificación, incluyendo las definiciones, se controlaran. Además, los materiales, métodos, y ejemplos son solamente ilustrativos y no tienen el propósito de ser limitantes, a menos que se especifique lo contrario. Virtualmente todos los métodos científicos para leer la información de la secuencia de ADN se apoyan en las propiedades de hibridación de las moléculas de ácido nucleico complementarias. Tales métodos, incluyendo PCR, secuenciación Sanger, microarreglo de ADN, Southern y Western Blotting, e in situ hibridación, todos por lo tanto requieren la desnaturalización de la hélice nativa doble de ADN en filamentos sencillos y la renaturalización subsecuente con cabadores específicos o puntas bajo condiciones cuidadosamente controladas. En contraste, la naturaleza frecuentemente se basa en las proteínas de unión de ADN de secuencia específica para leer la información de la secuencia de ADN, por ejemplo ocurre durante los procesos de iniciación de la transcripción, dirección de intrón, y defensa contra ADN invasor mediante las endonucleasas de restricción. En el genoma humano, los factores de transcripción de unión de ADN comprenden una de las clases más grandes de genes conocidos, con aproximadamente 2,000 miembros (19). El tipo más común de dominio de unión de ADN es la clase Cys2-His2 de los dedos de zinc. La presente invención establece el desarrollo de una nueva tecnología para la detección de las secuencias de ADN (ds) específicas con filamentos dobles. Este sistema, designado señalado SEER (Reagrupación Permitida de Secuencia), consiste de los sistemas de la proteína dividida que permiten la reagrupación de un complejo activo solamente en presencia de una secuencia de ADN similar. Este método combina dos métodos racionales de diseño de proteína, la tecnología de los análisis de complementación de proteína (PCA, por sus siglas en inglés) y la tecnología de la proteína de unión de ADN en un sito específico, por ejemplo la tecnología de la proteína del dedo de zinc (ZF) acostumbrada. PCA es una metodología descrita inicialmente para detectar las interacciones proteína-proteína (14a, b). Una proteína funcional, comúnmente una molécula reportera, se diseca en dos fragmentos no funcionales. La funcionalidad se restaura cuando los fragmentos son reagrupados por dominios unidos de la interacción proteína-proteína, tal como cierres de leucina. Varios sistemas tales se han reportado recientemente, incluyendo los nuevos reagrupamientos de ß-galactosidasa (14b), dihidrofolato reductasa (DHFR) (14d), proteína verde fluorescente (GFP) y sus variantes (14e), TEM-1 ß-lactamasa (14c), y luciferasa de luciérnaga (25, 26). Las proteínas de unión de ADN de secuencia específica se han estudiado ampliamente durante algunas décadas pasadas. La presente invención se aprovecha de la abundancia de información relacionada a la especificidad de la secuencia y las proteínas de unión de ADN relacionadas a esa especificidad. Como tal, los constructos de SEER de la presente invención proporcionan dos distintos constructos de proteína en los cuales cada constructo contiene por lo menos una proteína/dominio de unión de ADN unida a una mitad de una proteína de un sistema de PCA Las proteínas de unión de ADN de secuencia específica que se pueden utilizar en el sistema SEER incluyen, pero no se limitan a) proteínas héhce-giro-héhce, los ejemplos estructurales de esta familia de proteínas de unión de ADN incluyen los descritos por Huang G S y col (1989) J Mol Biol 205, 189-200, (ref 33) Mondragon A y col (1989) J Mol Biol 205, 179-188, (ref 4) Nep D y col (1992) J Mol Biol 223, 743-767, (ref 40) Pabo, C O y col (1982) Nature 298, 443-447, (ref 8) Padmanabhan S y col (1997) Biochemestry 36, 6424-6436, (ref 22) Sevilla-Sierra P y col (1994) J Mol Biol 235, 1003-1020 (ref 42), b) proteínas de unión de ADN miniatura designadas, incluyendo las descritas en Yang L y col (2005) Biochemestry, 44, 7469-7478, (ref 20) Montclare J K y col (2003) J Am Chem Soc, 125, 3416 (ref 21), c) proteínas del dedo de zinc (abajo); y d) dominios de unión de metilo-citosina, por ejemplo la familia del dominio de unión de metil-CpG de las proteínas que incluyen MBDI, MBD2, MBD3, MBD4, y MeCP2 (47a, b). Las proteínas de unión de ADN acostumbradas se pueden construir por dominios modificados de unión de ADN de Cys2-His2 ZF. Cada dominio de ZF contiene 30 aminoácidos que forman un plegamiento ßßa, estabilizados por las interacciones hidrofóbicas y la quelación de un ion de zinc entre dos histidinas y dos cisteinas. Cada dominio reconoce comúnmente 3-4 nucleótidos de ADN. Los dominios se pueden encontrar en los arreglos en tándem covalentes, facilitando el reconocimiento de las secuencias de ADN extendidas. Una proteína que contiene seis dedos de zinc debe tener la capacidad de reconocer 18pares de bases de ADN, suficientemente grandes para especificar un sitio único en el genoma humano (27). Una variedad de métodos de diseño de combinación y racionales se han utilizado para modificar la especificidad de unión de ZFs naturales (28-31). En detalle, Barbas y colaboradores han producido un léxico de dominios intercambiables con la capacidad de reconocer las secuencias únicas de ADN de 3-4 pares de bases (15). Usando estos módulos predefinidos de reconocimiento, las proteínas de unión de ADN se pueden agrupar rápidamente para unir virtualmente cualquier secuencia de ADN o gen en el genoma humano (1). Las proteínas de tres dedos tienen comúnmente afinidades en el intervalo de 1-50 nM y son altamente específicas para su sitio objeto (27). Estas proteínas ZF hechas de la manera acostumbrada se pueden unir a los dominios funcionales para generar las proteínas quiméricas de novedad que producen la actividad deseada en las secuencias específicas de ADN. Este método se ha utilizado para diseñar los factores de transcripción objeto (15,34), endonucleasas objeto (35), e integrasas objeto (36). Sin embargo, hasta ahora, no se ha proporcionado ningún método o sistemas en los cuales las proteínas de ZF se hayan unido a un sistema de proteína dividida no funcional que puede reagrupar un complejo activo solamente en presencia de una secuencia de ADN similar. Debido a la adaptabilidad del sitio de reconocimiento de ADN en la presente invención, el sistema SEER de la presente invención es una herramienta valiosa para detectar o confirmar la presencia una secuencia de ácido nucleico particular, tal como una anormalidad genética o un solo polimorfismo de nucleótido (SNP). Este sistema se puede utilizar para detectar el reajuste genómico en ADN y para la identificación de las secuencias altamente repetitivas. Un ejemplo de una aplicación de la presente invención es la identificación de las secuencias repetitivas en telómeros. En humanos, las secuencias de telómeros que se acortan en un periodo de tiempo produciendo un extremo 'pegajoso' que conduce a los reajustes del cromosoma, las cuales pueden ser un marcador del cáncer o enfermedades relacionadas a la edad. Puesto que los telómeros se acortan con el aumento de la edad, la detección de los telómeros acortados puede ser útil, por ejemplo, para determinar la edad de las células o animales clonados. Adicionalmente, con respecto al diagnóstico de cáncer y/o de enfermedad, el sistema SEER de la presente invención se puede adaptar para determinar la ausencia o presencia de una secuencia conservada específico que sirve como marcador único de la enfermedad o tipo de cáncer. El alcance e identidad del marcador genético que se probará está particularmente limitando. Según lo descrito en la presente, la naturaleza e identidad de la proteína unión de ADN y la secuencia identificada de tal modo se pueden seleccionar por el experto en la técnica dependiendo de la secuencia deseada que se detectara. Además, la presente invención proporciona un método para detectar la presencia de sitios específicos de metilación de ADN dentro de una secuencia específica de un polinucleótido de un sujeto en necesidad del mismo, (a) adaptando la especificidad de la secuencia de los dominios de unión de ADN de secuencia específica del sistema de detección de la secuencia de nucleótidos de la reivindicación 1, a una secuencia específica de ADN en el sujeto, a una secuencia única de ácido nucleico del mismo, en donde el dominio de unión de ADN de secuencia específica de por lo menos una de la primera proteína y segunda proteína es un dominio de unión de metilo, (b) liberando una cantidad efectiva del sistema de detección de la secuencia de nucleótidos de la reivindicación 1, a una muestra obtenida del 5 sujeto, (c) monitoreando la formación de la actividad asociada a la enzima de la proteína dividida cuando está en un estado reagrupado, y (d) correlacionando una actividad positiva observada del monitoreo a la presencia de la metilación de ADN dentro de la secuencia específica en el polinucleótido. Además, i o la presencia de la metilación de ADN se puede correlacionar a una predisposición al o una diagnosis del cáncer. Por supuesto, dentro de este método se contempla que las etapas adicionales se puedan agregar incluyendo una etapa de recuperación de muestra y cualquier etapa intermedia de procesamiento de I5 muestra. El método de monitoreo variará dependiendo de la proteína de la enzima de la proteína dividida seleccionada. En este método, el dominio de unión de metilo es preferiblemente un dominio de unión de metilo-citosina. En una modalidad de este método, la primera proteína tiene la secuencia que comprende la 20 SEC ID NO: 16 y la segunda proteína tiene la secuencia que comprende la SEC ID NO: 52. En las aplicaciones anteriores, la muestra que se probará puede ser cualquier célula que contenga la muestra. Los ejemplos no limitantes incluyen las muestras de tejido, incluyendo 25 biopsias tisulares, muestras de sangre (incluyendo sangre entera, eritrocitos, o leucocitos), sueros, exudados nasales, exudados vaginales, exudados rectales, etc SEER también se puede utilizar para hacer la identificación de otros agentes infecciosos tal como virus (Ebola, Marburg, etc ), o identificar capas o serotipos particulares de agentes infecciosos tal como VIH, Influenza o E coli Ademas de las muestras anteriores, el agente infeccioso también se puede buscar en alimentos, bebidas, muestras de agua, etc SEER también encuentra uso en las siguientes áreas de esfuerzo a) la detección de ADN metilaao, reporte del grado de metilación o si un sitio particular se metila en una célula, b) detección de ADN modificado por las toxinas ambientales, c) detección de la accesibilidad de ADN (por ejemplo, reportando si un sitio en un cromosoma está disponible para unir las proteínas o si está protegido por los nucleosomas) o estructuras inusuales de ADN (por ejemplo, G-cuádruple, triple, cruciformes), d) metodología de selección según lo descrito abajo, e) terapéutico según lo descrito abajo En una modalidad de la presente invención es un método para tratar la eliminación de una infección viral o tratar el cáncer en un sujeto en necesidad del mismo adaptando la especificidad de la secuencia de los dominios de unión de ADN de secuencia específica del sistema SEER al virus que infecta al sujeto o al oncogén mutante en el sujeto, a una secuencia única de ácido nucleico del mismo, en donde la enzima de la proteína dividida facilita la hidrólisis de un sustrato que se vuelve tóxico al virus durante la hidrólisis, seguido por la administración al sujeto de una cantidad efectiva de las proteínas del sistema SEER y el sustrato que se hidrolizará. Según lo indicado abajo, un ejemplo de la enzima de la proteína dividida del sistema SEER que puede efectuar este método, es una beta-lactamasa, donde el sustrato es C-mel. El término "cantidad efectiva" significa que es una cantidad que causa el efecto terapéutico deseado y variará depender de la edad, peso, y condición del sujeto, así como el tipo de trastorno que se tratará o eliminara. Además, la cantidad efectiva variará en base al tipo de la célula u objeto que se tratara. Las aplicaciones adicionales en las cuales el sistema SEER puede se extenderá están en los estudios del perfil de ADN. El genoma humano comprende 3.2 billones de pares de bases y aproximadamente 30,000 genes. Como tal, estadísticamente, un sitio único en el genoma humano se puede definir por 16 nucleótidos consecutivos. Por ejemplo, según lo indicado anteriormente, una proteína que contiene seis dedos de zinc debe tener la capacidad de reconocer 18 pares bases de ADN, que es suficientemente grande para especificar un sitio único en el genoma humano. Como tal, seleccionando un residuo los suficientemente grande de ADN, el sistema SEER de la presente solicitud se puede adaptar específicamente para detectar la ausencia o presencia de estiramientos únicos de ADN genómico.
Esta capacidad ofrecida por la presente invención proporciona las oportunidades únicas de la igualación muestra-a-fuente en base a una secuencia de ADN, por ejemplo mediante el análisis comparativo de un estiramiento de ADN obtenido de una muestra de sangre, pelo, piel, esperma, o semen (u otros fluidos corporales) recuperados de una escena del crimen (u otra ubicación más inocua) con el de una muestra de ADN obtenida de un sospechoso. Una ventaja adicional proporcionada por el sistema SEER en esta aplicación es que el SEER se podría implementar en el sitio. Comúnmente, la cantidad de material biológico viable (por ejemplo, pelo) recuperado de la escena de un crimen contiene solamente una cantidad pequeña de ADN. Por lo tanto, si la muestra tuvo que ser recolectada y llevada nuevamente al laboratorio para los protocolos tradicionales de PCR, el tiempo y recursos preciados se pueden perder. El uso de SEER en las células intactas es más ventajoso que los métodos existentes tal como Fluorescent In Situ Hybridization (FISH). Los SEER detectarán la diferencia genética y las anormalidades entre las células tanto como FISH. Sin embargo, el sistema SEER permite la detección de la accesibilidad de ADN, presencia de estructuras inusuales de ADN tal como G-cuádruple y modificaciones de ADN tal como metilación, que son actualmente indetectables por medio de FISH.
La reagrupación de proteína asistida por oligomerización es posible cuando una proteína se puede fragmentar en dos mitades que no se reagrupan hasta integrarse a los dominios de oligomerización de proteína convenientes. Este método se ha utilizado con éxito para la detección de las proteínas de oligomerización utilizando la ubiquitina fragmentada (14a), beta-galactosidasa (14b), beta-lactamasa (14c), dihidrofolato reductasa (14d), proteína verde fluorescente (GFP) (14e,f), luciferasa (14g), y dominios de pH (14h) entre otros. Sin embargo el reagrupamiento de la proteína divida no se ha utilizado para la detección directa de las secuencias específicas de ADN por la formación de complejos ternaria. Para la formación de complejos ternaria en presencia de ADN, hemos elegido utilizar la familia ubicua Cys2-His2 de los dedos de zinc que son el motivo de unión de ADN más ampliamente usado en el genoma humano. Cada uno de los dominios del dedo de zinc es capaz de reconocer un tracto de 3 pares de bases en el surco principal utilizando una hélice a (16). Así una proteína de 3 dedos puede reconocer un tracto de 9 pares de bases con una afinidad picomolar a nanomolar (15). Por otra parte, los experimentos recientes han dado lugar a la identificación de un código de reconocimiento de casi todos los sitios de reconocimiento de ADN de 3 pares bases posibles, lo cual permite el diseño de los dedos de zinc únicos de cualquier objeto de ADN de interés (15). Los presentes inventores proporcionan que la integración de los dedos de zinc de secuencia específica a las proteínas fragmentadas apropiadamente deben en principio permitir la reagrupación de la proteína solamente en presencia de la secuencia correcta de ADN (figura 1) Así, la presente invención proporciona un sistema de novedad para identificar una secuencia de ácido a nucleico deseada o, alternativamente, para determinar la ausencia de una secuencia específica de ácido nucleico que debe existir, pero se pierde debido a la mutación o modificación Este sistema utiliza pares de proteínas híbridas específicas que contienen los dominios de unión de ADN de secuencia específica o módulos que se unen de una manera a una secuencia específica de ácido polmucleico Estas proteínas híbridas también incluyen un fragmento del sistema de PCA, que cuando se localizan en proximidad mediante los dominios de unión de ADN de secuencia específica o módulos de unión al ácido nucleico, generan el reportero funcional de PCA (figura 1) En el caso donde los dominios o módulos de unión de ADN de secuencia específica son una o más proteínas del dedo de zinc, este sistema además utiliza los métodos conocidos usados para designar los factores acostumbrados de unión de ácido nucleico en un sitio específico tal como proteínas del dedo de zinc (1 -4) Los módulos de unión del dedo de zinc se pueden derivar de cualquier proteína del dedo de zinc conocida que incluye pero no se limita a Z?f268 (residuos 189-286 de SEC ID NO 44), PBSII (residuos 5-88 de SEC ID NO 46) y PEÍA (residuos 5-88 de SEC ID NO: 48). Según lo indicado anteriormente, una variedad de métodos de diseño de combinación y racionales se han utilizado para modificar la especificidad de unión de los dedos de zinc naturales (28-31). En particular, Barbas y colaboradores han producido un léxico de dominios intercambiables con la capacidad de reconocer las secuencias únicas de ADN de 3-4 pares de bases (15). Como tal, los módulos de unión del dedo de zinc se pueden modificar de acuerdo a los métodos conocidos en la técnica para unir una secuencia de ácido nucleico deseada (1-3). Además, las proteínas de unión del dedo de zinc se pueden agrupar en múltiplos para definir una secuencia de reconocimiento de una longitud relacionada directamente al número de módulos de unión del dedo de zinc contenidos dentro de la proteína. En una modalidad de la presente invención una o ambas mitades del sistema SEER contienen por lo menos una proteína hélice-giro-hélice, por lo menos una proteína de unión de ADN miniatura designada, por lo menos un dominio de unión de metilo-citosina (por ejemplo, metil-CpG), y/o por lo menos un dominio del dedo de zinc. Por lo tanto, en una modalidad de la presente invención una o ambas mitades del sistema SEER contienen por lo menos un dominio del dedo de zinc. Preferiblemente ambas mitades del sistema SEER contienen por lo menos un dominio del dedo de zinc, donde el número de dominios del dedo de zinc puede estar distribuido de forma asimétrica. La frase "por lo menos un dominio del dedo de zinc" comprende los múltiplos definidos solamente en base de la secuencia deseada que se detectará. Como tal, la presente invención comprende los dominios del dedo de zinc en cada mitad que se seleccionan independientemente de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, etc. Los constructos de proteína fueron designados tales que el fragmento de proteína se fusionara a un enlace de aminoácido. Generalmente, este enlace es de aproximadamente 15 residuos. Sin embargo, la longitud del enlace se puede modificar para aumentar la flexibilidad y acortarse para mejorar la eficiencia y selectividad (9). Por ejemplo, el enlace puede ser eliminado o acortado por lo menos a 5 residuos, preferiblemente el enlace es de por lo menos 10 residuos. Con respecto a los enlaces de longitud aumentada, a continuación se pueden mencionar por lo menos 20 residuos, por lo menos 25 residuos, por lo menos 30 residuos. Debe ser aparente a partir de lo anterior que los presentes inventores están en posesión de y describen en la presente todos los números enteros que se encuentran dentro de los intervalos definidos anteriormente aunque no son citados específicamente por el número. Los estudios previos que usan las endonucleasas acostumbradas basadas en el dedo de zinc, se han utilizado con éxito en las células. Los sistemas de endonucleasas se basan en dos proteínas del dedo de zinc que tienen juntos los dominios catalíticos de la enzima de restricción Fokl en el sitio objeto apropiado para dividir el ADN. Estos pares de proteínas son acertados en la realización de esta función en las células de ranas, embriones de mosca, plantas y humanos (9-12). El sistema de la presente ¡nvención llamado reagrupación estructuras de enzima permitida de secuencia (SEER), constituye y amplía la capacidad de disecar racionalmente las enzimas para construir los sistemas de reagrupación de proteína dependientes de la oligomerización, y la disponibilidad preparada de los motivos del dedo de zinc Cys2-His2 de unión de ácido nucleico para el reconocimiento de las secuencias de ácido nucleico deseadas. La reagrupación de proteína dependiente de la oligomerización es posible cuando una proteína se puede fragmentar en dos mitades que no se reagrupan hasta integrarse a los dominios de oligomerización de proteína convenientes. Los sistemas anteriores han estudiado el sistema de detección basado en la enzima de las interacciones de proteína-proteína. El diseño de los presentes inventores implica elegir los dominios de unión de ADN de secuencia específica apropiados (incluyendo, los dedos de zinc) y una proteína desagrupada conveniente que podría generar una señal óptica fácilmente detectable durante la reagrupación exitosa. Para su proteína desagrupada establecida en los ejemplos 1-4 abajo, se eligieron fragmentos de una variante de GFP, que se han demostrado previamente que son capaces de la reagrupación funcional solamente cuando se integran a los asociados de proteína o péptido de oligomerización (14e,17). También se debe observar que para los dominios de unión de ADN en los ejemplos 1-4, se eligieron dos dedos de zinc que contiene 3 dominios bien 5 caracterizados Zif268 y PBSII, con la afinidad nanomolar baja con las secuencias únicas de 9 pares de bases (15, 16). Además, en los ejemplos 5-6 abajo, los inventores eligieron fragmentos de una variante beta-lactamasa y demuestran que esta proteína es capaz de la reagrupación funcional cuando se integran a los i o asociados de proteína o péptido de oligomerización según lo reportado por un análisis colorimétrico. El sistema SEER es el primer ejemplo de la reagrupación dependiente del ácido nucleico de los fragmentos de proteína, el cual se puede aplicar a las enzimas de la proteína dividida tal 15 como beta-lactamasa, dihidrofolato reductasa, proteína verde fluorescente, beta-galactosidasa, y luciferasa. La evidencia para permitir que este sistema sea proporcionado por los ejemplos de la presente solicitud en donde se ha aplicado el sistema SEER usando beta-lactamasa y la proteína verde fluorescente como 20 enzimas de la proteína dividida. Así, el sistema SEER definido en la presente invención utiliza los sistemas de ensayo de complementación de proteína que incluyen, pero no se limita a, beta-lactamasa, dihidrofolato reductasa, proteína verde fluorescente, beta-galactosidasa, y luciferasa (5-7, 14e). 25 Con respecto a la proteína verde fluorescente, además de la proteína verde fluorescente ejemplificada, la presente invención comprende todas las variantes de la proteina verde fluorescente incluidas Además, la presente invención también comprende las proteínas fluorescentes estructural y funcionalmente similares a la proteína verde fluorescente (es decir, las variantes y/o homólogos de GFP), incluyendo las proteínas fluorescentes de arrecife de coral, variantes de GFP tal como proteínas verde, cían, amarillo, rojo fluorescentes Con respecto a las variantes de GFP y la amplitud de otras proteínas que ayudan a la complementación de proteína, los métodos de la presente invención se pueden extender para crear cualquier numero de distintos sistemas SEER que son compatibles, cada uno los cuales se adapta a una secuencia distinta Como tal, es posible detectar simultáneamente la presencia o ausencia de las secuencias múltiples dentro de una sola muestra que aumenta así la sensibilidad, exactitud, y confiabilidad del análisis Por ejemplo, es posible utilizar las cuatro variantes de GFP ya mencionadas para detectar simultáneamente 4 o más secuencias específicas de ADN en una sola muestra Con este fin, cualquier combinación y número de secuencias específicas se pueden probar simultáneamente Se hace mención específica de 2, 3, 4, 5, 6, 7, 8, 9, y 10 secuencias distintas, cada una probada sondada por un par de SEER designados específicamente Para que la enzima de la proteína dividida constituya el sistema SEER para reagruparse durante la unión a la secuencia de nucleótidos similar definida por el dominio de unión de ADN de secuencia específica contenido en la proteína de cada mitad a la enzima de la proteína dividida, es necesario que las secuencias similares se localicen en proximidad. La proximidad de estas secuencias similares se debe determinar en base a la colocación y número del dominio de unión de ADN de secuencia específica, así como en base a la orientación de la enzima de la proteína dividida dentro de cada constructo. Por ejemplo, en donde la primera proteína contiene por lo menos un dominio de unión de ADN de secuencia específica y en donde la región terminal N de la enzima de la proteína dividida y la segunda proteína contienen por lo menos un dominio de unión de ADN de secuencia específica y la región terminal C de la enzima de la proteína dividida, entonces la reagrupación ocurrirá solamente si la secuencia de nucleótido en el ADN que se probara es tal que la orientación durante la unión de la primera y segunda proteína es tal que los dominios de oligomerización se colocan en proximidad entre sí. En la presente invención, la enzimas que reporta la proteína dividida funcional se puede reagrupar en cualquier orientación (es decir, donde el sitio para la primera proteína es 5' ó 3' al sitio para la segunda proteína) dependiendo de la secuencia que se identificará. Además, para adaptar los efectos esféricos potenciales, se proporciona que el sitio objeto para la primera proteína se puede separar del sitio objeto para la segunda proteína mediante un separador. Aunque la longitud del separador es simplemente cuestión de ia elección del diseño, preferiblemente las longitudes oscilan de cero a veinticinco nucleótidos, preferiblemente cero, diez, quince, y veinte nucleótidos. Por supuesto, la presente invención también comprende y describe todos los números enteros y sub-intervalos entre cero y veinte cinco nucleótidos. Durante la reagrupación la enzima de la proteína dividida de vuelve un reportero funcional que emite una señal fluorescente (por ejemplo, GFP) o que es capaz de realizar la catálisis (por ejemplo, beta-lactamasa). GFP beta es una proteína fluorescente conocida que tiene las siguientes propiedades biofisicoquímicas - absorción máxima a 395 nm con un pico de absorbencia más pequeño a 470 nm, picos del espectro de emisión de fluorescencia a 509 nm con un margen a 540 nm. En el caso de beta-lactamasa, la enzima funcional hidroliza la nitrocefina de sustrato. Por lo tanto, durante la reagrupación, las propiedades anteriores se pueden monitorear de manera colorimétrico para la correlación positiva a la presencia de la secuencia de nucleótido deseada dentro de una muestra que comprende un polinucleótido. Además de la hidrólisis de nitrocefina, muchos otros sustratos están disponibles para monitorear la beta-lactamasa reconstituida. Por ejemplo, CCF2 y CCF4 son sustratos fluorescentes comercialmente disponibles.
CC2 es otro sustrato fluorescente que se debe mencionar Además de ser sustratos poderosos m vitro, CC2, CCF2, y CCF4 también se pueden utilizar en análisis celulares C-mel es un sustrato que se vuelve toxico a las células eucapoticas durante la hidrólisis y, como tal, este sustrato se podría utilizar para hacer SEER realice la eliminación de la célula dependiente de la secuencia (eliminando solamente las células que contienen por ejemplo un oncogén mutante o un virus particular) El uso de C-mel u otros sustratos citotóxicos de beta-lactamasa, permite que el sistema SEER sea utilizado en los métodos terapéuticos, que también son comprendidos por la presente solicitud Otra aplicación del sistema SEER está en los análisis de selección de las proteínas de unión modificadas, reporteros divididos modificados, etc tomando ventaja de los sustratos que son tóxicos a las células procarióticas que se vuelven inactivos por hidrólisis Estos sustratos de beta-lactamasa que son tóxicos a las células procarióticas que se vuelven inactivos por hidrólisis incluyen penicilina, ampicihna, y carbenicilina Para demostrar la posibilidad de la presente invención, se proporcionan la siguiente breve descripción de los datos ejemplares para la presente invención Los constructos de proteína fueron diseñados tales que la terminal C del fragmento de GFP (1-157) se fusionó a la terminal N de Z?f268 por medio de un enlace de 15 residuos y la terminal N del fragmento de GFP (158-236) se fusionó a la terminal C de PBSII a través de un enlace de 15 residuos Los constructos de proteína fueron incorporados juntos o por separado en el vector PetDuet y se verificaron por medio de la secuenciación de ADN (material suplementario) Los perfiles de expresión de proteína revelaron que NGFP-ZnFingerA fue expresado en las fracciones insoluoles, mientras que CGFP-ZnFingerB más pequeño fue expresado en las fracciones solubles e insolubles como se ha observado previamente para los péptidos en espiral integrados a los fragmentos de GFP similares (14e) Notablemente, ninguna fluorescencia detectable fue observada en las células que expresan cada proteína solas o juntas, durante un periodo de 1 semana, indicando la carencia de cualquier reagrupación no específica detectable en presencia de E coli nativa Las proteínas NGFP-ZnFingerA y CGFP-ZnFingerB se purificaron por separado bajo condiciones de desnaturalización utilizando la cromatografía de afinidad y se caracterizaron por la electroforesis en gel de SDS y espectrometría de masa (infra) Como una prueba del concepto para SEER, los presentes inventores diseñaron un ohgonucleótido con filamentos dobles que contiene dos sitios de reconocimiento de 9 pares de bases de Z?f268 y PBSII separados por un separador de 10 nucleótido, Z?f268-10-PBSII (15) El separador 10 nucleótidos fue diseñado para permitir que ambas mitades de GFP se yuxtapongan en la misma cara del ADN objeto pero se evita el aglomeramiento estérico Las mezclas equimolares (15 µM) de las dos proteínas purificadas de volvieron a duplicar en 10 mM Tris. HCl, 100 mM NaCI, 1 mM DTT en, y 100 µM ZnCI2 a pH 7.5 (amortiguador A) en presencia o ausencia del oligonucleótido objeto (4 µM). Bajo éstas condiciones no optimizadas la concentración de ADN fue 4 veces más baja que la de las mitades de la proteína, tal que las mitades GFP etiquetadas con dedo de zinc no localizarían a los diferentes filamentos de ADN. Los espectros de fluorescencia fueron adquiridos 48 horas después del replegamiento por excitación a 468 nm. La emisión de fluorescencia debido a la formación del cromóforo de GFP, fue observada solamente para las muestras que contienen ambas mitades de las fusiones de GFP-dedo de zinc en presencia del oligonucleótido objeto (figura 2a), así nuestro método SEER es soportado firmemente. Para probar adicionalmente la especificidad de secuencia de la reagrupación y la catálisis del cromóforo subsecuente, se diseñaron varios experimentos de control. Las secuencias de ADN para determinar la especificidad de la reagrupación consistieron de dos sitios de la mitad, Zif268 solo, PBSII solo, y ADN de esperma de arenque no específico. Las mezclas equimolares de las dos proteínas, NGFP-ZnFingerA y CGFP-ZnFingerB, se dejaron plegarse nuevamente en presencia de las secuencias de ADN de control y objeto. No se observó ninguna fluorescencia en presencia de cualquiera de los controles (figura 2b), confirmando fuertemente que la reagrupación de las dos mitades de GFP requiere la presencia ambos sitios objeto del dedo de zinc en un solo cebador de ADN de filamentos dobles. Un experimento final de control implicó la concentración de ADN objeto, con la hipótesis las relaciones molares altas de las ADN objeto:proteínas no permitirían la reagrupación de GFP puesto que las dos mitades de GFP localizarían estadísticamente a diferentes oligonucleótidos con el aumento de las concentraciones de ADN. Los resultados de este experimento (figura 2c) demostraron claramente que solamente un exceso de 4 veces de ADN objeto de Zif268-10-PBSII (20 µM) inhibe fuertemente la reagrupación de GFP (5 µM). Un primer intento al medir el efecto de la separación de los dos sitios objeto de ADN también reveló que nuestra separación de 10 bp diseñada entre los sitios de unión fue sustancialmente mejor que una separación de 3 bp (infra). Aunque lo anterior demuestra claramente la reagrupación cebada de ADN acertada de los dos fragmentos de GFP integrados a los dedos de zinc, Zif268 y PBSII. Además, otras enzimas de la proteína dividida incluyendo beta-lactamasa (ver los ejemplos 5 y 6, 14c) y luciferasa (14f), además amplifica la señal mediante el rendimiento del sustrato. La presente invención describe los constructos únicos que unen al ácido nucleico. SEER proporciona un método para la detección in vivo e in vitro de las secuencias específicas de ADN, así como para las respuestas condicionales a las mutaciones genéticas específicas mediante las proteínas de reagrupación que actúan como toxinas celulares. La detección de la señal del gen reportero reconstituido se puede hacer por los métodos estándares conocidos en la técnica para el diagnóstico y otros métodos de detección tal como los sistemas de detección fluorescente o colorimétrica. El sistema de detección y sensibilidad variara en base a la enzima que se utilizará en el aspecto de complementación de la proteína del sistema SEER. Con este fin, el sistema de detección y las etapas preparatorias y de monitoreo requeridas serían fácilmente evidentes al experto en la técnica. El sistema SEER se puede utilizar fácilmente en un intervalo amplio de configuraciones, que no es posible con los métodos disponibles actualmente. Por ejemplo, se proporciona que la tecnología de la presente solicitud se puede utilizar en las configuraciones donde el equipo voluminoso o instrumentación sensible pueden no ser prácticos. Por ejemplo, SEER es útil para la detección de campo de las secuencias específicas de ácido nucleico que son únicas a un patógeno, por ejemplo para la detección de los patógenos transmitido por los alimentos o agentes bioterroristas. Así, en una modalidad de la presente ¡nvención, el sistema SEER se puede presentar en un kit o forma pre-empaquetada que permitiría la detección rápida del genotipo en el campo donde los sistemas de PCR y FISH no están disponibles. El kit de la presente invención contiene los componentes del sistema SEER (es decir, las enzimas descritas en la presente anteriormente). En el kit de la presente invención la proteína puede estar en una forma seleccionada de congelada, seca (es decir, liofilizada), o acuoso. Además, el kit de la presente invención preferiblemente contiene los reactivo para la extracción de la muestra biológica que se probará, una solución de resuspension (en caso de ser necesario), el amortiguador de reacción/hibridización para conducir el análisis de complementación, y/o un sustrato para probar la presencia de un acontecimiento de unión (por ejemplo, nitrocefina, CCF2, CCF4, CC2, C-mel, penicilina, ampicilina, carbenicilina, etc.). En el kit de la presente invención, el amortiguador de reacción/hibridización puede contener además Zn2+ para estabilizar los dominios del dedo de zinc, cuando están presentes, en las proteínas contenidas en el kit durante el análisis de unión. En una modalidad de la presente invención, se proporcionan los siguientes pares de los pares de proteína de SEER: SEC ID NOS: 14 y 16, SEC ID NOS: 44 y 46, y SEC ID NOS: 44 y 48. En otra modalidad de la presente invención, se proporcionan ¡ndividualmente las proteínas SEER anteriores, así como los polinucleótidos que codifican las mismas. Es decir la presente invención proporciona las secuencias ubicadas en la SEC ID NOS: 14, 16, 44, 46, y 48. Con respecto a las secuencias que codifican las mismas, el intervalo completo de las variantes de secuencia es bien apreciado a partir del código genético universal. Sin embargo, en una modalidad preferida la secuencia que codifica SEC ID NOS: 14, 16, 44, 46, y 48 son, las SEC ID NOS: 13, 15, 43, 45, y 47, respectivamente. La presente invención también comprende los equivalentes optimizados del 5 codón a las anteriores. En aún otra modalidad de la presente invención, las proteínas son, por lo menos 70%, por lo menos 80%, por lo menos 90%, por lo menos 95%, por lo menos 97.5%, o por lo menos 99% homologas y/o idénticas a los polipéptidos definidos i o anteriormente, en donde estas proteínas tienen la capacidad de reconstituir una proteína funcional completamente activa cuando se apare con una proteína que codifica la mitad complementaria de la enzima de la proteína dividida y tiene la capacidad de unirse específicamente a la secuencia de ácido nucleico i5 definida/deseada En el contexto de la presente solicitud, las secuencias de polinucleótidos definidas anteriormente pueden ser "homologas" con la secuencia definida si por lo menos 70%, preferiblemente por lo menos 80%, más preferiblemente por lo menos 90%, muy 20 preferiblemente por lo menos 95% de su composición base y secuencia base corresponde a la secuencia de acuerdo a la invención. Además, el polinucleótido homólogo debe codificar una proteína que cumple las limitaciones establecidas en el párrafo anterior. 25 La homología, similitud de secuencia o identidad de secuencia de las secuencias de nucleótidos o aminoácidos, se puede determinar convencionalmente usando software o programas de computadora conocidos tal como los programas de comparación por pares BestFit o Gap (Wisconsin GCG Package, Genetics Computer Group, 575 Science Drive, Madison, Wisconsin 53711). BestFit utiliza el algoritmo de homología local de Smith y Waterman, Advances in Applied Mathematics 2: 482-489 (1981) (24), para encontrar el mejor segmento de identidad o similitud entre dos secuencias. Gap realiza las alineaciones globales: todas de una secuencia con el resto de la secuencia similar usando el método Needleman y Wunsch, J. Mol. Biol 48:443-453 (1970) (23). Al usar un programa de alineación de secuencia tal como BestFit, paca determinar el grado de homología, similitud o identidad de secuencia, se puede utilizar la configuración preestablecida, o una matriz de conteo apropiada se puede seleccionar para optimizar los conteos de homología, similitud o identidad. Similarmente, al usar un programa tal como BestFit para determinar la homología, similitud o identidad de secuencia entre dos diferentes secuencias de aminoácidos, se pueden utilizar las configuraciones preestablecidas, o una matriz de conteo apropiada, tal como blosum45 o biosumdO, se puede seleccionar para optimizar los conteos de identidad, similitud u homología. Dentro de la presente invención, se puede aislar la secuencia de polinucleótidos anterior, contenida funcionalmente en un vector de expresión para facilitar la expresión de los métodos de detección in vivo y terapéuticos, o integrada en el genoma hospedador para facilitar la expresión para la detección in vivo y métodos terapéuticos. Se pueden aislar las proteínas de la presente invención que constituyen el sistema SEER, o expresar en una célula hospedadora (por ejemplo procariótica o eucariótica). Con respecto a la forma expresada, se proporciona que la proteína se puede recuperar de la célula hospedadora por metodologías convencionales. Además para los métodos de detección in vivo y terapéuticos, las proteínas que constituyen el sistema SEER se pueden expresar directamente y acoplar funcionalmente en la célula hospedadora sin purificación o procesamiento adicional. Además, la forma aislada de las proteínas que constituyen el sistema SEER se puede liberar en una célula para la detección o terapia in vivo. Los métodos de liberación serían fácilmente evidentes al experto en la técnica, pero la liberación por liposoma se menciona por medios de ejemplo El término "aislados" significa separados de su ambiente natural. Debe entenderse que los polinucleótidos y polipéptidos "aislados" de la presente invención pueden además ser sustancialmente puros o puros (es decir, se han purificado los polinucleótidos y polipéptidos). Según lo utilizado en la presente, el término "sustancialmente puros" significa que los polinucleótidos y polipéptidos se han aislado de su ambiente natural a un grado tal que solamente permanecen impurezas menores (por ejemplo, los polinucleótidos y polipéptidos resultantes son por lo menos 70%, preferiblemente por lo menos 80%>, más preferiblemente por lo menos 90%, muy preferiblemente 5 por lo menos 95% puros). Según lo utilizado en la presente, el término "puro" significa que los polinucleótidos y polipéptidos están libres de contaminantes (es decir, son 100% puros). El término "polinucleótido" o "secuencia de ácido nucleico" se refiere en general a los poliribonucleótidos y i o polideoxiribonucleótidos, y puede denotar un ARN o ADN sin modificar o ARN o ADN modificado. Se entiende que el término "polipéptidos" significa que los péptidos o proteínas, que contienen dos o más aminoácidos que se unen vía enlaces péptido. 15 La descripción escrita anterior de la invención proporcionan una manera y proceso de hacerla y usarla tal que cualquier experto en la técnica es capaz de hacer y utilizar la misma, esta posibilidad se proporciona en particular para la metería objeto de las reivindicaciones anexas, que constituyen una parte de la 20 descripción. Según lo utilizado anteriormente, las frases "seleccionado del grupo que consiste de", "elegido de", y similares incluyen mezclas de materiales. Donde un límite o intervalo numérico se indica en la 25 presente, se incluyen los puntos finales. También, todos los valores y sub-intervalos dentro de un límite o intervalo numérico se ¡ncluyen específicamente como si se escribieron explícitamente. La descripción anterior se presenta para permitir que un experto en la técnica haga y utilice la invención, y se proporciona en el contexto de una aplicación particular y sus requisitos. Varias modificaciones a las modalidades preferidas serán fácilmente evidentes a los expertos en la técnica, y los principios genéricos definidos en la presente se pueden aplicar a otras modalidades y aplicaciones sin apartarse del espíritu y alcance de la invención. Así, esta invención no tiene el propósito de limitarse a las modalidades mostradas, sino de estar de acuerdo al alcance más amplio de conformidad con los principios y características descritas en la presente. Habiéndose descrito generalmente esta invención, se puede obtener una noción adicional por referencia a ciertos ejemplos específicos, que se proporcionan en la presente para propósitos de ilustración solamente, y no tienen el propósito de ser limitantes a menos que se especifique lo contrario.
Ejemplos Ejemplo 1: Clonación de las Proteínas NGFP-Zif268 y CGFP-PBSII Materiales y Métodos Generales Todas las enzimas de restricción, polimerasa Taq, ADN hgasa, dNTPS se obtuvieron de New England Biolabs Clonación Inicial Las secuencias de ADN de codificación de NGFP y CGFP fueron obtenidas por la amplificación por PCR a partir de los plásmidos que se han descrito1 previamente usando los siguientes cebadores para los fragmentos GFP de sub-clon en el plasmido de expresión pQE30 NGFP-BamHI: GCTACGGGATCCATGGCTAGCAAAGGAGAA (SEC ID NO 1) NGFP-Pstl: GCACGTCTGCAGACCTTGTTTGTCTGCCAT (SEC ID NO 2) CGFP-Kpnl: CCGCTCGCCACGCGCTCACCCACACGCACACTCGCGCACA CTCCACACACGCTCG (SEC ID NO 3) CGFP-Hindlll: CCGCACCGCTCACACGCCTCTCGCGCACTCCCTCCACGCTC TCGCTCACCACG (SEC ID NO 4) Los fragmentos de NGFP y CGFP se digirieron con BamHI/Pstl y Kpn l/H i nd lll respectivamente, y ligados en los plásmidos de expresión pQE30 (Qiagen) que contienen las regiones de codificación de Z?f268 y PBSII separadas por un enlace flexible de 15 aminoácidos, las secuencias fueron confirmadas por la secuenciación de dideoxioligonucleótidos en la University of Apzona DNA Sequencing Facility Expresión de Proteína de Plásmidos pQE30 Las expresiones de la proteína de prueba de estos dos constructos de plásmido fracasaron en las líneas celulares XL1-Blue (Stratagene), Top10 (Invitrogen), y BL21-Gold (DE3) (Novagen); por consiguiente se elige un sistema más robusto para la expresión de proteína, el cual también permitiría la expresión de ambas proteínas dentro de una sola célula. El sistema promotor T7 (Novagen) contiene los plásmidos designados específicamente para este propósito y los presentes inventores eligieron el vector de expresión de pETDuet-1 (Novagen) en base al trabajo previo que mostró que la expresión de las mismas mitades disecadas de GFP fusionadas a los cierres de leucina produjo rendimientos adecuados usando un sistema de expresión de pET similar (13). Clonación de Proteínas de SEER en pETDuet-1 Los cebadores que se utilizaron para amplificar los genes NGFP-Zif268 y CGFP-PBSII de los plásmidos pQE30 anteriores mediante la amplificación por PCR y mediante la clonación subsecuente de las proteínas de SEER en el plásmido de expresión pETDuet-1 así como los cebadores de secuenciación para ambos MCS de pETDuet-1 son como sigue: NGFP-ZÍÍ268 Bglll: CCGCGGCGCGCGCGGAGATCTGATGGCTAGCAAAGGA (SEC ID NO: 5) NGFP-Zif268 Xhol: CGCGCGCGCGCCGGCTCGAGGTCCTTCTGCCGCAA (SEC ID NO: 6) CGFP-PBSII EcoRI: CCGCGCGGCCGGCGCGAATTCGGAGAAGCCCTAT (SEC ID NO: 7) CGFP-PBSII Notl: GGCGGCG CGTG CGG CCGCTTATCAGTTGTACAGTTC (SEC ID NO: 8) pETDuet-1 MCSI: Fwd-ATGCGTCCGGCGTAGA (SEC ID NO: 9) Rev-GATTATGCGGCCGTGTACAA (SEC ID NO: 10) pETDuet-1 MCSII: Fwd-TTGTACACGGCCGCATAATC (SEC ID NO: 11) Rev-GCTAGTTATTGCTCAGCGG (SEC ID NO: 12) Estos genes entonces fueron ligados sucesivamente en el plásmido de expresión de pETDuet-1 usando Bglll/Xhol y EcoRI/Notl produciendo respectivamente un plásmido que contiene CGFP-PBSII en MCSI que contiene una etiqueta His terminal N y NGFP-Zif268 en MCSII que contiene una etiqueta terminal S, este plásmido fue llamado pETDuet-SEER (ver la figura 3). Las secuencias para CGFP-PBSII y NGFP-Zif268 fueron confirmadas mediante la secuenciación de dideoxioligonucleótidos en la University of Arizona DNA Sequencing Facility. Se determinó que la secuencia del polinucleótido CGFP-PBSII es la mostrada en la SEC ID NO: 13, que codifica la secuencia de aminoácidos de SEC ID NO: 14. En la secuencia de aminoácidos de SEC ID NO: 14, los residuos de aminoácidos 17-100 corresponden a PBSII5, los residuos de aminoácidos 101-115 corresponden al enlace, y los residuos de aminoácidos 116-196 de la SEC ID NO: 14 corresponden a los residuos 158 a 238 de GFP. Se determinó que la secuencia de polinucleótidos NGFP-Zif268 es la mostrada en SEC ID NO: 15, que codifica la secuencia de aminoácido de SEC ID NO: 16. En la secuencia de aminoácidos de SEC ID NO: 16, los residuos de aminoácidos 5-165 de SEC ID NO: 16 corresponden a los residuos 1-157 de GFP, los residuos de aminoácidos 166-180 corresponden al enlace, y los residuos de aminoácidos 181-267 corresponden a Zif268. Ejemplo 2: Expresión y Purificación de NGFP-Zif268 y CGFP-PBSII Materiales y Métodos Generales El amortiguador A es 10 mM Tris-HCl a pH = 7.5, 100 mM NaCI, 1 mM DTT, y 100 µM ZnCI2. Todos los reactivos fueron obtenidos de Sigma a menos que se observe lo contrario. Los medios LB y 2xYT se adquirieron de Becton Dickinson. Expresión Las células BL21-Gold (DE3) (Novagen) se transformaron con pETDuet-SEER usando el protocolo estándar de choque de calor, se colocaron en placas LB-Amp Agar, y se desarrollaron durante la noche a 37°C para obtener colonias sencillas. Las colonias sencillas se recolectaron y utilizaron para inocular los medios 2xYT que contienen Amp y se desarrollaron durante la noche con agitación a 37°C. Este cultivo durante la noche fue utilizado para inocular un litro de cultivo 2xYT-Amp que contiene 100 µM ZnCI2 (EM Science) a un O.D.60o final de 0.05. Las células se agitaron a 37°C hasta que se alcanzó un O.D 600 de 0.5-0.8 en cuyo caso se indujeron con 1 mM IPTG (Research Products International Corporation). Las células fueron inducidas durante tres horas después de lo cual se trituraron a 3000 rcf y congelaron durante la noche. Esto produjo aproximadamente 15 mg de CGFP-PBSII de los cuales 7.5 mg se purificaron por IMAC subsecuente y 26 mg de NGFP-Zif268 de los cuales 6 mg se purificaron por IMAC subsecuente a partir de un litro de cultivo. Purificación por IMAC Las células se suspendieron nuevamente en el amortiguador A y se trataron con lisinas usando los protocolos estándares de tratamiento sónico. NGFP-Zif268 se encontró enteramente en cuerpos de inclusión mientras que una cantidad relativamente pequeña de CGFP-PBSII se encontró en la fracción soluble (con el resto que reside en los cuerpos de inclusión). Por lo tanto ambas proteínas fueron purificadas bajo condiciones de desnaturalización como sigue. Los cuerpos de inclusión obtenidos anteriormente fueron solubilizados en el amortiguador A que contiene 6 M de urea y se incubaron en hielo durante una hora. La solución resultante fue diluida en 4 M de urea con amortiguador A y se clarificó por centrifugación a 18,000 rfc durante 20 minutos. Se hizo pasar este lisado sobre los granulos 5 de agarosa Ni-NTA (Qiagen) y se eluyó con amortiguador A que contiene 4 M de urea y se aumento las concentraciones de imidazol (2, 10, 20, 50, y 500 mM secuencialmente). Se eluyó NGFP-Zif268 en 2 mM de fracciones de imidazol mientras que CGFP-PBSII se eluyó en 50-500 mM de fracciones (una mezcla de i o ambas proteínas fue encontrada en 10-20 mM de fracciones). Las fracciones de CGFP-PBSII, las cuales aún contuvieron cantidades pequeñas de NGFP-Zif268, se purificaron adicionalmente mediante diálisis en el amortiguador A con 4 M de urea y 2 mM de imidazol, y se volvieron a exponer a la misma columna de IMAC. 15 Se eluyó NGFP-ZIF268 en el flujo, 2 mM imidazol, mientras que CGFP-PBSII se eluyó en las fracciones observadas previamente. Ejemplo 3: Espectroscopia de Masa (MALDD) de las Proteínas SEER Las proteínas SEER plegadas nuevamente se analizaron 20 mediante el análisis MALDI-EM. Los espectros de masa MALDI fueron adquiridos en un Bruker Reflex-lll MALDI/TOF, las masas obtenidas estuvieron dentro de 0.1% de masas calculadas y se muestran en la tabla 1 a continuación. 25 Tabla 1 Ejemplo 4: Experimentos de Re-plegamiento Materiales y Métodos Generales Todos los espectros se tomaron en un espectrofluorímetro Photon Technology International (PTI) con longitudes de onda de excitación y emisión de 468 nm y 505 nm respectivamente. Las anchuras divididas fueron establecidas a 5 nm para excitación y 10 nm para emisión. Todos los experimentos de re-plegamiento fueron conducidos usando 3.5K MWCO Slide-A-Lyzer Dialysis Cassettes (Pierce). Se obtuvieron todos los constructos de ADN usados en el re-plegamiento, se purificaron por CLAR a partir de IDT y aparecen a continuación: ZÍf268-3-PBSII: GCGTAGCGTGGGCGTAAGTGTGGAAACACCG (SEC ID NO: 17) Zif268-10-PBSII: GCGTAGCGTGGGCGTAGG ACG ATAGTGTGGAAAC ACCG (SEC ID NO: 18) Zif268: GCGTAGCGTGGGCGTAGG ACG ATACCTATGTGCC ACCG (SEC ID NO: 19) PBSII: GCGTACCTATGTG CTAG GACGATAGTGTGGAAAC ACCG (SEC ID NO: 20) En los constructos de ADN anteriores que se utilizaron en los experimentos de re-plegamiento, los nucleótidos 6-14 de las SEC ID NOS: 17-19 corresponde al sitio de unión de Zif268 ADN, los nucleótidos 25-33 de la SEC ID NO: 19 y los nucleótidos 6-14 de la SEC ID NO: 20 corresponden al sitio de unión de ADN señuelo, y los nucleótidos 18-26 de la SEC ID NO: 17 y los nucleótidos 25-33 de las SEC ID NOS: 18-20 corresponden al sitio de unión de PBSII ADN. Los números entre los nombres del dedo de zinc indican que la distancia entre los sitios de unión en los pares de bases. Los oligos se anelaron en amortiguador 1x BamHl (NEB) usando el siguiente procedimiento: calentamiento a 95°C durante 7 minutos, enfriamiento a 56°C a una proporción de 1°C/min, equilibrio a 56°C durante 5 minutos, y finalmente enfriamiento a 25°C a una proporción de 1°C/min usando un ciclador térmico Techne Genius. Todos los experimentos de re-plegamiento se condujeron a 4°C. Los coeficientes de extinción teóricos para NGFP-Zif268 y CGFP-PBSII a 280 nm son 17210 y 7680 M"1 cm"1.
Experimentos de Re-plegamiento Inicial Los experimentos de re-plegamiento inicial fueron conducidos usando las proteínas de SEER en amortiguador A que contiene 4 M de urea obtenido por IMAC a partir del lavado con 10 mM de imidazol. La concentración de cada mitad en este lavado fue determinada a 15 µM por la absorbencia UV a 280 nm. Las muestras se re-plegaron como sigue, se agregó 4 µM de Zif268-10-PBSII ADN a 1 ml de proteínas de SEER (15 µM cada una) y se dializaron en el amortiguador A de una manera pr etapas (el amortiguador A contiene 2 M de urea, 1 M de urea, 0.5 M de urea, y dos veces en el amortiguador sin urea) durante un periodo de dos días. Un control negativo también fue realizado, en donde no se agregó ningún ADN a las proteínas de SEER. El precipitado fue observado en la muestra de control negativa pero no en la muestra que contiene Zif268-10-PBSII ADN, lo cual indica que las proteínas fueron solubles solamente en presencia de ADN (esto fue confirmado por las observaciones posteriores). Los espectros fluorescentes de excitación y emisión de de estas muestras fueron tomados dos días después del re-plegamíento. Reagrupación de GFP como una Función de las Concentraciones de ADN Las concentraciones de cada proteína de SEER fueron mantenidas constantes a 5 µM mientras que la concentración de Zif268-10-PBSII ADN varió entre 5, 10, y 20 µM en 250 µl total de amortiguador A que contiene 4 M de urea. Las muestras se re-plegaron antes en amortiguador A durante dos días y los espectros de emisión de cada muestra fueron tomados dos días después del re-plegamiento. Especificidad de los Procesos de Reagrupación de GFP Las muestras que contienen 5 µM de cada proteína de SEER y 2.5 µM de Zif268-1 O-PBSI 1 , 2.5 µM de ZM268, 2.5 µM de PBSII, y 15.4 µg de ADN Herring Sperm (Invitrogen), se prepararon en 250 µl de amortiguador A total que contiene 4 M de urea. Estas muestras junto con un control negativo (ningún ADN) fueron re-plegadas según lo descrito anteriormente durante dos días.
Los espectros de emisión de fluorescencia de cada muestra fueron tomados dos días después del re-plegamiento. Efecto de la Separación Entre los Sitios de unión del Dedo de Zinc Las muestras separadas que contienen 5 µM de cada proteína de SEER y 2.5 µM o Zif268-3-PBSII y Zif268-10-PBSI I en 250 µl de amortiguador A que contienen 4 M de urea, fueron re-plegadas según lo indicado anteriormente durante dos días. Los espectros de emisión de fluorescencia de cada muestra que contiene ADN con diferente separación entre los sitios de unión, fueron tomados y los resultados se muestran en la figura 4. Ejemplo 5: Clonación, Expresión, y Purificación de Proteínas Basadas en ß-lactamasa Clonación, Expresión, y Purificación de las Proteínas E.coli TEM-1 b-lactamasa ADN se obtuvo por PCR usando el vector de expresión bacteriana pMAL-c2X (New England Biolabs) como patrón. LacA (aa26-aal96) y LacB (aal98-aa290) se clonaron en vectores separados pMAL-c2X usando los procedimientos estándares de clonación (vide infra). LacA contuvo una mutación de M182T para mejorar la estabilidad de la proteína (14c). Las proteínas ZF fueron construidas por PCR usando cebadores traslapados. Zif268 se clonó de terminal C a LacA, mientras que PBSII y PEÍA se clonaron de terminal N a LacB. Los dominios de ZF y Lac fueron separados por un enlace 15-aa, (GGGGS)3 (SEC ID NO: 25). La proteína se expresó en células BL-21 Star (Invitrogen). 100 µM de ZnCI2 fueron agregados a 100 ml de medio de crecimiento LB. A OD60o = 0.6-0.8, la expresión de la proteína fue inducida con 1 mM de isopropil ß-D-tiogalactosida (IPTG) durante 5 horas a 37°C. las células fueron granuladas y suspendidas nuevamente en ZBA (100 nM base Tris, 90 mM KCl, 1 mM MgCI2, 100 µM ZnCI2, pH 7.5)/5 mM DTT. Las proteínas etiquetadas con MBP fueron purificadas sobre columnas de amilosa y eluidas en ZBA/5 mM DTT/10 mM de maltosa, siguiendo la metodología del Protein Fusión and Purification System (New England Biolabs). La porción LacA de ß-lactamasa fue construida por PCR usando 5'-G AGG AGG AGGG ATCCC ACCC AGAAACGCTGGTG-3' (SEC ID NO: 21) como el cebado delantero y 5'-CTCCTCCTGCAGGCCAGTTAATAGTTTGCGCAACGTTGTTGCCAT TGCTACAGGAGTCG-3': (SEC ID NO: 21) como el cebador trasero, usando pQE-30 (Qiagen) como el patrón. El cebador trasero contiene una mutación que dio una conversión de M182T para estabilizar adicionalmente el pliegue del péptido. El producto de PCR fue purificado sobre la columna de purificación de PCR QIAquick (Qiagen). El producto purificado y un plásmido pMAL-c2x que contiene ZnFn Zif268 con un enlace terminal N 15aa, fue digerido con Pstl y BamHl durante 2 horas a 37°C usando el amortiguador 2 NEB (New England Biolabs). Los productos digeridos fueron visualizados en 1% de gel de agarosa TAE a 100 V durante 45 minutos. Las bandas apropiadas fueron cortadas del gel y el ADN fue extraído usando las columnas Montage (Millipore). El vector digerido y purificado y el inserto fueron ligados durante la noche a temperatura ambiente con ligasa T4 (Promega) en 10 ul de volumen de reacción, y 2 ul de producto de ligadura se transformó en células Top10 (invitrogen).
La porción LacB de ß-lactamasa fue generada por PCR usando 5'-GAGGAGGAGACC GGTGGGGGTGGCGGTTCAGGCGGTGGGGGTTCTGGTGGGGGTG GTACCCTACTTACTCTAGCTTCCCGGC-3' (SEC ID NO: 23) como el cebador delantero y 5'- CTCCTCCTCAAGCTTCCAATGCTTAATCAGTGAGGC-3' (SEC ID NO: 24) como el cebador trasero. El cebador delantero contiene una secuencia que codifica el enlace terminal N 15aa (GGGGS)3 (SEC ID NO: 25) de LacB. Los procedimientos restantes fueron similares a la construcción de LacA-Zif268 excepto por que LacB fue clonado en la terminal C de los vectores pMAL-c2x que tienen PBSII o PEÍA ZnFn usando los sitios de Agel y Hindlll. La configuración y orientación del sistema SEER se muestra en la figura 5. Fue determinado que la secuencia de polinucleótidos Zif268-LacA es la mostrada en la SEC ID NO: 43, la cual codifica la secuencia de aminoácidos de SEC ID NO: 44. En la secuencia de aminoácidos de SEC ID NO: 44, los residuos de aminoácidos 3-173 corresponden a los residuos 26-196 de ß-lactamasa donde el residuo Met-182 se ha remplazad por un Thr (con respecto a la numeración de residuo en ß-lactamasa, ver por favor la discusión posterior después de PE1A-LacB), los residuos de aminoácidos 174-188 corresponden al enlace, y los residuos 189-286 corresponden a ZnFn Zif268. En la región Zif268 de Zif268-LacA, los residuos 207-213 de SEC ID NO: 44 corresponden a un dedo de zinc con un sitio de reconocimiento de GCG, los residuos 235-241 de la SEC ID NO: 44 corresponden un dedo de zinc con un sitio de reconocimiento de TGG, y los residuos 263-269 de la SEC ID NO: 44 corresponden a un dedo de zinc con un sitio de reconocimiento de GCG. Se determinó que la secuencia de polinucleótido PBS2-LacB es la mostrada en la SEC ID NO: 45, que codifica la secuencia de aminoácidos de SEC ID NO: 46. En la secuencia de aminoácidos de SEC ID NO: 46, los residuos de aminoácidos 5-88 corresponden a ZnFn PBS2, los residuos de aminoácidos 89-103 corresponden al enlace, y los residuos 104-194 corresponden a los residuos 198-290 de ß-lactamasa (con respecto a la numeración de residuo en ß-lactamasa, ver por favor la discusión posterior después de PE1A-LacB). En la región PBS2 de PBS2-LacB, los residuos 19-25 de SEC ID NO: 46 corresponden a un dedo de zinc con un sitio de reconocimiento de AAA, los residuos 47-53 de SEC ID NO: 46 corresponden a un dedo de zinc con un sitio de reconocimiento de TGG, y los residuos 75-81 de SEC ID NO: 46 corresponden a un dedo de zinc con un sitio de reconocimiento de de GTG. Se determinó que la secuencia de polinucleótido PEl A-LacB es la mostrada en SEC ID NO: 47, que codifica la secuencia de aminoácidos de SEC ID NO: 48. En la secuencia de aminoácidos de SEC ID NO: 48, los residuos de aminoácidos 5-88 corresponden a ZnFn PEÍA, los residuos de aminoácidos 89-103 corresponden al enlace, y los residuos 104-194 corresponden a los residuos 198-290 de ß-lactamasa (con respecto a la numeración de residuo en ß-lactamasa, ver por favor la discusión posterior). En la región de PE1A de PEl A-LacB, los residuos 19-25 de SEC ID NO: 48 corresponden a un dedo de zinc con un sitio de reconocimiento de AAC, los residuos 47-53 de SEC ID NO: 48 corresponden un dedo de zinc con un sitio de reconocimiento de AAT, y los residuos 75-81 de SEC ID NO: 48 corresponden a un dedo de zinc con un sitio de reconocimiento de ATA. Se observa que los números de residuo de aminoácidos indicados en la descripción anterior no concuerdan con el número de residuos de aminoácidos en la secuencia indicada para los dominios ß-lactamasa en las secuencias respectivas en el listado de la secuencia. Los problemas se ubican con la publicación original que describe PCA de ß-lactamasa (Galarneau y col., 2002 Nat. Biotech. 20:619 (ref. 14c). Esos autores reivindican obtener gen ß-lactamasa que codifica 290 aa a partir del plásmido pQE32 de Qiagen. La descripción del vector de Qiagen, sin embargo, muestra este gen para codificar solamente 286 aa. El codón 287 es un codón de detención. Parece que Galarneau y col. (14c) agregaron de alguna manera 2 aa a la terminal N de ß-lactamasa de Qiagen, y 2 aa a la terminal C. Por lo tanto, la numeración abajo se da para clarificar la confusión con respecto a la secuencia de ß-lactamasa: De acuerdo a los datos de Qiagen, la numeración debe ser 24-194 (171 aa) para el fragmento terminal N, y 196-286 (91 aa) para el fragmento terminal C. De acuerdo a Galarneau y col., la numeración es 26-196 (171 aa) para el fragmento terminal N, y 198-290 (93 aa) para el fragmento terminal C. Aunque el fragmento terminal C de la presente invención tiene 91 aa, se describe que 198-290 es de acuerdo a Galarneau y col. (14c). Diseño de Proteína Las proteínas SEER-LAC contuvieron dos fragmentos inactivos de ß-lactamasa fusionados a las proteínas del dedo de zinc con la capacidad de reconocer las secuencias específicas de ADN. Los dos fragmentos fueron diseñados para unirse entre sí a los sitios adyacentes en presencia de un sitio objeto de ADN definido por el usuario para generar una señal. Dos proteínas ZF de 3 dedos, unidas de esta manera tendrían la capacidad colectiva de reconocer 18 bp de ADN, un sitio objeto suficientemente grande para ser única en el genoma humano (27). Sin embargo, puesto que los sitios objeto biológicos relevantes no se podrían elegir hasta que el separador óptimo y los parámetros de orientación se establezcan, los experimentos iniciales utilizaron los sitios objeto diseñados que fueron reconocidos por ZF existente bien caracterizado. Zif268 es un ZF de 3 dedos natural que se ha estudiado estructural y bioquímicamente de manera amplia (38, 39). Una la secuencia de 9 bp 5'-GCG TGG GCG-3' (SEC ID NO: 26). PBSII y PEÍA son ZFs de 3 dedos diseñados agrupados a partir de los dominios ZF modificados predefinidos (1.15), y reconocen las secuencias 5'-GTG TGG AAA-3' (SEC ID NO: 27) y 5'-ATA AAT AAC-3' (SEC ID NO: 28), respectivamente. Dos fragmentos inactivos de la proteína ß-lactamasa TEM1 de 290 aminoácidos pueden generare dividiendo la proteína entre los residuos 196 y 198 (34). Para mantener la polaridad correcta de los fragmentos de proteína, Zif268 fue integrado a la terminal C de los residuos de ß-lactamasa 26-196 (LacA-Zif268; que carece de la secuencia de señal secretora terminal N), y PBSII o PEÍA fue integrado a la terminal N de los residuos 198-290 (PBSII-LacB o PEl A-LacB). Los dominios ZF y ß-lactamasa fueron separados por un enlace 15-aa, (GGGGS)3 (SEC ID NO: 25; figura 6). Todas las proteínas fueron expresadas a partir del vector pMAL-c2X, que integra adicionalmente Maltose Binding Protein (MBP) de 392 aminoácidos a la terminal N de los tres fragmentos de proteína. Todos los experimentos fueron realizados con el dominio MBP unido. Ejemplo 6: Análisis de Nitrocefina para las Proteínas del Ejemplo 5 Análisis de Nitrocefina Zif268-0-PBSII objeto de ADN de oligonucleótido de tipo horquilla tiene la secuencia, 5'-GGC TTT CCA CAC CGC CCA CGC GGG TTTT CCC GCG TGG GCG GTG TGG AAA GCC-3' (SEC ID NO: 29), y Zif268-0-PE1 A tiene la secuencia, 5'-GGC GTT ATT TAT CGC CCA CGC GGG TTTT CCC GCG TGG GCG ATA AAT AAC GCC-3' (SEC ID NO: 30), donde 5'-CGC TGG GCG-3' (SEC ID NO: 31), 5'-GTT TGG AAA-3' (SEC ID NO: 32), y 5'-ATA AAT AAC-3' (SEC ID NO: 28) son los sitios objeto para ZFs Zif268, PBSII y PE1A, respectivamente. Todos los oligonucleótidos fueron calentados a 95°C durante 10 minutos en 10 µM de ZBA, después se enfriaron lentamente a temperatura ambiente para formar horquillas con un bucle de cuatro timidinas.
Se ofrece más adelante una descripción más completa de los objetos de ADN usados en este estudio.
En una placa de 96 pozos, se agregó 120 µl de ZBA a los pozos seguido por 20 µl de 10 µM, 200 nM, 2 nM, o ningún objeto de ADN de oligonucleótido de tipo horquilla (1 µM, 20 nM, 200 pM, 0 concentración final, Operon). Se agregaron 20 µl de 5 µM de fragmentos de proteína LacA-Zif268 y PBSII-LacB/PEl A-LacB (0.5 µM concentración final de cada fragmento) a los pozos antes de agregar 20 µl de 1 mM de nitrocefina (0J concentración final, Calbiochem). Todas las etapas fueron realizadas a temperatura ambiente. La absorbencia a 486 nm fue monitoreada durante 20 minutos con un SpectraMax M2 (Molecular Devices). Para asegurar que la contaminación de restos de ß-lactamasa integral expresada por pMAL-C2X no contribuyan a la hidrólisis base, las muestras que contienen fragmentos de SEER individuales fueron incubadas con sustrato. No se observó ninguna hidrólisis detectable en el intervalo de análisis (datos no mostrados).
Diseño de Objeto de ADN de Oligonucleótido de tipo Horquilla Los objetos de ADN de oligonucleótido de tipo horquilla usados en este estudio tuvieron la secuencia general mostrada abajo, donde está X1aX1aX1a es un sub-sitio de tres nucleótidos para el dedo de zinc 1, y X1'áX1áX1a' es su complemento. Una horquilla 4 nt fue formada por cuatro timidinas. Entre los sitios de unión de 9 bp para las dos proteínas del dedo de zinc, estuvo el separador de 0, 6 ó 10 bp, indicado como (N)sepa.ador- La secuencia completa de todos los ADNs objeto de sitio usados en este estudio se muestra en la tabla 2 abajo. Para simplicidad, solamente se muestra el filamento superior (extremo 3' del oligonucleótido de tipo horquilla) T CCC X3a X3a X3a X2a X2a X2a Xla Xla Xla (N ,.d0, X3b X3b X3b X2b X2b X2b Xlb Xlb Xlb GCC-3' T GGG X3a I '<'X l3lal<X l3lal' X l2lal'X I2Ia'X l2lal' X llll'X lllal'X lllal'(N ll.«l- X3 lbll'X l3lbl'X3 lbll< X2 lbll'X2 IbI'IX2 IbI"I Xl nb'uXlbi'lXlb' i CG nG-i5' Tabla 2: Secuencia Completa1 de Objetos de ADN de Oligonucleótidos de Tipo Horquilla Para simplicidad, se muestra solamente el filamento superior (extremo 3' del oligonucleótido de tipo horquilla) s itio objeto Zif268 es el subrayado, mutaciones G->T mostradas en el sitio objeto en superíndíce 3Sitio objeto de PBSII mostrado en negritas con subrayado doble, sitio objeto de PE1A mostrado en itálica.
Actividad Enzimática Dependiente de ADN Los análisis de la actividad de ß-lactamasa fueron conducidos usando la nitrocefina de sustrato colorimétrico, que cambia de amarillo a rojo (486 nm) durante la hidrólisis. En base a estudios similares con ZF-endonucleasas quiméricas, los presentes inventores esperaron que la separación entre los dos sitios de ZF ("separador") en el ADN objeto fuera crucial para la reagrupación eficiente de la enzima. Para examinar esta relación, los análisis de nitrocefina fueron realizados por triplicado con 0.5 µM de cada proteína LacA-Zif268 y PBSII-LacB en presencia de oligonucleótidos de tipo horquilla que contienen los dos sitios objeto en las longitudes del separador de 0, 6, y 10 bp (Zif-0-PBSII, Zif-6-PBSII, y Zif-10-PBSII etiquetados en la figura 7), a concentraciones de 1 µM, 20 nM, 200 pM, y ningún ADN como control. La reagrupación de enzima asistida por ADN fue mostrada con las tres longitudes del separador (figura 7A). Las proporciones de hidrólisis fueron las más altas para el separador de 0 bp, seguido por el de 10 y 6 bp (figura 7B). En el objeto con el separador de 0 bp, las proporciones de hidrólisis fueron proporcionales a la concentración de ADN (25 mU/min a 1 µM ADN, 20 mU/min en 20 nM, 7 mU/min a 200 pM) con un coeficiente de correlación R2 de 0.963 (figura 7C).
Fue observada una proporción de hidrólisis antecedente de alrededor 5 mU/min para el control negativo de LacA-Zif268 apareado con PE1A-LacB en los ADNs objeto anteriores. Una diferencia en la intensidad de la señal entre 1 µM de muestra y antecedente de ADN fue claramente distinguible por el primer punto de tiempo de nuestro análisis (3 minutos), y se volvió más pronunciado durante el transcurso del tiempo. Todas las proporciones de hidrólisis fueron lineales durante el intervalo de análisis de 23 minutos, con coeficientes de correlación mayores de 0.99 (figura 7D). Efectos de las Mutaciones del Sitio Objeto en la Intensidad de Señal de SEER Para determinar la sensibilidad de SEER a las mutaciones, análisis de nitrocefina fueron realizados usando los objetos de oligonucleótidos que tienen diferentes mutaciones en uno o ambos sitios de unión de ZF (figura 8). En 1 µM de concentración de ADN y 0.5 µM de cada proteína, una sola mutación en el sitio objeto de Zif268 redujo la actividad enzimática esencialmente los niveles base. Una sola mutación del par de bases en el sitio objeto de PBSII dio lugar a una reducción del 28% en la proporción de hidrólisis. Los sitios objeto que tienen dos o más mutaciones disminuyeron la señal a los niveles comparables a los base. Dominios de Unión de SEER que son Intercambiables Para demostrar SEER la generalidad de SEER-LAC a los sitios de unión objeto significativamente diferentes, un análisis de .nitrocefina se realizo con dos diferentes secuencias objeto de ADN, una tiene sitios objeto de Zif268 y PBSII sin el separador (Zif-0-PBSIT) y la otra tiene los sitios otra objeto de Zif268 y PEÍA sin el separador (Zif-0-PE1 A). Ambas combinaciones de SEER reagrupadas en presencia de sus secuencias de ADN similares (figura 9). El ADN objeto inadecuado produjo una señal similar a la señal base de ningún ADN objeto. Unión de SEER en Presencia de ADN Genómico Los experimentos anteriores se condujeron con los objetos de ADN purificados. Sin embargo, algunas aplicaciones de esta tecnología pudieron requerir reconocer su objeto en presencia de ADN complejo, tal como un genoma, que pudo contener los sitios alternativos múltiples para las proteínas de SEER individuales.
Para investigar si la presencia de ADN con filamentos dobles complejo interferiría con este análisis, un análisis de nitrocefina fue realizado en presencia o ausencia de ADN de esperma de arenque (HSADN). La concentración de HS-ADN usada fue equimolar en los pares de bases (es decir, ¡gual en masa) a 1 µM ADN objeto de oligonucleótidos. Bajo estas condiciones, no hubo diferencia en la intensidad de señal relativa cuando se incubó 0.5 µM de cada una de las proteínas LacA-Zif268 y PBSII-LacB con 1 µM de ADN objeto de Zif-O-PBSII en presencia o ausencia de HS-ADN (figura 10. barras negras). Como control negativo, las proteínas también fueron incubadas con ADN objeto de Zif-0-PE1 A (figura 10. barras blancas). Aunque la señal relativa generada usando este objeto fue un poco más alta que en el análisis anterior, no hubo esencialmente ningún cambio en la intensidad de la señal en presencia de HS-ADN.
Ejemplo 7: Clonación, Expresión, y Purificación de Proteinas Basadas en MBD2 Materiales y Métodos Generales Todas las enzimas fueron obtenidas a partir de NEB, dNTP's se adquirieron de Fermentas. Un plásmido pUC57 que contiene un gen E. coli optimizado que codifica MBD2 humano (48, 49) (residuos 147-215) fue designado y obtenido posteriormente de GeneScript. Clonación de MBD2: El inserto de MBD2 fue obtenido vía la amplificación por PCR del vector pUC57 usando los siguientes cebadores. Este inserto fue utilizado para remplazar un dedo de zinc, que fue fusionado a CGFP, con MBD2 en un constructo que fue descrito previamente. (50) MBD2-EcoRI: GCGTATGAATTCGGAAAGCGGCAAACGC (SEC ID NO: 49) MBD2-Agel: CGGTTAACCGGTCATTTTGCCGGTACG (SEC ID NO: 50) El inserto de MBD2 fue digerido secuencialmente con EcoRI y Agel. El vector existente de pETDuet CGFP-dedo de zinc también fue digerido secuencialmente y tratado con Antartíc Phosphatase para prevenir una nueva ligadura de la región de codificación del dedo de zinc, que producirá el plásmido original.
El inserto de MBD2 fue ligado al vector digerido doblemente usando una relación molar de 1:10 de vectopinserto. Éste produjo una fusión de CGFP-MBD2, que fue separada por un enlace flexible de 15 aminoácidos, las secuencias fueron confirmadas por la secuenciación de dideoxioligonucleótidos en la University of Arizona Sequencing Facility. Un mapa de este plásmido se muestra abajo (figura 11). Clonación de NGFP-ZH268 Un constructo de NGFP-Zif268 clonado según lo descrito en el ejemplo 1. Análisis de Secuencia Se determino que la secuencia de polinucleótidos CGFP-MBD2 es la mostrada en la SEC ID NO: 51, que codifica la secuencia de aminoácidos de SEC ID NO: 52. En la secuencia de aminoácidos de SEC ID NO: 52, los residuos de aminoácidos 17-85 corresponden al dominio MBD2, los residuos de aminoácidos 88-102 corresponden al enlace, y los residuos de aminoácidos 103-183 de SEC ID NO: 14 corresponden a los residuos 158 a 238 de GFP. Se determinó que la secuencia de polinucleótidos NGFP-Zif268 es la mostrada en la SEC ID NO: 15, que codifica la secuencia de aminoácidos de SEC ID NO: 16. En la secuencia de aminoácidos de SEC ID NO: 16, los residuos de aminoácidos 5-165 de SEC ID NO: 16 corresponden a los residuos 1-157 de GFP, los residuos de aminoácidos 166-180 corresponden al enlace, y los residuos 181-267 de aminoácidos corresponden a Zif268.
Expresión y Purificación de CGFP-MBD2 y NGFP-Zif268 Materiales y Métodos Generales: El amortiguador A es 10 mM Tris-HCl a pH = 7.5, 100 mM NaCI, 1 mM DTT, y 100 µM ZnCI2. Todos los reactivos fueron obtenidos de Research Products International Corporation a menos que se indique lo contrario.
LB-Agar y medio 2xYT fueron adquiridos de Becton Dickinson. Expresión de CGFP-MBD2 Las células electro-competentes BL21-Gold (DE3) (Novagen) fueron transformadas con el plásmido pETDuet CGFP-MBD2 usando los protocolos estándares, se colocaron en placas de LB-Amp Agar, y se desarrollaron durante la noche a 37°C para obtener colonias sencillas. Se recolectaron las colonias sencillas y se utilizaron para inocular el medio 2xYT que contienen Amp (100 µg/ml) y se desarrollaron durante la noche con agitación a 37°C. Esto cultivo durante la noche fue utilizadoa para inocular un litro de cultivo 2xYT-Amp que contiene 100 µM ZnCI2 (EM Science) a un O.D.6oo final de 0.05. Las células fueron agitadas a 37°C hasta que se alcanzo un O.D.60o de 1.32 en cuyo caso se indujeron con 1 mM IPTG. Las células fueron inducidas durante tres horas después de lo cual se granularon a 4000 rcf y se congelaron durante la noche. Esto produjo aproximadamente 10 mg de CGFP-MBD2 de los cuales 5.8 mg se purificaron por IMAC. Purificación de CGFP-MBD2 por IMAC Las células se suspendieron de nuevo en el amortiguador A y se sometieron a lisinas usando los protocolos estándares de tratamiento sónico y se clarificaron durante 30 minutos a 18,000 rcf. CGFP-MBD2 fue encontrado predominante en la fracción soluble. Este lisado pasó sobre granulos de agarosa Ni-NTA (Qiagen) y se eluyeron con amortiguador A que contiene concentraciones aumentadas de imidazol (2, 10, 20, 50, y 500 mM secuencialmente). CGFP-MBD2 se eluyó en 50-500 mM de fracciones de imidazol. Se encontró que las fracciones que contienen CGFP-MBD2 tienen altas concentraciones de ADN (según lo determinado por A260/A28o), por lo tanto CGFP-MBD2 se purificó adicionalmente bajo las condiciones de desnaturalización.
CGFP-MBD2 obtenido anteriormente fue diluido en un volumen equivalente del amortiguador A que contiene 8 M de urea (4 M de urea final). Esta muestra de expuso nuevamente a los granulos de agarosa Ni-NTA y la proteína fue eluida con amortiguador A que contiene 4 M de urea y concentraciones aumentadas de imidazol (2, 10, 20, 50, y 500 mM secuencialmente). Las fracciones que contienen CGFP-MBD2 fueron agrupadas, concentradas, y dializadas en el amortiguador A que contiene 4 M de urea. Las concentraciones fueron obtenidas usando las medidas de absorbencia de proteína a 280 nm (e = 14440 M"1 crrf1). Expresión y Purificación de NGFP-ZH268 NGFP-Zif268 se expresó y purificó según descrito previamente3. Las concentraciones fueron obtenidas usando mediciones de absorbencia de proteína a 280 nm (e = 17210 M"1 cm'1).
Ejemplo 8: Caracterización de proteínas SEER SDS-PAGE Las cantidades equivalentes de NGFP-Zif268 (32.7 kD) y CGFP-MBD2 (kD 19.6) fueron cargadas en 15% de gel de SDS-PAGE (figura 12). MALDI: Las muestras de las proteínas mCpG-SEER re-plegadas anteriores se enviaron para el análisis de MALDI-MS. Los espectros de masa de MALDI fueron adquiridos en un Bruker Reflex-lll MALDI/TOF, las masas obtenidas se muestran a continuación. El NGFP-Zif268 MH+ calculado es 32686; encontrado: 32648 El CGFP-MBD2 MH+ calculado es 19590; encontrado: 19572 Ejemplo 9: Experimentos de Re-plegamiento Materiales y Métodos Generales Los espectros fueron adquiridos en un espectrofluorímetro Photon Technology International con longitudes de onda de excitación y emisión a 468 nm y 505 nm, respectivamente. Las anchuras de división fueron establecidas a 5 nm para la excitación y 10 nm para la emisión. Todos los experimentos de re-plegamiento fueron conducidos usando los 3.5kD MWCO Slíde-A-Lyzer Dialysis Cassettes (Pierce) a menos que se indique lo contrario. Todos los constructos de ADN usadas en el re-plegamiento se muestran en la figura S5 y la CLAR obtenida se purificó a partir IDT. Los oligos se anelaron en amortiguador 1x BamHl (NEB) usando el siguiente procedimiento: calentamiento a 95°C durante 7 minutos, enfriamiento a 56°C a una proporción de 1°C/min, equilibrio a 56°C durante 5 minutos, y finalmente enfriamiento a 25°C a una proporcionó de 1°C/min usando un cicladro térmico Techne Genius. Todos los experimentos de re-plegamiento fueron conducidos a 4°C en cámaras. Experimentos de Re-plegamiento Inicial Las muestras se re-plegaron como sigue, se agregaron 2.5 µM de mCpG-Zif268 ADN a 5 µM de NGFP-Zif268 y 20 µM CGFP-MBD2 en el amortiguador A que contiene 4 M de urea en un volumen total de 250 µl. Esta muestra fue dializada en el amortiguador A de una manera por etapas (amortiguador A que contiene 2 M urea, 1 M de urea, 0.5 M de urea, y dos veces en amortiguador A sin urea) durante un periodo de dos días. También fue realizado un control negativo en donde ningún ADN se agregó a las proteínas mCpG-SEER. Los espectros de excitación y emisión de fluorescencia de estas muestras fueron tomados dos días después del re-plegamiento. Especificidad de mCpG-SEER Las muestras individuales que contienen 5 µM de NGFP-Zif268 y 20 µM de CGFP-MBD2 más 2.5 µM de cada secuencia de ADN de control separadas (abajo) junto con una muestra que contiene una cantidad equivalente (11.9 µg) de Herring Sperm DNA (Invitrogen) y un control negativo sin ADN, se prepararon a un volumen final de 250 µl en el amortiguador A que contiene 4 M de urea. Las muestras fueron re-plegadas como antes en el amortiguador A durante dos días y los espectros de emisión de cada muestra fueron tomados dos días después del re-plegamiento. La fluorescencia base del amortiguador A y el control negativo (ningún ADN) a 505 nm, fue restada secuencialmente de todas las lecturas. La fluorescencia a 505 nm para cada muestra fue hecha en relación a la muestra de mCpG-Zif268. Este experimento fue repetido y se promediaron los valores de fluorescencia relativos. Especificidad de Sustratos mCpG-Zif268: 5'-GCGTAmCGTAGGACGATACGCCCACGCCACCG (SEC ID NO: 51) 3'-CGCATGCmATCCTGCTATGCGGGTGCGGTGGC CpG-ZIF268: 5'-GCGTACGTAGGACGATACGCCCACGCCACCG (SEC ID NO: 52) 3'-CGCATGCATCCTGCTATGCGGGTGCGGTGGC Solamente mCpG: 5'-GCGTAmCGTAGGACGATAGCACATAGGCACCG (SEC ID NO: 53) 3'-CGCATGCmATCCTGCTATCGTG27irCCGTGGC mCpG-Z¡f268 G a T: 5'-GCGTAmCGTAGGACGATACGCACACGCCACCG (SEC ID NO: 54) 3'-CGCATGCmATCCTGCTATGCGTGTGCGGTGGC En los constructos de ADN anteriores usados en los experimentos de re-plegamiento, el texto en negritas indica el sitio MBD2, el texto subrayado indica el sitio Zif268, y el texto en itálica indica los sitios de mutación. Efecto de la Separación del Sitio Objeto de ADN en mCpG-SEER Las muestras individuales que contienen 5 µM de NGFP-Zif268 y 20 µM de CGFP-MBD2 más 2.5 µM de cada secuencia de ADN de control separada con diferentes separaciones entre los sitios objeto (3, 6, 10, y 13 b.p. abajo), se prepararon a un volumen final de 250 µl en amortiguador A que contiene 4 M de urea. Estas muestras junto con un control negativo (ningún ADN) fueron re-plegadas según lo descrito anteriormente durante un periodo de dos días. Los espectros de emisión de cada muestra fueron tomados dos días después del re-plegamíento. Los espectros base se sustrajeron usando la muestra sin ADN y fueron graficados en relación a la muestra que contiene la separación de 10 bp. Este experimento fue repetido 10kD MWCO Slide-A-Lyzer Dialysis Cassettes (Pierce) y se promediaron para obtener las tendencias basadas en los valores de fluorescencia relativos. Sustratos de Separación 3: 5'-GCGTAmCGTAGCGCCCACGCCACCG (SEC ID NO: 55) 3'-CGCATGCmATCGCGGGTGCGGTGGC 6: 5'-GCGTAmCGTAGGACCGCCCACGCCACCG (SEC ID NO: 6) 3'-CGCATGCmATCCTGGCGGGTGCGGTGGC 10: 5'-GCGTAmCGTAGGACGATACGCCCACGCCACCG (SEC ID NO: 57) 3'-CGCATGCmATCCTGCTATGCGGGTGCGGTGGC 13: 5'-GCGTAmCGTAGGACGATAACCCGCCCACGCCACCG (SEC ID NO: 58) 3'-CGCATGCmATCCTGCTATTGGGCGGGTGCGGTGGC En los constructos anteriores de ADN usados en los experimentos de re-plegamiento, el texto en negritas indican el sitio MBD2 y el texto subrayado indica el sitio de Zif268. Ejemplo 10: Efecto de Separación del Sitio Objeto en SEER-GFP Materiales y Métodos Generales Todos los espectros fueron tomados en un espectrofluorímetro Photon Technology con longitudes de onda de excitación y emisión de 468 nm y 505 nm, respectivamente. Las anchuras de división fueron establecidas a 5 nm para excitación y 10 nm para emisión. Todos los experimentos de re-plegamiento fueron conducidos usando 3.5kD MWCO Slide-A-Lyzer Dialysis Cassettes (Pierce). Todos los constructos de ADN usados en el re-plegamiento se muestran en la figura S6 y se obtuvieron las CLAR purificadas a partir de IDT. Los oligos fueron anelados en amortiguador 1x BamHl (NEB) usando el siguiente procedimiento: calentamiento a 95°C durante 7 minutos, enfriamiento a 56°C en una proporción de 1°C/min, equilibrio a 56°C durante 5 minutos, y finalmente enfriamiento a 25°C a una proporción de 1°C/min usando un ciclador térmico Techne Genius. Todos los experimentos de re-plegamiento fueron conducidos a 4°C en cámaras descubiertas. Los experimentos duplicados fueron comparados por el uso de un estándar interno, 5(6)-carboxifluoresceína (FAM), obtenido de Sigma preparado a 20 nM en amortiguador A. Los espectros de emisión de FAM fueron adquiridos por excitación a 490 nm. Los datos de SEER-GFP de los experimentos duplicados fueron normalizados en relación a la emisión de FAM a 512 nm.
Contructos de ADN Usados en los Experimentos de Re-plegamiento para Probar el Efecto de Separación de SEER-GFP 0 (SEC ID NO: 59): GCGTAGCGTGGGCGGTGTGGAAACACCG 3 (SEC ID NO: 60): GCGTAGCGTGGGCGTAAGTGTGGAAACACCG 6 (SEC ID NO: 61): GCGTAGCGTGGGCGTTAGTCGTGTGGAAACACCG 10 (SEC ID NO: 62): GCGTAGCGTGGGCGTAGG ACG ATAGTGTGGAAAC ACCG 13 (SEC ID NO: 63): GCGTAGCGTGGGCGTTAGTCACTAGAGGTGTGGAAACACCG 16 (SEC ID NO: 64): GCGTAGCGTGGGCGTTAGTCACTAGAGGACGTGTGGAAACACCG 20 (SEC ID NO: 65): GCGTAGCGTGGGCGTTAGTCACTAGAGGACGATAGTGTGGAAACACCG En los constructos anteriores, el texto en negritas indica el sitio Zif268 y el texto subrayado indica los sitios de PBSII. Los números indican la distancia entre los sitios de unión en los pares de bases.
Especificidad de SEER-GFP a la Separación del Sitio Objeto Los espectro fueron adquiridos a partir de las muestras que contuvieron 5 µM de NGFP-Zif268, 5 µM CGFP-PBSII, y 2.5 µM de cada ADN objeto. Los espectros fueron tomados cuatro días despegues del re-plegamiento y se normalizaron a la concentración final de ADN después de la diálisis (usando la absorbencia a 260 nm) y entonces a 20 nM de emisión de FAM (estándar interno). Los experimentos de re-plegamiento fueron repetidos, por separado, y los datos se graficaron después (figura 13).
Numerosas modificaciones y variaciones a la presente invención son posibles en la luz de las enseñanzas anteriores. Por lo tanto, se entiende que dentro del alcance de las reivindicaciones anexas, la invención se puede practicar de una manera distinta a la descrita específicamente en la presente. Referencias 1. Segal, D. J. (2002). The use of zinc finger peptides to study the role of specific factor binding sites in the chromatin environment. Methods 26, 76-83. 2. Beerli, R. R., Segal, D. J., Dreier, B., and Barbas in, C. F. (1998). Toward controlling gene expression, at will: specific regulation of the erbB-2/HER-2 promoter by using polydactyl zinc finger proteins constructed from modular building blocks. Proc Nati Acad Sci U S A 95, 14628-14633. 3. Segal, D. J., Dreier, B., Beerli, R. R., and Barbas lll, C. F. (1999). Toward controlling gene expression at will: selection and design of zinc finger domains recognizing each of the 5'-GNN-31 DNA target sequences. Proc Nati Acad Sci U S A 96, 2758-2763. 4. Dreier, B., Beerli, R. R., Segal, D. J., Flippin, J. D., and Barbas ffi, C. F: (2001). Development of zinc finger domains for recognition of the 5'-ANN-3' family of D14A sequences and their use in the construction of artificial transcription factors. J Biol Chem 276, 29466-29478. 5. Remy I, Michnick SW. A cDNA library functional screening strategy based on. fluorescent protein complementation assays to identify novel components of signaling pathways. Methods. abril 2004; 32(4):381-8. 6. Michnick SW, Remy I, Cknpbell-Valois FX, Vallee-Belisle A, Pelletier JN. Detection of protein-protein interactions by protein fragment complementation strategies.
Methods Enzymol. 2000;328:208-30. 7. Pelletier JN, Arndt KM, Pluckthun A, Michnick SW. An in vivo library-versus-library selection of optimized protein-protein interactions. Nat Biotechnol. Julio 1999; 17(7):683-90. 8. Pabo, C. O. y col. (1982) Nature 298, 443-447. 9. Bibikova M, Carroll D, Segal DJ, Trautman JK, Smith J, Kim YG, Chandrasegaran S. Stimulation of homologous recombination through targeted cleavage by chimeric nucleases.
Mol Cell Biol. Enero 2001 ;21 (1 ):289-97. 10. Bibikova M, Beumer K, Trautman JK, Carroll D.
Enhancing gene targeting with designed zinc finger nucleases.
Science. 2 de mayo de 2003;300(5620):764. 11. Lloyd A, Plaisier CL, Carroll D, Drews GN. Targeted mutagenesis using zinc-finger nucleases in Arabidopsis. Proc Nati Acad Sci U S A. 8 de febrero de 2005;102(6):2232-7. 12. Urnov FD, Miller JC, Lee YL, Beausejour CM, Rock JM, Augustus S, Jamieson AC, Porteus MH, Gregory PD, Holmes MC. Highiy efficient endogenous human, gene correction using designed zinc-finger nucleases. Nature. 3 de abril de 2005. 13. Patikoglou, G.; Burley, S. K. Annu. Rev. Biophys.
Biomolec. Struct. 1997, 26, 289-325. 14. a) Johnsson, N.; Varshavsky, A. Proc. Nati. Acad. Sci. U. S. A. 1994, 91, 10340-10344. b) Rossi, F.; Charlton, C. A.; Blau, H. M. Proc. Nati. Acad. Sci. U. S. A. 1997, 94, 8405-8410. c) Galaraeau, A.; Primeau, M.; Trudeau, L. E.; Michnick, S. W.
Nat. Biotechnol. 2002, 20, 619- 622. d) Pelletier, J. N.; Campbell-Valois, F. X.; Michnick, S. W. Proc. Nati. Acad. Sci. U.
S. A. 1998, 95, 12141-12146. e) Ghosh, L; Hamilton, A. D.; Regan, L. J. Am. Chem. Soc. 2000, 122, 5658-5659. f) Hu, C. D.; Kerppola, T. K. Not Biotechnol. 2003, 21, 539-545. g) Paulmurugan, R.; Gambhir, S. S. Anal. Chem. 2003, 75, 1584-1589. h) Sugimoto, K.; Mori, Y.; Makino, K.; Ohkubo, K.; Morii, T. J. Am. Chem. Soc. 2003, 125, 5000-5004. 15. Blancafort, P.; Segal, D. J.; Barbas, C. F., 3rd Mol. Pharmacol. 2004, 66, 1361-1371. 16. Pavletich, N. P.; Pabo, C. O. Science 1991, 252, 809-817. 17. Magliery, T. J.; Wilson, C. G. M.; Pan, W. L.; Mishler, D.; Ghosh, L; Hamilton, A. D.; Regan, L. J. Am. Chem. Soc. 2005, 127, 146-157. 18. a) Paul, N.; Joyce, G. F. Curr. Opin. Chem. Biol. 2004, 8, 634-639. b) Ghosh, L; Chmielewski, J. Curr. Opin. Chem. Biol. 2004, 8, 640-644. c) Calderone, C. T.; Liu, D. R. Curr. Opin. Chem. Biol. 2004, S, 645-653. 19. Venter, J. C, Adams, M. D., Myers, E. W., Li, P. W., Mural, R J , Sutton, G G , Smith, H O , Yandell, M , Evans, C A , Holt, R A , et al (2001) Science 291, 1304-51 20 Yang L & et al (2005) Biochemistry, 44, 7469-7478 21 Montclare J K et al (2003) J Am Chem Soc, 125, 3416 22 Padmanabhan, S y col (1997) Biochemistry 36, 6424-6436 23 Needleman y Wunsch, J Mol Biol 48443-453 (1970) 24 Smith y Waterman, Advances in Applied Mathematics 2 482-489 (1981) 25 Ray, P , Pimenta, H , Paulmurugan, R , Berger, F , Pheips, M E , lyer, M , y Gambhir, S S (2002) Proc Nati Acad Sci USA 99, 3105-10 26 Paulmurugan, R , Umezawa, Y , y Gambhir, S S (2002) Proc Nati Acad Sci USA 99, 15608-13 27 Segal, D J , Beerh, R R , Blancafort, P , Dreier, B , Effertz, K , Huber, A , Koksch, B , Lund, C V , Magnenat, L , Valente, D , y Barbas lll, C F (2003) Biochemistry 42, 2137-2148 28 Segal, D , y Barbas El, C F (2001) Curr Opm Biotech 12, 632-637 29 Liu, Q , Xia, Z , Zhong, X , y Case, C C (2002) J Biol Chem 277, 3850-6 30 Lee, D K , Seol, W , y Kim, J S (2003) Curr Top Med Chem 3, 645-57 31. Klug, A. (2005) FEBS Lett 579, 892-4. 32. Pabo, CO.; Peisach, E.; Grant, R. A. Annu. Rev. Biochem. 2001, 70, 313-340. 33. Huang, G. S. y col. (1989) J. Mol. Biol. 205, 189-200. 34. Jamieson, A. C, Miller, J. C, y Pabo, C. O. (2003) Nat Rev Drug Discov 2, 361-8. 35. Carroll, D. (2004) Methods Mol Biol 262, 195-207. 36. Tan, W., Zhu, K., Segal, D. J., Barbas, C. F., 3rd, y Chow, S. A. (2004) J Virol 78, 1301-13. 37. Stains, C. L, Porter, J. R., Ooi, A. T., Segal, D. J., y Ghosh, I. (2005) JAm Chem Soc 127, 10782-3. 38. Elrod-Erickson, M., Rould, M. A., Nekludova, L., y Pabo, C. O. (1996) Structure 4, 1 Hill 80. 39. Wolfe, S. A., Nekludova, L., y Pabo, C. O. (2000) Annu Rev Biophys Biomol Struct 29, 183-212. 40. Neri, D. y col. (1992) J. Mol. Biol. 223, 743-767. 41. Mondragon, A. y col. (1989) J. Mol. Biol. 205, 179-188. 42. Sevilla-Sierra, P. y col. (1994) J. Mol. Biol. 235, 1003-1020. 43. Zlokarnik, G., Negulescu, P. A., Knapp, T. E., Mere, L., Burres, N., Feng, L., Whitney, M., Roemer, K., y Tsien, R. Y. (1998) Science 279, 84-8. 44. Queenan, A. M., Foleno, B., Gownley, C, Wira, E., y Bush, K. (2004) J Clin Microbiol 42, 269-75. 45. Tan, S., Guschin, D., Davalos, A., Lee, Y. L., Snowden, A W , Jouvenot, Y , Zhang, H S , Howes, K , McNamara, A R , Lai, A , Ullman, C, Reynolds, L , Moore, M , Isalan, M , Berg, L P , Campos, B , Qi, H , Spratt, S K , Case, C C, Pabo, C O , Campisi, J , y Gregory, P D (2003) Proc Nati Acad Sci USA 100, 11997-2002 46 Choo, Y , y Klug, A (1994) Proc Nati Acad ScL U S A 91, 11168-72 47 (a) Hendpch, B , Bird, A Mol Cell Biol 1998, 18, 6538-6547 (b) Hendpch, B , Abbott, C, McQueen, H , Chambers, D , Cross, S , Bird, A Mam Gen 1999, 10, 906-912 48 Hendpch, B y col Genomic structure and chromosomal mapping of the murine and human Mbdl, Mbd2, Mbd3, and Mbd4 genes Mammalian Genome 10, 906-912 (1999) 49 Hendpch, B & Bird, A Identification and charactepzation of a family of mammalian methyl-CpG binding proteins Molecular and Cellular Biology 18, 6538-6547 (1998) 50 Stains, C I , Porter, J R , Ooi, A T , Segal, D J & Ghosh, I DNA sequence-enabled reassembly of the green fluorescent protein Journal of the American Chemical Society 127, 10782-10783 (2005)

Claims (1)

  1. REIVINDICACIONES 1 Un sistema de detección de secuencia de nucleótidos que comprende una primera proteína en donde la proteína comprende por lo menos un dominio de unión de ADN de secuencia específica y un dominio de oligomepzación terminal N de una enzima de la proteína dividida, en donde por lo menos un dominio del dedo de zinc es separado del dominio de oligomepzación de terminal N de la enzima de la proteína dividida por un enlace, y una segunda proteína en donde la proteína comprende por lo menos un dominio de unión de ADN de secuencia específica y el dominio de oligomepzación terminal C de la enzima de la proteína dividida, en donde por lo menos un dominio del dedo de zinc es separado del dominio de oligomepzación terminal C de la enzima de la proteína dividida por un enlace 2 El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde el dominio de unión de ADN de secuencia específica se selecciona del grupo que consiste de una proteína hélice-giro-hélice, una proteína de unión de ADN miniatura, un dominio de unión de metilo-citosina, y un dominio del dedo de zinc 3 El sistema de detección de la secuencia de nucleotidos de la reivindicación 2, en donde por lo menos una de la primera proteína y segunda proteina contiene por lo menos un dominio de unión de metilo-citosina como el dominio de unión ADN de secuencia específica. 4. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde por lo menos una de la primera proteína y segunda proteína contiene por lo menos un dominio del dedo de zinc como el dominio de unión de ADN de secuencia específica. 5. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde cada una de la primera proteína y segunda proteína contiene por lo menos un dominio del dedo de zinc como el dominio de unión de ADN secuencia específica. 6. El sistema de detección de la secuencia de nucleótidos de la reivindicación 5, en donde por lo menos un dominio del dedo de zinc de la primera proteína está contenido dentro de un módulo del dedo de zinc que se deriva de una proteína del dedo de zinc seleccionada del grupo que consiste de Zif268, PBSII y PEÍA. 7. El sistema de detección de la secuencia de nucleótidos de la reivindicación 5, en donde por lo menos un dominio del dedo de zinc de la segunda proteína está contenido dentro de un módulo del dedo de zinc que se deriva de una proteína del dedo de zinc seleccionada del grupo que consiste de Zif268, PBSII y PE1A. 8. El sistema de detección de la secuencia de nucleótidos de la reivindicación 5, en donde por lo menos un dominio del dedo de zinc de la primera proteína se localiza en el dominio del oligomerización de terminal C a terminal N de la enzima de la proteína dividida. 9. El sistema de detección de la secuencia de nucleótidos de la reivindicación 5, en donde por lo menos un dominio del dedo de zinc de la segunda proteína se localiza en el dominio de oligomerización de terminal N a terminal C de la enzima de la proteína dividida. 10. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde la enzima de la proteína dividida se reagrupa para formar una enzima funcional; en donde la primera proteína se une a la secuencia de nucleótidos similar para el dominio de unión de ADN de secuencia específica comprendido en la misma, en donde la segunda proteína se une a la secuencia de nucleótidos similar para el dominio de unión de ADN de secuencia específica comprendido en la misma, y en donde la secuencia de nucleótidos similar para la primera proteína se localiza en 5' en la secuencia de nucleótidos similar para la segunda proteína. 11. El sistema de detección de la secuencia de nucleótidos de la reivindicación 10, en donde la enzima de la proteína dividida se selecciona del grupo que consiste de beta-galactosidasa, beta-lactamasa, dihidrofolato reductasa, proteína verde fluorescente, y luciferasa, y variantes u homólogos de las mismas. 12. El sistema de detección de la secuencia de nucleótidos de la reivindicación 10, en donde la enzima de la proteína dividida es una beta-lactamasa, variantes u homólogos de la misma. 13. El sistema de detección de la secuencia de nucleótidos de la reivindicación 10, en donde la enzima de la proteína dividida es la proteína verde fluorescente, variantes u homólogos de la misma. 14. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde el enlace en la primera proteína oscila de 0 a 30 aminoácidos. 15. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde el enlace en la primera proteína es de 15 aminoácidos. 16. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde el enlace en la segunda proteína oscila de 0 a 30 aminoácidos. 17. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde el enlace en la segunda proteína es de 15 aminoácidos. 18. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde la primera proteína tiene la secuencia que comprende la SEC ID NO: 16 y la segunda proteína tiene la secuencia que comprende la SEC ID NO: 14. 19. El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde la primera proteína tiene la secuencia que comprende la SEC ID NO 46 y la segunda proteina tiene la secuencia que comprende la SEC ID NO 44 20 El sistema de detección de la secuencia de nucleotidos de la reivindicación 1, en donde la primera protema tiene la secuencia que comprende la SEC ID NO 48 y la segunda proteina tiene la secuencia que comprende la SEC ID NO 44 21 El sistema de detección de la secuencia de nucleótidos de la reivindicación 1, en donde la primera protema tiene la secuencia que comprende la SEC ID NO 16 y la segunda proteína tiene la secuencia que comprende la SEC ID NO 52 22 Un polinucleótido aislado que codifica la primera proteína del sistema de detección de la secuencia de nucleotidos de la reivindicación 1 23 El polinucleótido aislado de la reivindicación 22, en donde el pohnucleótido se selecciona del grupo que consiste de SEC ID NO 15, SEC ID NO 45, y SEC ID NO 47 24 Un polinucleótido aislado que codifica la segunda proteína del sistema de detección de la secuencia de nucleótidos de la reivindicación 1 25 El pohnucleótido aislado de la reivindicación 24, en donde el polinucleótido se selecciona del grupo que consiste de SEC ID NO 13, SEC ID NO 43, y SEC ID NO 51 26 Un kit que comprende el sistema de detección de la secuencia de nucleótidos de la reivindicación 1 y un amortiguador de hibridación 27. El kit de la reivindicación 26, en donde la primera proteína y la segunda proteína están en una forma liofilizada. 28. Un método para detectar la presencia de una secuencia específica de nucleótidos en una muestra que comprende un polinucleótido, en donde el método comprende: poner en contacto la muestra con el sistema de detección de la secuencia de nucleótidos de la reivindicación 1 durante una duración y bajo las condiciones convenientes para facilitar la hibridación, en donde el sistema de detección de la secuencia de nucleótidos se ajusta para detectar la secuencia específica de nucleótidos por la ubicación y el número de dominios de unión de ADN de secuencia específica contenidos dentro de la primera proteína y la segunda proteína; monitorear la formación de la actividad asociada a la enzima de la proteína dividida cuando está en un estado reagrupado; y correlacionar una actividad positiva observada del monitoreo a la presencia de la secuencia específica en el polinucleótido. 29. El método de la reivindicación 28, en donde la enzima de la proteína dividida es la proteína verde fluorescente y el monitoreo comprende monitorear la emisión de fluorescencia a 509 nm durante la excitación a 395 nm. 30. El método de la reivindicación 28, en donde la enzima de la proteína dividida es beta-lactamasa y el monitoreo comprende monitorear la hidrólisis de un sustrato seleccionado del grupo que consiste de nitrocefina, CCF2, CCF4, CC2, C-mel, penicilina, ampicilina, y carbenicilina. 31. El método de la reivindicación 28, en donde el método es un método para detectar una anormalidad genética en un sujeto en necesidad del mismo. 32. El método de la reivindicación 28, en donde el método es un método para detectar el polimorfismo de nucleótido sencillo en un sujeto en necesidad del mismo. 33. El método de la reivindicación 28, en donde el método es un método de detectar el acortamiento de telómeros en un sujeto en necesidad del mismo. 34. El método de la reivindicación 33, en donde el sujeto en necesidad del mismo es un sujeto que tiene o está propenso a tener cáncer. 35. El método de la reivindicación 33, en donde el sujeto en necesidad del mismo es un sujeto que tiene o está propenso a tener una enfermedad relacionada a la edad. 36. El método de la reivindicación 28, en donde el método es un método para determinar la edad de células o animales clonados y la secuencia específica de nucleótidos es la secuencia repetida en los telómeros. 37. El método de la reivindicación 28, en donde el método es un método para diagnosticar el cáncer en un sujeto en necesidad del mismo y la secuencia específica de nucleótidos es un marcador único para un tipo específico de cáncer. 38. El método de la reivindicación 28, en donde el método es un método para identificar un agente infeccioso y la muestra se selecciona del grupo que consiste de una muestra de tejido, muestra de sangre, muestra de sueros, exudado nasal, exudado vaginal, y exudado rectal 39 El método de la reivindicación 28, en donde el método es un método para identificar un agente infeccioso y la muestra se selecciona del grupo que consiste de alimento, bebida, y agua 40 El método de la reivindicación 28, en donde el método es un método de igualación de muestra-a-fuente en donde la secuencia específica de nucleótidos representa una secuencia única de nucleótidos obtenida de una muesíra biológica de interés y la muestra se obtiene de un sujeto que se sospecha que tiene la secuencia única de nucleótidos 41 El método de la reivindicación 40, en donde la muestra biológica de interés se selecciona del grupo que consiste de sangre, pelo, piel, esperma, y semen 42 El método de la reivindicación 40, en donde la muestra se selecciona del grupo que consiste de sangre, pelo, piel, esperma, y semen 43 Un método de tratamiento, que elimina una infección viral en un sujeto en necesidad del mismo, que comprende adaptar la especificidad de secuencia de los dominios de unión de ADN de secuencia específica del sistema de detección de la secuencia de nucleótidos de la reivindicación 1 a la infección viral, el sujeto a una secuencia única de ácidos nucleicos del mismo, en donde la enzima de la proteína dividida facilita la hidrólisis de un sustrato que se vuelve tóxico al virus durante la hidrólisis; administrar una cantidad efectiva del sistema de detección de la secuencia de nucleótidos de la reivindicación 1 al sujeto; y administrar una cantidad efectiva del sustrato al sujeto. 44. El método de la reivindicación 43, en donde la enzima de la proteína dividida es beta-lactamasa. 45. El método de la reivindicación 44, en donde el sustrato es C-mel. 46. Un método para tratar el cáncer en un sujeto en necesidad del mismo, que comprende: adaptar la especificidad de secuencia de los dominios de unión de ADN de secuencia específica del sistema de detección de la secuencia de nucleótidos de la reivindicación 1 a un oncogén mutante en el sujeto a una secuencia única de ácido nucleico del mismo, en donde la enzima de la proteína dividida facilita la hidrólisis de un sustrato que se vuelve tóxico al virus durante la hidrólisis; administrar una cantidad efectiva del sistema de detección de la secuencia de nucleótidos de la reivindicación 1 al sujeto; y administrar una cantidad efectiva de sustrato al sujeto. 47. El método de la reivindicación 46, en donde la enzima de la proteína dividida es beta-lactamasa. 48. El método de la reivindicación 47, en donde el sustrato es C-mel. 49. Un método para detectar la presencia de sitios específicos de metilación de ADN dentro de una secuencia específica de un polinucleótido de un sujeto en necesidad del mismo, que comprende: adaptar la especificidad de secuencia de los dominios de unión de ADN de secuencia específica del sistema de detección de la secuencia de nucleótidos de la reivindicación 1 a una secuencia específica de ADN en el sujeto, a una secuencia única de ácido nucleico de la misma, en donde el dominio de unión de ADN de secuencia específica de por lo menos uno primera proteína y segunda proteína es un dominio de unión de metilo; liberar una cantidad efectiva del sistema de detección de la secuencia de nucleótidos de la reivindicación 1 a una muestra obtenida del sujeto; monitorear la formación de la actividad asociada a la enzima de la proteína dividida cuando está en un estado reagrupado; y correlacionar una actividad positiva observada del monitoreo a la presencia de metilación de ADN dentro de la secuencia específica en el polinucleótido. 50. El método de la reivindicación 49, en donde el dominio de unión metilo es un dominio de unión de metilo-citosina. 51. El método de la reivindicación 50, en donde la primera proteína tiene la secuencia que comprende la SEC ID NO: 16 y la segunda proteína tiene la secuencia que comprende la SEC ID NO: 52. 52 El método de la reivindicación 49, en donde la presencia de la metilación de ADN se correlaciona a la predisposición al o a un diagnosis de cáncer. 53. Un método para la detección simultánea de la presencia de las secuencias específicas múltiples de nucleótidos en una muestra que comprende un polinucleótido, en donde el método comprende: poner en contacto la muestra con dos o más sistemas de detección de la secuencia de nucleótidos diferentes de la reivindicación 1 durante una duración y bajo las condiciones convenientes para facilitar la hibridación, en donde los sistemas de detección de la secuencia de nucleótidos son adaptados para detectar las secuencias específicas independientes de nucleótidos por la ubicación y número de dominios de unión de ADN de secuencia específica contenidos dentro la primera proteína y segunda proteína y en donde la enzima de la proteína dividida para cada sistema de detección de la secuencia de nucleótidos es distinta a cualquier otra, monitorear la formación de la actividad asociada a las enzimas de la proteína dividida cuando está en un estado reagrupado; y correlacionar una actividad positiva observada del monitoreo a la presencia de las secuencias específicas en el polinucleótido. 54. El método de la reivindicación 53, en donde por lo menos una de las enzimas de la proteína dividida se selecciona del grupo que consiste de beta-galactosidasa, beta-lactamasa, dihidrofolato reductasa, proteína verde fluorescente, y luciferasa, y variantes u homólogos de las mismas. 55. El método de la reivindicación 53, en donde por lo menos una de las enzimas de la proteína dividida es una beta-lactamasa, variantes u homólogos de las mismas. 56. El método de la reivindicación 53, en donde por lo menos una de las enzimas de la proteína dividida es la proteína verde fluorescente, variantes u homólogos de la misma. 57. El método de la reivindicación 56, en donde por lo menos una de las enzimas de la proteína dividida se selecciona del grupo que consiste de proteína verde fluorescente, proteína cían fluorescente, proteína amarillo fluorescente, proteína rojo fluorescente, y proteína arrecife de coral fluorescente. 58. El método de la reivindicación 53, en donde el contacto es con tres a cinco de los sistemas de detección de la secuencia de nucleótidos.
MX2007013757A 2005-05-05 2006-05-05 Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas. MX2007013757A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67845305P 2005-05-05 2005-05-05
PCT/US2006/017425 WO2006121866A2 (en) 2005-05-05 2006-05-05 Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences

Publications (1)

Publication Number Publication Date
MX2007013757A true MX2007013757A (es) 2008-01-24

Family

ID=37397133

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2007013757A MX2007013757A (es) 2005-05-05 2006-05-05 Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas.

Country Status (5)

Country Link
US (1) US20090068164A1 (es)
EP (1) EP1877583A2 (es)
CA (1) CA2607104A1 (es)
MX (1) MX2007013757A (es)
WO (1) WO2006121866A2 (es)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120196370A1 (en) 2010-12-03 2012-08-02 Fyodor Urnov Methods and compositions for targeted genomic deletion
CA2627410A1 (en) * 2005-10-27 2007-05-03 The Trustees Of Boston University Real time nucleic acid detection in vivo using protein complementation
AU2009260888B2 (en) 2008-05-28 2014-09-11 Sangamo Therapeutics, Inc. Compositions for linking DNA-binding domains and cleavage domains
CA2726768C (en) 2008-06-10 2016-09-06 Sangamo Biosciences, Inc. Methods and compositions for generation of bax- and bak-deficient cell lines
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
WO2011002503A1 (en) 2009-06-30 2011-01-06 Sangamo Biosciences, Inc. Rapid screening of biologically active nucleases and isolation of nuclease-modified cells
EP2727600B1 (en) 2009-07-28 2019-03-27 Sangamo Therapeutics, Inc. Zinc finger fusion proteins for repressing a huntington gene
AU2010282958B2 (en) 2009-08-11 2015-05-21 Sangamo Therapeutics, Inc. Organisms homozygous for targeted modification
PL2566972T3 (pl) 2010-05-03 2020-06-29 Sangamo Therapeutics, Inc. Kompozycje do wiązania modułów z motywem palca cynkowego
EP2580331A4 (en) * 2010-06-14 2013-11-27 Univ Iowa State Res Found Inc NUCLEASE ACTIVITY OF THE TAL EFFECTOR AND FUSION PROTEIN FOKI
WO2012012667A2 (en) 2010-07-21 2012-01-26 Sangamo Biosciences, Inc. Methods and compositions for modification of a hla locus
WO2012047598A1 (en) 2010-09-27 2012-04-12 Sangamo Biosciences, Inc. Methods and compositions for inhibiting viral entry into cells
WO2012051343A1 (en) 2010-10-12 2012-04-19 The Children's Hospital Of Philadelphia Methods and compositions for treating hemophilia b
WO2012094132A1 (en) 2011-01-05 2012-07-12 Sangamo Biosciences, Inc. Methods and compositions for gene correction
AU2012286901B2 (en) 2011-07-25 2016-10-27 Sangamo Therapeutics, Inc. Methods and compositions for alteration of a cystic fibrosis transmembrane conductance regulator (CFTR) gene
CN103917644A (zh) 2011-09-21 2014-07-09 桑格摩生物科学股份有限公司 调控转基因表达的方法和组合物
EP2758537A4 (en) * 2011-09-23 2015-08-12 Univ Iowa State Res Found ARCHITECTURE OF TAL NUCLEASE MONOMER OR ZINC FINGER NUCLEASE FOR DNA MODIFICATION
US9222105B2 (en) 2011-10-27 2015-12-29 Sangamo Biosciences, Inc. Methods and compositions for modification of the HPRT locus
US9688997B2 (en) 2011-12-29 2017-06-27 Iowa State University Research Foundation, Inc. Genetically modified plants with resistance to Xanthomonas and other bacterial plant pathogens
JP6490426B2 (ja) 2012-02-29 2019-03-27 サンガモ セラピューティクス, インコーポレイテッド ハンチントン病を治療するための方法および組成物
AU2013256240B2 (en) 2012-05-02 2018-09-20 Corteva Agriscience Llc Targeted modification of malate dehydrogenase
BR112014027813A2 (pt) 2012-05-07 2017-08-08 Dow Agrosciences Llc métodos e composições para integração de transgenes direcionada mediada por nuclease
AU2013289206B2 (en) 2012-07-11 2018-08-09 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of lysosomal storage diseases
WO2014011901A2 (en) 2012-07-11 2014-01-16 Sangamo Biosciences, Inc. Methods and compositions for delivery of biologics
US10648001B2 (en) 2012-07-11 2020-05-12 Sangamo Therapeutics, Inc. Method of treating mucopolysaccharidosis type I or II
IN2015DN01480A (es) 2012-08-29 2015-07-03 Sangamo Biosciences Inc
WO2014039684A1 (en) 2012-09-07 2014-03-13 Dow Agrosciences Llc Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
ES2824024T3 (es) 2012-10-10 2021-05-11 Sangamo Therapeutics Inc Compuestos modificadores de células T y usos de los mismos
AU2013355327A1 (en) 2012-12-05 2015-06-11 Sangamo Therapeutics, Inc. Methods and compositions for regulation of metabolic disorders
KR102192599B1 (ko) 2013-04-05 2020-12-18 다우 아그로사이언시즈 엘엘씨 식물의 게놈 내의 외인성 서열의 통합을 위한 방법 및 조성물
US20150056629A1 (en) * 2013-04-14 2015-02-26 Katriona Guthrie-Honea Compositions, systems, and methods for detecting a DNA sequence
AU2014262867B2 (en) 2013-05-10 2019-12-05 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
CA2910489A1 (en) 2013-05-15 2014-11-20 Sangamo Biosciences, Inc. Methods and compositions for treatment of a genetic condition
CA2920899C (en) 2013-08-28 2023-02-28 Sangamo Biosciences, Inc. Compositions for linking dna-binding domains and cleavage domains
CA2926094C (en) 2013-10-17 2024-04-02 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
WO2015057976A1 (en) 2013-10-17 2015-04-23 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
CN107223156A (zh) 2013-11-04 2017-09-29 美国陶氏益农公司 最优玉米座位
CN106164085A (zh) 2013-11-04 2016-11-23 美国陶氏益农公司 最优玉米座位
TWI672378B (zh) 2013-11-04 2019-09-21 陶氏農業科學公司 最適大豆基因座(一)
US10369201B2 (en) 2013-11-11 2019-08-06 Sangamo Therapeutics, Inc. Methods and compositions for treating Huntington's disease
PT3068881T (pt) 2013-11-13 2019-05-31 Childrens Medical Center Regulação da expressão de genes mediada por nucleases
JP6303195B2 (ja) * 2013-11-20 2018-04-04 国立研究開発法人産業技術総合研究所 細菌による機能的外来タンパク質の製造方法
EP3757116A1 (en) 2013-12-09 2020-12-30 Sangamo Therapeutics, Inc. Methods and compositions for genome engineering
EP3102673B1 (en) 2014-02-03 2020-04-15 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a beta thalessemia
AU2015218576B2 (en) 2014-02-24 2020-02-27 Sangamo Therapeutics, Inc. Methods and compositions for nuclease-mediated targeted integration
WO2015143046A2 (en) 2014-03-18 2015-09-24 Sangamo Biosciences, Inc. Methods and compositions for regulation of zinc finger protein expression
US9522936B2 (en) 2014-04-24 2016-12-20 Sangamo Biosciences, Inc. Engineered transcription activator like effector (TALE) proteins
BR112016025849A2 (pt) 2014-05-08 2017-10-17 Chdi Foundation Inc métodos e composições para o tratamento da doença de huntington
WO2015188065A1 (en) 2014-06-05 2015-12-10 Sangamo Biosciences, Inc. Methods and compositions for nuclease design
EP4335926A3 (en) 2014-07-14 2024-06-12 Washington State University Nanos knock-out that ablates germline cells
US9816074B2 (en) 2014-07-25 2017-11-14 Sangamo Therapeutics, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
WO2016019144A2 (en) 2014-07-30 2016-02-04 Sangamo Biosciences, Inc. Gene correction of scid-related genes in hematopoietic stem and progenitor cells
WO2016026453A2 (zh) * 2014-08-20 2016-02-25 北京百诺奇生物科技有限公司 一种检测样品中靶核酸的试剂盒及检测方法
SG10202011572XA (en) 2014-09-16 2021-01-28 Sangamo Therapeutics Inc Methods and compositions for nuclease-mediated genome engineering and correction in hematopoietic stem cells
CN104498594A (zh) * 2014-12-04 2015-04-08 李云英 TALEs双识别检测方法及其应用
US10889834B2 (en) 2014-12-15 2021-01-12 Sangamo Therapeutics, Inc. Methods and compositions for enhancing targeted transgene integration
WO2016118726A2 (en) 2015-01-21 2016-07-28 Sangamo Biosciences, Inc. Methods and compositions for identification of highly specific nucleases
AU2016243052C1 (en) 2015-04-03 2022-11-24 Dana-Farber Cancer Institute, Inc. Composition and methods of genome editing of B-cells
US10179918B2 (en) 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
SG10202112057QA (en) 2015-05-12 2021-12-30 Sangamo Therapeutics Inc Nuclease-mediated regulation of gene expression
US10450585B2 (en) 2015-07-13 2019-10-22 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
WO2017023570A1 (en) 2015-08-06 2017-02-09 The Curators Of The University Of Missouri Pathogen-resistant animals having modified cd163 genes
US10435441B2 (en) 2015-09-23 2019-10-08 Sangamo Therapeutics, Inc. HTT repressors and uses thereof
CA3004349A1 (en) 2015-11-23 2017-06-01 Sangamo Therapeutics, Inc. Methods and compositions for engineering immunity
WO2017106528A2 (en) 2015-12-18 2017-06-22 Sangamo Biosciences, Inc. Targeted disruption of the t cell receptor
MX2018007519A (es) 2015-12-18 2019-09-04 Sangamo Therapeutics Inc Alteracion dirigida del receptor celular del complejo mayor de histocompatibilidad (mhc).
JP6930052B2 (ja) 2016-01-15 2021-09-01 サンガモ セラピューティクス, インコーポレイテッド 神経性疾患の処置のための方法および組成物
WO2017136049A1 (en) 2016-02-02 2017-08-10 Sangamo Biosciences, Inc. Compositions for linking dna-binding domains and cleavage domains
SG11201901364VA (en) 2016-08-24 2019-03-28 Sangamo Therapeutics Inc Engineered target specific nucleases
RS62758B1 (sr) 2016-08-24 2022-01-31 Sangamo Therapeutics Inc Regulacija genske ekspresije korišćenjem inženjeringom nukleaza
US11219695B2 (en) 2016-10-20 2022-01-11 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of Fabry disease
CA3041668A1 (en) 2016-10-31 2018-05-03 Sangamo Therapeutics, Inc. Gene correction of scid-related genes in hematopoietic stem and progenitor cells
KR102674612B1 (ko) 2016-12-01 2024-06-14 상가모 테라퓨틱스, 인코포레이티드 Tau 조절제 및 그것의 전달을 위한 방법 및 조성물
EP3551754B1 (en) 2016-12-08 2023-08-30 Case Western Reserve University Methods and compositions for enhancing functional myelin production
AU2018256877B2 (en) 2017-04-28 2022-06-02 Acuitas Therapeutics, Inc. Novel carbonyl lipids and lipid nanoparticle formulations for delivery of nucleic acids
EP3619322A4 (en) 2017-05-03 2021-06-30 Sangamo Therapeutics, Inc. METHODS AND COMPOSITIONS FOR MODIFICATION OF A TRANSMEMBRANARY CONDUCTANCE REGULATORY GENE IN MUCOVISCIDOSIS (CFTR)
US11512287B2 (en) 2017-06-16 2022-11-29 Sangamo Therapeutics, Inc. Targeted disruption of T cell and/or HLA receptors
EP3706766A4 (en) 2017-11-09 2021-08-18 Sangamo Therapeutics, Inc. GENETIC MODIFICATION OF THE CYTOCINE INDUCTIBLE SH2-CONTAINING PROTEIN (CISH) GENE
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
CN112867792A (zh) * 2018-08-23 2021-05-28 桑格摩生物治疗股份有限公司 工程化靶特异性碱基编辑器
US20210317430A1 (en) 2018-09-18 2021-10-14 Sangamo Therapeutics, Inc. Programmed cell death 1 (pd1) specific nucleases
MX2021008358A (es) 2019-01-11 2021-09-30 Acuitas Therapeutics Inc Lipidos para la administracion de agentes activos en nanoparticulas lipidicas.
WO2020162978A1 (en) 2019-02-06 2020-08-13 Sangamo Therapeutics, Inc. Method for the treatment of mucopolysaccharidosis type i
AU2020253362A1 (en) 2019-04-02 2021-11-04 Sangamo Therapeutics, Inc. Methods for the treatment of beta-thalassemia
AU2021269103A1 (en) 2020-05-06 2022-12-15 Cellectis S.A. Methods to genetically modify cells for delivery of therapeutic proteins
AU2021308681A1 (en) 2020-07-16 2023-03-09 Acuitas Therapeutics, Inc. Cationic lipids for use in lipid nanoparticles
JP2023542705A (ja) * 2020-09-25 2023-10-11 サンガモ セラピューティクス, インコーポレイテッド 核酸塩基編集のためのジンクフィンガー融合タンパク質
WO2022101641A1 (en) 2020-11-16 2022-05-19 Pig Improvement Company Uk Limited Influenza a-resistant animals having edited anp32 genes
WO2023105244A1 (en) 2021-12-10 2023-06-15 Pig Improvement Company Uk Limited Editing tmprss2/4 for disease resistance in livestock
US12129223B2 (en) 2021-12-16 2024-10-29 Acuitas Therapeutics, Inc. Lipids for use in lipid nanoparticle formulations
WO2024013514A2 (en) 2022-07-15 2024-01-18 Pig Improvement Company Uk Limited Gene edited livestock animals having coronavirus resistance

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6348317B1 (en) * 1999-11-18 2002-02-19 The Arizona Board Of Regents Fluorescent and DNA cleavage properties of peptide/dye conjugates

Also Published As

Publication number Publication date
CA2607104A1 (en) 2006-11-16
WO2006121866A3 (en) 2009-04-16
WO2006121866A2 (en) 2006-11-16
EP1877583A2 (en) 2008-01-16
US20090068164A1 (en) 2009-03-12

Similar Documents

Publication Publication Date Title
MX2007013757A (es) Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas.
US20220315628A1 (en) Amino acid-specific binder and selectively identifying an amino acid
Kryuchkova et al. Two-step model of stop codon recognition by eukaryotic release factor eRF1
KR20190091499A (ko) 내열성의 역전사 효소 돌연변이체
Murthi et al. Genome-wide screen for inner nuclear membrane protein targeting in Saccharomyces cerevisiae: roles for N-acetylation and an integral membrane protein
KR20020059370A (ko) 융합 라이브러리의 제작 및 사용을 위한 방법 및 조성물
Yoo et al. Directed evolution of highly selective proteases using a novel FACS based screen that capitalizes on the p53 regulator MDM2
Guo et al. High level soluble production of functional ribonuclease inhibitor in Escherichia coli by fusing it to soluble partners
WO2014189768A1 (en) Devices and methods for display of encoded peptides, polypeptides, and proteins on dna
Zhang et al. Construction of a mini-intein fusion system to allow both direct monitoring of soluble protein expression and rapid purification of target proteins
KR20080070838A (ko) 활성화된 분절­폴리펩티드 및 이의 생산 방법 및 이의 용도
CN109384833B (zh) 特异性识别甲基化修饰dna碱基的tale rvd及其应用
US8852866B2 (en) Method for producing and identifying soluble protein domains
Gunawardana et al. Identification of functional domains in Arabidopsis thaliana mRNA decapping enzyme (AtDcp2)
US11897920B2 (en) Tale RVD specifically recognizing DNA base modified by methylation and application thereof
WO2017130610A1 (ja) 融合タンパク質及びそれを用いた抗原の検出方法
Lee et al. Characterization of Drosophila OVO protein DNA binding specificity using random DNA oligomer selection suggests zinc finger degeneration
Pang et al. Engineering sigma factors and chaperones for enhanced heterologous lipoxygenase production in Escherichia coli
WO2015106067A2 (en) Lucigen yellow (lucy), a yellow fluorescent protein
WO2021187554A1 (ja) 耐熱性ミスマッチエンドヌクレアーゼ変異体
Majumder et al. Interactions of HIPPI, a molecular partner of Huntingtin interacting protein HIP1, with the specific motif present at the putative promoter sequence of the caspase‐1, caspase‐8 and caspase‐10 genes
US20090111968A1 (en) Self-assembled proteins and related methods and protein structures
Berglund Analyzing binding motifs for WW, MATH, and MAGE domains using Proteomic Peptide Phage Display
Ahmed Understanding and engineering protein oligomers
WO2023096584A2 (en) Novel crispr/cas13 systems and uses thereof

Legal Events

Date Code Title Description
FA Abandonment or withdrawal