MX2009002460A - Arnt supresor hibrido para celulas de vertebrados. - Google Patents
Arnt supresor hibrido para celulas de vertebrados.Info
- Publication number
- MX2009002460A MX2009002460A MX2009002460A MX2009002460A MX2009002460A MX 2009002460 A MX2009002460 A MX 2009002460A MX 2009002460 A MX2009002460 A MX 2009002460A MX 2009002460 A MX2009002460 A MX 2009002460A MX 2009002460 A MX2009002460 A MX 2009002460A
- Authority
- MX
- Mexico
- Prior art keywords
- amino acid
- trna
- protein
- cell
- factor
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Esta invención proporciona composiciones y métodos para producir componentes de traducción que expanden el número de aminoácidos genéticamente codificados en células de vertebrados. Los componentes incluyen ARNts ortogonales, aminoacil-ARNt sintetasas ortogonales, pares ortogonales de ARNts/sintetasas y aminoácidos no naturales. También se proporcionan proteínas y métodos para producir proteínas con aminoácidos no naturales en células de vertebrados. La presente invención proporciona células de vertebrados con componentes de traducción, e.g., pares de aminoacil-ARNt sintetasas ortogonales (O-RSs) y ARNts ortogonales (O-ARNts) y componentes individuales de los mismos, que se utilizan en la maquinaria biosintética de proteínas de vertebrados para incorporar un aminoácido no natural en una cadena de polipéptidos en crecimiento, en una célula de vertebrado.
Description
ARNT SUPRESOR HÍBRIDO PARA CÉLULAS DE VERTEBRADOS
CAMPO DE LA INVENCIÓN La invención pertenece al campo de la bioquímica de traducción en células de vertebrados. La invención se refiere a métodos para la producción y a composiciones de ARNt ortogonales, sintetasas ortogonales y pares de las mismas, en células de vertebrados. La invención se refiere también a composiciones de aminoácidos no naturales, proteínas y métodos para producir proteínas en células de vertebrados que incluyen aminoácidos no naturales. ANTECEDENTES DE LA INVENCIÓN El código genético de cada organismo conocido, desde bacterias hasta humanos, codifica para los mismos veinte aminoácidos comunes. Diferentes combinaciones de los mismos veinte aminoácidos naturales forman proteínas que llevan a cabo virtualmente todos los complejos procesos de la vida, desde la fotosíntesis hasta la transducción de señal y la inmuno respuesta. A fin de estudiar y modificar la estructura y función de las proteínas, los científicos han intentado manipular tanto el código genético como la secuencia de aminoácidos de las proteínas. Sin embargo, ha sido difícil retirar las restricciones impuestas por el código genético que limitan las proteínas a veinte bloques de construcción estándar genéticamente codificados (con la rara
excepción de la selenocisteina (ver e.g., A. Bock et al., (1991) , Molecular Microbiology (Biología molecular) 5:515-20) y pirrolisina (ver e.g., G. Srinivasan, et al., (2002), Science 296:1459-62) . Se ha hecho algún progreso para retirar estas restricciones, aunque este progreso ha sido limitado y la capacidad para controlar racionalmente la estructura y función de las proteínas se encuentra aún en su infancia. Por ejemplo, los químicos han desarrollado métodos y estrategias para sintetizar y manipular las estructuras de moléculas pequeñas (ver e.g., E. J. Corey, & X.-M. Cheng, The Logic of Chemical Synthesis (La lógica de la síntesis química) (Wiley-Interscience, New York, 1995)) . La síntesis total (ver e.g., B. Merrifield, (1986), Science 232:341-7 (1986)), y las metodologías semi-sintéticas (ver e.g., D. Y. Jackson et al., (1994) Science 266:243-7; y, P. E. Dawson, & S. B. Kent, (2000), Annual Review of Biochemistry (Revisión anual de bioquímica) 69:923-60), han hecho posible sintetizar péptidos y proteínas pequeñas, pero estas metodologías tienen utilidad limitada con proteínas por arriba de los 10 kilo Daltones (kDa). Los métodos de mutagénesis, aunque poderosos, se restringen a un número limitado de cambios estructurales. En un número de casos, ha sido posible incorporar competitivamente análogos estructurales cercanos de aminoácidos comunes en todas las proteínas. Ver, e.g., R.
Furter, (1998), Protein Science 7:419-26; K. Krishenbaum, et al., (2002), ChemBioChem 3:235-7; y, V. Doring et al., (2001), Science 292 : 501-4. En un intento por expandir la capacidad para manipular la estructura y función de las proteínas, se desarrollaron métodos in Vitro utilizando ARNts ortogonales químicamente acilados que permitieron incorporar selectivamente aminoácidos no naturales en respuesta a un codón sin sentido, in Vitro (ver, e.g., J. A. Ellman, et al., (1992), Science 255:197-200) . Los aminoácidos con estructuras y propiedades físicas nuevas se incorporaron selectivamente en proteínas para estudiar el plegamiento y la estabilidad de proteínas y el reconocimiento y la catálisis biomolecular . Ver e.g., D. Mendel, et al., (1995), Annual Review of Biophysics and Biomolecular Structure (Revisión anual de biofísica y estructura biomolecular) 24:235-462; y, V. W. Cornish, et al. (31 de Marzo, 1995), Angewandte Chemie-International Edition in English 34:621:633. Sin embargo, la naturaleza estequiométrica de este proceso limitó severamente la cantidad de proteína que puede generarse. Los aminoácidos no naturales se han microinyectado en células. Por ejemplo, los aminoácidos no naturales se introdujeron en el receptor de acetilcolina nicotínico en oocitos de Xenopus (e.g., M. W. Nowak, et al. (1998), In vivo incorpora tion of unnatural amino acids into ion channels in
Xenopus oocyte expresión system, (Incorporación in vivo de aminoácidos no naturales en canales de ion en un sistema de expresión de oocito de Xenopus) Method Enzymol. 293:504-529) mediante microinyección de un ARNt de Tetrahimena termófila químicamente desacilado (e.g., M. E. Saks, et al. (1996), An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense supresión, (Un ARNtGln tetrahymena diseñado para la incorporación in vivo de aminoácidos no naturales en proteínas mediante la supresión sin sentido) J. Biol. Chem. 271:23169-231 5), y el ARNm relevante. Esto ha permitido estudios biofísicos detallados del receptor en oocitos mediante la introducción de aminoácidos que contienen cadenas laterales con propiedades físicas o químicas únicas. Ver, e.g., D. A. Dougherty (2000), Unnatural amino acids as probes of proteín structure and function, (Aminoácidos no naturales como sondas de la estructura y función de las proteínas) Curr. Opin. Chem. Biol. 4:645-652. Desafortunadamente, esta metodología se limita a proteínas en células que pueden microinyectarse , y debido a que el ARNt relevante se acila químicamente in vitro, y no puede re-acilarse, la producción de proteínas es muy baja. Para resolver estas limitaciones, se agregaron nuevos componentes a la maquinaria biosintética de la proteína del procarioto de Escherichia coli (E. coli) (e.g.,
L. Wang, et al., (2001), Science 292: 98-500), que permitió codificar genéticamente aminoácidos no naturales in vivo. Se ha incorporado eficientemente un número de aminoácidos nuevos con propiedades químicas, físicas o biológicas nuevas, que incluyen marcas de fotoafinidad y aminoácidos fotoisomerizables , ceto aminoácidos, y aminoácidos glicosilados con alta fidelidad en proteínas en E. coli en respuesta al codón ámbar, TAG, utilizando esta metodología. Ver, .g., J. W. Chin et al., (2002), Journal of the American Chemical Society (Diario de la sociedad química americana) 124:9026-9027; J. W. Chin, & P. G. Schultz, (2002), ChemBioChem 11:1135-1137; J. W. Chin, et al., (2002), PNAS United States of America 99:11020-11024: y, L. Wang, & P. G. Schultz, (2202), Chem. Comm. , 1-10. Sin embargo, la maquinaria de traducción de procariotos y eucariotos no es altamente conservada; por tanto, los componentes de la maquinaria biosintética agregados a E. coli frecuentemente no pueden utilizarse para incorporar específicamente al sitio aminoácidos no naturales dentro de proteínas en células de vertebrados. Por ejemplo, el par de tirosil-ARNt sintetasa/ARNt de Methanococcus jannaschii que se utilizó en E. coli no es ortogonal en células de vertebrados. Además, la transcripción de ARNt en eucariotos, pero no en procariotos, se lleva a cabo mediante ARN Polimerasa III y esto coloca restricciones sobre la secuencia principal de los
genes estructurales de ARNt que pueden transcribirse en células de vertebrados. Además, en contraste con las células procarióticas , los ARNts en células de vertebrados necesitan exportarse desde el núcleo, en donde se transcriben, al citoplasma, para funcionar en la traducción. Finalmente, el ribosoma 80S de vertebrado es distinto al ribosoma procariótico 70S. Por tanto, existe una necesidad por desarrollar componentes mejorados de la maquinaria biosintética para expandir el código genético de vertebrados. Esta invención satisface estas y otras necesidades, como será aparente en la revisión de la siguiente descripción. SUMARIO DE LA INVENCIÓN La invención proporciona células de vertebrados con componentes de traducción, e.g., pares de aminoacil-ARNt sintetasas ortogonales (O-RSs) y ARNts ortogonales (O-ARNts) y componentes individuales de los mismos, que se utilizan en la maquinaria biosintética de la proteina de vertebrados para incorporar un aminoácido no natural en una cadena de polipéptidos en crecimiento, en una célula de vertebrado. Las composiciones de la invención incluyen una célula de vertebrado (e.g., una célula de mamífero, una célula de ave, una célula de pez, una célula de reptil, una célula de anfibio, células derivadas de animales no mamíferos, etc.) que comprende una aminoacil-ARNt sintetasa ortogonal (O-RS) (e.g., derivada de un organismo no
vertebrado, tal como Escherichia coli, Bacillus stearothermophilus, etc.), en donde la O-RS preferentemente aminoacila un ARNt ortogonal (O-ARNt) al menos con un aminoácido no natural en la célula de vertebrado. Opcionalmente , pueden aminoacilarse dos o más OARNts en una célula de vertebrado dada. En un aspecto, una O-RS aminoacila a un O-ARNt con el aminoácido no natural, e.g., al menos 40%, al menos 45", al menos 50%, al menos 60%, al menos 75¾, al menos 80?, o incluso 90% o más tan eficientemente como lo hace una O-RS que tiene una secuencia de aminoácidos, e.g., como se establece en la SEQ ID NO.: 86 o 45. En una modalidad, una O-RS de la invención aminoacila al O-ARNt con el aminoácido no natural, e.g., al menos 10-veces, al menos 20-veces, al menos 30-veces, etc., más eficientemente que la O-RS aminoacila al O-ARNt con un aminoácido natural. En una modalidad, la O-RS o una porción del mismo se codifica mediante una secuencia de polinucleótidos como se establece en cualquiera de las SEQ ID NO.: 3-35, o una secuencia de polinucleótidos complementaria de las mismas. En otra modalidad, la O-RS comprende una secuencia de aminoácidos como se establece en cualquiera de las SEQ ID NO.: 36-63, y/o 86, o una variación conservadora de las mismas. Aún en otra modalidad, la O-RS comprende una secuencia de aminoácidos que es, e.g., al menos 90%, al menos 95%, al menos 98%, al menos 99%, o al menos 99.5% o más,
idéntica a la tirosil aminoacil-ARNt sintetasa de origen natural (TyrRS) y comprende dos o más aminoácidos de los grupos A-E. El grupo A incluye valina, isoleucina, leucina, glicina, serina, alanina, o treonina en una posición correspondiente a Tyr37 de un TyrRS de E. coli. El grupo B incluye aspartato en una posición correspondiente a Asnl26 de un TyrRS de E. coli. El grupo C incluye treonina, serina, arginina, asparagina o glicina en una posición correspondiente a Aspl82 de un TyrRS de E. coli. El grupo D incluye metionina, alanina, valina, o tirosina en la posición correspondiente a Phel83 de un TyrRS de E. coli; y, el grupo E que incluye serina, metionina, valina, cisteina, treonina, o alanina en una posición correspondiente a Leul86 de un TyrRS de E. coli. En otra modalidad, la O-RS tiene una o más propiedades enzimáticas mejoradas para el aminoácido no natural comparado con un aminoácido natural. Por ejemplo, las propiedades incrementadas o mejoradas del aminoácido no natural comparadas con el aminoácido natural incluyen cualquiera de, e.g., un Km más alto, un Km más bajo, un kcat más alto, un kcat más bajo, un kcat/km más alto, un kcat/km más bajo, etc. La célula de vertebrado incluye también opcionalmente incluye un aminoácido ( s ) no natural (es). La célula de vertebrado incluye opcionalmente un ARNt ortogonal
(O-ARNt) (e.g., derivado de un organismo no vertebrado, tal como Escherichia coli, Bacillus stearothemophilus , y/o lo similar) , en donde el O-ARNt reconoce un codón selector y se encuentra preferentemente aminoacilado con el aminoácido no natural mediante la O-RS. En un aspecto, el O-ARNt media la incorporación del aminoácido no natural dentro de una proteina con, e.g., al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95%, o 99% de la eficiencia de un ARNt gue comprende o se procesa en una célula de una secuencia de polinucleótidos como se establece en la SEQ ID NO.: 65. En otro aspecto, el O-ARNt comprende la secuencia de SEQ ID NO. : 65 y la O-RS comprende una secuencia de polipéptidos seleccionada a partir de una secuencia de aminoácidos establecida en cualquiera de las SEQ ID NO.: 36-63, y/o 86, y/o una variación conservadora de la misma. En otra modalidad, la célula de vertebrado comprende un ácido nucleico que comprende un polinucleótido que codifica para un polipéptido de interés, en donde el polinucleótido comprende un codón selector que se reconoce mediante el O-ARNt. En un aspecto, el rendimiento del polipéptido de interés que comprende un aminoácido no natural es, e.g., de al menos 2.5%, al menos 5%, al menos 10%, al menos 25%, al menos 30%, al menos 40%, 50% o más, del obtenido para el polipéptido de origen natural de interés a partir de una célula en la que el polipéptido carece del
codón selector. En otro aspecto, la** célula produce el polipéptido de interés en ausencia del aminoácido no natural, con un rendimiento que es, e.g., menor que 35%, menor que 30%, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural. La invención proporciona también una célula de vertebrado que comprende una aminoaci 1-ARNt sintetasa ortogonal (0-RS), un ARNt ortogonal (O-ARNt), un aminoácido no natural, y un ácido nucleico que comprende un polinucleótido que codifica para un polipéptido de interés. El polinucleótido comprende un codón selector que se reconoce mediante el O-ARNt . Además, la 0-RS preferentemente aminoacila al ARNt ortogonal (O-ARNt) con el aminoácido no natural en la célula de vertebrado, y la célula produce un polipéptido de interés en ausencia del aminoácido no natural, con un rendimiento que es, e.g., menor que 30%, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural. Las composiciones que incluyen una célula de vertebrado que comprende un ARNt ortogonal (O-ARNt) son también una característica de la invención. Típicamente, el O-ARNt media la incorporación de un aminoácido no natural dentro de una proteína que se encuentra codificada por un
polinucleótido que comprende un codón de selección que se reconoce mediante el O-ARNt in vivo. En una modalidad, el 0-ARNt media la incorporación del aminoácido no natural dentro de la proteina con, e.g., al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95%, o incluso 99" o más de eficiencia del ARNt que comprende o se encuentra procesado en una célula a partir de una secuencia de polinucleótidos como se establece en la SEQ ID NO.: 65. En otra modalidad, el O-ARNt comprende o se procesa a partir de una secuencia de polinucleótidos como se establece en la SEQ ID NO.: 65, o una variación conservadora del mismo. Aún en otra modalidad, el O-ARNt comprende un 0-ARNt reciclable. En un aspecto de la invención, el O-ARNt se modifica después de la transcripción. La invención proporciona también un ácido nucleico que codifica para un 0-ARNt en una célula de vertebrado, o un polinucleótido complementario de la misma. En una modalidad, el ácido nucleico comprende una casilla A y una casilla B. La invención también ofrece métodos de producción de componentes de transcripción, e.g., O-RSs o pares de 0-ARNt/O-RS (y componentes de transcripción producidos mediante estos métodos). Por ejemplo, la invención proporciona métodos para producir una aminoacil-ARNt sintetasa ortogonal (O-RS) que preferentemente aminoacila a un ARNt ortogonal con
un aminoácido no natural en una célula de vertebrado. El método incluye, e.g., (a) someter a selección positiva, en presencia de aminoácido no natural, a una población de células de vertebrados de una primera especie, en donde las células de vertebrados comprenden cada una: i) un miembro de una biblioteca de aminoaci 1-ARNt sintetasas (RSs), ii) un ARNt ortogonal (O-ARNt), iii) un pol inucleótido que codifica para un marcador de selección positiva, y iv) un pol inucleót ido que codifica para un marcador de selección negativa; en donde las células que sobreviven a la selección positiva comprenden un RS activo que aminoacila al ARNt ortogonal (O-ARNt) en presencia de un aminoácido no natural. Las células que sobreviven la selección positive se someten a selección negativa en ausencia del aminoácido no natural para eliminar al RSs activo que aminoacila al O-ARNt con un aminoácido natural. Esto proporciona la O-RS que preferentemente aminoacila al O-ARNt con el aminoácido no natural . En ciertas modalidades, el polinucleótido que codifica para el marcador de selección positiva se enlaza de forma operable a un elemento de respuesta y las células comprender además un polinucleótido que: a) codifica para una proteina moduladora de transcripción (e.g., una proteina moduladora de transcripción de vertebrado, etc.) que modula la transcripción a partir del elemento de respuesta, y b)
comprende al menos un codón selector. La incorporación del aminoácido no natural dentro de la proteina moduladora de transcripción mediante el O-ARNt aminoacilado con el aminoácido no natural da como resultado la transcripción del marcador de selección positiva. En una modalidad, la proteina moduladora de transcripción es una proteina activadora de transc ipción (e.g., GAL4 , etc.), y el codón selector es un codón de parada ámbar, e.g., en donde el codón de parada ámbar se localiza en o sustancialmente cerca de una porción del polinucleótido que codifica para un dominio de enlace de ADN de la proteina activadora de transcripción. El marcador de selección positiva puede ser cualquiera de una variedad de moléculas. En una modalidad, el marcador de selección positiva comprende un suplemento nutricional para el crecimiento y la selección se lleva a cabo en un medio que carece del suplemento nutricional. En otra modalidad, el polinucleótido que codifica para el marcador de selección positiva es, e.g., un ura3, leu2, lys2, lacZ gene, his3 (e.g., en donde el gene his3 codifica para una glicerol fosfato dehidratasa , detectada proporcionando 3-aminotriazol (3-AT), y/o lo similar. Aún en otra modalidad, el polinucleótido que codifica para el marcador de selección positiva comprende un codón selector. Como con el marcador de selección positiva, el marcador de selección negativa puede también ser cualquiera
de una variedad de moléculas. En ciertas modalidades, el pol inucleót ido que codifica para el marcador de sección negativa se encuentra enlazado de forma operable a un elemento de respuesta' a partir del cual se media la transcripción mediante la proteina moduladora de transcripción. La incorporación de un aminoácido natural dentro de la proteina moduladora de transcripción mediante el O-ARNt aminoacilado con un aminoácido natural, da como resultado la transcripción del marcador del selección negativa. En una modalidad, el polinucleótido que codifica para el marcador de selección negativa es, e.g., un gen ura3 y la selección negativa se logra en un medio que comprende acido 5- fluroorót ico (5-FOA). En otra modalidad, el medio utilizado para la selección negativa comprende un agente de selección o de clasificación que se convierte en una sustancia detectable por medio del marcador de selección negativa. En un aspecto de la invención, la sustancia detectable es una sustancia tóxica. En una modalidad, el polinucleótido que codifica para el marcador de selección negativa comprende un codón selector. En ciertas modalidades, el marcador de selección positiva y/o el marcador de selección negativa comprenden un polipéptido que imparte fluorescencia o cataliza una reacción luminiscente en presencia de un reactivo adecuado. En un aspecto de la invención, el marcador de selección positiva
y/o el marcador de selección negativa se detectan mediante la clasificación de la célula activada por fluorescencia (FACS), o mediante luminiscencia. En ciertas modalidades, el marcador de selección positiva y/o el marcador de selección negativa comprenden un marcador de selección basado en afinidad, o una proteina moduladora de transcripción. En una modalidad, el mismo polinucleótido codifica tanto para el marcador de selección positiva como para el marcador de selección negativa. En una modalidad, el polinucleótido que codifica para el marcador de selección positiva y/o para el marcador de selección negativa de la invención puede comprender al menos dos codones selectores, los cuales, cada uno o ambos, pueden comprender al menos dos codones selectores diferentes o al menos dos de los mismos codones selectores. Pueden utilizarse también niveles adicionales de rigurosidad de selección/clasificación en los métodos de la invención. En una modalidad, los métodos pueden comprender, e.g., proporcionar una cantidad variable de una sintetasa inactiva en la etapa (a), (b) o tanto (a) como (b) , en donde la cantidad variable de la sintetasa inactiva proporciona un nivel adicional de rigurosidad de selección o clasificación. En una modalidad, la etapa (a), (b) , o tanto la etapa (a) como la (b) del método para producir una O-RS incluye la variación de la rigurosidad de selección o clasificación,
e.g., del marcador de selección positiva y/o negativa. El método incluye opciona lmente someter al O-RS que preferentemente aminoacila al O-ARNt con el aminoácido no natural a una ronda adicional de selección, e.g., una ronda (s) adicional de selección positiva, una ronda (s) adicional de selección negativa o combinaciones de rondas de selección tanto positivas como negativas. En una modalidad, la selección/clasificación comprende una o más selecciones/clasificaciones positivas o negativas seleccionadas de, e.g., un cambio en la permeabilidad del aminoácido, un cambio en la eficiencia de traducción, un cambio en la fidelidad de traducción, etc. Los uno o más cambios se basan en una mutación en uno o más polinucleótidos que codifican para un componente del par de ARNt ortogonal-ARNt sintetasa que se utiliza para producir la proteina . Típicamente, la biblioteca de RSs (e.g., una biblioteca de RSs mutante) comprende RSs derivados a partir de al menos una aminoacil-ARNt sintetasa (RS), e.g., de un organismo no vertebrado. En una modalidad, la biblioteca de RSs se deriva de un RS inactivo, e.g., en donde el RS inactivo se genera mediante la mutación de un RS activo. En otra modalidad, el RS inactivo comprende una bolsa de enlace de aminoácido y uno o más aminoácidos que comprenden la bolsa de enlace se sustituyen con uno o más aminoácidos diferentes,
e.g., los aminoácidos sustituidos se sustituyen por alaninas. En ciertas modalidades, el método de producción de una O-RS incluye además llevar a cabo mutación aleatoria, mutación especifica del sitio, recombinación, construcción quimérica, o cualquier combinación de las mismas, o un ácido nucleico que codifica para un RS, produciendo asi la biblioteca de RSs mutantes. En ciertas modalidades, el método incluye además, e.g., (c) aislar un ácido nucleico que codifica para la OR-S; (d) generar a partir del ácido nucleico un conjunto de polinucleótidos que codifican para 0-RSs mutados (e.g., mediante mutagénesis aleatoria, mutagénesis especifica del sitio, construcción quimérica, recombinación o cualquier combinación de las mismas); y (e) repetir las etapas (a) y/o (b) hasta obtener una O-RS mutado que preferentemente aminoacila al 0-ARNt con el aminoácido no natural. En un aspecto de la invención, las etapas (c)-(e) se llevan a cabo al menos dos veces. Los métodos para producir pares de 0-tRNA/O-RS son también una característica de la invención. En una modalidad, la OR-S se obtiene como se describió anteriormente y el 0-tRNA se obtiene sometiendo a selección negativa a una población de células de vertebrados de una primera especie, en dende las células de vertebrados comprenden un miembro de la biblioteca de ARNts, para eliminar las células que comprenden un miembro de la biblioteca de ARNts que se
aminoacila mediante una aminoacil-ARNt sintetasa (RS) que es endógena a las células de vertebrados. Esto proporciona un depósito de ARNts que son ortogonales a las células de vertebrados de la primera especie. En un aspecto de la invención, la biblioteca de ARNts comprende ARNts derivados de al menos un ARNt, e.g., de un organismo invertebrado. En otro aspecto de la invención, la biblioteca de aminoacil-ARNt sintetasas (RSs) comprende RSs derivadas de al menos una aminoacil-ARNt sintetasa (RS), e.g. de un organismo invertebrado. Aún en otro aspecto de la invención, la biblioteca de ARNts comprende ARNts derivados de al menos un ARNt de un primer organismo no vertebrado. La biblioteca de aminoacil-ARNt sintetasas (RSs) comprende opcionalmente RSs derivadas de una aminoacil-ARNt sintetasa (RS) de un segundo organismo invertebrado. En una modalidad, el primero y el segundo organismos invertebrados son el mismo. Alternativamente, el primero y el segundo organismos invertebrados pueden ser diferentes. Los pares específicos de O-ARNts/O-RS producidos mediante los métodos de la invención son también una característica de la invención. Otra característica de la invención es un método para producir componentes de traducción en una especie, e introducir los componentes de traducción seleccionados/clasificados en una segunda especie. Por ejemplo, el método para producir un par de O-ARNt/O-RS en la
primera especie (e.g., una especie de vertebrado, tal como una levadura y lo similar) incluye además introducir un ácido nucleico que codifica para el O-ARNt y un ácido nucleico que codifica para la O-RS en una célula de vertebrado de la segunda especie (e.g. un mamífero, un insecto, un hongo, un alga, una planta y lo similar) . La segunda especie puede utilizar los componentes de traducción introducidos para incorporar un aminoácido no natural en una cadena de polipéptidos creciente in vivo, e.g. durante la traducción. En otro ejemplo, un método para producir una aminoacil-ARNt sintetasa ortogonal (O-RS) que preferentemente aminoacila un ARNt ortogonal con un aminoácido no natural en una célula de vertebrado incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, a una población de células de vertebrados de una primera especie (e.g., una especie de vertebrado, tal como una levadura o lo similar) . Las células de vertebrados de la primera especie comprenden cada una: i) un miembro de una biblioteca de aminoacil-ARNt sintetasas (RSs, ii) un ARNt ortogonal (0-ARNt), iii) un polinucleótido que codifica para un marcador de selección positiva, y iv) un polinucleótido que codifica para un marcador de selección negativa. Las células que sobreviven a la selección positiva comprenden un RS activo que aminoacila al ARNt ortogonal (O-ARNt) en presencia de un aminoácido no natural. Las células que sobreviven a la
selección positiva se someten a selección negativa en ausencia del aminoácido no natural para eliminar al RS activo que aminoacila al O-ARNt con un aminoácido natural, proporcionando asi una O-RS que preferentemente aminoacila al O-ARNt con el aminoácido no natural . Se introduce un ácido nucleico que codifica para el O-ARNt y un ácido nucleico que codifica para la OR-S en una célula de vertebrado de una segunda especie (e.g., mamífero, un insecto, un hongo, un alga, una planta y/o lo similar) . Estos componentes, cuando se transfieren en la segunda especie, pueden utilizarse para incorporar aminoácidos no naturales en una proteína o polipéptido de interés en la segunda especie. En una modalidad, el O-ARNt y/o la O-RS se introducen dentro de la célula de vertebrado de la segunda especie. En ciertas modalidades, el O-ARNt se obtiene sometiendo a selección negativa a una población de células de vertebrados de una primera especie, en donde las células de vertebrados comprenden un miembro de una biblioteca de ARNts, para eliminar las células que comprenden un miembro de la biblioteca de ARNts que se aminoacila mediante una aminoacil-ARNt sintetasa (RS) que es endógena a las células de vertebrados. Esto proporciona un depósito de ARNts que son ortogonales a las células de vertebrados de la primera especie y de la segunda especie. Las proteínas (o polipéptidos de interés) con al
menos un aminoácido no natural son también una característica de la invención. En ciertas modalidades de la invención, una proteína con al menos un aminoácido no natural incluye al menos una modificación post-traducción . En una modalidad, la al menos una modificación post-traducción comprende la unión de una molécula (e.g., un tinte, un polímero, e.g., un derivado de poletilen glicol, un fotorreticulador, un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un guelador de metal, un cofactor, un ácido graso, un carbohidrato, un pol inucleótido (e.g., ADN, ARN, etc.), etc.) que comprende un segundo grupo reactivo, mediante una cicloadición [3+2] a el al menos un aminoácido no natural que comprende un primer grupo reactivo. Por ejemplo, el primer grupo reactivo es un residuo alquinilo (e.g., en el aminoácido no natural p-propargiloxifenilalanina ) (este grupo es referido algunas veces como un residuo acetileno) y el segundo grupo reactivo es un residuo azido. En otro ejemplo, el primer grupo reactivo es el residuo azido (e.g., en el aminoácido no natural p-azido-L-fenilalanina ) y el segundo grupo reactivo es el residuo alquinilo. En ciertas modalidades, una proteína de la invención incluye al menos un aminoácido no natural (e.g., un aminoácido no natural ceto) que comprende al menos una modificación post-traducción, en donde al menos una modificación post-traducción comprende un
residuo sacarido. En ciertas modalidades, la modificación post-traducción se lleva acabo in vivo en una célula de vertebrado . En ciertas modalidades, la proteina incluye al menos una modificación post-traducción que se lleva a cabo in vivo mediante una célula de vertebrado, en donde la modificación post-traducción no se lleva a cabo mediante una célula procariótica . Ejemplos de modificaciones posttraducción incluyen, pero no se limitan a, acetilación, acilación, modificación de lipidos, palmitoilación, adición de palmitato, fosforilación, modificación de enlace de glicolipidos , y lo similar. En una modalidad, la modificación post-traducción comprende la unión de un ol igosacárido a una asparagina mediante un ligando GlcNAc-asparagina (e.g., en donde el oligosacárido comprende (GlcNAc-Man) 2-Man-GlcNAc-GlcNAc, y lo similar). En otra modalidad, la modificación post-traducción comprende la unión de un oligosacárido (e.g., Gal-GalNAc, Gal-GlcNAc, etc.) a una serina o treonina mediante un ligando GalNAc-serina , uno GalNAc-treonina, uno GlcNAc-serina o uno GlcNAc-treonina . En ciertas modalidades, una proteina o polipéptido de la invención puede comprender una secreción o secuencia de localización, una marca de epitope, una marca FLAG, una marca de polihistidina, una fusión GST, y/o lo similar. Típicamente, las proteínas son, e.g., al menos 60%,
al menos 70%, al menos 75 ¾ , al menos 80%, al menos 90%, al menos 95%, o incluso al menos 99% o más, idénticas a cualquier proteína disponible (e.g., una proteína terapéutica, una proteína de diagnóstico una enzima industrial, o porción de las mismas, y/o lo similar), y estas comprenden uno o más aminoácidos no naturales. En una modalidad, una composición de la invención incluye una proteína o polipéptido de interés y un excipiente (e.g., un amortiguador, un excipiente fa macéuticamente aceptable, etc. ) . La proteína o polipéptido de interés puede contener al menos uno, al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis, al menos siete, al menos ocho, al menos nueve o diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser los mismos o diferentes, e.g., puede haber 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más sitios diferentes en la proteína que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más aminoácidos no naturales diferentes. En ciertas modalidades, al menos uno, pero menos que todos, los aminoácidos particulares presentes en una versión de origen natural de la proteína se sustituye con un aminoácido no natural . Ejemplos de una proteína (o polipéptido de interés) incluyen, pero no se limitan a, e.g., una citosina, un factor de crecimiento, un receptor del factor de crecimiento, un
interferón, una interleucina , una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de hormona esteroide, eritropoyetina (EPO), insulina, hormona del crecimiento humano, una antitripsina Alfa-1, una angiostatina , un factor antihemolítico, un anticuerpo, una apol ipoproteina , una apoproteina, un factor atrial natriurético, un polipéptido atrial natriurético, un péptido atrial, una quimiosina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, una GCP-2, un NAP-4, un SDF-1, un PF4, un MIG, una calcitonina, un ligando de equipo-c, una citosina, una quimiosina CC, una proteina 1 quimioatrayente de monocito, una proteina 2 quimioatrayente de monocito, una proteina 3 quimioatrayente de monocito, una proteina 1 alfa inflamatoria de monocito, una proteina 1 beta inflamatoria de monocito, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando de equipo-c, un colágeno, un factor de estimulación de colonia (CSF) , un factor 5a de complemento, un inhibidor de complemento, un receptor 1 del complemento, una citosina, DHFR, un péptido-78 de activación de neutrofilo epitelial, un GROa/MGSA, un GROP, GROY un MIP-la, un ???-?d, un MCP-1, un factor de crecimiento epidérmico (EGF) , un péptido de activación de neutrofilo epitelial, una eritropoyetina (EPO), una toxina exfoliante, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un
factor de crecimiento de fibroblasto (FGF), un fibrinógeno, una f ibronect ina , un G-CSF, un GM-CSF, una glucocerebrosidasa, una gonadotropina , un factor de crecimiento, un receptor del factor de crecimiento, una proteina Hedgehog, una hemoglobina, un factor de crecimiento de hepatocito (HGF), una hirudina, una albúmina de suero humana, una ICAM-1, un receptor de ICAM-1, una LFA-1, un receptor de LFA-1, una insulina, un factor de crecimiento tipo insulina (IGF), un IGF-I, un IGF-II, un interferón, un IFN-a, un IFN-ß, un IFN-?, una interleucina , un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un factor de crecimiento de queratinocito (KGF), una lactoferrina , un factor inhibidor de leucemia, una luciferasa, una neurturina, un factor inhibidor de neutrófilo (NIF) , una oncostatina M, una proteina osteogénica, un producto oncógeno, una hormona paratiroidea, un PD-ECSF, un PDGF, una hormona de péptido, una hormona del crecimiento humano, una pleyotropina , una Proteina A, una Proteina G, exotoxinas pirogénicas A, B o C, un relaxina, una renina, un SCF, un receptor de complemento soluble I, un I-CAM 1 soluble, receptores de interleucina solubles, un receptor TNF soluble, una somatomedina , una somatostatina , una somatotropina , una estreptocinasa , superantigenos , enterotoxinas de estafilococo, un SEA, un SEB, un SEC1, un SEC2, un SEC3, un SED, un SEE, un receptor
de hormona esteroide, una dismutasa de superóxido (SOD), una toxina de síndrome de choque tóxico, una timosina alfa 1, un activador plasminógeno de tejido, un factor de crecimiento de tumor (TGF) , un TGF- , un TGF-ß, un factor de necrosis tumoral, un factor alfa de necrosis tumoral, un factor beta de necrosis tumoral, un receptor del factor de necrosis tumoral (TNFR), una proteína VLA-4, una proteína VCAM-1, un factor de crecimiento endotelial vascular (VEGEF) , una urocinasa, un Mos, un Ras, un Raf, un Met; un p53, un Tat, un Fos, un Myc, un Jun, un Myb, un Reí, un receptor de estrógeno, un receptor de progesterona , un receptor de testosterona , un receptor de aldosterona, un receptor LDL, un Equipo SCF/C, un CD40L/CD40, un VLA- 4 /VCAM-1 , un ICAM-l/LFA-1, una hialurina/CD44 , una corticosterona, una proteína presente en el GenBank u otra base de datos disponible, y lo similar, y/o una porción de los mismos. En una modalidad, el polipéptido de interés incluye una proteína moduladora de transcripción (e.g., una proteína activadora de transcripción (tal como GAL ) , o una proteína represora de transcripción, etc.) o una porción de la misma. Una célula de vertebrado de la invención proporciona la capacidad de sintetizar proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles. Por ejemplo, las proteínas que comprenden un aminoácido no natural pueden producirse en una concentración
de, e.g., al menos 10 pg/litro, al menos 50 pg/litro, al menos 75 pg/litro, al menos 100 pg/litro, al menos 200 pg/litro, al menos 250 pg/litro, o al menos 500 pg/litro o más de proteina en un extracto de célula, un amortiguador, un excipiente farmacéuticamente aceptable, y/o lo similar. En ciertas modalidades, una composición de la invención incluye, e.g., al menos 10 pg, al menos 50 pg, al menos 75 pg, al menos 100 pg, al menos 200 pg, al menos 250 pg, al menos 500 pg o más de proteina que comprende un aminoácido no natural. En ciertas modalidades, la proteina o polipéptido de interés (o porción de la misma) se codifica mediante un ácido nucleico. Típicamente, el ácido nucleico comprende al menos un codón selector, al menos dos codones selectores, al menos tres codones selectores, al menos cuatro codones selectores, al menos cinco codones selectores, al menos seis codones selectores, al menos siete codones selectores, al menos ocho codones selectores, al menos nueve codones selectores, o incluso diez o más codones selectores. La invención proporciona también métodos para producir, en una célula de vertebrado, al menos una proteína que comprende al menos un aminoácido no natural (así como proteínas producidas mediante tales métodos). Los métodos incluyen, e.g., el crecimiento, en un medio apropiado, de una célula de vertebrado que comprende un ácido nucleico que comprende al menos un codón selector y codifica para la
proteina. La célula de vertebrado comprende también un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce al codón selector y una aminoacil-ARNt sintetasa ortogonal (0-RS) que preferentemente aminoacila al O-ARNt con un aminoácido no natural, y el medio comprende un aminoácido no natural. En una modalidad, la 0-RS aminoacila al O-ARNt con el aminoácido no natural e.g., al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95%, o incluso 99% o más tan eficientemente como lo hace una O-RS que tiene una secuencia de aminoácidos, e.g., como se establece en SEQ ID NO.: 86 o 45. En otra modalidad, el 0-ARNt comprende, se procesa a partir de, o se codifica por la SEQ ID NO.: 64 o 65, o una secuencia de polinucleótidos complementaria de la misma. Aún en otra modalidad, la O-RS comprende una secuencia de aminoácidos como se establece en cualquiera de las SEQ ID NO.: 36-63, y/o 86. En una modalidad, el método incluye además incorporar dentro de la proteina al aminoácido no natural, en donde el aminoácido no natural comprende un primer grupo reactivo; y poner en contacto a la proteina con una molécula (e.g., un tinte, un polímero, e.g., un derivado de poletilen glicol, un fotorreticulado , un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador de metal, un cofactor, un ácido graso, un carbohidrato, un polinucleótido
(e.g., ADN, ARN, etc.), etc.) que comprende un segundo grupo reactivo. El primer grupo reactivo reacciona con el segundo grupo reactivo para unir la molécula al aminoácido no natural mediante una cicloadición [3+2]. En una modalidad, el primer grupo reactivo es un residuo de alquinilo o azido y el segundo grupo reactivo es un residuo azido o alquinilo. Por ejemplo, el primer grupo reactivo es el residuo alquinilo (e.g., en el aminoácido no natural p-propargiloxifenilalanina) , y el segundo grupo reactivo es el residuo azido. En otro ejemplo, el primer grupo reactivo es el residuo azido (e.g., en el aminoácido no natural p-azido-L-fenialanina ) y el segundo grupo reactivo es el residuo alquinilo. En ciertas modalidades, la proteina codificada comprende una proteina terapéutica, una proteina de diagnóstico, una enzima industrial, o porción de la misma. En una modalidad, la proteina que se produce mediante el método se modifica adicionalmente a través del aminoácido no natural. Por ejemplo, el aminoácido no natural se modifica mediante, e.g., una reacción nucleófila-electrófila , mediante una cicloadición [3+2], etc. En otra modalidad, la proteina producida mediante el método se modifica por al menos una modificación post-traducción (e.g., N-glicosilación, 0-glicosilación , acetilación, acilación, modificación de lipidos, palmitoilacion, adición de palmitato, fosforilación,
modificación de enlace de glicolipido, y lo similar) in vivo. Se proporcionan también métodos para producir una proteina moduladora de transcripción de clasificación o selección (dado que son proteínas moduladoras de transcripción de clasificación o selección producidas mediante tales métodos) . Los métodos incluyen, e.g., seleccionar una primera secuencia de pol inucleótidos , en donde la secuencia de polinucleótidos codifica para un dominio de enlace de ácido nucleico; y mutar la primera secuencia de polinucleótidos para incluir al menos un codón selector. Esto proporciona una secuencia de polinucleótidos de clasificación o selección. Los métodos incluyen además, e.g., seleccionar una segunda secuencia de polinucleótidos, en donde la segunda secuencia de polinucleótidos codifica para un domino de activación de transcripción; proporcionar una construcción que comprende la secuencia de polinucleótidos de clasificación o selección enlazada de forma operable a la segunda secuencia de polinucleótidos; e, introducir la construcción, un aminoácido no natural, una ARNt sintetasa ortogonal (0-RS) y un ARNt ortogonal (O-ARNt ) , dentro de una célula. Con estos componentes, la O-RS preferentemente aminoacila al O-ARNt con el aminoácido no natural y el O-ARNt reconoce al codón selector e incorpora al aminoácido no natural dentro del dominio de enlace de ácido nucleico, en respuesta al codón selector en la secuencia de
polinucleótidos de clasificación o selección. Esto proporciona la proteina moduladora de transcripción de clasificación o selección. En ciertas modalidades, las composiciones y métodos de la invención incluyen células de vertebrados. Una célula de vertebrado de la invención incluye cualquiera de, e.g., una célula de mamífero, una célula de levadura, una célula de hongo, una célula de planta, una célula de insecto, etc. Los componentes de traducción de la invención pueden derivarse de una variedad de organismos, e.g., organismos invertebrados, tales como un organismo procariótico (e.g., E. coli, Bacillus stearothermophilus, o lo similar), o un archaebacterium, o e.g., un organismo vertebrado. Un codón selector de la invención expande la estructura genética del codón de la maquinaria biosintética de la proteína de vertebrado. Cualquiera de una variedad de codones selectores puede utilizarse en la invención, incluyendo codones de parada (e.g., un codón ámbar, un codón ocre, o un codón de parada ópalo) , codones sin sentido, codones raros, cuatro (o más) codones base, y/o lo similar. Los ejemplos de aminoácidos no naturales que pueden utilizarse en las composiciones y métodos descritos en la presente incluyen (pero no se limitan a) : una p-acetil-L-fenilalanina, una p-yodo-L-fenilalanina, una O-metil-L-tirosina, un p-propargiloxifenilalanina, una p-propargil-
feni lalanina , una L-3- (2-naftil) alanina, una 3-metil-fen i la lanina , una ?-4-alil-L-tirosina, un 4-propil-L-tirosina, una tri-O-acetil-GlcNAc^-serina , una L-Dopa, una fenilalanina fluorada, una isopropi 1-L-fenilalanina , una p-a zido-L-fenilalanina, una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina , una fosfonotirosina, una p-bromofenilalanina, una p-amino-L-feni lalanina , una isopropil-L-fenilalanina, un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de un aminoácido de treonina; un alquilo, arilo, acilo, azido, ciano, halo, hidrazina, hidrazida, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo, fosfono, fosfina, heterociclico, enona, imina, aldehido, hidroxilamina, ceto, o aminoácido de amino sustituido, o cualquier combinación de los mismos; un aminoácido con un reticulador fotoactivable ; un aminoácido marcado con espira; un aminoácido fluorescente; un aminoácido de enlace con metal; un aminoácido que contiene metal; un aminoácido radiactivo; un aminoácido fotoencerrado y/o fotoisomeri zable ; un aminoácido que contiene biotina o un análogo de biotina; un aminoácido que contiene ceto, un aminoácido que comprende poletilen glicol o poliéter; un
aminoácido sustituido de átomo pesado; un aminoácido químicamente desdoblable o fotodesdoblable ; un aminoácido con una cadena lateral alargada; un aminoácido que contiene un grupo tóxico; un aminoácido sustituido de azúcar; un aminoácido de enlace de carbono que contiene azúcar; un aminoácido redox activo; un ácido que contiene a-hidroxi; un amino tioácido; un aminoácido disustituido a, ; un ß-aminoácido; un aminoácido cíclico diferente a prolina o histidina, un aminoácido aromático diferente a fenilalanina , tirosina, o triptofano, y/o lo similar. La invención proporciona también polipéptidos (0-RSs) y polinucleótidos, e.g., 0-ARNts, polinucleótidos que codifican para 0-RSs o porciones de los mismos (e.g., el sitio activo de la sintetasa), oligonucleótidos utilizados para construir mutantes de aminoacil-ARNt sintetasa, polinucleótidos que codifican para una proteína o polipéptido de interés que comprende uno o más codones selectores, etc. Por ejemplo, un polipéptido de la invención incluye un polipéptido que comprende una secuencia de aminoácidos como se establece en cualquiera de las SEQ ID NO. : 36-63, y/o 86, un polipéptido que comprende una secuencia de aminoácidos codificada mediante una secuencia de polinucleótidos como se establece en cualquiera de las SEQ ID NO.: 3-35, y un polipéptido que es específicamente inmunorreactivo con un anticuerpo específico para un polipéptido que comprende una
secuencia de aminoácidos como se muestra en cualquiera de las SEQ ID NO.: 36-63, y/o 86, o un polipéptido que comprende una secuencia de aminoácidos codificada mediante una secuencia de polinucleótidos como se muestra en cualquiera de las SEQ ID NO. : 3-35. Se incluye también entre los polipéptidos de la invención, un polipéptido que comprende una secuencia de aminoácidos que es al menos 90v. idéntica a la de una tirosil aminoacil-ARNt sintetasa (TyrRS) de origen natural (e.g., SEQ ID NO. : 2) y comprende dos o más aminoácidos de los grupos A-E (anotados anteriormente) . De forma similar, los polipéptidos de la invención incluyen también opcionalmente un polipéptido que comprende al menos 20 aminoácidos contiguos de cualquiera de las SEQ ID NO.: 36-63, y/o 86, y dos o más sustituciones de aminoácido como se indicó anteriormente en los grupos A-E. Una secuencia de aminoácidos que comprende una variación conservadora de cualquiera de los polipéptidos anteriores se incluye también como un polipéptido de la invención. En una modalidad, una composición incluye un polipéptido de la invención y un excipiente (e.g., amortiguador, agua, excipiente farmacéuticamente aceptable, etc.). La invención proporciona también anticuerpo o antisuero específicamente inmunorreactivo con un polipéptido de la invención.
Se proporcionan también polinucleótidos en la invención. Los polinucleótidos de la invención incluyen aquellos que codifican para proteínas o polipéptidos de interés de la invención con uno o más codones selectores. Además, los polinucleótidos de la invención incluyen, e.g., un polinucleótido que comprende una secuencia de nucleótidos como se establece en cualquiera de las SEQ ID NO.: 3-35, 64-85; un polinucleótido que es complementario a o que codifica para una secuencia de polinucleótidos del mismo; y/o un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácidos como se establece en las SEQ ID NO.: 36-63, y/o 86, o una variación conservadora de la misma. Un polinucleótido de la invención incluye también un polinucleótido que codifica para un polipéptido de la invención. De forma similar, un ácido nucleico que híbrida a un polinucleótido indicado anteriormente bajo condiciones altamente rigurosas sobre sustancialmente la longitud total del ácido nucleico es un polinucleótido de la invención. Un polinucleótido de la invención incluye también un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa (TyrRS) de origen natural (e.g., SEQ ID NO.: 2) y comprende dos o más mutaciones como se indicó anteriormente en los grupos A-E (anotados anteriormente) . Un polinucleótido que es al menos
70o, (o al menos 75%, al menos 80%, al menos 85%, al menos 90", al menos 95%, al menos 98%, o al menos 99% o más) idéntico al polinucleótido indicado anteriormente y/o un polinucleótido que comprende una variación conservadora de cualquiera de los polinucleótidos indicados anteriormente, se incluyen también entre los polinucleótidos de la invención. En ciertas modalidades, un vector (e.g., un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una modalidad, el vector es un vector de expresión. En otra modalidad, el vector de expresión incluye un promotor enlazado de manera operable a uno o más de los polinucleótidos de la invención. En otra modalidad, una célula comprende un vector que incluye un polinucleótido de la invención. En otro aspecto, la invención proporciona composiciones de compuestos y métodos de producción de tales compuestos. Por ejemplo, los compuestos incluyen, e.g., un aminoácido no natural (tal como p- (propargiloxi ) -fenilalanina (e.g., 1 en la Figura 11), tintes de azido (tales como los que muestra la estructura química 4 y la estructura química 6), un alquinilo poletilen glicol (e.g., como se muestra en la estructura química 7), en donde n es un entero entre e.g., 50 y 10,000, 75 y 5,000, 100 y 2.000,100 y 1,000, etc., y lo similar. En la modalidad de la invención, el alquinilo poletilen glicol tiene un peso molecular de, e.g. de
aproximadamente 5,000 a aproximadamente 100,000 Da, de aproximadamente 20,000 a aproximadamente 50,000 Da, de aproximadamente 20,000 a aproximadamente 10,000 Da (e.g. 20, 000 Da) . También se proporcionan varias composiciones que comprenden estos compuestos, e.g., con proteínas y células. En un aspecto, la composición que incluye el aminoácido no natural p- ( propargi loxi ) -fenilalanina incluye además un ARNt ortogonal. El aminoácido no natural puede encontrarse enlazado (e.g., covalentemente) al ARNt ortogonal, e.g. covalentemente enlazado al ARNt ortogonal a través de un ligando de amino-acilo, covalentemente enlazado a un 3' OH o a un 2' OH de una azúcar de terminal ribosa del ARNt ortogonal, etc . Los equipos son también una característica de la invención. Por ejemplo, se proporciona un equipo para producir una proteína que comprende al menos un aminoácido no natural en una célula, en donde el equipo incluye un envase que contiene una secuencia de polinucleótidos que codifica para un O-ARNt o un O-ARNt, y una secuencia de polinucleótidos que codifica para una O-RS o un O-RS. En una modalidad, el equipo incluye además al menos un aminoácido no natural. En otra modalidad, el equipo comprende además materiales de instrucción para producir la proteína. BREVE DESCRIPCIÓN DE LOS DIBUJOS
La figura 1 muestra la expresión aumentada de hGH utilizando el ARNt híbrido. DESCRIPCIÓN DETALLADA Antes de describir la presente invención en detalle, debe entenderse que esta invención no se limita a dispositivos o sistemas biológicos particulares, los cuales pueden, por supuesto variar. También debe entenderse que la terminología utilizada en la presente tiene el propósito de describir únicamente las modalidades particulares, y no intenta ser una limitante. Como se utilizó en esta especificación y en las reivindicaciones adjuntas, las formas en singular "un/a" y "el/la" incluyen referentes en plural a menos que el contenido claramente dicte lo contrario. Por tanto, por ejemplo, la referencia a "una célula" incluye una combinación de dos o más células; la referencia a "bacterias" incluye mezclas de bacterias, y lo similar. A menos que se defina de otra manera en la presente o mas adelante en el resto de la especificación, todos los términos técnicos o científicos utilizados en la presente tienen el mismo significado que se entiende comúnmente por los de experiencia ordinaria en la técnica a la que pertenece la invención. Homólogos: las proteínas y/o secuencias de proteínas son "homologas" cuando se derivan, natural o artificialmente, de una proteína ancestral común o una
secuencia de proteínas. De forma similar, los ácidos nucleicos o secuencias de ácidos nucleicos son homologas cuando se derivan natural o artificialmente, de un ácido nucleico ancestral común o secuencia de ácido nucleico. Por ejemplo, cualquier ácido nucleico de origen natural puede ser modificado por cualquier método de mutagénesis disponible para incluir uno o más codones selectores. Cuando se expresa, este ácido nucleico mutagenizado codifica para un polipéptido que comprende uno o más amino ácidos no naturales. El proceso de mutación, puede, por supuesto, alterar adicionalmente uno o más codones estándar, cambiando así uno o más aminoácidos estándar también en la proteína mutante resultante. La homología se infiere generalmente a partir de la similitud de secuencia entre dos o más ácidos nucleicos o proteínas (o sus secuencias) . El porcentaje preciso de similitud entre las secuencias, que es útil para establecer la homología, varía con el ácido nucleico y la proteína en cuestión, pero se utiliza rutinariamente tan poco como el 25% de similitud de secuencia para establecer la homología. Los niveles más altos de similitud de secuencia, e.g., 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% o 99% o más, pueden también utilizarse para establecer la homología. Los métodos para determinar los porcentajes de similitud de secuencia (e.g., BLASTP y BLASTN utilizando parámetros de falla) se describen en la presente y se encuentran
generalmente disponibles. Ortogonal: Como se utiliza en la presente, el término "ortogonal" se refiere a una molécula (e.g., un ARNt ortogonal (O-ARNt) y/o una aminoacil-ARNt sintetasa ortogonal (O-RS)) que funciona con componentes endógenos de una célula con eficiencia reducida en comparación con una molécula correspondiente que es endógena a la célula o sistema de traducción, o que no cumple la función con los componentes endógenos de la célula. En el contexto de los ARNts y aminoacil-ARNt sintetasas, ortogonal se refiere a una discapacidad o eficiencia reducida, e.g., menos del 20% de eficiencia, menos del 10% de eficiencia, menos del 5% de eficiencia, o menos del 1% de eficiencia, de un ARNt ortogonal para funcionar con una ARNt sintetasa endógena en comparación con un ARNt endógeno para funcionar con una ARNt sintetasa endógena, o de una aminoacil-ARNt sintetasa ortogonal para funcionar con un ARNt endógeno en comparación con una ARNt sintetasa endógena para funcionar con el ARNt endógeno. La molécula ortogonal carece de una molécula complementaria endógena funcional en la célula. Por ejemplo, un ARNt ortogonal en una célula se aminoacila mediante cualquier RS endógeno de la célula con eficiencia reducida o incluso ninguna, cuando se compara con la aminoacilación de un ARNt endógeno mediante el RS endógeno. En otro ejemplo, un RS ortogonal aminoacila cualquier RS endógeno en una
célula de interés con eficiencia reducida o incluso ninguna, en comparación con la aminoac i lac ión del ARNt endógeno mediante un RS endógeno. Puede introducirse una segunda molécula ortogonal dentro de la célula que funciona con la primera molécula ortogonal. Por ejemplo, un par de ARNt ortogonal/RS incluye componentes complementarios introducidos que funcionan juntos en la célula con una eficiencia (e.g., 50% de eficiencia, 60% de eficiencia, 70% de eficiencia, 75% de eficiencia, 80¾ de eficiencia, 90¾ de eficiencia, 95% de eficiencia, o 99% o más eficiencia) a la del par de ARNt /RS endógeno correspondiente. Complementario: El término "complementario" se refiere a componentes de un par ortogonal, 0-ARNt y O-RS que pueden funcionar juntos, e.g., en donde la O-RS aminoacila al O-ARNt. Preferentemente Aminoacila: El término
"preferentemente aminoacila" se refiere a una eficiencia, e.g., 70% eficiente, 75% eficiente, 85% eficiente, 90% eficiente, 95% eficiente, o 99% o más eficiente, a la cual una O-RS aminoacila un O-ARNt con un aminoácido no natural en comparación con la O-RS que aminoacila un ARNt de origen natural o un material de inicio utilizado para generar el 0-ARNt . El aminoácido no natural se incorpora dentro de la cadena de polipéptidos en crecimiento con alta fidelidad, e.g., a una eficiencia mayor que 75% para un codón selector
dado, a una eficiencia mayor que aproximadamente 80% para un codón selector dado, a una eficiencia mayor que 90% para un codón selector dado, a una eficiencia mayor que 95% para un codón selector dado o a una eficiencia mayor que 99% o más para un codón selector dado. Codón Selector: El término "codón selector" se refiere a codones reconocidos por el O-ARNt en un proceso de traducción y no reconocidos por un ARNt endógeno. El bucle anticodón O-ARNt reconoce al codón selector en el ARNm e incorpora su aminoácido, e.g., un aminoácido no natural, y este sitio en el polipéptido. Los codones selectores pueden incluir, e.g., codones sin sentido, tales como codones de parada, e.g., codones ámbar, ocre, y ópalo; cuatro o más codones base; codones raros; codones derivados de pares base naturales o no naturales y/o lo similar. ARNt Supresor: Un ARNt supresor es un ARNt que altera la lectura de un ARN mensajero (ARNm) en un sistema de traducción dado, e.g., proporcionando un mecanismo para incorporar un aminoácido dentro de una cadena de polipéptidos en respuesta a un codón selector. Por ejemplo, un ARNt supresor puede leerse mediante, e.g., un codón de parada, un codón de cuatro bases, un codón raro, y/o lo similar. ARNt Reciclable: El término "ARNt reciclable" se refiere a un ARNt que se aminoacila y puede re aminoacilarse repetidamente con un aminoácido (e.g., un aminoácido no
natural) para la incorporación del aminoácido (e.g., el aminoácido no natural) dentro de una o más cadenas de polipéptido durante la traducción. Sistema de traducción: El término "sistema de traducción" se refiere a un conjunto colectivo de componentes que incorporan un aminoácido de origen natural dentro de una cadena de polipéptidos en crecimiento (proteina) . Los componentes de un sistema de traducción pueden incluir, e.g., ribosomas, ARNts, sintetasas, ARNm, aminoácidos, y lo similar. Los componentes de la invención (e.g., ORS, ARNts, amino ácidos no naturales, etc.) pueden agregarse a un sistema de traducción in vitro o in vivo, e.g., una célula de vertebrado, e.g., una célula de levadura, una célula de mamífero, una célula de planta, una célula de alga, una célula de hongo, una célula de insecto, y/o lo similar. Aminoácido no Natural: Como se utiliza en la presente, el término "aminoácido no natural" se refiere a un aminoácido, aminoácido modificado, y/o análogo de aminoácido que no es uno de los 20 aminoácidos comunes de origen natural, seleno cisteína o pirrolisina. Derivado de: Como se utiliza en la presente, el término "derivado de" se refiere a un componente que se aisla a partir de o que se produce utilizando información de una molécula u organismo específico. RS Inactivo: Como se utiliza en la presente, el
término "RS inactivo" se refiere a una sintetasa que ha mutado de tal forma que ya no puede aminoacilar a su cognado natural ARNt con un aminoácido. Marcador de Selección o Clasificación Positiva: Como se utiliza en la presente, el término "marcador de selección o clasificación positiva" se refiere a un marcador que, cuando se encuentra presente, e.g., expresado, activado o lo similar, da como resultado la identificación de una célula con el marcador de selección positiva a partir de aquellas sin el marcador de selección positiva. Marcador de Selección o Clasificación Negativa: Como se utiliza en la presente, el término "marcador de selección o clasificación negativa" se refiere a un marcador que, cuando se encuentra presente, e.g., expresado, activado o lo similar, permite la identificación de una célula que no posee la propiedad deseada (e.g., comparada con una célula que posee la propiedad deseada) . Informante: Como se utiliza en la presente, el término "informante" se refiere a un componente que puede utilizarse para seleccionar componentes objetivo de un sistema de interés. Por ejemplo, un informante puede incluir un marcador fluorescente de clasificación (e.g., proteína verde fluorescente) , un marcador luminiscente (proteina de luciérnaga luciferasa), un marcador de clasificación en base a afinidad, o genes de marcador seleccionables tales como
his3, ura3, leu2, lys2, lacZ, ß-gal/lacZ ( -galactosidasa ) , Adh (alcohol dehidrogenasa), o lo similar. Vertebrado: Como se utiliza en la presente, el término "vertebrado" se refiere a organismos que pertenecen al dominio filogenético Eucarya tales como animales e.g., mamíferos, reptiles, aves, etc. No Eucarioto: Como se utiliza en la presente, el término "no eucarioto" se refiere a organismos no vertebrados. Por ejemplo, un organismo no vertebrado puede pertenecer al dominio filogenético Eubacteria (e.g., Escherichia coli, Thermus thermophilus , Bacillus stearothermophilus , etc.), o al dominio filogenético Archaea (e.g., Methanococcus jannaschii , Methanobacterium
Thermoautotrophicum , Ha lobacterium tal como Haloferax volcan i i y Halobacterium especie NRC-1, Archaeglobus fulgidus , Pyrococcus furiosus, Pyrococcus horikoshii , Aeuropyrum pernix, etc) . Anticuerpo: El término "anticuerpo", como se utiliza en la presente, incluye, pero no se limita a un polipéptido sustancialmente codificado por un gen de inmunoglobulina o genes de inmunoglobulina, o fragmentos de los mismos, que se enlazan específicamente y reconocen a un analito (antígeno) . Los ejemplos incluyen anticuerpos policlonales , monoclonales, quiméricos, y monocatenarios, y lo similar. Los fragmentos de inmunoglobulina, que incluyen
fragmentos Fab y fragmentos producidos mediante una biblioteca de expresión, incluyendo visualización de fago, se incluyen también en el término "anticuerpo" como se utiliza en la presente. Ver, e.g., Paul, Fundamental Immunology, (Inmunología fundamental) 4th Ed . , 1999, Raven Press, New York, para estructura y terminología de anticuerpos. Variante Conservativa: El término "variante conservativa" se refiere a un componente de traducción, e.g., un O-ARNt de variante conservativa o una O-RS de variante conservativa que funcionalmente se desempeñe como el componente en el que se basa la variante conservativa, e.g., un O-ARNt o O-RS, pero que tiene variaciones en la secuencia. Por ejemplo, una O-RS aminoacilará a un O-ARNt complementario o a un O-ARNt de variante conservativa con un aminoácido no natural, aunque el O-ARNt y el O-ARNt de variante conservativa no tengan la misma secuencia. La variante conservativa puede tener, e.g., una variación, dos variaciones, tres variaciones, cuatro variaciones, o cinco o más variaciones en secuencia, siempre que la variante conservativa se complemente con el O-ARNt o O-RS correspondiente. Agente de Selección o Clasificación: Como se utiliza en la presente, el término "agente de selección o clasificación" se refiere a un agente que, cuando se encuentra presente, permite la selección/clasificación de
ciertos componentes de una población. Por ejemplo, un agente de selección o clasificación incluye, pero no se limita a, e.g., un nutriente, un antibiótico, una longitud de onda de luz, un anticuerpo, un polinucleótido expresado (e.g., una proteina moduladora de transcripción), o lo similar. El agente de selección puede variar, e.g., en concentración, intensidad, etc. Sustancia Detectable: El término "sustancia detectable", como se utiliza en la presente, se refiere a un agente que, cuando se encuentra activado, alterado, expresado o lo similar, permite la selección/clasificación de ciertos componentes de una población. Por ejemplo, la sustancia detectable puede ser un agente químico, e.g., ácido 5-f luoroorótico (5-FOA), el cual bajo ciertas condiciones, e.g., expresión de un informante URA3, se vuelve detectable, e.g., un producto tóxico que mata las células que expresan el informante URA3. La habilidad para modificar genéticamente las estructuras de proteínas directamente en células de vertebrados, más allá de las limitaciones químicas impuestas por el código genético, proporcionaría una poderosa herramienta molecular tanto para probar como para manipular los procesos celulares. La invención proporciona componentes de traducción que expanden el número de aminoácidos genéticamente codificados en células de vertebrados. Estos
incluyen ARNts (e.q., ARNts ortogonales (O-ARNts ) ) , aminoacil-ARNt sintetasas (e.g., sintetasa ortogonal (O-RS)), pares de O-ARNt /O-RSs , y aminoácidos no naturales. Típicamente, los O-ARNts de la invención se expresan y se procesan eficientemente, y funcionan en la traducción en una célula de vertebrado, pero no se aminoacilan significativamente por las aminoacil-ARNt sintetasas huésped. En respuesta a un codón selector, un 0-ARNt de la invención suministra un aminoácido no natural, que no codifica ninguno de los veinte aminoácidos comunes, a una cadena de polipéptidos en crecimiento durante la traducción del ARNm . Un O-RS de la invención preferentemente aminoacila un O-ARNt de la invención con un aminoácido no natural en una célula de vertebrado, pero no aminoacila ninguno de los ARNts de huésped citoplásmico . Además, la especificidad de una aminoacil-ARNt sintetasa de la invención proporciona la aceptación de un aminoácido no natural mientras que excluye cualquier aminoácido endógeno. Los polipéptidos que incluyen secuencias de aminoácidos del ejemplo O-RSs, o porciones de las mismas, son también una característica de la invención. Además, lo polinucleótidos que codifican para componentes de traducción, O-ARNts, O-RSs y porciones de los mismos, son características de la invención. La invención proporciona también métodos para
producir los componentes de traducción deseados, e.g., O-RS, y/o un par ortogonal (ARNt ortogonal y aminoacil-ARNt sintetasa ortogonal) que utilizan un aminoácido no natural para su uso en una célula de vertebrado (y componentes de traducción producidos mediante tales métodos) . Por ejemplo, un par de tirosil-ARNt sintetasa/ARNt UA de E.coli es un par 0-ARNt/O-RS de la invención. Además, la invención también proporciona métodos para seleccionar/clasificar componentes de traducción en una célula de vertebrado, y una vez seleccionados /cías i ficados , utilizando aquellos componentes en una célula de vertebrado diferente (una célula de vertebrado que no se utilizó para selección/clasificación). Por ejemplo, los métodos de selección/clasificación para producir los componentes de traducción para células de vertebrados pueden llevarse a cabo en levadura, e.g., Saccha romyces cerevisiae, y después esos componentes seleccionados pueden utilizarse en otra célula de vertebrado, e.g., otra célula de levadura, una célula de mamífero, una célula de insecto, una célula de planta, una célula de hongo, etc. La invención proporciona además métodos para producir una proteína en una célula de vertebrado, en donde la proteína comprende un aminoácido no natural. La proteína se produce utilizando los componentes de traducción de la invención. La invención proporciona también proteínas (y
proteínas producidas mediante métodos de la invención) , que incluyen aminoácidos no naturales. La proteína o polipéptido de interés puede también incluir una modificación posttraducción e.g., que se agrega a través de una cicloadición [3+2], o una reacción nucleófi la-elect rófila , que no se produce mediante una célula proca riót ica , etc. En ciertas modalidades, los métodos para producir una proteína moduladora de transcripción con un aminoácido no natural (y las proteínas producidas mediante tales métodos) se incluyen también en la invención. Las composiciones, que incluyen proteínas que incluyen un aminoácido no natural son también una característica de la invención. Los equipos para producir una proteína o polipéptido con un aminoácido no natural son también una característica de la invención. Aminoacil-ARNt sintetasas ortogonales (O-RS) A fin de incorporar específicamente un aminoácido no natural dentro de una proteína o polipéptido de interés, en una célula de vertebrado, la especificidad del sustrato de la sintetasa se altera de tal forma que únicamente el aminoácido no natural, pero ninguno de los 20 aminoácidos comunes, se cargan al ARNt . Si la sintetasa ortogonal es promiscua, dará como resultado proteínas mutantes con una mezcla de aminoácidos naturales y no naturales en la posición objetivo. La invención proporciona composiciones de, y
métodos para, producir aminoacil-ARNt sintetasas ortogonales que tienen especificidad de sustrato modificada para un aminoácido no natural especifico. Una célula de vertebrado que incluye una aminoacil-ARNt sintetasa ortogonal (O-RS) es una característica de la invención. La O-RS preferentemente aminoacila a una ARNt ortogonal (O-ARNt) con un aminoácido no natural en una célula de vertebrado. En ciertas modalidades, la O-RS utiliza más de un aminoácido no natural, e.g., dos o más, tres o más, etc. Por tanto, una O-RS de la invención puede tener la capacidad de preferentemente aminoacilar a un O-ARNt con diferentes aminoácidos no naturales. Esto permite un nivel adicional de control mediante la selección de cual aminoácido no natural o combinación de aminoácidos no naturales, se colocan con la célula y/o seleccionando las diferentes cantidades de aminoácidos no naturales que se colocan con la célula para su incorporación. Un O-RS de la invención opcionalmente tiene una o más propiedades enzimáticas mejoradas o aumentadas para el aminoácido no natural en comparación con el aminoácido natural. Estas propiedades incluyen, e.g., mayor Km, menor Km, mayor kcat, menos kcat, menor kcat/km, mayor kcat/km, etc., para el aminoácido no natural, en comparación con el aminoácido de origen natural, e.g., uno de los 20 aminoácidos comunes conocidos.
Opcionalmente , la OR-S puede proporcionarse a una célula de vertebrado mediante un polipéptido que incluye una O-RS y/o mediante un pol inucleót ido que codifica para una 0-RS o una porción del mismo. Por ejemplo, un 0-RS, o una porción del mismo, se codifica mediante una secuencia de pol inucleót idos como se establece en cualquiera de las SEQ ID NO.: 3-35, o una secuencia de pol inucleótidos complementaria de la misma. En otro ejemplo, una 0-RS comprende una secuencia de aminoácidos como se establece en cualquiera de las SEQ ID NO.: 36-63, y/o 86, o una variación conservadora de la misma. Ver, e.g., las Tablas 5, 6 y 8, y el Ejemplo 6 en la presente para secuencias de moléculas 0-RS ejemplares. Un 0-RS puede comprender también una secuencia de aminoácidos que es, e.g., al menos 90%, al menos 95%, al menos 98%, al menos 99% o incluso al menos 99.5% idéntica a la de la tirosil aminoacil-ARNt sintetasa de origen natural (TyrRS) (e.g., como se establece en la SEQ ID NO.: 2) y comprende dos o más aminoácidos del grupo A-E. El grupo A incluye valina, isoleucina, leucina, glicina, serina, alanina, o treonina en una posición que corresponde a Tyr37 de TyrRS E. coli; el grupo B incluye aspartato en la posición correspondiente a Asnl26 de TyrRS E. coli; el grupo C incluye treonina, serina, arginina, asparagina o glicina en una posición correspondiente a Aspl82 de TyrRS E. coli; el grupo D incluye metionina, alanina, valina, o tirosina en una
posición correspondiente a Phel83 de TyrRS de E. coli; y, el grupo E incluye serina, meti.onína, valina, cisteína, treonina, o alanina en la posición correspondiente a Leul86 de TyrRS E . coli. Además de los O-RS, una célula de vertebrado de la invención puede incluir componentes adicionales, e.g., aminoácido ( s ) no natural (es) . La célula de vertebrado comprende además un ARNt ortogonal (O-ARNt) (e.g., derivado de un organismo vertebrado, tal como Escherichia coli, Bacillus stearotermofilus, y/o lo similar), en donde el 0-ARNt reconoce un codón selector y preferentemente se aminoacila con el aminoácido no natural mediante la 0-RS. Un ácido nucleico que comprende un pol inucleót ido que codifica para un polipéptido de interés, en donde el polinucleótido comprende un codón selector que se reconoce mediante un 0-ARNt, o una combinación de uno o más de estos, puede encontrarse también presente en la célula. En un aspecto, el O-ARNt regula la incorporación del aminoácido no natural dentro de una proteina con, e.g., al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95%, o 99% de eficiencia de dado que un ARNt comprende o se procesa a partir de una secuencia de polinucleótidos como se establece en la SEQ ID NO.: 65. En otro aspecto, la O-RS comprende la SEQ ID NO.: 65, y la O-RS comprende una secuencia de polipéptidos como se
establece en cualquiera de las SEQ ID NO.: 36-63, y/o 86, y/o variaciones conservadoras de la misma. Ver, e.g., la Tabla 5 y Ejemplo 6, en la presente, para secuencias de moléculas 0-RS y 0-ARNt ejemplares. En un ejemplo, una célula de vertebrado comprende una aminoacil-ARNt sintetasa ortogonal (0-ARNt), un ARNt ortogonal (0-ARNt), un aminoácido no natural, un ácido nucleico que comprende un pol inucleót ido que codifica para un polipéptido de interés, cuyo pol inucleót ido comprende un codón selector que se reconoce mediante el 0-ARNt. La 0-RS preferentemente aminoacila al ARNt ortogonal (0-ARNt) con el aminoácido no natural en la célula de vertebrado, y la célula produce el polipéptido de interés en ausencia del aminoácido no natural con un rendimiento que es, e.g., menor que 30%, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural. Los métodos para producir un O-RS, que son una característica de la invención, opcionalmente incluyen generar un conjunto de sintetasas mutantes a partir de la estructura de sintetasa de tipo salvaje, y después seleccionar RSs mutados en base a su especificidad para un aminoácido no natural relativo a los veinte aminoácidos comunes. Para aislar tal sintetasa, los métodos de selección son: (i) sensitivo, dado que la actividad de las sintetasas
deseadas a partir de las etapas iniciales puede ser baja y la población pequeña; (ii) "ajustable", dado que es deseable variar la rigurosidad de selección en diferentes etapas de selección; y, (iii) general, de tal forma que los métodos pueden utilizarse para diferentes aminoácidos no naturales. Los métodos para producir una aminoacil-ARNt sintetasa ortogonal (O-RS) que preferentemente aminoacila a un ARNt con un aminoácido no natural en una célula de vertebrado típicamente incluyen la aplicación de una combinación de una selección positiva seguida de una selección negativa. En la selección positiva, la supresión del codón selector introducido en la(s) posición (es) no esencial (es) de un marcador positivo permite a las células de vertebrados sobrevivir bajo la presión de la selección positiva. En presencia de aminoácidos no naturales, las supervivientes codifican por tanto, para las sintetasas activas que cargan al ARNt supresor ortogonal con un aminoácido no natural. En la selección negativa, la supresión de un codón selector introducido en la(s) posición (es) no esencial (es) de un marcador negativo retira las sintetasas con especificidades de aminoácido natural. Las supervivientes de la selección negativa y positiva codifican para sintetasas que aminoacilan (cargan) al ARNt supresor ortogonal con aminoácidos no naturales únicamente (o al menos preferentemente) .
Por ejemplo, el método incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, a una población de células de vertebrados de una primera especie, en donde las células de vertebrados pueden comprender cada una: i) un miembro de la biblioteca de aminoaci 1-ARNt sintetasas (RSs), ii) un ARNt ortogonal (0-ARNt), iii) un pol inucleót ido que codifica para un marcador de selección positiva, y vi) un polinucleótido que codifica para un marcador de selección negativa; en donde las células que sobreviven a la selección positiva comprenden un RS activo que aminoacila al ARNt ortogonal (0-ARNt) en presencia de un aminoácido no natural; y (b) someter a las células que sobreviven a la selección positiva, a selección negativa en ausencia de un aminoácido no natural para eliminar RSs activos que aminoacilan al 0-ARNt con un aminoácido natural, proporcionando de este modo la OR-S que preferentemente aminoacila al O-ARNt con el aminoácido no natural. El marcador de selección positiva puede ser de cualquier variedad de moléculas. En una modalidad, el marcador de selección positiva es un producto que proporciona un suplemento nutricional para el crecimiento, y la selección se lleva a cabo en un medio que carece de suplemento nutricional. Los ejemplos de polinucleótidos que codifican para marcadores de selección positiva incluyen, pero no se limitan a, e.g., un gen informante basado en complementar la
auxotrofia del aminoácido de una célula, un gene his3 (e.g., en donde el gene his3 codifica para una deshidratasa de fosfato glicerol imidazol, detectada proporcionando 3-aminotriazol (3-AT)), gen ura3, gen leu2, gen lys2, gen lacZ, gen adh, etc. Ver, e.g., G. M. Kishore, & D. M. Shah, (1998), ñmino acid biosynthesis inhibitors as herbicides, (Inhibidores de biosintesis de aminoácidos como herbicidas) Annual Review of Biochemistry 57:627-663. En una modalidad, la producción de lacZ se detecta mediante hidrólisis de orto-nitrofenil^-D-galactopiranosida (ONPG) . Ver, e.g., I. G. Serebri is kii , & E. A. Golemis, (2000), Uses of lacZ to study gene function: evaluation of beta- galactosidase assays employed in the yeast two-hybrid system, (Usos de lacZ para el estudio de la función del gen: evaluación de análisis de beta-galactosidasa empleados en el sistema de levadura de dos híbridos) Analytical Biochemistry 285:1-15. Los marcadores de selección positiva adicionales incluyen, e.g., luciferasa, proteína verde fluorescente (GFP) , YFP, EGFP, RFP, el producto de un gen resistente a antibiótico (e.g., cloranfenicol acetiltransferasa (CAT) ) , una proteína moduladora de transcripción (e.g., GAL ) , etc. Opcionalmente , el polinucleótido que codifica para un marcador de selección positiva comprende un codón selector. Un polinucleótido que codifica para el marcador de selección positiva puede enlazarse de forma operable con un
elemento de respuesta. Puede también encontrarse presente un pol inucleót ido adicional que codifica para una proteina moduladora de transcripción que modula la transcripción desde el elemento de respuesta, y comprende al menos un codón selector. La incorporación de un aminoácido no natural dentro de una proteina moduladora de transcripción mediante el O-ARNt aminoacilado con el aminoácido no natural da como resultado la transcripción del pol inucleótido (e.g., gen informante) que codifica para el marcador de selección positiva. Opcionalmente, el codón selector se sitúa en o sustancialmente cerca de una porción del pol inucleótido que codifica para un dominio de enlace de ADN de la proteina moduladora de transcripción. Un polinucleótido que codifica para el marcador de selección negativa puede también encontrarse enlazado de forma operable a un elemento de respuesta a partir del cual se regula la transcripción mediante la proteina moduladora de transcripción. Ver, e.g., A. J. DeMaggio, et al., (2000), The yeast splits-hybrid system, (El sistema de levadura de separación-híbrido) Method Enzymol. 328:128-137; H. M. Shih, et al., (1996), A positive genetic selection for disrupting proteín-protein interactions : Identification of CREB mutations that prevent asociation with the coactivator CBP, (Una selección genética positiva para romper las interacciones de proteína-proteína: identificación de
mutaciones CREB que evitan la asociación con el coactivador CBP) Proc. Nati. Acad. Sci. U.S.A. 93:13896-13901; M. Vidal, et al., (1996), Genetic characterization of a ma malian proteín-protein interact ion doma in by using a yeast reverse two-hybrid system. [comment], (Caracterización genética de un dominio de interacción de proteina-proteína en mamíferos utilizando un sistema de levadura de dos híbridos) Proc . Nati. Acad. Sci. U.S.A. 93:10321-10326; y, M. Vidal, et al., (1996), Reverse two-hybrid and one-hybrid Systems to detect dissociation of proteín-protein and DNA-protein interactions .[comment ] , (Sistemas inversos de dos híbridos y un híbrido para detectar la disociación de las interacciones de proteína-proteína y de ADN-proteína ) Proc. Nati. Acad. Sci . U.S.A. 93:10315-10320. La incorporación de un aminoácido natural dentro de la proteína moduladora de transcripción mediante el O-ARNt aminoacilado con un aminoácido natural, da como resultado la transcripción del marcador de selección negativa. Opcionalmente , el marcador de selección negativa comprende un codón selector. En una modalidad, el marcador de selección positiva y/o el marcador de selección negativa de la invención pueden comprender al menos dos codones selectores, los cuales pueden comprender cada uno o ambos al menos dos codones selectores diferentes o al menos dos codones selectores iguales. La proteína moduladora de transcripción es una
molécula que se enlaza (directa o indirectamente) a una secuencia de ácido nucleico (e.g., un elemento de respuesta) y modula la transcripción de una secuencia que se encuentra enlazada de forma operable con un elemento de respuesta. Una proteina moduladora de transcripción puede ser una proteina activadora de transcripción (e.g., GAL4, receptores de hormona nuclear, API, CREB, LEF/miembros de la familia tcf, SMADs, VP16, SP1, etc.), una proteina represora de transcripción (e.g., receptores de hormona nuclear, Groucho/ fami 1 ia tle, familia Engrailed, etc), o una proteina que puede tener ambas actividades dependiendo del ambiente (e.g., LEF/tcf, proteínas homobox, etc) . Un elemento de respuesta es típicamente una secuencia de ácido nucleico que se reconoce mediante la proteína moduladora de transcripción o un agente adicional que actúa junto con la proteína moduladora de transcripción. Otro ejemplo de proteína moduladora de transcripción es la proteína activadora de transcripción, GAL4. Ver, e.g., A. Laughon, et al., (1984), Identification of two proteins encoged by the Saccharomyces cerevisiae GAL4 gene, (Identificación de dos proteínas codificadas por el gen GAL4 de Saccharomyces cerevisiae) Molecular & Cellular Biology 4:268-275; A. Laughon, & R. F. Gasteland, (1984), Primary structure of the Saccharomyces cerevisiae GAL4 gene, (Estructura primaria del gen GAL4 de Saccharomyces
cerevisiae) Molecular & Cellular Biology 4:260-267; L. Keegan, et al., (1986), Separation of DNA binding from the transcription-activating funct ion of a vertébrate regulatory proteína, (Separación del enlace de ADN a partir de la función de transcripción-activación de una proteina reguladora de vertebrado) Science 231:699-704; y, M. Ptashne, (1988), How vertébrate transcripcional activators work, (Cómo funcionan los activadores de transc ipción vertebrados) Nature 335:683-689. Los 147 aminoácidos de terminal N de esta proteina de aminoácidos 881 forman un dominio de enlace de ADN (DBD) que se enlaza específicamente a una secuencia de ADN. Ver, e.g., M. Carey, et al., (1989), An amino-termínal fragment of GAL4 binds DNA as a dimer, (Un fragmento amino-terminal de GAL4 se enlaza a ADN como un dímero) J. Mol. Biol . 209:423-432; y, E. Ginger, et al., (1985), Specific DNA binding of GAL4 , a positive regulatory proteín of yeast, (Enlace de ADN específico de GAL4 , una proteína reguladora positiva de levadura) Cell 40:767-774. El DBD se enlaza, mediante una secuencia de intervención de proteína, a un dominio de activación del aminoácido 113 de terminal C (AD) que puede activar la transcripción cuando se enlaza a ADN. Ver, e.g., J. Ma, & M. Ptashne, (1987), Deletion análisis of GAL4 defines two transcripcional activating segments , (El análisis de supresión de GAL4 define dos segmentos de activación de transcripción) Cell 48:847-853: y, J. Ma, & M.
Ptashne, (1987), The ca rboxy- termina 1 30 amino acids of GAL4 are recogni zeci by GAL80, (Los 30 aminoácidos de terminal carboxi de GAL4 se reconocen por GAL80 ) Cell 50:137-142. Al colocar los codones ámbar, e.g., hacia el DBD de terminal N de un único polipéptido que contiene tanto el DBD de terminal N de GAL4 como su AD de terminal C, la supresión ámbar mediante el par de O-ARNt/O-RS puede enlazarse para activación de transcripción mediante GAL4. Los genes informantes activados de GAL4 pueden utilizarse para llevar a cabo selecciones tanto positivas como negativas con el gen. El medio utilizado para la selección negativa puede comprender un agente de selección o clasificación que se convierte en una sustancia detectable mediante el marcador de selección negativa. En un aspecto de la invención, la sustancia detectable es una sustancia tóxica. Un polinucleótido que codifica para un marcador de selección negativa puede ser, e.g., un gene ura3. Por ejemplo, el informante URA3 puede colocarse bajo el control de un promotor que contiene sitios de enlace de ADN GAL4. Cuando se produce el marcador de selección negativa, e.g., mediante la traducción de un polinucleótido que codifica para el GAL4 con codones selectores, GAL4 activa la transcripción de URA3. La selección negativa se logra sobre un medio que comprende ácido 5-fluoroorótico (5-FOA), que se convierte en una sustancia detectable (e.g., una sustancia tóxica que mata a
la célula) mediante el producto de gen del gen ura3. Ver, e.g., J. D. Boeke, et al., (1984), A positive selection for mutants lacking orotídíne-5 ' -phosphate decarboxylase activity in yeast: 5 -fluoroorot ic acid resistance, (Una selección positiva para mutantes que carecen de actividad de orotidina-50-fosfato decarboxilasa en levadura: resistencia de ácido 5-f 1 uoroorót ico ) Molecular & General Genetics 197:34 -346) M. Vidal, et al., (1996), Genetic characterization of a mammalian protein-protein interaction doma in by using a yeast reverse two-hybrid system [comment] (Caracterización genética de un dominio de interacción de prote ina-proteina utilizando un sistema inverso de levadura de dos híbridos) Proc . Nati. Acad. Sci. U. S. A. 93:10321-10326; y M. Vidali, et al., (1996), Reverse two-hybrid and one-hybrid Systems to detect dissasociation of protein-protein and DNñ-protein interaction [comment] (Sistemas inversos de dos híbridos y un híbrido para detectar la disociación de la interacción de proteína-proteína y de ADN-proteína ) Proc. Nati. Acad. Sci. U. S. A. 93 : 10315-10320. Como con el marcador de selección positiva, el marcador de selección negativa puede ser también cualquiera de una variedad de moléculas. En una modalidad, el marcador de selección positiva y/o el marcador de selección negativa es un polipéptido que imparte fluorescencia o cataliza una reacción de luminiscencia en presencia de un reactivador
adecuado. Por ejemplo, los marcadores de selección negativa incluyen, pero no se limitan a, e.g., luciferasa, proteina verde fluorescente (GFP) , YFP, EGFP, RFP, el producto del gene lacZ, proteina moduladora de transcripción, etc. En un aspecto de la invención, el marcador de selección positiva y/o el marcador de selección negativa se detectan mediante la clasificación de la célula de activación mediante fluorescencia (FACS) o mediante luminiscencia. En otro ejemplo, el marcador de selección positiva y/o el marcador de selección negativa comprenden un marcador de clasificación en base a afinidad. El mismo polinucleótido puede codificar tanto para el marcador de selección positiva como para el marcador de selección negativa. Pueden utilizarse también niveles adicionales de rigurosidad de selección/clasificación en los métodos de la invención. Las rigurosidad de selección o clasificación puede variar en una o ambas etapas del método para producir un O-RS . Esto puede incluir, e.g., variar la cantidad de elementos de respuesta en un polinucleótido que codifica para el marcador de selección positiva/negativa, agregando una cantidad variable de la sintetasa inactiva a una o ambas etapas, variar la cantidad del agente de selección/clasificación utilizado, etc. Pueden también llevarse a cabo rondas adicionales de selección positiva y/o negativa.
La selección o clasificación puede también comprender una o más selecciones o clasificaciones positivas o negativas que incluyen, e.g., un cambio en la permeabilidad del aminoácido, un cambio en la eficiencia de traducción, un cambio en la fidelidad de traducción, etc. Típicamente, los uno o más cambios se basan en la mutación de uno o más pol inucleót idos que comprenden o codifican para componentes de un par de sintetasa ARNt/ARNt ortogonal que se utiliza para producir proteínas. Pueden utilizarse también estudios de enriquecimiento del modelo para seleccionar rápidamente una sintetasa activa a partir de un exceso de sintetasas inactivas. Pueden llevarse a cabo estudios de selección de modelo positivo y/o negativo. Por ejemplo, las células de vertebrados que comprenden aminoacil-ARNt sintetasas potencialmente activas se mezclan con un exceso de veces variable de aminoacil-ARNt sintetasas inactivas. Se hace una comparación de proporción entre células que crecen en un medio no selectivo y se analizan mediante, e.g., revestimiento X-GAL, y aquellas que han crecido y son capaces de sobrevivir en un medio selectivo (e.g., en ausencia de histidina y/o uracilo) y se analizan mediante, e.g., análisis X-GAL. Para una selección de modelo negativo, se mezclan aminoacil-ARNt sintetasas potencialmente activas con un exceso de veces variable de aminoacil-ARNt sintetasas
inactivas y la selección se lleva a cabo con una sustancia de selección negativa, e.g., 5-FOA. Típicamente, la biblioteca de RSs (e.g., la biblioteca de RSs mutantes) comprende RSs derivados de al menos una aminoacil-ARNt sintetasa (RS), e.g., a partir de un organismo invertebrado. En una modalidad, la biblioteca de RSs se deriva de un RS inactivo, e.g., en donde el RS inactivo se genera mediante la mutación de un RS activo, e.g., en el sitio activo en la sintetasa, en el sitio de mecanismo de edición en la sintetasa, en diferentes sitios mediante la combinación de diferentes dominios de sintetasas, o lo similar. Por ejemplo, los residuos en el sitio activo del RS mutan a, e.g., residuos de alanina. El polinucleótido que codifica para el RS mutado a alanina se utiliza como plantilla para mutagenizar los residuos de alanina a todos los 20 aminoácidos. La biblioteca de RSs mutantes se selecciona/clasifica para producir la OR-S. En otra modalidad, el RS inactivo comprende una bolsa de enlace de aminoácido y uno o más aminoácidos que comprenden la bolsa de enlace se sustituyen con uno o más aminoácidos diferentes. En un ejemplo, los aminoácidos sustituidos se sustituyen por alaninas. Opcionalmente , el polinucleótido que codifica para el RS mutado a alanina se utiliza como plantilla para mutagenizar los residuos de alanina a todos los 20 aminoácidos y se selecciona/clasifica.
El método para producir una O-RS puede incluir además producir la biblioteca de RSs utilizando varias técnicas de mutagénesis conocidas en la técnica. Por ejemplo, los Rss mutantes pueden generarse mediante mutaciones especificas del sitio, mutaciones de punto aleatorio, recombinación homologa, arrastre de ADN u otros métodos de mutagénesis recurrentes, construcción quimérica o cualquier combinación de los mismos. Por ejemplo, la biblioteca de RSs mutantes puede producirse a partir de dos o más "sub-bibliotecas" diferentes, e.g., más pequeñas, menos diversas. Una vez que las sintetasas se han sometido a la estrategia de selección/clasificación positiva y/o negativa, estas sintetasas pueden entonces someterse a mutagénesis adicional. Por ejemplo, puede aislarse un ácido nucleico que codifica para la OR-S; un conjunto de polinucleótidos que codifican O-RSs mutados (e.g., mediante mutagénesis aleatoria, mutagénesis especifica del sitio, recombinación o cualquier combinación de las mimas) puede generarse a partir del ácido nucleico; y, estas etapas individuales o una combinación de estas etapas puede repetirse hasta obtener una O-RS mutado que preferentemente aminoacila al O-ARNt con el aminoácido no natural. En un aspecto de la invención, las etapas se llevan a cabo al menos dos veces. Pueden encontrarse detalles adicionales para producir O-RS en la WO 2002/086075 titulada "Method and
compositions for the production of orthogonal tRNA-aminoaci ltRNA syntethase pairs". (Método y composiciones para la producción de pares de ARNt ortogonal-aminoacil-ARNt sintetasa) Ver también, Hamano-Takaku et al., (2002) A mutante Escherichía coli Tyrosyl-tRNA Syntethase Utilizes the [innatural Amino Acid Azatyrosine More Efficiently than Tyrosine , (Una tirosil-ARNt sintetasa mutante de Escherichía coli utiliza el aminoácido no natural Azatirosina, más eficientemente que tirosina) Journal of Biological Chemistry, 275 (51) : 40324-40328 ; Kiga et al., (2002) An Engineered Escherichía coli tyrosyl-tRNA syntethase for site-specífic incorporation of an unnatural amino acid into proteins in vertébrate translation and its application in a wheat germ cell-free system, (Una tirosil-ARNt sintetasa de Escherichía coli fabricada para la incorporación específica en el sitio de un aminoácido no natural en proteínas en la traducción en vertebrados y su aplicación en un sistema libre de células de germen de trigo) PNAS 99 ( 15 ): 9715-9723 ; y, Flancklyn et al., (2002), Aminoacil -tRNA syntethases: Versátil players in the changing theater of translation ; (Actores versátiles en el cambiante teatro de la traducción) RNA 8:1363-1372. ARNts ortogonales Las células eucarióticas que incluyen un ARNt ortogonal se proporcionan mediante la invención. El ARNt ortogonal regula la incorporación de un aminoácido no natural
dentro de una proteína que se codifica por un polinucleótido que comprende un codón selector que se reconoce mediante el O-ARNt, in vivo. En ciertas modalidades, un O-ARNt de la invención media la incorporación de un aminoácido no natural dentro de la proteína con, e.g., al menos 40%, al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, o incluso 90% o más eficientemente que el ARNt que comprende o se procesa dentro de una célula a partir de una secuencia de polinucleótidos como se establece en la SEQ ID NO.: 65. Ver, Tabla 5, en la presente. Un ejemplo de un O-ARNt de la invención es la SEQ ID NO. : 65. {Ver Ejemplo 6 y Tabla 5, en la presente) . La SEQ ID NO.: 65 es una transcripción pre-unida/procesada que opcionalmente se procesa en la célula, e.g., utilizando maquinaria estándar de procesamiento y unión celular endógena, y modificada para formar un O-ARNt activo. Típicamente, una población de tales transcripciones de pre-unión forma una población de ARNts activos en una célula. La invención incluye también variaciones conservadoras del 0-ARNt y sus productos celulares procesados. Por ejemplo, las variaciones conservadoras de O-ARNt incluyen aquellas moléculas que funcionan como el O-ARNt de la SEQ ID NO.: 65 y mantienen la estructura en forma de L del ARNt en forma procesada, pero que no tienen la misma secuencia (y son diferentes a las moléculas de ARNt de tipo silvestre) .
Típicamente, un O-ARNt de la invención es un O-ARNt reciclable, debido a que el O-ARNt puede ser reaminoacilado in vivo para mediar otra vez la incorporación del aminoácido no natural dentro de una proteína que se codifica por un pol inucleót ido en respuesta a un codón selector. La transcripción del ARNt en eucariotos, pero no en procariotos, se lleva a cabo mediante ARN Polimerasa III, que aplica restricciones sobre la secuencia principal de los genes estructurales de ARNt que pueden transferirse en células de vertebrados. Además, en células de vertebrados, es necesario exportar los ARNts desde el núcleo, en donde se transcriben, al citoplasma, para funcionar en la traducción. Los ácidos nucleicos que codifican para un O-ARNt de la invención o para un polinucleót ido complementario del mismo son también una característica de la invención. En una aspecto de la invención, un ácido nucleico que codifica para un O-ARNt de la invención incluye una secuencia de promotor interno, e.g., una casilla A (e.g., TRGCNNAGY) y una casilla B (e.g., GGTTCGANTCC, SEQ ID NO. : 95) . Ejemplos adicionales de las secuencias de casilla A y casilla B pueden encontrarse en Geiduschek, (1988), Transcription by RNA Polymerase III, (Transcripción mediante ARN polimerasa III) Ann. Rev. Biochem. 57:873-914, que se incorpora en la presente mediante la referencia. El O-ARNt de la invención puede también modificarse de manera post-transcripcional . Por ejemplo, la
modificación post-transcripción de genes de ARNt en eucariotos incluye retirar las secuencias de extremo 5'- y 3' mediante Rnasa P y una endonucleasa 3'-, respectivamente. La adición de la secuencia 3'-CCA es también una modificación post-transcripción de un gene de ARNt en eucariotos. En una modalidad, se obtiene un O-ARNt sometiendo a selección negativa a una población de células de vertebrados de una primera especie, en donde las células de vertebrados comprenden un miembro de la biblioteca de ARNts. La selección negativa elimina a las células que comprenden un miembro de la biblioteca de ARNts que se aminoacila mediante una aminoacil-ARNt sintetasa (RS) que es endógena a las células de vertebrados. Esto proporciona un depósito de ARNts que son ortogonales a la célula de vertebrado de la primera especie. Alternativamente, o en combinación con otros métodos descritos anteriormente para incorporar un aminoácido no natural dentro de un polipéptido, puede utilizarse un sistema de trans-traducción . Este sistema involucra a una molécula llamada ARNtm presente en Escherichia coli. Esta molécula de ARN se relaciona estructuralmente con una alanil ARNt y se aminoacila mediante la alanil sintetasa. La diferencia entre Arntm y ARNt es que el bucle anticodón se reemplaza con una secuencia grande especial. Esta secuencia permite que el ribosoma reanude la traducción sobre
secuencias que se han atascado utilizando un marco de lectura abierta codificada dentro del ARNtm como plantilla. En la invención, un ARNtm ortogonal puede generarse para preferentemente aminoacilarse con una sintetasa ortogonal y cargarse con un aminoácido no natural. Mediante la transcripción de un gen por el sistema, el ribosoma se atasca en un sitio especifico; el aminoácido no natural se introduce en el sitio, y la traducción se reanuda utilizando la secuencia codificada dentro del ARNtm ortogonal. Los métodos adicionales para producir ARNts ortogonales recombinantes pueden encontrarse, e.g., en las solicitudes de patente Internacional WO 2002/086075, titulada "Methods and compositions for the production of orthogonal tRNA-aminoaci ItRNA synthetase pairs". (Métodos y composiciones para la producción de pares de ARNt ortogonal-aminoaci 1-ARNt sintetasa). Ver también, Forster et al., (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo (Programación de sintetasas peptidomiméticas traduciendo los códigos genéticos diseñados de novo) PNAS 100 ( 11 ): 6353-6357 ; y, Feng et al., (2003), Expanding tRNA recognition of a RNA synthetase by a single amino acid change, (Extensión del reconocimiento de ARNt de una ARN sintetasa mediante un solo cambio de aminoácido) PNAS 100 (10) : 5676-5681. Pares de ARNt ortogonal y aminoacil-ARNt sintetasa
ortogonal . Un par ortogonal se compone de un O-ARNt, e.g., un ARNt supresor, una estructura de cambio ARNt, o lo similar, y un O-RS. El O-ARNt no se encuentra acilado por sintetasas endógenas y es capaz de mediar la introducción de un aminoácido no natural dentro de una proteina que se encuentra codificada por un pol inucleót ido que comprende un codón selector que se reconoce por el O-ARNt in vivo. La O-RS reconoce al O-ARNt y preferentemente aminoacila al O-ARNt con un aminoácido no natural en una célula de vertebrado. Los métodos para producir pares ortogonales junto con los pares ortogonales producidos mediante tales métodos y las composiciones de pares ortogonales para su uso en células de vertebrados se incluyen en la invención. El desarrollo de múltiples pares de ARNt ortogonal/sintetasa puede permitir la incorporación simultánea de múltiples aminoácidos no naturales utilizando diferentes codones en una célula de vertebrado . Un par de O-ARNt ortogona 1 /O-RS en una célula de vertebrado puede producirse importando un par, e.g., un par de supresor sin sentido, desde un organismo diferente con aminoacilación de especies cruzada ineficiente. El O-ARNt y la OR-S se expresan eficientemente y se procesan en la célula de vertebrado y el O-ARNt se exporta eficientemente desde el núcleo hacia el citoplasma. Por ejemplo, uno de tales pares
es el par de tirosil-ARNt sintetasa/ARNtCuA de E. coli (ver e.g., H. M. Goodman, et al., (1968), Nature 217:1019-24; y D. G. Barker, et al., (1982), FEBS Letters 150:419-23) . La tirosil-ARNt sintetasa de E. coli aminoacila eficientemente a su cognado ARNt,-nA de E. coli cuando ambos se expresan en el citoplasma de S . cerevi siae, pero no aminoacila los ARNts de S. cerevisiae. Ver, e.g., H. Edwards, & P. Schimmel, (1990), Molecular & Cellular Biology (Biología molecular y celular) 10:1633-41; y, H. Edwards, et al., (1991), PNAS United States of America 88:1153-6. Además, tirosil ARNtCUA de E. coli es un sustrato pobre para las aminoacil-ARNt sintetasas de S. cerevisiae (ver, e.g., V. Trezeguet, et al., (1991), Molecular & Cellular Biology 11:2744-51), pero funciona eficientemente en la traducción de proteínas en S. cerevisiae. Ver, e.g., H. Edwards, & P. Schimmel, (1990) Molecular & Cellular Biology 10:1633-41; H. Edwards, et al., (1991), PNAS United States of America 88:1153-6; y, V. Trezeguet, et al., (1991), Molecular & Cellular Biology 11:2744-51. Además, TyrRS de E. coli no tiene ningún mecanismo de edición para corregir un aminoácido no natural enlazado al ARNt . El O-ARNt y la OR-S pueden ser de origen natural o pueden derivarse mediante la mutación de un ARNt y/o RS de origen natural, lo cual genera bibliotecas de ARNts y/o bibliotecas de RSs, a partir de una variedad de organismos.
Ver la sección titulada "Fuentes y Huéspedes" en la presente. En varias modalidades, el O-ARNt y la OR-S se derivan a partir de al menos un organismo. En otra modalidad, el 0-ARNt se deriva a partir de un ARNt de origen natural o de origen natural mutado de un primer organismo y la 0-RS se deriva a partir de un RS de origen natural o de origen natural mutado de un segundo organismo. En una modalidad, los organismos no vertebrados primero y segundo son el mismo. Alternativamente, los organismos no vertebrados primero y segundo pueden ser diferentes. Ver las secciones en la presente tituladas "Aminoacil-ARNt sintetasas ortogonales" y "O-ARNt" para métodos para producir O-RSs y 0-ARNts. Ver también, la solicitud de patente Internacional WO 2002/086075, titulada "Methods and compositions for the production of orthogonal tRNA-aminoaciltRNA synthetase pairs" (Métodos y composiciones para la producción de pares de ARNt ortogonal-aminoacil-ARNt sintetasa ) . Fidelidad, Eficiencia y Rendimiento La fidelidad se refiere a la precisión con la que una molécula deseada, e.g., un aminoácido no natural o aminoácido, se incorpora dentro de un polipéptido en crecimiento en una posición deseada. Los componentes de traducción de la invención incorporan aminoácidos no naturales, con alta fidelidad, dentro de proteínas en
respuesta a un codón selector. Por ejemplo, utilizando los componentes de la invención, la eficiencia de la incorporación de un aminoácido no natural deseado dentro de una cadena de polipéptidos en crecimiento en una posición deseada (e.g., en respuesta a un codón selector), es, e.g., mayor que 75%, mayor que 85'?'·,, mayor que 95%, o incluso mayor que 99¾ o más eficiente en comparación con la incorporación no deseada de un aminoácido natural especifico que se ha incorporado dentro de una cadena de polipéptidos en crecimiento en una posición deseada. La eficiencia puede también referirse al grado al cual la O-RS aminoacila al O-ARNt con el aminoácido no natural comparado con el control relevante. Los O-RSs de la invención pueden definirse por su eficiencia. En ciertas modalidades de la invención, una O-RS se compara con otro O-RS . Por ejemplo, una O-RS de la invención aminoacila a un 0-ARNt con un aminoácido no natural, e.g., al menos 40%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95%, o incluso 99% o más eficientemente de lo que una O-RS que tiene una secuencia de aminoácido, e.g., como se establece en la SEQ ID NO. : 86 o 45 (u otro RS especifico en la Tabla 5) aminoacila a un O-ARNt. En otra modalidad, una O-RS de la invención aminoacila al O-ARNt con un aminoácido no natural al menos 10-veces, al menos 20 veces, al menos 30 veces, etc., más eficientemente de lo que
la O-RS aminoacila al O-ARNt con un aminoácido natural. Utilizando los componentes de traducción de la invención, el rendimiento del polipéptido de interés que comprende el aminoácido no natural es, e.g., al menos 5%, al menos 10%, al menos 20%, al menos 30%, al menos 40%, 50% o más, del obtenido para el polipéptido de origen natural de interés a partir de una célula en la que el polinucleótido carece de codón selector. En otro aspecto, la célula produce el polipéptido de interés en ausencia de un aminoácido no natural con un rendimiento que es, e.g., menor que 30%, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural. Fuente y organismos huésped Los componentes de traducción ortogonales de la invención son típicamente derivados de organismos invertebrados para su uso en células de vertebrados o en sistemas de traducción. Por ejemplo, el O-ARNt ortogonal puede derivarse de un organismo invertebrado, e.g., una eubacteria, tal como Escherichia coli, Thermus thermophilus , Bacillus stearothermophilus , o lo similar, o una archaebacteria , tal como Methanoccocus j annaschii , Methanobacterium Thermoautotrophicum , Halobacterium tal como Haloferax volcanii y Halobacterium de especie NRC-1, ñrchaeoglobus fulgidus , Pyroccocus furiosus , Pyroccocus
horikoshii , Aeuropyrum pernix, o lo similar, mientras que la O-RS ortogonal puede derivarse de un organismo invertebrado, e.g., eubacterium, tal como Escherichia coli, Thermus thermophí lus , Bací 1 lus stea rothermophi lus , o lo similar, o una a rchaebacteria , tal como Methanoccocus jannaschii , Methanobacterium Thermoautotrophicum, Ha lobacterium tal como Haloferax volcanii y Halobacterium de especie NRC-1, Archaeoglobus fulgidus , Pyroccocus furiosus, Pyroccocus horikoshii, Aeuropyrum pernix, o lo similar. Alternativamente, las fuentes de vertebrados pueden también utilizarse, e.g., plantas, algas, protistas, hongos, levaduras, animales (e.g., mamíferos, insectos, artrópodos, etc.), o lo similar, e.g., en donde los compuestos son ortogonales a una célula o sistema de traducción de interés, o en donde se modifican (e.g., mutan) para ser ortogonales a una célula o sistema de traducción. Los componentes individuales de un par O-ARNt/O-RS pueden derivarse del mismo organismo o de diferentes organismos. En una modalidad, el par de O-ARNt/O-RS es del mismo organismo. Por ejemplo, el par de O-ARNt/O-RS puede derivarse de un par de tirosil-ARNt sintetasa/ARNtCuA a partir de E.coli. Alternativamente, el O-ARNt y la O-RS del par de O-ARNt/O-RS son opcionalmente de diferentes organismos. El O-ARNT ortogonal, O-RS o par de O-ARNt/O-RS pueden seleccionarse o clasificarse y/o utilizarse en una
célula de vertebrado para producir un polipéptido con un aminoácido no natural. Una célula de vertebrado puede ser de una variedad de fuentes, e.g., cualquier animal vertebrado (e.g., un mamífero, un anfibio, aves, reptiles, peces, etc.), o lo similar. Las composiciones de células de vertebrados con los componentes de traducción de la invención son también una característica de la invención. La invención proporciona también la clasificación eficiente en una especie para uso opcional en esa especie y/o en una segunda especie (opcionalmente, sin selección/clasificación adicional). Por ejemplo, los componentes del O-ARNt/O-RS se seleccionan o se clasifican en una especie, e.g., una especie fácilmente manipulada (tal como una célula de levadura, etc) y se introducen dentro de una segunda especie de vertebrado, e.g., planta (e.g., un complejo de planta tal como monocitos, o dicotos), un alga, un protist, un hongo, una levadura, un animal (e.g., un mamífero, un insecto, un artrópodo, etc) , o lo similar, para su uso en la incorporación in vivo de un aminoácido no natural en una segunda especie. Por ejemplo Saccharomyces cerevisiae (S. cerevisiae) puede seleccionarse como la primera especie de vertebrado, dado que es unicelular, tiene un tiempo de generación rápido, y genética relativamente bien caracterizada. Ver, e.g., D. Burke, et al., (2000) Methods
in Yeast Genetics. (Métodos en la genética de la levadura) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. Además, dado que la maquinaria de traducción de eucariotos es altamente conservada {ver, e.g., (1996), Translational Control . (Control de traducción) Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Y. Kwok, & J. T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and euka ryotes determined by use of aminoacyl-tRNA synthetases as phylogenet ic probes, (Relación evolutiva entre Halobacterium cutirubrum y eucariotos determinada por el uso de aminoacil-ARNt sintetasas como sondas filogenéticas ) Canadian Journal of Biochemistry 58:213-218; y, (2001) The Ribosome . Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) , pueden introducirse los genes aaRSs para la incorporación de aminoácidos no naturales descubiertos en S.cerevisiae en organismos vertebrados mayores y utilizarse, en conjunto con ARNts cognado (ver, e.g., K. Sakamoto, et al., (2002), Site-specific incorporation of an unnatural amino acid into proteins en mammalian cells, (Incorporación especifica del sitio de un aminoácido no natural en proteínas en células de mamífero) Nucleic Acids Res. 30 : 4692-4699 ; y, C. Kohrer, et al., (2001), Import of amber and ochre supresor tRNA' s into mammalian cells: a general approach to site-specific insertion of amino acid analogues into proteins (Importación de ARNts supresores ámbar y ocre en células de
mamífero: un procedimiento general para la inserción específica en el sitio de análogos de aminoácido en proteínas) Proc. Nati. Acad. Sci . U.S. A. 98:14310-14315) para incorporar aminoácidos no naturales. En un ejemplo, el método para producir O-ARNt /O-RS en una primera especie como se describe en la presente, incluye además introducir un ácido nucleico que codifica para el O-ARNt y un ácido nucleico que codifica para la OR-S dentro de la célula de vertebrado de una segunda especie (e.g., un mamífero, un insecto, un hongo, un alga, una planta y lo similar) . En otro ejemplo, un método para producir una aminoaci 1-ARNt sintetasa ortogonal (O-RS que preferentemente aminoacila a un ARNt ortogonal con un aminoácido no natural en una célula de vertebrado) incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, a una población de células de vertebrados de una primera especie (e.g., levadura y lo similar) . Cada una de las células de vertebrados comprende: i) un miembro de la biblioteca de aminoacil-ARNt sintetasas (RSs), ii) un ARNt ortogonal (0-ARNt), iii) un polinucleótido que codifica para un marcador de selección positiva, y vi) un polinucleótido que codifica para un marcador de selección negativa. Las células que sobreviven a la selección positiva comprenden un RS activo que aminoacila al ARNt ortogonal (O-ARNt) en presencia de un aminoácido no natural. Las células que sobreviven a la
selección positiva se cometen a selección negativa en ausencia de aminoácido no natural para eliminar RSs activos que aminoacilan al O-ARNt con un aminoácido natural. Esto proporciona una O-RS que preferentemente aminoacila al O-ARNt con el aminoácido no natural. Un ácido nucleico que codifica para el O-ARNt y un ácido nucleico que codifica para la OR-S (o los compuestos de O-ARNt y/o O-RS) se introducen dentro de una célula de vertebrado de la segunda especie e.g., un mamífero, un insecto, un hongo, un alga, una planta y/o lo similar. Típicamente, el O—ARNt se obtiene sometiendo a selección negativa a una población de células de vertebrados de una primera especie, en donde las células de vertebrados comprenden un miembro de la biblioteca de ARNts. La selección negativa elimina a las células que comprenden al miembro de la biblioteca de ARNts que se aminoacila mediante la aminoaci 1-ARNt sintetasa (RS) que es endógena a las células de vertebrados, lo cual proporciona un depósito de ARNts que son ortogonales a la célula de vertebrado de la primera especie y la segunda especie. Codones selectores Los codones selectores de la invención expanden la estructura del codón genético de la maquinaria biosintética de proteínas. Por ejemplo, un codón selector incluye, e.g., un codón único de tres bases, un codón sin sentido, tal como un codón de parada, e.g., un codón ámbar (UAG) , un codón
ópalo (UAG), un codón no natural, al menos un codón de cuatro bases, un codón raro, o lo similar. Puede introducirse un número de codones selectores dentro del gen deseado, e.g., uno o más, dos o más, más de tres, etc. Un gen puede incluir múltiples copias de un codón selector dado, o puede incluir múltiples codones selectores diferentes, o cualquier combinación de los mismos. En una modalidad, los métodos involucran el uso de un codón selector que es un codón de parada para la incorporación de aminoácidos no naturales in vivo en una célula de vertebrado. Por ejemplo, se produce un O-ARNt que reconoce al codón selector, e.g., UAG, y se aminoacila por una O-RS con un aminoácido no natural deseado. Este O-ARNt no se reconoce por las aminoacil-ARNt sintetasas huésped de origen natural. La mutagénesis dirigida al sitio convencional puede utilizarse para introducir el codón selector, e.g., TAG, en el sitio de interés en un polipéptido de interés. Ver, e.g., Sayers, J. R., et al., (1988), 5', 3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagénesis . (Exonucleasa en la mutagénesis en base a fosforotioato dirigida al oligonucleótido) Nucleic Acids Res 791-802. Cuando la O-RS, el O-ARNt y el ácido nucleico que codifica para el polipéptido de interés se combinan in vivo, el aminoácido no natural se incorpora en respuesta al codón UAG para proporcionar el polipéptido que contiene el
aminoácido no natural en la posición especificada. La incorporación de aminoácidos no naturales in vivo puede llevarse a cabo sin perturbación significativa de la célula huésped de vertebrado. Por ejemplo, debido a que la eficiencia de la supresión para el codón UAG depende de la competencia entre el O-ARNt, e.g., el ARNt supresor ámbar, y un factor de liberación de vertebrado (e.g., eRF) (que se enlaza a un codón de parada e inicia la liberación del péptido en crecimiento a partir del ribosoma), la eficiencia de la supresión puede modularse mediante, e.g., el aumento del nivel de expresión del O-ARNt, e.g., el ARNt supresor. Los codones selectores comprenden también codones extendidos, e.g., codones de cuatro bases o más, tales como codones de cuatro bases, cinco, seis o más. Ejemplos de codones de cuatro bases incluyen, e.g., AGGA, CUAG, UAGA, CCCU y lo similar. Ejemplos de codones de cinco bases incluyen, e.g., AGGAC, CCCCU, CCUC, CUAGA, CUACU, UAGGC y lo similar. Una característica de la invención incluye el uso de codones extendidos en base a la supresión de la estructura de cambio. Los codones de cuatro bases o más pueden insertar, e.g., uno o múltiples aminoácidos no naturales dentro de la misma proteína. Por ejemplo, en presencia de 0-ARNts mutados, e.g., un supresor de ARNts de estructura de cambio especial, con bucles anticodón, e.g., al menos con 8-10 nt bucles anticodón, el codón de cuatro bases o más se lee
como un aminoácido único. En otras modalidades, el bucle anticodón puede decodificar, e.g., al menos un codón de cuatro bases, al menos un codón de cinco bases, o al menos un codón de seis o más bases. Dado que existen 256 posibles codones de cuatro bases, pueden codificarse múltiples aminoácidos no naturales en la misma célula utilizando un codón de cuatro bases. Ver, Anderson et al., (2002)
Exploring the limits of Codon and Anticodón Size, (Explorando los limites del tamaño del codón y el anticodón) Chemistry and Biology, 9:237-244; Magliery, (2001) Expanding the Genetíc Code: Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli, (Expansión del código genético: Selección de supresores eficiente de codones de cuatro bases e identificación de codones "cambiantes" de cuatro bases con un procedimiento de biblioteca en Escherichia coli) J. Mol. Biol. 307:755-769. Por ejemplo, los codones de cuatro bases se han utilizado para incorporar aminoácidos no naturales dentro de proteínas utilizando métodos biosintéticos in Vitro. Ver, e.g., Ma et al., (1993) Biochemistry , 32:7939; y Hohsaka et al., (1999) J. Am. Chem. Soc.. 121:34. CGGG y AGGU se utilizaron para incorporar simultáneamente 2-naftilalanina y un derivado NBD de lisina dentro de estreptavidina in vitro con dos ARNts supresores de estructura de cambio químicamente
acilados. Ver, e.q., Hohsaka et al., (1999) J. Am. Chem. Soc . 121:12194. En un estudio in vivo, Moore et al., examinaron la capacidad de los derivados de ARNtLeu con anticodones NCUA para suprimir codones UAGN (N puede ser U, A, G, o C), y encontraron que el cuádruplo UAGA puede decodificarse mediante un ARNtLeu con un codón UCUA con una eficiencia de 13 a 26¾ con poca decodificación en el marco 0 o -1. Ver, Moore et al., (2000) J. Mol. Biol., 298:195. En una modalidad, pueden utilizarse en la invención los codones extendidos en base a codones raros o a codones sin sentido, que pueden reducir la pérdida de sentido a lo largo de la lectura y la supresión de la estructura de cambio en otros sitios no deseados. Para un sistema dado, un codón selector puede incluir también uno de los codones de tres bases naturales, en donde el sistema endógeno no utiliza (o raramente utiliza) el codón de base natural. Por ejemplo, esto incluye un sistema que carece de un ARNt que reconozca al codón de tres bases natural, y/o un sistema en donde el codón de tres bases natural es un codón raro. Los codones selectores incluyen opcionalmente pares de base no naturales. Estos pares de base no naturales expanden adicionalmente el alfabeto genético existente. Un par de base extra incrementa el número de codones triples de 64 a 125. Las propiedades de los pares de tres bases
incluyen la formación de pares de base estable y selectiva, la incorporación enzimática eficiente en el ADN con alta fidelidad mediante una polimerasa, y la extensión iniciadora continuada eficiente después de la síntesis del par de base no natural naciente. Las descripciones de los pares de base no naturales que pueden adaptarse para métodos y composiciones incluyen, e.g., Hirao, et al., (2002) An unnatural base pair for incorpora ting amino acid analogues into proteína , (Un par de base no natural para incorporar análogos de aminoácidos en proteínas) Nature Biotechnology, 20:177-182. Otras publicaciones relevantes se enlistan más adelante . Para uso in vivo, el nucleósido no natural es permeable a la membrana y se fosforila para formar el trifosfato correspondiente. Además, la información genética incrementada es estable y no se destruye por las enzimas celulares. Los esfuerzos previos por Benner y otros, tomaron ventaja de los patrones de enlace a hidrógeno que son diferentes a los de pares canónicos Watson-Crick, de los cuales el ejemplo más notable es el par de iso-C:iso-G. Ver, e.g., Switzer et al., (1989) J. Am. Chem. Soc, 111:8322; y Piccirilli et al., (1990) Nature 343:33; Kool (2000) Curr. Opin. Chem. Biol., 4:602. Estas bases en general se desemparejan en algún grado con las bases naturales y no pueden replicarse enzimáticamente . Kool y colaboradores,
demostraron que las interacciones de empaque hidrófobo entre las bases pueden reemplazar el enlace de hidrógeno para conducir la formación del par de base. Ver, Kool, (2000) Curr. Opin. Chem. Biol., 4:602; y Gruckian y Kool, (1998) Angew. Chem. Int. Ed. Engl., 36, 2825. En un esfuerzo por desarrollar un par de base no natural que satisfaga todos los requerimientos anteriores, Schultz, Romesberg y colaboradores, han sintetizado enzimáticamente y han estudiado una serie de bases hidrófobas no naturales. Se descubrió que un auto-par de PICS:PICS es más estable que los pares de base naturales y pueden incorporarse eficientemente en el ADN mediante un fragmento Klenow de ADN polimerasa I de Escherichia coli (KF). Ver, e.g., McMinn et al., (1999) J. Am. Chem. Soc, 121:11586; y Ogawa et al., (2000) J. Am. Chem. Soc, 122:3274. Un auto-par de 3MN : 3MN puede sintetizarse mediante KF con eficiencia y selectividad suficiente para la función biológica. Ver, e.g., Ogawa et al., (2000) J. Am. Chem. Soc, 122:8803. Sin embargo, ambas bases actúan como un terminador de cadena para su replicación posterior. Ha evolucionado recientemente una ADN polimerasa mutante que puede utilizarse para replicar el auto-par de PICS. Además, puede replicarse un auto-par de 7AI . Ver e.g., Tae et al., (2001) J. Am. Chem. Soc, 123:7439. También se ha desarrollado un nuevo par de metalobase, DipicPy, que forma un par estable al enlazarse a Cu (II).
Ver, Meggers et al., (2000) J. Am. Chem. Soc, 122:10714. Debido a que los codones extendidos y los codones no naturales son intrínsecamente ortogonales a los codones naturales, los métodos de la invención pueden tomar ventaja de esta propiedad para general ARNts ortogonales a partir de los mismos . También puede utilizarse un sistema de traducción de derivación para incorporar un aminoácido no natural en un polipéptido deseado. En un sistema de traducción de derivación, se inserta una secuencia grande en un gen pero no se traslada hacia la proteína. La secuencia contiene una estructura que sirve como clave para inducir que el ribosoma salte sobre la secuencia y resuma la traducción aguas debajo de la inserción. Aminoácidos no naturales Como se utiliza en la presente, un aminoácido no natural se refiere a cualquier aminoácido, aminoácido modificado o análogo de aminoácido diferente a selenocisteína y/o pirrolisina, y los siguientes aminoácidos alfa genéticamente codificados: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina , prolina, serina, treonina, triptofán, tirosina, valina. La estructura genética de un aminoácido alfa se ilustra mediante la Fórmula I:
1
Un aminoácido no natural es típicamente cualquier estructura que tiene la Fórmula I, en donde el grupo R es cualquier sustituyente diferente al utilizado en los veinte aminoácidos naturales. Ver, e.g., Biochemstry por L. Stryer, 3a ed . , 1988, Freeman and Company, New York, para estructuras de los veinte aminoácidos naturales. Nótese que, los aminoácidos no naturales de la invención pueden ser compuestos de origen natural diferentes a los veinte aminoácidos alfa anteriores. Debido a que los aminoácidos no naturales de la invención difieren típicamente de los aminoácidos naturales en la cadena lateral, los aminoácidos no naturales forman enlaces de amida con otros aminoácidos, e.g., naturales o no naturales, de la misma manera en la cual se forman en proteínas de origen natural. Sin embargo, los aminoácidos no naturales tienen grupos de cadena lateral que los distinguen de los aminoácidos naturales. Por ejemplo, R en la Fórmula I comprende opcionalmente un alquilo, arilo, acilo, ceto, azido, hidroxilo, hidrazina, ciano, halo, hidrazida, alquenilo, alquinilo, éter, tiol, seleno, sulfonilo, borato, boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina, aldehido, éster, tioácido, hidroxilamina , amina y lo
similar, o cualquier combinación de los mismos. otros aminoácidos no naturales de interés incluyen, pero no se limitan a, aminoácidos que comprenden un reticulador fotoacti vable , aminoácidos de marcado con giro; aminoácidos fluorescentes; aminoácidos de enlace con metal; aminoácidos que contienen metal; aminoácidos radiactivos; aminoácidos con nuevos grupos funcionales que interactúan covalente o no covalentemente con otras moléculas, aminoácidos fotoencerrados y/o fotoi somer i zables ; aminoácidos que contiene biotina o un análogo de biotina; aminoácidos que contienen ceto, aminoácidos que comprenden poletilen glicol o poliéter; aminoácidos de átomo pesado sustituidos; aminoácidos químicamente desdoblables o fotodesdoblables; aminoácidos con una cadena lateral alargada en comparación con los aminoácidos naturales (e.g., poliéteres o hidrocarburos de cadena larga, e.g., mayor que aproximadamente 5, mayor que aproximadamente 10 carbonos, etc.), aminoácidos que contienen azúcar enlazado a carbono, aminoácidos de redox activo; un ácido que contienen amino tioácido y aminoácidos que contienen uno o más residuos tóxicos. En algunas modalidades, los aminoácidos no naturales tienen un ligando cruzado fotoactivable que se utiliza, e.g., para enlazar una proteína a un soporte sólido. En una modalidad, los aminoácidos no naturales tienen un residuo sacárido unido a la cadena lateral del aminoácido
(e.g., aminoácidos glicosilados) y/o otra modificación de carbohidratos . Además de los aminoácidos no naturales que contienen nuevas cadenas laterales, los aminoácidos no naturales comprenden también opcionalmente estructuras modificadas, e.g., como se ilustra por las estructuras de la Fórmula II y III: II
III
En donde Z comprende típicamente OH, NH2, SH, NH-R' , o S-R' ; X y Y, que pueden ser el mismo o diferentes, comprenden típicamente S u O, y R y R' , que son opcionalmente el mismo o diferentes, se seleccionan típicamente de la misma lista de constituyentes para el grupo R antes descrito para los aminoácidos no naturales que tienen la Fórmula I así como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención comprenden típicamente sustituciones en el grupo amino o carboxilo como se ilustra en las Fórmulas II y III. Los aminoácidos no naturales de este tipo incluyen, pero no
se limitan a, ácidos alfa hidroxi, alfa-tioácidos alfa-aminotiocarboxilatos, e.g., con cadenas laterales correspondientes a los veinte aminoácidos naturales comunes o a las cadenas laterales no naturales. Además, las sustituciones en el alfa carbono incluyen opcionalmente aminoácidos L, D o alfa-alfa disustituidos tales como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutirico y lo similar. Otras alternativas estructurales incluyen aminoácidos cíclicos tales como análogos de prolina así como análogos de prolina de anillo de 3, 4, 6, 7, 8 y 9 miembros, aminoácidos beta y gamma tales como beta-alanina y ácido gama-amino butírico. Por ejemplo, muchos aminoácidos no naturales se basan en aminoácidos naturales tales como tirosina, glutamina, fenilalanina y lo similar. Los análogos de tirosina incluyen tirosinas para-sustituidas , tirosinas orto-sustituidas, y tirosinas meta-sustituidas, en donde la tirosina sustituida comprende, e.g., un grupo ceto (e.g., un grupo acetilo) , un grupo benciloxi, un grupo amino, una hidrazina, una hidroxilamina , un grupo tiol, un grupo carboxi, un grupo isopropilo, un grupo metilo, un hidrocarburo C6-C2o de cadena recta o ramificada, un hidrocarburo saturado o insaturado, un grupo O-metilo, un grupo poliéter, un grupo nitro, un grupo alquinilo o lo similar. Además, también se contemplan los anillos de arilo multiplicados sustituidos. Los análogos de glutamina de la
invención incluyen, pero no se limitan a, derivados de alfa hidroxi, derivados gamma sustituidos, derivados cíclicos y derivados de glutamina sustituidos con amida. Los ejemplos de análogos de fenilalanina incluyen, pero no se limitan a, f enilalaninas para-sust i tuida s , fenilalaninas orto-sustituidas, y fenilalaninas meta-sustituidas, en donde el sustituyente comprende, e.g., un grupo hidroxi, un grupo metoxi, un grupo metilo, un grupo alilo, un aldehido, un azido, un yodo, un bromo, un grupo ceto (e.g., un grupo acetilo) , un benzoilo, un grupo alquinilo o lo similar. Ejemplos específicos de aminoácidos no naturales incluyen, pero no se limitan a, una p-acetil-L-fenilalanina, una p-propargi loxi feni lalanina , una O-meti 1-L-tirosina, una L-3-(2-na ft i 1 ) alanina , una 3-meti 1-feni lalanina , una ?-4-alil-L-tirosina, una -propil-L-tirosina , una ^?-?^?e^?-??????ß-serina, una L-Dopa, una fenilalanina fluorada, una isopropil-L-fenilalanina , una p-azido-L-fenilalanina, una p-acil-L-fenilalanina , una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina , una fosfonotirosina , una p-yodo-fenilalanina , una p-bromofenilalanina, una p-amino-L-fenilalanina , y una isopropil-L-fenilalanina y lo similar. Se proporcionan estructuras adicionales de una variedad de aminoácidos no naturales por ejemplo, en las Figuras 16, 17, 18, 19, 26 y 29 de la WO 2002/085923 titulada "In vivo incorporation of unnatural amino acids" (Incorporación in
vivo de aminoácidos no naturales) . Ver también la Figura 1, estructuras 2.5 de Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation, (Incorporación de azidas en proteínas recombinantes para la modificación guimioselectiva mediante ligamiento Staudinger), PNAS 99:19-24, para análogos de metionina adicionales. En una modalidad, se proporcionan las composiciones gue incluyen un aminoácido no natural (tal como p- (propargiloxi ) fenilamina) . También se proporcionan varias composiciones que comprenden p- (propargiloxi ) fenilamina y e.g., proteínas y/o células. En un aspecto, una composición que incluye el aminoácido no natural p- ( propargi loxi ) feni lamina incluye además un ARNt ortogonal. Este aminoácido no natural puede enlazarse (e.g., covalentemente ) al ARNt ortogonal, e.g., covalentemente enlazado al ARNt ortogonal a través de un ligando amino-acilo, covalentemente enlazado a un 3' OH o a un 2' OH de un azúcar de terminal ribosa del ARNt ortogonal, etc. Los residuos químicos mediante aminoácidos no naturales que pueden incorporarse en proteínas, ofrecen una variedad de ventajas y manipulaciones de la proteína. Por ejemplo, la reactividad única de un grupo funcional ceto permite la modificación selectiva de proteínas con cualquier número de reactivos que contienen hidrazina o hidroxilamina ,
in vitro e in vivo. Un aminoácido no natural de átomo pesado, por ejemplo, puede ser útil para los datos de estructura de fase de rayos X. La introducción especifica en el sitio de átomos pesados utilizando aminoácidos no naturales proporciona también selectividad y flexibilidad para seleccionar las posiciones para átomos pesados. Los aminoácidos no naturales fotorreact ivos (e.g., los aminoácidos con cadenas laterales de benzofenona y arilazidas (e.g., fenilazida), por ejemplo, permiten la eficiente foto reticulación de las proteínas in vivo e in vitro. Ejemplos de aminoácidos no naturales fotorreactivos incluyen, pero no se limitan a, e.g., p-azido-fenilalanina y p-benzoil-fenilalanina . La proteína con los aminoácidos no naturales fotorreact ivas pueden entonces reticularse a voluntad mediante la excitación del grupo fotorreactivo , proporcionando un control temporal (y/o espacial). En un ejemplo, el grupo metilo de un aminoácido no natural, puede sustituirse con uno marcado isotópicamente, e.g., un grupo metilo, como una sonda de la estructura y dinámica local, e.g., con el uso de resonancia magnética nuclear y espectroscopia de vibración. Por ejemplo, los grupos funcionales alquinilo o azido permiten la modificación selectiva de proteínas con moléculas a través de una reacción de cicloadición [3+2]. Síntesis Química de Aminoácidos no Naturales
Muchos de los aminoácidos no naturales proporcionados anteriormente, se encuentran comercialmente disponibles, e.g., de Sigma (EUA) o Aldrich (Milwaukee, I, EUA) . Aquellos que no se encuentran comercialmente disponibles se sintetizan opcionalmente como se proporciona en la presente o como se proporciona en diversas publicaciones o utilizando métodos estándar conocidos por los expertos en la técnica. Para técnicas de síntesis orgánica, ver, e.g., Organic Chemistry, por Fessendon y Fessendon, (1982, segunda edición, Willard Grant Press, Boston, Mass) ; Advanced Organic Chemistry, por March (tercera edición, 1985, Wiley y Sons, New York); y Advanced Organic Chemistry, por Carey y Sundberg (tercera edición, partes A y B, 1990, Plenum Press, New York). Publicaciones adicionales que describen la síntesis de aminoácidos no naturales incluyen, e.g., WO 2002/085923 titulada "In vivo incorporat ion of Unnatural Amino Acids" (Incorporación in vivo de aminoácidos no naturales) Matsoukas et al., (1995), J. Med. Chem. , 38, 4660-4669; King, F.E., & Kidd, D.A.A., (1949) A New Synthesis of Glutamine and of y-Peptides of Glutamic Acid from Phthylated Intermediates (Una nueva síntesis de glutamina y de péptidos gamma de ácido glutámico a partir de intermediarios ftilados), J. Chem. Soc, 3315-3319; Friedman, O.M. & Chatterrji, R. (1959), Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents (Síntesis de
derivados de glutamina como modelos de sustrato para agentes anti-tumor), J. Am. Chem. Soc. , 81, 3750-3752; Craig J.C. et al., (1988) Absolute Configuration of the Enantiomers of 7-chloro-4 [ [4-(diethylamino) -1-methylbutyl ] amino] quinoline (Chloroquine) (Configuración absoluta de los enantiómeros de 7-cloro-4 [ [4-dieti lamino) -1-metilbutil ] amino] quinolina ( Cloroquina ) , J. Org. Chem., 53, 1167-1170; Azoulay, M. Vilmont, M. & Frappier, F., (1991) Glutamine analogues as Potential Antimalarials (Análogos de glutamina como anti-malaria potenciales) Eur. J. Med. Chem., 26, 201-5; Koskinen A.M.P. & Rapoport, H (1989) Synthesis of -substituted Prolines as Conformationally Constrained Amino Acid Analogues (Síntesis de prolinas 4 -sust ituidas como análogos de aminoácidos conformacionalmente constreñidos) J. Org. Chem., 54, 1859.1866; Christie B.D., & Rapoport, H (1985) Synthesis of Optically Puré Pipecolates from L-Asparagine . Application to the Total Synthesis of ( + ) -apovincamine Through Amino Acid Decarbonylation and Iminium Ion Cyclization (Síntesis de pipecolatos ópticamente puros a partir de L-asparagina . Aplicación a la síntesis total de ( + ) -apovincamina a través de la descarboni lación de aminoácidos y la ciclización de ion de iminio) , J. Org. Chem., 1989; 1859-1866; Barton et al., (1987), Synthesis of Novel a-Amino Acids and Derivatives Using Radical Chemistry: Synthesis of L and D-a-Amino-Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated
Derivatives (Síntesis de nuevos alfa-aminoácidos y derivados utilizando química radical: síntesis de aminoácidos L- y D-alfa adípicos, aminoácidos L-alfa-pimélicos y derivados insaturados apropiados), Tetrahedron Lett. 43:4297- 308; y Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of beta-heterocycl ic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site (Análogos de ácido cuiscuálico: síntesis de derivados de ácido 2-aminopropanoico beta-heterocíclico y su actividad en un nuevo sitio sensible al cuiscualato) J. Med. Chem., 35:4602-7. Absorción celular de aminoácidos no naturales La absorción del aminoácido no natural por una célula de vertebrado es un problema que se considera típicamente cuando se diseñan y se seleccionan aminoácidos no naturales, e.g., para su incorporación en una proteína. Por ejemplo, la alta densidad de carga de los alfa aminoácidos sugiere que es improbable que estos compuestos sean permeables a células. Los aminoácidos naturales se absorben en la célula de vertebrado mediante una colección de sistemas de transporte a base de proteínas. Puede efectuarse una rápida selección que evalúe cuáles aminoácidos no naturales, si existen, se absorben por las células. Ver e.g., los análisis de toxicidad, e.g., en la solicitud titulada "Protein Arrays" (Disposiciones de proteínas), minuta del
abogado número P1001US00 presentada en Diciembre 22 de 2002; y Liu D.R. & Schultz, P.G., (1999) Progress toward the evolution of an organism with an expanded genetic code (Progreso hacia la evolución de un organismo con un código genético expandido), PNAS Estados Unidos 96:4780-4785. Aunque la absorción se analiza fácilmente con diversos análisis, una alternativa para diseñar aminoácidos no naturales que sean dóciles a las trayectorias de absorción celular, es proporcionar trayectorias biosintéticas para crear aminoácidos in vivo. Biosintesis de Aminoácidos no Naturales Muchas trayectorias biosintéticas existen ya en las células para la producción de aminoácidos y otros compuestos. Aunque un método biosintético para un aminoácido no natural particular puede no existir en la naturaleza, e.g., en una célula de vertebrado, la invención proporciona tales métodos. Por ejemplo, las trayectorias biosintéticas para aminoácidos no naturales se generan opcionalmente en la célula huésped agregando nuevas enzimas o modificando las trayectorias existentes de la célula huésped. Las nuevas enzimas adicionales son opcionalmente, enzimas de origen natural o enzimas artificialmente evolucionadas. Por ejemplo, la biosintesis de p-aminofenilalanina (como se presenta en un ejemplo en la O 2002/085923 titulada "In vivo incorporation of unnatural amino acids" (Incorporación in vivo de
aminoácidos no naturales)), se basa en la adición de una combinación de enzimas conocidas de otros organismos. Los genes para estas enzimas pueden introducirse en una célula de vertebrado transformando la célula con un plásmido comprendido en los genes. Los genes, cuando se expresan en la célula, proporcionan una trayectoria enzimática para sintetizar el compuesto deseado. Ejemplos de los tipos de enzimas que se agregan opcionalmente , se proporcionan en los siguientes ejemplos. Las secuencias de enzimas adicionales se encuentran, e.g., en el Genbank. Las enzimas artificialmente evolucionadas también se agregan opcionalmente en una célula de la misma manera. De este modo, la maquinaria celular y los recursos de una célula se manipulan para producir aminoácidos no naturales. Se encuentra disponible una variedad de métodos para producir nuevas enzimas para su uso en trayectorias biosintéticas o para la evolución de las trayectorias existentes. Por ejemplo, la recombinación recursiva, e.g., como se desarrolla por axygen, Inc., (disponible en la red mundial en www . maxygen-com) , se utiliza opcionalmente para desarrollar nuevas enzimas y trayectorias. Ver e.g., Stemmer (1994), Rapid evolution of a protein in vitro by DNA shuffling (Rápida evolución de una proteina in vitro mediante arrastre de ADN), Nature 370 ( 4 ) : 389-391 ; y Stemmer (1994), DNA Shuffling by random fragmentation and reassembly: In
vitro recombinat ion for molecular evolution (Arrastre de ADN mediante fragmentación aleatoria y re-instalación: recombinación in vitro para la evolución molecular), Proc. Nati. Acad. Sci. EUA, 91:10747-10751. De manera similar, DesignPath1M, desarrollado por Genencor (disponible en la red mundial en genencor.com) se utiliza opcionalmente para ingeniería de trayectoria metabólica, e.g., para fabricar una trayectoria para crear 0-metil-L-tirosina en una célula. Esta tecnología reconstruye las trayectorias existentes en organismos huésped utilizando una combinación de nuevos genes, e.g., identificados mediante genómica funcional, y evolución y diseño molecular. Diversa Corporation
(disponible en la red mundial en diversa.com), proporciona también tecnología para selección rápida de bibliotecas de genes y trayectorias de gen, e.g., para crear nuevas trayectorias . Típicamente, el aminoácido no natural producido con una trayectoria biosintética fabricada de la invención, se produce en una concentración suficiente para la eficiente biosíntesis de proteínas, e.g., una cantidad celular natural, pero no a un grado tal que afecte la concentración de otros aminoácidos o que agote los recursos celulares. Las concentraciones típicas producidas in vivo de esta manera, son de aproximadamente 10 m a aproximadamente 0.05 m . Una vez transformada una célula con un plásmido que comprende los
genes utilizados para producir las enzimas deseadas para una trayectoria especifica y que se genera un aminoácido no natural, se utilizan opciona lmente selecciones in vivo para optimizar adicionalmente la producción del aminoácido no natural tanto para la síntesis de proteína ribosomal como para el crecimiento celular. Polipéptidos con Aminoácidos no Naturales Las proteínas o polipéptidos de interés con al menos un aminoácido no natural son una característica de la invención. La invención también incluye polipéptidos o proteínas con al menos un aminoácido no natural producido utilizando las composiciones y métodos de la invención. También puede encontrarse presente in excipiente (e.g., un excipiente farmacéuticamente aceptable) con la proteína. Al producir las proteínas o polipéptidos de interés con al menos un aminoácido no natural en células de vertebrados, las proteínas o polipéptidos incluirán típicamente modificaciones de vertebrado post-traducciónes . En ciertas modalidades, una proteína incluye al menos un aminoácido no natural y al menos una modificación posttraducción que se efectúa in vivo por una célula de vertebrado, cuando la modificación post-traducción no se efectúa por una célula procariótica . Por ejemplo, la modificación post-traducción incluye, e.g., acetilación, acilación, modificación de lípidos, palmitoilación, adición
de palmitato, fosforilación, modificación de enlace de gl icol ipidos , gl icosilación y lo similar. En un aspecto, la modificación post-traducción incluye la unión de un oligosacárido (e.g., GlcNAc-Man) --Man-GlcNAc-GlcNAc) ) a una asparagina mediante un ligando de GlcNAc-asparagina . Ver también la Tabla 7, que lista algunos ejemplos de ol igosacáridos enlazados a N de proteínas de vertebrado (los residuos adicionales, que no se muestran, también pueden encontrarse presentes) . En otro aspecto, la modificación post-traducción incluye la unión de un ol igosacárido (e.g., Gal-GalNAc, Gal-GlcNAc, etc.) a una serina o treonina mediante un ligando de GalNAc-serina o GalNAc-treonina , o un ligando GlcNAc-serina o Glc-Nac-treonina . TABLA 7: EJEMPLOS DE OLIGOSACÁRI DOS A TRAVÉS DEL ENLACE GlcNAc Tipo Estructura Base Mana 1-6
Air mimo. Mana1"3 an i-4GlcNAc31 -4GlcNAcp1 -Asn
Hibudo Manp1 -4GlcNAcpi-4G!cNAcp1 -Asn G!cNAcp
GlcNAc[ 1-2 Mar Complejo anp 1 -4G IcN Acp 1 -4GlcNAcp1 -Asn GlcNAc 1 -2 Mana
Xú n anp1 -4GlcNAcp1-4GlcNAcp1 -Asn
Aún en otro aspecto, la modificación posttraducción incluye el procesamiento proteolitico de precursores (e.g., precursor de calcitonina, precursor del péptido relacionado con el gen de calcitonina, hormona preproparatiroidea, preproinsu 1 ina , proinsulina, prepro-opiomelanocort ina , pro-opiomelanocortina y lo similar), la instalación en una proteina de multisubunidad o inslatación macromolecular , traducción a otro sitio en la célula (e.g., a organelos, tales como el retículo endoplásmico, el aparato de golgi, el núcleo, lisosomas, peroxisomas, mitocondrio, cloroplastos , vacuolas, etc., o a través de la trayectoria secretoria) . En ciertas modalidades, la proteína comprende una secuencia de secreción o localización, una marca de epítope, una marca FLAG, una marca de polihistidina , una fusión de GST o lo similar. Una ventaja de un aminoácido no natural, es que presenta residuos químicos adicionales que pueden utilizarse para agregar moléculas adicionales. Estas modificaciones pueden efectuarse in vivo en una célula de vertebrado o in vitro. Por tanto, en ciertas modalidades, la modificación post-traducción es a través del aminoácido no natural. Por ejemplo, la modificación post-traducción puede ser a través de una reacción nucleófila-electrófila . La mayoría de las reacciones actualmente utilizadas para la modificación selectiva de proteínas, implican la formación de un ligando
covalente entre socios de reacción nucleófilos y electrófilos, e.g., la reacción de alfa-ha locetonas con cadenas laterales de histidina o cisteina. La selectividad en estos casos, se determina por el número y la accesibilidad de los residuos nucleófilos en la proteina. En las proteínas de la invención, pueden utilizarse otras reacciones más selectivas, tales como la reacción de un ceto-amino no natural con hidrazidas o compuestos de aminooxi, in vitro e in vivo. Ver, e.g., Cornish et al., (1996) Am. Chem. Soc, 118:8150-8151; Mahal et al., (1997) Science, 276:1125-1128; Wang et al., (2001) Science 292:498-500; Chin et al., (2002) Am. Chem. Soc, 124:9026-9027 ; Chin et al., (2002) Proc. Nati. Acad. Sci., 99:11020-1102 ; Wang et al., (2003) Proc. Nati. Acad. Sci., 100:56-61; Zhang et al., (2003) Biochemistry, 42:6735-6746; y Chin et al., (2003) Science en impresión. Esto permite la marcación selectiva virtualmente de cualquier proteína con un huésped de reactivos incluyendo fluoróforos, agentes de reticulación, derivados de sacárido y moléculas citotóxicas. Ver también solicitud de patente USSN 10/686,944 titulada "Gl icoprotein synthesis" (Síntesis de glicoproteínas ) presentada en Octubre 15, 2003. Las modificaciones post-traducciónes , e.g., a través de un aminoácido de azido, también pueden efectuarse a través de ligación Staudinger (e.g., con reactivos de triarilfosfina . Ver e.g., Kiick et al., (2002) Incorporation of azides into
recombinant proteins for chemoselect ive modification by the Staudinger ligation (Incorporación de azidas en proteínas recombinantes para la modificación quimioselectiva mediante la ligación Staudinger), PNAS 99:19-24. Esta invención proporciona otro método altamente eficiente para la modificación selectiva de proteínas, que implica la incorporación genética de aminoácidos no naturales, e.g., conteniendo una azida o residuo alquinilo, en proteínas, en respuesta a un codón selector. Estas cadenas laterales de aminoácido pueden modificarse entonces, e.g., mediante una reacción de cicloadición Huisgen [3+2] (ver, e.g., Padwa A., en Comprehens ive Organic Synthesis Vol. 4 (1991) Ed. Trost, B.M., Pergamon, Oxford, p. 1069-1109; y Huisgen R., en 1,3-Dipolar Cycloaddition Chemistry (1984) Ed. Padwa, A. Wiley, New York, p. 1-176) con, e.g., derivados de alquinilo o azida, respectivamente. Ver e.g., Figura 16. Debido a que este método implica una cicloadición más que una sustitución nucleófila, las proteínas pueden modificarse con una selectividad extremadamente alta. Esta reacción puede llevarse a cabo a temperatura ambiente en condiciones acuosas con excelente regioselectividad (1,4 > 1,5) mediante la adición de cantidades catalíticas de sales de Cu ( I ) a la mezcla de reacción. Ver, e.g., Tornoe et al., (2002) Org. Chem. 67:3057-3064; y Rostovtsev et al., (2002) Angew. Chem. Int. Ed., 41: 2596-2599. Otro método que puede utilizarse es
el intercambio de ligando en un compuesto de biarsénico con un motivo de tetracisteína, ver, e.g., Griffin et al., (1998) Science 281:269-272. Una molécula que puede agregarse a una proteina de la invención a través de un grupo funcional de un aminoácido no naturalmente codificado, incluye virtualmente cualquier molécula con grupo funcional complementario. Tales moléculas incluyen, pero no se limitan a, colorantes, fluoróforos, agentes de reticulación, derivados de sacárido, polímeros (e.g., derivados de polietileno glicol), fotorreticuladores , compuestos citotóxicos, marcas de afinidad, derivados de biotina, resinas, gránulos, una segunda proteína o polipéptido (o más), pol inucleót ido ( s ) (e.g., ADN, ARN, etc.) queladores de metal, cofactores, ácidos grasos, carbohidratos y lo similar. En otro aspecto, la invención proporciona composiciones que incluyen tales moléculas y métodos para producir estas moléculas, e.g., derivados de polietileno glicol, en donde n es un entero de entre, e.g., 50 y 10,000, 75 y 5,000, 100 y 2,000, 100 y 1, 000, etc. En la modalidad de la invención, el polietileno glicol tiene un peso molecular e.g., de aproximadamente 5,000 a aproximadamente 100,000 Da, de aproximadamente 20,000 a aproximadamente 30,000, de aproximadamente 40,000 o de aproximadamente 50,000 Da, de aproximadamente 20,000 a aproximadamente 10,000 Da,
etc . También se proporcionan varias composiciones que comprenden estos compuestos, e.g., con proteínas y células. En un aspecto de la invención, una proteína que comprende un colorante azido (e.g., de estructura química 4 o de estructura química 6) , incluye además al menos un aminoácido no natural (e.g., un aminoácido de alquinilo), en donde el colorante de azido se encuentra unido al aminoácido no natural a través de una cicloadición [3+2] . Una célula de vertebrado de la invención proporciona la capacidad de sintetizar las proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles. En un aspecto, la composición incluye opcionalmente, e.g., al menos 10 microgramos, al menos 50 microgramos, al menos 75 microgramos, al menos 100 microgramos, al menos 200 microgramos, al menos 250 microgramos, al menos 500 microgramos, al menos 1 miligramo, al menos 10 miligramos o más, de la proteína que comprende un aminoácido no natural, o una cantidad que pueda lograrse con métodos de producción de proteínas in vivo (detalles acerca de la producción y purificación de proteína recombinante se proporcionan en la presente). En otro aspecto, la proteína se encuentra opcionalmente presente en la composición en una concentración de e.g., al menos 10 microgramos de proteína por litro, al menos 50 microgramos de proteína por litro, al menos 75
microgramos de proteina por litro, al menos 100 microgramos de proteina por litro, al menos 200 microgramos de proteina por litro, al menos 250 microgramos de proteina por litro, al menos 500 microgramos de proteina por litro, al menos 1 miligramo de proteina por litro, o al menos 10 miligramos de proteina por litro o más, e.g., en un lisado celular, un amortiguador, un amortiguador farmacéutico u otra suspensión liquida (e.g., en un volumen e.g., de cualquiera de aproximadamente 1 ni a aproximadamente 100 1) . La producción de grandes cantidades (e.g., mayores que las típicamente posibles con otros métodos, e.g., traducción in vitro) de una proteína en una célula de vertebrado incluyendo al menos un aminoácido no natural, es una característica de la invención. La incorporación de un aminoácido no natural que puede efectuarse, e.g., a cambios de diseño en la estructura y/o la función de la proteína, e.g., para cambiar el tamaño, la acidez, la nucleofilicidad, el enlace a hidrógeno, hidrofobicidad, accesibilidad de los sitios objetivo de proteasa, la dirección a un residuo (e.g., para una disposición de proteínas), etc. Las proteínas que incluyen un aminoácido no natural pueden tener propiedades catalíticas o físicas mejoradas o incluso completamente nuevas. Por ejemplo, las siguientes propiedades se modifican opcionalmente mediante la inclusión de un aminoácido no natural en una proteína: toxicidad, biodistribución,
propiedades estructurales, propiedades espectroscópicas , propiedades químicas y/o fotoquímicas, capacidad catalítica, vida media (e.g., vida media en suero), capacidad para reaccionar con otras moléculas, e.g., de manera covalente o no covalente, y lo similar. Las composiciones que incluyen proteínas que incluyen al menos un aminoácido no natural son útiles para e.g., nuevos terapéuticos, diagnósticos, enzimas catalíticas, enzimas industriales, proteínas de enlace (e.g., anticuerpos) y e.g., para el estudio de la estructura y función de proteínas. Ver e.g., Dougherty, (2000) Unnatural Amino Acids as Probes of Protein Structure and Function, (Aminoácidos no naturales como sondas de la estructura y función de proteínas), Current Opinión in Chemical Biology, 4 : 645-652. En un aspecto de la invención, una composición incluye al menos una proteína con al menos uno, al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis, al menos siete, al menos ocho, al menos nueve, o al menos diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser el mismo o diferentes, e.g., puede haber 1, 2, 3, 4, 5, 6, 7, 8, 9, o 10 o más sitios diferentes en la proteína que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9, o 10 o más aminoácidos no naturales diferentes. En otro aspecto, una composición incluye una proteína con al menos uno, pero menos que todos, de los aminoácidos particulares presentes en
la proteína, que se sustituye con el aminoácido no natural. Para una proteína dada con más de uno de los aminoácidos no naturales, los aminoácidos no naturales pueden ser idénticos o diferentes (e.g., la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales o puede incluir dos del mismo aminoácido no natural) . Para una proteína dada con más de dos aminoácidos no naturales, los aminoácidos no naturales pueden ser el mismo, diferentes o una combinación de un aminoácido no natural múltiple del mismo tipo, con al menos un aminoácido no natural diferente. Esencialmente cualquier proteína (o porción de la misma) que incluye un aminoácido no natural (y cualquier ácido nucleico de codificación correspondiente, e.g., que incluye uno o más codones selectores) puede producirse utilizando las composiciones y métodos en la presente. No se hacen intentos por identificar los cientos de miles de proteínas conocidas, de las cuales, todas pueden modificarse para incluir uno o más aminoácidos no naturales, e.g., diseñando cualquier método de mutación disponible para incluir uno o más codones selectores apropiados en un sistema de traducción relevante. Los repositorios de secuencia comunes para proteínas conocidas incluyen el GenBank, EMBL, DDBJ y el NCBI . Otros repositorios pueden identificarse fácilmente buscando en la internet. Típicamente, las proteínas son, e.g., al menos 60%,
al menos 70%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o al menos 99% o más, idénticas a cualquier proteina disponible (e.g., una proteina terapéutica, una proteína de diagnóstico, una enzima industrial, o una porción de las mismas y lo similar), y comprenden uno o más aminoácidos no naturales. Ejemplos de proteínas terapéuticas, de diagnóstico y otras que pueden modificarse para comprender uno o más aminoácidos no naturales, incluyen, pero no se limitan a, e.g., alfa-1 antitripsina, angiostatina , factor antihemofí lico, anticuerpos (detalles adicionales acerca de anticuerpos, se encuentran a continuación), apolipoproteína , apoproteína, factor atrial natr iurético, polipéptido atrial natriurético, péptidos atriales, quimiosinas C-X-C (e.g., T39765, NAP-2, ENA-78, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG) , calcitonina, CC quimiosinas (e.g., proteína 1 quimioatrayente de monocito, proteína 2 quimioatrayente de monocito, proteína 3 quimioatrayente de monocito, proteína 1 alfa inflamatoria de monocito, proteína 1 beta inflamatoria de monocito, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262), ligando CD40, ligando C-equipo, colágeno, factor estimulador de colonia (CSF) , factor 5a de complemento, inhibidor de complemento, receptor 1 de complemento, citosinas (e.g., péptido 78 de activación de neutrófilo epitelial, GROalfa/MGSA, GRObeta, GROgamma, MIO-la, ???-ldelta, MCP-1),
factor de crecimiento epidérmico (EGF), eritropoyetina ("EPO", representando un objetivo preferido para la modificación mediante la incorporación de uno o más aminoácidos no naturales), toxinas exfoliantes A y B, Factor IX, factor VII, factor VIII, factor X, factor de crecimiento ele fibroblastos (FGF), fibrinógeno, fibronectina , G-CDF, GM-CSF, glucocerebrosidasa, gonadotropina , factores de crecimiento, proteínas Hedgehog (e.g., Sonic, Indian, Desert), hemoglobina, factor de crecimiento de hepatocitos (HGF), hirudina, albúmina de suero humano, insulina, factor de crecimiento tipo insulina (IGF), interferones (e.g., IFN-alfa, IFN-beta, IFN-gamma), interleucinas (e.g., IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12 etc.), factor de crecimiento de queratinocito (KGF) , lactoferrina , factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilos (NIF) , oncostatina M, proteína osteogénica, hormona paratiroidea , PD-ECSF, PDGF, hormonas de péptido (e.g., hormona del crecimiento humana), pleiotropina , proteína A, proteína G, exotoxinas pirogénicas A, B y C, relaxina, renina, SCF, receptor 1 de complemento soluble, I-CAM 1 soluble, receptores de interleucina soluble (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptor de THF soluble, somatomedina, somatostatina , somatotropina , estreptocinasa, superantígenos , i.e., enterotoxinas de estafilococo (SEA,
SEB , SEC1, SEC2, SEC3, SED, SEE), superóxido dismutasa (SOD), toxina de síndrome de choque tóxico (TSST-1), alfa 1 timosina, activador de plasminógeno de tejido, factor beta de necrosis tumoral (beta TNF) , receptor del factor de necrosis tumoral (TNFR) , factor-alfa de necrosis tumoral (alfa TNF) , factor de crecimiento endotelial vascular (VEGEF) , urocinasa y muchas otras . Una clase de proteínas que puede fabricarse utilizando las composiciones y métodos para la incorporación in vivo de los aminoácidos no naturales descritos en la presente, incluye moduladores t ransc ipcionales o porciones de los mismos. Ejemplos de moduladores transcripcionales incluyen genes y proteínas moduladoras transcripcionales que modulan el crecimiento celular, la diferenciación, la regulación o lo similar. Los moduladores transcripcionales se encuentran en procariotos, virus y eucariotos, incluyendo hongos, plantas, levaduras, insectos y animales incluyendo mamíferos, que proporcionan un amplio rango de objetivos terapéuticos. Se apreciará que la expresión y los activadores transcripcionales regulan la transcripción mediante muchos mecanismos, e.g., enlazándose a los receptores, estimulando una cascada de transducción de señal, regulando la expresión de los factores de transcripción, enlazándose a promotores y mejoradores, enlazándose a proteínas que se enlazan a promotores y mejoradores,
desbobinando el ADN, dividiendo el pre-ARNm, poliadenilando el ARN, y degradando el ARN . Por ejemplo, las composiciones de proteina GAL4 o una porción de la misma en una célula de vertebrado, son también una característica de la invención. Típicamente, la proteína GAL4 o una porción de la misma, comprende al menos un aminoácido no natural. Ver también la sección en la presente titulada "Aminoacil-ARNt sintetasas ortogonales" . Una clase de proteínas de la invención (e.g., proteínas con uno o más aminoácidos no naturales) incluye activadores de expresión tales como citosinas, moléculas inflamatorias, factores de crecimiento, sus receptores y productos oncógenos, e.g., interleucinas (e.g., IL-1, IL-2, IL-8, etc.), interferones, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-alfa, TGF-beta, EGF, KGF, SCF/c-equipo , CD40L/CD40, VLA-4/VCAM-1, ICAM-l/LFA-1 e hilaurin/CD44 ; moléculas de transducción de señal y los productos oncógenos correspondientes, e.g., Mos, Ras, Raf y Met; y activadores y supresores transcripcionales , e.g., p53, Tat, Fos, yc, Jun, Myb, Reí y receptores de hormona esferoide tales como aquellos para estrógeno, progesterona , testosterona , aldosterona, el ligando del receptor LDL y corticosterona . Las enzimas, (e.g., enzimas industriales) o porciones de las mismas, con al menos un aminoácido no natural, también se proporcionan por la invención. Ejemplos
de enzimas incluyen, pero no se limitan a, e.g., amidasas, aminoácido racemasas, acilasas, dehalogenasas , dioxigenasas , diari lpropano peroxidasas, epimerasas, epóxido hidrolasas, esterasas, isomerasas, cinasas, glucosa isomerasas, glicosidasas, glicosil transíerasas , haloperoxidasas , monooxigenasas , (e.g., p450s), lipasas, lignina peroxidasas, nitrilo hidratasas, nitrilasas, proteasas, fosfatasas, subtilisinas , transaminasa y nucleasas. Muchas de estas proteínas se encuentran comercialmente disponibles (ver, e.g., el catálogo y la lista de precios de Sigma BioSciences 2002) y son muy conocidas las secuencias de proteínas y genes correspondientes y, típicamente, muchas variantes de los mismos (ver, e.g., GenBank) . Cualguiera de ellas puede modificarse mediante la inserción de uno o más aminoácidos no naturales de acuerdo con la invención, e.g., para alterar la proteína con respecto a una o más propiedades terapéuticas, de diagnóstico o enzimáticas de interés. Ejemplos de las propiedades terapéuticamente relevantes incluyen la vida media en suero, la vida media en anaquel, la estabilidad, la inmunogenicidad, la actividad terapéutica, la detectabilidad (e.g., mediante la inclusión de grupos informantes (e.g., marcas o sitios de enlace de marca) en los aminoácidos no naturales), la reducción de LD50 u otros efectos secundarios, la capacidad para introducirse al cuerpo a través del tracto gástrico
(e.g., disponibilidad oral) o lo similar. Ejemplos de propiedades diagnósticas incluyen la vida media en anaquel, la estabilidad, la actividad diagnóstica, detectabilidad o lo similar. Ejemplos de propiedades enzimáticas relevantes incluyen la vida media en anaquel, la estabilidad, la actividad enzimática, la capacidad de producción o lo simila . También puede modificarse una variedad de proteínas diferentes para incluir uno o más de los aminoácidos no naturales de la invención. Por ejemplo, la invención puede incluir la sustitución de uno o más aminoácidos naturales en una o más proteínas de vacuna con un aminoácido no natural, e.g., en proteínas de hongos infecciosos, e.g., Aspergillus, especies Candida; bacterias, particularmente E. coli, que sirve como modelo para bacterias patógenas, así como bacterias médicamente importantes tales como Staphylococci (e.g., aureus), o Streptococci (e.g., pneumoniae) ; protozoarios tales como sporozoos (e.g., Plasmodia) , rizópodos (e.g., Entamoeba) y flagelados ( Trypanosoma , Leishmania, Trichomonas, Giardia, etc.); virus tales como virus de (?) ARN (los ejemplos incluyen virus de viruela, e.g., vacunas; picornavirus , e.g., polio; togavirus e.g., rubéola; flavivirus, e.g., VHC; y coronavirus ) , virus (-) de ARN (e.g., rabdovirus, e.g., VSV; paramioxovirus , e.g., RSV; ortomixovirus , e.g., influenza; bunyavirus; y Arenavirus),
v rus de ADNds (reovirus, por ejemplo), virus de ARN para ADN, i.e., retrovirus, e.g., VIH y VTLH y ciertos virus de ADN para ARN tales como el de hepatitis B. Las proteínas agrícolamente relacionadas tales como las proteínas de resistencia a insectos (e.g., las proteínas Cry) , enzimas de producción de almidón y lípidos, toxinas de plantas e insectos, proteínas de resistencia a toxinas, proteínas de desintoxicación de micotoxinas, enzimas de crecimiento de plantas (e.g., ribulosa 1 , 5-bisfosfato carboxilasa/oxigenasa, "RUBISCO"), lipoxigenasa (LOX) y fosfofenolpiruvato (PEP) carboxilasa, también son objetivos adecuados para la modificación de aminoácidos no naturales. La invención proporciona también métodos para producir en una célula de vertebrado, al menos una proteína que comprende al menos un aminoácido no natural (y proteínas producidas mediante tales métodos) . Por ejemplo, un método incluye: cultivar, en un medio apropiado, una célula de vertebrado que comprende un ácido nucleico que comprende al menos un codón selector y que codifica para la proteína. la célula de vertebrado comprende también: un ARNt ortogonal (0-ARNt) que funciona en la célula y reconoce al codón selector; y una aminoacil ARNt sintetasa ortogonal (O-RS) que preferentemente aminoacila el O-ARNt con el aminoácido no natural y el medio comprende un aminoácido no natural. En una modalidad, el método incluye además la
incorporación en la proteina del aminoácido no natural, en donde el aminoácido no natural comprende un primer grupo reactivo; y poner en contacto la proteina con una molécula (e.g., un colorante, un polímero, e.g., un derivado de polietileno glicol, un fotorreticulador , un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador de metal, un cofactor, un ácido graso, un carbohidrato, un pol inucleót ido (e.g., ADN, ARN, etc.), y lo similar) que comprende un segundo grupo reactivo. El primer grupo reactivo reacciona con el segundo grupo reactivo para unir la molécula al aminoácido no natural mediante una cicloadición [3+2] . En una modalidad, el primer grupo reactivo es un residuo alquinilo o azido y el segundo grupo reactivo es un residuo azido o alquinilo. Por ejemplo, el primer grupo reactivo es el residuo alquinilo (e.g., en el aminoácido no natural p-propargiloxifenilalanina), y el segundo grupo reactivo es el residuo azido. En otro ejemplo, el primer grupo reactivo es el residuo azido (e.g., en el aminoácido no natural p-azido-L-fenilalanina ( y el segundo grupo reactivo es el residuo alquinilo. En una modalidad, la O-RS aminoacila el O-ARNt con el aminoácido no natural al menos 50% tan eficientemente como lo hace una O-RS que tiene una secuencia de aminoácidos, e.g., como se establece en la SEQ ID NO: 86 o 45. En otra
modalidad, el O-ARNt comprende, se procesa a partir de, o se codifica por, la SEQ ID NO: 65 o 64, o una secuencia de polinucleótidos complementaria de las mismas. Aún en otra modalidad, la O-RS comprende un aminoácido establecido en cualquiera de las SEQ ID NO: 36-63 y/o 86. La proteina codificada puede comprender, e.g., una proteina terapéutica, una proteina diagnóstica, una enzima industrial, o una porción de las mismas. Opcionalmente , la proteina que se produce mediante el método se modifica además a través del aminoácido no natural. Por ejemplo, la proteina producida mediante el método se modifica opcionalmente mediante al menos una modificación post-traducción in vivo. También se proporcionan métodos para producir una proteina moduladora transcripcional de selección (y para elegir o seleccionar las proteínas moduladoras transcripcionales producidas mediante tales métodos) . Por ejemplo, un método incluye: seleccionar una primera secuencia de polinucleótidos, en donde la secuencia de polinucleótidos codifica para un dominio de enlace de ácido nucleico; y mutar la primera secuencia de polinucleótidos para incluir al menos un codón selector. Esto proporciona una secuencia de polinucleótidos de elección o selección. El método incluye también: seleccionar una segunda secuencia de polinucleótidos, en donde la segunda secuencia de polinucleótidos codifica para un dominio de activación
transcripcional ; proporcionar una construcción que comprende la elección o selección del pol inucleót ido operablemente enlazado a la segunda secuencia de polinucleótidos ; e introducir la construcción, un aminoácido no natural, una ARNt sintetasa ortogonal (O-RS) y un ARNt ortogonal (O-ARNt) en una célula. Con estos componentes, la O-RS aminoacila preferentemente el O-ARNt con el aminoácido no natural y el O-ARNt reconoce el codón selector e incorpora el aminoácido no natural en el dominio de enlace del ácido nucleico, en respuesta al codón selector en la elección o selección de la secuencia de polinucleótido, proporcionando asi la elección o selección de la proteina moduladora transcripcional. En ciertas modalidades, la proteina o polipéptido de interés (o una porción del mismo) en los métodos y/o composiciones de la invención, se codifica por un ácido nucleico. Típicamente, el ácido nucleico comprende al menos un codón selector, al menos dos codones selectores, al menos tres codones selectores, al menos cuatro codones selectores, al menos cinco codones selectores, al menos seis codones selectores, al menos siete codones selectores, al menos ocho codones selectores, al menos nueve codones selectores, diez o más codones selectores. Los genes que codifican para las proteínas o polipéptidos de interés pueden mutagenizarse utilizando métodos muy conocidos para el experto en la técnica y
descritos en la presente bajo "Mutagénesis y otras técnicas de biología molecular", para incluir, e.g., uno o más codones selectores para la incorporación de un aminoácido no natural. Por ejemplo, un ácido nucleico para una proteína de interés se mutageniza para incluir uno o más codones selectores, proporcionando la inserción de los uno o más aminoácidos no naturales. La invención incluye todas tales variantes, e.g., mutantes, las versiones de cualquier proteína, e.g., incluyendo al menos un aminoácido no natural. De manera similar, la invención también incluye los ácidos nucleicos correspondientes, i.e., cualquier ácido nucleico con uno o más codones selectores que codifica para uno o más aminoácidos no naturales. Purificación de proteínas recombinantes que comprenden aminoácidos no naturales Las proteínas de la invención, e.g., proteínas que comprenden aminoácidos no naturales, anticuerpos para proteínas que comprenden aminoácidos no naturales, etc., pueden purificarse, ya sea parcial o sustancialmente hasta homogeneidad, de acuerdo con procedimientos estándar conocidos y utilizados por los expertos en la técnica. por consiguiente, los polipéptidos de la invención pueden recuperarse y purificarse mediante cualquiera de un número de métodos muy conocidos en la técnica incluyendo, e.g., precipitación de sulfato de amonio o etanol, extracción de
ácido o base, cromatografía de columna, cromatografía de columna de afinidad, cromatografía de intercambio de anión o catión, cromatografía de fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de hidroxilapatita , cromatografía de lectina, electroforesis de gel y lo similar. Pueden utilizarse etapas de re-doblamiento de proteínas, según se desee, para fabricar correctamente proteínas maduras dobladas. La cromatografía líquida de alto desempeño (HPLC) , la cromatografía de afinidad u otros métodos adecuados, pueden emplearse en etapas de purificación final en donde se desea una alta pureza. En una modalidad, los anticuerpos producidos contra aminoácidos no naturales (o las proteínas que comprenden aminoácidos no naturales) se utilizan como reactivos de purificación, e.g., para la purificación en base a afinidad de las proteínas que comprenden uno o más aminoácidos no naturales. Una vez purificados, parcialmente o hasta homogeneidad, según se desee, los polipéptidos se utilizan opcionalmente , e.g., como componentes de análisis, reactivos terapéuticos o como inmunógenos para la producción de anticuerpos. Además de otras referencias anotadas en la presente, son muy conocidos una variedad de métodos de purificación/doblamiento de proteínas, incluyendo e.g., los establecidos en R. Scopes, Protein Purification (Purificación de proteínas), Springer-Verlag, N.Y., (1982); Deutscher,
Methods in Enzymology (Métodos en enzimología ) , Vol . 182: Guide to Protein Purification (Guía para la purificación de proteínas), Academic Press, Inc., N.Y. (1990); Sandana (1997) Bioseparation of Proteins ( Bioseparación de proteínas), Academic Press, Inc.; Bollag et al., (1996) Protein Methods (Métodos de proteínas), 2a edición, Wiley-Liss, N.Y.; Wealker (1996) The Protein Protocols Handbook (Manual de protocolos de proteínas), Humana Press, N.J., Harris y Angal (1990) Protein Purification Applications: A Practical Approach (Aplicaciones de purificación de proteínas: un procedimiento práctico), IRL Press en Oxford, Oxford, Inglaterra; Harris y Angal, Protein Purification Methods: A Practical Approach (Métodos de purificación de proteínas: un procedimiento práctico) , IRL Press en Oxford, Oxford, Inglaterra; Scopes (1993) Protein Purification: Principies and Practice (Purificación de proteínas: principios y práctica) 3a edición, Springer Verlag, NY; Janson y Ryden (1998) Protein Purification: Principies, High Resolution Methods and Applications (Purificación de proteínas: principios, métodos y aplicaciones de alta resolución) , segunda edición, Wiley-VCH, NY; y Walker (1998) Protein Protocols on CD-ROM (Protocolos de proteínas en CD-ROM), Humana Press, NJ; y las referencias citadas en la presente. Una ventaja de producir una proteína o polipéptido de interés con un aminoácido no natural en una célula de
vertebrado es que, típicamente, las proteínas o polipéptidos se doblarán en sus conformaciones nativas. Sin embargo, en ciertas modalidades de la invención, los expertos en la técnica reconocerán que, después de la síntesis, expresión y/o purificación, las proteínas pueden poseer una conformación diferente a las conformaciones deseadas de los polipéptidos relevantes. En un aspecto de la invención, la proteina expresada es opcionalmente, desnaturalizada y renatura 1 i zada después. Esto se logra, e.g., agregando una chaperonina a la proteína o polipéptido de interés, y/o solubi lizando las proteínas en un agente caotrópico tal como HCl guanidina, etc. En general, ocasionalmente es deseable desnaturalizar y reducir los polipéptidos expresados y después ocasionar el redoblamiento de los polipéptidos en la conformación preferida. Por ejemplo, puede agregarse guanidina, urea, DTT, DTE y/o chaperonina a un producto de traducción de interés. Los métodos para reducir, desnaturalizar y renaturalizar proteínas son muy conocidos por los expertos en la técnica (ver, las referencias anteriores y Debinski et al., (1993) J. Biol . Chem. , 268:14065-14070; Kreitman y Pastan (1993) Bioconjug. Chem., 4:81-585; y Buchner et al., (1992) Anal. Biochem. , 205:263-270). Debisnki et al., por ejemplo, describen la desnaturalización y la reducción de la inclusión de proteínas
corporales en guan idina-DTE . Las proteínas pueden redoblarse en un amortiguador de reducción que contiene, e.g., glutationa oxidada y L-arginina. Los reactivos de redoblamiento pueden fluir o de otra manera moverse en contacto con los uno o más polipéptidos u otros productos de expresión o viceversa. Ant icuerpos En un aspecto, la invención proporciona anticuerpos para las moléculas de la invención, e.g., sintetasas, ARNt, y proteínas que comprenden aminoácidos no naturales. Los anticuerpos para las moléculas de la invención son útiles como reactivos de purificación, e.g., para purificar las moléculas de la invención. Además, los anticuerpos pueden utilizarse como reactivos indicadores para indicar la presencia de una sintetasa, ARNt, o proteína, que comprende un aminoácido no natural, e.g., para rastrear la presencia o la ubicación (e.g., in vivo o in situ) de la molécula. Un anticuerpo de la invención puede ser una proteína que comprende uno o más polipéptidos sustancial o parcialmente codificados por genes de inmunoglobulinas o fragmentos de genes de inmunoglobulinas. Los genes de inmunoglobulina reconocidos incluyen, los genes de región constantes kappa, lambda, alfa, gamma, delta, epsilon y mu, así como los genes de región variable de inmunoglobulina myriad. Las cadenas ligeras se clasifican ya sea como kappa
0 lambda. Las cadenas pesadas se clasifican como gamma, mu, alfa, delta o epsilon, que a su vez, definen las clases de
1 nmunoglobulina IgG, IgM, IgA, IgD e IgE, respectivamente. Una unidad estructural de inmunoglobul i na típica (e.g., anticuerpo) comprende un tetrámero. Cada tetrámero se compone de dos pares idénticos de cadenas de polipéptido, teniendo cada par una cadena "ligera" (aproximadamente 25 kD) y una "pesada" (aproximadamente 50-70 kD) . La terminal N de cada cadena define una región variable de aproximadamente 100 a 110 o más aminoácidos, principalmente responsables del reconocimiento de antígenos. Los términos cadena ligera variable (VL) y cadena pesada variable (VH), se refieren a estas cadenas ligera y pesada, respectivamente. Los anticuerpos existen como inmunoglobulinas intactas o como un número de fragmentos bien caracterizados producidos mediante la digestión con varias peptidasas. Por tanto, por ejemplo, la pepsina digiere un anticuerpo por debajo de los enlaces disulfuro en la región de articulación para producir un F(ab')2, un dímero de Fab, que en sí es una cadena ligera unida a VH-CH1 mediante un ligando disulfuro. El F(ab')2 puede reducirse bajo condiciones suaves para romper el enlace disulfuro en la región de articulación, convirtiendo así al dímero F(ab')2 en un monómero Fab' . El monómero Fab' es esencialmente un Fab con parte de la región de articulación (ver, Fundamental Immunology, (Inmunología
fundamental), 4a edición, W . E . Paul, ed . , Raven Press, N.Y. (1999), para una descripción más detallada de otros fragmentos de anticuerpo). Aunque se definen varios fragmentos de anticuerpo en términos de la digestión de un anticuerpo intacto, el experto apreciará que tales fragmentos Fab' , etc., pueden sintetizarse de nuevo ya sea químicamente o utilizando metodología de ADN recombinante . Por tanto, el término anticuerpo, como se utiliza en la presente, incluye también opcionalmente fragmentos de anticuerpo, ya sea producidos mediante la modificación de anticuerpos completos, o sintetizados de nuevo utilizando metodología de ADN recombinante. Los anticuerpos incluyen anticuerpos monocatenarios , incluyendo anticuerpos de Fv monocatenarios (sFv o scFv) en los cuales una cadena pesada variable y una ligera variable se encuentran unidas entre sí (directamente o a través de un ligando de péptido) para formar un polipéptido continuo. Los anticuerpos de la invención pueden ser e.g., fragmentos policlonales , monoclonales , quiméricos, humanizados, monocatenarios, fragmentos Fab, producidos mediante una biblioteca de expresión Fab o lo similar. En general, los anticuerpos de la invención son valiosos, como reactivos generales y como reactivos terapéuticos, en una variedad de procesos biológicos o farmacéuticos. Los métodos para producir anticuerpos policlonales y monoclonales se encuentran disponibles y
pueden aplicarse a la fabricación de los anticuerpos de la invención. Un número de textos básicos describen procesos estándar para la producción de anticuerpos, incluyendo, e.g., Borrebaeck (ed) (1995) Antibody Engineering (Ingeniería de anticuerpos), 2o edición, Freeman and Company, N.Y. (Borrebaeck); McCafferty et al., (1996) Antibody Engineering, A Practical Approach (Ingeniería de anticuerpos, un procedimiento práctico) IRL en Oxford Press, Oxford, Inglaterra (McCafferty), y Paul (1995) Antibody Engineering Protocols (Protocolos de ingeniería de anticuerpos), Humana Press, Towata, N.J. (Paul); Paul (ed) , (1999) Fundamental Immunology, (Inmunología fundamental), Quinta edición, Raven Press, N.Y.; Coligan (1991) Current Protocols in Immunology (Protocolos actuales en inmunología) Wiley/Greene, N.Y.; Harlow & Lañe (1989) Antibodies: A Laboratory Manual (Anticuerpos: un manual de laboratorio), Cold Spring Harbor Press, N.Y.; Stites et al., (eds.) Basic and Clinical Immunology (Inmunología básica y clínica) (4a edición) Lange Medical Publications , Los Altos, CA, y las referencias citadas en las mismas; Goding (1986) Monoclonal Antibodies: Principies and Practice (Anticuerpos monoclonales: principios y práctica) (2a edición) Academic Press, New York, N . Y . ; y Kohler y Milstein (1975) Nature (Naturaleza) 256:495-497. Se ha desarrollado una variedad de técnicas recombinantes para la preparación de anticuerpos que no se
basan en e.g., la inyección de un antigeno en un animal, y pueden utilizarse en el contexto de la presente invención. Por ejemplo, es posible generar y seleccionar bibliotecas de anticuerpos recombinantes en vectores fago o similares. Ver e.g., Winter et al., (1994) Making Antibodies by Phage Display Technology (Elaboración de anticuerpos mediante tecnología de vi sua 1 i zación de fago) Annu . Rev. Immunol., 12:433-55 y las referencias citadas en la misma para una revisión. Ver también, Griffiths y Duncan (1998) Strategies for selection of antibodies by phage display (Estrategias para la selección de anticuerpos mediante visualización de fago) Curr. Opin. Biotechnol., 9:102-8; Hoogenboom et al., (1998) Antibody phage display technology and its applications (Tecnología de visualización de fago de anticuerpos y sus aplicaciones) Immunotechnology, 4: 1-20; Gram et al., (1992) In vitro selection and affinity maturation of antibodies from a native combinatorial immunoglobul in library (Selección in vitro y maduración por afinidad de anticuerpos a partir de una biblioteca nativa de inmunoglobulina combinatoria) PNAS 89:3576-3580; Huse et al., (1989) Science 246: 1275-1281; y Ward et al., (1989) Nature 341:544-546. En una modalidad, las bibliotecas de anticuerpos incluyen repertorios de genes V (e.g., cosechados a partir de poblaciones de linfocitos o ensamblados in vivo) que se clonan para la visualización de dominios variables asociados
de cadena pesada y ligera en la superficie de bacteriófagos filamentosos. Los fagos se seleccionan mediante enlace a un antigeno. Los anticuerpos solubles se expresan a partir de bacterias fago infectadas y el anticuerpo puede mejorarse, e.g., mediante mutagénesis. Ver, e.g., Balint y Larrick (1993) Antibody Engineering by Parsimonious Mutagenesis (Ingeniería de anticuerpos mediante mutagénesis parsimoniosa) Gene 137:109-118; Stemmer et al., (1993) Selection of an Active Single Chain Fv Antibody From a Protein Linker Library Prepared by Enzymatic Inverse PCR (Selección de un anticuerpo Fv activo monocatenario a partir de una biblioteca de enlace de proteínas preparada mediante PCR enzimática inversa) Biotechniques 14 ( 2 ) : 256- 65 ; Crameri et al., (1996) Construction and evolution of ant ibody-phage librarles by DNA shuffling (Construcción y evolución de bibliotecas de anticuerpo-fago mediante arrastre de ADN), Nature Medicine, 2:100-103, y Crameri y Stemmer (1995) Combinatorial múltiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes (La mutagénesis combinatoria múltiple de cásete crea todas las permutaciones de casetes mutantes y de tipo silvestre) BioTechniques 18:194-195. También se conocen y se encuentran disponibles los equipos para clonación y expresión de sistemas fago de anticuerpos recombinantes , e.g., el "sistema de anticuerpo fago recombinante , módulo ScFv de ratón" de Amersham-
Pharmacia Biotechnology (Uppsala, Suecia) . También se han producido bibliotecas de anticuerpo bacteriófago para elaborar anticuerpos humanos de alta afinidad mediante arrastre de cadena (Ver e.g., Marks et al., (1992) By-passing immuni zat ion : Building high affinity human antibodies by chain shuffling (Inmunización de derivación: construcción de anticuerpos humanos de alta afinidad mediante arrastre de cadena) Biotechn iques 10:779-782. Se reconocerá también que los anticuerpos pueden prepararse mediante cualquiera de un número de servicios comerciales (e.g., Bethyl Laboratories (Montgomery, TX), Anawa (Suiza), Eurogentec (Bélgica y en los E.U. en Phi ladelphia , PA, etc.) y muchos otros. En ciertas modalidades, es útil "humanizar" los anticuerpos de la invención, e.g., cuando los anticuerpos van a administrarse terapéuticamente. El uso de anticuerpos humanizados tiende a reducir la incidencia de respuestas inmunes no deseadas contra los anticuerpos terapéuticos (e.g., cuando el paciente es humano) . Las referencias de anticuerpos anteriores, describen las estrategias de humanización. Además de los anticuerpos humanizados, los anticuerpos humanos son también una característica de la invención. Los anticuerpos humanos consisten de secuencias de inmunoglobulina característicamente humanas. Los anticuerpos humanos pueden producirse utilizando una amplia variedad de métodos (ver, e.g., Larrick et al., Patente de
E.U. No. 5,001,065 para una revisión) . Un procedimiento general para producir anticuerpos humanos mediante tecnología de trioma se describe por Ostberg et al., (1983), Hybridoma 2:361-367, Ostberg, Patente de E.U. No. 4,634,664 y Engelman et al., Patente de E.U. No. 4,634,666. Se conoce una variedad de métodos para utilizar anticuerpos en la purificación y detección de proteínas y pueden aplicarse para detectar y purificar proteínas que comprenden aminoácidos no naturales, como se anota en la presente. En general, los anticuerpos son reactivos útiles para ELISA, inmunoanálisis western, inmunohistoquímica , métodos de cromatografía de afinidad, SPR, y muchos otros métodos. Las referencias antes anotadas proporcionan detalles de cómo llevar a cabo análisis ELISA, inmunoanálisis western, resonancia de plasmón de superficie (SPR) y lo similar . En un aspecto de la invención, los anticuerpos de la invención en sí incluyen aminoácidos no naturales que proporcionan a los anticuerpos las propiedades de interés (e.g., vida media mejorada, estabilidad, toxicidad o lo similar) . Ver también la sección en la presente titulada " Polipéptidos con aminoácidos no naturales". Los anticuerpos representan casi el 50% de todos los compuestos actualmente en pruebas clínicas (Wittrup (1999) Phage on Display, TibTech, 17:423-424 y los anticuerpos se utilizan de igual
manera como reactivos de diagnóstico. Por consiguiente, la capacidad de modificar los anticuerpos con aminoácidos no naturales proporciona una importante herramienta para modificar estos valiosos reactivos. Por ejemplo, existen muchas aplicaciones de Mabs en el campo del diagnóstico. Los análisis varían desde simples pruebas de punto hasta métodos más involucrados tales como el NR-LU-10 Mab radio marcado de DuPont Merck Co., utilizado para visualización de tumor (Rusch et al., (1993) NR-LU-10 monoclonal antibody scanning. A helpful new adjunct to computed tomography in evaluating non-small-cell lung cáncer (Escaneo de anticuerpo monoclonal NR-LU-10. Un nuevo anexo de ayuda en la tomografía computari zada para evaluar el cáncer pulmonar no de célula pequeña), J. Thorac Cardiovasc Surg 196:200-4) . Como se anotó, los Mabs son reactivos centrales para ELISA, inmunoanálisis western, inmunoquímica , métodos de cromatografía de afinidad y lo similar. Cualquiera de tales anticuerpos de diagnóstico puede modificarse para incluir uno o más aminoácidos no naturales, para alterar, e.g., la especificidad o la avidez del Ab para un objetivo o para alterar una o más propiedades detectables, e.g., incluyendo una marca detectable (e.g., espectrográfica , fluorescente, luminiscente, etc.) en el aminoácido no natural . Una clase de reactivos de anticuerpo valiosos son
los Abs terapéuticos. Por ejemplo,, los anticuerpos pueden ser Mabs específicos del tumor que arrestan el crecimiento del tumor dirigiéndose a las células de tumor para su destrucción mediante citotoxicidad mediada por células dependiente del anticuerpo (ADCC) o lisis mediada por el complemento (CML) (estos tipos generales de Abs se refieren algunas veces como "balas mágicas") . Un ejemplo es Rituxan, un Mab anti-CD20 para el tratamiento de linfoma no de Hodgkins (Scott (1998) Rituximab: a new therapeutic monoclonal antibody for non-Hodkin' s lymphoma (Rituximab: un nuevo anticuerpo monoclonal terapéutico para linfoma no de Hodkin) Cáncer Pract . , 6:195-7) . Un segundo ejemplo se refiere a anticuerpos que interfieren con un componente crítico del crecimiento de tumor. Herceptin es un anticuerpo monoclonal anti-HER-2 para el tratamiento de cáncer metastásico de mama y proporciona un ejemplo de un anticuerpo con este mecanismo de acción (Baselga et al., (1998) Recombinant humanized anti-HER2 antibody (Herceptin) enhances the antitumor activity of paclitaxel and doxorubicin against HER2/neu overexpressing human breast cáncer xenografts (El anticuerpo anti-HER2 humanizado recombinante (Herceptin) mejora la actividad anti-tumor de paclitaxel y doxorubicin contra HER2/new que sobre-expresa los xenoinjertos del cáncer de mama humano) [la errata publicada aparece en Cáncer Res., (1999) 59(8):2020], Cáncer Res., 58:2825-31). Un tercer
ejemplo se refiere a anticuerpos para el suministro de compuestos citotóxicos (toxinas, radionúclidos , etc.) directamente a un tumor u otro sitio de interés. Por ejemplo, una aplicación de Mab es CYT-356, un anticuerpo enlazado a 90/ que dirige la radiación directamente a células de tumor de próstata (Deb et al., (1996) Treatment of hormone-refractory prostate cáncer with 90Y-CYT-356 monoclonal antibody (Tratamiento de cáncer de próstata refractario a hormonas con anticuerpos monoclonal 90Y-CYT-356) Clin. Cáncer Res., 2:1289-97. Una cuarta aplicación es la terapia de profármacos de enzimas dirigidas al anticuerpo, en donde una enzima co-localizada a un tumor activa un profármaco administrado de manera sistémica en cercanía al tumor. Por ejemplo, un anticuerpo anti-Ep-CAMl enlazado a carboxipeptidasa A se encuentra en desarrollo para el tratamiento del cáncer colorrectal (Wolfe et al., (1999) Antibody-directed enzyme prodrug therapy with the T268G mutant of human carboxipeptidase Al: in vitro and in vivo studies with prodrugs of methotrexate and the thymidylate synthase inhibitors G 1031 and G 1843 (Terapia de profármacos de enzimas dirigidas al anticuerpo con el muíante T268G de carboxipeptidasa humana Al: estudios in vitro e in vivo con profármacos de metotrexato y los inhibidores de timidilato sintasa G 1031 y G 1843), Bioconj . Chem. , 10:38-48). Otros Abs (e.g., antagonistas) se diseñan para inhibir
específicamente las funciones celulares normales para beneficio terapéutico. Un ejemplo es Orthoclone 0KT3, un Mab anti-CD3 ofrecido por Johnson y Johnson para reducir el rechazo agudo al transplante de órganos (Strate et al., (1990) Orthoclone OKT3 as first-line therapy in acute renal allograft rejection (Orthoclone OKT3 como terapia de primera línea en el rechazo agudo de aloinjerto renal) Transplant Proc., 22:219-20. Otra clase de productos de anticuerpo son los agonistas. Estos Mabs se diseñan para mejorar específicamente las funciones celulares normales para beneficio terapéutico. Por ejemplo, se encuentran en desarrollo agonistas a base de Mab de receptores de acetilcolina para neuropatía (Xie et al., (1997) Direct demostration of MuSK involvement in acetylcholine receptor clustering through identif ication of agonist ScFv (Demostración directa de la implicación de MuSK en la agrupación del receptor de acetilcolina mediante la identificación del agonista ScFV) Nat. Biotechnol., 15:768-71. Cualquiera de estos anticuerpos puede modificarse para incluir uno o más aminoácidos no naturales para mejorar una o más propiedades terapéuticas (especificidad, avidez, vida media en suero, etc.) . Otra clase de productos de anticuerpo proporcionan nuevas funciones. Los anticuerpos principales en este grupo son los anticuerpos catalíticos tales como las secuencias Ig
que se han diseñado para imitar las capacidades catalíticas de enzimas (Wentworth y Janda (1998) Catalytic antibodies (Anticuerpos catalíticos) Curr. Opin. Chem. Biol . , 2:138-44. Por ejemplo, una aplicación interesante implica el uso del anticuerpo catalítico mAb-15A10 para hidrolizar cocaína in vivo para terapia de adicción (Mets et al., (1998) A catalytic antibody against cocaine prevents cocaine's reinforcing and toxic effects in rats (Un anticuerpo catalítico contra la cocaína previene el reforzamiento y los efectos tóxicos de la cocaína en ratas) Proc. Nati. Acad. Sci. E.U.A., 95:10176-81) . Los anticuerpos catalíticos también pueden modificarse para incluir uno o más aminoácidos no naturales para mejorar una o más propiedades de interés. Definición de Polipéptidos mediante Inmunorreact ividad Debido a que los polipéptidos de la invención proporcionan una variedad de nuevas secuencias de polipéptidos (e.g., que comprenden aminoácidos no naturales en el caso de proteínas sintetizadas en los sistemas de traducción en la presente, o, e.g., en el caso de las nuevas sintetasas en la presente, nuevas secuencias de aminoácidos estándar) , los polipéptidos proporcionan también nuevas características estructurales que pueden reconocerse, e.g., en análisis inmunológicos . La generación de anticuerpos o de anticuerpos que se enlazan específicamente a los polipéptidos
de la invención, asi como los polipéptidos que se enlazan mediante tales anticuerpos o antisuero, son una característica de la invención. Por ejemplo, la invención incluye proteínas de sintetasa que se enlazan específicamente a o que son específicamente inmunorreactivas con un anticuerpo o antisuero generado contra un inmunógeno que comprende una secuencia de aminoácidos seleccionada de una o más de (SEQ ID NO: 36-63 y/o 86) . Para eliminar la reactividad cruzada con otros homólogos, el anticuerpo o antisuero se sustrae con homólogos de sintetasa de control disponibles tales como la tirosil sintetasa de E. coli de tipo silvestre (TyRS) (e.g., SEQ ID NO: 2) . En un formato típico, el inmunoanálisis utiliza un antisuero policlonal que se cultivó contra uno o más polipéptidos que comprenden una o más de las secuencias correspondientes a una o más de las SEQ ID NO: 36-63 y/o 86, o una subsecuencia sustancial de las mismas (i.e., al menos aproximadamente 30% de la secuencia de longitud total proporcionada). El conjunto de inmunógenos de polipéptido potenciales derivado de las SEQ ID NO: 36-63 y 86, se refiere colectivamente a continuación como "los polipéptidos inmunogénicos" . El antisuero resultante se selecciona opcionalmente para tener una baja reactividad cruzada contra los homólogos de sintetasa de control y toda reactividad
cruzada se retira, e.g., mediante inmunoabsorción , con uno o más homólogos de sintetasa de control, previo al uso del antisuero policlonal en el inmunoanál isis . A fin de producir el antisuero para su uso en un inmunoanálisis , se producen uno o más de los polipéptidos inmunogénicos y se purifican como se describe en la presente. Por ejemplo, la proteina recombinante puede producirse en una célula recombinante. Una especie cultivada de ratones
(utilizada en este análisis debido a que los resultados son más reproducibles dada la identidad genética virtual de los ratones) se inmuniza con la(s) proteina (s) inmunogénica ( s ) en combinación con un adyuvante estándar, tal como adyuvante de Freund, y un protocolo estándar de inmunización de ratón (ver e.g., Harlow y Lañe (1988) Antibodies, A Laboratory Manual (Anticuerpos, un manual de laboratorio) Cold Spring Harbor Publications , New York, para una descripción estándar de la generación de anticuerpos, formatos de inmunoanálisis y condiciones que pueden utilizarse para determinar la inmunorreactividad especifica. También se encuentran en la presente referencias y tratados adicionales de anticuerpos que pueden aplicarse aquí para producir anticuerpos que definen/detectan polipéptidos mediante inmunorreactividad) . Alternativamente, uno o más polipéptidos sintéticos o recombinantes derivados de las secuencias descritas en la presente, se conjugan a una proteína vehículo y se utilizan
como un inmunógeno. El suero policlonal se recolecta y se valora contra el polipéptido inmunogénico en un inmunoanálisis , por ejemplo, un inmunoanálisis de fase sólida con una o más de las proteínas inmunogénicas inmovilizadas en un soporte sólido. El antisuero policlonal con una valoración de 106 o mayor se selecciona, se deposita y se sustrae con los polipéptidos de sintetasa de control para producir antisuero policlonal valorado sustraído depositado. El antisuero policlonal valorado sustraído depositado se prueba por reactividad cruzada contra los homólogos de control en un inmunoanálisis comparativo. En este análisis comparativo, se determinan las condiciones discriminatorias de enlace para el antisuero policlonal valorado sustraído, que dan como resultado una proporción de señal a ruido al menos aproximadamente 5-10 veces mayor para el enlace del antisuero policlonal valorado a la sintetasa inmunogénica en comparación con el enlace a un homólogo de sintetasa de control. Es decir, la rigurosidad de la(s) reacción (es) de enlace/lavado, se ajusta mediante la adición de competidores no específicos tales como albúmina o leche en polvo sin grasa, y/o ajusfando las condiciones de sal, la temperatura y/o lo similar. Estas condiciones de enlace/lavado se utilizan en análisis subsecuentes para determinar si un polipéptido de prueba (un polipéptido que se
compara con el polipéptido inmunogénico y/o con los polipéptidos de control) se encuentra enlazado específicamente por el antisuero policlonal sustraído depositado. En particular, los polipéptidos de prueba que muestran una proporción de señal a ruido al menos 2-5 veces mayor que el homólogo de sintetasa de control bajo condiciones discriminatorias de enlace, y una proporción de señal a ruido de al menos aproximadamente ½, en comparación con el (los) polipéptido ( s ) inmunogénico ( s ) , comparten una similitud estructural sustancial con el polipéptido inmunogénico en comparación con las sintetasas conocidas, y, en consecuencia, son un polipéptido de la invención. En otro ejemplo, los inmunoanálisis en el formato de enlace competitivo se utilizan para la detección de un polipéptido de prueba. Por ejemplo, como se anotó, los anticuerpos de reacción cruzada se retiran de la mezcla de antisuero depositada mediante inmunoabsorción con los polipéptidos de control. El (los) polipéptido ( s ) inmunogénico ( s ) se inmoviliza (n) entonces a un soporte sólido que se expone al antisuero depositado sustraído. Las proteínas de prueba se agregan al análisis para competir por el enlace al antisuero sustraído depositado. La capacidad de la(s) proteína (s) de prueba para competir por el enlace al antisuero depositado sustraído, en comparación con la(s) proteína (s) inmovilizada ( s ) , se compara con la capacidad de
el (los) polipéptido ( s ) inmunogénico ( s ) agregados al análisis para competir por el enlace (los polipéptidos inmunogénicos compiten efectivamente con los polipéptidos inmunogénicos inmovilizados por el enlace al antisuero depositado). La reactividad cruzada porcentual para las proteínas de prueba se calcula utilizando cálculos estándar. En un análisis paralelo, la capacidad de las proteínas de control para competir por el enlace del antisuero depositado sustraído se determina opcionalmente en comparación con la capacidad de el (los) polipéptido ( s ) inmunogénico ( s ) para competir por el enlace al antisuero. De nuevo, la reactividad cruzada porcentual para los polipéptidos de control se calcula utilizando cálculos estándar. Cuando la reactividad cruzada porcentual es al menos 5-10 veces tan alta para los polipéptidos de prueba comparados con los polipéptidos de control y/o cuando el enlace de los polipéptidos de prueba se encuentra aproximadamente en el rango del enlace de los polipéptidos inmunogénicos, se dice que los polipéptidos de prueba se enlazan específicamente al antisuero depositado sustraído. En general, el antisuero inmunoabsorbido y depositado puede utilizarse en un inmunoanálisis de enlace competitivo, como se describe en la presente, para comparar cualquier polipéptido de prueba con el (los) polipéptido ( s ) inmunogénico ( s ) y/o de control. A fin de realizar esta
comparación, los polipéptidos inmunogénicos de prueba y de control se analizan cada uno en un amplio rango de concentraciones y la cantidad de cada polipéptido requerida para inhibir el 50% del enlace del antisuero sustraído e.g., a una proteína inmovilizada de control, de prueba o inmunogénica , se determina utilizando técnicas estándar. Si la cantidad del polipéptido de prueba requerida para el enlace en el análisis competitivo, es menor que dos veces la cantidad del polipéptido inmunogénico que se requiere, entonces se dice que el polipéptido de prueba se enlaza específicamente a un anticuerpo generado para la proteína inmunogénica, siempre que la cantidad sea al menos aproximadamente 5-10 veces tal alta como para el polipéptido de control. Como una determinación de especificidad adicional, el antisuero depositado se encuentra opcionalmente totalmente inmunoabsorbido con el (los) polipéptido ( s ) inmunogénico ( s ) (más que con los polipéptidos de control) hasta detectar poco o ningún enlace del antisuero depositado sustraído del polipéptido inmunogénico resultante a el (los) polipéptido ( s ) inmunogénico ( s ) utilizado (s) en la inmunoabsorción . Este antisuero totalmente inmunoabsorbido se prueba entonces por reactividad con el polipéptido de prueba. Si se observa poca o ninguna reactividad (i.e., no más de 2 veces la proporción de señal a ruido observada para el enlace del antisuero
totalmente inmunoabsorb ido al polipéptido inmunogénico ) , entonces el polipéptido de prueba se encuentra específicamente enlazado por el antisuero extraído por la proteína inmunogén ica . Composiciones Farmacéuticas Los polipéptidos o proteínas de la invención (e.g., sintetasas, proteínas gue comprenden uno o más aminoácidos no naturales, etc.) se emplean opcionalmente para usos terapéuticos, e.g., en combinación con un vehículo farmacéutico adecuado. Tales composiciones, e.g., comprenden una cantidad terapéuticamente efectiva del compuesto y un vehículo o excipiente farmacéuticamente aceptable. Tal vehículo o excipiente incluye, pero no se limita a, salina, salina amortiguada, dextrosa, agua, glicerol, etanol, y/o combinaciones de los mismos. La formulación se elabora para adaptarse al modo de administración. En general, los métodos para administrar proteínas son muy conocidos en la técnica y pueden aplicarse a la administración de los polipéptidos de la invención. Las composiciones terapéuticas que comprenden uno o más de los polipéptidos de la invención se prueban opcionalmente en uno o más modelos animales apropiados in vitro y/o in vivo de la enfermedad para confirmar su eficacia, el metabolismo del tejido y para estimar las dosis de acuerdo con métodos muy conocidos en la técnica. En
particular, las dosis pueden determinarse inicialmente por la actividad, la estabilidad u otras mediciones adecuadas de homólogos de aminoácidos no naturales, en la presente, a naturales (e.g., comparación de un EPO modificado para incluir uno o más aminoácidos no naturales a un aminoácido natural EPO), i.e., en un análisis relevante. La administración se realiza mediante cualquiera de las vías normalmente utilizadas para introducir una molécula en contacto final con células sanguíneas o de tejido. Los polipéptidos de aminoácido no natural de la invención se administran de cualquier manera adecuada, opcionalmente con uno o más vehículos farmacéuticamente aceptables. Se encuentran disponibles los métodos adecuados para administrar tales polipéptidos en el contexto de la presente invención a un paciente y, aunque puede utilizarse más de una vía para administrar una composición particular, frecuentemente una vía particular puede proporcionar una acción o reacción más inmediata y más efectiva que otra vía. Los vehículos farmacéuticamente aceptables se determinan en parte por la composición particular que se administra, así como por el método particular utilizado para administrar la composición. Por consiguiente, existe una amplia variedad de formulaciones adecuadas de las composiciones farmacéuticas de la presente invención. Las composiciones de polipéptidos pueden
administrarse por un número de vías incluyendo, pero sin limitarse a: medios orales, int avenosos, intraperitoneales, intramusculares, transdérmicos , subcutáneos, tópicos, sublinguales o rectales. Las composiciones de polipéptidos de aminoácido no natural también pueden administrarse mediante liposomas. Tales vías de administración y las formulaciones apropiadas se conocen generalmente por los expertos en la técnica. El polipéptido de aminoácido no natural, solo o en combinación con otros componentes adecuados, también pueden producirse en formulaciones en aerosol (i.e., pueden "nebulizarse" ) para administrarse mediante inhalación. Las formulaciones en aerosol pueden colocarse en propulsores presurizados aceptables tales como diclorodifluorometano, propano, nitrógeno y lo similar. Las formulaciones adecuadas para administración parenteral, tales como, por ejemplo, mediante vías intraarticulares (en las articulaciones), intravenosas, intramusculares, intradérmicas , intraperitoneales y subcutáneas, incluyen soluciones para inyección estériles isotónicas acuosas y no acuosas, que pueden contener antioxidantes, amortiguadores, bacterióstatos , y solutos que hacen la formulación isotónica con la sangre del receptor destinado y suspensiones estériles acuosas y no acuosas que pueden incluir agentes de suspensión, solubili zadores ,
agentes espesantes, estabilizadores y conservadores. Las formulaciones de ácido nucleico empacado pueden presentarse en envases de dosis única o multidosis tales como ampolletas y viales. La administración parenteral y la administración intravenosa son los métodos de administración preferidos. En particular, las vías de administración en uso para terapéuticos de homólogos de aminoácido natural (e.g., las típicamente utilizadas para EPO, GCSE, GMCSF, IFNs, interleucinas , anticuerpos y/o cualquier otra proteína farmacéuticamente suministrada), con untamente con las formulaciones actualmente en uso, proporcionan vías de administración y formulaciones preferidas para las proteínas que incluyen los aminoácidos no naturales de la invención (e.g., variantes pegiladas de proteínas terapéuticas actuales , etc . ) . La dosis administrada a un paciente, en el contexto de la presente invención, es suficiente para efectuar una respuesta terapéutica benéfica en el paciente al paso del tiempo o, e.g., para inhibir la infección por un patógeno, u otra actividad apropiada, dependiendo de la aplicación. La dosis se determina por la eficacia de una composición/formulación particular y por la actividad, estabilidad o vida media en suero del polipéptido de aminoácido no natural empleado y por la condición del
paciente, asi como por el peso corporal o área de superficie del paciente que se trata. El tamaño de la dosis también se determina por la existencia, la naturaleza y el grado de todo efecto secundario adverso que acompañe la administración de la composición/formulación particular, o lo similar, en un paciente en particular. Al determinar la cantidad efectiva de la composición/formulación que va a administrarse en el tratamiento o profilaxis de la enfermedad (e.g., cánceres, enfermedades hereditarias, diabetes, SIDA, o lo similar), el médico evalúa los niveles en plasma circulantes, la toxicidad de la formulación, el progreso de la enfermedad y/o si es relevante, la producción de anticuerpos anti polipéptido de aminoácido no natural. La dosis administrada, e.g., a un paciente de 70 kilogramos, se encuentra típicamente en el rango equivalente a las dosis de proteínas terapéuticas actualmente utilizadas, ajustadas para la actividad alterada de la vida media en suero de la composición relevante. Las composiciones/formulaciones de esta invención, pueden suplementar las condiciones de tratamiento mediante cualquier terapia convencional conocida, incluyendo administración de anticuerpos, administración de vacunas, administración de agentes citotóxicos, polipéptidos de aminoácido no natural, ácidos nucleicos, análogos de nucleótidos, modificadores de
respuesta biológica y lo similar. Para su administración, las formulaciones de la presente invención se administran a una proporción determinada por la LD-50 de la formulación relevante y/o por la observación de todo efecto secundario de los aminoácidos no naturales en varias concentraciones, e.g., aplicadas a la masa y a la salud general del paciente. La administración puede lograrse mediante dosis únicas o divididas. Si un paciente que experimenta la infusión de una formulación desarrolla fiebre, escalofríos, o dolores musculares, recibe la dosis apropiada de aspirina, ibuprofeno, acetaminofén u otro fármaco para el control del dolor/fiebre . Los pacientes que experimentan reacciones a la infusión tales como fiebre, dolores musculares y escalofríos, se premedican 30 minutos antes de futuras infusiones, ya sea con aspirina, acetaminofén o, e.g., di feni lhidramina . La meperidina se utiliza para escalofríos y dolores musculares más severos que no responden rápidamente a antipiréticos y antihistaminas . El tratamiento se retrasa o se discontinúa dependiendo de la severidad de la reacción. Ácido nucleico y secuencia y variantes de polipéptido Como se describió anteriormente y a continuación, la invención proporciona secuencias de polinucleótidos de ácido nucleico y secuencias de aminoácidos de polipéptido,
e.g., O-ARNts y O-RSs y, e.g., composiciones y métodos que comprenden dichas secuencias. Ejemplos de dichas secuencias, e.g., O-ARNts y O-RSs, se tratan en la presente (ver, Tabla 5, e.g., SEQ ID NO: 3-65, 86 y otras diferentes a las SEQ ID NO: 1 y 2) . Sin embargo, el experto en la técnica apreciará que la invención no se limita a aquellas secuencias descritas en la presente, e.g., los Ejemplos y la Tabla 5. El experto apreciará que la invención proporciona además muchas secuencias relacionadas e incluso no relacionadas con las funciones descritas en la presente, e.g., que codifican para un O-ARNt o una O-RS. La invención proporciona también polipéptidos (0-RSs) y polinucleót idos , e.g., O-ARNt, pol inucleótidos que codifican para O-RSs o porciones de los mismos (e.g., el sitio activo de la sintetasa), oligonucleótidos utilizados para construir mutantes de aminoacil-ARNt sintetasa, etc. Por ejemplo, un polipéptido de la invención incluye un polipéptido que comprende una secuencia de aminoácido como se muestra en cualquiera de las SEQ ID NO: 36-63 y/o 86, un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se muestra en cualquiera de las SEQ ID NO: 3-35, y un polipéptido que es específicamente inmunorreactivo con un anticuerpo específico para un polipéptido que comprende una secuencia de aminoácidos como se muestra en cualquiera de las
SEQ ID NO: 36-63 y/o 86, o un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se muestra en cualquiera de las SEQ ID NO: 3-35. También se incluyen entre los polipéptidos de la invención, los polipéptidos que comprenden una secuencia de aminoácidos que es al menos 90? idéntica a la de una tirosil aminoacil-ARNt sintetasa de oriqen natural (TyrRS) (e.g., SEQ ID NO: 2) y comprende dos o más aminoácidos de los grupos A-E. por ejemplo, el grupo A incluye valina, isoleucina, leucina, glicina, serina, alanina o treonina en una posición correspondiente a Tyr37 de TyrRS de E. coli; el grupo B incluye aspartato en una posición correspondiente a Asnl26 de TyrRS de E. coli; el grupo C incluye treonina, serina, arginina, asparagina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. coli; el grupo D incluye metionina, alanina, valina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y el grupo E incluye serina, metionina, valina, cisteina, treonina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli. De manera similar, los polipéptidos de la invención incluyen también un polipéptido que comprende al menos 20 aminoácidos contiguos de las SEQ ID NO: 36-63 y/o 86 y dos o más sustituciones de aminoácido como se indicó anteriormente en los grupos A-E. Una secuencia de aminoácidos que
comprende una variación conservadora de cualquiera de los polipéptidos anteriores también se encuentra incluida como un polipéptido de la invención. En una modalidad, una composición incluye un polipéptido de la invención y un excipiente (e.g., amortiguador, agua, excipiente farmacéuticamente aceptable, etc.) . La invención proporciona también un anticuerpo o antisuero específicamente inmunorreact ivo con un polipéptido de la invención. También se proporcionan pol inucleótidos en la invención. Los polinucleótidos de la invención incluyen aquellos que codifican para las proteínas o polipéptidos de interés de la invención o que incluyen uno o más codones selectores o ambos. Por ejemplo, los polinucleótidos de la invención incluyen, e.g., un pol inucleótido que comprende una secuencia de nucleótidos como se describe en cualquiera de las SEQ ID NO: 3-35, 64-85; un polinucleótido que es complementario a o que codifica para una secuencia de polinucleótidos del mismo; y/o un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácidos como se describe en cualquiera de las SEQ ID NO: 36-63 y/o 86, o una variación conservadora de los mismos. Un polinucleótido de la invención incluye también un polinucleótido que codifica para un polipéptido de la invención. De manera similar, un ácido nucleico que se
híbrida a un polinucleótido indicado anteriormente, bajo condiciones altamente rigurosas sustancialmente sobre la longitud total del ácido nucleico, es un polinucleótido de la invención . Un polinucleótido de la invención incluye también un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa de origen natural (TyrRS) (e.g., SEQ ID NO: 2) y que comprende dos o más mutaciones como se indicó anteriormente en los grupos A-E en el párrafo 11. Un polinucleótido que es al menos 70% (o al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98% o al menos 99% o más) idéntico a un polinucleótido indicado anteriormente y/o a un polinucleótido que comprende una variación conservadora de cualquiera de los polinucleótidos indicados anteriormente, también se incluye entre los polinucleótidos de la invención. En ciertas modalidades, un vector (e.g., un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una modalidad, el vector es un vector de expresión. En otra modalidad, el vector de expresión incluye un promotor operablemente enlazado a uno o más de los polinucleótidos de la invención. En otra modalidad, una célula comprende un vector que incluye un polinucleótido de la invención.
El experto apreciará también que se incluyen en la invención muchas variantes de las secuencias descritas. Por ejemplo, se incluyen en la invención las variaciones conservadoras de las secuencias descritas que producen una secuencia funcionalmente idéntica. Las variantes de las secuencias de pol inucleót idos de ácido nucleico, en donde las variantes se hibridan a al menos una secuencia descrita, se consideran incluidas en la invención. Las subsecuencias únicas de las secuencias descritas en la presente, determinadas, e.g., por técnicas estándar de comparación de secuencia, también se incluyen en la invención. Variaciones Conservadoras Debido a la degeneración del código genético, las "sustituciones silenciosas" (i.e., sustituciones en una secuencia de ácido nucleico que no dan como resultado una alteración en un polipéptido codificado) , son una característica implícita de toda secuencia de ácido nucleico que codifica para un aminoácido. De manera similar, las "sustituciones de aminoácido conservadoras", en uno o pocos aminoácidos en una secuencia de aminoácidos, se sustituyen con diferentes aminoácidos con propiedades altamente similares, también se identifican fácilmente como altamente similares a una construcción descrita. Tales variaciones conservadoras de cada secuencia descrita son una característica de la presente invención.
Las "variaciones conservadoras" de una secuencia de ácido nucleico particular, se refieren a aquellos ácidos nucleicos que codifican para secuencias de aminoácidos idénticas o esencialmente idénticas o, en donde el ácido nucleico no codifica para una secuencia de aminoácidos, a secuencias esencialmente idénticas. El experto reconocerá que las sustituciones, supresiones o adiciones individuales que alteram agregan o suprimen un solo aminoácido o un pequeño porcentaje de aminoácidos (típicamente menor que 5%, más típicamente menor que 4¾, 2 -A o 1%) en una secuencia codificada, son "variaciones conservativamente modificadas" en donde las alteraciones dan como resultado la supresión de un aminoácido, la adición de un aminoácido o la sustitución de un aminoácido con un aminoácido químicamente similar. Por tanto, las "variaciones conservadoras" de una secuencia de polipéptidos listada de la presente invención, incluyen sustituciones de un pequeño porcentaje, típicamente menor que 5%, más típicamente menor que 2% o 1%, de los aminoácidos de la secuencia de polipéptidos, con un aminoácido conservativamente seleccionado del mismo grupo de sustitución conservativa. Finalmente, la adición de secuencias que no alteran la actividad codificada de una molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservadora del ácido nucleico básico. Las tablas de sustitución conservativa que
proporcionan aminoácidos f uncionalmente similares son muy conocidas en la técnica. Lo siguiente establece grupos ejemplares que contienen aminoácidos naturales que incluyen "sustituciones conservadoras" uno para el otro. Grupos de Sustitución Conservadores
1 Alanina (A) Scrina (S) Treonina (T) 2 Acido Aspártico (D) Acido Glutámico 3 Asparagina (N) Glutamina (Q) 4 Aiginina ® Lisina ( ) 5 Isoleucina (I) Lcucina (L) etionina (M) Valina (V)
6 Fenilalanina (F) Tirosina (Y) Triptofano (W)
Hibridación del Ácido Nucleico La hibridación comparativa puede utilizarse para identificar los ácidos nucleicos de la invención, incluyendo variaciones conservadoras de los ácidos nucleicos de la invención y este método de hibridación comparativa es un método preferido para distinguir los ácidos nucleicos de la invención. Además, los ácidos nucleicos objetivo que se hibridan a los ácidos nucleicos representados por la SEQ ID NO: 3-35, 64-85 bajo condiciones de rigurosidad altas, ultra altas y ultra-ultra altas, son una característica de la invención. Ejemplos de tales ácidos nucleicos incluyen aquellos con una o pocas sustituciones de ácido nucleico silenciosas o conservadoras en comparación con una secuencia
de ácido nucleico dada. Se dice que un ácido nucleico de prueba se híbrida específicamente a una sonda de ácido nucleico, cuando este se híbrida al menos ½ tan bien a la sonda, como al objetivo complementario perfectamente igualado, i.e., con una proporción de señal a ruido al menos ½ tan alta como la hibridación de la sonda al objetivo bajo condiciones en las cuales la sonda perfectamente igualada se enlaza al objetivo complementario pe fectamente igualado con una proporción de señal a ruido que es al menos aproximadamente 5 x - 10 x tan alta como la observada para la hibridación a cualquiera de los ácidos nucleicos objetivo no igualados. Los ácidos nucleicos se "hibridan" cuando se asocian típicamente en solución. Los ácidos nucleicos se hibridan debido a una variedad de fuerzas psico-químicas bien caracterizadas, tales como el enlace a hidrógeno, la exclusión de solvente, el apuntalamiento de base y lo similar. Una extensa guía para la hibridación de ácidos nucleicos se encuentra en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes (Técnicas de laboratorio en hibridación bioquímica y de biología molecular con sondas de ácido nucleico) parte 1, capítulo 2, "Overview of principies of hybridi zation and the strategy of nucleic acid probé assays" (Revisión de los principios de hibridación
y la estrategia de análisis de sondas de ácido nucleico) (Elsevier, New York), asi como en Ausubel, supra. Hames y Higgins (1995) Gene Probes 1 (Sondas de gen 1) IRL Press en Oxford University Press, Oxford, Inglaterra (Hames y Higgins 1 ) y Hames y Higgins (1995) Gene Probes 2 (Sondas de gen 2) IRL Press en Oxford University Press, Oxford, Inglaterra (Hames y Higgins 2) proporcionan detalles acerca de la síntesis, marcación, detección y cuant i f icación de ADN y ARN, incluyendo oligonucleótidos . Un ejemplo de condiciones rigurosas de hibridación para la hibridación de ácidos nucleicos complementarios que tienen más de 100 residuos complementarios en un filtro en un manchado Southern o northern, es 5 C formalina con 1 mg de heparina a 42°C, siendo efectuada la hibridación durante la noche. Un ejemplo de condiciones rigurosas de lavado es un lavado de 0.2 x SSC a 65°C durante 15 minutos (ver Sambrook, supra, para una descripción del amortiguador SSC). Frecuentemente el lavado de alta rigurosidad se precede por un lavado de baja rigurosidad para retirar la señal de sonda de fondo. Un ejemplo de lavado de baja rigurosidad es 2 x SSC a 40°C durante 15 minutos. En general, una proporción de señal a ruido de 5 x (o mayor) que la observada para una sonda no relacionada en el análisis de hibridación particular, indica la detección de una hibridación específica.
Las "condiciones rigurosas de hibridación y lavado", en el contexto de experimentos de hibridación de ácido nucleico tales como hibridaciones Southern y northern, dependen de la secuencia y son diferentes bajo diferentes parámetros ambientales. Una extensa guia para la hibridación de ácidos nucleicos se encuentra en Tijssen (1993), supra, y en Hames y Higgins 1 y 2. Las condiciones rigurosas de hibridación y lavado puede determinarse fácilmente de manera empírica para cualquier ácido nucleico de prueba. Por ejemplo, para determinar condiciones altamente rigurosas de hibridación y lavado, las condiciones de hibridación y lavado se aumentan gradualmente (e.g., incrementando la temperatura, disminuyendo la concentración de sal, incrementando la concentración de detergente y/o incrementando la concentración de los solventes orgánicos tales como formalina en la hibridación o lavado) , hasta cumplir un grupo de criterios seleccionados. Por ejemplo las condiciones de hibridación y lavado se incrementan gradualmente hasta que la sonda se enlaza a un objetivo complementario perfectamente igualado con una proporción de señal a ruido que es al menos 5 veces tan alta como la observada para la hibridación de la sonda a un objetivo no igualado. Las condiciones "muy rigurosas" se seleccionan para ser iguales al punto de fusión térmica (Tm) para una sonda en particular. La Tra es la temperatura (bajo fuerza iónica y pH
definidos) a la cual el 50- de la secuencia de prueba se híbrida a una sonda perfectamente igualada. Para los propósitos de la presente invención, generalmente, las condiciones "altamente rigurosas" de hibridación y lavado se seleccionan para ser aproximadamente 5o menores que la Tm para la secuencia específica en una fuerza iónica y pH definidos . Las condiciones de hibridación y lavado de "ultra alta rigurosidad" son aquellas en las cuales la rigurosidad de las condiciones de hibridación y lavado se incrementan hasta que la proporción de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente igualado, es al menos 10 veces tan alta como la observada para la hibridación a cualquiera de los ácidos nucleicos objetivo no igualados. Un ácido nucleico objetivo que se híbrida a una sonda bajo tales condiciones, con una proporción de señal a ruido de al menos ½ de la del ácido nucleico objetivo complementario perfectamente igualado, se dice enlazado a la sonda bajo condiciones de ultra alta rigurosidad. De manera similar, pueden determinarse niveles incluso más altos de rigurosidad incrementando las condiciones de hibridación y/o lavado del análisis de hibridación relevante. Por ejemplo, aquellos en los cuales se incrementan las condiciones de rigurosidad de hibridación
y lavado hasta que la proporción de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente igualado es al menos 10 veces, 20 veces, 50 veces, 100 veces o 500 veces o más, tal alta como la observada para la hibridación a cualquiera de los ácidos nucleicos objetivo no igualados. Un ácido nucleico objetivo que se híbrida a una sonda bajo tales condiciones, con una proporción de señal a ruido de al menos ½ la del ácido nucleico objetivo complementario perfectamente igualado, se dice enlazado a la sonda bajo condiciones de ultra-ultra alta rigurosidad . Los ácidos nucleicos que no se hibridan entre sí bajo condiciones rigurosas son aún sustancialmente idénticos, si los polipéptidos que codifican son sustancialmente idénticos. Esto sucede, e.g., cuando se crea una copia de un ácido nucleico utilizando la máxima degeneración de codón permitida por el código genético. Subsecuencias únicas En un aspecto, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de las secuencias de los O-ARNts y 0-RSs descritos en la presente. La subsecuencia única es única en comparación con un ácido nucleico correspondiente a cualquier secuencia conocida de ácido nucleico de O-ARNt o de O-RS. La alineación puede efectuarse utilizando, e.g., un
conjunto BLAST para parámetros de falla. Cualquier subsecuencia única es útil, e.g., como una sonda para identificar los ácidos nucleicos de la invención. De manera similar, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RSs descritas en la presente. Aquí, la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquier secuencia conocida de pol ipépt idos . La invención proporciona también ácidos nucleicos objetivo que se hibridan bajo condiciones rigurosas a un oligonucleótido de codificación único que codifica para una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RSs, en donde la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera de los polipéptidos de control (e.g., secuencias de origen a partir de las cuales se derivaron las sintetasas de la invención, e.g., mediante mutación). Las secuencias únicas se determinan como se anotó anteriormente. Comparación, identidad y homología de secuencia Los términos "idéntica" o "identidad" porcentual, en el contexto de dos o más secuencias de ácido nucleico o polipéptidos, se refieren a dos o más secuencias o subsecuencias que son la misma o que tienen un porcentaje de residuos de aminoácido o nucleótidos que es el mismo, cuando
se comparan y se alinean para la máxima correspondencia, medida utilizando uno de los algoritmos de comparación de secuencia descritos abajo (u otros algoritmos disponibles para los expertos) o mediante inspección visual. La frase "sustancialmente idénticos", en el contexto de dos ácidos nucleicos o polipéptidos (e.g., ADNs que codifican para un O-ARNt u O-RS, o para la secuencia de aminoácido de un O-RS), se refiere a dos o más secuencias o subsecuencias que tienen al menos aproximadamente 605, preferentemente 80%, más preferentemente 90-95% de identidad del nucleótido o residuo de aminoácido, cuando se comparan o se alinean para la máxima correspondencia, medida utilizando un algoritmo de comparación de secuencia descritos abajo o mediante inspección visual. Tales secuencias "sustancialmente idénticas" se consideran típicamente "homologas" sin referirse a los ancestros reales. Preferentemente, la "identidad sustancial" existe sobre una región de las secuencias que es de al menos 50 residuos de longitud, más preferentemente sobre una región de al menos aproximadamente 100 residuos y más preferentemente, las secuencias son sustancialmente idénticas sobre al menos aproximadamente 150 residuos o sobre la longitud total de las dos secuencias que se comparan. Para la comparación de secuencia y la determinación de homología, típicamente una secuencia actúa como secuencia
de referencia con la cual se comparan las secuencias de prueba. Cuando se utiliza un algoritmo de comparación de secuencia, las secuencias de prueba y de referencia se introducen a una computadora, se diseñan coordenadas de subsecuencia , si es necesario, y se designan los parámetros de programa del algoritmo de secuencia. El algoritmo de comparación de secuencia calcula entonces el porcentaje de identidad de secuencia para la(s) secuencia (s) de prueba en relación con la secuencia de referencia, en base a los parámetros de programa designados. La alineación óptima de secuencias para comparación puede conducirse, e.g., mediante el algoritmo de homología local de Smith & Waterman, Adv. Appl . Math., 2:482 (1981), mediante el algoritmo de alineación de homología de Needleman & Wunsch J. Mol. Biol., 48:443 (1970), mediante el método de búsqueda de similitud de Pearson & Lipman, Proc. Nati. Acad. Sci. E.U.A., 85:2444 (1988), mediante las implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) o mediante inspección visual (ver en general, Ausubel et al., infra). Un ejemplo de un algoritmo adecuado para determinar la identidad de secuencia porcentual y la similitud de secuencia es el algoritmo BLAST, que se describe en Altschul et al., J. Mol. Biol., 215:403-410 (1990). El software para
llevar a cabo análisis BLAST se encuentra públicamente disponible a través del National Center for Biotechnology Information (www.ncbi-nlm.nih.gov/) . Este algoritmo implica primero la identificación de pares de secuencia de alta marcación (HSPs) identificando palabras de longitud corta W en la secuencia de búsqueda, que ya sea se igualan o satisfacen alguna marca de umbral T de valor positivo al alinearse con una palabra de la misma longitud en una secuencia de la base de datos. T se refiere como el umbral de marca de palabra vecino (Altschul et al., supra) . Estos golpes iniciales de palabra vecina actúan como semillas para iniciar las búsquedas para encontrar HSPs más largos que las contengan. Los golpes de palabra se extienden entonces en ambas direcciones a lo largo de cada secuencia durante tanto como pueda incrementarse la marca de alineación acumulativa. Las marcaciones acumulativas se calculan utilizando, para secuencias de nucleótidos, los parámetros M (marca de recompensa para un par de residuos iguales; siempre > 0) y N (marca de penalización para residuos no iguales; siempre < 0). Para secuencias de aminoácidos, la matriz de marcación se utiliza para calcular la marca acumulativa. La extensión de los golpes de palabra en cada dirección se detiene cuando: la marca de alineación acumulativa cae por la cantidad X desde su máximo valor logrado; la marca acumulativa cae a cero o menos, debido a la acumulación de una o más
alineaciones del residuo de marcación negativa; o se alcanza el final de cualquier secuencia. Los parámetros del algoritmo BLAST, W, T y X determinan la sensibilidad y la velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) utiliza como fallas una longitud de palabra (W) de 11, una expectativa (E) de 10, un corte de 100, M = 5, N = 4, y una comparación de ambas cadenas. Para secuencias de aminoácidos, el programa BLASTP utiliza como fallas una longitud de palabra (W) de 3, una expectativa (E) de 10, y la matriz de marcación BLOSUM62 (ver Heinkoff & Heinkoff (1989) Proc. Nati. Acad . Sci . , E.U.A., 89:10915). Además de calcular la identidad de secuencia porcentual, el algoritmo BLAST también lleva a cabo un análisis estadístico de la similitud entre dos secuencias (ver e.g., Karlin & Altschul, Proc. Nati. Acad. Sci . E.U.A., 90:5873-5787 (1993)). Una medición de similitud proporcionada por el algoritmo BLAST es la probabilidad de suma menor (P(N)), que proporciona una indicación de la probabilidad mediante la cual posiblemente se presentaría una igualación entre dos secuencias de nucleótidos o aminoácidos. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de la suma menor, comparando el ácido nucleico de prueba con el ácido nucleico de referencia, es menor que aproximadamente 0.1, más preferentemente menor que aproximadamente 0.01 y más
preferentemente menor que aproximadamente 0.001. Mutagénes is y otras Técnicas de Biología Molecular Los textos generales que describen técnicas de biología molecular incluyen Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology (Guía para técnicas de clonación molecular, métodos en enzimología) volumen 152, Academic Press Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (Clonación molecular - un manual de laboratorio) (2a ed.), Volumen 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook"" y Current Protocols in Molecular Biology (Protocolos actuales en biología molecular), F.M., Ausubel et al., Eds . , Current protocols, una fusión entre Greene Publishing Associates Inc., y John Wiley & Sons, Inc., ( suplementado a través de 1999) ("Ausubel")). Estos textos describen la mutagénesis, el uso de vectores, promotores y muchos otros tópicos relevantes e.g., para la generación de genes que incluyen codones selectores para la producción de proteínas que incluyen aminoácidos no naturales, ARNts ortogonales, sintetasas ortogonales y pares de los mismos. Se utilizan en la invención varios tipos de mutagénesis, e.g., para producir bibliotecas de ARNts, para producir bibliotecas de sintetasas, para insertar codones selectores que codifican para aminoácidos no naturales en una
proteina o polipéptido de interés. Estos incluyen, pero no se limitan a, mutagénesis de punto aleatorio dirigida al sitio, recombinación homologa, arrastre de ADN u otros métodos de mutagénesis repetidos, construcción quimérica, mutagénesis utilizando plantillas que contienen uracilo, mutagénesis dirigida al oligonucleótido, mutagénesis de ADN modificado con fosforotioato, mutagénesis utilizando ADN doble ranurado o lo similar o cualquier combinación de los mismos. Los métodos adicionales adecuados apuntan a la mutagénesis de reparación de desigualdad utilizando especies huésped deficientes en reparación, restricción-selección y restricción purificación, mutagénesis por supresión, mutagénesis mediante síntesis total del gen, reparación de fractura bicatenaria y lo similar. La mutagénesis, e.g., que involucra construcciones quiméricas, también se incluye en la presente invención. En una modalidad, la mutagénesis puede guiarse por la información conocida de la molécula de origen natural o de la molécula de origen natural alterada o mutada, e.g., la secuencia, las comparaciones de secuencia, las propiedades físicas, la estructura cristalina o lo similar. Los textos y ejemplos anteriores encontrados en la presente, describen estos procedimientos. Se encuentra información adicional en las siguientes publicaciones y referencias citadas en: Ling et al., Approaches to DNA mutagénesis: an overview (Procedimientos para mutagénesis de
ADN: una revisión) Anal. Biochem., 254 (2 ): 157-178 (1997); Dale et al., Oligonucleotide-directed random mutagenesis using the phosphorot ioate method, (Mutagénesis aleatoria dirigida a ol igonucleótidos utilizando el método de fosforotioato) Methods Mol. Biol . 57:369-374 (1996); Smith, In vitro mutagenesis (Mutagénesis in vitro) Ann. Rev . Genet . , 19:423-462 (1985); Botstein & Shortle, Strategies and applications of in vitro mutagenesis (Estrategias y aplicaciones de mutagénesis in vitro), Science 229:1193-1201 (1985); Cárter, Site-directed mutagenesis (Mutagénesis dirigida al sitio), Biochem. J. 237:1-7 (1986); Kunkel, The efficiency of oligonucleotide-directed mutagenesis (La eficiencia de la mutagénesis dirigida al oligonucleótido) en Nucleic Acids & Molecular Biology (Eckstein F. y Lilley, D.M.J. eds. , Sprmger Verlag, Berlín)) (1987); Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection (Rápida y eficiente mutagénesis especifica del sitio sin selección fenotípica) Proc. Nati. Acad. Sci . , E.U.A. 82:488-492 (1985); ); Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection (Rápida y eficiente mutagénesis específica del sitio sin selección fenotípica) Methods in enzymol. 154, 367-382 (1987); Bass et al., Mutant Trp repressors with new DNA-binding specificities (Represores de Trp mutante con nuevas especificidades de enlace a ADN), Science 242:240-245 (1988);
Methods in Enzymol., 100:468-500 (1983); Methods in Enzymol., 154:329-350 (1987); Zoller & Smith, Oligonucleotide-directed mutagenesis using 13-derived vectors : an efficient and general procedure for the production of point mutations in any DNA fragment (Mutagénesis dirigida al oligonucleótido utilizando vectores derivados de MI 3: un procedimiento eficiente y general para la producción de mutaciones de punto en cualquier fragmento de ADN), Nucleic Acids Res., 10:6487-6500 (1982); Zoller & Smith, Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors, (Mutagénesis dirigida al oligonucleótido de fragmentos de ADN clonados en vectores M13), Methods in Enzymol., 100:468-500 (1983); Zoller & Smith, Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA témplate (Mutagénesis dirigida al oligonucleótido: un método simple utilizando dos iniciadores de oligonucleótido y una plantilla de ADN monocatenario) , Methods in Enzymol., 154:329-350 (1987); Taylor et al., The use of phosphorothioate-modi fied DNA in restriction enzyme reactions to prepare nicked DNA, (El uso de ADN modificado con fosforotioato en reacciones de enzimas de restricción para preparar ADN cortado), Nucí. Acids Res., 13:8749-8764 (1985); Taylor et al., The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA (La rápida generación de
mutaciones dirigidas al oligonucleótido a alta frecuencia utilizando ADN modificado con fos forot ioato ) , Nucí. Acids Res., 13:8765-8787 (1985); Nakamaye & Eckstem, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to ol igonucleotide-directed mutagenesis (Inhibición del desdoblamiento de la endonucleasa Nci I de restricción mediante grupos fosforotioato y su aplicación a la mutagénesis dirigida al oligonucleótido), Nucí Acids Res., 14:9679-9698 (1986); Sayers et al., Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis (Exonucleasas Y-T en mutagénesis dirigida a oligonucleótido a base de fosforotioato) Nucí. Acids Res., 16:791-802 (1988); Sayers et al., Strand specific cleavage of phosphorothioate-containing DNA by a reaction with restriction endonucleases in the presence of ethidium bromide (Desdoblamiento especifico de cadena de ADN que contiene fosforotioato mediante una reacción con endonucleasas de restricción en presencia de bromuro de etidio) , (1988) Nucí. Acids Res., 16:803-814; Kramer et al., The gapped dúplex DNA approach to oligonucleot ide-directed mutation construction (El procedimiento de ADN doble ranurado para la construcción de la mutación dirigida al oligonucleótido), Nucí Acids Res., 12:9441-9456 (1984); Kramer & Fritz, Oligonucleotide-directed construction of mutations via gapped dúplex DNA (Construcción dirigida al
ol igonucleót ido de mutaciones mediante ADN doble ranurado) , Methods in Enzymol., 154:350-367 (1987); Kramer et al., Improved enzymatic in vitro reactions in the gapped dúplex DNA approach to oligonucleotide-directed construction of mutations, (Reacciones enzimáticas in -vitro mejoradas en el procedimiento de ADN doble ranurado para la construcción dirigida al oligonucleótido de mutaciones), Nucí. Acids Res., 16:7207 (1988); Fritz et al., Oligonucleotide-directed construction of mutations: a gapped dúplex DNA procedure without enzymatic reactions in vitro (Construcción dirigida al oligonucleótido de mutaciones: un procedimiento de ADN doble ranurado sin reacciones enzimáticas in vitro), Nucí. Acids Res., 16:6987-6999 (1988); Kramer et al., Point Mismatch Repair (Reparación de desigualdad de punto), Cell 38:879-887 (1984); Cárter et al., Improved oligonucleotide site-directed mutagenesis using MI 3 vectors, (Mutagénesis mejorada dirigida al sitio utilizando vectores M13), Nucí. Acids Res., 13:4431-4443 (1985); Cárter, Improved oligonucleotide site-directed mutagenesis using M13 vectors, (Mutagénesis mejorada dirigida al sitio utilizando vectores M13), Methods in Enzymol., 154:382-403 (1987); Eghtedarzadeh & Heinkoff, Use of oligonucleotides to genérate large deletions, (El uso de oligonucleótidos para generar grandes supresiones), Nucí. Acids Res., 14:5155 (1986); Wells et al., Importance of hydrogen-bond formation in stabilizing the
transition state of subtilisin (Importancia de la formación de enlaces de hidrógeno en la estabilización del estado de transición de subt i 1 isina ) , Phil. Trans. R. Soc, Lond . , A 317:415-423 (1986); Nambiar et al., Total synthesis and cloning of a gene coding for the ribonuclease S protein, (Síntesis total y clonación de un gen que codifica para la proteína S ribonucleasa ) , Science 223:1299-1301 (1984); Sakamar y Khorana, Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleot ide-binding protein (transducin) (Síntesis total y expresión de un gen para la subunidad alfa de la proteína de enlace a nucleótido del segmento exterior de guanina de línea bovina) (transducina) , Nucí. Acids Res., 14:6361-6372 (1988); Wells et al., Cassette mutagenesis: an efficient method for generation of múltiple mutations at defined sites (Mutagénesis de cásete: un método eficiente para la generación de múltiples mutaciones en sitios definidos), Gene 34:315-323 (1985); Grundstróm et al., Oligonucleotide-directed mutagenesis by microscale ^shot gun' gene synthesis (Mutagénesis dirigida al oligonucleótido mediante síntesis de gen 'shot gun' en microescala ) , Nucí Acids Res., 13:3305-3316 (1985); Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis (Reparación de fractura bicatenaria dirigida al oligonucleótido en plásmidos de Escherichia coli:
un método para la mutagénesis específica del sitio), Proc. Nati. Acad. Sci . , E.U.A., 83:7177-7181 (1986); Arnold, Protein engineering for unusual environments (Ingeniería de proteínas para ambientes no comunes), Current Opinión in Biotechnology, 4:450-455 (1993); Sieber et al., Nature Biotechnology, 19:456-460 (2001), W.P.C. Stemmer, Nature 370, 389-91 (1994); y I.A. Lorimer, I. Pastan, Nucleic Acids Res., 23, 3067-8 (1995) . Detalles adicionales acerca de muchos de los métodos anteriores pueden encontrarse en Methods in Enzymology, Volumen 154, que también describe controles útiles para problemas de disparo de problemas con varios métodos de mutagénesis. La invención se refiere también a células y organismos huésped vertebrados para la incorporación in vivo de un aminoácido no natural mediante pares de ARNt/RS ortogonal. Las células huésped se fabrican genéticamente (e.g., se transforman, transducen o transfectan) con los polinucleótidos de la invención o construcciones que incluyen un polinucleótido de la invención, e.g., un vector de la invención, que puede ser, por ejemplo, un vector de clonación o un vector de expresión. El vector puede encontrarse, por ejemplo, en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado. Los vectores se introducen en las células y/o microorganismos mediante métodos estándar incluyendo electroporacion (Frora et
al., Proc. Nati. Acad. Sci. E.U.A. 82;5824 (1985), infección por vectores virales, penetración balística a alta velocidad mediante pequeñas partículas con el ácido nucleico, ya sea dentro de la matriz de pequeños gránulos o partículas o sobre la superficie (Klewin et al., Nature, 70.73 (1987)) . Las células huésped fabricadas pueden cultivarse en medio nutriente convencional modificado según sea apropiado para tales actividades como, por ejemplo, etapas de selección, promotores de activación o transformadores de selección. Estas células pueden cultivarse opcionalmente en organismos transgénicos . Otras referencias útiles, e.g., para aislamiento y cultivo de células (e.g., para el aislamiento subsecuente del ácido nucleico) incluyen, Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, (Cultivo de células animales, un manual de técnicas básicas) tercera edición, Wiley-Liss, New York, y las referencias citadas en la misma; Payne et al., (1992) Plant Cell and Tissue Culture in Liquid Systems (Cultivo de células de plantas y tejidos en sistemas líquidos) John Wiley & Sons, Inc., New York, . Y . ; Gamborg y Phillips (eds.) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, (Cultivo de células de plantas, tejidos y órganos; Métodos Fundamentales), Sp inger-Verlag (Berlín Heidelberg New York) y Atlas y Parks (eds.) The Handbook of Microbiological Media (El manual de medios
microbiológicos ) (1993) CRC Press, Boca Ratón, FL . La invención se refiere también a lineas de células de vertebrados con la capacidad de incorporar un aminoácido o aminoácidos no naturales mediante pares de ARNt/RS ortogonales. Estas lineas celulares pueden establecerse utilizando técnicas de cultivo celular conocidas en la técnica en células huésped que se han transformado, transducido o transfectado con los polinucleótidos de la invención o construcciones que incluyen un polinucleótido de la invención. Los métodos para introducir ácidos nucleicos exógenos en células huésped son muy conocidas en la técnica y variarán con la célula huésped utilizada. Las técnicas incluyen, pero no se limitan a, transfección mediada por dextrano, precipitación de fosfato de calcio, tratamiento de cloruro de calcio, transfección mediada por polibreno, fusión de protoplasto, electroporación, infección viral o de fago, encapsulación de el (los) polinucleótido ( s ) en liposomas y microinyección directa. Las células pueden transformarse o transíectarse de manera que permitan la incorporación ya sea transitoria o estable de AD . Para la producción a largo plazo de alto rendimiento de proteínas recombinantes , se prefiere la expresión estable. Por ejemplo, pueden fabricarse líneas celulares que expresan establemente la molécula de anticuerpo. Más que utilizar los vectores de expresión que
contienen orígenes de replicación virales, las células huésped pueden transformarse con ADN controlado mediante elementos de control de expresión apropiados, (e.g., promotores, mejoradores, secuencias, terminadores de transcripción, sitios de poliadenilación, etc.) y un marcador seleccionable . Después de la introducción del ADN externo, las células fabricadas pueden dejarse crecer durante 1-2 días en un medio enriquecido y después se cambian a un medio selectivo. El marcador seleccionable en el plásmido recombinante confiere resistencia a la selección y permite a las células integrar de manera estable el plásmido en sus cromosomas y crecer para formar focos que a su vez pueden clonarse y expandirse en las líneas celulares. Este método puede utilizarse ventajosamente para fabricar líneas celulares que expresan la molécula de anticuerpo. Tales líneas celulares fabricadas pueden ser particularmente útiles en la selección y evaluación de compuestos que interactúan directa o indirectamente con la molécula de anticuerpo. Alternativamente, otras técnicas, tales como algunas técnicas de transfección de vector viral-mediadas , muy conocidas por los técnicos, pueden permitir la transfección transitoria de las células. Se encuentran disponibles varios métodos muy conocidos para introducir ácidos nucleicos objetivo en células, cualquiera de los cuales puede utilizarse en la
invención. Estos incluyen: fusión de las células recipientes con protoplastos bacterianos que contienen el ADN, electroporación , bombardeo de proyectiles (para una expresión más estable), e infección con vectores virales (que pueden utilizarse para transfección estable o transitoria y que también se tratan adicionalmente, a continuación), etc. Pueden utilizarse células bacterianas para amplificar el número de plásmidos que contienen construcciones de ADN de la invención. Las bacterias se cultivan a fase log y los plásmidos, dentro de las bacterias, pueden aislarse mediante una variedad de métodos conocidos en la técnica (ver, por ejemplo Sambrook) . Además, se encuentra comercialmente disponible una plétora de equipos para la purificación de plásmidos a partir de bacterias (ver, e.g., EasyPrep™, FlexiPrep™, ambos de Pharmacia Biotech; StrataClean™, de Stratagene; y QIAprep™ de Quiagen) . Los plásmidos aislados y purificados se manipulan entonces adicionalmente para producir otros plásmidos, utilizados para transfectar células o incorporados en vectores relacionados para infectar organismos. Los vectores típicos contienen terminadores de transcripción y de traducción, secuencias de iniciación de transcripción y de traducción, y promotores útiles para la regulación de la expresión del ácido nucleico objetivo particular. Los vectores comprenden opcionalmente casetes de expresión genéricos que contienen al menos una secuencia
terminador independiente, secuencias que permiten la replicación del cásete en eucariotos o procariotos, o ambos, (e.g., vectores de lanzadera) y marcadores de selección para sistemas tanto procarióticos como vertebrados. Los vectores son adecuados para la replicación y la integración en procariotos, eucariotos o preferentemente en ambos. Ver Giliman & Smith, Gene 8:81 (1979); Roberts et al., Nature 328:731 (1987); Schneider B., et al., Protein Expr. Purif., 6435:10 (1995); Ausubel, Sambrook, Berger (todos supra). Un catálogo de bacterias y bacteriófagos útil para clonación se proporciona, e.g., por la ATCC, e.g., The ATCC Catalogue of Bacteria and Bacteriophage (El catálogo ATCC de bacterias y bacteriófagos) (1992) Gherna et al., (eds) publicado por la ATCC. Los procedimientos básicos adicionales para secuenciado, clonación y otros aspectos de la biología molecular y que subrayan las consideraciones teóricas, se encuentran también en Watson et al., (1992) Recombinant DNA Second Edition (ADN recombinante segunda edición) , Scientific American Books, N.Y. Además, esencialmente cualquier ácido nucleico (y virtualmente cualquier ácido nucleico marcado, ya sea estándar o no estándar) puede diseñarse u ordenarse estándar a partir de una variedad de fuentes comerciales, tales como la Midland Certified Reagent Company (Midland, TX mcrc-com) , The Great American Gene Company (Ramona CA, disponible en la red mundial en genco.com), ExpressGen Inc.,
(Chicago, IL, disponible en la red mundial en expressgen.com), Operon Technologies Inc., (Alameda CA) y muchos otros. Equipos Los equipos también son una característica de la invención. Por ejemplo, se proporciona un equipo para producir una proteína que comprende al menos un aminoácido no natural en una célula, en donde el equipo incluye un envase que contiene una secuencia de polinucleótido que codifica para un 0-ARNt y/o un 0-ARNt y/o una secuencia de polinucleótido que codifica para una 0-RS, y/o una 0-RS. En una modalidad, el equipo incluye además al menos un aminoácido no natural. En otra modalidad, el equipo comprende además materiales instructivos para producir la proteína. EJEMPLOS Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar, la invención reivindicada. El experto reconocerá una variedad de parámetros no críticos que pueden alterarse sin apartarse del alcance de la invención reivindicada . Ejemplo 1: Métodos de producción y composiciones de aminoacil-ARNt sintetasas que incorporan aminoácidos no naturales en células de vertebradoss La expansión del código genético de vertebrados
para incluir aminoácidos no naturales con nuevas propiedades físicas, químicas o biológicas, proporcionarían poderosas herramientas para analizar y controlar la función de la proteína en estas células. Hacia este objetivo, se describe un procedimiento general para el aislamiento de aminoacil-ARNt sintetasas que incorporan aminoácidos no naturales con alta fidelidad en proteínas en respuesta a un codón ámbar en Saccharomyces cerevisiae (S. cerevisiae) . El método se basa en la activación de los genes informantes responsable de GAL4, HIS3, URA3 o LacZ, mediante la supresión de los codones ámbar entre el dominio de enlace de ADN y el dominio de activación transcripcional de GAL4. Se describe la optimización de un informante de GAL4 para la selección positiva de variantes de tirosil-ARNt sintetasa de Escherichia coli activa (EcTyrRS) . Una selección negativa de variantes de EcTyrRS también se ha desarrollado con el informante URA3 mediante el uso de una molécula pequeña (ácido 5-fluoorótico (5-FOA) agregado al medio de crecimiento como un "alelo tóxico". Importantemente, las selecciones tanto positiva como negativa pueden llevarse a cabo en una sola célula y con un rango de rigurosidades. Esto puede facilitar el aislamiento de un rango de actividades de aminoacil-ARNt sintetasa (aaRS) a partir de grandes bibliotecas de sintetasas mutantes. La energía del método para aislar los fenotipos de aaRS deseados se demuestra
mediante selecciones modelo. Ejemplo 2 Construcción de ARNt híbrido de Tyr ARNt de E. coli y B. stearothermophilus Se sabe a partir del trabajo en Saccharomyces cerevisiae, que los pares de Tyr de E. coli de ARNt/RS son ortogonales a los pares endógenos de ARNt/RS y soportan la supresión del aminoácido no natural. Sin embargo, han sido un reto los esfuerzos por transcribir el Tyr de ARNt de E. coli funcional in vivo en células de mamífero. Debido a esto, se ha puesto interés en B. stearothermophilus como una fuente de secuencia de ARNt que puede soportar la supresión de aminoácidos no naturales en células de mamífero. Aunque el ARNt de B. stearothermophilus es un sustrato para Tyr ARNt sintetasa de E. coli, es necesaria una fabricación adicional del ARNt para mejorar la eficiencia de aminoacilación del ARNt. La cepa aceptor del ARNt es una determinante clave para el reconocimiento de ARNt sintetasa. En este ejemplo, se construyó un ARNt híbrido combinando diferentes componentes estructurales de Tyr ARNt de E. coli y B. stearothermophilus, este ARNt híbrido tiene la cepa aceptor de Tyr ARNt de E. coli, y el circuito variable de brazo D, brazo T C, y la cepa anticodón de Tyr ARNt de B. stearothermophilus. El nuevo ARNt híbrido que tiene una cepa aceptor que se deriva de E. coli, es un mejor sustrato para
Tyr ARNt sintetasa de E. coli. Se muestra en el experimento siguiente que se obtuvo una eficiencia de supresión ámbar mejorada cuando se utilizó el recién creado híbrido de ARNt supresor de ámbar. Para comparación, el ARNt híbrido se probó a lo largo del Tyr ARNt de B. stearothermophilus a partir del cual se derivó. Experimento : Construcción del plásmido que codifica para el ARNt híbrido : Inserto de expresión de ARNt supresor de ámbar híbrido de copia única que incluye sitios de restricción 5' (EcoR 1 y Bgl II), secuencia de flanco 5' de Tyr ARNt (GGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTTTCTGTG CTGAACCTCAGGGGACGCCGACACACGTACACGTC (SEQ ID NO: 89)), el mutante de supresión ámbar del ARNt híbrido que carece de 3'-CCA (La secuencia de nucleótidos del ARNt híbrido es como sigue : GGUGGGGUAGCGAAGUGGCUAAACGCGGCGGACUCUAAAUCCGCUCCCUUUGGGUUCGGCG GTUCGAAUCCGUCCCCCUCCACCA (SEQ ID NO: 87) y la secuencia de ADN que codifica para el ARNt es como sigue: GGTGGGGTAGCGAAGTGGCTAAACGCGGCGGACTCTAAATCCGCTCCCTTTGGGTTCGGCG GTTCGAATCCGTCCCCCA (SEQ ID NO: 88)), secuencia de flanco 3' de Tyr ARNt humano
(GACAAGTGCGGTTTTTTTCTCCAGCTCCCGATGACTTATGGC (SEQ ID NO: 90)) y sitios de restricción 3' (BamH I y Hind III), se construyó
mediante PCR de sobrepos ición utilizando iniciadores: FTam 73: iniciador de avance con sitio EcoR I y Bgl II GTACGAATTCCCGAGATCTGGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAG CGCTCCGGTTTTTCTGTGC (SEQ ID NO: 91) FTam 115: iniciador inverso: AGTCCGCCGCGTTTAGCCACTTCGCTACCCCACCGACGTGTACGTGTGTCGGCGTCCCCTG AGGTTCAGCACAGAAAAACCGGAGCGC (SEQ ID NO: 92) FTam 116: iniciador de avance para pieza 2: GTGGCTAAACGCGGCGGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCC CCCACCAGACAAGTG (SEQ ID NO: 93) FTam 117: iniciador inverso para pieza 2: GATGCAAGCTTGATGGATCCGCCCATAAGTCATCGGGAGCTGGAGAAAAAAACCGCACTTG TCTGGTGGGGGACGG (SEQ ID NO: 94) El inserto se ligó en pUC19 en los sitios EcoR I y Hind III. Experimento de supresión de ámbar con ARNt híbrido (Figura 1 ) : Los plásmidos gue codifican para el mutante de ámbar hGH E88, ARNt sintetasa de E. coli y ya sea el ARNt de B. stearothermophilus supresor de ámbar de copia única o el ARNt híbrido supresor de ámbar de copia única, se co-transfectaron en células CHO Kl . La expresión de hGH se analizó 42 horas después de la transfección . Cuando se utilizó el ARNt híbrido (hbl), la eficiencia de supresión de ámbar se incrementó aproximadamente en 30% en relación con la
obtenida cuando se utilizó el ARNt de supresión de ámbar de B. stearothermophi lus . Ejemplo 3 Adición de moléculas de proteínas con un aminoácido no natural . En un aspecto, la invención proporciona métodos y composiciones relacionadas de proteínas que comprenden aminoácidos no naturales acoplados a moléculas sustituyentes adicionales . Se entiende que los ejemplos y modalidades descritas en la presente son solamente para propósitos ilustrativos y que varias modificaciones o cambios a la luz de los mismos se suqerirán a las personas expertas en la técnica y deben incluirse dentro del espíritu y provisión de esta solicitud y del alcance de las reivindicaciones anexas. Aunque lo anterior se ha descrito en algún detalle para propósitos de claridad y comprensión, será claro para el experto en la técnica a partir de la lectura de esta descripción, que pueden realizarse varios cambios en forma y detalle sin apartarse del alcance real de la invención. Por ejemplo, todas las técnicas y aparatos descritos en la presente pueden utilizarse en varias combinaciones. Todas las publicaciones, patentes, solicitudes de patente y/o otros documentos citados en esta solicitud, se incorporan mediante la referencia en su totalidad para todo propósito en la misma
medida que si cada publicación, patente, solicitud de patente y/u otro documento individual se indicara individualmente incorporado mediante la referencia para todo propósito.
TABLA 5 SEQ I D Etiqueta SECUENC IA NO.: SEQ I D polinuclcótido /\'l"GG /\AGCAGTAAC-TTG/\TTA/\/\CAATTGC/\AGAGCGGGGGCTGGTA G( 'CCAG(¡TGACGGA(OAGGAAGC'GTTAGCAGAGCGACTGGCGCAAGG
NO. : 1 TyrRs tipo ( '('rGATGGCGCTCTATTGCGGC TCGATCCTACCGCTGACAGCTTGCAT si lvestre de H. TI'GGGGCATCT'rGTTC'CATrcrrTA'rGCCTGAAAC'GCTTCCAGCAGGCGG coli (sintetasa) GCCACAAGCCGGTTCJrGCTCiGTAGGCGGCGCGACGGGTCTGATTGGCG ACCCGAGCTTCA AAGCTGCCGAGCGTA AGCTGAACACXTGAA GAA ACTG 'rTCAGCJAGTCiGGTGCiACAAAATCCXrrAAGCAGGTrGCCCCGTTCCTCG AITTOGACTGTGGAGAAAACTCTGCTATCGCGGCGAACAACTATGACT ( ]TTCX;CCAATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACA C 'TTC'IXX XiTTAACCAGATGATCAAGAAAGAAGCGG'ITAAGCAGCGTCT CAACCGTGAAGATCAGGGGATT'IXXJTTCACTGAG TTTTCCTACAACCTG T'I'GCAGGGTTATGACTTCGCCTGTCTGAACAAACAGTACGGTGTGGTGC IX Í 'AAA'ITGG t'GGTTC GACX'AGTGGGGTAACATCACTTCTGGTATCGA CCTGACX'CGTCGTCTGCAIX'AGAATCAGGTGTTTGGCCTGACCGTTCCG ("I GATCACTAAAGCAGATGGCACX'AAATTTGGTAAAACTGAAGGCGGC GGAGTGTGGT'I'GGATCCGAAGAAAACCAGCCCGTACAAATTCTACCAG TTCTGGATCAACACTGCGGATGCX'GACGTTTACCGCTTCCTGAAGTTCT TCACX 1 1 rATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAAGATA AAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAG
GTGA TC'GTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGT ATTACCGAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAGCGG
ACTTCGAACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAA
AGGGCGCAGACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTT
CCCGTGGTCAGGCACGTAAAACTATCGCCTCCAATGCCATCACCATTAA
CGGTGAAAAACAGTCCGATCCTGAATACTTCTTTAAAGAAGAAGATCG
TCTGTTTGGTCGTTTTACCTTACTGCGTCGCGGTAAAAAGAATTACTGT
CTGATTTGCTGGAAATAA
SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEA LAERLAQGPIALYCGFDPTADSLH LGH LVPLLCLKRFQQAGH PVALVGGATGLIGDPSFKAAER LNTEETVQEWV
NO.: 2 (aa) TyrRs DKIRKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIG HFSVNQM tipo silvestre INKEAV QRLNREDQGISFTEFSYNLLQGYDFACLN QYGVVLQIGGSDQ de E. coli WGNiTSGIDLTRRLHQNQVFGLTVPLIT ADGT FG TEGGAVWLDPKKTS (sintetasa) PY FYQFWINTADADVYRFLKFFTFMSIEEINALEEED NSG APRAQYVL AEQVTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQLAQDGVP VE
TCCGTTAACCAGATCiATC'AACAAAGAAG GGTTAAGCAGCGTCTCAAC COTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGC AGGGT'I'ATAC'GTATGC'GTGTCTGAACAAACAGTACGGTGTGGTGCTGCA AA'ITGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGACCTG AGGCG TGGTC'TGCA TCACJAATGAGGTGTTTGGCCTGACCGTTCCGCTGA TCACTAAAGCAGATGGGACCAAATTTGGTAAAACTGAAGGCGGCGCAG TC GGTTGGATCCGAA AAAACCAGCCCGTACAAATTCTACCAGTTCTG
GATCAACAC GCGCJATGC GACGTTTACCGCTTCCTGAAGTTCTTCACC TTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAAGATAAAAAC AGC'GGTAAAGCACCGCXICGC'CCAGTATGTACTGGCGGAGCAGGTGACT CGTCTGGTTCACGGTGAAGA AGGTTTACAGGCGGCAAAACGTATTACC
GAATGCXTGTTCAGCGGTTC TTGAGTGCXJCTGAGTGAAGCGGACTTCG AACAGC GGCGCA(ÍGAC'GGCGTACX"GATGGTTGAGATGGAAAAGGGCG CAGACX'TGATGCACJGCAC GCJTCGATTC GAACTGCAACCTTCCCGTGG TCAGGCACGTAAAACTATCGCX CCAATGCCATCACCATTAACGGTGAA
AAACAG'["CC(JATCC"TGAATA 'TTCTTTAAAGAAGAAGATCGTCTGTTTG GTCXJTTTTACXTTACTGCXJTCXJCGGTAAAAAGAATTACTGTCTGATTTGC
TGGAAATAA
SEQ I D Polinuclcótido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCGGGGGCTGGTA sinlelasa GCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGC NO.: 5 CCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTT pOMe-3 GGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGC
CACAAGCCGGTTGC'GCTGGTAGGCGGCGCGACGGGTCTGATTGGCGAC CCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT
CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATT
TCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTT
CGGCAATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACAC1TC TCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAAC
CGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGC
AGGGTTATAGTATGGCCTGTTTGAACAAACAGTACGGTGTGGTGCTGCA
AATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGACCTG
ACCCGTCGTCTGCATCAGAATCAGGTGTTTGGCCTGACCGTTCCGCTGA
TCACTAAAGCAGATGGCACCAAATTTGGTAAAACTGAAGGCGGCGCAG
TCTGGTTGGATCCGAAGAAAACCAGCCCGTACAAATTCTACCAGTTCTG
GATCAACACTGCGGATGCCGACGTTTACCGCTTCCTGAAGTTCTTCACC
TTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAAGATAAAAAC
AGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAGGTGACT
CGTCTGGTTCACGGTGAAGA AGGTTTACAGGCGGCAAAACGTATTACC
GAATGCCTGTTCAGCXXjTIX TTGAGTGCGCTGAGTGAAGCGGACTTCG AACAGCTGCJC'GCAGCJACGGCGTACCGATGGTTGAGATGGAAAAGGGCG GAGACCTGATGCACiGCAGTGGTCGATTC GAACTGCAACCTGGCCCGTGG TCAGCJCACGTAAAACTATGGCCTCCAATGCCATCACCATTAACGGTGAA
AAACAGTCCXJATCXTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTG
GTCGTTTTACCT'l'AG'IX Xi'rGGCXiGTAAAAAGAATTACTGTCTGA'nTGC TGGAAATAA
SHQ ID Polinuclcótido ATGGCAAGCAGTAAC TGATTAAACAATTGCAAGAgCGGGGGCTGGTA GCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGC
NO.: 6 sintctasa CCGATCGCACTCG'IXJTGTGGC'TTCGATCCTACCGCTGACAGCTTGCATTT pOMe-4 GGGGCATCTTGTTCX'ATIXJTTA'IXÍCC'PGAAACGCTTCCAGCAGGCGGGC CACAAGCCGGTTGCGCTGG I'AGCÍCGGCGCGACGGGTCTGATTGGCGAC CCGAGCTTCAAAGCTGCCXJAGCGTAAGCTGAACACCGAAGAAACTGTT
CAGGAGTGGGTG(¡AGAAAATC(X¡TAAGCAGGTTGCCCCGTTCCTCGATT TCGAC GTCJGAGAAAAGTCTGCTATCGCGGCCAATAATTATGACTGGTT CGGCAATATGAATGTGC GACCTTCCTGCGCGATATTGGCAAACACTTC TCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAAC CGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGC
AGGGTTATAGTATCJGCC GTTTGAACAAACAGTACGGTGTGGTGCTGCA AATTGGTGGTTCTGACCACi TGGGGTAACATCACTTCTGGTATCGACCTG ACCCGTCGTCTGCATCAGAATCAGGTGTT TGGCCTGACCGTTCCGCTGA
TCACTAAAGCAGATGGCACCAAATTTGGTAAAACTGAAGGCGGCGCAG
TCTGGTTGGATCCCiAAGAAAACCAGCCCGTACAAATTCTACCAGTTCTG GATCAACACTGCGGATGCCGACGTTTACCGCTTCCTGAAGTTCTTCACC
TTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAAGATAAAAAC
AGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAGGTGACT
CGTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGTATTACC
GAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAgCGGACTTCG AACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCG
CAGACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCCGTGG
TCAGGCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAA
AAACAGTCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTG
GTCGTTTTACCTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGC
TGGAAATAA
SEQ ID Polinucleótido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCGGGGGCTGGTA
NO.: 7 sintetasa gCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGC CCGATCGCACTCACGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATT pOMe-5 TGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGG
CCACAAt 'CC.G'n'GCCirTGGTACiGCGGCGCGACGGGTCTGATTGGCGA CCCGAGC'TTC'A A AGCTGCCGAGCGTAAGC'I'GAACACCGAAGAAACTGT TCAG(iAGTG(¡GTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGAT TTCGACTGTGGACiAAAACTGTGCTATCGCGGCCAATAATTATGACTGGT TC'GGC'AA'I ATGA ATG TGCTGACGTTCCTGCGCGATATTGGCAAACACTT CTCCGTTAACC'AGATGATCAACAAAGA AGCGGTTA AGCAGCGTCTCAA
CACjGCj ATACGATGGrCTGTCTGAACAAACAGTACGGTGTGGTGCTGC AAATTGGTGG TTCTGACCAGTGGGG I AACATCACTTCTGGTATCGACCT
GACCC-GTCGTCTüCATCAGAATCAGGTGTTrGGCCTGACCGTTCCGCTG ATCACTAA AGCAGATGGCACCAAATTTGGTA AAACTGAAGGCGGCGCA
GTCTGGTTGGATCCGA AGAAAACCAGCCTGTACAAATTCTACCAGTTCT
GGATCAACVXCTGCFGGATGCTOACGTTTACCGCTTCCTGAAGTTCTTCAC C'l ITA GAGCATTGAAGAGATCAACGCCCTGGAAGAAGAAGATAAAAA CAGCGGTA A AGCACCGCGCGCCCAGTA TGTACTGGCGGAGCAGGTGAC
TCGTrTGGTTCACXiGTGAAGAAGGTrTACAGGCGGCAAAACGTATTACC GAATGCCTG'I TCAGC JGTTCTTTGAGTGCGC TGAGTGAAGCGGACTTCG AACAGCTCiGCGCAGGACGGCGTACC'GATGCiTTGAGATGGAAAAGGGCG CAGACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCCGTGG
TCAGGCACG'I AAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAA AAACAGTCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTG
GTCGTTTTACTTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGC
TGGAA ATAA
S Q ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA CTGGCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTG NO.: 8 sintetasa ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC pO e-6 (sitio CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC
CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTATGACTGGTTCAGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATACGTATGCCTGTCTGAACAAACAGTACG
GTGTG
SEQ ID Polinucleótido CGGGGGCTGGTACCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA sintetasa CTGGCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTG NO.: 9 pOMe-7 (sitio ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC activo)
CAGCAGGCGGGa'ACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT CTGATTGGGGACCCGAGCTTCAAAG TGCCGAGCGTAAGCTGAACACC ("AAGAAACTGTTCAGGAGTGOGTGGACAAAATCCGTAAGCAGGTTGCC rCGTT(TTCGATTrC"GAC GTCiGAGAAAAC'I"CTGCTATCGCGGCCAATA ATTATGACTGGTTCAGCAATATGAATGTGCTGACC TCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCG TGAAGATC'AGGGGATTTCGTTCACTGAGTTTTCC TACAACTTGCTGCAGGGTTATACGTATGCCTGTCTGAACAAACAGTACG GTGTG
SHQ I D Polinucleótido CGGGGGCTGG TAGCCGAGGTGAC'GGACG AGGAAGCGTTAGCAGAGCG A CTGGCCiCA AGCiCCC'GATC'GCACTCA TGTGGC l rCGATCC ACCGCTG
NO. : 10 sintctasa ACAGCTTGCATTTCJGGGCATC'TTCJTTCCATTGTTATGCCTGAAACGCTTC p() e-8 (sitio CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) TGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC AAGAAACTGTTCAGGAGTGCJGTGGACAAAATCCGTAAGCAGGTTGCC CCGTTCCTC'CIATT'I CGACTG'IXÍGAGAAAAC TCTCÍCTATCGCGGCCAATA ATTATCIACTGGTTCACÍC'AATATGAATGTGCTGACCTTCCTGCGCGATAT TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA CAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC TACAACCTCÍCTGCAGCÍGTTATACGTATGCCTGTCTGAACAAACAGTACG TGTG
SHQ I D Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA CTGGCGCAAGGCCCGATCGCACTCAC TGTGGCTTCGATCCTACCGCTG
NO. : 1 1 sintctasa ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC pOMe-9 (sitio CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC
CCGTTCCTCGATFTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC TACAACCTGCTGCAGGGTTATTCGTATGCCTGTGCGAACAAACAGTACG GTGTG
SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACG AGGAAGCGTTAGCAGAGCG A sintetasa CTGGCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTG
NO.: 12 pOMe- 10 ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC (sitio activo) CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT
CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC
GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC CCGTTCCTCC TTTCGACTGTCGAGAAAACTCTGCTATCGCGGCCAATA
ATTATGACTGGTTCAGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATACGTATGGCTGTCTGAACAAACAGTACG
GTGTG
SHQ I D Polinucleótido CGGGGGCTGGTACCcCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA CTGGCGCAAGGCCGGATCGGACTCCTTTGTGGCTTCGATCCTACCGCTG NO. : 1 sintetasa ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC pO e- 1 1 CAGCAGGCGGGCCACAAGC'CGG'ITGCGCTGGTAGGCGGCGCGACGGGT (sitio activo) CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGACiTGGGTGGACAAA ATCCGTAAGCAGGTGCC CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATAGTATTGCCTGTTTGAACAAACAGTACG
GTGTG
SF-Q ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA CTGGCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTG NO. : 14 sintetasa ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC pO e- 12 CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT (sitio activo) CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC
CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATAGTATTGCCTGTTTGAACAAACAGTACG
GTGTG
SEQ ID Polinucleótido CGGGGGCTGGTACCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA CTGGCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTG NO.: 15 sintetasa ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC pOMe- 13 CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT (sitio activo) CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC
CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
GCAA'rA'fGA A'I rrCiC'TCiAC'C'ITC'CTGCÜCGATAT'rGGCAAACACTTCTC CGTTAACTAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCG TGAAGATCAGGGGATTTCCjTTCACTGAGTTTTCCTACAACCTGCTGCAG GGTTATGGTTTTG(XTGTTTGAACAAACAGTACGGTGTGGTGCTGCAAA TTGGTGGTTC GAC XGTGGGGTAACATCACTTCTGGTATCGACCTGAC CCCiTCGTCTGCATCAGAATCAGGTG SHQ I D Polín ucleótido GCGTTAGCAGAGCGACTGGCGCAAGGCCX JATCGCACTCGGGTGTGGC TTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTr NO. : 19 sintctasa p- ATGCCTGAAACCJCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGT Ben/ofcnona- AGCJCCJGCGCGACGGG'IXTGATTGGCGACCCGAGCTTCAAAGCTGCCGA 2 (sitio activo) GCGTAACÍCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAAT CCGTAAGCAGGTTGCGCGTTCTTCGATTTCGACTGTGGAGAAAACTCT GCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTGA ( TTCCTGCGCCJATAT I (JCJCAAACACTTCTCCGTTAACCAGATGATCAA CAAAGAAGCGGTTAAGCAGC(]TCTCAACCGTGAAGATCAGGGGATTTC (JTTCACTCJAGTT'ÍTGC'I'ACVXAÍ 'TGCTGCACJGGTTATGG'ITA'I'GCCTGTA TGAACAAACAGTACGC!TGTGGTGCTGCAAATTGGTGGTTCTGACCAGTG GGGTAACATGAC TC GGTATCGACCTGACCCGTCGTCTGCATCAGAAT
CAGGTG
SHQ ID Polínucleótido GGGCTGGTACiCCCAGGTGACCiGACGNAGAAGCGTTAGCAGAGCGACTG GCGCAAGGCCCGATCCiCACTC'CTTTGTGGCTTCGATCCTACCGCTGACA NO. : 20 sintetasa GCTTGCATTTGGGGC'ATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAG pAzido Fe- 1 CAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTG (sitio activo) ATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAA GAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCG
TTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATT
ATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATATTGG
CAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCA
GCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTAC
AACCTGCTGCAGGGTTATTCTATGGCCTGTGCGAACAAACAGTACGGTG
TGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGG
TATCGACCTGACCCGTCGTCTGCATCANAATCANGTG
SEQ ID Polínucleótido TTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCGTTTGTGGCTTCG ATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGC NO.: 21 sintetasa CTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGC pAzido Fe-2 GGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGT (sitio activo) AAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGT
AAGCAGGTTGCTTCGTTCC CGATTTCGACTGTGGAGAAAACTCTGCTA TCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTGACCTT
CCTGCGCGATATTGGCAAACAC TC CCGTTAACCAGATGATCAACAAA
GAAGCGGTTAAGCAC!CGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAACCTGCTCJCAGGGTTATTCTGCGGCCTGTGCGA
ACAAACAGTACGGTTITCGTGCTGCAAATTGGTGGTTCTGACCAGTGGG
GTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCA
GGTG Sl'Q I D Polinuclcótido GACGAGGAAGCGTTAGCAGAGCXÍACTGGCGCAAGGCCCGATCGCACTC CTGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGT NO.: 22 sintetasa TCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTT pAzido Fc-3 GCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA (sitio activo) GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTG GACAAAATCCGTAAGCAC ÍTTGCCCCGTTCCTCGATTTCGACTGTGGAG
AAAACTCTGCTATCGGGGCCAATAATTATGACTGGTTCGGCAATATGAA
TGTGCTGACCITCTTGCGGGATATTGGCAAACACTTCTCCGTTAACCAG
ATGATCAACAAANAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAG
GGGATTI CGTTCACTGAGTTTTGCTACAACCTGCTGCAGGGTTATTCGGC
TGCXTGTGCGAACAAACAGTACGGNGNGGNGCTGCAAATTGGNGGTTC
TGACCAGGGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTG
CATCAAAATCAGGTG
SHQ I D Polinucleótido GCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCGTTTGTGGCT TCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTG NO. : 23 sintetasa TGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTA pAzido Fe-4 GGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAG (sitio activo) CGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATC CGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAACTCTG
CTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTGAC
CTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC
AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCG
TTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTGCGGCCTGTGT
TAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGG
GGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATC
ANGTG
SEQ ID Polinucleótido GACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTC sintetasa ATTTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGT NO. : 24 pAzido Fe-5 TCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTT (sitio activo)
GCOCTGGTAGGCGGCX'JCGACGGGTCTGATTGGCGACCCGAGCTTCAAA ( TGCCGACK'GTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTG (JACAAAATCGGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAG AAAACTCTGCTATCGGGGCCAATGATTATGAC GGTTCGGCAATATGAA
TGTG(TGAGC"ITCCTGCGCGATATTGGCAAAC"ACTTCTCCGTTAACCAG ATGATCAACAAAGAAGCGGTTAAGCAGCG'I'CTCAACCGTGAAGATCAG (jGGATTTCCiTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAATTT 'rGCC GTGTGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT (JACC'AGTGGGGTAACATCACTTC'I'GGTATCGACCTGACCCGTCGTCTGC A TCA G A A TC A G G TG
SHQ I I) Polinuclcótido CGACTGGCCiCAAGGCCCXiATCGCACTCACGTGTGGCTTCGATCCTACCG CTCJACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGC
NO. : 25 sintetasa TTCCAGCAGGRGGGCCACAAGRCGGTTGCGCTGGTAGGCGGCGCGACG pAzido l-c-6 GGT 'TGA'N'GGCGACX'GGAGCT TCAAAGCTGCCGAGCGTAAGCTGAAC (sitio activo) ACCGAACJAAAC I GTTCACJGAGTGCJGTGGACAAAATCCGTAAGCAGGTT GC'CCCGTTCCTCGATTTCGACTGTGCJAGAAAACTCTGCTATCGCGGCCA ATA ATTAT ACTGGTTC'GGCAATAT A ATGTGCTGACCTTCCTGCGCGA TATTGGGAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTT
AAGCAGCGTCTCAACCCJTGAAGATC'AGGGGATTTCGTTCACTGAGTTTT ( ACAATCTGCTGCAGGGTTATTCGGCTGCCTGTCTTAACAAACAGTA CGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACT
TCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG
SEQ I D Polinuclcótido CGGGGGCTGGTANCCCAGGTGACGGACGAGGAAGCGTAGCAGAGCGA sintetasa pPR- CTGGCGCAAGGCCCGATCGCACTCGGGTGTGGCTTCGATCCTACCGCTG
NO.: 26 ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC EcRS- 1 CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT (sintetasa de CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC propargiloxi GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC fenilalanina) CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA ATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT (sitio activo) TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATTCTATGGCCTGTTTGAACAAACAGTACG
GTGTGGTGCTGCAAATTGGTGGTCTGACCAGTGGGGTAACATCACTTC
TGGTATCGACCTGANCCGTCGTCTGCATCAGAATCAGGTG
S HQ I D Polinuclcótido A;GGGGCTGGTAGCXX \GGTGACGGACGAGGAAGCGTTAGCAGAGCGA RRGGCGCAAGGCC'CGATCGCACTCACGTGTGGCTTGGATCCTACCGCTG NO. : 27 sintctasa pPR- ACAGCTTGCATTTCIGGGRATCTTGTTCCATTGTTATGCCT AAACGCTTC EcRS-2 (sitio CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) CI GATTGGCGACCRGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTC'AGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC CGC N CTCGAT'RI'CGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA ATTATGACTGGTTCGGCAATATGAATGTGCTGACC TCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAAC'CGTGAAGATCAGGGGATTTCCJTTCACTGAGTTTTCC TACAATCTGCTGCAGGGTTATTCGGCTGCCTGTCTTAACAAACAGTACG GTGTGGTGCTGCAAATTGGTGGTTC GACTAGTGGGGTAACATCACTTC TGGTATCGAACCTGANC GTCOTCTGCATCAAAATCAAGTG
SEO I D Polinuclcótido CGGGGGCTGGTACCCCAAG IXiACGGACGAGGAAACGTTAGCAGAGCGA CTGGCGC'AAGGCCCGATCGCACTCTCTTGTGGCTTCGATCCTACCGCTG NO.: 28 sintctasa pPR- ACAGCTTGCATTTÜGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC EcRS-3 (sitio CAGCAGGCAGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) CTGATTGGCGACCGGAGCTTCAAAGCTGC GAGCGTAAGCTGAACACC GAAGAAACTGTTC'AGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC CCGTTC TCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTATCjACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT TCiüCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATACGATGGCCTGTGTGAACAAACAGTACG
GTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTC
TGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG
SEQ I D Polinuclcótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA NO.: 29 sintctasa pPR- CTGGCGCAAGGCCCGATCGCACTCGCGTGCGGCTTCGATCCTACCGCTG ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC EcRS-4 (sitio CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) CTGATTGGCGACCCGAGCTTCAAGGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC
CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATTATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCGTGAAGATCAGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATTCTTATGCCTGTCTTAACAAACAGTACG
GTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTC
TGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG
S I :Q I D Polinuclcótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA ( "I G(¡rG('AAGGCCCGATC"GCACTCGCGTGTGGCTTCGATCCTACCGCTG
NO. : 30 sintelasa pPR- ? C A G CTTG C A TTTG G ( ¡ G G A T 'TTG TTCC A TTGTT A TG CCTG A A ACGCTTC EcRS-5 (sitio CAGGAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) C TGA rTGGCGACCCGAGGTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAACiAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC ('C'G'l'('C"['TCGAT'rrC(¡AC'rGTGGAG \AAACTCTGCTATCGCGGCCAATA A'ITATGACTCJGTTCGGCAATATGAATG TGCTGACCTTCCTGCGCGATAT '['(¡GCAAACAGTTC'TCC'GTTAACCAGATGATCAACAAAGAAGCGGTTAA GGA(¡GGTCTCAAC"CG TGAAGATCAGGGGATTTCGTTCACTGAG'ITTTCC TACAACC' TGGTGCAGCiGTTATACCiATGGCCTGTTGTAACAAACAGTACG G TG rGGTGCTGCAAATTGGTGGT'IX'TGACCAGTGGGGTAACATCACTTC TGG rATCXjACCTGACCCG rCG I C TGCATCAGAATCAGGTG SHQ I D Polinucleótido CGGGGGCTGGTACCCCAAGTCiACGGACGAGGAAGCGTTAGCAGAGCGA NO.: 3 1 sintctasa pPR- C-rGGGGGAAGGCCrGATCGCACTCACGTGTGGCTTCGATCCTACCGCTG AGAGGTTGCATTTGGCiGCATC'TTCj't'TCCATTGTTATGCCTGAAACGCTTC EcRS-6 (sitio CAGCAGGCGGGCCACAAGCCGGTTCGCTGGTAGGCGGCGCGACGGGT activo) CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAACiAAACTGTTCAGGAGTGCiGTGGACAAAATCCGTAAGCAGGTTGCC CCGITCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTA TGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCG TGAAGATCAGGGGATTTCGTTCGCTGAGTTTTCC
TACAACCTGCTGCAGGGTTATACGTTTGCCTGTATGAACAAACAGTACG
GTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTC
TGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG
SHQ ID Polinucleótido GTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC NO.: 32 sintetasa pPR- GCACTCACGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGC ATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAA EcRS-7 (sitio GCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAG activo) CTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGA GTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGAC
TGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCA
ATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGT
TAACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGA
AGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAATCTGCTGCAGGGT
TATTCGGCTGCCTGTCTTAACAAACAGTACGGTGTGGTGCTGCAAATTG
GTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCG
TCGTCTGCATCAGAATCAGGTG
SHQ I D Polinucleótido (TXiGGGCTGGTAGCC'CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA CTGGrGCAAGGCCCGATCGCACTCGTTTGTGGCTTCGATCC ACCGCTG
NO. : 3 sintetasa pPR- ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC EcRS-8 (sitio CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) C GATTGGCGACCCXiAGriTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAAC GTTCAGGAGTCGGTGGAC7\AAATCCGTAAGCAGGTTGCC C 'CiTTCGTCGA ITTCGACTGTGCiAGAAAAGTCTGCTATCGCGGCCAATA AITATGACTGG'ITCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT TGGC'AAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA GCACiCG'rCTCAACX'GTGAAGA rCAGGGGA'ITTCGTTCACTGAGTTTTCC TACAACC GCTGCAGGGTTATTCGA'rGGCCTGTACGAACAAACA TACG GTGTGGTGCTGCAAATTGGTGGTTC GACT'AGTGGGGTAACATCACTTC TGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG
SEO I D Polinucleótido CGGCiGGG rGGTANCGGAAGTGACGGACGGGGAAGCGTTAGCAGAGCGA CTGGCGCAAGGCCCGATCTiCACTCAGTTGTGGCTTCGATCCTACCGCTG
NO. : 34 sintetasa pPR- ACAGCTTGCATTTGGGGCATCTTGTI CATTGTTATGCCTGAAACGCTH C EcRS-9 (sitio CAG(7\GGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) C GATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGAGTGGGTGGACAAAATGCGTAAGCAGGTGCC
CCGTTCCTCGATCTGGACTGTCiGAGAAAAGTCTGCTATCGCGGCCAATA ATTATGAC GGTTCGGCAATATGAATCJTGCTGACCTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTGAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC TACAACCTGCTGCAGGGTTATAGTTTTGCCTGTCTGAACAAACAGTACG GTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTC TGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG
SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGA CTGGCGCAAGGCCCGATCGCACTCACGTGTGGCTTCGATCCTACCGCTG
NO.: 35 sintetasa pPR- ACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC EcRS- 10 (sitio CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGT activo) CTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACC GAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC
CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATA
ATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATAT
TGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAA
GCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCC
TACAACCTGCTGCAGGGTTATACGTTTGCCTGTACTAACAAACAGTACG
ÜTGTG(ÍTGCT(¡CA/\/\TTC ;TGGTTCTGACCAGTGGGGTAACATCACTTC TGGTATCOACCTGAC(TGTCGTCTGCATCAGAATCAGGTG Sl-Q ID Aminoácido MASSNIJKQLQERGLY \QVTDEEALAERLAQGPIALVCGFDPTADSLHLGH LVPLLCLKRFOQAGHKPVALVGGATGLIGDPSFKAAER LNTEETVQEWV
NO.: 36 (aa) sintctasa DKIRKQVAPFL.DFNCGENSALAANNYDWFGNMNVLTFLRDIGKLIFSVNQM p-yodo FcRS- INKEAV QRLNREDQGISFTEFSYNU.QGYSYACLN OYGVVLQIGGSDQ
1 WG FFSGIDLTRRLHQNQVFGLTVPLITK A DGTKFG TEGG A VWLDP KTS PYKFYQFWINTADADVYRFI. FFTFMSIEEINALEEEDKNSGKAPRAQYVL AEQV']'RLVHGI-;i;(jLQAAKR]TECLIrSGSLSALSEADFEOLAODGVPMVE KKGADI IQALV SELQPSRGQARKTIASNAITINGEKQSDPEY FF EEDRLF GRFTLLRRGKKNYCLICWK
SKQ ID Aminoácido MASSNI JKQLQERGLVAQVTDE ALAERLAQGPIALICGFDPTADSLHLGH LVPLLCLKRFQQAG1IKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV
NO.: 37 (aa) sintctasa DKIRKOVAPFLDFOCGENSAIAANNYDWFGNMVLTFLRDIGKHFSVNQ p-yodo FcRS- INKEAVKQRLNREDQGISFTEFSYNLLQGYS ACLNKQYGVVLQIGGSDQ 2 WGN ITSG IDLTR LHQNQVFG LTV PLITK A DGTKFGKTEGG A VWLDPKKTS PYKFYOFWINTADADN'YRFLKFFTF SIEEINALEEEDKNSGKAPRAQYVL AEQVTRLVllGFJXil.OAAKRITECl.F'SGSLSALSEADFEQLAQDGVPMVE EKGADL QALVtXSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF GRFTLLRRGKKNYCLICWK
XHQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV
NO. 38 (aa) sintctasa DKIRKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIGKHFSVNQ p-yodo FeRS- LNKEAVKQRLNREDQGISFTEFSYNLLQGYSMACANKQYGVVLQIGGSDQ 3 WGN ITSG IDLTRRLHQNQVFGLTVPLITK A DGTKFGKTEGG A VWLDPKKTS PYKFYQFWNTADADVYRFLKFFTFMSIEE1NALEEEDKNSGKAPRAQYVL AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVE
EKGADL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEQ ID Aminoácido ASSNL1KQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV
NO. 39 (aa) sintctasa DKIRKQVAPFLDFDCGENSA1AANNYDWFGN NVLTFLRDIGKHFSVNQM OMe TyrRS-1 INKEAVKQRLNREDQGISFTEFSYNLLQGYSMACLNKQYGVVLQIGGSDQ
WGNITSGIDLTRRLHQNQVFGLTVPLITKA DGTKFG TEGG A VWLDPKKTS
PYKFYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VEM
EKGADL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEQ ID Aminoácido ASSNIJ QLQERGIA \QVTDEEALA RLAQGPI ALVCGFDPTADSLHLGH NO.: 40 (aa) sintetasa I.VPI .CLK FQQAGHKPN'ALVGCJATGLIGDPSFKAAERKLNTEETVQEVVV OMe Tyr S-2 DKIRKQVAPFLDFDaJENSAlAANNYDWFGN NVLTFLRDIGKHFSVNQ INKEAVKQRLNREDQGISFTEFSYNLLQGYSMACLNKQYGVVLQIGGSDQ
WGNITSGIDLTRRLHONQVFGLTVPLITKADGTKFG TEGGAVWEDPKKTS
PYKFYQFWINTADADYTRFLKFFTF SIEEINAEEEDKNSGKAPRAQYVL
AHQYTRl.VHGHHGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VE HKGADL QAl.VDSHl.QPSRGQARKTIASNAITINGE QSDPEYFFKEEDRLF FTLLRRGKKNYCL 'W SEQ ID Aminoácido N SSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 41 (aa) sintetasa LV LLCLKRFQQAG1 IKPVALVGGATG LIGDPSF AAER LNTEETVQEVVV OMe TyrRS-3 DKIRKQVAPFLDI'DCCJENSAIAANNYDWFGNMNVLTFLRDIG HFSVNQ INKEAVKQRLNREDQGISFTEFSYNLLQGYT ACLN QYGWLQIGGSDQ GNri'SGlDLTRRLHQNOV FGLTYPI JT ADGT FGKTEGGA VWLDPKKTS PYKFYQFVVINTADADVYRF'E FFTFM.SIEEINALEEED NSG APRAQYVL AEQVTRLVHGEEGLQAAKR! I ECLFSGSLSALSEADFEQLAQDGVP VE E GADL QALVDSELQPSRGQARKTIASNAITINGE QSDPEYFF EEDRLF
GRFTLLRRGK NYCLICVYK
SEQ ID Aminoácido ASSNLIKQLQERGLVAQVTDI-EALAERLAQGPIALLCGFDPTADSLHLGH NO.: 42 (aa) sintetasa LVPLI.CL RFQQAGHKPVALVGGATGL1GDPSF AAERKLNTEETVQEWV OMe TyrRS-4 DKIRKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIGKHFSVNQM INKEAVKQRLNREDQGISFTEFSYNLLQGYSMACSNKQYGVVLQIGGSDQ
WGNITSGIDLTRRLHQNQVFGLTVPL1TKADGTKFGKTEGGAVWLDPKKTS PYKFYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VE
EKGADLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRG NYCLICW
SEQ ID Aminoácido ASSNLI QLQERGLVAQVTDEEALAERLAQGPIALLCGFDPTADSLHLGH NO.: 43 (aa) sintetasa LVPLLCL RFQQAGHKPVALVGGATGLIGDPSFKAAER LNTEETVQEWV OMe TyrRS-5 D IR QVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIG HFSVNQM I EAV QRLNREDQGISFTEFSYNLLQGYSMACANKQYGVVLQIGGSDQ
WGN1TSGI DLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS PY FYQFW1NTADADVYRFL FFTFMSIEEINALEEED NSGKAPRAQYVL AEQVTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQLAQDGVPMVEM
EKGADL QALVDSELQPSRGQAR TIASNA1TINGEKQSDPEYFFKEEDRLF GRFTLLRRGKKNYCLICWK
Sl-Q ID Aminoácido MASSNI JKQLQERGIA'AQVTD ALAERLAQGPIALTCGFDPTADSLFILGFI NO.: 44 (aa) sintetasa LV PLLCLKRFQQAGI IKPVAIA'GGATGLIGDPSFKAAERKLNTEETVQEWV OMe TyrRS-6 DK1RKQVAPFLDFDC ENSAIAANNYDWFGNMNVLTFLRDIGKHFSVNQ IN EAVKQRLNREDQGISFTEFSYNLLQGYR ACLN QYGVVLQIGGSDQ W N1TS IDI.T RLI IQNQVFGLTVPLIT ADGTKFGKTEGGA VWLDP TS PYKFYOFWINTADADVYRFLKFFTF SIEEINALEEEDKNSGKAPRAQYVL AEQVTRLV1 IGEEGLQAAKRITECLFSGSLSAESEADFEQLAQDGVPMVEM EKGADL QALVDSELQPSRGOARKTIASNAITINGE QSDPEYFFKEEDRLF G R FT LLRRGK NYCLIC W K SliQ ID Aminoácido MASSNI QLQER IA'AQVTDEEALAERLAQGPL ALICGFDPTADSLHLGFI NO.: 45 (aa) sintetasa LVPI.LCLKRFQQAGU PVALVGGATGLIGDPSFKAAERKLNTEETVQEWV p-acctil FeRS- DKIRKOVAPFLDFDCÜENSAIAANNYDWFGNMNVLTFLRDIGKHFSVNQM INKEAV QRLNREDQGISFTEFSYNLLQGYGMACANKQYGVVLQIGGSDQ 1 VVCÍNITSGIDETRRLIIQNQVFGI.TVPEIT ADGT FGKTEGGAVWLDPK TS PYKFYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVL
A QVTRLVI IGEEGLQAA RITECLFSGSLSAE ADFEQLAQDGVPMVE
EKGADLMQALYOSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SL:Q ID Aminoácido ASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALGCGFDPTADSLHLGH
NO.: 46 (aa) sintetasa LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV p-benzoil DKIRKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIG HFSVNQ IN EAV QRLNREDQGISFTEFSYNLLQGYGFACAN QYGVVLQIGGSDQ FeRS-1 WGNITSGIDLTRRLHQNQVFGLTVPLIT ADGTKFG TEGGAVWLDP KTS
PYKFYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVIIGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEM
EKGADL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRG KNYCLICW
SEQ ID Aminoácido ASSNL QLQERGLVAQVTDEEALAERLAQGPIALGCGFDPTADSLHLGH NO.: 47 (aa) sintetasa LVPLLCLKRFQQAGH PVALVGGATGLIGDPSFKAAER LNTEETVQEWV p-benzoil DKIR QVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIGKHFSVNQM INKEAVKQRLNREDQGISFTEFSYNLLQGYGYAC NKQYGVVLQIGGSDQ FeRS-2 WGNITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKFYQFWINTADADVYRFL FFTF SIEEINALEEED NSG APRAQYVL
AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VE
EKGADLMQALVDSELQPSRGQARKTIASNAITINGE QSDPEYFF EEDRLF
GRFTLLRRGKKNYCLICWK
SHQ ID Aminoácido ASSNIJKQLQERGIA'AQVTDEEALAERLAQGPIALLCGFDPTADSLHLGH NO.: 48 (aa) sintctasa LVPÜXLKRFQQAGIIKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV p-azido FcRS- DK1R Q\'APFLDFDC'CJENSA1AANNYDWFGN NVLTFLRDIGKHFSVNQM INKEAVKQRLNREDQGISFTEFSYNI QGYSN CANKQYGVVLQIGGSDQ ] W'GNITSGIDLTRRLHQNQVI-GLTVPLITKADGT FGKTEGGAVWLDP KTS PYKFYQFWINTADADVYRFLKFFFF SIEEINALEEEDKNSGKAPRAQYVL
AEQVTRL.VHGEEGI.QAA RITECLFSGSLSALSEADFEQLAQDGVP VE EKGAD[ IQALVDSELQPSRGQAR TIASNARRINGE QSDPEYFFKEEDRLF GRFTLLRRGKKNYCLICWK
SHQ ID Aminoácido MASSNIJKQLQERGLVAQVTDEEALAERI.AQGPIALVCGFDPTADSLHLGH NO.: 49 (aa) sintetasa LVPLLCEKRFQQAGU PVALVGGATGUGDPSFKAAERKLNTEETVQEWV p-azido I'cRS- D IRKQVAPFLDFDCGENSAIAANNYDVVFGNMNVLTFLRDIG HFSVNQM 2 INKEAV QRLNREDQGISFTEFSYNLLQGYSAACAN QYGVVLQIGGSDQ WGNRRSGLDLTRRI IQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKFYQFWINTADADVYRFLKFFTFMSIEEINAI IEEDKNSGKAPRAQYVL
AF:QVTRI.VIIGEEGLOAA R]TECLFSGSESALSEADFEQLAQDGVP VEM EKGADL QALVDSELQPSRGQAR TIASNAITINGE QSDPEYFF EEDRLF
GRFTLLRRG NYCLICWK
SLiQ ID Aminoácido ASSNLI QLQERGLVAQVTDEEALAERLAQGPIALLCGFDPTADSLF1LGH NO.: 50 (aa) sintctasa LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV p-azido FcRS- DKIR QVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIG HFSVNQ INKEAVKQRLNREDQGISFTEFSYNLLQGYSAACANKQYGVVLQIGGSDQ 3 WGNITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKFYQFVVINTADADVYRFL FFTF SIEEINALEEED NSG APRAQYVL
AEQVTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQLAQDGVPMVEM
EKGADL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH NO.: 51 (aa) sintetasa LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV p-azido FeRS- DK1RKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRD1G HFSVNQM INKEAVKQRLNREDQGISFTEFSYNLLQGYSAACVNKQYGVVLQIGGSDQ 4 WGNITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKFYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VEM
EKGADLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEO ID Aminoácido MASSNLIKQLQERCIL.VAQVTDEI-ALAERLAQGPIALICGFDPTADSLHLGH NO.: 52 (aa) sintetasa LVPI.L.CEKRI'OQACILIKPVALVGGATGLIGDPSFKAAER LNTEETVQEVVV p-azido FeRS- D IRKQVAPFLDFDC'GENSALAAND'I'DWFGN NVETFLRDIG HFSVNQM NKI-:AVKQR[.NREDQGISFTEFSYNELQGYNFACVNKQYGVVLQIGGSDQ 5 WGNN'SGLDI/RRRLUQNQVFGLTVPIJTKADGT FG TEGGAVVVLDP KTS PYKI-'YQFWINTADADVYRI'LKFFTF SIEEINALEEEDKNSG APRAQYVL AI-ÜVTRLVHGEEGl-OAAKRn'ECI.FSGSLSALSEADFEQLAQDGVP VEM E ADl. QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFF EEDRLF GRFTU.RRGKKNYCUCW'K SHQ ID Aminoácido MASSNLI QLQERGLVAQVTDEEALAERI VQGPIALTCGFDPTADSLHLGH • NO.: 53 (aa) sintetasa lA'PI.LCEKRFQQAGUKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV p-azido FeRS- DKIRKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIG HFSVNQM INKEAV QRI^NREDQGISFTEFSYNLLQGYSAACLN QYGVVLQIGGSDQ 6 WGNITSGIDLTRRLIIQNQVFGETVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKKYQF INTADADVYRFI. FFTFMSIEEINALEEED NSGKAPRAQYVL AEQVTRI.VllGEEGEQAAKRrrECLFSGSLSALSEADFEQLAQDGVPMVEM E GADL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFF EDRLF
GRFTLLRRGKKNYCLICW
SHQ ID Sintetasa de /?- ASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALGCGFDPTADSLH LGH NO.: 54 propargiloxip LVPLLCL RFQQAGHKPVALVGGATGLIGDPSF AAERKLNTEETVQEWV henilalaiiina D IRKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIG HFSVNQM INKEAV QRLNREDQGISFTEFSYNLLQGYS ACLN QYGVVLQIGGSDQ Aminoácido WGNITSGIDLTRRLUQNQVFGLTVPLIT ADGT FG TEGGAVWLDP TS (aa) sintetasa PY FYQFWINTADADVYRFL FFTF SIEEINALEEED NSGKAPRAQYVL pPR-EcRS-1 AEQVTRLVHGEEGLQAAKRITECFFSGSLSALSEADFEQLAQDGVPMVEM
E GADLMQALVDSELQPSRGQAR TIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEQ ID Aminoácido ASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 55 (aa) sintetasa LVPLLCL RFQQAGH PVALVGGATGLIGDPSF AAER LNTEETVQEWV pPR-EcRS-2 DKIRKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIGKHFSVNQ INKEAVKQRLNREDQG1SFTEFSYNLLQGYSAACLNKQYGVVLQIGGSDQ WGNITSGIDLTRRLHQNQVFGLTVPLIT ADGTKFG TEGGAVWLDP TS
PY FYQFWINTADADVYRFLKFFTF SIEEINALEEED NSGKAPRAQYVL
AEQVTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQLAQDGVPMVE
EKGADL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRG KNYCLiCW
SHQ ID Aminoácido MASSNLIKQIX^ERGLVAQVTDEEALAERLAQGPIALSCGFDPTADSLHLGH NO.: 56 (aa) sintetasa l.VPI.LCLKRFQQAGII PVALVGGATGLIGDPSF AAERKLNTEETVQEWV pPR-EcRS-3 DKIR QVAPF1.DFDCGENSAIAANNYDVVFGN NVLTFLRDIG HFSVNQ NKEAVKQRLNREDQGISFTEFSYNLLQGYT ACVNKQYGVVLQIGGSDQ
VVGNITSGIDLTRRLHONQVFGETVPLIT ADGTKFG TEGGAVWLDP TS
PY KYQFVVINTADADVYRFL FFTFMSIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVUGEEGLOAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEM F. GADFMQALVDSEL.QPSRGQAR TIASNArriNGEKQSDPEYFF EEDRLF GRFTLLRRGKKNYCLICWK
SHQ ID Aminoácido ASSNL1 QLQERGLVAQVTDHEALAERLAQGPIALACGFDPTADSLHLGH NO.: 57 (aa) sintetasa LVPLLCLKRFQQAGH PVALVGGATGLIGDPSF AAERKLNTEETVQEWV pPR-EcRS-4 DKIRKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIG HFSVNQ INKEAVKQRLNRHDQGISFTEFSYNIXQGYSYACLNKQYGVVLQIGGSDQ
WGNITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKFYQFVVINTADADVYRFLKFFTF SIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVE
HKGADLMQALVDSELQPSRGQARKTIASNALnNGEKQSDPEYFFKEEDRLF GRFTLLRRGKKNYCLICWK
SHQ ID Aminoácido ASSNLIKQLQERGLVAQVTOHEALAERLAQGPIALACGFDPTADSLHLGH NO.: 58 (aa) sintetasa LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV pPR-EcRS-5 DKIRKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIGKHFSVNQ IN EAV QRLNREDQGISFTEFSYNLLQGYTMACCN QYGVVLQIGGSDQ
WGNITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKFYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQLAQDGVPMVEM
EKGADLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 59 (aa) sintetasa LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWV pPR-EcRS-6 DK1RKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIGKHFSVNQM INKEAVKQRLNREDQGISFTEFSYNLLQGYTFACMNKQYGVVLQIGGSDQ
WGNITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTS
PYKFYQFWINTADADVYRFLKFFTFMSIEE1NALEEEDKNSGKAPRAQYVL AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVE
EKGADL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEQ ID Aminoácido MASSNI KQI.QERGIA VQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 60 (aa) sintctasa l.VPLI.CLKRI-'QQAGH PVALVGGATGLIGDPSF AAERKLNTEETVQEVVV pPR-EcRS-7 DKIRKQVAPFI.DFDC'GENSAIAANNYDVVFGN NVLTFLRDIGKHFSVNQ IN EAV QR1.NREDQGISFTEFSYNLLQGYSVACLN QYGVVLQIGGSDQ WGNrrSGlDLTRRLMQNQVFGLTVPLITKADGT FG TEGGAVWLDPKKTS PYKFYOFVVINTA ADVYRFL FFTFMSIEHINALEEEDKNSGKAPRAOYVL
AEQVTRLVI IGEE LQAA R1TECLFSGSLSALSEADFEQLAQDGVPMVEM E GADLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGKKNYCLICWK
SEQ ID Aminoácido MASSNLI QLQERGLVAQVTDEEALAEREAQGPIALVCGFDPTADSLHLGH NO.: 61 (aa) sintctasa LVPLLCLKRFQQACJHKPVALVGGATGUG DPSFKAAERKLNTEETVQEVVV pPR-EcRS-8 D IRKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIGKHFSVNQM IN EAVKQRl.NREDQGISFTEFSYNLLQGYS ACTNKQYGVVLQIGGSDQ WGNrrSGlDLTRRLMQNQVFGLTVPLITKADGT FG TEGGAVWLDP TS PYKFY'OF INTADADVYRFt.KFFTFMSIEEINALEEED NSGKAPRAQYVL AEQVTRLVI IGEEGI.QAA RITECLFSGSLSALSEADFEQLAQDGVPMVEM E GADLMQA1.V SEI.QPSRGQARKTIASNAITINGE QSDPEYFFKEEDRLF GRFTLLRRGKKNYCLICWK
SEQ I Aminoácido ASSNLI QLQERGLVAQVTDEEALAERLAQGPIALSCGFDPTADSLHLGH NO.: 62 (aa) sintetasa LVPLLCLKRFQQACiHKPVALVGGATGLIGDPSF AAERKLNTEETVQEWV pPR-EcRS-9 D IR QVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIGKHFSVNQM INKEAVKQRLNREDQGISFTEFSYNLLQGYSFACLNKQYGVVLQIGGSDQW
GNITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDP TSP
Y FYQFWINTADADVYRFLKFFTF SIEEINALEEED NSG APRAQYVLA
EQVTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQLAQDGVPMVEME
KGADLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLF
GRFTLLRRGK NYCLICW
SEQ ID Aminoácido ASSNLIKQLQERGLVAQVTDEEALAERLAQGP1ALTCGFDPTADSLHLGH NO.: 63 (aa) sintetasa LVPLLCL RFQQAGH PVALVGGATGLIGDPSF AAER LNTEETVQEWV pPR-EcRS-10 DKIRKQVAPFLDFDCGENSAIAANNYDWFGN NVLTFLRDIGKHFSVNQ IN EAV QRLNREDQGISFTEFSYNLLQGYTFACTN QYGVVLQ1GGSDQ WGN1TSGIDLTRRLHQNQVFGLTVPLIT ADGT FG TEGGAVWLDPKKTS PYKFYQFWINTADADVYRFL FFTF SIEEINALEEEDKNSGKAPRAQYVL
AEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VE
EKGADLMQALVDSELQPSRGQARKT1ASNAITINGEKQSDPEYFFKEEDRLF GRFTLLRRGKKNYCLICWK
SEQ ID polinucleótido AGCTTCrCGATAAGGGAGCAGGCTAGTAAAAAGCATTACCCCGTGGTG GGGTTCCCGAGCGGCCAAAGGGAGCAGACTCTAAATCTGCCGTCATCG
NO.: 64 de ARNt/Tyr ACCTCGAA(iGTTC'GAA'rCC"nXX'CCCACCACCA SHQ ID ARNt/Tyr AGCUUC'C GAUAAGGGAGCAGGCCAGUAAAAAGCAUUACCCCGUGGU GGGGUUCCCGAGCGG('CAAAGG(]AGCAGACUCUAAAUCUGC'CGUCAU
NO.: 65 CGACCUCGAAGGUUCGAAUCXXJUCCCCCACCACX'A SHQ ID Mutantes 5--ATGAAGTAGCTGTC'TTCTAT(X¡AACAAGCATGCG-3' NO.: 66 Amber L3TAG SHQ I Mutantes 5"-(X]AACAAGCATGC(¡ATTAC;TGCCGACTTAAAAAG-3" NO.: 67 Amber I13TAG SHQ ID Mutantes 5'-(X CTACTCTCCX"AAATAC;AAAAGG'rCTCCGCTG-3' NO.: 68 Amber T44TAG SHQ ID Mutantes S'-CTGGA ACAGC rATA(;C"i'A('T(¡ATTTTTCGTCG-3' NO.: 69 Amber F68TAG SEQ ID Mutantes 5'-GCCGTCACAGATTACTTGGCTTCAGTGGAGACTG-3' NO.: 70 Amber R110TAG SHQ ID Mutantes 5'-GATTGGCTTCATAGGAGACTGATATGCTCTAAC-3" NO.: 71 Amber VI 14TAG SEQ ID Mutantes 5'-GCCTCTATAGTTGAGACAGCATAGAATAATGCG-3' NO.: 72 Amber T121TAG SEQ ID Mutantes 5'-GAGACAGCATAGATAGAGTGCGACATCATCATCGG-3' NO.: 73 Amber I127TAG SEQ ID Mutantes 5 '-G A ATA AGTGCG ACATAGTCATCGG A AG AG AGTAGTAG- '
NO.: 74 Amber
SI Q ID M litantes 5"-GG'rCAA/\ÜAC/\ü'rrGTAGGTATCG/\TTGACTCGGC--V NO.: 75 Amber T145TAU SEQ ID M litantes de 5'-CGrTACTC CCCGAAATTTAAAAGGTrTCCX TG-3' NO.: 76 Sitio Permisivo T44F SEQ ID Mulantes de 5'-CGCTACTCTCCCCAAATATAAAAG(jTCTrCGCTG-3' NO.: 77 Sitio Permisivo T44Y SI;Q ID Minantes de 5'-CGCTAC'rCTCCCCAAATGGAAAAGGTCTCCGCTG-3'
NO.: 78 Sitio Permisivo T44VV SEQ ID M litantes de 5'-CGGTACT(TCCCCAAAGATAAAAGG rCTCC'GCTG-3' NO.: 79 Sitio Permisivo T44D SI-:Q ID litantes de 5'-CGCTAC TC'TCCC'CAAAAAAAA AAGGTCTCCGCTG-3'
NO.: 80 Sitio Permisivo T44 SHQ ID M litantes de 5'-GCCGTCACAGATTTTTTGGCTTCAGTGGAGACTG-3' NO.: 81 Sitio Permisivo R110F SEQ ID Mutantes de 5'-GCCGTCACAGATTATTTGGCTTCAGTGGAGACTG-3' Sitio NO.: 82 Permisivo Rl 10Y SEQ ID Mutantes de 5"-GCCGTCACAGATTGGTTGGCTTCAGTGGAGACTG-3' Sitio NO.: 83 Permisivo R110W SEQ ID utantes de 5'-GCCGTCACAGATGATTGGCTTCAGTGGAGACTG-3' Sitio NO.: 84 Permisivo R110D SEQ ID Mutantes de 5'-GCCGTCACAGATAAATTGGCTTCAGTGGAGACTG-3' Sitio NO.: 85 Permisivo R110
a Estos clones también contienen una mutación Asp 165 Gly.
Claims (40)
- REIVINDICACIONES 1. Una célula o linea celular de vertebrado que comprende una secuencia de nucleótidos como se establece en la SEQ ID NO: 87 o la SEQ ID NO: 88
- 2. La célula de la reivindicación 1, en donde la secuencia de nucleótidos codifica para una molécula ele ARNt que tiene una secuencia de reconocim ento de anticodón que es especifica para un codón selector.
- 3. La célula de la reivindicación 2, en donde el codón selector se selecciona del grupo que consiste de: codón ámbar, codón ocre, codón ópalo, o codones de cuatro o más bases .
- 4. La célula de la reivindicación 2, en donde la secuencia de nucleótidos codifica para una molécula de ARNt que es capaz de aminoacilarse con al menos un aminoácido no natural .
- 5. La célula de la reivindicación 1, en donde la secuencia de nucleótidos codifica para una molécula de ARNt que es un ARNt ortogonal (O-ARNt) .
- 6. La célula de la reivindicación 5, en donde el O-ARNt comprende una secuencia de aminoácidos como se establece en la SEQ ID NO: 87, SEQ ID NO: 88, o una variación conservadora de las mismas.
- 7. La célula de la reivindicación 5, en donde el O-ARNt es capaz de aminoacilación con un aminoácido natural o con un aminoácido no natural.
- 8. La célula de la reivindicación 4, en donde el O-ARNt es capaz de aminoaci lación con un aminoácido natural y con un aminoácido no natural.
- 9. La célula de la reivindicación 5, en donde el O-ARNt es capaz de aminoacilación con un aminoácido no natural .
- 10. La célula de la reivindicación 1, en donde la secuencia de nucleótidos se deriva de un organismo no vertebrado o de más de un organismo no vertebrado.
- 11. La célula de la rei indicación 1, en donde la secuencia de nucleótidos se deriva de un organismo vertebrado o de más de un organismo vertebrado.
- 12. La célula de la reivindicación 1, en donde la secuencia de nucleótidos se deriva de organismos vertebrados y no vertebrados.
- 13. La célula de la reivindicación 1, en donde la secuencia de nucleótidos es de tipo silvestre, mutada o modificada a partir del tipo silvestre.
- 14. La célula de la reivindicación 5, en donde la secuencia de nucleótidos se deriva de Escherichia coli o Bacillus stearothermophilus .
- 15. La célula de la reivindicación 1, en donde la célula de vertebrado es una célula de mamífero.
- 16. La célula de la reivindicación 15, en donde la célula de vertebrado es CHO-K1.
- 17. La célula de la reivindicación 15, en donde la célula de vertebrado es CHO DG-44.
- 18. La célula de la reivindicación 15, en donde la célula de vertebrado es una linea celular humana.
- 19. La célula de la reivindicación 9, en donde el aminoácido no natural se selecciona del grupo que consiste de: una p-acet i 1-L-feni lalanina , una p-yodo-L-fenilalanina, una O-met i 1 -L-t i ros ina , una p-propargiloxifenilalanina, una L-3- (2-naf til ) alanina, una 3-metil-fenilalanina, una 0-4-alil-L-tirosina, una 4 -propi 1-L- t i rosina , una tri-O-acetil-GlcNAc -serina , una L-Dopa, una fenilalanina fluorada, una isopropil-L-feni lalanina , una p-d z ido-L-fenilalanina , una p-acil-L-fenila lanina, una p-benzoi 1-L-fenilalanina, una L-fosfoserina, una fos fonoser ina , una fosfonotirosina, una p-bromofenilalanina , una p-amino-L-fenilalanina, una isopropil-L-fenilalanina , un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de un aminoácido de treonina; un alquilo, arilo, acilo, azido, ciano, halo, hidrazina, hidrazida, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina, aldehido, hidroxilamina , ceto, o aminoácido de amino sustituido, o cualquier combinación de los mismos; un aminoácido con un reticulador fotoact ivable ; un aminoácido marcado con espira; un aminoácido fluorescente; un aminoácido de enlace con metal; un aminoácido que contiene metal; un aminoácido radiactivo; un aminoácido fotoencerrado y/o fotoisomerizable; un aminoácido que contiene biotina o un análogo de biotina; un aminoácido que contiene ceto, un aminoácido que comprende poletilen glicol o poliéter; un aminoácido sustituido de átomo pesado; un aminoácido químicamente desdoblable o fotodesdoblable; un aminoácido con una cadena lateral alargada; un aminoácido que contiene un grupo tóxico; un aminoácido sustituido de azúcar; un aminoácido de enlace de carbono que contiene azúcar; un aminoácido redox activo; un ácido que contiene a-hidroxi; un amino tioácido; un aminoácido a,a disustituido; un ß-aminoácido ; un aminoácido cíclico diferente a prolina o histidina, y un aminoácido aromático diferente a fenilalanina , tirosina, o triptofano.
- 20. La célula de la reivindicación 15, que comprende además una ARNt sintetasa ortogonal (O-RS), en donde la OR-S reconoce al ARNt, y el ARNt preferentemente se aminoacila con un aminoácido no natural mediante la OR-S.
- 21. La célula de la reivindicación 20, en donde la OR-S se deriva de un oreganismo no vertebrado.
- 22. La célula de la reivindicación 20, en donde la OR-S comprende la secuencia de nucleótidos de la SEQ ID NO: 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 86, o variantes conservadoras de las mismas.
- 23. La célula de la reivindicación 21, en donde el organismo no vertebrado es Escherichia coli o Bacillus stearothermophi 1 us .
- 24. La célula de la reivindicación 20, que comprende además un ácido nucleico que comprende un polinucleótido que codifica para un polipéptido de interés, en donde el polinucleótido comprende un codón selector que se reconoce por el O-ARNt.
- 25. La célula de la reivindicación 24, en donde el polipéptido de interés es una proteina terapéutica, una proteina de diagnóstico, una enzima industrial o una porción de las mismas.
- 26. La célula de la reivindicación 24, en donde el polipéptido de interés comprende una proteina o una porción de una preoteina seleccionada del grupo que consiste de: una citosina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina , una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de hormona esferoide, eritropoyetina (EPO) , insulina, hormona del crecimiento humano, una antitripsina Alfa-1, una angiostatina , un factor antihemolitico, un anticuerpo, una apolipoproteina , una apoproteina, un factor atrial natriurético, un polipéptido atrial natriurético, un péptido atrial, una quimiosina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, una GCP-2, un NAP-4, un SDF-1, un PF4, un MIG, una calcitonina, un ligando de equipo-c, una citosina, una quimiosina CC, una proteína 1 quimioa trayente de monocito, una proteína 2 quimioatrayente de monocito, una proteína 3 quimioatrayente de monocito, una proteína 1 alfa inflamatoria de monocito, una proteína 1 beta inflamatoria de monocito, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando de equipo-c, un colágeno, un factor de estimulación de colonia (CSF) , un factor 5a de complemento, un inhibidor de complemento, un receptor 1 del complemento, una citosina, DHFR, un péptido-78 de activación de neutrofilo epitelial, un GROa/MGSA, un GRG-ß, GROy un MIP-la, un ???-?d, un MCP-1, un factor de crecimiento epidérmico (EGF) , un péptido de activación de neutrofilo epitelial, una eritropoyetina (EPO) , una toxina exfoliante, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un factor de crecimiento de fibroblasto (FGF), un fibrinógeno, una fibronectina , un G-CSF, un GM-CSF, una glucocerebrosidasa, una gonadotropina , un factor de crecimiento, un receptor del factor de crecimiento, una proteína Hedgehog, una hemoglobina, un factor de crecimiento de hepatocito (HGF), una hirudina, una albúmina de suero humana, una ICA -1, un receptor de ICAM-1, una LFA-1, un receptor de LFA-1, una insulina, un factor de crecimiento tipo insulina (IGF), un IGF-I, un IGF-II, un interferón, un IFN-a, un IFN-ß, un IFN-?, una ínter leucina , un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un factor de crecimiento de queratinocito (KGF) , una lactofer r ina , un factor inhibidor de leucemia, una luciferasa, una neurturina, un factor inhibidor de neutrófilo (NIF), una oncostatina M, una proteína osteogénica, un producto oncógeno, una hormona paratiroidea , un PD-ECSF, un PDGF, una hormona de péptido, una hormona del crecimiento humano, una pleyot opina , una Proteína A, una Proteína G, exotoxinas pirogénicas A, B o C, un relaxina, una renina, un SCF, un receptor de complemento soluble I, un I-CAM 1 soluble, un receptor de interleucina soluble, un receptor TNF soluble, una somatomedina , una somatostatina , una somatot opina , una estreptocinasa , un superantígeno , enterotoxinas de estafilococo, un SEA, un SEB, un SEC1, un SEC2, un SEC3, un SED, un SEE, un receptor de hormona esteroide, una dismutasa de superóxido (SOD) , una toxina de síndrome de choque tóxico, una timosina alfa 1, un activador plasminógeno de tejido, un factor de crecimiento de tumor (TGF) , un TGF-a, un TGF-ß, un factor de necrosis tumoral, un factor alfa de necrosis tumoral, un factor beta de necrosis tumoral, un receptor del factor de necrosis tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un factor de crecimiento endotel ial vascular (VEGEF) , una urocinasa, un Mos, un Ras, un Raf, un Met; un p53, un Tat, un Fos, un Myc, un Jun, un Myb, un Reí, un receptor de estrógeno, un receptor de progesterona , un receptor de testosterona , un receptor de aldosterona, un receptor LDL, un Equipo SCF/C, un CD40L/CD40, un VLA- 4 /VCAM- 1 , un ICAM-l/LFA-1, una hialurina/CD44 , y una corticosterona .
- 27. Una célula de vertebrado que comprende una aminoacil-ARNt sintetasa ortogonal (O-RS), un ARNt codificado por la SEQ ID NO: 87 o la SEQ ID NO: 88, un aminoácido no natural, y un ácido nucleico que comprende un polinucleótido que codifica para un polipéptido de interés, en donde el polinucleótido comprende un codón selector que se reconoce por el ARNt, en donde la OR-S aminoacila preferentemente al ARNt con el aminoácido no natural en la célula de vertebrado, y en donde la célula produce el polipéptido de interés del aminoácido no natural.
- 28. El ácido nucleico de la reivindicación 1, en donde el ácido nucleico comprende una caja A y una caja B.
- 29. La línea celular de la reivindicación 1, en donde la línea celular se ha transfectado de manera estable.
- 30. La línea celular de la reivindicación 1, en donde la linea celular se ha transfectado de manera transitoria .
- 31. Un método para producir, en una célula de vertebrado, al menos una proteina que comprende al menos un aminoácido no natural, comprendiendo el método: cultivar, en un medio apropiado, una célula de vertebrado que comprende un ácido nucleico que comprende al menos un codón selector y que codifica para la proteina; en donde el medio comprende un aminoácido no natural y la célula de vertebrado comprende: un ARNt que tiene una secuencia de nucleótidos establecida en la SEQ ID NO: 87 o la SEQ ID NO: 88, que funciona en la célula y reconoce al codón selector; y una aminoacil-ARNt sintetasa ortogonal (O-RS) que preferentemente aminoacila el O-ARNt con el aminoácido no natural .
- 32. El método de la reivindicación 31, en donde la célula se ha transfectado de manera estable para comprender el O-ARNt y la OR-S.
- 33. El método de la reivindicación 31, en donde la célula se ha transfectado de manera transitoria para comprender el O-ARNt y la OR-S.
- 34. El método de la reivindicación 31, en donde la célula se ha transfectado de manera estable para comprender el O-ARNt y la OR-S, y se ha transfectado de manera transitoria para comprender el O-ARNt o la OR-S, de tal manera que la célula aún comprende tanto el O-ARNt como la OR-S .
- 35. El método de la reivindicación 31, en donde el aminoácido no natural se selecciona del grupo que consiste de una p-acetil-L-fenilalanina, una p-yodo-L-fenilalanina , una O-metil-L-tirosina , una p-propargiloxifenilalanina, una L-3- ( 2 -naft i 1 ) alanina , una 3-met i 1-feni la lanina , una 0-4-alil-L-tirosina, una 4 -propi 1-L-1 iros ina , una tri-O-acetil-GlcNAcp-serina, una L-Dopa, una fenilalanina fluorada, una isopropil-L-fenilalanina , una p-azido-L-feni lalanina , una p-acil-L-feni lalanina , una p-benzoi 1-L- fen i lalanina , una L-fosfoserina, una fos fonoserina , una fos fonotirosina , una p-bromofenilalanina , una p-amino-L-fenilalanina, una isopropil-L-fenilalanina , un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de un aminoácido de treonina; un alquilo, arilo, acilo, azido, ciano, halo, hidrazina, hidrazida, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo, fosfono, fosfina, heterociclico, enona, imina, aldehido, hidroxilamina , ceto, o aminoácido de amino sustituido, o cualquier combinación de los mismos; un aminoácido con un reticulador fotoact i able ; un aminoácido marcado con espira; un aminoácido fluorescente; un aminoácido de enlace con metal; un aminoácido que contiene metal; un aminoácido radiactivo; un aminoácido fotoencer ado y/o fotoi someri zable ; un aminoácido que contiene biotina o un análogo de biotina; un aminoácido que contiene ceto, un aminoácido que comprende poletilen glicol o poliéter; un aminoácido sustituido de átomo pesado; un aminoácido químicamente desdoblable o fotodesdoblable; un aminoácido con una cadena lateral alargada; un aminoácido que contiene un grupo tóxico; un aminoácido sustituido de azúcar; un aminoácido de enlace de carbono que contiene azúcar; un aminoácido redox activo; un ácido que contiene a-hidroxi; un amino tioácido; un aminoácido a,a disustituido; un ß-aminoác ido ; un aminoácido cíclico diferente a prolina o histidina, un aminoácido aromático diferente a feni lalanina , tirosina, o triptofano.
- 36. El método de la reivindicación 32, en donde la proteína comprende una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o una porción de las mismas.
- 37. El método de la reivindicación 32, en donde la proteína comprende una proteína o una porción de una proteína seleccionada del grupo que consiste de: una citosina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina , una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de hormona esteroide, eritropoyetina (EPO), insulina, hormona del crecimiento humano, una antitripsina Alfa-1, una angiostat ina , un factor ant ihemol it ico , un anticuerpo, una apolipoproteina, una apoproteina, un factor atrial natriurét ico , un polipéptido atrial natriurético, un péptido atrial, una quimiosina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, una GCP-2, un NAP-4, un SDF-1, un PF4, un MIG, una calcitonina, un ligando de equipo-c, una citosina, una quimiosina CC, una proteina 1 quimioatrayente de monocito, una proteina 2 quimioatrayente de monocito, una proteina 3 quimioatrayente de monocito, una proteina 1 alfa inflamatoria de monocito, una proteina 1 beta inflamatoria de monocito, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando de equipo-c, un colágeno, un factor de estimulación de colonia (CSF) , un factor 5a de complemento, un inhibidor de complemento, un receptor 1 del complemento, una citosina, DHFR, un péptido-78 de activación de neutrofilo epitelial, un GROa/MGSA, un GRG^, GROY un MIP-la, un ??-?d, un MCP-1, un factor de crecimiento epidérmico (EGF), un péptido de activación de neutrofilo epitelial, una eritropoyetina (EPO), una toxina exfoliante, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un factor de crecimiento de fibroblasto (FGF), un fibrinógeno, una f ibronect ina , un G-CSF, un GM-CSF, una glucocerebrosidasa , una gonadot ropina , un factor de crecimiento, un receptor del factor de crecimiento, una proteina Hedgehog, una hemoglobina, un factor de crecimiento de hepatocito (HGF) , una hirudina, una albúmina de suero humana, una ICAM-1, un receptor de ICAM-l, una LFA-1, un receptor de LFA-1, una insulina, un factor de crecimiento tipo insulina (IGF) , un IGF-I, un IGF-II, un interferón, un IFN-OÍ, un IFN-ß, un IFN-?, una Ínter 1 euc i na , un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un factor de crecimiento de queratinocito (KGF) , una lactoferr ina , un factor inhibidor de leucemia, una luciferasa, una neurturina, un factor inhibidor de neutrófilo (NIF) , una oncostatina M, una proteína osteogénica, un producto oncógeno, una hormona paratiroidea, un PD-ECSF, un PDGF, una hormona de péptido, una hormona del crecimiento humano, una pleyotropina , una Proteína A, una Proteína G, exotoxinas pirogénicas A, B o C, un relaxina, una renina, un SCF, un receptor de complemento soluble I, un I-CAM 1 soluble, un receptor de interleucina soluble, un receptor TNF soluble, una somatomedina , una somatostatina , una somatotropina , una estreptocinasa , un superant ígeno, enterotoxinas de estafilococo, un SEA, un SEB, un SEC1, un SEC2, un SEC3, un SED, un SEE, un receptor de hormona esferoide, una dismutasa de superóxido (SOD), una toxina de síndrome de choque tóxico, una timosina alfa 1, un activador plasminógeno de tejido, un factor de crecimiento de tumor (TGF) , un TGF-a, un TGF-ß, un factor de necrosis tumoral, un factor alfa de necrosis tumoral, un factor beta de necrosis tumoral, un receptor del factor de necrosis tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un factor de crecimiento endotelial vascular (VEGEF) , una urocinasa, un os, un Ras, un Raf, un Met; un p53, un Tat, un Fos, un Myc, un Jun, un Myb, un Reí, un receptor de estrógeno, un receptor de progesterona , un receptor de tes tosterona , un receptor de aldosterona, un receptor LDL, un Equipo SCF/C, un CD40L/CD40, un VLA- /VCAM-1 , un ICAM-l/LFA-1, una hialurina/CD , y una cort icosterona .
- 38. Un equipo para producir una proteína que comprende al menos un aminoácido no natural, comprendiendo el equipo: un envase que contiene una secuencia de pol inucleótidos establecida en la SEQ ID NO: 87 o en la SEQ ID NO: 88.
- 39. El equipo de la reivindicación 38, en donde el equipo comprende además al menos un aminoácido no natural.
- 40. El equipo de la reivindicación 38, en donde el equipo comprende además materiales de instrucción para producir la proteína.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US84309206P | 2006-09-08 | 2006-09-08 | |
PCT/US2007/019655 WO2008030613A2 (en) | 2006-09-08 | 2007-09-07 | Hybrid suppressor trna for vertebrate cells |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2009002460A true MX2009002460A (es) | 2009-03-20 |
Family
ID=39157898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2009002460A MX2009002460A (es) | 2006-09-08 | 2007-09-07 | Arnt supresor hibrido para celulas de vertebrados. |
Country Status (16)
Country | Link |
---|---|
US (2) | US9133495B2 (es) |
EP (1) | EP2061878B1 (es) |
JP (1) | JP5399906B2 (es) |
KR (1) | KR20090051227A (es) |
CN (2) | CN106190983B (es) |
AU (1) | AU2007292892B9 (es) |
CA (1) | CA2662753C (es) |
DK (1) | DK2061878T3 (es) |
ES (1) | ES2457527T3 (es) |
HK (1) | HK1132528A1 (es) |
IL (1) | IL196912A (es) |
MX (1) | MX2009002460A (es) |
NZ (1) | NZ574721A (es) |
PT (1) | PT2061878E (es) |
SG (1) | SG174781A1 (es) |
WO (1) | WO2008030613A2 (es) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010096394A2 (en) | 2009-02-17 | 2010-08-26 | Redwood Biosciences, Inc. | Aldehyde-tagged protein-based drug carriers and methods of use |
CN103044539B (zh) * | 2010-04-09 | 2014-10-22 | 苏州元基生物技术有限公司 | 重组促红细胞生成素及制备方法 |
NZ607069A (en) | 2010-08-17 | 2014-10-31 | Ambrx Inc | Modified relaxin polypeptides and their uses |
US9567386B2 (en) | 2010-08-17 | 2017-02-14 | Ambrx, Inc. | Therapeutic uses of modified relaxin polypeptides |
WO2012097333A2 (en) | 2011-01-14 | 2012-07-19 | Redwood Bioscience, Inc. | Aldehyde-tagged immunoglobulin polypeptides and method of use thereof |
JP2019515677A (ja) | 2016-04-26 | 2019-06-13 | アール.ピー.シェーラー テクノロジーズ エルエルシー | 抗体複合体ならびにそれを作製および使用する方法 |
EP3580232B1 (en) | 2017-02-08 | 2023-09-20 | Bristol-Myers Squibb Company | Modified relaxin polypeptides comprising a pharmacokinetic enhancer and uses thereof |
EP3630977B1 (en) | 2017-06-02 | 2024-02-21 | Ambrx, Inc. | Methods and compositions for promoting non-natural amino acid-containing protein production |
IL314707A (en) | 2022-02-09 | 2024-10-01 | Daiichi Sankyo Co Ltd | Environmentally reactive masked antibody and its use |
CN114908066B (zh) * | 2022-05-17 | 2024-01-23 | 杭州嵌化合生医药科技有限公司 | 一种正交翻译系统及其在再分配密码子恢复ptc疾病中功能蛋白表达方面的应用 |
CN115261344B (zh) * | 2022-08-29 | 2023-07-21 | 北京大学 | 基于非天然氨基酸的离子液体、其制备方法及应用 |
Family Cites Families (171)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3773919A (en) | 1969-10-23 | 1973-11-20 | Du Pont | Polylactide-drug mixtures |
US4289872A (en) | 1979-04-06 | 1981-09-15 | Allied Corporation | Macromolecular highly branched homogeneous compound based on lysine units |
FR2504010B1 (fr) | 1981-04-15 | 1985-10-25 | Sanofi Sa | Medicaments anticancereux contenant la chaine a de la ricine associee a un anticorps antimelanome et procede pour leur preparation |
US4551433A (en) | 1981-05-18 | 1985-11-05 | Genentech, Inc. | Microbial hybrid promoters |
JPS57206622A (en) | 1981-06-10 | 1982-12-18 | Ajinomoto Co Inc | Blood substitute |
US4485045A (en) | 1981-07-06 | 1984-11-27 | Research Corporation | Synthetic phosphatidyl cholines useful in forming liposomes |
DE3374837D1 (en) | 1982-02-17 | 1988-01-21 | Ciba Geigy Ag | Lipids in the aqueous phase |
US4671958A (en) | 1982-03-09 | 1987-06-09 | Cytogen Corporation | Antibody conjugates for the delivery of compounds to target sites |
US4511503A (en) | 1982-12-22 | 1985-04-16 | Genentech, Inc. | Purification and activity assurance of precipitated heterologous proteins |
US4512922A (en) | 1982-12-22 | 1985-04-23 | Genentech, Inc. | Purification and activity assurance of precipitated heterologous proteins |
US4511502A (en) | 1982-12-22 | 1985-04-16 | Genentech, Inc. | Purification and activity assurance of precipitated heterologous proteins |
US5089398A (en) | 1983-02-22 | 1992-02-18 | Chiron Corporation | Enhanced yeast transcription employing hybrid GAPDH promoter region constructs |
CA1341302C (en) | 1983-02-22 | 2001-10-09 | Rae Lyn Burke | Yeast expression systems with vectors having gapdh or pyk promoters and synthesis of foreign protein |
US4876197A (en) | 1983-02-22 | 1989-10-24 | Chiron Corporation | Eukaryotic regulatable transcription |
US4755465A (en) | 1983-04-25 | 1988-07-05 | Genentech, Inc. | Secretion of correctly processed human growth hormone in E. coli and Pseudomonas |
US4859600A (en) | 1983-04-25 | 1989-08-22 | Genentech, Inc. | Recombinant procaryotic cell containing correctly processed human growth hormone |
US4544545A (en) | 1983-06-20 | 1985-10-01 | Trustees University Of Massachusetts | Liposomes containing modified cholesterol for organ targeting |
US4689406A (en) | 1983-08-10 | 1987-08-25 | Amgen | Enhancement of microbial expression of polypeptides |
EP0142641B1 (de) | 1983-09-26 | 1991-01-16 | Udo Dr. Ehrenfeld | Mittel und Erzeugnis für die Diagnose und Therapie von Tumoren sowie zur Behandlung von Schwächen der zelligen und humoralen Immunabwehr |
US4880734A (en) | 1984-05-11 | 1989-11-14 | Chiron Corporation | Eukaryotic regulatable transcription |
US4542225A (en) | 1984-08-29 | 1985-09-17 | Dana-Farber Cancer Institute, Inc. | Acid-cleavable compound |
US4738921A (en) | 1984-09-27 | 1988-04-19 | Eli Lilly And Company | Derivative of the tryptophan operon for expression of fused gene products |
US4659839A (en) | 1984-10-10 | 1987-04-21 | Mallinckrodt, Inc. | Coupling agents for radiolabeled antibody fragments |
US4837148A (en) | 1984-10-30 | 1989-06-06 | Phillips Petroleum Company | Autonomous replication sequences for yeast strains of the genus pichia |
EP0206448B1 (en) | 1985-06-19 | 1990-11-14 | Ajinomoto Co., Inc. | Hemoglobin combined with a poly(alkylene oxide) |
US4680338A (en) | 1985-10-17 | 1987-07-14 | Immunomedics, Inc. | Bifunctional linker |
US4699784A (en) | 1986-02-25 | 1987-10-13 | Center For Molecular Medicine & Immunology | Tumoricidal methotrexate-antibody conjugate |
US5186933A (en) | 1986-12-30 | 1993-02-16 | Baylor College Of Medicine | Synthesis and immunogenicity of rotavirus genes using a baculovirus expression system |
AU1717688A (en) | 1987-03-16 | 1988-10-10 | American Biogenetic Sciences, Inc. | Recombinant baculovirus occlusion bodies in vaccines and biological insecticides |
US5229490A (en) | 1987-05-06 | 1993-07-20 | The Rockefeller University | Multiple antigen peptide system |
CA1317244C (en) | 1987-07-24 | 1993-05-04 | Ernest Seigo Kawasaki | Production of biologically active forms of csf using a baculovirus (acnpv)-insect cell expression system |
AU2136788A (en) | 1987-07-24 | 1989-03-01 | Cetus Corporation | Production of ricin toxins in a baculovirus-insect cell expression system |
US5080891A (en) | 1987-08-03 | 1992-01-14 | Ddi Pharmaceuticals, Inc. | Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols |
US4929555A (en) | 1987-10-19 | 1990-05-29 | Phillips Petroleum Company | Pichia transformation |
US4904584A (en) | 1987-12-23 | 1990-02-27 | Genetics Institute, Inc. | Site-specific homogeneous modification of polypeptides |
CA1340772C (en) | 1987-12-30 | 1999-09-28 | Patricia Tekamp-Olson | Expression and secretion of heterologous protiens in yeast employing truncated alpha-factor leader sequences |
US5674706A (en) | 1988-05-06 | 1997-10-07 | Chiron Corporation | High level expression of proteins in yeast |
CA1324969C (en) | 1988-05-06 | 1993-12-07 | Jeffrey R. Shuster | High level expression of proteins in yeast |
FR2631974B1 (fr) | 1988-05-31 | 1992-12-11 | Agronomique Inst Nat Rech | Baculovirus modifie, son procede de preparation et son application en tant que vecteur d'expression de genes |
AU4197389A (en) | 1988-08-05 | 1990-03-05 | Mount Sinai School Of Medicine Of The City University Of New York, The | In vivo infection of live insects with a recombinant baculovirus |
GB8819453D0 (en) | 1988-08-16 | 1988-09-21 | Roy P | Production of bluetongue virus non-structural proteins using baculovirus expression vector |
NZ230425A (en) | 1988-09-02 | 1992-07-28 | Molecular Eng Ass | Production of paramyxovirus fusion (f) protein using recombinant baculovirus expression vector |
US5750373A (en) | 1990-12-03 | 1998-05-12 | Genentech, Inc. | Enrichment method for variant proteins having altered binding properties, M13 phagemids, and growth hormone variants |
CA2001774C (en) | 1988-10-28 | 2001-10-16 | James A. Wells | Method for identifying active domains and amino acid residues in polypeptides and hormone variants |
US6780613B1 (en) | 1988-10-28 | 2004-08-24 | Genentech, Inc. | Growth hormone variants |
WO1990005785A1 (en) | 1988-11-18 | 1990-05-31 | The Regents Of The University Of California | Method for site-specifically incorporating unnatural amino acids into proteins |
WO1990006952A1 (en) | 1988-12-22 | 1990-06-28 | Kirin-Amgen, Inc. | Chemically modified granulocyte colony stimulating factor |
US4902502A (en) | 1989-01-23 | 1990-02-20 | Cetus Corporation | Preparation of a polymer/interleukin-2 conjugate |
WO1990010078A1 (en) | 1989-02-23 | 1990-09-07 | University Of Ottawa | Improved baculovirus expression system capable of producing foreign gene proteins at high levels |
WO1990010277A1 (en) | 1989-02-24 | 1990-09-07 | Cell Analysis Systems, Inc. | Method and apparatus for determining a proliferation index of a cell sample |
AU5526690A (en) | 1989-04-19 | 1990-11-29 | Enzon, Inc. | Active carbonates of polyalkylene oxides for modification of polypeptides |
US5324844A (en) | 1989-04-19 | 1994-06-28 | Enzon, Inc. | Active carbonates of polyalkylene oxides for modification of polypeptides |
US5122614A (en) | 1989-04-19 | 1992-06-16 | Enzon, Inc. | Active carbonates of polyalkylene oxides for modification of polypeptides |
AU631223B2 (en) | 1989-05-17 | 1992-11-19 | University Of Georgia Research Foundation, Inc., The | Improved baculovirus expression vectors |
FR2649120B1 (fr) | 1989-06-30 | 1994-01-28 | Cayla | Nouvelle souche et ses mutants de champignons filamenteux, procede de production de proteines recombinantes a l'aide de ladite souche et souches et proteines obtenues selon ce procede |
US5162601A (en) | 1989-11-22 | 1992-11-10 | The Upjohn Company | Plant potyvirus expression vector with a gene for protease |
US5312808A (en) | 1989-11-22 | 1994-05-17 | Enzon, Inc. | Fractionation of polyalkylene oxide-conjugated hemoglobin solutions |
US5219564A (en) | 1990-07-06 | 1993-06-15 | Enzon, Inc. | Poly(alkylene oxide) amino acid copolymers and drug carriers and charged copolymers based thereon |
FR2664905B1 (fr) | 1990-07-18 | 1994-08-12 | Agronomique Inst Nat Rech | Baculovirus modifie, son procede d'obtention, et vecteurs d'expression obtenus a partir dudit baculovirus. |
WO1992001800A1 (en) | 1990-07-20 | 1992-02-06 | Chiron Corporation | Method for integrative transformation of yeast using dispersed repetitive elements |
WO1992002628A1 (en) | 1990-08-02 | 1992-02-20 | Chiron Corporation | Expression of human cmv glycoprotein-h using the baculovirus-insect cell expression system |
EP0548267A4 (en) | 1990-09-04 | 1994-11-23 | Salk Inst Biotech Ind | Production of insulin-like growth factor-1 in methylotrophic yeast cells |
EP0513332A4 (en) | 1990-11-14 | 1993-03-17 | Cargill, Incorporated | Conjugates of poly(vinylsaccharide) with proteins for the stabilization of proteins |
US5252714A (en) | 1990-11-28 | 1993-10-12 | The University Of Alabama In Huntsville | Preparation and use of polyethylene glycol propionaldehyde |
US5231178A (en) | 1991-01-16 | 1993-07-27 | The Salk Institute Biotechnology/Industrial Associates, Inc. | Method for the purification of intact, correctly-folded insulin-like growth factor-1 |
JPH06506217A (ja) | 1991-03-18 | 1994-07-14 | エンゾン,インコーポレーテッド | ポリペプチドまたはグリコポリペプチドとポリマーとのヒドラジン含有結合体 |
AU1651992A (en) | 1991-03-19 | 1992-10-21 | United States of America, as represented by the Secretary, U.S. Department of Commerce, The | Expression of influenza nucleoprotein antigens in baculovirus |
US5595732A (en) | 1991-03-25 | 1997-01-21 | Hoffmann-La Roche Inc. | Polyethylene-protein conjugates |
US6013433A (en) | 1991-04-26 | 2000-01-11 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Baculovirus expression vectors and recombinant antigens for detecting type-specific antibodies to herpes simplex virus |
US5281698A (en) | 1991-07-23 | 1994-01-25 | Cetus Oncology Corporation | Preparation of an activated polymer ester for protein conjugation |
US5290686A (en) | 1991-07-31 | 1994-03-01 | The United States Of America As Represented By The Department Of Health And Human Services | Expression of influenza a M2 protein in baculovirus |
IT1260468B (it) | 1992-01-29 | 1996-04-09 | Metodo per mantenere l'attivita' di enzimi proteolitici modificati con polietilenglicole | |
DE69312700T2 (de) | 1992-04-14 | 1998-02-19 | Cornell Res Foundation Inc | Makromoleküle auf basis von dendritischen polymeren und verfahren zur herstellung |
US5516657A (en) | 1992-05-11 | 1996-05-14 | Cambridge Biotech Corporation | Baculovirus vectors for expression of secretory and membrane-bound proteins |
ZA933926B (en) | 1992-06-17 | 1994-01-03 | Amgen Inc | Polyoxymethylene-oxyethylene copolymers in conjuction with blomolecules |
AU5006993A (en) | 1992-08-21 | 1994-03-15 | Enzon, Inc. | Novel attachment of polyalkylene oxides to bio-effecting substances |
US5382657A (en) | 1992-08-26 | 1995-01-17 | Hoffmann-La Roche Inc. | Peg-interferon conjugates |
US5298643A (en) | 1992-12-22 | 1994-03-29 | Enzon, Inc. | Aryl imidate activated polyalkylene oxides |
WO1994015625A1 (en) | 1993-01-15 | 1994-07-21 | Enzon, Inc. | Factor viii - polymeric conjugates |
US5349001A (en) | 1993-01-19 | 1994-09-20 | Enzon, Inc. | Cyclic imide thione activated polyalkylene oxides |
US5321095A (en) | 1993-02-02 | 1994-06-14 | Enzon, Inc. | Azlactone activated polyalkylene oxides |
US5532142A (en) | 1993-02-12 | 1996-07-02 | Board Of Regents, The University Of Texas System | Method of isolation and purification of fusion polypeptides |
IL104734A0 (en) | 1993-02-15 | 1993-06-10 | Univ Bar Ilan | Bioactive conjugates of cellulose with amino compounds |
WO1994028024A1 (en) | 1993-06-01 | 1994-12-08 | Enzon, Inc. | Carbohydrate-modified polymer conjugates with erythropoietic activity |
WO1995000162A1 (en) | 1993-06-21 | 1995-01-05 | Enzon, Inc. | Site specific synthesis of conjugated peptides |
GB9317618D0 (en) | 1993-08-24 | 1993-10-06 | Royal Free Hosp School Med | Polymer modifications |
US5762939A (en) | 1993-09-13 | 1998-06-09 | Mg-Pmc, Llc | Method for producing influenza hemagglutinin multivalent vaccines using baculovirus |
US5919455A (en) | 1993-10-27 | 1999-07-06 | Enzon, Inc. | Non-antigenic branched polymer conjugates |
US5643575A (en) | 1993-10-27 | 1997-07-01 | Enzon, Inc. | Non-antigenic branched polymer conjugates |
US5491076A (en) | 1993-11-01 | 1996-02-13 | The Texas A&M University System | Expression of foreign genes using a replicating polyprotein producing virus vector |
US5605792A (en) | 1993-11-04 | 1997-02-25 | The Ohio State University Research Foundation | Infectious bursal disease virus VP2 fusion protein expressed by baculovirus, use as diagnostic |
HUT75533A (en) | 1993-11-10 | 1997-05-28 | Schering Corp | Improved interferon polymer conjugates |
US5446090A (en) | 1993-11-12 | 1995-08-29 | Shearwater Polymers, Inc. | Isolatable, water soluble, and hydrolytically stable active sulfones of poly(ethylene glycol) and related polymers for modification of surfaces and molecules |
FR2715664B1 (fr) | 1994-01-31 | 1996-04-12 | Proteine Performance Sa | Baculovirus recombinant et son utilisation pour la production d'anticorps monoclonaux. |
JP3090586B2 (ja) | 1994-03-15 | 2000-09-25 | 片倉工業株式会社 | システインプロテアーゼ遺伝子欠損バキュロウイルスおよびその製造法並びにこれを利用する有用タンパク質の製造法 |
US5473034A (en) | 1994-03-18 | 1995-12-05 | Hyogo Prefectural Government | Method for producing protein-synthetic polymer conjugate and said conjugate produced thereby |
US5629384A (en) | 1994-05-17 | 1997-05-13 | Consiglio Nazionale Delle Ricerche | Polymers of N-acryloylmorpholine activated at one end and conjugates with bioactive materials and surfaces |
WO1995033490A1 (en) | 1994-06-02 | 1995-12-14 | Enzon, Inc. | Method of solubilizing substantially water insoluble materials |
US5730990A (en) | 1994-06-24 | 1998-03-24 | Enzon, Inc. | Non-antigenic amine derived polymers and polymer conjugates |
US6403375B1 (en) | 1994-08-24 | 2002-06-11 | Boyce Thompson Institute For Plant Research, Inc. | Establishment of Trichoplusia ni cell lines in serum-free medium for recombinant protein and baculovirus production |
US5650234A (en) | 1994-09-09 | 1997-07-22 | Surface Engineering Technologies, Division Of Innerdyne, Inc. | Electrophilic polyethylene oxides for the modification of polysaccharides, polypeptides (proteins) and surfaces |
US5871986A (en) | 1994-09-23 | 1999-02-16 | The General Hospital Corporation | Use of a baculovirus to express and exogenous gene in a mammalian cell |
US5824784A (en) | 1994-10-12 | 1998-10-20 | Amgen Inc. | N-terminally chemically modified protein compositions and methods |
EP0788375A2 (en) | 1994-11-09 | 1997-08-13 | Robin Ewart Offord | Functionalized polymers for site-specific attachment |
US5738846A (en) | 1994-11-10 | 1998-04-14 | Enzon, Inc. | Interferon polymer conjugates and process for preparing the same |
US5932462A (en) | 1995-01-10 | 1999-08-03 | Shearwater Polymers, Inc. | Multiarmed, monofunctional, polymer for coupling to molecules and surfaces |
AU720337B2 (en) | 1995-02-17 | 2000-05-25 | Stichting Dienst Landbouwkundig Onderzoek | Production of biologically active recombinant bovine follicle stimulating hormone (REC bFSH) in the baculovirus expression system |
FR2732035B1 (fr) | 1995-03-23 | 1997-05-30 | Agronomique Inst Nat Rech | Procede de regulation de l'expression d'un gene dans un baculovirus, par un site de fixation d'un recepteur de l'acide retinoique, et vecteur pour la mise en oeuvre du dit procede |
NZ308772A (en) | 1995-05-17 | 1999-04-29 | Du Pont | Recombinant baculovirus insecticides |
WO1996040791A1 (en) | 1995-06-07 | 1996-12-19 | Novo Nordisk A/S | Modification of polypeptides |
US5672662A (en) | 1995-07-07 | 1997-09-30 | Shearwater Polymers, Inc. | Poly(ethylene glycol) and related polymers monosubstituted with propionic or butanoic acids and functional derivatives thereof for biotechnical applications |
US5861279A (en) | 1996-01-17 | 1999-01-19 | Schering Corporation | Baculovirus expression system for human interleukin 5 receptor and method of screening for interleukin 5 antagonists |
WO1997026332A1 (en) | 1996-01-17 | 1997-07-24 | Schering Corporation | Baculovirus expression system for human interleukin 5 receptor and method of screening for interleukin 5 antagonists |
US5747639A (en) | 1996-03-06 | 1998-05-05 | Amgen Boulder Inc. | Use of hydrophobic interaction chromatography to purify polyethylene glycols |
TW517067B (en) | 1996-05-31 | 2003-01-11 | Hoffmann La Roche | Interferon conjugates |
ES2273373T3 (es) | 1996-08-02 | 2007-05-01 | Ortho-Mcneil Pharmaceutical, Inc. | Polipeptidos que tienen unido a su extremo n un unico polimero soluble al agua. |
US5980948A (en) | 1996-08-16 | 1999-11-09 | Osteotech, Inc. | Polyetherester copolymers as drug delivery matrices |
US6214966B1 (en) | 1996-09-26 | 2001-04-10 | Shearwater Corporation | Soluble, degradable poly(ethylene glycol) derivatives for controllable release of bound molecules into solution |
AU5465498A (en) | 1996-12-13 | 1998-07-03 | Michael Kunitani | Analysis and separation of platelet-derived growth factor proteins |
EP0921817B1 (en) | 1997-01-29 | 2001-03-28 | PolyMASC Pharmaceuticals plc | Pegylation process |
GB9703406D0 (en) | 1997-02-19 | 1997-04-09 | Chiron Spa | Expression of heterologous proteins |
AU7266898A (en) | 1997-04-30 | 1998-11-24 | Enzon, Inc. | Single-chain antigen-binding proteins capable of glycosylation, production and uses thereof |
US5990237A (en) | 1997-05-21 | 1999-11-23 | Shearwater Polymers, Inc. | Poly(ethylene glycol) aldehyde hydrates and related polymers and applications in modifying amines |
JP4011124B2 (ja) | 1997-06-06 | 2007-11-21 | 協和醗酵工業株式会社 | 化学修飾ポリペプチド |
US5965393A (en) | 1997-07-01 | 1999-10-12 | National Institute Of Immunology | Method for enhancing foreign gene expression in baculovirus expression vector system |
WO1999003887A1 (en) | 1997-07-14 | 1999-01-28 | Bolder Biotechnology, Inc. | Derivatives of growth hormone and related proteins |
GB9715660D0 (en) | 1997-07-25 | 1997-10-01 | Zeneca Ltd | Proteins |
US6410264B1 (en) | 1997-08-05 | 2002-06-25 | Chiron Corporation | Pichia pastoris gene sequences and methods for their use |
DE19735593C2 (de) | 1997-08-15 | 1999-08-26 | Hepavec Ag Fuer Gentherapie | Hüllprotein-modifizierter Baculovirus-Vektor für die Gentherapie |
US6090584A (en) | 1997-08-21 | 2000-07-18 | University Technologies International Inc. | Baculovirus artificial chromosomes and methods of use |
US5989868A (en) | 1997-09-12 | 1999-11-23 | The Board Of Regents Of The University Of Oklahoma | Fusion protein systems designed to increase soluble cytoplasmic expression of heterologous proteins in esherichia coli |
WO1999014318A1 (en) | 1997-09-16 | 1999-03-25 | Board Of Regents, The University Of Texas System | Method for the complete chemical synthesis and assembly of genes and genomes |
US6129912A (en) | 1997-09-26 | 2000-10-10 | Uab Research Foundation | Polyethylene glycol-protein compositions which reduce the antigenic display of red blood cells |
US6201072B1 (en) | 1997-10-03 | 2001-03-13 | Macromed, Inc. | Biodegradable low molecular weight triblock poly(lactide-co- glycolide) polyethylene glycol copolymers having reverse thermal gelation properties |
US6004573A (en) | 1997-10-03 | 1999-12-21 | Macromed, Inc. | Biodegradable low molecular weight triblock poly(lactide-co-glycolide) polyethylene glycol copolymers having reverse thermal gelation properties |
DE19748489A1 (de) | 1997-11-03 | 1999-05-06 | Roche Diagnostics Gmbh | Polyethylenglykol-derivatisierte Biomoleküle und deren Verwendung in heterogenen Nachweisverfahren |
US6448369B1 (en) | 1997-11-06 | 2002-09-10 | Shearwater Corporation | Heterobifunctional poly(ethylene glycol) derivatives and methods for their preparation |
EP0924298A1 (en) | 1997-12-18 | 1999-06-23 | Stichting Instituut voor Dierhouderij en Diergezondheid (ID-DLO) | Protein expression in baculovirus vector expression systems |
US6225060B1 (en) | 1998-03-04 | 2001-05-01 | Onyx Pharmaceuticals, Inc. | Baculovirus expression system and method for high throughput expression of genetic material |
ATE279430T1 (de) | 1998-03-05 | 2004-10-15 | Chiron Corp | Verfahren zur verbesserung der serum halbwertszeit von biologisch aktiven molekülen |
PT1061954E (pt) | 1998-03-12 | 2004-10-29 | Nektar Therapeutics Al Corp | Derivados de poli(etileno glicol) com grupos reactivos proximos |
KR100264953B1 (ko) | 1998-04-03 | 2001-03-02 | 박현우 | 재조합 베큘로바이러스, 이의 제조방법 및 이를 포함하는 미생물 살충제 |
US6168932B1 (en) | 1998-07-13 | 2001-01-02 | Parker Hughes Institute | Recombinant DTctGMCSF fusion toxin in a baculovirus expression vector system |
US6245528B1 (en) | 1998-07-28 | 2001-06-12 | Academia Sinica | Latent baculovirus expression system |
US6368825B1 (en) | 1998-08-10 | 2002-04-09 | Academia Sinica | Baculovirus containing minimal CMV promoter |
EP1107998B1 (en) | 1998-08-28 | 2004-02-04 | Gryphon Sciences | Method for the preparation of polyamide chains of precise length, their conjugates with proteins |
US6420339B1 (en) | 1998-10-14 | 2002-07-16 | Amgen Inc. | Site-directed dual pegylation of proteins for improved bioactivity and biocompatibility |
US6451346B1 (en) | 1998-12-23 | 2002-09-17 | Amgen Inc | Biodegradable pH/thermosensitive hydrogels for sustained delivery of biologically active agents |
US6281211B1 (en) | 1999-02-04 | 2001-08-28 | Euro-Celtique S.A. | Substituted semicarbazides and the use thereof |
US6994986B2 (en) | 1999-03-17 | 2006-02-07 | The Board Of Trustees Of The Leland Stanford University | In vitro synthesis of polypeptides by optimizing amino acid metabolism |
US6342216B1 (en) | 1999-03-17 | 2002-01-29 | The Board Of Regents, The University Of Texas System | Therapy of cancer by insect cells containing recombinant baculovirus encoding genes |
US6337191B1 (en) | 1999-03-22 | 2002-01-08 | The Board Of Trustees Of The Leland Stanford Junior University | Vitro protein synthesis using glycolytic intermediates as an energy source |
CA2370330C (en) | 1999-04-16 | 2009-01-20 | Wm. Marsh Rice University | Biodegradable poly(propylene fumarate) networks cross linked with poly(propylene fumarate)-diacrylate macromers |
US6261805B1 (en) | 1999-07-15 | 2001-07-17 | Boyce Thompson Institute For Plant Research, Inc. | Sialyiation of N-linked glycoproteins in the baculovirus expression vector system |
US6348558B1 (en) | 1999-12-10 | 2002-02-19 | Shearwater Corporation | Hydrolytically degradable polymers and hydrogels made therefrom |
EP1259562B1 (en) | 1999-12-22 | 2006-02-15 | Nektar Therapeutics Al, Corporation | Sterically hindered derivatives of water soluble polymers |
ATE424431T2 (de) | 1999-12-22 | 2009-03-15 | Nektar Therapeutics Al Corp | Verfahren zur herstellung von 1- benzotriazolcarbonatestern von wasserlöslichen polymeren |
US6646110B2 (en) | 2000-01-10 | 2003-11-11 | Maxygen Holdings Ltd. | G-CSF polypeptides and conjugates |
WO2001062827A2 (en) | 2000-02-22 | 2001-08-30 | Shearwater Corporation | N-maleimidyl polymer derivatives |
WO2001062299A2 (en) | 2000-02-28 | 2001-08-30 | Shearwater Corporation | Water-soluble polymer conjugates of artelinic acid |
US6586207B2 (en) | 2000-05-26 | 2003-07-01 | California Institute Of Technology | Overexpression of aminoacyl-tRNA synthetases for efficient production of engineered proteins containing amino acid analogues |
US6436386B1 (en) | 2000-11-14 | 2002-08-20 | Shearwater Corporation | Hydroxyapatite-targeting poly (ethylene glycol) and related polymers |
TW593427B (en) | 2000-12-18 | 2004-06-21 | Nektar Therapeutics Al Corp | Synthesis of high molecular weight non-peptidic polymer derivatives |
TWI246524B (en) | 2001-01-19 | 2006-01-01 | Shearwater Corp | Multi-arm block copolymers as drug delivery vehicles |
WO2002086075A2 (en) * | 2001-04-19 | 2002-10-31 | The Scripps Research Institute | Methods and composition for the production of orthoganal trna-aminoacyltrna synthetase pairs |
US6908963B2 (en) | 2001-10-09 | 2005-06-21 | Nektar Therapeutics Al, Corporation | Thioester polymer derivatives and method of modifying the N-terminus of a polypeptide therewith |
JP4758608B2 (ja) | 2001-11-07 | 2011-08-31 | ネクター セラピューティックス | 分枝ポリマーおよびそれらの結合体 |
ATE445709T1 (de) | 2002-10-16 | 2009-10-15 | Scripps Research Inst | Glycoproteinsynthese |
EP2062976B1 (en) * | 2002-10-16 | 2011-09-28 | The Scripps Research Institute | Site specific incorporation of keto amino acids into proteins |
WO2004039989A1 (ja) * | 2002-10-31 | 2004-05-13 | Riken | 非天然型アミノ酸組み込みタンパク質の発現方法 |
EP2793027B1 (en) | 2003-06-18 | 2019-11-13 | The Scripps Research Institute | Unnatural reactive amino acid genetic code additions |
-
2007
- 2007-09-07 MX MX2009002460A patent/MX2009002460A/es active IP Right Grant
- 2007-09-07 CN CN201610580892.6A patent/CN106190983B/zh active Active
- 2007-09-07 PT PT78379716T patent/PT2061878E/pt unknown
- 2007-09-07 JP JP2009527449A patent/JP5399906B2/ja active Active
- 2007-09-07 SG SG2011064235A patent/SG174781A1/en unknown
- 2007-09-07 DK DK07837971.6T patent/DK2061878T3/da active
- 2007-09-07 WO PCT/US2007/019655 patent/WO2008030613A2/en active Application Filing
- 2007-09-07 CA CA2662753A patent/CA2662753C/en active Active
- 2007-09-07 NZ NZ574721A patent/NZ574721A/en unknown
- 2007-09-07 AU AU2007292892A patent/AU2007292892B9/en active Active
- 2007-09-07 CN CN200780033108.9A patent/CN101541955B/zh active Active
- 2007-09-07 KR KR20097005333A patent/KR20090051227A/ko not_active Application Discontinuation
- 2007-09-07 EP EP07837971.6A patent/EP2061878B1/en active Active
- 2007-09-07 ES ES07837971.6T patent/ES2457527T3/es active Active
- 2007-09-07 US US12/440,015 patent/US9133495B2/en active Active
-
2009
- 2009-02-05 IL IL196912A patent/IL196912A/en active IP Right Grant
- 2009-11-05 HK HK09110262.1A patent/HK1132528A1/xx unknown
-
2015
- 2015-08-06 US US14/820,318 patent/US9868972B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2061878B1 (en) | 2014-01-08 |
JP2010502222A (ja) | 2010-01-28 |
US9133495B2 (en) | 2015-09-15 |
KR20090051227A (ko) | 2009-05-21 |
CN106190983B (zh) | 2019-05-28 |
CN106190983A (zh) | 2016-12-07 |
CN101541955B (zh) | 2016-09-28 |
AU2007292892A1 (en) | 2008-03-13 |
WO2008030613A2 (en) | 2008-03-13 |
ES2457527T3 (es) | 2014-04-28 |
SG174781A1 (en) | 2011-10-28 |
EP2061878A4 (en) | 2009-10-28 |
CA2662753A1 (en) | 2008-03-13 |
WO2008030613A3 (en) | 2008-11-20 |
JP5399906B2 (ja) | 2014-01-29 |
IL196912A (en) | 2013-03-24 |
NZ574721A (en) | 2012-02-24 |
HK1132528A1 (en) | 2010-02-26 |
US9868972B2 (en) | 2018-01-16 |
DK2061878T3 (da) | 2014-04-07 |
IL196912A0 (en) | 2011-08-01 |
US20170096696A1 (en) | 2017-04-06 |
PT2061878E (pt) | 2014-04-22 |
CN101541955A (zh) | 2009-09-23 |
EP2061878A2 (en) | 2009-05-27 |
AU2007292892B9 (en) | 2013-02-28 |
CA2662753C (en) | 2016-02-23 |
AU2007292892B2 (en) | 2012-08-02 |
US20100159586A1 (en) | 2010-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2007292891B2 (en) | Site specific incorporation of non-natural amino acids by vertebrate cells | |
JP5932117B2 (ja) | 脊椎動物細胞内におけるサプレッサーtrnaの転写 | |
US8815542B2 (en) | Unnatural reactive amino acid genetic code additions | |
US8114628B2 (en) | Expanding the eukaryotic genetic code | |
US9868972B2 (en) | Hybrid suppressor tRNA for vertebrate cells |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration |