Nothing Special   »   [go: up one dir, main page]

ES2644992T3 - Reacciones de transaminasa - Google Patents

Reacciones de transaminasa Download PDF

Info

Publication number
ES2644992T3
ES2644992T3 ES10797544.3T ES10797544T ES2644992T3 ES 2644992 T3 ES2644992 T3 ES 2644992T3 ES 10797544 T ES10797544 T ES 10797544T ES 2644992 T3 ES2644992 T3 ES 2644992T3
Authority
ES
Spain
Prior art keywords
residue
polar
aliphatic
aromatic
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10797544.3T
Other languages
English (en)
Inventor
Gregory Hughes
Paul N. Devine
Fred J. Fleitz
Brendon T. GRAU
John Limanto
Christopher Savile
Emily Mundorff
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Application granted granted Critical
Publication of ES2644992T3 publication Critical patent/ES2644992T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/182Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
Reacciones de transaminasa Descripcion
1. CAMPO TECNICO
La presente descripcion se refiere a biocatalizadores y metodos de uso de los biocatalizadores de las transaminasas.
3. ANTECEDENTES
Aminotransferasas, tambien conocidas como transaminasas (EC 2.6.1) catalizan la transferencia de un grupo amino, un par de electrones, y un proton de una amina primaria de un sustrato donante amino al grupo carbonilo de una molecula aceptora de amino.
Una reaccion de transaminasa general se muestra en la Reaccion I, a continuacion. En esta reaccion, un aceptor amino (ceto, o cetona) que es el precursor del producto de aminoacidos deseado, se hace reaccionar con un donante de amino. La enzima de transaminasa intercambia el grupo amino del donante amino con el grupo ceto del aceptor amino. Por consiguiente, la reaccion resulta en el producto de amina quiral deseado y un nuevo compuesto amino aceptor (ceto), que es un subproducto.
imagen1
Una transaminacion estereoselectiva ejemplar por una transaminasa se demuestra por la actividad de transaminasa de Arthrobacter sp. KNK168 en 3,4-dimetoxifenilacetona (vease, por ejemplo, Iwasaki et al, 2006, Appl Microbiol Biotechnol 69: 499-505; y la patente US 7.169.592, cada uno de los cuales se incorpora aqu por referencia en este documento). Por lo tanto, las enzimas de transaminasas tienen un potencial uso industrial para la smtesis estereoselectiva de aminas quirales opticamente puras y el enriquecimiento enantiomerico de aminas quirales y aminoacidos (Shin et al, 2001, Biosci Biotechnol Biochem 65: 1782-1788; Iwasaki et al., 2003, Biotech Lett 25: 18431846; Iwasaki et al, 2004, Appl Microb Biotech 69: 499-505, Yun et al, 2004, Appl Environ Microbiol 70: 2529-2534.; y Hwang et al, 2004, Enzyme Microbiol Technol 34: 429-426). Aminas quirales tienen un papel importante en las industrias farmaceutica, agroqmmica y qmmica. Aminas quirales se utilizan frecuentemente como productos intermedios o sintonas para la preparacion de diversos productos farmaceuticos, tales como derivados de la cefalosporina o pirrolidina. Ejemplos de la utilizacion de las aminotransferasas para generar compuestos qmmicos utiles incluyen: preparacion de compuestos intermedios y precursores de pregabalina (por ejemplo, el documento WO 2008/127646); la smtesis estereoespedfica y el enriquecimiento enantiomerico de ©-aminoacidos (por ejemplo, el documento WO 2005/005633); el enriquecimiento enantiomerico de aminas (por ejemplo, la Patente de Estados Unidos N° 4.950.606, Patente de Estados Unidos N° 5.300.437, y la Patente de Estados Unidos N° 5.169.780); y la produccion de acidos y derivados de amino (por ejemplo, la Patente de Estados Unidos N° 5.316.943, Patente de Estados Unidos N° 4.518.692, Patente de Estados Unidos N° 4.826.766, Patente de Estados Unidos N° 6.197.558, y la Patente de Estados Unidos N° 4.600.692). Por lo tanto, las transaminasas son utiles para el enriquecimiento de los enantiomeros y la smtesis estereoselectiva de aminas quirales. US2009/0148899 da a conocer un metodo para la produccion de un compuesto de amina opticamente activo. El metodo se caracteriza mediante la conversion de un compuesto de cetona a un compuesto de amina opticamente activo correspondiente mediante el uso de una transferasa de amino, una reductasa de acido a-ceto y una enzima, teniendo cada uno una propiedad espedfica en una sola de sistema de reaccion, en el que un atomo de carbono al que un grupo amino esta unido en el compuesto de amina opticamente activo es un punto asimetrico.
4. RESUMEN
La presente invencion se define por las reivindicaciones adjuntas. Cualquier objeto identificado en la solicitud como "realizacion", que supera el alcance de la invencion tal como representado por las reivindicaciones no forma parte de la invencion reivindicada pero solo sirve como informacion de antecedentes para entender mejor la invencion.
La presente divulgacion proporciona procedimientos para la conversion biocatalttica de sustratos proquirales ceto a aminas quirales en presencia de un donante de grupo amino, y biocatalizadores de transaminasas y los correspondientes polinucleotidos para uso en los procesos. En un aspecto, la presente invencion comprenden un procedimiento para preparar un producto de amina de formula estructural (I):
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen2
teniendo la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *; en exceso enantiomerico sobre el enantiomero opuesto, en el que
R1 es arilo o heteroarilo opcionalmente sustituido; y
R2 es un C1-C6 alquilo opcionalmente sustituido, -R3C(O)R4, o -R3OC(O)R5;
en la que R3 es un C1-C4 alquilo opcionalmente sustituido; y R4 es H, un C1-C4 alquilo opcionalmente sustituido, NR6R7, o OR8, donde R5, R6, R7 y R8 son independientemente H o C1-C4 alquilo, procedimiento que comprende poner en contacto un sustrato de cetona de formula estructural (II):
0
imagen3
con un polipeptido de transaminasa en presencia de un donante de amino en condiciones de reaccion adecuadas para la conversion del sustrato de cetona en el producto amina. En algunas realizaciones, el polipeptido de transaminasa tiene al menos 80% 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia de aminoacidos con la SEQ ID NO: 4 y es capaz de convertir el sustrato de cetona al producto de amina a una velocidad que esta mejorada en comparacion con la transaminasa de la SEQ ID NO: 2.
En algunas realizaciones, el polipeptido de transaminasa tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia de aminoacidos con la SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, o 102 y es capaz de convertir el sustrato de cetona al producto de amina a una tasa que se mejoro en comparacion con la transaminasa de la SEQ ID NO: 2. Las realizaciones espedficas de las transaminasas modificadas para su uso en los procesos se proporcionan adicionalmente en la descripcion detallada.
En algunas realizaciones, la transaminasa modificada tiene al menos 5%, 10%, 20%, 30%, 40%, 50% o mas actividad de la SEQ ID NO: 74.
En cualquiera de las realizaciones de los procesos descritos en este documento, el proceso puede llevarse a cabo en el que el polipeptido de transaminasa es capaz de convertir el sustrato de cetoamida de sitagliptina a la sitagliptina a una velocidad que esta mejorada en comparacion con la transaminasa de la SEQ ID NO: 2, y tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas aminoacidos de identidad de secuencia con la SEQ ID NO: 4.
En algunas realizaciones, el producto de amina se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones de los procesos descritos anteriormente, el producto de amina se produce en al menos el 99% de exceso enantiomerico.
En algunas realizaciones del proceso, R1 es un fenilo opcionalmente sustituido. En algunas realizaciones, R1 es un piridinilo opcionalmente sustituido. En algunas realizaciones, las sustituciones en el arilo o heteroarilo se seleccionan de entre C1-C4 alquilo, -OR'-SR', -NR'R '', -NO2, -NO, -CN, -CF3, halogeno (por ejemplo, -F, -Cl, -Br y -I), -C(O)R'-C(O)OR', -C(O)NR', -S(O)2R', -S(O)2NR'R", donde cada R' y R" se seleccionan independientemente del grupo que consiste en hidrogeno y (C1-C4) alquilo. En algunas realizaciones R2 es metilo o sustituido con halo metilo. En algunas realizaciones, R2 es CF2H o CF3.
En algunas realizaciones, la sustitucion en C1-C6 alquilo y R3 de grupo R2 se seleccionan de halogeno,
5
10
15
20
25
30
35
40
45
50
55
60
65
NR5R6 o OR8, Donde R5 y R6 se definen anteriormente y R8 es H o C1-C4 alquilo. En algunas realizaciones, los compuestos de formula (I) producidos en el proceso descrito anteriormente son compuestos sustancialmente quiralmente puros. En ciertas realizaciones, los compuestos de formula (I) producidos en el proceso descrito anteriormente son quiralmente puros.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen4
en la que R9 es H, Cl, Br, F, CH3, CF3, NH2, NO2, CN, SCN, o OCH3 y R2 es un C1-C6 alquilo opcionalmente sustituido, y el sustrato de cetona de formula (II) es:
imagen5
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen6
en la que R9 es H, Cl, Br, F, CH3, CF3, NH2, NO2, CN, SCN, o OCH3, Y el sustrato de cetona de formula (II) es:
imagen7
En algunas realizaciones R9 es Br, CH3, o CF3. En algunas realizaciones, R9 esta en la posicion para en el anillo fenilo.
En algunas realizaciones del proceso, el producto de amina (S)-1-(4-bromofenilo)-2,2,2-trifluoroetanamina esta preparado en exceso enantiomerico a partir de 1-(4-bromofenilo)-2,2,2-trifluoro:
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen8
En algunas realizaciones del proceso, el producto de amina (S)-2,2,2-trifluoro-1-p-toliletanamina se prepara en exceso enantiomerico de 2,2,2-trifluoro-1-p-toliletanona:
imagen9
En algunas realizaciones del proceso, el producto de amina (S)-2,2,2-trifluoro-1-(4- (trifluorometilo)fenilo)etanamina se prepara en exceso enantiomerico de 2,2,2-trifluoro-1-(4- (trifluorometilo)fenilo) etanona:
imagen10
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen11
y el sustrato de cetona de formula (II) es:
imagen12
en la que R7 es C1-C4 alquilo sustituido opcionalmente, y R10 es R9 definido anteriormente. En algunas realizaciones, R10 es H o F. En algunas realizaciones, R7 es C1-C4 alquilo.
5
10
15
20
25
30
35
40
45
50
55
60
65
En algunas realizaciones del proceso, el producto de amina (R)-etilo-3-amino-3-(piridina-2-ilo)propanoato de metilo esta preparado en exceso enantiomerico en acetato de 3-oxo-3-(piridina-2- ilo)propanoato de metilo:
imagen13
imagen14
en la que R11 es halogeno, OH, -C(O)R4, -OC(O)R5O NR6R7, En el que R4, R5, R6, R7Y R10 se ha definido
anteriormente, y el sustrato de cetona de formula (II) es:
imagen15
En algunas realizaciones del proceso, el producto de amina (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina esta preparado en exceso enantiomerico de 4-cloro-1-(2-fluorofenilo)butan-1-ona:
imagen16
En algunas realizaciones, la divulgacion proporciona un procedimiento para preparar el compuesto de formula (III):
imagen17
5
10
15
20
25
30
35
40
45
50
55
60
65
teniendo la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *, en exceso enantiomerico sobre el enantiomero opuesto, en el que R10 es como se define anteriormente, cuyo procedimiento comprende:
(a) poner en contacto un sustrato de cetona de formula:
imagen18
en la que R11 y R10 son como se definen anteriormente, con un polipeptido de transaminasa se describe en este documento en presencia de un donante de amino en condiciones de reaccion adecuadas para la conversion del sustrato de cetona a un producto de amina de formula:
imagen19
y
(b) ciclar el producto de amina en condiciones adecuadas para formar el compuesto de formula (III).
En algunas realizaciones, la divulgacion proporciona un procedimiento para preparar (R)-2-(2- fluorofenilo)pirrolidina:
imagen20
cuyo procedimiento comprende la conversion de sustrato de cetona 4-cloro-1-(2-fluorofenilo)butan-1-ona para el producto de amina (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina en exceso enantiomerico:
imagen21
5
10
15
20
25
30
35
40
45
50
55
60
y ciclar el (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina para formar (R)-2-(2-fluorofenilo)pirrolidina:
imagen22
en exceso enantiomerico.
Se describen en la descripcion detallada varias transaminasas disenadas que se pueden utilizar para llevar a cabo los procesos. En algunas realizaciones, el proceso puede utilizar las transaminasas modificadas representadas por SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, o 102.
Cualquier donante de amino adecuado se puede utilizar para la reaccion de transaminacion. En algunas realizaciones, el donante de grupo amino se selecciona de isopropilamina, alanina, acido 3-aminobutmco, o metilbencilamina. Un donante de grupo amino preferido es isopropilamina.
Como se ha senalado en el presente documento, los procesos descritos en el presente documento se llevan a cabo en condiciones de reaccion adecuadas para la conversion del sustrato de cetona al producto amina quiral correspondiente en exceso enantiomerico. En algunas realizaciones, la condicion de reaccion comprende una temperatura de 20°C a 65°C. En algunas realizaciones, la condicion de reaccion comprende una temperatura de 40°C a 65°C. En algunas realizaciones, la condicion de reaccion comprende una temperatura de 50°C a 65°C.
En algunas realizaciones, las condiciones de reaccion bajo las cuales los procesos se llevan a cabo comprenden un pH de aproximadamente 7,0 a aproximadamente 11,0. En algunas realizaciones, la condicion de reaccion comprende un pH de aproximadamente 7,0 a aproximadamente 9,0. En algunas realizaciones, la condicion de reaccion para el proceso es un pH de aproximadamente 8,5.
Diversos disolventes organicos se pueden utilizar en el proceso para facilitar la reaccion de la enzima y para colocar el sustrato y/o producto en solucion. En algunas realizaciones del procedimiento, el disolvente organico comprende un disolvente polar, tal como metanol o dimetilsulfoxido (DMSO). En algunas realizaciones, el disolvente organico es DMSO, que puede estar presente desde aproximadamente 10% a aproximadamente 40% volumen/volumen (v/v). En algunas realizaciones, el DMSO esta presente en aproximadamente 40% v/v.
5. DESCRIPCION DETALLADA
La presente divulgacion proporciona procedimientos para la conversion de ciertos sustratos ceto proquiral a productos de amina quiral usando biocatalizadores polipeptido de transaminasa de ingeniena estereoselectivas. Las realizaciones de diversos procesos y las transaminasas se describen en la presente memoria.
Tal como se utiliza en esta especificacion y las reivindicaciones adjuntas, las formas singulares "un", "una", "el" y "ella" incluyen referentes plurales a menos que el contexto indique claramente lo contrario. Asf, por ejemplo, la referencia a "una protema" incluye mas de una protema, y la referencia a "un compuesto" se refiere a mas de un compuesto.
Por otra parte, el uso de "o" significa "y/o" a menos que se indique lo contrario. Del mismo modo, "comprender", "comprende", "comprendiendo" "incluyen", "incluye" y "que incluye" son intercambiables y no pretenden ser limitantes.
Es de entenderse ademas que, cuando las descripciones de diversas realizaciones usan el termino "que comprende", los expertos en la tecnica entenderan que en algunos casos espedficos, una forma de realizacion puede ser descrita alternativamente usando el lenguaje "consiste esencialmente en" o "que consiste en".
5.1 Abreviaturas y definiciones
Para los fines de las descripciones del presente documento, las abreviaturas usadas para los aminoacidos codificados geneticamente son convencionales y son como sigue:
5
10
15
20
25
30
35
40
45
50
55
60
65
Aminoacido
Abreviatura de tres letras Abreviatura de una letra
Alanina
Ala A
Arginina
Arg R
Asparagina
Asn N
Aspartato
Asp D
Cistema
Cys C
Glutamato
Glu E
Glutamina
Gln Q
Glicina
Gly G
Histidina
His H
Isoleucina
Ile I
Leucina
Leu L
Lisina
Lys K
Metionina
Met M
Fenilalanina
Phe F
Prolina
Pro P
Serina
Ser S
Treonina
Thr T
Triptofano
Trp W
Tirosina
Tyr Y
Valina
Val V
Cuando se usan las abreviaturas de tres letras, a menos que esten precedidas espedficamente por una "L" o una "D" o claras por el contexto en el que se utiliza la abreviatura, el aminoacido puede estar en la configuracion L o D sobre el (-carbono (C(). Por ejemplo, mientras que "Ala" designa alanina sin especificar la configuracion sobre el (-carbono, "D-Ala" y "L-Ala" designan D-alanina y L-alanina, respectivamente. Cuando se usan las abreviaturas de una letra, las letras mayusculas designan aminoacidos en la configuracion L sobre (-carbono y las letras minusculas designan los aminoacidos en la configuracion D sobre el (-carbono. Por ejemplo, "A" designa L-alanina y "a" designa D-alanina. Cuando las secuencias peptidicas se presentan como una serie de abreviaturas de una letra o de tres letras (o mezclas de las mismas), las secuencias se presentan en la direccion NDC de acuerdo con la convencion comun.
5.2 Definiciones
Los terminos tecnicos y cientificos usados en las descripciones en el presente documento tendran los significados comunmente entendidos por un experto normal en la tecnica, salvo que se defina espedficamente lo contrario. En consecuencia, los siguientes terminos pretenden tener los siguientes significados.
"Aminotransferasa" y "transaminasa" se usan indistintamente en este documento para referirse a un polipeptido que tiene una capacidad enzimatica de transferencia de un grupo amino (NH2) y un atomo de hidrogeno a partir de una amina primaria (2) a un compuesto (1) de carbonilo aceptor (ceto), que convierte el donante de amina en su correspondiente compuesto (4) de carbonilo (ceto) y la conversion del aceptor en su correspondiente amina primaria (3).
imagen23
"Protema", "polipeptido" y "peptido" se usan indistintamente en este documento para denotar un polfmero de al menos dos aminoacidos unidos covalentemente mediante un enlace amida, independientemente de la longitud o modificacion postraduccional (por ejemplo, glicosilacion, fosforilacion, lipidacion, miristilacion, ubiquitinacion, etc.). Se incluyen dentro de esta definicion son D- y L-aminoacidos, y mezclas de D- y L-aminoacidos.
"Donante de grupo de amino" se refiere a un compuesto amino que es capaz de donar un grupo de amino en un compuesto aceptor de carbonilo (es decir, un aceptor de grupo de amino), convirtiendose asf en un
5
10
15
20
25
30
35
40
45
50
55
60
65
subproducto de carbonilo. Donantes de grupo de amino son moleculas de formula general:
nh2
imagen24
en el que cada uno de RC, RD, cuando se toman independientemente, es un grupo alquilo, un grupo alquilarilo, o un grupo arilo que esta no sustituido o sustituido con uno o mas grupos enzimaticamente aceptables. RC puede ser el mismo o diferente de RD en estructura o quiralidad. Los grupos RC y RD, tornados juntos, pueden formar un anillo que esta no sustituido, sustituido o fusionado con otros anillos. donantes de grupos de amino tipicos que se pueden usar con la invencion incluyen aminoacidos quirales y aquirales, y aminas quirales y aquirales.
"Amina quiral" se refiere a aminas de formula general Rx-CH(NH2)-RY en la que Rx y Ry son no identicos y se emplea en el presente documento en su sentido mas amplio, incluyendo una amplia variedad de compuestos alifaticos y alidclicos de diferente, y tipos mixtos, funcionales, que se caracterizan por la presencia de un grupo de amino primario unido a un atomo de carbono secundario que, ademas de un atomo de hidrogeno, lleva ya sea (i) un grupo divalente que forma una estructura dclica quiral, o (ii) dos sustituyentes (distintos de hidrogeno) que difieren entre sf en estructura o quiralidad.
"Sustrato" tal como se utiliza aqrn se refiere a un aceptor de grupo de amino, tal como una cetona, que acepta el grupo amino de un donante de grupo amino en una reaccion mediada por una transaminasa. En el contexto de la presente descripcion, sustrato para la transaminasa incluye, entre otros, el compuesto de formula (II), como se describe adicionalmente en este documento.
"Aceptor de amino" y "aceptor de amina", "sustrato ceto", "ceto" y "cetona" se usan indistintamente en este documento para referirse a un compuesto de carbonilo (ceto, o cetona) que acepta un grupo amino de una amina de donantes. Aceptores de aminoacidos son moleculas de la formula general,
imagen25
en el que cada uno de RA y RB en algunas realizaciones, cuando se toman independientemente, puede ser un grupo alquilo, un grupo alquilarilo, o un grupo arilo que esta no sustituido o sustituido con uno o mas grupos enzimaticamente aceptables. RA puede ser el mismo o diferente de RB en estructura o quiralidad. RA y RB, tomados juntos, pueden formar un anillo que esta no sustituido, sustituido o fusionado con otros anillos. Los compuestos espedficos de aceptor de amino se describen adicionalmente en la descripcion detallada.
"Subproducto de carbonilo" y "subproducto ceto" se refieren al compuesto de carbonilo formado a partir del donante de grupo amino cuando el grupo amino en el donante de grupo amino se transfiere al aceptor del grupo amino en una reaccion de transaminacion. El subproducto de carbonilo tiene la estructura general de la formula:
imagen26
en la que RC y RD se definen anteriormente para el donante de grupo amino.
"Piridoxal-fosfato", "PLP", "piridoxal-5'-fosfato", "PEP", y "P5P" se usan indistintamente en este documento para referirse al compuesto que actua como una coenzima en reacciones de transaminasas. En algunas realizaciones, el fosfato de piridoxal se define por la estructura de 1-(4'-formilo-3'-hidroxi-2'-metilo-5'-piridilo) acido metoxifosfonico, numero CAS [54-47-7]. Piridoxal-5'-fosfato se produce in vivo por la fosforilacion y la oxidacion de
5
10
15
20
25
30
35
40
45
50
55
60
65
piridoxal (tambien conocida como piridoxina B6 o vitamina). En las reacciones de transaminacion que utilizan enzimas transaminasas, el grupo amino de la donante de grupo amino se transfiere a la coenzima para producir un subproducto ceto, mientras que piridoxal-5'-fosfato se convierte a fosfato de piridoxamina. Piridoxal-5'-fosfato se regenera mediante la reaccion con un compuesto ceto diferente (el grupo aceptor amino). La transferencia del grupo amino de fosfato de piridoxamina al aceptor amino produce una amina quiral y regenera la coenzima. El piridoxal-5'- fosfato de la presente invencion puede ser sustituido por otros miembros de la familia de vitamina Be, incluyendo, entre otros, piridoxal (PL), piridoxamina (PM), y sus homologos fosforilados; fosfato de piridoxina (PNP), y fosfato de piridoxamina (PMP).
"Secuencia codificante" se refiere a aquella porcion de un acido nucleico (por ejemplo, un gen) que codifica una secuencia de aminoacidos de una protema.
"De origen natural" o "de tipo silvestre" se refiere a la forma encontrada en la naturaleza. Por ejemplo, una secuencia de polipeptido o polinucleotido de origen natural o de tipo silvestre es una secuencia presente en un organismo que puede aislarse de una fuente en la naturaleza y que no ha sido modificado intencionadamente por manipulacion humana.
"Recombinante" cuando se usa con referencia a, por ejemplo, una celula, acido nucleico, o polipeptido, se refiere a un material, o un material correspondiente a la forma natural o nativa del material, que se ha modificado de una manera que no existina de otro modo en la naturaleza, o es identica a la misma sino que se produce o se deriva a partir de materiales sinteticos y/o por la manipulacion usando tecnicas recombinantes. Los ejemplos no limitantes incluyen, entre otros, las celulas recombinantes que expresan genes que no se encuentran dentro de la forma nativa (no recombinante) de la celula o expresan genes nativos que se expresan de otro modo a un nivel diferente.
"Porcentaje de identidad de secuencia", "porcentaje de identidad", y "por ciento identico" se utilizan aqrn para referirse a comparaciones entre secuencias de polinucleotidos o secuencias de polipeptidos, y se determinan por comparacion de dos secuencias optimamente alineadas sobre una ventana de comparacion, donde la porcion de la secuencia de polinucleotido o polipeptido en la ventana de comparacion puede comprender adiciones o deleciones (es decir, huecos) en comparacion a la secuencia de referencia para la alineacion optima de las dos secuencias. El porcentaje se calcula determinando el numero de posiciones en las que la base o el residuo de aminoacido de acido nucleico identica en ambas secuencias o una base de acido o el residuo de aminoacido nucleico esta alineado con un hueco para producir el numero de posiciones coincidentes, dividiendo el numero de posiciones coincidentes por el numero total de posiciones en la ventana de comparacion y multiplicando el resultado por 100 para dar el porcentaje de identidad de secuencia. La determinacion de la alineacion optima y la identidad de secuencia en porcentaje se realiza utilizando algoritmos de BLAST y BLAST 2.0 (vease, por ejemplo, Altschul et al, 1990, J. Mol Biol. 215: 403-410 y Altschul et al, 1977, Nucleic Acids Res. 3389-3402). El software para realizar analisis BLAST esta disponible publicamente a traves del Centro Nacional de Informacion pagina web Biotechnology.
Brevemente, el analisis BLAST implica primero identificar pares de secuencias de alta puntuacion (HSP) identificando palabras cortas de longitud W en la secuencia de problema, que coinciden o satisfacen alguna puntuacion umbral de valor positivo T cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T se denomina como el umbral de puntuacion de palabra vecina (Altschul et al, supra). Estos exitos iniciales de palabras vecinas actuan como semillas para iniciar busquedas para encontrar HSP mas largos que las contengan. Los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia en cuando pueda incrementarse la puntuacion de alineacion acumulada. Las puntuaciones acumulativas se calculan usando, para secuencias de nucleotidos, los parametros M (puntuacion de recompensa para un par de residuos coincidentes; siempre >0) y N (puntuacion de penalizacion para residuos no coincidentes; siempre <0). Para secuencias de aminoacidos, una matriz de puntuacion se utiliza para calcular la puntuacion acumulativa. la extension de los aciertos de palabras en cada direccion se detiene cuando: la puntuacion de alineamiento acumulativa cae en la cantidad X desde su valor maximo alcanzado; la puntuacion acumulativa llega a cero o menos, debido a la acumulacion de una o mas alineaciones de residuos de puntuacion negativa; o el final de cualquier secuencia que se alcanza. Los parametros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineacion. El programa BLASTN (para secuencias de nucleotidos) usa por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4, y una comparacion de ambas cadenas. Para secuencias de aminoacidos, el programa BLASTP usa por defecto una longitud de palabra (W) de 3, una expectativa (E) de 10, y la matriz de puntuacion BLOSUM62 (vease Henikoff y Henikoff, 1989, Proc Natl Acad Sci USA 89: 10915).
Otros numerosos algoritmos estan disponibles que funcionan de forma similar a la explosion en proporcionar el porcentaje de identidad de dos secuencias. La alineacion optima de secuencias para la comparacion puede llevarse a cabo, por ejemplo, mediante el algoritmo de homologfa local de Smith y Waterman, 1981, Adv. Appl. Mates. 2: 482, mediante el algoritmo de alineacion de homologfa de Needleman y Wunsch, 1970, J. Mol. Biol. 48: 443, mediante la busqueda del metodo de similitud de Pearson y Lipman, 1988, Proc. Natl. Acad. Sci. usa 85: 2444, mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA, y TFASTA en el paquete de software GCG Wisconsin), o mediante inspeccion visual (vease en general, Current Protocols in Molecular Biology, FM Ausubel et al, eds.., Current Protocols, una empresa conjunta entre Greene Publishing
5
10
15
20
25
30
35
40
45
50
55
60
65
Associates, Inc. y John Wiley & Sons, Inc., 1995 (Suplemento) (Ausubel)). Ademas, la determinacion de la alineacion de secuencias y de identidad de secuencia por ciento puede emplear los programas BESTFIT o GAP en el paquete de software GCG Wisconsin (Accelrys, Madison WI), utilizando parametros proporcionados por defecto.
"Secuencia de referenda" se refiere a una secuencia definida a la que se compara una secuencia alterada. Una secuencia de referencia puede ser un subconjunto de una secuencia mayor, por ejemplo, un segmento de un gen de longitud completa o secuencia de polipeptido. Generalmente, una secuencia de referencia es de al menos 20 residuos de nucleotidos o aminoacidos de longitud, al menos 25 residuos de longitud, al menos 50 residuos de longitud, o la longitud total del acido nucleico o polipeptido. Dado que dos polinucleotidos o polipeptidos pueden cada uno (1) comprender una secuencia (es decir, una porcion de la secuencia completa) que es similar entre las dos secuencias, y (2) puede comprender ademas una secuencia que es divergente entre las dos secuencias, las comparaciones de secuencias entre dos (o mas) polinucleotidos o polipeptidos normalmente se llevan a cabo mediante la comparacion de secuencias de los dos polinucleotidos sobre una ventana de comparacion para identificar y comparar regiones locales de similitud de secuencia.
El termino "secuencia de referencia" no pretende estar limitado a las secuencias de tipo salvaje, y puede incluir secuencias alteradas o de ingeniena genetica. Por ejemplo, en algunas realizaciones, una "secuencia de referencia" puede ser una secuencia de aminoacidos previamente alterados geneticamente. Por ejemplo, una "secuencia de referencia en base a SEQ ID NO: 2 que tiene un residuo de glicina en posicion X284" se refiere a una secuencia de referencia correspondiente a la SEQ ID NO: 2 con un residuo de glicina en la X284 (la version no alterada de la SEQ ID NO: 2 tiene alanina en la X284).
"Ventana de comparacion" se refiere a un segmento conceptual de al menos aproximadamente 20 posiciones de nucleotidos contiguos o residuos de aminoacidos en que una secuencia puede compararse a una secuencia de referencia de al menos 20 nucleotidos contiguos o aminoacidos y en el que la porcion de la secuencia en la ventana de comparacion puede comprender adiciones o deleciones (es decir, huecos) de 20 por ciento o menos en comparacion con la secuencia de referencia (que no comprende adiciones o deleciones) para alineacion optima de las dos secuencias. La ventana de comparacion puede ser mas larga de 20 residuos contiguos, e incluye, opcionalmente 30, 40, 50, 100, o mas ventanas.
"Identidad sustancial" se refiere a una secuencia de polinucleotido o polipeptido que tiene al menos 80 por ciento de identidad de secuencia, al menos el 85 por ciento de identidad de secuencia, al menos 89 por ciento de identidad de secuencia, al menos el 95 por ciento de identidad de secuencia, e incluso al menos 99 por ciento de identidad de secuencia como en comparacion con una secuencia de referencia sobre una ventana de comparacion de al menos 20 posiciones de residuos, con frecuencia mas de una ventana de al menos 30-50 residuos, en el que el porcentaje de identidad de secuencia se calcula comparando la secuencia de referencia a una secuencia que incluye deleciones o adiciones que suman 20 por ciento o menos de la secuencia de referencia sobre la ventana de comparacion. En realizaciones espedficas aplicadas a polipeptidos, el termino "identidad sustancial" significa que dos secuencias polipeptfdicas, cuando se alinean optimamente, tales como mediante los programas GAP o BESTFIT usando pesos de hueco por defecto, comparten al menos 80 por ciento de identidad de secuencia, preferiblemente secuencia de identidad de al menos 89 por ciento, la identidad de secuencia de al menos 95 por ciento o mas (por ejemplo, identidad de secuencia de 99 por ciento). Preferiblemente, las posiciones de residuos que no son identicas difieren por sustituciones de aminoacidos conservativas.
"Correspondientes a", "referencia a" o "en relacion con" cuando se usan en el contexto de la numeracion de una secuencia de aminoacidos o de polinucleotidos dada se refiere a la numeracion de los residuos de una secuencia de referencia especificada cuando la secuencia de aminoacido dado o polinucleotido se compara con la secuencia de referencia. En otras palabras, la posicion de numero de residuo o residuo de un polfmero dado se designa con respecto a la secuencia de referencia en lugar de por la posicion numerica real del residuo dentro de aminoacidos dados o secuencia de polinucleotidos. Por ejemplo, una secuencia de aminoacidos dada, tal como la de una transaminasa modificada, se puede alinear a una secuencia de referencia mediante la introduccion de huecos para optimizar coincidencias de residuos entre las dos secuencias. En estos casos, aunque los huecos estan presentes, la numeracion del residuo en la secuencia de aminoacidos o de polinucleotidos dada se hace con respecto a la secuencia de referencia a la que se ha alineado.
"Estereoselectividad" se refiere a la formacion preferencial en una reaccion qrnmica o enzimatica de un estereoisomero sobre otro. La estereoselectividad puede ser parcial, donde la formacion de un estereoisomero es favorecido sobre el otro, o puede ser completa donde se forma un solo estereoisomero. Cuando los estereoisomeros son enantiomeros, la estereoselectividad se conoce como enantioselectividad, la fraccion (tfpicamente como un porcentaje) de un enantiomero en la suma de ambos. Se informa de modo comunmente alternativo en la tecnica (tfpicamente como un porcentaje) como el exceso enantiomerico (e.e.) calculado de acuerdo con la formula [enantiomero principal - enantiomero menor]/[enantiomero principal + enantiomero menor]. Cuando los estereoisomeros son diastereoisomeros, la estereoselectividad se conoce como diastereoselectividad, la fraccion (tfpicamente reportada como un porcentaje) de un diastereomero en una mezcla de dos diastereomeros, comunmente alternativamente informados como el exceso diastereomerico (d.e.). El exceso enantiomerico y el exceso diastereomerico son tipos de exceso estereomerico.
5
10
15
20
25
30
35
40
45
50
55
60
65
"Altamente estereoselectivo" se refiere a una reaccion qmmica o enzimatica que es capaz de convertir un sustrato (por ejemplo, la formula (II)) a su producto correspondiente (por ejemplo, la formula (I)) con al menos aproximadamente 85% de exceso de estereoisomero.
"Propiedad enzimatica mejorada" se refiere a cualquier propiedad enzimatica mejorada o mas deseable para un proposito particular en comparacion con la propiedad que se encuentra en una enzima de referencia. Para los polipeptidos de transaminasa modificada descritos en el presente documento, la comparacion se hace en general a la enzima de transaminasa de tipo salvaje, aunque en algunas formas de realizacion, la transaminasa de referencia puede ser otra transaminasa modificada mejorada. Propiedades enzimaticas para las que la mejora se puede hacer incluyen, pero no se limitan a, la actividad enzimatica (que puede ser expresada en terminos de porcentaje de conversion del sustrato en un penodo de tiempo), la estabilidad termica, la estabilidad del disolvente, el perfil de actividad de pH, requisitos de coenzima, la refractariedad a inhibidores (por ejemplo, la inhibicion del producto), estereoespecificidad y estereoselectividad (incluyendo enantioselectividad).
"Actividad enzimatica incrementada" o "actividad incrementada" se refiere a una propiedad mejorada de una enzima de ingeniena, que puede ser representada por un aumento en la actividad espedfica (por ejemplo, producto producido/hora/peso de protema) o un aumento en el porcentaje de conversion del sustrato al producto (por ejemplo, el porcentaje de conversion de cantidad inicial de sustrato a producto en un penodo de tiempo especificado utilizando una cantidad especificada de transaminasa) en comparacion con una enzima de referencia. Los metodos ejemplares para determinar la actividad de la enzima se proporcionan en los Ejemplos. Cualquier propiedad relativa a la actividad de la enzima puede verse afectada, incluyendo las propiedades de las enzimas clasicas de Km, Vmax o kcat, cuyos cambios pueden conducir al aumento de la actividad enzimatica. Las mejoras en la actividad de la enzima pueden ser de aproximadamente 1,5 veces la actividad enzimatica de la enzima de ingeniena correspondiente de tipo silvestre, a hasta 2 veces, 5 veces, 10 veces, 20 veces, 25 veces, 50 veces, 75 veces, 100 veces, o mas actividad enzimatica de la enzima de origen natural (por ejemplo, una transaminasa) u otra enzima de ingeniena a partir de la cual se derivaron las enzimas que exhiben una mayor actividad. En realizaciones espedficas, las enzimas de transaminasa modificada de la presente exposicion exhiben actividad enzimatica mejorada en el intervalo de 1,5 a 50 veces, 1,5 a 100 veces o mayor que la de la enzima de transaminasa padre (es decir, la transaminasa de tipo silvestre o modificada a partir de la cual se derivaron). Se entiende por el experto en la tecnica que la actividad de cualquier enzima esta limitada por difusion de tal manera que la tasa de recambio catalttico no puede exceder de la velocidad de difusion del sustrato, incluyendo cualesquiera coenzimas requeridas. El maximo teorico del lfmite de difusion es generalmente de aproximadamente 108 a 109 (M-1 s-1). Por lo tanto, cualquier mejora en la actividad enzimatica de la transaminasa tendra un lfmite superior en relacion con la velocidad de difusion de los sustratos sobre los que actua la enzima transaminasa. La actividad de la transaminasa se puede medir mediante uno cualquiera de los ensayos estandar utilizados para medir las transaminasas, como el cambio en el sustrato o la concentracion del producto, o cambio en la concentracion del donante de grupo amino. Las comparaciones de las actividades de la enzima se hacen usando una preparacion definida de enzima, un ensayo definido bajo un conjunto de condiciones, y uno o mas sustratos definidos, como se describe adicionalmente en detalle en este documento. Generalmente, cuando se comparan las enzimas en los lisados de celulas, el numero de celulas y la cantidad de protema ensayada se determinan asf como el uso de sistemas de expresion identicos y celulas huesped identicas para reducir al mmimo las variaciones en la cantidad de enzima producida por las celulas huesped y presente en el lisados.
"Conversion" se refiere a la transformacion enzimatica de un sustrato en el producto correspondiente. "El porcentaje de conversion" se refiere al porcentaje del sustrato que se convierte en el producto dentro de un penodo de tiempo en condiciones especificadas. Asf, por ejemplo, la "actividad enzimatica" o "actividad" de un polipeptido de transaminasa pueden expresarse como "porcentaje de conversion" del sustrato al producto.
"Termoestable" o "termicamente estable" se usan indistintamente para referirse a un polipeptido que es resistente a inactivacion cuando se expone a un conjunto de condiciones de temperatura (por ejemplo, 40-80°C) durante un penodo de tiempo (por ejemplo, 0,5-24 horas) en comparacion con la enzima sin tratar, reteniendo asf un cierto nivel de actividad residual (mas de 60% a 80% por ejemplo) despues de la exposicion a temperaturas elevadas.
"Solvente estable" se refiere a un polipeptido que mantiene la actividad similar (mas de por ejemplo, 60% a 80%) despues de la exposicion a concentraciones variables (por ejemplo, 5-99%) de disolvente, (por ejemplo, alcohol isopropflico, dimetilsulfoxido, tetrahidrofurano, 2-metiltetrahidrofurano, acetona, tolueno, acetato de butilo, metilo terc-butileter, acetonitrilo, etc.) durante un penodo de tiempo (por ejemplo, 0,5-24 horas) en comparacion con la enzima sin tratar.
"PH estable" se refiere a un polipeptido que mantiene la actividad similar (mas de por ejemplo, 60% a 80%) despues de la exposicion a pH bajo o alto (por ejemplo, 4,5-6 o 8 a 12) por un penodo de tiempo (por ejemplo, 0,5 - 24 horas) en comparacion con la enzima sin tratar.
"Estable termicamente y por disolvente" se refiere a un polipeptido que es estable tanto termoestable y como por disolvente.
5
10
15
20
25
30
35
40
45
50
55
60
65
"Derivado de" como se usa aqu en el contexto de enzimas por ingeniena identifica la enzima de origen, y/o el gen que codifica dicha enzima, en que se baso la ingeniena. Por ejemplo, la enzima de transaminasa modificada de SEQ ID NO: 4 se obtuvo mediante la mutacion de la transaminasa de la SEQ ID NO: 2. Por lo tanto, esta enzima de transaminasa modificada de SEQ ID NO: 4 se "deriva de" el polipeptido de SEQ ID NO: 2.
"Aminoacido" o "residuo" como se usa en el contexto de los polipeptidos descritos en el presente documento se refiere al monomero espedfico en una posicion de la secuencia (por ejemplo, P8 indica que el "aminoacido" o "residuo" en la posicion 8 de la SEQ ID NO: 2 es una prolina.).
"Aminoacido o residuo hidrofilo" se refiere a un aminoacido o residuo que tiene una cadena lateral que muestra una hidrofobicidad inferior a cero segun la escala de hidrofobicidad de consenso normalizada de Eisenberg et al., 1984, J. Mol. Biol. 179: 125-142. Aminoacidos hidrofflicos geneticamente codificados incluyen L-Thr (T), L-Ser (S), L-His (H), L-Glu (E), L-Asn (N), L-Gln (Q), L-Asp (D), L-Lys (K) y L-Arg (R).
"Aminoacido o residuo acido" se refiere a un aminoacido hidrofilo o residuo que tiene una cadena lateral que presenta un valor de pK de menos de aproximadamente 6 cuando el aminoacido esta incluido en un peptido o polipeptido. Los aminoacidos acidos ffpicamente tienen cadenas laterales cargadas negativamente a pH fisiologico debido a la perdida de un ion hidrogeno. Aminoacidos acidos codificados geneticamente incluyen L-Glu (E) y L-Asp (D).
"Aminoacido o residuo basico" se refiere a un aminoacido hidrofilo o residuo que tiene una cadena lateral que presenta un valor de pKa mayor de aproximadamente 6 cuando el aminoacido esta incluido en un peptido o polipeptido. Los aminoacidos basicos ffpicamente tienen cadenas laterales cargadas positivamente a pH fisiologico debido a la asociacion con el ion hidronio. Aminoacidos basicos geneticamente codificados incluyen L-Arg (R) y L- Lys (K).
"Aminoacido polar o residuo" se refiere a un aminoacido hidrofilo o residuo que tiene una cadena lateral que no esta cargada a pH fisiologico, pero que tiene al menos un enlace de electrones compartidos en comun por dos atomos por uno de los atomos. Aminoacidos polares geneticamente codificados incluyen L-Asn (N), L-Gln (Q), L-Ser (S) y L-Thr (T).
"Aminoacido o residuo hidrofobo" se refiere a un aminoacido o residuo que tiene una cadena lateral que muestra una hidrofobicidad mayor que cero de acuerdo a la escala de hidrofobicidad de consenso normalizada de Eisenberg et al., 1984, J. Mol. Biol. 179: 125-142. Aminoacidos hidrofobos codificados geneticamente incluyen L-Pro (P), L-Ile (I), L-Phe (F), L-Val (V), L-Leu (L), L-Trp (W), L- Met (M), L-Ala (A) y L-Tyr (y).
"Aminoacido o residuo aromatico" se refiere a un aminoacido hidrofilo o hidrofobo o residuo que tiene una cadena lateral que incluye al menos un anillo aromatico o heteroaromatico. Aminoacidos aromaticos codificados geneticamente incluyen L-Phe (F), L-Tyr (Y) y L-Trp (W). Aunque debido a la pKa de su atomo de nitrogeno heteroaromatico L-His (H) a veces se clasifica como un residuo basico, o como un residuo aromatico al incluuir su cadena lateral un anillo heteroaromatico, histidina en el presente documento se clasifica como un residuo hidrofflico o como un "residuo constrenido" (vease abajo).
"Aminoacido o residuo restringido" se refiere a un aminoacido o residuo que tiene una geometna restringida. En este documento, los residuos restringidos incluyen L-Pro (P) y L-His (H). Histidina tiene una geometna restringida porque tiene un anillo de imidazol relativamente pequeno. Prolina tiene una geometna restringida, ya que tambien tiene un anillo de cinco miembros.
"Aminoacido o residuo no polar" se refiere a un aminoacido hidrofobo o residuo que tiene una cadena lateral que no esta cargada a pH fisiologico y que tiene enlaces en los que el par de electrones compartidos en comun por dos atomos es generalmente realizado igualmente por cada uno de los dos atomos (es decir, la cadena lateral no es polar). Aminoacidos no polares geneticamente codificados incluyen L-Gly (G), L-Leu (L), L-Val (V), L-Ile (I), L-Met (M) y L-Ala (A).
"Aminoacido o residuo alifatico" se refiere a un aminoacido hidrofobo o un residuo que tiene una cadena lateral hidrocarbonada alifatica. Aminoacidos alifaticos geneticamente codificados incluyen L-Ala (A), L-Val (V), L- Leu (L) y L-Ile (I).
"Cistema" o L-Cys (C) es inusual en que puede formar puentes de disulfuro con otros aminoacidos L-Cys (C) u otros aminoacidos que contienen sulfanilo o sulfhidrilo. Los "restos de tipo cistema" incluyen otros aminoacidos que contienen restos de sulfhidrilo que estan disponibles para la formacion de puentes de disulfuro. La capacidad de L-Cys (C) (y otros aminoacidos con cadenas laterales que contienen -SH) de existir en un peptido en la forma tanto de -SH libre reducida o puenteada con disulfuro oxidada afecta si L-Cys (C) contribuye caracter hidrofobo neto o hidrofflico a un peptido. Mientras que L-Cys (C) muestra una hidrofobicidad de 0,29 segun la escala de consenso normalizada de Eisenberg (Eisenberg et al., 1984, supra), es de entenderse para los propositos de la presente descripcion, L-Cys (C) esta categorizado en su propio grupo unico.
5
10
15
20
25
30
35
40
45
50
55
60
65
"Aminoacido pequeno o residuo" se refiere a un aminoacido o residuo que tiene una cadena lateral que se compone de un total de tres o menos de carbono y/o heteroatomos (excluyendo el (-carbono y hidrogenos). Los pequenos aminoacidos o residuos pueden clasificarse adicionalmente como aminoacidos pequenos o residuos alifaticos, no polares, polares o acidos, de acuerdo con las definiciones anteriores. Pequenos aminoacidos codificados geneticamente incluyen L-Ala (A), L-Val (V), L-Cys (C), L-Asn (N), L- Ser (S), L-Thr (T) y L-Asp (D).
"Aminoacido o residuo que contiene hidroxilo" se refiere a un aminoacido que contiene un resto hidroxilo (OH). Aminoacidos que contienen hidroxilo geneticamente codificados incluyen L-Ser (S) L-Thr (T) y L-Tyr (Y).
"Diferencia de aminoacido" o "diferencia de residuo" se refiere a un cambio en el residuo en una posicion especificada de una secuencia de polipeptido cuando se compara con una secuencia de referencia. Por ejemplo, una diferencia de residuo en la posicion X8, donde la secuencia de referencia tiene una serina, se refiere a un cambio del residuo en la posicion X8 a cualquier residuo distinto de serina. Como se describe en el presente documento, una enzima puede incluir una o mas diferencias de residuos en relacion con una secuencia de referencia, donde multiples diferencias de residuos normalmente se indican mediante una lista de las posiciones especificadas donde los cambios se hacen en relacion con la secuencia de referencia (por ejemplo, "una o mas diferencias de residuos en comparacion con la SEQ ID NO: 2 en las siguientes posiciones de residuos: X4; X5; X8; X18; X25; X26; X27; X28; X30; X41; X42; X48; X49; X50; x54; X55; X60; X61 ; X62; X65; X81; X94; X96; X102; X117; X120; X124; X126; X136; X137; X138; X146; X148; X150; X152; X155; X156; X160; X163; X164; X169; X174; X178 ; X195; X199; X204; X208; X209; X211; X215; X217; X225; X230; X252; X269; X273; X282; X292; X297; X302; X306; X321; y X329.").
Sustituciones "conservadoras" de aminoacidos o mutaciones se refieren a la intercambiabilidad de residuos que tienen cadenas laterales similares, y por lo tanto tipicamente implica la sustitucion del aminoacido en el polipeptido con aminoacidos dentro de la misma o similar clase definida de aminoacidos. Sin embargo, como se usa en el presente documento, en algunas realizaciones, las mutaciones conservadoras no incluyen sustituciones de un hidrofilo a hidrofilo, hidrofobo a hidrofobo, que contiene hidroxilo a que contiene hidroxilo, o pequeno a pequeno residuo, si la mutacion conservadora puede ser en su lugar una sustitucion de un resto alifatico a un grupo alifatico, no polar a no polar, polar a polar, acido a acido, basico a basico, aromatico a aromatico, o residuo constrenido a restringido. Ademas, como se usa en este documento, A, V, L, o I se puede mutar de forma conservadora a cualquier otro residuo alifatico o a otro residuo no polar. La siguiente tabla muestra las sustituciones conservativas ejemplares.
Tabla 1
Residuo
Posibles mutaciones conservadoras
A, L, V, I
Otro alifatico (A, L, V, I) Otro no polare (A, L, V, I, G, M)
G, M
Otro no polar (A, L, V, I, G, M)
D, E
Otro acido (D, E)
K, R
Otro basico (K, R)
P, H
Otros constrenido (P, H)
N, Q, S, T
Otro polar
Y, W, F
Otros aromatico (Y, W, F)
C
Ninguna
"Sustitucion no conservativa" se refiere a la sustitucion o la mutacion de un aminoacido en el polipeptido con un aminoacido con propiedades de cadena lateral significativamente diferentes. Las sustituciones no conservativas pueden utilizar aminoacidos entre, en lugar de dentro de los grupos definidos mencionados anteriormente. En una realizacion, una mutacion no conservadora afecta a (a) la estructura del esqueleto peptfdico en el area de la sustitucion (por ejemplo, prolina para la glicina) (b) la carga o hidrofobicidad, o (c) el grueso de la cadena lateral.
"Supresion" se refiere a la modificacion del polipeptido mediante la eliminacion de uno o mas aminoacidos del polipeptido de referencia. Las deleciones pueden comprender la eliminacion de 1 o mas aminoacidos, 2 o mas aminoacidos, 5 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, o 20 o mas aminoacidos, hasta un 10% del numero total de los aminoacidos, hasta el 20% del numero total de aminoacidos, o hasta 30% del numero total de aminoacidos que constituyen el polipeptido al tiempo que conserva la actividad enzimatica y/o retencion de las propiedades mejoradas de una enzima de transaminasa modificada. Las deleciones pueden ser dirigidas a las partes internas y/o porciones terminales del polipeptido. En diversas realizaciones, la delecion puede comprender un segmento continuo o puede ser discontinuo.
5
10
15
20
25
30
35
40
45
50
55
60
65
"Insercion" se refiere a la modificacion del polipeptido mediante la adicion de uno o mas aminoacidos al polipeptido de referencia. En algunas realizaciones, las enzimas de transaminasa modificada mejoradas comprenden inserciones de uno o mas aminoacidos al polipeptido de transaminasa de origen natural, asf como inserciones de uno o mas aminoacidos a otros polipeptidos de transaminasas mejoradas. Las inserciones pueden estar en las porciones internas del polipeptido, o al extremo carboxi o amino. Las inserciones como se usa aqm incluyen protemas de fusion como se conoce en la tecnica. La insercion puede ser un segmento contiguo de aminoacidos o separado por uno o mas de los aminoacidos en el polipeptido de origen natural.
"Fragmento" como se utiliza aqm, se refiere a un polipeptido que tiene una delecion amino-terminal y/o carboxi-terminal, pero donde la secuencia de aminoacidos restante es identica a las posiciones correspondientes en la secuencia. Los fragmentos pueden ser de al menos 14 aminoacidos de longitud, al menos 20 aminoacidos de longitud, al menos 50 aminoacidos de longitud o mas, y hasta el 70%, 80%, 90%, 95%, 98% y 99% del polipeptido de transaminasa de plena longitud, por ejemplo el polipeptido de SEQ ID NO: 4.
"Polipeptido aislado" se refiere a un polipeptido que esta sustancialmente separado de otros contaminantes que acompanan de forma natural, por ejemplo, protemas, lfpidos, y polinucleotidos. El termino abarca polipeptidos que se han eliminado o purificado a partir de su sistema de medio ambiente o la expresion de origen natural (por ejemplo, celula huesped o la smtesis in vitro). Las enzimas de transaminasas mejoradas pueden estar presentes dentro de una celula, presente en el medio celular, o preparados en diversas formas, tales como lisadas o preparaciones aisladas. Como tal, en algunas realizaciones, la enzima de transaminasa mejorada puede ser un polipeptido aislado.
"Polipeptido sustancialmente puro" se refiere a una composicion en la que la especie de polipeptido es la especie predominante presente (es decir, sobre una base molar o en peso, es mas abundante que cualquier otra especie macromolecular individual en la composicion), y es generalmente una composicion sustancialmente purificada cuando la especie objeto comprende al menos aproximadamente 50 por ciento de las especies macromoleculares presentes en moles o % en peso. Generalmente, una composicion de transaminasa sustancialmente pura comprendera aproximadamente 60% o mas, aproximadamente 70% o mas, aproximadamente 80% o mas, aproximadamente 90% o mas, aproximadamente 95% o mas, y aproximadamente el 98% o mas de todas las especies macromoleculares en moles o % en peso presente en la composicion. En algunas realizaciones, la especie objeto se purifica hasta homogeneidad esencial (es decir, las especies contaminantes no pueden detectarse en la composicion mediante metodos de deteccion convencionales) donde la composicion consiste esencialmente en una unica especie macromolecular. Especies de disolventes, moleculas pequenas (<500 Daltons), y especies de iones elementales no se consideran especies macromoleculares. En algunas realizaciones, el polipeptido de transaminasas mejoradas aisladas es una composicion de polipeptido sustancialmente puro.
"Hibridacion rigurosa" se utiliza aqm para referirse a condiciones bajo las cuales los tnbridos de acidos nucleicos son estables. Como es conocido por los expertos en la tecnica, la estabilidad de los tnbridos se refleja en la temperatura de fusion (Tm) de los tnbridos. En general, la estabilidad de un tnbrido es una funcion de la fuerza ionica, temperatura, contenido de G/C, y la presencia de agentes caotropicos. Los valores de Tm de polinucleotidos se pueden calcular usando metodos conocidos para predecir las temperaturas de fusion (vease, por ejemplo, Baldino et al, Methods Enzymology 168: 761-777; Bolton et al, 1962, Proc Natl Acad Sci usa 48: 1390 ; Bresslauer et al, 1986, Proc Natl Acad Sci usa 83: 8893-8897; Freier et al, 1986, Proc Natl Acad Sci usa 83: 9373-9377; Kierzek et al, Biochemistry 25: 7840-7846; Rychlik et al, 1990, Nucleic Acids Res 18: 6409-6412 (errata, 1991, Nucleic Acids Res 19: 698); Sambrook et al, supra); Suggs et al, 1981, In Developmental Biology Using Purified Genes (Brown et al, eds.)., Pp 683-693, Academic Press; y Wetmur, 1991, Crit Rev Biochem Mol Biol. 26: 227-259). En algunas realizaciones, el polinucleotido codifica el polipeptido dado a conocer en el presente documento y se hibrida en condiciones definidas, tales como condiciones moderadamente rigurosas o altamente rigurosas, con el complemento de una secuencia que codifica una enzima de transaminasa modificada de la presente descripcion.
"Hibridacion de rigurosidad" se refiere a condiciones de hibridacion, tales como condiciones de lavado, en la hibridacion de acidos nucleicos. Generalmente, las reacciones de hibridacion se llevan a cabo en condiciones de rigurosidad mas baja, seguido de lavados de diversa pero mayor rigurosidad. El termino "hibridacion moderadamente rigurosa" se refiere a condiciones que permiten el objetivo de ADN para unir un acido nucleico complementario que tiene aproximadamente 60% de identidad, preferiblemente una identidad de aproximadamente 75%, aproximadamente 85% de identidad con el ADN diana; con mas de aproximadamente 90% de identidad para polinucleotido diana. Los ejemplos de condiciones moderadamente rigurosas son condiciones equivalentes a la hibridacion en 50% de formamida, 5X solucion de Denhart, 5XSSPE, 0,2% de SDS a 42°C, Seguido de lavado en 0,2XSSPE, 0,2% de SDS, a 42°C. "hibridacion de alta rigurosidad" se refiere generalmente a condiciones que son alrededor de 10°C o menos de la temperatura de fusion termica Tm tal como se determina bajo la condicion de solucion para una secuencia de polinucleotido definida. En algunas realizaciones, una condicion de alta rigurosidad se refiere a condiciones que permiten la hibridacion de solamente aquellas secuencias de acidos nucleicos que forman tnbridos estables en 0,018 M NaCl a 65°C. (es decir, si un tnbrido no es estable en 0,018 M NaCl a 65°C, no va a ser estable bajo condiciones de alta rigurosidad, como se contempla en el presente documento). Condiciones de alta rigurosidad se pueden proporcionar, por ejemplo, por hibridacion en condiciones equivalentes a 50% de formamida, 5X la solucion de Denhart, 5XSSPE, 0,2% de SDS a 42°C, seguido de lavado en 0,1XSSPE, y 0,1% de
5
10
15
20
25
30
35
40
45
50
55
60
65
SDS a 65°C. Otra condicion de alta rigurosidad se hibrida en condiciones equivalentes a la hibridacion en 5X SSC que contiene 0,1% (w:v) de SDS a 65°C y lavado en SSC 0,1x que contiene 0,1% de SDS a 65°C. Otras condiciones de alta rigurosidad de hibridacion, asf como condiciones moderadamente rigurosas, se describen en las referencias citadas anteriormente.
Polinucleotido "heterologo" se refiere a cualquier polinucleotido que se introduce en una celula huesped mediante tecnicas de laboratorio, e incluye polinucleotidos que se quitan de una celula huesped, sometidos a manipulacion de laboratorio, y luego vuelve a introducirse en una celula huesped.
"Codon optimizado" se refiere a cambios en los codones del polinucleotido que codifican una protema a los utilizados preferentemente en un organismo particular de tal manera que la protema codificada se expresa de manera eficiente en el organismo de interes. Aunque el codigo genetico es degenerado en que la mayona de los aminoacidos estan representados por varios codones, llamados "sinonimos" o codones "sinonimos", es bien sabido que el uso de codones por organismos particulares es no aleatorio y sesgado hacia determinados tripletes de codon. Este sesgo del uso de codon puede ser mayor en referencia a un gen dado, los genes de funcion comun o de origen ancestral, protemas altamente expresadas frente a protemas de bajo numero de copias, y las regiones que codifican protema agregada del genoma de organismo. En algunas realizaciones, los polinucleotidos que codifican las enzimas de transaminasas pueden ser de codones optimizados para la produccion optima del organismo huesped seleccionado para la expresion.
"Codones de uso sesgo preferidos, optimos, de alto codon" se refiere indistintamente a los codones que se utilizan en una frecuencia mas alta en las regiones que codifican protema que otros codones que codifican para el mismo aminoacido. Los codones preferidos pueden ser determinados en relacion con el uso de codones en un gen unico, un conjunto de genes de funcion o el origen comun, los genes altamente expresados, la frecuencia de codones en las regiones que codifican protema agregada de todo el organismo, la frecuencia de codones en las regiones que codifican protema agregada de organismos relacionados, o combinaciones de los mismos. Los codones cuya frecuencia se incrementa con el nivel de la expresion genica de frecuencia son tfpicamente codones optimos para la expresion. Una variedad de metodos son conocidos para la determinacion de la frecuencia de codones (por ejemplo, el uso de codones, uso de codon sinonimo relativo) y la preferencia de codones en los organismos espedficos, incluyendo el analisis multivariante, por ejemplo, utilizando el analisis cluster o el analisis de correspondencia, y el numero efectivo de los codones utilizados en un gen (vease GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, John Peden, Universidad de Nottingham; Mclnerney, J. O, 1998, Bioinformatics 14: 372-73; Stenico et al, 1994, Nucleic Acids Res 222437-46; Wright, F., 1990, gene 87: 23-29). tablas de uso de codones estan disponibles para una lista creciente de organismos (vease, por ejemplo, Wada et al, 1992, Nucleic Acids Res. 20: 2111-2118; Nakamura et al, 2000, Nucl Acids Res 28: 292; Duret, et al, supra; Henaut y Danchin, "Escherichia coli and Salmonella," 1996, Neidhardt, et al Eds, ASM Press, Washington DC, p 2047-2066. La fuente de datos para la obtencion de uso de codones puede confiar en cualquier secuencia disponible de nucleotidos capaz de codificar para una protema. Estos conjuntos de datos incluyen secuencias de acido nucleico conocidas para codificar protemas expresadas (por ejemplo, secuencias de codificacion de protema completa CDS), etiquetas de secuencias expresadas (EST), o regiones de codificacion predichas de secuencias genomicas (vease, por ejemplo, Mount, D., Bioinformatics: Sequence and Genome Analysis, Capftulo 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001; Uberbacher, EC, 1996, Methods Enzymol. 266: 259-281; Tiwari et al, 1997, Comput Appl Biosci 13: 263-270).
"Secuencia de control" se define aqrn para incluir todos los componentes, que son necesarios o ventajosos para la expresion de un polinucleotido y/o polipeptido de la presente divulgacion. Cada secuencia de control puede ser nativa o extranjera al polinucleotido de interes. Tales secuencias de control incluyen, pero no se limitan a, un lfder, secuencia de poliadenilacion, secuencia de propeptido, promotor, secuencia de peptido senal, y terminador de la transcripcion.
"Unido operativamente" se define aqrn como una configuracion en la que se coloca apropiadamente una secuencia de control (es decir, en una relacion funcional) en una posicion relativa a un polinucleotido de interes de tal manera que la secuencia de control dirige o regula la expresion del polinucleotido y/o polipeptido de interes.
"Secuencia promotora" es una secuencia de acido nucleico que es reconocida por una celula huesped para la expresion de un polinucleotido de interes, tal como una secuencia de codificacion. La secuencia de control puede comprender una secuencia promotora apropiada. La secuencia promotora contiene secuencias de control transcripcionales, que median la expresion de un polinucleotido de interes. El promotor puede ser cualquier secuencia de acido nucleico que muestre actividad transcripcional en la celula huesped de eleccion incluyendo promotores mutantes, truncados, e hfbridos, y puede ser obtenido a partir de genes que codifican polipeptidos extracelulares o intracelulares bien homologos o heterologos a la celula huesped.
"Alquilo" se refiere a grupos de hidrocarburo de cadena lineal o ramificada. Cuando los numeros aparecen en submdice despues del sfmbolo "C", el submdice define con mas especificidad el numero de atomos de carbono que puede contener un grupo particular. Por ejemplo, "C1-C6 alquilo" se refiere a grupos lineales y ramificados de alquilo de cadena con uno a seis atomos de carbono, tales como metilo, etilo, n-propilo, isopropilo, n-butilo, t-butilo,
5
10
15
20
25
30
35
40
45
50
55
60
65
n-pentilo, y asf sucesivamente. Los grupos alquilo pueden estar opcionalmente sustituidos con uno o mas grupos sustituyentes. Como se usa aqm, alquilo incluye alcanilo y alquileno, como se describe mas adelante.
"Alcanilo" por sf mismo o como parte de otro sustituyente se refiere a una cadena ramificada lineal saturada o alquilo dclico derivado de la eliminacion de un atomo de hidrogeno de un solo atomo de carbono de un alcano. grupos alcanilo incluyen, pero no se limitan a metanilo; etanilo; propanilos tales como propan-1-ilo, propan-2-ilo (isopropilo), ciclopropan-1-ilo, etc.; butanilos tales como butan-1-ilo, butan-2-ilo (sec-butilo), 2-metilo-propan-1-ilo (isobutilo), 2-metilo-propan-2-ilo (t-butilo), ciclobutan-1-ilo, etc.; y similares. En algunas realizaciones, los grupos alcanilo son (C-i-Ca) alcanilo.
"Alquileno" por sf mismo o como parte de otro sustituyente se refiere a una cadena ramificada lineal saturada o insaturada o un radical hidrocarburo divalente cfclico derivado de la eliminacion de dos atomos de hidrogeno de un solo atomo de carbono o dos atomos de carbono diferentes de un alcano, alqueno o alquino. Por ejemplo, -CH2CH3 es un grupo etilo, mientras que -CH2CH2- es un copolfmero de etileno. El termino "alquileno" incluye "cicloalquileno". El termino "alquileno" pretende incluir espedficamente grupos que tienen cualquier grado o nivel de saturacion, es decir, grupos que tienen enlaces carbono-carbono exclusivamente individuales, grupos que tienen uno o mas enlaces carbono-carbono dobles, grupos que tienen uno o mas enlaces de carbono-carbono triples y grupos que tienen mezclas de enlaces de carbono-carbono simples, dobles y triples.
"Alquenilo" y "alqueno" se refieren a grupos hidrocarburo de cadena lineal o ramificada que tienen al menos un doble enlace. Cuando los numeros aparecen en submdice despues del sfmbolo "C", el submdice define con mas
especificidad el numero de atomos de carbono que un grupo particular puede contener. Por ejemplo, "C1-C6
alquenilo" se refiere a grupos alquilo de cadena lineal y ramificada con uno a seis atomos de carbono que incluyen al menos un doble enlace. Grupos de alquenilo tfpicos son bien conocidos en la tecnica, e incluyen, pero no se limitan a: etenilo, 1-metilo-etenilo, 1- o 2-propenilo, 1-metilo-1-propenilo, 1-metilo-2- propenilo, 1,1-dimetilo-2-propenilo, 2- metilo-2-propenilo, 1-, 2- o 3-butenilo, 1-metilo-1-butenilo, 2-metilo-1-butenilo, 3-metilo-1-butenilo, 3,3-dimetilo-1- butenilo, 2,3-dimetilo-1-butenilo, 1-metilo-2-butenilo, 1,1 -dimetilo-2-butenilo, 2-metilo-2-butenilo, 3-metilo-2-butenilo, 1,3-butadienilo, 1,3-dimetilo-1,3-butadienilo, 1-, 2-, 3- o 4-pentenilo, y asf sucesivamente. Grupos alquenilo pueden estar opcionalmente sustituidos con uno o mas grupos sustituyentes.
"Alquinilo" y "alquino" se refieren a grupos hidrocarburo de cadena lineal o ramificada que tienen al menos un enlace triple. Cuando los numeros aparecen en submdice despues del sfmbolo "C", el submdice define con mas
especificidad el numero de atomos de carbono que puede contener un grupo particular. Por ejemplo, "C1-C6
alquinilo" se refiere a grupos lineales y ramificados de alquilo de cadena con uno a seis atomos de carbono que incluyen al menos un triple enlace. Grupos de alquinilo tfpicos son bien conocidos en la tecnica, e incluyen, pero no se limitan a: etinilo, 1- o 2-propinilo, 1-metilo-2-propinilo, 1,1 -dimetilo-2-propinilo, 1-, 2- o 3-butinilo, 3-metilo-1- butinilo, 3,3-dimetilo-1 -butinilo, 1 -metilo-2-butinilo, 1,1 -dimetilo-2-butinilo, 1-, 2-, 3-o 4-pentinilo, y asf sucesivamente. Los grupos alquinilo pueden estar opcionalmente sustituidos con uno o mas grupos sustituyentes.
"Arilo" se refiere a un radical de hidrocarburo aromatico monovalente de 6 a aproximadamente 20 atomos de carbono derivado de la eliminacion de un atomo de hidrogeno de un solo atomo de carbono de un sistema de anillo aromatico progenitor. Los grupos arilo incluyen, pero no se limitan a, grupos derivados de aceantrileno, acenaftileno, acefenantrileno, antraceno, azuleno, benceno, criseno, coroneno, fluoranteno, fluoreno, hexaceno, hexafeno, hexaleno, como indaceno, s-indaceno, indano, indeno, naftaleno, octaceno, octafeno, octaleno, ovaleno, penta-2,4-dieno, pentaceno, pentaleno, pentafeno, perileno, fenaleno, fenantreno, piceno, pleiadeno, pireno, pirantreno, rubiceno, trifenileno, trinaftaleno, y similares, asf como los diversos hidro isomeros de los mismos. En algunas realizaciones, el grupo arilo es (C5-C15) arilo, con (C5-C10) siendo preferido. En algunas realizaciones, los arilos son ciclopentadienilo, fenilo y naftilo. Los grupos arilo pueden estar opcionalmente sustituidos con uno o mas grupos sustituyentes.
"Heteroarilo" y "heteroaromatico" se refieren a un grupo arilo en el que uno o mas de los atomos de carbono del sistema de anillo aromatico progenitor se sustituyen por un heteroatomo (O, N, o S). Los grupos heteroarilo tfpicos incluyen, pero no se limitan a, grupos derivados de acridina, bencimidazol, bencisoxazol, benzodioxano, benzodiaxole, benzofurano, benzopirona, benzotiadiazol, benzotiazol, benzotriazol, benzoxazina, benzoxazol, benzoxazolina, carbazol, ®-carbolina, cromano, cromeno, cinolina, furano, imidazol, indazol, indol, indolina, indolizina, isobenzofuran, isocromeno, isoindol, isoindolina, isoquinolina, isotiazol, isoxazol, naftiridina, oxadiazol, oxazol, perimidina, fenantridina, fenantrolina, fenazina, ftalazina, pteridina, purina, pirano, pirazina, pirazol, piridazina, piridina, pirimidina, pirrol, pirrolizina, quinazolina, quinolina, quinolizina, quinoxalina, tetrazol, tiadiazol, tiazol, tiofeno, triazol, xanteno, y similares, asf como los diversos hidro isomeros de los mismos. En algunas realizaciones, el grupo heteroarilo es un heteroarilo de 5-14 miembros. En algunas realizaciones, el grupo heteroarilo es un heteroarilo de 5-10 miembros.
"Acilo" por sf mismo o como parte de otro sustituyente se refiere a -C(O)Ra, donde Ra es hidrogeno, o alquilo sustituido o no sustituido, cicloalquilo, cicloheteroalquilo, arilo, arilalquilo, heteroalquilo, heteroarilo, o heteroarilalquilo como se define aqm. Grupos acilo tfpicos incluyen, pero no se limitan a, formilo, acetilo, ciclohexilcarbonilo, ciclohexilmetilcarbonilo, benzoilo, bencilcarbonilo, y similares.
5
10
15
20
25
30
35
40
45
50
55
60
65
"Aciloxi" por sf mismo o como parte de otro sustituyente se refiere a -OC(O)RB, Donde RB representa un hidrogeno, o grupos sustituidos o no sustituidos de alquilo, heteroalquilo, cicloalquilo, heterocicloalquilo, arilo, arilalquilo, y heteroarilo como se define en el presente documento. Alquilaciloxi se refiere a un aciloxi donde Rb es (C1-C12) alquilo, (C1-C8) alquilo, o (C1-C4) alquilo. Arilaciloxi se refiere a un aciloxi donde Rb es un arilo opcionalmente sustituido con sustituyentes seleccionados, incluyendo, pero no limitado a, hidroxilo, alquilo, halogeno, (C1-C4) alquilo, (C1-C4) alcoxi, y carboxilo.
"Alcoxi" por s^ mismo o como parte de otro sustituyente se refiere a -ORc, donde Rc representa un grupo alquilo o cicloalquilo como se define aqrn. Grupos alcoxi tfpicos incluyen, pero no se limitan a, metoxi, etoxi, propoxi, butoxi, ciclohexiloxi, y similares.
"Alquilcarbonilo" por si mismo o como parte de otro sustituyente se refiere a -C(O)-Rd', donde Rd' es un grupo alquilo, como se definio anteriormente. Alcoxicarbonilos tfpicos incluyen, pero no se limitan a, acetilo, etilcarbonilo, n-propilcarbonilo, y similares.
"Alquiltio" por si mismo o como parte de otro sustituyente, se refiere a -SRe, en la que Re es un alquilo. Alquiltios tfpicos incluyen, pero no se limitan a, metiltio, etiltio, n-propiltio, y similares.
"Alcoxicarbonilo" por si mismo o como parte de otro sustituyente, se refiere a C(O)ORf en la que Rf representa un grupo alquilo o cicloalquilo como se define aqrn. Grupos alcoxicarbonilo tfpicos incluyen, pero no se limitan a, metoxicarbonilo, etoxicarbonilo, proproxicarbonilo, butoxicarbonilo, ciclohexiloxicarbonilo, y similares.
"Alcoxicarbonilalquilo" por si mismo o como parte de otro sustituyente se refiere a -Rg -C(O)ORh, Donde cada Rg y Rh es independientemente un alquilo. Alcoxicarbonilalquilos tfpicos incluyen, pero no se limitan a, metoxicarbonilmetilo, (1,1-dimetiletoxi)carbonilmetilo, 2-(metoxicarbonilo)etilo, y similares.
"Amino" por si mismo o como parte de otro sustituyente se refiere al grupo -NH2. Amino sustituido se refiere al grupo -NHRi', NrR y NRiRjRk, donde cada Ri, Ri y Rk se seleccionan independientemente de alquilo sustituido o no sustituido, cicloalquilo, cicloheteroalquilo, alcoxi, arilo, heteroarilo, heteroarilalquilo, acilo, alcoxicarbonilo, sulfanilo, sulfinilo, sulfonilo, y similares. grupos amino tfpicos incluyen, pero se limitan a, dimetilamino, dietilamino, trimetilamino, trietilamino, metilisulfonilamino, furanilo-oxi-sulfamino, y similares.
"Carbonilo" se refiere a -C(=O).
"Halogeno" o "halo" por si mismos o como parte de otro sustituyente, a menos que se indique lo contrario, se refieren a fluoro, cloro, bromo y yodo.
"Haloalquilo" por si mismo o como parte de otro sustituyente se refiere a un grupo alquilo en el que uno o mas de los atomos de hidrogeno se sustituye con un halogeno. Asi, el termino "haloalquilo" pretende incluir monohaloalquilos, dihaloalquilos, trihaloalquilos, etc. hasta perhaloalquilos. Por ejemplo, la expresion "(C1-C2) haloalquilo" incluye 1-fluorometilo, difluorometilo, trifluorometilo, 1-fluoroetilo, 1,1 -difluoroetilo, 1,2-difluoroetilo, 1,1,1- trifluoroetilo, perfluoroetilo, etc.
"Sustituido" cuando se usa para modificar un grupo especificado o radical, significa que uno o mas atomos de hidrogeno del grupo especificado o son cada uno, independientemente uno de otro, sustituido con el mismo o diferente sustituyente. Los sustituyentes tfpicos radicales (tambien denominados aqrn como "sustituyentes", "grupos sustituyentes", "grupos funcionales", o "grupos") son bien conocidos en la tecnica e incluyen, pero no se limitan a heteroatomos o grupos halo (por ejemplo, -F, -Cl, -Br, -I), de cadena lineal, ramificada o alquilos dclicos, de cadena lineal, ramificada o alquenilos dclicos, alquilos o alquenilos sustituidos por heteroatomo (por ejemplo, -O-alquilo, -S- alquilo), arilo o heteroarilo y otros grupos funcionales con o sin heteroatomos (por ejemplo, -Oh, -NH2, -CF3, -CN, - OCN, -SCN, -NO, y -NO2). Cuando un primer grupo sustituyente esta "sustituido con uno o mas" segundos grupos, uno o mas atomos de hidrogeno del primer grupo se sustituye con un numero correspondiente de segundos grupos. Cuando el numero de segundos grupos es dos o mayor, cada segundo grupo puede ser el mismo o diferentes.
"Alquilo, arilo, o heteroarilo sustituido" se refiere a un grupo alquilo, arilo o heteroarilo en el que uno o mas atomos de hidrogeno esta reemplazado con otro grupo sustituyente. Grupos sustituyentes ejemplares incluyen, pero no se limitan a, -Or1, -Sr1, -NRlRm, -NO2, -NO, -CN, -CF3, halogeno (por ejemplo, -F, -Cl, -Br y -I), -C(O)Rl, -C(O)ORl, -C(O)NR', -S(O)2Rl, -S(O)2NRRm, donde cada R1 y Rm se seleccionan independientemente del grupo que consiste en hidrogeno y (C1-C4) alquilo.
"Opcional" u "opcionalmente" se refiere a un evento o circunstancia descrita puede o puede no ocurrir, y que la descripcion incluye casos en los que ocurre el evento o circunstancia donde no lo hace el evento o circunstancia. Por ejemplo, "arilo opcionalmente sustituido" se refiere a un grupo arilo que puede o no puede estar sustituido y que la descripcion abarca tanto grupo arilo sustituido y un grupo arilo no sustituido.
5
10
15
20
25
30
35
40
45
50
55
60
65
"Estereoisomero," "forma estereoisomerica," y similares se usan de forma intercambiable aqrn para referirse a todos los isomeros de moleculas individuales que difieren solo en la orientacion de sus atomos en el espacio. Incluye enantiomeros e isomeros de compuestos con mas de un centro quiral que no son imagenes especulares el uno del otro ("diastereomeros").
"Centro quiral" se refiere a un atomo de carbono al que estan unidos cuatro grupos diferentes.
"Enantiomero" o "enantiomerico" se refiere a una molecula que es no superponible con su imagen especular y por lo tanto opticamente activa cuando el enantiomero rota el plano de luz polarizada en una direccion y su imagen especular hace girar el plano de luz polarizada en la direccion opuesta.
"Enriquecido", en referencia al componente en una composicion, tal como un compuesto quiral particular, enantiomero, o diastereomero se refiere a una composicion en la que el componente comprende mas de 50% y tfpicamente comprende al menos aproximadamente 60%, 70%, 80%, 90%, o incluso mas que ese compuesto particular quiral, enantiomero, o diastereomero. La cantidad de enriquecimiento se puede determinar utilizando metodos analtticos convencionales utilizados rutinariamente por los expertos ordinarios en la tecnica, incluyendo pero no limitado a la espectroscopia de RMN en presencia de reactivos de desplazamiento quiral, el analisis de cromatograffa de gases usando columnas quirales, y analisis cromatografico lfquido de alta presion utilizando columnas quirales. En algunas realizaciones un compuesto quiral unico, enantiomero, o diastereomero seran sustancialmente libres de otros compuestos quirales, enantiomero, o diastereomeros correspondientes. Composiciones enriquecidas quiralmente enantiomericamente, o diastereomericamente que contienen al menos aproximadamente 95% de un compuesto quiral, enantiomero, o diastereomero especificado se denominan aqrn como "substancialmente quiralmente puro", "sustancialmente enantiomericamente puro" y "sustancialmente diastereomericamente puro", respectivamente. Composiciones que contienen al menos aproximadamente 99% de un compuesto quiral, enantiomero, o diastereomero especificado se denominan aqrn como "quiralmente puro", "enantiomericamente puro" y "diastereomericamente puro", respectivamente.
"Compuesto" tal como se utiliza aqrn se refiere a cualquiera de los compuestos abarcados por la formula estructural identificada y/o nombre qrnmico asociado con el compuesto como se describe aqrn. Los compuestos pueden ser identificados bien por su estructura qrnmica y/o nombre qrnmico. Cuando entran en conflicto la estructura qrnmica y el nombre qrnmico, la estructura qrnmica es determinante de la identidad del compuesto. Cada compuesto identificado por las formulas estructurales y/o el nombre qrnmico dados a conocer en el presente documento pueden contener uno o mas centros quirales y/o dobles enlaces, y por lo tanto, pueden existir como mas de un estereoisomero, tales como isomeros de doble enlace (es decir, isomeros geometricos), enantiomero, o diastereomero. En consecuencia, a menos que se represente espedficamente o se indique lo contrario, las estructuras qrnmicas representadas en este documento abarcan todos los posibles enantiomeros y estereoisomeros de los compuestos ilustrados incluyendo la forma estereoisomericamente pura (por ejemplo, geometricamente pura, enantiomericamente pura o diastereomericamente pura) y mezclas enantiomericas y estereoisomericas. Las mezclas enantiomericas y estereoisomericas pueden resolverse en sus enantiomeros o estereoisomeros usando tecnicas de separacion o tecnicas de smtesis quiral bien conocidas por el experto en la tecnica de los componentes. Tambien los compuestos pueden existir en varias formas tautomericas, incluyendo la forma enol, la forma ceto y mezclas de los mismos. Por consiguiente, las estructuras qrnmicas representadas en este documento abarcan todas las posibles formas tautomeras de los compuestos ilustrados. Del mismo modo, los compuestos descritos tambien incluyen todas las versiones isotopicamente etiquetadas de los compuestos en los que uno o mas atomos tienen una masa atomica diferente de la masa atomica encontrada convencionalmente en la naturaleza. Ejemplos de isotopos que pueden incorporarse en los compuestos de la divulgacion incluyen, pero no se limitan a, 2H, 3H, 13C, 14C, 15N, 18O, 17O, etc. Compuestos pueden existir en formas no solvatadas asf como en formas solvatadas, incluyendo formas hidratadas y, como N-oxidos. En general, los compuestos pueden ser hidratados, solvatados o N-oxidos. Ciertos compuestos pueden existir en multiples formas cristalinas o amorfas. En general, todas las formas ffsicas son equivalentes para los usos contemplados en el presente documento y se pretende que esten dentro del alcance de la presente descripcion. Ademas, debe entenderse, cuando se ilustran estructuras parciales de los compuestos, que parentesis indican el punto de union de la estructura parcial al resto de la molecula.
5.3 Procesos de transaminacion biocatalttica
Los procesos de transaminacion biocatalftica descritos en este documento se basan en los polipeptidos de transaminasa modificados que se prepararon por su capacidad para llevar a cabo la transaminacion del sustrato de cetoamida, 4-oxo-4-[3-(trifluorometilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)-ilo]-1-(2,4,5-trifluorofenilo)butan- 2-ona al producto de amina quiral, (2R)-4-oxo-4-[3-(trifluoromeiilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)-ilo]- 1-(2,4,5-trifluorofenilo)butan-2-amina, en presencia de un donante de grupo amino. Este producto amina quiral, conocido como sitagliptina, es el ingrediente activo en JANUVIA® utilizado para el tratamiento de la diabetes de tipo 2. La correspondiente transaminasa de origen natural o transaminasa de SEQ ID NO: 2 no presenta sensiblemente la actividad sobre el sustrato de cetoamida de sitagliptina. La presente descripcion muestra que estas transaminasas modificadas tambien son capaces de llevar a cabo la transaminacion de otros sustratos ceto para producir aminas quirales en exceso enantiomerico. Los productos de amina quirales tienen la estructura general
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen27
en la que R1 es arilo o heteroarilo opcionalmente sustituido y R2 es un alquilo opcionalmente sustituido, o un grupo acilo, aciloxi, o grupos alcoxi unidos al carbono quiral por un alquileno sustituido o no sustituido. Los correspondientes sustratos cetonicos proquirales se ponen en contacto con una transaminasa en condiciones de reaccion adecuadas para producir el producto de amina en exceso enantiomerico. Los compuestos de amina resultantes se pueden utilizar en la smtesis de diversos productos farmaceuticos y los isomeros de los mismos, como se describe adicionalmente mas adelante.
En algunas realizaciones, la divulgacion proporciona un procedimiento para preparar un producto de amina de formula estructural (I):
imagen28
teniendo la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *; en un exceso enantiomerico sobre el enantiomero opuesto, en el que
R1 es arilo o heteroarilo opcionalmente sustituido;
R2 es un C1-C6 alquilo opcionalmente sustituido, -R3C(O)R4, o -R3OC(O)R5
en la que R3 es un C1-C4 alquilo opcionalmente sustituido, y R4 es H, un C1-C4 alquilo opcionalmente sustituido, NR6R7, o OR8, donde R5, R6, R7 y R8 son independientemente H o C1-C4 alquilo, y cuyo procedimiento
comprende la puesta en contacto de un sustrato de cetona de formula estructural (II):
imagen29
con un polipeptido de transaminasa en presencia de un donante de amino en condiciones de reaccion adecuadas para la conversion del sustrato de cetona en el producto amina, en el que el polipeptido de transaminasa es una transaminasa modificada descrita en el presente documento. En algunas realizaciones, el polipeptido de transaminasa tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia de aminoacidos con la SEQ ID NO: 4 y es capaz de convertir el sustrato de cetona de formula (II) al producto de amina de formula (I) a una velocidad que esta mejorada en comparacion con la transaminasa de la SEQ ID NO: 2.
En algunas realizaciones, el polipeptido de transaminasa tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia de aminoacidos con la SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, o 102, y es capaz de convertir el sustrato de cetona al producto de amina a una tasa que esta mejorada en comparacion con la transaminasa de la SEQ ID NO: 2. Las realizaciones espedficas de las transaminasas modificadas para uso en los procesos se describen mas adelante.
En algunas realizaciones, la transaminasa modificada tiene al menos 5%, 10%, 20%, 30%, 40%, 50% o mas actividad de la SEQ ID NO: 74.
5
10
15
20
25
30
35
40
45
50
55
60
65
En algunas realizaciones, el producto de amina se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones de los procesos descritos anteriormente, el producto de amina se produce en al menos el 99% de exceso enantiomerico.
Como se menciono anteriormente, los polipeptidos de transaminasa utiles en los procedimientos de la presente divulgacion se pueden caracterizar en terminos de la capacidad de convertir el sustrato de cetoamida de sitagliptina a la sitagliptina. En consecuencia, en cualquiera de las realizaciones de los procesos descritos en este documento, el proceso puede llevarse a cabo en el que el polipeptido de transaminasa es capaz de convertir el sustrato de cetoamida de sitagliptina a la sitagliptina a una velocidad que esta mejorada en comparacion con la transaminasa de la SEQ ID NO: 2, y tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91% 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia de aminoacidos con la SEQ ID NO: 4.
En algunas realizaciones del procedimiento anterior, R1 es un fenilo opcionalmente sustituido. En algunas realizaciones R1 es un piridinilo opcionalmente sustituido. En algunas realizaciones, R1 es un arilo o heteroarilo sustituido. En algunas realizaciones, las sustituciones en el arilo o heteroarilo se seleccionan de entre C1-C4 alquilo, - OR'-SR', -NR'R'', -NO2, -NO, -CN, -CF3, halogeno (por ejemplo, -F, -Cl, -Br y -I), -C(O)R'-C(O)OR', -C(O)NR', - S(O)2R', -S(O)2NR'R", donde cada R' y R" se seleccionan independientemente del grupo que consiste en hidrogeno y (C1-C4) alquilo. En algunas realizaciones, el (C1-C4) alquilo es un alquilo sustituido con halo.
En algunas realizaciones, R2 es un C1-C4 alquilo o C1-C4 alquilo sustituido por halo, particularmente metilo, metilo sustituido por halo, propilo o propilo sustituido por halo. En algunas realizaciones R2 es CF2H o CF3.
En algunas realizaciones de R2, la sustitucion en el C1-C6 alquilo y grupos de R3 se seleccionan de halogeno, OH, NR5R6, o OR8, donde R5, R6 y R8 se han definido anteriormente. En algunas realizaciones, los compuestos de formula (I) producidos en el proceso descrito anteriormente son compuestos sustancialmente quiralmente puros. En ciertas realizaciones, los compuestos de formula (I) producidos en el proceso descrito anteriormente son quiralmente puros.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen30
en la que R9 es H, Cl, Br, F, CH3, CF3, NH2, NO2, CN, SCN, OCF3O OCH3 y R2 es un C1-C6 alquilo opcionalmente sustituido, y el sustrato de cetona de formula (II) es:
imagen31
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen32
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen33
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen34
y el sustrato de cetona de formula (II) es:
imagen35
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen36
y el sustrato de cetona de formula (II)
es:
imagen37
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen38
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen39
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen40
y el sustrato de cetona de formula (II) es:
imagen41
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen42
y el sustrato de cetona de formula (II) es:
imagen43
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen44
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen45
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen46
en la que R9 como se define anteriormente, y el sustrato de cetona de formula (II) es
imagen47
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen48
en la que R9 es H, Cl, Br, F, CH3, CF3, NH2, NO2, CN, SCN, OCF3O OCH3, y el sustrato de cetona de formula (II) es:
imagen49
En algunas realizaciones R9 es H, Br, CH3O CF3. En algunas realizaciones R9 esta en la posicion para en el anillo fenilo. En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
5
10
15
20
25
30
35
40
45
50
55
60
65
En algunas realizaciones del proceso, el producto de amina de formula (I) es (S)-1-(4-bromofenilo)-2,2,2- trifluoroetanamina:
imagen50
y el sustrato de cetona de formula (II) es 1-(4-bromofenilo)-2,2,2-trifluoro:
imagen51
En algunas realizaciones del proceso, (S)-1-(4-bromofenilo)-2,2,2-trifluoroetanamina se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, (S)-1-(4-bromofenilo)-2,2,2-trifluoroetanamina producida son compuestos sustancialmente quiralmente puros. En ciertas realizaciones, (S)-1-(4-bromofenilo)-2,2,2-trifluoroetanamina producida en el proceso es quiralmente puro.
En algunas realizaciones del proceso, el producto de amina de formula (I) es (S)-2,2,2-trifluoro-1-p- toliletanamina:
imagen52
y el sustrato de cetona de formula (II) es 2,2,2-trifluoro-1-p-toliletanona
imagen53
En algunas realizaciones, (S)-2,2,2-trifluoro-1-p-toliletanamina se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, (S)-2,2,2-trifluoro-1-p- toliletanamina producida es sustancialmente quiralmente pura. En ciertas realizaciones, (S)-2,2,2-trifluoro-1-p- toliletanamina producida en el proceso es quiralmente pura.
En algunas realizaciones del proceso, la amina producto de formula (I) es (S)-2,2,2-trifluoro-1-(4- (trifluorometilo)fenilo) etanamina:
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen54
y el sustrato de cetona de formula (II) es 2,2,2-trifluoro-1-(4-(trifluorometilo)fenilo)etanona:
imagen55
En algunas realizaciones, (S)-2,2,2-trifluoro-1-(4-(trifluorometilo)fenilo)etanamina se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, (S)- 2,2,2-trifluoro-1-(4-(trifluorometilo)fenilo)etanamina producida es sustancialmente quiralmente pura. En ciertas realizaciones, (S)-2,2,2-trifluoro-1-(4-(trifluorometilo)fenilo)etanamina producida en el proceso es quiralmente pura.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen56
y el sustrato de cetona de formula (II) es:
imagen57
en la que R7 es un C1-C4 alquilo opcionalmente sustituido y R10 es hidrogeno, halogeno, amino o amino sustituido, C1-C4 alquilo, C1-C4 alquilo sustituido por halo, nitro, ciano, tiociano, o alcoxi. En algunas realizaciones, R10 es R9 descrito arriba. En algunas realizaciones, R10 es H o F. En algunas realizaciones, R7 es C1-C4 alquilo.
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
5
10
15
20
25
30
35
40
45
50
55
60
65
ilo) propanoato:
imagen58
y el sustrato de cetona de formula (II) es etilo de 3-oxo-3-(pirindin-2-ilo)propanoato:
imagen59
En algunas realizaciones, (R)-etilo-3-amino-3-(piridina-2-ilo)propanoato se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, (R)-etilo-3- amino-3-(piridina-2-ilo)propanoato producido es sustancialmente quiralmente puro. En ciertas realizaciones, (R)- etilo-3-amino-3-(piridina-2-ilo)propanoato producido en el proceso es quiralmente puro.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
NH2
imagen60
en la que R11 es halogeno, OH, -C(O)R4, -OC(O)R5 o NR6R7, donde R4, R5, R6, R7 y R10 se ha definido
anteriormente, y el sustrato de cetona de formula (II) es:
imagen61
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones, el producto de amina de formula (I) es (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina:
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen62
y el sustrato de cetona de formula (II) es 4-cloro-1-(2-fluorofenilo)butan-1-ona:
imagen63
En algunas realizaciones, (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, (S)-4-cloro-1- (2-fluorofenilo)butan-1-amina producida es sustancialmente quiralmente pura. En ciertas realizaciones, (S)-4-cloro-1- (2-fluorofenilo)butan-1-amina producida en el proceso es quiralmente pura.
En algunas realizaciones, el proceso utilizando los biocatalizadores de transaminasas se puede utilizar para preparar el compuesto de formula (III):
imagen64
tienen la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *, en un exceso enantiomerico sobre el enantiomero opuesto, en el que R10 es como se define anteriormente. El procedimiento para preparar el producto de amina del compuesto (III) puede comprender:
(a) poner en contacto un sustrato de cetona de formula
imagen65
en la que R10 y R11 son como se definen anteriormente, con un polipeptido de transaminasa se describe en este documento en presencia de un donante de amino en condiciones de reaccion adecuadas para la conversion del sustrato de cetona a un producto de amina de formula:
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen66
y
(b) ciclar el producto de amina en condiciones adecuadas para formar el compuesto de formula (III).
En algunas realizaciones, el producto de amina ciclada para la formula (III) en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones, el sustrato de cetona es 4-cloro-1-(2-fluorofenilo)butan-1-ona:
imagen67
y el producto de amina es (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina:
imagen68
formando de esta manera (R)-2-(2-fluorofenilo) pirrolidina:
imagen69
en exceso enantiomerico.
En algunas realizaciones, el (R)-2-(2-fluorofenilo)pirrolidina se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, (R)-2-(2- fluorofenilo)pirrolidina producida es sustancialmente quiralmente pura. En ciertas realizaciones, (R)-2-(2- fluorofenilo)pirrolidina producida en el proceso es quiralmente pura.
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen70
en la que R9 como se define anteriormente, y el sustrato de cetona de formula (II) es
imagen71
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen72
en la que R9 como se define anteriormente, y el sustrato de cetona de formula (II) es
imagen73
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen74
5
10
15
20
25
30
35
40
45
50
55
60
65
en la que R9 como se define anteriormente, y el sustrato de cetona de formula (II) es
imagen75
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen76
en la que R9 como se define anteriormente, y el sustrato de cetona de formula (II) es
imagen77
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen78
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen79
En algunas realizaciones del proceso, el producto de amina de formula (I) es:
imagen80
en la que R9 como se define anteriormente, y el sustrato de cetona de formula (II) es:
imagen81
En algunas realizaciones, el producto de amina en el proceso anterior se produce en al menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 96%, o 99% o mas de exceso enantiomerico. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos sustancialmente quiralmente puros. En algunas realizaciones, los compuestos producidos en el proceso anterior son compuestos quiralmente puros.
Como se senalo anteriormente, los procesos descritos anteriormente se llevan a cabo en condiciones de reaccion adecuados para la conversion del sustrato de cetona al producto de amina quiral correspondiente en exceso enantiomerico. En algunas realizaciones, las condiciones de reaccion comprenden una temperatura de aproximadamente 20°C a aproximadamente 65°C. En algunas realizaciones las condiciones de reaccion comprenden una temperatura de aproximadamente 40°C a aproximadamente 65°C. En algunas realizaciones las condiciones de reaccion comprenden una temperatura de aproximadamente 50°C a aproximadamente 65°C. Por ejemplo, para el proceso utilizando el siguiente sustrato cetona:
imagen82
las condiciones de reaccion comprenden una temperatura de 40°C a 65°C. Una temperatura ejemplar es 60°C.
En algunas realizaciones las condiciones de reaccion bajo las cuales se llevan a cabo los procesos descritos anteriormente comprenden un pH de aproximadamente 7,0 a aproximadamente 11,0. En algunas realizaciones las condiciones de reaccion comprenden un pH de aproximadamente 7,0 a aproximadamente 9,0. En algunas realizaciones, las condiciones de reaccion para el proceso es un pH de aproximadamente 8,5. Mientras que el pH se puede ajustar durante el proceso utilizando cualquier base y/o acido, en algunas realizaciones, el pH se
5
10
15
20
25
30
35
40
45
50
55
60
65
puede mantener mediante la adicion de isopropilamina, que tambien proporciona una fuente de donante de amino para empujar el equilibrio de la reaccion hacia la formacion del producto amina.
Diversos disolventes organicos se pueden utilizar en el proceso para facilitar la reaccion de la enzima y para colocar el sustrato y/o producto en solucion. En algunas realizaciones del procedimiento, el disolvente organico comprende un disolvente polar, tal como metanol o dimetilsulfoxido (DMSO). En algunas realizaciones, el disolvente organico es DMSO, que puede estar presente desde aproximadamente 10% a aproximadamente 40% volumen/volumen (v/v). En algunas realizaciones, el disolvente organico es DMSO, que puede estar presente desde aproximadamente 10% a aproximadamente 50% volumen/volumen (v/v). En algunas realizaciones, el DMSO esta presente en aproximadamente 40% v/v.
Como se discutio anteriormente, el donante de grupo amino utilizado en el proceso puede ser una amina quiral o una amina aquiral. Un donante de grupo amino aquiral tiene la ventaja de no estar limitado en su reaccion a un estereoisomero espedfico, por lo que requiere menos de la donante de grupo amino. Diversos donantes de grupos de amino adecuados se pueden utilizar, incluyendo, a modo de ejemplo y no de limitacion, isopropilamina (tambien referido como 2-aminopropano), L, D o DL alanina, fenilalanina, glutamato, glutamina, leucina (o cualesquiera otros (-aminoacidos adecuados), acido 3-aminobutmco (o cualesquiera otros ©-aminoacidos adecuados), y metilbencilamina. En algunas realizaciones, el donante de grupo amino es isopropilamina. En algunas realizaciones, otros donantes de grupos amino se pueden utilizar, incluyendo, entre otros, (-fenetilamina (tambien denominada 1-feniletanamina), y sus enantiomeros (S)-l-feniletanamina y (R)-l-feniletanamina, 2-amino-4- fenilbutano, glicina, acido L-glutamico, L-glutamato, glutamato monosodico, acido L-aspartico, L-lisina, L-ornitina, ©-alanina, taurina, n-octilamina, ciclohexilamina, 1,4-butanodiamina, 1,6-hexanodiamina, 6-aminohexanoico, acido 4-aminobutmco, tiramina, y bencilamina, 2-aminobutano, 2-amino-1-butanol, 1-amino-1-feniletano, 1-amino-1-(2- metoxi-5-fluorofenilo) etano, 1-amino-1-fenilpropano, 1-amino-1-(4-hidroxifenil)propano, 1-amino-1-(4- bromofenilo)propano, 1-amino-1-(4-nitrofenilo)propano, 1-fenilo-2-aminopropano, 1-(3-trifluorometilfenilo)-2- aminopropano, 2-aminopropanol, 1-amino-1-fenilbutano, 1-fenilo-2-aminobutano, 1-(2,5-dimetoxi-4-metilfenilo)-2- aminobutano, 1-fenilo-3-aminobutano, 1-(4-hidroxifenilo)-3-aminobutano, 1-amino-2-metilciclopentano, 1-amino-3- metilciclopentano, 1-amino-2-metilciclohexano, 1-amino-1-(2-naftilo)etano, 3-metilciclopentilamina, 2- metilciclopentilamina, 2-etilciclopentilamina, 2-metilciclohexilamina, 3-metilciclohexilamina, 1-aminotetralina, 2- aminotetralina, 2-amino-5-metoxitetralina, y 1-amino-indano, incluyendo isomeros unicos tanto (R) como (S) cuando sea posible y que incluye todas las sales posibles de las aminas.
En algunas realizaciones de los procesos anteriores, el paso en el proceso puede comprender ademas la eliminacion del subproducto de carbonilo formado a partir del donante de grupo amino cuando el grupo amino se transfiere al aceptor del grupo amino. Tal eliminacion in situ puede reducir la velocidad de la reaccion inversa de tal manera que la reaccion directa domina y mas sustrato se convierte entonces en el producto.
La eliminacion del subproducto de carbonilo se puede realizar de un numero de maneras. Cuando el donante de grupo amino es un aminoacido, tal como alanina, el subproducto de carbonilo, un acido ceto, puede ser eliminado por reaccion con un peroxido (vease, por ejemplo, US 2008/0213845). Los peroxidos que se pueden usar incluyen, entre otros, peroxido de hidrogeno; peroxiacidos (peracidos), tales como acido peracetico (CH3CO3H), acido trifluoroperacetico y acido metacloroperoxibenzoico; peroxidos organicos tales como peroxido de t-butilo ((CH3)3COOH), u otros oxidantes selectivos tales como perrutenato de tetrapropilamonio, MNO2, KMnO4, tetroxido de rutenio y compuestos relacionados. Alternativamente, la eliminacion de piruvato se puede lograr a traves de su reduccion a lactato mediante el empleo de deshidrogenasa de lactato para desplazar el equilibrio al producto de amina (vease, por ejemplo, Koszelewski et al "2008, Adv Syn Catal 350: 2761-2766). Eliminacion de piruvato tambien se puede lograr a traves de su descarboxilacion a acetaldehfdo dioxido de carbono mediante el empleo de descarboxilasa de piruvato (vease, por ejemplo, Hohne et al, 2008, ChemBioChem. 9: 363-365).
En algunas realizaciones, donde la eleccion de los resultados de donante de grupo amino en un subproducto de carbonilo que tiene una presion de vapor mayor que el agua (por ejemplo, un co-producto de punto de ebullicion bajo tal como un compuesto de carbonilo organico volatil), el subproducto de carbonilo puede eliminarse mediante burbujeo de la solucion de reaccion con un gas no-reactivo o mediante la aplicacion de un vacfo para reducir la presion de reaccion y la eliminacion del subproducto de carbonilo presente en la fase de gas. Un gas no reactivo es cualquier gas que no reacciona con los componentes de reaccion. Varios gases no reactivos incluyen nitrogeno y gases nobles (por ejemplo, gases inertes). En algunas realizaciones, el gas no reactivo es gas nitrogeno.
En algunas realizaciones, el donante de aminoacidos utilizado en el proceso es isopropilamina, que forma la acetona de subproducto de carbonilo despues de la transferencia del grupo amino al aceptor de grupo amino. la acetona puede ser eliminada por burbujeo con gas nitrogeno o la aplicacion de un vacfo a la solucion de reaccion y la eliminacion de la acetona a partir de la fase de gas por una trampa de acetona, tal como un condensador u otra trampa fna. Alternativamente, la acetona puede ser eliminada por reduccion a isopropanol utilizando una cetorreductasa.
En algunas realizaciones de los procesos anteriores donde se elimina el subproducto de carbonilo, el donante de grupo amino correspondiente se puede anadir durante la reaccion de transaminacion para reponer el
5
10
15
20
25
30
35
40
45
50
55
60
donante de grupo amino y/o mantener el pH de la reaccion. la reposicion del donante de grupo amino tambien desplaza el equilibrio hacia la formacion de producto, aumentando de este modo la conversion de sustrato a producto. Por lo tanto, en algunas realizaciones en el que el donante de grupo amino es iso-propilamina y el producto de acetona se elimina in situ, isopropilamina se puede anadir a la solucion para reponer el donante de grupo amino perdido durante la extraccion de acetona y para mantener el pH de la reaccion (por ejemplo, a aproximadamente 8,5). Alternativamente, en realizaciones en las que se utiliza un aminoacido como donante de grupo amino, subproducto de carbonilo de acido ceto se puede reciclar de vuelta al aminoacido por reaccion con amoniaco y NADH usando una enzima de deshidrogenasa de aminoacido apropiado, reponiendo de este modo el donante de grupo amino.
El sustrato de cetona puede estar presente en cantidades apropiadas, dependiendo de factores, entre otros, tales como la naturaleza del disolvente, la estabilidad de la transaminasa a temperatura de reaccion, la cantidad y la actividad de la enzima. En algunas realizaciones, el sustrato esta presente en 5 a 50 g/L. En algunas realizaciones, el sustrato esta presente en 5-25 g/L.
En algunas realizaciones, el procedimiento descrito anteriormente comprende poner en contacto el sustrato ceto en aproximadamente 10 a 50 g/L con aproximadamente 1 a 20 g/L de una transaminasa descrita en este documento en condiciones de reaccion de pH 7,5 a 9,0 y una temperatura de 40 a 60°C en presencia de isopropilamina de aproximadamente 1 M a aproximadamente 2 M, en el que al menos 80%, 85%, 90%, 92%, 94%, 96%, o 98% o mas del sustrato se convierte en producto en 24 h. En algunas realizaciones, el polipeptido de transaminasa capaz de llevar a cabo la reaccion anterior comprende una secuencia de aminoacidos correspondientes a la SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, 102, 110 o 166.
En algunas realizaciones, los procedimientos anteriores pueden comprender ademas la etapa de aislar los productos de amina, tales como los productos de amina de formulas estructurales (I), (III), o (V), a partir de la mezcla de reaccion.
Tambien se proporcionan en este documento composiciones de las transaminasas y sustratos/productos. En algunas realizaciones, las composiciones pueden comprender los productos de amina de formulas estructurales (I), (III), o (V) y una transaminasa de la descripcion. Una cualquiera o mas de las transaminasas modificadas pueden ser parte de la composicion.
En algunas realizaciones, las composiciones pueden comprender ademas un donante de grupo amino. En algunas realizaciones de las composiciones, el donante de grupo amino puede comprender isopropilamina, alanina, acido 3-aminobutmco, o metilbencilamina. En algunas realizaciones de las composiciones, el donante de grupo amino es un isopropilamina.
Los procedimientos de la descripcion son utiles para la produccion de diversos productos intermedios para la smtesis de isomeros y derivados de moleculas farmaceuticas. Por ejemplo, los procesos de la divulgacion que producen compuestos de formula (I), se pueden utilizar en la smtesis de moleculas tales como Odanacatib o derivados relacionados, un inhibidor selectivo de catepsina K en investigacion para la prevencion de recambio oseo en pacientes con cancer. Odanacatib tiene la siguiente estructura:
imagen83
Los procesos que producen compuestos de formula (I) se pueden usar para hacer productos intermedios para la smtesis de ciertos tiadaizoles tales como la molecula a continuacion. Los tiadaizoles son ligandos de receptores de CXC y CC-quimiocinas, que tengan propiedades anti-inflamatorias y anti-tumorales (documento WO 2005/066147).
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen84
Los procedimientos de la divulgacion que producen compuestos de formula (V) se pueden usar para sintetizar compuestos tales como:
imagen85
El documento WO 2008/128647 describe derivados de quinolina-carboxamida similares como antagonistas de P2Y12 que son potencialmente utiles en el tratamiento de trastornos cardiovasculares.
5.4 Polipeptidos y polinucleotidos de transaminasas
Como se senalo anteriormente, los polipeptidos de transaminasa usados en los metodos anteriormente descritos inicialmente se identificaron basandose en su capacidad para convertir el sustrato de cetoamida 4-oxo-4- [3-(trifluorometilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)-ilo]-1-(2,4,5-trifluorofenilo)butan-2-ona ("el sustrato de cetoamida sitagliptina") para el producto (2R)-4-oxo-4-[3-(trifluorometilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina- 7(8H)-ilo]-1-(2,4,5-trifluorofenilo)butan-2-amina para la smtesis de sitagliptina. El polipeptido de transaminasa de la SEQ ID NO; 2 no lleva a cabo de manera eficiente la reaccion de transaminacion. Estos polipeptidos de transaminasas pueden describirse en relacion con su actividad hacia el sustrato de cetoamida de sitagliptina, o para los sustratos descritos en el presente documento.
Las transaminasas, incluyendo las descritas en el presente documento, contienen tipicamente una coenzima, el fosfato de piridoxal (PLP), que participa en la reaccion de transaminacion. PLP puede ser proporcionado por la celula huesped en la que se sintetiza el polipeptido, o se proporciona mediante la adicion de PLP a una solucion del polipeptido. Mientras que la transaminasa se describe con respecto a la secuencia de aminoacidos, se entendera por los expertos en la tecnica que el polipeptido activo contiene PLP o un analogo adecuado como coenzima.
Como se senalo anteriormente, en algunas realizaciones, el polipeptido de transaminasa tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91% 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia de aminoacidos con la SEQ ID NO: 4 y es capaz de convertir el sustrato de cetona al producto de amina a una velocidad que esta mejorado en comparacion con la transaminasa de la SEQ ID NO: 2.
5
10
15
20
25
30
35
40
45
50
55
60
65
En algunas realizaciones, el polipeptido de transaminasa tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia de aminoacidos con la SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, o 102, y es capaz de convertir el sustrato de cetona al producto amina a una tasa que esta mejorado en comparacion con la transaminasa de la SEQ ID NO: 2.
En algunas realizaciones, los polipeptidos de transaminasa modificados comprenden una secuencia de aminoacidos que tiene una o mas diferencias de residuos en comparacion con una secuencia de referencia de transaminasa. Las diferencias de residuos pueden ser sustituciones no conservativas, sustituciones conservadoras, o una combinacion de sustituciones no conservadoras y conservadoras. Con respecto a las diferencias de residuos y las descripciones de las posiciones de residuos, las transaminasas proporcionadas en este documento se pueden describir en referencia a la secuencia de aminoacidos de la transaminasa de origen natural de Arthrobacter sp KNK168, o la transaminasa de SEQ ID NO: 2, u otra transaminasa modificada, tal como el polipeptido de SEQ ID NO: 4. Para las descripciones del presente documento, la posicion de residuo de aminoacido en la secuencia de referencia se determina de la transaminasa a partir del residuo de metionina inicial (M) (es decir, M representa la posicion de residuo 1), aunque se entendera por el experto en la tecnica que este residuo de metionina inicial se puede eliminar mediante la maquinaria de procesamiento biologico, tal como en una celula huesped o en el sistema de traduccion in vitro, para generar una protema madura que carece del residuo de metionina inicial.
La posicion de la secuencia de polipeptido en la que esta presente un aminoacido particular o un cambio de aminoacidos ("diferencia de residuo") se describe a veces en el presente documento como "Xn", o "posicion n", donde n se refiere a la posicion del residuo con respecto a la secuencia de referencia.
Una mutacion de sustitucion espedfica, que es una sustitucion del residuo espedfico en una secuencia de referencia con un residuo especificado diferente pueden indicarse por la notacion convencional "X(numero)Y", donde X es el identificador de una sola letra del residuo en la secuencia de referencia, "numero" es la posicion del residuo en la secuencia de referencia, e y es el identificador de una sola letra de la sustitucion de residuos en la secuencia modificada.
En algunas realizaciones, las diferencias de residuos pueden ocurrir en una o mas de las siguientes posiciones de residuos: X4; X5; X8; X18; X25; X26; X27; X28; X30; X41; X42; X48; X49; X50; X54; X55; X60; X61; X62; X65; X69; X81; X94; X96; X102; X117; X120; X122; X124; X126; X136; X137; X138; X146; X148; X150; X152; X155; X156; X160; X163; X164; X169; X174; X178; X195; X199; X204; X208; X209; X211; X215; X217; X223; X225; X230; X252; X269; X273; X282, X284; X292; X297; X302; X306; X321; y X329. En algunas realizaciones, las diferencias de residuos o combinaciones de los mismos, estan asociadas con las propiedades enzimaticas mejoradas. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 16, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 160 o diferencias residuales en las posiciones de residuos que no sean las posiciones espedficas indicadas por "Xn" mencionadas anteriormente. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de residuos de aminoacidos. En algunas realizaciones, las diferencias residuales en otras posiciones de residuos comprenden sustituciones con residuos de aminoacidos conservadores.
En las realizaciones del presente documento, las diferencias de residuos en comparacion con la SEQ ID NO: 2 en las posiciones de residuos que afectan a la union de sustrato en la transaminasa permite alojamiento de diversos sustratos de cetoamida. Sin estar ligado por la teona, al menos dos regiones, una primera region de union al sustrato y una region de union al segundo sustrato, interactuan con los diferentes elementos estructurales de sustratos de cetoamida. La primera region de union comprende posiciones de los residuos X62, X136, X137, X195, X199, X208, X209, X223, X225, X282 y, mientras que la segunda region de union comprende posiciones de los residuos X69, X122, y X284. En consecuencia, los polipeptidos de transaminasa en el presente documento tienen una o mas diferencias residuales en las posiciones de residuos que comprenden X62, X69, X122, X136, X137, X195, X199, X208, X209, X223, X225, X282, y X284. En algunas realizaciones, los polipeptidos de transaminasa en el presente documento tienen por lo menos dos o mas, tres o mas, cuatro o mas, cinco o mas, o seis o mas diferencias residuales en las posiciones de los residuos especificados asociados con la union del sustrato.
En algunas realizaciones, las diferencias de residuos en comparacion con SEQ ID NO: 2 se encuentran en una o mas de las posiciones de residuos que forman una primera region de union de sustrato comprendida de posiciones de los residuos X62, X136, X137, X195, X199, x208, X209, X223, X225, y X282. Por consiguiente, en algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos una diferencia de residuo en comparacion con SEQ ID NO: 2 en las posiciones de residuos X62, X136, X137, X195, X199, X208, X209, X223, X225, y X282.
En algunas realizaciones, las diferencias de residuos en comparacion con la SEQ ID NO: 2 se encuentran en una o mas de las posiciones de residuos que forman una segunda region de union de sustrato comprendida de posiciones de los residuos X69, X122, y X284. Por consiguiente, en algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos una diferencia de residuo en comparacion con SEQ ID NO: 2 en las posiciones de residuos X69, X122, y X284.
5
10
15
20
25
30
35
40
45
50
55
60
65
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye diferencias residuales en la primera region de union en combinacion con diferencias residuales en la segunda region de union. Por consiguiente, en algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye una o mas diferencias de residuo en comparacion con SEQ ID NO: 2 en las posiciones de residuos X62, X136, X137, X195, X199, X208, X209, X223, X225, y X282 en combinacion con una o mas diferencias de residuo en comparacion con SEQ ID NO: 2 en las posiciones de residuos X69, X122, y X284.
En algunas realizaciones de las transaminasas modificadas de la descripcion, los residuos de aminoacidos en una posicion de residuo pueden ser definidos en terminos de "caractensticas" de aminoacido (por ejemplo, el tipo o la propiedad de aminoacidos) que puede aparecer en esa posicion. Asf, en algunas realizaciones, los residuos de aminoacidos en las posiciones especificadas anteriormente se pueden seleccionar de las siguientes caractensticas: X4 es un residuo aromatico; X5 es un residuo basico; X8 es un residuo restringido; X18 es una cistema (C) o un residuo alifatico; X25 es un residuo polar; X26 es un residuo aromatico o restringido; X27 es un residuo polar; X28 es un residuo restringido; X30 es un residuo polar o no polar; X41 es un residuo restringido o polar; X42 es un residuo no polar; X48 es un residuo polar, acido, alifatico o no polar; X49 es un residuo polar; X50 es un residuo alifatico; X54 es un residuo restringido; X55 es un residuo alifatico; X60 es un residuo aromatico; X61 es un residuo aromatico; X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X69 es una cistema (C) o residuo no polar, polar, o alifatico; X81 es un residuo no polar; X94 es un residuo alifatico; X96 es un residuo alifatico; X102 es un residuo basico alifatico o; X117 es un residuo no polar; X120 es un residuo aromatico; X122 es un residuo nopolar o alifatico constrenido,; X124 es un residuo polar o restringido; X126 es un residuo polar; X136 es un residuo aromatico; X137 es un residuo polar o alifatico; X138 es un residuo basico o restringido; X146 es un residuo basico; X148 es un residuo alifatico o aromatico; X150 es un residuo aromatico, limitado o polar; X152 es una cistema (C), un residuo no polar, alifatico, o polar; X155 es un residuo no polar o polar; X156 es un residuo polar; X160 es un residuo alifatico; X163 es un residuo alifatico o restringido; X164 es un residuo alifatico o restringido; X169 es un residuo alifatico; X174 es un residuo alifatico; X178 es un residuo polar; X195 es un residuo aromatico o polar; X199 es un residuo alifatico o aromatico; X204 es un residuo alifatico; X208 es una cistema (C) o un residuo restringido, no polar, aromatico, polar, o basico; X209 es un residuo alifatico; X211 es un residuo alifatico; X215 es una cistema (C); X217 es un residuo polar; X223 es un residuo restringido; X225 es un residuo aromatico; X230 es un residuo alifatico; X252 es un residuo aromatico o alifatico; X269 es un residuo restringido; X273 es un residuo aromatico; X282 es un residuo polar; X284 es un residuo no polar; X292 es un residuo polar; X297 es un residuo polar; X302 es un residuo alifatico; X306 es un residuo alifatico; X321 es un residuo restringido, y X329 es un residuo constrenido o aromatico. En algunas formas de realizacion, donde el residuo de aminoacido en la posicion del residuo correspondiente de la secuencia de referencia esta abarcado dentro de la categona de aminoacidos descrita para la posicion especificada, un aminoacido diferente dentro de esa categona de aminoacidos se puede utilizar a la luz de la orientacion proporcionada en este documento.
En algunas realizaciones, el residuo de aminoacido en las posiciones de los residuos especificados anteriormente puede ser seleccionado de las siguientes caractensticas: X4 es Y, F o W, particularmente Y; X5 es K o R, particularmente K; X8 es H o P, particularmente P; X18 es C, A, V, o I, particularmente C o I; X25 es N, Q, S, o T, particularmente Q; X26 es F, W, H o P, particularmente H; X27 es N, Q, S, o T, particularmente T; X28 es P o H, particularmente P; X30 es N, Q, S, T, G, M, A, V, L o I, particularmente Q o M; X41 es P, H, N, Q, S, o T, particularmente H o S; X42 es G, M, A, V, L o I, particularmente G; X48 es N, Q, S, T, D, E, G, M, A, V, L, o I, particularmente Q, D, V, G, o A; X49 es N, Q, o T, particularmente T; X50 es A, V, L o I, especialmente L; X54 es P o H; X55 es A, V, L o, particularmente V; X60 es F o W, particularmente F; X61 es Y, F o W, particularmente Y; X62 es
S, T, N, Q, Y, F o W, particularmente T, Y o F; X65 es A, L o I, particularmente A; X69 es C, G, M, A, LI, S, T, N o Q, particularmente G, C, T, A, o S; X81 es G, M, A, V, L, I, particularmente G; X94 es A, V, L o I, particularmente I o L; X96 es A, V o L, particularmente L; X102 es A, V, L, I, K o R, particularmente L o K; X117 es G, M, A, V, L o I, particularmente G; X120 es Y, W o F, particularmente Y; X122 es G, M, A, V, I, L, P o H, particularmente M, I, L, V, o H; X124 es T, N, Q, P, o H, particularmente T, H o N; X 126 es N, Q, o T, particularmente T; X136 es Y, F o W, particularmente Y o F; X137 es S, T, N, Q, A, V, L o I, particularmente T o I; X138 es K, P o H, particularmente K o P; X146 es K o R, particularmente R; X148 es A, V, LI, W, o F, particularmente A o F; X150 es F, W, H, P, S, T, N, o Q, particularmente F, H, o S; X152 es C, G, M, A, L, I, S, T, N, o Q, particularmente I, L, S o C; X155 es N, S, T, G, M, A, V, L o I, particularmente H, V o T; X156 es N, Q, S, o T, particularmente Q; X160 es A, V, L o I, especialmente L; X163 es P, H, A, V, o L, particularmente H o V; X164 es A, V, L, I, P o H, particularmente V o P; X169 es V, L o I, especialmente L; X174 es A, V, L o I, particularmente A; X178 es S, N, o Q, particularmente S; X195 es F, Y, W, S,
T, N o Q, particularmente F o Q; X199 es A, L, I, Y, F, W, particularmente W o I; X204 es A, V, L, o I, particularmente A; X208 es H, C, G, K, N, Y, D o S; X209 es V, L o I, especialmente L; X211 es A, V, o I, particularmente I; X215 es C; X217 es S, T, N o Q, particularmente N; X223 es H o P, particularmente P; X225 es W o Y, particularmente Y; X230 es A, V, o L, particularmente V; X252 es A, V, I, Y, F o W, particularmente F; X269 es H o P, particularmente P; X273 es Y, F o W, particularmente Y; X282 es S, N o Q, particularmente S; X284 es G, M, V, L o I, particularmente G; X292 es T, N, o Q, particularmente T; X297 es S, T, N o Q, particularmente S; X302 es A, L, o I, particularmente A; X306 es A, L o I, especialmente L; X321 es H o P, particularmente P; y X329 es H, P, Y, F, o W, particularmente H.
En algunas realizaciones, el residuo de aminoacido en las posiciones de los residuos especificados anteriormente puede ser seleccionado de las siguientes caractensticas: X4 es Y; X5 es K; X8 es P; X18 es C o I;
5
10
15
20
25
30
35
40
45
50
55
60
65
X25 es Q; X26 es H; X27 es T; X28 es P; X30 es Q o M; X41 es H o S; X42 es G; X48 es Q, D, V, G, o A; X49 es T; X50 es L; X54 es P o H; X55 es V; X60 es F; X61 es Y; X62 es T, Y o F; X65 es A; X69 es G, C, T, A, o S; X81 es G; X94 es I o L; X96 es L; X102 es L o K; X117 es G; X120 es Y; X122 es M, I, L, V, o H; X124 T, H o N; X 126 es T; X136 es Y o F; X137 es T o I; X138 es K o P; X146 es R; X148 es A o F; X150 es F, H, o S; X152 es I, L, S o C; X155 es M, V o T; X156 es Q; X160 es L; X163 es H o V; X164 es V o P; X169 es L; X174 es A; X178 es S; X195 es F o Q; X199 es W o I; X204 es A, V, L, o I, en particular A; X208 es H, C, G, K, N, Y, D o S; X209 es L; X211 es I; X215 es C; X217 es N; X223 es P; X225 es Y; X230 es V; X252 es F; X269 es P; X273 es Y; X282 es S; X284 es G; X292 es T; X297 es S; X302 es A; X306 es L; X321 es P; y X329 es H.
En algunas realizaciones, el residuo de aminoacido en las posiciones de los residuos especificados anteriormente puede ser seleccionado de las siguientes caractensticas: X8 es P; X60 es F; X61 es Y; X62 es T, Y o F; X65 es A; X69 es G, C, T, A, o S; X81 es G; X94 es I o L; X96 es L; X122 es M, I, L, V, o H; X124 T, H o N; X136 es Y o F; X169 es L; X178 es S; X199 es W o I; X209 es L; X215 es C; X217 es N; X223 es P; X269 es P; X273 es Y; X282 es S; X284 es G; X297 es S; X321 es P y X329 es H.
En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye una o mas de las siguientes caractensticas: residuo correspondiente a X69 es cistema (C) o un residuo no polar, polar, o alifatico; residuo correspondiente a X122 es un residuo constrenido, no polar o alifatico; residuo correspondiente a X223 es un residuo restringido; y residuo correspondiente a X284 es un residuo no polar.
En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: (1) residuo correspondiente a X69 es C o un
residuo no-polar, alifatico o polar, y/o residuo correspondiente a X284 es un residuo no polar; (2) residuo
correspondiente a X122 es un residuo no polar o alifatico constrenido; y (3) el residuo correspondiente a X223 es un residuo restringido.

En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: X69 es C o un residuo no-polar, alifatico o polar; X122 es un residuo limitado, no polar o alifatico; y X223 es un residuo restringido.

En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: X69 es C, G, M, A, L, I, S, T, N o Q, en particular G, C, T, A, o S; X122 es G, M, A, V, L, I, P o H, en particular M, I, V, L, o H; y X223 es H o P, particularmente P.

En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: X122 es un residuo no-polar o alifatico constrenido; X223 es un residuo restringido; y X284 es un residuo no polar.

En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: X122 es G, M, A, V, L, I, P o H, en particular M, I, V, L o H; X223 es H o P particularmente P; y X284 es G, M, V, L o I, particularmente G.

En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: X69 es C o un residuo no polar, polar o alifatico; X122 es un residuo polar o alifatico constrenido, no; X223 es un residuo restringido; y X284 es un residuo no polar.

En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: X69 es C, G, M, A, L, I, S, T, N o Q, en particular G, C, T, A, o S; X122 es G, M, A, V, L, I, P o H, en particular M, I, V, L, o H; X223 es H o P, particularmente P; y X284 es G, M, A, V, L o I, particularmente G.

En algunas realizaciones, el polipeptido de transaminasa modificada comprende una secuencia de
aminoacidos que incluye al menos las siguientes caractensticas: X69 es C o T; X122 es M o I; X223 es P; y X284 es G.
En algunas realizaciones, los polipeptidos de transaminasa modificada con una o mas de las caractensticas o combinaciones de caractensticas especificadas en las posiciones de residuos X69, X122, X223 y X284, ademas, pueden tener una o mas diferencias de residuos en comparacion con la SEQ ID NO: 2 en las siguientes posiciones de residuos: X4; X5; X8; X18; X25; X26; X27; X28; X30; X41; X42; X48; X49; X50; X54; X55; X60; X61; X62; X65; X81; X94; X96; X102; X117; X120; X124; X126; X136; X137; X138; X146; X148; X150; X152; X155; X156; X160; X163; X164; X169; X174; X178; X195; X199; X204; X208; X209; X211; X215; X217; X225; X230; X252; X269; X273; X282; X292; X297; X306; X321; y X329. Ademas de las posiciones de residuos X69, X122, X223 y X284, estas otras posiciones de los residuos se asocian con efectos sobre diversas propiedades del polipeptido de transaminasa, y por lo tanto pueden tener diferencias de residuos en comparacion con SEQ ID NO: 2 a cambios deseables de efecto en las propiedades de enzima.
5
10
15
20
25
30
35
40
45
50
55
60
65
Como se senalo anteriormente, las posiciones de residuos X62, X136, X137, X195, X199, X208, X209, X225 y X282, junto con posiciones de los residuos X69, X122, X223 y X284, estan asociadas con la union del sustrato a la enzima, y por lo tanto el polipeptido de transaminasa puede tener diferencias residuales en estas posiciones recitadas en comparacion con SEQ ID NO: 2 a cambios deseables de efecto en la actividad enzimatica.
Posiciones de residuos X4, X5, X8, X26, X48, X60, X65, X81, X96, X102, X124, X160, X163, X169, X174, X178, X211, X217, X225, X230, X252, X269, X273, X292, X297, X306, X321, X329 tambien estan asociadas con incrementos adicionales en la actividad enzimatica, y por lo tanto el polipeptido de transaminasa pueden tener diferencias residuales en estas posiciones recitadas en comparacion con SEQ ID NO: 2 para efectuar cambios deseables adicionales en la actividad enzimatica, por ejemplo aumento en la eficiencia de la conversion en condiciones de carga alta del sustrato.
Posiciones de los residuos X18, X25, X27, X28, X30, X41, X42, X49, X50, X54, X55, X117, X120, X126, X138, X146, X148, X150, X152, X155, X156, X164, X204, X302 estan asociadas tambien con el aumento de la termoestabilidad y/o estabilidad de disolvente, tal como DMSO, y por lo tanto el polipeptido de transaminasa puede tener diferencias residuales en estas posiciones recitadas en comparacion con SEQ ID NO: 2 a cambios deseables de efecto en la termoestabilidad y/o estabilidad de disolvente.
Posiciones de los residuos X61, X94, X215 se asocian tambien con la capacidad de llevar a cabo la reaccion a altas concentraciones de isopropilamina de donante de amino, y por tanto el polipeptido de transaminasa puede tener diferencias residuales en estas posiciones recitadas en comparacion con SEQ ID NO: 2 para aumentar el efecto de la eficiencia de la conversion a concentraciones altas (por ejemplo, 1-2 M) de isopropilamina.
Es de entenderse que las diferencias de residuos de SEQ ID NO: 2 en las posiciones de residuos asociados con las diversas propiedades de las enzimas se pueden usar en varias combinaciones para formar polipeptidos de transaminasas que tienen caractensticas enzimaticas deseables, por ejemplo combinacion de aumentos en la actividad de la enzima, estabilidad de disolvente y templada, y la utilizacion de donante de amino. Combinaciones ejemplares se describen en la presente memoria.
En algunas realizaciones, los residuos de aminoacidos de las posiciones de los residuos especificados se pueden seleccionar de acuerdo con las descripciones anteriores. Por ejemplo, los residuos de aminoacidos pueden ser seleccionados en base a las siguientes caractensticas: X4 es un residuo aromatico; X5 es un residuo basico; X8 es un residuo restringido; X18 es una cistema (C) o un residuo alifatico; X25 es un residuo polar; X26 es un residuo aromatico o restringido; X27 es un residuo polar; X28 es un residuo restringido; X30 es un residuo polar o no polar; X41 es un residuo restringido o polar; X42 es un residuo no polar; X48 es un residuo acido, alifatico, no polar, o polar; X49 es un residuo polar; x5o es un residuo alifatico; X54 es un residuo restringido; X55 es un residuo alifatico; X60 es un residuo aromatico; X61 es un residuo aromatico; X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X81 es un residuo no polar; X94 es un residuo alifatico; X96 es un residuo alifatico; X102 es un residuo basico alifatico o; X117 es un residuo no polar; X120 es un residuo aromatico; X124 es un residuo polar o restringido; X126 es un residuo polar; X136 es un residuo aromatico; X137 es un residuo polar o alifatico; X138 es un residuo basico o restringido; X146 es un residuo basico; X148 es un residuo alifatico o aromatico; X150 es residuo aromatico, limitado o polar; X152 es residuo C, no polar, alifatico, o polar; X155 es residuo no polar o polar; X156 es un residuo polar; X160 es un residuo alifatico; X163 es un residuo alifatico o restringido; X164 es un residuo alifatico o restringido; X169 es un residuo alifatico; X174 es un residuo alifatico; X178 es un residuo polar; X195 es un residuo aromatico o polar; X199 es un residuo alifatico o aromatico; X204 es un residuo alifatico; x208 es cistema (C) o un residuo restringido, no polar, aromatico, polar, o basico; X209 es un residuo alifatico; X211 es un residuo alifatico; X215 es C; X217 es un residuo polar; X225 es un residuo aromatico; X230 es un residuo alifatico; X252 es un residuo aromatico o alifatico; X269 es un residuo restringido; X273 es un residuo aromatico; X282 es un residuo polar; X292 es un residuo polar; X297 es un residuo polar; X302 es un residuo alifatico; X306 es un residuo alifatico; X321 es un residuo restringido; y X329 es un residuo restringido o aromatico. Residuos de aminoacidos espedficos que se pueden utilizar en estas posiciones de residuos se han descrito anteriormente.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223 y X284 como se describio anteriormente, puede tener, ademas, una o mas de las siguientes caractensticas: X26 es un residuo aromatico o restringido; X61 es un residuo aromatico; X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X94 es un residuo alifatico; X136 es un residuo aromatico; X137 es un residuo polar o alifatico; X199 es un residuo alifatico o aromatico; X209 es un residuo alifatico; X215 es C; y X282 es un residuo polar.
En algunas realizaciones, ademas de las caractensticas anteriores, la secuencia de transaminasa de aminoacidos puede incluir adicionalmente una o mas de las siguientes caractensticas: X8 es un residuo restringido; X60 es un residuo aromatico; X81 es un residuo no polar o pequeno; X96 es un residuo alifatico; X124 es un residuo polar o restringido; X169 es un residuo alifatico; X217 es un residuo polar; X269 es un residuo restringido; X273 es un residuo aromatico; X297 es un residuo polar; y X321 es un residuo restringido.
5
10
15
20
25
30
35
40
45
50
55
60
65
aminoacidos puede incluir adicionalmente una o mas de las siguientes caractensticas: X4 es un residuo aromatico; X48 es un residuo acido, alifatico, no polar o polar; X102 es un residuo basico alifatico o; X150 es residuo aromatico, limitado o polar; X152 es C o un residuo no-polar, alifatico o polar; X160 es un residuo alifatico; X163 es un residuo alifatico o restringido; X174 es un residuo alifatico; X178 es un residuo polar; X195 es un residuo aromatico o polar; X208 es C o un residuo restringido, no polar, aromatico, polar, o basico; X211 es un residuo alifatico; X225 es un residuo aromatico; X230 es un residuo alifatico; X252 es un residuo aromatico o alifatico; X292 es un residuo polar; X306 es un residuo alifatico; y X329 es un residuo restringido o aromatico.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas de una o mas o combinaciones de caractensticas en las posiciones de residuos X69, X122, X223 y X284 como se describe anteriormente, incluye al menos las siguientes caractensticas adicionales: X26 es un residuo aromatico o constrenido, y/o X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X136 es un residuo aromatico; X199 es un residuo alifatico o aromatico; y X209 es un residuo alifatico.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes funciones adicionales: X61 es un residuo aromatico; X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X94 es un residuo alifatico; X136 es un residuo aromatico; X199 es un residuo alifatico o aromatico; X209 es un residuo alifatico; X215 es C, y X282 es un residuo polar.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes caractensticas adicionales: X8 es un residuo restringido; X61 es un residuo aromatico; X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X81 es un residuo no polar o pequeno; X94 es un residuo alifatico; X136 es un residuo aromatico; X199 es un residuo alifatico o aromatico; X209 es un residuo alifatico; X215 es un C; X217 es un
residuo polar; X269 es un residuo restringido; X282 es un residuo polar; X297 es un residuo polar; y X321 es un
residuo restringido.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes
caractensticas adicionales: X8 es un residuo restringido; X60 es un residuo aromatico; X61 es un residuo aromatico; X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X81 es un residuo no polar; X94 es un residuo alifatico; X96 es un residuo alifatico; X124 es un residuo polar o restringido; X136 es un residuo aromatico; X169 es un residuo alifatico; X199 es un residuo alifatico o aromatico; X209 es un residuo alifatico; X215 es C; X217 es un residuo polar; X269 es un residuo restringido; X273 es un residuo aromatico. X282 es un residuo polar; X297 es un residuo polar; y X321 es un residuo restringido.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes
caractensticas adicionales: X8 es un residuo restringido; X60 es un residuo aromatico; X61 es un residuo aromatico; X62 es un residuo aromatico o polar; X65 es un residuo alifatico; X81 es un residuo no polar; X94 es un residuo alifatico; X96 es un residuo alifatico; X124 es un residuo polar o restringido; X126 es un residuo polar; X136 es un residuo aromatico; X150 es un residuo aromatico, limitado o polar; X152 es una cistema (C), no polar, alifatico, o un residuo polar; X169 es un residuo alifatico; X199 es un residuo alifatico o aromatico; X209 es un residuo alifatico; X215 es C; X217 es un residuo polar; X269 es un residuo restringido; X273 es un residuo aromatico. X282 es un residuo polar; X297 es un residuo polar; y X321 es un residuo restringido.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223 y X284 como se describe anteriormente, incluye al menos las siguientes funciones adicionales: X26 es P, H, F, o W, en particular H, y/o X62 es S, T, N, Q, Y, F, o W, en particular T o F; X65 es A, L o I, en particular A; X136 es Y, F o W, particularmente Y o F; X199 es A, L, I, Y, F o W, particularmente W o I; y X209 es V, L o I, en particular L.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes caractensticas adicionales: X61 es Y, F o W, particularmente Y; X62 es S, T, N, Q, Y, F o W, en particular T o F; X65 es A, L o I, en particular A; X94 es A, V, L o I, particularmente I o L; X136 es Y, F o W, particularmente Y o F; X199 es A, L, I, Y, F o W, particularmente W o I; X209 es V, L o I, especialmente L; X215 es C; y X282 es S, N o Q, particularmente S.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes caractensticas adicionales: X8 es H o P, particularmente P; X61 es Y, F o W, particularmente Y; X62 es S, T, NQ, Y, F, o W, en particular T o F; X65 es A, L o I, en particular A; X81 es G, M, A, V, L o I, en particular G; X94 es A, V, L o I, particularmente I o L; X136 es Y, F o W, particularmente Y o F; X199 es A, L, I, Y, F o W, particularmente W o I; x209 es V, L o I, especialmente L; X215 es C; X217 es S, T, N, o Q, en particular N; X269 es H o P, particularmente
5
10
15
20
25
30
35
40
45
50
55
60
65
P; X282 es S, N o Q, particularmente S. X297 es S, T, N o Q, particularmente S; y X321 es H o P, particularmente P.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes
caractensticas adicionales: X8 es H o P, particularmente P; X60 es F o W, particularmente F; X61 es Y, F o W, particularmente Y; X62 es Y, F, W, S, T, N o Q, particularmente T o F; X65 es A, L o I, en particular A; X81 es G, M, A, V, L o I, en particular G; X94 es A, V, L o I, particularmente I o L; X96 es A, V o L, en particular L; X124 es P, H, T, N, o Q, particularmente T, H o N; X136 es Y, F o W, particularmente Y o F; X169 es V, L, o I, en particular L; X199 es Y, F, W, A, L o I, en particular W o I; X209 es V, L o I, especialmente L; X215 es C; X217 es S, T, N o Q, en particular N; X269 es H o P, particularmente P; X273 es Y, F o W, particularmente Y; X282 es S, No Q, particularmente S; X297 es S, T, N o Q, particularmente S; y X321 es H o P, particularmente P.
En algunas realizaciones, la transaminasa modificada que tiene las caractensticas en una o mas posiciones de residuos X69, X122, X223, X284 y como se describe anteriormente, incluye al menos las siguientes
caractensticas adicionales: X8 es H o P, particularmente P; X60 es F o W, particularmente F; X61 es Y, F o W, particularmente Y; X62 es Y, F, W, S, T, N o Q, particularmente T o F; X65 es A, L o I, en particular A; X81 es G, M, A, V, L o I, en particular G; X94 es A, V, L o I, particularmente I o L; X96 es A, V o L, en particular L; X124 es P, H, T, N, o Q, particularmente T, H o N; X 126 es N, Q, o T, en particular T; X136 es Y, F o W, particularmente Y o F; X150 es F, W, H, P, S, T, N, o Q, particularmente F, H, o S; X152 es C, G, M, A, L, I, S, T, N, o Q, en particular G, I, L, S o C; X169 es V, L, o I, en particular L; X199 es Y, F, W, A, L o I, en particular W o I; X209 es V, L o I, especialmente L; X215 es C; X217 es S, T, N o Q, en particular N; X269 es H o P, particularmente P; X273 es Y, F o W,
particularmente Y; X282 es S, N o Q, particularmente S; X297 es S, T, N o Q, particularmente S; y X321 es H o P, particularmente P.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X122 es un residuo restringido, no polar o alifatico, en particular H, I, L, V, o H; X223 es un residuo restringido, en particular P; X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1 - 9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de aminoacidos de referencia basada en SEQ ID NO: 2 que tiene las caractensticas descritas para los posiciones de los residuos especificados anteriores (es decir, X122; X223; y X284) (por ejemplo, SEQ ID NO: 8 o 10), con la condicion de que el polipeptido de transaminasa modificada comprende polipeptido comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para los residuos especificados.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X223 es un residuo restringido, en particular P; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 115, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1- 30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (es decir, X69; X122; X223; y X284) (por ejemplo, SEQ ID NO: 4), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que tiene al menos las caractensticas descritas para los residuos especificados.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; y X223 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 118, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia basada en SEQ ID NO: 2 que tiene las caractensticas descritas para las posiciones anteriores especificadas de residuos (por ejemplo, SEQ ID NO: 6), con la condicion de que el
5
10
15
20
25
30
35
40
45
50
55
60
65
polipeptido de transaminasa modificada comprende polipeptido comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para los residuos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 6.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X122 es un residuo restringido, no polar o alifatico, en particular M, I, L, V, o H; X174 es un residuo alifatico, en particular A; X223 es un residuo restringido, en particular P; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1- 30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 12), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 12.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X26 es un residuo aromatico o constrenido, en particular H; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X223 es un residuo restringido, en particular P; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1- 30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 14), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 14.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X26 es un residuo aromatico o constrenido, en particular H; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es residuo C o un no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X178 es un residuo polar, particularmente S; X199 es un residuo alifatico o aromatico, en particular W o I, en particular X223 es un residuo restringido, en particular P; X225 es un residuo aromatico, particularmente Y, X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1- 30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de residuos especificadas precedentes (por ejemplo, SEQ ID NO: 16), con la condicion de que el polipeptido de transaminasa modificada comprenda una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 16.
5
10
15
20
25
30
35
40
45
50
55
60
65
residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X223 es un residuo restringido, en particular P; X225 es un residuo aromatico, particularmente Y, X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 18), con la condicion de que el polipeptido de transaminasa modificada comprenda una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 18.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X26 es un residuo aromatico o constrenido, en particular H; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1- 30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 20, 22, 28, 30, 32, 34, 38 o 40), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 20, 22, 28, 30, 32, 34, 38 o 40.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X26 es un residuo aromatico o constrenido, en particular H; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X223 es un residuo restringido, en particular P; X225 es un residuo aromatico, particularmente Y, x282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1- 30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 24), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada pueden comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 24.
5
10
15
20
25
30
35
40
45
50
55
60
65
X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X174 es un residuo alifatico, en particular A; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X223 es un residuo restringido, en particular P; X230 es un residuo alifatico, particularmente V; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasa puede tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 135, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa alterada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 26), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 26.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X26 es un residuo aromatico o constrenido, en particular H; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 36), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 36.
En algunas realizaciones, las transaminasas modificadas comprenden una secuencia de aminoacidos que incluye al menos las siguientes caractensticas: X4 es un residuo aromatico, particularmente Y; X26 es un residuo aromatico o constrenido, en particular H; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, el polipeptido de transaminasa puede tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa alterada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 42), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 42.
5
10
15
20
25
30
35
40
45
50
55
60
65
X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es un C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 44, 46, o 48), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 44, 46, o 48.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular P; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo nopolar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es una cistema (C); X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 111, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 50), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 50.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X152 es C, residuo no polar, alifatico, o un polar, en particular G, I, L, S o C; X199 es un residuo alifatico o aromatico, en particular W o I; x209 es un residuo alifatico, en particular L; X215 es un C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 52), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 52.
5
10
15
20
25
30
35
40
45
50
55
60
65
o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es un C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 111, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 54 o 56), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas formas de realizacion, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 54 o 56.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es un C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, el polipeptido de transaminasa puede tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa alterada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 58 o 60), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 58 o 60.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X160 es un residuo alifatico, en particular L; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 62), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 62.
5
10
15
20
25
30
35
40
45
50
55
60
65
incluye las siguientes caractensticas: X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X137 es un residuo polar o alifatico, particularmente T o I; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; X284 es un residuo no polar, en particular G; y X306 es un residuo alifatico, particularmente L. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 64), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa alterada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 64.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X102 es un residuo alifatico o basico, en particular L o K; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X150 es residuo aromatico, limitado o polar, en particular F, H, o S; X152 es C, un residuo no polar, alifatico, o polar, en particular G, I, L, S o C; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es un C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 155, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 66), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 66.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X48 es un residuo polar, acido, alifatico o no polar, en particular D, V, G, Q o A; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo nopolar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X102 es un residuo basico o alifatico, en particular L o K; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X163 es un residuo alifatico o constrenido, en particular H o V; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X211 es un residuo alifatico, particularmente I; X215 es un C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X252 es un residuo aromatico o alifatico, particularmente F; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1- 9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 68), con la condicion que el polipeptido
5
10
15
20
25
30
35
40
45
50
55
60
65
de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99 % identica a una secuencia de referencia de SEQ ID NO: 68.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X48 es un residuo polar, acido, alifatico o no polar, en particular A; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo restringido, no polar o alifatico, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 70), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 70.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X223 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, particularmente G. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 115, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 72), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 72.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X178 es un residuo polar, particularmente S; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 18, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser
5
10
15
20
25
30
35
40
45
50
55
60
65
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 74), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 74.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo restringido, no polar o alifatico, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X152 es C o un residuo no-polar, alifatico, o polar, en particular G, I, L, S o C; X178 es un residuo polar, particularmente S; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X252 es un residuo aromatico o alifatico, particularmente F; X269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; x297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 118, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 76), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas formas de realizacion, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 76.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo restringido, no polar o alifatico, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X169 es un residuo alifatico, en particular L; X178 es un residuo polar, particularmente S; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X292 es un residuo polar, particularmente T; X297 es un residuo polar, particularmente S; y x321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa alterada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 78), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacido que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 78.
5
10
15
20
25
30
35
40
45
50
55
60
65
particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo constrenido, no polar o alifatico, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; x269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo constrenido, particularmente P. En algunas realizaciones, los polipeptidos de transaminasa puede tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1- 10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 80), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas formas de realizacion, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 80.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo constrenido, no polar o alifatico, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X169 es un residuo alifatico, en particular L; X178 es un residuo polar, particularmente S; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 82), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas formas de realizacion, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 82 p.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo constrenido, no polar o alifatico, en particular M, I, L, V, o H; X124 es un residuo polar o constrenido, particularmente T, H o N; X136 es un residuo aromatico, particularmente Y o F; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras
5
10
15
20
25
30
35
40
45
50
55
60
65
posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 84, 86, 88, 96, 98, o 100), con la condicion de que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa alterada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 84, 86, 88, 96, 98, o 100.
En algunas realizaciones, la transaminasa alterada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo constrenido, no polar o alifatico, en particular M, I, L, V, o H; X136 es un residuo aromatico, particularmente Y o F; X150 es residuo aromatico, limitado o polar, en particular F, H, o S; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasa puede tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 110, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 90), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 90.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X124 es un residuo polar o constrenido, particularmente T, H o N; X136 es un residuo aromatico, particularmente Y o F; X150 es residuo aromatico, limitado o polar, en particular F, H, o S; X152 es C o un residuo no-polar, alifatico, o polar, en particular G, I, L, S o C; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es un C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 teniendo las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 92), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 92.
5
10
15
20
25
30
35
40
45
50
55
60
65
particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo constrenido, no polar o alifatico, en particular M, I, L, V, o H; X124 es un residuo polar o constrenido, particularmente T, H o N; X136 es un residuo aromatico, particularmente Y o F; X150 es residuo aromatico, limitado o polar, en particular F, H, o S; X152 es C o un residuo no-polar, alifatico, o polar, en particular G, I, L, S o C; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es un C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 94), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 94.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo constrenido, no polar o alifatico, en particular M, I, L, V, o H; X124 es un residuo polar o constrenido, particularmente T, H o N; X136 es un residuo aromatico, particularmente Y o F; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; X269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; y X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; X321 es un residuo restringido, en particular P; y X329 es un residuo restringido o aromatico, en particular H. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2 tiene las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 102), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 102.
En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, en particular L; X122 es un residuo constrenido, no polar o alifatico, en particular M, I, L, V, o H; X124 es un residuo polar o constrenido, particularmente T, H o N; X136 es un residuo aromatico, particularmente Y o F; X150 es residuo aromatico, limitado o polar, en particular S; X152 es cistema (C), no polar, alifatico, o un residuo polar, en particular G, I, L, S o C; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; x223 es un residuo restringido, en particular P; x269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2,
5
10
15
20
25
30
35
40
45
50
55
60
65
1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 145, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2, teniendo las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 110), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 110. En algunas realizaciones, la transaminasa modificada comprende una secuencia de aminoacidos que incluye las siguientes caractensticas: X8 es un residuo restringido, en particular es P; X49 es un residuo polar, particularmente T; X60 es un residuo aromatico, particularmente F; X61 es un residuo aromatico, particularmente Y; X62 es un residuo aromatico o polar, particularmente T, Y o F; X65 es un residuo alifatico, en particular A; X69 es C o un residuo no-polar, alifatico o polar, particularmente G, C, T, A, o S; X81 es un residuo no polar, en particular G; X94 es un residuo alifatico, particularmente I o L; X96 es un residuo alifatico, particularmente L; X117 es un residuo no polar, en particular G; X122 es un residuo no-polar o alifatico constrenido, en particular M, I, L, V, o H; X124 es un residuo polar o constrenido, particularmente T, H o N; X126 es un residuo polar, particularmente T; X136 es un residuo aromatico, particularmente Y o F; X150 es residuo aromatico, limitado o polar, en particular S; X152 es cistema (C), no polar, alifatico, o un residuo polar, en particular G, I, L, S o C; X169 es un residuo alifatico, en particular L; X199 es un residuo alifatico o aromatico, en particular W o I; X209 es un residuo alifatico, en particular L; X215 es C; X217 es un residuo polar, en particular N; X223 es un residuo restringido, en particular P; x269 es un residuo restringido, en particular P; X273 es un residuo aromatico, particularmente Y; X282 es un residuo polar, particularmente S; X284 es un residuo no polar, en particular G; X297 es un residuo polar, particularmente S; X302 es un residuo alifatico, en particular A; y X321 es un residuo restringido, en particular P. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o diferencias residuales en otras posiciones de residuos. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en las otras posiciones de los residuos. En algunas realizaciones, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 2, teniendo las caractensticas descritas para posiciones de restos especificados precedentes (por ejemplo, SEQ ID NO: 166), con la condicion que el polipeptido de transaminasa modificada comprende una secuencia de aminoacidos que incluye al menos las caractensticas descritas para las posiciones de restos especificados. En algunas formas de realizacion, el polipeptido de transaminasa modificada puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identica a una secuencia de referencia de SEQ ID NO: 166.
Tabla 2 a continuacion proporciona polipeptidos de transaminasa modificada ejemplares, enumerando cada fila dos SEQ ID NOs, refiriendose el numero impar a la secuencia de nucleotidos que codifica la secuencia de aminoacidos proporcionada por el numero par. Las diferencias de residuos se basan en la comparacion para hacer referencia a la secuencia de la SEQ ID NO: 2, una transaminasa derivada de Arthrobacter sp KNK168 y se diferencia de la enzima de origen natural en que tiene una sustitucion de isoleucina (I) en posicion de residuo X306 con valina (V). En la columna de la actividad, los niveles de aumento de la actividad (es decir, "+" "++" "+++" etc.) se definieron del siguiente modo: "+" indica al menos igual a pero no mayor que 2 veces la actividad de SEQ ID NO: 4 (condiciones de ensayo: sustrato de cetoamida 2 g/L, 0,5 M isopropilamina, 22°C, pH 7,5, 5% de DMSO, 100metroM PLP); "++" indica aproximadamente 50 a 100 veces mayor que la actividad de la SEQ ID NO: 4 (condiciones de ensayo: sustrato de cetoamida/L 2 g, 0,5 M isopropilamina, 22°C, pH 7,5, 5% de MeOH, 100metroM PLP); "+++" indica aproximadamente 1,1 a aproximadamente 5 veces mayor que la actividad de la SEQ ID NO: 22 (condiciones de ensayo: 5-10 de sustrato de cetoamida g/L, 0,5-1 M isopropilamina, 22-30°C, pH 7,5, 5% de MeOH, 100 pM PLP); "++++" indica aproximadamente 1,1 a 5 veces mayor que la actividad de la SEQ ID NO: 48 (condiciones de ensayo: 10-40 g/L sustrato de cetoamida, 1 M isopropilamina, 30-45°C, pH 8,5, 10% MeOH, 100pM PLP); "+++++" indica aproximadamente 1,1 a 5 veces o mayor que la actividad de la SEQ ID NO: 58 (condiciones de ensayo: 40100 g/L sustrato de cetoamida, 1 M isopropilamina, 45°C, pH 8,5, 10% MeOH-25% de DMSO, 250pM PLP); "++++++" indica aproximadamente 1,1 a 5 veces o mayor que la actividad de la SEQ ID NO: 104 (condiciones de ensayo: 40-100 g/L sustrato de cetoamida, 1 M isopropilamina, 45°C, pH 8,5, 50% de DMSO, 1000pM PLP). condiciones de ensayo ejemplares para la actividad de medicion usando metanol y DMSO se describen en los Ejemplos 6-11.
Tabla 2
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ
NO
12__
3/4__
5/6__
7/8__
9/10
11/12
13/14
15/16
17/18
19/20
21/22
23/24
25/26
27/28
29/30
31/32
33/34
35/36
37/38
39/40
41/42
43/44
45/46
47/48
49/50
51/52
53/54
55/56
57/58
59/60
ID
Diferencias de residuos con relacion a la SEQ ID NO: 2
diferencias
residuos
V69G; F122V; S223P; A284G__________________________
V65A; V69G; F122I; S223P____________________________
F122L; S223P; A284G________________________________
F122I; S223P; A284G_________________________________
F122L; S174A; S223P; A284G__________________________
Y26H; V65A; V69G; F122I; S223P; A284G________________
Y26H; H62T; V65A; V69G; F122I; T178S; V199W; S223P;
F225Y; T282S; A284G________________________________
Y26H; H62F; V65A; V69G; F122V; G136Y; V199I; A209L;
S223P; F225Y; T282S; A284G__________________________
Y26H; H62T; V65A; V69G; F122V; G136Y; E137T; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; H62T; V65A; V69G; F122I; G136Y; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; H62T; V65A; V69G; F122I; G136Y; E137T; V199I;
A209L; S223P; F225Y; T282S; A284G____________________
Y26H; V65A; V69G; F122V; G136Y; E137I; S174A; V199I;
A209L; S223P; I230V; A284G__________________________
Y26H; H62T; V65A; V69G; F122H; G136Y; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; H62T; V65A; V69T; F122I; G136Y; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; H62T; V65A; V69C; F122I; G136Y; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; H62T; V65A; V69A; F122I; G136Y; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; L61Y; H62T; V65A; V69G; F122I; G136Y; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; H62Y; V65A; V69G; F122I; G136Y; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
Y26H; H62T; V65A; V69G; F122I; G136F; E137I; V199I;
A209L; S223P; T282S; A284G__________________________
S4Y; Y26H; H62T; V65A; V69G; M94I; F122I; G136Y; E137T;
V199I; A209L; G215C; S223P; T282S; A284G_____________
H62T; V65A; V69G; M94I; F122I; G136Y; E137I; V199I; A209L;
G215C; S223P; T282S; A284G_________________________
H62T; V65A; V69G; M94I; F122I; G136Y; E137T; V199I;
A209L; G215C; S223P; T282S; A284G___________________
H62T; V65A; V69C; M94I; F122I; G136Y; E137T; V199I;
A209L; G215C; S223P; T282S; A284G___________________
S8P; H62T; V65A; V69C; M94I; F122I; G136Y; E137T; V199I;
A209L; G215C; S223P; T282S; A284G___________________
L61Y; H62T; V65A; V69S; M94I; F122I; G136F; E137T; V152I;
V199I; A209L; G215C; S223P; T282S; A284G_____________
L61Y; H62T; V65A; V69C; M94I; F122V; G136F; E137T; V199I;
A209L; G215C; S223P; T282S; A284G___________________
L61Y; H62T; V65A; V69T; M94I; F122V; G136F; E137T; V199I;
A209L; G215C; S223P; T282S; A284G___________________
L61Y; H62T; V65A; V69T; M94I; F122I; G136F; V199I; A209L;
G215C; S223P; T282S; A284G_________________________
L61Y; H62T; V65A; V69T; M94I; F122H; G136F; V199I; A209L; G215C; S223P; T282S; A284G_________________________
4_
4_
3_
3_
4_
6_
11
12
12
12
13
12
12
12
12
12
13
12
12
15
13
13
13
14
15
14
14
13
13
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO
Diferencias de residuos con relacion a la SEQ ID NO: 2 N° de diferencias de residuos Actividad
61/62
L61Y; H62T; V65A; V69C; M94I; F122I; G136Y; E137T; F160L; A169L; V199I; A209L; G215C; S223P; L269P; T282S; A284G 17 + + + +
63/64
L61Y; H62T; V65A; V69C; M94L; F122I; G136Y; E137T; A169L; V199I; A209L; G215C; S223P; T282S; A284G; V306L 16 + + + +
65/66
L61Y; H62T; V65A; V69C; M94I; Q102L; F122I; G136F; Y150F; V152I; V199I; A209L; G215C; S223P; T282S; A284G 16 + + + +
67/68
S8P; P48A; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; Q102K; F122I; G136F; I163V; V199I; A209L; L211I; G215C; G217N; S223P; L252F; L273Y; T282S; A284G; S321P 24 + + + + +
69/70
S8P; P48A; L61Y; H62T; V65A; V69T; D81G; M94I; F122I; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; T282S; A284G; P297S; S321P 21 + + + + +
71/72
S8P; L61Y; H62T; V65A; V69T; M94I; F122I; G136F; V199I; A209L; G215C; S223P;T282S; A284G 14 + + + + +
73/74
S8P; L61Y; H62T; V65A; V69T; D81G; M94L; I96L; F122I; G136F; T178S; V199I; A209L; G215C; S223P; L269P; T282S; A284G; P297S; S321P 20 + + + + +
75/76
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; G136F; V152L; T178S; V199I; A209L; G215C; G217N; S223P; L252F; L269P; L273Y; T282S; A284G; P297S; S321P 25 + + + + +
77/78
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94L; I96L; F122I; G136F; A169L; T178S; V199I; A209L; G215C; G217N; S223P; L269P; T282S; A284G; S292T; P297S; S321P 24 + + + + +
79/80
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 23 + + + + +
81/82
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94L; I96L; F122I; G136F; A169L; T178S; V199I; A209L; G215C; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 23 + + + + +
83/84
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; S124T; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 24 + + + + +
85/86
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; S124H; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 24 + + + + +
87/88
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; S124N; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 24 + + + + +
89/90
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; G136F; Y150H; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 24 + + + + +
91/92
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124H; G136F; Y150H; V152S; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 26 + + + + +
93/94
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 26 + + + + +
95/96
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124N; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 24 + + + + +
97/98
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122I; S124H; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 24 + + + + +
99/100
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124N; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 24 + + + + +
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO
Diferencias de residuos con relacion a la SEQ ID NO: 2 N° de diferencias de residuos Actividad
101/102
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124N; G136F; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P; Q329H 25 + + + + +
103/104
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 26 + + + + +
105/106
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; S126T; G136F; R138K; Y150S; V152G; Q155M; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 29 + + + + +
107/108
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; R138P; Q146R; Y150S; V152S; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 28 + + + + +
109/110
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; S126T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
111/112
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; I163H; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
113/114
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y148A; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
115/116
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; W156Q; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
117/118
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; R164V; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
119/120
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y148F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
121/122
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; E120Y; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; 27 ++++++
A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P
123/124
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; Q155V; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
125/126
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; R164P; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
127/128
S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; Q155T; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO
Diferencias de residuos con relacion a la SEQ ID NO: 2 N° de diferencias de residuos Actividad
129/130
S8P; E50L; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
131/132
S8P; L18I; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
133/134
S8P; D25Q; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
135/136
S8P; E42G; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
137/138
S8P; P48D; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
139/140
S8P; P30Q; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
141/142
S8P; L28P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
143/144
S8P; I41H; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
145/146
S8P; P30M; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
147/148
S8P; S54H; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
149/150
S8P; L18C; I55V; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 28 ++++++
151/152
S8P; P48G; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
153/154
S8P; P48V; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
155/156
S8P; I41S; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
157/158
S8P; E27T; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO
Diferencias de residuos con relacion a la SEQ ID NO: 2 N° de diferencias de residuos Actividad
159/160
S8P; S54P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
161/162
S8P; P48Q; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 27 ++++++
163/164
A5K; S8P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; S126T; G136F; Y150S; V152C; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 28 ++++++
165/166
S8P; S49T; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; E117G; F122M; S124T; S126T G136F; Y150S; V152S; A169L; V199I; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; V302A; S321P 30 ++++++
167/168
S8P; S54P; Y60F; L61Y; H62T; V65A; V69T; D81G; M94I; I96L; F122M; S124T; S126T; G136F; Y150S; V152S; A169L; V199I; D204A; A209L; G215C; G217N; S223P; L269P; L273Y; T282S; A284G; P297S; S321P 29 ++++++
Como se senalo anteriormente, en algunas realizaciones, el polipeptido de transaminasa puede comprender una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas identica a una secuencia de referencia de SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166 o 168. En algunas realizaciones, polipeptidos de transaminasas pueden tener 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 19, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, o 1-60 diferencias de residuos en comparacion con la transaminasa de origen natural representada por la SEQ ID NO: 2. En algunas realizaciones, el numero de diferencias de residuos puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias en comparacion con la SEQ ID NO: 2.
En algunas realizaciones, el polipeptido de transaminasa comprende una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas identica a una secuencia de referencia de SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, o 102. En algunas realizaciones, el polipeptidos de transaminasas pueden tener 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, o 1-60 diferencias de residuos en comparacion con el transaminasa de origen natural representada por la SEQ ID NO: 2. En algunas realizaciones, el numero de diferencias de residuos puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias en comparacion con la SEQ ID NO: 2.
En algunas realizaciones, el polipeptido de transaminasa comprende una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166 o 168, con la condicion de que la secuencia de transaminasa de aminoacidos comprende uno cualquiera del conjunto de las diferencias de residuos contenidos en una cualquiera de las secuencias de polipeptidos enumerados en la Tabla 2 en comparacion con la SEQ ID NO: 2. En algunas realizaciones, los polipeptidos de transaminasas pueden tener, ademas, 1-2, 1-3, 1-4, 15, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1- 45, 1-50, 155, 1-60 o diferencias residuales en otras posiciones de residuos de aminoacidos en comparacion con la secuencia de referencia. En algunas realizaciones, el numero de diferencias puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 diferencias residuales en otras posiciones de residuos. En algunas realizaciones, las diferencias residuales en otras posiciones de residuos comprenden sustituciones con residuos de aminoacidos conservadores.
Como se senalo anteriormente, en algunas realizaciones, el polipeptido de transaminasa tambien es capaz
5
10
15
20
25
30
35
40
45
50
55
60
65
de convertir sustratos ceto a productos de amino con al menos 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de exceso enantiomerico. Polipeptidos de transaminasas ejemplares con los niveles especificados de enantioselectividad pueden comprender una secuencia de aminoacidos correspondiente a la SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166 o 168.
En algunas realizaciones, los polipeptidos de transaminasa modificada pueden comprender deleciones de los polipeptidos de transaminasa modificada descritos en este documento. Por lo tanto, para todas y cada forma de realizacion de los polipeptidos de transaminasa de la descripcion, las deleciones pueden comprender uno o mas aminoacidos, 2 o mas aminoacidos, 3 o mas aminoacidos, 4 o mas aminoacidos, 5 o mas aminoacidos, 6 o mas aminoacidos, 8 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, o 20 o mas aminoacidos, hasta 10% del numero total de aminoacidos, de hasta 10% del numero total de los aminoacidos, hasta el 20% del numero total de aminoacidos, o hasta 30% del numero total de aminoacidos de los polipeptidos de transaminasas, siempre y cuando se mantenga la actividad funcional de la actividad de la transaminasa. En algunas realizaciones, las deleciones pueden comprender, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1 -12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, 1-60 o residuos de aminoacidos. En algunas realizaciones, el numero de supresiones puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35, 40, 45, 50, 55, o 60 aminoacidos. En algunas realizaciones, las deleciones pueden comprender deleciones de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 22, 24, 26, 28, o 30 residuos de aminoacidos.
Como se describe en el presente documento, los polipeptidos de transaminasa de la divulgacion pueden ser en forma de polipeptidos de fusion en la que los polipeptidos de transaminasas estan fusionados a otros polipeptidos, tales como, a modo de ejemplo y no de limitacion, las etiquetas de anticuerpos (por ejemplo, un epftopo myc), secuencias de purificaciones (por ejemplo, etiquetas His para la union a metales), y senales de localizacion celular (por ejemplo, senales de secrecion). Por lo tanto, los polipeptidos de transaminasas se pueden utilizar con o sin fusiones con otros polipeptidos.
Los polipeptidos descritos en este documento no se limitan a los aminoacidos codificados geneticamente. Ademas de los aminoacidos codificados geneticamente, los polipeptidos descritos en este documento pueden comprender, ya sea en su totalidad o en parte, aminoacidos de origen natural y/o sinteticos no codificados. Ciertos aminoacidos comunmente encontrados no codificados de los cuales los polipeptidos descritos en este documento pueden estar compuestos incluyen, pero no se limitan a: los D-estereoisomeros de los aminoacidos codificados geneticamente; acido 2,3-diaminopropionico (Dpr); acido (-aminoisobutmco (Aib); acido X-aminohexanoico (Aha); acido ™-aminovalerico (Ava); N-metilglicina o sarcosina (MeGly o Sar); ornitina (Orn); citrulina (Cit); t-butilalanina (Bua); t-butilglicina (Bug); N-metilisoleucina (Melle); fenilglicina (Phg); ciclohexilalanina (Cha); norleucina (Nle); naftilalanina (Nal); 2-clorofenilalanina (Ocf); 3-clorofenilalanina (Mcf); 4-clorofenilalanina (Pcf); 2-fluorofenilalanina (Off); 3-fluorofenilalanina (Mfp); 4-fluorofenilalanina (Pff); 2-bromofenilalanina (Obf); 3-bromofenilalanina (Mbf); 4- bromofenilalanina (Pbf); 2-metilfenilalanina (Omf); 3-metilfenilalanina (Mmf); 4-metilfenilalanina (Pmf); 2- nitrofenilalanina (Onf); 3-nitrofenilalanina (Mnf); 4-nitrofenilalanina (Pnf); anofenilalanine 2-Cy (Ocf); 3- cianofenilalanina (Mcf); 4-cianofenilalanina (Pcf); 2-trifluorometilfenilalanine (Otf); 3-trifluorometilfenilalanine (Mtf); 4- trifluorometilfenilalanine (Ptf); 4-aminofenilalanina (Paf); Lanine 4-iodofenila- (Pif); 4-aminometilfenilalanina (Pamf); 2,4-diclorofenilalanina (Opef); 3,4-diclorofenilalanina (Mpcf); 2,4-difluorofenilalanina (Fepf); 3,4-difluorofenilalanina (Mpff); pirid-2-ilalanina (2pAla); pirid-3-ilalanina (3pAla); pirid-4-ilalanina (4pAla); naft-1-ilalanina (1nAla); naft-2- ilalanina (2nAla); tiazolilalanina (Taala); benzotienilalanina (Bala); tienilalanina (Tala); furilalanina (Fala); homofenilalanina (hPhe); homotirosina (hTir); homotriptofan (hTrp); pentafluorofenilalanina (5ff); estirilcalanina (sAla); autrilalanina (aAla); 3,3-difenilalanina (Dfa); acido 3-amino-5-fenipentanoico (AFP); penicilamina (Pen); acido 1,2,3,4- tetrahidroisoquinolina-3-carboxflico (Tic); ®-2-tienilalanina (Thi); sulfoxido de metionina (MSO); N(w)-nitroarginina (nArg); homolisina (hLys); fosfonometilfenilalanina (pmFe); fosfoserina (pSer); fosfotreonina (pThr); acido homoaspartico (hAsp); acido homoglutamico (hGlu); 1-aminociclopent-(2 o 3)-en-4 acido carboxflico; acido pipecolico (PA), azetidina-3-carboxflico (ACA); acido 1-aminociclopentano-3-carboxflico; alilglicina (aOly); propargilglicina (pgGly); homoalanina (Hala); norvalina (nVal); homoleucina (hLeu), homovalina (Hval); homoisoleucina (Hile); homoarginina (hArg); lisina N-acetilo (AcLys); acido 2,4-diaminobutmco (Dbu); acido 2,3-diaminobutmco (Dab); N- metilvalina (MeVal); homocistema (hCys); homoserina (hSer); hidroxiprolina (Hyp) y homoprolina (hPro). Aminoacidos no codificados adicionales de los cuales pueden estar compuestos los polipeptidos descritos en el presente documento seran evidentes para los expertos en la tecnica (vease, por ejemplo, los diversos aminoacidos proporcionados en Fasman, 1989, CRC Practical Handbook of Biochemistry and Molecular Biology, CRC Press, Boca Raton, FL, en las pags. 3-70 y las referencias citadas en la misma, todas los cuales se incorporan por referencia). Estos aminoacidos pueden estar en la configuracion L o D.
Los expertos en la tecnica reconoceran que los aminoacidos o residuos que llevan grupos protectores de la cadena lateral pueden comprender tambien los polipeptidos descritos en el presente documento. Ejemplos no limitantes de tales aminoacidos protegidos, que en este caso pertenecen a la categona aromatica, incluyen (grupos protectores enumerados en parentesis), pero no se limitan a: Arg (tos), Cys (metilbencilo), Cys (nitropiridinasulfenilo), Glu (™-bencilester), Gln (xantilo), Asn (N-™-xantilo), His (bom), His (bencilo), His (Tos), Lys (Fmoc), Lys (Tos), Ser (O-bencilo), Thr (O-bencilo) y Tyr (O-bencilo).
5
10
15
20
25
30
35
40
45
50
55
60
65
Los aminoacidos no codificadores que estan conformacionalmente restringidos de los que los polipeptidos descritos en el presente documento puede estar compuestos incluyen, pero no se limitan a, aminoacidos N-metilo (L-configuracion); acido 1-aminociclopent-(2 o 3)-eno-4-carboxflico; acido pipecolico; acido azetidina-3-carbox^lico; homoprolina (hPro); y acido 1-aminociclopentano-3-carbox^lico.
Como se describio anteriormente las diversas modificaciones introducidas en el polipeptido de origen natural para generar una enzima de transaminasa modificada pueden ser dirigidas a una propiedad espedfica de la enzima.
En otro aspecto, la presente descripcion proporciona polinucleotidos que codifican los polipeptidos de transaminasas mejoradas. Los polinucleotidos pueden ser unidos operativamente a una o mas secuencias reguladoras heterologas que controlan la expresion genica para crear un polinucleotido recombinante capaz de expresar el polipeptido de transaminasa. Las construcciones de expresion que contienen un polinucleotido heterologo que codifica la transaminasa alterada se puede introducir en celulas huesped apropiadas para expresar el polipeptido de transaminasa correspondiente.
Debido a los conocimientos de los codones correspondientes a los diversos aminoacidos, la disponibilidad de una secuencia de protema proporciona una descripcion de todos los polinucleotidos capaces de codificar el sujeto. La degeneracion del codigo genetico, donde los mismos aminoacidos son codificados por codones alternativos o sinonimos permite que se haga un numero extremadamente grande de acidos nucleicos, todos los cuales codifican los polipeptidos de transaminasa mejorada descritos en el presente documento. Por lo tanto, despues de haber identificado una secuencia de aminoacidos particular, los expertos en la tecnica podnan hacer cualquier numero de diferentes acidos nucleicos mediante una simple modificacion de la secuencia de uno o mas codones de una forma que no cambia la secuencia de aminoacidos de la protema. En este sentido, la presente descripcion contempla espedficamente cada una y cada posible variacion de polinucleotidos que podnan hacerse mediante la seleccion de combinaciones basadas en las posibles elecciones de codones, y todas dichas variaciones han de considerarse descritas espedficamente para cualquier polipeptido descrito en el presente documento, incluyendo las secuencias de aminoacido presentadas en la Tabla 2.
En algunas realizaciones, los polinucleotidos se pueden seleccionar y/o alterar para comprender codones que se seleccionan preferiblemente para adaptarse a la celula huesped en la que se produce la protema. Por ejemplo, los codones preferidos utilizados en bacterias se utilizan para expresar el gen en bacterias; los codones preferidos utilizados en la levadura se utilizan para la expresion en la levadura; y los codones preferidos utilizados en los mairnferos se utilizan para la expresion en celulas de mairnfero. Dado que no todos los codones necesitan ser reemplazados para optimizar el uso de codones de las transaminasas (por ejemplo, debido a que la secuencia natural puede tener codones preferidos y porque el uso de codones preferidos puede no ser necesario para todos los residuos de aminoacidos), polinucleotidos optimizados con codones que codifican los polipeptidos de transaminasa pueden contener codones preferidos en aproximadamente 40%, 50%, 60%, 70%, 80%, o mayor que 90% de las posiciones de codon de la region codificante de longitud completa.
En algunas realizaciones, el polinucleotido codifica un polipeptido de transaminasa que comprende una secuencia de aminoacidos que es al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas identica a la secuencia de referencia de SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, o 102, donde el polipeptido es capaz de convertir el sustrato de cetona al producto de amina con una actividad que se mejoro en comparacion con la actividad de la transaminasa de origen natural de Arthrobacter sp KNK168 o la transaminasa de la SEQ ID NO: 2.
En algunas realizaciones, el polinucleotido que codifica un polipeptido de transaminasa que comprende una secuencia de aminoacidos que tiene al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% o mas identidad de secuencia con el polipeptido que comprende una secuencia de aminoacidos correspondiente a la SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34,
36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96,
98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166 o 168 en donde el polipeptido tiene una o mas propiedades mejoradas en la conversion del sustrato de cetona al producto de amina en presencia de un donante de grupo amino. En algunas realizaciones, el polipeptido de transaminasa codificado tiene una actividad que es igual o mayor que la actividad del polipeptido de SEQ ID NO: 2.
En algunas realizaciones, el polinucleotido codifica un polipeptido de transaminasa que comprende una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% identica a una secuencia de referencia de SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76,
78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128,
130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166 o 168.
En algunas realizaciones, el polinucleotido codifica un polipeptido de transaminasa que comprende una
5
10
15
20
25
30
35
40
45
50
55
60
65
secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% identica a una secuencia de referencia sobre la base de la SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166 o 168, con la condicion de que la secuencia de transaminasa de aminoacidos mejorada comprende una cualquiera de la serie de diferencias de residuos contenida en una cualquiera de las secuencias de polipeptidos enumeradas en la Tabla 2 en comparacion con la SEQ ID NO: 2.
En algunas realizaciones, los polinucleotidos que codifican los polipeptidos de transaminasas mejoradas se seleccionan de SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41,43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, o 167.
En algunas realizaciones, los polinucleotidos son capaces de hibridarse en condiciones muy rigurosas con un polinucleotido que comprende la SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, o 167, o un complemento de los mismos, donde los polinucleotidos altamente estrictos de hibridacion codifican un polipeptido de transaminasa capaz de convertir los compuestos de formula (II) a los productos de amina de formula (I) en presencia de un donante de grupo amino con una actividad que se mejoro en comparacion con el polipeptido de SEQ ID NO: 2.
En algunas realizaciones, los polinucleotidos codifican los polipeptidos descritos en el presente documento, pero tienen aproximadamente 80% o mas de identidad de secuencia, aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% o mas de identidad de secuencia a nivel de nucleotidos con un polinucleotido de referencia que codifica la transaminasa alterada descrita en este documento. En algunas realizaciones, el polinucleotido de referencia se selecciona de la SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41,43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, o 167.
Un polinucleotido aislado que codifica un polipeptido de transaminasa mejorada puede ser manipulado en una variedad de maneras para proporcionar la expresion del polipeptido. En algunas realizaciones, los polinucleotidos que codifican los polipeptidos de transaminasa modificada pueden proporcionarse como vectores de expresion donde una o mas secuencias de control esta presente para regular la expresion de los polinucleotidos. La manipulacion del polinucleotido aislado antes de su insercion en un vector puede ser deseable o necesario dependiendo del vector de expresion. Las tecnicas para modificar los polinucleotidos y secuencias de acidos nucleicos utilizando metodos de ADN recombinantes son bien conocidos en la tecnica. Se proporciona orientacion en Sambrook et al, 2001, Molecular Cloning: A Laboratory Manual, 3a edicion, Cold Spring Harbor Laboratory Press; and Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, actualizaciones a 2006.
En algunas realizaciones, las secuencias de control incluyen, entre otros, promotores, secuencias lfder, secuencia poliadenilacion, secuencia de propeptido, secuencia de peptido de senal, y terminador de la transcripcion. Para las celulas huesped bacterianas, promotores adecuados para dirigir la transcripcion de los constructos de acido nucleico de la presente descripcion, incluyen los promotores obtenidos del operon lac de E. coli, operon trp de E. coli, de bacteriofagos L, gen de agarasa de Streptomyces coelicolor (dagA), gen de levansucrasa de Bacillus subtilis (sacB) de Bacillus licheniformis, gen de alfa-amilasa (amyL), gen de amilasa maltogenica de Bacillus stearothermophilus (amyM) de Bacillus amyloliquefaciens, gen de alfa-amilasa (amyQ), gen de penicilinasa de Bacillus licheniformis (penP), genes de xylA y xylB Bacillus subtilis, y gen procariotico de beta-lactamasa (Villa- Kamaroff et al, 1978, Proc Natl Acad Sci EE.uU. 75: 3727-3731), asf como el promotor tac (DeBoer et al, 1983, Proc Natl Acad Sci EE.UU. 80: 21-25).
Para las celulas huesped de hongos filamentosos, los promotores adecuados para dirigir la transcripcion de los constructos de acidos nucleicos de la presente divulgacion incluyen promotores obtenidos de los genes para amilasa de Aspergillus oryzae TAKA, proteinasa aspartica de Rhizomucor miehei, alfa-amilasa neutra de Aspergillus niger, alfa amilasa de acido estable de Aspergillus niger, glucoamilasa de Aspergillus niger o Aspergillus awamori (glaA), lipasa de Rhizomucor miehei, proteasa alcalina de Aspergillus oryzae, isomerasa de fosfato de Aspergillus oryzae triosa, acetamidasa de Aspergillus nidulans, y proteasa similar a tripsina de Fusarium oxisporum (vease, por ejemplo, WO 96/00787, que se incorpora por referencia en el presente documento), asf como el promotor NA2-tpi (un hforido de los promotores de los genes para alfa-amilasa neutra de Aspergillus niger y isomerasa de fosfato de Aspergillus oryzae triosa), y promotores mutantes, truncados, e hfbridos de los mismos.
5
10
15
20
25
30
35
40
45
50
55
60
65
deshidrogenasa/gliceraldel'ndo-3-fosfato deshidrogenasa (ADH2/GAP), y Saccharomyces cerevisiae 3-fosfoglicerato quinasa. Otros promotores utiles para celulas huespedes de levadura estan descritos por Romanos et al, 1992, Yeast 8: 423-488.
La secuencia de control puede tambien ser una secuencia del terminador de transcripcion adecuada, una secuencia reconocida por una celula huesped para terminar la transcripcion. La secuencia del terminador esta operativamente enlazada al termino 3' de la secuencia de acido nucleico que codifica el polipeptido. Cualquier terminador que es funcional en la celula huesped de eleccion puede ser usada en la presente invencion.
Por ejemplo, terminadores de la transcripcion ejemplares para celulas huespedes filamentosas fungicas se pueden obtener de los genes para amilasa de Aspergillus oryzae TAKA, glucoamilasa de Aspergillus niger, sintasa de antranilato de Aspergillus nidulans, alfa-glucosidasa de Aspergillus niger, y proteasa de tipo tripsina de Fusarium oxisporum.
Terminadores ejemplares para celulas huespedes de levadura se pueden obtener de los genes para enolasa de Saccharomyces cerevisiae, citocromo C de Saccharomyces cerevisiae (CYC1), y gliceraldehndo-3-fosfato deshidrogenasa de Saccharomyces cerevisiae. Otros terminadores utiles para celulas huespedes de levadura son descritos por Romanos et al., 1992, supra.
La secuencia de control puede tambien ser una secuencia lfder adecuada, una region no traducida de un ARNm que es importante para la traduccion por la celula huesped. La secuencia lfder esta operativamente enlazada al termino 5' de la secuencia de acido nucleico que codifica el polipeptido. Cualquier secuencia lfder que es funcional en la celula huesped de eleccion puede ser usada. Los lfderes ejemplares para celulas huespedes filamentosas fungicas se obtienen de los genes para amilasa de Aspergillus oryzae TAKA e isomerasa de fosfato Aspergillus nidulans triosa. Lfderes adecuados para celulas huespedes de levadura se obtienen de los genes para enolasa de Saccharomyces cerevisiae (ENO-1), 3-fosfoglicerato quinasa de Saccharomyces cerevisiae, factor alfa de Saccharomyces cerevisiae, y alcohol deshidrogenasa/gliceraldel'ndo-3-fosfato deshidrogenasa de Saccharomyces cerevisiae (ADH2/GAP).
La secuencia de control tambien puede ser una secuencia de poliadenilacion, una secuencia operativamente vinculada al termino 3' de la secuencia de acido nucleico y que, cuando se transcribe, es reconocida por la celula huesped como una senal para anadir residuos de poliadenosina al ARNm transcrito. Cualquier secuencia de poliadenilacion que es funcional en la celula huesped de eleccion puede ser usada en la presente invencion. Secuencias de poliadenilacion ejemplares para celulas huespedes filamentosas fungicas pueden ser de los genes para amilasa de Aspergillus oryzae TAKA, glucoamilasa de Aspergillus niger, sintasa de antranilato Aspergillus nidulans, proteasa similar a tripsina de Fusarium oxisporum, y alfa-glucosidasa de Aspergillus niger. Secuencias de poliadenilacion utiles para celulas huespedes de levadura son descritas por Guo y Sherman, 1995, Mol Cell Bio 15: 5983-5990.
La secuencia de control puede tambien ser una region codificante del peptido senal que codifica para una secuencia de aminoacidos enlazada al termino amino de un polipeptido y dirige el polipeptido codificado en la via secretora de la celula. El extremo 5' de la secuencia codificante de la secuencia de acido nucleico puede contener intrmsecamente una region codificante del peptido senal naturalmente vinculado en el marco de lectura de traduccion con el segmento de la region codificante que codifica el polipeptido secretado. Alternativamente, el extremo 5' de la secuencia codificante puede contener una region codificante del peptido senal que es diferente a la secuencia codificante. La region de codificacion de peptido senal puede ser requerida donde la secuencia codificante no contiene naturalmente una region codificante del peptido senal.
Regiones de codificacion del peptido senal eficaces para celulas huespedes bacterianas son el peptido senal obtenido de los genes para Bacillus NCLB 11837 de amilasa maltogenica de Bacillus stearothermophilus, la alfa-amilasa, subtilisina de Bacillus licheniformis, beta-lactamasa de Bacillus licheniformis, proteasas neutras de Bacillus stearothermophilus (nprT, nprS, nprM), y prsA de Bacillus subtilis. Otros peptidos de senal se describen por Simonen y Palva, 1993, Microbiol Rev 57: 109-137.
Regiones de codificacion del peptido de senal eficaces para celulas huespedes filamentosas fungicas pueden ser el peptido de senal obtenidas de los genes para amilasa de Aspergillus oryzae TAKA, amilasa neutra de Aspergillus niger, glucoamilasa de Aspergillus niger, proteinasa aspartica de Rhizomucor miehei, celulasa de Humicola insolens, y lipasa de Humicola lanuginosa.
Los peptidos de senal utiles para celulas huespedes de levadura pueden ser de los genes para Saccharomyces cerevisiae, factor alfa de Saccharomyces y invertasa de Saccharomyces cerevisiae. Otras regiones de codificacion del peptido de senal utiles son descritas por Romanos et al., 1992, supra.
5
10
15
20
25
30
35
40
45
50
55
60
65
puede convertir a un polipeptido maduro activo por escision catalttica o autocatalftica del propeptido del propolipeptido. La region codificante del propeptido puede ser obtenida de los genes para proteasa alcalina de Bacillus subtilis (aprE), proteasa neutra de Bacillus subtilis (nprT), factor alfa de Saccharomyces cerevisiae, proteinasa aspartica de Rhizomucor miehei, y lactasa de Myceliophthora thermophila (vease por ejemplo, WO 95/33836, que se incorpora por referencia en este documento).
Cuando regiones tanto de peptidos como de propeptidos de senal estan presentes en el termino amino de un polipeptido, la region de propeptido esta situada junto al termino amino de un polipeptido y la region del peptido de senal esta situada junto al termino amino de la region del propeptido.
Tambien puede ser deseable anadir secuencias reguladoras que permiten la regulacion de la expresion del polipeptido con respecto al crecimiento de la celula huesped. Ejemplos de sistemas reguladores son los que causan que la expresion del gen se active o desactive en respuesta a un estfmulo qmmico o ffsico, incluyendo la presencia de un compuesto regulador. En las celulas huesped procariotas, secuencias reguladoras adecuadas incluyen los sistemas de operador lac, tac, y trp. En las celulas huesped de levadura, sistemas de regulacion adecuados incluyen, como ejemplos, sistema ADH2 o sistema GAL1. En hongos filamentosos, secuencias reguladoras adecuadas incluyen el promotor de alfa-amilasa TAKA, promotor de glucoamilasa de Aspergillus niger, y promotor de glucoamilasa de Aspergillus oryzae.
Otros ejemplos de secuencias reguladoras son aquellos que permiten la amplificacion genica. En los sistemas eucarioticos, estos incluyen el gen de la reductasa de dihidrofolato, que se amplifica en presencia de metotrexato, y los genes de metalotionema, que se amplifican con metales pesados. En estos casos, la secuencia de acido nucleico que codifica el polipeptido de transaminasa de la presente invencion estana operativamente unida con la secuencia reguladora.
Por lo tanto, en otra realizacion, la presente descripcion esta tambien dirigida a un vector de expresion recombinante que comprende un polinucleotido que codifica un polipeptido de transaminasa alterada o una variante del mismo, y una o mas regiones reguladoras de la expresion tales como un promotor y un terminador, un origen de replicacion, etc., dependiendo del tipo de huespedes en que se vayan a introducir. Las diversas secuencias de acidos nucleicos y de control descritas anteriormente pueden ser unidas para producir un vector de expresion recombinante que puede incluir uno o mas sitios de restriccion convenientes para permitir la insercion o sustitucion de la secuencia de acido nucleico que codifica el polipeptido en tales sitios. Alternativamente, la secuencia de acido nucleico de la presente descripcion puede ser expresada mediante la insercion de la secuencia de acido nucleico o una construccion de acido nucleico que comprende la secuencia en un vector apropiado para la expresion. En la creacion del vector de expresion, la secuencia codificante se localiza en el vector de modo que la secuencia codificante esta operativamente enlazada con las secuencias de control apropiadas para la expresion.
El vector de expresion recombinante puede ser cualquier vector (por ejemplo, un plasmido o virus), que puede ser convenientemente sometido a procedimientos de ADN recombinante y puede provocar la expresion de la secuencia de polinucleotido. La eleccion del vector tipicamente dependera de la compatibilidad del vector con la celula huesped en la que el vector se va a introducir. Los vectores pueden ser plasmidos circulares lineales o cerrados.
El vector de expresion puede ser un vector de replicacion autonoma, es decir, un vector que existe como una entidad extracromosomica, cuya replicacion es independiente de la replicacion cromosomica, por ejemplo, un plasmido, un elemento extracromosomico, un minicromosoma, o un cromosoma artificial. El vector puede contener cualquier medio para asegurar la autorreplicacion. Alternativamente, el vector puede ser uno que, cuando se introduce en la celula huesped, se integra en el genoma y se replica junto con el cromosoma en que ha sido integrado. Ademas, un unico vector o plasmido o dos o mas vectores o plasmidos que juntos contienen el ADN total a introducir en el genoma de la celula huesped, o puede ser usado un transposon.
El vector de expresion de la presente invencion contiene preferiblemente uno o mas marcadores seleccionables, que permiten la seleccion facil de celulas transformadas. Un marcador seleccionable es un gen cuyo producto proporciona resistencia biocida o vmca, resistencia a metales pesados, prototroffa a auxotrofos, y similares. Ejemplos de marcadores seleccionables bacterianos son los genes dal de Bacillus subtilis o Bacillus licheniformis, o marcadores que confieren resistencia a los antibioticos tales como ampicilina, kanamicina, cloranfenicol o resistencia a la tetraciclina. Los marcadores adecuados para celulas huespedes de levadura son ADE2, HIS3, LEU2, LYS2, MET3, TRP1, y URA3.
Los marcadores seleccionables para el uso en una celula huesped filamentosa fungica incluyen, pero no se limitan a, amdS (acetamidasa), argB (carbamoiltransferasa de ornitina), bar (acetiltransferasa de fosfinotricina), hph (fosfotransferasa de higromicina), niaD (reductasa de nitrato), pyrG (orotidina-5'-fosfato descarboxilasa), sC (adeniltransferasa de sulfato), y trpC (sintasa de antranilato), asf como equivalentes de los mismos. Las formas de realizacion para el uso en una celula de Aspergillus incluyen los genes amdS y pyrG de Aspergillus nidulans o Aspergillus oryzae y el gen bar de Streptomyces hygroscopicus.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los vectores de expresion para expresar las transaminasas pueden contener un elemento que permite la integracion del vector en el genoma de la celula huesped o la replicacion autonoma del vector en la celula independiente del genoma. Para la integracion en el genoma de la celula huesped, el vector puede depender de la secuencia de acido nucleico que codifica el polipeptido o cualquier otro elemento del vector para la integracion del vector en el genoma por recombinacion homologa o no homologa.
Alternativamente, el vector de expresion puede contener secuencias de acidos nucleicos adicionales para dirigir la integracion por recombinacion homologa en el genoma de la celula huesped. Las secuencias de acidos nucleicos adicionales permiten que el vector sea integrado en el genoma de la celula huesped en una ubicacion precisa en el cromosoma. Para aumentar la probabilidad de integracion en una ubicacion precisa, los elementos integracionales debenan contener preferiblemente un numero suficiente de acidos nucleicos, tal como 100 a 10.000 pares de bases, preferiblemente 400 a 10.000 pares de bases, y lo mas preferiblemente 800 a 10.000 pares de bases, que son altamente homologos con la secuencia objetivo correspondiente para mejorar la probabilidad de recombinacion homologa. Los elementos integracionales pueden ser cualquier secuencia que es homologa con la secuencia diana en el genoma de la celula huesped. Ademas, los elementos integracionales pueden ser secuencias de acidos nucleicos no codificantes o codificantes. Por otra parte, el vector puede ser integrado en el genoma de la celula huesped por recombinacion no homologa.
Para la replicacion autonoma, el vector puede comprender ademas un origen de replicacion que permite al vector replicarse de manera autonoma en la celula huesped en cuestion. Ejemplos de ongenes bacterianos de replicacion son ori P15A o los ongenes de replicacion de los plasmidos pBR322, pUC19, pACYC177 (cuyo plasmido tiene el ori P15A), o pACYC184 que permiten la replicacion en E. coli, y pUB110, pE194, pTA1060, o pAM®1 que permiten la replicacion en Bacillus. Ejemplos de ongenes de replicacion para el uso en una celula huesped de levadura son el origen de 2 micras de replicacion, ARS 1, ARS4, la combinacion de ARS1 y CEN3, y la combinacion de ARS4 y CEN6. El origen de replicacion puede ser uno que tenga una mutacion que hace su funcionamiento sensible a la temperatura en la celula huesped (vease, por ejemplo, Ehrlich, 1978, Proc Natl Acad Sci EE.UU. 75: 1433).
Mas de una copia de una secuencia de acido nucleico de la presente invencion puede insertarse en la celula huesped para aumentar la produccion del producto del gen. Un aumento en el numero de copias de la secuencia de acido nucleico se puede obtener integrando al menos una copia adicional de la secuencia en el genoma de la celula huesped o mediante la inclusion de un gen marcador amplificable seleccionable con la secuencia de acido nucleico donde las celulas que contienen copias amplificadas del gen marcador seleccionable, y por tanto copias adicionales de la secuencia de acido nucleico, pueden seleccionarse para cultivar las celulas en presencia del agente seleccionable apropiado.
Muchos de los vectores de expresion para uso en la presente invencion estan disponibles comercialmente. Vectores de expresion comerciales adecuados incluyen vectores de expresion p3xFLAGTMTM de Sigma-Aldrich Chemicals, St. Louis MO., que incluye un promotor de CMV y el sitio de poliadenilacion de hGH para la expresion en celulas huesped de mairnfero y un origen pBR322 de marcadores de replicacion y resistencia a la ampicilina para la amplificacion en E. coli. Otros vectores de expresion adecuados son pBlue-scriptII SK(-) y pBK-CMv, que estan disponibles comercialmente de Stratagene, LaJolla CA, y los plasmidos que se derivan de pBR322 (Gibco BRL), pUC (Gibco BRL), pREP4, pCEP4 (Invitrogen) o pPoli (Lathe et al, 1987, gene 57: 193-201).
En otro aspecto, la presente descripcion proporciona una celula huesped que comprende un polinucleotido que codifica un polipeptido de transaminasa mejorada de la presente descripcion, el polinucleotido esta unido operativamente a una o mas secuencias de control para la expresion de la enzima de transaminasa en la celula huesped. Celulas huesped para su uso en la expresion de los polipeptidos de transaminasa codificados por los vectores de expresion de la presente invencion son bien conocidos en la tecnica e incluyen pero no se limitan a, celulas bacterianas, tales como celulas de E. coli, Lactobacillus, , Streptomyces y Salmonella typhimurium; celulas fungicas, tales como celulas de levadura (por ejemplo, Saccharomyces cerevisiae o Pichia pastoris (N° de acceso ATCC 201178)); celulas de insecto tales como celulas de Drosophila S2 y Spodoptera Sf9; celulas animales tales como CHO, COS, BHK, 293, y celulas de melanoma de Bowes; y celulas vegetales. Medios de cultivo apropiados y las condiciones de crecimiento para las celulas huesped descritas anteriormente son bien conocidos en la tecnica.
Los polinucleotidos para la expresion de la transaminasa pueden introducirse en las celulas mediante diversos procedimientos conocidos en la tecnica. Las tecnicas incluyen, entre otros, electroporacion, bombardeo de partfculas biolfsticas, transfeccion mediada por liposomas, transfeccion de cloruro de calcio, y fusion de protoplastos. Diversos metodos para introducir polinucleotidos en celulas seran evidentes para el experto en la materia.
Una celula huesped ejemplar es W3110 de Escherichia coli. El vector de expresion fue creado por la union operativa de un polinucleotido que codifica una transaminasa mejorada en plasmido pCK110900 operativamente unido al promotor lac bajo el control del represor lacl. El vector de expresion tambien contema el origen de replicacion p15A y el gen de resistencia a cloranfenicol. Las celulas que contienen el polinucleotido sujeto en Escherichia coli W3110 se aislaron sometiendo las celulas a la seleccion de cloranfenicol.
5
10
15
20
25
30
35
40
45
50
55
60
65
Las transaminasas y polinucleotidos mejorados que codifican tales polipeptidos se pueden preparar utilizando metodos comunmente utilizados por los expertos en la tecnica. Como se senalo anteriormente, la secuencia de aminoacidos de origen natural y polinucleotido correspondiente que codifica la enzima de transaminasa de Arthrobacter sp KNK168, de la que la secuencia original SEQ ID NO: 2 se derivo, representada aqu como la SEQ ID NO: 2) en las Patente de Estados Unidos N° 7.169.592. En algunas realizaciones, la secuencia de polinucleotido madre se optimiza por codones para aumentar la expresion de la transaminasa en una celula huesped espedfica. La secuencia de polinucleotido designada SEQ ID NO: 1 era la secuencia original utilizada como punto de partida para la mayona de los experimentos y construccion de la biblioteca de transaminasas modificadas.
Las transaminasas modificadas se pueden obtener sometiendo el polinucleotido que codifica la transaminasa de origen natural a mutagenesis y/o metodos de evolucion dirigida. Una tecnica de evolucion dirigida ejemplar es la mutagenesis y/o barajado de ADN como se describe en Stemmer, 1994, Proc Natl Acad Sci EE.UU. 91: 10747-10751; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 y la patente de EE.UU. 6.537.746 (cada una de las cuales se incorpora por referencia en este documento).
Otros procedimientos de evolucion dirigida que se pueden utilizar incluyen, entre otros, el proceso de extension escalonada (STEP), la recombinacion in vitro (Zhao et al, 1998, Nat Biotechnol 16: 258-261), PCR mutagenico (Caldwell et al., 1994, PCR Methods Appl. 3: S136-S140), y la mutagenesis de casete (Negro et al,
1996, Proc Natl Acad Sci EE.UU. 93: 3.525-3.529). Las tecnicas de mutagenesis y evolucion dirigida utiles para los fines de este presente documento tambien se describen en las siguientes las referencias: Ling, et al, 1997, "Approaches to DNA mutagenesis: an overview", Anal. Biochem. 254 (2): 157-78; Dale et al., 1996, "Oligonucleotide- directed random mutagenesis using the phosphorothioate method," Metods Mol. Biol. 57: 369-74; Smith, 1985, "Site- directed mutagenesis", Ann. Rev. Genet. 19: 423-462; Botstein et al, 1985, " Strategies and applications of in vitro mutagenesis," Science 229: 1193-1201; Carter, 1986, "Site-directed mutagenesis", Biochem. J. 237: 1-7; Kramer et al, 1984, "Point Mismatch Repair," Cell 38: 879-887; Wells et al, 1985, "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites," Gene 34: 315-323; Minshull et al, 1999, "Protein evolution by molecular breeding," Curr Opin Chem Biol 3: 284-290; Cristianos et al, 1999, "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling", Nature Biotech 17: 259-264; Crameri et al, 1998, Nature 391 "DNA shuffling of a family of genes from diverse species accelerates directed evolution ": 288-291; Crameri et al,
1997, "Molecular evolution of an arsenate detoxification pathway by DNA shuffling ", Nature Biotech. 15: 436-438; Zhang et al., 1997, "Directed evolution of an effective fructosidase from a galactosidase by DNA shuffling and screening," Proc Natl Acad Sci EE.UU. 94: 45-4-4509; Crameri et al, 1996, "Improved green fluorescent protein by molecular evolution using DNA shuffling", Nature Biotech 14: 315-319; y Stemmer, 1994, "Rapid evolution of a protein in vitro by DNA shuffling", Nature 370: 389 -391.
En algunas realizaciones, los clones obtenidos despues de un tratamiento de mutagenesis son examinados para detectar las transaminasas que tienen una propiedad mejorada de la enzima deseada. La medicion de actividad de la enzima de transaminasa de las bibliotecas de expresion se puede realizar utilizando las tecnicas estandar, tales como la separacion del producto (por ejemplo, por HPLC) y deteccion del producto midiendo la absorbancia UV del sustrato separado y los productos y/o por deteccion utilizando espectroscopfa de masas tandem (por ejemplo, MS/MS). Los ensayos ejemplares se describen en el Ejemplo 4 a continuacion. La tasa de aumento en el producto deseado por unidad de tiempo indica la actividad relativa (enzimatica) del polipeptido de transaminasa en una cantidad fija del lisado (o un polvo liofilizado hecho de los mismos). Cuando la propiedad de la enzima mejorada deseada es la estabilidad termica, la actividad enzimatica se puede medir despues de someter las preparaciones enzimaticas a una temperatura definida y midiendo la cantidad de actividad enzimatica que queda despues de los tratamientos termicos. Los clones que contienen un polinucleotido que codifica las transaminasas deseadas son entonces aislados, secuenciados para identificar los cambios de secuencias de nucleotidos (si los hay), y se utiliza para expresar la enzima en una celula huesped.
Cuando se conoce la secuencia del polipeptido alterado, los polinucleotidos que codifican la enzima se pueden preparar por metodos estandar en fase solida, segun metodos sinteticos conocidos. En algunas realizaciones, los fragmentos de hasta aproximadamente 100 bases se pueden sintetizar de forma individual, a continuacion, unidos (por ejemplo, por metodos enzimaticos o qrnmicos de litigio, o metodos de la polimerasa mediada) para formar cualquier secuencia continua deseada. Por ejemplo, los polinucleotidos y oligonucleotidos de la invencion se pueden preparar mediante smtesis qrnmica usando, por ejemplo, el metodo de la fosforamidita clasico descrito por Beaucage et al, 1981, Tet Lett. 22: 1859-1869, o el metodo descrito por Matthes et al., 1984, EMBO J. 3: 801-05, por ejemplo, como se practica tfpicamente en metodos de smtesis automatizados. De acuerdo con el metodo de la fosforamidita, los oligonucleotidos son sintetizados, por ejemplo, en un sintetizador de ADN automatico, se purifican, se hibridan, se ligan y se clonan en vectores apropiados. Ademas, esencialmente cualquier acido nucleico puede obtenerse a partir de cualquiera de una variedad de fuentes comerciales, The Great American Gene Company, Ramona, CA, ExpressGen Inc. Chicago, IL, Operon Technologies Inc., Alameda, CA, y muchos otros.
5
10
15
20
25
30
35
40
45
50
55
60
65
de protemas, incluyendo, entre otros, tratamiento con lisozima, sonicacion, filtracion, precipitacion por sales, ultra- centrifugacion, y cromatograffa. Las soluciones adecuadas para la lisis y la alta eficiencia de extraccion de protemas a partir de bacterias, tales como E. coli., estan disponibles comercialmente bajo el nombre comercial CelLytic BTM de Sigma-Aldrich de St. Louis MO.
Las tecnicas cromatograficas para el aislamiento del polipeptido de transaminasa incluyen, entre otros, cromatograffa de fase inversa, cromatograffa de fase lfquida de alto rendimiento, cromatograffa de intercambio ionico, electroforesis en gel y cromatograffa de afinidad. Condiciones para la purificacion de una enzima en particular dependera, en parte, de factores tales como la carga neta, hidrofobicidad, hidrofilicidad, peso molecular, forma molecular, etc., y seran evidentes para los expertos en la tecnica. En algunas realizaciones, las transaminasas modificadas se pueden expresar como protemas de fusion con etiquetas de purificacion, tales como etiquetas His que tiene afinidad por metales, o etiquetas de anticuerpos para la union a anticuerpos, por ejemplo, etiqueta de epftopo myc.
En algunas realizaciones, tecnicas de afinidad pueden unirse para aislar las enzimas de transaminasas mejoradas. Para la purificacion de cromatograffa de afinidad, cualquier anticuerpo que se une espedficamente al polipeptido de transaminasa puede ser utilizado. Para la produccion de anticuerpos, varios animales huesped, incluyendo pero no limitado a conejos, ratones, ratas, etc., pueden ser inmunizados por inyeccion con un polipeptido alterado. El polipeptido puede estar unido a un soporte adecuado, tal como BSA, por medio de un grupo o enlazadores funcionales de cadena lateral unida a un grupo funcional de cadena lateral. Varios adyuvantes pueden ser usados para aumentar la respuesta inmunologica, dependiendo de la especie huesped, incluyendo pero no limitados a Freund (completo e incompleto), geles minerales tales como hidroxido de aluminio, sustancias activas superficiales tales como lisolecitina, polioles pluronicos, polianiones, peptidos, emulsiones de aceite, hemocianina de lapa de ojo de cerradura, dinitrofenol y adyuvantes humanos potencialmente utiles tales como BCG (bacilos Calmette Guerin) y Corynebacterium parvum.
6. EJEMPLOS
Varias caracteffsticas y realizaciones de la descripcion se ilustran en los siguientes ejemplos representativos, que estan destinados a ser ilustrativos, y no limitantes.
Ejemplo 1: Adquisicion de gen de transaminasa de tipo silvestre y la construccion de vectores de expresion.
Genes que codifican transaminasas (TA) fueron disenados para la expresion en E. coli. basado en la secuencia de aminoacidos informada de la transaminasa, y un algoritmo de optimizacion de codones tal como se describe en el Ejemplo 1 de la Publicacion de Solicitud de Estados Unidos 20080248539, que se incorpora aqrn por referencia. Los genes fueron sintetizados usando oligonucleotidos, generalmente compuestos de 42 nucleotidos, y el gen clonado en el vector de expresion pCK110700 (representado como la FIG. 1 en la Publicacion de Solicitud de Estados Unidos 20050153417) o pCK110900 (representado como la FIG. 3 en la Publicacion de Solicitud de Estados Unidos 20060195947, que se incorpora aqrn por referencia en esta memoria) bajo el control de un promotor lac. Este vector de expresion tambien contiene el origen de replicacion p15A y el gen de resistencia a cloranfenicol. Los plasmidos resultantes se transformaron en E. coli. W3110 utilizando metodos estandar. Genes optimizados por codon y los polipeptidos que codifican se enumeran en la Tabla 2, y sus secuencias proporcionadas como SEQ ID NOs: 1 y 2.
Del mismo modo, los genes que codifican las transaminasas modificadas de la presente descripcion que aparece en la Tabla 2 (SEQ ID NOs: 3-168) fueron clonados en el vector pCK110700 o pCK110900 para la expresion en E. coli W3110.
Ejemplo 2: Produccion de polvos de transaminasas - procedimiento de agitacion de matraz.
Una colonia microbiana unica de E. coli que contiene un plasmido que codifica una transaminasa de interes se inoculo en caldo de Luria Bertani de 50 ml que contiene 30 pg/ml de cloranfenicol y 1% de glucosa. Las celulas se cultivaron durante una noche (al menos 16 horas) en una incubadora a 30°C con agitacion a 250 rpm. El cultivo se diluyo en 250 ml M9YE (1,0 g/L de cloruro de amonio, 0,5 g/L de cloruro de sodio, 6,0 g/L de fosfato disodico monohidrogeno, 3,0 g/L de dihidrogeno fosfato de potasio, 2,0 g/l de extracto de levadura Tastona-154, 1 L/L de agua desionizada) que contiene 30 pg/ml de cloramfenicol y 100 pM de piridoxina, en un matraz de 1 litro a una densidad optica a 600 nm (OD600) de 0,2 y se dejaron crecer a 30°C. La expresion del gen de transaminasa fue inducida por la adicion de isopropilo p D-tiogalactosido (IPTG) a una concentracion final de 1 mM cuando la C600 del cultivo es de 0,6 a 0,8 y luego se continuo la incubacion durante la noche (al menos 16 horas). Las celulas se recogieron por centrifugacion (5000 rpm, 15 min, 4°C) y el sobrenadante se descarto. El sedimento celular se resuspendio con un volumen igual de trietanolamina de 100 mM de tampon fffo (4°C) (cloruro), pH 7,5 que contiene 100 pM piridoxal 5'-fosfato (PLP), y se cosecharon por centrifugacion como anteriormente. Las celulas lavadas se volvieron a suspender en dos volumenes de tampon de trietanolamina en fffo (cloruro) que contiene PLP y pasaron a traves de una prensa francesa dos veces a 12.000 psi, mientras que se mantuvo a 4°C. Los residuos celulares se eliminaron por centrifugacion (9.000 rpm, 45 min., 4°C). Se recogio el sobrenadante de lisado claro y se almaceno a
5
10
15
20
25
30
35
40
45
50
55
60
65
- 20°C. la liofilizacion de lisado claro congelado proporciona un polvo seco de enzima de transaminasa cruda. Alternativamente, el granulo de celulas (antes o despues del lavado) se puede almacenar a 4°C o 80°C.
Ejemplo 3: Produccion de transaminasa - procedimiento de fermentacion.
Una colonia microbiana unica de E. coli. que contiene un plasmido con el gen de transaminasa de interes se inoculo en 2 ml de caldo M9YE (1,0 g/L de cloruro de amonio, 0,5 g/L de cloruro de sodio, 6,0 g/L de fosfato de disodio monohidrogeno, 3,0 g/L de fosfato de dihidrogeno de potasio, 2,0 g/L de Tastona-154 extracto de levadura, 1 L/L de agua desionizada) que contiene 30 pg/ml de cloranfenicol y 1% de glucosa. Las celulas se cultivaron durante una noche (al menos 12 horas) en una incubadora a 37°C con agitacion a 250 rpm. Despues de un crecimiento durante la noche, 0,5 ml de este cultivo se diluyo en 250 ml de caldo de M9YE, que contiene 30 pg/ml de cloranfenicol y 1% de glucosa en 1 frasco de litro y se dejo crecer a 37°C con agitacion a 250 rpm. Cuando la OD600 del cultivo es de 0,5 a 1,0, las celulas se retiraron de la incubadora y, o bien se usaron inmediatamente, o se almacenaron a 4°C.
Fermentaciones a escala de banco se realizaron a 30°C en un fermentador de 15 L agitado aireado, utilizando 6,0 L de medio de crecimiento (0,88 g/L sulfato de amonio, 0,98 g/L de citrato de sodio; 12.5 g/L de dipotasio trihidrato de fosfato de hidrogeno de, 6,25 g/L de fosfato de dihidrogeno de potasio, 3,3 g/l de extracto de levadura de Tastona-154, 0,083 g/L de citrato de amonio ferrico, y 8,3 ml/L de una solucion de elementos traza que contiene 2 g/L de cloruro de calcio dihidrato, 2,2 g/L de sulfato de zinc heptahidratado, 0,5 g/L de monohidrato de sulfato de manganeso, 1 g/L heptahidrato de sulfato de cuproso, 0,1 g/L de amonio tetrahidrato de molibdato y 0,02 g/L de tetraborato de sodio. El recipiente se esterilizo a 121°C y 15 PSI durante 30 minutos, y 100 pM de piridoxina se anadio despues de la esterilizacion. El fermentador se inoculo con un cultivo exponencial tardfo de W3110 de E. coli que contiene un plasmido que codifica el gen de transaminasa de interes (cultivado en un matraz de agitacion como se describe anteriormente a un OD600 inicial de 0,5 a 1,0. El fermentador se agito a 250 a 1250 rpm y se suministra aire al recipiente de fermentacion a 0,6 a 25 L/min para mantener un nivel de oxfgeno disuelto del 50% de saturacion o mayor. El pH del cultivo se mantuvo a 7,0 por adicion de hidroxido de amonio de 20% de v/v. El crecimiento del cultivo se mantuvo mediante la adicion de una solucion de alimentacion que contiene 500 g/L de dextrosa de cerelosa, 12 g/L de cloruro de amonio y 5,1 g/L de sulfato de magnesio heptahidratado. Despues de que el cultivo alcanzo OD600 de 70 + -10, la expresion de transaminasa fue inducida por la adicion de isopropilo-®-D- tiogalactosido (IPTG) a una concentracion final de 1 mM y la fermentacion se continuo durante otras 18 horas. El cultivo fue entonces enfriado a 4°C y se mantuvo a esa temperatura hasta que se cosecho. Las celulas se recogieron por centrifugacion a 5.000 G durante 40 minutos en una centnfuga de Sorval RC12BP a 4°C. Se utilizaron celulas cosechadas directamente en el siguiente proceso de recuperacion aguas abajo o pueden almacenarse a 4°C o congelarse a -80°C hasta su utilizacion.
El sedimento celular se resuspendio en 2 volumenes de 100 mM de tampon de trietanolamina (cloruro), pH 7,5 que contiene 100 pM de piridoxal 5'-fosfato (PLP), a 4°C a cada volumen de pasta celular humeda. La transaminasa intracelular se libera de las celulas haciendo pasar la suspension a traves de un homogeneizador equipado con un conjunto de valvula de homogeneizacion de dos etapas usando una presion de 12.000 psig. El homogeneizado de celulas se enfrio a -20°C inmediatamente despues de la interrupcion. Se anadio una solucion de 11% p/v polietilenimina pH 7,2 al lisado a una concentracion final de 0,5% p/v. Una solucion de 1 M Na2SO4 se anadio al lisado a una concentracion final de 100 mm. El lisado se agito durante 30 minutos. La suspension resultante se clarifico por centrifugacion a 5000G en una centnfuga Sorval RC12BP a 4°C durante 30 minutos. El sobrenadante claro se decanto y se concentro diez veces utilizando una membrana de ultrafiltracion de celulosa con un peso molecular de corte de 30 kD. El concentrado final se dispenso en recipientes poco profundos, se congelo a - 20°C y se liofilizo para polvo. El polvo de transaminasa se almaceno a -80°C.
Ejemplo 4: El examen de alto rendimiento para la identificacion de variantes de Arthrobacter sp. transaminasa de KNK168 capaz de convertir estereoselectivamente el sustrato de cetoamida de sitagliptina a sitagliptina.
Metodo aquiral HPLC para determinar la conversion del sustrato de cetoamida de sitagliptina a sitagliptina: conversion enzimatica de sustrato de cetoamida de sitagliptina (preparado como se describe en la Patente de Estados Unidos N° 7.326.708) a sitagliptina se determino usando un Agilent 1200 HPLC equipado con una columna Agilent Eclipse XDB-C8 (4,6 x 150 mm, 5 pM), usando 45:55 10 mM NH4Ac/MeCN como eluyente a un caudal de 1,5 ml/min y una temperatura de columna de 40°C. Tiempos de retencion: sustrato de cetoamida sitagliptina: 1,4 min; sitagliptina: 1,7 min. El sustrato de cetoamida de sitagliptina y producto en el eluyente se determinaron como el area del pico a 210 nm o 286 nm, con una longitud de trayectoria de 1 cm. Utilizando estas condiciones, el lfmite de deteccion para sitagliptina fue 5 pg/mL. Generalmente, se utilizo una longitud de onda incidente de 210 nm para las mediciones de actividad de transaminasas con actividad similar o igual a la SEQ ID NO: 4.
Metodo de HPLC quiral para determinar estereopureza de sitagliptina.: Se determino la pureza estereoisomerica de sitagliptina usando un Agilent 1200 HPLC equipado con una columna Daicel Chiralpak AD-H (4,6 x 150 mm, 5 pM) usando 60: 40: 0,1: 0,1 EtOH/heptano/dietilamina/agua como eluyente a un caudal de 0,8 ml/min y una temperatura de columna de 35°C. Tiempos de retencion: sustrato de cetoamida sitagliptina: 6,3 min; (S)-enantiomero: 8,4 min; sitagliptina: 10,8 min. El sustrato de cetoamida de sitagliptina y el producto se
5
10
15
20
25
30
35
40
45
50
55
60
65
determinaron como el area del pico a 210 nm o 268 nm con una longitud de trayectoria de 1 cm.
Metodo de espectroscopia de cromatografia-masa liquida (LC/MS) para detectar la conversion de bajo nivel del sustrato de cetoamida de sitagliptina a la sitagliptina: bajo nivel de conversion enzimatica de sustrato de cetoamida sitagliptina a la sitagliptina se determino usando un metodo de LC/MS/MS. Cinco microlitros de muestra se cargo en una columna Eclipse XDB-C8 HPLC (4,6 x 150 mm) y se eluyo isocraticamente con una fase movil de 40:60 de 0,2% formiato de amonio y metanol a 1,0 ml/min. El tiempo de retencion de sitagliptina fue de 1,5 minutos a 35°C. La espectrometna de masas se utilizo para la deteccion en un triple cuadruple Aguas Quattro. Q1 se fijo para pasar el ion M + H a 408,1 AMU y Q3 se establecio para pasar el 235,1 de ion hija. la celula de colision (Q2) tema una energfa de colision de 17,0 y el flujo de gas de argon de 0,3 ml/min. La ionizacion fue por APCI con una descarga de corona de 5 pA, temperatura de la fuente de 130°C y temperatura de la sonda de 600°C. El flujo de gas de desolvatacion era 100 L/minuto y el gas de cono se establecio a 50 L/minuto. Usando estas condiciones, el lfmite de deteccion para sitagliptina fue de 71 pg/mL.
Ejemplo 5: El examen de alto rendimiento para la identificacion de variantes de Arthrobacter sp. transaminasa de KNK168 capaz de convertir estereoselectivamente sustrato de cetoamida de sitagliptina a sitagliptina.
El gen que codifica transaminasa, construido como se describe en el Ejemplo 1, se mutagenizo usando metodos descritos anteriormente y la poblacion de moleculas de ADN alteradas se utilizo para transformar una cepa huesped de E coli adecuada. Se seleccionaron transformantes resistentes a los antibioticos y se procesaron para identificar las que expresan una transaminasa con una capacidad mejorada para transaminar el sustrato de cetoamida de sitagliptina estereoselectivamente a la sitagliptina en presencia de un donante de grupo amino adecuado (es decir, isopropilamina). La seleccion celular, el crecimiento, la expresion inducida de enzimas variantes de transaminasas y recogida de sedimentos celulares fueron como se describen a continuacion.
Colonias de E. coli recombinantes que llevan un gen que codifica la transaminasa se recogieron usando un selector de colonia robotico Q-Bot® (Genetix USA, Inc., Boston, MA) en placas de 96 pocillos de microtitulacion asf poco profundos que conteman en cada pocillo 180 pL LB Broth, 1% de glucosa y 30 pg/ml de cloranfenicol (CAM). Las celulas se cultivaron durante la noche a 30°C con agitacion a 200 rpm. Una alfcuota de 10 pL de este cultivo luego se transfirio a 96 placas de pocillos profundos que contiene 390 pL de caldo M9YE, 100 pM de piridoxina y 30 pg/ml de CAM. Despues de la incubacion de las placas de pocillos profundos a 30°C con agitacion a 250 rpm durante 2-3 horas, expresion de genes recombinantes dentro de las celulas cultivadas se indujo mediante la adicion de IPTG a una concentracion final de 1 mM. Las placas se incubaron a continuacion a 30°C con agitacion a 250 rpm durante 18 horas.
Las celulas se sedimentaron por centrifugacion (4000 rpm, 10 min, 4°C), se resuspendieron en 200 pL de tampon y se lisaron mediante agitacion a temperatura ambiente durante 2 horas lisis. El tampon de lisis contema 100 mM de tampon de trietanolamina (cloruro), pH 7,5 o 8,5, 1 mg/ml de lisozima, 500 pg/ml de sulfato de polimixina B (PMBS) y 250 pM de PLP. Despues de sellar las placas con cinta de sellado termico laminado de aluminio/polipropileno (Velocity 11, Menlo Park, CA, Cat# 06643-001), que se agitaron vigorosamente durante 2 horas a temperatura ambiente. Los restos celulares se sedimentaron por centrifugacion (4000 rpm, 10 min., 4°C) y el sobrenadante claro se ensayo directamente o se almaceno a 4°C hasta su uso.
Para el examen en metanol o DMSO a pH 7,5, con transaminasas alteradas en etapa temprana (es decir, a principios de etapa "evolventes"), se anadio 10 pL de alfcuota de una solucion de sustrato de cetoamida de sitagliptina (40 mg/ml) en metanol o DMSO a cada pocillo de una placa de pocillos profundos Costar®, seguido de adicion de 90 pL de hidrocloruro de 1,1 M de isopropilamina usando un instrumento robotico Biomek NXP (Beckman Coulter, Fullerton, CA). Esto fue seguido por la adicion de 100 pL del sobrenadante de lisado recuperado, tambien se realizo utilizando el Biomek NXP, para proporcionar una reaccion que comprende de 2 mg/ml de sustrato de cetoamida de sitagliptina, 500 mM de clorhidrato de amina de isopropilo, 50 mM de trietanolamina, pH 7,5, y 5% de metanol o DMSO (v/v). Las placas se sellaron termicamente con cinta de sellado termico laminado de aluminio/polipropileno (Velocity 11, Menlo Park, CA, Cat# 06643-001) a 175°C durante 2,5 segundos y despues se agito durante una noche (al menos 16 horas) a 30°C. Las reacciones se inactivaron mediante la adicion de 1 ml de acetonitrilo utilizando un sistema de manipulacion de lfquido Phoenix (Art Robbins Instruments, Sunnyvale, CA). Las placas se volvieron a sellar, se agitaron durante 5 min, y despues se centrifugaron a 4.000 rpm durante 10 min. 200 pL de alfcuota de la mezcla de reaccion aclarada se transfirio a una nueva placa de polipropileno de pozo poco profundo (Costar #3365), se sello y se analizo como se describe en el Ejemplo 4.
Para el examen en DMSO a pH 8,5 con transaminasas alterada de fase tardfa (es decir, "evolventes" de ultima etapa), se anadio 50 pL de alfcuota de una solucion de sustrato de cetoamida de sitagliptina (400 mg/ml) en sulfoxido de dimetilo (DMSO) a cada pocillo de una placa de pocillos profundos Costar®, seguido de adicion de 50 pL de hidrocloruro de isopropilamina 4 M usando un instrumento robotico Biomek NX (Beckman Coulter, Fullerton, CA). Esto fue seguido por la adicion de 100 pL del sobrenadante de lisado recuperado, tambien se realizo utilizando el Biomek NX, para proporcionar una reaccion que comprende de 100 mg/ml de substrato de cetoamida sitagliptina, 1 M de clorhidrato de amina de isopropilo, 50 mM de trietanolamina, pH 8,5, y 25% de DMSO (v/v). Las placas se sellaron termicamente con cinta de sellado termico laminado de aluminio/polipropileno (Velocity 11, Menlo Park, CA,
5
10
15
20
25
30
35
40
45
50
55
60
65
Cat# 06643-001) a 175°C durante 2,5 segundos y despues se agito durante una noche (al menos 16 horas) a 45°C. Las reacciones se inactivaron mediante la adicion de 1 ml de acetonitrilo utilizando un sistema de manipulacion l^quido Phoenix (Art Robbins Instruments, Sunnyvale, CA). Las placas se volvieron a sellar, se agitaron durante 5 min, y despues se centrifugaron a 4.000 rpm durante 10 min. 10 pL de alfcuota de la mezcla de reaccion aclarada se transfirio a una nueva placa de polipropileno de pozo poco profundo (Costar #3365) que contiene 190 pL de acetonitrilo, se sello y se analizo como se describe en el Ejemplo 4.
La transaminasa de la SEQ ID NO: 2 expresada como en los Ejemplos 1 y 2 no exhibio actividad detectable sobre el sustrato de cetoamida sitagliptina utilizando los metodos de deteccion del Ejemplo 4. Las variantes de Arthrobacter sp. transaminasa de KNK168 capaz de convertir el sustrato de cetoamida sitagliptina a la sitagliptina se identificaron utilizando los enfoques y los procedimientos descritos anteriormente. Multiples iteraciones de estos procesos, en los que se utilizaron uno o mas aislados mejorados de una ronda como el material de partida para posteriores rondas de mutagenesis y examen, se utilizaron para desarrollar o "evolucionar" Arthrobacter sp. variantes de transaminasa KNK168 con una mejor capacidad para reducir el sustrato de cetoamida de sitagliptina estereoselectivamente a la sitagliptina.
Ejemplo 6: Transaminacion estereoselectiva en metanol del sustrato de cetoamida sitagliptina por transaminasas alteradas en la Tabla 2 derivadas de Arthrobacter sp. transaminasa de KNK168.
Transaminasas mejoradas designadas "+" en la Tabla 2 derivadas de Arthrobacter sp. transaminasa de KNK168 se evaluaron a escala preparativa en DMSO como sigue. Una solucion 500 pL de la variante de transaminasa (20 mg/ml) en 100 mM de tampon de trietanolamina-cloruro de pH 7,5 con 250 pM de piridoxal 5'- fosfato se anadio a 5 ml de vial de reaccion equipado con una barra de agitacion magnetica. Posteriormente, 450 pL de 1,1 M de hidrocloruro de isopropilamina, seguido por 50 pL de una solucion de sustrato de cetoamida sitagliptina se anadio (40 mg/ml) en DMSO a la solucion de transaminasa. La reaccion se agito a 22°C y se controlo por analisis de HPLC de muestras tomadas periodicamente de la mezcla de reaccion (vease el Ejemplo 4 para las condiciones de analisis). La Tabla 2 proporciona la SEQ ID NO. correspondiente a variantes de transaminasa designadas "+", el numero de diferencias de restos de aminoacidos de la transaminasa de tipo salvaje, y la actividad de cada una hacia sustrato de cetoamida de sitagliptina con relacion a la de la enzima que tiene la secuencia de aminoacidos de SEQ ID NO: 4.
Las transaminasas mejoradas designadas "++", "+++", "++++" y "+++++" en la Tabla 2 se ensayaron con las condiciones ajustadas como sigue: "++": 2 g/L de sustrato de cetoamida sitagliptina, 0,5 M de isopropilamina, 22°C, pH 7,5, MeoH al 5%; "+++": 5-10 g/L de sustrato de cetoamida de sitagliptina, 0,5-1 M de isopropilamina, 22-30°C, pH 7,5, MeOH al 5%; "++++": 10-40 g/L de sustrato de cetoamida de sitagliptina, 1 M de isopropilamina, 30-45°C, pH
8.5, MeOH al 10%; "+++++": 40-100 g/L de sustrato de cetoamida de sitagliptina, 1 M de isopropilamina, 45°C, pH
8.5, MeOH al 10%-25% de DMSO; y "++++++": 40-100 g/L de sustrato de cetoamida, 1 M de isopropilamina, 45°C, pH 8,5, 50% de DMSO, 1.000 pM de PLP. actividades relativas de las transaminasas mejoradas designadas "+++", "++++", "+++++", "++++++" se determinaron en relacion a las actividades de la SEQ ID NO: 22, SEQ ID NO: 48, SEQ ID NO: 58 y SEQ ID NO: 104, respectivamente.
Para muchas transaminasas modificadas, la conversion de sustrato de cetoamida de sitagliptina a la sitagliptina tambien se puede lograr utilizando los donantes de grupos amino tales como D-alanina, acido 3- aminobutrnco, o (-metilbencilamina a una concentracion adecuada.
Ejemplo 7: Preparacion de (S)-2,2,2-trifluoro-1-feniletanamina de 2,2,2-trifluoro-1-feniletanona.
Preparacion de (S)-2,2,2-trifluoro-1-feniletanamina se ilustra como sigue:
imagen86
Proceso. Se anadio 1,4 g de hidrocloruro de isopropilamina a 14 ml de 0,1 M de tampon de trietanolamina a pH 8,5. Despues de disolver el clorhidrato de isopropilamina, 20 mg de PLP y 100 mg de una transaminasa de la SEQ ID NO:74 se anadieron y se disolvieron con agitacion suave a 400 rpm. El reactor se calento a 60°C y el pH de la solucion se ajusto a pH 8,5 con 5N NaOH. Aproximadamente 400 mg de sustrato de cetona 2,2,2-trifluoro-1 - feniletanona se disolvio en 6 ml de DMSO y se anadio gota a gota a la solucion durante 2 horas. El reactor se agita a continuacion a 500 RPM, 60°C, y el conjunto de pH a 8,5 durante 24 h. Despues de 24 h, la reaccion habfa alcanzado 99% de conversion al producto (S)-2,2,2-trifluoro-1-feniletanamina. Durante la elaboracion, la temperatura de la reaccion se disminuyo a 45°C y se anadio 2 N HCl gota a gota para disminuir el pH de la reaccion a pH 2. La
5
10
15
20
25
30
35
40
45
50
55
60
65
reaccion se dejo en agitacion durante 1 hora y el precipitado se filtro a traves de un embudo con vidrio equipado con una toalla de algodon. El precipitado se lavo tres veces con 10 ml de 0,1 N HCl. Los filtrados acuosos se combinaron y el pH se aumento a pH 11 con 5 N NaOH, seguido de extraccion con 2 x 100 ml de IPAC. Capas de IPAC se lavaron con 25 ml de salmuera, se secaron con MgSO4, se filtraron y se concentraron hasta un aceite del producto de (S)-2,2,2-trifluoro-1-feniletanamina.
Ejemplo 8: Preparacion de (R)-2-(2-fluorofenilo)pirrolidina a partir de 4-cloro-1-(2-fluorofenilo)butan-1-ona. Preparacion de (R)-2-(2-fluorofenilo)pirrolidina se ilustra como sigue:
imagen87
Proceso. A un vial de HPLC se anadio 10 pL cargado de cetona y 200 pL de DMSO. A un tubo de 50 mL Falcon se anadio 3,75 g de isopropilamina-HCl y 30 mL de 0,1 M de tampon de TEA. Se anade aproximadamente 37,5 mg de PLP y la mezcla de reaccion se agito con vortex para mezclarse. Atubos de 15 mL Falcon se anadieron 25 mg de una transaminasa de SEQ ID NO: 80. Se anadio una solucion de 5 ml de PLP/tampon a la enzima que contiene el tubo y se agito para disolver la enzima. 1,0 ml de la solucion de enzima se anadio al vial de LC que contiene el sustrato de cetona de 4-cloro-1-(2-fluorofenilo)butan-1-ona y DMSO y se coloca el vial a 45°C y se mezclo a 1.000 rpm en un termomezclador. Despues de varios dfas, el analisis de LCMS mostro una conversion de 53 LCAP a producto con una masa M+1 de 166. La coinyeccion con un estandar autentico del producto deseado (R)-2-(2-fluorofenilo)pirrolidina confirmo la identidad de este pico. La mezcla de reaccion se extrajo con 1,0 ml de EtOAC. la muestra se concentro y despues se diluyo con metanol. El ensayo por SFC usando una columna Chiralpak AD-H como fase estacionaria mostro (R)-2-(2-fluorofenilo)pirrolidina en un exceso enantiomerico de 95%.
Ejemplo 9: Preparacion de (R)-etilo 3-amino-3-(piridina-2-ilo)propanoato de etilo 3-oxo-3-(piridina-2-ilo)propanoato
Preparacion de (R)-etilo 3-amino-3-(piridina-2-ilo)propanoato se ilustra como sigue:
imagen88
Metodos/Materiales: la reaccion se llevo a cabo en un matraz de fondo redondo de 3L con monitor de pH, agitacion superior, manta de calentamiento, y termopar. Aproximadamente 100 g del etilo 3-oxo-3-(piridina-2- ilo)propanoato sustrato de cetoester se disolvio en 800 ml de DMSO que resulto en una solucion que es de color verde. Aproximadamente 4 g de vitamina-B6 ("PLP") se preparo en 1,2 L o 0,5 M de tampon de trietanolamina, pH 8,4 con 100 g/L isopropilamina-HCl. Despues de la adicion, el pH era 8,3. El pH fue ajustado a pH 8,8 mediante la adicion de 3 ml de KOH al 20% en peso. El polipeptido de transaminasa de la SEQ iD NO: 86 (2 g) se preparo en tampon y se mezclo hasta que este completamente disuelto. El pH de la solucion es 8,77 y la solucion se mantuvo a 21,7°C. El sustrato de cetoester preparado en DMSO se anadio directamente en lote en una porcion.
Reaccion: La reaccion es exotermica y se calienta la temperatura de lote a 38,1°C mientras que el pH de la solucion es 8,45 y aparece como una suspension verdosa. La solucion se calienta a 50°C. A una temperatura de 47°C, el pH de la solucion es 8,31, y luego el pH se ajusto a 8,6 mediante la adicion de 2 ml de KOH al 20% en peso. Despues de 2 horas de carga de sustrato, el pH era 8,07, y el pH se ajusto a 9,02 mediante la adicion de 4 ml de solucion de isopropilamina 4M. 6 h despues de la carga del sustrato, el pH era 8,05, y el pH se ajusto a 8,9 mediante la adicion de 4 ml de solucion de isopropilamina 4 M. La reaccion se dejo incubar durante la noche. Despues de 15 h de la carga del sustrato, el pH fue 7,4, y 47,6 mL de agua y la agitacion se incremento (el volumen se redujo ~ 25%). Se anadieron aproximadamente 8 ml de 4M de isopropilamina para ajustar el pH a 8,85. Despues
5
10
15
20
25
30
35
40
45
50
55
60
65
de 17,25 h, el pH fue 8,5, y la reaccion se dejo proceder sin ajuste adicional del pH. En 18,33 h, el pH era 8,27 y la reaccion fue completa como se determino por el ensayo en RP-HPLC.
Tratamiento de reaccion: 2 g de Solka Floc® se anadio a la solucion a temperatura ambiente. El pH de la solucion se aumento a 9,2 tras el enfriamiento ya que hada un cambio de pH dependiente de la temperatura con el tampon. El pH de la solucion se ajusto a 1,8 con la adicion de 4,5 ml de H2SO4 concentrado y se envejecio a 1 hora. La solucion se filtro al vado a traves de 5 pM de filtro con un frasco de filtrado y un filtro fritado (60 mL-40M). La filtracion tardo 1,5 h. La torta se lavo con 50,6 g de H2SO4 diluido (PH 1,6) mezclando ffsicamente con la solucion de lavado. La filtracion tardo aproximadamente 20 min. La torta se lavo de nuevo con 50 g de solucion acida diluida seguido por filtracion rapida en <5 min. El primer lavado y primeras soluciones acuosas acidas se combinaron y 67 ml de heptano y 3,3 ml de tolueno en una porcion. La solucion se mezclo a fondo y se separaron las capas en un embudo de separacion. El primer 1 acuoso acido resulta en aproximadamente el 63% de recuperacion del rendimiento teorico de la combinacion de productos de (R)-etilo 3-amino-3-(piridina-2-ilo)propanoato aminoacido/aminoester. El lavado acido 1 resulta en aproximadamente 27% de recuperacion mientras que el segundo lavado acido resulta en la recuperacion de alrededor del 10%.
Se anadieron aproximadamente 99,4 g de KOH al 20% en peso a la solucion para ajustar el pH a 13 y la solucion se incubo a 50°C. Despues de 20 min, se anadio 11,8 g adicionales de KOH al 20% en peso para ajustar el pH de 12,1 a 13. Despues de 20 min adicionales, el pH se estabilizo en 12,8 y la hidrolisis fue completa como se determino por HPLC. Se observo que los solidos se precipitaron fuera de la solucion. La solucion basica se filtro en un embudo fritado (los solidos se disolvieron en agua y paredan ser inorganicos ya que se observo solo una pequena cantidad de producto, los solidos no entraron en MeCN). La solucion basica se concentro en roto- evaporador para producir una solucion bruta de potasio-sal de (R)-etilo 3-amino-3-(piridina-2-ilo)propanoato con un rendimiento del 75%.
LISTADO DE SECUENCIAS
<110> Codexis, Inc.
HUGHES, Gregory DEVINE, Paul N.
FLEITZ, Fred J.
GRAU, Brendan T.
LIMANTO, John MUNDORFF, Emily SAVILE, Christopher
<120> REACCIONES transaminasa
<130> CX2-019WO1
<150> 61/308.873 <151> 2010-02-26
<150> 61/219.372 <151> 2009-06-22
<160> 168
<170> PatentIn version 3.5
<210> 1 <211> 993 <212> ADN
<213> Secuencia artificial <220>
<223> ATA117 <400> 1
5
10
15
20
25
30
35
40
45
50
55
60
65
atggcttfcct
ctgctgacac ctctgaaatc gtttacaccc acgacaccgg tctggactat 60
atcacctact
ctgaotacga actggacccg gctaacccgc tggctggtgg tgctgcttgg 120
atcgaaggtg
ctttcgttcc gecgtctgaa gctcgtatct ctatcttcga ccagggttac 180
ctgcactctg
acgttaccta eaccgttttc eacgtttgga acggtaacgc tttccgtctg 240
gacgaccaca
tcgaacgtct gttctctaac gotgaatcta tgcgtatcat cccgccgctg 300
acccaggacg
aagttaaaga aatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360
gcattcgttt
ctgtttctat caeccgtggt tactcttcta ccccaggtga acgtgacatc 420
accaaacatc
gtcegcaggt ttacatgtac gctgttccgt accagtggat cgtaccgttt 480
gaccgcatcc
gtgacggtgt tcacgctatg gttgctcagt ctgttcgtcg tactccgcgt 540
tcttctatcg
acccgcaggt taaaaacttc cagtggggtg acctgatccg tgcagttcag 600
gaaacccacg
accgtggttt cgaagctccg ctgctgctgg acggtgacgg tctgctggct 660
gaaggttctg
gtttcaacgt tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720
getgctctgc
cgggtatcac cegtaaaacc gttctggaaa togctgaatc tctgggtcac 780
gaagctatee
tggetgacat caecetggct gaaetgctgg aegotgacga agttctgggt 840
tgcactaceg
ctggtggfcgt ttggccgtto gtttctgttg acggtaaccc gatctctgac 900
ggtgttccgg
gtccggttac ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960
imagen89
<210>2 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> ATA117 <400> 2

Claims (15)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    1. Un procedimiento para preparar un producto de amina de formula estructural (I):
    imagen1
    tienen la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *; en un exceso enantiomerico sobre el enantiomero opuesto, en el que
    R1 es arilo o heteroarilo opcionalmente sustituido;
    R2 es un alquilo C1-C6 opcionalmente sustituido, -R3C(O)R4O - R3OC(O)R5
    R3 es un C1-C4 alquilo opcionalmente sustituido, y R4 es H, un C1-C4 alquilo opcionalmente sustituido, NR6R7, o OR8,
    donde R5, R6, R7Y R8 son independientemente H o C1-C4 alquilo; el proceso comprende poner en contacto un sustrato de cetona de formula estructural (II):
    imagen2
    con un polipeptido de transaminasa en presencia de un donante de amino en condiciones de reaccion adecuadas para la conversion del sustrato de cetona en el producto amina, en el que el polipeptido de transaminasa tiene al menos 95% de identidad de secuencia con la SEQ ID NO: 74 y es capaz de convertir el sustrato de cetona para el producto de amina a una velocidad que esta mejorado en comparacion con la SEQ ID NO: 2.
  2. 2. El proceso de la reivindicacion 1, en donde:
    i) R1 es un piridinilo opcionalmente sustituido;
    ii) R1 es un fenilo opcionalmente sustituido;
    iii) R1 es un arilo o heteroarilo sustituido;
    iv) la sustitucion en el C1-C6 alquilo y R3 se seleccionan de halogeno, NR5R6, o OR8, Donde R5 y R6 se definen anteriormente y R8 es H o C1-C4 alquilo; o
    v) R2 es metilo o halo sustituido metilo, en el que el sustituido con halo metilo opcionalmente es CF2H o CF3.
  3. 3. El proceso de la reivindicacion 1, en el que:
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    imagen3
    y el sustrato de cetona de formula (II) es:
    imagen4
    en la que R7 esta sustituido opcionalmente C1-C4 alquilo, y R10 es R9 definido anteriormente; ii) el producto de amina de formula (I) es:
    imagen5
    en la que R9 es H, Cl, Br, F, CH3, CF3, CN, SO2, -OCH3, -C(O)CH3, o NO2, y el sustrato de cetona de formula (II) es:
    imagen6
    en la que R9 opcionalmente esta en la posicion para en el anillo fenilo;
    iii) el producto de amina de formula (I) es (S)-1-(4-bromofenilo)-2,2,2-trifluoroetanamina:
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    imagen7
    y el sustrato de cetona de formula (II) es 1-(4-bromofenilo)-2,2,2-trifluoro:
    imagen8
    iv) el producto de amina de formula (I) es (S)-2,2,2-trifluoro-1-p-toliletanamina:
    imagen9
    y el sustrato de cetona de formula (II) es 2,2,2-trifluoro-1-p-toliletanona
    imagen10
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    imagen11
    y el sustrato de cetona de formula (II) es 2,2,2-trifluoro-1-(4- (trifluorometilo)fenilo) etanona:
    imagen12
    vi) el producto de amina de formula (I) es (R)-etilo-3-amino-3- piridina-2-ilo)propanoato:
    imagen13
    y el sustrato de cetona de formula (II) es acetato de 3-oxo-3-(pirindin-2-ilo)propanoato:
    imagen14
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    imagen15
    y el sustrato de cetona de formula (II) es:
    imagen16
    en la que R11 es halogeno, OH, -C(O)R4, -OC(O)R5O NR6R7, En el que R4, R5, R6, R7, R7 y R10 se ha definido anteriormente; o
    viii) el producto de amina de formula (I) es (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina:
    imagen17
    y el sustrato de cetona de formula (II) es 4-cloro-1-(2-fluorofenilo)butan-1-ona:
    imagen18
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
  4. 4. Un procedimiento para preparar el compuesto de formula (III):
    imagen19
    teniendo la configuracion estereoqmmica indicada en el centro estereogenico marcado con un * en un exceso enantiomerico sobre el enantiomero opuesto, en el que, R10 es Cl, Br, F, CH3, CF3, CN, SO2, -OCH3, o NO2, comprendiendo el proceso:
    (a) poner en contacto un sustrato de cetona de formula:
    imagen20
    en el que Ra es halogeno, OH, -C(O)R4, -OC(O)R5O NR6R7, En el que R4, R5, R6Y R7 es H o C1-C4 alquilo, y R10 es como se define anteriormente, con un polipeptido de transaminasa en presencia de un donante de amino en condiciones de reaccion adecuadas para la conversion de la cetona de sustrato a un producto de amina de formula:
    imagen21
    en el que el polipeptido de transaminasa tiene al menos 95% de identidad de secuencia con la SEQ ID NO: 74 y es capaz de convertir el sustrato de cetona al producto de amina a una velocidad que esta mejorada en comparacion con la SEQ ID NO: 2; y (b) ciclar el producto de amina en condiciones adecuadas para formar el compuesto de formula (III).
  5. 5. El proceso de la reivindicacion 4, en el que el sustrato de cetona es 4-cloro-1-(2-fluorofenilo)butan-1-ona:
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    imagen22
    y el producto de amina es (S)-4-cloro-1-(2-fluorofenilo)butan-1-amina:
    imagen23
    formando de esta manera (R)-2-(2-fluorofenilo) pirrolidina:
    imagen24
    en exceso enantiomerico.
  6. 6. El proceso de una cualquiera de las reivindicaciones 1 a 5, en el que la condicion de reaccion:
    (i) comprende una temperatura de 20°C a 65°C, por ejemplo en el que la condicion de reaccion comprende una temperatura de 40°C a 65°C;
    ii) es de un pH de aproximadamente 7,0 a un pH de aproximadamente 11,0, en el que la opcionalmente pH se mantiene mediante la adicion de isopropilamina; o
    iii) comprende un disolvente de sulfoxido de dimetilo (DMSO), en el que el DMSO opcionalmente esta entre aproximadamente 10% a aproximadamente 40% (v/v).
  7. 7. El proceso de una cualquiera de las reivindicaciones 2v) o 3i) -3iv), en el que la condicion de reaccion comprende una temperatura de aproximadamente 50°C a 65°C.
  8. 8. El proceso de una cualquiera de las reivindicaciones 1 a 5, en el que el producto de amina se produce en al menos el 90% de exceso enantiomerico, opcionalmente en el que el producto de amina se produce en al menos el 99% de exceso enantiomerico. 9
  9. 9. El proceso de una cualquiera de las reivindicaciones 1 a 5, en el que el donante amino se selecciona de isopropilamina, alanina, acido 3-aminobutmco, o metilbencilamina, opcionalmente en el que el donante amino es isopropilamina.
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
  10. 10. El proceso de cualquiera de las reivindicaciones 1 a 5, comprendiendo ademas el paso de eliminar un subproducto de carbonilo de la reaccion.
  11. 11. El proceso de la reivindicacion 10, en el que el donante amino es un aminoacido y el subproducto de carbonilo es un acido ceto.
  12. 12. El proceso de la reivindicacion 11, en el que el subproducto de carbonilo tiene una presion de vapor mayor que el agua, y la eliminacion del subproducto de carbonilo es por borboteo de un gas no reactivo o aplicando un vado.
  13. 13. El proceso de la reivindicacion 12, en el que:
    i) el gas no reactivo es gas nitrogeno; o
    ii) el donante de grupo amino es isopropilamina y el subproducto de carbonilo es acetona.
  14. 14. El proceso de una cualquiera de las reivindicaciones 1 a 5, en el que el sustrato esta presente en 5 a 25 g/L.
  15. 15. El proceso de una cualquiera de las reivindicaciones 1 a 5, en el que la transaminasa comprende una secuencia de aminoacidos que tiene una diferencia dresiduo en comparacion con SEQ ID NO: 2 en una o mas posiciones de residuo seleccionado de: X4; X5; X8; X18; X25; X26; X27; X28; X30; X41; X42; X48; X49; X50; X54; X55; X60; X61; X62; X65; X81; X94; X96; X102; X117; X120; X124; X126; X136; X137; X138; X146; X148; X150; X152; X155; X156; X160; X163; X164; X169; X174; X178; X195; X199; X204; X208; X209; X211; X215; X217; X225; X230; X252; X269; X273; X282, X292; X297; X306; X321; y X329, opcionalmente en el que:
    (i) la diferencia de residuo con un polipeptido de transaminasa de la SEQ ID NO: 2 se produce en una o mas posiciones de residuos seleccionados de: X62, X69, X122, X136, X137, X195, X199, X208, X209, X223, X225, X282, y X284;
    ii) el tipo de residuo de aminoacido en la posicion de la diferencia de residuo se selecciona de:
    X4 es un residuo aromatico,
    X8 es un residuo restringido;
    X26 es un residuo aromatico o restringido;
    X48 es un residuo polar, acido, alifatico o no polar;
    X60 es un residuo aromatico;
    X61 es un residuo aromatico;
    X62 es un aromatico o un residuo polar;
    X65 es un residuo alifatico;
    X69 es una cistema (C) o residuo no polar, polar, o alifatico X81 es un residuo no polar;
    X94 es un residuo alifatico;
    X96 es un residuo alifatico;
    X102 es una alifatico o residuo basico;
    X122 es un residuo constrenido, no-polar o alifatico;
    X124 es un residuo polar o restringido;
    X136 es un residuo aromatico;
    X137 es un residuo polar o alifatico;
    X150 es aromatico, limitada o residuo polar;
    X152 es cistema (C), un residuo no polar, alifatico, o polar;
    X160 es un residuo alifatico;
    X163 es un residuo alifatico o constrenido;
    X169 es un residuo alifatico;
    X174 es un residuo alifatico;
    X178 es un residuo polar;
    X195 es un residuo aromatico o polar;
    X199 es un residuo alifatico o aromatico;
    X208 es cistema (C) o residuo constrenido, no polar, aromatico, polar o basico;
    X209 es un residuo alifatico;
    X211 es un residuo alifatico;
    X215 es una cistema (C);
    X217 es un residuo polar;
    X223 es un residuo restringido;
    X225 es un residuo aromatico;
    X230 es un residuo alifatico;
    X252 es un residuo aromatico o alifatico;
    X269 es un residuo restringido;
    X273 es un residuo aromatico;
    X282 es un residuo polar;
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    X284 es un residuo no polar X292 es un residuo polar;
    X297 es un residuo polar;
    X306 es un residuo alifatico;
    X321 es un residuo restringido, y
    X329 es un residuo restringido o aromatico;
    iii) el residuo de aminoacido en la posicion de la diferencia de residuo se selecciona de: X4 es Y; X8 es P; X26 es H; X48 es Q, D, V, G, o A; X60 es F; X61 es Y; X62 es T, Y o F; X65 es A; X69 es G, C, T, A, o S; X81 es G; X94 es I o L; X96 es L; X102 es L o K; X122 es M, I, L, V, o H; X124 T, H o N; X136 es Y o F; X137 es T o I; X150 es F, H, o S; X152 es I, L, S o C; X160 es L; X163 es H o V; X169 es L; X174 es A; X178 es S; X195 es F o Q; X199 es W o I; X208 es H, C, G, K, N, Y, D o S; X209 es L; X211 es I; X215 es C; X217 es N; X223 es P; X225 es Y; X230 es V; X252 es F; X269 es P; X273 es Y; X282 es S; X284 es G; X292 es T; X297 es S; X306 es L; X321 es P; y X329 es H, opcionalmente en el que el residuo de aminoacido en la posicion de la diferencia de residuo se selecciona de: X8 es P; X60 es F; X61 es Y; X62 es T, Y o F; X65 es A; X69 es G, C, T, A, o S; X81 es G; X94 es I o L; X96 es L; X122 es M, I, L, V, o H; X124 T, H o N; X136 es Y o F; X169 es L; X178 es S; X199 es W o I; X209 es L; X215 es C; X217 es N; X223 es P; X269 es P; X273 es Y; X282 es S; X284 es G; X297 es S; X321 es P y X329 es H; o iv) el polipeptido de transaminasa tiene una secuencia de aminoacidos que corresponde a la secuencia de la SEQ ID NO: 58, 72, 74, 80, 86, 96, 98, 100, o 102.
ES10797544.3T 2009-06-22 2010-06-21 Reacciones de transaminasa Active ES2644992T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US21937209P 2009-06-22 2009-06-22
US219372P 2009-06-22
US30887310P 2010-02-26 2010-02-26
US308873P 2010-02-26
PCT/US2010/039343 WO2011005477A1 (en) 2009-06-22 2010-06-21 Transaminase reactions

Publications (1)

Publication Number Publication Date
ES2644992T3 true ES2644992T3 (es) 2017-12-01

Family

ID=43429475

Family Applications (1)

Application Number Title Priority Date Filing Date
ES10797544.3T Active ES2644992T3 (es) 2009-06-22 2010-06-21 Reacciones de transaminasa

Country Status (7)

Country Link
US (6) US8921079B2 (es)
EP (1) EP2446026B1 (es)
CN (1) CN102597226B (es)
ES (1) ES2644992T3 (es)
IL (1) IL216099A (es)
SG (1) SG177329A1 (es)
WO (1) WO2011005477A1 (es)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8293507B2 (en) * 2009-02-26 2012-10-23 Codexis, Inc. Transaminase biocatalysts
ES2644992T3 (es) 2009-06-22 2017-12-01 Codexis, Inc. Reacciones de transaminasa
EP2606139B1 (en) * 2010-08-16 2015-07-15 Codexis, Inc. Biocatalysts and methods for the synthesis of (1r,2r)-2-(3,4-dimethoxyphenethoxy)cyclohexanamine
US9587229B2 (en) 2011-06-24 2017-03-07 Merck Sharp & Dohme Corp. Immobilized transaminases and process for making and using immobilized transaminase
EP2753640B1 (en) 2011-09-08 2016-03-09 Codexis, Inc. Biocatalysts and methods for the synthesis of substituted lactams
WO2014037376A1 (en) 2012-09-04 2014-03-13 C5 Ligno Technologies In Lund Ab Stereoselective biosynthesis in microbial host cells
WO2014060571A1 (en) * 2012-10-18 2014-04-24 Sandoz Ag A process for preparing indoline derivatives
CN105164263B (zh) 2013-02-28 2022-07-01 科德克希思公司 用于工业生物催化的工程化转氨酶多肽
WO2014133928A1 (en) * 2013-02-28 2014-09-04 Merck Sharp & Dohme Corp. Immobilized transaminases and process for making and using immobilized transaminase
US10150959B2 (en) 2013-03-15 2018-12-11 Merck Sharp & Dohme Corp. Immobilized ketoreductases and process for making and using immobilized ketoreductase
KR20170004510A (ko) 2015-07-02 2017-01-11 씨제이제일제당 (주) 신규 트랜스아미나제 및 이를 이용한 아미노 화합물의 탈아민 방법
US11359183B2 (en) 2017-06-14 2022-06-14 Codexis, Inc. Engineered transaminase polypeptides for industrial biocatalysis
EP3415630A1 (en) 2017-06-14 2018-12-19 EntreChem, S.L. Method for one-pot production of a primary amine from an alcohol
CN108586346B (zh) * 2018-05-10 2019-10-01 北京富盛嘉华医药科技有限公司 一种生物催化合成西他列汀及其中间体的方法
CA3126671A1 (en) * 2019-01-15 2020-07-23 Codexis, Inc. Engineered transaminase polypeptides
WO2021207200A2 (en) 2020-04-10 2021-10-14 Codexis, Inc. Engineered transaminase polypeptides
CN112501145A (zh) * 2021-02-04 2021-03-16 凯莱英医药集团(天津)股份有限公司 转氨酶突变体及其应用
MX2023009213A (es) * 2021-02-05 2023-08-22 Zhejiang Apeloa Kangyu Pharmaceutical Co Ltd Construccion y aplicacion de un mutante de la omega-transaminasa reversible enantioselectivamente.
CN115975969A (zh) * 2021-10-14 2023-04-18 弈柯莱生物科技(上海)股份有限公司 转氨酶及用于制备西他列汀或其中间体的用途
CN114457125B (zh) * 2021-12-07 2024-04-09 浙江工业大学 转氨酶与乙醇脱氢酶偶联合成(r)-1-[3,5-双(三氟甲基)苯基]乙胺的方法
WO2024121301A1 (en) 2022-12-09 2024-06-13 Krka, D.D., Novo Mesto Process for the preparation of sitagliptin

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3926862A (en) 1973-04-16 1975-12-16 Allied Chem Detergent solvent compositions
US4075256A (en) * 1973-11-29 1978-02-21 Petro-Tex Chemical Corporation Purification of unsaturated compounds
US4600692A (en) 1983-02-10 1986-07-15 Purification Engineering, Inc. Immobilized cells for preparing phenylalanine
US4518692A (en) 1983-09-01 1985-05-21 Genetics Institute, Inc. Production of L-amino acids by transamination
US4826766A (en) 1985-09-23 1989-05-02 Genetics Institute, Inc. Production of amino acids using coupled aminotransferases
JPS63273486A (ja) 1987-04-30 1988-11-10 Tanabe Seiyaku Co Ltd 1−(4−メトキシフェニル)−2−アミノプロパンの製法
US5316943A (en) 1988-06-14 1994-05-31 Kidman Gene E Racemic conversion of using a transaminase
US5300437A (en) 1989-06-22 1994-04-05 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US4950606A (en) 1989-06-22 1990-08-21 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US5169780A (en) 1989-06-22 1992-12-08 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US5346828A (en) 1991-03-27 1994-09-13 Celgene Corporation Stereoisomeric enrichment of 2-amino-3-hydroxy-3-phenylpropionic acids using d-threonine aldolase
US5360724A (en) 1992-12-18 1994-11-01 Celgene Corporation Process for the preparation of chiral 1-aryl-2-aminopropanes
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
WO1997015682A1 (fr) 1995-10-23 1997-05-01 Kaneka Corporation Procede de production de composes amines actifs sur le plan optique
US5814473A (en) 1996-02-09 1998-09-29 Diversa Corporation Transaminases and aminotransferases
JPH10165194A (ja) 1996-12-12 1998-06-23 Sumitomo Chem Co Ltd 光学純度の向上方法
DE69841075D1 (de) 1997-04-23 2009-10-01 Kaneka Corp Deoxynukleinsäure welche ein Polypeptid mit stereoselektiver Transaminase Aktivität kodiert, sowie die Deoxynukleinsäure enthaltende Transformanden
US6197558B1 (en) 1997-05-19 2001-03-06 Nsc Technologies Transaminase biotransformation process
US6133018A (en) 1997-06-02 2000-10-17 Celgro Enzymatic synthesis of chiral amines using -2-amino propane as amine donor
US5866512A (en) 1997-12-19 1999-02-02 Celgene Corporation Plant growth inhibition using the R-isomer of esprocarb
PL342882A1 (en) 1998-03-11 2001-07-16 Celgro Improvements in the enzymatic synthesis of chiral amines
WO2000026351A1 (fr) 1998-10-30 2000-05-11 Kaneka Corporation (S)-α-PHENETHYLAMINE : TRANSAMINASE DE PYRUVATE
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
ATE277170T1 (de) * 1999-03-19 2004-10-15 Sumitomo Chemical Co Stereoselektive transaminase, deren kodierende gen und deren verwendungen
DE19919848A1 (de) 1999-04-30 2000-11-02 Aventis Cropscience Gmbh Verfahren zur Herstellung von L-Phosphinothricin durch enzymatische Transaminierung mit Aspartat
US6107521A (en) 1999-12-14 2000-08-22 Celgro Process for the preparation of secondary amines
MXPA02011764A (es) 2000-06-05 2003-04-10 Fmc Corp Proceso para preparar sulfonamidas.
US7202070B2 (en) 2000-10-31 2007-04-10 Biocatalytics, Inc. Method for reductive amination of a ketone using a mutated enzyme
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
AR043515A1 (es) 2003-03-19 2005-08-03 Merck & Co Inc Procedimiento para preparar derivados quirales beta aminoacidos mediante hidrogenacion asimetrica
JO2625B1 (en) 2003-06-24 2011-11-01 ميرك شارب اند دوم كوربوريشن Phosphoric acid salts of dipeptidyl betidase inhibitor 4
US20050009151A1 (en) 2003-07-10 2005-01-13 Pharmacia Corporation Methods for the stereospecific and enantiomeric enrichment of beta-amino acids
US7629157B2 (en) 2003-08-11 2009-12-08 Codexis, Inc. Ketoreductase polypeptides and related polynucleotides
AU2004265693A1 (en) 2003-08-11 2005-02-24 Codexis, Inc. Improved halohydrin dehalogenases and related polynucleotides
KR100718817B1 (ko) 2004-07-19 2007-05-17 김병기 신규한 오메가아미노트랜스퍼라제, 이의 유전자 및 이의이용 방법
US7172885B2 (en) 2004-12-10 2007-02-06 Cambrex North Brunswick, Inc. Thermostable omega-transaminases
JP4922929B2 (ja) 2005-05-23 2012-04-25 株式会社カネカ 新規アミノ基転移酵素、およびこれをコードする遺伝子、ならびにこれらの利用法
EP1818411A1 (en) 2006-02-13 2007-08-15 Lonza AG Process for the preparation of optically active chiral amines
JP5410089B2 (ja) * 2006-05-29 2014-02-05 株式会社カネカ 光学活性アミン化合物の製造方法、組換えベクター、及び該ベクターを含む形質転換体。
KR20090083900A (ko) 2006-10-02 2009-08-04 코덱시스, 인코포레이티드 입체이성질체적으로 순수한 스타틴 및 이의 합성 중간체 제조용 조성물 및 제조 방법
WO2008108998A2 (en) 2007-03-02 2008-09-12 Richmond Chemical Corporation Method to increase the yield and improve purification of products from transaminase reactions
WO2008127646A2 (en) 2007-04-11 2008-10-23 Dsm Ip Assets B.V. Transaminase-based processes for preparation of pregabalin
US20090123983A1 (en) 2007-10-03 2009-05-14 Valerie Niddam-Hildesheim Processes for preparing an intermediate of sitagliptin via enzymatic reduction
WO2009084024A2 (en) 2007-11-02 2009-07-09 Glenmark Generics Limited A process for the preparation of r-sit agliptin and its pharmaceutically acceptable salts thereof
US20090192326A1 (en) 2007-11-13 2009-07-30 Nurit Perlman Preparation of sitagliptin intermediate
US20090221595A1 (en) 2007-11-26 2009-09-03 Nurit Perlman Crystalline form of sitagliptin
US20090247532A1 (en) 2008-03-28 2009-10-01 Mae De Ltd. Crystalline polymorph of sitagliptin phosphate and its preparation
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
US8470564B2 (en) 2009-01-08 2013-06-25 Codexis, Inc. Transaminase polypeptides
US8293507B2 (en) * 2009-02-26 2012-10-23 Codexis, Inc. Transaminase biocatalysts
ES2644992T3 (es) * 2009-06-22 2017-12-01 Codexis, Inc. Reacciones de transaminasa
JP5792728B2 (ja) 2009-09-02 2015-10-14 ロンザ アーゲー (R)−特異的ω−トランスアミナーゼの同定および調製方法
CN105164263B (zh) * 2013-02-28 2022-07-01 科德克希思公司 用于工业生物催化的工程化转氨酶多肽

Also Published As

Publication number Publication date
US20190040431A1 (en) 2019-02-07
US9434968B2 (en) 2016-09-06
CN102597226A (zh) 2012-07-18
CN102597226B (zh) 2015-08-19
SG177329A1 (en) 2012-02-28
US8921079B2 (en) 2014-12-30
EP2446026B1 (en) 2017-08-09
US10767202B2 (en) 2020-09-08
US11371067B2 (en) 2022-06-28
EP2446026A1 (en) 2012-05-02
WO2011005477A1 (en) 2011-01-13
US20220290197A1 (en) 2022-09-15
US20200362377A1 (en) 2020-11-19
US20150079640A1 (en) 2015-03-19
EP2446026A4 (en) 2014-10-08
US20160333381A1 (en) 2016-11-17
IL216099A (en) 2016-08-31
US20120190085A1 (en) 2012-07-26
US10138503B2 (en) 2018-11-27
IL216099A0 (en) 2012-01-31

Similar Documents

Publication Publication Date Title
ES2644992T3 (es) Reacciones de transaminasa
ES2448816T3 (es) Biocatalizadores de transaminasa
EP2961844B1 (en) Engineered transaminase polypeptides for industrial biocatalysis
US10526587B2 (en) Engineered biocatalysts and methods for synthesizing chiral amines
CN116209754A (zh) 用于合成手性胺的工程化生物催化剂及方法