Descifrar La Biología de Mycobacterium Tuberculosis de La Secuencia Completa Del Genoma
Descifrar La Biología de Mycobacterium Tuberculosis de La Secuencia Completa Del Genoma
Descifrar La Biología de Mycobacterium Tuberculosis de La Secuencia Completa Del Genoma
del genoma
Los genes de ARN estable. Se encontraron cincuenta genes que codifican para molculas ARN
funcional. Estas molculas eran las tres especies producido por el nico opern de ARN ribosomal,
ARN 10Sa implicada en la degradacin de protenas codificadas por mensajero anormal ger RNA,
el componente ARN de la RNasa P, y 45 ARN de transferencia. No 4.5S ARN poda ser detectado.
El opern rrn est situado inusualmente ya que se produce alrededor de 1.500 kilobases (kb) de la
supuesta oric; la mayora de las eubacterias tienen uno o ms operones rrn cerca de oriC a
aprovechar el efecto de dosis gnica obtenidos durante la replicacin 10. Esta disposicin puede
estar relacionado con el lento crecimiento de M. tuberculosis. Los genes que codifican tRNAs que
reconocen 43 de la 61 sentido posible codones se distribuyeron en todo el genoma y, con una
excepcin, ninguno de estos usos A en la primera posicin del anticodn, lo que indica que una
amplia oscilacin se produce durante la traduccin. Esto es coherente con el alto contenido de G +
C del genoma y la el consiguiente sesgo en el uso de codones. Se encontraron tres genes que
codifican tRNAs para metionina; uno de estos genes (MeTV) est situado en una regin que puede
corresponder al terminal de replicacin (figuras 1, 2). Como METV est vinculado a genes
defectuosos para la integrasa y escisionasa, tal vez fue una vez parte de un fago o similar mvil
gentica elemento.
Al menos dos profagos se han detectado en la secuencia del genoma y su presencia puede explicar
por qu M. tuberculosis muestra lisis persistente de bajo nivel en la cultura. Prophages phiRv1 y
phiRv2 son a la vez, 10 kb de longitud y estn organizados de manera similar, y algunos de sus
productos de genes muestran una marcada similitud con los codificada por ciertos bacterifagos de
Streptomyces y saprofita micobacterias ftico. El sitio de insercin de phiRv1 es intrigante como
que corresponde a parte de una secuencia repetitiva de la familia 13E12 que s parece haber
integrado en el opern de biotina. Algunos cepas de M. tuberculosis se han descrito como que
requiere biotina como una suplemento de crecimiento, lo que indica que o bien phiRv1 tiene un
efecto polar en la expresin de los genes bio distal o que la escisin aberrante, que conduce a la
mutacin, puede ocurrir. Durante la atenuacin de serie de M. bovis que llev a la cepa de la vacuna
BCG de M. bovis, el phiRv1 profago se perdi 13. En un estudio sistemtico de la diversidad
genmica de prophages y secuencias de insercin (S.V.G. et al., manuscrito en preparacin), slo el
IS1532 exhibi una variabilidad significativa, indicando ING que la mayora de las secuencias de
insercin y prophages Actualmente estable. Sin embargo, a partir de estas observaciones
combinadas, se puede con- CLUDE de transferencia que horizontal de material gentico en la vida
libre antepasado del complejo M. tuberculosis se produjo probablemente en la naturaleza antes de
que el bacilo de la tuberculosis aprob su intracelular especializado nicho.
Los genes que codifican las protenas. 3.924 marcos de lectura abierta se identificaron en el genoma
(ver Mtodos), que representan el 91% de la potencial capacidad de codificacin (Figs 1, 2).
Algunos de estos genes parecen tienen codones de terminacin en marco o mutaciones de cambio
(con independencia de la fuente del ADN secuenciado) y puede utilizar ya sea frameshifting durante
la traduccin o corresponden a pseudogenes. Consistente con el alto contenido de G + C del
genoma, los codones de iniciacin GTG (35%) se utilizan con ms frecuencia que en Bacillus
subtilis (9%) y E. coli (14%), aunque ATG (61%) es el ms comn de traslacin comienzo. Hay
algunos ejemplos de codones de iniciacin atpicos, la siendo ms notable el ATC utilizado por
infC, que comienza con TCA en tanto B. subtilis y E. coli 9,14. Hay un ligero sesgo en la
orientacin de los genes (Fig. 1) con respecto a la direccin de la replicacin como , 59% se
transcriben con la misma polaridad que la replicacin, en comparacin con 75% en B. subtilis. En
otras bacterias, genes transcripcin describe en la misma direccin que las horquillas de replicacin
se cree que expresarse ms eficientemente 9,14. De nuevo, la distribucin ms uniforme en el gen
de polaridad visto en M. tuberculosis puede reflejar el lento crecimiento y ciclos de replicacin
poco frecuente. Tres genes (dnaB, recA y Rv1461) han sido invadida por secuencias que codifican
inteins (protenas intrones) y en los tres casos sus homlogos en M. leprae tambin contener inteins,
pero en diferentes sitios 15 (S.T.C. et al., no publicado observaciones).
Metabolismo lipdico
Muy pocos organismos producen una gama tan diversa de molculas lipofilicas como M.
tuberculosis. Estas molculas van desde simples cidos grasos tales como palmitato y
tuberculostearate, a travs de isoprenoids, a-cadena muy larga, molculas altamente complejas, tales
como cidos miclicos y los alcoholes phenolphthiocerol que esterifican con cido mycocerosic
para formar el andamiaje para la unin del Mycobacterium lados. Micobacterias contienen ejemplos
de cada lpido conocido y sistema de biosntesis de polictidos, incluyendo enzimas que
normalmente se encuentran en mamferos y plantas, as como los sistemas bacterianos comunes.
Los la capacidad biosinttica se ve ensombrecido por el an ms notable radiacin de degradacin,
los sistemas de oxidacin de los cidos grasos y, en total, hay, 250 enzimas distintas implicadas en
el metabolismo de cidos grasos en M. tuberculosis en comparacin con slo 50 en E. coli 20.
La degradacin de cidos grasos. En micobacterias vivo-crecido han sido sugerido a ser en gran
medida lipoltica, en lugar de lipognica, debido la variedad y cantidad de los lpidos disponibles
dentro de las clulas de mamfero y el tubrculo 2 (Fig. 4a). La abundancia de genes que codifican
componentes de los sistemas de oxidacin de cidos grasos que se encuentran por nuestro genmico
enfoque, apoya esta afirmacin, ya que hay 36 acil-CoA sintasas y una familia de 36 enzimas
relacionadas que podran catalizar la primera etapa en la degradacin de los cidos grasos. Hay 21
homloga enzimas que pertenecen a la enoil-CoA hidratasa / super- isomerasa familia de enzimas,
que rehidratar el producto naciente de la acil-deshidrogenasa CoA. Las cuatro enzimas que
convierten la 3-hidroxi cidos grasos en un cido graso de 3-ceto parece menos numerosos, sobre
todo porque son difciles de distinguir de otros miembros de la De cadena corta de la familia
alcohol deshidrogenasa sobre la base de primaria secuencia. Los cinco enzimas que completan el
ciclo de tiolisis el b-cetoster, los acetil-CoA C-acetiltransferasas, en efecto, parecen ser una familia
ms limitada. Adems de esta extensa un conjunto de enzimas de degradacin disociadas, el
genoma codifica tambin la compleja cannica FadA / fadB b-oxidacin (Rv0859 y Rv0860).
actividades de accesorios estn presentes para el metabolismo de cadena impar y multiplicar los
cidos grasos insaturados.
La biosntesis de cidos grasos. Al menos dos tipos discretos de enzima sistema, cido graso sintasa
(FAS) I y II FAS, estn involucrados en la biosntesis de cidos grasos en las micobacterias (Fig.
4b). FAS I (Rv2524, FAS) es un polipptido nico con mltiples actividades catalticas que
generadas varios ms corto steres de CoA a partir de cebadores acetil-CoA reductasa 5 y
probablemente crea precursores para la elongacin por todos los de la otra graso de cido y de
poliqutidos sistemas. FAS II consta de enzima disociable componentes que actan sobre un
sustrato unido a un acil-portador protena (ACP). FAS II es incapaz de sntesis de cidos grasos de
novo, pero en su lugar se alarga palmitoil-ACP a los cidos grasos de 24 a 56 carbonos de longitud
17,21. Varios componentes diferentes de FAS II, podr ser objetivos para la isoniazida importante
medicamento para la tuberculosis, incluyendo la enoil ACP-InhA 22, la sintasa cetoacil ACP-kasa y
el ACPM ACP 21. El anlisis del genoma muestra que hay slo tres posibles sintasas cetoacil: kasa
y kasb son altamente elacionados, y sus genes se agrupan con ACPM, mientras que KASC es una
mayor homlogo distante de un sistema de cetoacil sintasa III. El nmero de cetoacil sintasa y
genes ACP indica que hay un solo FAS sistema II. Su organizacin gentica, con dos cetoacil
agrupado sintasas, se asemeja a la de aromtico de biosntesis de polictidos tipo II grupos de genes,
tales como los de actinorrodina, tetraciclina y tetracenomicina en Streptomyces especies 23. InhA
parece ser el nico enoil-ACP reductasa y su gen es co-transcriben con una fabG homlogo, que
codifica la reductasa 3-oxoacyl-ACP. Ambos protenas son probablemente importantes en la
biosntesis de los cidos miclicos. Los cidos grasos se sintetizan a partir de malonil-CoA y
precursores son generada por la carboxilacin enzimtica de acetilo (o propionil) - CoA por una
carboxilasa de biotina-dependiente (Fig. 4b). Desde el estudio de la genoma predecimos que hay
tres carboxilasa completa sistemas, cada uno compuesto de un a- y una subunidad B, as como tres
subunidades B sin un A-contraparte. Como grupo, todos de la carboxilasas parecen estar ms
relacionadas con el homologos de mamferos que a las enzimas bacterianas correspondientes. Dos
de estos sistemas carboxilasa (accA1, accD1 y accA2, accD2) son probablemente implicada en la
degradacin de los cidos grasos de nmero impar, ya que son adyacente a los genes para otras
enzimas de degradacin conocidos. Que puede convertir propionil-CoA en succinil-CoA, que luego
puede ser incorporado en el ciclo del cido tricarboxlico. Las carboxilasas sintticos (AccA3,
accD3, accD4, accD5 y accD6) son ms difciles de entender. Las tres subunidades B adicionales
podran dirigir carboxilacin al precursor apropiado o simplemente puede aumentar el total de
cantidad de precursor carboxilado disponible si este paso fueron RATE limitante.
Sntesis de la columna vertebral parafnico de cidos grasos y en miclicos la clula es seguido por
extensas modificaciones postsynthetic y insaturaciones, sobre todo en el caso de los cidos
miclicos 24,25. Insaturacin est catalizada o bien por un Faba-como-b hydroxyacyl- ACP
dehydrase, actuando con una sintasa cetoacil especfica, o por una aerbico terminal de desaturasa
de funcin mixta que utiliza tanto en moles cular de oxgeno y NADPH. Inspeccin del genoma no
revel candidatos obvios para la actividad Faba-similares. Sin embargo, tres desaturasas potenciales
aerbicas (codificadas por desA1, y desA2 desA3) fueron evidentes que muestran poca similitud
con los vertebrados relacionados o enzimas de levadura (que actan sobre los steres de CoA
reductasa), sino que se asemejan desaturasas de plantas (que utilizan steres ACP). En
consecuencia, el genotipo los datos de micrfono indicar que la insaturacin de la cadena puede
meromycolate ocurrir mientras el grupo acilo se une a ACPM.
Gran parte de la diversidad estructural posterior en cidos miclicos se genera por una familia de L
S-metionina adenosil- dependiente enzimas, que utilizan el cido meromycolic insaturado como
sustrato para generar cis y trans y otros ciclopropanos micolatos. Seis miembros de esta familia han
sido identificados y caracterizados y 25 dos clster, convergente transcritos nuevos genes son
evidentes en el genoma (umaA1 y umaA2). De las funciones de la conocida miembros de la familia
y las estructuras de los cidos miclicos en M. tuberculosis, es tentador especular que estas nuevas
enzimas pueden introducir los ciclopropanos trans en el precursor meromycolate. Adems de estos
dos metiltransferasas, hay otros dos metiltransferasas de lpidos no relacionados (Ufa1 y Ufa2) que
la cuota homologa con ciclopropano cido graso sintasa de E. coli 25. Aunque ciclopropanacin
parece ser un relativamente comn modificacin de los cidos miclicos, ciclopropanacin de
plasma-bro constituyentes branas no se ha descrito en micobacterias. Tubrculosis cido culostearic
es producido por metilacin del cido oleico, y puede ser sintetizados por una de estas dos enzimas.
La condensacin de la mero- totalmente funcionalizado y preformado micolato cadena con una
rama de un 26-carbono genera de larga duracin cidos miclicos que debe ser transportado a su
ubicacin final para unin al arabinogalactano de la pared celular. La transferencia y
transesterificacin posterior est mediada por tres bien conocidos protenas inmunognicas del
antgeno 85 26 compleja. El genoma codifica un cuarto miembro de este complejo, el antgeno
85C9 (fbpC2, Rv0129), que est altamente relacionada con 85C antgeno. Nuevos estudios estn
necesarias para determinar si la protena posee mycolytransferase la actividad y para aclarar la
razn de la aparente redundancia.
Miembros de otro gran grupo de enzimas polictido sintasa son similares a los del MAS, que
tambin genera los componentes de cidos grasos se multiplican methylbranched de mycosides y
phthiocerol 5 molculas dimycocerosate, abundante pared celular asociada. A pesar de que algunos
de estos polictido sintasas pueden extenderse tipo I FAS CoA cebadores para producir otros cidos
grasos ramificados con metilo de cadena larga tales como mycolipenic, mycolipodienic y cidos
mycolipanolic o la cidos phthioceranic y hydroxyphthioceranic, o incluso puede mostrar 5
superposicin de funciones, hay muchas ms de estas enzimas de existen metabolitos conocidos.
As, puede haber nueva lpidos y metabolitos de poliqutidos que se expresan slo en ciertas
condiciones, tales como durante la infeccin y la enfermedad. Una cuarta clase de polictido
sintasas se relaciona con la planta superfamilia de enzimas que incluye chalcona y estilbeno sintasa
23. Estas polictido sintasas son filogenticamente divergentes de todos otras polictido sintasas y
de cidos grasos y generar no reducido polictidos que normalmente se asocian con pigmentos de
antocianina y flavonoides. La funcin de estos sistemas, que son a menudo vinculado a los mdulos
de E tipo aparentes, es desconocido. Un ejemplo es la grupo de genes que abarca pks10, pks7, pks8
y pks9, que incluye dos de las enzimas chalcona sintasa similar y dos mdulos de una sistema de
tipo I aparente. Los metabolitos producidos por desconocidos estas enzimas son interesantes debido
a la potente biolgica actividades de algunas polictidos, tales como el inmunosupresor rapamicina.
Siderforos. Los pptidos que no son sintetizados ribosomally son hechos por un proceso que es
mecnicamente anlogo al polictido 23,27 sntesis. Estos pptidos incluyen los siderforos barrido
de hierro estructuralmente relacionados, los mycobactins y los exochelins 2,28, que se derivan de
salicilato por la adicin de serina (o treonina), dos lisinas y los cidos grasos y los posibles
segmentos de polictidos diferentes. El opern MBT, que codifica uno aparente protena salicilato
de activacin, tres ligasas amino-cidos, y un nico mdulo de una sintasa de tipo I de polictidos,
puede ser responsable de la biosntesis de los siderforos micobacterianas. La presencia de un solo
sistema de pptido-sntesis no ribosomal indica que esta va puede generar tanto siderforos y que
la posterior modificacin de una grupo e-amino nico de un residuo de lisina puede dar cuenta de la
diferentes propiedades fsicas y la funcin de los siderforos 28.
Los 68 miembros de la familia de protenas PPE (Fig. 5) tambin tienen una dominio conservado N-
terminal que comprende, 180 amino-cido residuos, seguido de segmentos C-terminal que varan
notablemente ensecuencia y longitud. Estas protenas caen en por lo menos tres grupos, uno de los
cuales constituye la clase MPTR caracterizada por la presencia de mltiples copias en tndem, del
motivo Asn-X-Gly-X-Gly-Asn-X-Gly. El segundo subgrupo contiene una caracterstica, bien
conservado motivo alrededor de la posicin 350, mientras que el tercero contiene protenas que no
estn relacionadas excepto por la presencia de la comn Dominio de 180 residuos de PPE.
Varias observaciones y resultados apoyan la posibilidad de variacin antignica asociada tanto con
el PE y la familia PPE protenas. El miembro PGRS Rv1759 es un de unin a fibronectina protena
de masa molecular relativa 55.000 (ref. 35) que provoca una respuesta de anticuerpos variables,
indicando ya sea que los individuos montar diferentes respuestas inmunitarias, o que esta protena
PGRS puede variar entre cepas de M. tuberculosis. Esta ltima posibilidad con el apoyo de
polimorfismos de longitud de fragmentos de restriccin de varias secuencias de PGRS y MPTR en
33 aislamientos clnicos. Directo apoyo a la variacin gentica dentro de tanto el PE y PPE familias
se obtuvo por anlisis comparativo secuencia de ADN (Fig. 5). El gen para la protena Rv0746 PE-
GRS de BCG difiere de que en H37Rv por la delecin de 29 codones y la insercin de 46 codones.
variacin similar se observ en el gen para la protena de PPE Rv0442 (datos no mostrados). Como
se asociaron estas diferencias con secuencias repetitivas que podran haber resultado de intergnica
o eventos de recombinacin intragenic o, ms probablemente, a partir de captulo deslizamiento
durante la replicacin 32. Estos mecanismos son conocido para generar la variabilidad antignica en
otra bacteriana 36 patgenos.
Hay varios paralelismos entre las protenas y el PGRS antgenos nucleares del virus de Epstein-Barr
(EBNAs). Los miembros de ambas familias de polipptidos son ricas en glicina, contienen extensa
Gly-Ala repeticiones, y exhiben variacin en la longitud de la regin de repeticin entre diferentes
aislados. La regin de repeticin Gly-Ala de EBNA1 funciona como un inhibidor de actuacin cis
de la ubiquitina / proteasoma va de procesamiento de antgeno que genera pptidos presentados en
el contexto de complejo principal de histocompatibilidad (MHC) de clase I 37,38 molculas. MHC
de clase I ratones knockout son muy susceptibles a M. la tuberculosis, lo que subraya la importancia
de una de las clulas T citotxicas respuesta en la proteccin contra la enfermedad 3,39. Dado el
potencial de muchos efectos de las protenas de PPE y PE, es importante que una mayor Los
estudios se llevan a cabo para comprender su actividad. Si extensa variabilidad antignica o
reducido la presentacin de antgenos eran de hecho encontrado, esto sera importante para el
diseo de vacunas y para la comprensin de la inmunidad protectora en la tuberculosis, e incluso
podra explicar las variadas respuestas observadas en diferentes vacuna BCG 40 programas.
En la inspeccin de la secuencia del genoma, era evidente que cuatro copias de mce estaban
presentes y que stos fueron todas ellas situadas en operones, que comprende ocho genes,
organizados exactamente de la misma manera. En cada caso, los genes anterior cdigo mce para
integral protenas de la membrana, mientras que MCE y los cinco genes siguientes son todos
redicho para codificar protenas con secuencias de seal o hidrfobo se extiende en el extremo N-
erminal. Estos conjuntos de protenas, de las que poco se conoce, bien puede ser secretada o
expuesto en la superficie; esto es consistentecon la funcin propuesta del MCE en la invasin de
clulas husped 42. Adems, un homlogo de smpB, que ha sido implicado en la supervivencia
intracelular de Salmonella typhimurium, tambin ha sido 43 identificados. Entre las otras protenas
secretadas identificadas a partir de la secuencia del genoma que podran actuar como factores de
virulencia son una serie de fosfolipasas C, lipasas y esterasas, lo que podra atacar a las membranas
celulares o vacuolar, as como varias proteasas. Una de estas fosfolipasas acta como hemolisina
dependiente del contacto (N. Stoker, comunicacin personal). La presencia de almacenamiento
protenas en el Bacillus, tales como el oxgeno de la hemoglobina como captores descritos
anteriormente, los puntos a su capacidad para almacenar esencial factores de crecimiento, lo que le
permite persisten en el medio ambiente en nutrientes limitada del fagosoma. A este respecto, las
protenas de ferritina-como, codificada por bfrA y bfrB, puede ser importante en la supervivencia
intracelular como la capacidad de adquirir suficiente hierro en la vacuola es muy limitada.