KR102024109B1 - 2,4-다이하이드록시부티르산의 제조 방법 - Google Patents
2,4-다이하이드록시부티르산의 제조 방법 Download PDFInfo
- Publication number
- KR102024109B1 KR102024109B1 KR1020147033085A KR20147033085A KR102024109B1 KR 102024109 B1 KR102024109 B1 KR 102024109B1 KR 1020147033085 A KR1020147033085 A KR 1020147033085A KR 20147033085 A KR20147033085 A KR 20147033085A KR 102024109 B1 KR102024109 B1 KR 102024109B1
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- ala
- leu
- val
- thr
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/13—Transferases (2.) transferring sulfur containing groups (2.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01002—Alcohol dehydrogenase (NADP+) (1.1.1.2), i.e. aldehyde reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01061—4-Hydroxybutyrate dehydrogenase (1.1.1.61)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01075—Malonyl CoA reductase (malonate semialdehyde-forming)(1.2.1.75)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01076—Succinate-semialdehyde dehydrogenase (acetylating) (1.2.1.76)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y208/00—Transferases transferring sulfur-containing groups (2.8)
- C12Y208/03—CoA-transferases (2.8.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/03—Oxo-acid-lyases (4.1.3)
- C12Y401/03024—Malyl-CoA lyase (4.1.3.24)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01009—Malate--CoA ligase (6.2.1.9)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/52—Propionic acid; Butyric acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/01—Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
- C12Y103/01028—2,3-Dihydro-2,3-dihydroxybenzoate dehydrogenase (1.3.1.28)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은, 말레이트, 숙시닐-CoA 및/또는 글리옥실레이트를 말릴-CoA로 변환하는 단계, 상기 말릴-CoA를 말레이트-4-세미알데하이드로 변환하는 단계, 및 상기 말레이트-4-세미알데하이드를 DHB 데하이드로게나제에 의해 2,4-DHB로 변환하는 단계로 구성된, 연속 단계를 포함하는, 2,4-다이하이드록시부티르산 (2,4-DHB)의 제조 방법에 관한 것이다.
Description
본 발명은, 말레이트 및/또는 글리옥실레이트 및/또는 숙시닐-CoA를 말릴-CoA로 변환시키고, 말릴-CoA를 말레이트-4-세미알데하이드로 변환시킨 다음, 상기 말레이트-4-세미알데하이드를 2,4-다이하이드록시부티르산 (2,4-DHB)으로 변환시키는 합성 경로의 구현에 의해, 말레이트 및/또는 글리옥실레이트 및/또는 숙시닐-CoA로부터 2,4-다이하이드록시부티르산을 제조하는 신규 방법에 관한 것이다.
본 출원에서 언급되는 카르복실산은 이의 염 (예를 들어, 2,4-다이하이드록시부티레이트) 또는 산 형태 (예를 들어, 2,4-다이하이드록시부티르산)로 동일하게 지칭된다.
2,4-다이하이드록시부티르산 (2,4-DHB 또는 DHB와 동일시됨)은 상당히 경제적으로 이로운 화합물이다. DHB는 pH를 적절히 조정함으로써, 수성 매질에서 α-하이드록시-γ-부티로락톤으로 쉽게 변환될 수 있다. α-하이드록시-γ-부티로락톤은 메티오닌의 대체물이며, 동물 영양에서 시장이 큰, 2-하이드록시-4-(메틸티오)-부티레이트 (HMTB)를 제조하기 위한 주요 전구체이다 (US 2009/318715). 현재, α-하이드록시-γ-부티로락톤은, γ-부티로락톤을 α 위치에서 할로겐화하고, 이어서 할로겐 원자를 알칼리 매질에서 하이드록실기로 치환시키는 것을 포함하는 다단계 공정에 의해, γ-부티로락톤으로부터 유도된다 (US 2009/318715).
유가 상승으로 인해, 재생가능한 자원으로부터 DHB를 제조할 필요성이 생기고 있다. 미생물은 바이오매스 유래의 원료, 예를 들어 당이나 유기산을 여러 가지 화학적 화합물로 변환시킬 수 있다 (Werpy & Petersen, 2004). 생화학적 및 게놈학적 정보의 증가로, 미생물이 천연적인 대사 중간산물을 고수율로 그리고 고 생산성으로 과다생성하도록, 미생물을 변형시킬 수 있다 (Bailey, 1991). 생성 미생물의 최적화에는, 때때로, 특히, 대상 대사물질의 생합성의 필수 효소의 과다발현, 및 생성물 피드백 저해의 경감을 보장하는, 대사성 네트워크의 합리적인 조작이 요구된다. 다른 가능성으로는, 대상 대사물질의 생성을 촉매하는 새로운 효소 시스템을 구현하는 것이다.
대사 공학적 방식과 효소적 촉매 방식은, 대상 대사물질을 생성하는 대사 경로의 조절과 생화학에 대해 상세한 지식을 필요로 한다. 2,4-DHB를 제조하는 경우, 이러한 정보는 이용가능하지 않다. 단지 소수의 연구에서, 숙신산 세미알데하이드 데하이드로게나제(dehydrogenase)가 결핍된 환자에서 2,4-DHB의 생성이 보고되어 있지만, DHB 생성과 관련한 효소 반응은 규명되어 있지 않다 (Shinka et al., 2002). 따라서, 발효에 의해 또는 효소에 의해 2,4-DHB를 제조하는 방법에는, (i) 이용가능한 전구체를 2,4-DHB로 변환하는, 열역학적으로 실현가능한 경로의 규명, (ii) 상기 경로에서 각각의 반응 단계를 촉매할 수 있는 효소의 동정 및 구축, (iii) 적절한 생산 유기체에서, 경로의 효소들의 기능적 발현이 요구된다.
Akita, O., Nishimori, C., Shimamoto, T., Fujii, T. & Iefuji, H. (2000). Transport of pyruvate in Saccharomyces cerevisiae and cloning of the gene encoded pyruvate permease. Biosci Biotechnol Biochem 64, 980-984.
Alber, B., Olinger, M., Rieder, A., Kockelkorn, D., Jobst, B., Huegler, M. & Fuchs, G. (2006). Malonyl-coenzyme A reductase in the modified 3-hydroxypropionate cycle for autotrophic carbon fixation in archaeal Metallosphaera and Sulfolobus spp. J Bacteriol 188, 8551-8559.
Arps, P. J., Fulton, G. F., Minnich, E. C. & Lidstrom, M. E. (1993). Genetics of serine pathway enzymes in Methylobacterium extorquens AM1: phosphoenolpyruvate carboxylase and malyl coenzyme A lyase. J Bacteriol 175, 3776-3783.
Auriol, C., Bestel-Corre, G., Claude, J.-B., Soucaille, P. & Meynial-Salles, I. (2011). Stress-induced evolution of Escherichia coli points to original concepts in respiratory cofactor selectivity. Proc Natl Acad Sci U S A 108, 1278-1283.
Baba, T., Ara, T., Hasegawa, M., Takai, Y., Okumura, Y., Baba, M., Datsenko, K. A., Tomita, M., Wanner, B. L. & Mori, H. (2006). Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection. Mol Syst Biol 2, 2006.0008.
Bailey, J. E. (1991). Toward a science of metabolic engineering. Science 252, 1668-1675.
Camarasa, C., Bidard, F., Bony, M., Barre, P. & Dequin, S. (2001). Characterization of Schizosaccharomyces pombe malate permease by expression in Saccharomyces cerevisiae. Appl Environ Microbiol 67, 4144-4151.
Cherepanov, P. P. & Wackernagel, W. (1995). Gene disruption in Escherichia coli: TcR and KmR cassettes with the option of Flp-catalyzed excision of the antibiotic-resistance determinant. Gene 158, 9-14.
Chistoserdova, L., Kalyuzhnaya, M. G. & Lidstrom, M. E. (2009). The expanding world of methylotrophic metabolism. Annu Rev Microbiol 63, 477-499.
Datsenko, K. A. & Wanner, B. L. (2000). One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci U S A 97, 6640-6645.
Ford, G. & Ellis, E. M. (2002). Characterization of Ypr1p from Saccharomyces cerevisiae as a 2-methylbutyraldehyde reductase. Yeast Chichester Engl 19, 1087-1096.
Friedmann, S., Steindorf, A., Alber, B. E. & Fuchs, G. (2006). Properties of succinyl-coenzyme A:L-malate coenzyme A transferase and its role in the autotrophic 3-hydroxypropionate cycle of Chloroflexus aurantiacus. J Bacteriol 188, 2646-2655.
Grobler, J., Bauer, F., Subden, R. E. & Van Vuuren, H. J. (1995). The mae1 gene of Schizosaccharomyces pombe encodes a permease for malate and other C4 dicarboxylic acids. Yeast Chichester Engl 11, 1485-1491.
Groeneveld, M., Weme, R. G. J. D. O., Duurkens, R. H. & Slotboom, D. J. (2010). Biochemical characterization of the C4-dicarboxylate transporter DctA from Bacillus subtilis. J Bacteriol 192, 2900-2907.
Jantama, K., Zhang, X., Moore, J. C., Shanmugam, K. T., Svoronos, S. A. & Ingram, L. O. (2008a). Eliminating side products and increasing succinate yields in engineered strains of Escherichia coli C. Biotechnol Bioeng 101, 881-893.
Jantama, K., Haupt, M. J., Svoronos, S. A., Zhang, X., Moore, J. C., Shanmugam, K. T. & Ingram, L. O. (2008b). Combining metabolic engineering and metabolic evolution to develop nonrecombinant strains of Escherichia coli C that produce succinate and malate. Biotechnol Bioeng 99, 1140-1153.
Kawasaki, T., Koita, H., Nakatsubo, T., Hasegawa, K., Wakabayashi, K., Takahashi, H., Umemura, K., Umezawa, T. & Shimamoto, K. (2006). Cinnamoyl-CoA reductase, a key enzyme in lignin biosynthesis, is an effector of small GTPase Rac in defense signaling in rice. Proc Natl Acad Sci U S A 103, 230-235.
Kockelkorn, D. & Fuchs, G. (2009). Malonic semialdehyde reductase, succinic semialdehyde reductase, and succinyl-coenzyme A reductase from Metallosphaera sedula: enzymes of the autotrophic 3-hydroxypropionate/4-hydroxybutyrate cycle in Sulfolobales. J Bacteriol 191, 6352-6362.
Larkin, M. A., Blackshields, G., Brown, N. P., Chenna, R., McGettigan, P. A., McWilliam, H., Valentin, F., Wallace, I. M., Wilm, A. & other authors. (2007). Clustal W and Clustal X version 2.0. Bioinforma Oxf Engl 23, 2947-2948.
Lin, H., Bennett, G. N. & San, K.-Y. (2005). Metabolic engineering of aerobic succinate production systems in Escherichia coli to improve process productivity and achieve the maximum theoretical succinate yield. Metab Eng 7, 116-127.
Meister, M., Saum, S., Alber, B. E. & Fuchs, G. (2005). L-malyl-coenzyme A/beta-methylmalyl-coenzyme A lyase is involved in acetate assimilation of the isocitrate lyase-negative bacterium Rhodobacter capsulatus. J Bacteriol 187, 1415-1425.
Millard, C. S., Chao, Y. P., Liao, J. C. & Donnelly, M. I. (1996). Enhanced production of succinic acid by overexpression of phosphoenolpyruvate carboxylase in Escherichia coli. Appl Environ Microbiol 62, 1808-1810.
Miller, J. H. (1992). A Short Course in Bacterial Genetics: A Laboratory Manual andHandbook for Escherichica coli and Related Bacteria. Plainview (NY): Cold Spring Harbor Laboratory Press.
Rognstad, R. & Katz, J. (1979). Effects of 2,4-dihydroxybutyrate on lipogenesis in rat hepatocytes. J Biol Chem 254, 11969-11972.
Sambrook, J., Fritsch, E. F. & Maniatis, T. (1989). Molecular Cloning: A Laboratory Manual, 2nd edn. Cold Spring Harbor: Cold Spring Harbor Laboratory Press.
Sanchez, A. M., Bennett, G. N. & San, K.-Y. (2005). Novel pathway engineering design of the anaerobic central metabolic pathway in Escherichia coli to increase succinate yield and productivity. Metab Eng 7, 229-239.
Sauer, U. & Eikmanns, B. J. (2005). The PEP-pyruvate-oxaloacetate node as the switch point for carbon flux distribution in bacteria. Fems Microbiol Rev 29, 765-794.
Seedorf, H., Fricke, W. F., Veith, B., Brueggemann, H., Liesegang, H., Strittmatter, A., Miethke, M., Buckel, W., Hinderberger, J. & other authors. (2008). The genome of Clostridium kluyveri, a strict anaerobe with unique metabolic features. Proc Natl Acad Sci U S A 105, 2128-2133.
Shinka, T., Inoue, Y., Ohse, M., Ito, A., Ohfu, M., Hirose, S. & Kuhara, T. (2002). Rapid and sensitive detection of urinary 4-hydroxybutyric acid and its related compounds by gas chromatography-mass spectrometry in a patient with succinic semialdehyde dehydrogenase deficiency. J Chromatogr B Anal Technol Biomed Life Sci 776, 57-63.
Smejkalovae, H., Erb, T. J. & Fuchs, G. (2010). Methanol assimilation in Methylobacterium extorquens AM1: demonstration of all enzymes and their regulation. Plos One 5.
Soehling, B. & Gottschalk, G. (1993). Purification and characterization of a coenzyme-A-dependent succinate-semialdehyde dehydrogenase from Clostridium kluyveri. Eur J Biochem Febs 212, 121-127.
Vuilleumier, S., Chistoserdova, L., Lee, M.-C., Bringel, F., Lajus, A., Zhou, Y., Gourion, B., Barbe, V., Chang, J. & other authors. (2009). Methylobacterium genome sequences: a reference blueprint to investigate microbial metabolism of C1 compounds from natural and industrial sources. Plos One 4, e5584.
Wang, Q., Ou, M. S., Kim, Y., Ingram, L. O. & Shanmugam, K. T. (2010). Metabolic flux control at the pyruvate node in an anaerobic Escherichia coli strain with an active pyruvate dehydrogenase. Appl Environ Microbiol 76, 2107-2114.
Werpy, T. & Petersen, G. (2004). Top value added chemicals from biomass. Results of screening for potential candidates from sugars and synthesis gas. Washington DC.
Zarzycki, J., Brecht, V., Mueller, M. & Fuchs, G. (2009). Identifying the missing steps of the autotrophic 3-hydroxypropionate CO2 fixation cycle in Chloroflexus aurantiacus. Proc Natl Acad Sci U S A 106, 21317-21322.
Zelle, R. M., de Hulster, E., van Winden, W. A., de Waard, P., Dijkema, C., Winkler, A. A., Geertman, J.-M. A., van Dijken, J. P., Pronk, J. T. & van Maris, A. J. A. (2008). Malic acid production by Saccharomyces cerevisiae: engineering of pyruvate carboxylation, oxaloacetate reduction, and malate export. Appl Environ Microbiol 74, 2766-2777.
Zelle, R. M., de Hulster, E., Kloezen, W., Pronk, J. T. & van Maris, A. J. A. (2010). Key process conditions for production of C(4) dicarboxylic acids in bioreactor batch cultures of an engineered Saccharomyces cerevisiae strain. Appl Environ Microbiol 76, 744-750.
Zhang, X., Jantama, K., Shanmugam, K. T. & Ingram, L. O. (2009). Reengineering Escherichia coli for Succinate Production in Mineral Salts Medium. Appl Environ Microbiol 75, 7807-7813.
Zhang, X., Wang, X., Shanmugam, K. T. & Ingram, L. O. (2011). L-malate production by metabolically engineered Escherichia coli. Appl Environ Microbiol 77, 427-434.
본 발명은 이러한 필요성을 충족시키는 것을 목적으로 한다.
따라서, 본 발명의 일 목적은, 말레이트 및/또는 글리옥실레이트 및/또는 숙시닐-CoA를 말릴-CoA로 변환하는 제1 단계, 말릴-CoA를 말레이트-4-세미알데하이드로 변환하는 제2 단계, 및 말레이트-4-세미알데하이드를 2,4-DHB로 변환하는 제3 단계를 포함하는, 2,4-DHB의 제조 방법이다.
따라서, 본 발명의 일 목적은, 말레이트를, 말릴-CoA 신테타제(synthetase) 활성을 가진 효소의 작용에 의해 말릴-CoA로 변환하거나 [1.1], 및/또는 숙시닐-CoA를, 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 활성을 가진 효소의 작용에 의해 말릴-CoA로 변환하거나 [1.2], 및/또는 글리옥실레이트를, 말릴-CoA 리아제(리아제) 활성을 가진 효소의 작용에 의해 말릴-CoA로 변환하는 [1.3], 제1 반응을 포함하는, 2,4-DHB를 제조하는 방법이다 (도 1 참조). 제2 반응 [2]에서, 말릴-CoA는 말릴-CoA 리덕타제(reductase) 활성을 가진 효소의 작용에 의해 말레이트-4-세미알데하이드로 변환된다. 제3 반응 [3]에서, 말레이트-4-세미알데하이드는 DHB 데하이드로게나제 활성을 가진 효소의 작용에 의해 DHB로 변환된다. 더욱 정확하게는, 반응 [3]은 경로의 생합성 측면에서, 말레이트-4-세미알데하이드 리덕타제 활성을 가진 효소에 의해 촉매된다.
본 발명의 다른 측면에서, 2,4-DHB를 제조하는 방법에서 제1 단계는, 각각 말레이트, 숙시닐-CoA, 또는 글리옥실레이트를 말릴-CoA로 변환하는 말레이트-조효소 A 리가제 (ADP 형성), EC 6.2.1.9), 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 (EC 2.8.3.-), 또는 말릴-CoA 리아제 (EC 4.1.3.24) 활성을 가진 효소를 수반한다.
상기 효소는, 포름알데하이드를 고정하는데 세린 사이클을 이용하는 메틸영양성(methylotrophic) 박테리아 (Chistoserdova et al ., 2009; Smejkalova et al ., 2010; Vuilleumier et al ., 2009), 글리옥실레이트 사이클 및 이소시트레이트 리아제 활성과 독립적인 아세테이트 동화 경로에 의존하는 박테리아 (Meister et al., 2005), 및 자가영양 성장을 위해 3-하이드록시프로피오네이트 CO2-고정 사이클을 이용하는 박테리아 (Zarzycki et al ., 2009)에서, 규명된 바 있다.
기능성 변이체 또는 기능성 단편과 같이 상기 효소들과 상동성(homology)을 공유하는 단백질 또한, 본 발명의 또 다른 측면이기도 하다.
말릴-CoA 신테타제는 2가지 서브유닛인 MtkA 및 MtkB로 구성된다. 따라서, 본 발명에 따르면, 말릴-CoA 신테타제 활성을 포함하는 단백질은, M. 페트롤레이필룸(M. petroleiphilum)의 말릴-CoA 신테타제 서브유닛 MtkA 및 MtkB (YP 001022444 및 YP 001022445), 메틸로박터 엑스토?스(Methylobacter extorquens) (YP002962851 및 YP 002962852) 또는 M. 캡술라투스(M. capsulatus)의 2가지 서브유닛 SucC 및 SucD (YP 114179 및 YP 114180)의 단백질 서열과 30% 이상, 바람직하게는 50% 이상, 보다 바람직하게는 70%의 동일성(identity)을 가진 모든 폴리펩타이드를 지칭한다.
말릴-CoA 리아제는 호모헥사머로서, 아세테이트 동화를 위해 글리옥실레이트 사이클을 이용하지 않는 박테리아에서 확인된다 (Meister et al ., 2005). 따라서, 본 발명에 따르면, 말릴-CoA 리아제 활성을 포함하는 단백질은, 메틸로박터 엑스토?스, 로도박터 캡술라투스(Rhodobacter capsulatus), 또는 스트렙토마이세스 코엘리콜로(Streptomyces coelicolor)의 말릴-CoA 리아제, Mcl의 단백질 서열과 30% 이상, 바람직하게는 50% 이상, 보다 바람직하게는 70%의 동일성을 가진 모든 폴리펩타이드를 지칭한다.
본 발명의 추가적인 측면에서, 본 발명의 말릴-CoA 리아제는 서열 번호 1 또는 이의 변이체로 표시된다.
숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제는 2가지 서브유닛, SmtA 및 SmtB로 구성된다 (Zarzycki et al ., 2009)(Friedmann et al ., 2006). 따라서, 본 발명에 따르면, 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 활성을 가진 단백질은 클로로플렉수스 아우란티아쿠스(Chloroflexus aurantiacus)의 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 서브유닛 SmtA 및 SmtB의 단백질 서열 (서열 번호 191 및 서열 번호 193로 표시되거나 또는 서열 번호 192 및 서열 번호 194로 코딩됨)과 30% 이상, 바람직하게는 50% 이상, 보다 바람직하게는 70%의 동일성을 가진 모든 폴리펩타이드를 지칭한다.
보다 일반적으로, 본 발명의 의미에서, 2가지 단백질 서열들 간의 동일성은 당해 기술분야의 당업자에게 잘 공지된 방법에 의해 결정될 수 있다. 이러한 방법의 예는 CLUSTALW (Larkin et al ., 2007) 소프트웨어 (웹사이트에 표시된 디폴트 파라미터와 함께 http://www.ebi.ac.uk/Tools/msa/clustalw2/) 또는 BLAST 정렬 프로그램 (웹사이트에 표시된 디폴트 파라미터와 함께 http://blast.ncbi.nlm.nih.gov/Blast.cgi)의 사용이다.
기능성 변이체라는 용어는, 본 출원에 구체적으로 기술된 서열과 비교 시 실질적인 서열 변형을 제시할 수 있지만 본래의 효소 활성은 여전히 가지고 있는 효소를 포함한다.
기능성 단편이라는 용어는 본 발명에 따르면, 효소의 서열이 본래의 아미노산보다 적은 수의 아미노산을 포함할 수 있지만 본래의 효소 활성은 여전히 가지고 있는 것을 의미한다.
상기 효소의 개선은 1가지 이상의 돌연변이에 의해 수득될 수 있으며, 상기 돌연변이(들)는 말레이트, 숙시닐-CoA, 또는 글리옥실레이트 각각에 대한, 돌연변이 효소의 활성 및/또는 기질 친화성을 개선한다.
본 발명에서, "활성 및/또는 기질 친화성을 개선한다"라는 표현은, 돌연변이 전의 효소가:
- 기질을 사용할 수 없었거나, 및/또는
- 반응 산물을 적어도 3배 더 낮은 최대 비속도 (specific rate)로 합성하였거나, 및/또는
- 말레이트, 숙시닐-CoA, 또는 글리옥실레이트, 말릴-Co-A 또는 말레이트-4-세미알데하이드에 대한 친화성이 적어도 2배, 보다 바람직하게는 3배 더 낮았음을 의미한다.
말릴-CoA 신테타제 및 말릴-CoA 리아제 활성은 각각 (Smejkalova et al ., 2010) 또는 (Meister et al ., 2005)에 의해 기술된 효소 시험에 의해 측정될 수 있다. 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 활성은 (Friedmann et al ., 2006)에 의해 기술된 바와 같이 측정될 수 있다.
보다 추가적인 측면에서, 본 발명에 따라 2,4-DHB를 제조하는 방법의 제2 단계는 말릴-CoA 리덕타제 활성을 가진 효소를 수반하며, 상기 효소는 말릴-CoA를 말레이트-4-세미알데하이드로 변환하는 것을 특징으로 한다.
상기 효소는 말로닐-CoA 리덕타제, 숙시닐-CoA 리덕타제 또는 보고된 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA) 리덕타제, 신나모일-CoA 리덕타제, 또는 아세트알데하이드 데하이드로게나제 활성을 가진 효소들 중에서 규명될 수 있거나, 또는 이들은 상기 효소들의 변형에 의해 수득될 수 있다.
말로닐-CoA 리덕타제 (EC 1.2.1.75) 및 숙시닐-CoA 리덕타제 (EC 1.2.1.76)는 이산화탄소 고정을 위해 변형된 3-하이드록시프로피오네이트 사이클을 가진 박테리아 (Alber et al ., 2006; Kockelkorn & Fuchs, 2009), 및 혐기성 숙시네이트 분해 경로를 이용하는 박테리아 (Seedorf et al ., 2008; Soehling & Gottschalk, 1993)에서 확인되었다. HMG-CoA 리덕타제 (EC 1.1.1.38, EC 1.1.1.88)는 진핵생물 및 일부 박테리아에서 이소프레노이드의 생합성 경로의 일부이다. 신나모일-CoA 리덕타제 (EC 1.2.1.44)는 리그닌 생합성에 관여하는 효소이다 (Kawasaki et al ., 2006). 아세트알데하이드 데하이드로게나제 (EC 1.2.1.10)는 매우 다양한 박테리아에서 확인되며, 에탄올 생성 경로 또는 아세트알데하이드 해독으로의 투입을 촉매한다.
본 발명의 추가적인 측면에서, 말릴-CoA 리덕타제는 서열 번호 7 또는 서열 번호 10, 또는 이의 기능성 변이체 또는 이의 기능성 단편으로 표시된다.
따라서, 본 발명에 따르면, 말로닐-CoA 리덕타제 활성을 가진 단백질은 술폴로부스 토코다이이(Sulfolobus tokodaii) 말로닐-CoA 리덕타제, Mcr의 단백질 서열 (서열 번호 7)과 30% 이상의 동일성을 가진 모든 폴리펩타이드를 지칭한다. 바람직하게는 이들은 50% 이상, 보다 바람직하게는 70%의 동일성을 가진다.
클로로플렉세우스 아우란티아쿠스(Chloroflexus auranthiacus)의 말로닐-CoA 리덕타제 (서열 번호 190으로 코딩되는 서열 번호 189)는 본 발명의 또 다른 측면을 구성한다. 클로로플렉세우스 아우란티아쿠스의 단백질 서열과 30% 이상의 동일성을 가진 폴리펩타이드 또한 본 발명의 일부이다. 바람직하게는 이들은 50% 이상, 보다 바람직하게는 70%의 동일성을 가진다.
따라서, 본 발명에 따르면, 숙시닐-CoA 리덕타제 활성을 가진 단백질은 포르피로모나스 깅기발리스(Porphyromonas gingivalis) 숙시닐-CoA 리덕타제, SucD (서열 번호 10), 또는 이관능성 술폴로부스 토코다이이(S. tokodaii) 말로닐-CoA 및 숙시닐-CoA 리덕타제, Mcr (서열 번호 7)의 단백질 서열과 30% 이상의 동일성을 가진 모든 폴리펩타이드를 지칭한다. 바람직하게는 이들은 50% 이상, 보다 바람직하게는 70%의 동일성을 가진다.
말릴-CoA 리덕타제 활성은 실시예 2에 기술된 효소 시험에 의해 측정될 수 있다 ("효소 분석법" 참조).
상기 효소 활성은 효소의 1가지 이상의 돌연변이에 의해 개선될 수 있으며, 상기 돌연변이(들)는 말릴-CoA에 대한 돌연변이 효소의 활성 및/또는 기질 친화성을 개선하거나 또는 천연 기질에 대한 이의 활성을 감소시키는 것을 포함한다.
본 발명은 또한, 개선된 활성을 가진 변형된 말릴-CoA 리덕타제를 포함한다.
본 발명에 따른 말릴-CoA 리덕타제는 특정한 측면에서, 야생형 효소와 비교 시 P111, L152, T154, L202, G203, D204, Y206, D207, K209, T210, T238,T239, D295, R318의 위치 중 하나 이상에, 하나 이상의 돌연변이를 포함하는 술폴로부스 토코다이이 말로닐-CoA 리덕타제에 상응하며, 상기 위치에서 천연 아미노산은, 다른 19개의 천연 단백질성 (proteinogenic) 아미노산인 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민산, 글루타민, 글리신, 히스티딘, 이소루신, 루신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린 중 하나로 치환된다.
다른 측면에서, 본 발명에 따라 2,4-DHB를 제조하는 방법에서 제3 단계는, 말레이트-4-세미알데하이드를 2,4-DHB로 변환하는 것을 특징으로 하는, DHB 데하이드로게나제를 포함하며, 상기 효소는 경로의 생합성 측면에서, 말레이트-4-세미알데하이드 리덕타제 활성을 가진다.
이미 잠재적으로는 DHB 데하이드로게나제 활성을 가진, 후보 (candidate) DHB 데하이드로게나제는, C3, C4, 또는 C5 화합물에 작용하는 베타-하이드록시산 데하이드로게나제 클래스에서 선택될 수 있다.
본 발명의 더욱 다른 측면에 따르면, 상기 DHB 데하이드로게나제 효소는 타르트로네이트(tartronate) 세미알데하이드 리덕타제, 숙시네이트 세미알데하이드 리덕타제, 4-하이드록시부티레이트 데하이드로게나제, 말로네이트 세미알데하이드 리덕타제, 메틸부티르알데하이드 리덕타제, 아연형 알코올 데하이드로게나제, L-트레오닌-3-데하이드로게나제, 신나밀 알코올 데하이드로게나제, 알코올 데하이드로게나제, 또는 호모세린 데하이드로게나제와 같은 β-하이드록시산 데하이드로게나제와 구조적으로 및 메카니즘적으로 관련되어 있을 수 있다.
본 발명은 또한, 2,4-DHB에서 말레이트-4-세미알데하이드를 변환하기 위한, 메틸부티르알데하이드 리덕타제 또는 숙신산 세미알데하이드 리덕타제 (4-하이드록시부티레이트 데하이드로게나제로서도 지칭됨), 또는 알코올 데하이드로게나제의 용도에 관한 것이다.
본 발명의 또 다른 구체적인 측면에서, DHB 데하이드로게나제는 사카로마이세스 세레비지애(S. cerevisiae)의 메틸부티르알데하이드 리덕타제 (Ypr1), 메탈로스패라 세둘라(M. sedula)의 숙신산 세미알데하이드 리덕타제, 포르피로모나스 깅기발리스(P. gingivalis)의 4-하이드록시부티레이트 데하이드로게나제 (4hbd), 또는 에스케리키아 콜라이(Escherichia coli )의 알코올 데하이드로게나제 (YqhD)에 상응한다.
구체적인 실시 양태에서, 상기 메틸부티르알데하이드 리덕타제는 서열 번호 14로 표시되고, 상기 숙신산 세미알데하이드 리덕타제는 서열 번호 16으로 표시되며, 상기 4-하이드록시부티레이트 데하이드로게나제는 서열 번호 187로 표시되고, 상기 알코올 데하이드로게나제는 서열 번호 185로 표시된다. DHB 데하이드로게나제 활성은 실시예 3에서 기술된 효소 테스트에 의해 측정될 수 있다 ("효소 분석" 참고).
말레이트-4-세미알데하이드에 대한, DHB 데하이드로게나제의 친화성은, 효소에 생긴 하나 이상의 돌연변이에 의해 증가할 수 있으며, 상기 돌연변이(들)는 말레이트-4-세미알데하이드에 대한, 돌연변이 효소의 활성 및/또는 기질 친화성을 증가시키며, 및/또는 이의 천연 기질에 대한, 활성이나 친화성을 적어도 2배 감소시킨다.
구체적인 측면에서, 본 발명에 따른 DHB 데하이드로게나제는, 야생형 효소와 비교해, S40, N43, H39, T49, F85, Q108, L281 및 N305의 위치 중 하나 이상에, 하나 이상의 돌연변이를 포함하는 메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제 (서열 번호 16)이며, 상기 위치(들)의 천연 아미노산이, 다른 19개의 천연 단백질 아미노산인 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민산, 글루타민, 글리신, 히스티딘, 이소루신, 루신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린 중 하나로 치환된다.
비-제한적인 실시예에서 입증된 바와 같이, (L)-말레이트-4-세미알데하이드에 대한, 메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제의 친화성은, 부위 특이적인 돌연변이유발에 의해 이중 돌연변이 H39R N43H (서열 번호 36으로 표시됨)를 도입함으로써 증가되었다. 단순 돌연변이체인 H39R (서열 번호 32) 및 N43H (서열 번호 34) 또한, 본 발명에 포함된다 (실시예 5).
DHB 데하이드로게나제는, 본 발명의 또 다른 측면을 구성하며, 말레이트-4-세미알데하이드를 2,4-DHB로 변환하는 데 사용될 수 있다.
유전자의 핵산 서열은 숙주 유기체의 코돈 사용에 맞게 조정하여, 이종적으로 발현되는 단백질의 생산을 증가시킬 수 있다. 이는, 본 발명의 다른 측면을 구성한다.
메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제 H39R N43H를 코딩하며, 이의 뉴클레오티드 서열이 에스케리키아 콜라이에서 상기 효소의 발현을 위해 최적화된, 서열 번호 38로 표시되는 합성 유전자의 합성은 본 발명의 다른 측면이다.
더욱 다른 측면에서, 본 발명은 또한, 핵산, 보다 구체적으로는 말릴-CoA 신테타제를 코딩하는 분리된 핵산 서열에 관한 것이다.
보다 추가적인 측면에서, 본 발명은 말릴-CoA 리아제를 코딩하며 보다 구체적으로는 서열 번호 2로 표시되는 분리된 핵산 서열에 관한 것이다.
보다 추가적인 측면에서, 본 발명은 말릴-CoA 리덕타제를 코딩하며 보다 구체적으로는 서열 번호 8, 서열 번호 11, 또는 서열 번호 190으로 표시되는 분리된 핵산 서열에 관한 것이다.
더욱 다른 측면에서, 본 발명은 또한, 전술한 DHB 데하이드로게나제를 코딩하는 분리된 핵산 서열에 관한 것이다.
다른 측면에서, 상기 핵산은 서열 번호 15 또는 서열 번호 17, 서열 번호 37, 서열 번호 186 또는 서열 번호 188로 표시된다.
본 발명에 따르면, "핵산 서열"은 단일 또는 이중 가닥 형태의 DNA 또는 RNA 분자, 바람직하게는 DNA 분자를 지칭한다. 본원에서 사용되는 바와 같이, "분리된 DNA"는, 천연적이지 않거나, 또는 더 이상 원래 존재하였던 천연 환경에 존재하지 않는 DNA를 지칭하며, 예를 들어, 키메라 유전자 형태로 또 다른 조절 요소와 조합된 DNA 코딩 서열, 다른 숙주 세포로 이동된 DNA, 또는 임의의 자연 발생 DNA 서열과 비교해 상이한 뉴클레오티드 서열을 가진 인공적이며, 합성으로 제조된 DNA 서열을 지칭한다.
본 발명은 또한, 숙주 유기체에서 기능하는 하나 이상의 프로모터, 본 발명에 따라 정의된 말릴-CoA 신테타제 또는 말릴-CoA 리아제, 말릴-CoA 리덕타제, 말로닐-CoA 리덕타제, 숙시닐-CoA 리덕타제, 또는 DHB 데하이드로게나제 활성 중 임의를 코딩하는 폴리뉴클레오티드, 및 동일한 숙주 유기체에서 기능하는 종결자 요소를 서로 기능적으로 연결하여 포함하는, 키메라 유전자에 관한 것이다. 키메라 유전자에 포함될 수 있는 다양한 요소로는, 첫째로는, 프로모터, 신호 펩티드나 트랜지트 (transit) 펩티드를 코딩하는 서열, 또는 폴리아데닐화 신호를 구성하는 종결자 요소와 같이, 전사, 번역 및 단백질의 성숙을 조절하는 요소이며, 둘째로는, 단백질을 코딩하는 폴리뉴클레오티드이다. "서로 기능적으로 연결된"이라는 표현은, 키메라 유전자의 상기 요소들 중 어느 하나의 기능이 또 다른 요소의 기능에 의해 영향을 받도록, 이들 요소들이 서로 연결되어 있다는 것을 의미한다. 예로, 프로모터는, 코딩 서열의 발현에 영향을 미칠 수 있는 경우, 상기 코딩 서열에 기능적으로 연결되어 있다. 본 발명에 따른 키메라 유전자의 제작, 및 이의 다양한 요소들의 어셈블리는, 당해 분야의 당업자에게 잘 공지된 기술로 수행될 수 있다. 키메라 유전자를 이루는 조절 요소의 선택은, 이들이 기능해야 하는 숙주 유기체에 따라 필수적으로 다르며, 당해 분야의 당업자는 소정의 숙주 유기체에서 기능하는 조절 요소를 선택할 수 있다. "기능성"이라는 용어는, 소정의 숙주 유기체에서 기능할 수 있음을 의미하는 것이다.
본 발명에 따른 키메라 유전자에 포함될 수 있는 프로모터는 구성적 프로모터 (constitutive promoter) 또는 유도성 프로모터 (inducible promoter)이다. 예로, 박테리아의 발현에 사용되는 프로모터는 후술하는 프로모터에서 선택될 수 있다. 에스케리키아 콜라이의 발현에 대해, lac, trp, lpp, phoA, recA, araBAD, prou, cst-l, tetA, cadA, nar, tac, trc, lpp-lac, Psyn, cspA, PL, PL-9G-50, PR-PL, T7, [람다]PL-PT7, T3-lac, T5-lac, T4 유전자 32, nprM-lac, VHb 및 단백질 A 프로모터, 또는 심지어 Ptrp 프로모터 (WO 99/64607)를 언급할 수 있다. 코리네박테리아나 스트렙토마이세스와 같은 그람-양성 박테리아에서의 발현에 대해, PtipA 또는 PS1 및 PS2 (FR91/09870) 프로모터나, 특허 출원 제EP0629699A2 호에 기술된 것들을 언급할 수 있다. 효모와 균류에서의 발현에 대해, 클루이베로마이세스 락티스 PLAC4 프로모터 또는 클루이베로마이세스 락티스 Ppgk 프로모터 (특허 출원 제FR 91/05294 호), 트리코데르마 (Trichoderma) tef1 또는 cbh1 프로모터 (WO 94/04673), 페니실리움 his, csl 또는 apf 프로모터 (WO 00/68401), 및 아스페르길루스 gla 프로모터를 언급할 수 있다.
본 발명에 따르면, 키메라 유전자는, 프로모터와 코딩 서열 사이에 위치하는, 전사 활성자 (인핸서)와 같은 다른 조절 서열도 포함할 수 있다.
이처럼, 본 발명의 키메라 유전자는 구체적인 실시 양태에서, 숙주 유기체에서 기능하는 하나 이상의 프로모터 조절 서열, 본 발명의 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제, 말릴-CoA 리덕타제 및 DHB 데하이드로게나제를 코딩하는 핵산 서열, 및 상기 숙주 유기체에서 기능하는 종결자 조절 서열을, 전사 방향으로 기능적으로 연결하여, 포함한다.
본 발명은 또한, 본 발명에 따른 키메라 유전자 또는 본 발명의 핵산 서열을 포함하는 클로닝 및/또는 발현 벡터에 관한 것이다. 본 발명에 따른 벡터는 숙주 유기체를 변환하고, 이 유기체에서 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제, 말릴-CoA 리덕타제 및/또는 DHB 데하이드로게나제 중 어느 하나를 발현하는데 사용된다. 이 벡터는 플라스미드, 코스미드, 박테리오파지 또는 바이러스일 수 있다. 바람직하게는, 본 발명에 따른 형질변환 벡터는 플라스미드이다. 일반적으로, 이 벡터의 주 특징은, 숙주 유기체 세포에서 스스로 유지하고, 특히 복제 기원이 존재해서 자가복제하며, 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제, 말릴-CoA 리덕타제 및/또는 DHB 데하이드로게나제 중 어느 하나를 세포 안에서 발현하는 능력이어야 한다. 숙주 유기체의 안정적인 형질변환을 위해서는, 벡터가 게놈에 삽입될 수도 있다. 이러한 벡터의 선택과, 본 발명에 따른 키메라 유전자를 상기 벡터에 삽입하는 기술은, 당해 분야의 당업자가 가지고 있는 일반적인 지식의 일부이다. 유리하게는, 본 발명에서 사용되는 벡터는, 본 발명에 따른 키메라 유전자 외에도, 선별 마커를 코딩하는 키메라 유전자도 포함한다. 상기 선별 마커는, 효과적으로 형질변환된 숙주 유기체, 즉, 벡터가 삽입된 유기체를 선별할 수 있게 한다. 본 발명의 특정 실시 양태에 따르면, 형질변환되는 숙주 유기체는 박테리아, 효모, 균류이다. 사용될 수 있는 선별 마커 중에서도, 예를 들어, 하이그로마이신 포스포트랜스퍼라아제 (hygromycin phosphotransferase) 유전자와 같은 항생제 내성 유전자를 포함하는 마커가 언급될 수 있다. 다른 마커로는, 영양요구를 보완하는 (complement) 유전자, 예컨대 pyrA, pyrB, pyrG, pyr4, arg4, argB 및 trpC 유전자, 몰리브도프테린 신타제(synthase) 유전자, 또는 아세타미다아제 (acetamidase) 유전자일 수 있다. GUS 효소와 같이 쉽게 동정될 수 있는 효소를 코딩하는 유전자나, 형질변환된 세포에서 안료를 코딩하는 유전자 또는 안료 생성을 조절하는 효소가 언급될 수도 있다. 이러한 선별 마커 유전자는 특히 특허 출원 제WO 91/02071 호, 제WO 95/06128 호, 제WO 96/38567 호, 및 제WO 97/04103 호에 기술되어 있다.
본 발명은 또한, 숙주 유기체의 게놈에 삽입되어 있거나, 염색체외 유전자 요소인 예를 들어, 플라스미드에 존재하는, 본 발명에 따른 키메라 유전자를 하나 이상 포함하는, 형질변환된 숙주 유기체에 관한 것이다. 본 발명의 더욱 구체적인 측면에서, 형질변환된 숙주 유기체는, 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제 활성을 가진 폴리펩타이드를 코딩하는 본 발명의 핵산, 또는 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 키메라 유전자, 또는 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제 활성을 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 말릴-CoA 리덕타제 활성을 가진 폴리펩타이드를 코딩하는 핵산, 또는 말릴-CoA 리덕타제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 키메라 유전자, 또는 말릴-CoA 리덕타제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 DHB 데하이드로게나제 활성을 가진 폴리펩타이드를 코딩하는 핵산, DHB 데하이드로게나제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 키메라 유전자, 또는 DHB 데하이드로게나제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 발현 벡터를 포함한다.
숙주 유기체에서 이종성으로 발현되는 효소의 활성은 종종 이들의 불량한 용해성 및 봉입체(inclusion body)의 형성에 의해 제한을 받는다. 따라서, 본 발명은 또한, 기능성 효소가 또 다른 단백질 또는 펩타이드와 물리적으로 융합되어 (융합 단백질로 지칭되기도 함), 숙주 유기체에서 발현 시 상기 효소의 활성을 증가시키는 점에서, 키메라 단백질에 관한 것이기도 하다. 이러한 융합 단백질은 당해 기술분야에 공지되어 있으며, 하기의 비-배제적인 예들 사이에서 보편적으로 선택된다: 말토스(maltose) 결합 단백질, Mbp, 티오레독신(thioredoxin), ThrX, 글루타티온-S-트랜스퍼라제, Gst, 전사 종결 인자, NusA.
"숙주 유기체"라는 용어는, 2,4-DHB를 제조하기 위해, 본 발명에 따른 키메라 유전자(들), 핵산(들) 또는 벡터(들)가 도입될 수 있는 임의의 저급 단세포 유기체를 의미하는 것이다. 바람직하게는, 숙주 유기체는 미생물, 특히 균류, 예를 들어, 페니실리움, 아스페르길루스, 더욱 특히 아스페르길루스 플라부스 (Aspergillus flavus), 크리소스포리움 (Chrysosporium) 또는 트리코데르마 속의 균류, 효모, 특히 사카로마이에타세애(Saccharomycetaceae), 피키아세애(Pichiaceae) 또는 스키조사카로마이세타세애(Schizosaccharomycetaceae), 가장 바람직하게는 사카로마이세스 세레비지애, 스키조사카로마이세스폼베(Schizosaccharomycespombe), 클루이베로마이세스락티스(Kluyveromyceslactis), 클루이베로마이세스 마륵시아누스(Kluyveromyces marxianus), 또는 피키아 야디니이(Pichia jadinii), 피키아 스티피티스(Pichia stipitis) 또는 피키아 파스토리스(Pichia pastoris), 박테리움, 바람직하게는 엔테로박터리아세애(Enterobacteriaceae), 클로스트리디아세애(Clostridiaceae), 바실라세애(Bacillaceae), 스트렙토마이세타세애, 스트렙토콕카세애(Streptococcaceae), 메틸로박터리아새(Methylobacteriacae), 및 코리네박테리아세애(Corynebacteriaceae), 가장 바람직하게는 에스케리키아 콜라이, 바실러스 서브틸리스(Bacillus subtilis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 메틸로박테리움 엑스토?스(Methylobacterium extorquens), 또는 락토콕커스 락티스(Lactococcus lactis)의 효모이다.
숙주 유기체는 포도당과 같은 당으로부터 말레이트 또는 숙시네이트를 천연적으로 과다생성하는 숙주 유기체, 또는 포도당과 같은 당으로부터 말레이트 또는 숙시네이트를 과다생성하도록 조작되었으며 말레이트, 피루베이트, 숙시네이트 및 푸마레이트와 같은 유기산의 유출(export)을 촉진하는 모든 잠재적인 막 수송체가 제거된 숙주 유기체일 수 있다. 숙주 유기체는, DHB를 과다생성하도록 조작되었으며 말레이트, 피루베이트, 숙시네이트 및 푸마레이트와 같은 유기산의 유출을 촉진하는 모든 잠재적인 막 수송체가 제거된 숙주 유기체일 수 있다. 말레이트 및 기타 유기산의 유출을 촉진하는 퍼미아제(permease)의 예는, 스키조사카로마이세스 폼베(Schizosaccharomyces pombe ) 유래의 Mae1 (Camarasa et al ., 2001)(Grobler et al., 1995), 바실러스 서브틸리스(Bacillus subtilis ) 유래의 DctA (Groeneveld et al ., 2010), coli 유래의 Dct 1-4, 사카로마이세스 세레비지애(S. cerevisiae) 유래의 Jen1 (Akita et al ., 2000)이다. 전문가들은, 서열 동일성을 토대로, 에스케리키아 콜라이(E. coli)에서 후보(candidate) 퍼미아제를 규명할 수 있을 것이다. 이들 구성은 세포 내부에서 말레이트 및 기타 유기산을 유지하여 DHB 생성에 이용될 수 있도록 작용할 것이다.
"형질변환된 숙주 유기체"라는 표현은, 숙주 유기체의 게놈으로, 또는 플라스미드와 같은 염색체외 유전자 요소에, 본 발명에 따른 키메라 유전자 하나 이상이 삽입되어, 결과적으로 세포 내부나 배양 배지에서 말릴-CoA 신테타제, 말릴-CoA 리아제, 말릴-CoA 리덕타제 및/또는 DHB 데하이드로게나제 중 어느 하나를 생산하는 숙주 유기체를 의미하는 것이다. 본 발명에 따른 숙주 유기체를 수득하기 위해, 당해 분야의 당업자는 여러 공지된 형질변환 방법 중 하나를 이용할 수 있다.
이들 방법 중 하나는, 형질변환될 숙주 유기체의 세포를 폴리에틸렌 글리콜 (PEG)과, 그리고 본 발명에 따른 벡터와 접촉시키는 것으로 이루어진다. 형질변환될 세포와 본 발명의 벡터를 전기장에 두는 것으로 이루어진, 전기천공이 또 다른 방법이다. 다른 방법은, 미세주입에 의해 벡터를 세포나 조직에 직접 삽입하는 것으로 이루어진다. "바이오리스틱 (biolistic)" 방법이 사용될 수 있다. 이 방법은, 본 발명의 벡터가 그 위에 흡착된 입자들을 사용해, 세포나 조직을 공격함으로써 이루어진다 (미국 특허 제4,945,050 호).
박테리아를 형질변환하는 여러 방법은, 에스케리키아 콜라이와 다른 그람-음성 박테리아에 대한 문헌에 기술되어 있다. 접합이 사용될 수도 있다. 그람-양성 박테리아에 대해서는 전기천공이 사용될 수 있으며, 특히 스트렙토마이세스 속의 박테리에 대해서는 원형질 형질변환이 또한 사용될 수 있다.
균류를 형질변환하는 여러 방법이 또한 문헌에 기술되어 있다. PEG를 이용한 원형질 형질변환이 제EP 0260762 호에서 아스페르길루스를 들어 기술되어 있으며, 이 방법을 페니실리움 푸니쿨로숨 종에 맞도록 조정한 것이 제WO 00/36120 호에 기술되어 있다. 제한효소를 매개로 한 삽입, 또는 REMI에 의한 형질변환도 공지되어 있으며, 이는 아그로박테리움 속 박테리아를 사용하는 원형질 형질변환이다. 효모를 형질변환하는 기술 역시 문헌에 설명되어 있다.
다른 측면에서, 본 발명은 본 발명의 형질변환된 미생물을 배양하는 단계를 포함하는, 2,4-DHB의 제조 방법에 관한 것이다.
DHB의 제조를 위해, 포도당, 과당, 자당, 당밀, 엿당, 블랙스트랩 당밀, 전분 가수분해물 (포도당, 올리고당), 젖당, 엿당, 전분 및 전분 가수분해물, 셀룰로오스, 셀룰로오스 가수분해물, 글리세롤, 아세테이트 및 소정의 탄화수소, 오일 및 지방 예컨대 대두유, 해바라기유, 땅콩유 및 코코넛유, 뿐만 아니라 지방산 예컨대 팔미트산, 스테아르산 및 리놀레산과 같은 다양한 탄수화물이, 각각 또는 혼합물로서 이용될 수 있다. 이들 성분들은 각각 또는 혼합물로서 사용될 수 있다.
기체성 또는 수성 암모니아와 같은 무기 화합물, 황산암모늄, 질산암모늄, 인산암모늄, 염화암모늄, 아세트산암모늄 및 탄산암모늄과 같은 무기 또는 유기산의 암모늄염을 비롯하여 다양한 질소원이, 상용화와 중간 시험 규모의 제조에, 각각 또는 혼합물로 이용될 수 있다. 대안적으로는, 대두-가수분해물, 콩 단백질 HCl-가수분해물 (총 질소량은 약 7%임), 콩가루, 콩깻묵 가수분해물, 옥수수 침지액, 카제인 가수분해물, 효모 추출물, 육류 추출물, 맥아 추출물, 요소, 펩톤 및 아미노산과 같은, 천연 질소 포함 유기 물질이 이용될 수도 있다.
제조 공정은 호기성, 혐기성 및 산소 제한 조건 하에 수행될 수 있다. 공정은 유가식 공정 또는 회분식 공정으로 수행될 수 있다.
증식이 잘 되게 하는 말레이트 (또는 피루베이트, 숙시네이트나 푸마레이트와 같은 다른 유기산)를 단독으로, 또는 다른 탄소원과 함께 첨가한 매질에서 숙주 유기체를 배양함으로써, 상기 2,4-DHB를 제조할 수 있다. 말레이트 (및 다른 유기산)는 직접 첨가될 수 있거나, 또는, 제1 공정 단계에서, 말레이트-과다생성 미생물에 의해 말레이트 (또는 다른 유기산)가 생성되고, 후속한 단계에서, 본 발명에 따른 숙주 유기체에 의해 2,4-DHB가 생성되는 2-단계 발효 공정을 설계하여, 첨가될 수 있다.
생성물 분리 및 정제는 총 공정 효율과 생성물 가격에 크게 영향을 미치는 매우 중요한 요소이다. 생성물 회수 방법은 보편적으로, 세포 분리, 뿐만 아니라 생성물 정제, 농축 및 건조 단계를 각각 포함한다.
세포 분리
발효 매질에서 세포를 분리하기 위해, 한외여과 및 원심분리가 사용될 수 있다. 발효 매질에서 세포를 분리하는 것은, 높은 매질 점성으로 인해 종종 복잡하다. 따라서, 본 발명자들은, 세포 분리를 최적화하기 위해, 무기산이나 알칼리염과 같은 첨가제를 첨가하거나, 배양 배지 (culture broth)를 열처리할 수 있다.
생성물 회수
바이오매스 제거 전이나 후에, 다양한 이온-교환 크로마토그래피 방법이 DHB 분리에 이용될 수 있다. 이 방법들은, 생성물을 이들의 등전점에 따라 분리하는 것을 용이하게 하는, 1차 양이온 교환 수지의 사용을 포함한다. 전형적으로, 상기 수지에는 용액이 채워져 있으며, 보유 생성물은 용리액에서 (예를 들어, 수산화암모늄의 첨가에 의한) pH 증가에 따라 개별적으로 용리된다. 다른 가능성으로는, 고정층 또는 모사 이동층 수지를 사용하는 이온-교환 크로마토그래피의 이용이다. 적합한 생성물 순도를 수득하기 위해서는, 여러 가지 크로마토그래피 단계가 조합되어야 한다. 이들 정제 방법은 고비용의 결정화 단계에 비해 더 경제적이며, 최종 산물의 형태와 관련해 부가적인 이점이라든지 유연성을 제공하기도 한다.
생성물 농축 및 건조
정제 공정은, 분무 과립 건조기, 분무 건조기, 드럼 건조기, 회전 건조기, 및 터널 건조기와 같은 임의의 적절한 건조 수단을 수반할 수 있는 건조 단계를 포함할 수도 있다. 농축된 DHB 용액은, 다목적 농축기나 박막 증발기를 사용하는 경우, 130℃에서 증기로, 감압 하에 발효조를 가열함으로써 수득될 수 있다.
효율적인 DHB 제조는, 숙주 유기체의 대사 네트워크에서 탄소 흐름의 재분배를 최적화하고, DHB 경로의 3 가지 효소에 NADPH와 ATP를 충분히 공급해줌으로써, 보장될 수 있다. 원하는 대사 경로로 탄소 흐름을 채널링하고, NAD(P)H 보조인자를 공급하는 것은 보편적으로, 경쟁적 천연 발효 경로를 생략하거나 감소시킴으로써 용이하게 된다. 비-제한적인 예로는,
- (피루베이트 탈카르복실화효소의 결손에 의해) 에탄올 형성을 방해함으로써, 사카로마이세스 세레비지애에서 말레이트 생성을 최적화하는 것 (Zelle et al., 2008)(Zelle et al., 2010),
- 락테이트 형성 (예를 들어, IdhA의 결손), 아세테이트 형성 (예를 들어, pta, ackA의 결손), 에탄올 형성 (예를 들어, adhE의 결손), 포르메이트 형성 (예를 들어, pflB, focA의 결손), 피루베이트 산화 (예를 들어, poxB의 결손), 말레이트 분해 (maeB 및 scfA의 결손), 숙시네이트 형성 (예를 들어, frdBC의 결손), 메틸글리옥살 형성 (mgsA의 결손)을 방해함으로써, 에스케리키아 콜라이에서 숙시네이트나 말레이트 생성을 최적화하는 것 (Jantama et al, 2008a)(Jantama et al., 2008b)(Lin et al., 2005)(Zhang et al., 2011)(Sanchez et al., 2005)
- 포스포글루코스 이소머라제, pgi를 제거하여, 펜토스 포스페이트 경로를 가로지르는 탄소 유동을 채널(channel)함으로써, 생합성 반응에 대한 NADPH의 이용가능성을 높이는 것 (Auriol et al ., 2011)이 있다.
유기산 제조를 위해 탄소 흐름과 ATP 공급을 증가시킬 수 있는 다른 방법은, 포스포에놀피루베이트 (PEP)/피루베이트/옥살로아세테이트 브랜치 노드 (branch node)를 조작하는 것이다 (Sauer & Eikmanns, 2005에서 리뷰됨). 포스포에놀피루베이트에서 옥살로아세테이트로의 탄소 흐름을 확실히 증가시키는 대사 공학 계획에 대한 비-제한적인 예로는,
- 피루베이트 키나아제의 작용을 방해하고, PEP 카르복시키나아제의 활성을 증가시킴으로써, 사카로마이세스 세레비지애에서 말레이트 생성을 최적화하는 것 (Zelle et al., 2010).
- 천연적으로 또는 이종적으로 발현되는 PEP 카르복실라아제, PEP 카르복시키나아제, 또는 피루베이트 카르복실라아제의 활성을 증가시킴으로써, 에스케리키아 콜라이에서 숙시네이트 생성을 최적화하는 것 (Millard et al., 1996)(Sanchez et al., 2005)(Zhang et al., 2011)이다.
포도당을 처음으로 인산화시키는 단계에 PEP-소모 포스포트랜스퍼라아제 시스템 (PTS)을 이용하는 에스케리키아 콜라이와 또 다른 박테리아에서, 유기산의 제조를 위해 탄소 흐름과 ATP 공급을 증가시키는 다른 방법은, PTS 시스템의 필수 성분들 (예를 들어, pts1 또는 ptsG)을 결손시키는 것이다 (Lin et al., 2005)(Zhang et al., 2009). PTS 시스템에 결손 돌연변이를 가진 돌연변이체에서 포도당 흡수를 더욱 확실히 하기 위해서는, 대체 포도당 흡수 시스템 (예를 들어 GalP)의 활성이 보장되어야 한다.
유기산을 제조하는 바람직한 반응경로로 향하는 탄소 흐름을 증가시킬 다른 방법은, 시트르산 및 글리옥실레이트 회로를 조작하는 것이다. 비-제한적인 예로는,
- 이소시트레이트 분해효소의 활성을 증가시킴으로써 (전사 억제자 iclR의 결손), 에스케리키아 콜라이에서 숙신산 생성을 최적화하는 것 (Lin et al., 2005)(Sanchez ef al., 2005a).
- 이소시트레이트 데하이드로게나제, 및/또는 숙시네이트 데하이드로게나제의 결손에 의해, 숙신산 생성을 최적화하는 것 (Lin et al., 2005)이다.
DHB-생성 경로로의 도입 반응의 기질인 말레이트, 글리옥실레이트 및 아세틸-CoA의 이용가능성을 높이는 또 다른 방법은 아스파테이트 트랜스아미나제 (aspC , tyrB), 푸마라제 (fumABC), 푸마레이트 리덕타제 (frdBC), 말레이트 신타제 (aceB) 및 글리옥실레이트 리덕타제 (ghrAB) 효소를 약화시키는 것이다.
또 다른 대사 설정에서, 크렙스 사이클(Krebs cycle) 및 글리옥실레이트 션트(shunt)를 통해 2,4-DHB 전구물질인 말레이트만 생성할 수 있다. 이러한 설정은 세포기질(cytosolic) 및 막 결합된 말레이트 데하이드로게나제인 mdh 및 mqo를 각각 결손시킬 것을 요구한다. 상기 방법은 아스파테이트 및 이의 유도체로의 탄소 유동의 잠재적인 누출을 상당히 피한다.
2,4-DHB를 제조하는 바람직한 반응경로로 향하는 탄소 흐름을 증가시킬 다른 방법은, 생성 유기체에서 적절한 피루베이트 데하이드로게나제 및 시트레이트 신타제가 발현되는 것이다. 에스케리키아 콜라이의 천연 피루베이트 데하이드로게나제 및 시트레이트 신타제는, 혐기성 조건 하에 이들 효소의 활성을 감소시키는, 고농도의 세포내 NADH에 의해 저해된다. 에스케리키아 콜라이에서, NADH에 둔감한 피루베이트 데하이드로게나제 돌연변이체가 발현되면, 혐기성 조건 하에 아세틸-CoA가 과다생성되고, 발효 최종 산물 (아세테이트, 락테이트, 에탄올, 포르메이트, 및 피루베이트) 사이에 탄소 흐름 재분배가 변경된다 (Wang et al., 2010). NADH에 둔감한 바실러스 서브틸리스 시트레이트 신타제의 이종성 발현은, 조작된 에스케리키아 콜라이 균주에서 숙신산 생성을 증가시킨다 (Sanchez et al., 2005). 전술한 돌연변이와 더불어, 적절한 피루베이트 데하이드로게나제 및 시트레이트 신타제 (NADH 민감성 또는 둔감성)를 사용하면, 호기성 및 혐기성 조건 시, 글리옥실레이트 및 시트르산 회로 반응과 발효 경로 사이에 탄소 흐름 재분배를 조정할 수 있다.
DHB 경로를 통한 탄소 흐름을 증가시킬 다른 방법은, 반응경로 중간체인 말릴-CoA 또는 4-말레이트 세미알데하이드를 분해할 수 있는 효소 반응을 생략하는 것이다. 말레이트 세미알데하이드를 분해할 수 있는 후보 효소는 숙신산 세미알데하이드 데하이드로게나제 (sad, gabD)와, 말단 알데하이드기로 짧은 탄소 사슬 및 중간 탄소 사슬을 산화시킬 수 있는 다른 데하이드로게나제들이다. 더욱이, 말릴-CoA는 시트레이트 신타제에 의해 분해될 수 있는 것으로 알려져 있다.
숙주 유기체의 2,4-DHB 생산성을 증가시킬 다른 방법은, DHB를 분해하는 대사 반응을 생략하는 것이다. 2,4-DHB는 말산 효소의 경쟁적 저해자로서, 이 효소의 활성 부위에 대한 친화성이 상당히 높다 (Rognstad & Katz, 1979). 따라서, DHB는 다른 효소에 의해 인지되어 잠재적으로 분해될 수 있다. 이들 효소는 숙주 유기체에서 동정되고 결손될 수 있다.
2,4-DHB 생성이 말레이트 또는 다른 유기산의 첨가를 기본으로 할 경우, 2,4-DHB-생성 미생물은, 말레이트 (또는 피루베이트, 숙시네이트 등과 같은 다른 유기산)의 흡수를 용이하게 하는, 막 수송 단백질을 기능적으로 발현해야 한다.
본 발명의 형질변환된 숙주 유기체는 DHB를 합성하는 부가적인 경로를 추가로 포함할 수 있으며, 상기 숙주 유기체는 이들의 게놈에 병합되거나 또는 염색체외 유전적 구성원에 의해 옮겨지는, 1종 이상의 키메라 유전자, 예를 들어 말레이트 키나제를 코딩하는 플라스미드 또는 말레이트 키나제를 코딩하는 핵산을 포함하는 키메라 유전자 또는 말레이트 키나제를 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 말레이트 세미알데하이드 데하이드로게나제를 코딩하는 핵산, 또는 말레이트 세미알데하이드 데하이드로게나제를 코딩하는 핵산을 포함하는 키메라 유전자 또는 말레이트 세미알데하이드 데하이드로게나제를 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 DHB 데하이드로게나제를 코딩하는 핵산, DHB 데하이드로게나제를 코딩하는 핵산을 포함하는 키메라 유전자 또는 DHB 데하이드로게나제를 코딩하는 핵산을 포함하는 발현 벡터를 포함한다. 상기 효소는 국제 특허 출원 2012/056318에 개시되어 있다.
하기 실시예는 본 발명을 예시한다. 이들 실시예는 예시를 목적으로 할 뿐, 어떤 방식으로 본 발명의 범위를 한정하려는 것이 아니다.
도 1: (i) (L)-말레이트, 숙시닐-CoA, 또는 글리옥실레이트가 (L)-2,4-다이하이드록시부티레이트 (2,4-DHB)로 변환되는 것을 설명하는 반응 도식.
도 2: 도면은 말레이트 세미알데하이드에 대한 활성 (상부 그래프), 숙신산 세미알데하이드에 대한 활성 (중간 그래프), 말레이트 세미알데하이드 및 숙신산 세미알데하이드에 대한 야생형 활성의 비율에 대한, 말레이트 세미알데하이드 및 숙신산 세미알데하이드에 대한 돌연변이체의 활성의 비율의 로그함수로서 표현한, 야생형 효소와 비교 시 효소 특이성의 변화 (하부 그래프). (양의 값은 말레이트 세미알데하이드에 선호적인 특이성의 변화를 의미함).
도 3: 2 mM 아세틸-CoA, 2 mM 글리옥실레이트, 및 2 mM NADPH를 DHB 경로 효소의 서로 다른 조합과 함께 인큐베이션한 후 DHB의 존재를 보여주는 크로마토그램 (반응 1: 말릴-CoA 리아제 (150 ㎍/mL Me-Mcl), 말릴-CoA 리덕타제 (100 ㎍/mL St-Mcr), 및 말레이트 세미알데하이드 리덕타제 (100 ㎍/mL Ms-SSAred H39R N43H); 반응 2: 반응 1과 동일하지만, 100 ㎍/mL Pg-SucD를 말릴-CoA 리덕타제로서 사용함; 대조군 1: 반응 1과 동일하지만, 말릴-CoA 리덕타제를 포함하지 않음; 대조군 2: 반응 1과 동일하지만, 말레이트 세미알데하이드 리덕타제를 포함하지 않음)
도 2: 도면은 말레이트 세미알데하이드에 대한 활성 (상부 그래프), 숙신산 세미알데하이드에 대한 활성 (중간 그래프), 말레이트 세미알데하이드 및 숙신산 세미알데하이드에 대한 야생형 활성의 비율에 대한, 말레이트 세미알데하이드 및 숙신산 세미알데하이드에 대한 돌연변이체의 활성의 비율의 로그함수로서 표현한, 야생형 효소와 비교 시 효소 특이성의 변화 (하부 그래프). (양의 값은 말레이트 세미알데하이드에 선호적인 특이성의 변화를 의미함).
도 3: 2 mM 아세틸-CoA, 2 mM 글리옥실레이트, 및 2 mM NADPH를 DHB 경로 효소의 서로 다른 조합과 함께 인큐베이션한 후 DHB의 존재를 보여주는 크로마토그램 (반응 1: 말릴-CoA 리아제 (150 ㎍/mL Me-Mcl), 말릴-CoA 리덕타제 (100 ㎍/mL St-Mcr), 및 말레이트 세미알데하이드 리덕타제 (100 ㎍/mL Ms-SSAred H39R N43H); 반응 2: 반응 1과 동일하지만, 100 ㎍/mL Pg-SucD를 말릴-CoA 리덕타제로서 사용함; 대조군 1: 반응 1과 동일하지만, 말릴-CoA 리덕타제를 포함하지 않음; 대조군 2: 반응 1과 동일하지만, 말레이트 세미알데하이드 리덕타제를 포함하지 않음)
실시예
1: 말릴-
CoA
리아제
활성의 시험
말릴- CoA 리아제를 코딩하는 야생형 유전자를 포함하는 플라스미드의 제작: 메틸로박테리움 엑스토?스(M. extoquens ) (Arps et al ., 1993) 및 로도박터 캡술라투스(Rhodobacter capsulatus ) (Meister et al ., 2005)에서 말릴-CoA 리아제를 코딩하는 mcl 유전자의 DNA 서열을, GENEius 소프트웨어 (Eurofins)를 사용해 에스케리키아 콜라이에서 발현되도록 최적화하였다. 최적화된 서열은 NheI 및 EcoRI 제한효소 부위를 각각 mcl의 개시 코돈의 상류와 정지 코돈의 하류에 첨가함으로써 Eurofins MWG OPERON®에 의해 합성하였으며, 이로써 합성된 DNA 단편을 T4 DNA 리가제(ligase) (Biolabs)를 사용해 pET28a+ 벡터 (Novagen) 내로 직접 클로닝할 수 있었다. 연결 산물(ligation product)은 에스케리키아 콜라이 DH5α 세포에 형질변환시키고, 증폭시킨 다음, 플라스미드 pET28-Mex-mcl (메틸로박테리움 엑스토?스 유래의 말릴-CoA 리아제를 발현함) 및 pET28-Rca-mcl (로도박터 캡술라투스 유래의 말리-CoA 리아제를 발현함)을 표준 유전적 프로토콜을 이용해 분리하였다 (Sambrook et al ., 1989). 사용되는 mcl 단백질 서열에 대한 NCBI 및 통합 게놈(Integrated Genomics) 참조와, 상응하는 천연 DNA 서열 및 합성 DNA 서열에 대한 참조는 표 1에 열거되어 있다.
유기체 | 단백질 | NCBI/통합 게놈 입수 번호(Integrated Genomics accession number) | 천연 DNA 서열 | 최적화된 DNA 서열 |
메틸로박테리움 엑스토?스 (M. extorquens ) |
Mcl 서열 번호 1 |
YP _002962854 | 서열 번호 2 | 서열 번호 3 |
효소 발현: 에스케리키아 콜라이 BL21 (D3) 세포를 표준 유전적 프로토콜을 이용해 적절한 플라스미드로 형질변환하였다 (Sambrook et al ., 1989). OD600 0.1에서 하룻밤 배양시킨 배양물을 접종하여 OD600 0.6으로 증식시킨 후, 1 mM 이소프로필 β-D-1-티오갈락토파리노시드 (IPTG)를 배양 배지에 첨가하여 단백질 발현을 유도하여, 250 mL LB 배양액에서, N-말단 헥사-His 태그가 붙은 효소를 발현시켰다. 단백질 발현 3 시간 후, 13000 g에서 10 분 동안 원심분리해서 세포를 회수하고, 상층액을 폐기한다. 세포 펠렛은 다음 분석까지 -20℃에 보관하였다. 증식 및 단백질 발현은 37℃에서 수행하였다. 배양 배지에는 50 ㎍/mL 카나마이신이 첨가되었다.
효소 정제: 발현 배양물 중 동결시킨 세포 펠렛을 0.5 mL의 분해 완충액 (50 mM Hepes, 300mM NaCl, pH 7.5)에 재현탁시키고, 전력 출력을 30%로 세팅한 소니케이션(sonication)을 4 회 연속으로 진행시켜, 분해하였다 (소니케이션 간격: 20초, 파워 출력: 30%, 소니케이터(sonicator): Bioblock Scientific사 제품, Vibracell™ 72437). 조 (crude) 추출물을 4℃, 13000 g에서 15 분 동안 원심분리하여 세포 잔해를 제거하고, 맑은 상층액을 수득하였다. 15 mg/mL 스트렙토마이신 (시그마 (Sigma) 사 제품)을 첨가하고, 샘플을 4℃, 13000 g에서 10 분 동안 원심분리하여, 상층액을 수득함으로써, RNA 및 DNA를 추출물에서 제거하였다. 맑은 단백질 추출물을, 베드 (bed) 부피가 0.3 (0.75 mL)인 Talon™ 코발트 친화성 수지 (Clontech사 제품)로 실온에서 20분 (4℃에서 1시간) 동안 인큐베이션하였다. 현탁액을 테이블 탑 원심분리기, 700 g에서 원심분리하고, 상층액을 제거하였다. 0.5 mL의 용리 완충액 (50 mM Hepes, 300 mM NaCl, 200 mM 이미다졸, pH 7.5)으로 단백질을 용리하기 전에, 10 베드 부피의 세정 완충액 (50 mM Hepes, 300 mM NaCl, 15 mM 이미다졸, pH 7.5)으로 수지를 세정하였다. 용리된 효소의 순도는 SDS-PAGE 분석으로 확인하였다. 단백질 농도는 브래드포드(Bradford) 방법으로 측정하였다.
효소 분석: 말릴-CoA 리아제 활성을 (Meister et al ., 2005)로부터 채택된 방법에 의해 분석하였다. 말릴-CoA 리아제에 의한 말릴-CoA 합성은 조효소 A의 시트레이트 신테타제-촉매된 방출과 커플링하였으며, DTNB와의 자발적인 반응에 의해 모니터링하였다.
반응 도식:
말릴-CoA 리아제:
아세틸-CoA + 글리옥실레이트 → (L)-말릴-CoA
시트레이트 신테타제:
(L)-말릴-CoA → (L)-말레이트 + 조효소 A
자발적 :
조효소 A + DTNB → CoA-DTNB 다이설파이드
분석법 1에 따른 반응 혼합물은 50 mM MOPS/KOH (pH 7.5), 0.25 mM DTNB, 5 mM MgCl2, 1 mM 아세틸-CoA, 20 U/mL 시트레이트 신테타제 (모두 Sigma사 제품), 및 적당량의 정제된 말릴-CoA 리아제 또는 세포 추출물을 포함하였다. 반응은 10 mM 글리옥실레이트를 첨가함으로써 개시하였다. 효소적 분석은 37℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 412 nm (εDNTB + CoA = 13.6 mM-1 cm-1)에서 DNTB의 특징적인 흡광도를 분석하였다.
메틸로박테리움 엑스토?스 유래의 정제된 말릴-CoA 리아제는 Vmax가 36 μmol/(min mg prot), 글리옥실레이트에서의 Km이 0.5 mM이었다.
실시예
2: 말릴-
CoA
리덕타제
활성의 실험
말로닐 - CoA 리덕타제 및 숙시닐 - CoA 리덕타제를 코딩하는 야생형 유전자를 포함하는 플라스미드의 제작: 술폴로부스 토코다이이( Sulfolobus tokodaii ) str 7 (Alber et al ., 2006)에서 말릴-CoA 리덕타제를 코딩하는 mcr 유전자의 DNA 서열을, GENEius 소프트웨어 (Eurofins)를 사용해 에스케리키아 콜라이에서 발현되도록 최적화하였다. 최적화된 mcr 서열, 및 포르피로모나스 깅기발리스(Porphyromonas gingivalis)에서 숙시닐-CoA 리덕타제를 코딩하는 sucL 유전자의 천연 DNA 서열을, NheI 및 EcoRI 제한효소 부위를 각각 mcl의 개시 코돈의 상류와 정지 코돈의 하류에 첨가함으로써 Eurofins MWG OPERON®에 의해 합성하였으며, 이로써 합성된 DNA 단편을 T4 DNA 리가제 (Biolabs)를 사용해 pET28a+ 벡터 (Novagen) 내로 직접 클로닝할 수 있었다. 연결 산물은 에스케리키아 콜라이 DH5α 세포에 형질변환시키고, 증폭시킨 다음, 플라스미드 pET28-St-mcr (S. 코토다이이이(S. tokodaii) 유래의 말로닐-CoA 리덕타제를 발현함) 및 pET28-Pgi-sucD (포르피로모나스 깅기발리스(P. gingivalis) 유래의 숙시닐-CoA 리덕타제를 발현함)을 표준 유전적 프로토콜을 이용해 분리하였다 (Sambrook et al., 1989). 사용되는 mcl 및 sucD 단백질 서열에 대한 NCBI 및 통합 게놈 참조와, 상응하는 천연 DNA 서열 및 합성 DNA 서열에 대한 참조는 표 2에 열거되어 있다.
유기체 | 단백질 | NCBI/통합 게놈 입수 번호 | 천연 DNA 서열 | 최적화된 DNA 서열 |
술폴로부스 토코다이이(S. tokodaii ) | St-Mcr 서열 번호 7 |
NP _378167 | 서열 번호 8 | 서열 번호 9 |
포르피로모나스 깅기발리스
(P. gingivalis ) |
Pg-SucD 서열 번호 10 |
AAQ65862 | 서열 번호 11 |
Pg-SucD의 발현 및 정제는 플라스미드 pET28-Pgi-sucD를 사용해 실시예 1에서와 같이 수행하였다.
St-mcr 유전자는 프라이머 5'-TATAATGAGCTCGTTTAACTTTAAGAAGGAGATATACCATGATTCTGATGCGCCGT-3' (서열 번호 12) 및 5'-TATAATGGATCCCTCGAATTCTTACTTCTC-3' (서열 번호 13)를 사용해 플라스미드 pET28-St-mcr로부터 증폭시켰으며, 각각 개시 코돈의 상류 및 정지 코돈의 하류에 SacI 및 BamHI 제한효소 부위를 첨가하였다. PCR 단편을 SacI 및 BamHI 제한효소 부위를 사용해 pACT3 발현 벡터에 연결하였다. 생성된 플라스미드 pACT3-St-Mcr을 에스케리키아 콜라이 MG1655 균주에 형질변환시켰다. 생성된 발현 균주는 37℃에서 미네랄 배지에서 배양하였다. 1 리터 미네랄 배지는, 20 g 포도당, 18 g Na2HPO4 * 12 H2O, 3 g KH2PO4, 0.5 gNaCl, 2 g NH4Cl, 0.5 g MgSO4 * 7 H2O, 0.015 CaCl2 * 2 H2O, 100배 희석시킨 농축 HCl에서 제조한 0.06 mol/L FeCl3 스탁 용액 1 mL, 10 mM 티아민 HCl 스탁 용액 2 mL, MOPS 20 g, 카나마이신 설페이트 50 ㎍ (및 필요한 경우 25 ㎍ 클로람페니콜), 및 미량 원소 용액 1 mL (L 당: 0.04 g Na2EDTA * 2H2O, 0.18 g CoCl2 * 6 H2O, ZnSO4 * 7 H2O, 0.04 g Na2MoO4 * 2 H2O, 0.01 g H3BO3, 0.12 g MnSO4 * H2O, 0.12 g CuCl2 * H2O를 포함함)을 포함하였다. 중성 pH는 pH 7로 조정하였으며, 배지는 여과-살균하였다.
기하급수적으로 성장하는 배양물의 OD(600nm)가 0.6에 도달하였을 때, 1 mM IPTG를 첨가하고, 배양물을 20℃에서 14시간 동안 인큐베이션한 다음, 원심분리 (13000 x g, 10 min)에 의해 세포를 수집하였다. 상층액을 폐기한 후, 세포 펠렛을 -20℃에 보관하였다.
St-Mcr을 정제하기 위해, 발현 배양물의 동결된 세포 펠렛을 파쇄 완충액(breakage buffer) (50 mM Hepes, 300mM NaCl, pH 7.5) 0.5 mL에 재현탁시키고, 4회 연속한 소니케이션에 의해 파쇄하여 오픈되게 하였다 (소니케이션 간격: 20 sec, 파워 출력: 30 %, 소니케이터: Bioblock Scientific, VibraCellTM 72437). 세포 추출물을 4℃, 13000 x g에서 15분 동안 원심분리함으로써 세포 찌꺼기를 제거하고, 투명한 상층액을 유지시켰다. 에스케리키아 콜라이로부터 유래되는 본래의 단백질은 85℃에서의 30분 동안의 열 침전(heat precipitation)과 13000 x g에서의 원심분리에 의해 제거하였다. 단백질 조제물의 순도는 SDS-page 분석으로 분석하였으며, St-Mcr 단백질의 예상된 크기에 상응하는 밴드 하나만을 확인할 수 있었다.
효소적 분석: 말릴-CoA 리덕타제 활성은 각각 분석법 1 또는 분석법 2를 적용하는 반응의 환원 및 산화적 개념에서 분석하였다.
분석법 1 (반응 도식):
말릴-CoA 리아제:
글리옥실레이트 + 아세틸-CoA → 말릴-CoA + 아세테이트
말릴-CoA 리덕타제:
(L)-말릴-CoA + NADPH → (L)-말레이트 세미알데하이드 + 조효소 A + NADP
분석법 2 (반응 도식):
(L)-말레이트 세미알데하이드 + 조효소 A + NADP → (L)-말릴-CoA + NADPH
분석법 1에 따른 반응 혼합물은 50 mM MOPS/KOH (pH 7.5), 10 mM 글리옥실레이트, 4 mM 아세틸-CoA, 5 mM MgCl2, 0.25 mM NADPH (모두 Sigma사 제품), 5 U/mL 말릴-CoA 리아제, 및 적당량의 정제된 말릴-CoA 리덕타제 또는 세포 추출물을 포함하였다. 반응은 글리옥실레이트를 첨가함으로써 개시하였다. 효소적 분석은 37℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 340 nm (εNADPH = 6.22 mM-1 cm-1)에서 NADPH의 특징적인 흡광도를 분석하였다.
분석법 2에 따른 반응 혼합물은 200 mM HEPES (pH 9), 5 mM MgCl2, 1 mM NADP, 0.5 mM 조효소 A (모두 Sigma사 제품), 및 적당량의 정제된 말릴-CoA 리덕타제를 포함하였다. 반응은 5 mM (L)-말레이트 세미알데하이드를 첨가함으로써 개시하였다. 효소적 분석은 37℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 340 nm (εNADPH = 6.22 mM-1 cm-1)에서 NADPH의 특징적인 흡광도를 분석하였다. 불안정한 말레이트 세미알데하이드는 안정한 말레이트 세미알데하이드 유도체 2-[(4S)-2,2-다이메틸-5-옥소-1,3-다이옥솔란-4-일]아세트알데하이드(DMODA) (Activation®에 의해 제공됨)의 탈보호에 의해, 효소적 시험 전에 새로 제조하였다. 말레이트 세미알데하이드는, 2 M 염산에서 적당량의 DMODA를 용해시키고, 현탁액을 비점으로 단기간 가열한 다음, 가열된 현탁액을 실온에 15분간 방치함으로써 수득하였다. 방출된 아세톤은 회전 증발기(rotary evaporator)에서 35℃ 및 50 mbar에서 증발시켰다. 말레이트 세미알데하이드 용액의 pH는 소듐 바이카르보네이트를 사용해 pH 3.5로 고정시켰다.
표 3 및 4에 열거된 결과는, 술폴로부스 토코다이이(S. tokodaii)의 말로닐-CoA 리덕타제, Mcr, 및 포르피로모나스 깅기발리스(P. gingivalis)의 숙시닐-CoA 리덕타제, SucD에 대한 말릴-CoA 리덕타제 활성을 보여준다.
기질 | 말로닐- CoA | 숙시닐 - CoA | 말릴- CoA | |||
효소 | Vmax [μmol/(min mg)] |
Km [mM] |
Vmax [μmol/(min mg)] |
Km [mM] |
Vmax [μmol/(min mg)] |
Km [mM] |
St - Mcr | 0.67 ±0.15 | nd | 0.98 ±0.17 | 0.2 | 0.24 ±0.045 | nd |
Pg - SucD | nd | nd | 1 | 1 | 0.025 | nd |
기질 | 숙신산 세미알데하이드 | 말레이트 세미알데하이드 | ||
효소 | Vmax [μmol/(min mg)] |
Km [mM] |
Vmax [μmol/(min mg)] |
Km [mM] |
St - Mcr | 1.7 | 1.15 | 0.1 | 0.25 |
Pg - SucD | 4 | nd | 0.007 | nd |
실시예
3:
DHB
데하이드로게나제
활성에 대한 설명
적절한 2,4 DHB 데하이드로게나제를 규명하기 위해, 여러 가지 생물학적 소스 유래의 베타-하이드록시산 데하이드로게나제를, 말레이트 세미알데하이드를 환원시키는 능력에 대해 시험하였다. 시험된 효소들 중에는, 사카로마이세스 세레비지애 유래의 메틸부티르알데하이드 리덕타제, Ypr1 (Ford & Ellis, 2002)(서열 번호14), 포르피로모나스 깅기발리스(P. gingivalis)의 4-하이드록시부티레이트 데하이드로게나제, 4hbdh (서열 번호187), 에스케리키아 콜라이 유래의 알코올 데하이드로게나제, YqhD (서열 번호 185), 및 메탈로스패라 세둘라(Metallosphaera sedula) 유래의 숙신산 세미알데하이드 리덕타제, Ms-Ssr (Kockelkorn& Fuchs, 2009) (서열 번호 16)이 있었다. YPR1, 4hbdh, yqhD, 및 Ms-SSR 유전자를 표 5에 열거된 프라이머를 사용해 증폭시키고, 벡터 pET28 (제한부위 효소는 표 5를 참조)에 클로닝하여, 플라스미드 pET28-Sce-YPR1, pET28-Pgi-4hbdh, pET28-Eco-yqhd 및 pET28-Mse-SSR을 각각 수득하였다. 단백질은 실시예 1에서와 같이 발현시키고 정제하였다.
효소 | 입수 번호 | 프라이머 5'-3' | 제한부위 효소 |
YPR1 | GI:6320576 | TATAATGCTAGCATGCCTGCTACGTTAAAGAA (서열 번호 18) TATAATGAGCTCTCATTGGAAAATTGGGAAGG (서열 번호 18) |
NheI SacI |
YqhD | GI:16130909 | TATAATGAATTCTTAGCGGGCGGCTTCGTATATACGGCGGCTGACA (서열 번호 20) TATCGTGCTAGCATGAACAACTTTAATCTGCACA (서열 번호 21) |
EcoRI
NheI |
4hbdh | GI:188994588 | TATAATGGATCCTTAGTAGAGTCTTCTGTAG (서열 번호 22) TATAATCATATGCAACTTTTCAAACTC (서열 번호 23) |
BamHI
NdeI |
Ms - SSR | GI:146304190 | TATAATGCTAGCATGAAAGCTGCAGTACTTCA (서열 번호 24) TATAATGAATTCTTACGGGATTATGAGACTTC (서열 번호 25) |
NheI EcoRI |
말레이트 세미알데하이드 리덕타제 활성에 대한 시험:
반응 도식:
(L)-
말레이트
세미알데하이드
+
NAD
(P)H → (L)-2,4-
다이하이드록시부티르산
+
NAD
(P)
분석법 혼합물은 200 mM Hepes (pH 7.5), 50 mM KCl, 5 mM MgCl2, 0,24 mM NADH 또는 NADPH, 및 적당량의 정제된 효소 또는 세포 추출물을 포함하였다. 반응은 10 mM (L)-말레이트 세미알데하이드를 첨가함으로써 개시하였다 (말레이트 세미알데하이드는 각 시험 시마다 새로 제조하였으며, 실시예 3을 참조함). 효소적 분석은 30℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 340 nm (εNADPH = 6.22 mM-1 cm-1)에서 NAD(P)H의 특징적인 흡광도를 분석하였다. 그 결과는 표 6에 열거한다.
효소 | 기원 | 보고된 기능 |
말레이트
세미알데하이드
에 대한 활성
(보조인자 NADH ) [μmol/( min * mg _ prot )] |
말레이트
세미알데하이드
에 대한 활성
(보조인자 NADPH ) [μmol/( min * mg _ prot )] |
Ms-SSR (서열 번호 16) |
메탈로스패라 세둘라(M. sedula ) | 숙신산 세미알데하이드 리덕타제 | 4.9 | 4.9 |
YqhD (서열 번호 185) | 에스케리키아 콜라이 | 알코올 데하이드로게나제 | nd | 1.2 |
4hbdh (서열 번호 187) | 포르피로모나스 깅기발리스 (P. gingivali s) | 4-하이드록시부티레이트 데하이드로게나제 | 33 | nd |
YPR1 (서열 번호 14) |
사카로마이세스 세레비지애(S. cerevisiae) | 메틸부티르알데하이드 리덕타제 | nd | 0.19 |
메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 데하이드로게나제 및 사카로마이세스 세레비지애(S. cerevisiae) 유래의 메틸부티르알데하이드 리덕타제는 말레이트 세미알데하이드 리덕타제 활성을 가진다. 말레이트 세미알데하이드에 대한 Ms-SSR의 Km은 4 mM이었다.
실시예
4: 개선된 말릴-
CoA
리덕타제
효소의 합리적인 제작
표 7에 열거된 올리고뉴클레오티드 쌍과, 주형으로 pET28-Sto-mcr 플라스미드를 사용하여, 부위 특이적인 돌연변이유발을 수행하였다. 아미노산 서열을 바꾸기 위해, PCR (Phusion 1 U, HF 완충액 20% (v/v), dNTPs 2.5 mM, 정방향 및 역방향 프라이머 각각 1 μM, 주형 플라스미드 200 ng, 물)로 점 돌연변이를 도입하였다. PCR에 의한 플라스미드 제작이 가능한 경우, 제작된 플라스미드는 새로운 제한효소 부위 (침묵 돌연변이로 도입됨)외에도, 돌연변이된 클론의 동정을 용이하게 하는 기능성 돌연변이를 포함하였다. 주형 DNA를 제거하기 위해, PCR 산물을 37℃에서 2 x 2시간 동안 Dpnl로 분해시키고, NEB DH5-α 컴피턴트 에스케리키아 콜라이 세포 (NEB)에 형질변환시켰다. 돌연변이된 플라스미드를 제한효소 부위 분석으로 동정하고, 원하는 돌연변이가 생겼는지를 DNA 시퀀싱으로 확인하였다.
돌연변이 | 프라이머 5'-3' |
Tyr206 | 정방향 CATTCTGCCTTTAGGGGACGGCNNKGACGCCAAAACG (서열 번호 26) 역방향 CGTTTTGGCGTCMNNGCCGTCCCCTAAAGGCAGAATG (서열 번호 27) |
St-Mcr의 유전적 변형의 영향은 실시예 2에 기술된 분석법 3을 이용한 반응의 산화적 면에서 시험하였다. 도 3은, 천연 Tyr206을 다른 아미노산으로 대체한 경우, 천연 기질인 숙신산 세미알데하이드에 대한 활성을 감소시키며, 동시에 말레이트 세미알데하이드에 대한 활성을 증가시키거나 또는 적어도 지속시킴을 보여준다. 따라서, Tyr206을 적절한 아미노산 잔기로 대체하면, DHB 경로의 중간산물에 대한 Mcr의 특이성의 관점에서 선택적인 이점을 제공한다.
따라서, 306 위치에 바람직한 아미노산 잔기로는, 페닐알라닌, 히스티딘, 이소루신, 라이신, 메티오닌, 글리신, 아스파라긴, 프롤린, 아르기닌, 글루타민, 루신, 세린, 트립토판, 및 트레오닌이 있다.
티로신 306이 프롤린 잔기로 대체된 단백질은 서열 번호 202로 표시된다.
실시예
5: 개선된
DHB
데하이드로게나제의
합리적인 제작
표 6에 열거된 올리고뉴클레오티드 쌍과, 주형으로서 pET28-Mse-SSR 플라스미드를 사용하여, 부위 특이적인 돌연변이유발을 수행하였다. 아미노산 서열을 바꾸기 위해, PCR (Phusion 1 U, HF 완충액 20% (v/v), dNTPs 2.5 mM, 정방향 및 역방향 프라이머 각각 1 μM, 주형 플라스미드 200 ng, 물)로 점 돌연변이를 도입하였다. 가능한 경우, PCR로 제작된 플라스미드는 새로운 제한효소 부위 (침묵 돌연변이로 도입됨)외에도, 돌연변이된 클론의 동정을 용이하게 하는 기능성 돌연변이를 포함하였다. 주형 DNA를 제거하기 위해, PCR 산물을 37℃에서 2 x 2시간 동안 Dpnl로 분해시키고, NEB DH5-α 컴피턴트 에스케리키아 콜라이 세포 (NEB)에 형질변환하였다. 돌연변이된 플라스미드를 제한효소 부위 분석으로 동정하고, 원하는 돌연변이가 생겼는지를 DNA 시퀀싱으로 확인하였다. 표 8은 돌연변이체의 카이네틱 파라미터를 요약한 것이다. 결과에 따르면, 이중 돌연변이체 Ms-SSR H39R N43H (서열 번호 38)의, 말레이트 세미알데하이드에 대한 친화성이, 야생형 효소와 비교해 개선되었다.
돌연변이 | 프라이머 5'-3' | 제한부위 효소 |
H39R | gtcaaggcaaccggtctctgtcgctccgacgtcaatg (서열 번호 28) cattgacgtcggagcgacagagaccggttgccttgac (서열 번호 29) |
NheI |
N43H | ggctctgtcactccgacgtacatgtctttgaggggaaaac (서열 번호 30) gttttcccctcaaagacatgtacgtcggagtgacagagcc (서열 번호 31) |
NheI |
돌연변이체 |
최대 활성
[μmol/( min * mg prot )] |
Km
[ mmol /L] |
야생형 (서열 번호 16) | 4.9 | 4 |
H39R (서열 번호 32) | 1.7 | 1 |
N43H (서열 번호 34) | 4.3 | 5 |
H39R N43H (서열 번호 36) | 4.7 | 1 |
상응하는 핵산 서열은 서열 번호 17, 서열 번호 33, 서열 번호 35 및 서열 번호 37로 표시된다.
돌연변이 H39R 및 N43H를 포함한 메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제의 코딩 서열이, 진옵티마이저® (GeneOptimizer®) 소프트웨어를 이용해, 에스케리키아 콜라이에서 최대로 발현되도록 최적화하였다. 진아트® 진 신세시스 (GeneArt® Gene Synthesis) (인비트로겐 라이프 테크놀로지 (Invitrogen Life Technologie) 사 제품)로, 합성 유전자를 제조하였다. NheI 및 EcoRI 제한효소 부위를 개시 코돈의 상류과, 정지 코돈의 하류 각각에 도입하여, pET28a+ (노바겐 사 제품)에 직접 클로닝하였다.
제조되는 pET28-Mse-DHB-Dh-H39R_N43H-opt 플라스미드를 분리하고, 올바른 서열 (서열 번호 38)을 가진 전장 메탈로스패라 세둘라 SSR H39R N43H 유전자를 포함하는지를 DNA 시퀀싱으로 확인하였다.
실시예
6: 합성 말릴-
CoA
경로에 의해
DHB
의 시험관 내 제조에 대한 실험
효소 말릴-CoA 리아제 (Me-Mcl), 말릴-CoA 리덕타제 (St-Mcr 또는 Pg-SucD), 및 DHB 데하이드로게나제 (Ms-SSA-red H39N N43H)를 실시예 1, 2 및 3에 기술된 바와 같이 발현시키고 정제하였다.
말릴-CoA 리아제, 말릴-CoA 리덕타제, 및 DHB 데하이드로게나제를 포함하는 경로에 의한 DHB의 제조는 2 mM 글리옥실레이트를, 50 mM Hepes (pH 7.5), 2 mM 아세틸-CoA, 2 mM NADPH, 100 ㎍/mL DHB 데하이드로게나제, 150 ㎍/mL 말릴-CoA 리아제, 및 100 ㎍/mL 말릴-CoA 리덕타제 (St-Mcr (반응 1), 또는 Pg-SucD (반응 2)임)을 포함하는 반응 혼합물에 첨가함으로써 시험관 내에서 설명되었다.
대조군 반응물은 모든 성분들을 포함하였지만, DHB 데하이드로게나제 (대조군 1) 또는 말릴-CoA 리덕타제 (대조군 2)를 포함하지 않았다. 37℃에서 120분 동안 인큐베이션한 후, 반응 혼합물 내의 DHB 함량은 기체 크로마토그래피 [GCMS-QP2010 Ultra Shimadzu; FID 검출기 (FID-2010 Plus Shimadzu); 오토샘플러 AOC20s (Shimadzu) ; 스플릿리스 인젝터(splitless injector) AOC20i (Shimadzu) (230℃); 컬럼: Zebron ZB-FFAP, 30 m x 0.25 mm, df 0.25 ㎛; 및 라이너(liner): 테이퍼드 포커스 라이너(Tapered focus Liner) 5 x 95 x 3.4 mm (SGE)]로 분석하였다. 운반 기체는 총 유속이 25 mL/min인 수소였다. 공기-수소 혼합물을 이용해 불꽃 이온화 반응 (유속은 각각 300 mL/분 및 30 mL/분이었음)을 수행하였다. 검출기 온도는 240℃였다. 주입된 샘플 부피는 1 ㎕였다. 온도 프로그램은 하기 표 10에 나타낸다.
경로 효소를 모두 포함하는 반응물에 DHB가 존재한다는 것, 및 경로 효소 3가지 중 단지 2가지만 포함하는 샘플에 DHB가 존재하지 않는 것을 보여주는 크로마토그램은 도 2에 도시되어 있다.
컬럼 온도 [℃] |
고정기 [min] |
구배 [℃/min] |
진행시간 [min] |
90 | 0 | 0 | 0 |
115 | 1.8 | 30 | 2.63 |
170 | 1 | 4 | 17.38 |
230 | 3 | 50 | 21.58 |
실시예
7: 최적화된
DHB
생성 균주의 제작
말릴-
CoA
신타제
, 말릴-
CoA
리덕타제
, 및
DHB
-
데하이드로게나제의
동시 발현을 위한 플라스미드의 제작:
메틸로박테리움 엑스토?스 유래의 말릴-CoA 리아제, Me-mcl의 코딩 서열은, 하이 피델리티 폴리머라제 퓨전(high fidelity polymerase Phusion) (Fermentas), 및 개시 코돈의 SacI 상류에 대한 제한효소 부위 (밑줄 그어져 있음)를 포함하는 정방향 프라이머와 역방향 프라이머 5'-TCACACAGGAAACAGAATTCGAGCTCGGTAATGTCGTTTACCCTGATTCAGCAAGCGACT-3' (서열 번호 39) 및 5'-GGTATATCTCCTTCTTAAAGTTAAACTTATTTGCCGCCCATTGCATCCGCTTTCTG-3' (서열 번호 40)를 사용하여 플라스미드 pET28-Mex-mcl로부터 증폭시켰다. 술폴로부스 토코다이이(S. tokodaii) 유래의 말로닐-CoA 리덕타제, St-mcr의 코딩 서열은, 정지 코돈의 BamHI 하류에 대한 제한효소 부위를 포함하는 정방향 프라이머 및 역방향 프라이머 5'-GTTTAACTTTAAGAAGGAGATATACCATGATTCTGATGCGCCGTACCCTGAAAGCG-3' (서열 번호 41) 및 5'-GGTATATCTCCTTCTTAAAGTTAAACTTACTTCTCGATGTAGCCTTTCTCCACGAG-3' (서열 번호 42)를 사용하여 플라스미드 pET28-Sto-mcr로부터 증폭시켰다. 플라스미드 pET28-Mse-DHB-Dh-H39R_N43H-opt (실시예 5)를 주형으로 사용하여, 정지 코돈의 하류에 BamHI 제한효소 부위 (밑줄 그어져 있음)에 도입한 정방향 프라이머 및 역방향 프라이머 5'-GTTTAACTTTAAGAAGGAGATATACCATGAAAGCAGCAGTTCTGCATACCTATAAAGAACCGCTGAGCAT-3' (서열 번호 43) 및 5'-ATGCCTGCAGGTCGACTCTAGAGGATCCTTACGGAATAATCAGGCTACGAATTGCTTC-3' (서열 번호 44)를 사용하여, 메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 리덕타제 H39R N43H의 최적화된 코딩 서열을 증폭시켰다.
St-mcr 및 메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 리덕타제 H39R N43H에 대한 정방향 프라이머는 rbs 모티프를 포함하였다. 3개의 유전자를 In-Fusion 클로닝 키트 (Clontech)를 사용해 상동성 재조합에 의해 pACT3 발현 벡터에 동시에 클로닝하였다.
생성되는 pACT3-MCL-DHB (서열 번호 45) 플라스미드를 분리하고 DNA 시퀀싱에 의해 올바른 서열을 가지는 것으로 확인하였다.
말릴-
CoA
신타제
, 말릴-
CoA
리덕타제
, 및
DHB
-
데하이드로게나제의
동시 발현을 위한 플라스미드의 제작:
메틸로박테리움 엑스토?스 유래의 말릴-CoA 신테타제의 2가지 단백질 서브유닛인 mtkA (YP_00296285) 및 mtkB (YP_002962852)를 코딩하는 DNA 서열은, GENEius 소프트웨어 (Eurofins)를 사용하여 에스케리키아 콜라이에서의 발현용으로 최적화하였다. 서브유닛의 최적화된 DNA 서열을 메틸로박테리움 엑스토?스 게놈에서 mtkA 및 mtkB 유전자 사이에서 자연적으로 존재하는 DNA 서열에 의해 물리적으로 연결하였다 (CGAACGGGGGAGGAATCACGCC, 서열 번호 46). 생성되는 DNA 단편인 'mtkA 유전자 - 링커 DNA - mtkB 유전자'는,Eurofins MWG OPERON®에 의해 합성한 다음, NheI 및 EcoRI 제한부위 효소를 사용하여 pET28b 발현 벡터에 서브클로닝하였다. 생성되는 DNA 플라스미드 pET28-Mex-mtkAB (서열 번호 47)를 사용하여, 메틸로박테리움 엑스토?스 유래의 말릴-CoA 신테타제를 코딩하는 2가지 코돈 최적화된 유전자인 Me - mtkA 및 Me -mtkB를 하이 피델리티 폴리머라제 퓨전 (Fermentas), 및 개시 코돈의 상류에 SacI용 제한효소 부위 (밑줄 그어져 있음)를 포함하는 정방향 프라이머와 역방향 프라이머 5'-CAGGAAACAGAATTCGAGCTCGGTAATGGATGTGCACGAATATCAGGCGAAAGAACTGCT-3' (서열 번호 48) 및 5'-TACGGCGCATCAGAATCATTACGCCGCACGTGCTAACACATCGGCAAC-3' (서열 번호 49)를 사용해 동시에 증폭시켰다. 술폴로부스 토코다이이(S. tokodaii) 유래의 말로닐-CoA 리덕타제, St - mcr의 코딩 서열은, 정지 코돈의 BamHI 하류에 대한 제한효소 부위를 포함하는 정방향 프라이머 및 역방향 프라이머 5'-GGCGTAATGATTCTGATGCGCCGTACCCTGAAAGCG-3' (서열 번호 50) 및 5'-CTGCTGCTTTCATTACTTCTCGATGTAGCCTTTCTCCACGAG-3' (서열 번호 51)를 사용하여 플라스미드 pET28-Sto-mcr로부터 증폭시켰다. 플라스미드 pET28-Mse-DHB-Dh-H39R_N43H-opt (실시예 5)를 주형으로 사용하여, 정지 코돈의 하류에 BamHI 제한효소 부위 (밑줄 그어져 있음)에 도입한 정방향 프라이머 및 역방향 프라이머 5'-TACATCGAGAAGTAATGAAAGCAGCAGTTCTGCATACCTATAAAGAAC-3' (서열 번호 52) 및 5'-CCTGCAGGTCGACTCTAGAGGATCCTTACGGAATAATCAGGCTACGAATTGCTTCAC-3' (서열 번호 53)를 사용하여, 메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 리덕타제 H39R N43H의 최적화된 코딩 서열을 증폭시켰다.
3개의 유전자를 In-Fusion 클로닝 키트 (Clontech)를 사용해 상동성 재조합에 의해 pEXT20 발현 벡터에 동시에 클로닝하였다.
생성되는 pEXT20-MCS-DHB (서열 번호 54) 플라스미드를 분리하고 DNA 시퀀싱에 의해 올바른 서열을 가지는 것으로 확인하였다.
포스포에놀피루베이트 ( PEP ) 카르복시키나제 , PEP 카르복실라제 , 피루베이트 키나제, 피루베이트 카르복실라제, 이소시트레이트 리아제 효소 및 갈락토스 심포터 퍼미아제의 과발현을 위한 플라스미드의 구축:
주형으로 에스케리키아 콜라이 MG1655 유래의 게놈 DNA와, 각각 정방향 및 역방향 프라이머인 5'TATAATCCCGGGATGCGCGTTAACAATGGTTTGACC3' (서열 번호 56 및 5'TATAATTCTAGATTACAGTTTCGGACCAGCCG3' (서열 번호 57)를 사용하여, pck 코딩 서열을 증폭시켜, 에스케리키아 콜라이의 PEP 카르복시키나아제 코딩 pck 유전자를 가지는 플라스미드 pACT3-pck를 제작하였다. DNA 단편은 XmaI 및 XbaI으로 절단하고, T4 DNA 리가제 (Biolabs)를 사용해 pACT3 발현 벡터 (Dykxhoorn et al ., 1996)의 상응하는 부위에 연결한 다음, 에스케리키아 콜라이 DH5α 세포에 형질변환하였다. 형질변환체는 클로람페니콜 (25 ㎍/mL)을 포함하는 고형 LB 배지 상에서 선별하였다. 생성되는 플라스미드를 분리하고, pck 유전자의 올바른 삽입은 시퀀싱으로 확인하였다. aceA, ppc, galP, 또는 pykA (모두 에스케리키아 콜라이 유래) 또는 락토콕커스 락티스(Lactococcus lactis ) 유래의 pck를 각각 포함하는 플라스미드 pACT3-aceA, pACT3-ppc, pACT3-galP, pACT3-pck 및 pACT3-pyc는 표 11에 열거된 프라이머를 사용해 유사하게 제작하였다.
유전자 | 프라이머 | 링커 | 서열 |
Ec _ pck | Ec _ pck _ clon _ for | XmaI | tataatcccgggatgcgcgttaacaatggtttgacc (서열 번호 57) |
Ec _ pck _ clon _ rev | XbaI | tataattctagattacagtttcggaccagccg (서열 번호 58) |
|
Ec _ ppc | Ec _ ppc _ clon _ for | XmaI | tataatcccgggatgaacgaacaatattcc (서열 번호 59) |
Ec _ ppc _ clon _ rev | XbaI | tataattctagattagccggtattacgcat (서열 번호 60) |
|
Ec _ pykA | Ec _ pykA _ clon _ for | XmaI | tataatcccgggatgtccagaaggcttcgcagaaca (서열 번호 61) |
Ec _ pykA _ clon _ rev | XbaI | tataattctagattactctaccgttaaaatac (서열 번호 62) |
|
Ec _ aceA | Ec _ aceA _ clon _ for | XmaI | tataatcccgggatgaaaacccgtacacaacaaatt (서열 번호 63) |
Ec _ aceA _ clon _ rev | XbaI | tataattctagattagaactgcgattcttcag (서열 번호 64) |
|
Ll _ pycA | Ll _ pycA _ clon _ for | XmaI | tataatcccgggatgaaaaaactactcgtcgccaat (서열 번호 65) |
Ll _ pycA _ clon _ rev | XbaI | tataattctagattaattaatttcgattaaca (서열 번호 66) |
|
Ec _ galP | Ec _ galP _ clon _ for | XmaI | tataatcccgggatgcctgacgctaaaaaacaggggcggt (서열 번호 67) |
Ec _ galP _ clon _ rev | XbaI | tataattctagattaatcgtgagcgcctatttc (서열 번호 68) |
상기 플라스미드의 백본으로부터 lacI 유전자를 제거하고, 숙주 균주에서 lacI을 게놈 결손시키는 것은 상기 플라스미드 구축물로부터 단백질을 발현시킬 수 있는 것으로 이해된다.
탄소 흐름의 재분배가 최적화된,
DHB
제조용 균주의 제작.
DHB 제조를 위한 탄소 흐름 재분배 및 보조인자 공급을 최적화하기 위해, 에스케리키아 콜라이 균주 MG1655에서 유전자 수종을 파괴하였다. Datsenko et al.(Datsenko & Wanner, 2000)에 따라, 람다 레드 리컴비나제(recombinase) 방법을 이용하거나 또는 Miller(Miller, 1992)로부터 채택된 파지 형질도입 방법을 이용해 유전자를 결손시켰다.
람다 레드 리컴비나제 방법을 이용한 유전자 결손의 도입 프로토콜: 하이 피델리티 폴리머라제(polymerase) Phusion™ (핀자임스 사 제품), 및 주형으로 플라스미드 pKD4의 FRT-플랭크된 카나마이신 내성 유전자 (kan)를 사용한 PCR에 의해, 결손 카세트를 제조하였다 (Datsenko & Wanner, 2000). 센스 프라이머는, 각 표적 유전자 (밑줄이 그어져 있음)의 5' 말단에 상응하는 서열과, 뒤이어, pKD4의 FRT-kan-FRT 카세트에 상응하는 20 bp를 포함하였다. 안티-센스 프라이머는, 각 표적 유전자 (밑줄이 그어져 있음)의 3' 말단 영역에 상응하는 서열과, 뒤이어 카세트에 상응하는 20 bp를 포함하였다. 하기 표 12에 프라이머를 기술하였다. 형질변환하기 전에, PCR 산물을 DpnI으로 분해하고, 정제하였다.
에스케리키아 콜라이 MG1655 균주는, 세포를 37℃의 LB 액상 매질에서 OD600 0.6으로 증식시키고, 상기 세포를 100-배 농축시킨 다음, 아이스콜드 10% 글리세롤로 2 회 세정함으로써, 일렉트로-컴피턴트 (electro-competent)로 만들었다. 전기천공 (2.5 kV, 200 Ω, 25 μF, 2 mm 갭 큐벳 (gap cuvettes)에서)에 의해, 세포를 플라스미드 pKD46 (Datsenko & Wanner, 2000)으로 형질변환하였다. 형질변환체를, 30℃에서, 앰피실린 (100 ㎍/mL)이 든 LB 고형 매질에서 선별하였다.
람다 레드 리컴비나제-발현 플라스미드 pKD46을 가진 일렉트로-컴피턴트 에스케리키아 콜라이 균주를 파괴 카세트로 형질변환하였다. 상기 세포를 앰피실린 (100 ㎍/mL)이 첨가된, 30℃, 액상 SOB 매질에서 증식시켰다. 배양물의 OD600이 0.1에 도달했을 때, 10 mM의 아라비노스를 첨가하여, 람다 레드 리컴비나제 시스템을 유도하였다. 원심분리로 세포를 회수하기 전에, 상기 세포를 0.6의 OD600으로 더 증식시키고, 아이스콜드 10% 글리세롤로 2회 세정하고, 전기천공에 의해 파괴 카세트로 형질변환하였다. 30℃, LB 액상 매질에서 밤새 표현형이 발현되도록 한 다음, 상기 세포를 25 ㎍/mL 카나마이신이 첨가된 고형 LB 매질에 평판 배양하였다. 30℃에서 배양한 후, 형질변환체를 선별하였다.
크림슨 택 폴리머라제 (Crimson Taq polymerase) (NEB 사 제품)를 사용한 콜로니 PCR에 의해, 유전자 치환을 확인하였다. 동시적인, 모 절편의 소실과 신규 돌연변이체 특이 절편의 생성을 확인하기 위해, 플랭킹 유전자 좌-특이 (flanking locus-specific) 프라이머 (표 12 참고)로 제1 반응을 수행하였다. FRT-카나마이신 내성 카세트 내에 정렬된 하나의 유전자 좌-특이 프라이머와, 상응하는 프라이머인 k1rev, 또는 k2for (표 12 참고) (센스 유전자 좌 프라이머/k1rev 및 k2for/역방향 유전자 좌 프라이머) 중 하나를 함께 사용해, 2회의 추가적인 반응을 수행하였다.
이어서, FLP 리컴비나제를 가지는 플라스미드 pCP20 (Cherepanov & Wackernagel, 1995)을 사용해 내성 유전자 (FRT-kan-FRT)를 염색체에서 절단하였고, 이로써, FRT 부위가 하나 포함된 스카 영역 (scar region)이 형성되었다. pCP20은 앰피실린 및 CmR 플라스미드로서, 열 유도성 FLP 리컴비나제 합성과 온도-민감성 복제를 나타낸다. 카나마이신 내성 돌연변이체를 pCP20으로 형질변환하고, 30℃에서 앰피실린-내성 형질변환체를 선별하였다. 다음, 형질변환체를 37℃, 고형 LB 매질에서 증식시키고, 항생제 내성이 모두 소실되었는지 테스트하였다. 크림슨 택 폴리머라제와 플랭킹 유전자 좌-특이 프라이머를 사용한 콜로니 PCR에 의해, FRT-카나마이신 카세트의 절단을 분석하였다 (표 12). 전술한 단계의 반복으로, 다중 결손이 이루어졌다.
표 12. 유전자 파괴에 사용되는 프라이머. 표적 유전자에 상동성인 서열은 밑줄그어져 있음.
표 13. 유전자 파괴의 확인에 사용되는 프라이머 쌍
파지 형질도입 방법을 이용하여 유전자 결손을 도입하기 위한 프로토콜: 바람직한 단일 결손을 포함하는 균주를 Keio collection (Baba et al ., 2006)에서 수득하였다. 단일 결손 돌연변이체의 파치 파쇄물은 50 ㎍/mL 카나마이신, 2 g/L 포도당, 및 5 mM CaCl2와 하룻밤 예비배양물 100 ㎕를 포함하는 LB 배지 10 mL을 접종함으로써 제조하였다. 37℃에서 1시간 동안 인큐베이션한 후, 야생형 MG1655 균주 유래의 파지 파쇄물 200 ㎕를 첨가하고, 배양물은 세포 파쇄가 완료될 때까지 2-3시간 더 인큐베이션하였다. 클로로포름 200 ㎕를 첨가한 후, 세포 조제물을 먼저 격렬히 보텍싱(vortexing)한 다음, 4500 x g에서 10분간 원심분리하였다. 깨끗한 파쇄물을 회수하고 4℃에 보관하였다.
수여체 균주(receptor strain)는 37℃, LB 배지에서 밤새 배양함으로써 파지 형질도입용으로 제조하였다. 예비배양물 1.5 mL을 1500 x g에서 10분간 원심분리하였다. 상층액을 폐기하고, 세포 펠렛을 10 mM MgSO4 및 5 mM CaCl2를 포함하는 용액 600 ㎕에 재현탁하였다. 형질도입은, 수여체 균주를 포함하는 용액 100 ㎕를 파쇄물 100 ㎕와 혼합한 다음, 이 혼합물을 30℃에서 30분간 인큐베이션함으로써 수행하였다. 이후, 1 M 소듐 시트레이트 용액 100 ㎕를 첨가한 다음, 격렬히 보텍싱하였다. LB 배지 1 mL을 첨가한 후, 세포 현탁액을 37℃에서 1시간 동안 인큐베이션한 다음, 50 ㎍/mL 카나마이신을 포함하는 LB 한천 접시에 세포를 살포하였다. 항생제의 존재 하에 생장할 수 있는 클론은 표 13에 열거된 프라이머를 사용하여 원하는 결손을 포함하는지 콜로니 PCR로 확인하였다. 각각의 유전자 결손의 도입 후, 항생제 마커는 전술한 바와 같이 그리고 (Cherepanov & Wackernagel, 1995)의 방법에 따라 제거하였다.
말릴-CoA 신테타제, 말릴-CoA 리덕타제, 및 DHB 데하이드로게나제를 공동-발현하는 플라스미드 (pEXT20-MCS-DHB 또는 pACT3-MCS-DHB); 또는 말릴-CoA 리아제, 말릴-CoA 리덕타제, 및 DHB 데하이드로게나제를 공동-발현하는 플라스미드 (pEXT20-MCL-DHB 또는 pACT3-MCL-DHB); 또는 빈 대조군 플라스미드 (pEXT20 또는 pACT3)는 단독으로, 또는 플라스미드 pACT3-aceA, pACT3-ppc, pACT3-galP, pACT3-pck 또는 pACT3-pyc 중 하나와 함께 최적화된 숙주 균주에 형질변환하였다. DHB-경로 효소를 발현하는 플라스미드, 및 보충 경로(anaplerotic) 효소를 발현하는 플라스미드를 둘 다 포함하는 형질변환체는 클로람페니콜 (25 ㎍/mL) 및 카나마이신 (50 ㎍/mL)을 포함하는 고형 LB 배지 상에서 선별하였다. 구축된 균주에 대한 비-배제적인 예는 표 13에 열거되어 있다.
균주 | 관련된 유전형 |
MG1655 | 야생형 |
ECE50 | pEXT20-MCS-DHB |
ECE51 | pACT3-MCS-DHB |
ECE52 | pEXT20-MCL-DHB |
ECE53 | pACT3-MCL-DHB |
ECE54 | △ldhA △adhE △pta-ack △pflB pEXT20-MCS-DHB |
ECE55 | △ldhA △adhE △pta-ack △pflB pACT3-MCS-DHB |
ECE56 | △ldhA △adhE △pta-ack △pflB pACT3-MCS-DHB, pACT3-ppc |
ECE57 | △ldhA △adhE △pta-ack △pflB △poxB pEXT20-MCS-DHB |
ECE58 | △ldhA △adhE △pta-ack △pflB △poxB pACT3-MCS-DHB |
ECE59 | △ldhA △adhE △pta-ack △pflB △poxB pEXT20-MCS-DHB, pACT3-ppc |
ECE60 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA pEXT20-MCS-DHB |
ECE61 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA pACT3-MCS-DHB |
ECE62 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA pEXT20-MCS-DHB, pACT3-ppc |
ECE63 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts pEXT20-MCS-DHB |
ECE64 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA△pts pACT3-MCS-DHB |
ECE65 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA△pts pEXT20-MCS-DHB, pACT3-ppc |
ECE66 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts △frdBC pEXT20-MCS-DHB |
ECE67 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts △frdBC pACT3-MCS-DHB |
ECE68 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts △frdBC pEXT20-MCS-DHB, pACT3-ppc |
ECE69 | △pta △iclR △aceB pACT3-MCL-DHB |
ECE70 | △pta △iclR △aceB |
ECE71 | △pta △iclR △aceB △adhE pACT3-MCL-DHB |
ECE72 | △pta △iclR △aceB △adhE |
ECE73 | △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB pEXT20-MCS-DHB, pACT3- MCL-DHB |
ECE74 | △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △pts pEXT20-MCS-DHB, pACT3- MCL-DHB |
ECE75 | △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △pts △pgi pEXT20-MCS-DHB, pACT3- MCL-DHB |
ECE76 | △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △pgi pEXT20-MCS-DHB, pACT3- MCL-DHB |
ECE77 | △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △ghrAB pEXT20-MCS-DHB, pACT3- MCL-DHB |
ECE78 | |
ECE79 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA aspC pEXT20-MCS-DHB, pACT3-ppc |
ECE80 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △aspC △iclR △aceB pEXT20-MCS-DHB, pACT3-ppc |
ECE81 | △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △aspC △iclR △aceB △ghrAB pEXT20-MCS-DHB, pACT3-ppc |
실시예
8: 합성 말릴-
CoA
경로에 의한
DHB
의
자이모틱
(
zymotic
) 제조에 대한 설명
균주 및 배양 조건: 서열 번호 203으로 표시되는 플라스미드 pACT3-MCL-DHB 유래의 DHB 경로를 발현하는 ECE29 균주 (본 실험에서 야생형 Mcr 효소는 Mcr Tyr206Pro 돌연변이체로 대체하였음)와, 빈 플라스미드 pACT3만을 포함하는 동종(isogenic) 대조군 균주 ECE70으로 실험을 수행하였다. 37℃, 170 rpm으로 운행되는 인포스(Infors) 회전 쉐이커에서 모든 배양을 수행하였다. 글리세롤 스탁 유래의 하룻밤 배양물 (테스트 튜브 내 3 mL 매질)을 접종하였으며, 이를 이용하여 500 mL 쉐이크 플라스크 내 100 mL 증식 배양물의 OD600을 0.05로 적정하였다. 배양 배지의 OD600이 1에 도달했을 때, IPTG를 1 mmol/L의 농도로 첨가하였다. 성장 미네랄 배지의 조성은 실시예 2에 제공되어 있다.
LC - MS / MS 분석에 의한 DHB 농도 측정: DHB는 LC-MS에 의해 정량화하였다: 액체 음이온 교환 크로마토그래피는 자동 용리액(automatic eluent) (KOH) 발생기 시스템 (RFIC, Dionex), 및 샘플을 4℃에 유지시키는 오토샘플러 (AS50, Dionex)를 구비한, Dionex (Sunnyvale, USA)의 ICS-3000 시스템에서 수행하였다. 분석물은 AG11 HC (50 x 2 mm, Dionex) 예비-컬럼에 의해 보호된 IonPac AS11 HC (250 x 2 mm, Dionex) 컬럼 상에서 분리하였다. 컬럼 온도는 25℃로 유지시켰으며, 유속은 0.25 mL/min로 유지시켰고, 분석물은 전술한 KOH 구배를 적용함으로써 용리하였다 (Groussac E, Ortiz M & Francois J (2000) Improved protocols for quantitative determination of metabolites from biological samples using high performance ionic-exchange chromatography with conductimetric and pulsed amperometric detection. 효소. Microb . Technol . 26, 715-723). 주입된 샘플 부피는 15 ㎕였다. 백그라운드를 배제하기 위해, ASRS ultra II (2 mm, 익스터널 워터 모드(external water mode), 75 mA) 음이온 서프레서(anion suppressor)를 사용하였다. 분석물은 ESI mode (스플릿(split)은 1/3였으며, 질소 압력은 90 psi였고, 모세관 전압(capillary voltage)은 3.5 kV였고, 프로브 온도는 450℃였음)에서 진행되는 질량-감수성 검출기(mass-sensitive detector)(MSQ Plus, Thermo)에서 정량화하였다.
결과: 24시간 배양한 후, ECE69 및 ECE70 균주의 상층액은 각각 0.05 mM DHB 및 0 mM DHB를 포함하였으며, 이는 합성 경로를 통해 DHB가 생성되었음을 의미한다.
SEQUENCE LISTING
<110> ADISSEO FRANCE SAS
<120> A method of production of 2,4-dihydroxybutyric acid
<130> BR078701
<150> PCT/IB 2012/001123
<151> 2012-04-26
<160> 203
<170> PatentIn version 3.5
<210> 1
<211> 324
<212> PRT
<213> Methylobacter extorquens
<400> 1
Met Ser Phe Thr Leu Ile Gln Gln Ala Thr Pro Arg Leu His Arg Ser
1 5 10 15
Glu Leu Ala Val Pro Gly Ser Asn Pro Thr Phe Met Glu Lys Ser Ala
20 25 30
Ala Ser Lys Ala Asp Val Ile Phe Leu Asp Leu Glu Asp Ala Val Ala
35 40 45
Pro Asp Asp Lys Glu Gln Ala Arg Lys Asn Ile Ile Gln Ala Leu Asn
50 55 60
Asp Leu Asp Trp Gly Asn Lys Thr Met Met Ile Arg Ile Asn Gly Leu
65 70 75 80
Asp Thr His Tyr Met Tyr Arg Asp Val Val Asp Ile Val Glu Ala Cys
85 90 95
Pro Arg Leu Asp Met Ile Leu Ile Pro Lys Val Gly Val Pro Ala Asp
100 105 110
Val Tyr Ala Ile Asp Val Leu Thr Thr Gln Ile Glu Gln Ala Lys Lys
115 120 125
Arg Glu Lys Lys Ile Gly Phe Glu Val Leu Ile Glu Thr Ala Leu Gly
130 135 140
Met Ala Asn Val Glu Ala Ile Ala Thr Ser Ser Lys Arg Leu Glu Ala
145 150 155 160
Met Ser Phe Gly Val Ala Asp Tyr Ala Ala Ser Thr Arg Ala Arg Ser
165 170 175
Thr Val Ile Gly Gly Val Asn Ala Asp Tyr Ser Val Leu Thr Asp Lys
180 185 190
Asp Glu Ala Gly Asn Arg Gln Thr His Trp Gln Asp Pro Trp Leu Phe
195 200 205
Ala Gln Asn Arg Met Leu Val Ala Cys Arg Ala Tyr Gly Leu Arg Pro
210 215 220
Ile Asp Gly Pro Phe Gly Asp Phe Ser Asp Pro Asp Gly Tyr Thr Ser
225 230 235 240
Ala Ala Arg Arg Cys Ala Ala Leu Gly Phe Glu Gly Lys Trp Ala Ile
245 250 255
His Pro Ser Gln Ile Asp Leu Ala Asn Glu Val Phe Thr Pro Ser Glu
260 265 270
Ala Glu Val Thr Lys Ala Arg Arg Ile Leu Glu Ala Met Glu Glu Ala
275 280 285
Ala Lys Ala Gly Arg Gly Ala Val Ser Leu Asp Gly Arg Leu Ile Asp
290 295 300
Ile Ala Ser Ile Arg Met Ala Glu Ala Leu Ile Gln Lys Ala Asp Ala
305 310 315 320
Met Gly Gly Lys
<210> 2
<211> 975
<212> DNA
<213> Methylobacter extorquens
<400> 2
atgagcttca ccctgatcca gcaggccacc ccgcgcctgc accgctcgga actcgcggtt 60
cccggctcca acccgacctt catggagaag tcggccgcct cgaaggccga cgtgatcttc 120
ctcgacctcg aggacgcggt tgcgcccgac gacaaggagc aggcccgcaa gaacatcatc 180
caggccctca acgacctgga ttggggcaac aagaccatga tgatccgcat caacggtctc 240
gacacccact acatgtaccg cgacgtggtg gacatcgtgg aggcctgccc gcgcctcgac 300
atgatcctga tccccaaggt cggcgtgccg gccgacgtct acgccatcga cgtgctgacg 360
acgcagatcg agcaggccaa gaagcgcgag aagaagatcg gcttcgaggt gctgatcgag 420
accgcgctcg gcatggccaa tgtcgaggcg atcgcgacct cgtctaagcg ccttgaggcg 480
atgtccttcg gtgtcgccga ctacgccgct tccacccgcg cccgctccac cgtgatcggc 540
ggcgtcaacg ccgattacag cgtgctcacc gacaaggacg aggccggcaa ccgccagacc 600
cactggcagg atccgtggct gttcgcccag aaccgcatgc tggtcgcctg ccgcgcctac 660
ggcctgcgcc cgatcgacgg tcccttcggc gacttctccg atccggacgg ctacacctcg 720
gccgctcgcc gctgcgccgc gctcggcttc gagggcaagt gggcgatcca cccctcgcag 780
atcgatctcg ccaacgaggt cttcaccccc tccgaggccg aggtcaccaa ggcccgccgc 840
atcctggaag ccatggaaga ggccgccaag gccggccgcg gcgccgtctc gctcgacggc 900
cgtctcatcg acatcgcctc gatccgcatg gccgaggcgc tgatccagaa ggccgacgcg 960
atgggcggaa agtaa 975
<210> 3
<211> 975
<212> DNA
<213> Methylobacter extorquens
<400> 3
atgtcgttta ccctgattca gcaagcgact ccgcgcttac atcgcagcga acttgcggtt 60
ccgggttcaa atccgacctt tatggagaaa tcagcagcca gcaaggccga tgtcatcttc 120
ttggatctgg aggatgccgt tgcacctgat gacaaagaac aggcgcgtaa gaacatcatt 180
caggcactga acgatctgga ctggggcaac aaaacgatga tgatccgcat taacggtctg 240
gacacccact acatgtatcg ggatgtggtc gacatcgtag aagcatgccc tcgcctggat 300
atgattctca ttcccaaagt cggagtacca gcagacgtgt atgcgattga tgtgctgacg 360
acgcaaatcg aacaggcgaa gaaacgggag aagaaaatcg gattcgaggt gctcattgaa 420
acggctttag gcatggccaa tgttgaagcc atcgccacat cttcgaaacg cttggaagcg 480
atgtcgtttg gtgtggccga ttatgcagca tccactcgtg cccgtagtac cgtgattggt 540
ggtgtgaatg cggattactc cgttctcact gacaaagatg aagcagggaa ccgtcaaacc 600
cattggcaag atccgtggct gtttgcgcag aatcgcatgc tggttgcttg ccgtgcttac 660
gggcttcgcc cgattgatgg gccatttggc gacttcagcg atcccgatgg ctataccagt 720
gctgcgcgtc gttgtgcggc gctgggcttt gaaggcaaat gggcgattca cccgagtcag 780
atcgacttag cgaacgaggt gttcacaccg tctgaagctg aagtcaccaa agcgcgccgc 840
attctggagg caatggaaga agcggccaaa gccggtcgtg gcgctgtaag cctggacggt 900
cgcttgattg acatcgccag cattcgcatg gctgaagccc tgatccagaa agcggatgca 960
atgggcggca aataa 975
<210> 4
<211> 348
<212> PRT
<213> Rhodobacter capsulatus
<400> 4
Met Leu Gln Ala Gln Lys Phe Leu Ala Arg Arg Ser Ala Thr Ile Tyr
1 5 10 15
Arg Lys Arg Asn Ala Ser Arg Asn Phe Ile Ala Glu Arg Gln Met Ser
20 25 30
Phe Arg Thr Gln Pro Pro Ala Pro Ala Arg Leu Asn Arg Cys Gln Leu
35 40 45
Phe Gly Pro Gly Ser Arg Pro Ala Ile Phe Glu Lys Met Ala Gln Ser
50 55 60
Ala Ala Asp Val Ile Asn Leu Asp Leu Glu Asp Ser Val Ala Pro Asp
65 70 75 80
Asp Lys Pro Gln Ala Arg Arg Asn Ile Ile Glu Ala Ser His Asn Ile
85 90 95
Asp Trp Gly Asn Lys Tyr Leu Ser Val Arg Ile Asn Gly Leu Asp Thr
100 105 110
Pro Phe Trp Tyr Arg Asp Val Val Glu Leu Leu Glu Asp Gly Ser Glu
115 120 125
Arg Ile Asp Gln Ile Met Ile Pro Lys Val Gly Cys Ala Ala Asp Val
130 135 140
Tyr Ala Val Asp Ala Leu Val Thr Ala Ile Glu Ala Ala Lys Gly Arg
145 150 155 160
Lys Lys Arg Ile Ser Leu Glu Val Ile Ile Glu Ser Ala Ala Gly Ile
165 170 175
Ala His Val Glu Glu Ile Ala Ala Ala Ser Pro Arg Leu Gln Ala Met
180 185 190
Ser Leu Gly Ala Ala Asp Phe Ala Ala Ser Met Gly Met Ala Thr Thr
195 200 205
Gly Ile Gly Gly Thr Gln Glu Asn Tyr Tyr Met Leu His Ala Gly Val
210 215 220
Lys His Trp Ser Asp Pro Trp His Trp Ala Gln Ala Ala Ile Val Ala
225 230 235 240
Ala Cys Arg Thr His Gly Ile Leu Pro Val Asp Gly Pro Phe Gly Asp
245 250 255
Phe Ser Asp Asp Glu Gly Phe Arg Ala Gln Ala Leu Arg Ser Ala Thr
260 265 270
Leu Gly Met Val Gly Lys Trp Ala Ile His Pro Lys Gln Val Ala Leu
275 280 285
Ala Asn Glu Val Phe Thr Pro Ser Asp Ala Ala Val Ala Glu Ala Arg
290 295 300
Glu Ile Leu Ala Ala Met Glu Lys Ala Lys Ala Glu Gly Ala Gly Ala
305 310 315 320
Thr Val Tyr Lys Gly Arg Leu Val Asp Ile Ala Ser Ile Arg Gln Ala
325 330 335
Glu Val Ile Val Arg Gln Ala Glu Met Ala Lys Val
340 345
<210> 5
<211> 1047
<212> DNA
<213> Rhodobacter capsulatus
<400> 5
atgctgcagg cgcagaaatt ccttgcacgc cgcagcgcaa caatatatcg caaacgcaac 60
gcatcccgta acttcattgc cgagagacag atgagcttcc gcacccagcc ccctgccccc 120
gcccgcctca accgctgcca gctgttcggg ccgggttcgc gtccggcgat ctttgaaaag 180
atggcgcaat cggcggccga tgtgatcaac ctcgacctgg aagactcggt ggcgcccgac 240
gacaagccgc aggcgcggcg caacatcatc gaggccagcc acaacatcga ctggggcaac 300
aaatatctgt cggtgcggat caacgggctg gatacgccgt tctggtatcg cgacgtggtc 360
gagctgctgg aagacgggtc cgagcgcatc gaccagatca tgatcccgaa agtgggctgc 420
gccgccgacg tttacgccgt cgatgcgctg gtcaccgcga tcgaggccgc caagggccgg 480
aagaaacgca tctcgctgga agtgatcatc gaatcggccg cgggcatcgc ccatgtcgag 540
gaaatcgcgg ccgcctcgcc gcggctgcag gcgatgagcc ttggcgcggc ggatttcgcg 600
gcctccatgg gcatggccac caccggtatc ggcggcacgc aggaaaacta ctacatgctg 660
catgcgggcg tgaaacattg gtcggacccc tggcactggg cgcaggccgc catcgtcgcc 720
gcctgccgca cccatggcat cctgccggtc gatggcccgt ttggcgattt ctccgatgac 780
gagggcttcc gggcccaggc cttgcggtcg gcgacgctcg gcatggtcgg caaatgggcg 840
atccacccga aacaggtcgc tttggcgaac gaggtcttca ccccctctga cgctgcggtt 900
gcagaggcgc gggaaattct ggcggcgatg gaaaaggcca aggccgaggg cgccggcgcc 960
accgtctaca aggggcggct ggtcgatatt gcctcgatcc ggcaggcgga agtgattgtc 1020
agacaggcgg aaatggctaa ggtctga 1047
<210> 6
<211> 1047
<212> DNA
<213> Rhodobacter capsulatus
<400> 6
atgcttcagg cgcagaaatt cctggcacgt cgttctgcga cgatttaccg caaacgtaat 60
gcctcccgga acttcattgc cgagcgccag atgtcgtttc gtacccaacc accggctcct 120
gcccgtctga atcgctgcca gctgtttggc ccaggttctc gtcctgcgat cttcgagaaa 180
atggctcaga gtgcagcgga tgtgatcaat ctggatctgg aggacagcgt cgctccggat 240
gataagcccc aagcccgccg caatatcatt gaagcgtcac acaacattga ctggggtaac 300
aagtatctga gcgttcgtat taacggctta gacacgccgt tctggtatcg ggatgtcgtg 360
gagttgctgg aagatggtag cgaacgtatc gaccagatta tgatcccgaa ggtaggttgc 420
gcagcggacg tatatgccgt ggatgcttta gttaccgcga tcgaagccgc taaaggtcgc 480
aagaaacgca tttccctgga agtgatcatc gaaagtgcag ctgggattgc ccatgtggaa 540
gaaatcgccg ctgcctctcc acgcttgcag gcgatgagct taggagcagc ggactttgcc 600
gcgtcgatgg gtatggccac aaccggcatt ggcgggactc aggagaacta ctatatgctg 660
catgcgggcg tgaaacactg gagtgatccc tggcattggg cacaggccgc aattgtggcg 720
gcatgtcgca cgcatgggat tctgccggtt gatggcccgt ttggcgattt ctccgatgac 780
gaaggctttc gtgcacaggc acttcgttcg gcgactctgg gtatggtggg caaatgggcc 840
attcacccga aacaagtggc tctcgcaaac gaggtattta ccccgtcaga tgcggcggtt 900
gcggaagcgc gcgaaatctt ggccgcaatg gagaaagcca aagcggaagg agcgggagct 960
accgtctaca aaggtcgcct cgtcgatatc gcgagcattc gccaagcaga agttattgtt 1020
cgccaagcgg aaatggccaa agtctaa 1047
<210> 7
<211> 359
<212> PRT
<213> sulfolobus tokodaii
<400> 7
Met Ile Leu Met Arg Arg Thr Leu Lys Ala Ala Ile Leu Gly Ala Thr
1 5 10 15
Gly Leu Val Gly Ile Glu Tyr Val Arg Met Leu Ser Asn His Pro Tyr
20 25 30
Ile Lys Pro Ala Tyr Leu Ala Gly Lys Gly Ser Val Gly Lys Pro Tyr
35 40 45
Gly Glu Val Val Arg Trp Gln Thr Val Gly Gln Val Pro Lys Glu Ile
50 55 60
Ala Asp Met Glu Ile Lys Pro Thr Asp Pro Lys Leu Met Asp Asp Val
65 70 75 80
Asp Ile Ile Phe Ser Pro Leu Pro Gln Gly Ala Ala Gly Pro Val Glu
85 90 95
Glu Gln Phe Ala Lys Glu Gly Phe Pro Val Ile Ser Asn Ser Pro Asp
100 105 110
His Arg Phe Asp Pro Asp Val Pro Leu Leu Val Pro Glu Leu Asn Pro
115 120 125
His Thr Ile Ser Leu Ile Asp Glu Gln Arg Lys Arg Arg Glu Trp Lys
130 135 140
Gly Phe Ile Val Thr Thr Pro Leu Cys Thr Ala Gln Gly Ala Ala Ile
145 150 155 160
Pro Leu Gly Ala Ile Phe Lys Asp Tyr Lys Met Asp Gly Ala Phe Ile
165 170 175
Thr Thr Ile Gln Ser Leu Ser Gly Ala Gly Tyr Pro Gly Ile Pro Ser
180 185 190
Leu Asp Val Val Asp Asn Ile Leu Pro Leu Gly Asp Gly Tyr Asp Ala
195 200 205
Lys Thr Ile Lys Glu Ile Phe Arg Ile Leu Ser Glu Val Lys Arg Asn
210 215 220
Val Asp Glu Pro Lys Leu Glu Asp Val Ser Leu Ala Ala Thr Thr His
225 230 235 240
Arg Ile Ala Thr Ile His Gly His Tyr Glu Val Leu Tyr Val Ser Phe
245 250 255
Lys Glu Glu Thr Ala Ala Glu Lys Val Lys Glu Thr Leu Glu Asn Phe
260 265 270
Arg Gly Glu Pro Gln Asp Leu Lys Leu Pro Thr Ala Pro Ser Lys Pro
275 280 285
Ile Ile Val Met Asn Glu Asp Thr Arg Pro Gln Val Tyr Phe Asp Arg
290 295 300
Trp Ala Gly Asp Ile Pro Gly Met Ser Val Val Val Gly Arg Leu Lys
305 310 315 320
Gln Val Asn Lys Arg Met Ile Arg Leu Val Ser Leu Ile His Asn Thr
325 330 335
Val Arg Gly Ala Ala Gly Gly Gly Ile Leu Ala Ala Glu Leu Leu Val
340 345 350
Glu Lys Gly Tyr Ile Glu Lys
355
<210> 8
<211> 1080
<212> DNA
<213> sulfolobus tokodaii
<400> 8
gtgatactca tgaggagaac attaaaagcc gcaatattag gtgctactgg tttagtagga 60
atcgaatacg taagaatgct atcaaatcat ccttatatta aaccagcata tttagctgga 120
aaaggttcag tgggtaaacc gtatggtgag gtagtaagat ggcaaacagt aggacaagtt 180
cctaaggaaa tagctgatat ggaaataaaa ccaactgatc ctaagttaat ggatgatgta 240
gacataatat tttctccatt acctcaaggt gctgctggcc cagtagaaga acaatttgca 300
aaagaaggat tccctgtgat tagtaattca ccagatcata gatttgatcc tgatgttccc 360
ttattggttc ctgaactaaa tcctcatact attagcttaa ttgatgagca aagaaaaaga 420
agagaatgga aaggatttat agtaactaca ccactatgca cagcccaggg tgcagcaata 480
ccattaggtg ctatatttaa agattataag atggatggag catttataac tactattcaa 540
tcgctatctg gtgccggtta tccaggaata ccatcattag atgtagtaga taatatcttg 600
cctttaggtg atggatacga tgccaagacg ataaaagaga tcttcagaat tttaagcgaa 660
gttaagagaa atgtagatga acctaaatta gaagatgtaa gcttagcagc aacaactcat 720
agaatagcta ctatacatgg tcattatgaa gtactatatg tatcgttcaa agaggaaact 780
gctgctgaaa aagttaagga gactttagaa aactttagag gggaaccaca agatctaaaa 840
ttaccaactg caccttcaaa gccaattatc gttatgaatg aggatacaag acctcaagtc 900
tattttgata gatgggctgg ggatattcca ggaatgagtg tagttgtagg tagattaaag 960
caagtgaata agagaatgat aaggttagta tcattaattc ataacacggt cagaggagcc 1020
gcaggaggag gtatattagc agctgaatta cttgtcgaaa aaggatatat tgaaaagtaa 1080
<210> 9
<211> 1080
<212> DNA
<213> sulfolobus tokodaii
<400> 9
atgattctga tgcgccgtac cctgaaagcg gcaatcttgg gtgccaccgg cttagtcggg 60
attgagtacg tacggatgct gagcaatcat ccgtacatca aacccgccta tctggctggg 120
aaagggtcag ttggcaaacc gtatggcgaa gtagtgcgct ggcagactgt gggccaagtt 180
cccaaagaaa ttgccgatat ggaaatcaag ccgactgatc cgaaactgat ggatgatgtt 240
gacatcatct ttagcccact gcctcaaggt gcggcaggac ccgttgagga acaatttgcg 300
aaagaaggat ttccggtcat ttccaattct ccggatcatc ggtttgatcc ggatgtccca 360
ctcctggtgc cagaactgaa tccgcacacc attagcctta ttgacgaaca gcgtaaacgc 420
cgtgaatgga aaggcttcat cgttacgacg ccgttatgca ccgcacaggg tgctgcgatc 480
ccattgggtg ccatcttcaa ggactacaaa atggatggcg cattcattac gaccattcag 540
tctcttagcg gtgcgggata tccgggtatt ccgtccctgg atgtggtgga taacattctg 600
cctttagggg acggttatga cgccaaaacg atcaaggaaa ttttccgcat cctgagtgaa 660
gtgaaacgca atgtggacga acctaaactg gaggacgttt cactggccgc cacaacccat 720
cgcattgcaa ccattcatgg ccactatgag gtgttgtacg tgtcgtttaa ggaagaaaca 780
gcagcggaga aggtcaaaga aacgctggaa aactttcgcg gtgaacctca ggatctcaaa 840
ctgccgacag cgccctcgaa accgatcatt gtgatgaacg aagatactcg cccacaggta 900
tatttcgatc gttgggcggg cgacattccg ggcatgagtg tcgttgttgg ccgtctgaaa 960
caggtcaaca aacgcatgat tcgtctggta tcgcttatcc acaacaccgt acgtggtgct 1020
gcgggcggtg ggattttagc tgcggagttg ctcgtggaga aaggctacat cgagaagtaa 1080
<210> 10
<211> 451
<212> PRT
<213> Porphyromonas gingivalis
<400> 10
Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu
1 5 10 15
Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala
20 25 30
Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala
35 40 45
Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn
50 55 60
Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser
65 70 75 80
Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala
85 90 95
Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile
100 105 110
Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala
115 120 125
Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala
130 135 140
Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly
145 150 155 160
Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu
165 170 175
Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val
180 185 190
Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly
195 200 205
Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala
210 215 220
Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser
225 230 235 240
Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe
245 250 255
Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly
260 265 270
Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp
275 280 285
Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn
290 295 300
Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly
305 310 315 320
Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala
325 330 335
Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn
340 345 350
Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn
355 360 365
Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile
370 375 380
Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn
385 390 395 400
Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn
405 410 415
Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg
420 425 430
Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile
435 440 445
Trp Glu Leu
450
<210> 11
<211> 1356
<212> DNA
<213> Porphyromonas gingivalis
<400> 11
atggaaatca aagaaatggt gagccttgca cgcaaggctc agaaggagta tcaagctacc 60
cataaccaag aagcagttga caacatttgc cgagctgcag caaaagttat ttatgaaaat 120
gcagctattc tggctcgcga agcagtagac gaaaccggca tgggcgttta cgaacacaaa 180
gtggccaaga atcaaggcaa atccaaaggt gtttggtaca acctccacaa taaaaaatcg 240
attggtatcc tcaatataga cgagcgtacc ggtatgatcg agattgcaaa gcctatcgga 300
gttgtaggag ccgtaacgcc gacgaccaac ccgatcgtta ctccgatgag caatatcatc 360
tttgctctta agacctgcaa tgccatcatt attgcccccc accccagatc caaaaaatgc 420
tctgcacacg cagttcgtct gatcaaagaa gctatcgctc cgttcaacgt accggaaggt 480
atggttcaga tcatcgaaga acccagcatc gagaagacgc aggaactcat gggcgccgta 540
gacgtagtag ttgctacggg tggtatgggc atggtgaagt ctgcatattc ttcaggaaag 600
ccttctttcg gtgttggagc cggtaacgtt caggtgatcg tggatagcaa catcgatttc 660
gaagctgctg cagaaaaaat catcaccggt cgtgctttcg acaacggtat catctgctca 720
ggcgaacaga gcatcatcta caacgaggct gacaaggaag cagttttcac agcattccgc 780
aaccacggtg catatttctg tgacgaagcc gaaggagatc gggctcgtgc agctatcttc 840
gaaaatggag ccatcgcgaa agatgtagta ggtcagagcg ttgccttcat tgccaagaaa 900
gcaaacatca atatccccga gggtacccgt attctcgttg ttgaagctcg cggcgtagga 960
gcagaagacg ttatctgtaa ggaaaagatg tgtcccgtaa tgtgcgccct cagctacaag 1020
cacttcgaag aaggtgtaga aatcgcacgt acgaacctcg ccaacgaagg taacggccac 1080
acctgtgcta tccactccaa caatcaggca cacatcatcc tcgcaggatc agagctgacg 1140
gtatctcgta tcgtagtgaa tgctccgagt gccactacag caggcggtca catccaaaac 1200
ggtcttgccg taaccaatac gctcggatgc ggatcatggg gtaataactc tatctccgag 1260
aacttcactt acaagcacct cctcaacatt tcacgcatcg caccgttgaa ttcaagcatt 1320
cacatccccg atgacaaaga aatctgggaa ctctaa 1356
<210> 12
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 12
tataatgagc tcgtttaact ttaagaagga gatataccat gattctgatg cgccgt 56
<210> 13
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 13
tataatggat ccctcgaatt cttacttctc 30
<210> 14
<211> 312
<212> PRT
<213> Saccharomyces cerevisiae
<400> 14
Met Pro Ala Thr Leu Lys Asn Ser Ser Ala Thr Leu Lys Leu Asn Thr
1 5 10 15
Gly Ala Ser Ile Pro Val Leu Gly Phe Gly Thr Trp Arg Ser Val Asp
20 25 30
Asn Asn Gly Tyr His Ser Val Ile Ala Ala Leu Lys Ala Gly Tyr Arg
35 40 45
His Ile Asp Ala Ala Ala Ile Tyr Leu Asn Glu Glu Glu Val Gly Arg
50 55 60
Ala Ile Lys Asp Ser Gly Val Pro Arg Glu Glu Ile Phe Ile Thr Thr
65 70 75 80
Lys Leu Trp Gly Thr Glu Gln Arg Asp Pro Glu Ala Ala Leu Asn Lys
85 90 95
Ser Leu Lys Arg Leu Gly Leu Asp Tyr Val Asp Leu Tyr Leu Met His
100 105 110
Trp Pro Val Pro Leu Lys Thr Asp Arg Val Thr Asp Gly Asn Val Leu
115 120 125
Cys Ile Pro Thr Leu Glu Asp Gly Thr Val Asp Ile Asp Thr Lys Glu
130 135 140
Trp Asn Phe Ile Lys Thr Trp Glu Leu Met Gln Glu Leu Pro Lys Thr
145 150 155 160
Gly Lys Thr Lys Ala Val Gly Val Ser Asn Phe Ser Ile Asn Asn Ile
165 170 175
Lys Glu Leu Leu Glu Ser Pro Asn Asn Lys Val Val Pro Ala Thr Asn
180 185 190
Gln Ile Glu Ile His Pro Leu Leu Pro Gln Asp Glu Leu Ile Ala Phe
195 200 205
Cys Lys Glu Lys Gly Ile Val Val Glu Ala Tyr Ser Pro Phe Gly Ser
210 215 220
Ala Asn Ala Pro Leu Leu Lys Glu Gln Ala Ile Ile Asp Met Ala Lys
225 230 235 240
Lys His Gly Val Glu Pro Ala Gln Leu Ile Ile Ser Trp Ser Ile Gln
245 250 255
Arg Gly Tyr Val Val Leu Ala Lys Ser Val Asn Pro Glu Arg Ile Val
260 265 270
Ser Asn Phe Lys Ile Phe Thr Leu Pro Glu Asp Asp Phe Lys Thr Ile
275 280 285
Ser Asn Leu Ser Lys Val His Gly Thr Lys Arg Val Val Asp Met Lys
290 295 300
Trp Gly Ser Phe Pro Ile Phe Gln
305 310
<210> 15
<211> 939
<212> DNA
<213> Saccharomyces cerevisiae
<400> 15
atgcctgcta cgttaaagaa ttcttctgct acattaaaac taaatactgg tgcctccatt 60
ccagtgttgg gtttcggcac ttggcgttcc gttgacaata acggttacca ttctgtaatt 120
gcagctttga aagctggata cagacacatt gatgctgcgg ctatctattt gaatgaagaa 180
gaagttggca gggctattaa agattccgga gtccctcgtg aggaaatttt tattactact 240
aagctttggg gtacggaaca acgtgatccg gaagctgctc taaacaagtc tttgaaaaga 300
ctaggcttgg attatgttga cctatatctg atgcattggc cagtgccttt gaaaaccgac 360
agagttactg atggtaacgt tctgtgcatt ccaacattag aagatggcac tgttgacatc 420
gatactaagg aatggaattt tatcaagacg tgggagttga tgcaagagtt gccaaagacg 480
ggcaaaacta aagccgttgg tgtctctaat ttttctatta acaacattaa agaattatta 540
gaatctccaa ataacaaggt ggtaccagct actaatcaaa ttgaaattca tccattgcta 600
ccacaagacg aattgattgc cttttgtaag gaaaagggta ttgttgttga agcctactca 660
ccatttggga gtgctaatgc tcctttacta aaagagcaag caattattga tatggctaaa 720
aagcacggcg ttgagccagc acagcttatt atcagttgga gtattcaaag aggctacgtt 780
gttctggcca aatcggttaa tcctgaaaga attgtatcca attttaagat tttcactctg 840
cctgaggatg atttcaagac tattagtaac ctatccaaag tgcatggtac aaagagagtc 900
gttgatatga agtggggatc cttcccaatt ttccaatga 939
<210> 16
<211> 360
<212> PRT
<213> Metallosphaera sedula
<400> 16
Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu
1 5 10 15
Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val
20 25 30
Lys Ala Thr Gly Leu Cys His Ser Asp Val Asn Val Phe Glu Gly Lys
35 40 45
Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile
50 55 60
Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg
65 70 75 80
Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val
85 90 95
Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys
100 105 110
Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu
115 120 125
Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly
130 135 140
Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val
145 150 155 160
Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser
165 170 175
Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly
180 185 190
Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg
195 200 205
Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu
210 215 220
Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys
225 230 235 240
Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala
245 250 255
Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile
260 265 270
Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile
275 280 285
Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly
290 295 300
Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu
305 310 315 320
Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe
325 330 335
Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu
340 345 350
Ala Ile Arg Ser Leu Ile Ile Pro
355 360
<210> 17
<211> 1083
<212> DNA
<213> Metallosphaera sedula
<400> 17
atgaaagctg cagtacttca tacgtataag gaaccgctgt ccattgagga cgtgaatatc 60
tcccaaccta aggctgggga agtcaagatc aaggtcaagg caaccgggct ctgtcactcc 120
gacgtcaatg tctttgaggg gaaaacccca gttcctcccc cagtggttgc tggacacgaa 180
atatcaggga ttgtggagga agtgggacct ggggtgacca gggttaaacc aggtgatagg 240
gtgatttcag cgtttattca cccctgtggt aaatgcggta actgcgttgc aggaaaggag 300
aatctgtgtg agaccttctc ccaggtcaga ctcaagggag taatgccaga tggaacgtca 360
aggctgtcaa aggacggaaa ggagataagg actttccttg gaggcggttt cgcggagtac 420
gccattgtgg gagagaacgc gctaaccagg gttccagagg acatggacct agagaaggta 480
gctgtcctag gttgtgctgg gttaacaggg tacggtgcca tatcatcatc caagattgag 540
cctggagaca ctgtggccgt gataggcgta ggaggagtgg gtttgtccac aatacaactc 600
ctaagggcct cgggtgccgg gaggataatc gccgtgggaa cgaaaaagtg gaaacttgac 660
agggccatgg agctaggtgc aactgacgtg gtaaactcga aggagataga tcccgtcaaa 720
gcaataaagg agatcacggg tggagggcca caggtggtga tagaggctgg aggaaatgag 780
gatacgattc atatggcgct ggattcagtt agaattggag gaaaggtggt tctggtaggg 840
ttacctccag caacggccat gatacccatc agggtagcgt caatagttag gggaggcata 900
gaggttgtgg ggaattacgg aggaagacct agggttgata tgcccaagct tctcgagcta 960
gtgaggcagg gaagatacga tccgtctagg cttgtgacgg gtagattcag gttggaggaa 1020
ataaatgagg cagtcaaaat gcttgaggaa ggagaggcca taagaagtct cataatcccg 1080
taa 1083
<210> 18
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 18
tataatgcta gcatgcctgc tacgttaaag aa 32
<210> 19
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 19
tataatgagc tctcattgga aaattgggaa gg 32
<210> 20
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 20
tataatgaat tcttagcggg cggcttcgta tatacggcgg ctgaca 46
<210> 21
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 21
tatcgtgcta gcatgaacaa ctttaatctg caca 34
<210> 22
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 22
tataatcata tgcaactttt caaactc 27
<210> 23
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 23
tataatggat ccttagtaga gtcttctgta g 31
<210> 24
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 24
tataatgcta gcatgaaagc tgcagtactt ca 32
<210> 25
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 25
tataatgaat tcttacggga ttatgagact tc 32
<210> 26
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<220>
<221> misc_feature
<222> (23)..(24)
<223> n is a, c, g, or t
<400> 26
cattctgcct ttaggggacg gcnnkgacgc caaaacg 37
<210> 27
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<220>
<221> misc_feature
<222> (14)..(15)
<223> n is a, c, g, or t
<400> 27
cgttttggcg tcmnngccgt cccctaaagg cagaatg 37
<210> 28
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 28
gtcaaggcaa ccggtctctg tcgctccgac gtcaatg 37
<210> 29
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 29
cattgacgtc ggagcgacag agaccggttg ccttgac 37
<210> 30
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 30
ggctctgtca ctccgacgta catgtctttg aggggaaaac 40
<210> 31
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 31
gttttcccct caaagacatg tacgtcggag tgacagagcc 40
<210> 32
<211> 360
<212> PRT
<213> Metallosphaera sedula
<400> 32
Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu
1 5 10 15
Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val
20 25 30
Lys Ala Thr Gly Leu Cys Arg Ser Asp Val Asn Val Phe Glu Gly Lys
35 40 45
Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile
50 55 60
Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg
65 70 75 80
Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val
85 90 95
Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys
100 105 110
Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu
115 120 125
Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly
130 135 140
Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val
145 150 155 160
Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser
165 170 175
Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly
180 185 190
Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg
195 200 205
Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu
210 215 220
Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys
225 230 235 240
Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala
245 250 255
Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile
260 265 270
Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile
275 280 285
Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly
290 295 300
Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu
305 310 315 320
Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe
325 330 335
Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu
340 345 350
Ala Ile Arg Ser Leu Ile Ile Pro
355 360
<210> 33
<211> 1083
<212> DNA
<213> Metallosphaera sedula
<400> 33
atgaaagctg cagtacttca tacgtataag gaaccgctgt ccattgagga cgtgaatatc 60
tcccaaccta aggctgggga agtcaagatc aaggtcaagg caaccggtct ctgtcgctcc 120
gacgtcaatg tctttgaggg gaaaacccca gttcctcccc cagtggttgc tggacacgaa 180
atatcaggga ttgtggagga agtgggacct ggggtgacca gggttaaacc aggtgatagg 240
gtgatttcag cgtttattca cccctgtggt aaatgcggta actgcgttgc aggaaaggag 300
aatctgtgtg agaccttctc ccaggtcaga ctcaagggag taatgccaga tggaacgtca 360
aggctgtcaa aggacggaaa ggagataagg actttccttg gaggcggttt cgcggagtac 420
gccattgtgg gagagaacgc gctaaccagg gttccagagg acatggacct agagaaggta 480
gctgtcctag gttgtgctgg gttaacaggg tacggtgcca tatcatcatc caagattgag 540
cctggagaca ctgtggccgt gataggcgta ggaggagtgg gtttgtccac aatacaactc 600
ctaagggcct cgggtgccgg gaggataatc gccgtgggaa cgaaaaagtg gaaacttgac 660
agggccatgg agctaggtgc aactgacgtg gtaaactcga aggagataga tcccgtcaaa 720
gcaataaagg agatcacggg tggagggcca caggtggtga tagaggctgg aggaaatgag 780
gatacgattc atatggcgct ggattcagtt agaattggag gaaaggtggt tctggtaggg 840
ttacctccag caacggccat gatacccatc agggtagcgt caatagttag gggaggcata 900
gaggttgtgg ggaattacgg aggaagacct agggttgata tgcccaagct tctcgagcta 960
gtgaggcagg gaagatacga tccgtctagg cttgtgacgg gtagattcag gttggaggaa 1020
ataaatgagg cagtcaaaat gcttgaggaa ggagaggcca taagaagtct cataatcccg 1080
taa 1083
<210> 34
<211> 360
<212> PRT
<213> Metallosphaera sedula
<400> 34
Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu
1 5 10 15
Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val
20 25 30
Lys Ala Thr Gly Leu Cys His Ser Asp Val His Val Phe Glu Gly Lys
35 40 45
Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile
50 55 60
Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg
65 70 75 80
Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val
85 90 95
Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys
100 105 110
Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu
115 120 125
Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly
130 135 140
Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val
145 150 155 160
Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser
165 170 175
Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly
180 185 190
Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg
195 200 205
Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu
210 215 220
Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys
225 230 235 240
Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala
245 250 255
Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile
260 265 270
Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile
275 280 285
Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly
290 295 300
Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu
305 310 315 320
Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe
325 330 335
Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu
340 345 350
Ala Ile Arg Ser Leu Ile Ile Pro
355 360
<210> 35
<211> 1083
<212> DNA
<213> Metallosphaera sedula
<400> 35
atgaaagctg cagtacttca tacgtataag gaaccgctgt ccattgagga cgtgaatatc 60
tcccaaccta aggctgggga agtcaagatc aaggtcaagg caaccgggct ctgtcactcc 120
gacgtacatg tctttgaggg gaaaacccca gttcctcccc cagtggttgc tggacacgaa 180
atatcaggga ttgtggagga agtgggacct ggggtgacca gggttaaacc aggtgatagg 240
gtgatttcag cgtttattca cccctgtggt aaatgcggta actgcgttgc aggaaaggag 300
aatctgtgtg agaccttctc ccaggtcaga ctcaagggag taatgccaga tggaacgtca 360
aggctgtcaa aggacggaaa ggagataagg actttccttg gaggcggttt cgcggagtac 420
gccattgtgg gagagaacgc gctaaccagg gttccagagg acatggacct agagaaggta 480
gctgtcctag gttgtgctgg gttaacaggg tacggtgcca tatcatcatc caagattgag 540
cctggagaca ctgtggccgt gataggcgta ggaggagtgg gtttgtccac aatacaactc 600
ctaagggcct cgggtgccgg gaggataatc gccgtgggaa cgaaaaagtg gaaacttgac 660
agggccatgg agctaggtgc aactgacgtg gtaaactcga aggagataga tcccgtcaaa 720
gcaataaagg agatcacggg tggagggcca caggtggtga tagaggctgg aggaaatgag 780
gatacgattc atatggcgct ggattcagtt agaattggag gaaaggtggt tctggtaggg 840
ttacctccag caacggccat gatacccatc agggtagcgt caatagttag gggaggcata 900
gaggttgtgg ggaattacgg aggaagacct agggttgata tgcccaagct tctcgagcta 960
gtgaggcagg gaagatacga tccgtctagg cttgtgacgg gtagattcag gttggaggaa 1020
ataaatgagg cagtcaaaat gcttgaggaa ggagaggcca taagaagtct cataatcccg 1080
taa 1083
<210> 36
<211> 360
<212> PRT
<213> Metallosphaera sedula
<400> 36
Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu
1 5 10 15
Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val
20 25 30
Lys Ala Thr Gly Leu Cys Arg Ser Asp Val His Val Phe Glu Gly Lys
35 40 45
Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile
50 55 60
Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg
65 70 75 80
Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val
85 90 95
Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys
100 105 110
Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu
115 120 125
Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly
130 135 140
Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val
145 150 155 160
Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser
165 170 175
Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly
180 185 190
Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg
195 200 205
Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu
210 215 220
Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys
225 230 235 240
Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala
245 250 255
Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile
260 265 270
Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile
275 280 285
Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly
290 295 300
Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu
305 310 315 320
Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe
325 330 335
Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu
340 345 350
Ala Ile Arg Ser Leu Ile Ile Pro
355 360
<210> 37
<211> 1083
<212> DNA
<213> Metallosphaera sedula
<400> 37
atgaaagcag cagttctgca tacctataaa gaaccgctga gcattgaaga tgtgaatatt 60
tcacagccga aagccggtga agtgaaaatc aaagttaaag caaccggtct gtgtcgtagt 120
gatgttcatg tttttgaagg taaaacaccg gttccgcctc cggttgttgc aggtcatgaa 180
attagcggta ttgttgaaga ggttggtccg ggtgttaccc gtgttaaacc gggtgatcgt 240
gttattagcg catttattca tccgtgtggt aaatgcggta attgtgttgc cggtaaagaa 300
aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg ttatgccgga tggcaccagc 360
cgtctgagca aagatggcaa agaaattcgt acctttctgg gtggtggttt tgcagaatat 420
gcaattgttg gtgaaaatgc actgacccgt gttccggaag atatggatct ggaaaaagtt 480
gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa ttagcagcag caaaattgaa 540
cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg gtctgagcac cattcagctg 600
ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca ccaaaaaatg gaaactggat 660
cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta aagaaattga tccggtgaaa 720
gccatcaaag aaatcaccgg tggtggtccg caggttgtta ttgaagccgg tggtaatgaa 780
gataccattc acatggcact ggatagcgtt cgtattggtg gtaaagttgt tctggttggt 840
ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa gcattgttcg tggtggtatt 900
gaagttgttg gtaattatgg tggtcgtccg cgtgttgata tgccgaaact gctggaactg 960
gttcgtcagg gtcgttatga tccgagccgt ctggttaccg gtcgttttcg tctggaagaa 1020
attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa ttcgtagcct gattattccg 1080
taa 1083
<210> 38
<211> 1083
<212> DNA
<213> Metallosphaera sedula
<400> 38
atgaaagcag cagttctgca tacctataaa gaaccgctga gcattgaaga tgtgaatatt 60
tcacagccga aagccggtga agtgaaaatc aaagttaaag caaccggtct gtgtcgtagt 120
gatgttcatg tttttgaagg taaaacaccg gttccgcctc cggttgttgc aggtcatgaa 180
attagcggta ttgttgaaga ggttggtccg ggtgttaccc gtgttaaacc gggtgatcgt 240
gttattagcg catttattca tccgtgtggt aaatgcggta attgtgttgc cggtaaagaa 300
aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg ttatgccgga tggcaccagc 360
cgtctgagca aagatggcaa agaaattcgt acctttctgg gtggtggttt tgcagaatat 420
gcaattgttg gtgaaaatgc actgacccgt gttccggaag atatggatct ggaaaaagtt 480
gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa ttagcagcag caaaattgaa 540
cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg gtctgagcac cattcagctg 600
ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca ccaaaaaatg gaaactggat 660
cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta aagaaattga tccggtgaaa 720
gccatcaaag aaatcaccgg tggtggtccg caggttgtta ttgaagccgg tggtaatgaa 780
gataccattc acatggcact ggatagcgtt cgtattggtg gtaaagttgt tctggttggt 840
ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa gcattgttcg tggtggtatt 900
gaagttgttg gtaattatgg tggtcgtccg cgtgttgata tgccgaaact gctggaactg 960
gttcgtcagg gtcgttatga tccgagccgt ctggttaccg gtcgttttcg tctggaagaa 1020
attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa ttcgtagcct gattattccg 1080
taa 1083
<210> 39
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 39
tcacacagga aacagaattc gagctcggta atgtcgttta ccctgattca gcaagcgact 60
<210> 40
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 40
ggtatatctc cttcttaaag ttaaacttat ttgccgccca ttgcatccgc tttctg 56
<210> 41
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 41
gtttaacttt aagaaggaga tataccatga ttctgatgcg ccgtaccctg aaagcg 56
<210> 42
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 42
ggtatatctc cttcttaaag ttaaacttac ttctcgatgt agcctttctc cacgag 56
<210> 43
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 43
gtttaacttt aagaaggaga tataccatga aagcagcagt tctgcatacc tataaagaac 60
cgctgagcat 70
<210> 44
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 44
atgcctgcag gtcgactcta gaggatcctt acggaataat caggctacga attgcttc 58
<210> 45
<211> 8457
<212> DNA
<213> Artificial Sequence
<220>
<223> pACT-MCL-DHB
<400> 45
ttcgagctcg gtaatgtcgt ttaccctgat tcagcaagcg actccgcgct tacatcgcag 60
cgaacttgcg gttccgggtt caaatccgac ctttatggag aaatcagcag ccagcaaggc 120
cgatgtcatc ttcttggatc tggaggatgc cgttgcacct gatgacaaag aacaggcgcg 180
taagaacatc attcaggcac tgaacgatct ggactggggc aacaaaacga tgatgatccg 240
cattaacggt ctggacaccc actacatgta tcgggatgtg gtcgacatcg tagaagcatg 300
ccctcgcctg gatatgattc tcattcccaa agtcggagta ccagcagacg tgtatgcgat 360
tgatgtgctg acgacgcaaa tcgaacaggc gaagaaacgg gagaagaaaa tcggattcga 420
ggtgctcatt gaaacggctt taggcatggc caatgttgaa gccatcgcca catcttcgaa 480
acgcttggaa gcgatgtcgt ttggtgtggc cgattatgca gcatccactc gtgcccgtag 540
taccgtgatt ggtggtgtga atgcggatta ctccgttctc actgacaaag atgaagcagg 600
gaaccgtcaa acccattggc aagatccgtg gctgtttgcg cagaatcgca tgctggttgc 660
ttgccgtgct tacgggcttc gcccgattga tgggccattt ggcgacttca gcgatcccga 720
tggctatacc agtgctgcgc gtcgttgtgc ggcgctgggc tttgaaggca aatgggcgat 780
tcacccgagt cagatcgact tagcgaacga ggtgttcaca ccgtctgaag ctgaagtcac 840
caaagcgcgc cgcattctgg aggcaatgga agaagcggcc aaagccggtc gtggcgctgt 900
aagcctggac ggtcgcttga ttgacatcgc cagcattcgc atggctgaag ccctgatcca 960
gaaagcggat gcaatgggcg gcaaataagt ttaactttaa gaaggagata taccatgatt 1020
ctgatgcgcc gtaccctgaa agcggcaatc ttgggtgcca ccggcttagt cgggattgag 1080
tacgtacgga tgctgagcaa tcatccgtac atcaaacccg cctatctggc tgggaaaggg 1140
tcagttggca aaccgtatgg cgaagtagtg cgctggcaga ctgtgggcca agttcccaaa 1200
gaaattgccg atatggaaat caagccgact gatccgaaac tgatggatga tgttgacatc 1260
atctttagcc cactgcctca aggtgcggca ggacccgttg aggaacaatt tgcgaaagaa 1320
ggatttccgg tcatttccaa ttctccggat catcggtttg atccggatgt cccactcctg 1380
gtgccagaac tgaatccgca caccattagc cttattgacg aacagcgtaa acgccgtgaa 1440
tggaaaggct tcatcgttac gacgccgtta tgcaccgcac agggtgctgc gatcccattg 1500
ggtgccatct tcaaggacta caaaatggat ggcgcattca ttacgaccat tcagtctctt 1560
agcggtgcgg gatatccggg tattccgtcc ctggatgtgg tggataacat tctgccttta 1620
ggggacggtt atgacgccaa aacgatcaag gaaattttcc gcatcctgag tgaagtgaaa 1680
cgcaatgtgg acgaacctaa actggaggac gtttcactgg ccgccacaac ccatcgcatt 1740
gcaaccattc atggccacta tgaggtgttg tacgtgtcgt ttaaggaaga aacagcagcg 1800
gagaaggtca aagaaacgct ggaaaacttt cgcggtgaac ctcaggatct caaactgccg 1860
acagcgccct cgaaaccgat cattgtgatg aacgaagata ctcgcccaca ggtatatttc 1920
gatcgttggg cgggcgacat tccgggcatg agtgtcgttg ttggccgtct gaaacaggtc 1980
aacaaacgca tgattcgtct ggtatcgctt atccacaaca ccgtacgtgg tgctgcgggc 2040
ggtgggattt tagctgcgga gttgctcgtg gagaaaggct acatcgagaa gtaagtttaa 2100
ctttaagaag gagatatacc atgaaagcag cagttctgca tacctataaa gaaccgctga 2160
gcattgaaga tgtgaatatt tcacagccga aagccggtga agtgaaaatc aaagttaaag 2220
caaccggtct gtgtcgtagt gatgttcatg tttttgaagg taaaacaccg gttccgcctc 2280
cggttgttgc aggtcatgaa attagcggta ttgttgaaga ggttggtccg ggtgttaccc 2340
gtgttaaacc gggtgatcgt gttattagcg catttattca tccgtgtggt aaatgcggta 2400
attgtgttgc cggtaaagaa aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg 2460
ttatgccgga tggcaccagc cgtctgagca aagatggcaa agaaattcgt acctttctgg 2520
gtggtggttt tgcagaatat gcaattgttg gtgaaaatgc actgacccgt gttccggaag 2580
atatggatct ggaaaaagtt gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa 2640
ttagcagcag caaaattgaa cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg 2700
gtctgagcac cattcagctg ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca 2760
ccaaaaaatg gaaactggat cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta 2820
aagaaattga tccggtgaaa gccatcaaag aaatcaccgg tggtggtccg caggttgtta 2880
ttgaagccgg tggtaatgaa gataccattc acatggcact ggatagcgtt cgtattggtg 2940
gtaaagttgt tctggttggt ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa 3000
gcattgttcg tggtggtatt gaagttgttg gtaattatgg tggtcgtccg cgtgttgata 3060
tgccgaaact gctggaactg gttcgtcagg gtcgttatga tccgagccgt ctggttaccg 3120
gtcgttttcg tctggaagaa attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa 3180
ttcgtagcct gattattccg taagatcctc tagagtcgac ctgcaggcat gcaagcttct 3240
gttttggcgg atgagagaag aaattcgtcg cccgccataa actgccaggc atcaaattaa 3300
gcagaaggcc atcctgacgg atggcctttt tgcgtttcta caaactcttc ctgtctagca 3360
ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 3420
tcaaatatgt atccgctcat gctagaaata ttttatctga ttaataagat gatcttcttg 3480
agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac gaaaaaaccg ccttgcaggg 3540
cggtttttcg aaggttctct gagctaccaa ctctttgaac cgaggtaact ggcttggagg 3600
agcgcagtca ccaaaacttg tcctttcagt ttagccttaa ccggcgcatg acttcaagac 3660
taactcctct aaatcaatta ccagtggctg ctgccagtgg tgcttttgca tgtctttccg 3720
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcggactga acggggggtt 3780
cgtgcataca gtccagcttg gagcgaactg cctacccgga actgagtgtc aggcgtggaa 3840
tgagacaaac gcggccataa cagcggaatg acaccggtaa accgaaaggc aggaacagga 3900
gagcgcacga gggagccgcc aggggaaacg cctggtatct ttatagtcct gtcgggtttc 3960
gccaccactg atttgagcgt cagatttcgt gatgcttgtc aggggggcgg agcctatgga 4020
aaaacggctt tgccgcggcc ctctcacttc cctgttaagt atcttcctgg catcttccag 4080
gaaatctccg ccccgttcgt aagccatttc cgctcgccgc agtcgaacga ccgagcgtag 4140
cgagtcagtg agcgaggaag cggaatatat cctgtatcac atattctgct gacgcaccgg 4200
tgcagccttt tttctcctgc cacatgaagc acttcactga caccctcatc agtgccaaca 4260
tagtaagcca gtatacactc cgctagcgct gatgtccggc ggtgcttttg ccgttacgca 4320
ccaccccgtc agtagctgaa caggagggac agctgataga aacagaagcc actggagcac 4380
ctcaaaaaca ccatcataca ctaaatcagt aagttggcag catcacccga cgcactttgc 4440
gccgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc tggtgtccct 4500
gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga tcggcacgta 4560
agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt ttttgagtta 4620
tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg atataccacc 4680
gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc agttgctcaa 4740
tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac cgtaaagaaa 4800
aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat gaatgctcat 4860
ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag tgttcaccct 4920
tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag tgaataccac 4980
gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta cggtgaaaac 5040
ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc caatccctgg 5100
gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt cgcccccgtt 5160
ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag 5220
gttcatcatg ccgtctgtga tggcttccat gtcggcagaa tgcttaatga attacaacag 5280
tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg gtgcccttaa 5340
acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga aattcgaaag 5400
caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt atgtctattg 5460
ctggtttacc ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctg 5520
aggccagttt gctcaggctc tccccgtgga ggtaataatt gacgatatga tcatttattc 5580
tgcctcccag agcctgataa aaacggttag cgcttcgtta atacagatgt aggtgttcca 5640
cagggtagcc agcagcatcc tgcgatgcag atccggaaca taatggtgca gggcgcttgt 5700
ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc tgccggcacc 5760
tgtcctacga gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc 5820
cgcgcccacc ggaaggagct accggacagc ggtgcggact gttgtaactc agaataagaa 5880
atgaggccgc tcatggcgtt gactctcagt catagtatcg tggtatcacc ggttggttcc 5940
actctctgtt gcgggcaact tcagcagcac gtaggggact tccgcgtttc cagactttac 6000
gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 6060
cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 6120
cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 6180
ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 6240
ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 6300
cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 6360
ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 6420
tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 6480
gtccagtgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 6540
ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 6600
aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 6660
cgtagcccag cgcgtcggcc aattcgcgct aacttacatt aattgcgttg cgctcactgc 6720
ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 6780
ggagaggcgg tttgcgtatt gggcgccagg gtggtttttc ttttcaccag tgagacgggc 6840
aacagctgat tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg 6900
gtttgcccca gcaggcgaaa atcctgtttg atggtggttg acggcgggat ataacatgag 6960
ctgtcttcgg tatcgtcgta tcccactacc gagatatccg caccaacgcg cagcccggac 7020
tcggtaatgg cgcgcattgc gcccagcgcc atctgatcgt tggcaaccag catcgcagtg 7080
ggaacgatgc cctcattcag catttgcatg gtttgttgaa aaccggacat ggcactccag 7140
tcgccttccc gttccgctat cggctgaatt tgattgcgag tgagatattt atgccagcca 7200
gccagacgca gacgcgccga gacagaactt aatgggcccg ctaacagcgc gatttgctgg 7260
tgacccaatg cgaccagatg ctccacgccc agtcgcgtac cgtcttcatg ggagaaaata 7320
atactgttga tgggtgtctg gtcagagaca tcaagaaata acgccggaac attagtgcag 7380
gcagcttcca cagcaatggc atcctggtca tccagcggat agttaatgat cagcccactg 7440
acgcgttgcg cgagaagatt gtgcaccgcc gctttacagg cttcgacgcc gcttcgttct 7500
accatcgaca ccaccacgct ggcacccagt tgatcggcgc gagatttaat cgccgcgaca 7560
atttgcgacg gcgcgtgcag ggccagactg gaggtggcaa cgccaatcag caacgactgt 7620
ttgcccgcca gttgttgtgc cacgcggttg ggaatgtaat tcagctccgc catcgccgct 7680
tccacttttt cccgcgtttt cgcagaaacg tggctggcct ggttcaccac gcgggaaacg 7740
gtctgataag agacaccggc atactctgcg acatcgtata acgttactgg tttcacattc 7800
accaccctga attgactctc ttccgggcgc tatcatgcca taccgcgaaa ggttttgcac 7860
cattcgatgg tgtcaacgta aatgcatgcc gcttcgcctt cgcgcgcgaa ttggccgcca 7920
tgccggcgat aatggcctgc ttctcgccga aacgtttggt ggcgggacca gtgacgaagg 7980
cttgagcgag ggcgtgcaag attccgaata ccgcaagcga caggccgatc atcgtcgcgc 8040
tccagcgaaa gcggtcctcg ccgaaaatga cccagagcgc tgccggcacc tgtcctacga 8100
gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc cgcgcccacc 8160
ggaaggagct gactgggttg aaggctctca agggcatcgg cggagcttat cgactgcacg 8220
gtgcaccaat gcttctggcg tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc 8280
gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt 8340
gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac aattaatcat 8400
cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga aacagaa 8457
<210> 46
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> linker mtka mtkb
<400> 46
cgaacggggg aggaatcacg cc 22
<210> 47
<211> 7422
<212> DNA
<213> Artificial Sequence
<220>
<223> pET28-MEX-MTKAB
<400> 47
aattcgagct ccgtcgacaa gcttgcggcc gcactcgagc accaccacca ccaccactga 60
gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg ctgctgccac cgctgagcaa 120
taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt gctgaaagga 180
ggaactatat ccggattggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg 240
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 300
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 360
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 420
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 480
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 540
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 600
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa 660
tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 720
tacattcaaa tatgtatccg ctcatgaatt aattcttaga aaaactcatc gagcatcaaa 780
tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 840
tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 900
tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 960
aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagt 1020
ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 1080
ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 1140
tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 1200
agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 1260
ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 1320
atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 1380
tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 1440
tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 1500
tataaatcag catccatgtt ggaatttaat cgcggcctag agcaagacgt ttcccgttga 1560
atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 1620
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 1680
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 1740
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 1800
ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt 1860
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 1920
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 1980
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 2040
ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 2100
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 2160
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 2220
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 2280
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 2340
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 2400
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 2460
agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatata 2520
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 2580
tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 2640
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 2700
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag ctgcggtaaa 2760
gctcatcagc gtggtcgtga agcgattcac agatgtctgc ctgttcatcc gcgtccagct 2820
cgttgagttt ctccagaagc gttaatgtct ggcttctgat aaagcgggcc atgttaaggg 2880
cggttttttc ctgtttggtc actgatgcct ccgtgtaagg gggatttctg ttcatggggg 2940
taatgatacc gatgaaacga gagaggatgc tcacgatacg ggttactgat gatgaacatg 3000
cccggttact ggaacgttgt gagggtaaac aactggcggt atggatgcgg cgggaccaga 3060
gaaaaatcac tcagggtcaa tgccagcgct tcgttaatac agatgtaggt gttccacagg 3120
gtagccagca gcatcctgcg atgcagatcc ggaacataat ggtgcagggc gctgacttcc 3180
gcgtttccag actttacgaa acacggaaac cgaagaccat tcatgttgtt gctcaggtcg 3240
cagacgtttt gcagcagcag tcgcttcacg ttcgctcgcg tatcggtgat tcattctgct 3300
aaccagtaag gcaaccccgc cagcctagcc gggtcctcaa cgacaggagc acgatcatgc 3360
gcacccgtgg ggccgccatg ccggcgataa tggcctgctt ctcgccgaaa cgtttggtgg 3420
cgggaccagt gacgaaggct tgagcgaggg cgtgcaagat tccgaatacc gcaagcgaca 3480
ggccgatcat cgtcgcgctc cagcgaaagc ggtcctcgcc gaaaatgacc cagagcgctg 3540
ccggcacctg tcctacgagt tgcatgataa agaagacagt cataagtgcg gcgacgatag 3600
tcatgccccg cgcccaccgg aaggagctga ctgggttgaa ggctctcaag ggcatcggtc 3660
gagatcccgg tgcctaatga gtgagctaac ttacattaat tgcgttgcgc tcactgcccg 3720
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 3780
gaggcggttt gcgtattggg cgccagggtg gtttttcttt tcaccagtga gacgggcaac 3840
agctgattgc ccttcaccgc ctggccctga gagagttgca gcaagcggtc cacgctggtt 3900
tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg gcgggatata acatgagctg 3960
tcttcggtat cgtcgtatcc cactaccgag atatccgcac caacgcgcag cccggactcg 4020
gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg caaccagcat cgcagtggga 4080
acgatgccct cattcagcat ttgcatggtt tgttgaaaac cggacatggc actccagtcg 4140
ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga gatatttatg ccagccagcc 4200
agacgcagac gcgccgagac agaacttaat gggcccgcta acagcgcgat ttgctggtga 4260
cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt cttcatggga gaaaataata 4320
ctgttgatgg gtgtctggtc agagacatca agaaataacg ccggaacatt agtgcaggca 4380
gcttccacag caatggcatc ctggtcatcc agcggatagt taatgatcag cccactgacg 4440
cgttgcgcga gaagattgtg caccgccgct ttacaggctt cgacgccgct tcgttctacc 4500
atcgacacca ccacgctggc acccagttga tcggcgcgag atttaatcgc cgcgacaatt 4560
tgcgacggcg cgtgcagggc cagactggag gtggcaacgc caatcagcaa cgactgtttg 4620
cccgccagtt gttgtgccac gcggttggga atgtaattca gctccgccat cgccgcttcc 4680
actttttccc gcgttttcgc agaaacgtgg ctggcctggt tcaccacgcg ggaaacggtc 4740
tgataagaga caccggcata ctctgcgaca tcgtataacg ttactggttt cacattcacc 4800
accctgaatt gactctcttc cgggcgctat catgccatac cgcgaaaggt tttgcgccat 4860
tcgatggtgt ccgggatctc gacgctctcc cttatgcgac tcctgcatta ggaagcagcc 4920
cagtagtagg ttgaggccgt tgagcaccgc cgccgcaagg aatggtgcat gcaaggagat 4980
ggcgcccaac agtcccccgg ccacggggcc tgccaccata cccacgccga aacaagcgct 5040
catgagcccg aagtggcgag cccgatcttc cccatcggtg atgtcggcga tataggcgcc 5100
agcaaccgca cctgtggcgc cggtgatgcc ggccacgatg cgtccggcgt agaggatcga 5160
gatctcgatc ccgcgaaatt aatacgactc actatagggg aattgtgagc ggataacaat 5220
tcccctctag aaataatttt gtttaacttt aagaaggaga tataccatgg gcagcagcca 5280
tcatcatcat catcacagca gcggcctggt gccgcgcggc agccatatgg ctagcatgga 5340
tgtgcacgaa tatcaggcga aagaactgct tgcgtcgttt ggagtcgccg tgcctaaggg 5400
cgccgtggcg ttttcaccgg atcaggcggt ctatgcagcc actgagttag gcggcagctt 5460
ttgggctgtc aaagcgcaga ttcatgccgg tgcacgcggc aaagcgggtg gtattaagtt 5520
gtgccgcacc tacaacgaag ttcgtgatgc tgcccgtgat ctcctgggta aacggctggt 5580
aaccttgcaa accggtccgg agggtaaacc agtccagcgg gtatatgtgg aaacggctga 5640
tccgttcgaa cgcgaactct acttaggcta tgtgctggat cgcaaagcgg aacgtgtgcg 5700
cgttattgcc tcccaacgtg gcggcatgga tatcgaagag attgcggcta aagaaccgga 5760
agcgcttatc caggtggtgg ttgaaccagc agtcggcttg cagcagttcc aagcccgcga 5820
gattgccttt cagctggggc tgaacatcaa acaggttagt gcagcggtta aaaccatcat 5880
gaacgcatat cgcgcattcc gcgattgtga cgggaccatg ctggagatta accccttagt 5940
agtgaccaaa gacgatcgcg tactggcact ggacgcgaaa atgagctttg acgacaatgc 6000
gctctttcgc cgtcgtaaca ttgcggatat gcatgacccg agtcaaggcg atccgcgtga 6060
agcgcaagct gccgagcaca acctgagcta cattggcctg gaaggcgaaa ttgggtgcat 6120
tgtgaatgga gctggtctgg caatggccac gatggacatg atcaaacatg cgggagggga 6180
accggccaat ttcctcgatg taggtggtgg tgcatctcct gatcgcgttg cgactgcctt 6240
ccgtctggtt ctgtccgatc gcaatgtgaa agctattctg gtcaacatct ttgcgggtat 6300
taatcgctgc gattgggtcg cagaaggggt ggtcaaagca gctcgtgagg tgaagatcga 6360
cgttcccctg atcgtacgtc ttgctggcac gaatgtggac gaaggcaaga aaattctggc 6420
cgaatcgggc ttagacttga tcacagccga tacgctgaca gaagcggccc gcaaagcggt 6480
tgaggcatgt catggagcga agcactaacg aacgggggag gaatcacgcc atgtcgatcc 6540
tgattgacga aaagacgcca attctggtgc aaggcattac cggcgataaa gggacgtttc 6600
acgctaagga aatgattgcc tatggcagca atgtggtggg tggagttacc ccaggaaaag 6660
gtgggaaaac tcattgcggc gttcccgtgt tcaacaccgt gaaagaagct gtggaagcga 6720
ctggcgcgac cacctccatt accttcgtag cgccgccttt tgcagcggat gccattatgg 6780
aagccgctga tgccggctta aaactggtct gctccatcac agacggcatt cctgcgcagg 6840
acatgatgcg cgtcaaacgc tacttgcgtc gttatccgaa ggaaaagcgc acgatggtgg 6900
taggcccgaa ttgtgcgggt atcatctcgc cgggcaaaag catgctgggt attatgccgg 6960
ggcacatcta ccttcccggc aaagtcggtg tcattagtcg ctcagggacc cttgggtacg 7020
aagcggctgc gcagatgaaa gaactgggga ttggcatctc gacatccgtc ggaatcggtg 7080
gcgatccgat taacggtagc agctttctgg atcatctggc cctgttcgag caagatccgg 7140
aaaccgaagc cgttctcatg attggcgaaa ttggtggtcc acaggaggca gaagcaagcg 7200
catggatcaa agagaacttc tcaaaaccgg ttatcggttt tgtagccgga ttgactgctc 7260
cgaaaggtcg tcgcatgggt catgcaggcg cgatcatcag tgcgacgggt gactctgccg 7320
ctgagaaagc ggagattatg cggtcttatg gcctcacagt tgcacctgat ccgggtagtt 7380
ttggctctac ggttgccgat gtgttagcac gtgcggcgta ag 7422
<210> 48
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 48
caggaaacag aattcgagct cggtaatgga tgtgcacgaa tatcaggcga aagaactgct 60
<210> 49
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 49
tacggcgcat cagaatcatt acgccgcacg tgctaacaca tcggcaac 48
<210> 50
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 50
ggcgtaatga ttctgatgcg ccgtaccctg aaagcg 36
<210> 51
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 51
ctgctgcttt cattacttct cgatgtagcc tttctccacg ag 42
<210> 52
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 52
tacatcgaga agtaatgaaa gcagcagttc tgcataccta taaagaac 48
<210> 53
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 53
cctgcaggtc gactctagag gatccttacg gaataatcag gctacgaatt gcttcac 57
<210> 54
<211> 9515
<212> DNA
<213> Artificial Sequence
<220>
<223> pETT20-MCS-DHB
<400> 54
ttcgagctcg gtaatggatg tgcacgaata tcaggcgaaa gaactgcttg cgtcgtttgg 60
agtcgccgtg cctaagggcg ccgtggcgtt ttcaccggat caggcggtct atgcagccac 120
tgagttaggc ggcagctttt gggctgtcaa agcgcagatt catgccggtg cacgcggcaa 180
agcgggtggt attaagttgt gccgcaccta caacgaagtt cgtgatgctg cccgtgatct 240
cctgggtaaa cggctggtaa ccttgcaaac cggtccggag ggtaaaccag tccagcgggt 300
atatgtggaa acggctgatc cgttcgaacg cgaactctac ttaggctatg tgctggatcg 360
caaagcggaa cgtgtgcgcg ttattgcctc ccaacgtggc ggcatggata tcgaagagat 420
tgcggctaaa gaaccggaag cgcttatcca ggtggtggtt gaaccagcag tcggcttgca 480
gcagttccaa gcccgcgaga ttgcctttca gctggggctg aacatcaaac aggttagtgc 540
agcggttaaa accatcatga acgcatatcg cgcattccgc gattgtgacg ggaccatgct 600
ggagattaac cccttagtag tgaccaaaga cgatcgcgta ctggcactgg acgcgaaaat 660
gagctttgac gacaatgcgc tctttcgccg tcgtaacatt gcggatatgc atgacccgag 720
tcaaggcgat ccgcgtgaag cgcaagctgc cgagcacaac ctgagctaca ttggcctgga 780
aggcgaaatt gggtgcattg tgaatggagc tggtctggca atggccacga tggacatgat 840
caaacatgcg ggaggggaac cggccaattt cctcgatgta ggtggtggtg catctcctga 900
tcgcgttgcg actgccttcc gtctggttct gtccgatcgc aatgtgaaag ctattctggt 960
caacatcttt gcgggtatta atcgctgcga ttgggtcgca gaaggggtgg tcaaagcagc 1020
tcgtgaggtg aagatcgacg ttcccctgat cgtacgtctt gctggcacga atgtggacga 1080
aggcaagaaa attctggccg aatcgggctt agacttgatc acagccgata cgctgacaga 1140
agcggcccgc aaagcggttg aggcatgtca tggagcgaag cactaacgaa cgggggagga 1200
atcacgccat gtcgatcctg attgacgaaa agacgccaat tctggtgcaa ggcattaccg 1260
gcgataaagg gacgtttcac gctaaggaaa tgattgccta tggcagcaat gtggtgggtg 1320
gagttacccc aggaaaaggt gggaaaactc attgcggcgt tcccgtgttc aacaccgtga 1380
aagaagctgt ggaagcgact ggcgcgacca cctccattac cttcgtagcg ccgccttttg 1440
cagcggatgc cattatggaa gccgctgatg ccggcttaaa actggtctgc tccatcacag 1500
acggcattcc tgcgcaggac atgatgcgcg tcaaacgcta cttgcgtcgt tatccgaagg 1560
aaaagcgcac gatggtggta ggcccgaatt gtgcgggtat catctcgccg ggcaaaagca 1620
tgctgggtat tatgccgggg cacatctacc ttcccggcaa agtcggtgtc attagtcgct 1680
cagggaccct tgggtacgaa gcggctgcgc agatgaaaga actggggatt ggcatctcga 1740
catccgtcgg aatcggtggc gatccgatta acggtagcag ctttctggat catctggccc 1800
tgttcgagca agatccggaa accgaagccg ttctcatgat tggcgaaatt ggtggtccac 1860
aggaggcaga agcaagcgca tggatcaaag agaacttctc aaaaccggtt atcggttttg 1920
tagccggatt gactgctccg aaaggtcgtc gcatgggtca tgcaggcgcg atcatcagtg 1980
cgacgggtga ctctgccgct gagaaagcgg agattatgcg gtcttatggc ctcacagttg 2040
cacctgatcc gggtagtttt ggctctacgg ttgccgatgt gttagcacgt gcggcgtaat 2100
gattctgatg cgccgtaccc tgaaagcggc aatcttgggt gccaccggct tagtcgggat 2160
tgagtacgta cggatgctga gcaatcatcc gtacatcaaa cccgcctatc tggctgggaa 2220
agggtcagtt ggcaaaccgt atggcgaagt agtgcgctgg cagactgtgg gccaagttcc 2280
caaagaaatt gccgatatgg aaatcaagcc gactgatccg aaactgatgg atgatgttga 2340
catcatcttt agcccactgc ctcaaggtgc ggcaggaccc gttgaggaac aatttgcgaa 2400
agaaggattt ccggtcattt ccaattctcc ggatcatcgg tttgatccgg atgtcccact 2460
cctggtgcca gaactgaatc cgcacaccat tagccttatt gacgaacagc gtaaacgccg 2520
tgaatggaaa ggcttcatcg ttacgacgcc gttatgcacc gcacagggtg ctgcgatccc 2580
attgggtgcc atcttcaagg actacaaaat ggatggcgca ttcattacga ccattcagtc 2640
tcttagcggt gcgggatatc cgggtattcc gtccctggat gtggtggata acattctgcc 2700
tttaggggac ggttatgacg ccaaaacgat caaggaaatt ttccgcatcc tgagtgaagt 2760
gaaacgcaat gtggacgaac ctaaactgga ggacgtttca ctggccgcca caacccatcg 2820
cattgcaacc attcatggcc actatgaggt gttgtacgtg tcgtttaagg aagaaacagc 2880
agcggagaag gtcaaagaaa cgctggaaaa ctttcgcggt gaacctcagg atctcaaact 2940
gccgacagcg ccctcgaaac cgatcattgt gatgaacgaa gatactcgcc cacaggtata 3000
tttcgatcgt tgggcgggcg acattccggg catgagtgtc gttgttggcc gtctgaaaca 3060
ggtcaacaaa cgcatgattc gtctggtatc gcttatccac aacaccgtac gtggtgctgc 3120
gggcggtggg attttagctg cggagttgct cgtggagaaa ggctacatcg agaagtaatg 3180
aaagcagcag ttctgcatac ctataaagaa ccgctgagca ttgaagatgt gaatatttca 3240
cagccgaaag ccggtgaagt gaaaatcaaa gttaaagcaa ccggtctgtg tcgtagtgat 3300
gttcatgttt ttgaaggtaa aacaccggtt ccgcctccgg ttgttgcagg tcatgaaatt 3360
agcggtattg ttgaagaggt tggtccgggt gttacccgtg ttaaaccggg tgatcgtgtt 3420
attagcgcat ttattcatcc gtgtggtaaa tgcggtaatt gtgttgccgg taaagaaaat 3480
ctgtgtgaaa cctttagcca ggttcgtctg aaaggtgtta tgccggatgg caccagccgt 3540
ctgagcaaag atggcaaaga aattcgtacc tttctgggtg gtggttttgc agaatatgca 3600
attgttggtg aaaatgcact gacccgtgtt ccggaagata tggatctgga aaaagttgca 3660
gttctgggtt gtgccggtct gaccggttat ggtgcaatta gcagcagcaa aattgaacct 3720
ggtgataccg ttgcagttat tggtgttggt ggtgtgggtc tgagcaccat tcagctgctg 3780
cgtgcaagcg gtgcaggtcg tattattgca gttggcacca aaaaatggaa actggatcgt 3840
gcaatggaac tgggtgcaac cgatgttgtt aacagtaaag aaattgatcc ggtgaaagcc 3900
atcaaagaaa tcaccggtgg tggtccgcag gttgttattg aagccggtgg taatgaagat 3960
accattcaca tggcactgga tagcgttcgt attggtggta aagttgttct ggttggtctg 4020
cctccggcaa ccgcaatgat tccgattcgt gttgcaagca ttgttcgtgg tggtattgaa 4080
gttgttggta attatggtgg tcgtccgcgt gttgatatgc cgaaactgct ggaactggtt 4140
cgtcagggtc gttatgatcc gagccgtctg gttaccggtc gttttcgtct ggaagaaatt 4200
aatgaagccg tcaaaatgct ggaagaaggt gaagcaattc gtagcctgat tattccgtaa 4260
ggatcctcta gagtcgacct gcaggcatgc aagcttctgt tttggcggat gagagaagaa 4320
attcgtcgcc cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat 4380
ggcctttttg cgtttctaca aactcttcct gtctagcagg tggcactttt cggggaaatg 4440
tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatgc 4500
tagaaatatt ttatctgatt aataagatga tcttcttgag atcgttttgg tctgcgcgta 4560
atctcttgct ctgaaaacga aaaaaccgcc ttgcagggcg gtttttcgaa ggttctctga 4620
gctaccaact ctttgaaccg aggtaactgg cttggaggag cgcagtcacc aaaacttgtc 4680
ctttcagttt agccttaacc ggcgcatgac ttcaagacta actcctctaa atcaattacc 4740
agtggctgct gccagtggtg cttttgcatg tctttccggg ttggactcaa gacgatagtt 4800
accggataag gcgcagcggt cggactgaac ggggggttcg tgcatacagt ccagcttgga 4860
gcgaactgcc tacccggaac tgagtgtcag gcgtggaatg agacaaacgc ggccataaca 4920
gcggaatgac accggtaaac cgaaaggcag gaacaggaga gcgcacgagg gagccgccag 4980
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc caccactgat ttgagcgtca 5040
gatttcgtga tgcttgtcag gggggcggag cctatggaaa aacggctttg ccgcggccct 5100
ctcacttccc tgttaagtat cttcctggca tcttccagga aatctccgcc ccgttcgtaa 5160
gccatttccg ctcgccgcag tcgaacgacc gagcgtagcg agtcagtgag cgaggaagcg 5220
gaatatatcc tgtatcacat attctgctga cgcaccggtg cagccttttt tctcctgcca 5280
catgaagcac ttcactgaca ccctcatcag tgccaacata gtaagccagt atacactccg 5340
ctagcgctga tgtccggcgg tgcttttgcc gttacgcacc accccgtcag tagctgaaca 5400
ggagggacag ctgatagaaa cagaagccac tggagcacct caaaaacacc atcatacact 5460
aaatcagtaa gttggcagca tcacccgacg cactttgcgc cgaataaata cctgtgacgg 5520
aagatcactt cgcagaataa ataaatcctg gtgtccctgt tgataccggg aagccctggg 5580
ccaacttttg gcgaaaatga gacgttgatc ggcacgtaag aggttccaac tttcaccata 5640
atgaaataag atcactaccg ggcgtatttt ttgagttatc gagattttca ggagctaagg 5700
aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 5760
gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 5820
agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg 5880
cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga 5940
aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc 6000
aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac 6060
acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt 6120
ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt 6180
taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata 6240
cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtctgtgatg 6300
gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg 6360
gggcgtaatt tttttaaggc agttattggt gcccttaaac gcctggtgct acgcctgaat 6420
aagtgataat aagcggatga atggcagaaa ttcgaaagca aattcgaccc ggtcgtcggt 6480
tcagggcagg gtcgttaaat agccgcttat gtctattgct ggtttaccgg tttattgact 6540
accggaagca gtgtgaccgt gtgcttctca aatgcctgag gccagtttgc tcaggctctc 6600
cccgtggagg taataattga cgatatgatc atttattctg cctcccagag cctgataaaa 6660
acggttagcg cttcgttaat acagatgtag gtgttccaca gggtagccag cagcatcctg 6720
cgatgcagat ccggaacata atggtgcagg gcgcttgttt cggcgtgggt atggtggcag 6780
gccccgtggc cgggggactg ttgggcgctg ccggcacctg tcctacgagt tgcatgataa 6840
agaagacagt cataagtgcg gcgacgatag tcatgccccg cgcccaccgg aaggagctac 6900
cggacagcgg tgcggactgt tgtaactcag aataagaaat gaggccgctc atggcgttga 6960
ctctcagtca tagtatcgtg gtatcaccgg ttggttccac tctctgttgc gggcaacttc 7020
agcagcacgt aggggacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca 7080
ttcatgttgt tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc 7140
gtatcggtga ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca 7200
acgacaggag cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gagatgcgcc 7260
gcgtgcggct gctggagatg gcggacgcga tggatatgtt ctgccaaggg ttggtttgcg 7320
cattcacagt tctccgcaag aattgattgg ctccaattct tggagtggtg aatccgttag 7380
cgaggtgccg ccggcttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 7440
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 7500
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 7560
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 7620
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 7680
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccaa 7740
ttcgcgctaa cttacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 7800
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 7860
gcgccagggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg cccttcaccg 7920
cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc aggcgaaaat 7980
cctgtttgat ggtggttgac ggcgggatat aacatgagct gtcttcggta tcgtcgtatc 8040
ccactaccga gatatccgca ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc 8100
ccagcgccat ctgatcgttg gcaaccagca tcgcagtggg aacgatgccc tcattcagca 8160
tttgcatggt ttgttgaaaa ccggacatgg cactccagtc gccttcccgt tccgctatcg 8220
gctgaatttg attgcgagtg agatatttat gccagccagc cagacgcaga cgcgccgaga 8280
cagaacttaa tgggcccgct aacagcgcga tttgctggtg acccaatgcg accagatgct 8340
ccacgcccag tcgcgtaccg tcttcatggg agaaaataat actgttgatg ggtgtctggt 8400
cagagacatc aagaaataac gccggaacat tagtgcaggc agcttccaca gcaatggcat 8460
cctggtcatc cagcggatag ttaatgatca gcccactgac gcgttgcgcg agaagattgt 8520
gcaccgccgc tttacaggct tcgacgccgc ttcgttctac catcgacacc accacgctgg 8580
cacccagttg atcggcgcga gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg 8640
ccagactgga ggtggcaacg ccaatcagca acgactgttt gcccgccagt tgttgtgcca 8700
cgcggttggg aatgtaattc agctccgcca tcgccgcttc cactttttcc cgcgttttcg 8760
cagaaacgtg gctggcctgg ttcaccacgc gggaaacggt ctgataagag acaccggcat 8820
actctgcgac atcgtataac gttactggtt tcacattcac caccctgaat tgactctctt 8880
ccgggcgcta tcatgccata ccgcgaaagg ttttgcacca ttcgatggtg tcaacgtaaa 8940
tgcatgccgc ttcgccttcg cgcgcgaatt ggccgccatg ccggcgataa tggcctgctt 9000
ctcgccgaaa cgtttggtgg cgggaccagt gacgaaggct tgagcgaggg cgtgcaagat 9060
tccgaatacc gcaagcgaca ggccgatcat cgtcgcgctc cagcgaaagc ggtcctcgcc 9120
gaaaatgacc cagagcgctg ccggcacctg tcctacgagt tgcatgataa agaagacagt 9180
cataagtgcg gcgacgatag tcatgccccg cgcccaccgg aaggagctga ctgggttgaa 9240
ggctctcaag ggcatcggcg gagcttatcg actgcacggt gcaccaatgc ttctggcgtc 9300
aggcagccat cggaagctgt ggtatggctg tgcaggtcgt aaatcactgc ataattcgtg 9360
tcgctcaagg cgcactcccg ttctggataa tgttttttgc gccgacatca taacggttct 9420
ggcaaatatt ctgaaatgag ctgttgacaa ttaatcatcg gctcgtataa tgtgtggaat 9480
tgtgagcgga taacaatttc acacaggaaa cagaa 9515
<210> 55
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 55
tataatcccg ggatgcgcgt taacaatggt ttgacc 36
<210> 56
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 56
tataattcta gattacagtt tcggaccagc cg 32
<210> 57
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 57
tataatcccg ggatgcgcgt taacaatggt ttgacc 36
<210> 58
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 58
tataattcta gattacagtt tcggaccagc cg 32
<210> 59
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 59
tataatcccg ggatgaacga acaatattcc 30
<210> 60
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 60
tataattcta gattagccgg tattacgcat 30
<210> 61
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 61
tataatcccg ggatgtccag aaggcttcgc agaaca 36
<210> 62
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 62
tataattcta gattactcta ccgttaaaat ac 32
<210> 63
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 63
tataatcccg ggatgaaaac ccgtacacaa caaatt 36
<210> 64
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 64
tataattcta gattagaact gcgattcttc ag 32
<210> 65
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 65
tataatcccg ggatgaaaaa actactcgtc gccaat 36
<210> 66
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 66
tataattcta gattaattaa tttcgattaa ca 32
<210> 67
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 67
tataatcccg ggatgcctga cgctaaaaaa caggggcggt 40
<210> 68
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 68
tataattcta gattaatcgt gagcgcctat ttc 33
<210> 69
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 69
gaaggttgcg cctacactaa gcatagttgt tgatgagtgt aggctggagc tgcttc 56
<210> 70
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 70
ttaaaccagt tcgttcgggc aggtttcgcc tttttcatgg gaattagcca tggtcc 56
<210> 71
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 71
atggctgtta ctaatgtcgc tgaacttaac gcactcgtag agcgtgtgta ggctggagct 60
gcttc 65
<210> 72
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 72
ttaagcggat tttttcgctt ttttctcagc tttagccgga gcagccatat gaatatcctc 60
cttag 65
<210> 73
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 73
atgtcgagta agttagtact ggttctgaac tgcggtagtt cttcagtgta ggctggagct 60
gcttc 65
<210> 74
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 74
tcaggcagtc aggcggctcg cgtcttgcgc gataaccagt tcttccatat gaatatcctc 60
cttag 65
<210> 75
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 75
ttactccgta tttgcataaa aaccatgcga gttacgggcc tataagtgta ggctggagct 60
gcttc 65
<210> 76
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 76
atagattgag tgaaggtacg agtaataacg tcctgctgct gttctcatat gaatatcctc 60
cttag 65
<210> 77
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 77
gtgtcccgta ttattatgct gatccctacc ggaaccagcg tcggtgtgta ggctggagct 60
gcttc 65
<210> 78
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 78
ttactgctgc tgtgcagact gaatcgcagt cagcgcgatg gtgtacatat gaatatcctc 60
cttag 65
<210> 79
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 79
atgaaacaaa cggttgcagc ttatatcgcc aaaacactcg aatcggtgta ggctggagct 60
gcttc 65
<210> 80
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 80
ttaccttagc cagtttgttt tcgccagttc gatcacttca tcacccatat gaatatcctc 60
cttag 65
<210> 81
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 81
atgaccatta ctccggcaac tcatgcaatt tcgataaatc ctgccgtgta ggctggagct 60
gcttc 65
<210> 82
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 82
tcagatccgg tctttccaca ccgtctggat attacagaat tcgtgcatat gaatatcctc 60
cttag 65
<210> 83
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 83
atgaaactta acgacagtaa cttattccgc cagcaggcgt tgattgtgta ggctggagct 60
gcttc 65
<210> 84
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 84
ttaaagaccg atgcacatat atttgatttc taagtaatct tcgatcatat gaatatcctc 60
cttag 65
<210> 85
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 85
atggaccaga agctgttaac ggatttccgc tcagaactac tcgatgtgta ggctggagct 60
gcttc 65
<210> 86
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 86
tcaggtgtgt ttaaagctgt tctgctgggc aataccctgc agtttcatat gaatatcctc 60
cttag 65
<210> 87
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 87
atggataaga agcaagtaac ggatttaagg tcggaactac tcgatgtgta ggctggagct 60
gcttc 65
<210> 88
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 88
tcaggtatgt ttaaagctgt tctgttgggc aataccctgc agtttcatat gaatatcctc 60
cttag 65
<210> 89
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 89
atggctacat cagtacagac aggtaaagct aagcagctca cattagtgta ggctggagct 60
gcttc 65
<210> 90
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 90
ttagtgtttc ttgtcattca tcacaatata gtgtggtgaa cgtgccatat gaatatcctc 60
cttag 65
<210> 91
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 91
atggaaccaa aaacaaaaaa acagcgttcg ctttatatcc cttacgtgta ggctggagct 60
gcttc 65
<210> 92
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 92
ttagatggag gtacggcggt agtcgcggta ttcggcttgc cagaacatat gaatatcctc 60
cttag 65
<210> 93
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 93
atggatgacc agttaaaaca aagtgcactt gatttccatg aatttgtgta ggctggagct 60
gcttc 65
<210> 94
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 94
ttacagcggt tgggtttgcg cttctaccac ggccagcgcc accatcatat gaatatcctc 60
cttag 65
<210> 95
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 95
atgaacgaac aatattccgc attgcgtagt aatgtcagta tgctcgtgta ggctggagct 60
gcttc 65
<210> 96
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 96
ttagccggta ttacgcatac ctgccgcaat cccggcaata gtgaccatat gaatatcctc 60
cttag 65
<210> 97
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 97
atgtccagaa ggcttcgcag aacaaaaatc gttaccacgt taggcgtgta ggctggagct 60
gcttc 65
<210> 98
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 98
ttactctacc gttaaaatac gcgtggtatt agtagaaccc acggtcatat gaatatcctc 60
cttag 65
<210> 99
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 99
atgaaaaaga ccaaaattgt ttgcaccatc ggaccgaaaa ccgaagtgta ggctggagct 60
gcttc 65
<210> 100
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 100
ttacaggacg tgaacagatg cggtgttagt agtgccgctc ggtaccatat gaatatcctc 60
cttag 65
<210> 101
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 101
atggaactga cgactcgcac tttacctgcg cggaaacata ttgcggtgta ggctggagct 60
gcttc 65
<210> 102
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 102
ttacttcaga cggtccgcga gataacgctg ataatcgggg atcagcatat gaatatcctc 60
cttag 65
<210> 103
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 103
atggtcgcac ccattcccgc gaaacgcggc agaaaacccg ccgttgtgta ggctggagct 60
gcttc 65
<210> 104
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 104
tcagcgcatt ccaccgtacg ccagcgtcac ttccttcgcc gctttcatat gaatatcctc 60
cttag 65
<210> 105
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 105
atggaaagta aagtagttgt tccggcacaa ggcaagaaga tcaccgtgta ggctggagct 60
gcttc 65
<210> 106
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 106
ttacatgttt tcgatgatcg cgtcaccaaa ctctgaacat ttcagcatat gaatatcctc 60
cttag 65
<210> 107
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 107
atgcagaaca gcgctttgaa agcctggttg gactcttctt acctcgtgta ggctggagct 60
gcttc 65
<210> 108
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 108
ttattcgacg ttcagcgcgt cattaaccag atcttgttgc tgtttcatat gaatatcctc 60
cttag 65
<210> 109
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 109
atgagtagcg tagatattct ggtccctgac ctgcctgaat ccgtagtgta ggctggagct 60
gcttc 65
<210> 110
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 110
ctacacgtcc agcagcagac gcgtcggatc ttccagcaac tctttcatat gaatatcctc 60
cttag 65
<210> 111
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 111
gtgcaaacct ttcaagccga tcttgccatt gtaggcgccg gtggcgtgta ggctggagct 60
gcttc 65
<210> 112
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 112
tcagccattc gccttctcct tcttattggc tgcttccgcc ttatccatat gaatatcctc 60
cttag 65
<210> 113
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 113
atggctgaga tgaaaaacct gaaaattgag gtggtgcgct ataacgtgta ggctggagct 60
gcttc 65
<210> 114
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 114
ttagcgtggt ttcagggtcg cgataagaaa gtctttcgaa ctttccatat gaatatcctc 60
cttag 65
<210> 115
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 115
atgacgacta aacgtaaacc gtatgtacgg ccaatgacgt ccaccgtgta ggctggagct 60
gcttc 65
<210> 116
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 116
ttaccagtac agggcaacaa acaggattac gatggtggca accaccatat gaatatcctc 60
cttag 65
<210> 117
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 117
atgattaatc caaatccaaa gcgttctgac gaaccggtat tctgggtgta ggctggagct 60
gcttc 65
<210> 118
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 118
ttagattgta acgacaccaa tcagcgtgac aactgtcagg atagccatat gaatatcctc 60
cttag 65
<210> 119
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 119
atgatttcag gcattttagc atccccgggt atcgctttcg gtaaagtgta ggctggagct 60
gcttc 65
<210> 120
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 120
ttagcagatt gttttttctt caatgaactt gttaaccagc gtcatcatat gaatatcctc 60
cttag 65
<210> 121
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 121
atgtttaaga atgcatttgc taacctgcaa aaggtcggta aatcggtgta ggctggagct 60
gcttc 65
<210> 122
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 122
ttagtggtta cggatgtact catccatctc ggttttcagg ttatccatat gaatatcctc 60
cttag 65
<210> 123
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 123
gtgaaaccag taacgttata cgatgtcgca gagtatgccg gtgtcgtgta ggctggagct 60
gcttc 65
<210> 124
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 124
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcatcatat gaatatcctc 60
cttag 65
<210> 125
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 125
atgattattt ccgcagccag cgattatcgc gccgcagcgc aacgcgtgta ggctggagct 60
gcttc 65
<210> 126
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 126
ctatgccgca ttccctttcg ccatgggagc cagtgccgca ggcaacatat gaatatcctc 60
cttag 65
<210> 127
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 127
atgaaaaaca tcaatccaac gcagaccgct gcctggcagg cactagtgta ggctggagct 60
gcttc 65
<210> 128
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 128
ttaaccgcgc cacgctttat agcggttaat cagaccattg gtcgacatat gaatatcctc 60
cttag 65
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 129
cggtgccctg aatgaactgc 20
<210> 130
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 130
cagtcatagc cgaatagcct 20
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 131
atacgtgtcc cgagcggtag 20
<210> 132
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 132
tacacatccc gccatcagca 20
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 133
gaagtaaacg ggaaaatcaa 20
<210> 134
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplificatio
<400> 134
agaagtggca taagaaaacg 20
<210> 135
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 135
ccattggctg aaaattacgc 20
<210> 136
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 136
gttccattgc acggatcacg 20
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 137
atgccgtaga agccgccagt 20
<210> 138
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 138
tgttggtgcg cagctcgaag 20
<210> 139
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 139
gcaaatctgg tttcatcaac 20
<210> 140
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 140
tcccttgcac aaaacaaagt 20
<210> 141
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 141
ggatttggtt ctcgcataat 20
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 142
agcattaacg gtagggtcgt 20
<210> 143
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 143
gctgattctc gcgaataaac 20
<210> 144
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 144
aaaaacgttc ttgcgcgtct 20
<210> 145
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 145
tctgtttgtc accaccccgc 20
<210> 146
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 146
aagccagcac ctggaagcag 20
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 147
aagagctgcc gcaggaggat 20
<210> 148
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 148
gccgccctct taagtcaaat 20
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 149
ggattttagc aatattcgct 20
<210> 150
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 150
cctaatagca ggaagaagac 20
<210> 151
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 151
gctgaactgt tgctggaaga 20
<210> 152
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 152
ggcgtgcttt tacaactaca 20
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 153
tagtaaataa cccaaccggc 20
<210> 154
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 154
tcagtgagcg cagtgtttta 20
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 155
attaatggtg agagtttgga 20
<210> 156
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 156
tgcttttttt tattattcgc 20
<210> 157
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 157
gctttataaa agacgacgaa 20
<210> 158
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 158
gtaacgacaa ttccttaagg 20
<210> 159
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 159
tttatatgcc catggtttct 20
<210> 160
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 160
atctgttaga ggcggatgat 20
<210> 161
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 161
ctggaacgtt aaatctttga 20
<210> 162
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 162
ccagtttagt agctttcatt 20
<210> 163
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 163
gatttgttca acattaactc atcgg 25
<210> 164
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 164
tgcgattaac agacaccctt 20
<210> 165
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 165
tctcaggtgc tcacagaaca 20
<210> 166
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 166
tatggaagag gcgctactgc 20
<210> 167
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 167
cgacctgctg cataaacacc 20
<210> 168
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 168
tgaacgctaa ggtgattgca 20
<210> 169
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 169
acgtagacaa gagctcgcaa 20
<210> 170
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 170
catcacgtac gactgcgtcg 20
<210> 171
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 171
tgcaactttg tgctgagca 19
<210> 172
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 172
tatcgcttcc gggcattgtc 20
<210> 173
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 173
aaatcgatct cgtcaaattt cagac 25
<210> 174
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 174
aggaaccaca aatcgccata 20
<210> 175
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 175
gacgtgaaga ttactacgct 20
<210> 176
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 176
agttcaatgc tgaaccacac 20
<210> 177
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 177
tagccgcgac cacggtaaga aggag 25
<210> 178
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 178
cagcgcatca cccggaaaca 20
<210> 179
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 179
atcgtgatca ttaacctgat 20
<210> 180
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 180
ttaccctgat aaattaccgc 20
<210> 181
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 181
gaatctggtg tatatggcga 20
<210> 182
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 182
tcttcgctat tacgccagct 20
<210> 183
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 183
cgtcagcgga tgtatctggt 20
<210> 184
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 184
gcggaatttc tggttcgtaa 20
<210> 185
<211> 387
<212> PRT
<213> Escherichia coli
<400> 185
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 186
<211> 1164
<212> DNA
<213> Escherichia coli
<400> 186
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 187
<211> 371
<212> PRT
<213> Porphyromonas gingivalis
<400> 187
Met Gln Leu Phe Lys Leu Lys Ser Val Thr His His Phe Asp Thr Phe
1 5 10 15
Ala Glu Phe Ala Lys Glu Phe Cys Leu Gly Glu Arg Asp Leu Val Ile
20 25 30
Thr Asn Glu Phe Ile Tyr Glu Pro Tyr Met Lys Ala Cys Gln Leu Pro
35 40 45
Cys His Phe Val Met Gln Glu Lys Tyr Gly Gln Gly Glu Pro Ser Asp
50 55 60
Glu Met Met Asn Asn Ile Leu Ala Asp Ile Arg Asn Ile Gln Phe Asp
65 70 75 80
Arg Val Ile Gly Ile Gly Gly Gly Thr Val Ile Asp Ile Ser Lys Leu
85 90 95
Phe Val Leu Lys Gly Leu Asn Asp Val Leu Asp Ala Phe Asp Arg Lys
100 105 110
Ile Pro Leu Ile Lys Glu Lys Glu Leu Ile Ile Val Pro Thr Thr Cys
115 120 125
Gly Thr Gly Ser Glu Val Thr Asn Ile Ser Ile Ala Glu Ile Lys Ser
130 135 140
Arg His Thr Lys Met Gly Leu Ala Asp Asp Ala Ile Val Ala Asp His
145 150 155 160
Ala Ile Ile Ile Pro Glu Leu Leu Lys Ser Leu Pro Phe His Phe Tyr
165 170 175
Ala Cys Ser Ala Ile Asp Ala Leu Ile His Ala Ile Glu Ser Tyr Val
180 185 190
Ser Pro Lys Ala Ser Pro Tyr Ser Arg Leu Phe Ser Glu Ala Ala Trp
195 200 205
Asp Ile Ile Leu Glu Val Phe Lys Lys Ile Ala Glu His Gly Pro Glu
210 215 220
Tyr Arg Phe Glu Lys Leu Gly Glu Met Ile Met Ala Ser Asn Tyr Ala
225 230 235 240
Gly Ile Ala Phe Gly Asn Ala Gly Val Gly Ala Val His Ala Leu Ser
245 250 255
Tyr Pro Leu Gly Gly Asn Tyr His Val Pro His Gly Glu Ala Asn Tyr
260 265 270
Gln Phe Phe Thr Glu Val Phe Lys Val Tyr Gln Lys Lys Asn Pro Phe
275 280 285
Gly Tyr Ile Val Glu Leu Asn Trp Lys Leu Ser Lys Ile Leu Asn Cys
290 295 300
Gln Pro Glu Tyr Val Tyr Pro Lys Leu Asp Glu Leu Leu Gly Cys Leu
305 310 315 320
Leu Thr Lys Lys Pro Leu His Glu Tyr Gly Met Lys Asp Glu Glu Val
325 330 335
Arg Gly Phe Ala Glu Ser Val Leu Lys Thr Gln Gln Arg Leu Leu Ala
340 345 350
Asn Asn Tyr Val Glu Leu Thr Val Asp Glu Ile Glu Gly Ile Tyr Arg
355 360 365
Arg Leu Tyr
370
<210> 188
<211> 1116
<212> DNA
<213> Porphyromonas gingivalis
<400> 188
atgcaacttt tcaaactcaa gagtgtaaca catcactttg acacttttgc agaatttgcc 60
aaggaattct gtcttggaga acgcgacttg gtaattacca acgagttcat ctatgaaccg 120
tatatgaagg catgccagct cccctgccat tttgttatgc aggagaaata tgggcaaggc 180
gagccttctg acgaaatgat gaataacatc ttggcagaca tccgtaatat ccagttcgac 240
cgcgtaatcg gtatcggagg aggtacggtt attgacatct ctaaactttt cgttctgaaa 300
ggattaaatg atgtactcga tgcattcgac cgcaaaatac ctcttatcaa agagaaagaa 360
ctgatcattg tgcccacaac atgcggaacg ggtagcgagg tgacgaacat ttctatcgca 420
gaaatcaaaa gccgtcacac caaaatggga ttggctgacg atgccattgt tgcagaccat 480
gccatcatca tacctgaact tctgaagagc ttgcctttcc acttctacgc atgcagtgca 540
atcgatgctc ttatccatgc catcgagtca tacgtatctc ctaaagccag tccatattct 600
cgtctgttca gtgaggcggc ttgggacatt atcctggaag tattcaagaa aatcgccgaa 660
cacggccctg aataccgctt cgaaaagctg ggagaaatga tcatggccag caactatgcc 720
ggtatagcct tcggaaatgc aggagtagga gccgtccacg cactatccta cccgttggga 780
ggcaactatc acgtgccgca tggagaagca aactatcagt tcttcacaga ggtattcaaa 840
gtataccaaa agaagaatcc tttcggctat atagtcgaac tcaactggaa gctctccaag 900
atactgaact gccagcccga atacgtatat ccgaagctgg atgaacttct cggatgcctt 960
cttaccaaga aacctttgca cgaatacggc atgaaggacg aagaggtaag aggctttgcg 1020
gaatcagtgc ttaagacaca gcaaagattg ctcgccaaca actacgtaga gcttactgta 1080
gatgagatcg aaggtatcta cagaagactc tactaa 1116
<210> 189
<211> 1220
<212> PRT
<213> Chloroflexus aurantiacus
<400> 189
Met Ser Gly Thr Gly Arg Leu Ala Gly Lys Ile Ala Leu Ile Thr Gly
1 5 10 15
Gly Ala Gly Asn Ile Gly Ser Glu Leu Thr Arg Arg Phe Leu Ala Glu
20 25 30
Gly Ala Thr Val Ile Ile Ser Gly Arg Asn Arg Ala Lys Leu Thr Ala
35 40 45
Leu Ala Glu Arg Met Gln Ala Glu Ala Gly Val Pro Ala Lys Arg Ile
50 55 60
Asp Leu Glu Val Met Asp Gly Ser Asp Pro Val Ala Val Arg Ala Gly
65 70 75 80
Ile Glu Ala Ile Val Ala Arg His Gly Gln Ile Asp Ile Leu Val Asn
85 90 95
Asn Ala Gly Ser Ala Gly Ala Gln Arg Arg Leu Ala Glu Ile Pro Leu
100 105 110
Thr Glu Ala Glu Leu Gly Pro Gly Ala Glu Glu Thr Leu His Ala Ser
115 120 125
Ile Ala Asn Leu Leu Gly Met Gly Trp His Leu Met Arg Ile Ala Ala
130 135 140
Pro His Met Pro Val Gly Ser Ala Val Ile Asn Val Ser Thr Ile Phe
145 150 155 160
Ser Arg Ala Glu Tyr Tyr Gly Arg Ile Pro Tyr Val Thr Pro Lys Ala
165 170 175
Ala Leu Asn Ala Leu Ser Gln Leu Ala Ala Arg Glu Leu Gly Ala Arg
180 185 190
Gly Ile Arg Val Asn Thr Ile Phe Pro Gly Pro Ile Glu Ser Asp Arg
195 200 205
Ile Arg Thr Val Phe Gln Arg Met Asp Gln Leu Lys Gly Arg Pro Glu
210 215 220
Gly Asp Thr Ala His His Phe Leu Asn Thr Met Arg Leu Cys Arg Ala
225 230 235 240
Asn Asp Gln Gly Ala Leu Glu Arg Arg Phe Pro Ser Val Gly Asp Val
245 250 255
Ala Asp Ala Ala Val Phe Leu Ala Ser Ala Glu Ser Ala Ala Leu Ser
260 265 270
Gly Glu Thr Ile Glu Val Thr His Gly Met Glu Leu Pro Ala Cys Ser
275 280 285
Glu Thr Ser Leu Leu Ala Arg Thr Asp Leu Arg Thr Ile Asp Ala Ser
290 295 300
Gly Arg Thr Thr Leu Ile Cys Ala Gly Asp Gln Ile Glu Glu Val Met
305 310 315 320
Ala Leu Thr Gly Met Leu Arg Thr Cys Gly Ser Glu Val Ile Ile Gly
325 330 335
Phe Arg Ser Ala Ala Ala Leu Ala Gln Phe Glu Gln Ala Val Asn Glu
340 345 350
Ser Arg Arg Leu Ala Gly Ala Asp Phe Thr Pro Pro Ile Ala Leu Pro
355 360 365
Leu Asp Pro Arg Asp Pro Ala Thr Ile Asp Ala Val Phe Asp Trp Gly
370 375 380
Ala Gly Glu Asn Thr Gly Gly Ile His Ala Ala Val Ile Leu Pro Ala
385 390 395 400
Thr Ser His Glu Pro Ala Pro Cys Val Ile Glu Val Asp Asp Glu Arg
405 410 415
Val Leu Asn Phe Leu Ala Asp Glu Ile Thr Gly Thr Ile Val Ile Ala
420 425 430
Ser Arg Leu Ala Arg Tyr Trp Gln Ser Gln Arg Leu Thr Pro Gly Ala
435 440 445
Arg Ala Arg Gly Pro Arg Val Ile Phe Leu Ser Asn Gly Ala Asp Gln
450 455 460
Asn Gly Asn Val Tyr Gly Arg Ile Gln Ser Ala Ala Ile Gly Gln Leu
465 470 475 480
Ile Arg Val Trp Arg His Glu Ala Glu Leu Asp Tyr Gln Arg Ala Ser
485 490 495
Ala Ala Gly Asp His Val Leu Pro Pro Val Trp Ala Asn Gln Ile Val
500 505 510
Arg Phe Ala Asn Arg Ser Leu Glu Gly Leu Glu Phe Ala Cys Ala Trp
515 520 525
Thr Ala Gln Leu Leu His Ser Gln Arg His Ile Asn Glu Ile Thr Leu
530 535 540
Asn Ile Pro Ala Asn Ile Ser Ala Thr Thr Gly Ala Arg Ser Ala Ser
545 550 555 560
Val Gly Trp Ala Glu Ser Leu Ile Gly Leu His Leu Gly Lys Val Ala
565 570 575
Leu Ile Thr Gly Gly Ser Ala Gly Ile Gly Gly Gln Ile Gly Arg Leu
580 585 590
Leu Ala Leu Ser Gly Ala Arg Val Met Leu Ala Ala Arg Asp Arg His
595 600 605
Lys Leu Glu Gln Met Gln Ala Met Ile Gln Ser Glu Leu Ala Glu Val
610 615 620
Gly Tyr Thr Asp Val Glu Asp Arg Val His Ile Ala Pro Gly Cys Asp
625 630 635 640
Val Ser Ser Glu Ala Gln Leu Ala Asp Leu Val Glu Arg Thr Leu Ser
645 650 655
Ala Phe Gly Thr Val Asp Tyr Leu Ile Asn Asn Ala Gly Ile Ala Gly
660 665 670
Val Glu Glu Met Val Ile Asp Met Pro Val Glu Gly Trp Arg His Thr
675 680 685
Leu Phe Ala Asn Leu Ile Ser Asn Tyr Ser Leu Met Arg Lys Leu Ala
690 695 700
Pro Leu Met Lys Lys Gln Gly Ser Gly Tyr Ile Leu Asn Val Ser Ser
705 710 715 720
Tyr Phe Gly Gly Glu Lys Asp Ala Ala Ile Pro Tyr Pro Asn Arg Ala
725 730 735
Asp Tyr Ala Val Ser Lys Ala Gly Gln Arg Ala Met Ala Glu Val Phe
740 745 750
Ala Arg Phe Leu Gly Pro Glu Ile Gln Ile Asn Ala Ile Ala Pro Gly
755 760 765
Pro Val Glu Gly Asp Arg Leu Arg Gly Thr Gly Glu Arg Pro Gly Leu
770 775 780
Phe Ala Arg Arg Ala Arg Leu Ile Leu Glu Asn Lys Arg Leu Asn Glu
785 790 795 800
Leu His Ala Ala Leu Ile Ala Ala Ala Arg Thr Asp Glu Arg Ser Met
805 810 815
His Glu Leu Val Glu Leu Leu Leu Pro Asn Asp Val Ala Ala Leu Glu
820 825 830
Gln Asn Pro Ala Ala Pro Thr Ala Leu Arg Glu Leu Ala Arg Arg Phe
835 840 845
Arg Ser Glu Gly Asp Pro Ala Ala Ser Ser Ser Ser Ala Leu Leu Asn
850 855 860
Arg Ser Ile Ala Ala Lys Leu Leu Ala Arg Leu His Asn Gly Gly Tyr
865 870 875 880
Val Leu Pro Ala Asp Ile Phe Ala Asn Leu Pro Asn Pro Pro Asp Pro
885 890 895
Phe Phe Thr Arg Ala Gln Ile Asp Arg Glu Ala Arg Lys Val Arg Asp
900 905 910
Gly Ile Met Gly Met Leu Tyr Leu Gln Arg Met Pro Thr Glu Phe Asp
915 920 925
Val Ala Met Ala Thr Val Tyr Tyr Leu Ala Asp Arg Asn Val Ser Gly
930 935 940
Glu Thr Phe His Pro Ser Gly Gly Leu Arg Tyr Glu Arg Thr Pro Thr
945 950 955 960
Gly Gly Glu Leu Phe Gly Leu Pro Ser Pro Glu Arg Leu Ala Glu Leu
965 970 975
Val Gly Ser Thr Val Tyr Leu Ile Gly Glu His Leu Thr Glu His Leu
980 985 990
Asn Leu Leu Ala Arg Ala Tyr Leu Glu Arg Tyr Gly Ala Arg Gln Val
995 1000 1005
Val Met Ile Val Glu Thr Glu Thr Gly Ala Glu Thr Met Arg Arg
1010 1015 1020
Leu Leu His Asp His Val Glu Ala Gly Arg Leu Met Thr Ile Val
1025 1030 1035
Ala Gly Asp Gln Ile Glu Ala Ala Ile Asp Gln Ala Ile Thr Arg
1040 1045 1050
Tyr Gly Arg Pro Gly Pro Val Val Cys Thr Pro Phe Arg Pro Leu
1055 1060 1065
Pro Thr Val Pro Leu Val Gly Arg Lys Asp Ser Asp Trp Ser Thr
1070 1075 1080
Val Leu Ser Glu Ala Glu Phe Ala Glu Leu Cys Glu His Gln Leu
1085 1090 1095
Thr His His Phe Arg Val Ala Arg Lys Ile Ala Leu Ser Asp Gly
1100 1105 1110
Ala Ser Leu Ala Leu Val Thr Pro Glu Thr Thr Ala Thr Ser Thr
1115 1120 1125
Thr Glu Gln Phe Ala Leu Ala Asn Phe Ile Lys Thr Thr Leu His
1130 1135 1140
Ala Phe Thr Ala Thr Ile Gly Val Glu Ser Glu Arg Thr Ala Gln
1145 1150 1155
Arg Ile Leu Ile Asn Gln Val Asp Leu Thr Arg Arg Ala Arg Ala
1160 1165 1170
Glu Glu Pro Arg Asp Pro His Glu Arg Gln Gln Glu Leu Glu Arg
1175 1180 1185
Phe Ile Glu Ala Val Leu Leu Val Thr Ala Pro Leu Pro Pro Glu
1190 1195 1200
Ala Asp Thr Arg Tyr Ala Gly Arg Ile His Arg Gly Arg Ala Ile
1205 1210 1215
Thr Val
1220
<210> 190
<211> 3660
<212> DNA
<213> Chloroflexus aurantiacus
<400> 190
atgagcggaa caggacgact ggcaggaaag attgcgttaa ttaccggtgg cgccggcaat 60
atcggcagtg aattgacacg tcgctttctc gcagagggag cgacggtcat tattagtgga 120
cggaatcggg cgaagttgac cgcactggcc gaacggatgc aggcagaggc aggagtgccg 180
gcaaagcgca tcgatctcga agtcatggat gggagtgatc cggtcgcggt acgtgccggt 240
atcgaagcga ttgtggcccg tcacggccag atcgacattc tggtcaacaa tgcaggaagt 300
gccggtgccc agcgtcgtct ggccgagatt ccactcactg aagctgaatt aggccctggc 360
gccgaagaga cgcttcatgc cagcatcgcc aatttacttg gtatgggatg gcatctgatg 420
cgtattgcgg cacctcatat gccggtagga agtgcggtca tcaatgtctc gaccatcttt 480
tcacgggctg agtactacgg gcggattccg tatgtcaccc ctaaagctgc tcttaatgct 540
ctatctcaac ttgctgcgcg tgagttaggt gcacgtggca tccgcgttaa tacgatcttt 600
cccggcccga ttgaaagtga tcgcatccgt acagtgttcc agcgtatgga tcagctcaag 660
gggcggcccg aaggcgacac agcgcaccat tttttgaaca ccatgcgatt gtgtcgtgcc 720
aacgaccagg gcgcgcttga acgtcggttc ccctccgtcg gtgatgtggc agacgccgct 780
gtctttctgg ccagtgccga atccgccgct ctctccggtg agacgattga ggttacgcac 840
ggaatggagt tgccggcctg cagtgagacc agcctgctgg cccgtactga tctgcgcacg 900
attgatgcca gtggccgcac gacgctcatc tgcgccggcg accagattga agaggtgatg 960
gcgctcaccg gtatgttgcg tacctgtggg agtgaagtga tcatcggctt ccgttcggct 1020
gcggcgctgg cccagttcga gcaggcagtc aatgagagtc ggcggctggc cggcgcagac 1080
tttacgcctc ccattgcctt gccactcgat ccacgcgatc cggcaacaat tgacgctgtc 1140
ttcgattggg ccggcgagaa taccggcggg attcatgcag cggtgattct gcctgctacc 1200
agtcacgaac cggcaccgtg cgtgattgag gttgatgatg agcgggtgct gaattttctg 1260
gccgatgaaa tcaccgggac aattgtgatt gccagtcgcc tggcccgtta ctggcagtcg 1320
caacggctta cccccggcgc acgtgcgcgt gggccgcgtg tcatttttct ctcgaacggt 1380
gccgatcaaa atgggaatgt ttacggacgc attcaaagtg ccgctatcgg tcagctcatt 1440
cgtgtgtggc gtcacgaggc tgaacttgac tatcagcgtg ccagcgccgc cggtgatcat 1500
gtgctgccgc cggtatgggc caatcagatt gtgcgcttcg ctaaccgcag ccttgaaggg 1560
ttagaatttg cctgtgcctg gacagctcaa ttgctccata gtcaacgcca tatcaatgag 1620
attaccctca acatccctgc caacattagc gccaccaccg gcgcacgcag tgcatcggtc 1680
ggatgggcgg aaagcctgat cgggttgcat ttggggaaag ttgccttgat taccggtggc 1740
agcgccggta ttggtgggca gatcgggcgc ctcctggctt tgagtggcgc gcgcgtgatg 1800
ctggcagccc gtgatcggca taagctcgaa cagatgcagg cgatgatcca atctgagctg 1860
gctgaggtgg ggtataccga tgtcgaagat cgcgtccaca ttgcaccggg ctgcgatgtg 1920
agtagcgaag cgcagcttgc ggatcttgtt gaacgtaccc tgtcagcttt tggcaccgtc 1980
gattatctga tcaacaacgc cgggatcgcc ggtgtcgaag agatggttat cgatatgcca 2040
gttgagggat ggcgccatac cctcttcgcc aatctgatca gcaactactc gttgatgcgc 2100
aaactggcgc cgttgatgaa aaaacagggt agcggttaca tccttaacgt ctcatcatac 2160
tttggcggtg aaaaagatgc ggccattccc taccccaacc gtgccgatta cgccgtctcg 2220
aaggctggtc agcgggcaat ggccgaagtc tttgcgcgct tccttggccc ggagatacag 2280
atcaatgcca ttgcgccggg tccggtcgaa ggtgatcgct tgcgcggtac cggtgaacgt 2340
cccggcctct ttgcccgtcg ggcgcggctg attttggaga acaagcggct gaatgagctt 2400
cacgctgctc ttatcgcggc tgcgcgcacc gatgagcgat ctatgcacga actggttgaa 2460
ctgctcttac ccaatgatgt ggccgcacta gagcagaatc ccgcagcacc taccgcgttg 2520
cgtgaactgg cacgacgttt tcgcagcgaa ggcgatccgg cggcatcatc aagcagtgcg 2580
ctgctgaacc gttcaattgc cgctaaattg ctggctcgtt tgcataatgg tggctatgtg 2640
ttgcctgccg acatctttgc aaacctgcca aacccgcccg atcccttctt cacccgagcc 2700
cagattgatc gcgaggctcg caaggttcgt gacggcatca tggggatgct ctacctgcaa 2760
cggatgccga ctgagtttga tgtcgcaatg gccaccgtct attaccttgc cgaccgcaat 2820
gtcagtggtg agacattcca cccatcaggt ggtttgcgtt acgaacgcac ccctaccggt 2880
ggcgaactct tcggcttgcc ctcaccggaa cggctggcgg agctggtcgg aagcacggtc 2940
tatctgatag gtgaacatct gactgaacac cttaacctgc ttgcccgtgc gtacctcgaa 3000
cgttacgggg cacgtcaggt agtgatgatt gttgagacag aaaccggggc agagacaatg 3060
cgtcgcttgc tccacgatca cgtcgaggct ggtcggctga tgactattgt ggccggtgat 3120
cagatcgaag ccgctatcga ccaggctatc actcgctacg gtcgcccagg gccggtcgtc 3180
tgtaccccct tccggccact gccgacggta ccactggtcg ggcgtaaaga cagtgactgg 3240
agcacagtgt tgagtgaggc tgaatttgcc gagttgtgcg aacaccagct cacccaccat 3300
ttccgggtag cgcgcaagat tgccctgagt gatggtgcca gtctcgcgct ggtcactccc 3360
gaaactacgg ctacctcaac taccgagcaa tttgctctgg ctaacttcat caaaacgacc 3420
cttcacgctt ttacggctac gattggtgtc gagagcgaaa gaactgctca gcgcattctg 3480
atcaatcaag tcgatctgac ccggcgtgcg cgtgccgaag agccgcgtga tccgcacgag 3540
cgtcaacaag aactggaacg ttttatcgag gcagtcttgc tggtcactgc accactcccg 3600
cctgaagccg atacccgtta cgccgggcgg attcatcgcg gacgggcgat taccgtgtaa 3660
<210> 191
<211> 455
<212> PRT
<213> Chloroflexus aurantiacus
<400> 191
Met Ala Lys Ala Ser Arg Leu Thr Arg Ser Thr Gly Gln Pro Thr Glu
1 5 10 15
Val Ser Glu Gly Gln Val Thr Gly Thr Ser Glu Met Pro Pro Thr Gly
20 25 30
Glu Glu Pro Ser Gly His Ala Glu Ser Lys Pro Pro Ala Ser Asp Pro
35 40 45
Met Ser Thr Pro Gly Thr Gly Gln Glu Gln Leu Pro Leu Ser Gly Ile
50 55 60
Arg Val Ile Asp Val Gly Asn Phe Leu Ala Gly Pro Tyr Ala Ala Ser
65 70 75 80
Ile Leu Gly Glu Phe Gly Ala Glu Val Leu Lys Ile Glu His Pro Leu
85 90 95
Gly Gly Asp Pro Met Arg Arg Phe Gly Thr Ala Thr Ala Arg His Asp
100 105 110
Ala Thr Leu Ala Trp Leu Ser Glu Ala Arg Asn Arg Lys Ser Val Thr
115 120 125
Ile Asp Leu Arg Gln Gln Glu Gly Val Ala Leu Phe Leu Lys Leu Val
130 135 140
Ala Lys Ser Asp Ile Leu Ile Glu Asn Phe Arg Pro Gly Thr Met Glu
145 150 155 160
Glu Trp Gly Leu Ser Trp Pro Val Leu Gln Ala Thr Asn Pro Gly Leu
165 170 175
Ile Met Leu Arg Val Ser Gly Tyr Gly Gln Thr Gly Pro Tyr Arg Arg
180 185 190
Arg Ser Gly Phe Ala His Ile Ala His Ala Phe Ser Gly Leu Ser Tyr
195 200 205
Leu Ala Gly Phe Pro Gly Glu Thr Pro Val Leu Pro Gly Thr Ala Pro
210 215 220
Leu Gly Asp Tyr Ile Ala Ser Leu Phe Gly Ala Ile Gly Ile Leu Ile
225 230 235 240
Ala Leu Arg His Lys Glu Gln Thr Gly Arg Gly Gln Leu Ile Asp Val
245 250 255
Gly Ile Tyr Glu Ala Val Phe Arg Ile Leu Asp Glu Ile Ala Pro Ala
260 265 270
Tyr Gly Leu Phe Gly Lys Ile Arg Glu Arg Glu Gly Ala Gly Ser Phe
275 280 285
Ile Ala Val Pro His Gly His Phe Arg Ser Lys Asp Gly Lys Trp Val
290 295 300
Ala Ile Ala Cys Thr Thr Asp Lys Met Phe Glu Arg Leu Ala Glu Ala
305 310 315 320
Met Glu Arg Pro Glu Leu Ala Ser Pro Glu Leu Tyr Gly Asp Gln Arg
325 330 335
Lys Arg Leu Ala Ala Arg Asp Ile Val Asn Gln Ile Thr Ile Glu Trp
340 345 350
Val Gly Ser Leu Thr Arg Asp Glu Val Met Arg Arg Cys Leu Glu Lys
355 360 365
Glu Val Pro Val Gly Pro Leu Asn Ser Ile Ala Asp Met Phe Asn Asp
370 375 380
Glu His Phe Leu Ala Arg Gly Asn Phe Ala Cys Ile Glu Ala Glu Gly
385 390 395 400
Ile Gly Glu Val Val Val Pro Asn Val Ile Pro Arg Leu Ser Glu Thr
405 410 415
Pro Gly Arg Val Thr Asn Leu Gly Pro Pro Leu Gly Asn Ala Thr Tyr
420 425 430
Glu Val Leu Arg Glu Leu Leu Asp Ile Ser Ala Glu Glu Ile Lys Arg
435 440 445
Leu Arg Ser Arg Lys Ile Ile
450 455
<210> 192
<211> 1368
<212> PRT
<213> Chloroflexus aurantiacus
<400> 192
Ala Thr Gly Gly Cys Ala Ala Ala Ala Gly Cys Gly Thr Cys Ala Cys
1 5 10 15
Gly Cys Cys Thr Gly Ala Cys Cys Ala Gly Ala Thr Cys Ala Ala Cys
20 25 30
Cys Gly Gly Thr Cys Ala Gly Cys Cys Ala Ala Cys Gly Gly Ala Gly
35 40 45
Gly Thr Gly Thr Cys Ala Gly Ala Ala Gly Gly Ala Cys Ala Gly Gly
50 55 60
Thr Cys Ala Cys Cys Gly Gly Gly Ala Cys Ala Ala Gly Cys Gly Ala
65 70 75 80
Gly Ala Thr Gly Cys Cys Cys Cys Cys Cys Ala Cys Ala Gly Gly Ala
85 90 95
Gly Ala Ala Gly Ala Ala Cys Cys Ala Thr Cys Ala Gly Gly Ala Cys
100 105 110
Ala Cys Gly Cys Ala Gly Ala Ala Thr Cys Ala Ala Ala Gly Cys Cys
115 120 125
Gly Cys Cys Gly Gly Cys Cys Ala Gly Thr Gly Ala Thr Cys Cys Gly
130 135 140
Ala Thr Gly Ala Gly Cys Ala Cys Ala Cys Cys Gly Gly Gly Cys Ala
145 150 155 160
Cys Cys Gly Gly Thr Cys Ala Gly Gly Ala Gly Cys Ala Gly Thr Thr
165 170 175
Gly Cys Cys Gly Thr Thr Gly Ala Gly Thr Gly Gly Cys Ala Thr Thr
180 185 190
Cys Gly Gly Gly Thr Cys Ala Thr Thr Gly Ala Thr Gly Thr Ala Gly
195 200 205
Gly Thr Ala Ala Thr Thr Thr Thr Cys Thr Gly Gly Cys Cys Gly Gly
210 215 220
Cys Cys Cys Gly Thr Ala Thr Gly Cys Thr Gly Cys Thr Thr Cys Cys
225 230 235 240
Ala Thr Cys Cys Thr Gly Gly Gly Thr Gly Ala Ala Thr Thr Cys Gly
245 250 255
Gly Thr Gly Cys Cys Gly Ala Gly Gly Thr Gly Cys Thr Cys Ala Ala
260 265 270
Gly Ala Thr Cys Gly Ala Ala Cys Ala Cys Cys Cys Gly Cys Thr Gly
275 280 285
Gly Gly Thr Gly Gly Cys Gly Ala Thr Cys Cys Gly Ala Thr Gly Cys
290 295 300
Gly Thr Cys Gly Thr Thr Thr Cys Gly Gly Cys Ala Cys Thr Gly Cys
305 310 315 320
Ala Ala Cys Thr Gly Cys Gly Cys Gly Cys Cys Ala Cys Gly Ala Thr
325 330 335
Gly Cys Ala Ala Cys Ala Cys Thr Gly Gly Cys Cys Thr Gly Gly Cys
340 345 350
Thr Gly Ala Gly Cys Gly Ala Gly Gly Cys Cys Cys Gly Thr Ala Ala
355 360 365
Cys Cys Gly Thr Ala Ala Gly Thr Cys Gly Gly Thr Cys Ala Cys Gly
370 375 380
Ala Thr Thr Gly Ala Thr Cys Thr Gly Cys Gly Thr Cys Ala Gly Cys
385 390 395 400
Ala Ala Gly Ala Gly Gly Gly Cys Gly Thr Thr Gly Cys Gly Cys Thr
405 410 415
Cys Thr Thr Thr Cys Thr Gly Ala Ala Gly Cys Thr Gly Gly Thr Cys
420 425 430
Gly Cys Cys Ala Ala Ala Thr Cys Cys Gly Ala Cys Ala Thr Thr Cys
435 440 445
Thr Gly Ala Thr Thr Gly Ala Ala Ala Ala Cys Thr Thr Thr Cys Gly
450 455 460
Cys Cys Cys Cys Gly Gly Thr Ala Cys Gly Ala Thr Gly Gly Ala Ala
465 470 475 480
Gly Ala Ala Thr Gly Gly Gly Gly Cys Thr Thr Gly Ala Gly Cys Thr
485 490 495
Gly Gly Cys Cys Thr Gly Thr Thr Thr Thr Gly Cys Ala Gly Gly Cys
500 505 510
Gly Ala Cys Gly Ala Ala Thr Cys Cys Cys Gly Gly Ala Cys Thr Gly
515 520 525
Ala Thr Thr Ala Thr Gly Cys Thr Gly Cys Gly Gly Gly Thr Gly Thr
530 535 540
Cys Gly Gly Gly Cys Thr Ala Thr Gly Gly Thr Cys Ala Gly Ala Cys
545 550 555 560
Cys Gly Gly Gly Cys Cys Gly Thr Ala Cys Cys Gly Thr Cys Gly Gly
565 570 575
Cys Gly Thr Thr Cys Gly Gly Gly Gly Thr Thr Thr Gly Cys Cys Cys
580 585 590
Ala Thr Ala Thr Thr Gly Cys Cys Cys Ala Cys Gly Cys Thr Thr Thr
595 600 605
Cys Ala Gly Cys Gly Gly Cys Cys Thr Cys Thr Cys Gly Thr Ala Thr
610 615 620
Cys Thr Gly Gly Cys Cys Gly Gly Gly Thr Thr Cys Cys Cys Cys Gly
625 630 635 640
Gly Cys Gly Ala Ala Ala Cys Gly Cys Cys Ala Gly Thr Cys Thr Thr
645 650 655
Gly Cys Cys Gly Gly Gly Ala Ala Cys Gly Gly Cys Ala Cys Cys Gly
660 665 670
Cys Thr Cys Gly Gly Cys Gly Ala Cys Thr Ala Thr Ala Thr Cys Gly
675 680 685
Cys Cys Ala Gly Thr Cys Thr Gly Thr Thr Cys Gly Gly Gly Gly Cys
690 695 700
Gly Ala Thr Thr Gly Gly Gly Ala Thr Thr Thr Thr Gly Ala Thr Cys
705 710 715 720
Gly Cys Gly Cys Thr Gly Cys Gly Cys Cys Ala Cys Ala Ala Ala Gly
725 730 735
Ala Gly Cys Ala Gly Ala Cys Cys Gly Gly Ala Cys Gly Cys Gly Gly
740 745 750
Gly Cys Ala Gly Thr Thr Gly Ala Thr Cys Gly Ala Thr Gly Thr Cys
755 760 765
Gly Gly Gly Ala Thr Thr Thr Ala Cys Gly Ala Ala Gly Cys Gly Gly
770 775 780
Thr Cys Thr Thr Cys Cys Gly Gly Ala Thr Thr Cys Thr Gly Gly Ala
785 790 795 800
Thr Gly Ala Gly Ala Thr Thr Gly Cys Cys Cys Cys Gly Gly Cys Thr
805 810 815
Thr Ala Cys Gly Gly Thr Cys Thr Gly Thr Thr Cys Gly Gly Cys Ala
820 825 830
Ala Gly Ala Thr Thr Cys Gly Thr Gly Ala Ala Cys Gly Cys Gly Ala
835 840 845
Ala Gly Gly Gly Gly Cys Cys Gly Gly Gly Ala Gly Thr Thr Thr Thr
850 855 860
Ala Thr Thr Gly Cys Thr Gly Thr Thr Cys Cys Gly Cys Ala Thr Gly
865 870 875 880
Gly Cys Cys Ala Thr Thr Thr Cys Cys Gly Cys Thr Cys Gly Ala Ala
885 890 895
Gly Gly Ala Cys Gly Gly Cys Ala Ala Gly Thr Gly Gly Gly Thr Thr
900 905 910
Gly Cys Gly Ala Thr Thr Gly Cys Cys Thr Gly Thr Ala Cys Cys Ala
915 920 925
Cys Cys Gly Ala Cys Ala Ala Gly Ala Thr Gly Thr Thr Thr Gly Ala
930 935 940
Ala Cys Gly Gly Cys Thr Gly Gly Cys Cys Gly Ala Ala Gly Cys Ala
945 950 955 960
Ala Thr Gly Gly Ala Gly Cys Gly Cys Cys Cys Gly Gly Ala Ala Cys
965 970 975
Thr Gly Gly Cys Thr Thr Cys Gly Cys Cys Gly Gly Ala Ala Cys Thr
980 985 990
Gly Thr Ala Cys Gly Gly Cys Gly Ala Thr Cys Ala Ala Cys Gly Cys
995 1000 1005
Ala Ala Ala Cys Gly Gly Cys Thr Gly Gly Cys Ala Gly Cys Ala
1010 1015 1020
Cys Gly Cys Gly Ala Thr Ala Thr Thr Gly Thr Gly Ala Ala Cys
1025 1030 1035
Cys Ala Gly Ala Thr Cys Ala Cys Gly Ala Thr Thr Gly Ala Ala
1040 1045 1050
Thr Gly Gly Gly Thr Cys Gly Gly Thr Thr Cys Gly Thr Thr Gly
1055 1060 1065
Ala Cys Gly Cys Gly Cys Gly Ala Cys Gly Ala Gly Gly Thr Gly
1070 1075 1080
Ala Thr Gly Cys Gly Gly Cys Gly Thr Thr Gly Thr Cys Thr Gly
1085 1090 1095
Gly Ala Gly Ala Ala Gly Gly Ala Ala Gly Thr Thr Cys Cys Cys
1100 1105 1110
Gly Thr Thr Gly Gly Cys Cys Cys Ala Cys Thr Cys Ala Ala Cys
1115 1120 1125
Ala Gly Cys Ala Thr Cys Gly Cys Cys Gly Ala Thr Ala Thr Gly
1130 1135 1140
Thr Thr Cys Ala Ala Cys Gly Ala Cys Gly Ala Ala Cys Ala Thr
1145 1150 1155
Thr Thr Thr Cys Thr Gly Gly Cys Thr Cys Gly Cys Gly Gly Cys
1160 1165 1170
Ala Ala Cys Thr Thr Thr Gly Cys Cys Thr Gly Thr Ala Thr Cys
1175 1180 1185
Gly Ala Ala Gly Cys Cys Gly Ala Gly Gly Gly Thr Ala Thr Cys
1190 1195 1200
Gly Gly Cys Gly Ala Ala Gly Thr Gly Gly Thr Gly Gly Thr Thr
1205 1210 1215
Cys Cys Gly Ala Ala Cys Gly Thr Gly Ala Thr Cys Cys Cys Cys
1220 1225 1230
Ala Gly Ala Cys Thr Gly Thr Cys Ala Gly Ala Ala Ala Cys Ala
1235 1240 1245
Cys Cys Gly Gly Gly Ala Cys Gly Gly Gly Thr Gly Ala Cys Cys
1250 1255 1260
Ala Ala Cys Cys Thr Cys Gly Gly Cys Cys Cys Ala Cys Cys Gly
1265 1270 1275
Cys Thr Gly Gly Gly Gly Ala Ala Thr Gly Cys Cys Ala Cys Gly
1280 1285 1290
Thr Ala Thr Gly Ala Gly Gly Thr Gly Thr Thr Gly Cys Gly Cys
1295 1300 1305
Gly Ala Gly Cys Thr Gly Cys Thr Thr Gly Ala Thr Ala Thr Thr
1310 1315 1320
Thr Cys Thr Gly Cys Cys Gly Ala Ala Gly Ala Gly Ala Thr Cys
1325 1330 1335
Ala Ala Gly Cys Gly Thr Cys Thr Gly Cys Gly Cys Ala Gly Cys
1340 1345 1350
Cys Gly Cys Ala Ala Gly Ala Thr Thr Ala Thr Thr Thr Ala Gly
1355 1360 1365
<210> 193
<211> 405
<212> PRT
<213> Chloroflexus aurantiacus
<400> 193
Met Asp Gly Thr Thr Thr Thr Leu Pro Leu Ala Gly Ile Arg Val Ile
1 5 10 15
Asp Ala Ala Thr Val Ile Ala Ala Pro Phe Cys Ala Thr Leu Leu Gly
20 25 30
Glu Phe Gly Ala Asp Val Leu Lys Val Glu His Pro Ile Gly Gly Asp
35 40 45
Ala Leu Arg Arg Phe Gly Thr Pro Thr Ala Arg Gly Asp Thr Leu Thr
50 55 60
Trp Leu Ser Glu Ser Arg Asn Lys Arg Ser Val Thr Leu Asn Leu Gln
65 70 75 80
His Pro Glu Gly Ala Arg Val Phe Lys Glu Leu Ile Ala His Ser Asp
85 90 95
Val Leu Cys Glu Asn Phe Arg Pro Gly Thr Leu Glu Lys Trp Gly Leu
100 105 110
Gly Trp Asp Val Leu Ser Lys Ile Asn Pro Arg Leu Ile Met Leu Arg
115 120 125
Val Thr Gly Tyr Gly Gln Thr Gly Pro Tyr Arg Asp Arg Pro Gly Phe
130 135 140
Ala Arg Ile Ala His Ala Val Gly Gly Ile Ala Tyr Leu Ala Gly Met
145 150 155 160
Pro Lys Gly Thr Pro Val Thr Pro Gly Ser Thr Thr Leu Ala Asp Tyr
165 170 175
Met Thr Gly Leu Tyr Gly Cys Ile Gly Val Leu Leu Ala Leu Arg His
180 185 190
Arg Glu Gln Thr Gly Arg Gly Gln Tyr Ile Asp Ala Ala Leu Tyr Glu
195 200 205
Ser Val Phe Arg Cys Ser Asp Glu Leu Val Pro Ala Tyr Gly Met Tyr
210 215 220
Arg Lys Val Arg Glu Arg His Gly Ser His Tyr Asn Glu Phe Ala Cys
225 230 235 240
Pro His Gly His Phe Gln Thr Lys Asp Gly Lys Trp Val Ala Ile Ser
245 250 255
Cys Ala Thr Asp Lys Leu Phe Ala Arg Leu Ala Asn Ala Met Gly Arg
260 265 270
Pro Glu Leu Ala Ser Ser Ser Val Tyr Gly Asp Gln Lys Val Arg Leu
275 280 285
Ala His Ala Ser Asp Val Asn Glu Ile Val Arg Asp Trp Cys Ser Ser
290 295 300
Leu Thr Arg Ala Glu Val Leu Glu Arg Cys Tyr Ala Thr Ala Thr Pro
305 310 315 320
Ala Ala Pro Leu Asn Asp Ile Ala Asp Phe Phe Gly Asp Arg His Val
325 330 335
His Ala Arg Arg Asn Leu Val Ala Ile Asp Ala Glu Asp Leu Gly Glu
340 345 350
Thr Leu Ile Met Pro Asn Val Val Pro Lys Leu Ser Glu Thr Pro Gly
355 360 365
Ser Ile Arg Ser Leu Gly Pro Lys Leu Gly Glu His Thr Glu Glu Val
370 375 380
Leu Lys Glu Ile Leu Gly Met Cys Asp Glu Gln Ile Asn Asp Leu Arg
385 390 395 400
Ser Lys Arg Val Ile
405
<210> 194
<211> 1218
<212> DNA
<213> Chloroflexus aurantiacus
<400> 194
atggatggaa cgaccacaac gttgccgctg gccggaattc gcgttatcga tgccgcgacg 60
gtgattgctg cgcctttttg tgcgaccctg ttgggcgaat tcggcgctga cgtgttgaaa 120
gtagaacatc ctatcggcgg tgatgcgctg cgccgcttcg ggacgccgac cgcacgcggc 180
gatacgctga cctggctgag cgagtcgcgc aacaagcgtt cggttacgct caacctgcaa 240
catcccgaag gggcgcgtgt cttcaaagag ctgatcgccc actccgatgt gctgtgcgaa 300
aattttcgcc ccggtacgct ggaaaaatgg gggctgggtt gggatgtgtt gagcaagatc 360
aacccgcgcc tgattatgtt gcgggtcacc ggctatgggc agaccgggcc gtaccgtgat 420
cgaccggggt ttgcccggat tgcgcacgcc gtcggtggca tcgcgtatct ggccggtatg 480
ccgaaaggga caccggtgac gccggggtca acgacactcg ccgattacat gaccggtctc 540
tacggctgta ttggcgtgct gctggcgctg cgccaccgcg aacagaccgg acgcggccag 600
tacattgatg ccgctctgta cgaatcggtc ttccgctgta gcgatgagct ggtgccggcc 660
tacgggatgt atcgcaaggt gcgtgaacgc cacggttccc actacaacga gtttgcctgt 720
cctcacggcc acttccagac caaagacggg aaatgggtgg cgatctcgtg tgcgaccgat 780
aagctgtttg cccgactggc aaatgcgatg gggcgccccg aactggcgtc gtcgagtgtc 840
tacggcgacc agaaagtacg gctggcgcac gccagtgatg tgaacgagat tgtgcgtgac 900
tggtgtagct cgctgacccg cgccgaagtg cttgagcgct gttacgccac ggctaccccg 960
gcggcaccgc tgaacgacat tgccgacttc ttcggtgatc gccacgtcca cgctcgtcgg 1020
aatctggtcg cgattgatgc cgaagacctg ggggagacgt tgatcatgcc gaatgtggtg 1080
ccaaagctct cggagacacc gggcagcatt cgctcgctcg gcccgaaact cggcgagcat 1140
acggaagagg tcttgaaaga gattctcggc atgtgcgacg agcagatcaa cgatctgcgt 1200
tcaaagcggg tgatatag 1218
<210> 195
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 195
ttgtcaacga tggggtcatg 20
<210> 196
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 196
aaaaatgccg acataacgtc 20
<210> 197
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 197
ccatccgttg aatgagtttt 20
<210> 198
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 198
tggtgttaac tggcaaaatc 20
<210> 199
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 199
gtgacttcca acggcaaaag 20
<210> 200
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer for amplification
<400> 200
ccgttggttt gatagcaata 20
<210> 201
<211> 1080
<212> DNA
<213> sulfolobus tokodaii
<400> 201
atgattctga tgcgccgtac cctgaaagcg gcaatcttgg gtgccaccgg cttagtcggg 60
attgagtacg tacggatgct gagcaatcat ccgtacatca aacccgccta tctggctggg 120
aaagggtcag ttggcaaacc gtatggcgaa gtagtgcgct ggcagactgt gggccaagtt 180
cccaaagaaa ttgccgatat ggaaatcaag ccgactgatc cgaaactgat ggatgatgtt 240
gacatcatct ttagcccact gcctcaaggt gcggcaggac ccgttgagga acaatttgcg 300
aaagaaggat ttccggtcat ttccaattct ccggatcatc ggtttgatcc ggatgtccca 360
ctcctggtgc cagaactgaa tccgcacacc attagcctta ttgacgaaca gcgtaaacgc 420
cgtgaatgga aaggcttcat cgttacgacg ccgttatgca ccgcacaggg tgctgcgatc 480
ccattgggtg ccatcttcaa ggactacaaa atggatggcg cattcattac gaccattcag 540
tctcttagcg gtgcgggata tccgggtatt ccgtccctgg atgtggtgga taacattctg 600
cctttagggg acggccctga cgccaaaacg atcaaggaaa ttttccgcat cctgagtgaa 660
gtgaaacgca atgtggacga acctaaactg gaggacgttt cactggccgc cacaacccat 720
cgcattgcaa ccattcatgg ccactatgag gtgttgtacg tgtcgtttaa ggaagaaaca 780
gcagcggaga aggtcaaaga aacgctggaa aactttcgcg gtgaacctca ggatctcaaa 840
ctgccgacag cgccctcgaa accgatcatt gtgatgaacg aagatactcg cccacaggta 900
tatttcgatc gttgggcggg cgacattccg ggcatgagtg tcgttgttgg ccgtctgaaa 960
caggtcaaca aacgcatgat tcgtctggta tcgcttatcc acaacaccgt acgtggtgct 1020
gcgggcggtg ggattttagc tgcggagttg ctcgtggaga aaggctacat cgagaagtaa 1080
<210> 202
<211> 359
<212> PRT
<213> sulfolobus tokodaii
<400> 202
Met Ile Leu Met Arg Arg Thr Leu Lys Ala Ala Ile Leu Gly Ala Thr
1 5 10 15
Gly Leu Val Gly Ile Glu Tyr Val Arg Met Leu Ser Asn His Pro Tyr
20 25 30
Ile Lys Pro Ala Tyr Leu Ala Gly Lys Gly Ser Val Gly Lys Pro Tyr
35 40 45
Gly Glu Val Val Arg Trp Gln Thr Val Gly Gln Val Pro Lys Glu Ile
50 55 60
Ala Asp Met Glu Ile Lys Pro Thr Asp Pro Lys Leu Met Asp Asp Val
65 70 75 80
Asp Ile Ile Phe Ser Pro Leu Pro Gln Gly Ala Ala Gly Pro Val Glu
85 90 95
Glu Gln Phe Ala Lys Glu Gly Phe Pro Val Ile Ser Asn Ser Pro Asp
100 105 110
His Arg Phe Asp Pro Asp Val Pro Leu Leu Val Pro Glu Leu Asn Pro
115 120 125
His Thr Ile Ser Leu Ile Asp Glu Gln Arg Lys Arg Arg Glu Trp Lys
130 135 140
Gly Phe Ile Val Thr Thr Pro Leu Cys Thr Ala Gln Gly Ala Ala Ile
145 150 155 160
Pro Leu Gly Ala Ile Phe Lys Asp Tyr Lys Met Asp Gly Ala Phe Ile
165 170 175
Thr Thr Ile Gln Ser Leu Ser Gly Ala Gly Tyr Pro Gly Ile Pro Ser
180 185 190
Leu Asp Val Val Asp Asn Ile Leu Pro Leu Gly Asp Gly Pro Asp Ala
195 200 205
Lys Thr Ile Lys Glu Ile Phe Arg Ile Leu Ser Glu Val Lys Arg Asn
210 215 220
Val Asp Glu Pro Lys Leu Glu Asp Val Ser Leu Ala Ala Thr Thr His
225 230 235 240
Arg Ile Ala Thr Ile His Gly His Tyr Glu Val Leu Tyr Val Ser Phe
245 250 255
Lys Glu Glu Thr Ala Ala Glu Lys Val Lys Glu Thr Leu Glu Asn Phe
260 265 270
Arg Gly Glu Pro Gln Asp Leu Lys Leu Pro Thr Ala Pro Ser Lys Pro
275 280 285
Ile Ile Val Met Asn Glu Asp Thr Arg Pro Gln Val Tyr Phe Asp Arg
290 295 300
Trp Ala Gly Asp Ile Pro Gly Met Ser Val Val Val Gly Arg Leu Lys
305 310 315 320
Gln Val Asn Lys Arg Met Ile Arg Leu Val Ser Leu Ile His Asn Thr
325 330 335
Val Arg Gly Ala Ala Gly Gly Gly Ile Leu Ala Ala Glu Leu Leu Val
340 345 350
Glu Lys Gly Tyr Ile Glu Lys
355
<210> 203
<211> 8457
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 203
ttcgagctcg gtaatgtcgt ttaccctgat tcagcaagcg actccgcgct tacatcgcag 60
cgaacttgcg gttccgggtt caaatccgac ctttatggag aaatcagcag ccagcaaggc 120
cgatgtcatc ttcttggatc tggaggatgc cgttgcacct gatgacaaag aacaggcgcg 180
taagaacatc attcaggcac tgaacgatct ggactggggc aacaaaacga tgatgatccg 240
cattaacggt ctggacaccc actacatgta tcgggatgtg gtcgacatcg tagaagcatg 300
ccctcgcctg gatatgattc tcattcccaa agtcggagta ccagcagacg tgtatgcgat 360
tgatgtgctg acgacgcaaa tcgaacaggc gaagaaacgg gagaagaaaa tcggattcga 420
ggtgctcatt gaaacggctt taggcatggc caatgttgaa gccatcgcca catcttcgaa 480
acgcttggaa gcgatgtcgt ttggtgtggc cgattatgca gcatccactc gtgcccgtag 540
taccgtgatt ggtggtgtga atgcggatta ctccgttctc actgacaaag atgaagcagg 600
gaaccgtcaa acccattggc aagatccgtg gctgtttgcg cagaatcgca tgctggttgc 660
ttgccgtgct tacgggcttc gcccgattga tgggccattt ggcgacttca gcgatcccga 720
tggctatacc agtgctgcgc gtcgttgtgc ggcgctgggc tttgaaggca aatgggcgat 780
tcacccgagt cagatcgact tagcgaacga ggtgttcaca ccgtctgaag ctgaagtcac 840
caaagcgcgc cgcattctgg aggcaatgga agaagcggcc aaagccggtc gtggcgctgt 900
aagcctggac ggtcgcttga ttgacatcgc cagcattcgc atggctgaag ccctgatcca 960
gaaagcggat gcaatgggcg gcaaataagt ttaactttaa gaaggagata taccatgatt 1020
ctgatgcgcc gtaccctgaa agcggcaatc ttgggtgcca ccggcttagt cgggattgag 1080
tacgtacgga tgctgagcaa tcatccgtac atcaaacccg cctatctggc tgggaaaggg 1140
tcagttggca aaccgtatgg cgaagtagtg cgctggcaga ctgtgggcca agttcccaaa 1200
gaaattgccg atatggaaat caagccgact gatccgaaac tgatggatga tgttgacatc 1260
atctttagcc cactgcctca aggtgcggca ggacccgttg aggaacaatt tgcgaaagaa 1320
ggatttccgg tcatttccaa ttctccggat catcggtttg atccggatgt cccactcctg 1380
gtgccagaac tgaatccgca caccattagc cttattgacg aacagcgtaa acgccgtgaa 1440
tggaaaggct tcatcgttac gacgccgtta tgcaccgcac agggtgctgc gatcccattg 1500
ggtgccatct tcaaggacta caaaatggat ggcgcattca ttacgaccat tcagtctctt 1560
agcggtgcgg gatatccggg tattccgtcc ctggatgtgg tggataacat tctgccttta 1620
ggggacggcc ctgacgccaa aacgatcaag gaaattttcc gcatcctgag tgaagtgaaa 1680
cgcaatgtgg acgaacctaa actggaggac gtttcactgg ccgccacaac ccatcgcatt 1740
gcaaccattc atggccacta tgaggtgttg tacgtgtcgt ttaaggaaga aacagcagcg 1800
gagaaggtca aagaaacgct ggaaaacttt cgcggtgaac ctcaggatct caaactgccg 1860
acagcgccct cgaaaccgat cattgtgatg aacgaagata ctcgcccaca ggtatatttc 1920
gatcgttggg cgggcgacat tccgggcatg agtgtcgttg ttggccgtct gaaacaggtc 1980
aacaaacgca tgattcgtct ggtatcgctt atccacaaca ccgtacgtgg tgctgcgggc 2040
ggtgggattt tagctgcgga gttgctcgtg gagaaaggct acatcgagaa gtaagtttaa 2100
ctttaagaag gagatatacc atgaaagcag cagttctgca tacctataaa gaaccgctga 2160
gcattgaaga tgtgaatatt tcacagccga aagccggtga agtgaaaatc aaagttaaag 2220
caaccggtct gtgtcgtagt gatgttcatg tttttgaagg taaaacaccg gttccgcctc 2280
cggttgttgc aggtcatgaa attagcggta ttgttgaaga ggttggtccg ggtgttaccc 2340
gtgttaaacc gggtgatcgt gttattagcg catttattca tccgtgtggt aaatgcggta 2400
attgtgttgc cggtaaagaa aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg 2460
ttatgccgga tggcaccagc cgtctgagca aagatggcaa agaaattcgt acctttctgg 2520
gtggtggttt tgcagaatat gcaattgttg gtgaaaatgc actgacccgt gttccggaag 2580
atatggatct ggaaaaagtt gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa 2640
ttagcagcag caaaattgaa cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg 2700
gtctgagcac cattcagctg ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca 2760
ccaaaaaatg gaaactggat cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta 2820
aagaaattga tccggtgaaa gccatcaaag aaatcaccgg tggtggtccg caggttgtta 2880
ttgaagccgg tggtaatgaa gataccattc acatggcact ggatagcgtt cgtattggtg 2940
gtaaagttgt tctggttggt ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa 3000
gcattgttcg tggtggtatt gaagttgttg gtaattatgg tggtcgtccg cgtgttgata 3060
tgccgaaact gctggaactg gttcgtcagg gtcgttatga tccgagccgt ctggttaccg 3120
gtcgttttcg tctggaagaa attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa 3180
ttcgtagcct gattattccg taagatcctc tagagtcgac ctgcaggcat gcaagcttct 3240
gttttggcgg atgagagaag aaattcgtcg cccgccataa actgccaggc atcaaattaa 3300
gcagaaggcc atcctgacgg atggcctttt tgcgtttcta caaactcttc ctgtctagca 3360
ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 3420
tcaaatatgt atccgctcat gctagaaata ttttatctga ttaataagat gatcttcttg 3480
agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac gaaaaaaccg ccttgcaggg 3540
cggtttttcg aaggttctct gagctaccaa ctctttgaac cgaggtaact ggcttggagg 3600
agcgcagtca ccaaaacttg tcctttcagt ttagccttaa ccggcgcatg acttcaagac 3660
taactcctct aaatcaatta ccagtggctg ctgccagtgg tgcttttgca tgtctttccg 3720
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcggactga acggggggtt 3780
cgtgcataca gtccagcttg gagcgaactg cctacccgga actgagtgtc aggcgtggaa 3840
tgagacaaac gcggccataa cagcggaatg acaccggtaa accgaaaggc aggaacagga 3900
gagcgcacga gggagccgcc aggggaaacg cctggtatct ttatagtcct gtcgggtttc 3960
gccaccactg atttgagcgt cagatttcgt gatgcttgtc aggggggcgg agcctatgga 4020
aaaacggctt tgccgcggcc ctctcacttc cctgttaagt atcttcctgg catcttccag 4080
gaaatctccg ccccgttcgt aagccatttc cgctcgccgc agtcgaacga ccgagcgtag 4140
cgagtcagtg agcgaggaag cggaatatat cctgtatcac atattctgct gacgcaccgg 4200
tgcagccttt tttctcctgc cacatgaagc acttcactga caccctcatc agtgccaaca 4260
tagtaagcca gtatacactc cgctagcgct gatgtccggc ggtgcttttg ccgttacgca 4320
ccaccccgtc agtagctgaa caggagggac agctgataga aacagaagcc actggagcac 4380
ctcaaaaaca ccatcataca ctaaatcagt aagttggcag catcacccga cgcactttgc 4440
gccgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc tggtgtccct 4500
gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga tcggcacgta 4560
agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt ttttgagtta 4620
tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg atataccacc 4680
gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc agttgctcaa 4740
tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac cgtaaagaaa 4800
aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat gaatgctcat 4860
ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag tgttcaccct 4920
tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag tgaataccac 4980
gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta cggtgaaaac 5040
ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc caatccctgg 5100
gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt cgcccccgtt 5160
ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag 5220
gttcatcatg ccgtctgtga tggcttccat gtcggcagaa tgcttaatga attacaacag 5280
tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg gtgcccttaa 5340
acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga aattcgaaag 5400
caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt atgtctattg 5460
ctggtttacc ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctg 5520
aggccagttt gctcaggctc tccccgtgga ggtaataatt gacgatatga tcatttattc 5580
tgcctcccag agcctgataa aaacggttag cgcttcgtta atacagatgt aggtgttcca 5640
cagggtagcc agcagcatcc tgcgatgcag atccggaaca taatggtgca gggcgcttgt 5700
ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc tgccggcacc 5760
tgtcctacga gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc 5820
cgcgcccacc ggaaggagct accggacagc ggtgcggact gttgtaactc agaataagaa 5880
atgaggccgc tcatggcgtt gactctcagt catagtatcg tggtatcacc ggttggttcc 5940
actctctgtt gcgggcaact tcagcagcac gtaggggact tccgcgtttc cagactttac 6000
gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 6060
cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 6120
cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 6180
ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 6240
ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 6300
cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 6360
ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 6420
tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 6480
gtccagtgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 6540
ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 6600
aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 6660
cgtagcccag cgcgtcggcc aattcgcgct aacttacatt aattgcgttg cgctcactgc 6720
ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 6780
ggagaggcgg tttgcgtatt gggcgccagg gtggtttttc ttttcaccag tgagacgggc 6840
aacagctgat tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg 6900
gtttgcccca gcaggcgaaa atcctgtttg atggtggttg acggcgggat ataacatgag 6960
ctgtcttcgg tatcgtcgta tcccactacc gagatatccg caccaacgcg cagcccggac 7020
tcggtaatgg cgcgcattgc gcccagcgcc atctgatcgt tggcaaccag catcgcagtg 7080
ggaacgatgc cctcattcag catttgcatg gtttgttgaa aaccggacat ggcactccag 7140
tcgccttccc gttccgctat cggctgaatt tgattgcgag tgagatattt atgccagcca 7200
gccagacgca gacgcgccga gacagaactt aatgggcccg ctaacagcgc gatttgctgg 7260
tgacccaatg cgaccagatg ctccacgccc agtcgcgtac cgtcttcatg ggagaaaata 7320
atactgttga tgggtgtctg gtcagagaca tcaagaaata acgccggaac attagtgcag 7380
gcagcttcca cagcaatggc atcctggtca tccagcggat agttaatgat cagcccactg 7440
acgcgttgcg cgagaagatt gtgcaccgcc gctttacagg cttcgacgcc gcttcgttct 7500
accatcgaca ccaccacgct ggcacccagt tgatcggcgc gagatttaat cgccgcgaca 7560
atttgcgacg gcgcgtgcag ggccagactg gaggtggcaa cgccaatcag caacgactgt 7620
ttgcccgcca gttgttgtgc cacgcggttg ggaatgtaat tcagctccgc catcgccgct 7680
tccacttttt cccgcgtttt cgcagaaacg tggctggcct ggttcaccac gcgggaaacg 7740
gtctgataag agacaccggc atactctgcg acatcgtata acgttactgg tttcacattc 7800
accaccctga attgactctc ttccgggcgc tatcatgcca taccgcgaaa ggttttgcac 7860
cattcgatgg tgtcaacgta aatgcatgcc gcttcgcctt cgcgcgcgaa ttggccgcca 7920
tgccggcgat aatggcctgc ttctcgccga aacgtttggt ggcgggacca gtgacgaagg 7980
cttgagcgag ggcgtgcaag attccgaata ccgcaagcga caggccgatc atcgtcgcgc 8040
tccagcgaaa gcggtcctcg ccgaaaatga cccagagcgc tgccggcacc tgtcctacga 8100
gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc cgcgcccacc 8160
ggaaggagct gactgggttg aaggctctca agggcatcgg cggagcttat cgactgcacg 8220
gtgcaccaat gcttctggcg tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc 8280
gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt 8340
gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac aattaatcat 8400
cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga aacagaa 8457
Claims (25)
- 2,4-다이하이드록시부티르산 (2,4-DHB)의 제조 방법으로서,
a) 말레이트, 숙시닐-CoA 또는 글리옥실레이트를, 각각 말릴-CoA 신테타제(synthetase), 숙시닐-CoA: (L)-말레이트-CoA 트랜스퍼라제(transferase) 또는 말릴-CoA 리아제(lyase) 활성을 가진 효소에 의해 말릴-CoA로 변환하는 제1 단계,
b) 상기 말릴-CoA를 말릴-CoA 리덕타제(reductase) 활성을 가진 효소에 의해 말레이트-4-세미알데하이드로 변환하는 제2 단계, 및
c) 상기 말레이트-4-세미알데하이드를 DHB 데하이드로게나제(DHB dehydrogenase)에 의해 2,4-DHB로 변환하는 제3 단계로 구성된, 연속 단계를 포함하는, 제조 방법. - 제1항에 있어서,
상기 단계 a)의 효소가 서열 번호 1, 서열 번호 191 또는 서열 번호 193로 표시되는 것을 특징으로 하는, 방법. - 제1항에 있어서,
상기 단계 a)의 효소가 서열 번호 2, 서열 번호 194 또는 서열 번호 192에 규정된 핵산 서열에 의해 코딩되는 것을 특징으로 하는, 방법. - 제1항에 있어서,
상기 단계 b)의 효소가 말로닐-CoA 리덕타제, 숙시닐-CoA 리덕타제 또는 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA) 리덕타제, 신나모일-CoA 리덕타제, 또는 아세트알데하이드 데하이드로게나제 활성을 가진 효소들 중에서 선택되는 것을 특징으로 하는, 방법. - 제1항에 있어서,
상기 단계 b)의 효소가 서열 번호 7, 서열 번호 10, 또는 서열 번호 189로 표시되는 것을 특징으로 하는, 방법. - 제5항에 있어서,
상기 효소가 서열 번호 8, 서열 번호 11 또는 서열 번호 190에 규정된 핵산 서열에 의해 코딩되는 것을 특징으로 하는, 방법. - 제1항에 있어서,
상기 말릴-CoA 리덕타제가 서열번호 7의 술폴로부스 토코다이이(Sulfolobus tokodaii) 말로닐-CoA 리덕타제 야생형 효소와 비교해, P111, L152, T154, L202, G203, D204, Y206, D207, K209, T210, T238, T239, D295, R318 중 한 곳 이상의 위치에, 하나 이상의 돌연변이를 포함하며,
상기 위치들에 존재하는 천연 아미노산이, 다른 19개의 천연 단백질 아미노산(proteinogenic amino acid)인 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민산, 글루타민, 글리신, 히스티딘, 이소루신, 루신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린 중 하나로 치환되는 것을 특징으로 하는, 방법. - 제7항에 있어서,
상기 말릴-CoA 리덕타제가 서열 번호 202로 표시되거나, 또는 서열 번호 201의 핵산에 의해 코딩되는 것을 특징으로 하는, 방법. - 제1항에 있어서,
상기 단계 c)가 DHB 데하이드로게나제 활성을 가진 효소에 의해 촉매되는 것을 특징으로 하는, 방법. - 제9항에 있어서,
상기 효소가, 메틸부티르알데하이드 리덕타제, 숙신산 세미알데하이드 리덕타제, 4-하이드록시부티레이트 데하이드로게나제, 또는 알코올 데하이드로게나제인 것을 특징으로 하는, 방법. - 제10항에 있어서,
상기 효소가 서열 번호 14, 서열 번호 16, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 187 또는 서열 번호 185로 표시되는 것을 특징으로 하는, 방법. - 제11항에 있어서,
상기 효소가 서열 번호 15, 서열 번호 17, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 188, 또는 서열 번호 186에 규정된 핵산 서열에 의해 코딩되는 것을 특징으로 하는, 방법. - 제1항에 있어서,
단계 a), b) 및 c)가 상기 단계 a), b) 또는 c)에 기술된 효소적 활성을 수행하는 효소들 중 하나 이상을 이종적으로(heterogeously) 발현하는 변형된 미생물에 의해 수행되는 것을 특징으로 하는, 방법. - 제1항에 있어서,
상기 a), b) 및 c)가 동일한 미생물 내에서 수행되는 것을 특징으로 하는, 방법. - 2,4-DHB의 개선된 제조를 위한 변형된 미생물로서,
상기 미생물은 제1항 내지 제13항 중 어느 한 항에 정의된 단계 a), b) 및 c)의 촉매작용에 필요한 효소적 활성을 가진 효소를 발현하는, 변형된 미생물. - 제15항에 있어서,
박테리아 또는 효모인 것을 특징으로 하는, 변형된 미생물. - 제16항에 있어서,
상기 박테리아가 엔테로박테리아세애(Enterobacteriaceae), 클로스트리디아세애(Clostridiaceae), 바실라세애(Bacillaceae), 스트렙토마이세타세애(Streptomycetaceae), 스트렙토콕카세애(Streptococcaceae), 메틸로박테리아세애(Methylobacteriacae), 및 코리네박테리아세애(Corynebacteriaceae) 로 이루어진 군으로부터 선택되는 박테리아인 것을 특징으로 하는, 변형된 미생물. - 제16항에 있어서,
상기 박테리아가 에스케리키아 콜라이(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 메틸로박테리움 엑스토?스(Methylobacterium extorquens), 또는 락토콕커스 락티스(Lactococcus lactis)로 이루어진 군으로부터 선택되는 박테리아인 것을 특징으로 하는, 변형된 미생물. - 제16항에 있어서,
상기 효모가 사카로마이세타세애(Saccharomycetaceae), 피키아세애(Pichiaceae), 및 스키조사카로마이세타세애(Schizosaccharomycetaceae)로 이루어진 군으로부터 선택되는 효모인 것을 특징으로 하는, 변형된 미생물. - 제16항에 있어서,
상기 효모가 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 막시아누스(Kluyveromyces marxianus), 피키아 야디니이(Pichia jadinii), 피키아 스티피티스(Pichia stipitis), 또는 피키아 파스토리스(Pichia pastoris)로 이루어진 군으로부터 선택되는 효모인 것을 특징으로 하는, 변형된 미생물. - 제15항에 있어서,
(a) 포스포에놀피루베이트 카르복실라제, 포스포에놀피루베이트 카르복시키나제, 피루베이트 카르복실라제, 이소시트레이트 리아제, 피루베이트 카르복실라제, 및 헥소스 심포터 퍼미아제(hexose symporter permease)로 이루어진 군으로부터 선택되는 효소적 활성 중 하나 이상의 발현이 증가되거나,
(b) 락테이트 데하이드로게나제, 알코올 데하이드로게나제, 아세테이트 키나제, 포스페이트 아세틸트랜스퍼라제, 피루베이트 옥시다제, 이소시트레이트 리아제, 푸마레이트 리덕타제, 푸마라제(fumarase), 2-옥소글루타레이트 데하이드로게나제, 피루베이트 키나제, 말산 효소, 포스포글루코스 이소머라제, 포스포에놀피루베이트 카르복실라제, 포스포에놀피루베이트 카르복시키나제, 피루베이트-포르메이트 리아제, 숙신산 세미알데하이드 데하이드로게나제, 당-수송 포스포트랜스퍼라제, 아스파테이트 아미노트랜스퍼라제, 글리옥실레이트 리덕타제, 말레이트 신타제(synthase), 또는 메틸글리옥살 신타제로 이루어진 군으로부터 선택되는 효소적 활성 중 하나 이상이 감소되거나,
(c) (a) 및 (b) 둘 다인 것을 특징으로 하는, 변형된 미생물. - 제21항에 있어서,
(a) 모두 에스케리키아 콜라이(E. coli)로부터 유래되는, ppc, pck, aceA, galP; 및 락토콕커스 락티스(L. lactis) 유래의 pycA로 이루어진 군으로부터 선택되는 유전자들 중 하나 이상을 과발현하거나,
(b) ldhA, adhE, ackA, pta, poxB, focA, pflB, sad, gabABC, sfcA, maeB, ppc, pykA, pykF, mgsA, frdABCD, sucAB, ptsI, ptsG, pgi, fumABC, aldA, lldD, iclR, aceB, aspC, ghrAB로 이루어진 군으로부터 선택되는 유전자들 중 하나 이상이 결손되거나,
(c) (a) 및 (b) 둘 다인 에스케리키아 콜라이인 것을 특징으로 하는, 변형된 미생물. - 2,4-DHB의 제조 방법으로서,
제15항에 따른 변형된 미생물을 적절한 배양 배지에서 배양하는 단계, 및
상기 배양 배지로부터 2,4-DHB를 회수하는 단계를 포함하는, 방법. - 제23항에 있어서,
상기 2,4-DHB가 추가로 정제되는 것을 특징으로 하는, 방법. - 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IBPCT/IB2012/001123 | 2012-04-26 | ||
IB2012001123 | 2012-04-26 | ||
PCT/IB2013/001071 WO2013160762A2 (en) | 2012-04-26 | 2013-04-25 | A method of production of 2,4-dihydroxybutyric acid |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150013607A KR20150013607A (ko) | 2015-02-05 |
KR102024109B1 true KR102024109B1 (ko) | 2019-09-23 |
Family
ID=48699857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147033085A KR102024109B1 (ko) | 2012-04-26 | 2013-04-25 | 2,4-다이하이드록시부티르산의 제조 방법 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9890400B2 (ko) |
EP (1) | EP2841584B1 (ko) |
JP (1) | JP6342385B2 (ko) |
KR (1) | KR102024109B1 (ko) |
CN (1) | CN104254612B (ko) |
BR (1) | BR112014026149A2 (ko) |
ES (1) | ES2875010T3 (ko) |
IN (1) | IN2014DN09529A (ko) |
MY (1) | MY175391A (ko) |
WO (1) | WO2013160762A2 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102093172B1 (ko) * | 2012-07-11 | 2020-03-25 | 아디쎄오 프랑스 에스에이에스 | 2,4-다이하이드록시부티레이트의 제조 방법 |
CN103642765B (zh) * | 2013-12-25 | 2015-11-18 | 南京工业大学 | 醇脱氢酶突变体及其应用 |
EP3129489B1 (en) * | 2014-04-11 | 2021-10-13 | String Bio Private Limited | Production of succinic acid from organic waste or biogas or methane using recombinant methanotrophic bacterium |
US10415062B2 (en) | 2015-04-07 | 2019-09-17 | Metabolic Explorer | Modified microorganism for the optimized production of 2,4-dihydroxybutyrate |
US10858675B2 (en) | 2015-04-07 | 2020-12-08 | Metabolic Explorer | Modified microorganism for the optimized production of 2,4-dihydroxybutyrate with enhanced 2,4-dihydroxybutyrate efflux |
KR102643377B1 (ko) * | 2015-06-25 | 2024-03-04 | 다이나믹 푸드 잉그리다이언츠 코포레이션 | 2,4-다이하이드록시부티르산의 제조 방법 |
CN105441372A (zh) * | 2015-10-30 | 2016-03-30 | 清华大学 | 一种重组谷氨酸棒杆菌与应用 |
WO2018053004A2 (en) | 2016-09-13 | 2018-03-22 | Allergan, Inc. | Non-protein clostridial toxin compositions |
CN111778200B (zh) * | 2019-04-04 | 2022-11-01 | 中国科学院微生物研究所 | 生产L-天冬氨酸的平台菌、基于该平台菌构建的生产β-丙氨酸的重组菌及其构建方法 |
CN110713962B (zh) * | 2019-09-06 | 2022-06-21 | 南京农业大学 | 一株高产丙二酰辅酶a的基因工程菌及其构建方法和应用 |
DE102021101004B3 (de) | 2021-01-19 | 2022-03-10 | Technische Universität Dresden, Körperschaft des öffentlichen Rechts | Verfahren zur Herstellung von 2,4-Dihydroxybutyrat oder L-Threonin unter Nutzung eines mikrobiellen Stoffwechselweges |
CN115820616A (zh) * | 2022-07-22 | 2023-03-21 | 昆明理工大学 | 一种带荧光标记的噬菌体裂解酶及其应用 |
CN115948482B (zh) * | 2023-02-07 | 2024-02-09 | 中国科学院天津工业生物技术研究所 | 一种2,4-二羟基丁酸生物合成途径的构建方法及应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008046328A1 (fr) | 2006-10-19 | 2008-04-24 | East China University Of Science And Technology | Souche produisant une lactonohydrolase lévorotatoire et son utilisation pour la production d'oxyacide chiral |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
EP0260762B1 (en) | 1986-09-16 | 1994-01-12 | Gist-Brocades N.V. | Penicillium transformants and methods for their production |
US7705215B1 (en) | 1990-04-17 | 2010-04-27 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
HU218465B (hu) | 1989-08-09 | 2000-09-28 | Dekalb Genetics Corporation | Eljárások és kompozíciók stabilan transzformált, termő egyszikű növények és sejtjeik előállítására |
US5693781A (en) | 1991-06-03 | 1997-12-02 | Mitsubishi Chemical Corporation | Promoter DNA fragment from coryneform bacteria |
AU4712193A (en) | 1992-08-19 | 1994-03-15 | Alko Group Limited | Fungal promoters active in the presence of glucose |
FR2734842B1 (fr) | 1995-06-02 | 1998-02-27 | Rhone Poulenc Agrochimie | Sequence adn d'un gene de l'hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant un gene de l'hydroxy-phenyl pyruvate dioxygenase, tolerantes a certains herbicides |
FR2736926B1 (fr) | 1995-07-19 | 1997-08-22 | Rhone Poulenc Agrochimie | 5-enol pyruvylshikimate-3-phosphate synthase mutee, gene codant pour cette proteine et plantes transformees contenant ce gene |
FR2780416B1 (fr) | 1998-06-10 | 2002-12-20 | Rhone Poulenc Nutrition Animal | Procede industriel de production de proteines heterologues chez e. coli et souches utiles pour le procede |
FR2787121B1 (fr) | 1998-12-11 | 2003-09-12 | Aventis Cropscience Sa | Nouvelle methode d'isolement et de selection de genes codant pour des enzymes, et milieu de culture approprie |
AU777674B2 (en) | 1999-05-06 | 2004-10-28 | Adisseo France S.A.S. | Recombinant Penicillium Funiculosum for homologous and heterologous protein production |
JP3687497B2 (ja) * | 2000-06-28 | 2005-08-24 | ダイソー株式会社 | 微生物培養法による光学活性1,2−ジオール類の製造法 |
DE102006025821A1 (de) * | 2006-06-02 | 2007-12-06 | Degussa Gmbh | Ein Enzym zur Herstellung von Mehylmalonatsemialdehyd oder Malonatsemialdehyd |
JP2010501516A (ja) | 2006-08-24 | 2010-01-21 | エボニック デグサ ゲーエムベーハー | D,l−2−ヒドロキシ−4−アルキルチオ酪酸の製造方法 |
SG176656A1 (en) | 2009-06-04 | 2012-01-30 | Genomatica Inc | Microorganisms for the production of 1,4-butanediol and related methods |
US9238829B2 (en) * | 2010-10-28 | 2016-01-19 | Adisseo France S.A.S. | Method of production of 2,4-dihydroxybutyric acid |
-
2013
- 2013-04-25 US US14/397,315 patent/US9890400B2/en active Active
- 2013-04-25 KR KR1020147033085A patent/KR102024109B1/ko active IP Right Grant
- 2013-04-25 WO PCT/IB2013/001071 patent/WO2013160762A2/en active Application Filing
- 2013-04-25 MY MYPI2014002952A patent/MY175391A/en unknown
- 2013-04-25 EP EP13731871.3A patent/EP2841584B1/en active Active
- 2013-04-25 BR BR112014026149A patent/BR112014026149A2/pt not_active Application Discontinuation
- 2013-04-25 CN CN201380022158.2A patent/CN104254612B/zh active Active
- 2013-04-25 IN IN9529DEN2014 patent/IN2014DN09529A/en unknown
- 2013-04-25 JP JP2015507618A patent/JP6342385B2/ja active Active
- 2013-04-25 ES ES13731871T patent/ES2875010T3/es active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008046328A1 (fr) | 2006-10-19 | 2008-04-24 | East China University Of Science And Technology | Souche produisant une lactonohydrolase lévorotatoire et son utilisation pour la production d'oxyacide chiral |
Non-Patent Citations (2)
Title |
---|
Journal of Bacteriology, Vol. 191, pp. 6352-6362 (2009.08.14.) |
YEAST, Vol. 19, pp. 1087-1096 (2002.09.15.) |
Also Published As
Publication number | Publication date |
---|---|
WO2013160762A3 (en) | 2014-01-23 |
US9890400B2 (en) | 2018-02-13 |
US20150159182A1 (en) | 2015-06-11 |
JP6342385B2 (ja) | 2018-06-13 |
KR20150013607A (ko) | 2015-02-05 |
WO2013160762A2 (en) | 2013-10-31 |
CN104254612A (zh) | 2014-12-31 |
BR112014026149A2 (pt) | 2017-07-18 |
EP2841584A2 (en) | 2015-03-04 |
EP2841584B1 (en) | 2021-03-17 |
MY175391A (en) | 2020-06-23 |
ES2875010T3 (es) | 2021-11-08 |
CN104254612B (zh) | 2018-06-01 |
IN2014DN09529A (ko) | 2015-07-17 |
JP2015514433A (ja) | 2015-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102024109B1 (ko) | 2,4-다이하이드록시부티르산의 제조 방법 | |
US11505811B2 (en) | Method for the preparation of 2,4-dihydroxybutyrate | |
KR101990014B1 (ko) | 2,4-디하이드록시부티르산의 제조 방법 | |
CN107828671B (zh) | 用于生产3-羟基丙酸的组合物和方法 | |
US7700319B2 (en) | Production of 3-hydroxypropionic acid using beta-alanine/pyruvate aminotransferase | |
JP2023507482A (ja) | グアニジノ酢酸の発酵生産方法 | |
US11306331B2 (en) | Processes for the production of hydroxycinnamic acids using polypeptides having tyrosine ammonia lyase activity | |
CN107406821B (zh) | 用于生产3-羟基丙酸的突变宿主细胞 | |
KR102079274B1 (ko) | 효소 변경된 대사 산물의 활성 | |
JP7554183B2 (ja) | コリネ型細菌におけるマロニルCoAの供給ならびにコリネ型細菌を用いたポリフェノールおよびポリケチドの産生方法 | |
JP2017534268A (ja) | 有用産物の生産のための改変微生物および方法 | |
CN107099559B (zh) | 用于生物技术制备甲基化的肉桂酸和肉桂酸酯、甲基化的苯乙胺和其偶联产物、尤其肉桂酸酰胺的偶联产物的方法 | |
US20140296571A1 (en) | Microorganisms And Methods For Producing Propionic Acid | |
TWI500767B (zh) | 高產量之異丙醇生產細菌 | |
CN107109446B (zh) | 顺式-5-羟基-l-哌可酸的制造方法 | |
CN114058560A (zh) | 甘氨酸的生产方法 | |
KR101505172B1 (ko) | 3-히드록시프로피온산을 생산하는 재조합 미생물 및 이를 이용한 3-히드록시프로피온산의 생산방법 | |
KR102605543B1 (ko) | 메티오닌-생산 효모 | |
US20140107377A1 (en) | Microorganisms And Methods For Producing Acrylate And Other Products From Propionyl-CoA | |
EP4431609A1 (en) | Method for improving 2, 4 dihydroxybutyric acid production and yield | |
WO2006088110A1 (ja) | 新規な炭酸固定促進タンパク質、及び該タンパク質を用いた炭酸固定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |