KR102527102B1 - 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 - Google Patents
이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 Download PDFInfo
- Publication number
- KR102527102B1 KR102527102B1 KR1020210029469A KR20210029469A KR102527102B1 KR 102527102 B1 KR102527102 B1 KR 102527102B1 KR 1020210029469 A KR1020210029469 A KR 1020210029469A KR 20210029469 A KR20210029469 A KR 20210029469A KR 102527102 B1 KR102527102 B1 KR 102527102B1
- Authority
- KR
- South Korea
- Prior art keywords
- val
- ala
- glu
- gly
- asp
- Prior art date
Links
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 title claims abstract description 184
- 229960003136 leucine Drugs 0.000 title claims abstract description 109
- 239000004395 L-leucine Substances 0.000 title claims abstract description 78
- 235000019454 L-leucine Nutrition 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims description 22
- NJMGRJLQRLFQQX-HYXAFXHYSA-N 2-isopropylmaleic acid Chemical compound CC(C)C(\C(O)=O)=C\C(O)=O NJMGRJLQRLFQQX-HYXAFXHYSA-N 0.000 title abstract description 16
- 229940097413 isopropyl maleate Drugs 0.000 title abstract description 16
- 238000004519 manufacturing process Methods 0.000 claims abstract description 32
- 229920001184 polypeptide Polymers 0.000 claims description 112
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 112
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 112
- 108091033319 polynucleotide Proteins 0.000 claims description 74
- 102000040430 polynucleotide Human genes 0.000 claims description 74
- 239000002157 polynucleotide Substances 0.000 claims description 74
- 125000000539 amino acid group Chemical group 0.000 claims description 63
- 230000000694 effects Effects 0.000 claims description 63
- 239000013598 vector Substances 0.000 claims description 63
- 244000005700 microbiome Species 0.000 claims description 62
- 150000001413 amino acids Chemical group 0.000 claims description 50
- 238000006467 substitution reaction Methods 0.000 claims description 32
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 31
- KPULXFNPTWGJQH-UHFFFAOYSA-N 3-hydroxy-4-oxo-4-propan-2-yloxybutanoic acid Chemical compound CC(C)OC(=O)C(O)CC(O)=O KPULXFNPTWGJQH-UHFFFAOYSA-N 0.000 claims description 28
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 18
- 241000186216 Corynebacterium Species 0.000 claims description 14
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 13
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 11
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 11
- 239000004471 Glycine Substances 0.000 claims description 9
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 9
- 238000012258 culturing Methods 0.000 claims description 9
- 229960000310 isoleucine Drugs 0.000 claims description 8
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 8
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 6
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 6
- 229930195712 glutamate Natural products 0.000 claims description 5
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 claims description 5
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 claims description 4
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 claims description 4
- 241000186249 Corynebacterium sp. Species 0.000 claims description 3
- 230000035772 mutation Effects 0.000 description 69
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 60
- 235000001014 amino acid Nutrition 0.000 description 53
- 229940024606 amino acid Drugs 0.000 description 51
- 108020004414 DNA Proteins 0.000 description 50
- 125000003275 alpha amino acid group Chemical group 0.000 description 48
- 101150087199 leuA gene Proteins 0.000 description 46
- 108090000623 proteins and genes Proteins 0.000 description 42
- 101710102786 ATP-dependent leucine adenylase Proteins 0.000 description 34
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 30
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 30
- 239000002773 nucleotide Substances 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 102000004169 proteins and genes Human genes 0.000 description 30
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 29
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 29
- 108010093581 aspartyl-proline Proteins 0.000 description 29
- 108010092854 aspartyllysine Proteins 0.000 description 29
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 29
- 108010015792 glycyllysine Proteins 0.000 description 29
- 108010012581 phenylalanylglutamate Proteins 0.000 description 29
- 108010005233 alanylglutamic acid Proteins 0.000 description 28
- 108010068380 arginylarginine Proteins 0.000 description 28
- 108010071207 serylmethionine Proteins 0.000 description 28
- 235000018102 proteins Nutrition 0.000 description 27
- 210000004027 cell Anatomy 0.000 description 25
- 210000000349 chromosome Anatomy 0.000 description 23
- 239000002609 medium Substances 0.000 description 23
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 22
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 22
- 108010026333 seryl-proline Proteins 0.000 description 22
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 17
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 16
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 16
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 16
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 16
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 15
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 15
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 15
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 15
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 15
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 15
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 15
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 15
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 15
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 15
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 15
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 15
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 15
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 15
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 15
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 15
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 15
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 15
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 15
- SJPZTWAYTJPPBI-GUBZILKMSA-N Asn-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SJPZTWAYTJPPBI-GUBZILKMSA-N 0.000 description 15
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 15
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 15
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 15
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 15
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 15
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 15
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 15
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 15
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 15
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 15
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 15
- YADSXULAFMJZRL-QEJZJMRPSA-N Gln-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YADSXULAFMJZRL-QEJZJMRPSA-N 0.000 description 15
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 15
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 15
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 15
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 15
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 15
- ZSIDREAPEPAPKL-XIRDDKMYSA-N Glu-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N ZSIDREAPEPAPKL-XIRDDKMYSA-N 0.000 description 15
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 15
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 15
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 15
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 15
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 15
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 15
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 15
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 15
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 15
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 15
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 15
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 15
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 15
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 15
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 15
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 15
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 15
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 15
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 15
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 15
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 15
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 15
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 15
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 15
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 15
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 15
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 15
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 15
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 15
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 15
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 15
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 15
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 15
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 15
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 15
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 15
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 15
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 15
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 15
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 15
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 15
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 15
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 15
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 15
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 15
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 15
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 15
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 15
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 15
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 15
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 15
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 15
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 15
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 15
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 15
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 15
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 15
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 15
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 15
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 15
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 15
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 15
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 15
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 15
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 15
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 15
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 15
- GQNCRIFNDVFRNF-BPUTZDHNSA-N Trp-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O GQNCRIFNDVFRNF-BPUTZDHNSA-N 0.000 description 15
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 15
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 15
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 15
- 108010064997 VPY tripeptide Proteins 0.000 description 15
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 15
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 15
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 15
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 15
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 15
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 15
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 15
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 15
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 15
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 15
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 15
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 15
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 15
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 15
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 15
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 15
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 15
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 15
- 108010044940 alanylglutamine Proteins 0.000 description 15
- 108010087924 alanylproline Proteins 0.000 description 15
- 108010062796 arginyllysine Proteins 0.000 description 15
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 15
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 15
- 108010047857 aspartylglycine Proteins 0.000 description 15
- 108010078144 glutaminyl-glycine Proteins 0.000 description 15
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 15
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 15
- 108010049041 glutamylalanine Proteins 0.000 description 15
- 108010040030 histidinoalanine Proteins 0.000 description 15
- 108010036413 histidylglycine Proteins 0.000 description 15
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 15
- 108010064235 lysylglycine Proteins 0.000 description 15
- 108010034507 methionyltryptophan Proteins 0.000 description 15
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 15
- 108010027345 wheylin-1 peptide Proteins 0.000 description 15
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 14
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 14
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 14
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 14
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 14
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 14
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 14
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 14
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 14
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 14
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 14
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 14
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 14
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 14
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 14
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 14
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 14
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 14
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 14
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 14
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 14
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 14
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 14
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 14
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 14
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 14
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 14
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 14
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 14
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 14
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 14
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 14
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 14
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 14
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 14
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 14
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 14
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 14
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 14
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 14
- 108010066427 N-valyltryptophan Proteins 0.000 description 14
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 14
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 14
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 14
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 14
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 14
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 14
- UCTIUWKCVNGEFH-OBJOEFQTSA-N Pro-Val-Gly-Pro Chemical compound N([C@@H](C(C)C)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 UCTIUWKCVNGEFH-OBJOEFQTSA-N 0.000 description 14
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 14
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 14
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 14
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 14
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 14
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 14
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 14
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 14
- 108010011559 alanylphenylalanine Proteins 0.000 description 14
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 14
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 14
- 108010050848 glycylleucine Proteins 0.000 description 14
- 108010085325 histidylproline Proteins 0.000 description 14
- 108010000761 leucylarginine Proteins 0.000 description 14
- 108010057821 leucylproline Proteins 0.000 description 14
- 108010070643 prolylglutamic acid Proteins 0.000 description 14
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 13
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 102000004190 Enzymes Human genes 0.000 description 12
- 101150106096 gltA gene Proteins 0.000 description 12
- 238000006116 polymerization reaction Methods 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 11
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 10
- 238000004925 denaturation Methods 0.000 description 10
- 230000036425 denaturation Effects 0.000 description 10
- 101150042350 gltA2 gene Proteins 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 108091081024 Start codon Proteins 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 229930027917 kanamycin Natural products 0.000 description 9
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 9
- 229960000318 kanamycin Drugs 0.000 description 9
- 229930182823 kanamycin A Natural products 0.000 description 9
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 8
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 8
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 8
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 7
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 7
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 7
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 7
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 7
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 7
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 206010064571 Gene mutation Diseases 0.000 description 6
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 239000004475 Arginine Substances 0.000 description 5
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 5
- -1 L-leucine Chemical class 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 235000003704 aspartic acid Nutrition 0.000 description 5
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 230000001747 exhibiting effect Effects 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 238000004128 high performance liquid chromatography Methods 0.000 description 5
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 235000015097 nutrients Nutrition 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000014621 translational initiation Effects 0.000 description 5
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 4
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 235000013379 molasses Nutrition 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 101150099953 ilvE gene Proteins 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 229960005190 phenylalanine Drugs 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 229910052697 platinum Inorganic materials 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- QHKABHOOEWYVLI-UHFFFAOYSA-N 3-methyl-2-oxobutanoic acid Chemical compound CC(C)C(=O)C(O)=O QHKABHOOEWYVLI-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- GANZODCWZFAEGN-UHFFFAOYSA-N 5-mercapto-2-nitro-benzoic acid Chemical compound OC(=O)C1=CC(S)=CC=C1[N+]([O-])=O GANZODCWZFAEGN-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 2
- 241000186248 Corynebacterium callunae Species 0.000 description 2
- 241001605246 Corynebacterium crudilactis Species 0.000 description 2
- 241000446654 Corynebacterium deserti Species 0.000 description 2
- 241000291063 Corynebacterium halotolerans Species 0.000 description 2
- 241000024402 Corynebacterium imitans Species 0.000 description 2
- 241000128247 Corynebacterium pollutisoli Species 0.000 description 2
- 241000334675 Corynebacterium singulare Species 0.000 description 2
- 241000186308 Corynebacterium stationis Species 0.000 description 2
- 241000158523 Corynebacterium striatum Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000007857 degradation product Substances 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 150000002484 inorganic compounds Chemical class 0.000 description 2
- 229910010272 inorganic material Inorganic materials 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 239000013587 production medium Substances 0.000 description 2
- 229940107700 pyruvic acid Drugs 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 229960004793 sucrose Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- IHCCLXNEEPMSIO-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 IHCCLXNEEPMSIO-UHFFFAOYSA-N 0.000 description 1
- 108010030844 2-methylcitrate synthase Proteins 0.000 description 1
- YXIKLBXSFOXIPR-UHFFFAOYSA-N 3-hydroxy-4-oxo-4-propoxybutanoic acid Chemical compound CCCOC(=O)C(O)CC(O)=O YXIKLBXSFOXIPR-UHFFFAOYSA-N 0.000 description 1
- BKAJNAXTPSGJCU-UHFFFAOYSA-N 4-methyl-2-oxopentanoic acid Chemical compound CC(C)CC(=O)C(O)=O BKAJNAXTPSGJCU-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 1
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 108010088278 Branched-chain-amino-acid transaminase Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108010071536 Citrate (Si)-synthase Proteins 0.000 description 1
- 102000006732 Citrate synthase Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000595586 Coryne Species 0.000 description 1
- 241001644925 Corynebacterium efficiens Species 0.000 description 1
- 241001134763 Corynebacterium flavescens Species 0.000 description 1
- 241000960580 Corynebacterium testudinoris Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 206010034719 Personality change Diseases 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 108010073771 Soybean Proteins Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- VBPDMBAFBRDZSK-HOUAVDHOSA-N Thr-Asn-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VBPDMBAFBRDZSK-HOUAVDHOSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 1
- ZJKZLNAECPIUTL-JBACZVJFSA-N Trp-Gln-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ZJKZLNAECPIUTL-JBACZVJFSA-N 0.000 description 1
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- DFPAKSUCGFBDDF-ZQBYOMGUSA-N [14c]-nicotinamide Chemical compound N[14C](=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-ZQBYOMGUSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- ZIWNLPKLQFDFEU-FJXQXJEOSA-N calcium;3-[[(2r)-2,4-dihydroxy-3,3-dimethylbutanoyl]amino]propanoic acid Chemical compound [Ca].OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O ZIWNLPKLQFDFEU-FJXQXJEOSA-N 0.000 description 1
- 108010079058 casein hydrolysate Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 239000003317 industrial substance Substances 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- FBAFATDZDUQKNH-UHFFFAOYSA-M iron chloride Chemical compound [Cl-].[Fe] FBAFATDZDUQKNH-UHFFFAOYSA-M 0.000 description 1
- 229910000358 iron sulfate Inorganic materials 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- 229940099596 manganese sulfate Drugs 0.000 description 1
- 239000011702 manganese sulphate Substances 0.000 description 1
- 235000007079 manganese sulphate Nutrition 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001522 polyglycol ester Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 229940001941 soy protein Drugs 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 229960000344 thiamine hydrochloride Drugs 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/06—Alanine; Leucine; Isoleucine; Serine; Homoserine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/03—Acyl groups converted into alkyl on transfer (2.3.3)
- C12Y203/03013—2-Isopropylmalate synthase (2.3.3.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 출원은 이소프로필말레이트 신타제 변이체 및 이를 이용한 L-류신의 생산 방법에 관한 것이다.
Description
본 출원은 이소프로필말레이트 신타제 변이체 및 이를 이용한 L-류신의 생산 방법에 관한 것이다.
L-류신은 필수 아미노산의 일종으로 의약, 식품, 사료첨가물 및 공업 약품 등에 광범위하게 사용되는 고가의 아미노산으로서, 주로 미생물을 이용하여 생산된다. L-류신을 포함한 분지쇄 아미노산의 발효 생산은, 주로 에스케리키아 속 미생물 또는 코리네박테리움 속 미생물을 통해 이루어지며, 피루브산으로부터 여러 단계를 거쳐 2-케토이소카프로산(2-ketoisocaproate)을 전구체로 생합성된다고 알려져 있다(대한민국 등록특허 제10-0220018호, 대한민국 등록특허 제10-0438146호).
상기 L-류신 생합성에 관여하는 효소인 이소프로필말레이트 신타제(isopropylmalate synthase)는 발린 생합성 경로 중 생성되는 2-케토아이소발러레이트(2-ketoisovalerate)를 발린 대신 류신 생합성에 필요한 이소프로필말레이트(isopropylmalate)로 전환하는 류신 생합성의 1 단계 효소로, 류신 생합성 과정에서 중요한 효소이다. 그러나 상기 이소프로필말레이트 신타제는 최종 산물인 L-류신 또는 이의 유도체에 의한 피드백 저해를 받는다. 이에 고농도 류신 생산을 목적으로 피드백 저해를 해제한 이소프로필말레이트 신타제 변이체에 대하여 다양한 선행기술이 존재하나(미국 공개특허 제2015-0079641호, 미국 등록특허 제6403342호), 여전히 더 나은 변이체 발굴에 대한 연구는 지속되고 있다.
이러한 배경 하에서, 본 발명자들은 고농도의 L-류신 생산에 사용할 수 있는 이소프로필말레이트 신타제 변이체를 개발하기 위해 예의 노력한 결과, 신규한 이소프로필말레이트 신타제 변이체를 개발하여, 이를 포함하는 미생물로부터 고수율로 L-류신을 생산할 수 있음을 확인하고, 본 출원을 완성하였다.
본 출원의 하나의 목적은 이소프로필말레이트 신타제(isopropylmalate synthase) 활성을 가지는 변이형 폴리펩티드를 제공하는 것이다.
본 출원의 다른 하나의 목적은 본 출원의 변이형 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원의 다른 하나의 목적은 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.
본 출원의 다른 하나의 목적은 본 출원의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드; 또는 이를 포함하는 벡터;를 포함하는, L-류신을 생산하는 코리네박테리움 속(Corynebacterium sp.) 미생물을 제공하는 것이다.
본 출원의 또 하나의 목적은 본 출원의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드; 또는 이를 포함하는 벡터;를 포함하는, L-류신을 생산하는 코리네박테리움 속 미생물을 배지에서 배양하는 단계를 포함하는, L-류신 생산방법을 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 출원에 기재된 본 출원의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 출원에 포함되는 것으로 의도된다.
상기 목적을 달성하기 위한 본 출원의 하나의 양태는, 이소프로필말레이트 신타제(isopropylmalate synthase) 활성을 가지는 변이형 폴리펩티드를 제공한다.
구체적으로, 상기 변이형 폴리펩티드는 서열번호 1의 아미노산 서열에서 i) 138 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, ii) 162 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, iii) 211 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, iv) 245 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, 및 v) 588 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로의 치환으로 이루어지는 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것일 수 있다.
본 출원에서 용어, "이소프로필말레이트 신타제(isopropylmalate synthase, IPMS)"는 2-케토아이소발러레이트(2-ketoisovalerate)를 아세틸-CoA와 반응시켜 L-류신의 전구체 중 하나인 이소프로필말레이트(isopropylmalate)로 전환하는 효소를 의미한다. 본 출원에서 상기 이소프로필말레이트 신타제는 이소프로필말레이트 합성효소, IPMS, LeuA 단백질 또는 LeuA로 혼용하여 사용될 수 있다.
본 출원에서 상기 LeuA는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 구체적으로 leuA 유전자에 의해 코딩되는 이소프로필말레이트 신타제 활성을 갖는 단백질일 수 있으나, 이에 제한되지 않는다.
상기 LeuA는 코리네박테리움속 미생물 유래의 효소일 수 있고, 구체적으로 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 유래 이소프로필말레이트 신타제일 수 있다.
본 출원의 LeuA는 서열번호 1의 아미노산 서열을 포함하는 것일 수 있으나, 이에 제한되는 것은 아니다. 또한, 상기 LeuA는 서열번호 1의 아미노산 서열과 적어도 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 또는 99 % 상동성을 가지는 폴리펩티드를 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 상기 이소프로필말레이트 신타제에 동일 또는 상응하는 활성을 나타내는 아미노산 서열이라면, 일부 서열이 결손, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원의 범위 내에 포함됨은 자명하다.
또한, 본 출원의 LeuA는 서열번호 1의 아미노산 서열 또는 이와 90% 이상의 동일성을 갖는 아미노산 서열을 가지거나, 상기 아미노산 서열로 이루어지거나, 또는 상기 아미노산 서열로 필수적으로 이루어질(consisting essentially of) 수 있다. 본 출원의 LeuA는 서열번호 1의 아미노산 서열 앞뒤로의 무의미한 서열 추가(즉, 아미노산 서열 N-말단 그리고/또는 C-말단에 단백질의 기능을 변경하지 않는 서열 추가) 또는 자연적으로 발생할 수 있는 돌연변이, 이의 잠재성 돌연변이(silent mutation) 또는 보존적 치환을 가지는 경우를 제외하는 것이 아니다.
상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다. 예를 들면, 양으로 하전된(염기성) 아미노산은 알지닌, 라이신, 및 히스티딘을 포함하고; 음으로 하전된(산성) 아미노산은 글루탐산 및 아스파르트산을 포함하고; 방향족 아미노산은 페닐알라닌, 트립토판 및 타이로신을 포함하고, 소수성 아미노산은 알라닌, 발린, 이소류신, 류신, 메티오닌, 페닐알라닌, 타이로신 및 트립토판을 포함한다.
본 출원에서 용어, "변이형 폴리펩티드(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 상기 열거된 서열(the recited sequence)과 상이하나, 상기 단백질의 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다 상기 변이체는 수 개의 아미노산 치환, 결손 또는 부가에 의해 식별되는 서열(identified sequence)과 상이하다. 이러한 변이체는 일반적으로 상기 단백질의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 단백질의 특성을 평가하여 식별될 수 있다. 즉, 변이체의 능력은 본래 단백질(native protein)에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이형 폴리펩티드를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein) 의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 "변이형 폴리펩티드" 또는 "변이체"는 변이형, 변형, 변이된 단백질, 변이 등의 용어(영문 표현으로는 modification, modified protein, mutant, mutein, divergent, variant 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다.
또한, 변이형 폴리펩티드는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결손 또는 부가를 포함할 수 있다. 예를 들면 폴리펩티드는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이전(transfer)에 관여하는 단백질 N-말단의 시그널(또는 리더) 서열과 컨쥬게이트 할 수 있다. 또한 상기 폴리펩티드는 폴리펩티드를 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
본 출원의 변이형 폴리펩티드는 이소프로필말레이트 신타제 활성을 가질 수 있다. 또한, 본 출원의 변이형 폴리펩티드는 이소프로필말레이트 신타제 활성을 갖는 야생형 폴리펩티드에 비해 강화된 이소프로필말레이트 신타제 활성을 가질 수 있다.
본 출원의 변이형 폴리펩티드는 서열번호 1의 아미노산 서열에서 i) 138 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, ii) 162 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, iii) 211 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, iv) 245 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, 및 v) 588 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로의 치환으로 이루어지는 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것일 수 있고, 구체적으로 서열번호 1의 아미노산 서열에서 i) 138 번째에 상응하는 위치의 아미노산 잔기인 류신이 류신을 제외한 다른 아미노산 잔기로 치환, ii) 162 번째에 상응하는 위치의 아미노산 잔기인 히스티딘이 히스티딘을 제외한 다른 아미노산 잔기로 치환, iii) 211 번째에 상응하는 위치의 아미노산 잔기인 세린이 세린을 제외한 다른 아미노산 잔기로 치환, iv) 245 번째에 상응하는 위치의 아미노산 잔기인 아스파라기닌이 아스파라기닌을 제외한 다른 아미노산 잔기로 치환, 및 v) 588 번째에 상응하는 위치의 아미노산 잔기인 이소류신이 이소류신을 제외한 다른 아미노산 잔기로의 치환으로 이루어지는 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것일 수 있으며, 보다 구체적으로 서열번호 1의 아미노산 서열에서 i) 138 번째에 상응하는 위치의 아미노산 잔기인 류신이 글라이신으로 치환, ii) 162 번째에 상응하는 위치의 아미노산 잔기인 히스티딘이 글루타메이트로 치환, iii) 211 번째에 상응하는 위치의 아미노산 잔기인 세린이 류신으로 치환, iv) 245 번째에 상응하는 위치의 아미노산 잔기인 아스파라기닌이 세린으로 치환, 및 v) 588 번째에 상응하는 위치의 아미노산 잔기인 이소류신이 프롤린으로의 치환으로 이루어지는 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것일 수 있고, 더욱 구체적으로 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개의 치환을 포함하는 것일 수 있다. 상기 2개 이상의 치환은 상기 i) 및 v)의 조합; ii) 및 v)의 조합; iii) 및 v)의 조합; 또는 iv) 및 v)의 조합일 수 있으나, 이에 제한되지 않는다. 상기 4개 이상의 치환은 i), ii), iii), 및 iv)의 조합일 수 있으나, 이에 제한되지 않는다. 상기 5개 이상의 치환은 i), ii), iii), iv) 및 v)의 조합일 수 있다.
본 출원의 변이형 폴리펩티드는 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14의 아미노산 서열을 가지는/포함하는 것일 수 있거나, 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14의 아미노산 서열로 이루어진/필수적으로 이루어진 것일 수 있다. 본 출원의 변이형 폴리펩티드는 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14의 아미노산 서열과 적어도 80%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상, 및 100% 미만의 동일성 또는 상동성을 가지며, 상기 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14의 아미노산 서열에서 i) 138 번째에 상응하는 위치의 아미노산 잔기가 글라이신, ii) 162 번째에 상응하는 위치의 아미노산 잔기가 글루타메이트, iii) 211 번째에 상응하는 위치의 아미노산 잔기가 류신, iv) 245 번째에 상응하는 위치의 아미노산 잔기가 세린, 또는 v) 588 번째에 상응하는 위치의 아미노산 잔기가 프롤린인 폴리펩티드를 포함할 수 있다. 구체적으로, 상기 서열번호 6은 서열번호 1의 아미노산 서열에서 138 번째에 상응하는 위치의 아미노산 잔기인 류신이 글라이신으로 치환된 아미노산 서열일 수 있고, 상기 서열번호 8은 162 번째에 상응하는 위치의 아미노산 잔기인 히스티딘이 글루타메이트로 치환된 아미노산 서열일 수 있고, 상기 서열번호 10는 211 번째에 상응하는 위치의 아미노산 잔기인 세린이 류신으로 치환된 아민노산 서열일 수 있고, 상기 서열번호 12는 588 번째에 상응하는 위치의 아미노산 잔기인 이소류신이 프롤린으로 치환된 아미노산 서열일 수 있으며, 상기 서열번호 14은 245 번째에 상응하는 위치의 아미노산 잔기인 아스파라기닌이 세린으로 치환된 아미노산 서열일 수 있다.
또한, 이러한 동일성 또는 상동성을 가지며 본 출원의 변이형 폴리펩티드에 상응하는 효능을 나타내는 아미노산 서열이라면 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14의 아미노산 서열에서 i) 138 번째, ii) 162 번째, iii) 211 번째, iv) 245 번째, 또는 v) 588 번째 이외에, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이형 폴리펩티드도 본 출원의 범위 내에 포함됨은 자명할 수 있다. 구체적으로, 상기 치환은 (1) 이소프로필말레이트 신타제를 코딩하는 leuA 유전자의 1673 번째 뉴클레오티드인 G가 A로 치환되어 LeuA 단백질의 558 번째에 상응하는 위치의 아미노산인 알지닌이 히스티딘으로 치환되는 변이(R558H), (2) leuA 유전자의 1682 번째, 1683 번째 뉴클레오티드인 GC가 AT로 치환되어 561 번째에 상응하는 위치의 아미노산인 글리신이 아스파르트산으로 치환되는 변이(G561D) 또는 (3) leuA 유전자의 739번째, 740번째 뉴클레오티드인 CC 가 TG 로 치환되어 247번째 아미노산인 프롤린이 시스테인으로 치환되는 변이(P247C) 중 어느 하나 이상을 포함할 수 있으며, 이에 대해서는 전술한 바와 같다.
보다 구체적으로, 상기 변이형 폴리펩티드는 상기 i) 138 번째 변이에 추가로 상기 247번째, 558번째 및 561번째 변이를 포함(서열번호 38); 또는 ii) 162 번째 변이에 추가로 상기 247번째, 558번째 및 561번째 변이를 포함(서열번호 40); 또는 iii) 211 번째 변이에 추가로 상기 247번째, 558번째 및 561번째 변이를 포함(서열번호 42); iv) 245 번째 변이에 추가로 상기 247번째, 558번째 및 561번째 변이를 포함(서열번호 44); v) 588 번째 변이에 추가로 상기 247번째, 558번째 및 561번째 및 변이를 포함(서열번호 46); iii) 211번째 및 v) 588 번째 변이에 추가로 상기 247번째, 558번째 및 561번째 변이를 포함 (서열번호 48); i) 138 번째, ii) 162 번째, iii) 211 번째 및 iv) 245번째 변이에 추가로 상기 247번째, 558번째 및 561번째 변이를 포함(서열번호 50); 또는 i) 138 번째, ii) 162 번째, iii) 211 번째, iv) 245 번째 및 v) 588 번째 변이에 추가로 상기 247번째, 558번째 및 561번째 변이를 포함(서열번호 52);하는 폴리펩티드를 포함할 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어 "상응하는 위치(corresponding position)"는, 단백질 또는 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 단백질 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 레퍼런스 단백질에서의 유사하거나 대응되는 위치를 지칭한다.
본 출원에서 사용되는 단백질 내의 아미노산 잔기 위치에 특정 넘버링이 사용될 수 있다. 예를 들면, 비교하고자 하는 대상 단백질과 본 출원의 단백질의 폴리펩티드 서열을 정렬함으로써, 본 출원의 단백질의 아미노산 잔기 위치에 상응하는 위치에 대해 재넘버링 하는 것이 가능하다.
본 출원에서 용어, '상동성 (homology)' 또는 '동일성 (identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%를 따라 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드 역시 포함됨이 자명하다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
본 출원의 다른 하나의 양태는 본 출원의 변이형 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이형 단백질을 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 변이형 폴리펩티드를 코딩하는 폴리뉴클레오티드는 상기 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14 또는 서열번호 38 또는 서열번호 40 또는 서열번호 42 또는 서열번호 44 또는 서열번호 46 또는 서열번호 48 또는 서열번호 50 또는 서열번호 52로 기재한 아미노산 서열을 코딩하는 염기서열을 포함할 수 있으나, 이에 제한되지 않는다. 구체적으로, 본 출원의 폴리뉴클레오티드는 서열번호 7 또는 서열번호 9 또는 서열번호 11 또는 서열번호 13 또는 서열번호 15 또는 서열번호 39 또는 서열번호 41 또는 서열번호 43 또는 서열번호 45 또는 서열번호 47 또는 서열번호 49 또는 서열번호 51 또는 서열번호 53의 염기서열을 가지거나 포함할 수 있다.
상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 서열번호 7 또는 서열번호 9 또는 서열번호 11 또는 서열번호 13 또는 서열번호 15 또는 서열번호 39 또는 서열번호 41 또는 서열번호 43 또는 서열번호 45 또는 서열번호 47 또는 서열번호 49 또는 서열번호 51 또는 서열번호 53과 상동성 또는 동일성이 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어질 수 있으나, 이에 제한되지 않는다.
또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화하여, 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14 또는 서열번호 38 또는 서열번호 40 또는 서열번호 42 또는 서열번호 44 또는 서열번호 46 또는 서열번호 48 또는 서열번호 50 또는 서열번호 52의 아미노산 서열을 코딩하는 서열이라면 제한없이 포함될 수 있다.
상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60 ℃, 1ХSSC, 0.1% SDS, 구체적으로 60 ℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로 68 ℃, 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.
구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J. Sambrook et al., 상동).
본 출원의 폴리뉴클레오티드에서, 변이형 폴리펩티드는 상기 다른 양태에서 기재한 바와 같다.
본 출원의 다른 하나의 양태는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.
본 출원에서 사용된 용어 "벡터"는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDCM2(대한민국 공개특허 제10-2020-0136813호), pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.
일례로 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원에서 용어 "형질전환"은 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 단백질을 코딩하는 DNA 및 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이형 단백질을 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.
본 출원의 벡터에서, 폴리뉴클레오티드는 상기 다른 양태에서 기재한 바와 같다.
본 출원의 다른 하나의 양태는 본 출원의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드; 또는 이를 포함하는 벡터;를 포함하는, L-류신을 생산하는 코리네박테리움 속(Corynebacterium sp.) 미생물을 제공하는 것이다.
본 출원에서 용어, "L-류신을 생산하는 미생물"은 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.
해당 미생물은 본 출원의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드; 또는 이를 포함하는 벡터; 중 어느 하나 이상을 통해 유전적으로 변형된 미생물, 본 출원의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드;를 발현하도록 변형된 미생물, 본 출원의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드;를 발현하는 재조합 미생물, 또는 본 출원의 변이형 폴리펩티드 활성을 갖는 재조합 미생물일 수 있으나, 이에 제한되지 않는다.
본 출원의 미생물은 자연적으로 이소프로필말레이트 신타제 활성 또는 L-류신 생산능을 가지고 있는 미생물, 또는 이소프로필말레이트 신타제 활성 또는 L-류신 생산능이 없는 모균주에 본 출원의 변이형 폴리펩티드가 발현되거나 L-류신 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다.
구체적으로 본 출원의 미생물은 본 출원의 폴리뉴클레오티드 또는 본 출원의 변이형 폴리펩티드를 코딩하는 유전자를 포함하는 벡터로 형질전환되어, 본 출원의 변이형 폴리펩티드를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 미생물은 본 출원의 변이형 폴리펩티드를 포함하여 L-류신을 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 미생물은 천연의 야생형 미생물 또는 L-류신을 생산하는 미생물에 본 출원의 변이형 폴리펩티드를 코딩하는 폴리뉴클레오티드가 도입됨으로써 본 출원의 변이형 폴리펩티드가 발현되어, L-류신 생산능이 증가된 재조합 미생물일 수 있다. 상기 L-류신 생산능이 증가된 재조합 미생물은, 천연의 야생형 미생물 또는 비변형 미생물에 비하여 L-류신 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.
구체적으로, 본 출원의 미생물은 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 크루디락티스(Corynebacterium crudilactis), 코리네박테리움 데세르티(Corynebacterium deserti), 코리네박테리움 이피시엔스(Corynebacterium efficiens), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 스테셔니스(Corynebacterium stationis), 코리네박테리움 싱굴라레(Corynebacterium singulare), 코리네박테리움 할로톨레란스(Corynebacterium halotolerans), 코리네박테리움 스트리아툼(Corynebacterium striatum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 폴루티솔리(Corynebacterium pollutisoli), 코리네박테리움 이미탄스(Corynebacterium imitans), 코리네박테리움 테스투디노리스(Corynebacterium testudinoris) 또는 코리네박테리움 플라베스센스(Corynebacterium flavescens)일 수 있다.
본 출원의 미생물은 본 출원의 이소프로필말레이트 신타제를 이루는 서열번호 1의 아미노산 서열에서 i) 138 번째, ii) 162 번째, iii) 211 번째, iv) 245 번째, 또는 v) 588 번째를 제외한, 하나 이상의 아미노산 잔기가 다른 아미노산으로 치환된 이소프로필말레이트 신타제를 코딩하는 염기서열을 포함하는 미생물일 수 있고, 구체적으로 상기 치환은 (1) 이소프로필말레이트 신타제를 코딩하는 leuA 유전자의 1673 번째 뉴클레오티드인 G가 A로 치환되어 LeuA 단백질의 558 번째 아미노산인 알지닌이 히스티딘으로 치환되는 변이(R558H), (2) leuA 유전자의 1682 번째, 1683 번째 뉴클레오티드인 GC가 AT로 치환되어 561 번째 아미노산인 글리신이 아스파르트산으로 치환되는 변이(G561D) 또는 (3) leuA 유전자의 739번째, 740번째 뉴클레오티드인 CC 가 TG 로 치환되어 247번째 아미노산인 프롤린이 시스테인으로 치환되는 변이(P247C) 중 어느 하나 이상을 포함할 수 있으며, 이에 대해서는 전술한 바와 같다.
구체적으로, 본 출원의 L-류신을 생산하는 미생물은 상기와 같은 변이를 포함하는 이소프로필말레이트 신타제를 발현함에 따라, 이소프로필말레이트 신타제 활성이 강화된 미생물일 수 있다.
본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성에 비하여 향상된 것을 의미한다.
상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.
상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 강화는
1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가,
2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체,
3) 폴리펩티드를 코딩하는 유전자의 개시코돈 또는 5'-UTR 지역 염기서열의 변형,
4) 폴리펩티드 활성이 증가되도록 상기 폴리펩티드의 아미노산 서열의 변형,
5) 폴리펩티드 활성이 증가되도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형,
6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입,
7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화,
8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식, 또는
9) 상기 1) 내지 8)의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
보다 구체적으로,
상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터가 숙주세포 내 도입된 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 copy 이상 도입된 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.
상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.
공지된 강력한 프로모터의 예에는 cj1 내지 cj7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터 및 yccA 프로모터 등이 있으나, 이에 제한되지 않는다.
상기 3) 폴리펩티드를 코딩하는 유전자의 개시코돈 또는 5'-UTR 지역의 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈으로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열을 변형시키는 방법은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.
상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.
상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.
이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도가 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
보다 구체적으로, 본 출원의 L-류신을 생산하는 미생물은 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14 또는 서열번호 38 또는 서열번호 40 또는 서열번호 42 또는 서열번호 44 또는 서열번호 46 또는 서열번호 48 또는 서열번호 50 또는 서열번호 52를 포함하는 폴리펩티드, 서열번호 6 또는 서열번호 8 또는 서열번호 10 또는 서열번호 12 또는 서열번호 14 또는 서열번호 38 또는 서열번호 40 또는 서열번호 42 또는 서열번호 44 또는 서열번호 46 또는 서열번호 48 또는 서열번호 50 또는 서열번호 52를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 또는 서열번호 7 또는 서열번호 9 또는 서열번호 11 또는 서열번호 13 또는 서열번호 15 또는 서열번호 39 또는 서열번호 41 또는 서열번호 43 또는 서열번호 45 또는 서열번호 47 또는 서열번호 49 또는 서열번호 51 또는 서열번호 53을 포함하는 폴리뉴클레오티드를 추가로 포함하는 미생물일 수 있다.
본 출원의 미생물에서, 변이형 폴리펩티드, 폴리뉴클레오티드, 벡터 및 L-류신 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 하나의 양태는 본 출원의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드; 또는 이를 포함하는 벡터;를 포함하는, L-류신을 생산하는 코리네박테리움 속 미생물을 배지에서 배양하는 단계를 포함하는, L-류신 생산방법을 제공한다.
본 출원에서, 용어 "배양"은 본 출원의 코리네박테리움 글루타미쿰 균주를 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, "배지"는 본 출원의 코리네박테리움 글루타미쿰 균주를 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 코리네박테리움 글루타미쿰 균주의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 코리네박테리움 글루타미쿰 균주를 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다. 구체적으로, 코리네박테리움 속 균주에 대한 배양 배지는 문헌["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)]에서 찾아 볼 수 있다.
본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 리신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.
또한, 본 출원의 코리네박테리움 글루타미쿰 균주의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.
본 출원의 배양에서 배양온도는 20 내지 45℃, 구체적으로는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 배양에 의하여 생산된 L-류신은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.
본 출원의 L-류신 생산방법은, 본 출원의 코리네박테리움 글루타미쿰 균주를 준비하는 단계 또는 상기 균주를 배양하기 위한 배지를 준비하는 단계를 추가로 포함할 수 있다.
본 출원의 L-류신 생산방법은, 상기 배양에 따른 배지 또는 본 출원의 코리네박테리움 글루타미쿰 균주로부터 L-류신을 회수하는 단계를 추가로 포함할 수 있다.
상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 L-류신을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 L-류신을 회수할 수 있다.
또한, 본 출원의 L-류신 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다.
본 출원의 방법에서, 변이형 폴리펩티드, 폴리뉴클레오티드 및 L-류신 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이형 폴리펩티드 또는 본 출원의 폴리뉴클레오티드를 포함하는 코리네박테리움 글루타미쿰 균주; 또는 이를 배양한 배지;를 포함하는 L-류신 생산용 조성물을 제공하는 것이다.
본 출원의 조성물은 아미노산 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 조성물에서, 변이형 폴리펩티드, 폴리뉴클레오티드 및 L-류신 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원에서 이소프로필말레이트 신타제의 활성을 가지는 변이형 폴리펩티드는 야생형 이소프로필말레이트 신타제에 비해 활성이 증가되며, 이를 L-류신을 고수율로 대량 생산하는 데에 응용할 수 있다.
이하 본 출원을 실시예에 의해 보다 상세하게 설명한다. 그러나 하기 실시예는 본 출원을 예시하기 위한 바람직한 실시양태에 불과한 것이며 따라서, 본 출원의 권리범위를 이에 한정하는 것으로 의도되지는 않는다. 한편, 본 명세서에 기재되지 않은 기술적인 사항들은 본 출원의 기술 분야 또는 유사 기술 분야에서 숙련된 통상의 기술자이면 충분히 이해하고 용이하게 실시할 수 있다.
실시예 1. 변이된 이소프로필말레이트 신타제를 암호화하는 DNA 라이브러리 제작
1-1. leuA를 포함하는 벡터 제작
이소프로필말레이트 신타제(Isopropylmaleate synthase) 활성을 가지는 leuA 변이 라이브러리를 제작하기 위해 우선 leuA를 포함하는 재조합 벡터를 제작하였다. 야생형 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 유래의 LeuA 단백질(서열번호 1, Uniprot accession code: P42455)을 암호화하는 leuA 유전자(서열번호 2)를 증폭하기 위하여, 코리네박테리움 글루타미쿰 ATCC13032 야생주의 염색체를 주형으로 서열번호 3 및 4의 프라이머를 94 ℃에서 1 분간 변성, 58 ℃에서 30 초간 결합, 72 ℃에서 1 분간 Pfu DNA 중합효소를 이용한 중합을 25 회 반복하여 PCR을 수행하였다. 사용한 프라이머의 서열은 하기 표 1과 같다.
서열번호 | 서열명 | 서열(5'->3') |
서열번호 3 | Primer 1 | TATGCTTCACCACATGACTTC |
서열번호 4 | Primer 2 | AAATCATTTGAGAAAACTCGAGG |
상기 PCR 산물을 TOPO 클로닝 키트(Invitrogen)를 이용하여 대장균 벡터 pCR2.1에 클로닝하여 'pCR-leuA'를 얻었다.
1-2. leuA 변이 라이브러리 제작
상기 실시예 1-1에서 제작된 벡터를 기반으로 에러-프론 PCR 키트(error-prone PCR kit, clontech Diversify® PCR Random Mutagenesis Kit)를 이용하여 leuA 변이 라이브러리를 제작하였다. 1000bp 당 0 내지 3개의 변이가 발생할 수 있는 조건에서, 상기 표 1에 기재된 서열번호 3과 서열번호 4의 프라이머를 이용하여 PCR 반응을 수행하였다.
구체적으로, 94 ℃에서 30초 동안 프리-히팅(pre-heating) 후, 94 ℃에서 30초 변성, 68 ℃에서 1분 30초 중합을 25회 반복하여 PCR을 수행하였다. 이 때 얻어진 PCR 산물을 메가프라이머(megaprimer, 50~125ng)를 이용하여 95 ℃에서 50초 변성, 60 ℃에서 50초 결합, 68 ℃에서 12분 중합을 25회 반복 수행한 후 DpnI 처리하여, 대장균 DH5α에 열 충격법을 통해 형질 전환하여 카나마이신 25 mg/L이 포함된 LB 고체배지에 도말 하였다. 형질전환된 콜로니 20종을 선별한 후 플라스미드를 획득하여 염기서열을 분석한 결과 2 mutations/kb 빈도로 서로 다른 위치에 변이가 도입된 것을 확인하였다. 약 20,000개의 형질전환된 대장균 콜로니를 취하여 플라스미드를 추출하였고, 이를 'pTOPO-leuA-library' 로 명명하였다.
실시예 2. 제작한 라이브러리 평가 및 변이체 선별
2-1. L-류신 생산량이 증가된 변이 균주 선별
상기 실시예 1-2에서 제작된 pTOPO-pheA-library를 야생형 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) ATCC13032 에 전기천공법으로 형질 전환한 후, 카나마이신 25mg/L를 함유한 영양배지(표 2)에 도말하여 변이 유전자가 삽입된 균주 10,000개의 콜로니를 선별하였다. 선별된 각 콜로니를 ATCC13032/pTOPO_pheA(mt)1부터 ATCC13032/ pTOPO_pheA(mt) 10,000 로 명명하였다.
확보된 10,000개의 콜로니 중 L-류신 생산이 늘어나며 방향족 아미노산 중 L-페닐알라닌 생산량이 증가 및 저감되는 콜로니를 확인하기 위해 각각의 콜로니에 대해 하기와 같은 방법으로 발효 역가 평가를 진행하였다.
배지 종류 | 성분 |
생산배지 | 포도당 100g, (NH4)2SO4 40g, 대두 단백질(Soy Protein) 2.5g, 옥수수 침지 고형분(Corn Steep Solids) 5 g, 요소 3g, KH2PO4 1g, MgSO4·7H2O 0.5g, 바이오틴 100㎍, 티아민 염산염 1,000㎍, 칼슘-판토텐산 2000㎍, 니코틴아미드 3,000㎍, CaCO3 30g; (증류수 1리터 기준), pH 7.0 |
영양배지 | 포도당 10g, 육즙 5g, 폴리펩톤 10g, 염화나트륨 2.5g, 효모엑기스 5g, 한천 20g, 유레아 2g (증류수 1리터 기준) |
상기 표 2의 생산배지 25 ㎖에 25 ug/ml의 카나마이신을 함유하는 250 ㎖ 코너-바풀 플라스크에 각 콜로니를 백금이를 이용하여 접종한 후, 30 ℃에서 60 시간 동안 200 rpm으로 진탕 배양하였다. 배양 종료 후 고속 액체 크로마토그래피(HPLC, SHIMAZDU LC20A)를 이용한 방법에 의해 L-류신 생산량을 측정하였다.
그 결과, 10,000개의 콜로니 중 야생형 코리네박테리움 글루타미쿰 ATCC13032 대비 L-류신 생산능이 가장 향상된 균주 5종(ATCC13032 /pTOPO_leuA(mt)3847, ATCC13032/pTOPO_leuA(mt)4708, ATCC13032 /pTOPO_leuA(mt)5109, ATCC13032/pTOPO_leuA(mt)7563, ATCC13032 /pTOPO_leuA(mt)8459)을 선별하였다. 선별된 균주에서 생산된 L-류신의 농도는 하기 표 3와 같다.
균주명 | L-류신 (g/L) |
ATCC13032 | 0.87 |
ATCC13032/pTOPO_leuA(mt)3847 | 1.23 |
ATCC13032/pTOPO_leuA(mt)4708 | 1.27 |
ATCC13032/pTOPO_leuA(mt)5109 | 1.39 |
ATCC13032/pTOPO_leuA(mt)7563 | 1.19 |
ATCC13032/pTOPO_leuA(mt)8459 | 1.25 |
상기 표 3에 나타난 바와 같이, leuA 유전자에 변이가 있는 코리네박테리움 글루타미쿰 ATCC13032/pTOPO_leuA(mt)3847은 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신 생산능이 약 1.41배 향상됨을 확인하였다. 또한, ATCC13032/pTOPO_leuA(mt)4708, ATCC13032/pTOPO_leuA(mt)5109, ATCC13032/pTOPO_leuA(mt)7563, ATCC13032/pTOPO_leuA(mt)8459는 모균주 대비 각각 약 1.45배, 1.59배, 1.36배, 1.38배 향상됨을 확인하였다.
2-2. L-류신 생산량이 증가된 변이 균주의 변이 확인
선별된 변이 균주 5종의 leuA 유전자 변이를 확인하기 위하여, 상기 표 1에 기재된 서열번호 3와 서열번호 4의 프라이머를 이용하여 각 변이 균주의 DNA를 주형으로 하여 94℃에서 5분간 변성 후, 94 ℃에서 30초 변성, 55 ℃에서 30초 결합, 72 ℃에서 1분 30초 중합을 30회 반복한 후, 72 ℃에서 5분 중합의 조건으로 PCR을 수행하고 DNA시퀀싱을 진행하였다.
시퀀싱 결과, ATCC13032/pTOPO_leuA(mt)3847 균주는 서열번호 2의 leuA 유전자의 412번째, 413번째 뉴클레오티드인 C와 T가 모두 G로 치환되어 있음을 확인하였다. 이는 LeuA 단백질의 138번째(번역 개시코돈을 35 개 뒤로 표기하여 LeuA 단백질이 581 개의 아미노산으로 이루어진 것(서열번호 5)으로 공지한 문헌에 기초하는 경우는 103 번째; 이하 138 번째로만 표기) 아미노산인 류신이 글라이신으로 치환된 변이체(이하, L138G)를 암호화할 수 있음을 의미한다. LeuA 변이체(L138G)의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기서열은 서열번호 6 및 서열번호 7과 같다.
ATCC13032/pTOPO_leuA(mt)4708 균주는 leuA 유전자의 484번째, 486번째 뉴클레오티드인 C가 모두 G로 치환되어 있음을 확인하였다. 이는 LeuA 단백질의 162번째(번역 개시코돈을 35 개 뒤로 표기하여 LeuA 단백질이 581 개의 아미노산으로 이루어진 것(서열번호 5)으로 공지한 문헌에 기초하는 경우는 127 번째; 이하 162 번째로만 표기) 아미노산인 히스티딘이 글루타메이트로 치환된 변이체(이하, H162E)를 암호화할 수 있음을 의미한다. LeuA 변이체(H162E)의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기서열은 서열번호 8 및 서열번호 9와 같다.
ATCC13032/pTOPO_leuA(mt)5109 균주는 leuA 유전자의 631번째-633번째 뉴클레오티드인 TCC가 CTT로 치환되어 있음을 확인하였다. 이는 LeuA 단백질의 211번째(번역 개시코돈을 35 개 뒤로 표기하여 LeuA 단백질이 581 개의 아미노산으로 이루어진 것(서열번호 5)으로 공지한 문헌에 기초하는 경우는 176 번째; 이하 211 번째로만 표기) 아미노산인 세린이 류신로 치환된 변이체(이하, S211L)를 암호화할 수 있음을 의미한다. LeuA 변이체(S211L)의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기서열은 서열번호 10 및 서열번호 11과 같다.
ATCC13032/pTOPO_leuA(mt)7563 균주는 leuA 유전자의 1762번째-1763번째 뉴클레오티드인 AT가 CC로 치환되어 있음을 확인하였다. 이는 LeuA 단백질의 588번째(번역 개시코돈을 35 개 뒤로 표기하여 LeuA 단백질이 581 개의 아미노산으로 이루어진 것(서열번호 5)으로 공지한 문헌에 기초하는 경우는 553 번째; 이하 588 번째로만 표기) 아미노산인 이소류신이 프롤린으로 치환된 변이체(이하, I588P)를 암호화할 수 있음을 의미한다. LeuA 변이체(I588P)의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기서열은 서열번호 12 및 서열번호 13과 같다.
또한, ATCC13032/pTOPO_leuA(mt)8459 균주는 leuA 유전자의 733번째-734번째 뉴클레오티드인 AA가 TC로 치환되어 있음을 확인하였다. 이는 LeuA 단백질의 245번째(번역 개시코돈을 35 개 뒤로 표기하여 LeuA 단백질이 581 개의 아미노산으로 이루어진 것(서열번호 5)으로 공지한 문헌에 기초하는 경우는 210 번째; 이하 245 번째로만 표기) 아미노산인 아스파라지닌이 세린으로 치환된 변이체(이하, N245S)를 암호화할 수 있음을 의미한다. LeuA 변이체(N245S)의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기서열은 서열번호 14 및 서열번호 15와 같다.
이하 실시예에서는, 상기 변이(L138G, H162E, S211L, N245S, I588P)가 코리네 박테리움 속 미생물의 L-류신 생산량에 영향을 미치는지 확인하고자 하였다.
실시예 3. 선별된 변이 균주의 L-류신 생산능 확인
3-1. leuA 변이를 포함하는 삽입 벡터 제작
상기 실시예 2에서 선별된 변이를 균주 내로 도입하기 위해 삽입용 벡터를 제작하고자 하였다. leuA(L138G, H162E, S211L, N245S, I588P) 변이 도입용 벡터 제작은 위치 지정 돌연변이 생성(Site directed mutagenesis) 방법을 사용하였다. 구체적으로, 야생형 코리네박테리움 글루타미쿰 ATCC13032 균주의 염색체를 주형으로 L138G 변이를 생성하기 위해 서열번호 16 및 서열번호 17의 프라이머 쌍, 서열번호 18 및 서열번호 19의 프라이머 쌍을 이용하고, H162E 변이를 생성하기 위해 서열번호 16 및 서열번호 20의 프라이머 쌍, 서열번호 19 및 서열번호 21의 프라이머 쌍을 이용하여 PCR을 수행하였다. S211L 변이를 생성하기 위해 서열번호 16 및 서열번호 22의 프라이머 쌍, 서열번호 19 및 서열번호 23의 프라이머 쌍을 이용하고, N245S 변이를 생성하기 위해 서열번호 16 및 서열번호 24의 프라이머 쌍, 서열번호 19 및 서열번호 25의 프라이머 쌍을 이용하여 PCR을 수행하였다. I588P 변이를 생성하기 위해 서열번호 16 및 서열번호 26의 프라이머 쌍, 서열번호 19 및 서열번호 27의 프라이머 쌍을 이용하여 PCR을 수행하였다. 구체적으로, 94 ℃에서 5분간 변성 후에 94 ℃에서 30초 변성, 55 ℃에서 30초 결합, 72 ℃에서 1분 30초 중합을 30회 반복한 후, 72 ℃에서 5분 중합 조건으로 PCR을 수행하였다. 사용한 프라이머의 구체적인 서열은 하기 표 4에 기재하였다.
서열번호 | 서열명 | 서열(5'->3') |
서열번호 16 | Primer 3 | GGTCGACTCTAGAGGATCCCCTATGCTTCACCACATGACTTC |
서열번호 17 | Primer 4 | CAGGTGCTCACGAGCCTGAACCccAACCTGAATGGTGACATC |
서열번호 18 | Primer 5 | GACGATGTCACCATTCAGGTTggGGTTCAGGCTCGTGAG |
서열번호 19 | Primer 6 | GTGAATTCGAGCTCGGTACCCAAATCATTTGAGAAAACTCGAGGC |
서열번호 20 | Primer 7 | GATGGAGGTTGAGTTGTAGAAcTcCACGATAACGTTTTTTGCG |
서열번호 21 | Primer 8 | GGCGCAAAAAACGTTATCGTGgAgTTCTACAACTCAACCTCC |
서열번호 22 | Primer 9 | AGTGCCGGTGAAGGACTCAGGaagGTACTGCCAGCGCC |
서열번호 23 | Primer 10 | ACCAACTGGCGCTGGCAGTACcttCCTGAGTCCTTCACC |
서열번호 24 | Primer 11 | CATCTCAACGGTGGAACACAGGgaGATGATCATTGGGTTCTC |
서열번호 25 | Primer 12 | CCTGAGAACCCAATGATCATCtcCCTGTGTTCCACCG |
서열번호 26 | Primer 13 | TGCCTTCAGCGAAGCGTAGGTGggGGAGCCAGCGATGC |
서열번호 27 | Primer 14 | GGCGTCGGCATCGCTGGCTCCccCACCTACGCTTCGCTG |
상기 PCR 산물을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터와 인퓨전(In-Fusion) 효소를 이용해 DNA 단편 간의 말단 15 개 염기의 상동서열을 퓨전시켜 클로닝하여 LeuA의 아미노산을 치환하는 벡터 'pDCM2-leuA(L138G)', 'pDCM2-leuA(H162E)', 'pDCM2-leuA(S211L)', 'pDCM2-leuA(N245S)', 'pDCM2-leuA(I588P)'를 제작하였다. 또한 변이체를 조합함에 따라 leuA의 아미노산을 치환하는 벡터 'pDCM2-leuA(S211L, I588P), pDCM2-leuA(L138G, H162E, S211L, N245S)', 'pDCM2-leuA(L138G, H162E, S211L, N245S, I588P)'를 제작하였다.
3-2. 코리네박테리움 글루타미쿰 ATCC13032 균주 내 변이체 도입 및 평가
상기 실시예 3-1에서 제작한 pDCM2-leuA(L138G), pDCM2-leuA(H162E), pDCM2-leuA(S211L), pDCM2-leuA(N245S), pDCM2-leuA(I588P), pDCM2-leuA(S211L, I588P), pDCM2-leuA(L138G, H162E, S211L, N245S), pDCM2-leuA(L138G, H162E, S211L, N245S, I588P) 벡터를 코리네박테리움 글루타미쿰 ATCC13032 균주에 전기천공법으로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 leuA 유전자 변이 도입의 여부는 서열번호 3과 서열번호 4의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 변이가 도입되었음을 확인하였다. 제작된 균주는 총 8종이며, 각각 'ATCC13032_leuA_L138G', 'ATCC13032_leuA_H162E, ATCC13032_leuA_S211L', 'ATCC13032_leuA_N245S', 'ATCC13032_leuA_I588P', 'ATCC13032_leuA_(S211L, I588P)' 'ATCC13032_leuA_(L138G, H162E, S211L, N245S)', 'ATCC13032_leuA_(L138G, H162E, S211L, N245S, I588P)' 로 명명하였다.
상기 제작된 총 8종의 균주의 L-류신 생산능을 평가하기 위해 플라스크 발효역가 평가를 진행하였다. 각각의 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바풀 플라스크에 모균주인 코리네박테리움 글루타미쿰 ATCC13032 및 상기 제작한 ATCC13032_leuA_L138G, ATCC13032_leuA_H162E, ATCC13032_leuA_S211L, ATCC13032_leuA_N245S, ATCC13032_leuA_I588P, ATCC13032_leuA_(S211L, I588P), ATCC13032_leuA_(L138G, H162E, S211L, N245S), ATCC13032 _leuA_(L138G, H162E, S211L, N245S, I588P)을 각각 1백금이 접종한 후, 30 ℃에서 60 시간 동안 200 rpm으로 진탕 배양하여 L-류신을 생산하였다. 배양종료 후 HPLC로 L-류신의 생산량을 측정하였다. 실험한 각 균주에 대한 배양액 중의 류신 농도는 하기 표 5와 같다.
균주명 | 류신 (g/L) |
ATCC13032 | 0.87 |
ATCC13032_leuA_L138G | 1.27 |
ATCC13032_leuA_H162E | 1.30 |
ATCC13032_leuA_S211L | 1.38 |
ATCC13032_leuA_N245S | 1.22 |
ATCC13032_leuA_I588P | 1.20 |
ATCC13032_leuA_(S211L, I588P) | 1.32 |
ATCC13032_leuA_(L138G, H162E, S211L, N245S) | 1.36 |
ATCC13032_leuA_(L138G, H162E, S211L, N245S, I588P) | 1.35 |
상기 표 5에 나타난 바와 같이, leuA 유전자에 L138G 변이가 있는 ATCC13032 _leuA_L138G는 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신의 수율이 약 1.45 배 향상되었고, H162E 변이가 있는 ATCC13032_leuA_H162E는 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신의 수율이 약 1.49 배 향상되었고, S211L 변이가 있는 ATCC13032_leuA_S211L는 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신의 수율이 약 1.58 배 향상되었고, N245S 변이가 있는 ATCC13032_leuA_N245S는 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신의 수율이 약 1.40 배 향상되었고, I588P 변이가 있는ATCC13032_leuA_I588P는 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신의 수율이 약 1.37 배 향상되었고, ATCC13032_leuA_(S211L, I588P)는 모균주인 L-류신의 수율이 약 1.51 배 향상되었다. ATCC13032_leuA_(L138G, H162E, S211L, N245S)와 ATCC13032_leuA_(L138G, H162E, S211L, N245S, I588P)는 모균주인 코리네박테리움 글루타미쿰 에 비해 L-류신의 수율이 약 1.56 배 향상됨을 확인하였다.
실시예 4. 류신 생산주에서 leuA 선별 변이의 류신 생산능 확인
코리네박테리움 속 야생형의 균주는 류신을 생산하더라도 아주 극미량이 생산될 뿐이다. 이에 야생형 코리네박테리움 글루타미쿰 ATCC13032 유래의 류신 생산 균주를 제작하고, 선별한 변이를 도입하여 류신 생산능을 확인 하는 실험을 진행하였다. 구체적인 실험 방법 및 결과는 다음과 같다.
4-1. L-류신 생산주 CJL-8109 균주 제작
고농도의 L-류신 생산을 위한 균주로서 (1) leuA 유전자의 1673 번째 뉴클레오티드인 G가 A로 치환되어 LeuA 단백질의 558 번째 아미노산인 알지닌이 히스티딘으로 치환되는 변이(R558H), (2) leuA 유전자의 1682 번째, 1683 번째 뉴클레오티드인 GC가 AT로 치환되어 561 번째 아미노산인 글리신이 아스파르트산으로 치환되는 변이(G561D), 및 (3) leuA 유전자의 739번째, 740번째 뉴클레오티드인 CC 가 TG 로 치환되어 247번째 아미노산인 프롤린이 시스테인으로 치환되는 변이(P247C)를 포함하는 야생형 코리네박테리움 글루타미쿰 ATCC13032 유래의 균주를 제조하였다.
구체적으로, leuA 유전자 변이(R558H, G561D)를 포함하는 pDCM2-leuA(R558H, G561D) 벡터(대한민국 공개특허 제10-2018-0077008호)를 코리네박테리움 글루타미쿰 ATCC13032에 전기천공법으로 형질전환하고 카나마이신 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차를 거쳐, leuA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 서열번호 28 및 55의 프라이머를 이용하여 PCR(94 ℃ 5분 후, 94 ℃ 30초/55 ℃ 30초/72 ℃ 90초 30회 반복, 72 ℃ 5분)을 수행하고 염기서열을 분석하여 R558H, G561D 변이가 도입된 것을 확인하였다. 사용한 프라이머의 구체적인 서열은 하기 표 6에 기재하였다. pDCM2-leuA(R558H, G561D) 벡터로 형질전환된 ATCC13032_leuA_(R558H, G561D) 균주를 'CJL-8100'으로 명명하였다.
서열번호 | 서열명 | 서열(5'->3') |
서열번호 28 | Primer 15 | AACACGACCGGCATCCCGTCGC |
서열번호 29 | Primer 16 | AAATCATTTGAGAAAACTCGAGG |
서열번호 19 | Primer 6 | GTGAATTCGAGCTCGGTACCCAAATCATTTGAGAAAACTCGAGGC |
서열번호 54 | Primer 27 | GGTGATCATCTCAACGGTGGAACACAGGTTGATGATCATTGGGTT |
서열번호 55 | Primer 28 | AACCCAATGATCATCAACCTGTGTTCCACCGTTGAGATGATCACC |
상기 L-류신 생산 균주인 CJL-8100에 변이(P247C)를 도입하기 위해 삽입용 벡터를 제작하였다.
구체적으로, CJL-8100 균주의 염색체를 주형으로 서열번호 28 및 29의 프라이머, 서열번호 54 및 55의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR은 94 ℃에서 5분간 변성 후, 94 ℃에서 30초, 55 ℃에서 30초, 72 ℃에서 1분 30초를 30회 반복한 후, 72 ℃에서 5분간 중합반응을 수행하였다. 그 결과 얻어진 PCR 산물을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터와 In-Fusion 효소를 이용해 DNA 단편 간의 말단 15 개 염기의 상동서열을 퓨전시켜 클로닝하여, 야생형 균주의 LeuA 아미노산 서열에서 558 번째 아미노산인 알지닌이 히스티딘으로 치환되고, 561 번째 아미노산인 글리신이 아스파르트산으로 치환된 LeuA 변이체를 암호화하는 leuA 변이를 포함하고, LeuA의 247 번째 아미노산인 프롤린(Pro)을 시스테인(Cys)으로 치환하는 벡터 pDCM2-leuA(P247C, R558H, G561D)를 제작하였다.
상기 pDCM2-leuA(P247C, R558H, G561D) 벡터를 야생형 코리네박테리움 글루타미쿰 ATCC13032에 전기천공법으로 형질전환하고 카나마이신 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차를 거쳐, leuA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 서열번호 3과 서열번호 4의 프라이머를 이용하여 PCR(94 ℃ 5분 변성 후, 94 ℃ 30초 변성, 55 ℃ 30초 결합, 72 ℃ 90초 중합 30회 반복, 72 ℃ 5분 중합)을 수행하고 염기서열을 분석하여 P247C, R558H, 및 G561D 변이가 도입된 것을 확인하였다. pDCM2-leuA(P247C, R558H, G561D) 벡터로 형질전환된 ATCC13032_leuA_(P247C, R558H, G561D) 균주를 'CA13-8105'으로 명명하였다.
상기 CA13-8105는 부다페스트조약 하의 수탁기관인 한국미생물보존센터에 2020년 4월 29일자로 기탁하여 수탁번호 KCCM12709P를 부여받았다.
제작한 CA13-8105 균주에서 L-류신 생산능을 높이기 위해 분지쇄 아미노산 아미노트랜스퍼라제(branched-chain amino acid aminotransferase)를 코딩하는 유전자인 ilvE 변이체(V156A)가 도입된 균주를 제작하였다(대한민국 등록특허 제10-2143964호). 구체적으로 상기의 ilvE 유전자 변이를 포함하는 pDCM2-ilvE(V156A) 벡터를 코리네박테리움 글루타미쿰 CJL-8100에 전기천공법으로 형질전환하고 카나마이신 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차를 거쳐, ilvE 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 하기 표 7의 서열번호 30 및 서열번호 31의 프라이머 쌍을 이용하여 PCR(94 ℃ 5분 후, 94 ℃ 30초/55 ℃ 30초/72 ℃ 90초 30회 반복, 72 ℃ 5분)을 수행하고 염기서열을 분석하여 V156A 변이가 도입된 것을 확인하였다. pDCM2-ilvE(V156A) 벡터로 형질전환된 균주를 'CJL-8108'로 명명하였다.
서열번호 | 서열명 | 서열(5'->3') |
서열번호 30 | Primer 23 | GTCACCCGATCGTCTGAAG |
서열번호 31 | Primer 24 | GTCTTAAAACCGGTTGAT |
제작한 CJL-8108 균주에 L-류신 생산능을 높여주기 위해 시트레이트 신타아제(Citrate Synthase) 활성을 약화시킨 gltA 변이체(M312I)가 도입된 균주를 제작하였다.
구체적으로, gltA(M312I) 변이 도입용 벡터 제작은 위치 지정 돌연변이 생성(Site directed mutagenesis) 방법을 사용하였다. 야생형 코리네박테리움 글루타미쿰 ATCC13032의 염색체를 주형으로 하기 표 8의 프라이머를 이용하여 PCR을 수행하였다. PCR은 94 ℃에서 5분간 변성 후, 94 ℃에서 30초, 55 ℃에서 30초, 72 ℃에서 1분 30초를 30회 반복한 후, 72 ℃에서 5분간 중합반응을 수행하였다. 그 결과 얻어진 유전자 단편을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터와 인퓨전(In-Fusion) 효소를 이용해 DNA 단편간의 말단 15개 염기의 상동서열을 결합시켜 클로닝하여 312번째 아미노산인 메티오닌을 이소류신으로 치환하는 벡터 pDCM2-gltA(M312I)를 제작하였다.
서열번호 | 서열명 | 서열(5'->3') |
32 | gltA M312I Up F | GTGAATTCGAGCTCGGTACCCGCGGGAATCCTGCGTTACCGC |
33 | gltA M312I Up R | TGTAAACGCGGTGTCCGAAGCCGATGAGGCGGACGCCGTCTT |
34 | gltA M312I Down F | AAGACGGCGTCCGCCTCATCGGCTTCGGACACCGCGTTTACA |
35 | gltA M312I Down R | GGTCGACTCTAGAGGATCCCCTTAGCGCTCCTCGCGAGGAAC |
상기의 gltA 유전자 변이를 포함하는 pDCM2-gltA(M312I) 벡터를 코리네박테리움 글루타미쿰 CJL-8108에 전기천공법으로 형질전환하고 카나마이신 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차를 거쳐, gltA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 하기 표 9의 서열번호 36 및 서열번호 37의 프라이머를 이용하여 PCR(94 ℃ 5분 후, 94 ℃ 30초/55 ℃ 30초/72 ℃ 90초 30회 반복, 72 ℃ 5분)을 수행하고 염기서열을 분석하여 M312I 변이가 도입된 것을 확인하였다. pDCM2-gltA(M312I) 벡터로 형질전환된 균주를 'CJL-8109'로 명명하였다.
서열번호 | 서열명 | 서열(5'->3') |
서열번호 36 | Primer 25 | CAATGCTGGCTGCGTACGC |
서열번호 37 | Primer 26 | CTCCTCGCGAGGAACCAACT |
4-2. leuA 변이를 포함하는 삽입 벡터 제작
실시예 4-1에서 제작한 L-류신 생산균주인 CJL-8109에 상기 실시예 2에서 선별된 변이(L138G, H162E, S211L, N245S, I588P)를 도입하기 위해 삽입용 벡터를 제작하고자 하였다.
CJL-8109 균주의 염색체를 주형으로 상기 표 4의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR은 94 ℃에서 5분간 변성 후, 94 ℃에서 30초 변성, 55℃에서 30초 결합, 72℃에서 1분 30초 중합을 30회 반복한 후, 72 ℃에서 5분간 중합하여 수행하였다. 그 결과 얻어진 PCR 산물을 SmaI 제한효소로 절단 시킨 선상의 pDCM2 벡터와 인퓨전 효소를 이용해 DNA 단편 간의 말단 15 개 염기의 상동서열을 퓨전시켜 클로닝하여 총 8개의 벡터 'pDCM2-leuA(L138G, P247C, R558H, G561D)', 'pDCM2-leuA(H162E, P247C, R558H, G561D)', 'pDCM2-leuA(S211L, P247C, R558H, G561D)', 'pDCM2-leuA(N245S, P247C, R558H, G561D)', 'pDCM2-leuA(P247C, R558H, G561D, I588P)', 'pDCM2-leuA(S211L, P247C, I588P)', 'pDCM2-leuA(L138G, H162E, S211L, N245S, P247C, R558H, G561D)', 'pDCM2-leuA(L138G, H162E, S211L, N245S, P247C, R558H, G561D, I588P)'를 제작하였다.
4-3. CJL-8109 균주 내 leuA 변이체 도입 및 평가
L-류신 생산 균주인 CJL-8109을 상기 실시예 4-2에서 제작한 벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질 전환된 균주의 leuA 유전자 변이 도입의 여부는 서열번호 3과 서열번호 4의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주내 leuA 변이가 도입되었음을 확인하였다. 제작된 총 8종의 균주는 하기 표 11와 같이 명명하였고, 변이를 포함하는 변이체의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기서열의 서열을 하기 표 10에 기재하였다.
균주명 | 균주 번호 | 서열번호 |
CJL-8109_leuA_L138G, P247C, R558H, G561D | CJL-8117 | 서열번호 38, 39 |
CJL-8109_leuA_H162E, P247C, R558H, G561D | CJL-8118 | 서열번호 40, 41 |
CJL-8109_leuA_S211L, P247C, R558H, G561D | CA13-8119 | 서열번호 42, 43 |
CJL-8109_leuA_N245S, P247C, R558H, G561D | CJL-8120 | 서열번호 44, 45 |
CJL-8109_leuA_I588P, P247C, R558H, G561D | CJL-8121 | 서열번호 46, 47 |
CJL-8109_leuA_S211L, P247C, R558H, G561D, I588P | CJL-8122 | 서열번호 48, 49 |
CJL-8109_leuA_L138G, H162E, S211L, N245S, P247C, R558H, G561D | CJL-8123 | 서열번호 50, 51 |
CJL-8109_leuA_L138G, H162E, S211L, N245S, P247C, R558H, G561D, I588P | CJL-8125 | 서열번호 52, 53 |
이후, 야생형 코리네박테리움 글루타미쿰 ATCC13032, 제작된 CJL-8109, CJL-8117, CJL-8118, CA13-8119, CJL-8120, CJL-8121, CJL-8122, CJL-8123, CJL-8125 균주의 L-류신의 생산능을 평가하였다. 구체적으로, 실시예 2-1의 방법으로 플라스크 배양을 진행하였고, 배양 종료 후 HPLC를 이용하여, 모균주 및 변이 균주의 L-류신 생산량을 측정하고 그 결과를 하기 표 11에 기재하였다.
균주명 | L-류신 (g/L) |
ATCC13032 | 0.87 |
CJL-8109 | 2.89 |
CJL-8117 | 3.55 |
CJL-8118 | 3.67 |
CA13-8119 | 4.03 |
CJL-8120 | 3.46 |
CJL-8121 | 3.48 |
CJL-8122 | 4.52 |
CJL-8123 | 4.02 |
CJL-8125 | 4.01 |
상기 표 11에 나타난 바와 같이, leuA 유전자에 L138G, H162E, S211L, N245S, I588P, S211L/I588P, L138G/H162E/S211L/N245S 또는 L138G/H162E/S211L/N245S/I588P 변이가 추가로 있는 L-류신 생산균주인 CJL-8117, CJL-8118, CA13-8119, CJL-8120, CJL-8121, CJL-8122, CJL-8124 및 CJL-8125는 모균주인 야생형 코리네박테리움 글루타미쿰 ATCC13032에 비해 L-류신 생산능이 약 4 내지 5 배 향상됨을 확인하였다. 또한 L-류신 생산균주 코리네박테리움 글루타미쿰 CJL-8117, CJL-8118, CA13-8119, CJL-8120, CJL-8121, CJL-8122, CJL-8123, 및 CJL-8125는 모균주인 코리네박테리움 글루타미쿰 CJL-8109에 비해 L-류신 생산능이 약 1.2 내지 1.6 배 향상됨을 확인하였다.
상기 결과를 통해 LeuA 단백질의 아미노산 서열 중 138번째, 162번째, 211번째, 245번째, 588번째 위치의 아미노산이 L-류신 생산 활성에 중요한 위치임을 확인할 수 있다.
4-4. LeuA 변이체가 도입된 균주에서의 이소프로필말레이트 신타제 활성 측정
실시예 4-3에서 제작한 L-류신 생산균주인 CJL-8109 및 CJL-8117, CJL-8118, CA13-8119, CJL-8120, CJL-8121, CJL-8122, CJL-8123 및 CJL-8125에서 이소프로필 말레이트 신타제의 활성을 측정하기 위해, 하기와 같은 방법으로 실험하였다.
상기 표 2의 생산배지 25 ㎖을 함유하는 250㎖ 코너-바풀 플라스크에 상기 균주(CJL-8109, CJL-8117, CJL-8118, CA13-8119, CJL-8120, CJL-8121, CJL-8122, CJL-8123, CJL-8125) 및 야생형 코리네박테리움 글루타미쿰 ATCC13032를 각각 1 백금이 접종한 후, 30℃에서 16 시간 동안 200rpm으로 진탕 배양하였다. 배양 종료 후 배양액을 원심분리하여 상층액은 버리고, 펠렛을 용균완충용액으로 세척 및 혼탁하고 세포를 파쇄하였다. 용균액의 단백질 정량은 브래드포드법을 따랐으며, 100㎍/㎖의 단백질이 포함된 용균액을 이용하였다. 이때, 생성되는 CoA를 이용한 환원에 의해 DTNB(5,5'-디티오비스-(2-니트로벤조산), 엘만(Ellman) 시약)로부터 형성된 티오니트로벤조에이트(TNB)로 인한 412nm에서의 흡광 변화를 측정하여 이소프로필말레이트 신타제 효소의 활성을 측정하였다. 각 균주에서의 이소프로필말레이트 신타제의 활성 측정 결과는 하기 표 12와 같다.
균주 | 상대적인 이소프로필말레이트 신타제 활성 (%) |
ATCC13032 | 100 |
CJL-8109 | 118 |
CJL-8117 | 121 |
CJL-8118 | 125 |
CA13-8119 | 138 |
CJL-8120 | 122 |
CJL-8121 | 130 |
CJL-8122 | 132 |
CJL-8123 | 135 |
CJL-8125 | 136 |
다음으로, 상기 효소의 류신에 대한 피드백 저해에 대한 해제 정도를 확인하기 위해 류신이 2g/L 첨가된 조건에서 100 ㎍/㎖의 단백질이 포함된 용균액을 이용하였을 때 생성되는 CoA를 측정함으로써 이소프로필말레이트 신타제의 활성을 측정하였다. 각 균주에서의 이소프로필말레이트 신타제의 활성 측정 결과는 하기 표 13과 같다.
균주 | 류신 0 g/l | 류신 2 g/l |
상대적인 이소프로필말레이트 신타제 활성 (%) | ||
ATCC13032 | 100 | 36 |
CJL-8109 | 100 | 83 |
CJL-8117 | 100 | 83 |
CJL-8118 | 100 | 83 |
CA13-8119 | 100 | 93 |
CJL-8120 | 100 | 85 |
CJL-8121 | 100 | 88 |
CJL-8122 | 100 | 92 |
CJL-8123 | 100 | 90 |
CJL-8125 | 100 | 91 |
상기 표 12 및 표 13에 나타난 바와 같이 LeuA 변이체 발현 벡터가 형질 전환된 L-류신 생산균주 CJL-8109 및 CJL-8117, CJL-8118, CA13-8119, CJL-8120, CJL-8121, CJL-8122, CJL-8123, CJL-8125는 대조군인 야생형 코리네박테리움 글루타미쿰 ATCC 13032에 비해 이소프로필말레이트 신타제의 활성이 약 1.18 내지 1.38배로 향상됨을 확인하였다. 또한, 상기 L-류신 생산균주들은 류신이 2 g/L 첨가된 조건에서도 이소프로필말레이트 신타제 효소 활성을 각각 83% 내지 93% 로 유지하는 것을 확인하여 류신에 의한 피드백 저해가 해제 되었음을 확인하였다.
상기 CA13-8119는 부다페스트조약 하의 수탁기관인 한국미생물보존센터에 2021년 2월 8일자로 기탁하여 수탁번호 KCCM12949P를 부여받았다.
이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CheilJedang Corporation
<120> Isopropylmaleate synthase variant and a method of producing
L-leucine using the same
<130> KPA201380-KR
<160> 55
<170> KoPatentIn 3.0
<210> 1
<211> 616
<212> PRT
<213> Unknown
<220>
<223> leuA(616 aa)
<400> 1
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 2
<211> 1851
<212> DNA
<213> Unknown
<220>
<223> leuA WT(1851 bp)
<400> 2
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaacgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggcttcaaag aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaaggg catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactccac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactaa tcaagaccat cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgcc ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggtg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccgcggc aacggcccac tggccgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 3
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 1
<400> 3
tatgcttcac cacatgactt c 21
<210> 4
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 2
<400> 4
aaatcatttg agaaaactcg agg 23
<210> 5
<211> 581
<212> PRT
<213> Unknown
<220>
<223> leuA(581 aa)
<400> 5
Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val Glu Asp Ile
1 5 10 15
Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr Val Ala Pro
20 25 30
Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala Leu Ile Asp
35 40 45
Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu Leu Val Gln
50 55 60
Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala Ser Gln Thr
65 70 75 80
Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met Ile Pro Asp
85 90 95
Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His Leu Ile Arg
100 105 110
Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile Val His Phe
115 120 125
Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe Arg Met Asp
130 135 140
Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu Leu Ile Lys
145 150 155 160
Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp Gln Tyr Ser
165 170 175
Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys Glu Val Val
180 185 190
Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn Pro Met Ile
195 200 205
Ile Asn Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn Val Tyr Ala
210 215 220
Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg Asp Ser Ile
225 230 235 240
Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly Val Gly Ala
245 250 255
Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu Gly Cys Leu
260 265 270
Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val Thr Leu Ala
275 280 285
Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp Phe Thr Asp
290 295 300
Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln Leu Arg Val
305 310 315 320
Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr Ala Phe Ser
325 330 335
Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala Met Ala Ala
340 345 350
Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp Glu Gln Leu
355 360 365
Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp Pro Lys Asp
370 375 380
Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser Gln Ser Gly
385 390 395 400
Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly Leu Gln Ile
405 410 415
Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln Asn Val Thr
420 425 430
Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp Asp Ile Phe
435 440 445
Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln Ile Ala Leu
450 455 460
Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser Ile Thr Ala
465 470 475 480
Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly Arg Gly Asn
485 490 495
Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu Gly Ile Asp
500 505 510
Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser Gly Asp Asp
515 520 525
Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly Arg Lys Val
530 535 540
Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser Leu Lys Ala
545 550 555 560
Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His Glu Ala Val
565 570 575
Leu Ala Gly Gly Val
580
<210> 6
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> L138G
<400> 6
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 7
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> L138G
<400> 7
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tggggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgcc ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 8
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> H162E
<400> 8
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val Glu Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 9
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> H162E
<400> 9
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtggagttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgcc ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 10
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> S211L
<400> 10
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val Glu Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Leu Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 11
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> S211L
<400> 11
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac cttcctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgcc ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 12
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> I588P
<400> 12
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val Glu Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Leu Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Ser Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Pro Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 13
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> I588P
<400> 13
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgcc ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc ccccacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 14
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> N245S
<400> 14
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val Glu Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Leu Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Ser Leu Pro Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 15
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> N245S
<400> 15
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tctccctgcc ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 16
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 3
<400> 16
ggtcgactct agaggatccc ctatgcttca ccacatgact tc 42
<210> 17
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 4
<400> 17
caggtgctca cgagcctgaa ccccaacctg aatggtgaca tc 42
<210> 18
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 5
<400> 18
gacgatgtca ccattcaggt tggggttcag gctcgtgag 39
<210> 19
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 6
<400> 19
gtgaattcga gctcggtacc caaatcattt gagaaaactc gaggc 45
<210> 20
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 7
<400> 20
gatggaggtt gagttgtaga actccacgat aacgtttttt gcg 43
<210> 21
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 8
<400> 21
ggcgcaaaaa acgttatcgt ggagttctac aactcaacct cc 42
<210> 22
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 9
<400> 22
agtgccggtg aaggactcag gaaggtactg ccagcgcc 38
<210> 23
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 10
<400> 23
accaactggc gctggcagta ccttcctgag tccttcacc 39
<210> 24
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 11
<400> 24
catctcaacg gtggaacaca gggagatgat cattgggttc tc 42
<210> 25
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 12
<400> 25
cctgagaacc caatgatcat ctccctgtgt tccaccg 37
<210> 26
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 13
<400> 26
tgccttcagc gaagcgtagg tgggggagcc agcgatgc 38
<210> 27
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 14
<400> 27
ggcgtcggca tcgctggctc ccccacctac gcttcgctg 39
<210> 28
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 15
<400> 28
aacacgaccg gcatcccgtc gc 22
<210> 29
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 16
<400> 29
aaatcatttg agaaaactcg agg 23
<210> 30
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 23
<400> 30
gtcacccgat cgtctgaag 19
<210> 31
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 24
<400> 31
gtcttaaaac cggttgat 18
<210> 32
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Up F
<400> 32
gtgaattcga gctcggtacc cgcgggaatc ctgcgttacc gc 42
<210> 33
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Up R
<400> 33
tgtaaacgcg gtgtccgaag ccgatgaggc ggacgccgtc tt 42
<210> 34
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Down F
<400> 34
aagacggcgt ccgcctcatc ggcttcggac accgcgttta ca 42
<210> 35
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Down R
<400> 35
ggtcgactct agaggatccc cttagcgctc ctcgcgagga ac 42
<210> 36
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 25
<400> 36
caatgctggc tgcgtacgc 19
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 26
<400> 37
ctcctcgcga ggaaccaact 20
<210> 38
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> L138G, P247C, R558H, G561D
<400> 38
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 39
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> L138G, P247C, R558H, G561D
<400> 39
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tggggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 40
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> H162E, P247C, R558H, G561D
<400> 40
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val Glu Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 41
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> H162E, P247C, R558H, G561D
<400> 41
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtggagttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 42
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> S211L, P247C, R558H, G561D
<400> 42
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Leu Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 43
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> S211L, P247C, R558H, G561D
<400> 43
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac cttcctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 44
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> N245S, P247C, R558H, G561D
<400> 44
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Ser Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 45
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> N245S, P247C, R558H, G561D
<400> 45
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tctccctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 46
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> I588P, P247C, R558H, G561D
<400> 46
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Pro Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 47
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> I588P, P247C, R558H, G561D
<400> 47
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc ccccacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 48
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> S211L, P247C, R558H, G561D, I588P
<400> 48
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Leu Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Pro Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 49
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> S211L, P247C, R558H, G561D, I588P
<400> 49
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac cttcctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc ccccacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 50
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> L138G, H162E, S211L, N245S, P247C, R558H, G561D
<400> 50
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val Glu Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Leu Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Ser Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 51
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> L138G, H162E, S211L, N245S, P247C, R558H, G561D
<400> 51
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tggggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtggagttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac cttcctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tctccctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 52
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> L138G, H162E, S211L, N245S, P247C, R558H, G561D, I588P
<400> 52
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Gly Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val Glu Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Leu Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Ser Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Pro Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 53
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> L138G, H162E, S211L, N245S, P247C, R558H, G561D, I588P
<400> 53
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tggggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtggagttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac cttcctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tctccctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc ccccacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 54
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 27
<400> 54
ggtgatcatc tcaacggtgg aacacaggtt gatgatcatt gggtt 45
<210> 55
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 28
<400> 55
aacccaatga tcatcaacct gtgttccacc gttgagatga tcacc 45
Claims (13)
- 서열번호 1의 아미노산 서열에서 i) 138 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, ii) 162 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, iii) 211 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, iv) 245 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환, 및 v) 588 번째에 상응하는 위치의 아미노산 잔기가 다른 아미노산 잔기로의 치환으로 이루어지는 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는, 이소프로필말레이트 신타제(isopropylmalate synthase) 활성을 가지는 변이형 폴리펩티드.
- 제1항에 있어서, 상기 i)은 138 번째에 상응하는 위치의 아미노산 잔기인 류신이 글라이신으로 치환된 것인, 변이형 폴리펩티드.
- 제1항에 있어서, 상기 ii)는 162 번째에 상응하는 위치의 아미노산 잔기인 히스티딘이 글루타메이트로 치환된 것인, 변이형 폴리펩티드.
- 제1항에 있어서, 상기 iii)은 211 번째에 상응하는 위치의 아미노산 잔기인 세린이 류신으로 치환된 것인, 변이형 폴리펩티드.
- 제1항에 있어서, 상기 iv)는 245 번째에 상응하는 위치의 아미노산 잔기인 아스파라기닌이 세린으로 치환된 것인, 변이형 폴리펩티드.
- 제1항에 있어서, 상기 v)는 588 번째에 상응하는 위치의 아미노산 잔기인 이소류신이 프롤린으로 치환된 것인, 변이형 폴리펩티드.
- 제1항에 있어서, 상기 변이형 폴리펩티드는 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 및 서열번호 14으로 이루어지는 군으로부터 선택되는 어느 하나 이상의 아미노산 서열을 포함하는 것인, 변이형 폴리펩티드.
- 제1항 내지 제7항 중 어느 한 항의 변이형 폴리펩티드를 코딩하는 폴리뉴클레오티드.
- 제8항의 폴리뉴클레오티드를 포함하는 벡터.
- 제1항의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드; 또는 이를 포함하는 벡터;를 포함하는, L-류신을 생산하는 코리네박테리움 속(Corynebacterium sp.) 미생물.
- 제10항에 있어서, 상기 코리네박테리움 속 미생물은 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)인, 코리네박테리움 속 미생물.
- 제1항의 변이형 폴리펩티드; 이를 코딩하는 폴리뉴클레오티드; 또는 이를 포함하는 벡터;를 포함하는, L-류신을 생산하는 코리네박테리움 속 미생물을 배지에서 배양하는 단계를 포함하는, L-류신 생산방법.
- 제12항에 있어서, 상기 배양하는 단계 이후 배지 또는 미생물로부터 L-류신을 회수하는 단계를 추가적으로 포함하는, L-류신 생산방법.
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210029469A KR102527102B1 (ko) | 2021-03-05 | 2021-03-05 | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 |
JP2023540849A JP2024501753A (ja) | 2021-03-05 | 2022-01-28 | イソプロピルリンゴ酸シンターゼ変異体及びそれを用いたl-ロイシンの生産方法 |
CA3204875A CA3204875A1 (en) | 2021-03-05 | 2022-01-28 | Isopropylmalate synthase variant and a method of producing l-leucine using the same |
AU2022229156A AU2022229156A1 (en) | 2021-03-05 | 2022-01-28 | Isopropylmalate synthase variant and a method of producing L-leucine using the same |
US18/274,912 US20240093252A1 (en) | 2021-03-05 | 2022-01-28 | Isopropylmalate synthase variant and a method of producing l-leucine using the same |
PCT/KR2022/001560 WO2022186487A1 (ko) | 2021-03-05 | 2022-01-28 | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 |
EP22763472.2A EP4253532A4 (en) | 2021-03-05 | 2022-01-28 | ISOPROPYLMALATE SYNTHASE VARIANT AND METHOD FOR PRODUCING L-LEUCINE USING THE SAME |
MX2023009553A MX2023009553A (es) | 2021-03-05 | 2022-01-28 | Variante de isopropilmalato sintasa y un procedimiento para producir l-leucina usando la misma. |
CN202280016563.2A CN117355605A (zh) | 2021-03-05 | 2022-01-28 | 异丙基苹果酸合酶变体和使用其产生l-亮氨酸的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210029469A KR102527102B1 (ko) | 2021-03-05 | 2021-03-05 | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220125526A KR20220125526A (ko) | 2022-09-14 |
KR102527102B1 true KR102527102B1 (ko) | 2023-04-28 |
Family
ID=83154166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210029469A KR102527102B1 (ko) | 2021-03-05 | 2021-03-05 | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240093252A1 (ko) |
EP (1) | EP4253532A4 (ko) |
JP (1) | JP2024501753A (ko) |
KR (1) | KR102527102B1 (ko) |
CN (1) | CN117355605A (ko) |
AU (1) | AU2022229156A1 (ko) |
CA (1) | CA3204875A1 (ko) |
MX (1) | MX2023009553A (ko) |
WO (1) | WO2022186487A1 (ko) |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100438146B1 (ko) | 1996-11-28 | 2004-11-03 | 씨제이 주식회사 | L-루이신생산미생물인코리네박테리움글루타미컴ch25 |
KR100220018B1 (ko) | 1997-06-25 | 1999-10-01 | 손 경 식 | L-루이신을 생산하는 신규한 미생물 코리네박테리움 글루타미컴(Corynebacterium glutamicum) CH45 |
RU2201454C2 (ru) * | 1999-07-09 | 2003-03-27 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Мутантная альфа-изопропилмалат синтаза (ipms), днк, кодирующая мутантную ipms, способ получения штамма escherichia coli, способ получения l-лейцина |
KR100620092B1 (ko) | 2004-12-16 | 2006-09-08 | 씨제이 주식회사 | 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법 |
EP2565265A1 (en) * | 2011-09-02 | 2013-03-06 | Philip Morris Products S.A. | Isopropylmalate synthase from Nicotiana tabacum and methods and uses thereof |
WO2013160124A1 (en) | 2012-04-27 | 2013-10-31 | Evonik Industries Ag | Feedback-resistant alpha-isopropylmalate synthases |
KR101632642B1 (ko) | 2015-01-29 | 2016-06-22 | 씨제이제일제당 주식회사 | 신규한 프로모터 및 그의 용도 |
ES2907694T3 (es) | 2016-08-31 | 2022-04-26 | Cj Cheiljedang Corp | Nuevo promotor y uso del mismo |
KR102055874B1 (ko) | 2016-12-28 | 2019-12-13 | 씨제이제일제당 주식회사 | 신규한 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 |
KR102143964B1 (ko) | 2019-12-06 | 2020-08-12 | 씨제이제일제당 주식회사 | 신규한 분지쇄 아미노산 아미노트랜스퍼라제 변이체 및 이를 이용한 류신 생산방법 |
KR102278000B1 (ko) | 2020-03-17 | 2021-07-15 | 씨제이제일제당 주식회사 | 프리페네이트 디하이드라타아제 활성 강화를 통한 l-트립토판을 생산하는 방법 |
-
2021
- 2021-03-05 KR KR1020210029469A patent/KR102527102B1/ko active IP Right Grant
-
2022
- 2022-01-28 CN CN202280016563.2A patent/CN117355605A/zh active Pending
- 2022-01-28 WO PCT/KR2022/001560 patent/WO2022186487A1/ko active Application Filing
- 2022-01-28 JP JP2023540849A patent/JP2024501753A/ja active Pending
- 2022-01-28 US US18/274,912 patent/US20240093252A1/en active Pending
- 2022-01-28 EP EP22763472.2A patent/EP4253532A4/en active Pending
- 2022-01-28 CA CA3204875A patent/CA3204875A1/en active Pending
- 2022-01-28 MX MX2023009553A patent/MX2023009553A/es unknown
- 2022-01-28 AU AU2022229156A patent/AU2022229156A1/en active Pending
Non-Patent Citations (1)
Title |
---|
Microbiology and Molecular Biology Reviews, 2003, 67권, 1호, 페이지 1-15 |
Also Published As
Publication number | Publication date |
---|---|
EP4253532A1 (en) | 2023-10-04 |
MX2023009553A (es) | 2023-08-22 |
AU2022229156A9 (en) | 2024-10-17 |
AU2022229156A1 (en) | 2023-07-27 |
WO2022186487A1 (ko) | 2022-09-09 |
KR20220125526A (ko) | 2022-09-14 |
CN117355605A (zh) | 2024-01-05 |
CA3204875A1 (en) | 2022-09-09 |
JP2024501753A (ja) | 2024-01-15 |
EP4253532A4 (en) | 2024-06-26 |
US20240093252A1 (en) | 2024-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102277408B1 (ko) | 신규한 포르메이트 의존성 포스포리보실글리신아미드 포밀 전이효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102363913B1 (ko) | L-쓰레오닌 디하이드라타아제의 신규 변이체 및 이를 이용한 l-이소류신 생산 방법 | |
KR102527096B1 (ko) | 프리페네이트 탈수 효소 (Prephenate dehydratase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 | |
KR102694516B1 (ko) | L-글루타민 생산능이 향상된 미생물 및 이를 이용한 l-글루타민 생산 방법 | |
KR102525073B1 (ko) | 신규한 시트레이트 신타아제 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102527895B1 (ko) | GlxR 단백질 변이체 또는 이를 이용한 쓰레오닌 생산방법 | |
KR102273638B1 (ko) | 신규한 포스포글리세린산 디하이드로게나제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102470602B1 (ko) | 신규한 분지 연쇄 아미노산 아미노트렌스퍼라아제 변이체 및 이를 이용한 이소류신 생산 방법 | |
KR102273640B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 감마 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102267931B1 (ko) | 신규한 5-(카르복시아미노)이미다졸리보뉴클레오티드합성효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102527102B1 (ko) | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 | |
KR102147381B1 (ko) | 아세토하이드록시산 신타제 신규 변이체 및 이를 포함하는 미생물 | |
KR20220139085A (ko) | L-아르기닌을 생산하는 코리네박테리움 속 미생물 및 이를 이용한 l-아르기닌 생산방법 | |
KR102495918B1 (ko) | aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 | |
KR102673796B1 (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR102727406B1 (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR102464883B1 (ko) | 신규한 감마-아미노부티르산 퍼미에이즈 변이체 및 이를 이용한 이소류신 생산 방법 | |
KR102619598B1 (ko) | 신규한 아세토하이드록시산 신타아제 소단위체 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102679080B1 (ko) | 변이형 atp-의존적 프로테아제 및 이를 이용한 l-아미노산의 생산 방법 | |
KR102727407B1 (ko) | L-이소루신 생산 미생물 및 이를 이용한 l-이소루신 생산 방법 | |
CN114981292B (zh) | 新型蛋白质htrl变体及使用其生产l-色氨酸的方法 | |
KR20230045990A (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR20230094761A (ko) | L-이소루신 생산 미생물 및 이를 이용한 l-이소루신 생산 방법 | |
KR20230031624A (ko) | 신규한 초산 대사 조절자 a 변이체 및 이를 이용한 l-분지쇄 아미노산 생산 방법 | |
KR20240023455A (ko) | 신규한 아세토하이드록시산 신타아제 소단위체 변이체 및 이를 이용한 l-발린 생산 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |