KR20070085665A - 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 - Google Patents
도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 Download PDFInfo
- Publication number
- KR20070085665A KR20070085665A KR1020077012473A KR20077012473A KR20070085665A KR 20070085665 A KR20070085665 A KR 20070085665A KR 1020077012473 A KR1020077012473 A KR 1020077012473A KR 20077012473 A KR20077012473 A KR 20077012473A KR 20070085665 A KR20070085665 A KR 20070085665A
- Authority
- KR
- South Korea
- Prior art keywords
- desaturase
- genes encoding
- seq
- gene
- acid
- Prior art date
Links
- MBMBGCFOFBJSGT-KUBAVDMBSA-N all-cis-docosa-4,7,10,13,16,19-hexaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 title claims abstract description 340
- 235000020669 docosahexaenoic acid Nutrition 0.000 title claims abstract description 175
- 229940090949 docosahexaenoic acid Drugs 0.000 title claims abstract description 171
- 241000235015 Yarrowia lipolytica Species 0.000 title abstract description 9
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 449
- 238000004519 manufacturing process Methods 0.000 claims abstract description 111
- 238000000034 method Methods 0.000 claims abstract description 93
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 70
- 108700016155 Acyl transferases Proteins 0.000 claims abstract description 45
- 239000002253 acid Substances 0.000 claims abstract description 29
- 102000045404 acyltransferase activity proteins Human genes 0.000 claims abstract description 19
- 108700014220 acyltransferase activity proteins Proteins 0.000 claims abstract description 19
- 241000235013 Yarrowia Species 0.000 claims description 188
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 95
- 229930195729 fatty acid Natural products 0.000 claims description 95
- 239000000194 fatty acid Substances 0.000 claims description 95
- 235000013305 food Nutrition 0.000 claims description 91
- 108010001348 Diacylglycerol O-acyltransferase Proteins 0.000 claims description 87
- 102000002148 Diacylglycerol O-acyltransferase Human genes 0.000 claims description 87
- 102000004190 Enzymes Human genes 0.000 claims description 85
- 108090000790 Enzymes Proteins 0.000 claims description 85
- 230000000694 effects Effects 0.000 claims description 85
- 150000004665 fatty acids Chemical class 0.000 claims description 84
- 239000000047 product Substances 0.000 claims description 84
- 235000020660 omega-3 fatty acid Nutrition 0.000 claims description 79
- 102100038805 Lysophospholipid acyltransferase 2 Human genes 0.000 claims description 65
- 108010011713 delta-15 desaturase Proteins 0.000 claims description 62
- 239000000758 substrate Substances 0.000 claims description 61
- 102100034544 Acyl-CoA 6-desaturase Human genes 0.000 claims description 60
- 108010037138 Linoleoyl-CoA Desaturase Proteins 0.000 claims description 59
- 150000002632 lipids Chemical class 0.000 claims description 58
- 235000020673 eicosapentaenoic acid Nutrition 0.000 claims description 57
- 230000000813 microbial effect Effects 0.000 claims description 56
- 102000004169 proteins and genes Human genes 0.000 claims description 55
- 235000018102 proteins Nutrition 0.000 claims description 53
- 102100034542 Acyl-CoA (8-3)-desaturase Human genes 0.000 claims description 52
- 108010073542 Delta-5 Fatty Acid Desaturase Proteins 0.000 claims description 51
- 108010022240 delta-8 fatty acid desaturase Proteins 0.000 claims description 47
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 claims description 45
- 235000020661 alpha-linolenic acid Nutrition 0.000 claims description 41
- 229960004488 linolenic acid Drugs 0.000 claims description 41
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims description 40
- 235000020665 omega-6 fatty acid Nutrition 0.000 claims description 39
- 229940012843 omega-3 fatty acid Drugs 0.000 claims description 38
- 229920001184 polypeptide Polymers 0.000 claims description 38
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 38
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 38
- 101710091951 Glycerol-3-phosphate acyltransferase Proteins 0.000 claims description 37
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 claims description 37
- 241001465754 Metazoa Species 0.000 claims description 34
- 229940033080 omega-6 fatty acid Drugs 0.000 claims description 34
- 108030002650 Phospholipid:diacylglycerol acyltransferases Proteins 0.000 claims description 31
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 claims description 31
- 101000912235 Rebecca salina Acyl-lipid (7-3)-desaturase Proteins 0.000 claims description 30
- 101000877236 Siganus canaliculatus Acyl-CoA Delta-4 desaturase Proteins 0.000 claims description 30
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 29
- 239000003795 chemical substances by application Substances 0.000 claims description 29
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 28
- 235000020664 gamma-linolenic acid Nutrition 0.000 claims description 28
- 108010052187 1-Acylglycerophosphocholine O-Acyltransferase Proteins 0.000 claims description 27
- 150000007523 nucleic acids Chemical group 0.000 claims description 27
- 108010054662 2-acylglycerophosphate acyltransferase Proteins 0.000 claims description 26
- HOBAELRKJCKHQD-QNEBEIHSSA-N dihomo-γ-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HOBAELRKJCKHQD-QNEBEIHSSA-N 0.000 claims description 26
- HOBAELRKJCKHQD-UHFFFAOYSA-N (8Z,11Z,14Z)-8,11,14-eicosatrienoic acid Natural products CCCCCC=CCC=CCC=CCCCCCCC(O)=O HOBAELRKJCKHQD-UHFFFAOYSA-N 0.000 claims description 25
- 235000015872 dietary supplement Nutrition 0.000 claims description 22
- 235000013350 formula milk Nutrition 0.000 claims description 21
- 150000003904 phospholipids Chemical class 0.000 claims description 20
- 244000144974 aquaculture Species 0.000 claims description 17
- 238000009360 aquaculture Methods 0.000 claims description 17
- 150000001413 amino acids Chemical class 0.000 claims description 16
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 claims description 15
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 claims description 15
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 claims description 15
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 claims description 15
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 claims description 15
- 235000015097 nutrients Nutrition 0.000 claims description 15
- 241000282414 Homo sapiens Species 0.000 claims description 12
- 102000039446 nucleic acids Human genes 0.000 claims description 12
- 108020004707 nucleic acids Proteins 0.000 claims description 12
- 102000004539 Acyl-CoA Oxidase Human genes 0.000 claims description 11
- 108020001558 Acyl-CoA oxidase Proteins 0.000 claims description 11
- 102000015439 Phospholipases Human genes 0.000 claims description 11
- 108010064785 Phospholipases Proteins 0.000 claims description 11
- 150000001720 carbohydrates Chemical class 0.000 claims description 11
- 235000014633 carbohydrates Nutrition 0.000 claims description 11
- 230000001588 bifunctional effect Effects 0.000 claims description 10
- 241000282412 Homo Species 0.000 claims description 9
- 229910052500 inorganic mineral Inorganic materials 0.000 claims description 9
- 239000011707 mineral Substances 0.000 claims description 9
- 235000010755 mineral Nutrition 0.000 claims description 9
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 claims description 9
- 229940088594 vitamin Drugs 0.000 claims description 9
- 239000011782 vitamin Substances 0.000 claims description 9
- 235000013343 vitamin Nutrition 0.000 claims description 9
- 229930003231 vitamin Natural products 0.000 claims description 9
- 108010087894 Fatty acid desaturases Proteins 0.000 claims description 8
- 239000003814 drug Substances 0.000 claims description 8
- 235000013365 dairy product Nutrition 0.000 claims description 7
- 230000002255 enzymatic effect Effects 0.000 claims description 7
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 claims description 6
- 235000021355 Stearic acid Nutrition 0.000 claims description 6
- 102000014384 Type C Phospholipases Human genes 0.000 claims description 6
- 108010079194 Type C Phospholipases Proteins 0.000 claims description 6
- 230000007812 deficiency Effects 0.000 claims description 6
- 229940098330 gamma linoleic acid Drugs 0.000 claims description 6
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 claims description 6
- 239000008117 stearic acid Substances 0.000 claims description 6
- VZCCETWTMQHEPK-UHFFFAOYSA-N gamma-Linolensaeure Natural products CCCCCC=CCC=CCC=CCCCCC(O)=O VZCCETWTMQHEPK-UHFFFAOYSA-N 0.000 claims description 5
- 235000013622 meat product Nutrition 0.000 claims description 5
- 235000011888 snacks Nutrition 0.000 claims description 5
- 229910019142 PO4 Inorganic materials 0.000 claims description 4
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 claims description 4
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 claims description 4
- 229960005135 eicosapentaenoic acid Drugs 0.000 claims description 4
- 239000010452 phosphate Substances 0.000 claims description 4
- 244000144977 poultry Species 0.000 claims description 4
- 108090000489 Carboxy-Lyases Proteins 0.000 claims description 3
- 101100005882 Mus musculus Cel gene Proteins 0.000 claims description 3
- 101100289046 Mus musculus Lias gene Proteins 0.000 claims description 3
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 claims description 3
- 241000282849 Ruminantia Species 0.000 claims description 3
- 235000011868 grain product Nutrition 0.000 claims description 3
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 claims description 3
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 claims description 3
- 101150091094 lipA gene Proteins 0.000 claims description 3
- YAFQFNOUYXZVPZ-UHFFFAOYSA-N liproxstatin-1 Chemical compound ClC1=CC=CC(CNC=2C3(CCNCC3)NC3=CC=CC=C3N=2)=C1 YAFQFNOUYXZVPZ-UHFFFAOYSA-N 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 101710103615 Acyl-coenzyme A oxidase 2 Proteins 0.000 claims description 2
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 claims description 2
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 claims description 2
- 102100026795 Peroxisomal acyl-coenzyme A oxidase 2 Human genes 0.000 claims description 2
- 101100161758 Yarrowia lipolytica (strain CLIB 122 / E 150) POX3 gene Proteins 0.000 claims description 2
- 235000021342 arachidonic acid Nutrition 0.000 claims description 2
- 229940114079 arachidonic acid Drugs 0.000 claims description 2
- 235000020778 linoleic acid Nutrition 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims description 2
- 235000021298 Dihomo-γ-linolenic acid Nutrition 0.000 claims 2
- 102100034543 Fatty acid desaturase 3 Human genes 0.000 claims 2
- 101710084373 Lipase 1 Proteins 0.000 claims 2
- 102000013460 Malate Dehydrogenase Human genes 0.000 claims 2
- 108010026217 Malate Dehydrogenase Proteins 0.000 claims 2
- XSXIVVZCUAHUJO-AVQMFFATSA-N (11e,14e)-icosa-11,14-dienoic acid Chemical compound CCCCC\C=C\C\C=C\CCCCCCCCCC(O)=O XSXIVVZCUAHUJO-AVQMFFATSA-N 0.000 claims 1
- OYHQOLUKZRVURQ-NTGFUMLPSA-N (9Z,12Z)-9,10,12,13-tetratritiooctadeca-9,12-dienoic acid Chemical compound C(CCCCCCC\C(=C(/C\C(=C(/CCCCC)\[3H])\[3H])\[3H])\[3H])(=O)O OYHQOLUKZRVURQ-NTGFUMLPSA-N 0.000 claims 1
- NIONDZDPPYHYKY-UHFFFAOYSA-N 2-hexenoic acid Chemical compound CCCC=CC(O)=O NIONDZDPPYHYKY-UHFFFAOYSA-N 0.000 claims 1
- 101150102441 ACO3 gene Proteins 0.000 claims 1
- 101710088194 Dehydrogenase Proteins 0.000 claims 1
- 235000021297 Eicosadienoic acid Nutrition 0.000 claims 1
- ZDGJAHTZVHVLOT-UHFFFAOYSA-N L-Saccharopine Natural products OC(=O)C(N)CCCCNC(C(O)=O)CCC(O)=O ZDGJAHTZVHVLOT-UHFFFAOYSA-N 0.000 claims 1
- ZDGJAHTZVHVLOT-YUMQZZPRSA-N L-saccharopine Chemical compound OC(=O)[C@@H](N)CCCCN[C@H](C(O)=O)CCC(O)=O ZDGJAHTZVHVLOT-YUMQZZPRSA-N 0.000 claims 1
- 101710084378 Lipase 2 Proteins 0.000 claims 1
- 101100433922 Solanum lycopersicum ACO4 gene Proteins 0.000 claims 1
- 241000490645 Yarrowia sp. Species 0.000 claims 1
- 229960002733 gamolenic acid Drugs 0.000 claims 1
- 150000002888 oleic acid derivatives Chemical class 0.000 claims 1
- 229960004274 stearic acid Drugs 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 abstract description 100
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 abstract description 68
- 238000003786 synthesis reaction Methods 0.000 abstract description 47
- 238000009825 accumulation Methods 0.000 abstract description 21
- 102000057234 Acyl transferases Human genes 0.000 abstract description 18
- 230000014509 gene expression Effects 0.000 description 108
- 101710095468 Cyclase Proteins 0.000 description 98
- 239000003921 oil Substances 0.000 description 93
- 235000019198 oils Nutrition 0.000 description 92
- 229940088598 enzyme Drugs 0.000 description 81
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 78
- 210000004027 cell Anatomy 0.000 description 75
- 241000907999 Mortierella alpina Species 0.000 description 68
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 63
- 238000006243 chemical reaction Methods 0.000 description 62
- 230000037361 pathway Effects 0.000 description 52
- 239000013615 primer Substances 0.000 description 49
- 238000009482 thermal adhesion granulation Methods 0.000 description 46
- 108020004414 DNA Proteins 0.000 description 36
- 230000001105 regulatory effect Effects 0.000 description 36
- 108091026890 Coding region Proteins 0.000 description 30
- 239000013612 plasmid Substances 0.000 description 30
- 239000000203 mixture Substances 0.000 description 29
- 230000009471 action Effects 0.000 description 27
- -1 2) optionally Chemical compound 0.000 description 25
- 108020004705 Codon Proteins 0.000 description 25
- 230000001965 increasing effect Effects 0.000 description 25
- 244000005700 microbiome Species 0.000 description 23
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 22
- 229910052799 carbon Inorganic materials 0.000 description 22
- 230000006870 function Effects 0.000 description 22
- 125000003729 nucleotide group Chemical group 0.000 description 22
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 21
- 241000223218 Fusarium Species 0.000 description 21
- 239000012634 fragment Substances 0.000 description 21
- 239000002773 nucleotide Substances 0.000 description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 20
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 20
- 230000035508 accumulation Effects 0.000 description 20
- 108020004999 messenger RNA Proteins 0.000 description 20
- 235000016709 nutrition Nutrition 0.000 description 20
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 20
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 18
- YUFFSWGQGVEMMI-JLNKQSITSA-N (7Z,10Z,13Z,16Z,19Z)-docosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCCCC(O)=O YUFFSWGQGVEMMI-JLNKQSITSA-N 0.000 description 17
- 229940024606 amino acid Drugs 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 17
- 238000000855 fermentation Methods 0.000 description 17
- 230000004151 fermentation Effects 0.000 description 17
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 16
- 239000003925 fat Substances 0.000 description 16
- 235000019197 fats Nutrition 0.000 description 16
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 16
- 241000894007 species Species 0.000 description 16
- 238000013519 translation Methods 0.000 description 16
- 230000014616 translation Effects 0.000 description 16
- 101710124165 1-acyl-sn-glycerol-3-phosphate acyltransferase Proteins 0.000 description 15
- 101710097496 Lysophospholipid acyltransferase Proteins 0.000 description 15
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 15
- 101710163746 Lysophospholipid acyltransferase 2 Proteins 0.000 description 14
- 239000005642 Oleic acid Substances 0.000 description 14
- 101710172946 Probable 1-acyl-sn-glycerol-3-phosphate acyltransferase Proteins 0.000 description 14
- 238000007726 management method Methods 0.000 description 14
- 230000002503 metabolic effect Effects 0.000 description 14
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 14
- 235000021313 oleic acid Nutrition 0.000 description 14
- 238000013518 transcription Methods 0.000 description 14
- 230000035897 transcription Effects 0.000 description 14
- 230000002538 fungal effect Effects 0.000 description 13
- 239000002609 medium Substances 0.000 description 13
- 239000006014 omega-3 oil Substances 0.000 description 13
- 230000014621 translational initiation Effects 0.000 description 13
- 102000053187 Glucuronidase Human genes 0.000 description 12
- 108010060309 Glucuronidase Proteins 0.000 description 12
- 108091081024 Start codon Proteins 0.000 description 12
- 125000002252 acyl group Chemical group 0.000 description 12
- 230000012010 growth Effects 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- 240000000073 Achillea millefolium Species 0.000 description 11
- 235000007754 Achillea millefolium Nutrition 0.000 description 11
- 235000013351 cheese Nutrition 0.000 description 11
- 238000009472 formulation Methods 0.000 description 11
- 238000010353 genetic engineering Methods 0.000 description 11
- 238000005984 hydrogenation reaction Methods 0.000 description 11
- 235000013372 meat Nutrition 0.000 description 11
- 229910052757 nitrogen Inorganic materials 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000006798 recombination Effects 0.000 description 11
- 238000005215 recombination Methods 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 11
- 108700010070 Codon Usage Proteins 0.000 description 10
- 241000235070 Saccharomyces Species 0.000 description 10
- 235000019688 fish Nutrition 0.000 description 10
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 10
- 230000010354 integration Effects 0.000 description 10
- 230000002018 overexpression Effects 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 10
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 10
- 241000251468 Actinopterygii Species 0.000 description 9
- 229920002498 Beta-glucan Polymers 0.000 description 9
- 241000222122 Candida albicans Species 0.000 description 9
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 9
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 9
- 229930182558 Sterol Natural products 0.000 description 9
- 230000000692 anti-sense effect Effects 0.000 description 9
- 229940095731 candida albicans Drugs 0.000 description 9
- 235000013339 cereals Nutrition 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 239000007788 liquid Substances 0.000 description 9
- 238000003753 real-time PCR Methods 0.000 description 9
- 235000003702 sterols Nutrition 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 241000228212 Aspergillus Species 0.000 description 8
- 241000351920 Aspergillus nidulans Species 0.000 description 8
- 101150099000 EXPA1 gene Proteins 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 8
- 102100029095 Exportin-1 Human genes 0.000 description 8
- 241000233866 Fungi Species 0.000 description 8
- 108010091086 Recombinases Proteins 0.000 description 8
- 102000018120 Recombinases Human genes 0.000 description 8
- 101100119348 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) EXP1 gene Proteins 0.000 description 8
- 101100269618 Streptococcus pneumoniae serotype 4 (strain ATCC BAA-334 / TIGR4) aliA gene Proteins 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 108700002148 exportin 1 Proteins 0.000 description 8
- 230000036541 health Effects 0.000 description 8
- 235000013336 milk Nutrition 0.000 description 8
- 239000008267 milk Substances 0.000 description 8
- 210000004080 milk Anatomy 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 239000002243 precursor Substances 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 7
- WRGQSWVCFNIUNZ-GDCKJWNLSA-N 1-oleoyl-sn-glycerol 3-phosphate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@@H](O)COP(O)(O)=O WRGQSWVCFNIUNZ-GDCKJWNLSA-N 0.000 description 7
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 7
- 101150069620 ARE2 gene Proteins 0.000 description 7
- 241000195619 Euglena gracilis Species 0.000 description 7
- 108091092195 Intron Proteins 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 235000005911 diet Nutrition 0.000 description 7
- 238000002955 isolation Methods 0.000 description 7
- 230000007935 neutral effect Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 230000035764 nutrition Effects 0.000 description 7
- IPCSVZSSVZVIGE-UHFFFAOYSA-N palmitic acid group Chemical group C(CCCCCCCCCCCCCCC)(=O)O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 7
- 150000004671 saturated fatty acids Chemical class 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 210000005253 yeast cell Anatomy 0.000 description 7
- PORPENFLTBBHSG-MGBGTMOVSA-N 1,2-dihexadecanoyl-sn-glycerol-3-phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(O)=O)OC(=O)CCCCCCCCCCCCCCC PORPENFLTBBHSG-MGBGTMOVSA-N 0.000 description 6
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 6
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 241000233732 Fusarium verticillioides Species 0.000 description 6
- UXDDRFCJKNROTO-UHFFFAOYSA-N Glycerol 1,2-diacetate Chemical compound CC(=O)OCC(CO)OC(C)=O UXDDRFCJKNROTO-UHFFFAOYSA-N 0.000 description 6
- 241001138401 Kluyveromyces lactis Species 0.000 description 6
- 108090001060 Lipase Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 102000016553 Stearoyl-CoA Desaturase Human genes 0.000 description 6
- 229940100389 Sulfonylurea Drugs 0.000 description 6
- 108091023045 Untranslated Region Proteins 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 230000000378 dietary effect Effects 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 235000021588 free fatty acids Nutrition 0.000 description 6
- 235000013376 functional food Nutrition 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 239000000843 powder Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 229920006395 saturated elastomer Polymers 0.000 description 6
- 235000003441 saturated fatty acids Nutrition 0.000 description 6
- 239000013589 supplement Substances 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 6
- 230000002103 transcriptional effect Effects 0.000 description 6
- 108020005544 Antisense RNA Proteins 0.000 description 5
- 229920002101 Chitin Polymers 0.000 description 5
- 102100036869 Diacylglycerol O-acyltransferase 1 Human genes 0.000 description 5
- 241000195620 Euglena Species 0.000 description 5
- 108010018837 Glycerol-3-Phosphate O-Acyltransferase Proteins 0.000 description 5
- 102000002754 Glycerol-3-Phosphate O-Acyltransferase Human genes 0.000 description 5
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 5
- 108020002496 Lysophospholipase Proteins 0.000 description 5
- 241000235575 Mortierella Species 0.000 description 5
- 241000221961 Neurospora crassa Species 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 241000223252 Rhodotorula Species 0.000 description 5
- 108010073771 Soybean Proteins Proteins 0.000 description 5
- 102000001494 Sterol O-Acyltransferase Human genes 0.000 description 5
- 108010054082 Sterol O-acyltransferase Proteins 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 125000004432 carbon atom Chemical group C* 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 235000021323 fish oil Nutrition 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 230000007407 health benefit Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 235000020256 human milk Nutrition 0.000 description 5
- 210000004251 human milk Anatomy 0.000 description 5
- 239000004615 ingredient Substances 0.000 description 5
- 239000000543 intermediate Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 150000003432 sterols Chemical class 0.000 description 5
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical compound OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 5
- 102100039338 Aminomethyltransferase, mitochondrial Human genes 0.000 description 4
- 108050001492 Ammonium transporters Proteins 0.000 description 4
- 241000024188 Andala Species 0.000 description 4
- 108010029692 Bisphosphoglycerate mutase Proteins 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- 108050004099 Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 4
- 108010058643 Fungal Proteins Proteins 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- 241000235395 Mucor Species 0.000 description 4
- 102000011025 Phosphoglycerate Mutase Human genes 0.000 description 4
- 241000172147 Saprolegnia diclina Species 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 239000006227 byproduct Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000003184 complementary RNA Substances 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 150000001982 diacylglycerols Chemical class 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 235000004626 essential fatty acids Nutrition 0.000 description 4
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 235000013402 health food Nutrition 0.000 description 4
- 239000004009 herbicide Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- SECPZKHBENQXJG-FPLPWBNLSA-N palmitoleic acid Chemical compound CCCCCC\C=C/CCCCCCCC(O)=O SECPZKHBENQXJG-FPLPWBNLSA-N 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 229940001941 soy protein Drugs 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- TWJNQYPJQDRXPH-UHFFFAOYSA-N 2-cyanobenzohydrazide Chemical compound NNC(=O)C1=CC=CC=C1C#N TWJNQYPJQDRXPH-UHFFFAOYSA-N 0.000 description 3
- 101150040074 Aco2 gene Proteins 0.000 description 3
- 241001225321 Aspergillus fumigatus Species 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 102100029297 Cholinephosphotransferase 1 Human genes 0.000 description 3
- 241000252212 Danio rerio Species 0.000 description 3
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 3
- 229930186217 Glycolipid Natural products 0.000 description 3
- 101000859570 Homo sapiens Carnitine O-palmitoyltransferase 1, liver isoform Proteins 0.000 description 3
- 101000909313 Homo sapiens Carnitine O-palmitoyltransferase 2, mitochondrial Proteins 0.000 description 3
- 101000989606 Homo sapiens Cholinephosphotransferase 1 Proteins 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 102000004882 Lipase Human genes 0.000 description 3
- 239000004367 Lipase Substances 0.000 description 3
- 235000021360 Myristic acid Nutrition 0.000 description 3
- TUNFSRHWOTWDNC-UHFFFAOYSA-N Myristic acid Natural products CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 3
- 241000221960 Neurospora Species 0.000 description 3
- 108091092724 Noncoding DNA Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 102100037883 Phospholipase B1, membrane-associated Human genes 0.000 description 3
- 108090000553 Phospholipase D Proteins 0.000 description 3
- 108010052160 Site-specific recombinase Proteins 0.000 description 3
- 101150050575 URA3 gene Proteins 0.000 description 3
- HQPCSDADVLFHHO-LTKCOYKYSA-N all-cis-8,11,14,17-icosatetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HQPCSDADVLFHHO-LTKCOYKYSA-N 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 229940091771 aspergillus fumigatus Drugs 0.000 description 3
- 235000008452 baby food Nutrition 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 239000002775 capsule Substances 0.000 description 3
- 239000001569 carbon dioxide Substances 0.000 description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 229960001231 choline Drugs 0.000 description 3
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 235000009508 confectionery Nutrition 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000004817 gas chromatography Methods 0.000 description 3
- 230000001744 histochemical effect Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 235000019421 lipase Nutrition 0.000 description 3
- 230000006372 lipid accumulation Effects 0.000 description 3
- 150000004668 long chain fatty acids Chemical class 0.000 description 3
- 235000013310 margarine Nutrition 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 3
- 235000013594 poultry meat Nutrition 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 235000020991 processed meat Nutrition 0.000 description 3
- 108700012830 rat Lip2 Proteins 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000004904 shortening Methods 0.000 description 3
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000003826 tablet Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 150000003626 triacylglycerols Chemical class 0.000 description 3
- GVJHHUAWPYXKBD-UHFFFAOYSA-N (±)-α-Tocopherol Chemical compound OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 2
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 108010000700 Acetolactate synthase Proteins 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 2
- 241000228197 Aspergillus flavus Species 0.000 description 2
- 235000007319 Avena orientalis Nutrition 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 2
- 101100434663 Bacillus subtilis (strain 168) fbaA gene Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 240000006162 Chenopodium quinoa Species 0.000 description 2
- 241001527609 Cryptococcus Species 0.000 description 2
- 101150042222 DGAT1 gene Proteins 0.000 description 2
- 208000020401 Depressive disease Diseases 0.000 description 2
- 101150102653 Dgat2 gene Proteins 0.000 description 2
- 102000013444 Diacylglycerol Cholinephosphotransferase Human genes 0.000 description 2
- 108010051225 Diacylglycerol cholinephosphotransferase Proteins 0.000 description 2
- 241000723298 Dicentrarchus labrax Species 0.000 description 2
- 235000021294 Docosapentaenoic acid Nutrition 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 101150095274 FBA1 gene Proteins 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- 102100024017 Glycerol-3-phosphate acyltransferase 3 Human genes 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 102100031415 Hepatic triacylglycerol lipase Human genes 0.000 description 2
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 2
- 101000848239 Homo sapiens Acyl-CoA (8-3)-desaturase Proteins 0.000 description 2
- 108010044467 Isoenzymes Proteins 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241001149698 Lipomyces Species 0.000 description 2
- 241000404158 Lonas Species 0.000 description 2
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 2
- 240000002129 Malva sylvestris Species 0.000 description 2
- 235000006770 Malva sylvestris Nutrition 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 101150059359 POX2 gene Proteins 0.000 description 2
- 235000021314 Palmitic acid Nutrition 0.000 description 2
- 235000021319 Palmitoleic acid Nutrition 0.000 description 2
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 2
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- 102000001107 Phosphatidate Phosphatase Human genes 0.000 description 2
- 108010069394 Phosphatidate Phosphatase Proteins 0.000 description 2
- 102000011420 Phospholipase D Human genes 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 241000277331 Salmonidae Species 0.000 description 2
- 241000209056 Secale Species 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 241000223230 Trichosporon Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- 241001491678 Ulkenia Species 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 150000001335 aliphatic alkanes Chemical class 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- OGBUMNBNEWYMNJ-UHFFFAOYSA-N batilol Chemical class CCCCCCCCCCCCCCCCCCOCC(O)CO OGBUMNBNEWYMNJ-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical class OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 230000008238 biochemical pathway Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 235000008429 bread Nutrition 0.000 description 2
- 235000014121 butter Nutrition 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 235000021466 carotenoid Nutrition 0.000 description 2
- 150000001747 carotenoids Chemical class 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 235000010980 cellulose Nutrition 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 239000004464 cereal grain Substances 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 101150036876 cre gene Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- GHVNFZFCNZKVNT-UHFFFAOYSA-N decanoic acid Chemical compound CCCCCCCCCC(O)=O GHVNFZFCNZKVNT-UHFFFAOYSA-N 0.000 description 2
- CYQFCXCEBYINGO-IAGOWNOFSA-N delta1-THC Chemical compound C1=C(C)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 CYQFCXCEBYINGO-IAGOWNOFSA-N 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- UKMSUNONTOPOIO-UHFFFAOYSA-N docosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCCCCC(O)=O UKMSUNONTOPOIO-UHFFFAOYSA-N 0.000 description 2
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 2
- 230000002222 downregulating effect Effects 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005886 esterification reaction Methods 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 150000002190 fatty acyls Chemical group 0.000 description 2
- 235000012041 food component Nutrition 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 239000007897 gelcap Substances 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 235000008216 herbs Nutrition 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- VKOBVWXKNCXXDE-UHFFFAOYSA-N icosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCCC(O)=O VKOBVWXKNCXXDE-UHFFFAOYSA-N 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000003308 immunostimulating effect Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960000367 inositol Drugs 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 229960003136 leucine Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 235000014666 liquid concentrate Nutrition 0.000 description 2
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 2
- 239000003264 margarine Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 2
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 2
- UTOPWMOLSKOLTQ-UHFFFAOYSA-N octacosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCCCCCCCCCCC(O)=O UTOPWMOLSKOLTQ-UHFFFAOYSA-N 0.000 description 2
- 229920001542 oligosaccharide Polymers 0.000 description 2
- 150000002482 oligosaccharides Chemical class 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 235000015927 pasta Nutrition 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 235000013324 preserved food Nutrition 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000010010 raising Methods 0.000 description 2
- 235000020989 red meat Nutrition 0.000 description 2
- 235000013580 sausages Nutrition 0.000 description 2
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 2
- 235000015170 shellfish Nutrition 0.000 description 2
- 150000004666 short chain fatty acids Chemical class 0.000 description 2
- 230000010473 stable expression Effects 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- XSXIVVZCUAHUJO-HZJYTTRNSA-N (11Z,14Z)-icosadienoic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCCC(O)=O XSXIVVZCUAHUJO-HZJYTTRNSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- DVSZKTAMJJTWFG-SKCDLICFSA-N (2e,4e,6e,8e,10e,12e)-docosa-2,4,6,8,10,12-hexaenoic acid Chemical compound CCCCCCCCC\C=C\C=C\C=C\C=C\C=C\C=C\C(O)=O DVSZKTAMJJTWFG-SKCDLICFSA-N 0.000 description 1
- CUXYLFPMQMFGPL-UHFFFAOYSA-N (9Z,11E,13E)-9,11,13-Octadecatrienoic acid Natural products CCCCC=CC=CC=CCCCCCCCC(O)=O CUXYLFPMQMFGPL-UHFFFAOYSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- YZAZXIUFBCPZGB-QZOPMXJLSA-N (z)-octadec-9-enoic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O.CCCCCCCC\C=C/CCCCCCCC(O)=O YZAZXIUFBCPZGB-QZOPMXJLSA-N 0.000 description 1
- 102000018659 1-Acylglycerophosphocholine O-Acyltransferase Human genes 0.000 description 1
- 102000004223 1-acyl-sn-glycerol-3-phosphate acyltransferase Human genes 0.000 description 1
- 108010069159 1-acylglycerol-3-phosphate O-acyltransferase Proteins 0.000 description 1
- 102100031251 1-acylglycerol-3-phosphate O-acyltransferase PNPLA3 Human genes 0.000 description 1
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- 101710161460 3-oxoacyl-[acyl-carrier-protein] synthase Proteins 0.000 description 1
- 102100024088 40S ribosomal protein S7 Human genes 0.000 description 1
- LODRRYMGPWQCTR-UHFFFAOYSA-N 5-fluoro-2,4-dioxo-1h-pyrimidine-6-carboxylic acid;hydrate Chemical compound O.OC(=O)C=1NC(=O)NC(=O)C=1F LODRRYMGPWQCTR-UHFFFAOYSA-N 0.000 description 1
- GZJLLYHBALOKEX-UHFFFAOYSA-N 6-Ketone, O18-Me-Ussuriedine Natural products CC=CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O GZJLLYHBALOKEX-UHFFFAOYSA-N 0.000 description 1
- 101150014984 ACO gene Proteins 0.000 description 1
- 101150093595 ACO1 gene Proteins 0.000 description 1
- 244000215068 Acacia senegal Species 0.000 description 1
- 108010003902 Acetyl-CoA C-acyltransferase Proteins 0.000 description 1
- 102000004672 Acetyl-CoA C-acyltransferase Human genes 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000238426 Anostraca Species 0.000 description 1
- 108010024976 Asparaginase Proteins 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 1
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 235000021357 Behenic acid Nutrition 0.000 description 1
- 239000005711 Benzoic acid Chemical class 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 239000004255 Butylated hydroxyanisole Substances 0.000 description 1
- 239000004322 Butylated hydroxytoluene Substances 0.000 description 1
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- XMFASNZWWPHTPG-UHFFFAOYSA-N CCCCCCCCCCCCCCCC(O)=O.CCCCCCC=CCCCCCCCC(O)=O Chemical compound CCCCCCCCCCCCCCCC(O)=O.CCCCCCC=CCCCCCCCC(O)=O XMFASNZWWPHTPG-UHFFFAOYSA-N 0.000 description 1
- RZZPDXZPRHQOCG-OJAKKHQRSA-M CDP-choline(1-) Chemical compound O[C@@H]1[C@H](O)[C@@H](COP([O-])(=O)OP([O-])(=O)OCC[N+](C)(C)C)O[C@H]1N1C(=O)N=C(N)C=C1 RZZPDXZPRHQOCG-OJAKKHQRSA-M 0.000 description 1
- 101150098791 CPT1 gene Proteins 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 101100501250 Caenorhabditis elegans elo-3 gene Proteins 0.000 description 1
- 101100289888 Caenorhabditis elegans lys-5 gene Proteins 0.000 description 1
- 241000588565 Caenorhabditis tropicalis Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 239000005632 Capric acid (CAS 334-48-5) Substances 0.000 description 1
- 241000321369 Cephalopholis fulva Species 0.000 description 1
- 241000238366 Cephalopoda Species 0.000 description 1
- 240000008886 Ceratonia siliqua Species 0.000 description 1
- 235000013912 Ceratonia siliqua Nutrition 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 241001480517 Conidiobolus Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000238424 Crustacea Species 0.000 description 1
- 241000199912 Crypthecodinium cohnii Species 0.000 description 1
- 241000223233 Cutaneotrichosporon cutaneum Species 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- 241001147477 Cyclotella cryptica Species 0.000 description 1
- 240000008990 Cyperus javanicus Species 0.000 description 1
- 241000252233 Cyprinus carpio Species 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- MMWCIQZXVOZEGG-XJTPDSDZSA-N D-myo-Inositol 1,4,5-trisphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H](O)[C@@H]1OP(O)(O)=O MMWCIQZXVOZEGG-XJTPDSDZSA-N 0.000 description 1
- 101150023395 DGA1 gene Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101100009781 Danio rerio dmbx1a gene Proteins 0.000 description 1
- 241000235036 Debaryomyces hansenii Species 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 101000729758 Dehalococcoides mccartyi (strain ATCC BAA-2266 / KCTC 15142 / 195) Glycerol-3-phosphate acyltransferase 5 Proteins 0.000 description 1
- 241000200106 Emiliania Species 0.000 description 1
- 241001480508 Entomophthora Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 239000004386 Erythritol Substances 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 101710158368 Extracellular lipase Proteins 0.000 description 1
- 101710089384 Extracellular protease Proteins 0.000 description 1
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 235000019733 Fish meal Nutrition 0.000 description 1
- 244000182067 Fraxinus ornus Species 0.000 description 1
- 235000002917 Fraxinus ornus Nutrition 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 241001149475 Gaeumannomyces graminis Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 1
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 101710162677 Glyceraldehyde-3-phosphate dehydrogenase 2 Proteins 0.000 description 1
- 101710162684 Glyceraldehyde-3-phosphate dehydrogenase 3 Proteins 0.000 description 1
- 108030000884 Glycerol-3-phosphate 1-O-acyltransferases Proteins 0.000 description 1
- 101710199764 Glycerol-3-phosphate acyltransferase 3 Proteins 0.000 description 1
- 102100040870 Glycine amidinotransferase, mitochondrial Human genes 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 101000893303 Homo sapiens Glycine amidinotransferase, mitochondrial Proteins 0.000 description 1
- 101001071233 Homo sapiens PHD finger protein 1 Proteins 0.000 description 1
- 101100084403 Homo sapiens PRODH gene Proteins 0.000 description 1
- 101000612397 Homo sapiens Prenylcysteine oxidase 1 Proteins 0.000 description 1
- XSXIVVZCUAHUJO-UHFFFAOYSA-N Homo-gamma-linoleic acid Natural products CCCCCC=CCC=CCCCCCCCCCC(O)=O XSXIVVZCUAHUJO-UHFFFAOYSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 241001501873 Isochrysis galbana Species 0.000 description 1
- 241000003482 Japonochytrium Species 0.000 description 1
- 102100027629 Kinesin-like protein KIF11 Human genes 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 101150066244 LRO1 gene Proteins 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 239000005639 Lauric acid Substances 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100037611 Lysophospholipase Human genes 0.000 description 1
- 241001344131 Magnaporthe grisea Species 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 241000033340 Merluccius capensis Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108700005443 Microbial Genes Proteins 0.000 description 1
- 241000294598 Moritella marina Species 0.000 description 1
- 241000048020 Mortierella exigua Species 0.000 description 1
- 241000306281 Mucor ambiguus Species 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 241000272458 Numididae Species 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241001221668 Ostreococcus tauri Species 0.000 description 1
- 102100036879 PHD finger protein 1 Human genes 0.000 description 1
- 101150105372 POX1 gene Proteins 0.000 description 1
- 101150114097 POX3 gene Proteins 0.000 description 1
- 101150053659 POX4 gene Proteins 0.000 description 1
- 101150004239 POX5 gene Proteins 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 108010011964 Phosphatidylcholine-sterol O-acyltransferase Proteins 0.000 description 1
- 102000014190 Phosphatidylcholine-sterol O-acyltransferase Human genes 0.000 description 1
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 1
- 102100035200 Phospholipase A and acyltransferase 4 Human genes 0.000 description 1
- 102100032967 Phospholipase D1 Human genes 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 241001600434 Plectroglyphidodon lacrymatus Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 101100505672 Podospora anserina grisea gene Proteins 0.000 description 1
- 244000298647 Poinciana pulcherrima Species 0.000 description 1
- 102100028772 Proline dehydrogenase 1, mitochondrial Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101000813109 Rattus norvegicus Elongation of very long chain fatty acids protein 6 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241001149408 Rhodotorula graminis Species 0.000 description 1
- 241000221523 Rhodotorula toruloides Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101100313649 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) POT1 gene Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000233671 Schizochytrium Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000269821 Scombridae Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000269809 Sparus aurata Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- 241000233675 Thraustochytrium Species 0.000 description 1
- 241000144181 Thraustochytrium aureum Species 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 241000276707 Tilapia Species 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 101710128940 Triacylglycerol lipase Proteins 0.000 description 1
- KYOBSHFOBAOFBF-UHFFFAOYSA-N UMP Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1C(O)=O KYOBSHFOBAOFBF-UHFFFAOYSA-N 0.000 description 1
- 241000134363 Umbelopsis ramanniana Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 229930003427 Vitamin E Natural products 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 101100215634 Yarrowia lipolytica (strain CLIB 122 / E 150) XPR2 gene Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 101100194320 Zea mays PER1 gene Proteins 0.000 description 1
- 101100029251 Zea mays PER2 gene Proteins 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 239000000205 acacia gum Substances 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 108010089140 acyl CoA oxidase 3 Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000000240 adjuvant effect Effects 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000010419 agar Nutrition 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- CUXYLFPMQMFGPL-SUTYWZMXSA-N all-trans-octadeca-9,11,13-trienoic acid Chemical compound CCCC\C=C\C=C\C=C\CCCCCCCC(O)=O CUXYLFPMQMFGPL-SUTYWZMXSA-N 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 239000001166 ammonium sulphate Substances 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 239000002269 analeptic agent Substances 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 229940121363 anti-inflammatory agent Drugs 0.000 description 1
- 239000002260 anti-inflammatory agent Substances 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003529 anticholesteremic agent Substances 0.000 description 1
- 229940127226 anticholesterol agent Drugs 0.000 description 1
- 229940053200 antiepileptics fatty acid derivative Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 101150005479 are1 gene Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 208000015802 attention deficit-hyperactivity disease Diseases 0.000 description 1
- 235000015241 bacon Nutrition 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 235000013527 bean curd Nutrition 0.000 description 1
- 229940116226 behenic acid Drugs 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 231100000693 bioaccumulation Toxicity 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 235000012813 breadcrumbs Nutrition 0.000 description 1
- 235000015496 breakfast cereal Nutrition 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 235000019282 butylated hydroxyanisole Nutrition 0.000 description 1
- CZBZUDVBLSSABA-UHFFFAOYSA-N butylated hydroxyanisole Chemical compound COC1=CC=C(O)C(C(C)(C)C)=C1.COC1=CC=C(O)C=C1C(C)(C)C CZBZUDVBLSSABA-UHFFFAOYSA-N 0.000 description 1
- 229940043253 butylated hydroxyanisole Drugs 0.000 description 1
- 235000010354 butylated hydroxytoluene Nutrition 0.000 description 1
- 229940095259 butylated hydroxytoluene Drugs 0.000 description 1
- 235000012970 cakes Nutrition 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001721 carbon Chemical class 0.000 description 1
- 235000014171 carbonated beverage Nutrition 0.000 description 1
- 230000003293 cardioprotective effect Effects 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 238000009903 catalytic hydrogenation reaction Methods 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 238000011072 cell harvest Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 239000005482 chemotactic factor Substances 0.000 description 1
- 235000015218 chewing gum Nutrition 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000001886 ciliary effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 235000014156 coffee whiteners Nutrition 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 235000020186 condensed milk Nutrition 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000008162 cooking oil Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 235000014048 cultured milk product Nutrition 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 235000011850 desserts Nutrition 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 150000005690 diesters Chemical class 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000007882 dietary composition Nutrition 0.000 description 1
- 235000020931 dietary conditions Nutrition 0.000 description 1
- 235000019007 dietary guidelines Nutrition 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- NFRFUGBXJTXTMZ-UHFFFAOYSA-L disodium;2,3-di(hexadecanoyloxy)propyl phosphate Chemical compound [Na+].[Na+].CCCCCCCCCCCCCCCC(=O)OCC(COP([O-])([O-])=O)OC(=O)CCCCCCCCCCCCCCC NFRFUGBXJTXTMZ-UHFFFAOYSA-L 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- KAUVQQXNCKESLC-UHFFFAOYSA-N docosahexaenoic acid (DHA) Natural products COC(=O)C(C)NOCC1=CC=CC=C1 KAUVQQXNCKESLC-UHFFFAOYSA-N 0.000 description 1
- 235000012489 doughnuts Nutrition 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 230000001214 effect on cellular process Effects 0.000 description 1
- 150000002066 eicosanoids Chemical class 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 201000003104 endogenous depression Diseases 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 229940009714 erythritol Drugs 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 235000019414 erythritol Nutrition 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- DECIPOUIJURFOJ-UHFFFAOYSA-N ethoxyquin Chemical compound N1C(C)(C)C=C(C)C2=CC(OCC)=CC=C21 DECIPOUIJURFOJ-UHFFFAOYSA-N 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 101150017244 exp-1 gene Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004133 fatty acid degradation Effects 0.000 description 1
- 101150031187 fba gene Proteins 0.000 description 1
- 101150108901 fbaA gene Proteins 0.000 description 1
- 101150035621 fen1 gene Proteins 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000004467 fishmeal Substances 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000007421 fluorometric assay Methods 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 235000020509 fortified beverage Nutrition 0.000 description 1
- 239000013505 freshwater Substances 0.000 description 1
- 235000013611 frozen food Nutrition 0.000 description 1
- 235000015203 fruit juice Nutrition 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 229940044627 gamma-interferon Drugs 0.000 description 1
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 235000021474 generally recognized As safe (food) Nutrition 0.000 description 1
- 235000021472 generally recognized as safe Nutrition 0.000 description 1
- 235000021473 generally recognized as safe (food ingredients) Nutrition 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 235000003869 genetically modified organism Nutrition 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 150000002327 glycerophospholipids Chemical class 0.000 description 1
- 101150054900 gus gene Proteins 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- RMMMJEMNGXIIPT-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCC(O)=O RMMMJEMNGXIIPT-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- 235000019692 hotdogs Nutrition 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 230000000774 hypoallergenic effect Effects 0.000 description 1
- 235000015243 ice cream Nutrition 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 229960001438 immunostimulant agent Drugs 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 235000021125 infant nutrition Nutrition 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 235000015110 jellies Nutrition 0.000 description 1
- 239000008274 jelly Substances 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 238000002386 leaching Methods 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 150000002617 leukotrienes Chemical class 0.000 description 1
- 101150077696 lip-1 gene Proteins 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 235000020978 long-chain polyunsaturated fatty acids Nutrition 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- 108010093769 lysophospholipase-transacylase Proteins 0.000 description 1
- 235000020640 mackerel Nutrition 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 208000024714 major depressive disease Diseases 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 235000020124 milk-based beverage Nutrition 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 150000002759 monoacylglycerols Chemical class 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 230000001937 non-anti-biotic effect Effects 0.000 description 1
- 235000021590 normal diet Nutrition 0.000 description 1
- 235000021049 nutrient content Nutrition 0.000 description 1
- 235000021048 nutrient requirements Nutrition 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- RQFLGKYCYMMRMC-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCCCC(O)=O RQFLGKYCYMMRMC-UHFFFAOYSA-N 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- KYOBSHFOBAOFBF-XVFCMESISA-N orotidine 5'-phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1C(O)=O KYOBSHFOBAOFBF-XVFCMESISA-N 0.000 description 1
- 229940000673 orphan drug Drugs 0.000 description 1
- 239000002859 orphan drug Substances 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 229940094443 oxytocics prostaglandins Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 238000009372 pisciculture Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 108010016297 plasmin drug combination deoxyribonuclease Proteins 0.000 description 1
- 239000005014 poly(hydroxyalkanoate) Substances 0.000 description 1
- 229920000903 polyhydroxyalkanoate Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 108010001062 polysaccharide-K Proteins 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 159000000001 potassium salts Chemical class 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- QAQREVBBADEHPA-IEXPHMLFSA-N propionyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 QAQREVBBADEHPA-IEXPHMLFSA-N 0.000 description 1
- 150000003180 prostaglandins Chemical class 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 235000011962 puddings Nutrition 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical class O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 108010033405 ribosomal protein S7 Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007127 saponification reaction Methods 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 235000021391 short chain fatty acids Nutrition 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 235000002316 solid fats Nutrition 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000004334 sorbic acid Chemical class 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 235000021262 sour milk Nutrition 0.000 description 1
- 235000013322 soy milk Nutrition 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 235000013599 spices Nutrition 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 108010016092 sterol O-acyltransferase 2 Proteins 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000000194 supercritical-fluid extraction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- ZTUXEFFFLOVXQE-UHFFFAOYSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCC(O)=O ZTUXEFFFLOVXQE-UHFFFAOYSA-N 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000003595 thromboxanes Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 150000005691 triesters Chemical class 0.000 description 1
- 230000001228 trophic effect Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 229940046009 vitamin E Drugs 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 235000020985 whole grains Nutrition 0.000 description 1
- 235000008939 whole milk Nutrition 0.000 description 1
- 230000029663 wound healing Effects 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 235000013618 yogurt Nutrition 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23D—EDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
- A23D9/00—Other edible oils or fats, e.g. shortenings, cooking oils
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6434—Docosahexenoic acids [DHA]
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23K—FODDER
- A23K20/00—Accessory food factors for animal feeding-stuffs
- A23K20/10—Organic substances
- A23K20/158—Fatty acids; Fats; Products containing oils or fats
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L33/00—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
- A23L33/10—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
- A23L33/115—Fatty acids or derivatives thereof; Fats or oils
- A23L33/12—Fatty acids or derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/04—Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/14—Prodigestives, e.g. acids, enzymes, appetite stimulants, antidyspeptics, tonics, antiflatulents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/02—Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
- A61P19/10—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/20—Hypnotics; Sedatives
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/24—Antidepressants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/30—Drugs for disorders of the nervous system for treating abuse or dependence
- A61P25/32—Alcohol-abuse
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/06—Antihyperlipidemics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/08—Drugs for disorders of the metabolism for glucose homeostasis
- A61P3/10—Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/12—Antihypertensives
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/18—Baker's yeast; Brewer's yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/746—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for lactic acid bacteria (Streptococcus; Lactococcus; Lactobacillus; Pediococcus; Enterococcus; Leuconostoc; Propionibacterium; Bifidobacterium; Sporolactobacillus)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0083—Miscellaneous (1.14.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6472—Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23V—INDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
- A23V2002/00—Food compositions, function of food ingredients or processes for food or foodstuffs
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Polymers & Plastics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Neurosurgery (AREA)
- Neurology (AREA)
- Food Science & Technology (AREA)
- Diabetes (AREA)
- Rheumatology (AREA)
- Physical Education & Sports Medicine (AREA)
- Cardiology (AREA)
- Heart & Thoracic Surgery (AREA)
- Nutrition Science (AREA)
- Virology (AREA)
Abstract
본 발명에는 전체 오일 분획 중 5.6% 초과의 도코사헥사엔산 (DHA, ω-3 다불포화 지방산)을 생성할 수 있는 유질 효모 야로위아 리폴리티카의 유전자 조작된 균주가 기재되어 있다. 이 균주는 이종 데새투라제, 엘론가제 및 아실트랜스퍼라제를 발현하는 다양한 키메라 유전자를 포함하고, 임의로는 DHA의 합성 및 고축적이 가능한 다양한 천연 데새투라제 및 아실트랜스퍼라제 녹아웃을 포함한다. 상기 숙주 세포 내에서 DHA를 생성하는 방법으로서, 생성 숙주 세포가 청구된다.
도코사헥사엔산, 야로위아 리폴리티카 균주, 데새투라제, 엘론가제
Description
본 출원은 2004년 11월 4일자로 출원된 미국 가출원 제60/624812호를 우선권으로 주장하며, 그 전문은 본원에 참고로 포함된다.
본 발명은 생명공학 분야에 속한다. 보다 구체적으로, 본 발명은 고농도의 도코사헥사엔산 (ω-3 다불포화 지방산)을 생성할 수 있는 유질 효모 야로위아 리폴리티카(Yarrowia lipolytica)의 유전자 조작된 균주에 관한 것이다.
도코사헥사엔산 (DHA; 시스-4,7,10,13,16,19-도코사헥사엔산; C22:6 ω-3)은 뇌 기능의 성장, 기능 발달 및 건강 유지에 필수적이며, 요람기로부터 노화까지 인생 전반에 요구된다 [Horrocks, L.A. and Y.K. Yeo. Pharmacol. Res. 40(3):211-225 (1999)]. DHA 결핍은 태아기 알콜 증후군, 주의력 결핍 과잉활동 장애, 낭포성 섬유증, 페닐케톤뇨증, 단극적 우울증, 공격성 적대성 및 부신백질이영양증과 연관된다. 반대로, 증가된 DHA 섭취는 유익함을 나타내거나, 염증성 장애 (예를 들어, 류마티스 관절염), II형 당뇨병, 고혈압, 아테롬성 동맥경화증, 우울증, 심근경색증, 혈전증, 일부 암에서 유리한 효과를 갖고, 알쯔하이머병(Alzheimer's disease)과 같은 퇴행성 장애의 발병을 예방하는 데 유리한 효과를 갖는다.
어류 (예를 들어, 연어, 송어, 고등어)는 이들이 DHA와 같은 장쇄 지방산을 천연적으로 고농도로 함유하기 때문에 DHA의 중요한 공급원이다. 많은 연구 [미국 정부가 발행한 2005년 식사 가이드라인 자문 위원회 보고서(2005 Dietary Guidelines Advisory Committee Report for Americans, part D, section 4 (coordinated by the U.S. Dept. of Health & Human Services and the U.S. Dept. of Agriculture))에 보고됨]에 근거하여, 미국 심장 협회(the American Heart Association), 국제 콜레스테롤 교육 프로그램(the National Cholesterol Education Program), 세계 건강 기구(the World Health Association), 유럽 심장 학회(the European Society for Cardiology), 미국 당뇨 협회(the American Diabetes Association) 및 영양분에 대한 영국 과학 자문 위원회(the United Kingdom Scientific Advisory Committee on Nutrition)는 모두 이렇게 시사된 심장보호 효과를 위해 1주에 2회 식사의 생선 (각 식사 시 하루에 DHA 및 에이코사펜타엔산 (EPA, C20:5 ω-3) 약 450 mg 정도의 동량을 제공함)을 권장한다. 이와 같이, DHA는 기능성 식품, 유아용 영양분, 벌크 영양소 및 동물 건강과 관련된 다양한 제품에 혼입된다.
도코사펜타엔산 (DPA, C22:5 ω-3)의 생리학적 기능은 아직 공지되어 있지 않지만, 이 지방산는 DHA의 대사 전구체이고 EPA를 연장시킨 바로 하류 생성물이다. DPA는 또한 그 함량이 매우 낮기는 하지만 어유에도 함유된 것으로 공지되어 있다. DPA에 대해 단지 공지된 기능은 제약 제제를 뇌로 운반하기 위해 담체로서 유용성을 갖는다는 것이다 (일본 특허 공개 (공개) 제61-204136호 (1986)). 그러나, DHA 결핍을 보충할 때 DPA가 증가하는 것으로 공지되어 있으므로, DPA는 동물체 내 생리학적 역할을 수행할 수 있는 것으로 예상된다 [Homayoun et al., J. Neurochem., 51 :45 (1988); Hamm et al., Biochem. J., 245:907 (1987); 및 Rebhung et al., Biosci. Biotech. Biochem., 58:314 (1994)]. 따라서, DPA 및 DHA 모두는 중요한 ω-3 지방산으로서 여겨져야만 한다. 당업자는 DHA에 대한 본원에서의 교시가 또한 광범위하게 적용가능하고 DPA 제조에 관한 본원의 교시가 미래의 목적하는 생성물이 될 것임을 인지할 것이다.
DHA는 여러 유형의 어유 및 해양 플랑크톤에서 천연적으로 발견되지만, 이러한 ω-3 지방산의 공급은 늘어나는 수요를 충족시키기에는 불충분할 것이라고 예측된다. 어유는 매우 불균질한 조성 (이 때문에, EPA를 풍부하게 하기 위해서는 과도한 정제가 요구됨), 불쾌한 맛 및 냄새 (이는 경제적으로 제거하기가 어렵고, 어유가 식품 성분으로서 허용되지 않게 함)를 가지며, 중금속 오염물의 환경적인 생체 축적 및 (기후, 질환 또는 남획으로 인한) 입수성의 변동이 쉽게 일어난다.
어유에 대한 대체물로서, DHA는 또한 미생물에서 생성될 수 있다. 일반적으로, 미생물성 오일 생성은 오일 합성 (이는 통상적인 세포 대사의 과정에서 일어남)을 가능하게 하는 적합한 배양 배지에서 EPA를 천연 합성할 수 있는 적절한 미생물을 배양한 후, 발효 배지로부터 미생물을 분리하고, 세포내 오일의 회수를 위한 처리하는 것을 포함한다. 특이적인 미생물 유기체 [예를 들어, 시조키트륨(Schizochytrium) 종 (미국 특허 제5,340,742호; 미국 특허 제6,582,941호); 울케 니아(Ulkenia) (미국 특허 제6,509,178호); 수도모나스(Pseudomonas) 종 YS-180 (U.S. 6,207,441); 트라우스토키트륨(Thraustochytrium) 속 균주 LFF1 (미국 특허 제2004/0161831 A1호); 크립테코디늄 코니(Crypthecodinium cohnii) (미국 특허 제2004/0072330 A1호; 문헌 [de Swaaf, M. E. et al. Biotechnol Bioeng. 81 (6):666-72 (2003)] 및 [Appl Microbiol Biotechnol. 61 (1):40-3 (2003)]); 에밀리아니아(Emiliania) 종 (일본 특허 출원 (공개) 제5-308978호 (1993)); 및 자포노키트륨(Japonochytrium) 종 (ATCC #28207; 일본 특허 출원 (공개) 제199588/1989호)]를 기초로 하는 여러 수많은 방법이 존재한다. 추가로, 하기 미생물: 비브리오 마리누스(Vibrio marinus) (심해로부터 단리된 박테리아; ATCC #15381); 미세조류 시클로텔라 크립티카(Cyclotella cryptica) 및 이소크리시스 갈바나(Isochrysis galbana); 및 편모충 곰팡이, 예를 들어 트라우스토키트륨 아우레움(Thraustochytrium aureum) (ATCC #34304; 문헌 [Kendrick, Lipids, 27:15 (1992)]), 및 ATCC #28211, ATCC #20890 및 ATCC #20891로 지칭되는 트라우스토키트륨 종은 DHA를 생산하는 능력이 있는 것으로 공지되어 있다. 그리고, 이들 몇몇 방법이 다양한 제한의 결과로서 산업적 사용성에 대하여 허용되지 않더라도, DHA의 상업적 제조를 위한 적어도 3가지의 상이한 발효 과정: DHASCO™ (매릴랜드주 콜롬비아 소재의 마르텍 바이오사이언시스 코포레이션(Martek Biosciences Corporation)) 제조용 크립테코디늄 코니의 발효; DHAGold (마르텍 바이오사이언시스 코포레이션)로서 종래 공지된 오일 제조용 시조키트륨 종의 발효; 및 DHActive™ (독일 프랑크푸르트 소재의 뉴트리노바(Nutrinova)) 제조용 울케니아 종의 발효 가 존재한다. 이러한 성공에도 불구하고, 이들 각각의 방법은 발효가 미생물 자체의 천연 능력에 의존적이기 때문에 생성된 오일 조성물의 특징을 조절하거나 또는 오일의 수율을 실질적으로 개선시키는 능력이 없어서 적용하기 어렵다.
따라서, 재조합 수단을 이용하는 DHA의 미생물 생성은 천연 미생물 공급원으로부터의 생성에 비해 여러 이점이 있을 것으로 예상된다. 예를 들어, 숙주의 천연 발생 미생물 지방산 프로파일은 숙주에서 새로운 생합성 경로의 도입 및/또는 원치않는 경로의 저해에 의해 변경되어, 원하는 PUFA (또는 그의 접합된 형태)의 생성 수준을 증가시키고, 원치않는 PUFA의 생성을 감소시킬 수 있기 때문에, 오일 생성을 위한 바람직한 특징을 갖는 재조합 미생물을 사용할 수 있다. 둘째로, 재조합 미생물은 특정 용도를 가질 수 있는 특정한 형태의 PUFA를 제공할 수 있다. 그리고, 마지막으로, 미생물성 오일 생성은 배양 조건의 조절에 의해, 현저하게는 미생물에서 발현되는 효소를 위한 특정한 기질 공급원을 제공함으로써, 또는 화합물 첨가/유전자 조작에 의해 원치않는 생화학적 경로를 저해함으로써 조작될 수 있다. 따라서, 예를 들어 그렇게 생성된 ω-3 지방산과 ω-6 지방산의 비율을 변형시킬 수 있거나, 다른 PUFA 하류 또는 상류 생성물의 유의한 축적이 없이 특이적 PUFA (예컨대, DHA)의 생성을 유전자 조작할 수 있다.
DHA의 미생물성 생성은 먼저 중간체 지방산인 EPA의 합성이 요구된다. 그리고, 미생물에서 생성되는 대부분의 DHA는 Δ6 데새투라제(desaturase)/Δ6 엘론가제(elongase) 경로 (조류, 이끼류, 진균, 선충류 및 인간에서 우세하게 발견됨)를 통해 합성되며, 여기서, 1) Δ12 데새투라제의 작용에 의해 올레산이 LA로 전환되 고, 2) 임의로, Δ15 데새투라제의 작용에 의해 LA는 ALA로 전환되고, 3) Δ6 데새투라제의 작용에 의해 LA는 GLA로 전환되고/되거나 ALA는 STA로 전환되고, 3) C18 /20 엘론가제의 작용에 의해 GLA가 DGLA로 전환되고/되거나 STA가 ETA로 전환되고, 3) Δ5 데새투라제의 작용에 의해 DGLA가 ARA로 전환되고/되거나 ETA가 EPA로 전환되고, 4) 임의로, Δ17 데새투라제의 작용에 의해 ARA가 EPA로 전환된다 (도 1). 그러나, EPA의 생합성을 위한 별법의 Δ9 엘론가제/Δ8 데새투라제 경로는 일부 유기체, 예컨대 유글레나 종에서 작동하며, 이는 C20 PUFA의 형성을 위한 주요 경로이다 (문헌 [Wallis, J.G., and Browse, J. Arch. Biochem. Biophys. 365:307-316 (1999)]; 제WO 00/34439호 및 [Qi, B. et al. FEBS Letters. 510:159-165 (2002)]). 이 경로에서는, 1) Δ9 엘론가제에 의해 LA 및 ALA가 각각 EDA 및 ETrA로 전환되고, 2) Δ8 데새투라제에 의해 EDA 및 ETrA가 각각 DGLA 및 ETA로 전환되고, 3) 상기 기재된 바와 같이 DGLA 및 ETA가 궁극적으로 EPA로 전환된다. EPA의 합성에 따라, C20 /22 엘론가제는 기질을 DPA로 전환시킨 다음, Δ4 데새투라제에 의해 탈포화시켜 DHA를 수득하는 데 작용한다.
상기 문헌은 ω-3/ω-6 PUFA 생합성 경로의 다양한 부분을 사카로마이세스 세레비지애(Saccharomyces cerevisiae) (비-유질 효모)에 도입한 수많은 최근의 예시적인 방법을 보고한다. 구체적으로, 문헌 [Dyer, J. M. et al., Appl. Eniv. Microbiol., 59:224-230 (2002)]은 리놀렌산의 합성을 보고하였고, 넛존(Knutzon) 등의 미국 특허 제6,136,574호는 리놀렌산 (LA), γ-리놀렌산 (GLA), ALA 및 스테 아리돈산 (STA)의 생성을 유도하였고, 문헌 [Domergue, F. et al., Eur. J. Biochem. 269:4104-4113 (2002)]는 EPA의 생성을 기재하였고, 문헌 [Pereira, S. L. et al., Biochem. J. 384:357-366 (2004)]는 최초로 DHA를 생성하였다 (EPA가 기질로서 공급되는 경우 전체 지방산의 3.8%). 그러나, 이러한 성공에도 불구하고, DHA의 시판량 (즉, 전체 지방산에 대하여 5 내지 30% 초과)을 경제적으로 생성할 수 있는 복잡한 대사성 유전자 조작은 보고된 바가 없었다. 추가로, 이러한 조작을 위해 가장 적절한 숙주 유기체의 선택과 관련하여 상당한 편차가 존재한다.
최근에, 피카타지오(Picataggio) 등의 제WO 2004/101757호 및 동시-계류중인 미국 특허 출원 제60/624812호에서는 PUFA, 예컨대 ARA, EPA 및 DHA의 생성을 위한 바람직한 미생물 부류로서 유질 효모, 구체적으로 야로위아 리폴리티카 (이전에는 칸디다 리폴리티카(Candida lipolytica)로서 분류됨)의 유용성에 대해 연구하였다. 유질 효모는 천연적인 오일 합성 및 축적이 가능한 효모로서 정의되며, 여기서, 오일 축적은 세포 건조 중량의 약 80%까지일 수 있다. 이들 유기체는 ω-6 및 ω-3 지방산 생성이 천연적으로 결핍되어 있음에도 불구하고 (천연적으로 생성되는 PUFA는 18:2 지방산 (및 덜 통상적으로는, 18:3 지방산)으로 제한되기 때문), 피카타지오 등의 상기 문헌에서는 비교적 간단한 유전자 조작 접근법을 이용하여 야로위아 리폴리티카에서 (전체 지방산의) 1.3% ARA 및 1.9% EPA의 생성을 입증하였고, 더 복잡한 대사성 유전자 조작을 이용하여 28% 이하의 EPA 생성을 입증하였다. 그러나, 상기 특정한 숙주 유기체에서 더욱 복잡한 대사성 유전자 조작에 의해 DHA를 경제적이고 상업적으로 생성한 적은 없다.
본 출원인은 Δ6 데새투라제/Δ6 엘론가제 경로를 이용하여 전체 오일 분획 중 5% 초과의 DHA를 생성할 수 있는 다양한 야로위아 리폴리티카 균주의 유전자 조작에 의해 상기 문제점을 해결하였다. 이들 유질 효모에서 DHA 생성률을 더욱 증가시키기 위해 추가의 대사성 유전자 조작 및 발효 방법뿐만 아니라, Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생성할 수 있는 방법 (이에 따라 GLA가 결여된 DHA-함유 오일을 생성함)을 제공한다.
<발명의 요약>
본 발명은 도코사헥사엔산 (DHA)을 생성하기 위해 유전자 조작된 재조합 생성 숙주, 이를 제조하는 방법 및 본 발명의 제조합 숙주에 의해 생성된 미생물성 오일을 함유한 식품 공급 제품에 관한 것이다.
따라서, 본 발명의 한 실시양태는, ω-3/ω-6 지방산 생합성 경로의 유전자인
a) Δ6 데새투라제를 코딩하는 하나 이상의 유전자;
b) C18 /20 엘론가제를 코딩하는 하나 이상의 유전자;
c) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;
d) Δ17 데새투라제를 코딩하는 하나 이상의 유전자;
e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및
f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자
를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하는, 도코사헥 사엔산의 생성을 위한 재조합 생성 숙주 세포를 제공한다.
또다른 실시양태에서, 본 발명은 ω-3/ω-6 지방산 생합성 경로의 유전자인
a) Δ15 데새투라제를 코딩하는 하나 이상의 유전자;
b) Δ6 데새투라제를 코딩하는 하나 이상의 유전자;
c) C18 /20 엘론가제를 코딩하는 하나 이상의 유전자;
d) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;
e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및
f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자
를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하는, 도코사헥사엔산 생성을 위한 재조합 생성 숙주 세포를 제공한다.
또다른 실시양태에서, 본 발명은 ω-3/ω-6 지방산 생합성 경로의 유전자인
a) Δ9 엘론가제를 코딩하는 하나 이상의 유전자;
b) Δ8 데새투라제를 코딩하는 하나 이상의 유전자;
c) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;
d) Δ17 데새투라제를 코딩하는 하나 이상의 유전자;
e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및
f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자
를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하는, 도코사헥사엔산 생성을 위한 재조합 생성 숙주 세포를 제공한다.
별법의 실시양태에서, 본 발명은 ω-3/ω-6 지방산 생합성 경로의 유전자인
a) Δ15 데새투라제를 코딩하는 하나 이상의 유전자;
b) Δ9 엘론가제를 코딩하는 하나 이상의 유전자;
c) Δ8 데새투라제를 코딩하는 하나 이상의 유전자;
d) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;
e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및
f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자
를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하는, 도코사헥사엔산 생성을 위한 재조합 생성 숙주 세포를 제공한다.
바람직한 실시양태에서, 본 발명의 생성 숙주는 임의로는 Δ12 데새투라제를 코딩하는 하나 이상의 유전자를 포함한다. 또다른 바람직한 실시양태에서, 본 발명은 전체 지방산에 대한 백분율로서 약 5% 이상의 도코사헥사엔산을 갖는 미생물성 오일을 생성하는 제조합 생성 숙주를 제공한다.
또다른 실시양태에서, 본 발명은
a) 도코사헥사엔산을 포함하는 미생물성 오일을 생성하는 본 발명의 생성 숙주를 배양하는 단계; 및
b) 임의로 단계 a)의 미생물성 오일을 회수하는 단계
를 포함하는, 도코사헥사엔산을 포함하는 미생물성 오일을 생성하는 방법을 제공한다.
또다른 실시양태에서, 본 발명은 상기 방법으로 제조된 미생물성 오일 및 본 발명의 생성 숙주를 제공한다. 바람직한 실시양태에서, 본 발명의 미생물성 오일은 DHA를 함유하지만 임의의 γ-리놀레산은 함유하지 않는다.
또다른 실시양태에서, 본 발명은 본 발명의 방법으로 생성된 유효량의 미생물성 오일을 포함하는 식품을 제공한다. 다르게는, 본 발명은 본 발명의 방법으로 생성된 유효량의 미생물성 오일을 포함하는, 의료용 식품, 식이 보조제; 유아용 조제식 및 약제로 이루어진 군으로부터 선택된 제품을 제공한다.
다르게는, 본 발명은 본 발명의 방법으로 생성된 유효량의 미생물성 오일을 포함하는 동물 사료를 제공한다.
또다른 실시양태에서, 본 발명은 도코사헥사엔산을 함유하는 본 발명의 방법에 의해 생성된 미생물성 오일을 인간 또는 동물이 소모가능하거나 사용가능한 형태로 제공하는 것을 포함하는, 에이코사펜타엔산이 풍부한 인간, 동물 또는 양식 유기체 식이 보충제를 제공하는 방법을 제공한다.
다르게는, 본 발명은 도코사헥사엔산을 함유하는 본 발명의 방법에 의해 생성된 미생물성 오일을 인간 또는 동물이 소모가능하거나 사용가능한 형태로 제공하는 것을 포함하는, 동물 또는 인간에서 도코사헥사엔산의 결핍을 치료하는 방법을 제공한다.
<미생물 기탁>
하기 미생물은 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, 기탁 번호 및 기탁일은 하기와 같다.
미생물 | 기탁 번호 | 기탁일 |
플라스미드 pY89-5 | ATCC PTA-6048 | 2004년 6월 4일 |
야로위아 리폴리티카 Y2047 | ATCC PTA-7186 | 2005년 10월 26일 |
야로위아 리폴리티카 Y2201 | ATCC PTA-7185 | 2005년 10월 26일 |
야로위아 리폴리티카 Y2096 | ATCC PTA-7184 | 2005년 10월 26일 |
야로위아 리폴리티카 Y3000 | ATCC PTA-7187 | 2005년 10월 26일 |
<도면의 간단한 설명 및 서열의 기재>
도 1은 ω-3/ω-6 지방산 생합성 경로를 도시한다.
도 2는 유질 효모에서의 지질 축적에 대한 생화학적 메카니즘의 개략도이다.
도 3A는 메갈린(Megalign) DNASTAR 소프트웨어를 이용하여 생성한, 상이한 섬사상 진균으로부터의 Δ12 데새투라제 및 Δ15 데새투라제 단백질의 계통수를 도시한다. 도 3B는 pY57.YI.AHAS.w497l에 대한 플라스미드 지도를 제공한다.
도 4는 유질 효모에서의 지질 축적에서 다양한 아실트랜스퍼라제의 역할을 기재하는 개략도이다.
도 5는 전체 지질 분획 중 다양한 지방산 (DHA 포함)을 생산하는 본 발명의 일부 야로위아 리폴리티카 균주의 발달에 대한 약도이다.
도 6A는 pY5-30에 대한 플라스미드 지도를 제공한다. 도 6B는 야로위아 리폴리티카 ATCC #76982 균주에서 조직화학적 염색에 의해 측정된 TEF, GPD, GPM, FBA 및 FBAIN의 상대적인 프로모터 활성을 나타낸다. 도 6C는 다양한 배지에서 성장한 야로위아 리폴리티카에서 조직화학적 염색에 의해 측정된 YAT1, TEF, GPAT 및 FBAIN의 상대적인 프로모터 활성을 나타낸다.
도 7A는 야로위아 리폴리티카 ATCC #76982 균주에서 형광측정에 의해 측정된 GPD, GPM, FBA 및 FBAIN의 프로모터 활성을 비교하는 그래프이다. 도 7B는 실시간 PCR 상대적인 정량화의 결과를 그래프로 요약한 것이며, 여기서 야로위아 리폴리티카 ATCC #76982 균주의 GUS mRNA (즉, GPD::GUS, GPDIN::GUS, FBA::GUS 또는 FBAIN::GUS 키메라 유전자를 발현)는 pY5-30을 발현하는 야로위아 리폴리티카 균주의 mRNA (즉, 키메라 TEF::GUS 유전자) 수준에 대해 정량화되었다.
도 8는 (A) pKUNF12T6E, (B) pDMW271, (C) pZP3L37, (D) pZKUT16 및 (E) pKO2UM25E에 대한 플라스미드 지도를 제공한다.
도 9는 (A) pDMW303, (B) pZUF17, (C) pZUF4, (D) pFOE2S 및 (E) pZP2F0EN4에 대한 플라스미드 지도를 제공한다.
도 10은 (A) pKUNT2; (B) pDMW237; (C) pDMW240; (D) 효모 발현 벡터 pY89-5; 및 (E) pKUNFmKF2에 대한 플라스미드 지도를 제공한다.
도 11는 유글레나 그라실리스(Euglena gracilis) 세포 추출물의 지질 프로파일의 크로마토그램을 도시한다.
도 12은 다양한 유글레나 그라실리스 Δ8 데새투라제 폴리펩티드 서열의 정렬을 도시한다. 이용된 정렬 방법은 "클러스탈(Clustal) V 정렬 방법"에 상응한다.
도 13은 (A) pDMW277, (B) pZF5T-PPC, (C) pDMW287F 및 (D) pDMW297에 대한 플라스미드 지도를 제공한다.
도 14는 (A) pZP2C16M899, (B) pDMW314, (C) pDM325 및 (D) pZKL5598에 대한 플라스미드 지도를 제공한다.
도 15는 (A) pY72 [또는 "pY72.2loxp.Hyg.Fba.F15"], (B) pY80 [또는 "pY80.loxp.2F15"], (C) pY79 [또는 "pY79.Cre.AHASw497L"] 및 (D) pY86 [또는 "pY86.loxp.Ura3.Hyg.F12"]에 대한 플라스미드 지도를 제공한다.
도 16은 (A) pY94 [또는"pY94.loxp.D9ED8.Ura3"], (B) pY91M [또는"pY91.Dr.D6M (천연)"], (C) pDMW232 및 (D) pY37/F15에 대한 플라스미드 지도를 제공한다.
도 17은 (A) pKO2UF2PE, (B) pZKUGPI5S, (C) pDMW302T16 및 (D) pKO2UM26E에 대한 플라스미드 지도를 제공한다.
도 18은 (A) pZUF-Mod-1, (B) pMDAGAT1-17 및 (C) pMGPAT-17에 대한 플라스미드 지도를 제공한다.
도 19는 각각 모르티에렐라 알피나의 글리세롤-3-포스페이트 o-아실트랜스퍼라제 (GPAT)와 관련된 서열 138, 139, 140, 141, 142, 143, 144, 145, 146, 147 및 148 사이의 관계를 그래프로 나타낸다.
도 20은 각각 모르티에렐라 알피나의 C16 /18 지방산 엘론가제 효소 (ELO3)와 관련된 서열 86, 87, 88, 89, 90, 91, 92 및 93 사이의 관계를 그래프로 나타낸다.
도 21은 (A) pZUF6S, (B) pZUF6S-E3WT, (C) pZKUGPYE1-N 및 (D) pZKUGPYE2에 대한 플라스미드 지도를 제공한다.
도 22는 (A) pZKUGPYE1, (B) pZUF6FYE1, (C) pZP217 + Ura, (D) pY20 및 (E) pLV13에 대한 플라스미드 지도를 제공한다.
본 발명은 본 출원의 일부분인 하기 발명의 상세한 설명 및 첨부된 서열 기재로부터 더욱 잘 이해될 것이다.
하기 서열은 37 C.F.R.§1.821-1.825 ("뉴클레오티드 서열 및/또는 아미노산 서열을 포함하는 특허 출원에 대한 기재 요건 - 서열 규칙")에 부합하며, WIPO 표준 ST.25 (1998) 및 EPO 및 PCT의 서열 목록 요건 (규칙 5.2 및 49.5(a-bis), 및 행정 지침서 섹션 208 및 첨부 C)에 일치한다. 뉴클레오티드 및 아미노산 서열 데이타에 사용된 기호 및 포맷은 37 C.F.R.§1.822의 규칙에 부합한다.
서열 1-153 및 210-221는 표 1에 나타낸 바와 같이 프로모터, 유전자 또는 단백질 (또는 그의 단편)을 코딩하는 ORF이다.
유전자 및 단백질 서열에 대한 요약 | ||
기재 | 핵산 서열 | 단백질 서열 |
모르티에렐라 알피나 Δ6 데새투라제 | 1 (1374 bp) | 2 (457 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 모르티에렐라 알피나로부터 유래된 합성 Δ6 데새투라제 | 3 (1374 bp) | 2 (457 AA) |
모르티에렐라 알피나 Δ6 데새투라제 "B" | 4 (1521 bp) | 5 (458 AA) |
모르티에렐라 알피나 Δ5 데새투라제 | 6 (1341 bp) | 7 (446 AA) |
이소크리시스 갈바나 Δ5 데새투라제 | 8 (1329 bp) | 9 (442 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 이소크리시스 갈바나로부터 유래된 합성 Δ5 데새투라제 | 10 (1329 bp) | 9 (442 AA) |
호모 사피엔스(Homo sapiens) Δ5 데새투라제 | 11 (1335 bp) | 12 (444 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 호모 사피엔스로부터 유래된 합성 Δ5 데새투라제 | 13 (1335 bp) | 12 (444 AA) |
다니오 레리오(Danio rerio) Δ5/Δ6 데새투라제 Drd6/d5(V) (진뱅크 관리 번호 AF309556) | 14 (1590 bp) | 15 (444 AA) |
다니오 레리오 Δ5/Δ6 데새투라제 (진뱅크 관리 번호 BC068224) | 16 (1946 bp) | --- |
다니오 레리오 Δ5/Δ6 데새투라제 돌연변이체 Drd6/d5(M) | 17 (1335 bp) | 18 (444 AA) |
사프롤레그니아 디클리나(Saprolegnia diclina) Δ17 데새투라제 | 19 (1077 bp) | 20 (358 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 사프롤레그니아 디클리나로부터 유래된 합성 Δ17 데새투라제 유전자 | 21 (1077 bp) | 20 (358 AA) |
모르티에렐라 알피나 C18 /20 엘론가제 | 22 (957 bp) | 23 (318 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 모르티에렐라 알피나로부터 유래된 합성 C18 /20 엘론가제 유전자 | 24 (957 bp) | 23 (318 AA) |
트라우스토키트륨 아우레움 C18 /20 엘론가제 | 25 (819 bp) | 26 (272 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 트라우스토키트륨 아우레움으로부터 유래된 합성 C18/20 엘론가제 유전자 | 27 (819 bp) | 26 (272 AA) |
야로위아 리폴리티카 Δ12 데새투라제 | 28 (1936 bp) | 29 (419 AA) |
모르티에렐라 이자벨리나(Mortierella isabellina) Δ12 데새투라제 | 30 (1203 bp) | 31 (400 AA) |
푸사륨 모닐리포르메(Fusarium moniliforme) Δ12 데새투라제 | 32 (1434 bp) | 33 (477 AA) |
아스페르길루스 니둘란스(Aspergillus nidulans) Δ12 데새투라제 | 34 (1416 bp) | 35 (471 AA) |
아스페르길루스 플라부스(Aspergillus flavus) Δ12 데새투라제 | -- | 36 (466 AA) |
아스페르길루스 푸미가투스(Aspergillus fumigatus) Δ12 데새투라제 | -- | 37 (424 AA) |
마그나포르테 그리세아(Magnaporthe grisea) Δ12 데새투라제 | 38 (1656 bp) | 39 (551 AA) |
뉴로스포라 크라싸(Neurospora crassa) Δ12 데새투라제 | 40 (1446 bp) | 41 (481 AA) |
푸사륨 그라미네아륨(Fusarium graminearium) Δ12 데새투라제 | 42 (1371 bp) | 43 (456 AA) |
모르티에렐라 알피나 Δ12 데새투라제 | 44 (1403 bp) | 45 (400 AA) |
사카로마이세스 클루이베리(Saccharomyces kluyveri) Δ12 데새투라제 | -- | 46 (416 AA) |
클루이베로마이세스 락티스(Kluyveromyces lactis) Δ12 데새투라제 | 47 (1948 bp) | 48 (415 AA) |
칸디다 알비칸스(Candida albicans) Δ12 데새투라제 | -- | 49 (436 AA) |
데바리오마이세스 한세니이(Debaryomyces hansenii) CBS767 Δ12 데새투라제 | -- | 50 (416 AA) |
푸사륨 모닐리포르메 Δ15 데새투라제 | 51 (1209 bp) | 52 (402 AA) |
아스페르길루스 니둘란스 Δ15 데새투라제 | 53 (1206 bp) | 54 (401 AA) |
마그나포르테 그리세아 Δ15 데새투라제 | 55 (1185 bp) | 56 (394 AA) |
뉴로스포라 크라싸 Δ15 데새투라제 | 57 (1290 bp) | 58 (429 AA) |
푸사륨 그라미네아륨 Δ15 데새투라제 | 59 (1212 bp) | 60 (403 AA) |
모르티에렐라 알피나 Δ15 데새투라제 | 61 (1353 bp) | 62 (403 AA) |
클루이베로마이세스 락티스 Δ15 데새투라제 | 63 (1248 bp) | 64 (415 AA) |
칸디다 알비칸스 Δ15 데새투라제 | -- | 65 (433 AA) |
사카로마이세스 클루이베리 Δ15 데새투라제 | -- | 66 (419 AA) |
데바리오마이세스 한세니이 CBS767 Δ15 데새투라제 | -- | 67 (435 AA) |
아스페르길루스 푸미가투스 Δ15 데새투라제 | -- | 68 (396 AA) |
이소크리시스 갈바나 Δ9 엘론가제 | 69 (792 bp) | 70 (263 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된 합성 Δ9 엘론가제 유전자 | 71 (792 bp) | 70 (263 AA) |
유글레나 그라실리스 Δ8 데새투라제 유전자 (비-관능성; 진뱅크 관리 번호 AAD45877) | 72 (1275 bp) | 73 (419 AA) |
유글레나 그라실리스 Δ8 데새투라제 유전자 (비-관능성; 문헌 [Wallis et al., Archives of Biochem. Biophys., 365:307-306 (1999)]; 제WO 00/34439호) | -- | 74 (422 A) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된 합성 Δ8 데새투라제 유전자 (D8S-1) | 75 (1270 bp) | -- |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된 합성 Δ8 데새투라제 유전자 (D8S-3) | 76 (1269 bp) | -- |
유글레나 그라실리스 Δ8 데새투라제 유전자 (Eg5) | 77 (1271 bp) | 78 (421 AA) |
유글레나 그라실리스 Δ8 데새투라제 유전자 (Eg12) | 79 (1271 bp) | 80 (421 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된 합성 Δ8 데새투라제 유전자 (D8SF) | 81 (1272 bp) | 82 (422 AA) |
라투스 노르베기쿠스(Rattus norvegicus) C16 /18 엘론가제 | 83 (2628 bp) | 84 (267 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 라투스 노르베기쿠스로부터 유래된 합성 C16 /18 엘론가제 유전자 | 85 (804 bp) | 84 (276 AA) |
모르티에렐라 알피나 C16 /18 엘론가제 (ELO3) | 86 (828 bp) | 87 (275 AA) |
모르티에렐라 알피나 ELO3 - 부분 cDNA 서열 | 88 (607 bp) | -- |
모르티에렐라 알피나 ELO3 - 게놈 워킹(genome walking)에 의해 수득한 3' 서열 | 89 (1,042 bp) | -- |
모르티에렐라 알피나 ELO3 - 게놈 워킹에 의해 수득한 5' 서열 | 90 (2,223 bp) | -- |
모르티에렐라 알피나 ELO3 - cDNA 콘티그 | 91 (3,557 bp) | -- |
모르티에렐라 알피나 ELO3 - 인트론 | 92 (542 bp) | -- |
모르티에렐라 알피나 ELO3 - 게놈 콘티그 | 93 (4,099 bp) | -- |
야로위아 리폴리티카 C16 /18 엘론가제 유전자 | 94 (915 bp) | 95 (304 AA) |
칸디다 알비칸스 가능한 지방산 엘론가제 (진뱅크 관리 번호 EAL04510) | -- | 96 (353 AA) |
야로위아 리폴리티카 C14 /16 엘론가제 유전자 | 97 (978 bp) | 98 (325 AA) |
뉴로스포라 크라싸 FEN1 유전자 (진뱅크 관리 번호 CAD70918) | -- | 99 (337 AA) |
오스트레오코쿠스 타우리(Ostreococcus tauri) C20 /22 엘론가제 | 100 (903 bp) | 101 (300 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 오스트레오코쿠스 타우리로부터 유래된 합성 C20 /22 엘론가제 유전자 | 102 (903 bp) | 103 (300 AA) |
트라우스토키트륨 아우레움(Traustochytrium aureum) Δ4 데새투라세 | 104 (1548 bp) | 105 (515 AA) |
야로위아 리폴리티카에서의 발현을 위해 코돈-최적화된, 트라우스토키트륨 아우레움으로부터 유래된 합성 Δ4 데새투라세 | 106 (1545 bp) | 107 (514 AA) |
모르티에렐라 알피나 리소포스파티드산 아실트랜스퍼라제 (LPAAT1) | 108 (945 bp) | 109 (314 AA) |
모르티에렐라 알피나 리소포스파티드산 아실트랜스퍼라제 (LPAAT2) | 110 (927 bp) | 111 (308 AA) |
야로위아 리폴리티카 리소포스파티드산 아실트랜스퍼라제 (LPAAT1) | 112 (1549 bp) | 113 (282 AA) |
야로위아 리폴리티카 리소포스파티드산 아실트랜스퍼라제 (LPAAT2) - 유전자를 포함하는 게놈 단편 | 114 (1495 bp) | -- |
야로위아 리폴리티카 리소포스파티드산 아실트랜스퍼라제 (LPAAT2) | 115 (672 bp) | 116 (223 AA) |
야로위아 리폴리티카 포스포리피드:디아실글리세롤 아실트랜스퍼라제 (PDAT) | 117 (2326 bp) | 118 (648 AA) |
야로위아 리폴리티카 아실-CoA:스테롤-아실트랜스퍼라제 (ARE2) | 119 (1632 bp) | 120 (543 AA) |
캐노르합디티스 엘레강스(Caenorhabditis elegans) 아실-CoA:1-아실 리소포스파티딜콜린 아실트랜스퍼라제 (LPCAT) | -- | 121 (282 AA) |
야로위아 리폴리티카 디아실글리세롤 아실트랜스퍼라제 (DGAT1) | 122 (1578 bp) | 123 (526 AA) |
모르티에렐라 알피나 디아실글리세롤 아실트랜스퍼라제 (DGAT1) | 124 (1578 bp) | 125 (525 AA) |
뉴로스포라 크라싸 디아실글리세롤 아실트랜스퍼라제 (DGAT1) | -- | 126 (533 AA) |
지베렐라 제애(Gibberella zeae) PH-1 디아실글리세롤 아실트랜스퍼라제 (DGAT1) | -- | 127 (499 AA) |
마그나포르테 그리세아 디아실글리세롤 아실트랜스퍼라제 (DGAT1) | -- | 128 (503 AA) |
아스페르길루스 니둘란스 디아실글리세롤 아실트랜스퍼라제 (DGAT1) | -- | 129 (458 AA) |
야로위아 리폴리티카 디아실글리세롤 아실트랜스퍼라제 (DGAT2) | 130 (2119 bp) 132 (1380 bp) 134 (1068 bp) | 131 (514 AA) 133 (459 AA) 135 (355 AA) |
모르티에렐라 알피나 디아실글리세롤 아실트랜스퍼라제 (DGAT2) | 136 (996 bp) | 137 (331 AA) |
모르티에렐라 알피나 글리세롤-3-포스페이트 아실트랜스퍼라제 (GPAT) | 138 (2151 bp) | 139 (716 AA) |
모르티에렐라 알피나 GPAT - 부분 cDNA 서열 | 140 (1212 bp) | -- |
모르티에렐라 알피나 GPAT - -1050 bp 내지 +2886 bp 영역을 포함하는 게놈 단편 | 141 (3935 bp) | -- |
모르티에렐라 알피나 GPAT - 게놈 워킹에 의해 수득한 3' cDNA 서열 | 142 (965 bp) | -- |
모르티에렐라 알피나 GPAT - 게놈 워킹에 의해 수득한 5' cDNA 서열 | 143 (1908 bp) | -- |
모르티에렐라 알피나 GPAT - 게놈 워킹에 의해 수득한 내부 서열 | 144 (966 bp) | -- |
모르티에렐라 알피나 GPAT - 인트론 #1 | 145 (275 bp) | -- |
모르티에렐라 알피나 GPAT - 인트론 #2 | 146 (255 bp) | -- |
모르티에렐라 알피나 GPAT - 인트론 #3 | 147 (83 bp) | -- |
모르티에렐라 알피나 GPAT - 인트론 #4 | 148 (99 bp) | -- |
야로위아 리폴리티카 디아실글리세롤 콜린포스포트랜스퍼라제 (CPT1) - 유전자를 포함하는 게놈 단편 | 149 (2133 bp) | -- |
야로위아 리폴리티카 디아실글리세롤 콜린포스포트랜스퍼라제 (CPT1) | 150 (1185 bp) | 151 (394 AA) |
사카로마이세스 세레비지애 이노시톨 스핑고인지질-특이적 포스포리파제 C (ISC1) | 152 (1434 bp) | 153 (477 AA) |
야로위아 리폴리티카 글리세르알데히드-3-포스페이트 데히드로게나제 프로모터 (GPD) | 210 (971 bp) | -- |
야로위아 리폴리티카 글리세르알데히드-3-포스페이트 데히드로게나제 + 인트론 프로모터 (GPDIN) | 211 (1174 bp) | -- |
야로위아 리폴리티카 포스포글리세레이트 뮤타제 프로모터 (GPM) | 212 (878 bp) | -- |
야로위아 리폴리티카 프럭토스-비스포스페이트 알돌라제 프로모터 (FBA) | 1213 (1001 bp) | -- |
야로위아 리폴리티카 프럭토스-비스포스페이트 알돌라제 + 인트론 프로모터 (FBAIN) | 214 (973 bp) | -- |
야로위아 리폴리티카 프럭토스-비스포스페이트 알돌라제 + 개질된 인트론 프로모터 (FBAINm) | 215 (924 bp) | -- |
야로위아 리폴리티카 글리세롤-3-포스페이트 아실트랜스퍼라제 (GPAT) | 216 (1130 bp) | -- |
야로위아 리폴리티카 암모늄 수송자 프로모터 (YAT1) | 217 (778 bp) | -- |
야로위아 리폴리티카 번역 연장 인자 ET1-α 프로모터 (TEF) | 218 (436 bp) | -- |
야로위아 리폴리티카 키메라 GPM::FBA 인트론 프로모터 (GPM::FBAIN) | 219 (1020 bp) | -- |
야로위아 리폴리티카 키메라 GPM::GPD 인트론 프로모터 (GPM::GPDIN) | 220 (1052 bp) | -- |
야로위아 리폴리티카 방출 단백질 프로모터 (EXP1) | 221 (1000 bp) | -- |
서열 154 및 156-209는 표 2에 나타낸 플라스미드이다.
서열 155은 야로위아 종에서 최적으로 발현되는 유전자를 위한 코돈-최적화된 번역 개시 부위에 상응한다.
서열 222는 진균 Δ15 및 Δ12 데새투라제에서 발견되는 His 박스 1 모티프에 상응한다.
서열 223은 Δ15 데새투라제 활성을 갖는 진균 단백질임을 표시하는 모티프에 상응하고, 서열 224는 Δ12 데새투라제 활성을 갖는 진균 단백질임을 표시하는 모티프에 상응한다.
서열 225-238은 각각 야로위아 리폴리티카 프로모터 영역을 증폭시키는데 사용되는 프라이머 YL211, YL212, YL376, YL377, YL203, YL204, GPAT-5-1, GPAT-5-2, ODMW314, YL341, ODMW320, ODMW341, 27203-F 및 27203-R에 상응한다.
서열 239-242는 각각 실시간 분석에 사용되는 올리고뉴클레오티드 YL-URA-16F, YL-URA-78R, GUS-767F 및 GUS-891R이다.
서열 243은 W497L 돌연변이를 포함하는 돌연변이체 AHAS 유전자이다.
서열 244-249는 각각 돌연변이를 포함하는 돌연변이체 야로위아 리폴리티카 AHAS 유전자의 합성에 사용되는, 프라이머 410, 411, 412, 413, 414 및 415에 상응한다.
서열 250-281은 전체 코돈-최적화된 코딩 영역을 함께 포함하는 16쌍의 올리고뉴클레오티드 (즉, D4-1A, D4-1B, D4-2A, D4-2B, D4-3A, D4-3B, D4-4A, D4-4B, D4-5A, D4-5B, D4-6A, D4-6B, D4-7A, D4-7B, D4-8A, D4-8B, D4-9A, D4-9B, D4-10A, D4-10B, D4-11A, D4-11B, D4-12A, D4-12B, D4-13A, D4-13B, D4-14A, D4-14B, D4-15A, D4-15B, D4-16A 및 D4-16B)에 상응한다.
서열 282-289는 각각 코돈-최적화된 Δ4 데새투라제 유전자의 합성 동안에 PCR 증폭을 위해 사용되는 프라이머 D4-1F, D4-4R, D4-5F, D4-8R, D4-9F, D4-12R, D4-13 및 D4-16R에 상응한다.
서열 290 및 291은 각각 코돈-최적화된 Δ4 데새투라제 유전자의 합성 동안 사용되는 프라이머 YL251 및 YL252에 상응한다.
서열 292-307은 이소크리시스 갈바나 Δ9 엘론가제의 전체 코돈-최적화된 코딩 영역을 함께 포함하는 8쌍의 올리고뉴클레오티드 (즉, 각각 IL3-1A, IL3-1B, IL3-2A, IL3-2B, IL3-3A, IL3-3B, IL3-4A, IL3-4B, IL3-5A, IL3-5B, IL3-6A, IL3-6B, IL3-7A, IL3-7B, IL3-8A 및 IL3-8B)에 상응한다.
서열 308-311은 각각 코돈-최적화된 Δ9 엘론가제 유전자의 합성 동안에 PCR 증폭을 위해 사용되는 프라이머 IL3-1F, IL3-4R, IL3-5F 및 IL3-8R에 상응한다.
서열 312는 pT9(1-4)에 기재된 417 bp NcoI / PstI 단편이고, 서열 313은 pT9(5-8)에 기재된 377 bp PstI / NotI 단편이다.
서열 314-339는 유글레나 그라실리스 Δ8 데새투라제의 전체 코돈-최적화된 코딩 영역을 함께 포함하는 13쌍의 올리고뉴클레오티드 (즉, 각각 D8-1A, D8-1B, D8-2A, D8-2B, D8-3A, D8-3B, D8-4A, D8-4B, D8-5A, D8-5B, D8-6A, D8-6B, D8-7A, D8-7B, D8-8A, D8-8B, D8-9A, D8-9B, D8-10A, D8-10B, D8-11A, D8-11B, D8-12A, D8-12B, D8-13A 및 D8-13B)에 상응한다.
서열 340-347은 각각 코돈-최적화된 Δ8 데새투라제 유전자의 합성 동안에 PCR 증폭을 위해 사용되는 프라이머 D8-1F, D8-3R, D8-4F, D8-6R, D8-7F, D8-9R, D8-10F 및 D8-13R에 상응한다.
서열 348은 pT8(1-3)에 기재된 309 bp Nco / BglII 단편이고, 서열 349는 pT8(4-6)에 기재된 321 bp BglII / XhoI 단편이고, 서열 350은 pT8(7-9)에 기재된 264 bp XhoI/SacI 단편이고, 서열 351은 pT8(10-13)에 기재된 369 bp SacI / NotI 단편이다.
서열 352 및 353은 각각 pDMW255에서 D8S-2의 합성 동안에 사용되는 프라이머 ODMW390 및 ODMW391에 상응한다.
서열 354 및 355는 실시예 9에 기재된 키메라 D8S-1::XPR 및 D8S-2::XPR 유전자이다.
서열 356 및 357은 D8S-3의 합성 동안에 사용되는 프라이머 ODMW392 및 ODMW393에 상응한다.
서열 358 및 359는 각각 유글레나 그라실리스로부터의 Δ8 데새투라제의 증폭을 위해 사용되는 프라이머 Eg5-1 및 Eg3-3에 상응한다.
서열 360-363은 각각 Δ8 데새투라제 클론의 서열분석을 위해 사용되는 프라이머 T7, M13-28Rev, Eg3-2 및 Eg5-2에 상응한다.
서열 364는 D8S-3의 증폭을 위해 사용되는 프라이머 ODMW404이다.
서열 365는 D8S-3을 포함하는 1272 bp 키메라 유전자이다.
서열 366 및 367은 각각 클로닝된 D8S-3 유전자에서 새로운 제한 효소 부위를 생성하기 위해 사용되는 프라이머 YL521 및 YL522에 상응한다.
서열 368-381은 각각 D8SF를 제공하는 부위 지정 돌연변이유발 반응에 사용되는 프라이머 YL525, YL526, YL527, YL528, YL529, YL530, YL531, YL532, YL533, YL534, YL535, YL536, YL537 및 YL538에 상응한다.
서열 382는 Cre 레콤비나제 효소에 의해 인식되는 LoxP 재조합 부위에 상응한다.
서열 383 및 384는 각각 플라스미드 pY80의 합성 동안에 GPD::Fm1::XPR2를 증폭시키기 위해 사용되는 프라이머 436 및 437에 상응한다.
서열 385-388은 각각 이작용성 Δ5/Δ6 데새투라제의 클로닝을 위해 사용되는 프라이머 475, 477, 478 및 476에 상응한다.
서열 389 및 390은 각각 부위-특이적 돌연변이유발에 의해 플라스미드 pY91M으로부터 플라스미드 pY91V를 생성하기 위해 사용되는 프라이머 505 및 506에 상응한다.
서열 391-393는 각각 BD-클론테크 크리에이터 스마트(BD-Clontech Creator Smart®) cDNA 라이브러리 키트 프라이머 SMART IV 올리고뉴클레오티드, CDSIII/3' PCR 프라이머 및 5'-PCR 프라이머에 상응한다.
서열 394는 모르티에렐라 알피나 cDNA 라이브러리 서열분석에 사용되는 M13 전진 프라이머에 상응한다.
서열 395-398 및 400-401은 각각 모르티에렐라 알피나 LPAAT2 ORF의 클로닝에 사용되는 프라이머 MLPAT-F, MLPAT-R, LPAT-Re-5-1, LPAT-Re-5-2, LPAT-Re-3-1 및 LPAT-Re-3-2에 상응한다.
서열 399 및 402는 각각 야로위아 리폴리티카 LPAAT1 ORF의 5' (1129 bp) 및 3' (938 bp) 영역에 상응한다.
서열 403 및 404는 각각 "대조군" 플라스미드 pZUF-MOD-1의 생성을 위해 사용되는 프라이머 pzuf-mod1 및 pzuf-mod2에 상응한다.
서열 405 및 406은 각각 모르티에렐라 알피나 DGAT1 ORF의 클로닝을 위해 사용되는 프라이머 MACAT-F1 및 MACAT-R에 상응한다.
서열 407 및 408은 각각 모르티에렐라 알피나 DGAT2 ORF의 클로닝을 위해 사용되는 프라이머 MDGAT-F 및 MDGAT-R1에 상응한다.
서열 409 및 410은 각각 모르티에렐라 알피나 GPAT의 증폭을 위한 추정(degenerate) PCR에 사용되는 프라이머 MGPAT-N1 및 MGPAT-NR5에 상응한다.
서열 411-413은 각각 모르티에렐라 알피나 GPAT의 3'-말단의 증폭을 위해 사용되는 프라이머 MGPAT-5N1, MGPAT-5N2 및 MGPAT-5N3에 상응한다.
서열 414 및 415는 게놈-워킹에 사용되는 클론테크 유니버셜 게놈워커(Universal GenomeWalkerTM) 키트로부터의 게놈 워커 어댑터에 상응한다.
서열 416-419는 각각 게놈-워킹에 사용되는 PCR 프라이머 MGPAT-5-1A, 어댑터-1 (AP1), MGPAT-3N1 및 네스티드(Nested) 어댑터 프라이머 2 (AP2)에 상응한다.
서열 420 및 421은 각각 모르티에렐라 알피나 GPAT의 증폭을 위해 사용되는 프라이머 mgpat-cdna-5 및 mgpat-cdna-R에 상응한다.
서열 422 및 423은 각각 모르티에렐라 알피나 ELO3의 3'-말단 영역의 단리를 위한 게놈-워킹에 사용되는 프라이머 MA Elong 3'1 및 MA Elong 3'2에 상응한다.
서열 424 및 425는 각각 모르티에렐라 알피나 ELO3의 5'-말단 영역의 단리를 위한 게놈-워킹에 사용되는 프라이머 MA Elong 5'1 및 MA Elong 5'2에 상응한다.
서열 426 및 427은 각각 모르티에렐라 알피나 cDNA로부터의 완전한 ELO3을 증폭시키기 위해 사용되는 프라이머 MA ELONG 5' NcoI 3 및 MA ELONG 3' NotI 1에 상응한다.
서열 428 및 429는 야로위아 리폴리티카 YE2의 코딩 영역을 증폭시키기 위해 사용되는 프라이머 YL597 및 YL598에 상응한다.
서열 430 및 431은 각각 Aco 3' 종결자를 함유하는 NotI/PacI 단편의 증폭을 위해 사용되는 프라이머 YL325 및 YL326에 상응한다.
서열 432-435는 야로위아 리폴리티카 YE1의 코딩 영역을 증폭시키기 위해 사용되는 프라이머 YL567, YL568, YL569 및 YL570에 상응한다.
서열 436 및 437은 각각 야로위아 리폴리티카 YE1의 클로닝 동안에 부위-지정 돌연변이유발을 위해 사용되는 프라이머 YL571 및 YL572에 상응한다.
서열 438 및 439는 각각 야로위아 리폴리티카 CPT1 ORF의 클로닝을 위해 사용되는 프라이머 CPT1-5'-NcoI 및 CPT1-3'-NotI에 상응한다.
서열 440 및 441은 각각 사카로마이세스 세레비지애 ISC1 ORF의 클로닝을 위해 사용되는 프라이머 Isc1F 및 Isc1R에 상응한다.
서열 442 및 443은 각각 사카로마이세스 세레비지애 PCL1 ORF의 클로닝을 위해 사용되는 프라이머 Pcl1F 및 Pcl1R에 상응한다.
서열 444-447은 각각 야로위아 리폴리티카 DGAT2 유전자의 표적화된 파괴를 위해 사용되는 프라이머 P95, P96, P97 및 P98에 상응한다.
서열 448-450은 각각 야로위아 리폴리티카 DGAT2 유전자의 표적화된 통합을 스크리닝하기 위해 사용되는 프라이머 P115, P116 및 P112에 상응한다.
서열 451-454는 각각 야로위아 리폴리티카 PDAT 유전자의 표적화된 파괴를 위해 사용되는 프라이머 P39, P41, P40 및 P42에 상응한다.
서열 455-458은 각각 파괴된 야로위아 리폴리티카 PDAT 유전자의 표적화된 통합을 스크리닝하기 위해 사용되는 프라이머 P51, P52, P37 및 P38에 상응한다.
서열 459 및 460은 각각 야로위아 리폴리티카 DGAT1의 단리를 위해 사용되는 추정 프라이머 P201 및 P203에 상응한다.
서열 461-465는 각각 야로위아 리폴리티카에서 추정적 DGAT1 유전자의 표적화된 파괴를 위한 표적화 카세트의 생성에 사용되는 프라이머 P214, P215, P216, P217 및 P219에 상응한다.
서열 466 및 467은 각각 파괴된 야로위아 리폴리티카 DGAT1 유전자의 표적화된 통합을 스크리닝하기 위해 사용되는 프라이머 P226 및 P227에 상응한다.
본원에 인용된 모든 특허, 특허 출원 및 공보는 그의 전문이 본원에 참고로 포함된다. 구체적으로, 하기하는 출원인의 양수인의 동시 계류중인 출원을 포함한다:
미국 특허 출원 제10/840478호 (2004년 5월 6일 출원),
미국 특허 출원 제10/840579호 (2004년 5월 6일 출원),
미국 특허 출원 제10/840325호 (2004년 5월 6일 출원),
미국 특허 출원 제10/869630호 (2004년 6월 16일 출원),
미국 특허 출원 제10/882760호 (2004년 7월 1일 출원),
미국 특허 출원 제10/985109호 (2004년 11월 10일 출원),
미국 특허 출원 제10/987548호 (2004년 11월 12일 출원),
미국 특허 출원 제60/624812호 (2004년 11월 4일 출원),
미국 특허 출원 제11/024545호 및 제11/024544호 (2004년 12월 29일 출원),
미국 특허 출원 제60/689031호 (2005년 6월 9일 출원),
미국 특허 출원 제11/183664호 (2005년 7월 18일 출원),
미국 특허 출원 제11/185301호 (2005년 7월 20일 출원),
미국 특허 출원 제11/190750호 (2005년 7월 27일 출원),
미국 특허 출원 제11/225354호 (2005년 9월 13일 출원),
미국 특허 출원 제10/253,882호 (2005년 10월 19일 출원),
미국 특허 출원 제11/254,173호 (2005년 10월 19일 출원),
미국 특허 출원 제10/253,882호 (2005년 10월 19일 출원),
미국 특허 출원 제11/254,173호 (2005년 10월 19일 출원).
본 발명에 따라, 본 출원인은 5% 초과의 도코사헥사엔산 (DHA, 22:6, ω-3)을 생성할 수 있는 야로위아 리폴리티카의 생성 숙주 균주를 제공한다. 이러한 특정 다불포화 지방산 (PUFA)의 축적은 고수준의 재조합 발현을 위한 유질 효모 숙주내에서 Δ6 데새투라제, C18 /20 엘론가제, Δ5 데새투라제, Δ17 데새투라제, C20 /22 엘론가제 또는 Δ4 데새투라제 활성을 갖는 단백질을 포함하는, 기능적 ω-3/ω-6 지방산 생합성 경로의 도입에 의해 달성된다. 따라서, 본 발명은 야로위아 리폴리티카를 유전자 조작하여 DHA 및 그의 유도체를 상업적으로 생성할 수 있다는 것을 증명한다. 생성 방법 또한 청구한다.
본 발명은 여러 용도를 갖는다. 본원에 개시된 방법에 의해 제조된 PUFA 또는 그의 유도체는 정맥내 영양 공급을 행하고 있는 환자를 위한 또는 영양 불량의 예방 또는 치료를 위한 식이 대체물 또는 보충제, 특히 유아용 조제식으로서 사용될 수 있다. 별법으로, 정제된 PUFA (또는 그의 유도체)를 일반적인 사용시에 수용자가 식이 보조를 위해 원하는 양으로 섭취하도록 제제화된 요리용 오일, 지방 또는 마가린에 혼입할 수 있다. PUFA는 또한 유아용 조제식, 영양 보충제 또는 다른 식품에 혼입될 수 있으며, 소염제 또는 콜레스테롤 강하제로서 사용될 수 있다. 임의로, 상기 조성물은 (인간 또는 가축의) 약제 용도로 사용될 수 있다. 이 경우, PUFA는 일반적으로 경구 투여되지만, 성공적으로 흡수될 수 있는 임의의 경로, 예를 들어 비경구 (예컨대, 피하, 근육내 또는 정맥내), 직장, 질 또는 국소 (예컨대, 피부 연고 또는 로션으로서)로 투여될 수 있다.
재조합 수단에 의해 생성된 PUFA로 인간 또는 동물을 보충함으로써, 첨가된 PUFA의 수준뿐 아니라 이들의 대사 결과물이 증가될 수 있다. 예를 들어, DHA로 처리하면, DHA뿐 아니라 DHA의 하류 생성물, 예컨대 에이코사노이드 (즉, 프로스타글란딘, 류코트리엔, 트롬복산)의 수준도 증가될 수 있다. 복잡한 조절 메카니즘을 이용하여 다양한 PUFA를 조합하거나 PUFA의 상이한 접합체를 부가할 수 있으며, 이로써 개체에서 특이적인 PUFA의 원하는 수준을 달성하기 위해 상기 메카니즘을 방해, 조절 또는 극복할 수 있다.
별법의 실시양태에서, 양식용 사료 (즉, 건식 사료, 반-습식 및 습식 사료)는 일반적으로 영양제 조성물의 1% 내지 2% 이상이 ω-3 및/또는 ω-6 PUFA인 것을 요구하기 때문에, 본원에 개시된 방법에 의해 제조된 PUFA 또는 그의 유도체를 상기 제제의 합성에 이용할 수 있다.
정의
본원에서는 수많은 용어 및 약어들이 사용된다. 하기 정의를 제공한다.
"오픈 리딩 프레임(Open reading frame)"은 ORF로 약칭된다.
"폴리머라제 연쇄 반응"은 PCR로 약칭된다.
"아메리칸 타입 컬쳐 콜렉션"은 ATCC로 약칭된다.
"다불포화 지방산"은 PUFA로 약칭된다.
"디아실글리세롤 아실트랜스퍼라제"는 DAG AT 또는 DGAT로 약칭된다.
"인지질:디아실글리세롤 아실트랜스퍼라제"는 PDAT로 약칭된다.
"글리세롤-3-포스페이트 아실트랜스퍼라제"는 GPAT로 약칭된다.
"리소포스파티드산 아실트랜스퍼라제"는 LPAAT로 약칭된다.
"아실-CoA:1-아실 리소포스파티딜콜린 아실트랜스퍼라제"는 "LPCAT"로 약칭된다.
"아실-CoA:스테롤-아실트랜스퍼라제"는 ARE2로 약칭된다.
"디아실글리세롤"은 DAG로 약칭된다.
"트리아실글리세롤"은 TAG로 약칭된다.
"조효소 A"는 CoA로 약칭된다.
"포스파티딜-콜린"은 PC로 약칭된다.
용어 "푸사륨 모닐리포르메"는 "푸사륨 베르티실리오이데스(Fusarium verticillioides)"와 동의어이다.
용어 "식품"은 인간 소비에 일반적으로 적합한 임의의 음식을 나타낸다. 전형적인 식품으로는 육류 제품, 곡류 제품, 베이킹 식품, 스낵 식품, 유제품 등이 있으나, 이로 한정되는 것은 아니다.
용어 "기능성 식품"은 함유된 전형적인 영양제를 넘어서는 건강상의 이점을 제공할 수 있는 임의의 변형된 식품 또는 성분을 비롯하여 건강에 좋은 생성물을 잠재적으로 포함하는 식품을 나타낸다. 기능성 식품은 비타민, 허브 및 건강 기능 물질이 강화된 시리얼, 빵 및 음료와 같은 식품을 포함할 수 있다. 기능성 식품은 그의 영양적 가치를 넘어서는 건강상의 이점을 제공하는 물질을 함유하며, 상기 물질은 식품에 천연적으로 존재하거나 의도적으로 첨가된 것이다.
본원에 사용된 용어 "의료용 식품"은 의사의 지시하에 장에서 소비되거나 장으로 투여되도록 제제화되고, 인정된 과학 원리에 기초하여 구별되는 영양 요건이 의료적 평가에 의해 확립된 질환 또는 증상에서 특정한 식이 관리를 위해 의도된 식품을 나타낸다 (문헌 [section 5(b) of the Orphan Drug Act (21 U.S.C. 360ee(b)(3)] 참조). 하기의 경우에만 "의료용 식품"에 해당된다: (i) 경구 섭취 또는 관에 의한 장내 공급에 의해 부분적으로 또는 전적으로 환자에게 공급하기 위한 특이적으로 제제화되고 가공된 제품이다 (천연 상태로 사용되는 천연 발생 음식물과는 반대됨); (ii) 치료적 또는 만성 의료적 요구 때문에 통상적인 음식물 또는 특정한 영양제를 섭취, 소화, 흡수 또는 대사하는 능력이 제한되거나 손상된 환자, 또는 정상적인 식사의 변형만으로는 달성될 수 없는 의학적으로 결정된 다른 특정한 영양 요건을 가진 환자의 식이 관리를 위해 의도된다; (iii) 의학적 평가에 의해 결정되는 바와 같이, 특정한 질환 또는 증상으로 인한 특유한 영양분 요구의 관리를 위해 특이적으로 변형된 영양분 지원을 제공한다; (iv) 의학적 관리하에 사용되도록 의도된다; (v) 지속적인 현행의 의학적 관리를 받는 환자에게만 의도되며, 상기 환자가 다른 것 중에서도 의료용 식품의 사용 지침에 대한 주기적 기준에 대해 의학적 주의를 요한다. 따라서, 식이 보조제 또는 통상적인 식품과는 달리, 구별되는 영양 요건이 확립되어 있는 질환 또는 증상의 특별한 식이 관리를 위해 의도된 의료용 식품은 특정한 질환 또는 증상을 위해 구별되는 영양분 지원을 제공하는 것과 관련하여 과학적으로 타당하게 요구될 수 있다. 의료용 식품은 특정한 식이적 용도를 위한 보다 광범위한 부류의 식품 (예컨대, 저자극성 식품), 및 의료용 식품이 의학적 관리하에 사용된다는 요건에 따라 건강을 요구하는 식품 (예컨대, 식이 보조제)과는 구별된다.
용어 "의료용 영양제"는 본원에서 정의된 바와 같은 의료용 식품으로서, 전형적으로 특정한 식이적 요구를 위해 구체적으로 고안된 강화 음료를 나타낸다. 의료용 영양제는 일반적으로 특정한 의료적 또는 식이적 증상에 대해 집중된 식이 조성물을 포함한다. 시판되는 의료용 영양제의 예로는 엔슈어(Ensure®) 및 부스트(Boost®)가 있으나, 이로 제한되지 않는다.
본원에 사용된 용어 "약제"는 미국에서 판매되는 경우 연방 식품, 약품 및 화장품법의 섹션 505 또는 505에 의해 규제되는 화합물 또는 물질을 의미한다.
용어 "유아용 조제식"은 사람의 젖과 유사하여 오로지 유아에 의해 소비되는 것으로 고안된 식품을 의미한다. 유아용 조제식의 전형적인 예로는 시밀락(Similac®) 및 이소밀(Isomil®)이 있으나, 이로 제한되지 않는다.
용어 "식이 보조제"는 (i) 음식을 보충하기 위해 의도되어, 통상적인 식품이나 식사 또는 음식용 단품으로서는 사용되지 않고, (ii) 한가지 이상의 식이 성분 (예를 들어, 비타민, 미네랄, 허브 또는 다른 식물성 약품, 아미노산, 효소 및 분비선 추출물) 또는 이들의 구성성분을 함유하고, (iii) 환약, 캡슐, 정제 또는 액체로서 입으로 복용하도록 의도되고, (iv) 식이 보조제인 것으로 표시된 제품을 나타낸다.
"식품 유사물"은 육류, 치즈, 우유 등과 같은 대응 식품과 비슷하게 제조되고, 상기 대응 식품의 외관, 맛 및 조직감을 갖도록 의도된 식품-유사 제품이다. 따라서, 본원에 사용된 용어 "식품"은 또한 식품 유사물을 포함한다.
용어 "양식용 사료" 및 "양식사료"는 양식 산업에서 천연 사료를 보충하거나 대체하기 위한 제작 음식 또는 인공 음식 (제제화된 사료)을 나타낸다. 따라서, 양식사료는 양식 물고기 및 갑각류 (즉, 하급 주식용 어류 종 [예를 들어, 민물고기, 예컨대 잉어, 틸라피아 및 메기] 및 명품 또는 한정 시장을 위한 고급 환금 작물 종 [예를 들어, 주로 해양 종 및 양측 회유성 종, 예컨대 새우, 연어, 송어, 방어, 농어, 강성돔 및 참바리])에 유용한 인공적으로 배합된 사료를 나타낸다. 이들 제제화 사료는 양식 종을 위한 영양적으로 완전한 음식을 형성하기 위해 서로를 보충하는 다양한 비율의 여러 성분들로 이루어진다.
용어 "동물 사료"는 동물, 예를 들어 가축 (애완 동물, 농장 동물 등) 또는 어장에서 식품 생산을 위해 길러지는 동물에 의해서만 소비되도록 의도된 사료를 나타낸다.
용어 "사료 영양분"은 본 발명의 제조합 생성 숙주를 포함하는 효모 생물체로부터 유도될 수 있는 단백질, 지질, 탄수화물, 비타민, 미네랄 및 핵산과 같은 영양분을 의미한다.
본원에 사용된 용어 "생물체(biomass)"는 구체적으로 상업적으로 유의한 양으로 재조합 생성 숙주에서 생성된 EPA의 발효에 소모되거나 사용되는 효모 세포 물질을 나타낸다.
용어 "지방산"은 약 C12 내지 C22의 다양한 쇄 길이의 장쇄 지방족산 (알칸산)을 나타낸다 (장쇄 및 단쇄 길이의 산은 모두 공지되어 있다). 우세한 쇄 길이는 C16 내지 C22이다. 지방산의 구조는 "X:Y"의 간단한 표기법으로 표현되며, 여기서, X는 특정 지방산에서 탄소 (C) 원자의 총 개수를 나타내고, Y는 이중 결합의 개수를 나타낸다. "포화 지방산"과 "불포화 지방산", "일불포화 지방산"과 "다불포화 지방산" (또는 "PUFA"), "오메가-6 지방산" (ω-6 또는 n-6)과 "오메가-3 지방산" (ω-3 또는 n-3)의 차이에 대한 더욱 상세한 설명은 제WO 2004/101757호에 제공되어 있다.
본원에서 PUFA를 기재하기 위해 사용된 명명법을 하기 표 3에 나타낸다. "속기 표시"란에서, 탄소의 개수, 이중 결합의 개수, 및 오메가 탄소 (이를 1번으로 함)에서부터 세었을 때 오메가 탄소에 가장 근접한 이중 결합의 위치를 나타내기 위해 오메가-참조 시스템을 사용한다. 하기 표에는 또한 ω-3 및 ω-6 지방산 및 그의 전구체의 일반명, 명세서에 사용될 약어, 및 각 화합물의 화학명이 기재된다.
불포화 지방산 및 전구체의 명명법 | |||
일반명 | 약어 | 화학명 | 속기 표시 |
미리스트산 | -- | 테트라데칸산 | 14:0 |
팔미트산 | 팔미테이트 | 헥사데칸산 | 16:0 |
팔미트올레산 | -- | 9-헥사데센산 | 16:1 |
스테아르산 | -- | 옥타데칸산 | 18:0 |
올레산 | -- | 시스-9-옥타데센산 | 18:1 |
리놀레산 | LA | 시스-9,12-옥타데카디엔산 | 18:2 ω-6 |
γ-리놀레산 | GLA | 시스-6,9,12-옥타데카트리엔산 | 18:3 ω-6 |
에이코사디엔산 | EDA | 시스-11,14-에이코사디엔산 | 20:2 ω-6 |
디호모-γ-리놀레산 | DGLA | 시스-8,11,14-에이코사트리엔산 | 20:3 ω-6 |
아라키돈산 | ARA | 시스-5,8,11,14-에이코사테트라엔산 | 20:4 ω-6 |
α-리놀렌산 | ALA | 시스-9,12,15-옥타데카트리엔산 | 18:3 ω-3 |
스테아리돈산 | STA | 시스-6,9,12,15-옥타데카테트라엔산 | 18:4 ω-3 |
에이코사트리엔산 | ETrA | 시스-11,14,17-에이코사트리엔산 | 20:3 ω-3 |
에이코사테트라엔산 | ETA | 시스-8,11,14,17-에이코사테트라엔산 | 20:4 ω-3 |
에이코사펜타엔산 | EPA | 시스-5,8,11,14,17-에이코사펜타엔산 | 20:5 ω-3 |
도코사펜타엔산 | DPA | 시스-7,10,13,16,19-에이코사펜타엔산 | 22:5 ω-3 |
도코사헥사엔산 | DHA | 시스-4,7,10,13,16,19-에이코사헥사엔산 | 22:6 ω-3 |
용어 "고수준 DHA 생성"은 미생물 숙주의 전체 지질 중 약 5% 이상의 DHA, 바람직하게는 전체 지질 중 약 10% 이상의 DHA, 더욱 바람직하게는 전체 지질 중 약 15% 이상의 EDHA, 더욱 바람직하게는 전체 지질 중 약 20% 이상의 DHA, 더욱 바람직하게는 전체 지질 중 약 25-30% 이상의 DHA를 생성하는 것을 나타낸다. 따라서, DHA의 구조적 형태에는 제한이 없지만, 예를 들어 DHA는 유리 지방산 또는 에스테르화된 형태, 예컨대 아실글리세롤, 인지질, 술포지질 또는 당지질로서 전체 지질 중에 존재할 수 있다.
용어 "임의의 GLA가 결여된"은 약 0.1% 아래까지 검출가능한 수준을 갖는 장비를 이용하여 GC 분석에 의해 측정하였을 때, 미생물 숙주의 전체 지질 중에 임의의 검출가능한 GLA가 결여된 것을 나타낸다.
용어 "필수 지방산"은 특정한 필수 지방산을 새로 합성할 수 없는 유기체가 생존을 위해 섭취해야만 하는 특정한 PUFA를 나타낸다. 예를 들어, 포유동물은 필수 지방산 LA (18:2, ω-6) 및 ALA (18:3, ω-3)를 합성할 수 없다. 다른 필수 지방산으로는 GLA (ω-6), DGLA (ω-6), ARA (ω-6), EPA (ω-3) 및 DHA (ω-3)가 있다.
"미생물성 오일" 또는 "단세포 오일"은 미생물 (예컨대, 조류, 유질 효모 및 섬사상 진균)에 의해 그의 일생동안 천연적으로 생산되는 오일이다. 용어 "오일"은 25℃에서 액체이고 보통 다불포화된 지질을 나타낸다. 반대로, 용어 "지방"은 25℃에서 고체이고 보통 포화된 지질을 나타낸다.
"지질체"는 보통 특정한 단백질 및 단층의 인지질에 의해 둘러싸인 지질 액적을 나타낸다. 이들 기관은 대부분의 유기체가 중성 지질을 전달/저장하는 부위이다. 지질체는 TAG-생합성 효소를 함유하는 소포체의 마이크로도메인으로부터 발생하는 것으로 생각되며, 이들의 합성 및 크기는 특정한 단백질 성분에 의해 조절되는 것으로 여겨진다.
"중성 지질"은 세포에서 저장 지방 및 오일로서 지질체 중에서 흔히 발견되는 지질을 나타내며, 상기 지질은 대개 세포의 pH에서 하전된 기를 전혀 갖지 않기 때문에 그렇게 불린다. 일반적으로, 이들은 수 친화성이 전혀 없이 비-극성이다. 중성 지질은 일반적으로 글리세롤과 지방산의 모노-, 디- 및/또는 트리에스테르이며, 이들은 각각 모노아실글리세롤, 디아실글리세롤 또는 TAG (또는 집합적으로 아실글리세롤)로도 지칭된다. 아실글리세롤로부터 유리 지방산을 방출시키기 위해 가수분해 반응이 일어나야 한다.
용어 "트리아실글리세롤", "오일" 및 "TAG"는 3개의 지방 아실 잔기가 글리세롤 분자에 에스테르화된 중성 지질을 나타낸다 (상기 용어들은 본 명세서 내에서 서로 교환가능하게 사용될 것이다). 이러한 오일은 장쇄 PUFA 뿐 아니라, 단쇄 포화 및 불포화 지방산 및 장쇄 포화 지방산을 포함할 수 있다. 따라서, "오일 생합성"은 일반적으로 세포에서 TAG를 합성하는 것을 나타낸다.
용어 "아실트랜스퍼라제"는 아미노-아실기 이외의 기의 전달을 담당하는 효소 (EC 2.3.1.-)를 나타낸다.
용어 "DAG AT"는 디아실글리세롤 아실트랜스퍼라제 (아실-CoA-디아실글리세롤 아실트랜스퍼라제 또는 디아실글리세롤 O-아실트랜스퍼라제로도 공지됨) (EC 2.3.1.20)를 나타낸다. 이 효소는 아실-CoA 및 1,2-디아실글리세롤을 TAG 및 CoA로 전환시키는 것을 담당한다 (이는 TAG 생합성의 최종 단계와 관련이 있음). 두가지 부류의 DAG AT 효소인 DGAT1 및 DGAT2가 존재한다. DGAT1 부류는 아실-CoA:콜레스테롤 아실트랜스퍼라제 (ACAT) 유전자 부류와 상동성을 공유하는 반면, DGAT2는 관련이 없다 (문헌 [Lardizabal et al., J. Biol Chem. 276(42):38862-38869 (2001)]).
용어 "PDAT"는 인지질:디아실글리세롤 아실트랜스퍼라제 효소 (EC 2.3.1.158)를 나타낸다. 이 효소는 인지질의 sn-2 위치로부터 1,2-디아실글리세롤의 sn-3 위치로 아실기를 전달하여 리소인지질 및 TAG을 생성하는 것을 담당한다 (이는 TAG 생합성의 최종 단계와 관련이 있음). 이 효소는 아실-CoA-독립성 메카니즘을 통해 TAG를 합성한다는 점에서 DGAT (EC 2.3.1.20)와는 상이하다.
용어 "ARE2"는 아실-CoA + 스테롤 = CoA + 스테롤 에스테르의 반응을 촉매하는 아실-CoA:스테롤-아실트랜스퍼라제 효소 (EC 2.3.1.26; 스테롤-에스테르 신타제 2 효소로도 공지됨)를 나타낸다.
용어 "GPAT"는 gpat 유전자에 의해 코딩되며, 아실-CoA 및 sn-글리세롤 3-포스페이트를 CoA 및 1-아실-sn-글리세롤 3-포스페이트로 전환시키는 (인지질 생합성의 제1 단계) 글리세롤-3-포스페이트 O-아실트랜스퍼라제 효소 (E.C. 2.3.1.15)를 나타낸다.
용어 "LPAAT"는 리소포스파티드산-아실트랜스퍼라제 효소 (EC 2.3.1.51)를 나타낸다. 이 효소는 아실-CoA 기를 1-아실-sn-글리세롤 3-포스페이트 (즉, 리소포스파티드산) 상에 전달하여 CoA 및 1,2-디아실-sn-글리세롤 3-포스페이트 (포스파티드산)를 생성하는 것을 담당한다. 상기 용어는 또한 아실-CoA:1-아실-sn-글리세롤-3-포스페이트 2-O-아실트랜스퍼라제, 1-아실-sn-글리세롤-3-포스페이트 아실트랜스퍼라제 및/또는 1-아실글리세롤포스페이트 아실트랜스퍼라제 (AGAT로 약칭됨)로서의 LPAAT를 나타낸다.
용어 "LPCAT"는 아실-CoA:1-아실 리소포스파티딜-콜린 아실트랜스퍼라제를 나타낸다. 이 효소는 CoA와 포스파티딜 콜린 (PC) 사이의 아실기 교환을 담당한다. 여기서, 상기 용어는 또한 CoA와 다른 인지질, 예컨대 리소포스파티드산 (LPA) 사이의 아실 교환과 관련된 효소를 나타낸다.
"전체 지질 및 오일 분획 중 PUFA 백분율(%)"은 이들 분획 중 전체 지방산에 대한 PUFA의 백분율을 나타낸다. 용어 "전체 지질 분획" 또는 "지질 분획"은 모두 유질 유기체 내의 모든 지질 (즉, 중성 및 극성), 예컨대 포스파티딜콜린 (PC) 분획, 포스파티딜에탄올아민 (PE) 분획 및 트리아실글리세롤 (TAG 또는 오일) 분획에 위치하는 지질의 합계를 나타낸다. 그러나, 용어 "지질" 및 "오일"은 본 명세서 내에서 서로 교환가능하게 사용될 것이다.
용어 "포스파티딜콜린" 또는 "PC"는 세포막의 주요 구성성분인 인지질을 나타낸다. PC의 화학 구조는 일반적으로 콜린 분자, 포스페이트기 및 글리세롤을 포함하는 것으로 기재될 수 있으며, 여기서, 지방 아실 쇄는 R 기로서 글리세롤 분자의 sn-1 및 sn-2 위치에 부착된다.
용어 "PUFA 생합성 경로 효소"는 PUFA의 생합성과 관련된 임의의 하기 효소 (및 하기 효소를 코딩하는 유전자)를 나타낸다: Δ4 데새투라제, Δ5 데새투라제, Δ6 데새투라제, Δ12 데새투라제, Δ15 데새투라제, Δ17 데새투라제, Δ9 데새투라제, Δ8 데새투라제, Δ9 엘론가제, C14 /16 엘론가제, C16 /18 엘론가제, C18 /20 엘론가제 및/또는 C20 /22 엘론가제.
용어 "ω-3/ω-6 지방산 생합성 경로"는 적절한 조건하에 발현될 때, ω-3 및 ω-6 지방산 중 하나 또는 둘다의 생성을 촉매하는 효소를 코딩하는 유전자의 집합을 나타낸다. 전형적으로 ω-3/ω-6 지방산 생합성 경로와 관련된 유전자는 하기 효소 중 일부 또는 모두를 코딩한다: Δ12 데새투라제, Δ6 데새투라제, C18 /20 엘론가제, C20 /22 엘론가제, Δ9 엘론가제, Δ5 데새투라제, Δ17 데새투라제, Δ15 데새투라제, Δ9 데새투라제, Δ8 데새투라제 및 Δ4 데새투라제. 대표적인 경로를 도 1에 도시하는데, 도 1은 다양한 중간체를 통해 올레산을 DHA로 전환시키는 것을 제공하며, 이는 ω-3 및 ω-6 지방산 둘다가 공통된 공급원으로부터 생성될 수 있는 방법을 입증한다. 상기 경로는 천연적으로 두가지 부분으로 나뉘어지며, 한 부분은 ω-3 지방산만을 생성할 것이고, 다른 부분은 ω-6 지방산만을 생성할 것이다. ω-3 지방산만을 생성하는 부분은 본원에서 ω-3 지방산 생합성 경로로 지칭되는 반면, ω-6 지방산만을 생성하는 부분은 본원에서 ω-6 지방산 생합성 경로로 지칭될 것이다.
본원에서 ω-3/ω-6 지방산 생합성 경로의 문맥에서 사용된 용어 "기능적"은 상기 경로의 일부 (또는 모든) 유전자가 활성 효소를 발현하여, 생체내 가수분해 또는 기질 전환을 일으키는 것을 의미한다. 수많은 지방산 생성물은 상기 경로의 유전자의 하위 집합의 발현만을 필요로 할 것이기 때문에, "ω-3/ω-6 지방산 생합성 경로" 또는 "기능적 ω-3/ω-6 지방산 생합성 경로"가 상기 문단에 열거된 모든 유전자를 필요로 한다는 것을 암시하는 것은 아님을 이해해야 한다.
용어 "ω-6 Δ6 데새투라제/Δ6 엘론가제 경로"는 최소한 Δ6 데새투라제, C18/20 엘론가제, Δ5 데새투라제, Δ17 데새투라제, C20 /22 엘론가제 및 Δ4 데새투라제의 유전자를 포함하는 DHA 지방산 생합성 경로를 나타낼 것이다. 용어 "ω-3 Δ6 데새투라제/Δ6 엘론가제 경로"는 최소한 Δ15 데새투라제, Δ6 데새투라제, C18/20 엘론가제, Δ5 데새투라제, C20 /22 엘론가제 및 Δ4 데새투라제의 유전자를 포함하는 DHA 지방산 생합성 경로를 나타낼 것이다. 용어 "Δ6 데새투라제/Δ6 엘론가제 경로의 조합"은 최소한 Δ15 데새투라제, Δ6 데새투라제, C18 /20 엘론가제, Δ5 데새투라제, Δ17 데새투라제, C20 /22 엘론가제 및 Δ4 데새투라제의 유전자를 포함하는 DHA 지방산 생합성 경로를 나타낼 것이다. 마지막으로, 용어 "Δ6 데새투라제/Δ6 엘론가제 경로"는 포괄적으로 상기 기재된 Δ6 데새투라제/Δ6 엘론가제 경로 중 임의의 하나 (또는 그 이상)을 나타낼 것이다.
관련된 방식으로, 용어 "ω-6 Δ9 엘론가제/Δ8 데새투라제 경로"는 최소한 Δ9 엘론가제, Δ8 데새투라제, Δ5 데새투라제, Δ17 데새투라제, C20 /22 엘론가제 및 Δ4 데새투라제의 유전자를 포함하는 DHA 지방산 생합성 경로를 나타낼 것이다. 용어 "ω-3 Δ9 엘론가제/Δ8 데새투라제 경로"는 최소한 Δ15 데새투라제, Δ9 엘론가제, Δ8 데새투라제, Δ5 데새투라제, C20 /22 엘론가제 및 Δ4 데새투라제의 유전자를 포함하는 DHA 지방산 생합성 경로를 나타낼 것이다. 용어 "Δ9 엘론가제/Δ8 데새투라제 경로의 조합"은 최소한 Δ15 데새투라제, Δ9 엘론가제, Δ8 데새투라제, Δ5 데새투라제, Δ17 데새투라제, C20 /22 엘론가제 및 Δ4 데새투라제의 유전자를 포함하는 DHA 지방산 생합성 경로를 나타낼 것이다. 그리고, 용어 "Δ9 엘론가제/Δ8 데새투라제 경로"는 포괄적으로 상기 기재된 Δ9 엘론가제/Δ8 데새투라제 경로 중 임의의 하나 (또는 그 이상)을 나타낼 것이다.
용어 "데새투라제"는 1개 이상의 지방산을 탈포화시켜, 즉 이중 결합을 도입시켜, 관심을 가진 지방산 또는 전구체를 생성시킬 수 있는 폴리펩티드를 나타낸다. 구체적인 지방산을 나타내기 위해 본 명세서에서 오메가-참조 시스템을 사용하였지만, 델타-시스템을 이용하여 기질의 카르복실 말단에서부터 세어 데새투라제의 활성을 표시하는 것이 더욱 편리하다. 본원에서 특히 관심을 갖는 것은 1) 분자의 카르복실-말단에서부터 세었을 때 8번째와 9번째 탄소 원자 사이에서 지방산을 탈포화시키고, 예를 들어 EDA에서 DGLA 및/또는 ETrA에서 ETA로의 전환을 촉매하는 Δ8 데새투라제; 2) LA에서 GLA로 및/또는 ALA에서 STA로의 전환을 촉매하는 Δ6 데새투라제; 3) DGLA에서 ARA로 및/또는 ETA에서 EPA로의 전환을 촉매하는 Δ5 데새투라제; 4) DPA에서 DHA로의 전환을 촉매하는 Δ4 데새투라제; 5) 올레산에서 LA로의 전환을 촉매하는 Δ12 데새투라제; 6) LA에서 ALA로 및/또는 GLA에서 STA로의 전환을 촉매하는 Δ15 데새투라제; 7) ARA에서 EPA 및/또는 DGLA에서 ETA로의 전환을 촉매하는 Δ17 데새투라제; 및 8) 팔미테이트에서 팔미트올레산 (16:1)으로 및/또는 스테아레이트에서 올레산 (18:1)으로의 전환을 촉매하는 Δ9 데새투라제이다.
본 발명의 Δ15 데새투라제와 관련하여, 용어 "이작용성"은 효소성 기질로서 올레산 및 LA 둘다를 사용하는 능력을 갖는 폴리펩티드를 의미한다. 유사하게, 본 발명의 Δ5 데새투라제와 관련하여, 용어 "이작용성"은 (1) DGLA 및 ETA로 이루어진 군으로부터 선택된 하나 이상의 효소성 기질; 및 (2) LA 및 ALA로 이루어진 군으로부터 선택된 하나 이상의 효소성 기질을 사용하는 능력을 갖는 폴리펩티드를 의미한다. "효소성 기질"은 폴리펩티드가 활성 부위에서 기질과 결합하여, 그에 대해 각각의 방식으로 작용하는 것을 의미한다.
용어 "엘론가제 시스템"은 상기 엘론가제 시스템이 작용하는 지방산 기질보다 2개의 탄소가 더 긴 지방산을 생성하도록 지방산 탄소 쇄의 신장을 담당하는 4가지 효소의 집합을 나타낸다. 보다 구체적으로, 신장 과정은 CoA가 아실 담체인 지방산 신타제와 연관되어 일어난다 (문헌 [Lassner et al., The Plant Cell 8:281-292 (1996)]). 기질-특이적이며 속도-제한적인 제1 단계에서는, 말로닐-CoA가 장쇄 아실-CoA와 축합되어 CO2 및 β-케토아실-CoA (이의 아실 부분은 2개의 탄소 원자만큼 신장되었음)를 생성한다. 후속 반응에서는, β-히드록시아실-CoA로 환원되고, 에노일-CoA로 탈수되고, 제2 환원에 의해 신장된 아실-CoA가 생성된다. 엘론가제 시스템에 의해 촉매되는 반응의 예로는 GLA에서 DGLA로의 전환, STA에서 ETA로의 전환, 및 EPA에서 DPA로의 전환이 있다.
목적을 위해, 제1 축합 반응 (즉, 말로닐-CoA에서 β-케토아실-CoA로의 전환)을 촉매하는 효소는 포괄적으로 "엘론가제"로 지칭될 것이다. 일반적으로, 엘론가제의 기질 선택성은 다소 광범위하지만, 쇄 길이와 불포화 정도 및 유형 모두에 의해 구별된다. 따라서, 엘론가제는 상이한 특이성을 가질 수 있다. 예를 들어, C14 /16 엘론가제는 C14 기질 (예컨대, 미리스트산)을 이용할 것이고, C16 /18 엘론가제는 C16 기질 (예컨대, 팔미테이트)을 이용할 것이고, C18 /20 엘론가제는 C18 기질 (예컨대, GLA, STA)을 이용할 것이고, C20 /22 엘론가제는 C20 기질 (예컨대, EPA)을 이용할 것이다. 마찬가지 방식으로, Δ9 엘론가제는 LA에서 EDA로의 전환 및 ALA에서 ETrA로의 전환을 촉매할 수 있다. 일부 엘론가제가 광범위한 특이성을 가지며, 따라서, 단일 효소가 여러 엘론가제 반응을 촉매할 수 있다 (예컨대, C16 /18 엘론가제 및 C18 /20 엘론가제 둘다로서 작용할 수 있다)는 점을 주의하는 것이 중요하다. 바람직한 실시양태에서, 적합한 숙주를 지방산 엘론가제를 위한 유전자로 형질전환시킴으로써 지방산 엘론가제의 특이성을 실험적으로 측정하고, 숙주의 지방산 프로파일에 대한 그의 효과를 측정하는 것이 가장 바람직하다.
용어 "고친화도 엘론가제" 또는 "EL1S" 또는 "ELO1"는 바람직하게는 GLA (엘론가제 반응 [즉, Δ6 엘론가제]의 생성물로서 DGLA와 함께)에 대한 기질 특이성을 갖는 C18 /20 엘론가제를 나타낸다. 이러한 한 엘론가제는 제WO 00/12720호에 기재되어 있고, 본원에서 서열 22 및 23로서 제공된다. 그러나, 본 발명자들은 상기 효소가 18:2 (LA) 및 18:3 (ALA)에 대해서도 일부 활성을 갖는다는 것을 밝혀냈고, 따라서, 서열 23은 Δ9 엘론가제 활성 (그의 Δ6 엘론가제 활성 이외에도)을 나타낸다. 따라서, 본원에서 서열 23로서 제공된 C18 /20 엘론가제는 예를 들어 이소크리시스 갈바나 Δ9 엘론가제 (서열 70) 대신에, 본원에 기재된 Δ6 데새투라제/Δ6 엘론가제 경로 내에서 및 Δ9 엘론가제/Δ8 데새투라제 경로 내에서 모두 기능할 수 있는 것으로 결론지어 진다.
용어 "EL2S" 또는 "ELO2"는 바람직하게는 GLA (엘론가제 반응의 생성물로서 DGLA와 함께) 및/또는 STA (엘론가제 반응의 생성물로서 STA와 함께)에 대한 기질 특이성을 갖는 C18 /20 엘론가제를 나타낸다. 이러한 한 엘론가제는 미국 특허 제6,677,145호에 기재되어 있으며, 본원에서 서열 25 및 26으로서 제공된다.
용어 "ELO3"는 elo3 유전자 (서열 86)에 의해 코딩되는 모르티에렐라 알피나 C16/18 지방산 엘론가제 효소 (본원에서 서열 87로서 제공됨)를 나타낸다. 용어 "YE2"는 본원에서 서열 94로서 제공된 유전자에 의해 코딩되는 야로위아 리폴리티카 C16 /18 지방산 엘론가제 효소 (본원에서 서열 95로서 제공됨)를 나타낸다. 본원에서 보고된 데이타에 기초하면, ELO3 및 YE2 둘다 팔미테이트 (16:0)에서 스테아르산 (18:0)으로의 전환을 우세하게 촉매한다.
용어 "YE1"은 본원에서 서열 97로 제공된 유전자에 의해 코딩되는 야로위아 리폴리티카 C14 /16 지방산 엘론가제 효소 (본원에서 서열 98로 제공됨)를 나타낸다. 본원에서 보고된 데이타에 기초하면, YE2는 미리스트산 (14:0)에서 팔미테이트 (16:0)로의 전환을 우세하게 촉매한다.
용어 "전환 효율" 및 "기질 전환율(%)"은 특정 효소 (예컨대, 데새투라제 또는 엘론가제)가 기질을 생성물로 전환시킬 수 있는 효율을 나타낸다. 전환 효율은 하기 식에 따라 측정된다.
([생성물]/[기질+생성물])×100
여기서, '생성물'은 즉시 생성물 및 그로부터 유래된 경로에서의 모든 생성물을 나타낸다.
용어 "유질"은 에너지 공급원을 지질 형태로 저장하는 경향이 있는 유기체를 나타낸다 (문헌 [Weete, In: Fungal Lipid Biochemistry, 2nd Ed., Plenum, 1980]). 일반적으로, 이들 미생물의 세포성 오일 함량은 S형 곡선을 따르는데, 지질의 농도는 성장의 대수기 말기 또는 정지기 초기에서 최고에 도달할 때까지 증가한 다음, 정지기 말기 및 사멸기 동안에 점진적으로 감소한다 (문헌 [Yongmanitchai and Ward, Appl. Environ. Microbiol. 57:419-25 (1991)]).
용어 "유질 효모"는 오일을 생성할 수 있는 효모로서 분류되는 미생물을 나타낸다. 일반적으로, 유질 미생물의 세포성 오일 또는 트리아실글리세롤 함량은 S형 곡선을 따르는데, 지질의 농도는 성장의 대수기 말기 또는 정지기 초기에서 최고에 도달할 때까지 증가한 다음, 정지기 후기 및 사멸기 동안에 점진적으로 감소한다 (문헌 [Yongmanitchai and Ward, Appl. Environ. Microbiol. 57:419-25 (1991)]). 오일을 건조 세포 중량의 약 25% 넘게 축적하는 유질 미생물은 드물지 않다. 유질 효모의 예로는 야로위아, 칸디다, 로도토룰라(Rhodotorula), 로도스포리듐(Rhodosporidium), 크립토코커스(Cryptococcus), 트리코스포론(Trichosporon) 및 리포마이세스(Lipomyces) 속이 있으나, 이로 제한되지 않는다.
용어 "발효가능한 탄소 공급원"은 에너지를 유도하기 위해 미생물이 대사하는 탄소 공급원을 의미한다. 전형적인 본 발명의 탄소 공급원으로는 단당류, 올리고당류, 다당류, 알칸, 지방산, 지방산 에스테르, 모노글리세리드, 디글리세리드, 트리글리세리드, 이산화탄소, 메탄올, 포름알데히드, 포르메이트 및 탄소-함유 아민이 있으나, 이로 제한되지 않는다.
본원에 사용된 "단리된 핵산 단편"은 임의로 합성, 비-천연 또는 변경된 뉴클레오티드 염기를 함유하는 단일- 또는 이중-가닥 RNA 또는 DNA의 중합체이다. DNA 중합체 형태의 단리된 핵산 단편은 cDNA, 게놈 DNA 또는 합성 DNA의 하나 이상의 절편으로 이루어질 수 있다.
아미노산 또는 뉴클레오티드 서열의 "실질적인 부분"은 당업자에 의한 서열의 수동적 평가에 의해, 또는 컴퓨터-자동화 서열 비교 및 BLAST (Basic Local Alignment Search Tool; 문헌 [Altschul, S. F., et al., J. Mol. Biol. 215:403-410 (1993)])와 같은 알고리즘을 이용한 확인에 의해, 폴리펩티드 또는 유전자를 추정적으로 확인하기 위해, 상기 폴리펩티드의 아미노산 서열 또는 상기 유전자의 뉴클레오티드 서열을 충분히 포함하는 부분이다. 일반적으로, 공지된 단백질 또는 유전자에 대한 상동성으로서 폴리펩티드 또는 핵산 서열을 추정적으로 확인하기 위해서는, 10개 이상의 연속 아미노산 또는 30개 이상의 뉴클레오티드로 이루어진 서열이 필요하다. 더욱이, 뉴클레오티드 서열과 관련하여, 유전자 확인 (예컨대, 써던 혼성화) 및 단리 (예컨대, 박테리아 콜로니 또는 박테리오파지 플라크의 동일계내 혼성화)의 서열-의존성 방법에서는 20 내지 30개의 연속 뉴클레오티드를 포함하는 유전자-특이적 올리고뉴클레오티드 프로브가 사용될 수 있다. 또한, 12 내지 15개의 염기로 이루어진 짧은 올리고뉴클레오티드는 PCR에서 증폭 프라이머로서 사용되어, 상기 프라이머를 포함하는 특정 핵산 단편을 수득할 수 있다. 따라서, 뉴클레오티드 서열의 "실질적인 부분"은 서열을 포함하는 핵산 단편을 구체적으로 확인하고/하거나 단리하기 위해 상기 서열을 충분히 포함한다.
용어 "상보적인"은 서로 혼성화될 수 있는 뉴클레오티드 염기들 사이의 관계를 기재하기 위해 사용된다. 예를 들어, DNA와 관련하여, 아데노신은 티민에 대해 상보적이고, 시토신은 구아닌에 대해 상보적이다.
"코돈 다의성(degeneracy)"은 코딩된 폴리펩티드의 아미노산 서열에 영향을 주지 않으면서, 뉴클레오티드 서열의 다양성을 허용하는 유전자 코드의 성질을 나타낸다. 당업자는 주어진 아미노산을 특정하기 위해 뉴클레오티드 코돈을 사용하는데 있어서 특정한 숙주 세포에 의해 나타나는 "코돈-편향성(codon-bias)"을 잘 알 고 있다. 따라서, 숙주 세포에서의 개선된 발현을 위해 유전자를 합성할 때, 코돈 사용 빈도가 숙주 세포에서 바람직한 코돈 사용 빈도에 접근하도록 유전자를 고안하는 것이 바람직하다.
DNA 서열과 관련하여 "화학적으로 합성된"은 구성 뉴클레오티드들을 시험관내에서 조립한 것을 의미한다. DNA의 수동적인 화학적 합성은 널리 확립된 절차를 이용하여 달성할 수 있거나, 또는 자동화된 화학적 합성은 시판되는 수많은 기계를 이용하여 수행할 수 있다. "합성 유전자"는 당업자에게 공지된 절차를 이용하여 화학적으로 합성된 올리고뉴클레오티드 빌딩 블록으로부터 조립될 수 있다. 이들 빌딩 블록을 라이게이션하고 어닐링하여 유전자 절편을 형성한 다음, 이들을 효소적으로 조립하여 전체 유전자를 구축한다. 따라서, 뉴클레오티드 서열의 최적화에 기초하여 최적의 유전자 발현을 위해 유전자들을 맞추어서, 숙주 세포의 코돈 편향성을 반영할 수 있다. 당업자는 숙주가 우호적인 이들 코돈에 대해 코돈 사용이 편향되는 경우 유전자 발현이 성공적일 수 있음을 이해한다. 바람직한 코돈의 결정은 서열 정보를 입수할 수 있는 숙주 세포로부터 유래된 유전자의 개관에 기초할 수 있다.
"유전자"는 특정한 단백질을 발현하는 핵산 단편을 나타내며, 이는 코딩 영역 단독을 나타내거나, 코딩 서열의 이전 (5' 비-코딩 서열) 및 이후 (3' 비-코딩 서열)의 조절 서열을 포함할 수 있다. "천연 유전자"는 그의 조절 서열과 함께 천연적으로 발견되는 유전자를 나타낸다. "키메라 유전자"는 천연적으로 함께 발견되지 않는 조절 및 코딩 서열을 포함하는, 천연 유전자가 아닌 임의의 유전자를 나타낸다. 따라서, 키메라 유전자는 상이한 공급원으로부터 유래된 조절 서열 및 코딩 서열, 또는 동일한 공급원으로부터 유래된 조절 서열 및 코딩 서열을 포함할 수 있으나, 천연적으로 발견되는 것과는 상이한 방식으로 정렬된다. "내인성 유전자"는 유기체 게놈 내의 천연적인 위치에 있는 천연 유전자를 나타낸다. "외래" 유전자는 유전자 전달에 의해 숙주 유기체로 도입된 유전자를 나타낸다. 외래 유전자는 비-천연 유기체에 삽입된 천연 유전자, 천연 숙주 내의 새로운 위치로 도입된 천연 유전자, 또는 키메라 유전자를 포함할 수 있다. "트랜스진"은 형질전환 절차에 의해 게놈에 도입된 유전자이다. "코돈-최적화된 유전자"는 숙주 세포의 바람직한 코돈 사용 빈도를 모방하도록 고안된 코돈 사용 빈도를 갖는 유전자이다.
"코딩 서열"은 특정한 아미노산 서열을 코딩하는 DNA 서열을 나타낸다. "적합한 조절 서열"은 코딩 서열의 상류 (5' 비-코딩 서열), 내부, 또는 하류 (3' 비-코딩 서열)에 위치하며, 관련된 코딩 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오티드 서열을 나타낸다. 조절 서열은 프로모터, 번역 리더 서열, 인트론, 폴리아데닐화 인식 서열, RNA 가공 부위, 이펙터(effector) 결합 부위, 및 스템-루프(stem-loop) 구조체를 포함할 수 있다.
"프로모터"는 코딩 서열 또는 기능적 RNA의 발현을 조절할 수 있는 DNA 서열을 나타낸다. 일반적으로, 코딩 서열은 프로모터 서열에 대해 3'에 위치한다. 프로모터는 전체가 천연 유전자로부터 유래될 수 있거나, 천연적으로 발견되는 상이한 프로모터로부터 유래된 상이한 요소들로 이루어질 수 있거나, 심지어 합성 DNA 절편을 포함할 수 있다. 당업자라면, 상이한 프로모터가 상이한 조직 또는 세포 유형에서, 상이한 발달 단계에서, 또는 상이한 환경적인 또는 생리학적 조건에 반응하여, 유전자의 발현을 지시할 수 있다는 것을 이해할 것이다. 유전자가 대부분의 세포 유형에서 대부분 발현될 수 있게 하는 프로모터는 보통 "구성적(constitutive) 프로모터"로서 지칭된다. 추가로, 많은 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있다는 것이 인식될 것이다.
용어 "GPAT 프로모터" 또는 "GPAT 프로모터 영역"은 발현에 필요하며 gpat 유전자에 의해 코딩되는 글리세롤-3-포스페이트 O-아실트랜스퍼라제 효소 (예컨대 2.3.1.15)의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역을 나타낸다. 적합한 야로위아 리폴리티카 GPAT 프로모터 영역의 예는 미국 특허 출원 제11/225354호에 기재되어 있다.
용어 "GPD 프로모터" 또는 "GPD 프로모터 영역"은 발현에 필요하며 gpd 유전자에 의해 코딩되는 글리세르알데히드-3-포스페이트 데히드로게나제 효소 (E.C. 1.2.1.12)의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역을 나타낸다. 적합한 야로위아 리폴리티카 GPD 프로모터 영역의 예는 제WO 2005/003310호에 기재되어 있다.
용어 "GPM 프로모터" 또는 "GPM 프로모터 영역"은 발현에 필요하며 gpm 유전자에 의해 코딩되는 포스포글리세레이트 뮤타제 효소 (EC 5.4.2.1)의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역을 나타낸다. 적합한 야로위아 리폴리티카 GPM 프로모터 영역의 예는 제WO 2005/003310호에 기재되어 있다.
용어 "FBA 프로모터" 또는 "FBA 프로모터 영역"은 발현에 필요하며 fba1 유전자에 의해 코딩되는 프럭토스-비스포스페이트 알돌라제 효소 (E.C. 4.1.2.13)의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역을 나타낸다. 적합한 야로위아 리폴리티카 FBA 프로모터 영역의 예는 제WO 2005/049805호에 기재되어 있다.
용어 "FBAIN 프로모터" 또는 "FBAIN 프로모터 영역"은 발현에 필요한 fba1 유전자의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역과 함께 fba1 유전자의 인트론을 갖는 5' 코딩 영역의 부분을 나타낸다. 적합한 야로위아 리폴리티카 FBAIN 프로모터 영역의 예는 제WO 2005/049805호에 기재되어 있다.
용어 "GPDIN 프로모터" 또는 "GPDIN 프로모터 영역"은 발현에 필요한 gpd 유전자의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역과 함께 gpd 유전자의 인트론을 갖는 5' 코딩 영역의 부분을 나타낸다. 적합한 야로위아 리폴리티카 GPDIN 프로모터 영역의 예는 미국 특허 출원 제11/183664호에 기재되어 있다.
용어 "YAT1 프로모터" 또는 "YAT1 프로모터 영역"은 yat1 유전자에 의해 코딩되며 발현에 필요한 암모늄 수송자 효소 (TC 2.A.49; 진뱅크(GenBank) 관리 번호 XM_504457)의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역을 나타낸다. 적합한 야로위아 리폴리티카 YAT1 프로모터 영역의 예는 미국 특허 출원 제11/185301호에 기재되어 있다.
용어 "EXP1 프로모터" 또는 "EXP1 프로모터 영역"은 발현에 필요하며 야로위아 리폴리티카 "YALI0C12034g" 유전자 (진뱅크 관리 번호 XM_501745)에 의해 코딩되는 단백질의 'ATG' 번역 개시 코돈 이전의 5' 상류 비번역 영역을 나타낸다. sp│Q12207 사카로마이세스 세레비지애 비고전적 방출 단백질 2 (그의 기능은 절단가능한 신호 서열이 결여된 단백질의 신규한 방출 경로와 관련이 있음)에 대한 "YALI0C12034g"의 유의한 상동성에 기초하여, 본원에서는 상기 유전자를 exp1 유전자라고 지칭하고, 그가 코딩하는 단백질을 EXP1라고 지칭한다. 적합한 야로위아 리폴리티카 EXP1 프로모터 영역의 예는 서열 221로서 기재되어 있지만, 이는 제한하려는 의도는 아니다. 당업자라면, EXP1 프로모터 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 증가되거나 감소된 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있다는 것을 인식할 것이다.
용어 "프로모터 활성"은 프로모터의 전사 효율의 평가를 나타낼 것이다. 이는 예를 들어 직접적으로는 프로모터로부터 mRNA 전사체의 양을 측정함으로써 (예컨대, 노던 블럿 또는 프라이머 신장 방법), 또는 간접적으로는 프로모터로부터 발현된 유전자 생성물의 양을 측정함으로써 결정될 수 있다.
"인트론"은 대부분의 진핵세포의 유전자 서열 (코딩 영역, 5' 비-코딩 영역, 또는 3' 비-코딩 영역)에서 발견되는 비-코딩 DNA의 서열을 나타낸다. 그들의 완전한 기능은 알려지지 않았지만, 일부 인핸서가 인트론에 위치한다 (문헌 [Giacopelli F. et al., Gene Expr. 11: 95-104 (2003)]). 이들 인트론 서열은 전사는 되지만, mRNA가 단백질로 번역되기 전에 예비-mRNA 전사체 내로부터 제거된다. 이러한 인트론 제거 과정은 인트론의 어느 한 측에 있는 서열 (엑손)의 자체-스플라이싱에 의해 일어난다.
용어 "인핸서"는 인접한 진핵세포 프로모터로부터의 전사 수준을 상승시켜 유전자 전사를 증가시킬 수 있는 시스-조절 서열을 나타낸다. 인핸서는 DNA의 여러 10 킬로베이스에 걸쳐 프로모터에 대해 작용할 수 있고, 그들이 조절하는 프로모터에 대해 5' 또는 3'일 수 있다. 인핸서는 또한 인트론 내부에 존재할 수 있다.
용어 "3' 비-코딩 서열" 및 "전사 종결자"는 코딩 서열의 하류에 위치하는 DNA 서열을 나타낸다. 이는 폴리아데닐화 인식 서열, 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 코딩하는 다른 서열을 포함한다. 폴리아데닐화 신호는 보통 폴리아데닐산 구역을 mRNA 전구체의 3' 말단에 부가하는 것에 영향을 미치는 것을 특징으로 한다. 3' 영역은 관련된 코딩 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미칠 수 있다.
"RNA 전사체"는 DNA 서열의 RNA 폴리머라제-촉매된 전사의 결과 생성된 생성물을 나타낸다. RNA 전사체가 DNA 서열의 완벽한 상보적인 카피인 경우에는 1차 전사체로 지칭되거나, 또는 상기 1차 전사체의 전사후 가공으로부터 유래된 RNA 서열일 수 있는 경우에는 성숙 RNA로서 지칭된다. "전령 RNA" 또는 "mRNA"는 인트론이 없으며 세포에 의해 단백질로 번역될 수 있는 RNA를 나타낸다. "cDNA"는 mRNA에 상보적이며 그로부터 유래된 이중-가닥 DNA를 나타낸다. "센스" RNA는 mRNA를 포함하며 세포에 의해 단백질로 번역될 수 있는 RNA 전사체를 나타낸다. "안티센스 RNA"는 표적 1차 전사체 또는 mRNA의 전체 또는 일부에 대해 상보적이고, 표적 유전자의 발현을 차단하는 RNA 전사체를 나타낸다 (미국 특허 제5,107,065호, 제WO 99/28508호). 안티센스 RNA는 특정한 유전자 전사체의 임의의 부분, 즉 5' 비-코딩 서열, 3' 비-코딩 서열, 또는 코딩 서열에 대해 성보적일 수 있다. "기능적 RNA"는 번역되지는 않지만 세포 과정에 대해 효과를 갖는 안티센스 RNA, 리보자임 RNA, 또는 다른 RNA를 나타낸다.
용어 "작동가능하게 연결된"은 하나의 기능이 다른 것에 의해 영향을 받도록 단일 핵산 단편과 핵산 서열이 회합되는 것을 나타낸다. 예를 들어, 프로모터는 코딩 서열의 발현에 영향을 미칠 수 있을 때 상기 코딩 서열에 작동가능하게 연결된다 (즉, 상기 코딩 서열은 프로모터의 전사 조절하에 있다). 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동가능하게 연결된다.
본원에 사용된 용어 "발현"은 본 발명의 핵산 단편으로부터 유래된 센스 (mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 나타낸다. 발현은 또한 mRNA에서 폴리펩티드로의 번역을 나타낸다.
"성숙" 단백질은 번역후 가공된 폴리펩티드, 즉 1차 번역 생성물에 존재하는 임의의 프리- 또는 프로펩티드가 제거된 것을 나타낸다. "전구체" 단백질은 mRNA 번역의 1차 생성물, 즉 프리- 및 프로펩티드가 여전히 존재하는 것을 나타낸다. 프리- 및 프로펩티드는 세포내 국부화 신호일 수 있지만, 이로 제한되지 않는다.
용어 "레콤비나제"는 DNA 구조를 변경하기 위해 부위-특이적 재조합을 수행하는 효소를 나타내며, 이는 트랜스포사제, 람다 통합/제거 효소뿐 아니라, 부위-특이적 레콤비나제를 포함한다.
"레콤비나제 부위" 또는 "부위-특이적 레콤비나제 서열"은 레콤비나제가 인식하여 결합하는 DNA 서열을 나타낸다. 이는 기능이 유지되는 한 야생형 또는 돌연변이체 레콤비나제 부위일 수 있으며, 레콤비나제 효소는 여전히 상기 부위를 인식하여 DNA 서열에 결합하고, 인접한 두개의 레콤비나제 부위 사이의 재조합을 촉매할 수 있다.
"형질전환"은 핵산 분자를 숙주 유기체에 전달하여 유전적으로 안정한 내력을 나타내는 것이다. 예를 들어, 핵산 분자는 자율적으로 복제하는 플라스미드일 수 있거나, 또는 숙주 유기체의 게놈에 통합될 수 있다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "재조합" 또는 "형질전환된" 유기체로서 지칭된다.
용어 "플라스미드", "벡터" 및 "카세트"는 세포의 중심적인 대사의 일부분이 아닌 유전자를 보유하며, 보통 환형의 이중-가닥 DNA 단편의 형태를 갖는 별개의 염색체 요소를 나타낸다. 이러한 요소는 임의의 공급원으로부터 유래된 선형 또는 환형의 단일- 또는 이중-가닥 DNA 또는 RNA의 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열일 수 있으며, 여기서, 수많은 뉴클레오티드 서열이 특유한 구축물 내로 접합 또는 재조합되고, 상기 구축물은 적절한 3' 비번역 서열과 함께 선택된 유전자 생성물을 위한 프로모터 단편 및 DNA 서열을 세포 내로 도입할 수 있다. "발현 카세트"는 외래 유전자를 함유하고, 상기 외래 유전자 이외에도 외래 숙주에서 상기 유전자의 발현을 증가시킬 수 있는 요소를 갖는 특정한 벡터를 나타낸다.
용어 "상동성 재조합"은 (교차되는 동안) 2개의 DNA 분자 사이의 DNA 단편의 교환을 나타낸다. 교환된 단편은 상기 2개의 DNA 분자 사이에서 동일한 뉴클레오티드 서열 부위 (즉, "상동성 영역")에 의해 플랭킹된다. 용어 "상동성 영역"은 상동성 재조합에 참여하는 서로 상동성인 핵산 단편 상의 뉴클레오티드 서열의 신장부를 나타낸다. 효과적인 상동성 재조합은 일반적으로 이들 상동성 영역의 길이가 약 10 bp 이상이고, 바람직하게는 약 50 bp 이상인 경우에 일어난다. 전형적으로, 재조합을 위해 의도된 단편은 표적화된 유전자 파괴 또는 대체가 필요한 2개 이상의 상동성 영역을 함유한다.
용어 "서열 분석 소프트웨어"는 뉴클레오티드 또는 아미노산 서열의 분석에 유용한 임의의 컴퓨터 알고리즘 또는 소프트웨어 프로그램을 나타낸다. "서열 분석 소프트웨어"는 시판되는 것이거나, 독자적으로 개발된 것일 수 있다. 전형적인 서열 분석 소프트웨어로는 1) GCG 집합의 프로그램 (위스콘신 팩키지 버전 9.0(Wisconsin Package Version 9.0), 제네틱 컴퓨터 그룹(Genetics Computer Group; GCG), 미국 위스콘신주 매디슨 소재); 2) BLASTP, BLASTN, BLASTX (문헌 [Altschul et al., J. Mol. Biol. 215:403-410 (1990)]); 3) DNASTAR (디엔에이스타, 인크(DNASTAR, Inc.), 미국 위스콘신주 매디슨 소재); 4) 시퀀쳐(Sequencher) (진 코드스 코포레이션(Gene Codes Corporation), 미국 미시건주 앤 아버 소재); 및 5) 스미스-워터맨(Smith-Waterman) 알고리즘이 도입된 FASTA 프로그램 (문헌 [W. R. Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Plenum: New York, NY])이 있으나, 이로 제한되는 것은 아니다. 본원의 문맥상, 서열 분석 소프트웨어를 분석을 위해 이용하는 경우, 달리 명시하지 않는 한 분석 결과는 참조한 프로그램의 "디폴트 값"을 기초로 할 것이라는 것을 이해할 것이다. 본원에 사용된 "디폴트 값"은 처음 초기화시에 소프트웨어에 원래 내장되어 있는 임의의 집합의 값 또는 파라미터를 의미할 것이다.
용어 "보존된 도메인" 또는 "모티프"는 진화론적으로 관련이 있는 단백질의 정렬된 서열을 따라 특정한 위치에서 보존된 아미노산의 집합을 의미한다. 다른 위치의 아미노산은 상동성 단백질들 사이에서 다를 수 있는 반면, 특정한 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 활성에 필수적인 아미노산을 나타낸다. 이들은 단백질 상동체 족의 정렬된 서열에서 고도의 보존성에 의해 확인되기 때문에, 새로 결정된 서열을 갖는 단백질이 이전에 확인된 단백질 족에 속하는지를 결정하는 식별자 또는 "사인"으로서 사용될 수 있다. Δ15 데새투라제 활성을 갖는 진균 단백질임을 표시하는 모티프는 서열 223로 제공되고, Δ12 데새투라제 활성을 갖는 진균 단백질임을 표시하는 모티프는 서열 224으로 제공된다.
본원에서 이용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 공지되어 있고, 문헌 [Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)] (이후 "마니아티스"); [Silhavy, T. J., Bennan, M. L. and Enquist, L. W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1984)] 및 [Ausubel, F, M. et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc, and Wiley-lnterscience (1987)]에 기재되어 있다.
DHA
생성을 위한 바람직한 미생물 숙주:
야로위아
리폴리티카
본 발명자들에 의한 작업 이전에는 (피카타지오(Picataggio) 등의 제WO 2004/101757호 참조), PUFA를 위한 생성 플랫폼으로서 사용하기에 적합한 미생물 부류로서 유질 효모를 조사한 적이 없었다. 전형적으로 유질 효모로서 확인된 족으로는 야로위아, 칸디다, 로도토룰라, 로도스포리듐, 크립토코커스, 트리코스포론 및 리포마이세스가 있으나, 이로 제한되지 않는다. 보다 구체적으로, 오일-합성 효모의 예로는 로도스포리듐 토룰리데스(Rhodosporidium toruloides), 리포마이세스 스타르케이이(Lipomyces starkeyii), 리포마이세스 리포페루스(L. lipoferus), 칸디다 레브카우피(Candida revkaufi), 칸디다 풀케리마(C. pulcherrima), 칸디다 트로피칼리스(C. tropicalis), 칸디다 유틸리스(C. utilis), 트리코스포론 풀란스(Trichosporon pullans), 트리코스포론 쿠타네움(T. cutaneum), 로도토룰라 글루티누스(Rhodotorula glutinus), 로도토룰라 그라미니스(R. graminis) 및 야로위아 리폴리티카 (이전에는 칸디다 리폴리티카로 분류됨)가 있으나, 이로 제한되지 않는다.
유질 효모는 DHA의 경제적이고 상업적인 생성을 위한 숙주 유기체로서 용이하게 사용될 수 있는 여러 성질을 갖는 것으로 고려되었다. 첫째, 상기 유기체는 천연적으로 오일을 합성 및 축적할 수 있는 것들로 한정되며, 여기서, 상기 오일은 세포 건조 중량의 약 25% 초과, 더욱 바람직하게는 세포 건조 중량의 약 30% 초과, 가장 바람직하게는 세포 건조 중량의 약 40%를 차지할 수 있다. 둘째, 오일 함량이 높은 유질 효모를 성장시키는 기술은 널리 개발되어 있다 (예를 들어, 제EP 0 005 277B1호; 문헌 [Ratledge, C, Prog. Ind. Microbiol. 16:119-206 (1982)] 참조). 그리고, 이들 유기체는 과거에 다양한 목적을 위해 상업적으로 사용되었다. 예를 들어, 야로위아 리폴리티카의 다양한 균주는 역사적으로 이소시트레이트 리아제 (제DD 259637호); 리파제 (제SU 1454852호, 제WO 2001083773호, 제DD 279267호); 폴리히드록시알카노에이트 (제WO 2001088144호); 시트르산 (제RU 2096461호, 제RU2090611호, 제DD 285372호, 제DD 285370호, 제DD 275480호, 제DD 227448호, 제PL 160027호); 에리트리톨 (제EP 770683호); 2-옥소글루타르산 (제DD 267999호); γ-데카락톤 (미국 특허 제6,451,565호, 제FR 2734843호); γ-도데카락톤 (제EP 578388호); 및 피루브산 (제JP 09252790호)의 제조 및 생산에 사용되었다.
유질 효모로서 분류된 유기체들 중에서, 본원의 목적상 야로위아 리폴리티카가 바람직한 미생물 숙주로서 선택되었다. 이러한 선별은, ω-3 지방산을 TAG 분획에 혼입시킬 수 있는 유질 균주를 입수할 수 있었고, 상기 유기체를 유전자 조작할 수 있었으며, 식품 등급의 시트르산의 일반적으로 안전한 것으로 인식된 (Generally Recognized As Safe ("GRAS"), 미국 식약청에 따라) 공급원으로서 이전에 상기 종을 사용하였다는 지식에 기초하였다. 추가의 실시양태에서, 지질 함량이 높고 (건조 중량%로서 측정) 부피 생산율이 높은 (g/Lh-1로서 측정) 야생형 균주의 확인을 위해 표적화된 예비 연구 때문에, ATCC #20362, ATCC #8862, ATCC #18944, ATCC #76982 및/또는 LGAM S(7)1로 지칭되는 야로위아 리폴리티카 균주가 가장 바람직하다 (문헌 [Papanikolaou S., and Aggelis G., Bioresour. Technol. 82(1):43-9 (2002)]).
제WO 2004/101757호에 기재된 바와 같이, 이전에 야로위아 리폴리티카는 ω-3/ω-6 생합성 경로를 코딩하는 유전자의 도입 및 발현에 의해 각각 1.3% ARA 및 1.9% EPA를 생성하도록 유전자 조작되었다. 보다 구체적으로, 두가지 상이한 DNA 발현 구축물 (ARA 합성을 위해 Δ6 데새투라제, Δ5 데새투라제 및 고-친화도 PUFA C18/20 엘론가제, 또는 EPA 합성을 위해 Δ6 데새투라제, Δ5 데새투라제, 고-친화도 PUFA C18 /20 엘론가제 및 코돈-최적화된 Δ17 데새투라제를 포함함)를 따로 형질전환시키고, 효소 오로티딘-5'-포스페이트 데카르복실라제 (EC 4.1.1.23)를 코딩하는 야로위아 리폴리티카 염색체 URA3 유전자에 통합시켰다. 적절한 기질을 공급한 숙주 세포의 GC 분석에 의해 ARA 및 EPA의 생성을 검출하였다. 이 작업은 유질 숙주가 ω-6 및 ω-3 지방산을 생성하도록 유전자 조작되는 능력에 대한 개념을 증명하는데는 적합하였지만, DHA 생성을 입증하거나, 또는 전체 오일 분획 중 5% 초과의 DHA, 더욱 바람직하게는 전체 오일 분획 중 10% 초과의 DHA, 훨씬 더욱 바람직하게는 전체 오일 분획 중 15 내지 20%의 DHA, 가장 바람직하게는 전체 오일 분획 중 25 내지 30%의 DHA를 합성할 수 있도록 복잡한 대사성 유전자를 조작하거나 제안하는데는 실패하였다.
동시 계류 중인 미국 특허 출원 제60/624812호에서는, 야로위아 리폴리티카를 사용한 복잡한 대사성 유전자 조작이 (1) EPA의 합성 및 고축적을 허용하는, 바람직한 데새투라제 및 엘론가제를 확인하기 위해; (2) 오메가 지방산을 저장 지질 풀로 전달하는 아실트랜스퍼라제의 활성을 조작하기 위해; (3) 강력한 프로모터, 다중 카피에서의 발현 및/또는 코돈-최적화를 사용하여 데새투라제, 엘론가제 및 아실트랜스퍼라제를 과발현시키기 위해; (4) EPA의 전반적인 축적을 감소시키는 PUFA 생합성 경로 내에서 특정 유전자의 발현을 하향-조절하기 위해; 그리고 (5) EPA 제조에 영향을 미치는 경로 및 광범위한 조절자를 조작하기 위해 수행한다. 이것은 야로위아 리폴리티카의 하나의 특정 재조합 균주에서 28% 이하의 EPA를 생성하였다.
본 출원에서, 유사한 복잡한 대사성 유전자 조작은 야로위아 리폴리티카 재조합 균주에서 전체 오일 분획 중 5% 초과의 DHA을 생성하기 위해 수행되었다. 보다 구체적으로, 균주는 Δ6 데새투라제/Δ6 엘론가제 경로를 사용하여 유전학적으로 유전자 조작되었고; 별법 실시양태에서, 형질전환 균주를 유전학적으로 유전자 조작하여 Δ9 엘론가제/Δ8 데새투라제 경로에 사용함으로써, GLA가 결여된 고-DHA 오일을 생성할 수 있다. 사용된 대사성 유전자 조작의 측면은 상기 유질 효모에서 DHA 생성을 유의하게 증가시키기 위해 수행될 수 있는 추가 유전자 조작 및 발효 방법과 함께 하기에 논의될 것이다.
개관: 지방산 및
트리아실글리세롤의
미생물성 생합성
일반적으로, 유질 미생물에서의 지질 축적은 성장 배지에 존재하는 전반적인 탄소:질소 비율에 반응하여 유발된다. 유질 미생물에서 유리 팔미테이트 (16:0)의 새로운 합성을 유도하는 상기 과정은 제WO 2004/101757호에 상세하게 기재되어 있다. 팔미테이트는 더욱 장쇄의 포화 및 불포화 지방산 유도체의 전구체이고, 이는 엘론가제 및 데새투라제의 작용에 의해 형성된다. 예를 들어, Δ9 데새투라제의 작용에 의해 팔미테이트가 그의 불포화 유도체 [팔미트올레산 (16:1)]로 전환되고, 유사하게, 팔미테이트가 C16 /18 지방산 엘론가제에 의해 신장되어 스테아르산 (18:0)을 형성하고, 이는 Δ9 데새투라제에 의해 그의 불포화 유도체로 전환되어 올레산 (18:1)을 수득할 수 있다.
TAG (지방산에 대한 1차 저장 단위)는 1) 아실트랜스퍼라제를 통해 아실-CoA의 한 분자가 글리세롤-3-포스페이트로 에스테르화되어 리소포스파티드산을 생성하고; 2) 아실트랜스퍼라제를 통해 아실-CoA의 제2 분자가 에스테르화되어 1,2-디아실글리세롤 포스페이트 (흔히 포스파티드산으로 확인됨)를 수득하고; 3) 포스파티드산 포스파타제에 의해 포스페이트를 제거하여 1,2-디아실글리세롤 (DAG)을 수득하고; 4) 아실트랜스퍼라제의 작용에 의해 제3 지방산을 부가하여 TAG를 형성하는 것을 포함하는 일련의 반응 (도 2)에 의해 형성된다.
포화 및 불포화 지방산 및 단쇄 및 장쇄 지방산을 비롯한 광범위한 지방산을 TAG에 도입시킬 수 있다. 아실트랜스퍼라제에 의해 TAG에 도입될 수 있는 지방산의 일부 제한적인 예로는 카프르산 (10:0), 라우르산 (12:0), 미리스트산 (14:0), 팔미트산 (16:0), 팔미트올레산 (16:1), 스테아르산 (18:0), 올레산 (18:1), 바센산 (18:1), LA, 엘레오스테아르산 (18:3), ALA, GLA, 아라키드산 (20:0), EDA, ETrA, DGLA, ETA, ARA, EPA, 베헨산 (22:0), DPA, DHA, 리그노세르산 (24:0), 네르본산 (24:1), 세로트산 (26:0) 및 몬탄산 (28:0) 지방산이 있다. 본 발명의 바람직한 실시양태에서, DHA를 TAG에 도입하는 것이 가장 바람직하다.
DHA
, ω-3 지방산의 생합성
올레산이 DHA로 전환되는 대사 과정은 탄소 원자의 첨가에 의한 탄소 쇄의 신장, 및 이중 결합의 첨가에 의한 분자의 탈포화를 포함한다. 이는 소포체 막에 존재하는 일련의 특정한 탈포화 및 신장 효소를 필요로 한다. 그러나, 도 1 및 하기에 기재된 바와 같이, DHA 생성에 대한 여러 별법의 경로가 존재한다 (모든 경우에서, DHA 생성이 EPA 합성을 요구함).
구체적으로, 모든 경로는 Δ12 데새투라제의 작용에 의해 올레산에서 LA (18:2) (첫번째 ω-6 지방산)로의 초기 전환을 포함한다. 이어서, EPA 생합성을 위한 "ω-6 Δ6 데새투라제/Δ6 엘론가제 경로"를 이용하여 (이로써 EPA 생합성은 주로 ω-6 지방산의 형성을 통해 일어남), PUFA를 다음에 따라 형성한다: (1) Δ6 데새투라제의 작용에 의해 LA가 GLA로 전환되고; (2) C18 /20 엘론가제의 작용에 의해 GLA가 DGLA로 전환되고; (3) Δ5 데새투라제의 작용에 의해 DGLA가 ARA로 전환되고; (4) Δ17 데새투라제의 작용에 의해 ARA가 EPA로 전환된다. 별법으로, EPA 생합성이 주로 "ω-3 Δ6 데새투라제/Δ6 엘론가제 경로"를 통해 일어나는 경우에는, (1) Δ15 데새투라제의 작용에 의해 LA가 ALA (첫번째 ω-3 지방산)로 전환되고; (2) Δ6 데새투라제의 작용에 의해 ALA가 STA로 전환되고; (3) C18 /20 엘론가제의 작용에 의해 STA가 ETA로 전환되고; (4) Δ5 데새투라제의 작용에 의해 ETA가 EPA로 전환된다. 임의로, ω-6 및 ω-3 지방산의 조합물은 EPA가 생성되기 전에, Δ17 데새투라제의 작용에 의해 DGLA로부터 ETA를 제조할 때, 또는 Δ15 데새투라제 및 Δ17 데새투라제 둘다를 Δ6 데새투라제, C18 /20 엘론가제 및 Δ5 데새투라제와 함께 동시 발현시킬 때 합성될 수 있다.
EPA의 생합성에 대한 별법의 경로는 Δ9 엘론가제 및 Δ8 데새투라제를 이용한다. 보다 구체적으로, "ω-6 Δ9 엘론가제/Δ8 데새투라제 경로"를 통해, Δ9 엘론가제의 작용에 의해 LA가 EDA로 전환된 다음, Δ8 데새투라제가 EDA를 DGLA로 전환시킨다. 상기 기재된 바와 같이, Δ5 데새투라제의 작용에 의한 DGLA의 후속적인 탈포화에 의해 ARA를 수득하고, ARA는 Δ17 데새투라제의 작용에 의해 EPA로 직접 전환된다. 반대로, "ω-3 Δ9 엘론가제/Δ8 데새투라제 경로"를 이용하여, 먼저 Δ15 데새투라제의 작용에 의해 LA가 ALA로 전환된다. 그 다음, Δ9 엘론가제의 작용에 의해 ALA가 ETrA로 전환됨 후, Δ8 데새투라제가 ETrA를 ETA로 전환시킨다. Δ5 데새투라제의 작용에 의해 ETA가 후속적으로 탈포화되어 EPA를 수득한다.
EPA 합성 시에, C20 /22 엘론가제는 기질을 DPA로 전환시킨다. 이어서, DPA는 Δ4 데새투라제의 작용에 의해 DHA로 전환된다.
명확히 하기 위해, 이들 각 경로 및 구별되는 특징들을 하기 표에 요약하였다.
EPA 생합성을 위한 대안적인 생합성 경로 | ||
명칭 | EPA 를 위한 최소 필요 유전자 * | 경로 |
ω-6 Δ6 데새투라제/Δ6 엘론가제 경로 | Δ6D, C18 /20 ELO, Δ5D, Δ17D, C20/22 ELO, Δ4D | PUFA 생성물의 ω-3/ω-6 비를 개선시킴 |
ω-3 Δ6 데새투라제/Δ6 엘론가제 경로 | Δ15D, Δ6D, C18 /20 ELO, Δ5D, C20/22 ELO, Δ4D | 후속적인 PUFA 생합성을 위한 기질의 ω-3/ω-6 비를 개선시키고, GLA가 결여된 오일을 생성함 |
Δ6 데새투라제/Δ6 엘론가제 경로의 조합 | Δ15D, Δ6D, C18 /20 ELO, Δ5D, Δ17D, C20 /22 ELO, Δ4D | --- |
ω-6 Δ9 엘론가제/Δ8 데새투라제 경로 | Δ9 ELO, Δ8D, Δ5D, Δ17D, C20/22 ELO, Δ4D | PUFA 생성물의 ω-3/ω-6 비를 개선시킴 |
ω-3 Δ9 엘론가제/Δ8 데새투라제 경로 | Δ15D, Δ9 ELO, Δ8D, Δ5D, C20/22 ELO, Δ4D | 후속적인 PUFA 생합성을 위한 기질의 ω-3/ω-6 비를 개선시키고, GLA가 결여된 오일을 생성함 |
Δ9 엘론가제/Δ8 데새투라제 경로의 조합 | Δ15D, Δ9 ELO, Δ8D, Δ5D, Δ17D, C20 /22 ELO, Δ4D | --- |
* 약어: "D" = 데새투라제; "ELO" = 엘론가제 |
DHA
합성을 위한 미생물 유전자의 선별
DHA의 생성을 위해 야로위아 리폴리티카에 도입될 필요가 있는 특별한 기능들은 숙주 세포 (및 그의 천연 PUFA 프로파일 및/또는 데새투라제/엘론가제 프로파일), 기질의 유용성, 및 원하는 최종 생성물에 의해 좌우된다. 천연 숙주 세포와 관련하여, 야로위아 리폴리티카가 천연적으로 18:2 지방산을 생성할 수 있어서, 천연 Δ12 데새투라제 (서열 28 및 29; 제WO 2004/104167호 참조)를 보유한다는 것이 공지되어 있다. 원하는 최종 생성물과 관련하여, 생성되는 오일의 최종 지방산 프로파일 (즉, 고 DHA 오일의 최종 조성물 중 % GLA)의 면에서 Δ9 엘론가제/Δ8 데새투라제 경로 발현과는 반대되는 Δ6 데새투라제/Δ6 엘론가제 경로 발현의 결과를 상기 기재하였다.
따라서, 일부 실시양태에서는, Δ6 데새투라제/Δ6 엘론가제 경로를 통해 DHA를 생성하는 것이 바람직할 것이다. 따라서, 최소한 하기 유전자가 숙주 유기체에 도입되어 DHA 생합성을 위해 발현되어야 한다: Δ6 데새투라제, C18 /20 엘론가제, Δ5 데새투라제, 및 Δ17 데새투라제 또는 Δ15 데새투라제 중 하나 (또는 둘다), C20 /22 엘론가제 및 Δ4 데새투라제. 더욱 바람직한 실시양태에서, 숙주 균주는 추가로 Δ9 데새투라제, Δ12 데새투라제, C14 /16 엘론가제 및 C16 /18 엘론가제 중 하나 이상을 포함한다.
별법의 실시양태에서, DHA를 GLA의 동시 합성 없이 생성하는 것이 바람직하다 (따라서, Δ9 엘론가제/Δ8 데새투라제 경로의 발현이 필요하다). 이 전략은 최소한 하기 유전자가 숙주 유기체에 도입되어 DHA 생합성을 위해 발현되는 것을 필요로 한다: Δ9 엘론가제, Δ8 데새투라제, Δ5 데새투라제, 및 Δ17 데새투라제 또는 Δ15 데새투라제 중 하나 (또는 둘다), C20 /22 엘론가제 및 Δ4 데새투라제. 더욱 바람직한 실시양태에서, 숙주 균주는 추가로 Δ9 데새투라제, Δ12 데새투라제, C14 /16 엘론가제 및 C16 /18 엘론가제 중 하나 이상을 포함한다.
당업자라면 DHA 생합성에 필요한 각각의 효소를 코딩하는 다양한 후보 유전자를 확인할 수 있을 것이다. 유용한 데새투라제 및 엘론가제 서열은 임의의 공급원으로부터 유래될 수 있는데, 예를 들어, 천연 공급원 (박테리아, 조류, 진균, 식물, 동물 등)으로부터 단리되거나, 반-합성 경로를 통해 제조되거나, 새로이 합성될 수 있다. 숙주에 도입되는 데새투라제 및 엘론가제 유전자의 특정한 공급원은 본 발명에서 중요하지는 않지만, 데새투라제 또는 엘론가제 활성을 갖는 특정한 폴리펩티드를 선택하는데 있어서 고려할 점으로는 1) 폴리펩티드의 기질 특이성; 2) 폴리펩티드 또는 그의 성분이 속도-제한적 효소인지의 여부; 3) 데새투라제 또는 엘론가제가 원하는 PUFA의 합성에 필수적인지의 여부; 및/또는 4) 폴리펩티드에 필요한 보조인자가 있다. 발현된 폴리펩티드는 바람직하게는 숙주 세포에서 그가 위치하는 생화학적 환경과 상용성인 파라미터를 갖는다. 예를 들어, 폴리펩티드는 숙주 세포에서 기질에 대해 다른 효소와 경쟁할 수 있어야 한다. 따라서, 폴리펩티드의 KM 및 특정한 활성의 분석은 주어진 숙주 세포에서 PUFA 생성을 변형시키기 위해 주어진 폴리펩티드의 적합성을 측정하는 것으로 고려된다. 특정 숙주 세포에서 사용된 폴리펩티드는 의도된 숙주 세포에 존재하는 생화학적 조건하에 기능할 수 있지만, 원하는 PUFA를 변형시킬 수 있는 데새투라제 또는 엘론가제 활성을 갖는 임의의 폴리펩티드일 수 있는 것이다.
추가의 실시양태에서, 각각의 특정한 데새투라제 및/또는 엘론가제의 전환 효율을 고려하는 것이 유용할 것이다. 보다 구체적으로, 대부분의 효소는 기질에서 생성물로의 100% 전환 효율로 기능하지 않기 때문에, 숙주 세포에서 생성된 비정제된 오일의 최종 지질 프로파일은 전형적으로 원하는 DHA 뿐만 아니라 다양한 상류 중간체 PUFA로 구성되는 다양한 PUFA의 혼합물 (예컨대, 100% DHA 오일과 대조적임)일 것이다. 따라서, 각 효소의 전환 효율의 고려는 DHA의 생합성을 최적화할 때 중요한 변수이며, 이는 생성물의 최종 원하는 지질 프로파일의 측면에서 고려되어야 한다.
상기 각각을 고려하여, 적절한 데새투라제 및 엘론가제 활성을 갖는 후보 유전자는 공개적으로 입수가능한 문헌 (예컨대, 진뱅크), 특허 문헌, 및 PUFA를 생성하는 능력을 갖는 미생물의 실험적 분석에 따라 확인될 수 있다. 예를 들어, 하기 진뱅크 관리 번호는 DHA 생합성에 유용한 공개적으로 입수가능한 유전자의 예를 나타낸다: AY131238, Y055118, AY055117, AF296076, AF007561, L11421, NM_031344, AF465283, AF465281, AF110510, AF465282, AF419296, AB052086, AJ250735, AF126799, AF126798 (Δ6 데새투라제); AF390174 (Δ9 엘론가제); AF139720 (Δ8 데새투라제); AF199596, AF226273, AF320509, AB072976, AF489588, AJ510244, AF419297, AF07879, AF067654, AB022097 (Δ5 데새투라제); AAG36933, AF110509, AB020033, AAL13300, AF417244, AF161219, AY332747, AAG36933, AF110509, AB020033, AAL13300, AF417244, AF161219, X86736, AF240777, AB007640, AB075526, AP002063 (Δ12 데새투라제); NP_441622, BAA18302, BAA02924, AAL36934 (Δ15 데새투라제); AF338466, AF438199, E11368, E11367, D83185, U90417, AF085500, AY504633, NM_069854, AF230693 (Δ9 데새투라제); AY630574, AY332747, AY278558, AF489589 (Δ4 데새투라제); 및 NP_012339, NP_009963, NP_013476, NP_599209, BAB69888, AF244356, AAF70417, AAF71789, AF390174, AF428243, NP_955826, AF206662, AF268031, AY591335, AY591336, AY591337, AY591338, AY605098, AY605100, AY630573 (C14 /16, C16 /18, C18 /20 및 C20 /22 엘론가제). 유사하게, 특허 문헌은 PUFA 생성과 관련된 유전자의 추가의 여러 DNA 서열 (및/또는 상기 여러 유전자와 관련된 상세한 내용 및 그의 단리 방법)을 제공한다 [예를 들어, 제WO 02/077213호 (Δ9 엘론가제); 제WO 00/34439호 및 제WO 04/057001호 (Δ8 데새투라제); 미국 특허 제5,968,809호 (Δ6 데새투라제); 미국 특허 제5,972,664호 및 미국 특허 제6,075,183호 (Δ5 데새투라제); 제WO 94/11516호, 미국 특허 제5,443,974호, 제WO 03/099216호 및 제WO 05/047485호 (Δ12 데새투라제); 제WO 93/11245호 (Δ15 데새투라제); 제WO 91/13972호 및 미국 특허 제5,057,419호 (Δ9 데새투라제); 미국 출원 제2003/0196217호 (Δ17 데새투라제); 및 제WO 02/090493호 (Δ4 데새투라제); 및, 제WO 00/12720호, 미국 특허 제6,403,349호, 미국 특허 제6,677,145호, 미국 특허 제2002/0139974 A1호, 미국 특허 2004/0111763호 (C14 /16, C16/18, C18 /20 및 C20 /22 엘론가제)]. 이들 각 특허 및 출원은 그의 전문이 본원에 참고로 포함된다.
상기 예는 제한하려고 의도된 것이 아니며, 상이한 공급원으로부터 유래된 (1) Δ6 데새투라제, C18 /20 엘론가제, Δ5 데새투라제, 및 Δ17 데새투라제 또는 Δ15 데새투라제 중 하나 (또는 둘다), C20 /22 엘론가제 및 Δ4 데새투라제를 코딩하는 수많은 다른 유전자 (및 임의로 Δ9 데새투라제, Δ12 데새투라제, C14 /16 엘론가제 및/또는 C16 /18 엘론가제를 코딩하는 다른 유전자); 또는 (2) Δ9 엘론가제, Δ8 데새투라제, Δ5 데새투라제, 및 Δ17 데새투라제 또는 Δ15 데새투라제 중 하나 (또는 둘다), C20 /22 엘론가제 및 Δ4 데새투라제를 코딩하는 수많은 다른 유전자 (및 임의로 Δ9 데새투라제, Δ12 데새투라제, C14 /16 엘론가제 및/또는 C16 /18 엘론가제를 코딩하는 다른 유전자)를 코딩하는 수많은 다른 유전자들이 야로위아 리폴리티카에 도입시키기에 적합할 것이다.
DHA
합성에 바람직한 유전자
야로위아 리폴리티카에서의 발현에 적합할 수 있는 데새투라제 및 엘론가제를 광범위하게 선택할 수 있지만, 본 발명의 바람직한 실시양태에서는 데새투라제 및 엘론가제가 하기 (또는 그의 유도체)로부터 선택된다:
야로위아 리폴리티카에서 EPA 생성합을 위한 바람직한 데새투라제 및 엘론가제 | |||
ORF | 유기체 | 참조문헌 | 서열번호 |
Δ6 데새투라제 | 모르티에렐라 알피나 | 진뱅크 관리 번호 AF465281; 미국 특허 제5,968,809호 | 서열 1, 서열 2 |
Δ6 데새투라제 | 모르티에렐라 알피나 | 진뱅크 관리 번호 AB070555 | 서열 4, 서열 5 |
C18 /20 엘론가제 ("ELO1") | 모르티에렐라 알피나 | 진뱅크 관리 번호 AX464731; 제WO 00/12720호 | 서열 22, 서열 23 |
C18 /20 엘론가제 ("ELO2") | 트라우스토키트륨 아우레움 | 미국 특허 제6,677,145호 | 서열 25, 서열 26 |
Δ9 엘론가제 | 이소크리시스 갈바나 | 진뱅크 관리 번호 AF390174 | 서열 69, 서열 70 |
Δ8 데새투라제 | 유글레나 그라실리스 | 동시 계류 중인 미국 특허 출원 제11/166993호 | 서열 77, 서열 78 |
Δ5 데새투라제 | 모르티에렐라 알피나 | 진뱅크 관리 번호 AF067654; 미국 특허 제6,075,183호 | 서열 6, 서열 7 |
Δ5 데새투라제 | 이소크리시스 갈바나 | 제WO 02/081668 A2호 | 서열 8, 서열 9 |
Δ5 데새투라제 | 호모 사피엔스 | 진뱅크 관리 번호 NP_037534 | 서열 11, 서열 12 |
Δ5/Δ6 데새투라제 | 다니오 레리오 | 진뱅크 관리 번호 AF309556 | 서열 14, 서열 15 |
Δ5/Δ6 데새투라제 | 다니오 레리오 | 진뱅크 관리 번호 BC068224 | 서열 16 |
Δ5/Δ6 데새투라제 | 다니오 레리오 | -- | 서열 17, 서열 18 |
Δ17 데새투라제 | 사프롤레그니아 디클리나 | 미국 특허 출원 제US 2003/0196217 A1호 | 서열 19, 서열 20 |
Δ4 데새투라제 | 트라우스토키트륨 아우레움 | 진뱅크 관리 번호 AAN75707 | 서열 104, 서열 105 |
C20 /22 엘론가제 | 오스트레오코쿠스 타우리 | 진뱅크 관리 번호 AY591336 | 서열 100, 서열 101 |
C16 /18 엘론가제 ("YE2") | 야로위아 리폴리티카 | -- | 서열 94, 서열 95 |
C16 /18 엘론가제 ("ELO3") | 모르티에렐라 알피나 | -- | 서열 86, 서열 87 |
C16 /18 엘론가제 (rELO2) | 라투스 노르베기쿠스 | 진뱅크 관리 번호 AB071986 | 서열 83, 서열 84 |
C14 /16 엘론가제 ("YE1") | 야로위아 리폴리티카 | -- | 서열 97, 서열 98 |
Δ12 데새투라제 | 야로위아 리폴리티카 | 제WO 2004/104167호 | 서열 28, 서열 29 |
Δ12 데새투라제 | 모르티에렐라 이자벨리나 | 진뱅크 관리 번호 AF417245 | 서열 30, 서열 31 |
Δ12 데새투라제 (Fm d12) | 푸사륨 모닐리포르메 | 제WO 2005/047485호 | 서열 32, 서열 33 |
Δ12 데새투라제 (An d12) | 아스페르길루스 니둘란스 | 아스페르길루스 니둘란스 게놈 프로젝트에서 콘티그 1.15 (스캐폴드 1); AAG36933; 제WO 2005/047485호 | 서열 34, 서열 35 |
Δ12 데새투라제 | 아스페르길루스 플라부스 | 진뱅크 관리 번호 AY280867 (버전 AY280867.1; gi:30721844); 제WO 2005/047485호 | 서열 36 |
Δ12 데새투라제 (Afd12p) | 아스페르길루스 푸미가투스 | 아스페르길루스 푸미가투스 게놈 프로젝트에서 AFA.133c 344248:345586 리버스 (AfA5C5.001c); 제WO 2005/047485호 | 서열 37 |
Δ12 데새투라제 (Mg d12) | 마그나포르테 그리세아 | 마그나포르테 그리세아 게놈 프로젝트에서 콘티그 2.375 중 로커스 MG01985.1; 제WO 2005/047485호 | 서열 38, 서열 39 |
Δ12 데새투라제 (Nc d12) | 뉴로스포라 크라싸 | 진뱅크 관리 번호 AABX01000374; 제WO 2005/047485호 | 서열 40, 서열 41 |
Δ12 데새투라제 (Fg d12) | 푸사륨 그라미네아륨 | 푸사륨 그라미네아륨 게놈 프로젝트에서 콘티그 1.233; 제WO 2005/047485호 | 서열 42, 서열 43 |
Δ12 데새투라제 (Mad12) | 모르티에렐라 알피나 | 진뱅크 관리 번호 AB020033 | 서열 44, 서열 45 |
Δ12 데새투라제 (Skd12) | 사카로마이세스 클루이베리 | 진뱅크 관리 번호 BAD08375 | 서열 46 |
Δ12 데새투라제 (Kld12p) | 클루이베로마이세스 락티스 | "효모 프로젝트 게놀레부레스(Genolevures)"의 클루이베로마이세스 락티스 데이타베이스의 Klla0B:35614..36861 안티센스 (m)으로부터의 gnl│GLV│KLLV0B00473g ORF (프랑스 탈렌스 세덱스 LaBRI 바이오포르마틱스 센터) | 서열 47, 서열 48 |
Δ12 데새투라제 (Cad12p) | 칸디다 알비칸스 | 진뱅크 관리 번호 EAK94955 | 서열 49 |
Δ12 데새투라제 (Dhd12p) | 데바리오마이세스 한세니이 CBS767D | 진뱅크 관리 번호 CAG90237 | 서열 50 |
Δ15 데새투라제 (Fm d15) | 푸사륨 모닐리포르메 | 제WO 2005/047479호 | 서열 51, 서열 52 |
Δ15 데새투라제 (An d15) | 아스페르길루스 니둘란스 | 아스페르길루스 니둘란스 게놈 프로젝트에서 콘티그 1.122 (스캐폴드 9); 제WO 2005/047479호 | 서열 53, 서열 54 |
Δ15 데새투라제 (Mg d15) | 마그나포르테 그리세아 | 마그나포르테 그리세아 게놈 프로젝트에서 콘티그 2.1597 중 로커스 MG08474.1; 제WO 2005/047479호 | 서열 55, 서열 56 |
Δ15 데새투라제 (Nc d15) | 뉴로스포라 크라싸 | 진뱅크 관리 번호 AABX01000577; 제WO 2005/047479호 | 서열 57, 서열 58 |
Δ15 데새투라제 (Fg d15) | 푸사륨 그라미네아륨 | 푸사륨 그라미네아륨 게놈 프로젝트에서 콘티그 1.320; 제WO 2005/047479호 | 서열 59, 서열 60 |
Δ15 데새투라제 (Mad15) | 모르티에렐라 알피나 | 진뱅크 관리 번호 AB182163 | 서열 61, 서열 62 |
Δ15 데새투라제 (Kld15p) | 클루이베로마이세스 락티스 | 진뱅크 관리 번호 XM_451551 | 서열 63, 서열 64 |
Δ15 데새투라제 (Cad15p) | 칸디다 알비칸스 | 진뱅크 관리 번호 EAL03493 | 서열 65 |
Δ15 데새투라제 (Skd15) | 사카로마이세스 클루이베리 | 진뱅크 관리 번호 BAD11952 | 서열 66 |
Δ15 데새투라제 (Dhd15p) | 데바리오마이세스 한세니이 CBS767 | 진뱅크 관리 번호 CAG88182 | 서열 67 |
Δ15 데새투라제 (Afd15p) | 아스페르길루스 푸미가투스 | 진뱅크 관리 번호 EAL85733 | 서열 68 |
* 주의: 아스페르길루스 푸미가투스 게놈 프로젝트는 유니버시티 오브 맨체스터의 공동 연구기관인 생어 인스티튜트(Sanger Institute) 및 더 인스티튜트 오브 게놈 리써치(The Institute of Genome Research (TIGR))에서 후원되고, 아스페르길루스 니둘란스 게놈 프로젝트는 매리랜드주 캠브리지 소재의 센터 포 게놈 리써치(Center for Genome Research (CGR))에서 후원되고, 마그나포르테 그리세아 게놈 프로젝트는 CGR 및 인터내셔널 라이스 블라스트 게놈 협회(International Rice Blast Genome Consortium)에서 후원하고, 푸사륨 그라미네아륨 게놈 프로젝트는 CGR 및 인터내셔녈 지베렐라 제애 게노믹스 협회(International Gibberella zeae Genomics Consortium (IGGR)에 의해 후원되었다. |
본 발명자들은 야로위아 리폴리티카에서 발현될 때 각 효소의 기질 특이성 및/또는 기질 선택성을 측정하거나 확인하기 위해 다양한 엘론가제에 대해 상당한 분석을 수행하였다. 예를 들어, 두 가지 야로위아 리폴리티카 엘론가제의 코딩 서열을 공개적으로 입수하고, 각각의 단백질이 추정적 장쇄 지방-아실 엘론가제로서 해석되거나, 다른 지방산 엘론가제에 대해 유의한 상동성을 공유하였지만, 이들 효소의 기질 특이성은 측정된 적이 없었다. 본원에서 수행한 분석에 기초하여, YE1은 C16 지방산을 생성하는 기질로서 C14 지방산을 우세하게 사용하는 지방산 엘론가제 (즉, C14 /16 엘론가제)인 것으로 긍정적으로 결정되었고, YE2는 C18 지방산을 생성하는 기질로서 C16 지방산을 우세하게 사용하는 지방산 엘론가제 (즉, C16 /18 엘론가제)임이 결정되었다. 이와 관련하여, 신규한 모르티에렐라 알피나 ELO3 유전자를 확인할 때, 다른 지방산 엘론가제에 대한 상동성으로서 서열을 특성화하였다. 그러나, C16 /18 엘론가제로서 ELO3의 특이성을 확인하기 위해서는 지질 프로파일 분석이 필요하였다.
Δ12 데새투라제와 관련하여, 본 발명자들은 놀랍게도 야로위아 리폴리티카에서 18:2를 생성하는데 있어서 푸사륨 모닐리포르메 Δ12 데새투라제 (서열 32에 의해 코딩됨)가 천연 야로위아 리폴리티카 Δ12 데새투라제에 비해 더 높은 효율로 기능한다는 것을 발견하였다 (제WO 2005/047485호 참조). 구체적으로, 야로위아 리폴리티카에서 TEF 프로모터의 조절하에 푸사륨 모닐리포르메 Δ12 데새투라제의 발현은, 이전에 TEF 프로모터의 조절하에 야로위아 리폴리티카 Δ12 데새투라제를 코딩하는 키메라 유전자에 의해 수득되는 것 (LA의 생성물 축적률 59%)보다 18:2를 더 높은 수준 (LA의 생성물 축적률 68%)으로 생성하는 것으로 측정되었다. 이는 ([18:2+18:3]/[18:1+18:2+18:3])×100으로 계산되는 기질 전환율(%)의 차이가 각각 85% 및 74%인 것에 상응한다. 이러한 결과에 기초하여, 본 발명의 진균 푸사륨 모닐리포르메 Δ12 데새투라제의 발현은 야로위아 리폴리티카의 고농도 DHA-생산 균주의 유전자 조작 수단으로서 다른 공지된 Δ12 데새투라제에 비해 바람직하다 (그러나, 당업자는 푸사륨 모닐리포르메 Δ12 데새투라제의 활성이 예를 들어 코돈-최적화에 따라 야로위아 리폴리티카에서 개선될 수 있다고 예측할 것이다).
별법으로, 야로위아 리폴리티카에서 개선된 효율로 기능할 수 있는 새로운 5가지 Δ12 데새투라제가 최근에 확인되었다. 구체적으로, 사카로마이세스 클루이베리 Δ12 데새투라제 (진뱅크 관리 번호 BAD08375)가 문헌 [Watanabe et al., Biosci. Biotech. Biocheml. 68(3):721-727 (2004)]에 기재되었고, 모르티에렐라 알피나로부터의 Δ12 데새투라제 (진뱅크 관리 번호 AB182163)는 문헌 [Sakuradani et al., Eur. J. Biochem. 261 (3):812-820 (1999)]에 기재되었다. 이들 서열 및 상기 기재된 방법을 이용하여, 추가의 3가지 Δ12 데새투라제가 본 발명자들에 의해 확인되었다: 클루이베로마이세스 락티스 gnl│GLV│KLLA0B00473g ORF (서열 48), 칸디다 알비칸스 진뱅크 관리 번호 EAK94955 (서열 49) 및 데바리오마이세스 한세니이 CBS767 진뱅크 관리 번호 CAG90237 (서열 50). 야로위아 리폴리티카에서 이들 추가의 Δ12 데새투라제의 과발현은 LA의 생성을 증가시키는 수단으로서 유용할 수 있으며, 이로써 다른 하류 PUFA (예컨대, DHA)의 생성을 증가시킬 수 있다.
또다른 바람직한 실시양태에서, 푸사륨 모닐리포르메 (서열 51 및 52)는 ALA의 생성을 증가시키는데 바람직한 Δ15 데새투라제인데, 그 이유는 이 특정한 Δ15 데새투라제가 이전에 공지된 Δ15 데새투라제에 비하여 여러가지 독특한 특징을 갖고 있기 때문이다. 첫째, 푸사륨 모닐리포르메 Δ15 데새투라제는 그의 상당한 Δ12 데새투라제 활성 (따라서 이작용성 효소로서 특징지워짐)에 의해 구별된다. 이전의 연구에서, 서열 52을 코딩하는 키메라 유전자로 형질전환된 야로위아 리폴리티카의 Δ12 데새투라제-파괴된 균주가 LA를 ALA로 96% ([18:3]/[18:2+18:3]×100로서 계산된 기질 전환율(%)) 전환시킬 뿐 아니라, 올레산을 LA로 24% (([18:2+18:3]/[18:1+18:2+18:3])×100으로 계산된 기질 전환율(%)) 전환시킬 수 있다는 것이 측정되었다. 둘째로, 푸사륨 모닐리포르메 Δ15 데새투라제는, 다른 이종 발현된 Δ15 데새투라제에 대해 기재된 것에 비해 [예컨대, 비-유질 효모 사카로마이세스 세레비지애에서 캐노르합디티스 엘레강스 Δ15 데새투라제를 발현할 때 ALA의 생성물 축적률(%)이 단지 4.1%인 반면에 (문헌 [Meesapyodsuk et al., Biochem. 39:11948-11954 (2000)]), 사카로마이세스 세레비지애에서 브라시카 나푸스 Δ15 데새투라제를 발현할 때 ALA의 생성물 축적률(%)은 단지 1.3%이었음 (문헌 [Reed., D.W. et al., Plant Physiol. 122:715-720 (2000)])], 야로위아 리폴리티카에서 발현될 때 ALA를 매우 고농도로 합성가능하게 한다 [즉, 서열 52을 코딩하는 키메라 유전자로 형질전환된 야로위아 리폴리티카가 형질전환된 숙주 세포에서의 전체 지방산에 비해 ALA의 생성물 축적률(%)이 31%인 것으로 입증되었으며, 이는 ALA로의 전환 효율 ([18:3]/[18:2+18:3]×100로서 계산)이 83%와 동등함]. 마지막으로, 푸사륨 모닐리포르메 Δ15 효소는 18:2의 하류 ω-6 유도체에 대해 비교적 광범위한 기질 특이성을 갖는다. 구체적으로, Δ15 데새투라제는 GLA에서 STA로의 전환, DGLA에서 ETA로의 전환, 및 ARA에서 EPA로의 전환을 촉매할 수 있다.
바람직한 Δ15 데새투라제로서 푸사륨 모닐리포르메 Δ15 효소가 확인되었으나, 6가지 새로운 Δ15 데새투라제가 야로위아 리폴리티카에서 개선된 효율로 기능할 수 있다는 것이 최근 확인되었다. 구체적으로, 사카로마이세스 클루이베리 Δ15 데새투라제 (진뱅크 관리 번호 BAD11952; Skd15)는 문헌 [Oura et al., Microbiol. 150:1983-1990 (2004)]에 기재되어 있고, 모르티에렐라 알피나 Δ15 데새투라제 (진뱅크 관리 번호 AB182163; Mad15)는 문헌 [Sakuradani et al., Appl. Microbiol. Biotechnol. 66:648-654 (2005)]에 기재되어 있다. 각각 이전에 확인된 사카로마이세스 클루이베리 및 모르티에렐라 알피나 Δ12 데새투라제에 대한 그들의 근접한 상동성에 이은 기능적 활성의 측정에 기초하여 상기 두 서열의 일부가 확인되었기 때문에, 이들 두 쌍의 단백질은 푸사륨 모닐리포르메, 아스페르길루스 니둘란스, 마그나포르테 그리세아, 뉴로스포라 크라싸 및 푸사륨 그라미네아륨과 유사한 밀접한 관련이 있는 진균 Δ12 및 Δ15 데새투라제의 추가의 예로 제공된다 (상기 표 참조). 상기 발견은 진균 Δ12 데새투라제-유사 서열의 "쌍"이 Δ15 데새투라제 활성을 갖는 하나의 단백질 및 Δ12 데새투라제 활성을 갖는 하나의 단백질을 포함한다는 본 발명자들의 이전의 가설을 더욱더 뒷받침한다 (제WO 2005/047480호 및 제WO 2005/047485호 참조). 따라서, Δ12 데새투라제-유사 단백질의 유사한 "쌍"이 클루이베로마이세스 락티스, 칸디다 알비칸스, 데바리오마이세스 한세니이 CBS767 및 아스페르길루스 푸미가투스에서 확인되었고, 예상된 바와 같이, 각 쌍의 한 구성원은 이전에 확인된 사카로마이세스 클루이베리 Δ12 데새투라제 (Skd12)에 대해 더욱 근접하게 정렬하고, 나머지는 Skd15에 더욱 근접하게 정렬하였다 (도 3A). 따라서, 이 분석에 기초하여, 본 발명자들은 야로위아 리폴리티카에서의 과발현이 ω-3 지방산의 생성을 증가시키는데 유용할 수 있는 추정적 진균 Δ15 데새투라제로서 클루이베로마이세스 락티스 진뱅크 관리 번호 XM_451551, 데바리오마이세스 한세니이 CBS767 진뱅크 관리 번호 CAG88182, 칸디다 알비칸스 진뱅크 관리 번호 EAL03493 및 아스페르길루스 푸미가투스 진뱅크 관리 번호 EAL85733을 확인하였다.
추가의 실시양태에서에서, 본 발명자들은 Δ12 데새투라제 활성과 대조적으로 Δ15 데새투라제 활성을 갖는 진균 서열을 쉽게 구별하는 수단을 확인하였다. 구체적으로, Mad12, Skd12, Nc d12, Fm d12, Mg d12, An d12, Fg d12, Dhd12p, Kld12p, Cad12p, Afd12p, Mad15, Skd15, Nc d15, Fm d15, Mg d15, An d15, Fg d15, Dhd15p, Kld15p, Cad15p 및 Afd15p로 이루어진 아미노산 서열 정렬을 분석할 때 (상기 표 참조), 모든 진균 Δ15 또는 Δ12 데새투라제가 Fm d15의 위치 102 (서열 52)에 상응하며 고도로 보존된 His 박스 1 ("HECGH"; 서열 222)로부터 떨어져 있는 단지 3개의 아미노산 잔기인 위치에서 각각 Ile 또는 Val 아미노산 잔기를 함유한다는 것이 명백해졌다 (표 6).
본 발명자들은 상기 위치에 있는 Ile 및 Val이 각각 진균 데새투라제에서 Δ15 및 Δ12 데새투라제 특이성의 결정자인 것으로 결론지었다. 보다 구체적으로, 본 발명자들은 상응하는 잔기(들) (즉, 또는 모티프 IXXHECGH [서열 223])에서 Ile를 갖는 임의의 진균 Δ12 데새투라제-유사 단백질이 Δ15 데새투라제일 것이고, 상응하는 잔기(들) (즉, 또는 모티프 VXXHECGH [서열 224])에서 Val을 갖는 임의의 진균 Δ12 데새투라제-유사 단백질이 Δ12 데새투라제일 것이라고 제안한다. 따라서, 상기 단일 루이신/발린 아미노산은 미래의 진균 데새투라제가 확인되고 해석되는 것으로 고려될 중요한 잔기일 것이다. 또한, 상기 위치에서 Ile에서 Val으로의 변화로 인한 돌연변이가 진균 Δ12 데새투라제-유사 단백질을 코딩하는 유전자 (예컨대, 본원에서 서열 52로 기재된 푸사륨 모닐리포르메 데새투라제)에서, 예를 들어 Δ12 탈포화에 대한 효소 특이성을 변경시키고, 반대로, 상기 위치에서 Val에서 Ile로의 변화로 인한 돌연변이가 예를 들어 Δ15 탈포화에 대한 효소 특이성을 변경시킬 것으로 고려된다.
바람직한 실시양태에서, 다양한 Δ5 데새투라제가 이용될 특정한 경로에 따라 DHA 생성을 위한 숙주 세포에서 발현하는데 가장 이로운 것으로 선택될 수 있다. 구체적으로, ω-6 Δ6 데새투라제/Δ6 엘론가제 경로 또는 ω-6 Δ9 엘론가제/Δ8 데새투라제 경로를 발현할 때, 모르티에렐라 알피나, 이소크리시스 갈바나 및 호모 사피엔스 Δ5 데새투라제가 바람직하다. 반대로, ω-3 Δ6 데새투라제/Δ6 엘론가제 경로 또는 ω-3 Δ9 엘론가제/Δ8 데새투라제 경로를 이용하는 것이 바람직한 경우에는 (이로써 ω-3 PUFA의 합성이 우세함), 예를 들어 피토프테라 메가스페르마(Phytopthera megasperma) 또는 다니오 레리오로부터의 ω-3-우호성 Δ5 데새투라제를 사용하는 것이 유리할 수 있다. 하스팅스(Hastings) 등은 원래 사카로마이세스 세레비지애에서 다니오 레리오 cDNA (진뱅크 관리 번호 AF309556)의 발현이 이작용성 Δ6 및 Δ5 데새투라제 활성 (ω-6 기질에 비해 ω-3 기질에 대해 명확한 우호성을 가지며, Δ5 데새투라제에 비해 Δ6 데새투라제 활성이 약간 더 높음)을 나타낸다고 보고하였다. 그 후, 본 발명자들은 ORF의 위치 984에서 1 bp (T) 결실 (결과적으로 돌연변이 없음) 및 위치 1171에서 1 bp 치환 (G에서 A로) (결과적으로 V에서 M으로 아미노산 변화)에서 차이가 나는, 진뱅크 관리 번호 AF309556의 동족체로서 진뱅크 관리 번호 BC068224를 확인하였다. 그 후, 진뱅크 관리 번호 BC068224의 V1171 M 돌연변이를 제외하고는 진뱅크 관리 번호 AF309556과 동일한 돌연변이체 단백질 (본원에서 "Drd6/d5(M)"로서 확인됨)을 생성하였다. 본 발명자들의 초기 연구에서 사카로마이세스 세레비지애에서 Drd6/d5(M)의 발현이 진뱅크 관리 번호 AF309556에 비해 약 50% 더 낮은 활성을 나타내는 것으로 결정되었지만, ETA를 제조하는 야로위아 균주의 발현은 이작용성 Δ5/Δ6 데새투라제가 훨씬 더 ω-3-특이적이었음을 확인하였다. 따라서, 상기 효소 (본원에서 서열 18으로 확인됨), 또는 유사한 기질 특이성을 갖는 효소가 ω-3 PUFA의 증가된 합성을 위한 ω-3 Δ6 데새투라제/Δ6 엘론가제 경로 또는 ω-3 Δ9 엘론가제/Δ8 데새투라제 경로의 발현시에 바람직하다.
물론, 본 발명의 별법의 실시양태에서, 서열 2, 5, 7, 9, 12, 15, 18, 20, 23, 26, 29, 31, 33, 35-37, 39, 41, 43, 45, 46, 48-50, 52, 54, 56, 58, 60, 62, 64-68, 70, 78, 84, 87, 95, 98, 101 및 105에 의해 코딩되는 데새투라제 및 엘론가제와 실질적으로 동일한 다른 DNA 또한 야로위아 리폴리티카에서 DHA의 생성을 위해 사용될 수 있다. "실질적으로 동일한"은 선택된 폴리펩티드, 또는 상기 아미노산 서열을 코딩하는 핵산 서열에 대해 80%, 90% 또는 95% 이상의 상동성으로 증가한 우호성을 나타내는 아미노산 서열 또는 핵산 서열을 위해 의도된다. 폴리펩티드의 경우, 비교 서열의 길이는 일반적으로 16개 이상의 아미노산, 바람직하게는 20개 이상의 아미노산, 가장 바람직하게는 35개 이상의 아미노산이다. 핵산의 경우, 비교 서열의 길이는 일반적으로 50개 이상의 뉴클레오티드, 바람직하게는 60개 이상의 뉴클레오티드, 더욱 바람직하게는 75개 이상의 뉴클레오티드, 가장 바람직하게는 110개 이상의 뉴클레오티드이다.
전형적으로, 상동성은 서열 분석 소프트웨어를 이용하여 측정되고, 여기서 용어 "서열 분석 소프트웨어"는 뉴클레오티드 또는 아미노산 서열의 분석에 사용되는 임의의 컴퓨터 알고리즘 또는 소프트웨어 프로그램을 나타낸다. "서열 분석 소프트웨어"는 시판되는 것이거나 독자적으로 개발될 수 있다. 전형적인 서열 분석 소프트웨어로는 1) GCG 집합의 프로그램 (위스콘신 팩키지 버전 9.0, 제네틱 컴퓨터 그룹, 미국 위스콘신주 매디슨 소재); 2) BLASTP, BLASTN, BLASTX (문헌 [Altschul et al., J. Mol. Biol. 215:403-410 (1990)]); 3) DNASTAR (디엔에이스타, 인크, 미국 위스콘신주 매디슨 소재); 및 4) 스미스-워터맨 알고리즘이 도입된 FASTA 프로그램 (문헌 [W. R. Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Plenum: New York, NY])이 있으나, 이로 제한되는 것은 아니다. 본원의 문맥상, 서열 분석 소프트웨어를 분석을 위해 이용하는 경우, 달리 명시하지 않는 한 분석 결과는 참조한 프로그램의 "디폴트 값"을 기초로 할 것이라는 것을 이해할 것이다. 본원에 사용된 "디폴트 값"은 처음 초기화시에 소프트웨어에 원래 내장되어 있는 임의의 집합의 값 또는 파라미터를 의미할 것이다. 일반적으로, 이러한 컴퓨터 소프트웨어는 다양한 치환, 결실 및 다른 변형에 대한 상동성 정도를 분배함으로써 유사한 서열을 매칭시킨다.
더욱 바람직한 실시양태에서, 서열 2, 9, 12, 20, 23, 26, 70, 78, 84, 101 및 105에 기재된 것과 실질적으로 동일한 데새투라제 및 엘론가제를 코딩하는 코돈-최적화된 유전자를 사용한다. 구체적으로, 당업자에게 공지된 바와 같이, 천연 유전자의 코돈을 선택된 숙주 미생물에서 최적의 유전자 발현을 위한 코돈으로 대체시켜서 코딩된 mRNA의 번역 효율을 증가시킴으로써 이종 유전자의 발현을 증가시킬 수 있다. 따라서, 외래 숙주에서 발현되는 특정 폴리펩티드를 코딩하는 유전자의 일부분을 변형시켜서, 변형된 폴리펩티드가 다른 숙주에 의해 바람직한 코돈을 사용하도록 하는 것이 종종 유용하며, 숙주 우호성 코돈의 사용은 상기 폴리펩티드를 코딩하는 외래 유전자의 발현을 실질적으로 개선시킬 수 있다.
일반적으로, 숙주 우호성 코돈은 관심을 가진 특정 숙주 종 내에서 단백질에서의 코돈 사용을 측정하고 (바람직하게는 최다량으로 발현된 것), 가장 높은 빈도로 사용된 것을 측정함으로써 결정될 수 있다. 이어서, 관심을 가진 폴리펩티드 (예컨대, 데새투라제, 엘론가제, 아실트랜스퍼라제)의 코딩 서열은 상기 숙주 종에서 바람직한 코돈을 전부 또는 일부 사용하여 합성될 수 있다. 모든 (또는 일부) DNA 또한 전사된 mRNA에서 존재하는 2차 구조체의 임의의 불안정화 서열 또는 영역을 제거함으로써 합성될 수 있다. 그리고, 모든 (또는 일부) DNA 또한 원하는 숙주 세포에서 염기 조성을 더욱 바람직한 것으로 변경시킴으로써 합성될 수 있다.
추가로, 번역 개시 코돈 'ATG' 주변의 뉴클레오티드 서열은 효모 세포의 발현에 영향을 미치는 것으로 확인되었다. 원하는 폴리펩티드가 효모에서 불량하게 발현되는 경우에는, 외생 유전자의 뉴클레오티드 서열이 효율적인 효모 번역 개시 서열을 포함하여 최적의 유전자 발현을 달성하도록 변형될 수 있다. 효모에서의 발현의 경우, 이는 비효율적으로 발현되는 유전자를 프래임 내에서 내인성 효모 유전자, 바람직하게는 고도로 발현되는 유전자에 융합시킴으로써 부위-지정 돌연변이유발에 의해 수행될 수 있다. 별법으로, 야로위아 리폴리티카에 대해 본원에서 입증된 바와 같이, 숙주에서 컨센서스(consensus) 번역 개시 서열을 측정하여, 상기 서열을 관심을 가진 숙주에서의 최적의 발현을 위해 이종 유전자로 유전자 조작할 수 있다.
본 발명에서, 표 5의 여러 데새투라제 및 엘론가제 유전자를 상기 기재된 숙주 우호성을 기준으로 하여 야로위아 리폴리티카에서의 발현을 위해 코돈-최적화하였다. 이는 먼저 야로위아 리폴리티카 코돈 사용 프로파일을 측정하고 (제WO 04/101757호 참조), 바람직한 코돈을 확인함으로써 가능해진다. 이어서, 야로위아 리폴리티카에서의 유전자 발현을 더욱 최적화시키기 위해, 'ATG' 개시 코돈 주변의 컨센서스 서열 (즉, 'MAMMATGNHS' (서열 155), 사용된 핵산 다의성 코드는 M=A/C; S=C/G; H=A/C/T; 및 N=A/C/G/T임)을 측정하였다. 하기 표 7은 야로위아 리폴리티카에서 발현될 때 천연 및 코돈-최적화된 유전자의 활성을 비교하여, 각각의 코돈-최적화된 유전자에 대해 상세하게 제공한다. %Sub. Conv.는 "기질 전환율(%)"의 약어이고 및 코돈-Opt.는 "코돈-최적화된"의 약어이다.
야로위아 리폴리티카에서 DHA 생합성을 위한 가장 바람직한 코돈-최적화된 데새투라제 및 엘론 가제 | |||||
천연 유전자 | 천연 유전자 % Sub . Conv . | 코돈- Opt . 유전자에서 변형된 전체 염기 | 코돈- Opt . 유전자 % Sub . Conv . | 참조문헌 | 코돈- Opt . 서열 번호 |
모르티에렐라 알피나 Δ6 데새투라제 (진뱅크 관리 번호 AF465281) | 30% | 1374 bp의 152 (144 코돈에 상응) | 42% | 제WO 04/101753호 | 서열 3 |
모르티에렐라 알피나 고친화성 C18 /20 엘론가제 (진뱅크 관리 번호 AX464731) | 30% | 957 bp의 94 (85 코돈에 상응) | 47% | 제WO 04/101753호 | 서열 24 |
트라우스토키트륨 아우레움 C18 /20 엘론가제 ("ELO2") | 33% | 817 bp의 114 (108 코돈에 상응) | 46% | -- | 서열 27 |
사프롤레그니아 디클리나 Δ17 데새투라제 (미국 특허 출원 제2003/0196217 A1호) | 23% | 1077 bp의 127 (117 코돈에 상응) | 45% | 동시 계류 중인 미국 특허 출원 제10/840478호 | 서열 19 |
이소크리시스 갈바나 Δ9 엘론가제 | -- | 789 bp의 126 (123 코돈에 상응) | 30% | -- | 서열 71 |
유글레나 그라실리스 Δ8 데새투라제 | -- | 1263 bp의 207 (192 코돈에 상응) | 75% | 동시 계류 중인 미국 특허 출원 제11/166993호 | 서열 81 |
이소크리시스 갈바나 Δ5 데새투라제 | 7% | 1323 bp의 203 (193 코돈에 상응) | 32% | -- | 서열 10 |
호모 사피엔스 Δ5 데새투라제 (진뱅크 관리 번호 NP_037534) | -- | 1335 bp의 227 (207 코돈에 상응) | 30% | -- | 서열 13 |
트라우스토키트륨 아우레움 Δ4 데새투라제 | --- | 1546 bp의 170 (166 코돈에 상응) | 20% | -- | 서열 106 |
오스트레오코쿠스 타우리 C20 /22 엘론가제 | --- | 903 bp의 160 (147 코돈에 상응) | 67% | -- | 서열 102 |
라투스 노르베기쿠스 C16 /18 엘론가제 (진뱅크 관리 번호 AB071986) | -- | 792 bp의 127 (125 코돈에 상응) | 43% | -- | 서열 85 |
본 발명의 추가의 별법의 실시양태에서, 서열 3, 10, 13, 19, 24, 27, 71, 81, 85, 102 및 106에 제시된 바람직한 데새투라제 및 엘론가제와 실질적으로 동일하지 않은 다른 DNA 또한 본 발명의 목적을 위해 사용될 수 있다. 예를 들어, 본 발명에 따라 야로위아 리폴리티카에 도입되기에 유용한 Δ6 데새투라제 폴리펩티드를 코딩하는 DNA 서열은 GLA 또는 STA를 생성하는 능력을 가진 미생물로부터 수득될 수 있다. 이러한 미생물로는 예를 들어 모르티에렐라, 코니디오볼루스(Conidiobolus), 피티움, 피토파토라(Phytophathora), 페니실륨(Penicillium), 포르피리듐, 코이도스포륨(Coidosporium), 무코르(Mucor), 푸사륨, 아스페르길루스, 로도토룰라 및 엔토모프토라(Entomophthora) 속에 속하는 것들이 있다. 포르피리듐 속 중에서, 특히 포르피리듐 크루엔툼(P. cruentum)이 관심의 대상이다. 모르티에렐라 속 중에서, 특히 모르티에렐라 엑스텐시아(M. extensia), 모르티에렐라 엑시구아, 모르티에렐라 히그로필라, 모르티에렐라 라만니아나 바르. 안굴리스포라(M. ramanniana var. angulispora) 및 모르티에렐라 알피나가 관심의 대상이다. 무코르 속 중에서, 무코르 시르시넬로이데스(M. circinelloides) 및 무코르 자바니쿠스(M. javanicus)가 관심의 대상이다.
별법으로, 모르티에렐라 알피나 Δ6 데새투라제와 살질적으로 동일하지만, 예를 들어 분자의 카르복실 말단으로부터 6번째 탄소에서 지방산 분자가 탈포화될 수 있는 관련 데새투라제 또한 본 발명에서 Δ6 데새투라제로서 유용할 수 있으며, 상기 데새투라제는 여전히 효과적으로 LA를 GLA로 및/또는 ALA를 STA로 전환시킬 것으로 추정된다. 따라서, 관련 데새투라제 및 엘론가제는 본원에 개시된 데새투라제 및 엘론가제와 실질적으로 동일하게 기능할 수 있는 그들의 능력에 의해 확인될 (또는 생성될) 수 있다.
상기 제안된 바와 같이, 또다른 실시양태에서 당업자는 본원의 목적에 적합한, 예를 들어 Δ12 데새투라제 및 Δ6 데새투라제 활성 둘다를 갖는 융합 단백질을 생성할 수 있다. 이는 연결 링커를 이용하여 Δ12 데새투라제와 Δ6 데새투라제를 융합시킴으로써 가능해질 것이다. Δ12 데새투라제 또는 Δ6 데새투라제는 융합 단백질의 N-말단 부분에 있을 수 있다. 적절한 링커 분자를 고안하고 합성하는 수단은 당업자에게 용이하게 공지되어 있으며, 예를 들어 상기 링커는 알라닌 또는 리신 아미노산의 신장체일 수 있고, 융합 효소의 활성에는 영향을 미치지 않을 것이다.
마지막으로, 서열을 합성하고 서열을 함께 가져오는 방법이 문헌에 확립되어 있음은 당업계에 널리 공지되어 있다. 따라서, 천연 발생 데새투라제 및/또는 엘론가제 유전자의 돌연변이를 달성하기 위해, 시험관내 돌연변이유발 및 선별, 부위-지정 돌연변이유발, 화학적 돌연변이유발, "유전자 뒤섞기(shuffling)" 방법 또는 다른 수단을 이용할 수 있다. 이는 숙주 세포에서 기능하기에 더욱 바람직한 물리적 및 동력학적 파라미터 (예컨대, 긴 반감기 또는 원하는 PUFA의 높은 생성률)를 가지며 생체내에서 데새투라제 또는 엘론가제 활성을 갖는 폴리펩티드의 생성을 허용할 것이다.
요약하면, 야로위아 리폴리티카에서 DHA 생성에 적합한 PUFA 생합성 경로 효소를 코딩하는 바람직한 데새투라제 및 엘론가제 유전자의 서열이 제시되지만, 이들 유전자는 본 발명을 제한하려는 의도는 아니다. 본 발명의 목적에 적합한 PUFA 생합성 경로 효소를 코딩하는 수많은 다른 유전자를 다양한 공급원 (예컨대, 적절한 데새투라제 또는 엘론가제 활성을 갖는, 야생형의 코돈-최적화된 합성 및/또는 돌연변이체 효소)으로부터 단리할 수 있다. 이들 별법의 데새투라제는 하기의 능력을 특징으로 한다: 1) 분자의 카르복실-말단에서부터 세었을 때 17번째 및 18번째 탄소 원자 사이의 지방산의 탈포화, 및 ARA에서 EPA로 및/또는 DGLA에서 ETA로의 전환을 촉매 (Δ17 데새투라제); 2) LA에서 GLA로 및/또는 ALA에서 STA로의 전환을 촉매 (Δ6 데새투라제); 3) DGLA에서 ARA로 및/또는 ETA에서 EPA로의 전환을 촉매 (Δ5 데새투라제); 4) 올레산에서 LA로의 전환을 촉매 (Δ12 데새투라제); 5) LA에서 ALA로의 전환을 촉매 (Δ15 데새투라제); 6) EDA에서 DGLA로 및/또는 ETrA에서 ETA로의 전환을 촉매 (Δ8 데새투라제); 7) DPA에서 DHA로의 전환을 촉매 (Δ4 데새투라제); 및/또는 8) 팔미테이트에서 팔미트올레산로 및/또는 스테아레이트에서 올레산으로의 전환을 촉매 (Δ9 데새투라제). 유사한 방식으로, 본원의 목적에 적합한 엘론가제는 특정한 공급원으로부터의 것으로 제한되지 않고, 대신에, 본원의 목적에 사용되는 효소는 엘론가제가 작용하는 기질에 비해 2개의 탄소만큼 지방산 탄소 쇄를 신장시켜서, 모노- 또는 다불포화 지방산을 생성하는 능력을 특징으로 한다. 보다 구체적으로, 이들 엘론가제는 하기 능력을 특징으로 한다: 1) LA에서 EDA로 및/또는 ALA에서 ETrA로의 신장 (Δ9 엘론가제); 2) C18 기질을 신장시켜 C20 생성물을 생성 (C18 /20 엘론가제); 3) C14 기질을 신장시켜 C16 생성물을 생성 (C14/16 엘론가제); 4) C16 기질을 신장시켜 C18 생성물을 생성 (C16 /18 엘론가제); 및/또는 5) C20 기질을 신장시켜 C22 생성물을 생성 (C20 /22 엘론가제). 또한, 일부 엘론가제는 광범위한 기질 특이성의 결과 여러 엘론가제 반응을 촉매할 수 있다는 것을 주목하는 것이 중요하다.
아실트랜스퍼라제
및
TAG
생합성의 최종 단계에서 이들의 역할
아실트랜스퍼라제는 TAG의 생합성과 밀접한 관계가 있다. 문헌 [D. Sorger and G. Daum, Appl. Microbiol. Biotechnol. 61:289-299 (2003)] 및 [H. Muellner and G. Daum, Acta Biochimica Polonica, 51 (2):323-347 (2004)]에서는 TAG 합성과 관련된 유전자 및 그를 유도하는 대사 중간체에 대한 상세한 설명을 비롯하여, 효모에서의 TAG 생합성에 대해 포괄적으로 간단히 고찰되었다. 상기 문헌의 저자들은 상이한 부류의 진핵세포 아실트랜스퍼라제 유전자 족에 대해 요약하였지만, 이들은 또한 지질 입자에서 TAG 생합성 및 천연 지질 형성의 조절적 측면이 명확하지 않음을 확인하였다.
중성 지질 합성을 유도하는 아실-CoA-의존성 또는 독립성 에스테르화 반응과 관련된 네 가지 진핵세포 아실트랜스퍼라제 유전자 족이 확인되었다:
(1) 아실-CoA:콜레스테롤 아실트랜스퍼라제 (ACAT) 족, EC 2.3.1.26 (일반적으로 스테롤 아실트랜스퍼라제로 공지됨). 이 족의 유전자는 아실-CoA 및 스테롤을 CoA 및 스테롤 에스테르로 전환시키는 것을 담당하는 효소를 포함한다. 이 족은 또한 TAG 생합성의 최종 단계와 관련된 DGAT1을 포함한다.
(2) 레시틴:콜레스테롤 아실트랜스퍼라제 (LCAT) 족, EC 2.3.1.43. 이 족의 유전자는 포스파티딜콜린 및 스테롤을 스테롤 에스테르 및 1-아실글리세로포스포콜린으로 전환시키는 것을 담당한다. 이 족은 또한 인지질의 sn-2 위치의 아실기를 1,2-디아실글리세롤의 sn-3 위치로 전달하여 TAG를 생합성하는 것과 관련된 인지질:디아실글리세롤 아실트랜스퍼라제 (PDAT) 효소를 포함한다.
(3) 디아실글리세롤 아실트랜스퍼라제 (DAG AT) 족, EC 2.3.1.20. 이 족의 유전자 (DGAT2 포함)는 TAG 생합성의 최종 단계와 관련이 있다.
(4) 글리세롤-3-포스페이트 아실트랜스퍼라제 및 아실-CoA 리소포스파티드산 아실트랜스퍼라제 (GPAT/LPAAT) 족. GPAT (E.C. 2.3.1.15) 단백질은 TAG 생합성의 첫번째 단계를 담당하는 반면, LPAAT (E.C. 2.3.1.51) 효소는 TAG 생합성의 두번째 단계와 관련이 있다. 이 족은 또한 인지질과 CoA 사이에서의 아실 교환을 촉매하는 리소포스파티딜콜린 아실트랜스퍼라제 (LPCAT)를 포함한다.
또한, 이들 네 가지 아실트랜스퍼라제 유전자 족은 중성 지질 형성을 위한 중복 생합성 시스템을 나타내고, 상이한 조절, 대안적인 국부화, 및 상이한 기질 특이성의 결과인 것으로 여겨진다 (상기 문헌 [H. Muellner and G. Daum]). 이들 네 가지 각 유전자 족은 야로위아 리폴리티카에서 5% 초과의 DHA를 합성하도록 하는 대사성 유전자 조작과 관련하여 중요하게 본원에서 논의될 것이다.
각종
아실트랜스퍼라제의
기능성
야로위아 리폴리티카에 존재하는 이러한 많은 아실트랜스퍼라제들 사이의 상호작용은 도 4에 개략적으로 도시하였다. TAG 생합성의 직접적인 메카니즘에 우선 초점을 맞추면, 이 과정의 제1 단계는 아실-CoA 1개 분자를 GPAT를 통해 sn-글리세롤-3-포스페이트로 에스테르화하여 리소포스파티드산 (LPA) (및 부산물로서의 CoA)를 생성하는 것이다. 이어서, 리소포스파티드산은 아실-CoA의 또다른 분자의 에스테르화에 의해 포스파티드산 (PA) (및 부산물로서의 CoA)으로 전환되며, 이 반응은 LPAAT에 의해 촉매된다. 이어서, 포스파티드산 포스파타제가 포스파티드산에서 포스페이트기를 제거하여 1,2-디아실글리세롤 (DAG)을 생성한다. 그 후, DAG AT (예컨대, DGAT1, DGAT2 또는 PDAT)에 의해서 DAG의 sn-3 위치에 세번째 지방산이 부가되어 TAG가 형성된다.
과거, DGAT1은 TAG 합성에 특이적으로 관여하여 아실-CoA기를 DAG로 전달하여 TAG를 형성함으로써 아실-CoA와 DAG를 TAG와 CoA로 전환시키는 반응을 촉매하는 효소에 불과하다고 여겨졌다. DGAT1은 ACAT에 상동성인 것으로 알려져 있었으나, 최근의 연구를 통해, ACAT 유전자 족과는 관련이 없는 새로운 족의 DAG AT 효소가 밝혀졌다. 따라서, 이제는 명칭을 달리하여 ACAT 유전자 족과 관련이 있는 DAG AT 효소 (DGAT1 족) 및 관련이 없는 DAG AT 효소 (DGAT2 족)을 구별한다 [Lardizabal et al., J. Biol. Chem. 276(42):38862-38869 (2001)]. DGAT2 족의 구성원은 진핵생물의 모든 주요 종 (진균, 식물, 동물 및 원시(basal) 진핵생물)에서 확인된 바 있다.
훨씬 더 최근에, 문헌 [Dahlqvist et al. (Proc. Nat. Acad. Sci. (USA) 97:6487-6492 (2000)] 및 문헌 [Oelkers et al. (J. Biol. Chem. 275:15609-15612 (2000)]은 TAG 합성이 아실-CoA가 없어도 아실-CoA와 무관한 메카니즘을 통해 일어날 수 있음을 발견하였다. 구체적으로, PDAT가 포스파티딜콜린 기질의 sn-2 위치에서 아실기를 제거하여 DAG로 전달함으로써 TAG가 생성된다. 이 효소는 LCAT 족과 구조적으로 관련이 있고, PDAT의 기능이 DGAT2만큼 잘 특징규명되지는 않았지만 PDAT는 일부 오일종자 식물에서 인지질로부터 "독특한(unusual)" 지방산을 제거하는데 중요한 역할을 할 것이라고 추측되어 왔다 [Banas, A. et al., Biochem. Soc. Trans. 28(6):703-705 (2000)].
사카로마이세스 세레비지애에서의 TAG 합성과 관련하여, 3가지 경로가 기재된 바 있다 [Sandager, L. et al., J. Biol. Chem. 277(8):6478-6482 (2002)). 첫째, TAG는 DAG 및 아실-CoA로부터 DGAT2 (DGA1 유전자에 의해 코딩됨)의 활성에 의해 주로 합성된다. 그러나 보다 최근에는, PDAT (LRO1 유전자에 의해 코딩됨) 또한 확인된 바 있다. 최종적으로, 2종의 아실-CoA:스테롤-아실트랜스퍼라제 (ARE1 유전자 및 ARE2 유전자에 의해 코딩됨)는 아실-CoA 및 스테롤을 이용하여 스테롤 에스테르 (및 소량의 TAG, 문헌 [Sandager et al., Biochem. Soc. Trans. 28(6):700-702 (2000)] 참조)를 생성한다고 알려져 있다. PDAT와 DGAT2는 함께 사카로마이세스 세레비지애 중 오일 생합성의 대략 95%를 담당한다.
DGAT1, DGAT2, PDAT 및 ARE2를 코딩하는 여러가지 공개적으로 입수가능한 서열 (하기 참조)을 기초로, 본 발명자들은 야로위아 리폴리티카에서 DGAT1 (서열 122), DGAT2 (서열 130, 132 및 134 [여기서, 서열 130는 서열 132 및 서열 134에서 제공되는 것과 같은 2종 이상의 추가의 네스티드 ORF를 함유함. 서열 134에 의해 코딩되는 ORF는 다른 공지된 DGAT 효소와 높은 정도의 유사성을 보유하며 서열 134에서의 파괴는 천연 유전자의 DGAT 기능을 소실시키기 때문에, 서열 135의 폴리펩티드가 DGAT 기능성을 보유함이 확인됨]), PDAT (서열 117) 및 ARE2 (서열 119)를 코딩하는 유전자들을 단리하고 특징규명하였다. 그러나, 사카로마이세스 세레비지애에서 개발된 모델 (여기서는 PDAT와 DGAT2가 오일 생합성의 대략 95%를 담당함)과는 달리, 야로위아 리폴리티카의 PDAT, DGAT2 및 DGAT1은 오일 생합성을 최대 약 95% 이하로 담당 (ARE2가 오일 생합성에 추가로 약간 기여할 수도 있음)하는 것으로 발견되었다.
야로위아 리폴리티카의 TAG 분획에서 DHA를 축적하는데 중요한 기능을 할 수 있는 최종 아실트랜스퍼라제 효소는 LPCAT이다. 도 4에 나타난 바와 같이, 이 효소 (EC 2.3.1.23)는 sn-포스파티딜콜린의 sn-2 위치에서의 2원 아실 교환을 담당하여 ω-6 및 ω-3 PUFA 생합성을 증진시킨다는 가설이 있다. 이 가설은 하기 사람들의 연구를 기초로 한다: (1) 스팀느 에스.(Stymne S.) 및 에이.케이.스토바르트(A.K. Stobart) [Biochem J. 223(2):305-14(1984)]: 이들은 LPCAT가 아실-CoA 풀과 포스파티딜콜린 (PC) 풀 사이의 교환에 영향을 미칠 것이라는 가설을 세웠음; (2) 도메르구, 에프.(Domergue, F.) 등 [J. Bio. Chem 278:35115 (2003)]: 이들은 효모에서 PC의 sn-2 위치에 GLA가 축적되고 ARA가 효율적으로 합성될 수 없는 것은 아실-CoA 풀에서 일어나는 PUFA 생합성에 신장 단계가 포함되어 있으나 Δ5 및 Δ6 탈포화 단계는 PC의 sn-2 위치에서 우세하게 일어나기 때문이라고 제안하였음; (3) 아바디, 에이.(Abbadi, A.) 등 [The Plant Cell, 16:2734-2748 (2004)]: 이들은 트랜스제닉 오일종자 식물에서의 PUFA 축적 제약에 관한 분석을 기초로 하여, LPCAT가 Δ6 데새투라제/Δ6 엘론가제 경로의 성공적인 재구성에 중대한 역할을 한다고 제안하였음; (4) 제WO 2004/076617 A2호 (렌쯔, 에이.(Renz, A.) 등): 이들은 사카로마이세스 세레비지애에서 유전자 도입된 Δ6 데새투라제/Δ6 엘론가제 경로의 신장 효율을 실질적으로 개선시키는, 캐노르합디티스 엘레강스로부터의 LPCAT를 코딩하는 유전자 (T06E8.1)를 제공하였음. 데새투라제는 지질-커플링된 지방산 (sn-2 아실 PC)에서 이중 결합의 도입을 촉매하지만 엘론가제는 오로지 CoA 에스테르화된 지방산 (아실-CoA)의 신장만을 촉매하기 때문에, 본 발명자들은 LPCAT가 인지질과 아실-CoA 풀 사이에서 새로 합성된 지방산이 효율적이고 지속적으로 교환될 수 있게 한다고 결론을 내렸다.
DHA
합성을 위한 이종
아실트랜스퍼라제
유전자의 선별
야로위아 리폴리티카에서 천연적으로 생산된 PUFA는 18:2 지방산 (및 덜 통상적으로는, 18:3 지방산)으로 한정되기 때문에, GPAT, LPAAT (즉, LPAAT1 또는 LPAAT2), DGAT1, DGAT2, PDAT 및 LPCAT를 코딩하는 숙주 유기체의 천연 유전자는 18:3 이상의 길이를 갖는 지방산을 포함하는 TAG (예컨대, DHA)를 효율적으로 합성하는데 어려움이 있을 수 있다. 따라서, 일부 경우에서는 이종 (또는 "외래") 아실트랜스퍼라제가 천연 효소보다 바람직할 수 있다.
수많은 아실트랜스퍼라제 유전자가 여러 유기체에서 확인되었고, 간행물 및 특허 문헌에 기술되어 있다. 예를 들어, 하기하는 진뱅크 관리 번호는 지질 생합성에 유용한 공개적으로 입수가능한 아실트랜스퍼라제 유전자의 예이다: CQ891256, AY441057, AY360170, AY318749, AY093169, AJ422054, AJ311354, AF251795, Y00771, M77003 (GPAT); Q93841, Q22267, Q99943, 015120, Q9NRZ7, Q9NRZ5, Q9NUQ2, O35083, Q9D1E8, Q924S1, Q59188, Q42670, P26647, P44848, Q9ZJN8, O25903 Q42868, Q42870, P26974, P33333, Q9XFW4, CQ891252, CQ891250, CQ891260, CQ891258, CQ891248, CQ891245, CQ891241, CQ891238, CQ891254, CQ891235 (LPAAT); AY445635, BC003717, NM_010046, NM_053437, NM_174693, AY116586, AY327327, AY327326, AF298815 및 AF164434 (DGAT1); 및 NC_001147 [유전자좌 NP_014888], NM_012079, NMJ 27503, AF051849, AJ238008, NM_026384, NM_010046, AB057816, AY093657, AB062762, AF221132, AF391089, AF391090, AF129003, AF251794 및 AF164434 (DGAT2); P40345, O94680, NP_596330, NP_190069 및 AB006704 [gi:2351069] (PDAT). 유사하게, 특허 문헌은 TAG 생성에 관여하는 유전자의 많은 추가 DNA 서열 (및/또는 상기 여러 유전자 및 이들의 단리 방법에 관한 상세 사항)을 제공한다 [예를 들어, 미국 특허 제5,210,189호, 제WO 2003/025165호 (GPAT), 유럽 특허 제1144649 A2호, 유럽 특허 제1131438호, 미국 특허 제5,968,791호, 미국 특허 제6,093,568호, 제WO 2000/049156호 및 제WO 2004/087902호 (LPAAT), 미국 특허 제6,100,077호, 미국 특허 제6,552,250호, 미국 특허 제6,344,548호, 미국 특허 출원 제2004/0088759 A1호 및 미국 특허 출원 제20040078836 A1호 (DGAT1), 미국 특허 출원 제2003/124126호, 제WO 2001/034814호, 미국 특허 출원 제2003/115632호, 미국 특허 출원 제2003/0028923호 및 미국 특허 출원 제2004/0107459호 (DGAT2), 제WO 2000/060095호 (PDAT) 및 제WO 2004/076617 A2호 (LPCAT)].
상기 예는 제한하고자 하는 것이 아니며, 다른 공급원으로부터 유래된 DGAT1, DGAT2, PDAT, GPAT, LPCAT 및 LPAAT를 코딩하는 수많은 다른 유전자가 야로위아 리폴리티카로의 도입에 적합하다. 예를 들어, 본 발명자들은 모르티에렐라 알피나 (서열 124 및 125), 뉴로스포라 크라싸 (서열 126), 지베렐라 제애 PH-1 (서열 127), 마그나포르테 그리세아 (서열 128) 및 아스페르길루스 니둘란스 (서열 129)로부터 신규 DGAT1을 확인하였고, 모르티에렐라 알피나로부터 신규 DGAT2 (서열 136 및 137), GPAT (서열 138 및 139), LPAAT1 (서열 108 및 109) 및 LPAAT2 (서열 110 및 111)를 확인하였다.
DHA
합성에 바람직한
아실트랜스퍼라제
유전자
야로위아 리폴리티카에서의 발현에 적합할 수 있는 아실트랜스퍼라제는 광범위하게 선택될 수 있지만, 본 발명의 바람직한 실시양태에서는 유의한 양의 더욱 장쇄의 ω-6 (예컨대, ARA) 및/또는 ω-3 (예컨대, EPA, DHA) PUFA를 생산하는 유기체로부터의 DGAT1, DGAT2, PDAT, GPAT, LPAAT 및 LPCAT가 선택된다. 따라서, 하기 효소 (또는 그의 유도체)가 특히 바람직하다:
DHA 를 고도로 생성하는 야로위아 리폴리티카 균주에서의 발현에 바람직한 이종 아실트랜스퍼라제 | |||
ORF | 유기체 | 참조문헌 | 서열번호 |
DGAT1 | 모르티에렐라 알피나 | 동시 계류 중인 미국 특허 출원 제11/024544호 | 서열 124, 서열 125 |
DGAT2 | 모르티에렐라 알피나 | 동시 계류 중인 미국 특허 출원 제11/024545호 | 서열 136, 서열 137 |
GPAT | 모르티에렐라 알피나 | - | 서열 138, 서열 139 |
LPAAT1 | 모르티에렐라 알피나 | - | 서열 108, 서열 109 |
LPAAT2 | 모르티에렐라 알피나 | 동시 계류 중인 미국 특허 출원 제60/689031호 | 서열 110, 서열 111 |
LPCAT | 캐노르합디티스 엘레강스 | 클론 T06E8.1, 제WO 2004/076617 A2호 | 서열 121 |
본원에 개시한 본 발명을 한정하려는 것은 아니었지만, 모르티에렐라 알피나는 이종 아실트랜스퍼라제의 바람직한 공급원으로서 선택되었는데, 이는 상기 천연 유기체가 ARA를 전체 지방산 (TFA)의 50% 초과의 농도로 생산할 수 있기 때문이다. 유사한 방식으로, 캐노르합디티스 엘레강스는 TFA의 최대 20 내지 30%를 EPA로 생산할 수 있다.
물론, 본 발명의 별법의 실시양태에서, 서열 108 내지 111, 121, 124, 125 및 136 내지 139에 의해 코딩되는 아실트랜스퍼라제와 실질적으로 동일한 다른 DNA 역시 야로위아 리폴리티카에서의 이종 발현에 사용되어 TAG 분획 중 EPA의 생성 및 축적을 용이하게 할 수 있다. 더욱 바람직한 실시양태에서, 서열 108 내지 111, 121, 124, 125 및 136 내지 139에 기재된 서열과 실질적으로 동일한 아실트랜스퍼라제를 코딩하는 코돈-최적화된 유전자가 사용된다.
외래 유전자의 발현을 위한 일반적인 발현 시스템, 카세트, 벡터 및 형질전환
외래 단백질의 고수준 발현을 지시하는 조절 서열, 예컨대 DHA의 고수준 생성을 유도하는 조절 서열을 함유하는 발현 벡터 및 미생물 발현 시스템은 당업자에게 공지되어 있다. 이들 중 임의의 것을 사용하여 바람직한 데새투라제, 엘론가제 및 아실트랜스퍼라제를 코딩하는 키메라 유전자를 구축할 수 있다. 이어서, 코딩된 효소의 고수준 발현을 제공하는 표준 형질전환 방법을 이용하여 이들 키메라 유전자를 야로위아 리폴리티카에 도입할 수 있다.
숙주 세포의 형질전환에 유용한 벡터 또는 DNA 카세트는 당업계에 공지되어 있다. 상기 구축물에 존재하는 서열들을 구체적으로 선택하는 것은, 원하는 발현 생성물, 숙주 세포의 특성, 및 형질전환된 세포와 형질전환되지 않은 세포를 분리하기 위해 제안된 수단에 따라 달라진다. 그러나 전형적으로, 상기 벡터 또는 카세트는 관련 유전자(들)의 전사 및 번역을 지시하는 서열, 선별가능한 마커 및 자율 복제 또는 염색체 통합을 허용하는 서열을 함유한다. 적합한 벡터는 전사 개시를 조절하는 유전자 (예컨대, 프로모터)인 영역 5' 및 전사 종결을 조절하는 DNA 단편 (즉, 종결자)인 영역 3'를 포함한다. 두가지 조절 영역 모두가 형질전환된 숙주 세포로부터의 유전자로부터 유래된 경우가 가장 바람직하지만, 이러한 조절 영역이 생성 숙주로서 선택된 특정 종에 천연인 유전자로부터 유래되어야 하는 것은 아님을 이해해야 한다.
2종 이상의 유전자가 별도의 복제 벡터로부터 발현되는 경우, 각 벡터는 상이한 선별 수단을 갖는 것이 바람직하며, 안정적인 발현을 유지하고 구축물 중 요소들의 재배열을 방지하기 위해서 다른 구축물과의 상동성이 없어야 한다. 조절 영역의 현명한 선택, 선별 수단 및 도입된 구축물의 증식 방법을 실험적으로 결정하여, 도입된 모든 유전자가 원하는 생성물의 합성을 위해 제공되기에 필요한 수준으로 발현되도록 할 수 있다.
관심 유전자(들)을 포함하는 구축물은 임의의 표준 기술을 이용하여 숙주 세포에 도입할 수 있다. 이들 기술로는 형질전환법 (예컨대, 리튬 아세테이트 형질전환 [Methods in Enzymology, 194:186-187 (1991)]), 원형질체 융합법, 볼리스트 충격(bolistic impact), 전기천공법, 미세주입법, 또는 관심 유전자(들)을 숙주 세포에 도입하는 임의의 다른 방법 등이 있다. 야로위아 리폴리티카에 적용할 수 있는 더욱 구체적인 교시 문헌으로는, 미국 특허 제4,880,741호 및 동 제5,071,764호 및 문헌 [Chen, D. C. et al. (Appl Microbiol Biotechnol. 48(2):232-235 (1997))] 등이 있다.
편의상, 본원에서는 임의의 방법으로 조작되어 DNA 서열 (예컨대, 발현 카세트)이 도입된 숙주 세포를 "형질전환" 또는 "재조합"된 것이라고 지칭할 것이다. 형질전환된 숙주는 발현 구축물의 카피를 1개 이상 보유할 것이며, 유전자가 게놈에 통합되었는지, 증폭되었는지 또는 다중 카피수를 갖는 염색체외 요소에 존재하는지 여부에 따라 2개 또는 그 이상일 수 있다. 형질전환된 숙주 세포는 제WO 2004/101757호 및 제WO 2005/003310호에 기재된 것과 같은 다양한 선별 기술로 확인할 수 있다.
본원에서 사용하기에 바람직한 선별 방법은 카나마이신, 하이그로마이신 및 아미노 글리코시드 G418에 대한 내성, 및 또한 우라실, 루이신 또는 히스티딘이 없는 배지에서의 성장 능력이다. 별법의 실시양태에서, 5-플루오로오로트산 (5-플루오로우라실-6-카르복실산 1수화물, "5-FOA")이 효모 Ura- 돌연변이체의 선별에 사용된다. 상기 화합물은 오로티딘 5'-모노포스페이트 데카르복실라제 (OMP 데카르복실라제)를 코딩하는 기능적 URA3 유전자를 보유하는 효모 세포에 독성이고, 따라서, 이러한 독성을 기초로, 5-FOA는 Ura- 돌연변이체 효모 균주의 선별 및 확인에 특히 유용하다 [Bartel, P. L. and Fields, S., Yeast 2-Hybrid System, Oxford University: New York, v. 7, pp 109-147, 1997].
본원에서 이용되는 별법의 바람직한 선별 방법은 술포닐우레아 내성을 기초로 하는, 야로위아 리폴리티카에 대한 우성의 비-항생제 마커에 의존한다. 상기 기술은 또한 일반적으로 반수체, 이배체, 이수체(異數體) 또는 이형접합체일 수 있는 다른 산업상의 효모 균주에도 적용될 수 있다. 산업상의 효모 균주를 위한 유전적 형질전환 시스템의 개발에 있어서 (1) 천연적으로 영양요구성인 균주가 거의 없고, 자발적이거나 유도된 영양요구성 돌연변이체의 단리가 균주의 배수성으로 인해 곤란하며, (2) 항생제 내성 유전자를 보유하는 유전자 변형된 유기체의 방출에 대한 제약으로 인해서 항생제 내성 마커의 사용이 균주의 상업적 이용을 제한할 수 있다는 2가지 주요 한계를 극복할 것이라 예측된다. 푸이그(Puig) 등 [J. Agric. Food Chem. 46:1689-1693 (1998)]은 표적 균주를 유전자 조작하여 유리딘에 대한 영양요구성으로 만들고 이후에는 URA3 마커를 사용하여 관심 형질을 도입하는 것을 기초로 하여 이러한 한계를 극복하는 방법을 개발하였지만, 상기 전략은 불필요한 작업이 요구되어 지나치게 소모적이다.
본원에 개시된, 야로위아 리폴리티카를 형질전환시키기 위한 신규한 술포닐우레아 내성 선별 마커는 외래 유전자가 아닌 돌연변이체 천연 유전자에 의존한다. 따라서, 따라서, 영양요구성일 필요도 없으며 영양요구성을 초래하지도 않고 야생형 균주의 형질전환을 초래하지도 않는다. 보다 구체적으로, 마커 유전자 (서열 243)는 술포닐 우레아 제초제 내성을 부여하는 단일 아미노산 변화 (W497L)를 갖는 천연 아세토히드록시산 신타제 (AHAS 또는 아세토락테이트 신타제, E.C. 4.1.3.18)이다. AHAS는 분지쇄 아미노산의 생합성 경로에서 공통적인 첫번째 효소이며, 술포닐우레아 및 이미다졸리논 제초제의 표적이다. W497L 돌연변이는 사카로마이세스 세레비지애에서의 작업에 근거하여 공지되어 있다 ([Falco, S. C, et al., Dev. Ind. Microbiol. 30:187-194 (1989)], [Duggleby, R.G., et. al. Eur. J. Biochem. 270:2895 (2003)]). 다음과 같은 결과를 나타낸 초기 시험을 통해, 야로위아 세포가 제초제에 천연적으로 내성이 있지는 않음이 결정되었다: 1) 제초제 흡수가 불량하거나 흡수하지 않음, 2) AHAS의 천연적인 제초제-내성 형태가 존재함, 및/또는 3) 제초제-불활성화 메카니즘을 이용함. 이로써, 형질전환체의 선별 수단으로서 돌연변이체 AHAS 유전자 (서열 243)의 합성 및 사용이 가능해졌다.
선별 마커를 재사용하는 추가의 방법은 부위-특이적 레콤비나제 시스템에 의존한다. 간략하게 설명하면, 상기 부위-특이적 재조합 시스템은 (1) 특징적인 DNA 서열 [예컨대 LoxP]을 갖는 재조합 부위, 및 (2) 2개 이상의 재조합 부위가 동일 DNA 분자상에서 소정의 간격을 두고 동일 방향으로 배향되어 있는 경우에 DNA 서열에 특이적으로 결합하여 DNA 서열들 사이의 재조합 (즉, 제거)을 촉매하는 레콤비나제 효소 [예컨대 Cre]의 2가지 요소로 구성된다. 바람직한 선별 마커 쌍이 여러 회의 순차적인 형질전환에 사용되도록 이것을 "재순환"시키는 것이 가능하기 때문에, 이 방법은 선별 수단으로서 유용성이 있다.
구체적으로, 숙주 게놈에 삽입되는 것이 바람직한 표적 유전자 (예컨대, 데새투라제, 엘론가제, 아실트랜스퍼라제), 및 또한 재조합 부위들로 측접(flnaking)되어 있는 제1 선별 마커 (예컨대, Ura3, 하이그로마이신 포스포트랜스퍼라제 [HPT])를 포함하는 통합 구축물을 제조한다. 형질전환 및 형질전환체의 선별 후, 제2 선별 마커 (예컨대, 술포닐우레아 내성 [AHAS]) 및 게놈에 도입된 부위-특이적 재조합 부위를 인식하는데 적합한 레콤비나제를 보유하는 복제 플라스미드를 도입함으로써 제1 선별 마커를 염색체로부터 제거해 낸다. 제2 마커를 보유하는 형질전환체의 선별 및 숙주 게놈으로부터의 제1 선별 마커 제거를 확인한 후, 상기 복제 플라스미드는 숙주에 의해 구별없이 관리(cure)된다. 이로써 제1 선별 마커와 제2 선별 마커 어느 것도 보유하지 않는 형질전환체가 생성되며, 따라서 상기 관리된 균주는 또다른 회의 형질전환에 이용될 수 있다. 당업자는 상기 방법이 본 발명에서 사용되는 특정 선별 마커 또는 특정 부위-특이적 재조합 시스템에 한정되는 것이 아님을 인지할 것이다.
야로위아
리폴리티카
중 외래 유전자의 과발현
당업자에게 공지된 바와 같이, 유전자 (예컨대, 데새투라제)를 클로닝 벡터에 삽입하는 것만으로는 이것이 필요한 수준으로 성공적으로 발현될 것을 보장하지 못한다. 전사, 번역, 단백질 안정성, 산소 제한 및 숙주 세포로부터의 분비 측면을 조절하는 수많은 상이한 유전자 요소들을 조작하는 것이 바람직할 수 있다. 보다 구체적으로, 유전자 발현은 다음을 변경함으로써 조절될 수 있다: 관련 전사 프로모터 및 종결자 서열의 성질, 클로닝된 유전자의 카피 수, 상기 유전자가 플라스미드에 보유되는지 또는 숙주 세포의 게놈에 통합되는지의 여부, 합성된 외래 단백질의 최종적인 세포내 위치, 숙주 유기체 중에서의 번역 효율, 숙주 세포 중 클로닝된 유전자 단백질의 내재적 안정성, 및 클로닝된 유전자 내에서 숙주 세포의 바람직한 코돈 사용 빈도에 도달할만큼의 코돈 사용. 이러한 과발현 방법 중 여러가지가 이하에서 논의될 것이고, 본 발명에서 예를 들어 야로위아 리폴리티카 중 데새투라제, 엘론가제 및 아실트랜스퍼라제의 과발현을 위한 수단으로서 유용하다.
원하는 유전자(들)의 발현은 mRNA 또는 코딩된 단백질로부터 불안정화 서열을 제거/결실시키거나, 또는 상기 mRNA에 안정화 서열을 부가함으로써 더 강력한 프로모터 (조절형 또는 구성적 프로모터)의 사용을 통해 전사 수준에서 증가되어 발현이 증가될 수 있다 (미국 특허 제4,910,141호).
원하는 숙주 세포에서 데새투라제, 엘론가제 및 아실트랜스퍼라제 유전자의 발현을 구동시키는데 유용한 개시 조절 영역 또는 프로모터는 매우 다양하며 당업자에게 알려져 있다. 사실상, 야로위아 리폴리티카에서 이들 유전자의 발현을 지시할 수 있는 임의의 프로모터가 본 발명에 적합하다. 숙주 세포에서의 발현은 일시적이거나 안정적인 방식으로 수행될 수 있다. 일시적 발현은 관심 유전자에 작동가능하게 연결된 조절가능한 프로모터의 활성을 유도하여 달성될 수 있고, 별법으로, 안정적인 발현은 관심 유전자에 작동가능하게 연결된 구성적 프로모터를 이용하여 달성될 수 있다. 예를 들어, 숙주 세포가 효모인 경우에는 특히 상기 숙주 종으로부터 유래된, 효모 세포에서 기능적인 전사 영역 및 번역 영역이 제공된다. 전사 개시 조절 영역은 예를 들어 1) 해당 경로 중의 유전자, 예컨대 알콜 데히드로게나제, 글리세르알데히드-3-포스페이트-데히드로게나제, 포스포글리세레이트 뮤타제, 프럭토스-비스포스페이트 알돌라제, 포스포글루코스-이소머라제, 포스포글리세레이트 키나제, 글리세롤-3-포스페이트 O-아실트랜스퍼라제 등, 또는 2) 조절가능한 유전자, 예컨대 산 포스파타제, 락타제, 메탈로티오네인, 글루코아밀라제, 번역 신장 인자 EF1-α (TEF) 단백질 (미국 특허 제6,265,185), 리보솜 단백질 S7 (미국 특허 제6,265,185), 암모늄 수송자 단백질, 방출 단백질 등으로부터 얻을 수 있다. 구성적 전사를 원하는지 또는 유도된 전사를 원하는지의 여부, 관심 ORF의 발현에 있어서의 프로모터 효율, 구축의 용이성 등에 따라, 수많은 조절 서열 중 임의의 것을 사용할 수 있다. 상기한 예는 본원에 개시한 본 발명을 제한하려는 것이 아니다.
당업자가 알고 있는 바와 같이, 다양한 프로모터의 활성 비교에는 여러가지 방법이 이용가능하다. 이러한 유형의 비교는, 각 프로모터를 이들 프로모터에 ω-6 및 ω-3 지방산의 생성에 유용한 키메라 유전자의 구축이 필요한 추가의 용도에 사용하기 위한 프로모터 강도 결정을 용이하게 하는데 유용하다. 따라서, 리포터 유전자 (즉, β-글루쿠로니다제 (GUS)를 코딩하는 이. 콜라이(E. coli) 유전자)의 발현을 기초로 하여 프로모터 활성을 간접적으로 정량하는 것이 유용할 수 있다. 별법의 실시양태에서, 때로는 더욱 정량적인 수단을 이용하여 프로모터 활성을 정량화하는 것이 유용할 수 있다. 적합한 방법 중 하나는 실시간 PCR (실시간 PCR 이용에 대하여 일반적으로 고찰하기 위해서는, 문헌 [Ginzinger, D. J., Experimental Hematology, 30:503-512 (2002)] 참조)을 이용하는 것이다. 실시간 PCR은 형광성 리포터의 검출 및 정량화를 기초로 한다. 이 신호는 반응물 중 PCR 생성물의 양에 직접 비례하여 증가한다. 각 주기에서 형광 방출의 양을 기록함으로써, PCR 생성물의 양에 있어서의 최초의 유의한 증가가 표적 주형의 초기 양과 상관관계가 있는 지수 성장기 동안의 PCR 반응을 모니터링할 수 있다. 앰플리콘을 정량적으로 검출하기 위한 2가지 일반적 방법이 있다: (1) 형광성 프로브의 사용, 또는 (2) DNA-결합제 (예컨대, SYBR-그린 I, 에티듐 브로마이드)의 사용. 상대적인 유전자 발현 비교를 위해, 내인성 조절을 내부 기준물 (예컨대, 염색체에 의해 코딩되는 16S rRNA 유전자)로서 사용하여, 각각의 실시간 PCR 반응에 첨가되는 DNA의 총량에 있어서의 차이에 대해 표준화할 수 있도록 할 필요가 있다. 실시간 PCR에 대한 구체적인 방법은 당업계에 문서화되어 있다. 예를 들어 문헌 [Real Time PCR Special Issue (Methods, 25(4):383-481 (2001)]을 참조한다).
실시간 PCR 반응 후에, 기록된 형광 강도를 이용하여 하기 방법을 통해 주형의 양을 정량한다: 1) 절대적 표준 방법 (알려진 양의 기준물, 예컨대 시험관내 번역된 RNA (cRNA)를 사용함), 2) 상대적 표준 방법 (알려진 양의 표적 핵산을, 디자인된 검정법의 각 운행에 포함시킴), 또는 3) 유전자 발현의 상대적 정량화를 위한 비교 CT 방법 (ΔΔCT) (표적 서열의 상대적 양을, 선택된 임의의 기준물 값과 비교하고, 그 결과를 기준 값에 대한 상대치로서 나타냄). 비교 CT 방법은, 우선 표적의 CT 값과 표준물의 CT 값 사이의 차이 (ΔCT)를 결정하는 것이 필요하다: ΔCT = CT (표적) - CT (표준물). 정량할 각 샘플에 대해 이 값을 계산하고, 한 샘플을 각각의 비교가 수행될 기준물로서 선택해야 한다. 비교 ΔΔCT 계산은 각 샘플의 ΔCT와 기준선의 ΔCT 사이의 차이를 알아낸 후에, 이들 값을 식 2-ΔΔ CT에 따른 절대값으로 변환시키는 것을 포함한다.
야로위아 리폴리티카에서의 발현에 적합할 수 있는 프로모터의 선택폭은 매우 다양하지만, 본 발명의 바람직한 실시양태에서는 프로모터가 하기 표 9에 기재한 프로모터 (또는 그의 유도체)로부터 선택된다:
야로위아 리폴리티카에서의 과발현에 바람직한 천연 프로모터 | |||||
프로모터 명칭 | 위치 * | 천연 유전자 | 활성 "등급" | 참조문헌 | 서열번호 |
TEF | --- | 번역 신장 인자 EF1-α | 1 | 미국 특허 제6,265,185호 (뮬러 (Muller) 등), 진뱅크 관리 번호 AF054508 | 서열 218 |
GPD | -968 bp 내지 +3 bp | 글리세르알데히드- 3-포스페이트- 데히드로게나제 | 2 | 제WO 2005/ 003310호 | 서열 210 |
GPM | -875 bp 내지 +3 bp | 포스포-글리세레이트 뮤타제 | 1 | 제WO 2005/ 003310호 | 서열 212 |
FBA | -1001 bp 내지 -1 bp | 프럭토스-비스포스페이트 알돌라제 | 4 | 제WO 2005/ 049805호 | 서열 213 |
FBAIN | -804 bp 내지 +169 bp (102 bp 인트론 [+64 내지 +165] 포함) | 프럭토스-비스포스페이트 알돌라제 | 7 | 제WO 2005/ 049805호 | 서열 214 |
FBAINm | -804 bp 내지 +169 bp, 변형됨*** | 프럭토스-비스포스페이트 알돌라제 | 5 | 제WO 2005/ 049805호 | 서열 215 |
GPDIN | -973 bp 내지 +201 bp (146 bp 인트론 [+49 내지 +194] 포함) | 글리세르알데히드- 3-포스페이트- 데히드로게나제 | 3 | 동시 계류 중인 미국 특허 출원 제11/183664호 | 서열 211 |
GPAT | -1130 bp 내지 +3 bp | 글리세롤-3-포스페이트-O- 아실트랜스퍼라제 | 5 | 동시 계류 중인 미국 특허 출원 제11/225354호 | 서열 216 |
YAT1 | -778 bp 내지 -1 bp | 암모늄 수송자 효소 | 6 | 동시 계류 중인 미국 특허 출원 제11/185301호 | 서열 217 |
EXP1 | -1000 bp 내지 -1 bp | 방출 단백질 | 6 | ---- | 서열 221 |
* 천연 유전자에 대한 위치임. 여기서, 'ATG' 번역 개시 코돈의 'A' 위치를 +1로 함. *** FBAINm 프로모터는 FBAIN 프로모터의 변형된 형태로, FBAINm이 FBAIN 프로모터의 ATG 번역 개시 코돈과 인트론 사이에 52 bp 결실부를 가지며 (따라서, N-말단의 22개 아미노산만을 포함함) 인트론 뒤에 새로운 번역 컨센서스 모티프를 가짐. 추가로, 발현될 유전자의 코딩 영역과 융합될 경우에 FBAIN 프로모터는 융합 단백질을 생성하지만, FBAINm 프로모터는 그러한 융합 단백질을 생성하지 않음. |
GPM의 활성은 TEF과 거의 동일하지만, GPD, FBA, FBAIN, FBAINm, GPDIN, GPAT, YAT1 및 EXP1의 활성은 모두가 TEF보다 높다 (활성은, "활성 등급"이라는 제목의 컬럼에서 상대적 방식으로 정량화함. 여기서, '1'은 가장 낮은 활성을 갖는 프로모터에 상응하고 '7'은 가장 높은 활성을 갖는 프로모터에 상응함). 이러한 정량화는 각 프로모터가 리포터로서 β-글루쿠로니다제 (GUS)를 코딩하는 이. 콜라이 유전자 [Jefferson, R.A. Nature. 14;342:837-838 (1989)] 및 야로위아 Xpr 유전자의 3' 영역의 약 100 bp를 보유하는 키메라 유전자의 생성에 사용된 비교 연구를 기초로 한다. 각각의 발현된 구축물에서의 GUS 활성은, 조직화학적 및/또는 형광측정 검정 [Jefferson, R. A. Plant Mol. Biol. Reporter 5:387-405 (1987)] 및/또는 실시간 PCR의 이용으로 측정한 것이다.
YAT1 프로모터는, 본 발명자들에 의해 야로위아 내에서 유질 조건 (즉, 질소 제한)하에 유도가능한 것으로 확인된 최초의 프로모터로서 특징규명되었다는 점에서 독특하다. 구체적으로, YAT1 프로모터는 질소 (예컨대, 최대 약 0.5%의 암모늄 술페이트)를 함유하는 배지 중에서 활성이지만, 상기 프로모터의 활성은 숙주 세포를 질소-제한 조건 (예컨대, 암모늄을 매우 낮은 수준으로 함유하거나 암모늄이 없는 배지 중)하에서 성장시킬 경우에 증가한다. 따라서, 바람직한 배지는 암모늄 술페이트 또는 다른 적합한 암모늄 염을 약 0.1% 미만으로 함유하는 것이다. 더욱 바람직한 실시양태에서, YAT1 프로모터는, 숙주 세포를 탄소:질소의 비율 (즉, C:N)이 높은 배지, 예컨대 약 8 내지 12% 글루코스 및 약 0.1% 이하의 암모늄 술페이트를 함유하는 고농도 글루코스 배지 (HGM)에서 성장시킬 경우에 유도된다. 이들 조건은 또한 유질인 효모 (예컨대, 야로위아 리폴리티카) 중에서 유질성을 유도하기에도 충분하다. 세포 추출물의 GUS 활성을 기초로, 세포를 최소 배지에서 HGM으로 변경시켜 24시간 동안 성장시킬 때 YAT1 프로모터의 활성은 약 37배 증가하였고, HGM 중에서 120시간이 지난 후에는 이 활성이 다소 저하되었으나 질소를 포함하는 최소 배지 중에서의 활성에 비해 여전히 25배 더 높았다 (실시예 1).
물론, 본 발명의 별법의 실시양태에서, 상기 표 9에 기재한 임의의 프로모터 영역으로부터 유래된 다른 프로모터도 야로위아 리폴리티카에서 TAG 분획물 중 DHA의 생성과 축적을 용이하게 하기 위한 이종 발현에 사용될 수 있다. 특히, 상기한 임의의 프로모터의 길이 변형은 동일한 활성을 갖는 돌연변이체 프로모터를 초래할 수 있는데, 이는 이들 조절 서열의 정확한 경계가 아직 완전하게 규명되지 못했기 때문이다. 별법의 실시양태에서, FBAIN 및 GPDIN 프로모터의 인트론 내에 위치한 인핸서를 사용하여 천연 야로위아 프로모터에 비해 활성이 증가된 키메라 프로모터를 생성할 수 있다 (예컨대, 키메라 GPM::FBAIN 및 GPM::GPDIN 프로모터 (서열 219 및 서열 220)는 야로위아 Xpr 유전자 3' 영역의 약 100 bp와 함께 GUS 리포터 유전자의 발현을 구동시킬 경우, GPM 프로모터 단독인 경우에 비해 활성이 증가되었음).
종결 영역은 개시 영역이 얻어진 유전자 또는 상이한 유전자의 3' 영역으로부터 유래될 수 있다. 다수의 종결 영역이 공지되어 있으며 다양한 숙주에서 (이들이 유래된 속과 종이 동일한 경우와 상이한 경우 둘다에 이용될 때) 만족스런 기능을 발휘한다. 종결 영역은 일반적으로 임의의 특정 성질이 아니라 편의성을 위주로 선택된다. 종결 영역은 효모 유전자, 특히 사카로마이세스, 쉬조사카로마이세스(Schizosaccharomyces), 칸디다, 야로위아 또는 클루이베로마이세스로부터 유래되는 것이 바람직하다. γ-인터페론 및 α-2 인터페론을 코딩하는 포유동물 유전자의 3'-영역도 효모에서 기능하는 것으로 공지되어 있다. 또한, 종결 조절 영역도 바람직한 숙주에 천연인 각종 유전자로부터 유래될 수도 있다. 임의로, 종결 부위는 필요치 않을 수 있지만, 이것이 포함되는 것이 가장 바람직하다. 제한하려는 것은 아니지만, 본원의 개시 내용에 유용한 종결 영역으로는 야로위아 리폴리티카 세포외 프로테아제 (XPR (진뱅크 관리 번호 M17741)) 3' 영역의 약 100 bp, 아실-coA 옥시다제 (Aco3 (진뱅크 관리 번호 AJ001301 및 CAA04661), Pox3 (진뱅크 관리 번호 XP_503244)) 종결자, Pex20 (진뱅크 관리 번호 AF054613) 종결자, Pex16 (진뱅크 관리 번호 U75433) 종결자, Lip1 (진뱅크 관리 번호 Z50020) 종결자, Lip2 (진뱅크 관리 번호 AJ012632) 종결자, 및 3-옥소아실-coA 티올라제 (OCT, 진뱅크 관리 번호 X69988) 종결자 등이 있다.
상기한 데새투라제, 엘론가제 및/또는 아실트랜스퍼라제 유전자의 추가의 카피 (즉, 1개 초과의 카피)가 야로위아 리폴리티카에 도입되어 DHA 생산 및 축적을 증가시킬 수 있다. 구체적으로, 추가의 카피의 유전자가 단일 발현 구축물 내에 클로닝될 수 있고/있거나; 플라스미드 카피수를 증가시키거나 클로닝된 유전자를 게놈에 다중 통합시킴으로써 추가의 카피의 클로닝된 유전자(들)이 숙주 세포에 도입될 수 있다 (하기 참조). 예를 들어 한 실시양태에서, 야로위아 리폴리티카의 균주 (즉, 균주 Y3000)는 3개 카피의 Δ12 데새투라제, 2개 카피의 Δ6 데새투라제, 4개 카피의 C18 /20 엘론가제, 5개 카피의 Δ5 데새투라제, 3개 카피의 Δ17 데새투라제, 3개 카피의 C16 /18 엘론가제, 1개 카피의 C20 /22 엘론가제 및 1개 카피의 Δ4 데새투라제를 포함하는 키메라 유전자를 야로위아 게놈에 도입 및 통합시켜서 DHA를 5% 초과로 생산하도록 유전자 조작되었다.
일반적으로, 일단 유질 효모 중에서의 발현에 적합한 DNA (예컨대, 프로모터, ORF 및 종결자를 포함하는 키메라 유전자)가 수득되면, 이것을 숙주 세포 중에서 자가 복제가 가능한 플라스미드 벡터에 위치시키거나, 또는 숙주 세포의 게놈에 직접 통합시킨다. 발현 카세트의 통합은 숙주 게놈 내에서 무작위로 일어날 수도 있고, 또는 숙주 유전자좌와의 재조합을 표적화하기에 충분할 만큼 숙주 게놈에 상동성인 영역을 함유하는 구축물을 사용하여 표적화될 수도 있다. 본 발명에서 제한되지는 않지만, 전사 조절 영역 및 번역 조절 영역의 전부 또는 일부는 구축물이 표적화되는 내인성 유전자좌에 의해 제공될 수 있다.
본 발명에서, 야로위아 리폴리티카에서 유전자를 발현시키는 바람직한 방법은 선형 DNA를 숙주의 게놈으로 통합시키는 것이고, 게놈 내 여러 위치에 통합시키는 것이 유전자의 고수준 발현을 원하는 경우에 특히 유용할 수 있다. 이러한 목적을 위해, 게놈 내에 다중 카피로 존재하는 서열을 동정하는 것이 바람직하다.
슈미드-베르거(Schmid-Berger) 등 [J. Bact. 176(9):2477-2482 (1994)]은 야로위아 리폴리티카에서 최초의 레트로트란스포손-유사 요소 Ylt1을 발견하였다. 이 레트로트란스포손은 제타 영역이라고 불리는 긴 말단 반복부 (LTR; 각각 대략 700 bp 길이)의 존재를 특징으로 한다. Ylt1 및 솔로 제타 요소들은 게놈 내에서 각각 35개 이상의 카피/게놈 및 50 내지 60개 카피/게놈으로 분산되어 존재하였다. 이들 두 요소 모두가 상동성 재조합 부위로서 기능하는 것으로 결정되었다. 추가로, 쥬렛젝(Juretzek) 등의 연구 [Yeast 18:97-113 (2001)]는 플라스미드를 효모 게놈의 반복적 영역에 표적화함으로써 (양 말단에 LTR 제타 영역을 갖는 선형 DNA를 사용함), 적은 카피 수의 플라스미드 형질전환체를 사용하여 달성되는 발현에 비해 유전자 발현이 크게 증가할 수 있음을 입증하였다. 따라서, 제타-지시된 통합은 플라스미드 DNA를 야로위아 리폴리티카에 다중 통합시켜서 유전자 발현이 고수준이 되게 하는 수단으로서 이상적일 수 있다. 그러나 불행히도, 야로위아 리폴리티카의 모든 균주가 제타 영역을 보유하는 것은 아니다 (예컨대, ATCC #20362로 동정된 균주). 균주에 이러한 영역이 없는 경우, 발현 카세트를 포함하는 플라스미드 DNA를 별법의 유전자좌에 통합시켜서 발현 카세트를 원하는 카피수로 만드는 것도 가능하다. 예를 들어, 바람직한 별법의 유전자좌로는 Ura3 유전자좌 (진뱅크 관리 번호 AJ306421), Leu2 유전자의 유전자좌 (진뱅크 관리 번호 AF260230), Lys5 유전자 (진뱅크 관리 번호 M34929), Aco2 유전자의 유전자좌 (진뱅크 관리 번호 AJ001300), Pox3 유전자의 유전자좌 (Pox3 (진뱅크 관리 번호 XP_503244) 또는 Aco3 (진뱅크 관리 번호 AJ001301)), Δ12 데새투라제 유전자의 유전자좌 (서열 28), Lip1 유전자의 유전자좌 (진뱅크 관리 번호 Z50020) 및/또는 Lip2 유전자의 유전자좌 (진뱅크 관리 번호 AJ012632) 등이 있다.
유리하게도, Ura3 유전자는 5-FOA 선별 (상기 문헌)을 병행하여 반복적으로 사용될 수 있다. 보다 구체적으로, 천연 Ura3 유전자를 우선 넉아웃(knockout)시켜서 Ura- 표현형을 갖는 균주를 생성할 수 있고, 이때의 선별은 5-FOA 내성을 기초로 한다. 이어서, 다중 키메라 유전자 및 신규한 Ura3 유전자의 클러스터(cluster)를 야로위아 게놈의 상이한 유전자좌에 통합시킴으로써 Ura+ 표현형을 갖는 신규 균주를 생성할 수 있다. 도입된 Ura3 유전자가 넉아웃된 경우에는 이후의 통합에 의해 새로운 Ura3- 균주 (다시 5-FOA 선별을 이용하여 동정함)를 생성할 수 있다. 따라서, Ura3 유전자 (5-FOA 선별을 병행함)를 여러 회의 형질전환에서 선별 마커로서 이용할 수 있고, 이에 따라 유전자 변형물이 야로위아 게놈에 간편한 방식으로 쉽게 통합되도록 할 수 있다.
몇몇 예에서는, 본 발명의 단백질을 상이한 세포내 구획 (예컨대, 아실-CoA 풀 vs . 포스파티딜콜린 풀)으로 지시하는 것이 유용할 것이다. 본원에 기재한 목적상, DHA는 유리 지방산으로서 존재하거나 또는 에스테르화된 형태, 예컨대 아실글리세롤, 인지질, 술포지질 또는 당지질로서 존재할 수 있다. DHA 생합성을 허용하는 폴리펩티드를 코딩하는 상기 키메라 유전자가 적절한 세포내 표적화 서열을 포함하도록 추가로 유전자 조작될 수 있음이 이해된다.
쥬렛젝 등 [Yeast, 18:97-113 (2001)]은 야로위아 리폴리티카 내에서 통합된 플라스미드 카피수의 안정성이 개개의 형질전환체, 수용성 균주 및 사용된 표적화 플랫폼에 따라 달라진다는 것에 주목하였다. 따라서, 당업자는 원하는 발현 수준 및 패턴을 보이는 균주를 수득하기 위해서 다중 형질전환체가 스크리닝되어야 함을 인지할 것이다. 이러한 스크리닝은 DNA 블럿의 써던 분석 [Southern, J. Mol. Biol. 98:503 (1975)], mRNA 발현의 노던 분석 [Kroczek, J. Chromatogr. Biomed. Appl., 618(1-2):133-145 (1993)], 단백질 발현의 웨스턴 분석, PUFA 생성물의 표현형 분석 또는 GC 분석으로 수행될 수 있다.
요약하면, 상기 수단 각각은 야로위아 리폴리티카에서 특정 유전자 생성물 (예컨대, 데새투라제, 엘론가제, 아실트랜스퍼라제)의 발현을 증가시키는데 유용하며, 생명공학 분야의 당업자는 DHA를 많이 생산할 수 있는 가장 적절한 조합의 방법들을 쉽게 선택할 수 있을 것이다.
DHA
생산 증가를 위한 경로의 조작
상기 방법은 개개의 이종 유전자 발현을 상향 조절하는데 유용하지만, 야로위아 리폴리티카에서 DHA 생산을 증가시키는 것은 훨씬 더 복잡한 일이고 다양한 대사 경로를 조화롭게 조작하는 것이 요구될 수 있다. PUFA 생합성 경로의 조작이 우선 이루어진 후에 TAG 생합성 경로 및 TAG 분해 경로에서의 바람직한 조작이 뒷따를 것이다.
앞서 기재한 바와 같이, DHA를 전체 오일 분획의 5% 초과로, 또는 더욱 바람직하게는 DHA를 전체 오일 분획의 10% 초과로, 또는 훨씬 더욱 바람직하게는 DHA를 전체 오일 분획의 15 내지 20% 초과로, 또는 가장 바람직하게는 DHA를 전체 오일 분획의 25 내지 30% 초과로 생산하는 야로위아 리폴리티카 균주의 구축에는 (1) 적어도 Δ6 데새투라제/Δ6 엘론가제 경로를 발현하기 위한 Δ6 데새투라제, C18/20 엘론가제, Δ5 데새투라제 및 Δ17 데새투라제 또는 Δ15 데새투라제 (또는 둘다), C20 /22 엘론가제 및 Δ4 데새투라제; 또는 (2) 적어도 Δ9 엘론가제/Δ8 데새투라제 경로를 발현하기 위한 Δ9 엘론가제, Δ8 데새투라제, Δ5 데새투라제 및 Δ17 데새투라제 또는 Δ15 데새투라제 (또는 둘다), C20 /22 엘론가제 및 Δ4 데새투라제가 필요하다. 그러나, 이들 중 어느 실시양태에서도 숙주 균주에 Δ9 데새투라제, Δ12 데새투라제, C14 /16 엘론가제 및/또는 C16 /18 엘론가제를 추가로 포함시키는 것이 바람직할 수 있다.
일부 경우에서는, 천연 야로위아 리폴리티카 Δ12 데새투라제를 푸사륨 모닐리포르메 Δ12 데새투라제로 대체하는 것이 유리한 것으로 입증될 수 있으며, 이는 푸사륨 모닐리포르메 Δ12 데새투라제가 증가된 기질 전환율(%)을 나타내기 때문이다 (제WO 2005/047485호). 보다 구체적으로, 이들 2종의 Δ12 데새투라제 모두가 올레산이 LA로 전환되는 것을 촉매하지만, 상기 2종의 효소는 전반적인 특이성 (이에 따라 각 효소의 기질 전환율(%)이 영향을 받음)이 상이하다. 본 발명자들은 푸사륨 모닐리포르메 Δ12 데새투라제가 LA를 포스포티딜콜린 기질의 sn-2 위치 (이로써 Δ6 데새투라제에 의한 이후의 반응을 용이하게 함)에 이동시키는 능력(loading capacity)이 야로위아 리폴리티카 Δ12 데새투라제보다 더 높다고 결정하였다. 이것을 기초로, 푸사륨 모닐리포르메 Δ12 데새투라제의 과발현과 야로위아 리폴리티카 Δ12 데새투라제의 넉아웃은 DHA로의 추후 전환을 위한 생성물을 증가시킬 수 있다.
일부 실시양태에서, 숙주 유기체의 천연 DAG AT의 활성을 조절함으로써 야로위아 리폴리티카 숙주의 지질 및 오일 내 PUFA의 백분율을 조작하는 것이 유용할 수 있다. 구체적으로, 오일 생합성이 유질화 동안 다중불포화와 경쟁한다고 예측되기 때문에, 유기체의 1종 이상의 아실트랜스퍼라제 (예컨대, PDAT 및/또는 DGAT1 및/또는 DGAT2) 활성을 저하시키거나 불활성화시켜서, 오일 생합성의 전반적인 비율은 저하시키면서 그와 동시에 지질 및 오일 분획으로 혼입되는 PUFA의 백분율 (전체 지방산에 대한 백분율)은 증가시킬 수 있다. 이러한 결과는 다중불포화가 보다 효율적으로 일어날 수 있기 때문이며, 또는 다른 말로 하면 특이적 DAG AT 활성을 하향 조절함으로써 오일 생합성과 다중불포화 사이의 기질 경쟁이 유질화 동안 다중포화가 유리하도록 저하될 수 있기 때문이다.
당업자는 최적 수준의 하향 조절을 이루는데 필요한 기술 및 이러한 억제 달성에 필요한 수단을 보유하고 있을 것이다. 예를 들어, 일부 바람직한 실시양태에서, 단일 DAG AT의 활성을 조작하는 것이 바람직할 수 있다 (예컨대, DGAT1 넉아웃을 생성하면서 PDAT와 DGAT2의 활성은 변경시키지 않음). 별법의 실시양태에서, 유질 유기체는 총 "n"종의 천연 DAG AT를 포함하고, 총 "n-1"종의 아실트랜스퍼라제 활성이 변형되어 오일 생합성의 속도를 저하시키는 반면에 나머지 아실트랜스퍼라제는 그의 야생형 활성을 유지한다. 그리고, 일부 상황에서는, 다중불포화 비율에 대한 오일 생합성의 최적 비율의 달성을 위해서 일부 바람직한 유질 유기체 중 모든 천연 DAG AT의 활성을 조작하는 것이 바람직할 수 있다.
유사한 방식으로, 본 발명자들은 이종 아실트랜스퍼라제의 발현 및 상응하는 천연 야로위아 리폴리티카 아실트랜스퍼라제의 넉아웃이 숙주 세포에서 생산되는 전반적 DHA를 유의하게 증가시킬 수 있다는 가설을 세웠다. 구체적으로, 이전에 제안되었던 바와 같이, C20 이상인 지방산에 특이성을 갖는 이종 GPAT, LPAAT, DGAT1, DGAT2, PDAT 및 LPCAT 아실트랜스퍼라제가 천연 효소보다 더 바람직할 수 있는데, 이는 야로위아 리폴리티카에서 천연적으로 생산된 PUFA가 18:2 지방산으로 제한되고 천연 효소가 더욱 장쇄의 지방산을 이용한 반응을 효율적으로 촉매할 수 없기 때문이다. 이러한 결론을 기초로 하여, 본 발명자들은 모르티에렐라 알피나에서 GPAT, LPAAT, DGAT1 및 DGAT2를 코딩하는 유전자를 동정하고 이들 유전자를 유전자 조작된 EPA-생산 야로위아 숙주에서 발현시켜서 PUFA 생합성을 증가시켰다 (본원 실시예 17 내지 실시예 20). 이후, 천연 및 이종 아실트랜스퍼라제 사이의 기질 경쟁을 저하시키는 수단으로서, 야로위아 리폴리티카 중의 여러가지 천연 아실트랜스퍼라제 (예컨대, DGAT1 및 DGAT2)의 활성을 감소시키거나 넉아웃시켰다. DHA를 생산하는 유전자 조작된 야로위아 숙주에서 유사한 결과가 예상된다.
당업자는 또한 DHA 생산에 영향을 주는 경로 및 포괄적인 조절자의 조작을 고려해야 한다. 예를 들어, 더욱 장쇄의 포화 및 불포화 지방산, 예컨대 팔미테이트 (16:0) 및 스테아르산 (18:0)의 전구체의 이용가능성을 증가시켜서 PUFA 생합성 경로로의 탄소 유동을 증가시키는 것이 유용하다. 상기한 장쇄의 포화 지방산의 합성은 C14 /16 엘론가제의 활성에 의존적인 반면, 상기한 장쇄의 불포화 지방산의 합성은 C16 /18 엘론가제의 활성에 의존적이다. 따라서, 천연 야로위아 리폴리티카 C14/16 엘론가제 (서열 97 및 98)의 과발현은 16:0 및 16:1 지방산의 생산을 실질적으로 증가시켰고 (대조군 균주에 비해 22% 증가), 유사하게 천연 야로위아 리폴리티카 C16 /18 엘론가제 (서열 94 및 95)의 과발현은 18:0, 18:1, 18:2 및 18:3 지방산의 생산을 실질적으로 증가시켰으며 (대조군 균주에 비해 18% 증가), C16 지방산의 축적을 저하시켰다 (대조군 균주에 비해 22% 감소). 물론, 본원에서 입증되고 이나가끼, 케이.(Inagaki, K.) 등의 연구 [Biosci. Biotech. Biochem. 66(3):613-621 (2002)]에서 제안된 바와 같이, 본 발명의 일부 실시양태에서는 이종 C16 /18 엘론가제 (예컨대, 라투스 노르베기쿠스 [진뱅크 관리 번호 AB071986, 본원의 서열 83 및 84] 및/또는 모르티에렐라 알피나 [서열 86 및 87]로부터 유래된 것)의 동시 발현이 유용할 수 있다. 따라서, 야로위아 리폴리티카 숙주 균주는 DHA 생합성을 위해서 최소한 (1) Δ6 데새투라제, C18 /20 엘론가제, Δ5 데새투라제 및 Δ17 데새투라제 또는 Δ15 데새투라제 (또는 둘다), C20 /22 엘론가제, Δ4 데새투라제; 또는 (2) Δ9 엘론가제, Δ8 데새투라제, Δ5 데새투라제 및 Δ17 데새투라제 또는 Δ15 데새투라제 (또는 둘다), C20 /22 엘론가제, 및 Δ4 데새투라제를 발현하도록 조작되어야 하지만, 추가의 바람직한 실시양태에서는 숙주 균주가 Δ9 데새투라제, Δ12 데새투라제, C14 /16 엘론가제 및/또는 C16 /18 엘론가제 중 1종 이상을 추가로 포함한다.
또다른 바람직한 실시양태에서, 본 발명의 야로위아 리폴리티카에서 지방산 분해 및 TAG 분해에 영향을 주는 경로를 변형시켜서, 세포 내에서 아실-CoA 풀 또는 TAG 분획에 축적된 DHA의 분해를 최소화하였다. 이들 경로는 아실-CoA 옥시다제 및 리파제 유전자 각각에 의해 대표된다. 보다 구체적으로, 아실-CoA 옥시다제 (EC 1.3.3.6)는 각각의 분해 주기로 아세틸-CoA 분자 및 지방산 기질보다 2개의 탄소 원자가 더 짧은 지방산이 수득되는 퍼옥시좀 β-산화 반응을 촉매한다. 야로위아 리폴리티카에는 5종의 아실-CoA 옥시다제 동종효소가 존재하며, 진뱅크 관리 번호 AJ001299 내지 AJ001303 각각에 상응하는 POX1, POX2, POX3, POX4 및 POX5 유전자 (또한, Aco1, Aco2, Aco3, Aco4 및 Aco5 유전자라고도 공지되어 있음)에 의해 코딩된다 (또한, 상응하는 진뱅크 관리 번호 XP_504703, XP_505264, XP_503244, XP_504475 및 XP_502199 참조). 상기 동종효소 각각은 기질 특이성이 상이하다. 예를 들어, POX3 유전자는 단쇄 지방산에 대하여 활성인 아실-CoA 옥시다제를 코딩하는 반면, POX2 유전자는 더욱 장쇄의 지방산에 대하여 활성인 아실-CoA 옥시다제를 코딩한다 [Wang H.J., et al. J. Bacteriol., 181:5140-5148 (1999)]. 본 발명의 숙주 세포에서 퍼옥시좀 β-산화를 본원에서의 목적에 유리할 수 있는 방식으로 변형시키면, 상기 유전자 중 임의의 것의 활성이 저하되거나 제거될 수 있다고 여겨진다. 최종적으로, 혼동되는 것을 피하기 위해서, 본 발명자들은 상기한 아실-CoA 옥시다제를 POX 유전자라고 지칭할 것이지만, 이러한 용어는 공개적으로 입수가능한 몇몇 문헌에 따라 Aco 유전자 명명법과 혼용될 수 있다.
유사하게, 야로위아 리폴리티카에서 세포내 효소, 막-결합 효소 및 세포외 효소를 비롯한 여러 리파제 (EC 3.1.1.3)가 검출되었다 ([Choupina, A., et al. Curr. Genet. 35:297 (1999)], [Pignede, G., et al. J. Bacteriol. 182:2802-2810 (2000)]). 예를 들어, Lip1 (진뱅크 관리 번호 Z50020) 및 Lip3 (진뱅크 관리 번호 AJ249751)은 세포내 효소 또는 막-결합 효소인 반면, Lip2 (진뱅크 관리 번호 AJ012632)는 세포외 리파제를 코딩한다. 이들 리파제 각각은 이들 효소가 TAG 및 물이 DAG 및 지방산 음이온으로 직접 분해되는 반응을 촉매하기 때문에 파괴할 표적이었다.
추가의 별법의 실시양태에서, 야로위아 리폴리티카의 바람직한 숙주 균주에서 여러가지 포스포리파제의 활성이 조작될 수 있다. 포스포리파제는 막 지질의 생합성 및 분해에 중대한 역할을 한다. 보다 구체적으로, 용어 "포스포리파제"는 글리세로인지질 중의 1개 이상의 에스테르 연결부를 가수분해하는 능력을 공유하는 이질성 군의 효소를 지칭한다. 모든 포스포리파제가 인지질을 기질로서 표적화하지만, 각 효소는 특이적 에스테르 결합을 절단하는 능력을 보유한다. 따라서, 포스포리파제에 대한 명명법은 개개의 포스포리파제를 차별화하고, 인지질 분자 내에 표적화된 특이적 결합을 지시한다. 예를 들어, 포스포리파제 A1 (PLA1)은 글리세롤 부분의 sn-1 위치에서 지방 아실 에스테르 결합을 가수분해하지만, 포스포리파제 A2 (PLA2)는 이 분자의 sn-2 위치에서 지방산을 제거한다. PLA1 (EC 3.1.1.32) 및 PLA2 (EC 3.1.1.4)의 작용은 유리 지방산 및 2-아실 리소인지질 또는 1-아실 리소인지질 각각의 축적을 초래한다. 포스포리파제 C (PLC) (EC 3.1.4.3)는 인지질 주쇄 중의 포스포디에스테르 결합을 가수분해하여 1,2-DAG를 생성하고, 또한 포함된 구체적인 인지질 종에 따라 포스파티딜콜린, 포스파티딜에탄올아민 등을 생성한다 (예컨대, PLC1은 1-포스파티딜-1D-마이오-이노시톨 4,5-비스포스페이트 + H2O = 1D-마이오-이노시톨 1,4,5-트리포스페이트 + DAG의 반응을 담당함. ISC1은 이노시톨 스핑고인지질-특이적 포스포리파제 C를 코딩함 [Sawai, H., et al. J. Biol. Chem. 275, 39793-39798 (2000)]). 제2의 포스포디에스테르 결합은 포스포리파제 D (PLD) (EC 3.1.4.4)에 의해 절단되어 포스파티드산이 생성되고, 또한 마찬가지로 포함된 인지질 클래스에 따라 콜린 또는 에탄올아민이 생성된다. 포스포리파제 B (PLB)는 sn-1 및 sn-2 지방산 둘다를 제거할 수 있으며, 히드롤라제 (상기 효소는 2가지 지방산 인지질 [PLB 활성]과 리소인지질 [리소포스포리파제 활성] 둘다를 절단하여 지방산을 방출함) 및 리소포스포리파제-트랜스아실라제 활성 (상기 효소는 유리 지방산을 리소인지질에 전달하여 인지질을 생성할 수 있음)을 둘다 보유한다는 점에서 독특하다. 형질전환체 야로위아 숙주 세포의 전체 오일 분획에 축적되는 DHA의 농도를 증가시키기 위해서는 이들 포스포리파제 중 1종 이상을 과발현하는 것이 유용할 수 있다. 이러한 영향은 포스포리파제가 신장 또는 트리글리세리드로의 혼입을 위해 PC로부터의 아실기를 CoA 풀에 방출하기 때문에 관찰된 것이라는 가설을 세웠다.
또다른 별법의 실시양태에서, 야로위아 리폴리티카의 바람직한 숙주 균주에서, 포스파티딜콜린 (PC) 생합성을 담당하는 CDP-콜린 경로의 효소가 DHA 생합성을 전반적으로 증가시키기 위한 수단으로서 조작될 수도 있다. 상기 기술의 유용성은 본 명세서에서 디아실글리세롤 콜린포스포트랜스퍼라제 (EC 2.7.8.2)를 코딩하는 야로위아 리폴리티카 CPT1 유전자의 과발현에 의해 야로위아 리폴리티카의 유전자 조작된 균주에서 EPA 생합성이 증가되는 것으로 입증된다. 당업자는 PC 생합성 경로를 잘 알고 있을 것이고, 다른 적절한 후보 효소를 인지하고 있을 것이다.
상기한 바와 같은 생화학적 경로를 조작하는 방법은 당업자에게 공지되어 있지만, 천연 유전자의 활성을 저하시키거나 없애기 위한 몇가지 기술의 개요를 이하에서 간략하게 제시할 것이다. 이들 기술은 상기 논의한 바와 같은 천연 야로위아 리폴리티카 Δ12 데새투라제, GPAT, LPAAT, DGAT1, DGAT2, PDAT, LPCAT, 아실-CoA 옥시다제 2 (Aco2 또는 Pox2), 아실-CoA 옥시다제 3 (Aco3 또는 Pox3) 및/또는 리파제 유전자의 활성을 하향 조절하는데 유용하다.
당업자는 천연 유전자의 활성을 저하시키거나 없애기 위해 사용될 가장 적절한 기술을 확인하겠지만, 일반적으로는 특정 유전자의 내인성 활성은 예를 들어 1) 표적 유전자 전체 또는 일부의 삽입, 치환 및/또는 결실에 의한 유전자 파괴, 2) 안티센스 서열을 유전자의 전사 생성물로 전사하기 위한 카세트의 제공, 3) 특이적 유전자 활성이 천연적으로 거의 없거나 전혀 없는 [또는 그러하도록 돌연변이된] 숙주 세포의 사용, 4) 돌연변이화된 헤테로서브유닛 (즉, 2종 초과의 헤테로서브유닛을 포함하는 효소의 것)을 과발현시켜서, "우성 음성 효과"에 의해 효소의 활성을 저하시킴, 및 5) iRNA 기술의 이용에 의해 저하 또는 제거될 수 있다. 일부 경우에서, 원치않는 유전자 경로의 억제는 특이적 억제제 (예컨대, 미국 특허 제4,778,630호에 기재된 것과 같은 데새투라제 억제제)의 사용을 통해 수행될 수도 있다.
유전자 파괴를 위해, 외래 DNA 단편 (전형적으로는 선별가능한 마커 유전자, 그러나 임의로는 발현시에 바람직한 표현형을 나타내는 키메라 유전자 또는 키메라 유전자 클러스터)을 파괴될 구조적 유전자에 삽입시켜서 그의 코딩 서열을 중단시키고 이에 의해 그 유전자를 기능적으로 불활성화시킨다. 파괴 카세트로 숙주 세포를 형질전환시키면, 기능적 천연 유전자가 기능적으로 파괴되지 않은 유전자와의 상동성 재조합에 의해 대체된다 (예컨대 문헌 [Hamilton et al. J. Bacteriol. 171:4617-4622 (1989)], [Balbas et al. Gene 136:211-213 (1993)], [Gueldener et al. Nucleic Acids Res. 24:2519-2524 (1996)] 및 [Smith et al. Methods Mol. Cell. Biol. 5:270-277(1996)] 참조).
안티센스 기술은 표적 유전자의 서열이 알려져 있는 경우에 유전자를 하향 조절하는 또다른 방법이다. 이를 수행하기 위해서, 원하는 유전자로부터의 핵산 절편을 클로닝하여 프로모터에 작동가능하게 연결시켜서 RNA의 안티센스 가닥이 전사되도록 한다. 이어서, 상기 구축물을 숙주 세포에 도입하고, RNA의 안티센스 가닥을 발현시킨다. 안티센스 RNA는 관심 단백질을 코딩하는 mRNA의 축적을 방해하여 유전자 발현을 억제한다. 당업자라면, 특정 유전자의 발현 저하를 위해서는 안티센스 기술의 이용에 대하여 특별히 고려해야 함을 알고 있을 것이다. 예를 들어, 안티센스 유전자의 발현 수준을 적당하게 하기 위해서는 당업자에게 공지된 상이한 조절 요소를 이용하는 여러 키메라 유전자의 사용이 필요할 수 있다.
표적화된 유전자 파괴 및 안티센스 기술은 공지 서열의 유전자를 하향 조절하는 효과적인 수단을 제공하지만, 서열-기재가 아닌 다른 덜 특이적 방법이 개발되어 왔다 (예컨대, UV 조사/화학 작용제 또는 위치전이성(transposable) 요소/트란스포손의 사용을 통한 돌연변이유발. 제WO 04/101757호 참조).
별법의 실시양태에서, 특정 유전자의 내인성 활성은 단백질의 발현을 조절하는 조절 서열의 조작에 의해 저하될 수 있다. 당업계에 공지된 바와 같이, 코딩 서열과 관련이 있는 조절 서열은 코딩 서열의 상류 (5' 비-코딩 서열), 내부, 또는 하류 (3' 비-코딩 서열)에 위치한 전사 및 번역 "조절" 뉴클레오티드 서열을 포함하며, 전사, RNA 가공 또는 안정성, 또는 관련된 코딩 서열의 번역에 영향을 미친다. 따라서, 특정 유전자의 조절 서열의 조작은 유전자의 프로모터, 번역 리더 서열, 인트론, 인핸서, 개시 조절 영역, 폴리아데닐화 인식 서열, RNA 가공 부위, 이펙터 결합 부위 및 스템-루프 구조의 조작을 지칭하는 것일 수 있다. 따라서, 예를 들어, DAG AT의 발현을 하향 조절하여 지질 및 오일 생합성의 비율 저하를 달성하기 위해서 DAG AT의 프로모터를 결실시키거나 파괴시킬 수 있다. 별법으로, DAG AT의 발현을 구동하는 천연 프로모터를, 프로모터 활성이 천연 프로모터에 비해 감소된 이종 프로모터로 치환될 수 있다. 조절 서열 조작에 유용한 방법은 당업자에게 공지되어 있다.
요약하면, 본원에서 교시된 내용을 이용하여, 형질전환체 유질 미생물 숙주는 DHA를 미생물 숙주 전체 지질의 약 5% 이상, 바람직하게는 DHA를 전체 지질의 약 10% 이상, 더욱 바람직하게는 DHA를 전체 지질의 약 15% 이상, 더욱 바람직하게는 DHA를 전체 지질의 약 20% 이상, 가장 바람직하게는 DHA를 전체 지질의 약 25 내지 30% 이상으로 생산할 것이다.
DHA
생산을 위한 발효 공정
형질전환된 미생물 숙주 세포는, 키메라 유전자 (예컨대, 데새투라제, 엘론가제, 아실트랜스퍼라제 등을 코딩함)의 발현을 최적화하고 DHA를 가장 많이 가장 경제적으로 수득하는 조건하에 성장시킨다. 일반적으로, 최적화될 수 있는 배지 조건으로는, 탄소 공급원의 유형과 양, 질소 공급원의 유형과 양, 탄소:질소 비율, 산소 수준, 성장 온도, pH, 생물체 생성기의 길이, 오일 축적기의 길이 및 세포 수확 시간 등이 있다. 야로위아 리폴리티카는 일반적으로 복합 배지 (예컨대, 효모 추출물-펩톤-덱스트로즈 브로쓰(broth) (YPD)) 또는 성장에 필요한 성분이 없어서 원하는 발현 카세트가 선별될 수 있도록 하는 규정된 최소 배지 (예컨대, 효모 질소 염기 (디프코 래버러토리즈(DIFCO Laboratories), 미국 미시간주 디트로이트 소재)) 중에서 성장한다.
본 발명에서의 발효 배지는 적합한 탄소 공급원을 함유해야 한다. 적합한 탄소 공급원으로는 단당류 (예컨대, 글루코스, 프럭토스), 이당류 (예컨대, 락토스, 수크로스), 올리고당류, 다당류 (예컨대, 전분, 셀룰로스 또는 이들의 혼합물), 당 알콜 (예컨대, 글리세롤) 또는 보완가능한 공급원료 (예컨대, 치즈 유장 투과물, 옥수수 침유(cornsteep liquor), 사탕무 당밀, 보리 맥아)로부터의 혼합물 등을 들 수 있으나 이에 제한되지 않는다. 추가로, 탄소 공급원은 알칸, 지방산, 지방산의 에스테르, 모노글리세리드, 디글리세리드, 트리글리세리드, 인지질 및 식물성 오일 (예컨대, 대두유) 및 동물 지방을 비롯한 지방산의 다양한 시판 공급원을 포함할 수 있다. 추가로, 탄소 공급원은 핵심적인 생화학적 중간체로의 대사 전환이 입증된 바 있는 1-탄소 공급원 (예컨대, 이산화탄소, 메탄올, 포름알데히드, 포르메이트 및 탄소-함유 아민)을 포함할 수 있다. 따라서, 본 발명에 이용되는 탄소 공급원은 광범위하게 다양한 탄소-함유 공급원을 포괄하는 것으로 고려된다. 상기 언급한 모든 탄소 공급원 및 이들의 혼합물이 본 발명에 적합하다고 예상되지만, 바람직한 탄소 공급원은 당 및/또는 지방산이다. 가장 바람직한 것은 글루코스 및/또는 10 내지 22개 탄소를 함유하는 지방산이다.
질소는 무기 (예컨대, (NH4)2SO4) 또는 유기 (예컨대, 우레아 또는 글루타메이트) 공급원으로부터 공급될 수 있다. 발효 배지는 적절한 탄소 및 질소 공급원 뿐만이 아니라 적합한 미네랄, 염, 보조인자, 완충제, 비타민, 및 유질 효모의 성장 및 DHA 생산에 필요한 효소 경로의 촉진에 적합하다고 당업계에 공지된 기타 성분도 함유해야 한다. 특히, 지질 및 PUFA의 합성을 촉진시키는 여러 금속 이온 (예컨대, Mn+2, Co+2, Zn+2, Mg+2)에 주목한다 [Nakahara, T. et al., Ind. Appl. Single Cell Oils, D. J. Kyle and R. Colin, eds. pp 61-97 (1992)].
본 발명에서 바람직한 성장 배지는 시판용으로 제조된 통상의 배지, 예컨대 효모 질소 염기 (디프코 래버러토리즈, 미국 미시간주 디트로이트 소재)이다. 다른 규정된 성장 배지 또는 합성 성장 배지가 사용될 수도 있고, 야로위아 리폴리티카의 성장에 적절한 배지는 미생물학 또는 발효 과학 분야의 당업자에게 공지되어 있다. 발효에 적합한 pH 범위는 전형적으로 약 pH 4.0 내지 pH 8.0이며, pH 5.5 내지 pH 7.0이 초기 성장 조건의 범위로서 바람직하다. 발효는 호기성 또는 혐기성 조건하에서 수행될 수 있고, 미호기성 조건이 바람직하다.
전형적으로, 유질 효모 세포 중 고수준의 PUFA의 축적은 2-단계 공정을 필요로하는데, 대사 상태가 성장 및 지방의 합성/저장 사이에서 "균형"을 이루어야 하기 때문이다. 따라서, 가장 바람직하게는, 야로위아 리폴리티카에서의 DHA 생산에 2-단계 발효 공정이 필요하다. 이러한 접근법은 제WO 2004/101757호에 다양한 적합한 발효 공정 디자인 (즉, 배치식, 공급형-배치식 및 연속식) 및 성장 동안의 고려사항으로서 기재되어 있다.
DHA
의 정제 및 가공
DHA를 비롯한 PUFA는 숙주 미생물 중에서 유리 지방산 또는 아실글리세롤, 인지질, 술포지질 또는 당지질 등과 같은 에스테르화 형태로 존재할 수 있으며, 당업계에 공지된 각종 수단을 통해 상기 숙주 세포로부터 추출될 수 있다. 효모 지질의 추출 기술, 품질 분석 및 허용 기준에 대한 검토 중 하나는 문헌 [Z. Jacobs (Critical Reviews in Biotechnology, 12(5/6):463-491 (1992))]이다. 하류 가공에 대한 간략한 검토는 또한 문헌 [A. Singh and O. Ward (Adv. Appl. Microbiol., 45:271-312 (1997))]에서도 찾을 수 있다.
일반적으로, DHA 및 다른 PUFA의 정제 수단으로는 유기 용매를 이용한 추출, 초음파처리, 초임계 유체 추출 (예컨대, 이산화탄소 사용), 비누화 및 압착과 같은 물리적 수단, 또는 이들의 조합 등을 들 수 있다. 추가의 세부사항에 대하여는 제WO 2004/101757호의 교시 내용을 참조한다.
정련되고/되거나 정제된 DHA를 함유하는 오일은 수소화되어 다양한 용융 성질 및 조직을 갖는 지방이 생성될 수 있다. 스프레드, 제과 지방, 고체 버터, 마가린, 베이킹 쇼트닝 등을 비롯한 많은 가공 지방에는 실온에서의 고화도 정도가 다양할 것이 요구되며, 공급원 오일의 물리적 성질을 변경하여야 생산될 수 있다. 이것은 가장 통상적으로 촉매적 수소화에 의해 달성된다.
수소화는 니켈과 같은 촉매의 보조하에 수소가 불포화 지방산 이중 결합에 첨가되는 화학 반응이다. 수소화는 2가지 주요 효과를 갖는다. 우선, 불포화 지방산 함량의 감소로 인해 오일의 산화적 안정성이 증가한다. 다음으로, 지방산 변형이 융점을 증가시켜서 실온에서 반액체 또는 고체인 지방을 초래하기 때문에, 오일의 물리적 성질이 변화된다.
수소화 반응에 영향을 미치고 따라서 최종 생성물의 조성을 변경시키는 변수는 많이 있다. 압력, 온도, 촉매 유형 및 농도, 교반 및 반응기 디자인 등을 비롯한 작업 조건은 조절될 수 있는 더 중요한 파라미터이다. 선택적인 수소화 조건이 이용되어 더 높은 수준으로 불포화된 지방산, 우선적으로는 덜 불포화된 지방산을 수소화할 수 있다. 매우 적은 정도 또는 약간의 수소화는 액체 오일의 안정성을 증가시키는데 흔히 이용된다. 추가의 수소화는 액체 오일을 물리적으로 고체인 지방으로 전환시킨다. 수소화 정도는 특정 최종 생성물에 대해 디자인된 원하는 성능 및 용융 특징에 따라 달라진다. 베이킹 제품의 제조에 사용되는 액체 쇼트닝, 상업적으로 튀기고 굽는 작업에 사용되는 고체 지방 및 쇼트닝, 및 마가린 제조를 위한 베이스 스톡(base stock)이 수소화를 통해 달성될 수 있는 무수한 오일 및 지방 생성물 중에 속한다. 수소화 및 수소화 생성물에 대한 보다 상세한 설명은 문헌 [Patterson, H. B. W., Hydrogenation of Fats and Oils: Theory and Practice. The American Oil Chemists' Society, 1994]에서 찾을 수 있다.
식료품에 사용하기 위한,
야로위아
리폴리티카의
DHA
-생산 균주
시장은 현재 ω-3 및/또는 ω-6 지방산 (특히 ARA, EPA 및 DHA)이 혼입된 매우 다양한 식품 및 사료 제품을 선호하고 있다. DHA를 포함하는 본 발명의 효모 미생물성 오일은 식품 및 사료 제품에서 이들 제제의 건강상의 이점을 부여하는 기능을 하는 것으로 고려된다.
본원에 기재한 효모 숙주에 의해 생산된 ω-3 및/또는 ω-6 지방산-함유 미생물성 오일은 식품 유사물, 육류 제품, 곡류 제품, 베이킹 식품, 스낵 식품, 및 유제품을 포함하지만 이에 제한되지 않는 각종 식품 및 사료 제품에서 사용하기에 적합할 것이다. 추가로, 본 발명의 미생물성 오일은 의료용 영양제, 식이 보조제, 유아용 조제식 및 또한 약제 생성물 등을 비롯한 의료용 식품에서 건강상의 이점을 부여하기 위한 제제에 사용될 수 있다. 식품 가공 및 식품 제제화 분야의 당업자는 소정량과 소정의 조성을 갖는 미생물성 오일이 식품 또는 사료 제품에 첨가될 수 있는 방법을 이해할 것이다. 이러한 양은 본원에서 "유효량"이라 지칭되며, 상기 생성물이 보충할 음식물인 식품 또는 사료 제품, 또는 의료용 식품 또는 의료용 영양제가 교정되거나 처치될 의학적 상태에 따라 달라질 것이다.
식품 유사물은 당업자에게 공지된 공정을 이용하여 제조될 수 있다. 육류 유사물, 치즈 유사물, 우유 유사물 등을 언급할 수 있다. 대두로부터 제조된 육류 유사물은 콩 단백질 또는 두부 및 다양한 종류의 육류를 모방하도록 함께 혼합된 다른 성분을 함유한다. 이들 육류 대안물은 냉동 식품, 통조림 식품 또는 건조 식품으로 판매된다. 통상적으로, 이들은 이것들이 대체할 식품과 동일한 방식으로 사용될 수 있다. 육류 유사물의 예로는 햄 유사물, 소시지 유사물, 베이컨 유사물 등이 있으나 이에 제한되지 않는다.
식품 유사물은 이들의 기능적 특성과 조성적 특성에 따라 대용물 또는 대체물로 분류될 수 있다. 예를 들어, 대용 치즈는 대체하도록 디자인된 치즈와 유사하기만 할 것이 요구된다. 그러나, 생성물이 치즈와 영양적으로 동등하고 치즈에 대한 최소 조성 요건을 대신하여 충족시키기만 한다면, 그 생성물은 통상적으로 대체용 치즈라고 불릴 수 있다. 따라서, 대체용 치즈는 종종 대용 치즈보다 단백질 수준이 더 높고 비타민과 미네랄이 강화되어 있다.
우유 유사물 또는 비-유제품 식품으로는 대용 우유 및 비-유제품 냉동 후식 (예컨대, 대두 및/또는 콩 단백질 생성물로부터 제조된 것) 등이 있으나 이에 제한되지 않는다.
육류 제품은 매우 다양한 생성물을 포함한다. 미국에서는 "육류"가 소, 돼지 및 양에서 얻은 "붉은 고기"를 포함한다. 붉은 고기뿐 아니라, 닭, 칠면조, 거위, 뿔닭, 오리 등을 비롯한 가금류 품목 및 어류와 조개류도 있다. 조리되고 가공된 육류 제품은 광범위하게 분류된다: 날 것, 보존처리되고 튀긴 것, 및 보존처리되고 요리된 것. 소시지 및 핫도그는 가공된 육류 제품의 예이다. 따라서, 본원에서 사용되는 용어 "육류 제품"은 가공된 육류 제품 등을 포함하지만 이에 제한되지 않는다.
시리얼 식품은 시리얼 곡물을 가공하여 유래된 식품이다. 시리얼 곡물은 식용 곡물 (종자)을 생성하는 목초류로부터의 임의의 식물을 포함한다. 가장 대중적인 곡물은 보리, 옥수수, 기장, 귀리, 퀴노아, 쌀, 호밀, 사탕수수, 라이밀, 밀 및 야생 벼이다. 시리얼 식품의 예로는 전립 곡물, 분쇄 곡물, 그릿(grits), 밀가루, 겨, 싹(germ), 아침식사용 시리얼, 압출식 식품, 파스타 등이 있으나 이에 제한되지 않는다.
베이킹 제품은 상기 언급한 임의의 시리얼 식품을 포함하며, 베이킹된 것이거나 베이킹과 유사한 방식으로 가공된 것, 즉 열을 가하여 건조 또는 경화시킨 것이다. 베이킹 제품의 예로는 빵, 케이크, 도넛, 바아(bars), 파스타, 빵가루, 베이킹 스낵, 미니-비스킷, 미니-크래커, 미니-쿠키, 및 미니-프레첼 등이 있으나 이에 제한되지 않는다. 상기 언급한 바와 같이, 본 발명의 오일이 성분으로 사용될 수 있다.
스낵 식품은 임의의 상기 또는 하기 식품을 포함한다.
튀긴 식품은 임의의 상기 또는 하기 튀긴 식품을 포함한다.
음료는 액체 또는 건조 분말 형태일 수 있다.
예를 들어, 과일 주스, (신선한 것, 냉동된 것, 캔에 들어 있거나 농축된 것), 향미료가 첨가되거나 첨가되지 않은 우유 드링크 등과 같은 비-탄산 음료가 언급될 수 있다. 성인 및 유아용 영양제는 당업계에 공지되어 있으며 시판되고 있다 (예컨대, 로스 프로덕츠 디비젼(Ross Products Division), 애보트 래버러토리즈(Abbott Laboratories)의 시밀락®, 엔슈어®, 제비티(Jevity®) 및 알리멘툼(Alimentum®)). 유아용 조제식은 유아와 영아에게 공급되는 액체 또는 재구성된 분말이다. 유아용 조제식은 모유를 대신한다. 유아용 조제식은 흔히 유아를 위한 유일한 영양 공급원이기 때문에, 유아용 조제식은 유아의 음식에서 특별한 역할을 한다. 유아에게는 수유가 여전히 가장 우수한 영양공급이지만, 유아용 조제식은 아기가 생존만 하게 하는 것이 아니라 성장하도록 하는데도 충분하다. 유아용 조제식은 모유에 점점 더 근접하고 있다.
유제품은 우유로부터 유래된 생성물이다. 우유 유사물 또는 비-유제품은 우유 이외의 공급원, 예를 들어 앞서 논의한 두유로부터 유래한다. 상기 생성물로는 전유(全乳), 탈지유, 발효유 제품, 예컨대 요구르트 또는 산미유(酸味乳), 크림, 버터, 연유, 탈수유(dehydrated milk), 커피 화이트너, 커피 크리머, 아이스크림, 치즈 등이 있으나 이에 제한되지 않는다.
본 발명의 DHA-함유 오일이 포함될 수 있는 추가의 식품으로는, 예를 들어 츄잉검, 제과류 및 프로스팅류(frostings), 젤라틴류 및 푸딩류, 경질 및 연질의 캔디, 잼 및 젤리, 과립화된 백설탕, 당 대체물, 달콤한 소스, 토핑류 및 시럽류, 및 건조 배합된 분말 혼합물 등이 있다.
건강 식품 및 약제
건강 식품은 건강상의 이점을 부여하는 임의의 식품이며, 기능성 식품, 의료용 식품, 의료용 영양제 및 식이 보조제 등이 있다. 추가로, 본 발명의 미생물성 오일은 표준 제약 조성물에 사용될 수 있다. 본 발명의 유전자 조작된 야로위아 리폴리티카 균주 또는 그로부터 생산된 DHA-포함 미생물성 오일은 상기 언급한 임의의 식품에 쉽게 혼입되어 예를 들어 기능적 식품 또는 의료용 식품을 생성할 수 있다. 예를 들어, DHA를 포함하는 보다 농축된 제제로는 인간 또는 인간 이외의 동물에서 식이 보조제로 사용될 수 있는 캡슐, 분말, 정제, 소프트겔, 겔캡, 액상 농축물 및 에멀젼 등이 있다.
식이 보조제에서의 용도
DHA를 포함하는 보다 농축된 제제로는 인간 또는 인간 이외의 동물에서 식이 보조제로 사용될 수 있는 캡슐, 분말, 정제, 소프트겔, 겔캡, 액상 농축물 및 에멀젼 등이 있다. 특히, 본 발명의 DHA-오일은 유아용 조제식 또는 아기 음식물과 같은 식이 보조제로 혼입시키는 데 특히 적합하다.
유아용 조제식은 유아와 영아에게 공급되는 액체 또는 재구성된 분말이다. 본원에서, "유아용 조제식"은 젖먹이 유아에서 모유를 대신할 수 있는 장용 영양 생성물로 정의되며, 전형적으로 수용액 중에서 원하는 백분율(%)의 탄수화물 및 단백질과 혼합된 원하는 백분율(%)의 지방으로 구성된다 (예컨대, 미국 특허 제4,670,285호 참조). 전 세계적인 조성 연구 및 전문가 그룹에 의해 규명된 수준을 기초로 할 때, 평균적인 모유는 전형적으로 총 지방산을 약 0.20% 내지 0.40%로 함유하며 (지방 칼로리의 약 50%로 추측됨), 일반적으로 DHA:ARA의 비율은 약 1:1 내지 1:2의 범위이다 (예컨대, 엔파밀 리필™(Enfamil LIPIL™) [미드 존슨 앤드 컴파니(Mead Johnson & Company)] 및 시밀락 어드밴스™(Similac Advance™) [로스 프로덕츠 디비젼, 애보트 래버러토리즈]의 제제 참조). 유아용 조제식은 흔히 유아를 위한 유일한 영양 공급원이기 때문에, 유아용 조제식은 유아의 음식에서 특별한 역할을 하며, 유아에게는 수유가 여전히 가장 우수한 영양공급이지만 유아용 조제식은 아기가 생존만 하게 하는 것이 아니라 성장하도록 하는데도 충분하다.
동물 사료에서의 용도
본원에서, 동물 사료는 인간 이외의 동물을 위한 사료로 사용되거나 사료에 혼합하기 위한 생성물을 총칭하여 정의된다. 그리고, 상기 언급된 바와 같이, 본 발명의 DHA-포함 오일은 다양한 동물 사료 중의 성분으로서 사용될 수 있다.
보다 구체적으로, 본 발명의 오일은 애완동물 사료, 반추 동물 및 가금류 사료, 및 양식용 사료 등을 포함하지만 이에 제한되지 않는 제품에 사용될 수 있다고 예측된다. 애완동물 사료는 애완동물 (예컨대, 개, 고양이, 새, 파충류, 설치류)에게 공급될 제품이고, 이들로는 상기한 시리얼 및 건강 식품 뿐만이 아니라 육류 및 육류 부산물, 콩 단백질 생성물, 목초 및 건초 제품 (예컨대, 자주개자리, 큰조아재비, 귀리 또는 브롬 그래스, 야채) 등이 있다. 반추 동물 및 가금류 사료는 예를 들어 칠면조, 닭, 소 및 돼지에게 공급될 제품이다. 상기한 애완동물 사료와 마찬가지로, 이들 제품은 앞서 언급한 시리얼 및 건강 식품, 콩 단백질 생성물, 육류 및 육류 부산물, 및 목초 및 건초 제품을 포함할 수 있다. 그리고, 양식 사료 (또는 "양식사료")는 신선한 물 또는 해양 물 중에서 수상 유기체 및/또는 동물을 증식, 배양 또는 사육하는 양식에 사용되는 제품이다.
대부분의 동물 사료 제제에는 ARA, EPA 및/또는 DHA를 고농도로 생산하는 본 발명의 유전자 조작된 야로위아 리폴리티카 균주를 포함시키는 것이 특히 유용할 것이라고 여겨진다. 필요한 ω-3 및/또는 ω-6 PUFA를 제공하는 것 이외에도, 상기 효모 그 자체가 동물의 전반적 건강 및 영양에 기여하고 제제의 맛을 증가시킬 수 있는 단백질 및 다른 영양분 (예컨대, 비타민, 미네랄, 핵산, 복합 탄수화물 등)의 유용한 공급원이다. 보다 구체적으로, 야로위아 리폴리티카 (ATCC #20362)에서 건조 세포 중량에 대한 백분율(%)로서의 대략적인 화학적 조성은 다음과 같다: 35% 단백질, 40% 지질, 10% 탄수화물, 5% 핵산, 5% 회분(ash) 및 5% 수분. 추가로, 탄수화물 분획 내에 β-글루칸은 대략 45.6 mg/g, 만나스는 대략 11.4 mg/g, 키틴은 대략 52.6 mg/g로 포함한다 (반면, 트레할로스는 소량 성분임 [대략 0.7 mg/g]).
상당한 문헌들에서 β-글루칸, 만나스 및 키틴의 면역 조정 효과가 조사된 바 있다. 키틴과 만나스는 둘다 유용한 면역자극제로서 유사하게 인식되지만, 박테리아 및 진균 세포벽의 주요 구성성분인 β-글루칸이 비-특이적 면역을 자극 (즉, "면역자극 효과")함으로써 양식 종, 애완 동물 및 농장 동물 및 인간의 건강을 개선시키는 수단이 가장 잘 연구되어 있다. 아주 간단하게 설명하면, 면역 반응의 전반적 향상은 β-글루칸의 사용으로 달성될 수 있는데, 이는 이들 β-1,3-D-폴리글루코스 분자가 백혈구 (예컨대, 대식세포, 호중구 및 단핵구)의 생성을 비-특이적 방식으로 자극함으로써 각종 병원성 항원 또는 환경적인 스트레서에 대한 민감도와 방어력을 증가시킬 수 있기 때문이다. 보다 구체적으로, 수많은 연구들은, β-글루칸이 바이러스, 박테리아, 진균 및 기생충 감염에 대한 보호력을 향상시키고, 항생제 및 백신과 병용될 때 보강 효과를 발휘하며, 창상 치유를 향상시키고, 유리 라디칼로 인한 손상을 호전시키고, 종양 퇴행을 향상시키고, 박테리아 내독소의 독성을 조정하며, 점막 면역을 강화시킨다는 것을 입증해 왔다 (문헌 [Raa, J. et al., Norwegian Beta Glucan Research, Clinical Applications of Natural Medicine. Immune: Depressions Dysfunction & Deficiency (1990)]에서 검토됨). 전통적인 동물 사육업 및 양식업 분야에 있어서 효모 β-글루칸, 만나스 및 키틴의 유용성을 문서화하고 있는 당업계 문헌의 예로는 [L.A. White et al. (J. Anim. Sci, 80:2619-2628 (2002)] (새끼 돼지를 위한 보충물), [K.S. Swanson et al. (J. Nutr. 132:980-989 (2002)] (개를 위한 보충물), [J. Ortuno et al. (Vet. Immunol. Immonopath. 85:41-50 (2002)] (도미(gilthead seabream)에게 투여된 온전한 사카로마이세스 세레비지애), [A. Rodriguez et al. (Fish Shell. Immuno. 16:241-249 (2004)] (도미에게 투여된 전장 무코르 써시넬로이데스), [M. Bagni et al. (Fish Shell. Immuno. 18:311-325 (2005) [(β-글루칸을 함유하는 효모 추출물을 함유하는, 농어(sea bass)를 위한 보충물), [J. Raa (In: Cruz - Suarez, L. E., Ricque-Marie, D., Tapia-Salazar, M., Olvera-Novoa, M.A. y Civera-Cerecedo, R., (Eds.). Avances en Nutricion Acuicola V. Memorias del V Simposium lnternacional de Nutricion Acuicola. 19-22 Noviembre, 2000. Merida, Yucatan, Mexico] (어류 및 조개류 사료에 면역-자극제를 사용하는 것에 대한 검토) 등이 있다.
야로위아 리폴리티카의 독특한 단백질:지질:탄수화물 조성 및 독특한 복합 탄수화물 프로파일 (대략 1:4:4.6 비율의 만난:β-글루칸:키틴을 포함함)을 기초로 하여, 본 발명의 유전적으로 유전자 조작된 효모 세포 (또는 그의 일부)는 동물 사료 제제에 유용한 첨가제라고 여겨진다 (예컨대, 온전한 [동결건조된] 효모 세포, 정제된 세포벽, 정제된 효모 탄수화물로서 사용되거나, 또는 다양한 다른 분획화 형태 중의 것으로 사용됨).
양식 산업과 관련하여, 다양한 어류 종에 대한 영양 요건의 이해가 높아지고 사료 제조에 있어서 기술적 진보가 이루어져서 양식 산업에서의 천연 사료를 보충하거나 대체하기 위해서 제조된 먹이 또는 인공 먹이 (제제화된 사료)를 개발하고 사용할 수 있게 되었다. 그러나, 일반적으로는 어류 양식용 사료에 포함된 다양한 영양분의 통상적인 비율은 (건조 먹이에 대한 백분율(%)로서 표현할 때) 32 내지 45%의 단백질, 4 내지 28%의 지방 (이 중 1 내지 2% 이상이 ω-3 및/또는 ω-6 PUFA임), 10 내지 30%의 탄수화물, 1.0 내지 2.5%의 미네랄 및 1.0 내지 2.5%의 비타민을 포함한다. 상기 제제에는 각종 다른 성분들이 임의로 첨가될 수 있다. 이들로는 (1) 살과 비늘의 색 각각을 향상시키기 위한 카로테노이드, 특히 연어류 및 관상용 "수족관" 어류를 위한 카로테노이드, (2) 펠렛에 안정성을 제공하고 영양분이 물로 침출되는 것을 저하시키기 위한 결합제 (예컨대, 소 심장, 전분, 셀룰로스, 펙틴, 젤라틴, 아라비아 고무, 로커스트 빈, 한천, 카르기닌 및 다른 알기네이트), (3) 어류 먹이의 저장 수명을 연장시키고 지방의 악취를 저하시키기 위한 보존제, 예컨대 항미생물제 및 항산화제 (예컨대, 비타민 E, 부틸화 히드록시아니솔, 부틸화 히드록시톨루엔, 에톡시퀸, 및 프로피온산, 벤조산 또는 소르브산의 나트륨염 및 칼륨염), (4) 사료의 맛과 그의 섭취를 향상시키기 위한 화학주성인자 및 향미료, 및 (5) 기타 먹이. 이들 다른 먹이는 먹이의 영양적 가치를 향상시키고 어류에 의한 섭취를 증가시키기 위해서 섬유 및 회분 (각각, 충전재 및 칼슘과 인의 공급원으로 사용하기 위함)과 같은 물질 및 식물성 물질 및/또는 어류 가루 또는 오징어 가루 (예컨대, 살아있거나, 냉동된 것이거나 또는 건조된 조류, 브라인 슈림프, 담륜충 또는 기타 동물성 플랑크톤) 등의 물질을 포함할 수 있다. 문헌 [Nutrient Requirements of Fish (National Research Council, National Academy: Washington D. C, 1993)]은 어류를 위한 필수 영양분 및 다양한 성분들의 영양분 함량에 대한 상세한 설명을 제공한다.
양식사료 제제의 제조에는 각종 인자를 고려할 것이 요구되는데, 완전한 먹이는 영양적으로 균형을 이루어야 하고, 맛이 좋아야 하며, 물에 안정적이어야 하고, 적당한 크기와 조직을 가져야 하기 때문이다. 양식사료의 영양분 조성과 관련하여서는 문헌 ([Handbook on Ingredients for Aquaculture Feeds (Hertrampf, J. W. and F. Piedad-Pascual. Kluwer Academic: Dordrecht, The Netherlands, 2000)] 및 [Standard Methods for the Nutrition and Feeding of Farmed Fish and Shrimp (Tacon, A. G. J. Argent Laboratories: Redmond, 1990)])을 참조한다. 일반적으로, 사료는 건조 (즉, 최종 수분 함량이 6 내지 10%), 반-습식 (즉, 35% 내지 40% 물 함량) 또는 습식 (즉, 50 내지 70% 물 함량) 상태가 되도록 제제화된다. 건조 사료는 건조 성분들이 단순히 섞여 있는 혼합물 (즉, "매쉬(mash)" 또는 "가루"), 압착형 펠렛, 부스러기 또는 과립, 및 플레이크를 포함한다. 어류의 먹이 공급 요건에 따라, 펠렛은 가라앉도록 제조될 수도 있고 또는 떠오르도록 제조될 수도 있다. 반-습식 사료 및 습식 사료는 단일 성분 또는 혼합 성분들 (예컨대, 잡어(trash fish) 또는 요리된 콩류)로 제조되고, 케이크나 볼로 성형될 수 있다.
여기서, 대부분의 양식용 사료에는 고농도의 DHA를 생산하는 본 발명의 유전자 조작된 야로위아 리폴리티카 균주를 포함시키는 것이 특히 유용할 것임은 명백하다. 필요한 ω-6 PUFA를 제공하는 것 이외에도, 상기 효모 그 자체는 제제의 맛을 증가시킬 수 있는 유용한 단백질 공급원이다. 별법의 실시양태에서, 본 발명의 야로위아 리폴리티카 균주에 의해 생산되는 오일은 상기 세포 덩어리로부터 추출 및 정제된 후에 양식용 사료 제제에 직접 도입될 수 있다.
바람직한 실시양태의 기재
본 발명은 유질 효모인 야로위아 리폴리티카가 전체 지질 분획 중 최대 5.6%로 DHA를 합성함을 입증한다. 도 5에 나타난 바와 같이, 다양한 유전자를 야생형 ATCC #20362 야로위아 리폴리티카에 통합하여 수많은 야로위아 리폴리티카 균주를 생성하였고, 각각의 형질전환체 균주는 PUFA (DHA 포함)를 상이한 양으로 생산할 수 있었다. 몇몇 대표적인 형질전환체 생물의 완전한 지질 프로파일을 하기 표 10에 나타내었다. 엘론가제는 다음과 같은 약어 명명법을 이용하여 표시한다: C18EL1은 고 친화성 C18 /20 엘론가제 (ELO1)를 지칭하고, C18EL2는 C18 /20 엘론가제 (ELO2)를 지칭하고, C16EL은 C16 /18 엘론가제를 지칭하며, C20EL은 C20 /22 엘론가제를 지칭한다. 지방산은 16:0, 16:1, 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA, EPA, DPA 및 DHA로 표시하였고, 각각의 조성은 전체 지방산의 백분율(%)로 제시하였다. "지질 % dcw"는 건조 세포 중량으로 측정한, 세포 중의 지질의 백분율(%)을 나타낸다.
상기 표에서 보인 바와 같이, DHA 생산 균주는 하기 기재된 유전자 변형을 포함하였다 (이들에 대한 더 상세한 사항은 실시예에 제공되어 있음):
(1) FBA::F.Δ12::LIP2 및 TEF::F.Δ12::PEX16 키메라 유전자 내 푸사륨 모닐리포르메 Δ12 데새투라제의 2개 카피의 발현,
(2) FBAIN::M.D12::PEX20 키메라 유전자 내 모르티에렐라 이사벨리나 Δ12 데새투라제의 1개 카피의 발현,
(3) TEF::Δ6S::LIP1 및 FBAIN::Δ6S::LIP1 키메라 유전자 내 모르티에렐라 알피나 Δ6 데새투라제로부터 유래된 합성 Δ6 데새투라제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 2개 카피의 발현,
(4) FBAIN::MAΔ5S::PEX20 및 TEF::MAΔ5S::LIP1 키메라 유전자 내 모르티에렐라 알피나 Δ5 데새투라제의 2개 카피의 발현,
(5) TEF::H.D5S::PEX16 및 GPAT::H.D5S::PEX20 키메라 유전자 내 호모 사피엔스 Δ5 데새투라제로부터 유래된 합성 Δ5 데새투라제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 2개 카피의 발현,
(6) TEF::I.D5S::PEX20 키메라 유전자 내 이소크리시스 갈바나 Δ5 데새투라제로부터 유래된 합성 Δ5 데새투라제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 1개 카피의 발현,
(7) FBAIN::Δ17S::LIP2, TEF::Δ17S::PEX20 및 FBAINm::Δ17S::PEX16 키메라 유전자 내 사프롤레그니아 디클리나 Δ17 데새투라제로부터 유래된 합성 Δ17 데새투라제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 3개 카피의 발현,
(8) FBAIN::EL1S::PEX20, GPAT::EL1S::XPR 및 GPDIN::EL1S::LIP2 키메라 유전자 내 모르티에렐라 알피나 고친화도 엘론가제로부터 유래된 합성 고친화도 C18 /20 엘론가제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 3개 카피의 발현,
(9) TEF::EL2S::XPR 키메라 유전자 내 트라우스토키트륨 아우레움 엘론가제로부터 유래된 합성 C18 /20 엘론가제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 1개 카피의 발현,
(10) TEF::rELO2S::PEX20 키메라 유전자 내 라투스 노르베기쿠스 rELO 유전자로부터 유래된 합성 C16 /18 엘론가제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 3개 카피의 발현,
(11) YAT1::Δ4S::Pex16 키메라 유전자 내 트라우스토키트륨 아우레움 Δ4 데새투라제 유전자로부터 유래된 합성 Δ4 데새투라제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 1개 카피의 발현,
(12) FBAIN::OtE2S::Oct 키메라 유전자 내 오스트레오코쿠스 타우리 C20 /22 엘론가제 유전자로부터 유래된 합성 C20 /22 엘론가제 유전자 (야로위아 리폴리티카에서의 발현을 위해 코돈-최적화됨)의 1개 카피의 발현,
(13) 오로티딘-5'-포스페이트 데카르복실라제를 코딩하는 천연 야로위아 리폴리티카 Ura3 유전자의 파괴,
(14) 이소프로필 말레이트 데히드로게나제를 코딩하는 천연 야로위아 리폴리티카 Leu2 유전자의 파괴,
(15) 아실-coA 옥시다제를 코딩하는 천연 야로위아 리폴리티카 Pox3 유전자의 파괴,
(16) Δ12 데새투라제를 코딩하는 천연 야로위아 리폴리티카 유전자의 파괴,
(17) 리파제 1을 코딩하는 천연 야로위아 리폴리티카 Lip1 유전자의 파괴, 및
(18) 아실-CoA 옥시다제를 코딩하는 천연 야로위아 리폴리티카 Pox2 유전자의 파괴.
본 발명자들은 야로위아 리폴리티카의 상기 특정 재조합 균주에서 5.6% DHA (여기서, 총 지방산에 대한 C22 지방산의 총 누적량(%)은 약 24%임)의 생산을 입증하였지만, 숙주 세포에서 DHA의 농도는 본 발명에 있어서 추가의 유전자 변형에 의해 극적으로 증가될 수 있는 것으로 고려된다. 추가로, 본원에서 기재한 교시 내용 및 결과를 기초로 하여, 유질 효모를 각종 ω-3 및/또는 ω-6 PUFA의 합성을 위한 생성 플랫폼으로서 사용하고, ω-6 Δ6 데새투라제/Δ6 엘론가제 경로 및/또는 ω-3 Δ6 데새투라제/Δ6 엘론가제 경로 및/또는 ω-6 Δ9 엘론가제/Δ8 데새투라제 경로 및/또는 ω-3 Δ9 엘론가제/Δ8 데새투라제 경로를 이용하여 생성되는 실행가능성 및 상업적 유용성을 인지할 것이라 예측된다.
본 발명은 하기 실시예에서 추가로 설명된다. 이들 실시예가 본 발명의 바람직한 실시양태를 나타내는 것이긴 하지만 이는 오직 예시하기 위한 것임을 이해해야 한다. 상기 논의 및 이들 실시예로부터, 당업자는 본 발명의 본질적 특성을 본 발명의 사상과 범위에서 벗어나지 않고 파악할 수 있을 것이고 본 발명에 각종 변화와 변형을 가하여 여러 용도 및 조건에 적합하게 할 수 있다.
통상의 방법
실시예에서 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 공지되어 있으며 하기 문헌에 기재되어 있다:
미생물 배양물의 유지 및 성장에 적합한 재료 및 방법은 당업계에 공지되어 있다. 하기 예에서 사용하기에 적합한 기술은 문헌 [Manual of Methods for General Bacteriology (Phillipp Gerhardt, R. G. E. Murray, Ralph N. Costilow, Eugene W. Nester, Willis A. Wood, Noel R. Krieg and G. Briggs Phillips, Eds), American Society for Microbiology: Washington, D. C. (1994)] 또는 문헌 [Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology, 2nd ed., Sinauer Associates: Sunderland, MA (1989)] 등에서 찾을 수 있다. 달리 명시하지 않는 한, 미생물 세포의 성장 및 유지에 사용되는 모든 시약, 제한 효소 및 재료는 알드리치 케미칼스(Aldrich Chemicals) (미국 위스콘신주 밀워키 소재), 디프코 래버러토리즈 (미국 미시간주 디트로이트 소재), GIBCO/BRL (미국 메릴랜드주 가이터스버그 소재) 또는 시그마 케미칼 컴퍼니(Sigma Chemical Company) (미국 미주리주 세인트 루이스 소재)로부터 얻었다.
이. 콜라이 (XL1-Blue) 감응성(competent) 세포는 스트라타진 컴퍼니(Stratagene Company) (미국 캘리포니아주 샌 디에고 소재)로부터 구입하였다. 이. 콜라이 균주는 전형적으로 37℃의 루리아 베르타니(Luria Bertani, LB) 플레이트에서 성장시켰다.
통상의 분자 클로닝은 표준 방법 [Sambrook et al., 상기 문헌]에 따라 수행하였다. 올리고뉴클레오티드는 시그마-제노시스(Sigma-Genosys) (미국 텍사스주 스프링 소재)가 합성한 것이었다. 개개의 PCR 증폭 반응은 총 부피를 50 ㎕로 하여 수행하였고, 달리 명시하지 않는 한은 PCR 완충제 (10 mM KCl, 10 mM (NH4)2SO4, 20 mM Tris-HCl (pH 8.75), 2 mM MgSO4, 0.1% 트리톤 X(Triton X)-100 함유), 100 ㎍/mL BSA (최종 농도), 200 μM씩의 각 데옥시리보뉴클레오티드 트리포스페이트, 각각의 프라이머 10 pmol 및 Pfu DNA 폴리머라제 (스트라타진, 미국 캘리포니아주 샌 디에고 소재) 1 ㎕를 포함하였다. 부위-지정 돌연변이유발은 스트라타진의 퀵체인지(QuickChange)™ 부위-지정 돌연변이유발 키트를 제조사의 지시에 따라 사용 하여 수행하였다. PCR 또는 부위-지정 돌연변이유발이 서브클로닝에 이용된 경우에는 상기 구축물에 대하여 서열결정을 수행하여 서열에 오류가 없음을 확인하였다. PCR 생성물을 프로메가(Promega) (미국 위스콘신주 매디슨 소재)의 pGEM-T-이지(pGEM-T-easy) 벡터에 클로닝하였다.
DNA 서열은 벡터 및 삽입물-특이적 프라이머의 조합물을 이용한 염료 종결자 기술 (미국 특허 제5,366,86호, 유럽 특허 제272,007호)을 이용하는 ABI 오토매틱 시퀀서(ABI Automatic sequencer)에서 생성하였다. 서열 교정(editing)은 시퀀서 (진 코드스 코포레이션, 미국 미시건주 앤 아버 소재)에서 수행하였다. 모든 서열은 양 방향으로 2배 이상의 범위를 포함한다. 유전자 서열의 비교는 DNASTAR 소프트웨어 (DNA 스타, 인크.(DNA Star, Inc.))를 이용하여 수행하였다. 별법으로, 유전자 서열의 조작은 제네틱스 컴퓨터 그룹 인크.(Genetics Computer Group Inc.) (위스콘신 패키지 버전 9.0, 제네틱스 컴퓨터 그룹 (GCG), 미국 위스콘신주 매디슨 소재)에서 구한 프로그램 스위트를 이용하여 수행하였다. GCG 프로그램 "Pileup"은 갭 생성 디폴트 값을 12로 하고 갭 신장 디폴트 값을 4로 하여 사용하였다. GCG "Gap" 또는 "Bestfit" 프로그램은 디폴트 갭 생성 패널티를 50으로 하고 디폴트 갭 신장 패널티를 3으로 하여 사용하였다. 달리 언급하지 않는다면, 모든 다른 경우에서도 상기한 GCG 프로그램 디폴트 파라미터를 사용하였다.
BLAST (Basic Local Alignment Search Tool, 문헌 ([Altschul, S. F., et al., J. Mol. Biol. 215:403-410 (1993)] 및 [Nucleic Acids Res. 25:3389-3402 (1997)])) 검색을 수행하여, BLAST "nr" 데이타베이스 내의 서열 (3-차원 구조 브 룩하벤 프로테인 데이타 뱅크(Brookhaven Protein Data Bank), SWISS-PROT 단백질 서열 데이타베이스, EMBL 및 DDBJ 데이타베이스로부터 유래된 서열인 모든 비-풍부 진뱅크 CDS 번역부를 포함함)과 유사성을 갖는 단리된 서열을 동정하였다. 서열은 모든 리딩 프레임에서 번역되었고, NCBI에서 제공된 BLASTX 알고리즘 [Gish, W. and States, D. J. Nature Genetics 3:266-272 (1993)]을 이용하여 상기 "nr" 데이타베이스 내의 모든 공개적으로 입수가능한 단백질 서열과의 유사성에 대해 비교하였다.
의문(query) 서열과 최대의 유사성을 갖는 서열을 정리한 BLAST 비교 결과는 동일성(%), 유사성(%) 및 기대값으로 보고된다. "동일성(%)"은 2종 단백질 사이에서 동일한 아미노산의 백분율(%)로 정의된다. "유사성(%)"은 2종 단백질 사이에서 동일하거나 보존된 아미노산의 백분율(%)로 정의된다. "기대값"은 매치수를 주어진 스코어로 표시하여 상기 매치의 통계적 유의성을 추정하는데, 해당 크기의 데이타베이스 검색시에 아주 우연하게 기대되는 값이다.
약어의 의미는 다음과 같다: "sec"은 초를 의미하고, "min"은 분을 의미하며, "h"는 시간을 의미하고, "d"는 일(日)수를 의미하고, "㎕"는 마이크로리터를 의미하고, "mL"은 밀리리터를 의미하고, "L"은 리터를 의미하고, "μM"은 마이크로몰농도를 의미하고, "mM"은 밀리몰농도를 의미하고, "M"은 몰농도를 의미하고, "mmol"은 밀리몰수를 의미하고, "μmol"은 마이크로몰수를 의미하고, "g"은 그램을 의미하고, "㎍"은 마이크로그램을 의미하고, "ng"은 나노그램을 의미하고, "U"는 유닛을 의미하고, "bp"는 염기쌍을 의미하며, "kB"는 킬로베이스를 의미한다.
야로위아
리폴리티카의
형질전환 및 배양
야로위아 리폴리티카 균주 ATCC #20362, #76982 및 #90812은 아메리칸 타입 컬쳐 콜렉션 (미국 메릴랜드주 록크빌 소재)로부터 구입하였다. 야로위아 리폴리티카 균주를 일반적으로 28℃의 YPD 아가 (1% 효모 추출물, 2% 박토펩톤, 2% 글루코스, 2% 한천)에서 성장시켰다. 별법으로, "SD" 배지는 아미노산 없이 암모늄 술페이트가 들어 있는 0.67% 효모 질소 염기 및 2% 글루코스를 포함한다.
야로위아 리폴리티카의 형질전환은 달리 언급하지 않는 한은 문헌 [Chen, D. C. et al. (Appl. Microbiol Biotechnol. 48(2):232-235 (1997)]의 방법에 따라 수행하였다. 간략하게 설명하면, 야로위아를 YPD 플레이트에 스트리킹(streaking)하여 30℃에서 대략 18시간 동안 성장시켰다. 세포를 백금이로 여러번 크게 떠서 플레이트로부터 긁어 내고, 50% PEG (평균 MW 3350) 2.25 mL, 2 M Li 아세테이트 (pH 6.0) 0.125 mL, 2 M DTT 0.125 mL 및 전단된 연어 정자 DNA 50 ㎍를 함유하는 형질전환 완충제 1 mL 중에 재현탁시켰다. 이어서, 선형화된 플라스미드 DNA 대략 500 ng을 재현탁된 세포 100 ㎕ 중에서 인큐베이션하고, 15분 간격으로 볼텍싱 혼합하면서 39℃에서 1시간 동안 유지시켰다. 세포를 선별 배지 플레이트에 플레이팅하고, 30℃에서 2일 내지 3일 동안 유지시켰다.
형질전환체 선별을 위해, 일반적으로 SD 배지 또는 최소 배지 ("MM")를 사용하였다. MM의 조성은 다음과 같다: 암모늄 술페이트 또는 아미노산이 없는 0.17% 효모 질소 염기 (디프코 래버러토리즈, 미국 미시간주 디트로이트 소재), 2% 글루코스, 0.1% 프롤린, pH 6.1). 적절하다면, 아데닌, 루이신, 리신 및/또는 우라실 의 보충제를 최종 농도 0.01%로 첨가하였다 (이로써 "MMA", "MMLe", "MMLy" 및 "MMU" 선별 배지가 생성됨. 각각 20 g/L 한천으로 제조됨).
별법으로, 형질전환체를 암모늄 술페이트 또는 아미노산이 없는 0.17% 효모 질소 염기 (디프코 래버러토리즈), 2% 글루코스, 0.1% 프롤린, 75 mg/L 우라실, 75 mg/L 유리딘, 900 mg/L FOA (자이모 리써치 코포레이션(Zymo Research Corp.), 미국 캘리포니아주 오렌지 소재) 및 20 g/L 한천을 포함하는 5-플루오로오로트산 ("FOA"; 또한, 5-플루오로우라실-6-카르복실산 1수화물) 선별 배지에서 선별하였다.
최종적으로, 유질성 조건을 촉진하기 위해 디자인된 "2-단계 성장 조건"을 위해서, 고농도 글루코스 배지 ("HGM")를 다음과 같이 제조하였다: 14 g/L KH2PO4, 4 g/L K2HPO4, 2 g/L MgSO4·7H2O, 80 g/L 글루코스 (pH 6.5). 균주는, 하기 프로토콜에 따라 "2-단계 성장 조건"하에서 배양하였다: 먼저, 세포를 30℃에서 액체 MM 중에서 250 rpm/분으로 48시간 동안 3벌로 진탕 성장시켰다. 세포를 원심분리로 수집하고, 액체 상등액을 추출하였다. 펠렛화된 세포를 HGM 중에 재현탁하고 72시간 또는 96시간 동안 30℃에서 250 rpm/분으로 진탕 성장시켰다. 세포를 다시 원심분리로 수집하고, 액체 상등액을 추출하였다.
"2-단계 성장 조건"을 위해 사용된 변형 배지는 "SD + AA" 배지였으며, 이것은 아미노산은 없지만 암모늄 술페이트가 함유된 6.7 g 효모 질소 염기, 20 g 글루코스, 및 1× 아미노산 혼합물 (20 mg/mL 아데닌 술페이트, 20 mg/mL 우라실, 20 mg/mL L-트립토판, 20 mg/mL L-히스티딘-HCL, 20 mg/mL L-아르기닌-HCL, 20 mg/mL L-메티오닌, 30 mg/mL L-티로신, 30 mg/mL L-루이신, 30 mg/mL L-이소루이신, 30 mg/mL L-리신-HCl, 50 mg/mL L-페닐알라닌, 100 mg/mL L-글루탐산, 100 mg/mL L-아스파르트산, 150 mg/mL L-발린, 200 mg/mL L-트레오닌 및 400 mg/mL L-세린)로 구성된 것이었다.
야로위아
리폴리티카의
지방산 분석
지방산 분석을 위해, 원심분리로 세포를 수집하고, 문헌 [Bligh, E. G. & Dyer, W. J. (Can. J. Biochem. Physiol. 37:911-917 (1959)]에 기재된 바와 같이 하여 지질을 추출하였다. 지질 추출물을 나트륨 메톡시드와 에스테르교환반응시켜서 지방산 메틸 에스테르를 제조하고 [Roughan, G., and Nishida I. Arch Biochem Biophys. 276(1):38-46 (1990)], 그 후에는 30-m × 0.25 mm (i.d.) HP-INNOWAX (휴렛-팩커드(Hewlett-Packard)) 컬럼이 장착된 휴렛-팩커드 6890 GC로 분석하였다. 오븐 온도는 170℃ (25분 동안 고정)에서부터 3.5℃/분씩 185℃로 하였다.
직접적인 염기 에스테르교환반응을 위해서, 야로위아 배양물 (3 mL)을 수확하여 증류수 중에서 1회 세척하고 스피드-백(Speed-Vac)에서 진공하에 5 내지 10분 동안 건조시켰다. 상기 샘플에 나트륨 메톡시드 (1%, 100 ㎕)를 첨가한 후에 상기 샘플을 볼텍싱하고 20분 동안 흔들어 주었다. 1 M NaCl 3 방울 및 헥산 400 ㎕를 첨가한 후, 샘플을 볼텍싱하고 회전시켰다. 상층을 취하여 상기한 바와 같이 GC로 분석하였다.
실시예
1
야로위아
리폴리티카에서의
고농도 발현을 위한 프로모터의 동정
TEF, GPD, GPDIN, GPM, GPAT, FBA, FBAIN 및 YAT1 프로모터의 프로모터 활성을 조사하는 비교 연구를, 각 프로모터 및 리포터 유전자로서 β-글루쿠로니다제 (GUS)를 코딩하는 이. 콜라이 유전자를 포함하는 구축물을 합성하여 수행하였다 [Jefferson, R.A. Nature. 14(342):837-838 (1989)]. 이어서, 조직화학적 및 형광측정 검정 [Jefferson, R. A. Plant Mol. Biol. Reporter 5:387-405 (1987)] 및/또는 mRNA 정량화를 위한 실시간 PCR로 GUS 활성을 측정하였다.
키메라
프로모터::
GUS
::
XPR
유전자를 포함하는 플라스미드의 구축
플라스미드 pY5-30 (도 6A, 서열 154)은 야로위아 자가 복제 서열 (ARS18), ColE1 플라스미드 복제 기점, 이. 콜라이에서의 선별을 위한 앰피실린-내성 유전자 (AmpR), 야로위아에서의 선별을 위한 야로위아 LEU2 유전자, 및 키메라 TEF::GUS::XPR 유전자를 함유하였다. 상기 플라스미드를 기초로 하여, TEF 프로모터가 각종 다른 천연 야로위아 리폴리티카 프로모터로 대체된 일련의 플라스미드를 제작하였다.
하기 표 11에 나타낸 프라이머를 사용하고 주형으로서는 게놈 야로위아 리폴리티카 DNA 또는 pGEM-T-이지 벡터 (프로메가, 미국 위스콘신주 매디슨 소재)에 클로닝된 적절한 영역의 DNA를 함유하는 게놈 DNA의 단편을 사용하여 추정적 프로모터 영역을 PCR로 증폭시켰다:
키메라 프로모터:: GUS :: XPR 유전자를 포함하는 플라스미드의 구축 | ||||
프로모터 | 프라이머 | 유전자에 대한 위치 | RE 부위 | 플라스미드 명칭 |
GPD | YL211, YL212 (서열 225 및 226) | gdp 유전자의 -968 bp 내지 'ATG' 번역 개시 부위 (서열 210) | SalI 및 NcoI | pYZGDG |
GPDIN | YL376, YL377 (서열 227 및 228) | gdp 유전자 부근의 -973 bp 내지 +201 bp (이로써 위치 +49 bp 내지 +194 bp에 위치한 146 bp 인트론을 포함함) (서열 211) | PstI/NcoI (프로모터용), 및 PstI/SalI (벡터용) | pDMW222 |
GPM | YL203, YL204 (서열 229 및 230) | gmp 유전자의 -875 bp 내지 'ATG' 번역 개시 부위 (서열 212) | NcoI 및 SalI | pYZGMG |
GPAT | GPAT-5-1, GPAT-5-2 (서열 231 및 232) | gpat 유전자의 -1130 bp 내지 'ATG' 번역 개시 부위 (서열 216) | SalI 및 NcoI | pYGPAT-GUS |
FBA | ODMW314, YL341 (서열 233 및 234) | fba 유전자 부근의 -1001 bp 내지 -1 bp (서열 213) | NcoI 및 SalI | pDMW212 |
FBAIN | ODMW320, ODMW341 (서열 235 및 236) | fba 유전자 부근의 -804 bp 내지 +169 bp (이로써 +62 bp 내지 +165 bp에 위치한 102 bp 인트론을 포함함) (서열 214) | NcoI 및 SalI | pDMW214 |
YAT1 | 27203-F, 27203-R (서열 237 및 238) | yat1 유전자 부근의 -778 bp 내지 -1 bp (서열 217) | HindIII 및 SalI, 또한 NcoI 및 HindIII | pYAT-GUS |
주: 'ATG' 번역 개시 코돈의 'A' 뉴클레오티드를 +1로 함. |
GPD, GPDIN, GPM, FBA 및 FBAIN에 대한 개개의 PCR 증폭 반응은 총 부피를 50 ㎕로 하여 상기 '통상의 방법' 항목에 기재한 바와 같이 수행하였다. 열순환기 조건은 95℃에서 1분, 56℃에서 30초 및 72℃에서 1분의 35 주기 후에 72℃에서 10분의 최종 신장으로 설정하였다.
GPAT 프로모터에 대한 PCR 증폭은 예비혼합된 2× PCR 용액 (다까라 바이오 인크.(TaKaRa Bio Inc.), 일본 520-2193 시가 오쯔 소재)의 1:1 희석물을 이용하여 총 부피를 50 ㎕로 하여 수행하였다. 최종 조성물은 25 mM TAPS (pH 9.3), 50 mM KCl, 2 mM MgCl2, 1 mM 2-머캅토에탄올, 200 μM씩의 각 데옥시리보뉴클레오티드 트리포스페이트, 10 pmol씩의 각 프라이머, 50 ng 주형 및 1.25 U 다까라 Ex Taq™ DNA 폴리머라제 (다까라 미루스 바이오(Takara Mirus Bio), 미국 위스콘신주 매디슨 소재)를 함유하였다. 열순환기 조건은 94℃에서 2.5분, 55℃에서 30초 및 72℃에서 2.5분의 30 주기 후에 72℃에서 6분의 최종 신장으로 설정하였다.
YAT1 프로모터에 대한 PCR 증폭은 GPAT에 대하여 상기한 것과 유사한 조성물 중에서 수행하였다. 반응 혼합물을 우선 94℃로 150초 동안 가열하였다. 증폭은 94℃에서 30초, 55℃에서 30초 및 72℃에서 1분의 30 주기 후에 72℃에서 7분의 최종 신장으로 하여 수행하였다.
각 PCR 생성물을 퀴아젠(Qiagen) PCR 정제 키트로 정제한 후에 제한 효소를 사용하여 소화시키고 (표준 조건을 이용하여 상기한 표에 따라 수행함), 소화 생성물을 1% (w/v) 아가로스 중에서의 겔 전기영동으로 정제하였다. 이어서, 소화 PCR 생성물 (YAT1로부터의 생성물은 제외)을 유사하게 소화시킨 pY5-30 벡터로 라이게이션하였다. 이어서, 각 반응물의 라이게이션된 DNA를 사용하여 이. 콜라이 Top10, 이. 콜라이 DH10B 또는 이. 콜라이 DH5α을 개별적으로 형질전환시켰다. 앰피실린 (100 ㎍/mL)을 함유하는 LB 아가에서 형질전환체를 선별하였다.
YAT1은 pY5-30으로의 클로닝 이전에 추가의 조작이 필요하였다. 구체적으로, YAT1 PCR 생성물을 HindIII 및 SalI으로 소화시키면 약 600 bp 단편이 생성되었고, NcoI 및 HindIII으로 소화시키면 약 200 bp 단편이 생성되었다. 두가지 생성물 모두를 단리하여 정제하였다. 이어서, 플라스미드 pYGPAT-GUS를 SalI 및 NcoI으로 소화시키고, 약 9.5 kB 단편을 단리 및 정제하였다. 상기 3가지 DNA 단편을 함께 라이게이션하여 pYAT-GUS를 생성하였다.
각 형질전환 반응물의 플라스미드 DNA를 분석하여 예측된 플라스미드의 존재를 확인하였다. 이들 플라스미드를 다음과 같이 칭하였다: pYZGDG (GPD::GUS::XPR 키메라 유전자를 포함함), pDMW222 (GPDIN::GUS::XPR 키메라 유전자를 포함함), pYZGMG (GPM::GUS::XPR 키메라 유전자를 포함함), pYGPAT-GUS (GPAT::GUS::XPR 키메라 유전자를 포함함), pDMW212 (FBA::GUS::XPR 키메라 유전자를 포함함), pDMW214 (FBAIN::GUS::XPR 키메라 유전자를 포함함) 및 pYAT-GUS (YAT1::GUS::XPR 키메라 유전자를 포함함).
상기 '통상의 방법' 항목에 기재한 바와 같이, 상기 각 플라스미드 및 추가의 플라스미드 pY5-30 (TEF::GUS::XPR 키메라 유전자를 포함함)를 개별적으로 야로위아 리폴리티카에 형질전환시켰다. 야로위아 리폴리티카 숙주는 야로위아 리폴리티카 ATCC #76982 또는 야로위아 리폴리티카 ATCC #20362, 균주 Y2034 (하기함 [실시예 13], Δ6 데새투라제/Δ6 엘론가제 경로를 통해 ARA를 10%로 생산할 수 있음)였다. 형질전환된 모든 세포를 루이신이 없는 최소 배지 플레이트에 플레이팅하여 30℃에서 2 내지 3일 동안 유지시켰다.
GUS
발현의 조직화학적 분석에 의한
야로위아
프로모터들의 비교 분석
플라스미드 pY5-30, pYZGDG, pYZGMG, pDMW212 및 pDMW214를 함유하는 야로위아 리폴리티카 ATCC #76982 균주들을 MM 3 mL 중의 단일 콜로니로부터 30℃에서 OD600 약 1.0으로 성장시켰다. 이어서, 세포 100 ㎕를 원심분리로 수집하여, 조직화학적 염색 완충제 100 ㎕ 중에 재현탁하고 30℃에서 인큐베이션하였다. 염색 완충제는 5-브로모-4-클로로-3-인돌릴 글루쿠로나이드 (X-Gluc) 5 mg을 디메틸 포름아미드 50 ㎕ 중에 용해한 후에 50 mM NaPO4 (pH 7.0) 5 mL를 가하여 제조하였다. 조직화학 염색 결과 (도 6B)는 구축물 pY5-30 중의 TEF 프로모터, 구축물 pYZGDG 중의 GPD 프로모터, 구축물 pYZGMG 중의 GPM 프로모터, 구축물 pDMW212 중의 FBA 프로모터, 및 구축물 pDMW214 중의 FBAIN 프로모터 모두가 활성임을 보여준다. FBA 프로모터와 FBAIN 프로모터 둘다가 모든 다른 프로모터보다 훨씬 강력하며, FBAIN 프로모터가 가장 강력한 프로모터 활성을 보유하는 것으로 여겨졌다.
별도의 실험에서, 플라스미드 pY5-30, pYGPAT-GUS, pYAT-GUS 및 pDMW214를 함유하는 야로위아 리폴리티카 Y2034 균주들을 SD 배지 5 mL 중의 단일 콜로니로부터 30℃에서 24시간 동안 OD600 약 8.0으로 성장시켰다. 이어서, 세포 1 mL를 원심분리로 수집하였다. 나머지 배양물을 원심분리하여 HGM으로 2회 세척하고, 각각 5 mL씩의 HGM 중에 재현탁하고, 30℃에서 추가로 성장시켰다. 24시간 및 120시간 후에, 각 배양물 약 0.25 mL씩을 원심분리하여 세포를 수집하였다. 세포 샘플을 조직화학적 염색 완충제 (상기) 100 ㎕ 중에 개별적으로 재현탁하였다. 각각에 자이몰라제(Zymolase) 2OT (1 mg/mL 5 ㎕; ICN 바이오메디칼스(ICN Biomedicals), 미국 캘리포니아주 코스타 메사 소재)를 가하고, 혼합물을 30℃에서 인큐베이션하였다.
조직화학적 염색 결과는, SD 배지 중에서 24시간 동안 성장시킨 경우, 구축물 pYAT-GUS 중의 YAT1 프로모터가 활성인 것처럼 구축물 pYGPAT-GUS 중의 GPAT 프로모터가 활성임을 보여준다 (도 6C, "SD 배지 중 24시간"). 비교하면, GPAT 프로모터가 TEF 프로모터보다는 훨씬 더 강력하고 FBAIN 프로모터에 비하여는 활성이 낮다고 여겨졌다. 마찬가지로, 세포를 SD 배지 중에서 24시간 동안 성장시킨 경우, YAT1 프로모터는 TEF 프로모터보다는 더 강력하였으나 FBAIN 프로모터 및 GPAT 프로모터보다는 유의하게 더 약한 것으로 여겨졌다. 그러나 더 흥미롭게도, HGM 중에서 24시간 동안 성장시킨 세포 중에서 YAT1 프로모터는 GPAT 프로모터보다 더 강력하고 FBAIN 프로모터에 필적하는 것으로 여겨졌다 (도 6C, "HG 배지 중 24시간"). 이것은 HGM 중에서 120시간이 지난 후에도 마찬가지였다 (도 6C, "HG 배지 중 120시간"). 따라서, YAT1 프로모터는 질소 제한으로 인해 유질 성장 조건을 촉진시키는 배지인 HGM 중에서 유도되는 것으로 여겨졌다.
GUS
발현의 형광측정 검정에 의한
야로위아
프로모터의 비교 분석
또한, GUS 활성을, 상응하는 기질 β-글루쿠로나이드로부터의 4-메틸룸벨리페론 (4-MU) 생성을 형광 측정함으로써 검정하였다 [Jefferson, R. A. Plant Mol. Biol. Reporter 5:387-405 (1987)].
플라스미드 pY5-30, pYZGDG, pYZGMG, pDMW212 및 pDMW214를 함유하는 야로위아 리폴리티카 ATCC #76982의 균주들을 3 mL MM (상기한 바와 같음) 중의 단일 콜로니로부터 30℃에서 OD600 약 1.0으로 성장시켰다. 이어서, 3 mL 배양물 각각을 50 mL MM을 함유하는 500 mL 플라스크에 첨가하고 30℃의 진탕 인큐베이터 중에서 약 24시간 동안 성장시켰다. 세포를 원심분리로 수집하여 프로메가 세포 용해 완충제 중에 재현탁하고 Bio101 바이오풀버라이저(BioPulverizer) 시스템 (비스타(Vista), 미국 캘리포니아주 소재)을 사용하여 용해시켰다. 원심분리 후, 상등액을 취하여 얼음상에 보관하였다.
유사하게, 플라스미드 pY5-30, pYAT-GUS, pYGPAT-GUS 및 pDMW214 구축물 각각을 함유하는 야로위아 리폴리티카 균주 Y2034를 10 mL SD 배지 중의 단일 콜로니로부터 30℃에서 OD600 약 5.0으로 48시간 동안 성장시켰다. 각 배양물 2 mL를 하기하는 GUS 활성 검정을 위해 수집하였고, 각 배양물 5 mL는 HGM으로 변경했다.
구체적으로, 5 mL 분취액으로부터의 세포를 원심분리로 수집하고, HGM 5 mL로 1회 세척하여 HGM 중에 재현탁하였다. 이어서, HGM 중의 배양물을 30℃의 인큐베이터에서 24시간 동안 진탕 성장시켰다. GUS 활성 검정을 위해 각 HGM 배양물 2 mL씩을 수집하였고, 나머지 배양물은 추가의 96시간 동안 더 성장시킨 후에 검정을 위해서 각 배양물을 2 mL씩 더 수집하였다.
SD 배지 중 2 mL씩의 배양물 샘플을 0.5× 세포 배양물 용해 시약 (프로메가) 1 mL 중에 재현탁하였다. 재현탁된 세포를 고무 O-링이 장착된 2.0 mL 스크류 캡 튜브 중에서 유리 비드 (0.5 mm 직경) 0.6 mL와 혼합하였다. 이어서, 상기 세포를 바이오스펙 미니 비드비터(Biospec mini beadbeater) (미국 오클라호마주 바르틀레스빌 소재)에서 90초 동안 가장 높은 셋팅으로 균질화했다. 균질화 혼합물을 에펜도르프(Eppendorf) 원심분리기에서 2분 동안 14,000 rpm으로 원심분리하여 세포 파편 및 비드를 제거하였다. 상등액을 이용하여 GUS 검정 및 단백질 결정을 수행하였다.
각각의 형광측정 검정을 위해, 추출물 100 ㎕를 GUS 검정 완충제 (추출 완충제 중 2 mM 4-메틸룸벨리페릴-β-D-글루쿠로나이드 ("MUG")) 700 ㎕에 첨가하거나, 또는 추출물 200 ㎕를 GUS 검정 완충제 800 ㎕에 첨가하였다. 상기 혼합물을 37℃로 유지시켰다. 0분, 30분 및 60분 시점에서 분취액을 100 ㎕씩 취하여 중지 완충제 (1 M Na2CO3) 900 ㎕에 첨가하였다. 각 시점에 여기 파장은 360 nm로 하고 방출 파장은 455 nm로 하여 설정된 사이토플루어 시리즈 4000 플루오레슨스 멀티-웰 플레이트 리더(CytoFluor Series 4000 Fluorescence Multi-Well Plate Reader) (퍼셉티브 바이오시스템즈(PerSeptive Biosystems), 미국 매사추세츠주 프레이밍햄 소재)를 이용하여 판독하였다. 각 샘플의 총 단백질 농도를, 추출물 10 ㎕와 바이오라드 브래드포드(BioRad Bradford) 시약 200 ㎕를 사용하거나 또는 추출물 20 ㎕와 바이오라드 브래드포드 시약 980 ㎕를 사용하여 결정하였다 [Bradford, M. M. Anal. Biochem. 72:248-254 (1976)]. GUS 활성은 단백질 1 mg 당 1분 당의 4-MU 나노몰(nmol)로 표시하였다.
야로위아 리폴리티카 ATCC #76982 균주에서 TEF, GPD, GPM, FBA 및 FBAIN 프로모터를 비교하도록 디자인된 이들 형광측정 검정의 결과를 도 7A에 나타내었다. 구체적으로, FBA 프로모터는 야로위아 리폴리티카에서 GPD 프로모터보다 2.2배 더 강력하였다. 추가로, FBAIN 프로모터의 GUS 활성은 GPD 프로모터보다 약 6.6배 더 강력하였다.
야로위아 리폴리티카 균주 Y2034에서 TEF, GPAT, YAT1 및 FBAIN 프로모터를 비교하도록 디자인된 이들 형광측정 검정의 결과를 하기 표에 나타내었다:
다양한 성장 조건하에서 TEF , FBAIN . YAT1 및 GPAT 프로모터의 활성 비교 | ||||
배양 조건 | 프로모터 | |||
TEF | FBAIN | YAT1 | GPAT | |
48시간, SD | 0.401 | 43.333 | 0.536 | 5.252 |
24 시간, HGM | 0.942 | 30.694 | 19.154 | 2.969 |
120시간, HGM | 0.466 | 17.200 | 13.400 | 3.050 |
세포 추출물의 GUS 활성을 기준으로 YAT1 프로모터의 활성을 정량한 상기 데이타에 기초할 때, YAT1 프로모터의 활성은 세포를 SD 배지에서 HGM으로 변경하여 24시간 동안 성장시킬 경우에 약 37배 증가하였다. HGM 중에서 120시간이 지난 후, 상기 활성은 다소 감소하였으나 SD 배지 중에서의 활성에 비해 여전히 25배 더 높았다. 반대로, FBAIN 프로모터 및 GPAT 프로모터의 활성은 SD 배지에서 HGM으로 변경하여 24시간 동안 성장시킬 경우에 각각 30% 및 40% 감소하였다. TEF 프로모터의 활성은 HGM 중에서 24시간이 지난 후에 2.3배 증가하였다. 따라서, YAT1 프로모터는 유질 조건하에서 유도가능하다.
GUS
발현의 정량적
PCR
분석에 의한
야로위아
프로모터의 비교 분석
TEF, GPD, GPDIN, FBA 및 FBAIN 프로모터의 전사 활성을 pY5-30, pYZGDG, pDMW222, pDMW212 및 pDMW214 구축물을 함유하는 야로위아 리폴리티카 중에서 정량적 PCR 분석으로 측정하였다. 이를 위해서는 RNA의 단리 및 실시간 RT-PCR이 필요했다.
보다 구체적으로, pY5-30, pYZGDG, pDMW222, pDMW212 및 pDMW214를 함유하는 야로위아 리폴리티카 ATCC #76982 균주를 25 mL 에를렌마이어(Erlenmeyer) 플라스크 중의 MM 6 mL에서 16시간 동안 30℃에서 단일 콜로니로부터 성장시켰다. 이어서, 6 mL 출발 배양물 각각을 HGM 140 mL를 함유하는 개개의 500 mL 플라스크에 첨가하고 30℃에서 4일 동안 인큐베이션시켰다. 각각 24시간씩의 간격을 두고, 각 플라스크로부터 배양물을 1 mL씩 취하여 광학 밀도를 측정하였고, 27 mL를 취하여 형광측정 GUS 검정 (상기한 바와 같음)에 사용하였으며, RNA 단리를 위해 1.5 mL씩의 2개 분취액을 취하였다. RNA 단리를 위한 배양물은 원심분리하여 세포 펠렛을 생성하였다.
변형된 퀴아젠 RNeasy 미니 프로토콜(RNeasy mini protocol) (퀴아젠, 미국 캘리포니아주 샌 디에고 소재)에 따라, 야로위아 균주로부터 RNA를 단리하였다. 간략하게 설명하면, 각 샘플마다 각 시점에서 퀴아젠 완충제 RLT 340 ㎕를 사용하여 2개의 세포 펠렛 각각을 재현탁했다. 2개 튜브 각각으로부터의 완충제 RLT/세포 현탁액 혼합물을 비드 비팅(beating) 튜브 (Bio101, 미국 캘리포니아주 샌 디에고 소재)에서 합하였다. 0.5 mL 유리 비드 약 500 ㎕를 상기 튜브에 넣고, 설정치 5에서 2분 동안의 비드 비팅으로 세포를 파괴하였다 (바이오풀버라이저, Bio101 컴파니, 미국 캘리포니아주 샌 디에고 소재). 이어서, 파괴된 세포를14,000 rpm에서 1분 동안 원심분리하여 펠렛화하고, 상등액 350 ㎕를 새로운 마이크로원심분리 튜브에 옮겼다. 각각의 균질화된 용해물에 에탄올 (70%, 350 ㎕)을 첨가하였다. 완만한 혼합 후, 전체 샘플을 2 mL 수집 튜브 중의 RNeasy 미니 컬럼에 첨가하였다. 상기 샘플을 15초 동안 10,000 rpm에서 원심분리하였다. 완충제 RW1 (350 ㎕)을 RNeasy 미니 컬럼에 첨가하고, 상기 컬럼을 15초 동안 10,000 rpm에서 원심분리하여 세포를 세척하였다. 용출액은 버렸다. 퀴아젠의 DNase1 스톡(stock) 용액 (10 ㎕)을 완충제 RDD 70 ㎕에 첨가하고 완만하게 혼합하였다. 상기 전체 DNase 용액을 RNeasy 미니 컬럼에 첨가하고 실온에서 15분 동안 인큐베이션시켰다. 인큐베이션 단계 후에는 완충제 RW1 350 ㎕를 상기 미니 컬럼에 첨가하고, 컬럼을 15초 동안 10,000 rpm에서 원심분리하였다. 상기 컬럼을 완충제 RW1 700 ㎕로 2회 세척하였다. RNase-무함유 물 (50 ㎕)을 컬럼에 첨가하였다. 컬럼을 1분 동안 10,000 rpm에서 원심분리하여 RNA를 용출시켰다.
2-단계 RT-PCR 프로토콜을 이용하였고, 이때 전체 야로위아 RNA를 우선 cDNA로 전환시킨 후에 cDNA를 실시간 PCR로 분석하였다. cDNA로의 전환은 어플라이드 바이오시스템즈(Applied Biosystems)의 하이 캐퍼서티 cDNA 아르키브(High Capacity cDNA Archive) 키트 (PN#4322171; 미국 캘리포니아주 포스터 시티 소재) 및 미디아테크, 인크.(MediaTech, Inc.)의 분자생물학 등급 물 (PN# 46-000-Con; 미국 플로리다주 홀리 힐 소재)을 이용하여 수행하였다. 야로위아로부터 얻은 전체 RNA (100 ng)를 RT 완충제 10 ㎕, 25× dNTP 4 ㎕, 10× 랜덤 헥사머(Random Hexamer) 프라이머 10 ㎕, 멀티스크라이브 리버스 트랜스크립타제(Multiscribe Reverse Transcriptase) 5 ㎕ 및 RNase 인히비터(Inhibitor) 0.005 ㎕와 혼합하고 물을 사용하여 총 반응 부피를 100 ㎕로 맞추어 cDNA로 전환시켰다. 상기 반응물을 열순환기 중에서 10분 동안 25℃에서 인큐베이션한 후에 2시간 동안 37℃에서 인큐베이션했다. 실시간 분석 이전에는 cDNA를 -20℃에서 보관하였다.
실시간 분석은 어플라이드 바이오시스템즈의 SYBR 그린 PCR 마스터 믹스(SYBR Green PCR Master Mix) (PN# 4309155)로 수행하였다. 역전사 반응물 (2 ㎕)을 2× SYBR PCR 믹스 10 ㎕, URA (즉, 프라이머 YL-URA-16F 및 YL-URA-78R [서열 239 및 서열 240]) 또는 GUS (즉, 프라이머 GUS-767F 및 GUS-891R [서열 241 및 서열 242])를 위한 100 μM의 전방향 및 역방향 프라이머 0.2 ㎕ 및 물 7.2 ㎕에 첨가하였다. 상기 반응물을 ABI 7900 시퀀스 디텍션 시스템(Sequence Ditection System) 기기에서 10분 동안 95℃로 열주기(thermocycle) 적용시킨 후, 95℃에서 5초 및 60℃에서 1분으로 하여 40회 주기를 실시하였다. 각각의 주기 중 60℃ 신장 동안의 실시간 형광 데이타를 수집하였다.
상대적 정량화는 유저 블러틴(User Bulletin) #2 ("유전자 발현의 상대적 정량화", 어플라이드 바이오시스템즈, 2001년 10월 업데이트)에 따라 ΔΔCT 방법으로 수행했다. 상기 URA 유전자를 이용하여 GUS 발현을 표준화하였다. 표준물 유전자로서의 URA 용도를 확인하기 위해서 GUS 및 URA의 PCR 효율을 비교하였고, 이들은 각각 1.04 및 0.99인 것으로 밝혀졌다 (여기서, 1.00은 100% 효율에 해당함). PCR 효율이 둘다 100%에 가까웠기 때문에, 발현 정량화를 위한 ΔΔCT 방법의 이용과 같이 GUS 발현을 위한 표준물로서 URA의 용도가 확인되었다. 표준화된 양은 ΔCT로 표시한다.
각각의 상이한 균주 (즉, pYZGDG, pDMW222, pDMW212 및 pDMW214 구축물을 함유하는 야로위아 리폴리티카 ATCC #76982 균주) 중의 GUS mRNA를 pY5-30 (TEF::GUS)를 갖는 균주의 mRNA 수준에 대하여 정량화하였다. 따라서, 발현의 상대적 정량화는 TEF::GUS를 함유하는 균주의 mRNA 수준을 참조용 샘플로서 사용하여 계산하였다. GPD::GUS, GPDIN::GUS, FBA::GUS 및 FBAIN::GUS에 대한 표준화 값을 TEF::GUS 기준물의 표준화 값과 비교하였다. 이 양을 ΔΔCT라고 지칭한다. 이어서, ΔΔCT 값을 식 2-ΔΔ CT를 이용하여 절대값으로 전환시켰다. 이 값은, 키메라 GPD::GUS, GPDIN::GUS, FBA::GUS 및 FBAIN::GUS 유전자를 포함하는 균주 중에서의 GUS mRNA 수준을 키메라 TEF::GUS 유전자를 포함하는 경우에서의 값과 비교한 증가분 (배)으로 표시한다. 이 방법을 이용하면, TEF 프로모터의 활성을 GPD, GPDIN, FBA 및 FBAIN 프로모터와 비교하는 것이 가능하였다.
각각의 GUS 키메라 유전자에 대한 mRNA의 상대적 정량화 결과는 도 7B에 나타내었다. 보다 구체적으로, 상기 검정법은 HGM에서 24시간이 지난 후에는 FBA 및 FBAIN 프로모터의 전사 활성이 TEF 프로모터보다 각각 약 3.3배 및 6배 더 강력함을 보여주었다. 유사하게, GPD 및 GPDIN 프로모터의 전사 활성은 TEF 프로모터보다 각각 약 2배 및 4.4배 더 강력하였다. FBA::GUS, FBAIN::GUS, GPD::GUS 및 GPDIN::GUS 유전자 융합체의 전사 활성은 4일의 실험 기간에 걸쳐 감소했지만, FBAIN 및 GPDIN 프로모터의 전사 활성은 실험 마지막 날에 TEF 프로모터보다 여전히 약 3배 및 2.6배 더 강력했다.
실시예
2
야로위아
리폴리티카에서의
유전자 전사를 증가시키는데 유용한
인핸서의
동정
본 실시예의 연구는, FBAIN 및 GPDIN의 강력한 프로모터 활성 (상기 활성은 각각 FBA 및 GPD 프로모터의 활성보다 높음) 및 각 프로모터 영역 내 인트론 동정 결과를 기초로 하여, 각각의 인트론 내에 인핸서가 존재하는지 여부를 결정하기 위한 것이었다.
구체적으로, GPM::FBAIN 프로모터 융합체 및 GPM::GPDIN 프로모터 융합체로 구성된 2종의 키메라 프로모터를 생성하여, GUS 리포터 유전자의 발현을 구동하였다. 키메라 프로모터 ("성분 1" 및 "성분 2"로 구성됨)를 하기 표 13에 기재한다:
키메라 프로모터:: GUS :: XPR 유전자 내에 키메라 프로모터를 포함하는 플라스미드의 구축 | |||
키메라 프로모터 | 성분 1 | 성분 2 | 플라스미드 명칭 |
GPM::FBAIN (서열 219) | GPM의 -1 bp 내지 -843 bp 영역 | FBAIN의 +1 bp 내지 +171 bp. 여기서의 인트론은 위치 +62 bp 내지 +165 bp에 위치함. | pDMW224 |
GPM::GPDIN (서열 220) | GPM의 -1 bp 내지 -843 bp 영역 | GPDIN의 +1 bp 내지 +198 bp. 여기서의 인트론은 위치 +49 bp 내지 +194 bp에 위치함. | pDMW225 |
상기 키메라 프로모터들은 이들 각각이 플라스미드 pDMW224 및 pDMW225 내에서 GUS 리포터 유전자의 발현을 구동하도록 위치시켰다.
pDMW224 및 pDMW225를 포함하는 야로위아 리폴리티카 균주 중에서의 GUS 활성을 조직화학적 검정 결과 (실시예 1에 기재한 바와 같음)에 기초하여 pY5-30, pYZGDG, pYZGMG 및 pDMW214 구축물을 포함하는 야로위아 리폴리티카 균주 중에서의 GUS 활성과 비교함으로써, GPM::FBAIN 프로모터 및 GPM::GPDIN 프로모터의 활성을 TEF, FBAIN, GPDIN 및 GPM 프로모터의 활성과 비교하였다. 앞서 측정된 바와 같이, FBAIN 프로모터가 가장 강력한 프로모터였다. 그러나, 키메라 GPM::FBAIN 프로모터 및 키메라 GPM::GPDIN 프로모터는 둘다 GPM 프로모터보다 훨씬 더 강력하였고, GPDIN 프로모터와 활성면에서 동등한 것으로 여겨졌다. 따라서, 이것은 GPDIN 프로모터와 FBAIN 프로모터 둘다에 인핸서가 존재함을 확인시켜 주었다.
당업자는 GPDIN 인트론 또는 FBAIN 인트론을 사용한 유사한 키메라 프로모터를 쉽게 구축할 수 있을 것이다.
실시예
3
술포닐우레아
선별
야로위아의 유전적 개선은 적합한 비-항생제 선별가능한 형질전환 마커의 결여로 인해 방해를 받았다. 본 실시예는 술포닐우레아 내성을 기초로 하는, 야로위아 리폴리티카에 대한 우성의 비-항생제 마커의 개발을 기재하며, 이것은 반수체, 이배체, 이수체 또는 이형접합체일 수 있는 다른 산업상의 효모 균주에도 적용될 수 있다.
이론 및 초기 감수성 스크리닝
아세토히드록시산 신타제 (AHAS)는 분지쇄 아미노산의 생합성 경로에 공통적인 첫번째 효소이다. 이것은 술포닐우레아 및 이미다졸리논 제초제의 표적이다. 이와 같이, 미생물과 식물 모두에서 술포닐 우레아 제초제 내성이 보고된 바 있다. 예를 들어, 사카로마이세스 세레비지애에서는 AHAS에서의 단일 W586L 돌연변이가 술포닐우레아 제초제에 내성을 부여한다 ([Falco, S. C, et al., Dev. Ind. Microbiol. 30:187-194 (1989)], [Duggleby, R.G., et. al. Eur. J. Biochem. 270:2895 (2003)]).
야생형 AHAS 야로위아 리폴리티카 효소 (진뱅크 관리 번호 XP_501277) 및 사카로마이세스 세레비지애 효소 (진뱅크 관리 번호 P07342)의 아미노산 서열을 정렬했을 때, 사카로마이세스 세레비지애 효소의 위치 586에서의 Trp 아미노산 잔기는 야로위아 리폴리티카 효소의 위치 497에서의 Trp 아미노산 잔기와 동등하였다. 따라서, 야생형 세포 자체가 술포닐우레아에 감수성이 있다면 야로위아 리폴리티카 효소 중의 W497L 돌연변이가 술포닐우레아 제초제 내성을 부여할 것이라는 가설을 세웠다. 당업자에게 공지된 방법을 이용하여, 최소 배지 중 100 ㎍/mL 농도의 술포닐우레아 (클로리무론 에틸)가 야생형 야로위아 리폴리티카 균주 ATCC #20362 및 ATCC #90812의 성장을 억제하는데 충분한 것으로 결정되었다.
돌연변이체
W497L
AHAS
유전자의 합성
W497L 돌연변이를 함유하는 야로위아 리폴리티카 AHAS 유전자 (서열 243)를 게놈 DNA로부터 2-단계 반응으로 생성하였다. 우선, Pfu 울트라(Pfu Ultra)™ 하이-피델러티(High-Fidelity) DNA 폴리머라제 (스트라타진, 카탈로그 #600380) 및 프라이머 410 및 411 [서열 244 및 245]를 사용하여 AHAS 유전자의 5' 부분을 게놈 DNA로부터 증폭시켰고, 상기 유전자의 3' 부분은 프라이머 412 및 413 [서열 246 및 247]를 사용하여 유사하게 증폭시켰다. 2쌍의 프라이머를, W497L 돌연변이 (여기서의 돌연변이는 'CT'의 'TG'로의 변화임)를 함유하는 영역이 중복되도록 중복시켰다.
정확한 크기의 5' 및 3' PCR 생성물을 겔 정제하여, 2차 PCR의 주형으로 사용하였고, 이때 프라이머 414 및 415 (서열 248 및 249) 및 2가지 1차 PCR 반응에서 얻은 생성물들의 혼합물을 사용하여, 전체 돌연변이체 유전자가 증폭되었다. 이 돌연변이체 유전자는 고유의 천연 프로모터 및 종결자 서열을 보유하였다. 정확한 크기의 2차 PCR 생성물을 겔 정제하여 인-퓨전(in-fusion) 기술로 플라스미드 pY35 [키메라 TEF::푸사륨 모닐리포르메 Δ12 데새투라제 (Fm2) 유전자, 이. 콜라이 복제 기점, 박테리아 앰피실린 내성 유전자, 야로위아 Leu 2 유전자 및 야로위아 자가 복제 서열 (ARS)을 함유함. 더욱 상세한 사항에 대하여는 제WO 2005/047485호 참조]의 벡터 주쇄에 클로닝한 후, 효소 SalI/BsiWI으로 소화시켰다. 인-퓨전 반응 혼합물로 TOP10 감응성 세포 (인비트로젠(Invitrogen), 카탈로그 #C4040-10)를 형질전환시켰다. 1일 후에 LB/Amp 플레이트상에서 선별하고, 여덟개 (8개)의 콜로니를 DNA 미니프렙(miniprep)으로 분석하였다. 제한 소화를 통해 7개의 클론이 제대로 된 것임을 확인하였다. 이들 중 술포닐우레아 내성 유전자 및 또한 LEU 유전자를 함유하는 하나를 "pY57" (또는 "pY57.YI.AHAS.w4971", 도 3B)라고 명명하였다.
표준 리튬 아세테이트 방법에 의해, 야생형 야로위아 리폴리티카 균주 ATCC #90812 및 ATCC #20362를 pY57 및 '빈(empty)' LEU로 형질전환시켰다. DNA를 포함하지 않는 ('No-DNA') 형질전환 대조군도 사용하였다. 형질전환체를 MM 또는 MM + 술포닐우레아 (SU; 100 ㎍/mL) 아가 플레이트에 플레이팅하고, 4일 동안 성장시킨 후에 콜로니의 존재 또는 부재를 평가하였다.
야로위아 리폴리티카에서의 AHAS 선별 | ||||
플라스미드 | ATCC #90812 | ATCC #20362 | ||
MM | MM + SU (100 ㎍/ mL ) | MM | MM + SU (100 ㎍/ mL ) | |
pY57 | 콜로니 생성 | 콜로니 생성 | 콜로니 생성 | 콜로니 생성 |
Leu 벡터 대조군 | 콜로니 생성 | 콜로니 생성 없음 | 콜로니 생성 | 콜로니 생성 없음 |
No DNA 대조군 | 콜로니 생성 없음 | 콜로니 생성 없음 | 콜로니 생성 없음 | 콜로니 생성 없음 |
상기 나타낸 결과를 기초로 할 때, AHAS W497L은 야로위아 리폴리티카 ATCC #90812와 ATCC #20362 모두에서 양효한 비-항생제 선별 마커였다. 이어서, 본 발명자들은 술포닐우레아를 150 ㎍/mL의 농도로 사용하였다. 상기 신규 마커는 외래 유전자에는 의존적이 아니지만 돌연변이체 천연 유전자에는 의존적이며, 영양요구성도 필요 없고 영양요구성을 야기하지도 않기 때문에, 야로위아 리폴리티카의 형질전환에 유리하다. 제초제는 인간과 동물에게 비독성이다.
이러한 선별 방법은, 돌연변이체 AHAS 효소가 본원에 기재한 것과 유사한 방식으로 제작된 경우에는 반수체, 이배체, 이수체 또는 이형접합체일 수 있는 다른 산업상의 효모 균주에 일반적으로 적용될 수 있다고 예측된다.
실시예
4
야로위아
리폴리티카
중의 코돈-최적화 Δ4
데새투라제
유전자의 합성 및
기능적 발현
트라우스토키트륨 아우레움의 Δ4 데새투라제 유전자 (진뱅크 관리 번호 AAN75707)의 코돈 사용방식을 WO 2004/101753에 기재된 바와 유사한 방식으로 야로위아 리폴리티카에서의 발현에 최적화시켰다. 구체적으로, 야로위아 코돈 사용방식 패턴, ATG 번역 개시 코돈 주변의 컨센서스 서열, 및 RNA 안정성의 일반 규칙 [Guhaniyogi, G. and J. Brewer, Gene 265(1-2):11-23 (2001)]에 따라, 코돈-최적화 Δ4 데새투라제 유전자는 트라우스토키트륨 아우레움 유전자 (서열 104)의 DNA 서열을 기초로 하여 디자인하였다 (서열 106 및 107). 번역 개시 부위의 변형 외에, 1545 bp 코딩 영역 중 170 bp가 변형되었고 (11%), 166개 코돈이 최적화되었다. 번역 개시 부위를 변형시키기 위해, 서열 105 (야생형)의 제2 아미노산 (T)는 코돈-최적화 Δ4 데새투라제 유전자 (서열 107)에 포함시키지 않았다.
코돈-최적화 Δ4
데세투라제
유전자의
시험관내
합성
코돈-최적화 Δ4 데새투라제 유전자를 하기와 같이 합성하였다. 먼저, 16쌍의 올리고뉴클레오티드를 디자인하여 트라우스토키트륨 아우레움 Δ4 데새투라제 유전자의 코돈-최적화 코딩 영역의 전장을 신장시켰다 (예컨대, 서열 250 내지 281에 상응하는 D4-1A, D4-1B, D4- 2A1 D4-2B, D4-3A, D4-3B, D4-4A, D4-4B, D4-5A, D4-5B, D4-6A, D4-6B, D4-7A, D4-7B, D4-8A, D4-8B, D4-9A, D4-9B, D4-10A, D4-10B, D4-11A, D4-11B, D4-12A, D4-12B, D4-13A, D4-13B, D4-14A, D4-14B, D4-15A, D4-15B, D4-16A 및 D4-16B). 센스 (A) 및 안티센스 (B) 올리고뉴클레오티드의 각 쌍은 각 5'-말단에서의 4 bp 오버행 외에는 상보적이었다. 추가로, 프라이머 D4-1F (서열 282)은 NcoI 부위를 도입하였고, 프라이머 D4-4R (서열 283) 및 D4-5F (서열 284)은 BamHI 부위를 도입하였고, 프라이머 D4-8R (서열 285) 및 D4-9F (서열 286)는 274번 아미노산을 Phe에서 Leu로 변화시킨 HindIII 부위를 도입하였고, 프라이머 D4-12R (서열 287) 및 D4-13 (서열 288)은 ApaLI 부위를 도입하였고, 프라이머 D4-16R (서열 289)은 차후의 서브클로닝을 위해 NotI 부위를 도입하였다. 이후, 프라이머 D4-8R 및 D4-9F에 의해 도입된 274번 위치의 아미노산 변화는 이하의 전체 유전자 어셈블리를 이용해서 교정하였다.
각각의 올리고뉴클레오티드 (100 ng)는 37℃에서 1시간 동안 50 mM Tris-HCl (pH 7.5), 10 mM MgCl2, 10 mM DTT, 0.5 mM 스페르미딘, 0.5 mM ATP 및 10U T4 폴리뉴클레오티드 키나제를 함유한 부피 20 ㎕에서 인산화하였다. 센스 및 안티센스 올리고뉴클레오티드의 각 쌍을 혼합하고, 하기 파라미터를 이용하는 열순환기에서 어닐링시켰다: 95℃ (2분), 85℃ (2분), 65℃ (15분), 37℃ (15분), 24℃ (15분) 및 4℃ (15분). 따라서, D4-1A (서열 250)를 D4-1B (서열 251)에 어닐링시켜 이중-가닥 생성물 "D4-1AB"를 생산하였다. 유사하게, D4-2A (서열 252)를 D4-2B (서열 253)에 어닐링시켜 이중-가닥 생성물 "D4-2AB" 등을 생산하였다.
어닐링된 이중-가닥 올리고뉴클레오티드의 4개의 개별적 풀을 하기에 나타내는 바와 같이 이어서 함께 라이게이션하였다: 풀 1 (D4-1AB, D4-2AB, D4-3AB 및 D4-4AB 포함); 풀 2 (D4-5AB, D4-6AB, D4-7AB 및 D4-8AB 포함); 풀 3 (D4-9AB, D4-10AB, D4-11AB 및 D4-12AB 포함); 및 풀 4 (D4-13AB, D4-14AB, D4-15AB 및 D4- 16AB 포함). 어닐링된 올리고뉴클레오티드의 각 풀을 10U T4 DNA 리가제를 갖는 부피 20 ㎕에서 혼합하고, 라이게이션 반응물을 밤새 16℃에서 인큐베이션하였다.
각 라이게이션 반응의 생성물을 이어서 주형으로서 사용하여 디자인된 DNA 단편을 PCR로 증폭시켰다. 구체적으로, 라이게이션된 "풀 1" 혼합물 (즉, D4-1AB, D4-2AB, D4-3AB 및 D4-4AB)을 주형으로 사용하고, 올리고뉴클레오티드 D4-1F 및 D4-4R (서열 282 및 283)을 프라이머로 사용하여, 코돈-최적화 Δ4 데새투라제 유전자의 제1 부분을 PCR로 증폭시켰다. PCR 증폭은 총 부피를 50 ㎕로 하여 상기 '통상의 방법' 항목에 기재한 바와 같이 수행하였다. 증폭을 하기와 같이 수행하였다: 95℃에서 3분 동안 초기 변성, 이어서 95℃에서 1분 동안, 56℃에서 30초, 72℃에서 40초 동안의 35 주기. 72℃에서 10분 동안의 최종 신장 주기를 수행하고, 이어서 4℃에서의 반응 종결을 수행하였다. 433 bp PCR 단편을 pGEM-T 이지 벡터 (프로메가) 내로 서브클로닝하여 pT4(1-4)을 생성시켰다.
라이게이션된 "풀 2" 혼합물 (즉, D4-5AB, D4-6AB, D4-7AB 및 D4-8AB)을 주형으로 사용하고, 올리고뉴클레오티드 D4-5F 및 D4-8R (서열 284 및 285)을 프라이머로서 사용하여, 코돈-최적화 Δ4 데새투라제 유전자의 제2 부분을 PCR로 유사하게 증폭시키고, pGEM-T-이지 벡터 내로 클로닝시켜 pT4(5-8)를 생성시켰다.
라이게이션된 "풀 3" 혼합물 (즉, D4-9AB, D4-10AB, D4-11AB 및 D4-12AB)을 주형으로 사용하고, 올리고뉴클레오티드 D4-9F 및 D4-12R (서열 286 및 287)을 프라이머로서 사용하여, 코돈-최적화 Δ4 데새투라제 유전자의 제3 부분을 PCR로 유사하게 증폭시키고, pGEM-T-이지 벡터 내로 클로닝시켜 pT4(9-12)를 생성시켰다.
라이게이션된 "풀 4" 혼합물 (즉, D4-13AB, D4-14AB, D4-15AB 및 D4-16AB)을 주형으로 사용하고, 올리고뉴클레오티드 D4-13F 및 D4-16R (서열 288 및 289)을 프라이머로서 사용하여, 코돈-최적화 Δ4 데새투라제 유전자의 제4 부분을 PCR로 유사하게 증폭시키고, pGEM-T-이지 벡터 내로 클로닝시켜 pT4(13-16)를 생성시켰다.
이. 콜라이를 따로 pT4(1-4), pT4(5-8), pT4(9-12) 및 pT4(13-16)로 형질전환시키고, 플라스미드 DNA를 앰피실린-내성 형질전환체로부터 단리시켰다. 플라스미드 DNA를 정제하고, 적절한 제한 엔도뉴클레아제로 소화시켜 pT4(1-4)의 433 bp NcoI/BamHI 단편, p4(5-8)의 383 bp BamHI/HindIII 단편, p4(9-12)의 436 bp HindIII/ApaLI 단편, 및 p4(13-16)의 381 bp ApaLI/NotI 단편을 유리시켰다. 이어서 이들 4개 단편을 합하고, Nco1/Not1 소화 pZUF17 (서열 162; 도 9B)와 함께 정해진 방향으로 라이게이션시켜 pZUF4 (서열 163)을 생성시켰다.
클로닝 편의를 이유로, pZUF4에서 합성 Δ4 데새투라제 유전자 ("D4S")의 274번 아미노산을 처음부터 Phe에서 Leu로 변화시켰다. 주형으로서 pZUF4를 사용하고 올리고뉴클레오티드 YL251 및 YL252를 프라이머 (서열 290 및 291)로서 사용해서 부위-지정 돌연변이유발법에 의해 274번 아미노산인 Leu를 Phe로 교정하였다. 따라서, 생성된 플라스미드는 Δ4 데새투라제 유전자 (서열 106)의 정확한 합성 아미노산 서열을 함유했으며, pZUF4S (서열 164; 도 9C)로 표시했다.
야로위아
리폴리티카
중의 코돈-최적화 Δ4
데새투라제
유전자의 발현
키메라 FBAIN::D4S::Pex20 유전자를 포함한 구축물 pZUF4S인 자가-복제 플라스미드를 야로위아 리폴리티카 Y20362U (FOA 내성에 대해 선별함으로써 생성된, ATCC 번호 20362의 자발적 Ura- 돌연변이체) 내로 상기 '통상의 방법' 항목에 기재한 바와 같이 형질전환시켰다. 형질전환체 세포를 MM 선별 배지 플레이트에 플레이팅하고, 30 ℃에서 2 내지 3일 동안 유지하였다. MM 플레이트에서 성장한 형질전환체 (3)을 골라내서 신선한 MM 플레이트에 재스트리킹하였다. 일단 성장했으면, 이들 균주를 30 ℃에서 10 ㎍ DPA가 공급된 3 mL 액체 MM에 개별적으로 접종시키고, 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 결과는 이들 3개의 형질전환체에서 DHA가 약 2%로 생산됨을 보여주었다. 코돈-최적화 유전자의 "기질 전환율(%)"은 약 20%인 것으로 측정되었다.
실시예
5
야로위아
리폴리티카
중의 코돈-최적화
C
20
/22
엘론가제
유전자의 합성 및
기능적 발현
오스트레오코쿠스 타우리의 C20 /22 엘론가제 유전자 (진뱅크 관리 번호 AY591336; "OtElo2")의 코돈 사용방식을 WO 2004/101753 및 실시예 4 (상기 문헌)에 기재된 바와 유사한 방식으로 야로위아 리폴리티카에서의 발현에 최적화시켰다. 구체적으로, 야로위아 코돈 사용방식 패턴 (WO 2004/101753), 'ATG' 번역 개시 코돈 주변의 컨센서스 서열, 및 RNA 안정성의 일반 규칙 [Guhaniyogi, G. and J. Brewer, Gene 265(1-2):11-23 (2001)]에 따라, 코돈-최적화 OtElo2 엘론가제 유전자 ("OtE2S"로 표시됨, 서열 102)는 오스트레오코쿠스 타우리의 공개된 서열 (진뱅크 관리 번호 AY591336, 서열 100)을 기초로 하여 디자인하였다. 번역 개시 부위의 변형 외에, 903 bp 코딩 영역 중 160 bp가 변형되었고 (17.7%), 147개 코돈이 최적화되었다 (49%). 코돈-최적화 ORF (서열 102 및 103) 내의 번역 개시 코돈 주변에 NcoI 부위를 부가하기 위해 제2 아미노산을 'S'에서 'A'로 변화시킨 것을 제외하면, 코돈-최적화 유전자에서의 어떤 변형도 코딩된 단백질의 아미노산 서열 (서열 101)을 변화시키지 않았다. 디자인된 OtE2S 유전자는 뉴저지주 피스카타웨이 소재의 젠스크립트 코포레이션 (GenScript Corporation)사에 의해 합성되었으며, 이를 pUC57 (진뱅크 관리 번호 Y14837)에 클로닝하여 pOtE2S를 생성시켰다.
야로위아
리폴리티카
중의 코돈-최적화
OtE2S
유전자의 발현
pOtE2S의 NcoI/NotI 단편을 단리하고, Nco1/Not1 소화 pZUF17 (서열 162; 도 9B)와 함께 라이게이션하여 pFOE2S (도 9D)를 생성시켰다. 키메라 FBAIN::OtE2S::Pex20 유전자를 포함한 구축물 pFOE2S인 자가-복제 플라스미드를 야로위아 리폴리티카 균주 Y20362U (FOA 스크리닝 하에 선별된, ATCC 번호 20362의 자발적 Ura- 돌연변이체) 내로 상기 '통상의 방법' 항목에 기재한 바와 같이 형질전환시켰다. 형질전환체 세포를 MM 선별 배지 플레이트에 플레이팅하고, 30 ℃에서 2 내지 3일 동안 유지하였다. MM 플레이트에서 성장한 pFOE2S 보유 Y20362U의 형질전환체 (3)을 골라내서 신선한 MM 플레이트에 재스트리킹하였다. 일단 성장했으면, 이들 균주를 30 ℃에서 10 ㎍ EPA가 공급된 3 mL 액체 MM에 개별적으로 접종시키고, 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 결과는 이들 3개의 형질전환체에서 DPA가 전체 지질의 약 1% 내지 1.3%로 존재하며 EPA가 약 0.5%로 존재함을 보여주었다. 이들 형질전환체에서 코돈-최적화 OtE2S 유전자의 EPA에서 DPA로의 "기질 전환율(%)"은 67%인 것으로 측정되었다.
실시예
6
ω-6 Δ6
데새투라제
/Δ6
엘론가제
경로:
DHA
를 전체 지질의
5% 초과로 생산하는 균주
Y3000
의 생성
본 실시예는 야로위아 리폴리티카 ATCC #20362로부터 유래되어 DHA를 전체 지질에 대하여 5.6%로 생산할 수 있는 균주 Y3000의 구축을 기재한다 (도 5). 이 균주는 ω-6 Δ6 데새투라제/Δ6 엘론가제 경로를 발현하도록 유전자 조작되었다.
균주 Y3000의 개발에는 균주 M4 (DGLA를 8%로 생성함), 균주 Y2047 (ARA를 11%로 생산함), 균주 Y2048 (EPA를 11%로 생산함), 균주 Y2060 (EPA를 13%로 생산함), 균주 Y2072 (EPA를 15%로 생산함), 균주 Y2072U3 (EPA를 16%로 생산함), 균주 Y2098 (EPA를 22%로 생산함), 및 균주 Y2098U (EPA를 21%로 생산함)의 구축이 요구되었다.
DGLA
를 전체 지질의 약 8%로 생산하는
M4
균주의 생성
4개의 키메라 유전자 (Δ12 데새투라제, Δ6 데새투라제 및 2개의 C18 /20 엘론가제 포함)를 야생형 야로위아 균주 ATCC #20362의 Ura3 유전자좌에 통합함으로써 DGLA가 생성될 수 있도록 하는 구축물 pKUNF12T6E (도 8A, 서열 156)를 제조하였다. pKUNF12T6E 플라스미드는 하기 성분을 함유하였다:
플라스미드 pKUNF12T6E (서열 156)의 기재 | |
서열 156 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (9420-8629) | 야로위아 Ura3 유전자의 784 bp 5' 부분 (진뱅크 관리 번호 AJ306421) |
SphI/PacI (12128-1) | 야로위아 Ura3 유전자의 516 bp 3' 부분 (진뱅크 관리 번호 AJ306421) |
SwaI/BsiWI (6380-8629) | ·FBAIN: FBAIN 프로모터 (서열 214) ·EL1S: 코돈-최적화 엘론가제 1 유전자 (서열 24) (모르티에렐라 알피나 (진뱅크 관리 번호 AX464731)로부터 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)로부터의 Pex20 종결자 서열 을 포함하는 FBAIN::EL1S::Pex20 |
BglII/SwaI (4221-6380) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·Δ6S: 코돈-최적화 Δ6 데새투라제 유전자 (서열 3) (모르티에렐라 알피나 (진뱅크 관리 번호 AF465281)로부터 유래됨) . Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)로부터의 Lip1 종결자 서열 을 포함하는 TEF::Δ6S::Lip1 |
PmeI/ClaI (4207-1459) | ·FBA:FBA 프로모터 (서열 213) ·F.Δ12:푸사륨 모닐리포르메 Δ12 데새투라제 유전자 (서열 32) ·Lip2: 야로위아 Lip2 유전자 (진뱅크 관리 번호 AJ012632)로부터의 Lip2 종결자 서열 을 포함하는 FBA::F.Δ12::Lip2 |
ClaI/PacI (1459-1) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·EL2S: 코돈-최적화 엘론가제 유전자 (서열 27) (트라우스토키트륨 아우레움 (미국 특허 제6,677,145호)으로부터 유래됨) ·XPR: 야로위아 Xpr 유전자 (진뱅크 관리 번호 M17741)의 3' 영역의 약 100 bp 를 포함하는 TEF::EL2S::XPR |
pKUNF12T6E 플라스미드를 AscI/SphI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 야생형 야로위아 리폴리티카 ATCC #20362를 형질전환시켰다. 형질전환 세포를 FOA 선별 배지 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. FOA 내성 콜로니를 골라내서 MM 및 MMU 선별 플레이트에 스트리킹했다. MMU 플레이트에서는 성장할 수 있으나 MM 플레이트에서는 성장할 수 없는 콜로니를 Ura- 균주로서 선별하였다. 이어서, Ura- 균주의 단일 콜로니를 30℃에서 액체 MMU에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 DGLA가 pKUNF12T6E의 4개 키메라 유전자를 함유하는 형질전환체 중에는 존재하지만 야생형 야로위아 대조군 균주 중에는 존재하지 않음을 보여주었다. 선별된 32개의 Ura- 균주 대개는 DGLA를 전체 지질의 약 6%로 생산하였다. DGLA를 전체 지질의 약 8%로 생산하는 균주는 2종이었다 (즉, 균주 M4 및 13-8).
ARA
를 전체 지질의 약 10%로 생산하는
Y2047
균주의 생성
3개의 Δ5 키메라 유전자를 야로위아 균주 M4의 Leu2 유전자에 통합하여 구축물 pDMW271 (도 8B, 서열 157)를 제조하였다. 플라스미드 pDMW271은 표 16에 나타낸 하기 성분을 함유하였다:
플라스미드 pDMW271 (서열 157)의 기재 | |
서열 157 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (5520-6315) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230)의 788 bp 5' 부분 |
SphI/PacI (2820-2109) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230)의 703 bp 3' 부분 |
SwaI/BsiWI (8960-6315) | ·FBAIN: FBAIN 프로모터 (서열 214) ·MAΔ5: 모르티에렐라 알피나 Δ5 데새투라제 유전자 (서열 6) (진뱅크 관리 번호 AF067654) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::MAΔ5::Pex20 |
SwaI/ClaI (8960-11055) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·MAΔ5: 서열 6 (상기 참조) ·Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 Lip1 종결자 서열 을 포함하는 TEF::MAΔ5::Lip1 |
PmeI/ClaI (12690-11055) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
ClaI/PacI (1-2109) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·HΔ5S: 코돈-최적화 Δ5 데새투라제 유전자 (서열 13) (호모 사피엔스 (진뱅크 관리 번호 NP_037534)로부터 유래됨) ·Pex16: 야로위아 Pex16 유전자의 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 TEF::HΔ5S::Pex16 |
플라스미드 pDMW271을 AscI/SphI로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 M4를 형질전환시켰다. 형질전환 후, 세포를 MMLe 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. MMLe 플레이트에서 성장된 개개의 콜로니를 골라내서 MM 및 MMLe 플레이트에 스트리킹했다. MMLe 플레이트에서는 성장할 수 있으나 MM 플레이트에서는 성장할 수 없는 콜로니를 Leu2- 균주로서 선별하였다. 이어서, Leu2- 균주의 단일 콜로니를 30℃에서 액체 MMLe 배지에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 ARA가 pDMW232 형질전환체 중에는 존재하지만 모(母) M4 균주 중에는 존재하지 않음을 보여주었다. 구체적으로, pDMW271을 함유하는 것으로 선별된 48개의 Leu2- 형질전환체 중에서 유전자 조작된 야로위아에서 ARA를 전체 지질의 5% 미만으로 생산하는 균주는 35개였고, ARA를 6 내지 8%로 생산하는 균주는 12개였으며, ARA를 약 11%로 생산하는 균주는 1개였다. ARA를 11%로 생산하는 균주를 "Y2047"로 명명하였다.
EPA
를 전체 지질의 약 11%로 생산하는
Y2048
균주의 생성
3개의 합성 Δ17 데새투라제 키메라 유전자를 Y2047 균주의 아실-CoA 옥시다제 3 유전자에 통합하여 구축물 pZP3L37 (도 8C, 서열 158)을 제조하였다. 플라스미드 pZP3L37은 하기 성분을 함유하였다:
플라스미드 pZP3L37 (서열 158)의 기재 | |
서열 158 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (6813-6043) | 야로위아 Pox3 유전자 (진뱅크 관리 번호 AJ001301)의 763 bp 5' 부분 |
SphI/PacI (9521-10345) | 야로위아 Pox3 유전자 (진뱅크 관리 번호 AJ001301)의 818 bp 3' 부분 |
ClaI/BsiWI (4233-6043) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·Δ17S: 코돈-최적화 Δ17 데새투라제 유전자 (서열 21) (사프롤레그니아 디클리나로부터 유래됨) (미국 특허 출원 제2003/0196217 A1호) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 TEF::Δ17S::Pex20 |
ClaI/PmeI (4233-1811) | ·FBAIN: FBAIN 프로모터 (서열 214) ·Δ17S:서열 21 (상기 참조) ·Lip2: 야로위아 Lip2 유전자 (진뱅크 관리 번호 AJ012632)의 Lip2 종결자 서열 을 포함하는 FBAIN::Δ17S::Lip2 |
PmeI/SwaI (1811-1) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230) |
PacI/SwaI (10345-1) | ·FBAINm: FBAINm 프로모터 (서열 215) ·Δ17S:서열 21 (상기 참조) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 FBAINm::Δ17S::Pex16 |
플라스미드 pZP3L37을 AscI/SphI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 Y2047을 형질전환시켰다. 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. MM 플레이트에서 성장한 총 96개의 형질전환체를 골라내서 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃에서 액체 MM에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 EPA가 pZP3L37을 함유하는 대부분의 형질전환체 중에는 존재하지만 모 Y2047 균주 중에는 존재하지 않음을 보여주었다. pZP3L37을 함유하는 것으로 선별된 96개의 형질전환체 중에서, 유전자 조작된 야로위아에서 EPA를 전체 지질의 2% 미만으로 생산하는 균주는 20개였고, EPA를 2 내지 3%로 생산하는 균주는 23개였고, EPA를 3 내지 4%로 생산하는 균주는 5개였으며, EPA를 약 6%로 생산하는 균주는 2개 (즉, 균주 번호 71 및 균주 번호 94)였다. (EPA를 6%로 생산하는) 균주 번호 71은 상기 '통상의 방법' 항목에 기재한 바와 같이 "2-단계 성장 조건" (즉, 48시간 MM, 72시간 HGM)을 이용하여 추가로 분석하였다. GC 분석은 상기 균주 번호 71이 EPA를 전체 지질의 약 11%로 생산함을 보여주었다. 이 균주를 "Y2048"로 칭하였다.
EPA
를 전체 지질의 약 13%로 생산하는,
Ura
- 표현형을 갖는
Y2060
균주의 생성
균주 Y2048에서 Ura3 유전자를 파괴하기 위해, TEF::rELO2S::Pex20 키메라 유전자를 균주 Y2048의 Ura3 유전자에 통합시켜 구축물 pZKUT16 (도 8D; 서열 159)를 생성시켰다. rELO2S는 16:0을 18:0로 연장시키는 래트 간 효소 (즉, C16 /18 엘론가제)를 코딩하는 코돈-최적화 rELO 유전자이다. 플라스미드 pZKUT16은 하기 성분을 함유하였다:
플라스미드 pZKUT16 (서열 159)의 기재 | |
서열 159 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
BsiWI/PacI (1-721) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 721 bp 5' 부분 |
SalI/ClaI (3565-4289) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 724 bp 3' 부분 |
ClaI/BsiWI (4289-1) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·rELO2S: 코돈-최적화 rELO2 엘론가제 유전자 (서열 85) (래트 (진뱅크 관리 번호 AB071986)로부터 유래함) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 TEF::rELO2S::Pex20 |
구체적으로, 플라스미드 pZKUT16을 SalI/PacI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 Y2048을 형질전환시켰다. 형질전환 후, 세포를 MM + 5-FOA 선별 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다.
MM + 5-FOA 플레이트에서 성장한 총 40개의 형질전환체를 골라내서 MM 플레이트 및 MM + 5-FOA 플레이트에 따로 재스트리킹했다. MM + 5-FOA 플레이트에서 성장할 수 있지만 MM 플레이트에서는 성장할 수 없는 균주를 Ura- 균주로서 선별했다. 이들 40개의 Ura- 균주를 개별적으로 액체 MMU에 접종하고, 30℃에서 250 rpm/분으로 2일 동안 진탕 성장시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 MMU 배지에서 2일간 성장시킨 후 EPA를 전체 지질의 5% 미만으로 생산하는 균주는 14개였고, EPA를 5 내지 5.9%로 생산하는 균주는 9개였으며, EPA를 6 내지 6.9%로 생산하는 균주는 15개였고, EPA를 7 내지 8%로 생산하는 균주는 7개였음을 보여주었다. EPA를 7 내지 8%로 생산하는 균주는 상기 '통상의 방법' 항목에 기재한 바와 같은 2-단계 성장 조건 (즉, 48시간 MM, 96시간 HGM)을 이용하여 추가로 분석하였다. GC 분석은 상기 균주 모두가 EPA를 10% 초과로 생산하며 이들 중 하나는 EPA를 전체 지질의 약 13%로 생산함을 보여주었다. 이 균주를 균주 "Y2060"이라고 칭하였다.
EPA
를 전체 지질의 약 15%로 생산하는
Y2072
균주의 생성
3개의 키메라 유전자 (C18 /20 엘론가제, Δ12 데새투라제 및 Δ5 데새투라제를 포함) 및 Ura3 유전자의 클러스터를 균주 Y2060의 천연 야로위아 Δ12 데새투라제 유전자 부위에 통합시킴으로써 구축물 pKO2UM25E (도 8E; 서열 160)를 생성시켰다. 플라스미드 pKO2UM25E는 하기 성분을 함유하였다:
플라스미드 pKO2UM25E (서열 160)의 기재 | |
서열 160 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
HindIII/AscI (1-728) | 야로위아 Δ12 데새투라제 유전자 (서열 28)의 728 bp 5' 부분 |
SphI/EcoRI (3436-3992) | 야로위아 Δ12 데새투라제 유전자 (서열 28)의 556 bp 3' 부분 |
BsiWI/HindIII (10437-1) | ·GPAT: GPAT 프로모터 (서열 216) ·EL1S: 코돈-최적화 엘론가제 1 유전자 (서열 24) (모르티에렐라 알피나 (진뱅크 관리 번호 AX464731)로부터 유래됨) ·XPR: 야로위아 Xpr 유전자 (진뱅크 관리 번호 M17741)의 3' 영역의 약 100 bp 를 포함하는 GPAT::EL1S::XPR |
BglII/BsiWI (7920-10437) | ·FBAIN: FBAIN 프로모터 (서열 214) ·M.Δ12: 모르티에렐라 이사벨리나 Δ12 데새투라제 유전자 (진뱅크 관리 번호 AF417245; 서열 30) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::M.Δ12::Pex20 |
SalI/PacI (6046-7544) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
EcoRI/SalI (3992-6046) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·I.Δ5S: 코돈-최적화 Δ5 데새투라제 유전자 (서열 10) (이소크리시스 갈바나 (WO 2002/081668)로부터 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 TEF::I.Δ5S::Pex20 |
구체적으로, 플라스미드 pKO2UM25E를 SphI/AscI로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 Y2060을 형질전환시켰다. 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다.
MM 플레이트에서 성장한 총 63개의 형질전환체를 골라내서 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃에서 액체 MM에 접종하고 250 rpm/분으로 2일 동안 진탕 배양했다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은, MMU 배지 중에서 1일 동안 성장시킨 후에는 pKO2UM25E를 함유하는 거의 모든 형질전환체에 EPA가 존재함을 보여주었다. 선별된 63개의 형질전환체 중에서, EPA를 6 내지 8.9%로 생산하는 균주는 26개였으며, EPA를 9% 초과로 생산하는 균주는 46개였다. EPA를 9% 초과로 생산하는 균주는 상기 '통상의 방법'에 기재된 바와 같은 2-단계 성장 조건 (즉, 48시간 MM, 96시간 HGM)을 이용하여 추가의 분석을 위해 선별하였다. GC 분석은 선별된 46개의 균주 중 45개가 EPA를 11 내지 14.5%로 생산하지만 배양물 번호 2는 2-단계 성장 후 EPA를 전체 지질의 15.1%로 생산함을 보여주었다. 이 균주 (즉, 2번 균주)를 균주 "Y2072"라고 칭하였다.
EPA
를 전체 지질의 약 15 내지 16%로 생산하는,
Ura
- 표현형을 갖는
Y2072U3
및 Y2072U4 균주의 생성
구축물 pZKUT16 (도 8D, 서열 159; 상기 참조)을 사용해서 TEF::rELO2S::Pex20 키메라 유전자를 균주 Y2072의 Ura3 유전자에 통합시켰다. 구체적으로, 상기 '통상의 방법'에 따라 SalI/PacI-소화 플라스미드 pZKUT16을 사용해서 균주 Y2072를 형질전환시켰다. 형질전환 후, 세포를 MM + 5-FOA 선별 플레이트에 플레이팅하고, 30 ℃에서 3 내지 4일 동안 유지하였다.
MM + 5-FOA 플레이트에서 성장한 총 24개의 형질전환체를 골라내서 MM 플레이트 및 MM + 5-FOA 플레이트에 따로 재스트리킹했다. MM + 5-FOA 플레이트에서 성장할 수 있지만 MM 플레이트에서는 성장할 수 없는 균주를 Ura- 균주로서 선별했다. 이들 24개의 Ura- 균주를 개별적으로 30℃에서 액체 MMU에 접종하고, 250 rpm/분으로 2일 동안 진탕 배양시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 MMU 배지에서 2일간 성장시킨 후 EPA를 전체 지질의 8.9% 미만으로 생산하는 균주는 14개였고, EPA를 9 내지 9.9%로 생산하는 균주는 8개였으며, EPA를 10.1%로 생산하는 균주는 1개 (즉, 12번 균주)였음을 보여주었다. 균주 번호 12 (10.1% EPA) 및 균주 번호 11 (9.6% EPA)은 2-단계 성장 절차 (즉, 48시간 MM, 96시간 HGM)을 이용하여 추가로 분석하였다. GC 분석은 균주 번호 12가 EPA를 약 15%로 생산했음을 보여주었으며, 이 균주를 "Y2072U3"으로 칭하였다. 이와는 달리, 균주 번호 11은 EPA를 약 16%로 생산하였으며, 이 균주를 균주 "Y2072U4"로 칭하였다.
EPA
를 전체 지질의 23 내지 28%로 생산하는
Y2096
,
Y2097
,
Y2098
,
Y2105
및
Y2106
균주의 생성
4개의 키메라 유전자 (C18 /20 엘론가제, Δ6 데새투라제, Δ5 데새투라제 및 Δ12 데새투라제를 포함) 및 Ura3 유전자의 클러스터를 균주 Y2072U3의 야로위아 리파제 1 유전자 부위에 통합시킴으로써 구축물 pDMW303 (도 9A; 서열 161)를 생성시켰다. 플라스미드 pDMW303은 하기 성분을 함유하였다:
플라스미드 pDMW303 (서열 161)의 기재 | |
서열 161 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
BsiWI/AscI (1-819) | 야로위아 리파제 1 유전자 (진뱅크 관리 번호 Z50020)의 819 bp 5' 부분 |
SphI/PacI (35278-4297) | 야로위아 리파제 1 유전자 (진뱅크 관리 번호 Z50020)의 769 bp 3' 부분 |
SwaI/BsiWI (13300-1) | ·GPAT: GPAT 프로모터 (서열 216) ·HΔ5S: 코돈-최적화 Δ5 데새투라제 유전자 (서열 13) (호모 사피엔스 (진뱅크 관리 번호 NP_037534)로부터 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 GPAT::HΔ5S::Pex20 |
BglII/SwaI (10602-13300) | ·FBAIN: FBAIN 프로모터 (서열 214) ·Δ6S: 코돈-최적화 Δ6 데새투라제 유전자 (서열 3) (모르티에렐라 알피나 (진뱅크 관리 번호 AF465281)로부터 유래됨) . Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)로부터의 Lip1 종결자 서열 을 포함하는 FBAIN::Δ6S::Lip1 |
ClaI/PmeI (8081-10558) | ·GPDIN: GPDIN 프로모터 (서열 211) ·EL1S: 코돈-최적화 엘론가제 1 유전자 (서열 24) (모르티에렐라 알피나 (진뱅크 관리 번호 AX464731)로부터 유래됨) ·Lip2: 야로위아 리파제 2 유전자 (진뱅크 관리 번호 AJ012632)의 Lip2 종결자 를 포함하는 GPDIN::EL1S::Lip2 |
EcoRI/ClaI (6453-8081) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
PacI/EcoRI (4297-6453) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·F.Δ12: 푸사륨 모닐리포르메 Δ12 데새투라제 유전자 (서열 32) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 를 포함하는 TEF::F.Δ12::Pex16 |
구체적으로, SphI/AscI-소화 플라스미드를 상기 '통상의 방법'에 따라 사용하여 균주 Y2072U3을 형질전환시켰다. 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 30℃에서 3 내지 4일 동안 유지시켰다.
MM 플레이트에서 성장한 총 48개의 형질전환체를 골라내서 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃에서 액체 MM에 접종하고 250 rpm/분으로 2일 동안 진탕 성장시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은, MM 배지 중에서 2일 동안 성장시킨 후에는 pDMW303을 함유하는 Y2072U3의 거의 모든 형질전환체에서 EPA가 생산됨을 보여주었다. 선별된 48개의 형질전환체 중에서, EPA를 전체 지질의 13.9% 미만으로 생산하는 균주는 35개였고, EPA를 14 내지 16.9%로 생산하는 균주는 8개였으며, EPA를 17 내지 18.3%로 생산하는 균주는 4개였다.
(MM에서 2일 후) EPA를 전체 지질의 14% 초과로 생산하는 균주는 2-단계 성장 절차 (즉, 48시간 MM, 96시간 HGM)를 이용해서 추가의 분석을 위해 선별하였다. GC 분석은 상기 12개의 균주 모두가 EPA를 전체 지질의 18% 초과로 생산함을 보여주었다. 이들 중에서, 균주 번호 6 (균주 "Y2096"으로 표시함)은 EPA를 전체 지질의 약 24%로 생산했고, 균주 번호 43 (균주 "Y2097"로 표시함)은 EPA를 약 22.3%로 생산했고, 균주 번호 45 (균주 "Y2098"로 표시함)는 EPA를 약 22.4%로 생산했고, 균주 번호 47 (균주 "Y2099"로 표시함)은 EPA를 약 22.6%로 생산했고, 균주 번호 5 (균주 "Y2015"로 표시함)는 EPA를 약 23.3%로 생산했으며, 균주 번호 48 (균주 "Y2106"으로 표시함)은 EPA를 약 23%로 생산했다.
균주 Y2096 중의 EPA 함량 및 오일 양을 이하의 변형된 2-단계 성장 절차를 이용해서 추가로 분석하였다. 균주 Y2096은 단일 콜로니로부터 SD+AA 배지 3 mL에서 30℃ 및 250 rpm/분으로 진탕 배양시켰다. 성장 24시간 후에, SD + AA 배지 32 mL를 함유한 에를렌마이어 플라스크에 시발 배양액 3 mL를 첨가하였다. 30℃ 및 250 rpm/분의 진탕에서 48시간 추가 성장시킨 후에, 세포를 펠렛화하고, 상등액을 제거하였다. 펠렛을 250 mL 플라스크 중의 HGM 35 mL에 재현탁하였다. 배양액 35 mL를 30℃에서 인큐베이션하고, 250 rpm/분으로 추가 4일 동안 진탕 성장시켰다. 배양액의 분취액 (1 mL)을 GC 분석에 사용하고, 배양액 30 mL를 세포 건중량의 측정에 사용하였다. (내부 대조군으로서 사용하기 위한) C15:0 40 ㎍을 에스테르교환반응을 위한 나트륨 메톡시드에 첨가한 것을 제외하면 GC 분석을 상기 '통상의 방법' 항목에 기재한 바와 같이 수행하였다. 세포 건중량은 배양액 30 mL로부터의 H2O-세척 세포 펠렛을 동결건조시킴으로써 측정하였다.
GC 분석은 Y2096이 전체 지질의 약 28.1% EPA와 약 20.8% 오일/세포 건중량을 생산하였음을 보여주었다. 균주 Y2096은 야생형 야로위아 리폴리티카 ATCC #20362에 대해 하기 유전자형을 보유하였다:
EPA
를 전체 지질의 약 21%로 생산하는,
Ura
- 표현형을 갖는
Y2098U
균주의 생성
상기 '통상의 방법'에 따라 SalI/PacI-소화 구축물 pZKUT16 (서열 159)를 사용해서 TEF::rELO2S::Pex20 키메라 유전자를 균주 Y2098의 Ura3 유전자에 통합시켰다. 형질전환 후, 세포를 MM + 5-FOA 선별 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지하였다.
MM + 5-FOA 플레이트에서 성장한 총 48개의 형질전환체를 골라내서 MM 플레이트 및 MM + 5-FOA 플레이트에 따로 재스트리킹했다. MM + 5-FOA 플레이트에서 성장할 수 있지만 MM 플레이트에서는 성장할 수 없는 균주를 Ura- 균주로서 선별했다. 이들 48개의 균주 모두를 상기 '통상의 방법'에 기재된 바와 같은 2-단계 성장 조건 (즉, 48시간 MMU, 96시간 HGM)을 이용해서 분석하였다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 2-단계 성장 후 pZKUT16을 갖는 모든 형질전환체에서 EPA가 12 내지 20%로 존재했음을 보여주었다. 한가지 균주 (즉, 번호 33 균주)는 EPA를 약 21%로 생산했으며, 균주 "Y2098U"로 표시했다.
DHA
를 전체 지질의 5.6% 초과로 생산하는
Y3000
균주의 생성
구축물 pZP2FOEN4 (도 9E; 서열 165)를 사용해서 2개의 키메라 유전자 (합성 C20/22 "OtE2S" 엘론가제 및 합성 Δ4 데새투라제 "D4S"를 포함)의 클러스터를 균주 Y2098U의 Pox2 유전자 부위에 통합시켰다. 플라스미드 pZP2FOEN4는 하기 성분을 함유하였다:
플라스미드 pZP2FOEN4 (서열 165)의 기재 | |
서열 165 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
BsiWI/AscI (6152-6962) | 야로위아 Aco2 유전자 (진뱅크 관리 번호 AJ001300)의 810 bp 5' 부분 |
SphI/EcoRI (9670-10325) | 야로위아 Aco2 유전자 (진뱅크 관리 번호 AJ001300)의 655 bp 3' 부분 |
EcoRI/PacI (10640-2648) | ·YAT 프로모터: YAT1 프로모터 (서열 217) ·Δ4S: 코돈-최적화 Δ4 데새투라제 유전자 (서열 106) (트라우스토키트륨 아우레움 (진뱅크 관리 번호 AAN75707) 으로부터 유래됨) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 YAT::Δ4S::Pex16 |
EcoRV를 갖는 EcoRI/SwaI (10618-8345) | ·FBAIN: FBAIN 프로모터 (서열 214) ·OtE2S: 코돈-최적화 OtE2S 유전자 (서열 102) (오스트레오코쿠스 타우리 (진뱅크 관리 번호 AY591336) 로부터 유래됨) ·OCT: 야로위아 OCT 유전자 (진뱅크 관리 번호 X69988)의 OCT 종결자 서열 을 포함하는 FBAIN::OtE2S::Oct |
SpeI를 갖는 SpeI/XbaI (12582-11095) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
플라스미드 pZP2FOEN4를 SphI/AscI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 Y2098U 균주를 형질전환시켰다. 형질전환 후, 세포를 MM 선별 배지 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. MM 플레이트에서 성장한 총 24개의 형질전환체를 골라내서 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃에서 액체 배지 3 mL에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은, 24개의 형질전환체들 중 12개에서 DPA가 전체 지질의 약 3.6 내지 5.3%로 존재하며 DHA가 0.4 내지 1%로 존재함을 보여주었다. DPA 및 DHA를 생산하는 12개의 균주는 상기 2-단계 성장 조건 (즉, 48시간 MM, 96시간 HGM)을 이용하여 추가의 분석을 위해 선별하였다. 이어서 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 이들 12개의 형질전환체들에서 DPA가 15.6 내지 20%로 생산되며 DHA가 2.9 내지 5.6%로 생산됨을 보여주었다. DHA를 5.6%로 생산하는 균주를 균주 "Y3000"으로 칭했다.
실시예
7
Ura
- 유전자형을 가지며
LA
를 전체 지질의
45%로 생산하는 중간체 균주
Y2031
의 생성
플라스미드 pKUNT2 (도 10A)의 TEF::Y.Δ12:Pex20 키메라 유전자를 야생형 야로위아 균주 ATCC #20362의 Ura3 유전자의 유전자좌에 통합시켜 Ura-유전자형을 구성함으로써 균주 Y2031을 생성시켰다.
구체적으로, 플라스미드 pKUNT2는 하기 성분을 함유하였다:
플라스미드 pKUNT2 (서열 116)의 기재 | |
서열 166 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (3225-3015) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 784 bp 5' 부분 |
SphI/PacI (5933-13) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 516 bp 3' 부분 |
EcoRI/BsiWI (6380-8629) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·Y.Δ12: 야로위아 Δ12 데새투라제 유전자 (서열 28) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 TEF::Y.Δ12::Pex20 |
pKUNT2 플라스미드를 AscI/SphI으로 소화시킨 후, 이것을 상기 '통상의 방법'에 따라 사용하여 야생형 야로위아 리폴리티카 ATCC #20362를 형질전환시켰다. 형질전환체 세포를 FOA 선별 배지 플레이트에 플레이팅하고 30℃에서 2 내지 3일 동안 유지시켰다. FOA 내성 콜로니를 골라내서 MM 및 MMU 선별 플레이트에 스트리킹했다. MMU 플레이트에서는 성장할 수 있으나 MM 플레이트에서는 성장할 수 없는 콜로니를 Ura- 균주로서 선별하였다. 이어서 Ura- 균주의 단일 콜로니 (5)를 30℃에서 액체 MMU 에 접종시키고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 야생형 ATCC #20362에서 LA가 약 20%로 존재한 것에 비해 2개의 Ura- 균주 (즉, 균주 번호 2 및 3)에서 LA가 약 45%로 존재했음을 보여주었다. 형질전환체 균주 번호 2를 균주 "Y2031"로 칭했다.
실시예
8
야로위아
리폴리티카
중의 코돈-최적화 Δ9
엘론가제
유전자의 합성 및
기능적 발현
이소크리시스 갈바나의 Δ9 엘론가제 유전자 (진뱅크 관리 번호 AF390174)의 코돈 사용방식을 WO 2004/101753 및 실시예 4에 기재된 바와 유사한 방식으로 야로위아 리폴리티카에서의 발현에 최적화시켰다. 구체적으로, 야로위아 코돈 사용방식 패턴, ATG 번역 개시 코돈 주변의 컨센서스 서열, 및 RNA 안정성의 일반 규칙 [Guhaniyogi, G. and J. Brewer, Gene 265(1-2):11-23 (2001)]에 따라, 코돈-최적화 Δ9 엘론가제 유전자는 이소크리시스 갈바나 유전자 (서열 69)의 DNA 서열을 기초로 하여 디자인하였다 (서열 71). 번역 개시 부위의 변형 외에, 792 bp 코딩 영역 중 126 bp가 변형되었고, 123개 코돈이 최적화되었다. 코돈-최적화 유전자의 변형의 어느 것도 코딩된 단백질의 아미노산 서열을 변화시키지는 않았다 (진뱅크 관리 번호 AF390174, 서열 70).
야로위아에
대한 코돈-최적화 Δ9
엘론가제
유전자의
시험관내
합성
코돈-최적화 Δ9 엘론가제 유전자를 하기와 같이 합성하였다. 먼저, 8쌍의 올리고뉴클레오티드를 디자인하여 이소크리시스 갈바나 Δ9 엘론가제 유전자의 코돈-최적화 코딩 영역의 전장을 신장시켰다 (예컨대, 서열 292 내지 307에 상응하는 IL3-1A, IL3-1B, IL3-2A, IL3-2B, IL3-3A, IL3-3B, IL3-4A, IL3-4B, IL3-5A, IL3-5B, IL3-6A, IL3-6B, IL3-7A, IL3-7B, IL3-8A 및 IL3-8B). 센스 (A) 및 안티센스 (B) 올리고뉴클레오티드의 각 쌍은 각 5'-말단에서의 4 bp 오버행 외에는 상보적이었다. 추가로, 프라이머 IL3-1F, IL3-4R, IL3-5F 및 IL3-8R (서열 308-311)은 또한 차후의 서브클로닝을 위해 NcoI, PstI, PstI 및 Not1 제한 부위를 각각 도입하였다.
각각의 올리고뉴클레오티드 (100 ng)는 실시예 4에 기재된 바와 같이 인산화하였으며, 이어서 센스 및 안티센스 올리고뉴클레오티드의 각 쌍을 혼합하고, 함께 어닐링시켰다 [예를 들면, IL3-1A (서열 292)를 IL3-1B (서열 293)에 어닐링시켜 이중-가닥 생성물 "IL3-1AB"를 생산하였으며, IL3-2A (서열 294)를 IL3-2B (서열 295)에 어닐링시켜 이중-가닥 생성물 "IL3-2AB"을 생산함, 등.]
이어서 어닐링된 이중-가닥 올리고뉴클레오티드의 2개의 개별적 풀을 하기에 나타내는 바와 같이 함께 라이게이션하였다: 풀 1 (IL3-1AB, IL3-2AB, IL3-3AB 및 IL3-4AB 포함); 및 풀 2 (IL3-5AB, IL3-6AB, IL3-7AB 및 IL3-8AB 포함). 어닐링된 올리고뉴클레오티드의 각 풀을 10U T4 DNA 리가제를 갖는 부피 20 ㎕에서 혼합하고, 라이게이션 반응물을 밤새 16℃에서 인큐베이션하였다.
이어서 각 라이게이션 반응의 생성물을 주형으로 사용하여, 디자인된 DNA 단편을 PCR로 증폭시켰다. 구체적으로, 라이게이션된 "풀 1" 혼합물 (즉, IL3-1AB, IL3-2AB, IL3-3AB 및 IL3-4AB)을 주형으로 사용하고, 올리고뉴클레오티드 IL3-1F 및 IL3-4R (서열 308 및 309)을 프라이머로 사용하여, 코돈-최적화 Δ9 엘론가제 유전자의 제1 부분을 PCR로 증폭시켰다. PCR 증폭은 총 부피를 50 ㎕로 하여 실시예 4에 기재한 바와 같이 수행하였다. 417 bp PCR 단편을 pGEM-T 이지 벡터 (프로메가) 내로 서브클로닝하여 pT9(1-4)을 생성시켰다.
라이게이션된 "풀 2" 혼합물 (즉, IL3-5AB, IL3-6AB, IL3-7AB 및 IL3-8AB)을 주형으로 사용하고, 올리고뉴클레오티드 IL3-5F 및 IL3-8R (서열 310 및 311)을 프라이머로서 사용하여, 코돈-최적화 Δ9 엘론가제 유전자의 제2 부분을 PCR로 유사하게 증폭시키고, pGEM-T-이지 벡터 내로 클로닝시켜 pT9(5-8)을 생성시켰다.
이. 콜라이를 따로 pT9(1-4) 및 pT9(5-8)로 형질전환시키고, 플라스미드 DNA를 앰피실린-내성 형질전환체로부터 단리시켰다. 플라스미드 DNA를 정제하고, 적절한 제한 엔도뉴클레아제로 소화시켜 pT9(1-4)의 417 bp NcoI/PstI 단편 (서열 312) 및 pT9(5-8)의 377 bp PstI/Not1 단편 (서열 313)을 유리시켰다. 이어서 이들 2개 단편을 합하고, Nco1/Not1 소화 pZUF17 (서열 162; 도 9B)와 함께 정해진 방향으로 라이게이션시켜 pDMW237 (도 10B, 서열 167)을 생성시켰다. pDMW237 중의 생성된 합성 Δ9 엘론가제 유전자 ("IgD9e")의 DNA 서열은 야로위아에 대해 원래 디자인된 코돈-최적화 유전자 (즉, 서열 71)와 정확하게 동일하였다.
야로위아
리폴리티카
중의 코돈-최적화 Δ9
엘론가제
유전자의 발현
키메라 FBAIN::IgD9e::Pex20 유전자를 함유한 구축물 pDMW237 (도 10B)인 자가-복제 플라스미드를 야로위아 리폴리티카 Y2031 균주 (실시예 7) 내로 상기 '통상의 방법' 항목에 기재한 바와 같이 형질전환시켰다. pDMW237을 갖는 Y2031의 3개 형질전환체를 개별적으로 MM 배지에서 2일 동안 성장시키고, 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 결과는 pDMW237을 갖는 이들 형질전환체에서 약 7.1%, 7.3% 및 7.4% EDA가 각각 생산되었음을 보여주었다. 이들 데이타는 합성 코돈-최적화 IgD9e가 C18:2를 EDA로 전환시킬 수 있음을 입증하였다. 코돈-최적화 유전자의 "기질 전환율(%)"은 약 13%인 것으로 측정되었다.
실시예
9
야로위아
리폴리티카에서의
코돈-최적화 Δ8
데새투라제
유전자의 합성
유글레나 그라실리스의 Δ8 데새투라제 유전자 (진뱅크 관리 번호 AAD45877)의 코돈 사용방식을 WO 2004/101753 및 실시예 4 및 8 (상기 문헌)에 기재된 바와 유사한 방식으로 야로위아 리폴리티카에서의 발현에 최적화시켰다. 3개 상이한 코돈-최적화 유전자 (즉, "D8S-1", "D8S-2" 및 "D8S-3")의 합성에도 불구하고, 이들 유전자의 어느 것도 EDA를 DGLA로 탈포화시킬 수 없었다. 따라서, 이전에 공개된 Δ8 데새투라제 서열은 정확하지 않으며, Δ8 데새투라제를 유글레나 그라실리스로부터 직접 단리한 후에 mRNA 단리, cDNA 합성 및 PCR을 행하는 것이 필요하다고 가정하였다. 이로 인해 2개의 유사한 서열을 본원에서 Eg5 (서열 77 및 78) 및 Eg12 (서열 79 및 80)로 동정하였다.
각 유전자 서열의 기능적 분석은 유전자를 사카로마이세스 세레비지애 효모 발현 벡터 내에 클로닝하고, 기질 공급 시험을 행하여 수행하였다. Eg5 및 Eg12 모두는 데새투라제 EDA 및 ETrA가 DGLA 및 ETA를 각각 생산할 수 있게 하였지만, Eg5는 Eg12보다 유의하게 큰 활성을 가졌다.
Eg5의 확인된 Δ8 데새투라제 활성에 기초하여, 상기 서열은 야로위아 리폴리티카에서의 발현을 위해 코돈-최적화되었고, 그에 의해 "D8SF" (서열 81 및 82)로 지칭되는 합성 기능적 코돈-최적화 Δ8 데새투라제를 합성하였다.
코돈-최적화 Δ8
데새투라제
유전자의 예비적
시험관내
합성
코돈-최적화 Δ8 데새투라제 유전자 ("D8S-1"이라고 칭함, 서열 75)는 유글레나 그라실리스의 공개된 서열 (서열 72 및 73)을 기초로 하여 야로위아 코돈 사용방식 패턴 (WO 2004/101753), 'ATG' 번역 개시 코돈 주변의 컨센서스 서열, 및 RNA 안정성의 일반 규칙 [Guhaniyogi, G. and J. Brewer, Gene 265(1-2): 11-23 (2001)]에 따라 디자인하였다. 번역 개시 부위의 변형 외에, 1260 bp 코딩 영역 중 200 bp가 변형되었다 (15.9%). 코돈-최적화 유전자의 변형은 번역 개시 코돈 주변에 NcoI 부위를 첨가하는 'K'에서 'E'로의 제2 아미노산 변화를 제외하면 코딩된 단백질의 아미노산 서열 (서열 73)을 변화시키지 않았다.
구체적으로, 코돈-최적화 Δ8 데새투라제 유전자를 하기와 같이 합성하였다. 먼저, 13쌍의 올리고뉴클레오티드를 디자인하여 유글레나 그라실리스 Δ8 데새투라제 유전자의 코돈-최적화 코딩 영역의 전장을 신장시켰다 (예컨대, 서열 314 내지 339에 상응하는 D8-1A, D8-1B, D8-2A, D8-2B, D8-3A, D8-3B, D8-4A, D8-4B, D8-5A, D8-5B, D8-6A, D8-6B, D8-7A, D8-7B, D8-8A, D8-8B, D8-9A, D8-9B, D8-10A, D8-10B, D8-11A, D8-11B, D8-12A, D8-12B, D8-13A 및 D8-13B). 센스 (A) 및 안티센스 (B) 올리고뉴클레오티드의 각 쌍은 각 5'-말단에서의 4 bp 오버행 외에는 상보적이었다. 추가로, 프라이머 D8-1A, D8-3B, D8-7A, D8-9B 및 D8-13B (서열 314, 319, 326, 331 및 339)는 또한 차후의 서브클로닝을 위해 NcoI, BglII, XhoI, SacI 및 Not1 제한 부위를 각각 도입하였다.
각각의 올리고뉴클레오티드 (100 ng)를 실시예 4에 기재된 바와 같이 인산화하고, 이이서 센스 및 안티센스 올리고뉴클레오티드의 각 쌍을 혼합하고, 함께 어닐링시켰다 [예를 들어, D8-1A (서열 314)를 D8-1B (서열 315)에 어닐링시켜 이중-가닥 생성물 "D8-1AB"를 생산함, D8-2A (서열 316)를 D8-2B (서열 317)에 어닐링시켜 이중-가닥 생성물 "D8-2AB"를 생산함, 등].
어닐링된 이중-가닥 올리고뉴클레오티드의 4개의 개별적 풀을 하기에 나타내는 바와 같이 이어서 함께 라이게이션하였다: 풀 1 (D8-1AB, D8-2AB 및 D8-3AB 포함); 풀 2 (D8-4AB, D8-5AB 및 D8-6AB 포함); 풀 3 (D8-7AB, D8-8AB, 및 D8-9AB 포함); 및 풀 4 (D8-10AB, D8-11AB, D8-12AB 및 D8-13AB 포함). 어닐링된 올리고뉴클레오티드의 각 풀을 10U T4 DNA 리가제를 갖는 부피 20 ㎕에서 혼합하고, 라이게이션 반응물을 16℃에서 밤새 인큐베이션하였다.
각 라이게이션 반응의 생성물을 이어서 주형으로서 사용하여 디자인된 DNA 단편을 PCR로 증폭시켰다. 구체적으로, 라이게이션된 "풀 1" 혼합물 (즉, D8-1AB, D8-2AB 및 D8-3AB)을 주형으로 사용하고, 올리고뉴클레오티드 D8-1F 및 D8-3R (서열 340 및 341)을 프라이머로 사용하여, 코돈-최적화 Δ8 데새투라제 유전자의 제1 부분을 PCR로 증폭시켰다. PCR 증폭은 총 부피를 50 ㎕로 하여 실시예 4에 기재한 바와 같이 수행하였다. 309 bp PCR 단편을 pGEM-T 이지 벡터 (프로메가) 내로 서브클로닝하여 pT8(1-3)을 생성시켰다.
라이게이션된 "풀 2" 혼합물 (즉, D8-4AB, D8-5AB 및 D8-6AB)을 주형으로 사용하고, 올리고뉴클레오티드 D8-4F 및 D8-6R (서열 342 및 343)을 프라이머로서 사용하여, 코돈-최적화 Δ8 데새투라제 유전자의 제2 부분을 PCR로 유사하게 증폭시키고, pGEM-T-이지 벡터 내로 클로닝시켜 pT8(4-6)을 생성시켰다. 라이게이션된 "풀 3" 혼합물 (즉, D8-7AB, D8-8AB 및 D8-9AB)을 주형으로 사용하고, 올리고뉴클레오티드 D8-7F 및 D8-9R (서열 344 및 345)을 프라이머로서 사용하여, 코돈-최적화 Δ8 데새투라제 유전자의 제3 부분을 PCR로 유사하게 증폭시키고, pGEM-T-이지 벡터 내로 클로닝시켜 pT8(7-9)을 생성시켰다. 최종적으로, 라이게이션된 "풀 4" 혼합물 (즉, D8-10AB, D8-11AB, D8-12AB 및 D8-13AB)을 주형으로 사용하고, 올리고뉴클레오티드 D8-10F 및 D8-13R (서열 346 및 347)을 프라이머로서 사용하여, 코돈-최적화 Δ8 데새투라제 유전자의 제4 부분을 PCR로 유사하게 증폭시키고, pGEM-T-이지 벡터 내로 클로닝시켜 pT8(10-13)을 생성시켰다.
이. 콜라이를 따로 pT8(1-3), pT8(4-6), pT8(7-9) 및 pT8(10-13)으로 형질전환시키고, 플라스미드 DNA를 앰피실린-내성 형질전환체로부터 단리시켰다. 플라스미드 DNA를 정제하고, 적절한 제한 엔도뉴클레아제로 소화시켜 pT8(1-3)의 309 bp NcoI/BglII 단편 (서열 348), pT8(4-6)의 321 bp BglII/XhoI 단편 (서열 349), pT8(7-9)의 264 bp XhoI/SacI 단편 (서열 350) 및 pT8(10-13)의 369 bp Sac1/Not1 단편 (서열 351)을 유리시켰다. 이어서 이들 단편을 합하고, Nco1/Not1 소화 pY54PC (서열 168; WO2004/101757)와 함께 정해진 방향으로 라이게이션시켜 pDMW240 (도 10C)을 생성시켰다. 이는 pDMW240 중의 합성 Δ8 데새투라제 유전자 ("D8S-1", 서열 75)를 생성시켰다.
유글레나 그라실리스의 공개된 Δ8 데새투라제 아미노산 서열 (서열 73)에 비해, 번역 개시 코돈 주변에 NcoI 부위를 첨가하기 위해 D8S-1의 제2 아미노산을 'K'에서 'E'로 변화시켰다. 공개된 유글레나 그라실리스 Δ8 데새투라제 서열 (서열 73)과 정확하게 동일한 아미노산 서열을 갖는 또다른 형태의 합성된 유전자는 pDMW240을 주형으로서 사용하고 올리고뉴클레오티드 ODMW390 및 ODMW391 (서열 352 및 353)을 프라이머로서 사용하여 시험관내 돌연변이유발 (스트라타진, 미국 캘리포니아주 샌 디에고 소재)에 의해 구축하였다. 생성된 플라스미드를 pDMW255라고 칭하였다. pDMW255 중의 합성 Δ8 데새투라제 유전자를 "D8S-2"라고 칭하였으며, 아미노산 서열은 서열 73에 도시한 서열과 정확하게 동일하였다.
비기능적 코돈-최적화 Δ8
데새투라제
유전자
야로위아 리폴리티카 균주 ATCC #76982(Leu-)를 pDMW240 (도 10C) 및 pDMW255로 각각 상기 '통상의 방법' 항목에 기재한 바와 같이 형질전환시켰다. 재조합 구축물 함유 효모를 EDA [20:2(11,14)]를 보충한 MM에서 성장시켰다. 구체적으로, pDMW240 (D8S-1 함유) 또는 pDMW255 (D8S-2 함유)를 함유한 형질전환체 야로위아 리폴리티카의 단일 콜로니를 MM 3 mL 중에서 30℃에서 OD600 약 1.0까지 성장시켰다. 이어서 기질 공급을 위해 세포 100 ㎕를, EDA 기질 10 ㎍을 함유하는 MM 3 mL 중에서 30℃에서 약 24시간 동안 계대배양하였다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
상기 형질전환체 중 어느 것도 EDA로부터 DGLA를 생산하지 않았으며, 따라서 D8S-1 및 D8S-2가 기능하지 않았고, EDA를 탈포화시킬 수 없었다. 키메라 D8S-1::XPR 및 D8S-2::XPR 유전자를 서열 354 및 355에 각각 나타낸다.
진뱅크 (관리 번호 AAD45877 [서열 73])에 기탁되고 WO 00/34439 또는 문헌 [Wallis et al., Archives of Biochem. Biophys, 365:307-316 (1999)]에 기재한 Δ8 데새투라제의 단백질 서열 (본원에서 서열 74)들 사이에서 3개의 아미노산 차이가 발견되었다. 구체적으로, 3개 아미노산은 진뱅크 관리 번호 AAD45877에서 누락된 것으로 나타났다. pDMW255를 주형으로 사용하고 ODMW392 및 ODMW393 (서열 356 및 357)을 프라이머로서 사용하여, 시험관내 돌연변이유발 (스트라타진, 미국 캘리포니아주 샌 디에고 소재)에 의해 9 bp를 합성 D8S-2 유전자 내에 부가함으로써 WO 00/34439 및 문헌 [Wallis et al. (상기 문헌)]에 기재한 서열 (서열 74)과 동일한 단백질을 생산하였다. 생성된 플라스미드를 pDMW261이라고 칭하였다. pDMW261 중의 합성 Δ8 데새투라제 유전자를 "D8S-3" (서열 76)이라고 칭하였다. pDMW261 구축물을 야로위아 내로 형질전환시킨 후에, EDA를 사용하는 유사한 공급 실험을 상기 기재한 바와 같이 수행하였다. D8S-3의 경우 EDA에서 DGLA로의 탈포화가 관찰되지 않았다.
유글레나
그라실리스
Δ8
데새투라제
유전자의 단리
유글레나 그라실리스를 미시간 주립대학교(미국 미시건주 이스트 랜싱 소재)에 재직하는 리차드 트리에머(Richard Triemer) 박사의 실험실에서 얻었다. 활성적 성장 배양물 10 mL로부터, 분취액 1 mL를 500 mL 유리병 중의 유글레나 그라실리스 (Eg) 배지 250 mL에 옮겼다. Eg 배지는 물 970 mL 중에 나트륨 아세테이트 1 g, 소 추출물 (카탈로그 #U126-01, 디프코 래버러토리즈, 미국 미시간주 디트로이트 소재) 1 g, 박토(Bacto)® 트립톤 (카탈로그 #0123-17-3, 디프코 래버러토리즈) 2 g 및 박토® 효모 추출물 (카탈로그 #0127-17-9, 디프코 래버러토리즈) 2 g을 합하여 제조하였다. 여과 멸균 후에, 토양수 상등액 (카탈로그 #15-3790, 캐롤라이나 바이올로지컬 서플라이 컴파니(Carolina Biological Supply Company), 미국 노쓰캐롤라이나 벌링톤 소재) 30 mL를 무균적으로 첨가하여 최종 Eg 배지를 제조하였다. 유글레나 그라실리스 배양물을 23℃에서 교반 없이 2주 동안 광 주기 16시간, 암 주기 8시간으로 성장시켰다.
2주 후에, 배양물 10 mL을 지질 분석을 위해 들어내고, 1,800 x g에서 5분 동안 원심분리하였다. 펠렛을 물로 1회 세척하고, 재-원심분리하였다. 생성된 펠렛을 5분 동안 진공하에 건조시키고, 트리메틸술포늄 히드록시드 (TMSH) 100 ㎕에 재현탁하고, 실온에서 15분 동안 진탕 인큐베이션하였다. 이 후에, 헥산 0.5 mL를 첨가하고, 바이알을 15분 동안 실온에서 진탕 인큐베이션하였다. 지방산 메틸 에스테르 (헥산층으로부터 5 ㎕ 주사됨)를 분리하고, 오메가왁스 320 융합 실리카 모세관 컬럼 (카탈로그 #24152, 수펠코 인크.(Supelco Inc.))을 장착한 휴렛-팩커드 6890 가스 크로마토그래프로 정량하였다. 오븐 온도를 220℃에서 2.7분 동안 유지하고, 20℃/분으로 240℃까지 증가시키고, 이어서 추가 2.3분 동안 유지하는 프로그램대로 진행시켰다. 운반 기체를 왓트만(Whatman) 발생기로 제공하였다. 체류 시간을 상업적으로 입수가능한 표준의 메틸 에스테르 (카탈로그 #U-99-A, 누-체크 프렙, 인크.(Nu-Chek Prep, Inc.))와 비교하고, 생성된 크로마토그램을 도 11에 나타낸다.
잔존 2주 배양물 (240 mL)을 1,800 x g에서 10분 동안 원심분리하여 펠렛화하고, 물로 1회 세척하고, 재-원심분리하였다. 총 RNA를 생성된 펠렛으로부터 RNA STAT-60™ 시약 (델-테스트, 인크.(TEL-TEST, Inc.), 미국 택사스주 프랜즈우드 소재)으로 제공된 제조자의 프로토콜에 따라 (물 0.5 mL에 RNA를 용해한 시약 5 mL 사용) 추출하였다. 이러한 방법으로, 총 RNA (2 mg/mL) 1 mg을 펠렛으로부터 수득하였다. mRNA를 제공된 제조자의 프로토콜에 따라 mRNA 정제 키트 (아머샴 바이오사이언스즈(Amersham Biosciences), 미국 뉴저지주 피스카타웨이 소재)로 총 RNA 1 mg으로부터 단리하였다. 이런 방식으로, mRNA 85 ㎍을 수득하였다.
제조자의 프로토콜에 따라 제공된 올리고(dT) 프라이머와 함께 cDNA 합성용 수퍼스크립트™ 초이스 (Superscript™ Choice) 시스템 (인비트로젠™ 라이프 테크놀로지즈(Invitrogen™ Life Technologies), 미국 캘리포니아주 칼스배드 소재)을 사용하여 cDNA를 mRNA 765 ng으로부터 합성하였다. 합성된 cDNA를 물 20 ㎕에 용해하였다.
하기 조건을 이용하여 올리고뉴클레오티드 프라이머 Eg5-1 및 Eg3-3 (서열 358 및 359)로 유글레나 그라실리스 Δ8 데새투라제를 cDNA로부터 증폭시켰다. 구체적으로, cDNA (1 ㎕)를 50 pmol Eg5-1, 50 pmol Eg5-1, PCR 뉴클레오티드 믹스 (10 mM, 프로메가, 미국 위스콘신주 매디슨 소재) 1 ㎕, 10X PCR 완충제 (인비트로젠) 5 ㎕, MgCl2 (50 mM, 인비트로젠) 1.5 ㎕, Taq 폴리머라제 (인비트로젠) 0.5 ㎕ 및 최종 50 ㎕가 되는 양의 물과 합하였다. 반응 조건은 3분 동안 94℃, 이어서 45초 동안 94℃, 45초 동안 55℃ 및 1분 동안 72℃의 35 주기였다. PCR을 72℃에서 7분 동안, 이어서 4℃에서 유지하여 마쳤다. PCR 반응물을 5 ㎕에 대해 아가로스 겔 전기영동으로 분석하고, 약 1.3 kB의 분자 중량을 갖는 DNA 밴드를 관찰하였다. 잔존 45 ㎕의 생성물을 아가로스 겔 전기영동으로 분리하고, DNA 밴드는 제조자의 프로토콜에 따라 자이모클린™ 겔 DNA 리커버리 키트(Zymoclean™ Gel DNA Recovery Kit)(자이모 리써치, 미국 캘리포니아주 오렌지 소재)를 사용하여 정제하였다. 생성된 DNA를 제조자의 프로토콜에 따라 pGEM®-T 이지 벡터 (프로메가) 내로 클로닝하였다. 다중 클론을 T7, M13-28Rev, Eg3-2 및 Eg5-2 (각각 서열 360 내지 363)로 서열결정하였다.
따라서, 단지 몇개 bp가 상이한 Eg5 (서열 77) 및 Eg12 (서열 79)인 2개 클래스의 DNA 서열을 얻었다. Eg5 및 Eg12의 번역은 단지 1개 아미노산이 상이한 단백질 서열인 서열 78 및 80을 각각 생성하였다. 따라서, Eg5에 대한 DNA 및 단백질 서열을 서열 77 및 서열 78로 각각 나타내고; Eg12에 대한 DNA 및 단백질 서열을 서열 79 및 서열 80으로 각각 나타낸다.
단리된
유글레나
그라실리스
Δ8
데새투라제
서열 대 공개된 유글레나
그라실리스
Δ8
데새투라제
서열의 비교
진뱅크 관리 번호 AAD45877 (gi: 5639724, 본원에서 서열 73)로부터의 단백질 서열 및 문헌 [Wallis et al., Archives of Biochem. Biophys., 365:307-316 (1999); WO 00/34439][본원에서 서열 74]의 공개된 단백질 서열과 서열 78 (Eg5) 및 서열 80 (Eg12)으로 나타내는 단백질 서열의 정렬을 도 12에 나타낸다. 모든 4개 서열 중에 보존된 아미노산을 별표 (*)로 나타낸다. 서열의 정렬을 최대화하기 위해 대시(-)를 프로그램에 의해 사용하였다. 추정적 시토크롬 b5 도메인에 밑줄을 쳤다. 추정적 His 박스를 볼드체로 나타낸다. 동일성(%) 계산은 Eg5 Δ8 데새투라제 단백질 서열이 서열 73에 대해 95.5% 및 서열 74에 대해 96.2% 동일함을 나타내며, 여기서 "동일성(%)"을 2개 단백질 간의 동일한 아미노산의 비율(%)로서 정의한다. 서열 정렬 및 동일성(%) 계산은 LASERGENE 바이오인포매틱스 컴퓨팅 스위트(bioinformatics computing suite) (드나스타 인크., 미국 위스콘신주 매디슨 소재)의 메갈린 프로그램으로 수행하였다. 서열의 다중 정렬은 디폴트 파라미터 (GAP PENALTY=1O, GAP LENGTH PENALTY=1O)를 갖는 클러스탈 정렬 방법 [Higgins and Sharp, CABIOS. 5:151-153 (1989)]으로 수행하였다. 클러스탈 방법을 사용하는 쌍쌍 정렬에 대한 디폴트 파라미터는 KTUPLE 1, GAP PENALTY=3, WINDOW=5 및 DIAGONALS SAVED=5이었다. 다양한 유글레나 그라실리스 Δ8 데새투라제 서열들 간의 차이에 대한 더 완전한 분석을 위해서는 동시 계류 중인 미국 특허 출원 제11/166993호를 참조한다.
사카로마이세스
세레비지애
중의 유글레나
그라실리스
Δ8
데새투라제
서열의 기능적 분석
효모 에피솜 플라스미드 (YEp)-유형 벡터 pRS425 [Christianson et al., Gene, 110:119-22 (1992)]는 사카로마이세스 세레비지애 2μ 내인성 플라스미드로부터의 서열, LEU2 선별가능한 마커 및 다기능적 파지미드 pBluescript II SK +의 주쇄에 기초한 서열을 함유한다. 사카로마이세스 세레비지애의 강력한 구성적 글리세르알데히드-3-포스페이트 데히드로게나제 (GPD) 프로모터를 pRS425의 SacII와 SpeI 부위 사이에 문헌 [Jia et al., Physiological Genomics, 3:83-92 (2000)]에 기재된 것과 동일한 방식으로 클로닝하여 pGPD-425를 생산하였다. NotI 부위를 pGPD-425의 BamHI 부위 내에 도입하여 (따라서, BamHI 부위에 의해 플랭킹된 NotI 부위를 생산함) 플라스미드 pY-75를 생산하였다. Eg5 (서열 77) 및 Eg12 (서열 79)을 NotI 소화에 의해 상기 기재한 pGEM®-T 이지 벡터로부터 유리시키고, pY-75의 NotI 부위 내로 클로닝하여 pY89-5 (ATCC #PTA-6048로 기탁됨) 및 pY89-12를 각각 생산하였다. 이런 방식으로, Δ8 데새투라제 (즉, Eg5 [서열 77] 및 Eg12 [서열 79])를 사카로마이세스 세레비지애에서의 발현을 위해 강력한 구성적 프로모터 뒤에 클로닝하였다. pY89-5의 지도를 도 10D에 나타낸다.
플라스미드 pY89-5, pY89-12 및 pY-75를 사카로마이세스 세레비지애 BY4741 (ATCC #201388) 내로 표준 리튬 아세테이트 형질전환 절차로 형질전환시켰다. 형질전환체는 CSM-leu (큐바이오젠(Qbiogene), 미국 캘리포니아주 칼스배드 소재)를 보충한 DOBA 배지에서 선별하였다. 각 플레이트로부터의 형질전환체를 CSM-leu (큐바이오젠)으로 보충한 DOB 배지 2 mL에 접종하고, 1일 동안 30℃에서 성장시킨 후에, 0.5 mL를 1 mM로 EDA 또는 EtrA를 보충한 동일한 배지로 옮겼다. 이들을 30℃에서 250 rpm으로 밤새 인큐베이션하고, 펠렛을 원심분리로 수득하고, 진공하에 건조시켰다. 펠렛을 TMSH 50 ㎕로 에스테르교환하고, 상기 '통상의 방법' 항목에 기재한 바와 같이 GC로 분석하였다. pY-75 (즉, 클론 75-1 및 75-2) 및 pY89-5 (즉, 클론 5-6-1 및 5-6-2)에 대한 2개 클론을 각각 분석하면서, 두 가지 독립적 형질전환으로부터의 pY89-12에 대한 2개 세트의 클론 (즉, 클론 12-8-1, 12-8-2, 12-9-1 및 12-9-2)을 분석하였다.
EDA 공급 클론의 GC 분석에 의해 얻은 지질 프로파일을 표 23에 나타내고; EtrA 공급 클론의 GC 분석에 의해 얻은 지질 프로파일을 표 24에 나타냈다. 지방산을 16:0 (팔미테이트), 16:1 (팔미트올레산), 18:0, 18:1 (올레산), 20:2 [EDA], 20:3 (8,11,14) [DGLA], 20:3 (11,14,17) [ETrA] 및 20:4 (8,11,14,17) [ETA]로서 확인하고; 각각의 조성을 전체 지방산의 백분율(%)로 나타낸다.
표 23 및 24의 데이타는 클로닝된 유글레나 Δ8 데새투라제가 EDA 및 EtrA를 탈포화시킬 수 있었음을 보여주었다. 서열 80에 나타낸 서열은 서열 78에 나타낸 서열에 비해 1개 아미노산 변화를 가지고, 저하된 Δ8 데새투라제 활성을 가졌다.
표 24 중의 클론 75-2에 의해 생성되는 소량의 20:4(8,11,14,17)는 20:4(8,11,14,17)에 대한 표준과 약간 다른 체류 시간을 가졌다. 이 피크는 그 실험에서 야생형 효모에 의해 생성되는 소량의 상이한 지방산일 가능성이 더 크다.
야로위아
리폴리티카에
대해 최적화된 Δ8
데새투라제
유전자 코돈의 추가 개질
pDMW261 중의 합성 D8S-3 유전자의 아미노산 서열을 기능적 유글레나 Δ8 데새투라제의 아미노산 서열 (서열 77 및 78)에 따라 교정하였다. pDMW261을 주형으로 사용하고, 올리고뉴클레오티드 ODMW404 (서열 364) 및 D8-13R (서열 347)을 사용하여, 합성 D8S-3 데새투라제 유전자를 코딩하는 DNA 단편을 증폭시켰다. 생성된 PCR 단편을 Bio101 진클린(Geneclean) 키트로 정제하고, 이어서 Kpn1 및 Not1로 소화시켰다 (프라이머 ODMW404가 KpnI 부위를 도입하고, 프라이머 D8-13R은 NotI 부위를 도입함). Kpn1/Not1 단편 (서열 365)을 Kpn1/Not1 소화 pKUNFmKF2 (도 10E, 서열 169) 내로 클로닝하여 pDMW277 (도 13A)을 생산하였다.
증폭시키고, D8S-3 유전자의 5' 말단을 교정하기 위해 디자인한 올리고뉴클레오티드 YL521 및 YL522 (서열 366 및 367)를 pDMW277이 주형으로서 사용되는 또다른 PCR 반응에서 프라이머로서 사용하였다. 프라이머는 PCR 단편의 5' 및 3' 말단에 Nco1 부위 및 BglII 부위를 각각 도입하였다. 318 bp PCR 생성물을 Bio101 진클린 키트로 정제하고, 이어서 Nco1 및 BglII로 소화시켰다. 소화 단편을 pDMW277로부터의 954 bp BglII/NotI 단편과 함께 사용하여 pZF5T-PPC (도 13B, 서열 170)를 교환하여 pDMW287을 형성시켰다. 합성 D8S-3 유전자의 5' 말단을 교정하는 것 외에, 이 클로닝 반응은 또한 합성 Δ8 데새투라제 유전자를 야로위아 리폴리티카 FBAIN 프로모터 (서열 214)의 조절 하에 두었다.
부위-지정 돌연변이유발 반응의 최종 시리즈 중의 제1 반응은 이어서 pDMW287 상에서 수행하였다. 프라이머의 제1 세트인 YL525 및 YL526 (서열 368 및 369)은 pDMW287 중의 합성 D8S-3 유전자의 아미노산 F에서 S (위치 #50)로의 교정을 위해 디자인하였다. 이 돌연변이유발 반응으로부터 생성된 플라스미드는 이어서 프라이머 YL527 및 YL528 (서열 370 및 371)을 사용하는 다음 부위-지정 돌연변이유발 반응에 주형이 되었다. 이들 프라이머는 아미노산 D8S-3 유전자의 아미노산 F에서 S (위치 #67)로의 교정을 위해 디자인하고, 플라스미드 pDMW287/YL527을 생성하였다.
유전자의 제2 쿼터 내에 서열 교정을 완료하기 위해, 하기 반응을 유전자의 제1 쿼터 상의 돌연변이와 동시에 수행하였다. pDMW287을 주형으로서 사용하고, 올리고뉴클레오티드 YL529 및 YL530 (서열 372 및 373)을 프라이머로서 사용하여, 시험관내 돌연변이유발 반응을 수행하여 합성 D8S-3 유전자의 아미노산 C에서 W (위치 #177)로의 교정을 수행하였다. 이 돌연변이유발 반응의 생성물 (즉, pDMW287/Y529)을 프라이머 YL531 및 YL532 (서열 374 및 375)를 사용하는 하기 반응에 주형으로서 사용하여 아미노산 P에서 L (위치 #213)로 교정하였다. 이 반응의 생성물을 pDMW287/YL529-31이라고 칭하였다.
유전자의 제1 및 제2 쿼터 상의 돌연변이와 동시에, 상기 반응을 유전자의 3' 말단 상에서 유사하게 수행하였다. 각각의 차후 돌연변이유발 반응은 이전 반응으로부터의 플라스미드 생성물을 사용하였다. 프라이머 YL533 및 YL534 (서열 376 및 377)를 pDMW287 상에 사용하여 아미노산 C에서 S (위치 #244)로 교정함으로써 pDMW287/YL533을 생성하였다. 프라이머 YL535 및 YL536 (서열 378 및 379)을 사용하여 pDMW287/YL533의 합성 D8S-3 유전자 중의 아미노산 A를 T (위치 #280)로 교정하여 pDMW287/YL533-5를 형성시켰다. 마지막으로, pDMW287/YL533-5를 주형으로서 사용하고 YL537 및 YL538 (서열 380 및 381)을 프라이머로 사용하여 합성 D8S-3 유전자 중의 위치 #333에서의 아미노산 P를 S로 교정하였다. 생성된 플라스미드를 pDMW287/YL533-5-7이라고 명명하였다.
pDMW287/YL529-31의 BglII/XhoI 단편 및 pDMW287/YL533-5-7의 XhoI/NotI 단편을 사용하여 pDMW287/YL257의 BglII/NotI 단편을 변화시켜 완전히 교정된 합성 Δ8 데새투라제 유전자 (D8SF라고 칭하고, 서열 81에 나타냄)를 함유한 pDMW287F (도 13C)을 생산하였다. 서열 82는 개시 메티오닌 이후의 추가의 발린을 제외하면 서열 78에 나타낸 서열과 본질적으로 동일한 서열 81의 뉴클레오티드 2 내지 1270을 코딩하는 아미노산 서열을 나타낸다.
실시예
10
야로위아
리폴리티카
중의 코돈-최적화 Δ9
엘론가제
유전자 및
코돈-최적화 Δ8
데새투라제의
기능적 발현
본 실시예는 실시예 8 및 9로부터의 코돈-최적화 Δ9 엘론가제 및 코돈-최적화된 Δ8 데새투라제를 동시 발현하기 위해 형질전환된 야로위아 리폴리티카 중의 DGLA 생합성 및 축적을 기재한다. 이에 의해 본 실험은 유전자 활성 및 야로위아 리폴리티카의 Δ9 엘론가제/Δ8 데새투라제 경로 발현 능력을 모두 확인하였다.
구체적으로, 구축물 pDMW287F (실시예 9)의 키메라 FBAIN::D8SF::Pex16 유전자를 포함하는 ClaI/PacI 단편을 pDMW237 (실시예 8)의 ClaI/PacI 부위 내에 삽입시켜 구축물 pDMW297 (도 13D; 서열 123)을 생성하였다.
플라스미드 pDMW297은 하기 성분을 함유하였다:
플라스미드 pDMW297 (서열 171)의 기재 | |
서열 171 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
EcoRI/ClaI (9053-10448) | ARS18 서열 (진뱅크 관리 번호 A17608) |
ClaI/PacI (1-2590) | ·FBAIN: FBAIN 프로모터 (서열 214) ·D8SF: 코돈-최적화 Δ8 데새투라제 유전자 (서열 181) (유글레나 그라실리스 (진뱅크 관리 번호 AF139720)로부터 유래됨) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 FBAIN::D8SF::Pex16 |
PacI/SalI (2590-4082) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
SalI/BsiWI (4082-6257) | ·FBAIN: FBAIN 프로모터 (서열 214) ·IgD9e: 코돈-최적화 Δ9 엘론가제 유전자 (서열 71) (이소크리시스 갈바나 (진뱅크 관리 번호 390174) 로부터 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::IgD9e::Pex20 |
이어서 구축물 pDMW297을 균주 Y2031 (실시예 13)의 형질전환에 대해 통상의 방법에 따라 사용하였다. 형질전환체 세포를 MM 선별 배지 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. MM 플레이트에서 성장한 총 8개 형질전환체를 골라내서 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃에서 액체 MM에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 DGLA가 분석된 모든 형질전환체에서 생산됨을 보여주었다. 1개 균주는 DGLA를 약 3.2% 생산하고, 4개 균주는 DGLA를 4.3 내지 4.5% 생산하고, 2개 균주는 DGLA를 5.5 내지 5.8% 생산하고, 1개 균주는 DGLA를 6.4% (본원에서 균주 "Y0489"라고 칭함) 생산하였다. 균주 Y0489 중의 코돈-최적화 D8SF 유전자의 "기질 전환율(%)"은 75%인 것으로 측정되었다.
실시예
11
ω-6 Δ9
엘론가제
/Δ8
데새투라제
경로:
야로위아
리폴리티카에서
DHA
를 생산하는 균주의 생성 (예언적)
본 실시예는 야로위아 리폴리티카 ATCC #20362로부터 유래되어 ω-6 Δ9 엘론가제/Δ8 데새투라제 경로의 발현을 통해 DHA를 생산하도록 유전자 조작된 균주의 구축을 기재하고 있으며, 따라서 이들 DHA-생산 균주의 완전한 지질 프로파일의 분석은 최종 DHA-함유 오일에서 GLA 동시-합성이 없음을 나타내었다.
이들 DHA-생산 균주의 개발에는 첫째로 야로위아 리폴리티카 ATCC #20362로부터 유래되어 EPA를 전체 지질에 대하여 9%로 생산할 수 있는 균주 Y2201 및 Y2203의 생성이 요구되었다 (도 5). 균주 Y2201 및 Y2203에는 균주 Y2152 및 Y2153 (DGLA를 ~3.5%로 생산함), 균주 Y2173 (DGLA를 14%로 생산함) 및 균주 Y2189 (EPA를 5%로 생산함)의 구축이 요구되었다.
후속적으로, Y2201 및 Y2203은 Lys-균주이기 때문에, 당업자에게 익히 공지된 방법을 사용하여 pZP2FOEN4 (서열 165)의 뉴클레오티드 위치 12582-11095를 스패닝하는 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)를 야로위아 Lys5 유전자 (진뱅크 관리 번호 M34929)로 교환하여 플라스미드 pZP2FOEN4-Lys를 생성하는 것이 필요하였다. 이러한 조작 후에, 균주 Y2201 및 Y2203은 상기 실시예 6에 기재된 바와 같이 플라스미드 pZP2FOEN4-Lys로 형질전환되어, ω-6 Δ9 엘론가제/Δ8 데새투라제 경로를 사용하여 DHA를 생산하는 형질전환체 균주가 생성되었다.
DGLA
를 전체 지질의 약 ~3.5%로 생산하는 균주
Y2152
및
Y2153
의 생성
구축물 pZP2C16M899 (도 14A, 서열 172)를 사용하여 4개의 키메라 유전자 (2개의 Δ9 엘론가제, 합성 C16 /18 지방산 엘론가제 및 Δ8 데새투라제 포함), 뿐만 아니라 단일 아미노산 돌연변이를 함유한 야로위아 AHAS 유전자 (아세토히드록시-산 신타제)의 클러스터를 통합시켰다. 야로위아 중의 돌연변이된 AHAS 효소는 양성 스크리닝 마커로서 사용되는 술포닐우레아 내성을 부여하였다. 플라스미드 pZP2C16M899는 야로위아 균주 ATCC #20362의 Pox2 유전자 부위 내로 통합되도록 디자인하고, 따라서 하기 성분을 함유하였다:
플라스미드 pZP2C16M899 (서열 172)의 기재 | |
서열 172 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
BsiWI/AscI (6152-6962) | 야로위아 Aco2 유전자 (진뱅크 관리 번호 AJ001300)의 810 bp 5' 부분 |
SphI/EcoRI (9670-10325) | 야로위아 Aco2 유전자 (진뱅크 관리 번호 AJ001300)의 655 bp 3' 부분 |
BsiWI/PmeI와 함께 EcoRV (929-3195) | ·GPM/FBAIN: GPM::FBAIN 키메라 프로모터 (서열 219) ·rEL02S: 코돈-최적화된 rEL02 엘론가제 유전자 (서열 85) (래트 (진뱅크 관리 번호 AB071986)에서 유래됨) ·OCT: 야로위아 OCT 유전자 (진뱅크 관리 번호 X69988)의 OCT 종결자 서열 을 포함하는 GPM/FBA인트론::rEL02S::0ct |
BsiWI/EcoRI (929-14447, 역방향) | ·GPAT: GPAT 프로모터 (서열 216) ·IgD9e: 코돈-최적화된 Δ9 엘론가제 유전자 (서열 71) (이소크리시스 갈바나에서 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 GPAT::IgD9e::Pex20 |
EcoRI/SwaI (14447 -12912) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·IgD9e: 서열 71 (상기 문헌) ·Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 Lip1 종결자 서열 을 포함하는 TEF::IgD9e::Lip1 |
SwaI/PacI (12912-10325) | ·FBAIN: FBAIN 프로모터 (서열 214) ·D8SF: 코돈-최적화된 Δ8 데새투라제 유전자 (서열 81) (유글레나 그라실리스 (진뱅크 관리 번호 AF139720)에서 유래됨) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 FBAIN::D8SF::Pex16 |
PmeI와 함께 EcoRV/BsiWI (3195-6152) | W497L 돌연변이를 포함하는 야로위아 리폴리티카 AHAS 유전자 (서열 243) |
플라스미드 pZP2C16M899를 SphI/AscI로 소화시킨 후에, 이것을 사용하여 ATCC #20362를 통상의 방법에 따라 형질전환시켰다. 형질전환 후, 세포를 술포닐우레아 150 mg을 함유한 MM 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. 술포닐우레아 내성 콜로니를 골라내고 술포닐우레아 함유 MM 선별 플레이트 상에 스트리킹하였다. 총 96개 형질전환체를 이어서 술포닐우레아를 함유한 액체 MM에 30℃에서 접종시키고, 250 rpm/분에서 2일 동안 진탕시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 pZP2C16M899의 4개 키메라 유전자를 함유한 형질전환체에서 DGLA의 존재를 보였지만, 야생형 야로위아 대조군 균주에서는 보이지 않았다. 선별된 96개 균주 중 대부분은 전체 지질의 2% 미만으로 DGLA를 생산하였다. DGLA를 전체 지질의 2 내지 2.9%로 생산하는 균주가 28개였다. DGLA를 전체 지질의 3.5%로 생산하는 균주가 2개였다. 균주 #65 및 #73을 본원에서 균주 "Y2152" 및 "Y2153"이라고 각각 칭하였다.
DGLA
를 전체 지질의 약 14 내지 16%로 생산하는 균주
Y2173
및
Y2175
의 생성
구축물 pDMW314 (도 14B, 서열 173)을 사용하여 4개의 키메라 유전자 (2개의 Δ9 엘론가제, Δ8 데새투라제 및 Δ12 데새투라제 포함)의 클러스터를 야로위아 균주 Y2152 및 Y2153의 Ura3 유전자 부위 내로 통합하여 DGLA의 생성을 증대시켰다. 플라스미드 pDMW314는 하기 성분을 함유하였다:
플라스미드 pDMW314 (서열 173)의 기재 | |
서열 173 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (10066-9275) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 784 bp 5' 부분 |
SphI/PacI (12774-1) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 516 bp 3' 부분 |
SwaI/BsiWI (6582-9275) | ·FBAIN: FBAIN 프로모터 (서열 214) ·F.Δ12: 푸사륨 모닐리포르메 Δ12 데새투라제 유전자 (서열 32) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)로부터의 Pex20 종결자 서열 을 포함하는 FBAIN::F.D12S::Pex20 |
ClaI/EcoRI (6199-4123) | GPAT::IgD9e::Pex20: pZP2C16M899 (상기 참조)에 기재된 바와 같음 |
EcoRI/SwaI (4123-2588) | TEF::IgD9E::Lip1: pZP2C16M899 (상기 참조)에 기재된 바와 같음 |
SwaI/PacI (2588-1) | FBAIN::D8SF::Pex16: pZP2C16M899 (상기 참조)에 기재된 바와 같음 |
플라스미드 pDMW314를 AscI/SphI로 소화시킨 후에, 이를 야로위아 리폴리티카 균주 Y2152 및 Y2153의 형질전환을 위해 통상의 방법에 따라 사용하였다. 형질전환체 세포를 FOA 선별 배지 플레이트 상에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. FOA 내성 콜로니를 골라내고 MM 및 MMU 선별 플레이트 상에 스트리킹하였다. MMU 플레이트에는 성장할 수 있지만, MM 플레이트에서는 성장할 수 없는 콜로니를 Ura- 균주로서 선별하였다. Ura- 균주의 단일 콜로니를 이어서 액체 MMU 내에 30℃에서 접종하고, 250 rpm/분에서 2일 동안 진탕시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 pDMW314의 4개 키메라 유전자를 함유한 거의 모든 형질전환체에서 DGLA의 증가된 생성을 보여주었다. pDMW314를 갖는 Y2152의 선별된 Ura- 균주 48개 중 대부분은 DGLA를 전체 지질의 약 6 내지 8%로 생산하였다. DGLA를 전체 지질의 약 13.9%로 생산하는 균주는 1개였다 (즉, #47은 본원에서 "Y2173"이라고 칭함).
유사하게, pDMW314를 갖는 Y2153의 선별된 24개 Ura- 균주 중 대부분은 DGLA를 전체 지질의 약 6 내지 8%로 생산하였다. DGLA를 전체 지질의 약 16.3% 및 17.2%로 생산하는 균주는 2개였다 (즉, #6 및 #11은 본원에서 균주 "Y2175" 및 "Y2176"이라고 칭함).
EPA
를 전체 지질의 약 4.8%로 생산하는 균주
Y2189
의 생성
구축물 pDMW325 (도 14C, 서열 174)를 사용하여 4개의 키메라 유전자 (2개의 Δ5 데새투라제 및 2개의 Δ17 데새투라제 포함)의 클러스터를 야로위아 Y2173 균주의 Leu2 유전자 부위 내로 통합하여 EPA를 생성할 수 있었다. 플라스미드 pDMW325는 하기 성분을 함유하였다:
플라스미드 pDMW325 (서열 174)의 기재 | |
서열 174 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (4837-5632) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230)의 788 bp 5' 부분 |
SphI/PacI (2137-1426) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230)의 703 bp 3' 부분 |
SwaI와 함께 Pme/BsiWI (8277-5632) | ·FBAIN: FBAIN 프로모터 (서열 214) ·MAΔ5: 모르티에렐라 알피나 Δ5 데새투라제 유전자 (서열 6) (진뱅크 관리 번호 AF067654) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::MAΔ5::Pex20 |
EcoRI/SwaI와 함께 PmeI (10876-8278) | ·GPM/FBAIN: GPM::FBAIN 키메라 프로모터 (서열 219) ·I.Δ5S: 코돈-최적화된 Δ5 데새투라제 유전자 (서열 10) (이소크리시스 갈바나 (WO 2002/081668)에서 유래됨) ·OCT: 야로위아 OCT 유전자 (진뱅크 관리 번호 X69988)의 OCT 종결자 서열 을 포함하는 GPM/FBAIN::I.Δ5S::0ct |
EcoRI/PmeI (10876-12497) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
PmeI/ClaI (12497-14651) | ·YAT: YAT1 프로모터 (서열 217) ·Δ17S: 코돈-최적화된 Δ17 데새투라제 유전자 (서열 21) (사프롤레그니아 디클리나에서 유래됨) ·Lip2: 야로위아 리파제2 유전자 (진뱅크 관리 번호 AJ012632)의 Lip2 종결자 을 포함하는 YAT::D17S::Lip2 |
ClaI/PacI (14651-1426) | ·GPD: GPD 프로모터 (서열 210) ·Δ17S: 서열 21 (상기 참조) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 GPD::D17S::Pex16 |
플라스미드 pDMW325를 AscI/SphI로 소화시킨 후에, 이를 사용하여 균주 Y2173을 통상의 방법에 따라 형질전환시켰다. 형질전환 후, 세포를 MMLe 플레이트 상에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. 각각의 형질전환으로부터 MMLe 플레이트 상에 성장한 개개의 콜로니를 골라내고 MM 및 MMLe 플레이트 상에 스트리킹하였다. MMLe 플레이트 상에 성장할 수 있지만 MM 플레이트 상에 성장할 수 없는 이들 콜로니를 Leu2- 균주로서 선별하였다. Leu2- 균주의 단일 콜로니를 이어서 액체 MMLe 배지에 30℃에서 접종하고, 250 rpm/분에서 2일 동안 진탕시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 pDMW325 형질전환체에 EPA가 존재하지만, 모 Y2173 균주에는 존재하지 않음을 보여주었다. 구체적으로, pDMW325를 갖는 Y2173의 48개 선별된 Leu2- 형질전환체 중에, 대부분의 균주가 EPA를 전체 지질의 3% 미만으로 생산하였다. EPA를 각각 전체 지질의 약 4.8% 및 3.4%로 생산하는 균주가 2개 (즉, #21 및 #46, 본원에서 "Y2189" 및 "Y2190"이라고 칭함) 있었다.
EPA
를 전체 지질의 약 9%로 생산하는 균주
Y2201
및
Y2203
의 생성
구축물 pZKSL5598 (도 14D, 서열 175)을 사용하여 4개의 키메라 유전자 (Δ9 엘론가제, Δ8 데새투라제 및 2개의 Δ5 데새투라제 포함)의 클러스터를 야로위아 Y2189 균주의 Lys5 유전자 (진뱅크 관리 번호 M34929) 부위 내에 통합하여 EPA의 생성을 증대시켰다. 플라스미드 pZKSL5598은 하기 성분을 함유하였다:
플라스미드 pZKSL5598 (서열 175)의 기재 | |
서열 175 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (10409-9573) | 야로위아 Lys5 유전자 (진뱅크 관리 번호 M34929)의 794 bp 5' 부분 |
SphI/PacI (13804-13117) | 야로위아 Lys5 유전자 (진뱅크 관리 번호 M34929)의 687 bp 3' 부분 |
BsiWI/SwaI (7150-9573) | ·NT: YAT1 프로모터 (서열 217) ·I.Δ5S: 코돈-최적화된 Δ5 데새투라제 유전자 (서열 10) (이소크리시스 갈바나 (WO 2002/081668)에서 유래됨) ·Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 Lip1 종결자 서열 을 포함하는 NT::I.D5S::Lip1 |
SalI/BsiWI (4537-7150) | ·GPAT: GPAT 프로모터 (서열 216) ·MAΔ5: 모르티에렐라 알피나 Δ5 데새투라제 유전자 (서열 6) (진뱅크 관리 번호 AF067654) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)로부터의 Pex20 종결자 서열 을 포함하는 GPAT::MAΔ5::Pex20 |
SwaI/PmeI (2381-348) | ·FBAINm: FBAINm 프로모터 (서열 215) ·IgD9e: 코돈-최적화된 Δ9 엘론가제 유전자 (서열 71) (이소크리시스 갈바나에서 유래됨) ·OCT: 야로위아 OCT 유전자 (진뱅크 관리 번호 X69988)의 OCT 종결자 서열 을 포함하는 FBAINm::IgD9e::OCT |
ClaI/PacI (1-13804) | ·GPD: GPD 프로모터 (서열 210) ·D8SF: 코돈-최적화된 Δ8 데새투라제 유전자 (서열 81) (유글레나 그라실리스 (진뱅크 관리 번호 AF139720)에서 유래됨) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 GPD::D8SF::Pex16 |
SalII/PmeI (4537 -2417) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230) |
플라스미드 pZKSL5598을 AscI/SphI로 소화시킨 후에, 이를 사용하여 균주 Y2189을 통상의 방법에 따라 형질전환시켰다. 형질전환 후, 세포를 MMLys 플레이트 상에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. 각각의 형질전환으로부터 MMLys 플레이트 상에 성장한 개개의 콜로니를 골라내고 MM 및 MMLys 플레이트 상에 스트리킹하였다. 플레이트 상에 성장할 수 있지만 MM 플레이트 상에서는 성장할 수 없는 이들 콜로니를 Lys- 균주로서 선별하였다. Lys- 균주의 단일 콜로니를 이어서 액체 MMLys 배지에 30℃에서 접종하고, 250 rpm/분에서 2일 동안 진탕시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 pZKSL5598 형질전환체에서 EPA의 증가된 생성을 나타냈다. pZKSL5598을 갖는 Y2189의 96개 선별된 Lys- 형질전환체 중에서, 대부분의 균주는 EPA를 전체 지질의 4 내지 8%로 생산하였다. EPA를 각각 전체 지질의 약 9% 및 8.7%로 생산하는 균주가 2개 있었다 (즉, #34 및 #77, 본원에서 "Y2201" 및 "Y2203"이라고 칭함).
실시예
12
ω-3 Δ9
엘론가제
/Δ8
데새투라제
경로:
야로위아
리폴리티카에서
DHA
를 생산하는 균주의 생성 (예언적)
본 실시예는 야로위아 리폴리티카 ATCC #20362로부터 유래되어 ω-3 Δ9 엘론가제/Δ8 데새투라제 경로의 발현을 통해 DHA를 생산하도록 유전자 조작된 균주의 구축을 기재하고 있으며, 따라서 이들 DHA-생산 균주의 완전한 지질 프로파일의 분석은 최종 DHA-함유 오일에서 GLA 동시-합성이 없음을 나타내었다.
이들 DHA-생산 균주의 발달에는 첫째로 야로위아 리폴리티카 ATCC #20362로부터 유래되어 EPA를 전체 지질에 대하여 1.3%로 생산할 수 있는 균주 L116의 생성이 요구되었다 (도 5). 균주 L116에는 균주 L98 (ALA를 생산함), 균주 L103 (증가된 ALA를 생산함) 및 균주 L115 (ETA를 약 4%로 생산함)의 구축이 요구되었다. 추가로, 균주 L116은 오직 (또는 강력한) ω-3 특이성을 갖는 것으로 본원에서 특성화된, 다니오 레리오 (진뱅크 관리 번호 BC068224)로부터 유래된 신규 이작용성 Δ5/Δ6 데새투라제의 합성 및 발현이 요구되었다.
후속적으로, L116 Ura- 균주는 pKUT16을 갖는 L116에서 Ura3 유전자의 파괴에 의해 생성된 다음 상기 실시예 6에 기재된 바와 같이 플라스미드 pZP2FOEN4로 형질전환되어, ω-3 Δ9 엘론가제/Δ8 데새투라제 경로를 사용하여 DHA를 생산하는 형질전환체 균주가 생성되었다.
재순환가능 선별을 위한
LoxP
::
Ura3
/
HPT
::
LoxP
통합 구축물 및
Cre
-
SU
복제 플라스미드의 생성
Δ15 데새투라제의 다중 카피를 야로위아 리폴리티카 내로 도입하기 위해 재순환가능 선별 마커 및 부위-특이적 재조합 시스템 (즉, Cre/Lox)에 기반한 전략을 사용하였다. 간략하게 설명하면, 표적 유전자 (즉, 푸사륨 모닐리포르메 Δ15 데새투라제 [서열 51])를 통합 구축물에서 LoxP 부위에 의해 플랭킹되는 선별 마커 (예컨대, Ura3 및 하이그로마이신 포스포트랜스퍼라제 [HPT])에 인접하게 클로닝하였다. 형질전환 및 형질전환체의 선별 후에, 선별 마커는 술포닐우레아 내성 (SU) 유전자 및 Cre 레콤비나제 유전자를 갖는 복제 플라스미드의 도입에 의해 염색체로부터 제거하였다. 선별 마커의 손실 후에, Cre 플라스미드를 치유하였다. 따라서, 치유된 균주는 또다른 형질전환에 사용가능하였다.
보다 구체적으로, 플라스미드 pY72 (도 15A, 서열 176)는 1개 카피의 푸사륨 모닐리포르메 Δ15 데새투라제 및 Ura3/HPT 선별 마커 (LoxP 부위에 의해 플랭킹됨)를 포함하는 통합 구축물이었다. 구축물 pY72는 하기 성분을 함유하였다:
플라스미드 pY72 (서열 176)의 기재 | |
서열 176 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
6763-7643 | 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 881 bp 5' 부분 |
9422-10184 | 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 763 bp 3' 부분 |
SwaI/Sbfl (16-2522) | ·FBAIN: FBAIN 프로모터 (서열 214) ·FmD15: 푸사륨 모닐리포르메 Δ15 데새투라제 유전자 (서열 51) . Lip2: 야로위아 Lip2 유전자 (진뱅크 관리 번호 AJ012632)로부터의 Lip2 종결자 서열 을 포함하는 FBAIN::FmD15:Lip2 |
2531-2564 | LoxP 서열 (서열 382) |
2566-4184 | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
4198-5861 | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·HPT: 히그로마이신 내성을 부여하는 에스케리키아 콜라이 히그로마이신 포스포트랜스퍼라제 코딩 영역 [Kaster, K.R., et al., Nucleic Acids Res. 11 :6895-6911 (1983)] ·XPR: 야로위아 Xpr 유전자 (진뱅크 관리 번호 M17741)의 3' 영역의 ~100 bp 를 포함하는 TEF::HPT::XPR |
5862-5895 | LoxP 서열 (서열 382) |
유사하게, 플라스미드 pY80 (도 15B, 서열 177)을 사용하여 2개 카피의 푸사륨 모닐리포르메 Δ15 데새투라제 및 Ura3/HPT 선별 마커 (LoxP 부위에 의해 플랭킹됨)를 포함하는 통합 구축물을 생성하였다. 프라이머 436 및 437 (서열 383 및 384)을 사용하며, PCR을 사용하여 8878 bp 플라스미드 pY34 (WO 2005/047480)로부터의 GPD::Fm1::XPR2를 포함하는 PacI/FseI 단편을 증폭하였다. 이 PacI/FseI 단편을 PacI/FseI-소화 벡터 pY72 내로 인-퓨전 클로닝 (클론테크 래버러토리즈, 인크., 미국 캘리포니아주 마운틴 뷰 소재)에 의해 클로닝하고, XL-2 울트라 감응성 세포 (BRL, 미국 메릴랜드주 베쎄스다 소재) 내로 형질전환시켰다. 10개 양성 형질전환체를 PacI/FseI 소화 후에 미니프렙 분석에 의해 동정하고, 단지 클론 #3 및 #4가 올바른 것이었다. 올바른 클론 중 하나를 "pY80"이라 칭하였다. 따라서, 구축물 pY80은 하기 성분을 함유하였다:
플라스미드 pY80 (서열 177)의 기재 | |
서열 177 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
PacI/FseI (4-2375) | ·GPD: GPD 프로모터 (서열 210) ·FmD15: 푸사륨 모닐리포르메 Δ15 데새투라제 유전자 (서열 51) ·XPR: 야로위아 Xpr 유전자 (진뱅크 관리 번호 M17741)의 3' 영역의 ~100 bp 을 포함하는 GPD::FmD15:XPR |
FseI/SbfI 2385-4891 | FBAIN::FmD15:Lip2: pY72 (상기 참조)에 기재된 바와 같음 |
4900-4933 | LoxP 서열 (서열 382) |
4935-6533 | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
6567-8230 | TEF::HPT::XPR: pY72 (상기 참조)에 기재된 바와 같음 |
8231-8264 | LoxP 서열 (서열 382) |
8271-9079 | 야로위아 Lip1 유전자 (진뱅크 관리 번호 250020)의 809 bp 5' 부분 |
11791-12553 | 야로위아 Lip1 유전자 (진뱅크 관리 번호 250020)의 763 bp 3' 부분 |
구축물 pY79 (도 15C, 서열 178)는 술포닐우레아 내성 (SU) 유전자 (즉, AHAS) 및 TEF::Cre 레콤비나제 유전자를 갖는 복제 플라스미드이었다. 구체적으로, 구축물 pY79는 하기 성분을 함유하였다:
플라스미드 pY79 (서열 178)의 기재 | |
RE 부위 및 뉴클레오티드 서열 178 | 단편 및 키메라 유전자 성분의 기재 |
4329-7315 | W497L 돌연변이체 (서열 243)를 포함한 야로위아 리폴리티카 AHAS 유전자 |
7362-1 | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·Cre: 리컴비나제 단백질에 대한 장내세균 파지 P1 Cre 유전자 (진뱅크 관리 번호 X03453) ·XPR: 야로위아 Xpr 유전자의 3' 영역의 ~100 bp (진뱅크 관리 번호 M17741) 을 포함하는 TEF::Cre::XPR |
ALA
를 생산하는 균주
L98
의 생성
플라스미드 pY72 (서열 176)를 AscI/SphI로 소화시킨 후에, 이것으로 표준 리튬 아세테이트 방법을 사용하여 야생형 야로위아 리폴리티카 ATCC #20362를 형질전환시켰다. 형질전환 후, 세포를 YPD+하이그로마이신 (250 ㎍/mL) 플레이트 상에 플레이팅하였다. 2일 후에, 20개 형질전환체를 골라내고 신선한 YPD+하이그로마이신 (250 ㎍/mL) 플레이트 상에 스트리킹하고, 30℃에서 밤새 인큐베이션하였다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 pY72 형질전환체에서 ALA가 존재하지만, 야생형 야로위아 대조군 균주에서는 존재하지 않았음을 보여주었다. 최고 클론은 ALA를 전체 지질의 약 27%로 생산하고, 80%의 기질 전환율을 나타냈다.
ATCC #20362/pY72 형질전환체를 pY79 (서열 178, 술포닐우레아 (SU) 내성 마커를 가짐)로 형질전환시키고, 형질전환체를 3일 동안 MM + SU (150 ㎍/mL) 플레이트 상에서 선별함으로써 pY72 중에서 LoxP 부위에 의해 플랭킹된 Ura3/HPT 마커를 게놈으로부터 제거하였다. SU-내성 (SUR) 형질전환체를 신선한 MM + SU (150 ㎍/mL) 플레이트 상에 1일 동안 재스트리킹하고, 이어서 YPD+하이그로마이신 (250 ㎍/mL) 플레이트 상에 레플리카-플레이팅하였다. 모든 클론 (클론 #1 제외)은 하이그로마이신 (Hygs)에 감수성이어서 이는 HPT 내성 유전자가 Cre 레콤비나제에 의해 성공적으로 제거되었음을 나타낸다.
플라스미드 pY79는 세포를 YPD에서 선별 없이 30℃에서 밤새 성장시킴으로써 Hygs 클론 #6 및 #14로부터 치유되었다. 배양물 (0.1 mL)을 YPD 1 mL에 희석하고, 이를 사용하여 가장 높은 희석이 20,000배가 되도록 계단 희석하였다. 각각의 희석을 이어서 새로운 YPD 플레이트 상에 플레이팅하고, 30℃에서 밤새 인큐베이션하였다. 플레이트를 MM + SU (150 ㎍/mL) 플레이트 상에 레플리카-플레이팅하였다. 모든 클론은 SU-감수성 (SUS)이어서, 이는 이들이 pY79를 성공적으로 치유하였음을 나타낸다. 클론 #6-1을 추가의 형질전환에 대해 사용하였다.
구체적으로, 상기 방법을 사용하여 플라스미드 pY80 (서열 177)을 AscI/SphI로 소화시킨 후에, 이를 사용하여 균주 #6-1을 형질전환시켰다. YPD+하이그로마이신 (250 ㎍/mL) 플레이트 상의 선별, 전체 지질의 GC 분석, 플라스미드 pY79 (서열 178)로의 형질전환, SUR 및 Hygs 클론의 동정, 및 플라스미드 pY79의 치유 후에, 균주 #1을 동정하였다. 이에 의해 이 균주는 3개 카피의 FmΔ15를 가지고, LA에서 ALA로의 96.1%의 기질 전환율을 가졌다.
균주 #1을 pY80 및 이어서 pY79로 상기 기재한 바와 같이 형질전환시켰다. 이는 불충분한 기질 (즉, LA)의 결과로서 5개 카피의 FmΔ15를 갖는 균주 L98을 생성하였지만, 이 균주 중의 Δ15 탈포화는 균주 #1 (3개 카피의 FmΔ15를 가짐)에 상대적으로 유의하게 개선되지 않았다.
증가된
ALA
를 생산하는 균주
L103
의 생성
플라스미드 pY86 (도 15D, 서열 179)을 1개 카피의 푸사륨 모닐리포르메 Δ12 데새투라제 및 Ura3/HPT 선별 마커 (LoxP 부위에 의해 플랭킹됨)를 포함하는 통합 구축물이었다. 구체적으로, pY86은 하기 성분을 함유하였다:
플라스미드 pY86 (서열 179)의 기재 | |
서열 179 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
3399-4207 | 야로위아 Lip1 유전자의 809 bp 5' 부분 (진뱅크 관리 번호 Z50020) |
6919-7681 | 야로위아 Lip1 유전자의 763 bp 3' 부분 (진뱅크 관리 번호 Z50020) |
28-61 | LoxP 서열 (서열 382) |
63-1681 | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
1695-3358 | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·HPT: 히그로마이신 내성을 부여하는 에스케리키아 콜라이 히그로마이신 포스포트랜스퍼라제 코딩 영역 [Kaster, K.R., et al., Nucleic Acids Res. 11 :6895-6911 (1983)] ·XPR: 야로위아 Xpr 유전자 (진뱅크 관리 번호 M17741)의 3' 영역의 ~100 bp 를 포함하는 TEF::HPT::XPR |
3359-3392 | LoxP 서열 (서열 382) |
PacI/FseI (7690-7) | ·FBAIN: FBAIN 프로모터 (서열 214) ·FmD12: 모르티에렐라 이자벨리나 Δ12 데새투라제 유전자 (서열 32) ·Lip2: 야로위아 Lip2 유전자 (진뱅크 관리 번호 AJ012632)의 Lip2 종결자 서열 을 포함하는 FBAIN::FmD12::Lip2 |
상기 방법으로, 플라스미드 pY86을 AscI/SphI로 소화시킨 후에, 이것으로 균주 L98을 형질전환시켰다. YPD+하이그로마이신 (250 ㎍/mL) 플레이트 상의 선별, 전체 지질의 GC 분석, 플라스미드 pY79 (서열 178)를 사용하는 형질전환 및 SUR 및 Hygs 클론의 동정 후에, 균주 L103을 동정하였다. 이에 의해 이 균주는 5개 카피의 FmΔ15, 1개 카피의 FmΔ12를 가졌고, Ura3-이었다. 균주 L98에 상대적으로, 균주 L103 중의 18:1의 양 (전체 지방산의 백분율로서)은 42%에서 약 10%로 저하되었고, 균주 L103 중의 18:2의 양 (전체 지방산의 백분율로서)은 2%에서 약 10%로 증가하고, 균주 L103 중의 ALA의 양 (전체 지방산의 백분율로서)은 22%에서 47%로 증가하였다.
ETA
를 전체 지질의 약 4%로 생산하는 균주
L115
의 생성
플라스미드 pY94 (도 16A, 서열 180)는 1개 카피의 Δ8 데새투라제, 1개 카피의 Δ9 엘론가제, 및 Ura3 선별 마커 (LoxP 부위에 의해 플랭킹됨)를 포함하는 통합 구축물이었다. 이 플라스미드는 하기 성분을 함유하였다:
플라스미드 pY94 (서열 180)의 기재 | |
서열 180 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
PacI/SwaI (1-2587) | ·FBAIN: FBAIN 프로모터 (서열 214) ·D8: 코돈-최적화된 Δ8 데새투라제 유전자 (서열 81) (유글레나 그라실리스 (진뱅크 관리 번호 AF139720)에서 유래됨) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 서열 을 포함하는 FBAIN::D8:Pex16 |
2592-4684 | ·GPAT: GPAT 프로모터 (서열 216) ·D9E: 코돈-최적화된 Δ9 엘론가제 유전자 (서열 71) (이소크리시스 갈바나에서 유래됨) ·Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 Lip1 종결자 서열 을 포함하는 GPAT::D9E::Lip1 |
4714-4747 | LoxP 서열 (서열 382) |
4761-6378 | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
6380-6413 | LoxP 서열 (서열 382) |
6470-7253 | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 784 bp 5' 부분 |
9965-10480 | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 516 bp 3' 부분 |
표준 리튬 아세테이트 방법을 이용하여 플라스미드 pY94로 균주 L103을 형질전환시켰다. 형질전환 후, 상기 세포를 MM 플레이트에 플레이팅하고 3일 동안 유지시켰다. 이어서, 22개의 콜로니를 골라내고 신선한 MM 플레이트에 스트리킹하여 30℃에서 밤새 성장시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다. 클론 #8 (본원에서는 균주 L104라고 칭함)은 가장 높은 Δ9 엘론가제 및 Δ8 데새투라제 기질 전환율(%)을 가졌다.
균주 L104의 대수증식기 세포를 pY79 (서열 178) 1 ㎕ (약 0.5 ㎍/㎕)로 형질전환시키고, 형질전환체를 4일 동안 MMU + SU (100 ㎍/mL) 플레이트에서 선별함으로써 게놈으로부터 pY94에서 LoxP 부위에 의해 플랭킹된 Ura3 마커를 잘라냈다. 12개 SUR 형질전환체를 신선한 MM 및 MMU 플레이트에서 2일 동안 재스트리킹하였다. 모든 클론 (1개는 제외)은 URA 영양요구성 (즉, Uras)이므로, 이는 Ura3 내성 유전자를 Cre 레콤비나제에 의해 성공적으로 잘라냈음을 나타낸다.
세포의 1/3 백금이로부터 MMU 중에 1:10,000 내지 1:50,000 희석함으로써 플라스미드 pY79를 1개 URA 영양요구균으로부터 치유하였다. 희석물 (100 ㎕/플레이트)을 YPD 플레이트 상에 플레이팅하고, 30℃에서 2일 동안 인큐베이션하였다. 8개 콜로니를 YPD 플레이트로부터 골라내고, MMU 플레이트 및 MMU + SU 플레이트 상에 스트리킹하고, 30℃에서 24 시간 동안 인큐베이션하였다. 모든 클론은 SU-감수성 (SUs)이어서, 이는 이들이 pY79를 성공적으로 치유하였음을 나타낸다. 이들 중 하나를 L111이라 칭하고, 이에 의해 5개 카피의 FmΔ15, 1개 카피의 FmΔ12, 1개 카피의 Δ8 데새투라제, 1개 카피의 Δ9 엘론가제를 가지고, Ura3-이었다.
균주 L115 (5개 카피의 FmΔ15, 1개 카피의 FmΔ12, 2개 카피의 Δ8 데새투라제, 2개 카피의 Δ9 엘론가제를 보유하고 Ura3-을 특징으로 함)는 균주 L111을 pY94 (서열 180)로 상기 방법을 이용하여 형질전환시킴으로써 생성하였다. GC 분석은 균주 L115가 ETA를 전체 지질 (완전한 지질 프로파일, 하기 참조)의 약 4%로 생산하였음을 보여주었다.
EPA
를 전체 지질의 약 1.3%로 생산하는 균주
L116
의 생성
진뱅크 관리 번호 AF309556 [Hastings et al., PNAS 98(25): 14304-14309 (2001)]로서 동정된 다니오 레리오 데새투라제는 사카로마이세스 세레비지애에서 하기 이작용성 Δ6 및 Δ5 데새투라제 활성을 나타내는 것으로 보고되었다: (1) ω-6 기질에 비해 ω-3 기질의 별개의 성호성; 및 (2) Δ5 데새투라제 활성에 상대적으로 유의하게 더 높은 Δ6 데새투라제 활성.
본 발명자들은 진뱅크 관리 번호 BC068224를 진뱅크 관리 번호 AF309556의 상동체 (이들은 단지 ORF의 위치 984에서의 1 bp (T) 결실 (무효화 돌연변이를 생성함) 및 위치 1171에서의 1 bp 변화 ('G'에서 'A'로) ('V에서 'M'으로 아미노산을 변화시킴)가 상이함)로서 동정하였다.
V1171M 돌연변이 외에 진뱅크 관리 번호 AF309556 (본원에서 "Drd6/d5(V)"로서 동정됨, 서열 15)에 동일하게 돌연변이체 단백질을 이어서 생성하였다 (본원에서 "Drd6/d5(M)"로서 동정함, 서열 18). 구체적으로, 2개 중복 단편을 먼저 진뱅크 관리 번호 BC068224 cDNA 파지미드로부터 프라이머 쌍들 475 및 477 (서열 385 및 386) 및 478 및 476 (서열 387 및 388) [여기서, 프라이머 477 및 478은 "누락 T"를 가짐]으로 증폭하였다. 이어서, 전체 Drd6/d5(M) ORF는 프라이머 475 및 476 및 주형으로서의 2개 중복 단편을 사용하여 증폭시켰다. ORF는 하기 성분을 함유한 복제 플라스미드 중에 두고, 본원에서 플라스미드 "pY91M" (도 16B)로서 동정하였다:
플라스미드 pY91M (서열 181)의 기재 | |
서열 181 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
2866-4170 | ARS18 서열 (진뱅크 관리 번호 A17608) |
4216-5703 | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
SalI/BsiwI (5705-8423) | ·FBAIN: FBAIN 프로모터 (서열 214) ·DrD6: Drd6/d5(M) 유전자 (서열 17) (다니오 레리오 Δ5/Δ6 데새투라제 (진뱅크 관리 번호 BC068224) 에서 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::DrD6:Pex20 |
플라스미드 pY91V는 플라스미드 pY91M으로부터 부위-특이적 돌연변이유발에 의해 QuikChange® II 부위-지정 돌연변이유발 키트, (스트라타진, 카탈로그 #200523) 및 프라이머 505 및 506 (서열 389 및 390)을 사용하여 생성하였다. pY91V는 상기 기재한 M에서 V로 아미노산 돌연변이시키는 단일 bp 변화 외에 pY91M과 동일하였다.
플라스미드 pY91M 및 pY91V, 뿐만 아니라 대조군로서 제공된 빈 벡터를 균주 L115의 대수증식기 세포 내로 각각 표준 리튬 아세테이트 방법으로 형질전환시켰다. 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 3일 동안 유지하였다. 콜로니를 이어서 골라내고, 신선한 MM 플레이트 상에 성장시키고, 30℃에서 밤새 성장시켰다. 각 클론의 세포의 1/3 백금이를 MM 3 mL에 접종하고, 30℃의 진탕기에서 24시간 동안 성장시켰다. 별법으로, 세포를 24 시간 동안 MM에서 성장시키고, 이어서 3일 동안 HGM에서 배양하였다. 모든 세포를 수확하고, 그의 지방산 조성을 이전에 기재한 바와 같이 GC에 의해 분석하였다.
빈 벡터 (대조군), pY91M 및 pY91V로 형질전환시킨 균주 L115 (FmΔ15, FmΔ12, Δ8 데새투라제 및 Δ9 엘론가제 키메라 유전자의 결과로서 ω-3 Δ9 엘론가제/Δ8 데새투라제 경로를 발현함)의 완전한 지질 프로파일을 하기 표 36에 나타낸다. 지방산을 16:0, 16:1, 17:1, 18:0, 18:1 (올레산), 18:2 (LA), GLA, 20:2 (EDA), DGLA, ARA, ALA, STA, 20:3 (ETrA), ETA 및 EPA로서 확인하고; 각각의 조성을 전체 지방산(%)으로서 나타낸다. 3개의 별도 실험을 수행하였으며, 이를 컬럼 "실험 번호"에 실험 번호 1, 2 및 3으로 나타냈다. 추가로, 각각의 균주에 대한 Δ6 및 Δ5 기질 전환율(%)은 ω-6 및 ω-3 기질을 모두 사용하는 활성에 대해 보고한다 (표 37).
* 클론 #11로서 동정된 L115/pY91M 형질전환체를 야로위아 리폴리티카 균주 "L116"이라고 칭하였다.
상기 결과에서 입증되는 바와 같이, 야로위아 리폴리티카 (즉, 균주 L115 + pY91M)에서의 Drd6/d5(M)의 발현은 Δ6 데새투라제 활성 (즉, ALA에서 STA로)보다 Δ5 데새투라제 활성 (즉, ETA에서 EPA로)에 대한 더 높은 기질 전환율(%) 및 Δ6 및 Δ5 데새투라제 활성 모두에 대해 매우 높은 ω-3 기질 선호성을 갖는, Δ6 및 Δ5 데새투라제 활성을 모두 갖는 이작용성 효소를 생산하였다. 예상외로, Drd6/d5(V) (즉, 균주 L115 + pY91V)는 ω-6 기질에 대해 Δ6 또는 Δ5 활성을 나타내지 않은 반면, Drd6/d5(M)은 ω-6 기질에 대해 Δ5 활성을 결실하였다. 따라서, Drd6/d5(M)은 Drd6/d5(V)와 상이한 특징을 가졌다. Drd6/d5(V)와 공개된 구축물과의 활성에서의 차이는 단백질이 발현되는 상이한 숙주 유기체 및/또는 기질의 기원 (즉, 기질 공급 [Hastings et al., 상기 문헌] 또는 기질 생합성 [본원에서 입증됨])과 관련이 있는 것으로 여겨진다.
Drd6/d5(M) 및 Drd6/d5(V)의 기질 특이성의 더 나은 이해를 위해, FBAIN::Drd6/d5(M)::Pex20 및 FBAIN::Drd6/d5(V)::Pex20 키메라 유전자를 야로위아 복제 플라스미드 내로 LEU 선별로 전달하고, 이에 의해 플라스미드 pY102(M) 및 pY102(V)를 각각 생성하였다. 이들 플라스미드를 이어서 균주 Q-d12D인, Δ12 데새투라제 넉아웃 (WO 2004/104167)을 포함하는 야로위아 리폴리티카 균주 내로 형질전환시켰다. 형질전환체를 1일 동안 MM에서 0.5 mM LA, ALA, ETrA [20:3 (11,14,17)], EDA, DGLA 또는 ETA의 존재하에 성장시키고, 기질 전환율(%)을 시험하였다. 결과를 하기 표 38에 나타낸다:
상기 결과는 신규 Drd6/d5(M) 데새투라제가 (공개된 Drd6/d5(V) 데새투라제에 비해) (1) 시험된 모든 기질에 대해 더 높은 기질 전환율(%); (2) ω-6 지방산에 비해 ω-3 지방산에 대해 더 높은 선택성 [ω-3 또는 ω-6 기질를 갖는 Drd6/d5(V)에는 Δ5 활성이 없었지만]; 및 (3) 예측되지 않은 Δ8 데새투라제 활성을 가졌음을 보여주었다.
Q-d12D 형질전환체 대 L115 형질전환체 간의 기질 전환율(%)에서의 차이는 기질 공급의 결과로 여겨졌다. Drd6/d5가 아실-CoA 기질 상에 작용하는 것으로 보고되었기 때문에, 데새투라제 활성은 지방산 공급 또는 야로위아 숙주에 의한 새로운 합성의 결과로서 상이할 수 있다. 또다른 예측되지 않은 관찰은 Drd6/d5(M)가 ETrA [20:3 (11, 14, 17)]를 ETA로 전환시키지만, EDA [20:2 (11, 14)]를 DGLA로 전환시키지 않았는데, 즉 단백질이 ω-3 기질에 대해서만 Δ8 데새투라제 활성을 가졌다는 것이었다.
이 신규 Drd6/d5(M) 데새투라제는 야로위아 리폴리티카에서 발현되는 경우에 경로 유전자 조작에 대한 특이한 이점을 제공할 수 있다는 특징을 가지는 것으로 고려된다.
실시예
13
EPA
를 전체 지질의 14%로 생산하는, 중간체 균주
Y2067U
의 생성
본 실시예는 야로위아 리폴리티카 ATCC #20362로부터 유래되어 EPA를 전체 지질에 대하여 14%로 생산할 수 있는 균주 Y2067U의 구축을 기재한다 (도 5). 이 균주는 ω-6 Δ6 데새투라제/Δ6 엘론가제 경로를 발현하도록 유전자 조작되었다. 이 EPA 생산 균주에서 모르티에렐라 알피나 LPAAT2, DGAT1 및 DGAT2 및 야로위아 리폴리티카 CPT1 유전자 과발현이 미치는 효과를 실시예 17, 18, 19 및 24 각각 (하기 참조)에 기재한 바와 같은 TAG 함량 및/또는 조성의 분석을 기초로 조사하였다.
균주 Y2067U의 개발에는 균주 M4 (DGLA를 8%로 생성하고, 실시예 6에 기재됨), 균주 Y2034 (ARA를 10%로 생산함), 균주 E (EPA를 10%로 생산함), 균주 EU (EPA를 10%로 생산함) 및 균주 Y2067 (EPA를 15%로 생산함)의 구축이 요구되었다.
ARA
를 전체 지질의 약 10%로 생산하는
Y2034
균주의 생성
2개의 Δ5 키메라 유전자를 야로위아 균주 M4의 Leu2 유전자에 통합하여 구축물 pDMW232 (도 16C, 서열 182)를 제조하였다. 플라스미드 pDMW232는 표 39에 나타낸 하기 성분을 함유하였다:
플라스미드 pDMW232 (서열 182)의 기재 | |
서열 182 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (5550-4755) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230)의 788 bp 5' 부분 |
Sphl/PacI (8258-8967) | 야로위아 Leu2 유전자 (진뱅크 관리 번호 AF260230)의 703 bp 3' 부분 |
SwaI/BsiWI (2114-4755) | ·FBAIN: FBAIN 프로모터 (서열 214) ·MAΔ5: 모르티에렐라 알피나 Δ5 데새투라제 유전자 (서열 6) (진뱅크 관리 번호 AF067654) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::MAΔ5::Pex20 |
SwaI/ClaI (2114-17) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·MAΔ5: 서열 6 (상기함) ·Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 Lip1 종결자 서열 을 포함하는 TEF::MAΔ5::Lip1 |
PmeI/ClaI (5550-4755) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
플라스미드 pDMW232를 AscI/SphI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 M4를 형질전환시켰다. 형질전환 후, 세포를 MMLe 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. 각각의 형질전환으로부터 MMLe 플레이트에서 성장한 개개의 콜로니를 골라내고 MM 및 MMLe 플레이트에 스트리킹했다. MMLe 플레이트에서는 성장할 수 있으나 MM 플레이트에서는 성장할 수 없는 콜로니를 Leu2- 균주로서 선별하였다. 이어서, Leu2- 균주의 단일 콜로니를 30℃의 액체 MMLe 배지에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 ARA가 pDMW232 형질전환체 중에는 존재하지만 모(母) M4 균주 중에는 존재하지 않음을 보여주었다. 구체적으로, pDMW232를 함유하는 것으로 선별된 48개의 Leu2- 형질전환체 중에서 유전자 조작된 야로위아에서 ARA를 전체 지질의 5% 미만으로 생산하는 균주는 34개였고, ARA를 6 내지 8%로 생산하는 균주는 11개였으며, ARA를 약 10%로 생산하는 균주는 3개였다. ARA를 10%로 생산하는 균주 중 하나를 "Y2034"로 명명하였다.
EPA
를 전체 지질의 약 10%로 생산하는 E 균주의 생성
플라스미드 pZP3L37 (실시예 6)을 AscI/SphI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 Y2034를 형질전환시켰다. 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. MM 플레이트에서 성장한 총 48개의 형질전환체를 골라내고 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃의 액체 MM에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 EPA가 pZP3L37을 함유하는 대개의 형질전환체 중에는 존재하지만 모 균주 (즉, Y2034) 중에는 존재하지 않음을 보여주었다. pZP3L37을 함유하는 것으로 선별된 48개의 형질전환체 중에서, 유전자 조작된 야로위아에서 EPA를 전체 지질의 2% 미만으로 생산하는 균주는 18개였고, EPA를 2 내지 3%로 생산하는 균주는 14개였으며, EPA를 약 7%로 생산하는 균주는 1개였다.
EPA를 7%로 생산하는 균주는 상기 '통상의 방법' 항목에 기재한 바와 같이 "2-단계 성장 조건" (즉, 48시간 MM, 72시간 HGM)을 이용하여 배양한 후에 추가로 분석하였다. GC 분석은 상기 유전자 조작된 균주가 상기 2-단계 성장 후에 EPA를 전체 지질의 약 10%로 생산함을 보여주었다. 상기 균주를 "E" 균주라고 칭하였다.
EPA
를 전체 지질의 약 10%로 생산하는,
Ura
-
표현형을 갖는
EU
균주의 생성
5-FOA 내성인 균주 E의 돌연변이체 세포를 동정하여 균주 EU (Ura-)를 제조하였다. 구체적으로, 일군의 야로위아 E 균주 세포를 YPD 배지 3 mL에 접종하고, 30℃에서 250 rpm/분으로 24시간 동안 진탕 성장시켰다. 배양물을 YPD으로 OD600 0.4까지 희석한 후에 추가의 4시간 동안 인큐베이션했다. 상기 배양물을 MM + FOA 플레이트에 플레이팅 (플레이트 1개 당 100 ㎕)하고, 30℃에서 2 내지 3일 동안 유지시켰다. 총 16개의 FOA 내성 콜로니를 골라내고 MM 및 MM + FOA 선별 플레이트에 스트리킹했다. 이들 중 10개의 콜로니가 FOA 선별 플레이트에서는 성장하였으나 MM 플레이트에서는 성장하지 못했고, 이들을 잠재적인 Ura- 균주로서 선별하였다.
이들 균주 중 1개를, 키메라 GPD::푸사륨 모닐리포르메 Δ15::XPR2 유전자 및 선별 마커로서의 Ura3 유전자를 포함하는 pY37/F15를 사용한 형질전환의 숙주로 사용하였다 (도 16D, 서열 183). MM 플레이트에서 3일 동안의 선별 후, 상기 플레이트에서는 수백개의 콜로니가 성장하였고, 플라스미드를 보유하지 않는 형질전환 대조군에서는 콜로니 성장이 없었다. 이 실험으로 5-FOA 내성 숙주 균주가 Ura-인 것으로 확인되었으며, 이 균주를 균주 "EU"라고 칭하였다.
이어서, EU 균주의 단일 콜로니를 0.1 g/L 유리딘을 추가로 함유하는 액체 MMU에 접종하고, 30℃에서 250 rpm/분으로 2일 동안 진탕 배양하였다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다. GC 분석은 EU 균주가 EPA를 전체 지질의 약 10%로 생산함을 보여주었다.
EPA
를 전체 지질의 약 15%로 생산하는
Y2067
균주의 생성
2개의 키메라 유전자 (이종 Δ12 데새투라제 및 C18 /20 엘론가제를 포함함) 및 Ura3 유전자를 함유하는 클러스터를 균주 EU의 천연 야로위아 Δ12 데새투라제 유전자에 통합하여 플라스미드 pKO2UF2PE (도 17A, 서열 184)를 제조하였다. 플라스미드 pKO2UF2PE는 하기 성분을 함유하였다:
플라스미드 pKO2UF2PE (서열 184)의 기재 | |
서열 184 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
AscI/BsiWI (3382-2645) | 야로위아 Δ12 데새투라제 유전자 (서열 28)의 730 bp 5' 부분 |
SphI/EcoRI (6090-6646) | 야로위아 Δ12 데새투라제 유전자 (서열 28)의 556 bp 3' 부분 |
SwaI/BsiWI (1-2645) | ·FBAINm: FBAINm 프로모터 (서열 215) ·F.Δ12: 푸사륨 모닐리포르메 Δ12 데새투라제 유전자 (서열 32) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAINm::F.Δ12DS::Pex20 |
SwaI/PmeI (1-8525) | ·GPAT: GPAT 프로모터 (서열 216) ·EL1S: 코돈-최적화된 엘론가제 1 유전자 (서열 24) (모르티에렐라 알피나 (진뱅크 관리 번호 AX464731)로부터 유래됨) ·OCT: 야로위아 OCT 유전자 (진뱅크 관리 번호 X69988)의 OCT 종결자 서열 을 포함하는 GPAT::EL1S::0CT |
EcoRI/PacI (6646-8163) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
플라스미드 pKO2UF2PE를 AscI/SphI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 EU를 형질전환시켰다 (균주 EU는 형질전환 완충제 중에 현탁시키기 전에 YPD 플레이트에 스트리킹하여 대략 36시간 [vs . 18시간] 동안 성장시켰음). 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. MM 플레이트에서 성장한 총 72개의 형질전환체를 골라내고 신선한 MM 플레이트에 따로 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃의 액체 MM에 접종하고 250 rpm/분으로 2일 동안 진탕시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 pKO2UF2PE를 함유하는 거의 모든 형질전환체 중에는 EPA가 존재함을 보여주었다. 보다 구체적으로, 72개의 선별된 형질전환체 중에서 유전자 조작된 야로위아에서 EPA를 전체 지질의 8 내지 9.9%로 생산하는 균주는 17개였고, EPA를 10 내지 10.9%로 생산하는 균주는 27개였으며, EPA를 11 내지 11.9%로 생산하는 균주는 16개였고, EPA를 12 내지 12.7%로 생산하는 균주는 7개였다. EPA를 12.7%로 생산하는 균주는 상기 '통상의 방법' 항목에 기재한 바와 같은 2-단계 성장 조건 (즉, 48시간 MM, 72시간 HGM)을 이용하여 추가로 분석하였다. GC 분석은 상기 유전자 조작된 균주가 상기 2-단계 성장 후에 EPA를 전체 지질의 약 15%로 생산함을 보여주었다. 상기 균주를 균주 "Y2067"이라고 칭하였다.
EPA
를 전체 지질의 약 14%로 생산하는,
Ura
-
표현형을 갖는
Y2067U
균주의 생성
플라스미드 pZKUT16 (실시예 6)을 SalI/PacI로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 Y2067 균주를 형질전환시켰다. 형질전환 후, 세포를 MM + 5-FOA 선별 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다.
MM + 5-FOA 플레이트에서 성장한 총 24개의 형질전환체를 골라내고 MM 플레이트 및 MM + 5-FOA 플레이트에 따로 재스트리킹했다. MM + 5-FOA 플레이트에서는 성장할 수 있으나 MM 플레이트에서는 성장할 수 없는 균주를 Ura- 균주로서 선별하였다. 총 10개의 Ura- 균주를 개별적으로 30℃의 액체 MMU 배지에 접종하고 250 rpm/분으로 1일 동안 진탕 성장시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은, MMU 배지 중에서 1일 동안 성장시킨 후에는 pZKUT16을 함유하는 모든 형질전환체에 EPA가 5 내지 7%로 존재함을 보여주었다. EPA를 6.2%로 생산하는 균주는 2-단계 성장 조건 (즉, 48시간 MM, 96시간 HGM)을 이용하여 추가로 분석하였다. GC 분석은 상기 유전자 조작된 균주가 EPA를 전체 지질의 약 14%로 생산함을 보여주었다. 상기 균주를 균주 "Y2067U"라고 칭하였다.
야생형 야로위아 리폴리티카 ATCC #20362에 대한 이 균주의 최종 유전자형은 다음과 같았다:
실시예
14
EPA
를 전체 지질의 16%로 생산하는, 중간체 균주
Y2107U1
의 생성
본 실시예는 야로위아 리폴리티카 ATCC #20362로부터 유래되어 EPA를 전체 지질에 대하여 상당한 농도로 생산할 수 있는 균주 Y2107U1의 구축을 기재한다 (도 5). 모르티에렐라 알피나 GPAT 유전자 과발현의 영향을 실시예 20에 기재된 바와 같이 TAG 함량 및/또는 조성의 분석에 기초하여 이 EPA 생산 균주에서 조사하였다 (하기 참조).
본원에서 균주 Y2107U1 (EPA를 16%로 생산하고, Ura- 표현형을 보유함)의 발달에는 균주 M4 (DGLA를 8%로 생산함, 실시예 6에 기재됨), 균주 Y2047 (ARA를 11%로 생산함, 실시예 6에 기재됨), 균주 Y2048 (EPA를 11%로 생산함, 실시예 6에 기재됨), 균주 Y2060 (EPA를 13%로 생산함, 실시예 6에 기재됨), 균주 Y2072 (EPA를 15%로 생산함, 실시예 6에 기재됨), 균주 Y2072U1 (EPA를 14%로 생산함) 및 Y2089 (EPA를 18%로 생산함)의 구축이 요구되었다.
EPA
를 전체 지질의 약 14%로 생산하는,
Ura
-
표현형을 갖는
Y2072U1
균주의 생성
GPAT::I.Δ5S::Pex20 키메라 유전자를 Y2072 균주 (실시예 6)의 Ura3 유전자에 통합하여 구축물 pZKUGPI5S (도 17B, 서열 187)를 제조하였다. 보다 구체적으로, 플라스미드 pZKUGPI5S는 하기 성분을 함유하였다:
플라스미드 pZKUGPI5S (서열 187)의 기재 | |
서열 187 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
BsiWI/PacI (318-1038) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 721 bp 5' 부분 |
SalI/ClaI (3882-4606) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421)의 724 bp 3' 부분 |
ClaI/BsiWI (4606-318) | ·GPAT: GPAT 프로모터 (서열 216) ·I.Δ5S: 코돈-최적화된 Δ5 데새투라제 유전자 (서열 10) (이소크리시스 갈바나로부터 유래됨) (제WO 2002/081668호) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 GPAT::I.Δ5S::Pex20 |
플라스미드 pZKUGPI5S를 SalI/PacI으로 소화시킨 후, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 Y2072를 형질전환시켰다. 형질전환 후에는 세포를 MM + 5-FOA 선별 플레이트에 플레이팅하고 30℃에서 3 내지 4일 동안 유지시켰다.
MM + 5-FOA 플레이트에서 성장한 총 24개의 형질전환체를 골라내고 MM 플레이트 및 MM + 5-FOA 플레이트에 따로 재스트리킹했다. MM + 5-FOA 플레이트에서는 성장할 수 있으나 MM 플레이트에서는 성장할 수 없는 균주를 Ura- 균주로서 선별하였다. 이들 24개의 Ura- 균주 각각을 개별적으로 액체 MMU에 접종하고 30℃에서 250 rpm/분으로 2일 동안 진탕 성장시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은, MMU 중에서 2일 동안 성장시킨 후에는 EPA를 전체 지질의 7.3 내지 8.9%로 생산하는 균주가 8개이고, EPA를 9 내지 9.9%로 생산하는 균주가 14개이고, EPA를 10.5%로 생산하는 균주가 1개 (즉, #1)이며, EPA를 10.7%로 생산하는 균주가 1개 (즉, #23)임을 보여주었다. 균주 #1 및 균주 #23을 2-단계 성장 조건 (즉, 48시간 MM, 96시간 HGM)을 이용하여 추가로 분석하였다. GC 분석은 이들 2개의 균주가 상기 2-단계 성장 후에 EPA를 전체 지질의 약 14%로 생산함을 보여주었다. 균주 #1은 균주 "Y2072U1"이라고 칭하였다.
EPA
를 전체 지질의 약 18%로 생산하는
Y2089
균주의 생성
4개의 키메라 유전자 (C16 /18 엘론가제, C18 /20 엘론가제, Δ6 데새투라제 및 Δ12 데새투라제를 포함함) 및 Ura3 유전자의 클러스터를 Y2072U1 균주의 야로위아 리파제 1 유전자 부위에 통합하여 구축물 pDMW302T16 (도 17C, 서열 186)을 제조하였다. 플라스미드 pDMW302T16은 하기 성분을 함유하였다:
플라스미드 pDMW302T16 (서열 186)의 기재 | |
서열 186 내의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
BsiWI/AscI (1-817) | 야로위아 리파제 1 유전자 (진뱅크 관리 번호 Z50020)의 817 bp 5' 부분 |
SphI/PacI (3525-4294) | 야로위아 리파제 1 유전자 (진뱅크 관리 번호 Z50020)의 769 bp 3' 부분 |
EcoRI/BsiWI (13328-1) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·rELO2S: 코돈-최적화된 rEL02 엘론가제 유전자 (서열 85) (래트 (진뱅크 관리 번호 AB071986)로부터 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 TEF::rELO2S::Pex20 |
BgIII/EcoRI (10599-13306) | ·FBAIN: FBAIN 프로모터 (서열 214) ·Δ6S: 코돈-최적화된 Δ6 데새투라제 유전자 (서열 3) (모르티에렐라 알피나 (진뱅크 관리 번호 AF465281)로부터 유래됨) ·Lip1: 야로위아 Lip1 유전자 (진뱅크 관리 번호 Z50020)의 Lip1 종결자 서열 을 포함하는 FBAIN::D6S::Lip1 |
ClaI/PmeI (8078-10555) | ·GPDIN: GPDIN 프로모터 (서열 211) ·EL1S: 코돈-최적화된 엘론가제 1 유전자 (서열 24) (모르티에렐라 알피나 (진뱅크 관리 번호 AX464731)로부터 유래됨) ·Lip2: 야로위아 리파제 2 유전자 (진뱅크 관리 번호 AJ012632)의 Lip2 종결자 를 포함하는 GPDIN::EL1S::Lip2 |
EcoRI/ClaI (6450-8078) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
PacI/EcoRI (4294-6450) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·F.Δ12: 푸사륨 모닐리포르메 Δ12 데새투라제 유전자 (서열 32) ·Pex16: 야로위아 Pex16 유전자 (진뱅크 관리 번호 U75433)의 Pex16 종결자 를 포함하는 TEF::F.Δ12::Pex16 |
플라스미드 pDMW302T16을 SphI/AscI으로 소화시킨 후에, 이것을 상기 '통상의 방법'에 따라 사용하여 균주 Y2072U1을 형질전환시켰다. 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 30℃에서 3 내지 4일 동안 유지시켰다.
MM 플레이트에서 성장한 총 48개의 형질전환체를 골라내고 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃의 액체 MM에 접종하고 250 rpm/분으로 2일 동안 진탕 성장시켰다. 세포를 원심분리로 수집하여 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은, MM 배지 중에서 2일 동안 성장시킨 후에는 pDMW302T16을 함유하는 Y2072U1의 거의 모든 형질전환체에서 EPA가 생산됨을 보여주었다. 선별된 48개의 형질전환체 중에서, EPA를 10% 미만으로 생산하는 균주는 27개였고, EPA를 10 내지 12.9%로 생산하는 균주는 14개였으며, EPA를 13 내지 13.9%로 생산하는 균주는 5개였다. 균주 #34 (EPA를 13.9%로 생산함)를 선별하여 2-단계 성장 절차 (즉, 48시간 MM, 96시간 HGM)를 이용한 추가의 분석을 수행하였다. GC 분석은 균주 #34가 EPA를 전체 지질의 약 18%로 생산함을 보여주었다. 균주 #34를 균주 "Y2089"라고 칭하였다.
야생형 야로위아 리폴리티카 ATCC #20362에 대한 균주 Y2089의 유전자형은 다음과 같았다:
EPA
를 전체 지질의 약 16%로 생산하는,
Ura
-
표현형을 갖는
Y2107U1
균주의 생성
GPAT::EL1S::Pex20 키메라 유전자를 균주 Y2089의 Ura3 유전자 내로 통합하여 구축물 pZKUGPE1S (서열 187)를 제조하였다. 보다 구체적으로, 플라스미드 pZKUGPE1S는 하기 성분을 함유하였다:
플라스미드 pZKUGPE1S (서열 187)의 기재 | |
서열 187 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
BsiWI/PacI (318-1038) | 야로위아 Ura3 유전자의 721 bp 5' 부분 (진뱅크 관리 번호 AJ306421) |
SalI/ClaI (3882-4606) | 야로위아 Ura3 유전자의 724 bp 3' 부분 (진뱅크 관리 번호 AJ306421) |
ClaI/BsiWI (4606-318) | ·GPAT:GPAT 프로모터 (서열 216) ·EL1S: 코돈-최적화된 엘론가제 1 유전자 (서열 24) (모르티에렐라 알피나 (진뱅크 관리 번호 AX464731)에서 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)로부터의 Pex20 종결자 서열 을 포함하는 GPAT::EL1S::Pex20 |
플라스미드 pZKUGPE1S를 PstI/PacI로 소화시키고, 이어서 이를 사용하여 통상의 방법에 따라 균주 Y2089를 형질전환시켰다. 형질전환 후, 세포를 MM + 5-FOA 선별 플레이트 상에 플레이팅하고, 30℃에서 3 내지 4일 동안 유지시켰다.
MM + 5-FOA 플레이트 상에 성장한 총 8개 형질전환체를 골라내고 MM 플레이트 및 MM + 5-FOA 플레이트 상에 따로 재스트리킹하였다. MM + 5-FOA 플레이트에서는 성장할 수 있으나 MM 플레이트에서는 성장할 수 없는 이들 균주를 Ura- 균주로서 선별하였다. 각각의 이들 8 Ura- 균주를 액체 MMU에 개별적으로 접종시키고, 30℃에서 250 rpm/분으로 2일 동안 진탕하여 성장시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 2일 동안 MMU에서 성장시킨 후에는 EPA를 전체 지질의 6.6 내지 8.7%로 생산하는 균주가 6개였고, EPA (즉, #4 및 #5)를 9.4 내지 10%로 생산하는 균주가 2개였음을 보여주었다. 균주 #4 및 #5는 2-단계 성장 조건 (즉, 48시간 MM, 72시간 HGM)을 이용하여 추가로 분석하였다. GC 분석은 이들 2개의 균주가 EPA를 전체 지질의 약 16%로 상기 2-단계 성장 후에 생산하였음을 보여주었다. 균주 #4를 균주 "Y2107U1"이라고 칭하고, 균주 #5를 균주 "Y2107U2"라고 칭하였다.
실시예
15
EPA
를 전체 지질의 9 내지 12%로 생산하는, 중간체 균주
MU
의 생성
본 실시예는 야로위아 리폴리티카 ATCC #20362로부터 유래되어 EPA를 전체 지질에 대하여 상당한 농도로 생산할 수 있는 균주 MU의 구축을 기재한다 (도 5). 다양한 천연 야로위아 리폴리티카 아실트랜스퍼라제 넉아웃의 영향을 실시예 27에 기재된 바와 같이 TAG 함량 및/또는 조성의 분석에 기초하여 이 EPA 생산 균주에서 조사하였다 (하기 참조).
균주 MU (본원에서 EPA를 9 내지 12%로 생산함)의 발달에는 균주 M4 (DGLA를 8%로 생산함, 실시예 6에 기재됨), 균주 Y2034 (ARA를 10%로 생산함, 실시예 13에 기재됨), 균주 E (EPA를 10%로 생산함, 실시예 13에 기재됨), 균주 EU (EPA를 10%로 생산함, 실시예 13에 기재됨) 및 균주 M26 (EPA를 14%로 생산함)의 구축이 요구되었다.
EPA
를 전체 지질의 약 14%로 생산하는
M26
균주의 생성
구축물 pKO2UM26E (서열 188, 도 17D)를 사용하여 3개의 키메라 유전자 (C18/20 엘론가제, Δ6 데새투라제 및 Δ12 데새투라제 포함) 및 Ura3 유전자의 클러스터를 EU 균주의 야로위아 Δ12 데새투라제 유전자 부위 내로 통합하였다 (실시예 13). 플라스미드 pKO2UM26E는 하기 성분을 함유하였다:
플라스미드 pK02UM26E (서열 188)의 기재 | |
서열 188 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
HindIII/AscI (1-728) | 야로위아 Δ12 데새투라제 유전자 (서열 28)의 728 bp 5' 부분 |
SphI/EcoRI (3436-3992) | 야로위아 Δ12 데새투라제 유전자 (서열 28)의 556 bp 3' 부분 |
BsiWI/Hindlll (11095-1) | ·GPAT: GPAT 프로모터 (서열 216) ·EL1S: 코돈-최적화된 엘론가제 1 유전자 (서열 24) (모르티에렐라 알피나 (진뱅크 관리 번호 AX464731)에서 유래됨) ·XPR: 야로위아 Xpr 유전자 (진뱅크 관리 번호 M17741)의 3' 영역의 ~100 bp 를 포함하는 GPAT::EL1S::XPR |
BglII/BsiWI (8578-11095) | ·FBAIN: FBAIN 프로모터 (서열 214) ·M.Δ12: 모르티에렐라 이자벨리나 Δ12 데새투라제 유전자 (진뱅크 관리 번호 AF417245; 서열 30) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::M.Δ12::Pex20 |
SalI/PacI (6704 내지 8202) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
EcoRI/SalI (3992-6704) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·M.Δ6B: 모르티에렐라 알피나 Δ6 데새투라제 유전자 "B" (진뱅크 관리 번호 AB070555; 서열 4) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)의 Pex20 종결자 서열 을 포함하는 FBAIN::M.Δ6B::Pex20 |
플라스미드 pKO2UM26E를 SphI/AscI로 소화시킨 후에, 이것을 사용하여 EU 균주 (실시예 13)를 통상의 방법에 따라 형질전환시켰다. 형질전환 후, 세포를 MM 플레이트에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다.
MM 플레이트에서 성장한 총 48개의 형질전환체를 골라내고 신선한 MM 플레이트에 재스트리킹했다. 일단 성장했으면, 이들 균주를 개별적으로 30℃의 액체 MM에 접종하고 250 rpm/분에서 1일 동안 진탕하여 성장시켰다. 세포를 원심분리로 수집하고 지질을 추출하고 에스테르교환반응으로 지방산 메틸 에스테르를 제조한 후에 휴렛-팩커드 6890 GC로 분석하였다.
GC 분석은 EPA가 1일 동안 MM 배지에서 성장시킨 후에는 pKO2UM26E를 갖는 거의 모든 형질전환체에서 생산되었음을 보였다. 선별된 48개의 형질전환체 중에서, 유전자 조작된 야로위아에서 EPA를 전체 지질의 4% 미만으로 생산하는 균주가 5개였고, EPA를 4 내지 5.9%로 생산하는 균주가 23개였고, EPA를 6 내지 6.9%로 생산하는 균주가 9개였고, EPA를 7 내지 8.2%로 생산하는 균주가 11개였다. EPA를 8.2%로 생산하는 균주를 2-단계 성장 절차 (즉, 48시간 MM, 96시간 HGM)를 이용한 추가의 분석을 위해 선별하였다. GC 분석은 상기 유전자 조작된 균주가 EPA를 전체 지질의 약 14%로 생산하였음을 보였다. 상기 균주를 균주 "M26"이라고 칭하였다.
야생형 야로위아 리폴리티카 ATCC #20362에 대한 M26 균주의 유전자형은 다음과 같았다:
EPA
를 전체 지질의 약 14%로 생산하는
MU
균주의 생성
균주 MU는 균주 M26의 Ura 영양요구균이었다. 이 균주는 균주 M26을 PacI 및 HincII로 소화시킨 플라스미드 pZKUM (서열 189) 5 ㎍으로 형질전환시킴으로써 제조하였다. 형질전환을 동결-EZ 효모 형질전환 키트 (Frozen-EZ Yeast Transformation kit; 자이모 리서치 코포레이션, 미국 캘리포니아 오렌지 소재)로 수행하고, 형질전환체는 하기 배지를 갖는 아가 플레이트 상에 형질전환된 세포 믹스 100 ㎕를 플레이팅함으로써 선별하였다: 6.7 g/L 효모 질소 염기 (디프코 래버러토리즈, 미국 미시간주 디트로이트 소재), 20 g/L 덱스트로즈, 50 mg/L 우라실 및 800 mg/L FOA. 7일 후에, MM 및 MMU 아가 플레이트 상에 플레이팅된 작은 콜로니들이 도출되었다. 모두가 URA 영양요구이었다. 균주 중 하나를 "MU"라고 칭하였다.
실시예
16
모르티에렐라
알피나
게놈
DNA
및
cDNA
의 구축
본 실시예는 모르티에렐라 알피나 (ATCC #16266)로부터 게놈 DNA 및 cDNA의 제조를 기재한다. 이는 실시예 17, 18, 19, 20 및 21에 각각 기재하는 바와 같이 모르티에렐라 알피나 LPAAT2, DGAT1, DGAT2, GPAT 및 ELO3을 단리할 수 있다.
모르티에렐라
알피나로부터의
게놈
DNA
의 제조
게놈 DNA를 모르티에렐라 알피나 (ATCC #16266)로부터 QiaPrep 스핀 미니프렙 키트(Spin Miniprep Kit) (퀴아젠, 카탈로그 #627106)로 단리하였다. YPD 아가 플레이트 (2% 박토-효모 추출물, 3% 박토-펩톤, 2% 글루코스, 2.5% 박토-아가) 상에 성장한 세포를 긁어 내어 키트 완충제 P1 1.2 mL에 재현탁하였다. 재현탁한 세포를 2개 2.0 mL 스크루 캡 튜브에 두었으며, 이들 각각은 0.6 mL 유리 비드 (0.5 mm 직경)를 함유하였다. 세포를 HOMOGENIZE 셋팅에서의 바이오스펙(Biospec) (미국 오클라호마주 바르틀레스빌 소재) 미니 비드 비터(beater) 상에서 2분 동안 균질화하였다. 튜브를 이어서 14,000 rpm에서의 에펜도르프 미세원침에서 2분 동안 원심분리하였다. 상등액 (0.75 mL)을 3개의 1.5 mL 미세원침관 내로 전달하였다. 키트 완충제 P2의 동일 부피를 각각의 튜브에 첨가하였다. 3회 뒤집어서 튜브를 혼합한 후에, 완충제 N3 0.35 mL를 각각의 튜브에 첨가하였다. 각각의 튜브의 함유물을 총 5회 뒤집어서 다시 혼합하였다. 혼합물을 14,000 rpm에서의 에펜도르프 미세원침에서 5분 동안 원심분리하였다. 각 튜브로부터의 상등액을 개별적으로 3개의 개별 키트 스핀 컬럼 내로 옮겼다. 컬럼에 이어서 하기 단계를 수행하였다: 원심분리 (14,000 rpm에서 1분), 완충제 PE로 1회 세척, 원심분리 (14,000 rpm에서 1분), 및 이어서 최종 원심분리 (14,000 rpm에서 1분). 완충제 EB (50 ㎕)를 각 컬럼에 첨가하고, 1분 동안 정치하였다. 게놈 DNA를 이어서 14,000 rpm에서 1분 동안 원심분리함으로써 용출시켰다.
모르티에렐라
알피나로부터의
cDNA
의 제조
모르티에렐라 알피나의 cDNA를 제조자의 프로토콜에 따라 BD-클론테크 크리에이터 스마트® cDNA 라이브러리 키트 (캐나다 온타리오주 미시소거 소재)로 제조하였다.
구체적으로, 모르티에렐라 알피나 균주 ATCC #16266을 YPD 배지 (2% 박토-효모 추출물, 3% 박토르(Bactor)-펩톤, 2% 글루코스) 60 mL에 3일 동안 23℃에서 성장시켰다. 세포를 3750 rpm에서의 벡크만(Beckman) GH3.8 로터에서 10분 동안 원심분리하여 펠렛화하고, 트리졸(Trizole) 시약 (인비트로젠) 6 X 0.6 mL에 재현탁하였다. 재현탁한 세포를 6개의 2 mL 스크루 캡 튜브에 옮겼으며, 이들 각각은 0.5 mm 유리 비드 0.6 mL를 함유하였다. 세포를 HOMOGENIZE 셋팅에서의 바이오스펙 미니 비드 비터 상에서 2분 동안 균질화하였다. 튜브를 잠시 원심분리하여 비드를 가라앉혔다. 상기 액체를 4개의 신선한 1.5 mL 미세원침관에 옮기고, 클로로포름/이소아밀 알콜 (24:1) 0.2 mL를 각 튜브에 첨가하였다. 튜브를 손으로 1분 동안 진탕하고, 3분 동안 정치하였다. 튜브를 이어서 14,000 rpm에서 10분 동안 4℃에서 원심분리하였다. 상부 층을 4개 새로운 튜브에 옮겼다. 이소프로필 알콜 (0.5 mL)을 각 튜브에 첨가하였다. 튜브를 실온에서 15분 동안 인큐베이션한 후에, 14,000 rpm 및 4℃에서 10분 동안 원심분리하였다. 펠렛을 RNase-무함유 물로 제조한 각 75% 에탄올 1 mL로 세척하고, 공기 건조시켰다. 총 RNA 샘플을 이어서 물 500 ㎕에 재용해하고, 1:50 희석 RNA 샘플을 사용하여 A260 nm로 RNA 양을 측정하였다. 총 3.14 mg의 RNA가 수득되었다.
이 총 RNA 샘플을 제조자의 프로토콜에 따라 퀴아젠 RNeasy 총 RNA 미디(Midi) 키트로 추가 정제하였다. 따라서, 총 RNA 샘플을 2 mL로 희석하고, β-머캅토에탄올 80 ㎕ 및 100% 에탄올 5.6 mL를 갖는 완충제 RLT 8 mL와 혼합하였다. 샘플을 4개 부분으로 나누고, 4개 RNeasy 미디드(midid) 컬럼 상에 적하하였다. 컬럼을 이어서 5분 동안 4500Xg에서 원심분리하였다. 컬럼을 세척하기 위해, 완충제 RPE 2 mL를 적하하고, 컬럼을 2분 동안 4500Xg에서 원심분리하였다. 원심분리 시간을 5분으로 연장한 것 외에는 세척 단계를 1회 반복하였다. 총 RNA는 RNase 무함유 물 250 ㎕를 각 컬럼에 가하고, 1분 동안 대기하고, 4500Xg 3분 동안 원심분리하여 용출시켰다.
이어서, 폴리A(+)RNA를 아머샴 바이오사이언스즈 mRNA 정제 키트의 프로토콜에 따라 상기 총 RNA 샘플로부터 단리하였다. 간략하게 설명하면, 2개 올리고-dT-셀룰로스 컬럼을 사용하였다. 컬럼을 각 고염 완충제 1 mL로 2회 세척하였다. 이전의 단계로부터의 총 RNA 샘플을 총 부피 2 mL로 희석하고, 10 mM Tris/HCl, pH 8.0, 1 mM EDTA로 조정하였다. 샘플을 65℃에서 5분 동안 가열하고, 이어서 얼음상에 두었다. 샘플 완충제 (0.4 mL)를 첨가하고, 샘플을 이어서 2개 올리고-dT-셀룰로스 컬럼 상에 중력 공급 하에 적하하였다. 컬럼을 350Xg에서 2분 동안 원심분리하고, 각 고염 완충제 0.25 mL로 2회 세척하였으며, 각 횟수 후에 350Xg에서 2분 동안 원심분리하였다. 컬럼을 저염 완충제로 추가로 3회 세척한 후에, 동일한 일상적 원심분리를 수행하였다. 폴리(A)+RNA는 컬럼을 65℃로 예열한 각 용출 완충제 0.25 mL로 4회 세척한 후에, 동일한 원심분리 절차를 수행함으로써 용출하였다. 전체 정제 과정을 1회 반복하였다. 정제된 폴리(A)+RNA를 30.4 ng/㎕의 농도로 얻었다.
cDNA를 BD-클론테크 및 폴리A(+) RNA 샘플 0.1 ㎍로 특정지어진 LD-PCR 방법으로 생성하였다. 구체적으로, 제1 가닥 cDNA 합성을 위해, 폴리(A)+RNA 샘플 3 ㎕를 SMART IV 올리고 뉴클레오티드 (서열 391) 1 ㎕ 및 CDSIII/3' PCR 프라이머 (서열 392) 1 ㎕와 혼합하였다. 혼합물을 72℃에서 2분 동안 가열하고, 얼음상에서 2분 동안 냉각하였다. 상기 튜브에 제1 가닥 완충제 2 ㎕, 20 mM DTT 1 ㎕, 10 mM dNTP 믹스 1 ㎕ 및 파워스크립트(Powerscript) 역전사효소 1 ㎕를 첨가하였다. 혼합물을 42℃에서 1시간 동안 인큐베이션하고, 얼음상에서 냉각하였다.
제1 가닥 cDNA 합성 혼합물을 PCR 반응에 대해 주형으로서 사용하였다. 구체적으로, 반응 혼합물은 제1 가닥 cDNA 혼합물 2 ㎕, 5'-PCR 프라이머 (서열 393) 2 ㎕, CDSIII/3'-PCR 프라이머 (서열 392) 2 ㎕, 물 80 ㎕, 10X 어드밴티지(Advantage) 2 PCR 완충제 10 ㎕, 5OX dNTP 믹스 2 ㎕ 및 5OX 어드밴티지 2개 폴리머라제 믹스 2 ㎕를 함유하였다. 열순환기 조건은 GenAmp 9600 기기상에서 95℃에서 20초 후에 95℃에서 5초 및 68℃에서 6분의 14 내지 20 주기로 설정하였다. PCR 생성물을 아가로스 겔 전기영동 및 에티듐 브로마이드 염색으로 정량하였다.
상기 PCR 생성물 (cDNA) 75 ㎕를 키트로 공급한 20 ㎍/㎕ 프로테이나제 K 3 ㎕와 혼합하였다. 혼합물을 45℃에서 20분 동안 인큐베이션하고, 이어서 물 75 ㎕를 첨가하고, 혼합물을 페놀:클로로포름:이소아밀 알콜 혼합물 (25:24:1) 150 ㎕로 추출하였다. 수성 상을 클로로포름:이소아밀 알콜 (25:1) 150 ㎕로 추가 추출하였다. 수성 상을 이어서 3M 나트륨 아세테이트 15 ㎕, 20 ㎍/㎕ 글리코겐 2 ㎕ 및 100% 에탄올 400 ㎕와 혼합하였다. 혼합물을 실온에서 20분 동안 14000 rpm에서의 미세원침에서 즉시 원심분리하였다. 펠렛을 80% 에탄올 150 ㎕로 1회 세척하고, 공기 건조시키고, 물 79 ㎕에 용해하였다.
용해된 cDNA를 이어서 SfiI (cDNA 79 ㎕를 1OX SfiI 완충제 10 ㎕, SfiI 효소 10 ㎕ 및 100X BSA 1 ㎕와 혼합하고, 혼합물을 50℃에서 2시간 동안 인큐베이션함)로 소화하였다. 크실렌 시아놀 염료 (1%, 2 ㎕)를 첨가하였다. 혼합물을 제조자 절차에 정확하게 따라 키트로 제공한 크로마 스핀(Chroma Spin)-400 컬럼 상에서 이어서 분획하였다. 컬럼으로부터 수집한 분획을 아가로스 겔 전기영동으로 분석하였다. cDNA를 함유한 제1의 3개 분획을 모으고, cDNA를 에탄올로 침전시켰다. 침전된 cDNA를 물 7 ㎕로 재용해하고, 키트-공급 pDNR-LIB 내로 라이게이션하였다.
라이브러리 서열분석
라이게이션 생성물을 사용하여 이. 콜라이 XL-1 블루(Blue) 전기천공법 감응성 세포 (스트라타진)를 형질전환시켰다. 추측된 총 2 x 106 콜로니를 수득하였다. cDNA 라이브러리의 서열분석을 M13 전진 프라이머 (서열 394)로 아젠코트 바이오사이언스 코포레이션(Agencourt Bioscience Corporation)(미국 매사추세츠주 비벌리 소재)에 의해 수행하였다.
실시예
17
모르티에렐라
알피나
LPAAT2
발현은
PUFA
(%)를 증가시킨다.
본 실시예는 모르티에렐라 알피나 LPAAT2 (서열 110 및 111)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2067U (실시예 13)에서의 증가된 EPA 생합성 및 축적을 기재한다. Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생산하도록 유전자 조작된 야로위아 리폴리티카 숙주 균주는 모르티에렐라 알피나 LPAAT2가 그에서 유사하게 동시 발현되는 경우에 (예컨대, 균주 Y3000에서) 증가된 DHA 생합성 및 축적을 입증할 수 있었음을 고려한다.
모르티에렐라 알피나 LPAAT2 ORF를 하기와 같이 클로닝하였다. 프라이머 MLPAT-F 및 MLPAT-R (서열 395 및 396)을 사용하여 모르티에렐라 알피나 (실시예 16)의 cDNA로부터 LPAAT2 ORF를 PCR에 의해 증폭시켰다. 반응 혼합물은 cDNA 1 ㎕, 각 프라이머 1 ㎕, 물 22 ㎕ 및 ExTaq 프리믹스 2X Taq PCR 용액 (다까라 바이오 인크., 일본 520-2193 시가현 오쯔 소재) 25 ㎕를 함유하였다. 증폭을 하기와 같이 수행하였다: 94℃에서 150초 동안 초기 변성, 이어서 94℃에서 30초 동안 변성, 55℃에서 30초 동안 어닐링 및 72℃에서 90초 동안 신장의 30주기. 72℃에서 10분 최종 신장 주기를 수행한 후에, 반응을 4℃에서 종결하였다. ~950 bp DNA 단편을 PCR 반응물로부터 수득하였다. 이를 퀴아젠 (미국 캘리포니아주 발렌시아 소재) PCR 정제 키트로 제조자의 프로토콜에 따라 정제하였다. 정제된 PCR 생성물을 NcoI 및 NotI로 소화시키고, NcoI-NotI 절단 pZUF17 벡터 (서열 162; 도 9B) 내로 클로닝하여 유전자가 야로위아 리폴리티카에서의 발현을 위한 자가-복제 벡터 중에서 야로위아 리폴리티카 FBAIN 프로모터 및 PEX20-3' 종결자 영역의 조절 하에 놓이게 하였다. 정확한 형질전환체를 미니프렙 DNA의 제한 분석에 의해 확인하고, 생성된 플라스미드를 "pMLPAT-17" (서열 190)이라고 칭하였다.
모르티에렐라 알피나 LPAAT2를 야로위아 리폴리티카의 게놈 내로 통합하기 위해, 플라스미드 pM LPAT-Int를 생성하였다. 프라이머 LPAT-Re-5-1 및 LPAT-Re-5-2 (서열 397 및 398)를 사용하여 야로위아 리폴리티카 LPAAT1 (서열 112)의 AUG 바로 상류에 1103 bp 단편의 야로위아 리폴리티카 게놈을 함유한 1129 bp DNA 단편인 YLPAT-5' (서열 399)를 증폭하였다. 반응 혼합물은 야로위아 리폴리티카 게놈 DNA 1 ㎕, 각 프라이머 1 ㎕, 물 22 ㎕ 및 ExTaq 프리믹스 2X Taq PCR 용액 (다까라) 25 ㎕를 함유하였다. 증폭을 상기 기재한 바와 같이 수행하였다. ~1130 bp DNA 단편을 PCR 반응물로부터 수득하였다. 이를 퀴아젠 PCR 정제 키트로 제조자의 프로토콜에 따라 정제하였다. 정제된 PCR 생성물을 SalI 및 ClaI으로 소화시키고, SalI-ClaI 절단 pBluescript SK (-) 벡터 내로 클로닝하여 플라스미드 "pYLPAT-5"를 생성하였다.
프라이머 LPAT-Re-3-1 및 LPAT-Re-3-2 (서열 400 및 401)를 이어서 사용하여 야로위아 리폴리티카 LPAAT1의 정지 코돈 직후에 903 bp 단편의 야로위아 리폴리티카 게놈을 함유한 938 bp 단편 YLPAT-3' (서열 402)을 상기와 동일한 조건으로 증폭하였다. 정제된 PCR 생성물을 ClaI 및 XhoI으로 소화시키고, ClaI-XhoI 소화 pYLPAT-5'내로 클로닝하였다. 정확한 형질전환체를 미니프렙 분석으로 확인하고, 생성된 플라스미드를 "pYLPAT-5'-3"'라고 칭하였다.
pMLPAT-17 (서열 190)을 이어서 ClaI 및 NotI로 소화시키고, 야로위아 리폴리티카 URA3 유전자, 야로위아 리폴리티카 FBAIN 프로모터 및 모르티에렐라 알피나 LPAAT2 유전자를 함유한 ~3.5 kb 단편을 퀴아젠 QiaexII 겔 정제 키트로 제조자의 프로토콜에 따라 단리하였다. 이 단편을 ClaI-NotI 소화 pYLPAT-5'-3' 내로 클로닝하였다. 정확한 형질전환체를 미니프렙 및 제한 분석에 의해 확인하였다. 생성된 플라스미드를 "pMLPAT-Int" (서열 191)라고 명명하였다.
"대조군" 벡터 pZUF-MOD-1 (서열 192, 도 18A)을 하기와 같이 제조하였다. 첫째, 프라이머 pzuf-mod1 및 pzuf-mod2 (서열 403 및 404)를 사용하며, pDNR-LIB (클론테크, 캘리포니아주 팔로 알토 소재)를 주형로서 사용하여 252 bp "스터퍼(stuffer)" DNA 단편을 증폭시켰다. 증폭시킨 단편을 퀴아젠 QiaQuick PCR 정제 키트로 정제하고, 표준 조건을 사용하여 NcoI 및 NotI로 소화시키고, 이어서 QiaQuick PCR 정제 키트로 다시 정제하였다. 이 단편을 유사하게 소화시킨 NcoI-/NotI-절단 pZUF17 벡터 (서열 162; 도 9B) 내로 라이게이션하고, 생성된 라이게이션 혼합물을 사용하여 이. 콜라이 Top10 세포 (인비트로젠)를 형질전환시켰다. 플라스미드 DNA를 4개의 생성된 콜로니로부터 퀴아젠 QiaPrep 스핀 미니프렙 키트로 정제하였다. 정제된 플라스미드를 NcoI 및 NotI로 소화시켜 -250 bp 단편의 존재를 확인하였다. 생성된 플라스미드를 "pZUF-MOD-1" (서열 192)이라고 명명하였다.
야로위아 리폴리티카 균주 Y2067U (실시예 13으로부터, EPA를 전체 지질의 14%로 생산함)를 플라스미드 pMLPAT-17, 플라스미드 pZUF-MOD-1 (대조군) 및 SpeI/XbaI 소화 플라스미드 pMLPAT-Int로 개별적으로 통상의 방법에 따라 형질전환시켰다. 형질전환체를 2일 동안 아미노산 보충 합성 MM에서, 이어서 4일 동안 HGM에서 성장시켰다. pZUF-MOD-1를 함유한 2개의 형질전환체, pMLPAT-17을 함유한 2개의 형질전환체, 및 pMLPAT-Int를 갖는 2개의 형질전환체 (게놈 내에 통함됨)의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기 표에 나타낸다. 지방산을 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 전체 지방산(%)으로서 나타낸다.
상기 입증한 바와 같이, pMLPAT-17로부터의 모르티에렐라 알피나 LPAAT2의 발현은 EPA(%)를 "대조군" 균주에서의 ~14%에서 15.5 내지 16%로 증가시켰다. 16.6 내지 17.3%로의 EPA의 추가 증가는 모르티에렐라 알피나 LPAAT2가 pMLPAT-Int를 사용하여 게놈 내로 통합되는 경우에 달성되었다. 추가 증가는 천연 야로위아 리폴리티카 LPAAT1 (서열 112 및 113) 및/또는 LPAAT2 (서열 115 및 116)가 예를 들어 균주 Y2067U + pMLPAT-Int에서 넉아웃 되는 경우에 예측될 것이다.
실시예
18
모르티에렐라
알피나
DGAT1
발현은
PUFA
(%)를 증가시킨다.
본 실시예는 모르티에렐라 알피나 DGAT1 cDNA (서열 124)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2067U (실시예 13)에서의 증가된 EPA 생합성 및 축적을 기재한다. Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생산하도록 유전자 조작된 야로위아 리폴리티카 숙주 균주는 모르티에렐라 알피나 DGAT1이 그에서 유사하게 동시 발현되는 경우에 (예컨대, 균주 Y3000에서) 증가된 DHA 생합성 및 축적을 입증할 수 있었음을 고려한다.
모르티에렐라 알피나 DGAT1 ORF를 하기와 같이 클로닝하였다. 첫째, cDNA의 클로닝을 돕기 위해, DGAT1의 제2 코돈의 서열을 'ACA'에서 'GCA'로 바꾸어 트레오닌에서 알라닌으로 아미노산을 변화시켰다. 모르티에렐라 알피나 DGAT1 ORF의 완전한 코딩 영역을 프라이머 MACAT-F1 및 MACAT-R (서열 405 및 406)로 증폭시켜 이를 달성하였다. 구체적으로, PCR 반응 혼합물은 프라이머 MACAT-F1 및 MACAT-R 각 20 μM 용액 1 ㎕, 모르티에렐라 알피나 cDNA (상기 참조, 실시예 16) 1 ㎕, 물 22 ㎕ 및 ExTaq 프리믹스 2X Taq PCR 용액 (다까라 바이오 인크, 일본 520-2193 시가현 오쯔 소재) 25 ㎕를 함유하였다. 증폭을 하기와 같이 수행하였다: 94℃에서 150초 동안 초기 변성, 이어서 94℃에서 30초 동안 변성, 55℃에서 30초 동안 어닐링 및 72℃에서 90초 동안 신장의 30주기. 72℃에서 10분 동안의 최종 신장 주기를 수행한 후에, 반응을 4℃에서 종결하였다. ~1600 bp DNA 단편을 PCR 반응으로부터 수득하였다. 이를 퀴아젠 PCR 정제 키트로 제조자의 프로토콜에 따라 정제하였다.
모르티에렐라 알피나 DGAT1 ORF를 NcoI-NotI 소화 플라스미드 pZUF17 (서열 162; 도 9B) 내로 삽입하여 ORF를 FBAIN 프로모터 및 PEX20-3' 종결자 영역의 조절 하에 클로닝하였다. 그러나, DGAT1 ORF가 내부 NcoI 부위를 함유하였기 때문에, 클로닝을 위해 2개의 개별 제한 효소 소화를 수행하는 것이 요구되었다. 첫째, 정제된 PCR 생성물 ~2 ㎍을 BamHI 및 NcoI로 소화시켰다. 반응 혼합물은 총 부피 60 ㎕ 중에 20 U의 각 효소 (프로메가) 및 제한 완충제 D 6 ㎕를 함유하였다. 혼합물을 2시간 동안 37℃에서 인큐베이션하였다. ~320 bp 단편을 아가로스 겔 전기영동으로 분리하고, 퀴아젠 QiaexII 겔 정제 키트로 정제하였다. 달리, NcoI를 NotI로 대체한 것 외에 상기와 동일한 반응 조건을 이용하여 정제된 PCR 생성물 ~2 ㎍을 BamHI 및 NotI로 소화시켰다. ~1280 bp 단편을 상기와 같이 단리하고, 정제하였다. 최종적으로, pZUF17 ~3 ㎍을 NcoI 및 NotI로 소화시키고, 상기와 같이 정제하하여, ~7 kB 단편을 생성하였다.
~7 kB NcoI/NotI pZUF17 단편, ~320 bp NcoI/BamHI DGAT1 단편 및 ~1280 bp BamHI/NotI DGAT1 단편을 함께 실온에서 밤새 인큐베이션하는 3-방식 라이게이션으로 라이게이션하였다. 라이게이션 혼합물은 총 부피 20 ㎕ 중에 7 kB 단편 100 ng, 및 320 bp 및 1280 bp 단편 각각 200 ng, 리가제 완충제 2 ㎕, 및 2 U T4 DNA 리가제 (프로메가)를 함유하였다. 라이게이션 생성물을 사용하여 이. 콜라이 Top10 화학 감응성 세포 (인비트로젠)를 제조자의 프로토콜에 따라 형질전환시켰다.
형질전환으로부터의 개개 콜로니 (총 12개)를 사용하여 미니프렙 분석을 위해 배양물에 접종하였다. 제한 지도분석 및 서열분석은 12개 중 5개 콜로니가 원하는 플라스미드를 가졌음을 보여주었으며, 이를 "pMDGAT1-17" (도 18B, 서열 193)이라고 명명하였다.
야로위아 리폴리티카 균주 Y2067U (실시예 13으부터)를 pMDGAT1-17 및 pZUF-MOD-1 (상기 참조, 실시예 17)로 통상의 방법에 따라 각각 형질전환시켰다. 형질전환체를 2일 동안 아미노산 보충 합성 MM에서, 이어서 4일 동안 HGM에서 성장시켰다. pMDGAT1-17을 함유한 2개의 형질전환체 및 pZUF-MOD-1을 함유한 2개의 형질전환체의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기 표 46에 나타낸다. 지방산을 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
상기 입증한 바와 같이, 플라스미드 pMDGAT1-17로부터의 모르티에렐라 알피나 DGAT1의 발현은 EPA(%)를 "대조군" 균주에서의 ~13.3%에서 ~14.1% ("Y2067U + pMDGAT1-17 #1") 및 ~15.1% ("Y2067U + pMDGAT1-17 #2")로 각각 증가시켰다. EPA에서의 추가 증가는 천연 야로위아 리폴리티카 DGAT1 (서열 122 및 123)이 예를 들어 균주 Y2067U + pMDGAT1-17에서 넉아웃 되는 경우에 예측될 것이다.
실시예
19
모르티에렐라
알피나
DGAT2
발현은
PUFA
(%)를 증가시킨다.
본 실시예는 모르티에렐라 알피나 DGAT2 cDNA (서열 136)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2067U (실시예 13)에서의 증가된 EPA 생합성 및 축적을 기재한다. Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생산하도록 유전자 조작된 야로위아 리폴리티카 숙주 균주는 모르티에렐라 알피나 DGAT2가 그에서 유사하게 동시 발현되는 경우에 (예컨대, 균주 Y3000에서) 증가된 DHA 생합성 및 축적을 입증할 수 있었음을 고려한다.
모르티에렐라 알피나 DGAT2 ORF를 하기와 같이 플라스미드 pZUF17 내로 클로닝하였다. 첫째, ORF를 모르티에렐라 알피나 cDNA으로부터의 프라이머 MDGAT-F 및 MDGAT-R1 (서열 407 및 408) (상기 참조, 실시예 16)로 PCR-증폭시켰다. 예측된 1015 bp 단편을 단리하고, 정제하고, NcoI 및 NotI로 소화시키고, NcoI-NotI 절단 pZUF17 벡터 (서열 162; 도 9B) 내로 클로닝하여 유전자가 야로위아 리폴리티카 FBAIN 프로모터 및 PEX20-3' 종결자 영역의 조절 하에 놓이게 하였다. 정확한 형질전환체를 미니프렙 DNA의 제한 분석에 의해 확인하고, 생성된 플라스미드를 "pMDGAT2-17" (서열 194)이라고 칭하였다.
야로위아 리폴리티카 균주 Y2067U (실시예 13으부터)를 pMDGAT2-17 및 pZUF-MOD-1 (상기 참조, 실시예 17)로 통상의 방법에 따라 각각 형질전환시켰다. 형질전환체를 2일 동안 아미노산 보충 합성 MM에서, 이어서 4일 동안 HGM에서 성장시켰다. pMDGAT2-17을 함유한 2개의 형질전환체 및 pZUF-MOD-1을 함유한 2개의 형질전환체의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기에 나타낸다. 지방산을 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
플라스미드 pMDGAT2-17로부터의 모르티에렐라 알피나 DGAT2의 발현은 EPA(%)를 "대조군" 균주에서의 ~13.3%에서 ~15.25% ("Y2067U + pMDGAT2-17")로 증가시켰다. EPA에서의 추가 증가는 천연 야로위아 리폴리티카 DGAT2 (서열 130 내지 135)가 예를 들어 균주 Y2067U + pMDGAT2-17에서 넉아웃 되는 경우에 예측될 것이다.
실시예
20
모르티에렐라
알피나
GPAT
는
PUFA
(%)를 증가시킨다.
본 실시예는 모르티에렐라 알피나 GPAT ORF (서열 138)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2107U1 (실시예 14)에서의 증가된 DGLA 생합성 및 축적 (및 저하된 18:1의 양)을 기재한다. Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생산하도록 유전자 조작된 야로위아 리폴리티카 숙주 균주는 모르티에렐라 알피나 GPAT가 그에서 유사하게 동시 발현되는 경우에 (예컨대, 균주 Y3000에서) 증가된 DHA 생합성 및 축적을 입증할 수 있었음을 고려한다.
추정 PCR 프라이머를 사용하는 모르티에렐라 알피나 GPAT 의 동정
아스페르길루스 니둘란스 (진뱅크 관리 번호 EAA62242) 및 뉴로스포라 크라싸 (진뱅크 관리 번호 XP_325840)로부터의 GPAT의 서열을 기초로 하여, 하기 프라이머를 추정 PCR을 위해 디자인하였다:
MGPAT-N1 (서열 409) CCNCAYGCNAAYCARTTYGT
MGPAT-NR5 (서열 410) TTCCANGTNGCCATNTCRTC
[주의: 서열 409 및 410에 사용된 핵산 다의성 코드는 하기와 같음: R= A/G; Y=C/T; 및 N=A/C/T/G.]
PCR 증폭은 퍼킨 엘머(Perkin Elmer) GeneAmp 9600 PCR 머신에서 다까라 ExTaq 프리믹스 Taq 폴리머라제 (다까라 바이오 인크., 일본 시가현 오쯔 소재)를 사용하여 수행하였다. 증폭을 하기와 같이 수행하였다: 94℃에서 30초 동안 변성, 55℃에서 30초 동안 어닐링 및 72℃에서 90초 동안 신장의 30주기, 이어서 72℃에서 7분 동안의 최종 신장 주기.
~1.2 kB 단편을 수득하였다 (서열 140). 이 단편을 퀴아젠 QiaQuick PCR 정제 키트로 정제하고, TOPO® 클로닝 벡터 pCR2.1-TOPO (인비트로젠) 내로 클로닝하고, 서열결정하였다. 생성된 서열은 번역되는 경우에 BLAST 프로그램 분석에 기초하여 공지된 GPAT에 상동성을 가졌다.
1212 bp cDNA 단편의 서열에 기초하여, 모르티에렐라 알피나 GPAT의 5' 및 3' 말단 영역을 PCR 증폭 및 게놈 워킹 기술로 클로닝하였다. 이는 모르티에렐라 알피나 GPAT (서열 141)의 -1050 bp 내지 + 2885 bp 영역에 상응하는 콘티그를 어셈블리할 수 있다. 이 콘티그는 GPAT의 전체 코딩 영역 및 4개의 인트론 (서열 145, 146, 147 및 148)을 포함한다.
구체적으로, 실시예 16에 기재된 모르티에렐라 알피나 cDNA 샘플 (1 ㎕)을 GPAT의 3'-말단의 증폭을 위해 주형으로 사용하였다. MGPAT-5N1 (서열 411) 및 CDSIII/3' (서열 392)를 프라이머로서 사용하였다. PCR 증폭은 퍼킨 엘머 GeneAmp 9600 PCR 머신에서 다까라 ExTaq 프리믹스 Taq 폴리머라제 (다까라 바이오 인크., 일본 시가현 오쯔 소재)를 사용하여 수행하였다. 증폭을 하기와 같이 수행하였다: 94℃에서 30초 동안 변성, 55℃에서 30초 동안 어닐링 및 72℃에서 120초 동안 신장의 30주기, 이어서 72℃에서 7분 동안의 최종 신장 주기.
PCR 생성물을 1:10으로 희석하고, 희석된 PCR 생성물 1 ㎕는 MGPAT-5N2 (서열 412) 및 CDSIII/3'를 프라이머로서 사용하는 제2회 증폭에 주형으로서 사용하였다. 조건은 상기와 정확하게 동일하였다. 제2회 PCR 생성물을 다시 1:10으로 희석하고, 희석된 PCR 생성물 1 ㎕는 MGPAT-5N3 (서열 413) 및 CDSIII/3'를 프라이머로서 사용하는 제3회 PCR의 주형으로서 사용하였다. PCR 조건은 다시 동일하였다.
~1 kB 단편을 제3회 PCR에서 생성하였다. 이 단편을 퀴아젠 PCR 정제 키트로 정제하고, 서열 분석을 위해 pCR2.1-TOPO 벡터 내로 클로닝하였다. 서열 분석으로부터의 결과는 이 965 bp 단편 (서열 142)이 GPAT 유전자의 3'-말단에 상응함을 보여주었다.
클론테크 유니버셜 게놈워커™ 키트를 사용하여 모르티에렐라 알피나 GPAT의 5'-말단 영역에 상응하는 게놈 DNA의 한 조각을 수득하였다. 간략하게 설명하면, 각 모르티에렐라 알피나 게놈 DNA 2.5 ㎍을 DraI, EcoRV, PvuII 또는 StuI로 개별적으로 소화시키고, 소화된 DNA 샘플을 퀴아젠 Qiaquick PCR 정제 키트로 정제하고, 각 키트 완충제 EB 30 ㎕로 용출시키고, 정제된 샘플을 이어서 하기 나타내는 게놈 워커 어댑터 (서열 414 [상부 가닥] 및 415 [하부 가닥])로 라이게이션하였다:
각각의 라이게이션 반응 혼합물은 25 μM 게놈 워커 어댑터 1.9 ㎕, 10X 라이게이션 완충제 1.6 ㎕, T4 DNA 리가제 0.5 ㎕ 및 정제된 소화 게놈 DNA 샘플 4 ㎕를 함유하였다. 반응 혼합물을 16℃에서 밤새 인큐베이션하였다. 반응을 70℃에서 5분 동안 인큐베이션에 의해 종결하였다. 이어서, 10 mM TrisHCl 72 ㎕, 1 mM EDTA, pH 7.4 완충제를 각 라이게이션 반응 믹스에 첨가하였다.
4개 개별 PCR 반응을 수행하고, 이들 각각은 4개의 라이게이션 혼합물 중 하나를 주형으로서 사용하였다. PCR 반응 혼합물은 라이게이션 혼합물 1 ㎕, 20 μM MGPAT-5-1A (서열 416) 0.5 ㎕, 10 μM 키트 프라이머 AP1 (서열 417) 1 ㎕, 물 22.5 ㎕, 및 ExTaq 프리믹스 Taq 2X PCR 용액 (다까라) 25 ㎕를 함유하였다. PCR 반응은 하기 조건을 사용하는 32주기 동안 수행하였다: 94℃에서 30초 동안 변성, 55℃에서 30초 동안 어닐링 및 72℃에서 180초 동안 신장. 72℃에서 7분 동안의 최종 신장 주기를 수행한 후에, 반응을 4℃에서 종결하였다.
각각의 PCR 반응의 생성물을 1:50으로 개별적으로 희석하고, 제2회 PCR의 주형으로서 사용하였다. 각각의 반응 혼합물은 주형으로서의 희석된 PCR 생성물 중 하나 1 ㎕, 20 μM MGPAT-3N1 (서열 418) 0.5 ㎕, 10 μM 키트 프라이머 AP2 (서열 419) 21 ㎕, 물 22.5 ㎕ 및 ExTaq 프리믹스 Taq 2X PCR 용액 (다까라) 25 ㎕를 함유하였다. PCR 반응을 상기한 바와 동일한 열순환기 조건으로 32주기 동안 수행하였다.
DNA 단편을 제2회 PCR로부터 수득하였다. 이 단편을 정제하고, pCR2.1-TOPO 내로 클로닝하고, 서열결정하였다. 서열 분석은 1908 bp 단편 (서열 143)이 모르티에렐라 알피나 GPAT 유전자의 5'-말단이었음을 보여주었다.
유사하게, 966 bp 단편 (서열 144)은 프라이머 MGPAT-5N1을 제1회 PCR에 대한 유전자 특이적 프라이머로서 사용하고, 프라이머 MGPAT-5N2를 제2회 PCR에 대한 유전자 특이적 프라이머로서 사용하는 것을 제외하고는 상기한 2개 회수의 게놈 워킹에 의해 수득하였다. 이 단편을 또한 정제하고, pCR2.1-TOPO 내로 클로닝하고, 서열결정하였다. 서열 분석은 이들이 GPAT 유전자의 부분을 함유함을 보여주었으나, 단편은 유전자의 말단까지 연장하기에 충분히 길지 않았다. 3' cDNA 서열 (서열 142)과의 비교는 ORF의 최종 171 bp가 함유되지 않았음을 보여주었다.
모르티에렐라
알피나로부터의
전장
GPAT
서열의 어셈블리
완전한 GPAT 유전자 (GPAT 번역 개시 'ATG' 코돈의 상류로 1050개 염기를 연장하고, GPAT 종결 코돈 너머로 22개 염기를 연장하는 영역을 포함함)를 함유한 3935 bp 서열 (서열 141)을 원래 부분적 cDNA 단편 (서열 140), 3' cDNA 단편 (서열 142), 내부 게놈 단편 (서열 144), 및 5' 게놈 단편 (서열 143)(상기함)(도 19에 도시함)의 서열로부터 어셈블리하였다. 이 영역에는 2151 bp GPAT ORF가 포함된다. 'ATG'에서 정지 코돈 TAG'로의 모르티에렐라 알피나 GPAT ORF의 완전한 뉴클레오티드 서열은 서열 138 (서열 141의 염기 1050 내지 2863에 상응함, 4개 인트론 (즉, 인트론 1 [서열 145], 서열 141의 염기 1195 내지 1469에 상응함; 인트론 2 [서열 146], 서열 141의 염기 1585 내지 1839에 상응함; 인트론 3 [서열 147], 서열 141의 염기 2795 내지 2877에 상응함 및 인트론 4 [서열 148], 서열 141의 염기 2940 내지 3038에 상응함)을 제외함)을 제공한다. 번역된 아미노산 서열 (서열 139)은 수많은 진균, 식물 및 동물 GPAT와 상동성을 보였다.
보다 구체적으로, 서열의 동일성을 BLAST (베이직 로컬 얼라인먼트 서치 툴(Basic Local Alignment Search Tool); [Altschul, S. F., et al., J. Mol. Biol. 215:403-410 (1993)]) 검색을 수행하여 측정하였다. 본원에서 서열 139라고 기재한 아미노산 단편은 우스틸라고 마이디스(Ustilago maydis)의 추정적 GPAT의 단백질 서열 (진뱅크 관리 번호 EAK84237)과 47% 동일성 및 65% 유사성을 가지며, 기대값이 1e-152이고; 추가로, 서열 139는 아스페르길루스 푸미가투스의 GPAT (진뱅크 관리 번호 EAL20089)와 47% 동일성 및 62% 유사성을 가지며, 기대값이 1e-142이었다.
FBAIN
::
MGPAT
::
PEX20
-3'
키메라
유전자를 포함하는 플라스미드
pMGPAT
-17의 구축
모르티에렐라 알피나 GPAT ORF를 하기와 같이 클로닝하였다. 프라이머 MGPAT-cDNA-5 및 MGPAT-cDNA-R (서열 420 및 421)을 사용하여 GPAT ORF를 모르티에렐라 알피나의 cDNA로부터 PCR에 의해 증폭시켰다. 반응 혼합물은 cDNA 1 ㎕, 각 프라이머 1 ㎕, 물 22 ㎕ 및 ExTaq 프리믹스 2X Taq PCR 용액 (다까라 바이오 인크., 일본 520-2193 시가현 오쯔 소재) 25 ㎕를 함유하였다. 증폭을 하기와 같이 수행하였다: 94℃에서 150초 동안 초기 변성, 이어서 94℃에서 30초 동안 변성, 55℃에서 30초 동안 어닐링 및 72℃에서 120초 동안 신장의 30주기. 72℃에서 10분 동안의 최종 신장 주기를 수행한 후에, 반응을 4℃에서 종결하였다. ~2.2 kB DNA 단편을 PCR 반응으로부터 수득하였다. 이를 퀴아젠 PCR 정제 키트로 제조자의 프로토콜에 따라 정제하였다.
정제된 PCR 생성물을 BamHI 및 EcoRI로 소화시키고, ~470 bp 단편을 겔 아가로스 전기영동에 의해 단리하고, 퀴아젠 겔 정제 키트로 정제하였다. 별법으로, PCR 생성물을 또한 EcoRI 및 NotI로 절단하고, 1.69 kB 단편을 상기와 같이 단리하고, 정제하였다. 2개의 단편을 BamHI 및 NotI 절단 pZUF-MOD-1 벡터 (서열 192; 도 18A) 내로 라이게이션하여 유전자가 야로위아 리폴리티카에서의 발현을 위한 자가-복제 벡터 중에서 야로위아 리폴리티카 FBAIN 프로모터 및 PEX20-3' 종결자 영역의 조절 하에 놓이게 하였다. 정확한 형질전환체를 미니프렙 DNA의 제한 분석에 의해 확인하고, 생성된 플라스미드를 "pMGPAT-17" (서열 195; 도 18C)이라고 칭하였다.
모르티에렐라
알피나
GPAT
를 과발현하는 형질전환체
야로위아
리폴리티카
중의 지질 조성의 분석
야로위아 리폴리티카 균주 Y2107U1 (실시예 14로부터)을 플라스미드 pMGPAT-17 및 플라스미드 pZUF-MOD-1 (상기 참조, 실시예 17)로 통상의 방법에 따라 각각 형질전환시켰다. 형질전환체를 2일 동안 아미노산 보충 합성 MM에서, 이어서 4일 동안 HGM에서 성장시켰다. pZUF-MOD-1을 함유한 2개의 형질전환체 및 pMGPAT-17을 함유한 4개의 형질전환체의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기 표에 나타낸다. 지방산을 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
상기 입증한 바와 같이, pMGPAT-17로부터의 모르티에렐라 알피나 GPAT의 발현은 DGLA(%)를 "대조군" 균주에서의 ~2.5%에서 6.5%로 증가시켰다. 18:1의 수준은 ~23%에서 ~16%로 저하되었다. DGLA (또는 임의의 다른 하류 PUFA)에서의 추가 증가는 천연 야로위아 리폴리티카 GPAT가 pMGPAT-17을 발현하는 형질전환체 균주에서 넉아웃 되는 경우에 예측될 것이다.
실시예
21
모르티에렐라
알피나
지방산
엘론가제
"
ELO3
"은
PUFA
(%)를 증가시킨다.
본 실시예는 모르티에렐라 알피나 C16 /18 지방산 엘론가제 ("ELO3", 서열 86)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2031 (실시예 7)에서 대조군 균주에 상대적으로 35% 증가의 C18 지방산 (18:0, 18:1, 18:2 및 GLA) 및 31% 저하의 C16 지방산을 기재한다. ELO3 (증가된 발현을 위해 임의로 코돈-최적화될 수 있음)이 원하는 PUFA, 즉 DHA의 생성을 증가시키기 위한 수단으로서 유전자 조작된 Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로 내로 탄소 플럭스를 가할 수 있음을 고려한다. 예를 들어, 이 C16 /18 지방산 엘론가제를 포함하는 키메라 유전자는 예를 들어, 균주 Y3000 내로 쉽게 도입될 수 있었다.
모르티에렐라
알피나
C
16
/18
지방산
엘론가제의
서열 확인
모르티에렐라 알피나 지방산 엘론가제의 부분을 코딩하는 cDNA 단편 (서열 88)을 9,984개 모르티에렐라 알피나 cDNA 서열 (실시예 16) 중에서 동정하였다. 이 단편은 수많은 지방산 엘론가제에 유의한 상동성을 가지고, 따라서 엘론가제로서 임시적으로 동정되었다.
서열 88이 가장 유사성을 갖는 서열을 요약한 BLAST 비교의 결과를 동일성(%), 유사성(%), 및 기대값에 따라 보고한다. 구체적으로, 서열 88의 번역된 아미노산 서열은 칸디다 알비칸스 SC5314 (진뱅크 관리 번호 EAL04510.1, 이는 사카로마이세스 세레비지애 EUR4, FEN1 및 ELO1과 유사한 3개의 잠재적인 지방산 엘론가제 유전자 중 하나로 본원에 주석을 달음)로부터의 잠재적인 지방산 엘론가제의 단백질 서열과 32% 동일성 및 46% 유사성을 가지며, 기대값이 4e-13이었다. 추가로, 서열 88은 사카로마이세스 세레비지애 (진뱅크 관리 번호 NC_001142, 염색체 X의 염기 67849 내지 68781)로부터의 ELO1과 35% 동일성 및 53% 유사성을 가졌다. 불포화 C12-C16 지방 아실-CoA에서 C16-C18 지방산으로의 카르복시-말단 신장을 촉매하는 배지-쇄 아실 엘론가제로서 사카로마이세스 세레비지애 ELO1을 기재한다.
상기 보고한 상동성을 기초하여, 서열 88의 야로위아 리폴리티카 유전자 생성물을 본원에서 "엘론가제 3" 또는 "ELO3"으로서 칭하였다.
부분적 지방산 엘론가제 cDNA 서열 (서열 88)의 분석은 5' 및 3'-말단이 모두 불완전하였음을 나타냈다. 모르티에렐라 알피나 ELO3의 누락된 3' 영역을 얻기 위해, 클론테크 유니버셜 게놈워커™ 키트를 사용하였다 (실시예 20에 기재함). 구체적으로, MA Elong 3'1 (서열 422) 및 AP1을 프라이머 (즉, 프라이머 MGPAT-5-1A 및 AP1 대신에)로서 사용한 것 외에는 4개의 라이게이션 혼합물의 동일한 세트를 제1회의 PCR에 이전에 기재한 동일한 성분 및 조건으로 사용하였다. 제2회의 PCR은 MA Elong 3'2 (서열 423) 및 AP2를 프라이머로서 사용하였다. 1042 bp DNA 단편을 제2회의 PCR로부터 수득하였다 (서열 89). 이 단편을 정제하고, pCR2.1-TOPO 내로 클로닝하고, 서열결정하였다. 서열 분석은 단편이 유전자의 'TAA' 정지 코돈의 ~640 bp 하류를 포함하는 ELO3의 3'-말단을 함유하였음을 보여주었다.
클론테크 3'-말단 RACE (상기 참조)에 사용된 4개의 라이게이션 혼합물의 동일한 세트를 또한 사용하여 모르티에렐라 알피나 ELO3의 5'-말단 영역을 수득하였다. 구체적으로, MA Elong 5'1 (서열 424, 5' 말단에 존재) 및 AP1을 프라이머 (즉, 프라이머 MA Elong 3'1 및 AP1 대신에)로서 사용한 것 외에는 제1회의 PCR을 상기한 동일한 성분 및 조건으로 수행하였다. 제2회의 PCR은 MA Elong 5'2 (서열 425, 5' 말단에 존재) 및 AP2를 프라이머로서 사용하였다. 2223 bp DNA 단편 (서열 90)을 수득하였다. 이를 정제하고, pCR2.1-TOPO 내로 클로닝하고, 서열결정하였다. 서열 분석은 단편이 ELO3 유전자의 5'-영역을 함유하였음을 보여주었다.
따라서, 모르티에렐라 알피나 ELO3 (서열 91)의 전체 cDNA 서열은 원래 부분적 cDNA 서열 (서열 88)을 게놈 워킹 (서열 90 및 89, 각각 도 20에 도시함)에 의해 수득한 중복 5' 및 3' 서열과 합하여 수득하였다. 이로써 ELO3의 추정적 'ATG' 번역 개시 코돈의 상류 2091 bp; ELO3 ORF 828 bp (즉, 서열 86, 서열 91의 염기 2092 내지 2919에 상응함); 및 ELO3 정지 코돈의 하류 638 bp (서열 91의 염기 2920 내지 3557에 상응함)를 포함하는, 본원에서 서열 91로서 동정된 3557 bp 서열을 수득하였다.
모르티에렐라 알피나 ELO3의 상응하는 게놈 서열은 서열 91로서 제공된 cDNA 단편보다 길다. 구체적으로, 542 bp 인트론 (서열 92)을 ORF의 318 bp에서 ELO3 유전자를 함유한 게놈 DNA에서 발견하였으며; 따라서, 본원에서 서열 93으로서 제공된 게놈 DNA 단편은 4,099 bp이다 (도 20).
번역된 ELO3 단백질 서열 (서열 87)은 BLAST 프로그램 분석에 기초하여 하기 상동성을 가졌다: 칸디다 알비칸스 SC5314로부터의 잠재적인 지방산 엘론가제 (진뱅크 관리 번호 EAL04510.1)와의 37% 동일성 및 51% 유사성, 기대값 4e-43. 추가로, 번역된 ELO3은 뉴로스포라 크라싸로부터의 XP_331368 ("가상 단백질"로서 본원에 주석을 달음)의 단백질 서열과 33% 동일성 및 44% 유사성을 공유하며, 기대값이 3e-44이었다.
FBAIN
::
ELO3
::
PEX16
-3'
키메라
유전자를 포함하는 플라스미드
pZUF6S
-
E3WT
의 구축
모르티에렐라 알피나 지방산 ELO3 ORF를 하기와 같이 클로닝하였다. 프라이머 MA Elong 5' NcoI 3 및 MA Elong 3' NotI (서열 426 및 427)을 사용하여 ELO3 ORF를 모르티에렐라 알피나의 cDNA (실시예 16)로부터 PCR에 의해 증폭시켰다. 반응 혼합물은 cDNA 1 ㎕, 각 프라이머 1 ㎕, 물 22 ㎕ 및 ExTaq 프리믹스 2X Taq PCR 용액 (다까라) 25 ㎕를 함유하였다. 증폭을 하기와 같이 수행하였다: 94℃에서 30초 동안 초기 변성, 이어서 94℃에서 30초 동안 변성, 55℃에서 30초 어닐링, 72℃에서 120초 동안 신장의 32 주기. 72℃에서 7분 동안의 최종 신장 주기를 수행하고, 이어서 4℃에서 반응을 종결하였다. ~830 bp DNA 단편을 PCR 반응으로부터 수득하였다. 이를 퀴아젠 (미국 캘리포니아주 발렌시아 소재) PCR 정제 키트로 제조자의 프로토콜에 따라 정제하였다. 정제된 PCR 생성물을 2개 분취액으로 나누었으며, 여기서 하나는 NcoI 및 NspI로 소화시키는 반면에, 다른 하나는 NspI 및 NotI로 소화시켰다. ~270 bp NcoI-NspI 및 ~560 bp NspI-NotI 단편을 NcoI-NotI 절단 pZF5T-PPC 벡터 (도 13B, 서열 170) 내로 3-조각 라이게이션에 의해 클로닝하여 유전자가 야로위아 리폴리티카에서의 발현을 위한 자가-복제 벡터 중에서 야로위아 리폴리티카 FBAIN 프로모터 및 PEX16-3' 종결자 영역 (진뱅크 관리 번호 U75433)의 조절 하에 놓이게 하였다. 정확한 형질전환체를 미니프렙 분석에 의해 확인하고, 생성된 플라스미드를 "pZF5T-PPC-E3" (서열 196)이라고 칭하였다.
플라스미드 pZF5T-PPC-E3을 ClaI 및 PacI로 소화시키고, ~2.2 kB 밴드 (즉, FBAIN::ELO3::PEX16-3' 단편)를 아가로스 겔로부터 퀴아젠 겔 추출 키트로 정제하였다. 상기 단편을 Pex20-3' 종결자와 FBAIN 프로모터의 조절 하의 모르티에렐라 알피나 Δ6 데새투라제 ORF ("D6S"; 진뱅크 관리 번호 AF465281) (즉, FBAIN::D6S::Pex20 키메라 유전자) 및 Ura3 유전자를 함유한 자가-복제 플라스미드인 ClaI-PacI 절단 pZUF6S (도 21A, 서열 197) 내로 클로닝하였다. 정확한 형질전환체를 미니프렙 분석에 의해 확인하고, 생성된 플라스미드를 "pZUF6S-E3WT" (도 21B, 서열 198)라고 칭하였다.
모르티에렐라
알피나
ELO3
을 과발현하는 형질전환체
야로위아
리폴리티카
중의 지질 조성의 분석
야로위아 리폴리티카 균주 Y2031 (실시예 7)을 플라스미드 pZUF6S (대조군, FBAIN::D6S::Pex20 키메라 유전자 포함) 및 플라스미드 pZUF6S-E3WT (FBAIN::D6S::Pex20 키메라 유전자 및 FBAIN::ELO3::PEX16 키메라 유전자 포함)로 통상의 방법에 따라 형질전환시켰다. 형질전환체를 2일 동안 아미노산 보충 합성 MM에서, 이어서 4일 동안 HGM에서 성장시켰다. pZUF6S를 함유한 6개의 클론 (클론 #1-6, 단일 형질전환으로부터) 및 pZUF6S-E3WT를 함유한 22개의 클론 (4개의 상이한 형질전환 [즉, #3, 5, 6, 및 7]으로부터)의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기 표 49에 나타낸다. 지방산을 16:0 (팔미테이트), 16:1 (팔미트올레산), 18:0, 18:1 (올레산), 18:2 (LA) 및 GLA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
일부 샘플 (볼드체 및 이탤릭체로 표기함)은 예측 판독에서 벗어났다. 구체적으로, Y2031+pZUF6S-E3WT #3-3 또는 Y2031+pZUF6S-E3WT #5-6은 GLA를 생산하지 않았다. 유사하게, Y2031+pZUF6S-E3WT #7-1, #7-3 및 #7-4는 GC 에러를 가졌으며, 여기서 16:0 및 16:1 피크는 GC에 의해 단일 피크로서 판독되었다. 이들 상이한 결과로서, 표 50은 대조군 및 ELO3을 발현하는 형질전환체 균주에서의 평균 지질을 보고한다. 구체적으로, 표 50은 표 49에 부정확 것인 볼드체 및 이탤릭체로 나타낸 줄을 이들 평균 계산 시 포함하지 않은채 표 49에서의 지방산 프로파일로부터의 평균을 나타낸다. "총 C16"은 16:0 및 16:1의 평균 면적의 합을 나타내고, "총 C18"은 18:0, 18:1, 18:2 및 GLA의 평균 면적의 합을 반영한다.
상기 보고한 데이타를 기초하여, 모르티에렐라 알피나 ELO3의 과발현은 모르티에렐라 알피나 Δ6 데새투라제만을 과발현하는 Y2031의 대조군 균주에 상대적으로 야로위아 리폴리티카 균주 Y2031에서 모르티에렐라 알피나 Δ6 데새투라제와 동시 발현하는 경우에 C18(%)을 증가시키고, C16(%)을 저하시켰다. 이는 모르티에렐라 알피나 ELO3이 실제로 C16 /18 지방산 엘론가제이었음을 나타냈다.
실시예
22
야로위아
C
16
/18
지방산
엘론가제
"
YE2
"는
PUFA
(%)를 증가시킨다
본 실시예는 야로위아 리폴리티카 C16 /18 지방산 엘론가제 ("YE2", 서열 94)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2031 (실시예 7)에서 증가된 GLA 생합성 및 축적을 기재한다. YE2 엘론가제가 원하는 PUFA, 즉 DHA의 생성을 증가시키기 위한 수단으로서 유전자 조작된 Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로 내로 탄소 플럭스를 가할 수 있음을 고려한다. 예를 들어, 이 C16 /18 지방산 엘론가제를 포함하는 키메라 유전자는 예를 들어, 균주 Y3000 내로 쉽게 도입될 수 있었다.
야로위아
리폴리티카
C
16
/18
지방산
엘론가제의
서열 확인
야로위아 리폴리티카로부터의 신규 지방산 엘론가제 후보는 래트 Elo2 C16/18 지방산 엘론가제 단백질 서열 (진뱅크 관리 번호 AB071986, 서열 84)을 조회 서열로서 사용하는 서열 비교에 의해 동정하였다. 구체적으로, 이 rElo2 조회 서열을 사용하여 진뱅크 및 "효모 프로젝트 게놀레부레스"의 공개 야로위아 리폴리티카 단백질 데이타베이스 (프랑스 탈렌스 세덱스 LaBRI 바이오인포르마틱스 센터) (또한, 문헌 [Dujon, B. et al., Nature 430 (6995):35-44 (2004)] 참조)를 조사하였다. 이로써 "무명의 단백질 생성물"로서 주석을 달은 상동성 서열인 진뱅크 관리 번호 CAG77901 (서열 94 및 95)을 동정하였다. 이 유전자를 YE2라고 칭하였다.
BLAST 알고리즘 (문헌 [Altschul, S. F., et al., Nucleic Acids Res. 25:3389-3402 (1997)] 참조)을 사용해 야로위아 YE2 아미노산 서열을 공개 데이타베이스와 비교하여 가장 유사한 공지 아미노산 서열이 칸디다 알비칸스 SC5314 (서열 96, 진뱅크 관리 번호 EAL04510)의 것 (가능한 지방산 엘론가제로서 주석을 달음)임을 밝혀냈다. 상기 단백질들은 약 40% 동일성을 공유하고, 스코어가 236이며, E 값은 7e-61이었다.
야로위아
YE2
유전자의 단리
YE2 유전자의 코딩 영역은 야로위아 게놈 DNA를 주형으로서 사용하고, 올리고뉴클레오티드 YL597 및 YL598 (서열 428 및 429)을 프라이머로서 사용하여 PCR에 의해 증폭시켰다. PCR 반응을 상기 '통상의 방법' 항목에 기재한 바와 같이 총 부피 50 ㎕로 수행하였다. 열순환기 조건은 95℃에서 1분 동안, 56℃에서 30초 동안, 72℃에서 1분 동안의 35주기, 이어서 72℃에서 10분 동안의 최종 신장으로 설정하였다. YE2 코딩 영역의 PCR 생성물을 정제하고, NcoI/NotI로 소화시키고, 이어서 NcoI/NotI 소화 pZKUGPYE1-N (하기 참조, 실시예 23; 또한 도 21C, 서열 199 참조)와 라이게이션하여 pZKUGPYE2 (도 21D, 서열 200)를 생성하였다. 'ATG' 번역 개시 코돈 주변의 NcoI 부위의 첨가는 YE2의 제2 아미노산을 L에서 V로 변화시켰다.
pZKUGPYE2의 ClaI/NotI 단편 (GPAT 프로모터 및 YE2 코딩 영역 함유) 및 Aco 종결자를 함유하는 NotI/PacI 단편 (ACO 3' 종결자를 프라이머 YL325 및 YL326 [서열 430 및 431]으로 PCR 증폭시키고, 이어서 NotI/PacI로 소화시켜 제조함)을 ClaI/PacI 소화 벡터 pZUF6S와 정해진 방향으로 라이게이션하여 pZUF6YE2를 생산하였다. pZKUT16의 ClaI/NcoI 단편 (TEF 프로모터 함유) 및 pZUF6YE2의 NcoI/PacI 단편 (YE2의 코딩 영역 및 Aco 종결자 함유)을 이후 ClaI/PacI 소화 벡터 pZUF6S와 정해진 방향으로 라이게이션하여 pZUF6TYE2 (서열 201)를 생산하였다.
YE2
를 과발현하는 형질전환체
야로위아
리폴리티카
중의 지질 조성의 분석
플라스미드 pZUF6S (도 21A, 서열 197) 및 pZUF6TYE2 (서열 201)를 사용하여 야로위아 균주 Y2031을 따로 형질전환시켰다. 이들 2개 플라스미드의 성분을 표 51 및 52에 기재한다.
플라스미드 pZUF6S (서열 197)의 기재 | |
서열 197 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
EcoRI/ClaI (3114-4510) | 야로위아 자율 복제 서열 18 (ARS18; 진뱅크 관리 번호 M91600) |
SalI/PacI (6022-4530) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
EcoRI/BsiWI (6063-318) | ·FBAIN: FBAIN 프로모터 (서열 214) ·Δ6S: 코돈-최적화된 Δ6 데새투라제 유전자 (서열 3) (모르티에렐라 알피나 (진뱅크 관리 번호 AF465281)에서 유래됨) ·Pex20: 야로위아 Pex20 유전자 (진뱅크 관리 번호 AF054613)로부터의 Pex20 종결자 서열 을 포함하는 FBAIN::Δ6S::Pex20 |
플라스미드 pZUF6TYE2 (서열 201)의 기재 | |
서열 201 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
EcoRI/ClaI (7461-8857) | 야로위아 자율 복제 서열 18 (ARS18; 진뱅크 관리 번호M91600) |
SalI/PacI (1907-415) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
EcoRl/BsiWI (1948-4665) | FBAIN::Δ6S::Pex20: pZUF6에 기재된 바와 같음 (상기 참조) |
ClaI/PacI (8857 -415) | ·TEF: TEF 프로모터 (진뱅크 관리 번호 AF054508) ·YE2: 야로위아 YE2 유전자 (서열 94; 진뱅크 관리 번호 CAG77901)의 코딩 영역 ·Aco: 야로위아 Aco3 유전자 (진뱅크 관리 번호 AJOO1301)의 Aco3 종결자 서열 을 포함하는 TEF::YE2::Aco |
야로위아 리폴리티카 균주 Y2031 (실시예 7)을 플라스미드 pZUF6S (대조군) 및 플라스미드 pZUF6TYE2로 통상의 방법에 따라 형질전환시켰다. 형질전환체를 2일 동안 액체 MM에서 성장시켰다. pZUF6S 또는 pZUF6YE2를 각각 함유한 8개 콜로니의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기 표 53에 나타낸다. 지방산을 16:0 (팔미테이트), 16:1 (팔미트올레산), 18:0, 18:1 (올레산), 18:2 (LA) 및 GLA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
GC 분석은 pZUF6S를 갖는 Y2031 형질전환체에서 생산된 것이 총 지질의 약 27.1% C16 (C16:0 및 C16:1) 및 62.2% C18 (C18:0, C18:1, C18:2 및 GLA)임을 보여주었으며; pZUF6TYE2를 갖는 Y2031 형질전환체에서는 약 21.3% C16 및 73.6% C18이 생산되었다. 따라서, pZUF6TYE2 형질전환체에서 (pZUF6S를 갖는 형질전환체에 비해) C16의 총량은 약 21.4% 저하되었고, C18의 총량은 약 18% 증가되었다. 이들 데이타는 YE2가 C16 /18 지방산 엘론가제로서 기능하여 야로위아에서 C18 지방산을 생산한다는 것을 입증하였다. 추가로, pZUF6S 형질전환체에서 생산되는 GLA에 상대적으로 pZUF6TYE2 형질전환체에서 약 12.8% GLA를 더 생산하였다. 이들 데이타는 YE2 엘론가제가 탄소 플럭스를 유전자 조작된 PUFA 경로 내로 가하여 최종 생성물 (즉, GLA)을 더 생산할 수 있었음을 제안하였다.
실시예
23
야로위아
C
14
/16
지방산
엘론가제
"
YE1
"이
PUFA
(%)를 증가시킨다.
본 실시예는 야로위아 리폴리티카 C14 /16 지방산 엘론가제 ("YE1", 서열 97)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2031 (실시예 7)에서의 증가된 GLA 생합성 및 축적을 기재한다. YE1 엘론가제가 원하는 PUFA, 즉 DHA의 생성을 증가시키기 위한 수단으로서 유전자 조작된 Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로 내로 탄소 플럭스를 가할 수 있음을 고려한다. 구체적으로, 이 C14 /16 지방산 엘론가제를 포함하는 키메라 유전자는 예를 들어, 균주 Y3000 내로 쉽게 도입될 수 있었다.
야로위아
리폴리티카
C
14
/16
지방산
엘론가제의
서열 확인
야로위아 리폴리티카로부터의 신규 지방산 엘론가제 후보는 실시예 22에서 사용한 것과 유사한 방식으로 래트 Elo2 C16/18 지방산 엘론가제 단백질 서열 (진뱅크 관리 번호 AB071986, 서열 84)을 조회 서열로서 사용하는 서열 비교에 의해 동정하였다. 이로써 "무명의 단백질 생성물"로서 주석을 달은 상동성 서열인 진뱅크 관리 번호 CAG83378 (서열 97 및 98)을 동정하였다. 이 유전자를 "YE1"이라고 칭하였다.
BLAST 알고리즘 (문헌 [Altschul, S. F., et al., Nucleic Acids Res. 25:3389-3402 (1997)] 참조)을 사용해 야로위아 YE1 아미노산 서열을 공개 데이타베이스와 비교하여 가장 유사한 공지 서열이 뉴로스포라 크라싸로부터의 FEN1 (진뱅크 관리 번호 CAD70918, 서열 99)(YE1과 약 60% 동일성을 갖는 가능한 지방산 엘론가제)임을 밝혀냈다.
야로위아
YE1
유전자의 단리
YE1 유전자 (서열 97)의 DNA 서열은 내부 NcoI 부위를 보유한다. 야로위아 번역 모티프를 YE1 유전자의 'ATG' 번역 개시 코돈 주변에 혼입하기 위해 2-단계 전략을 사용하여 야로위아로부터의 전체 YE1 유전자를 PCR하였다. 구체적으로, 야로위아 게놈 DNA를 주형으로서 사용하여, YE1의 제1 절반은 올리고뉴클레오티드 YL567 및 YL568 (서열 432 및 433)을 프라이머로서 사용하는 PCR에 의해 증폭시키는 반면에, YE1 유전자의 제2 절반은 올리고뉴클레오티드 YL569 및 YL570 (서열 434 및 435)을 프라이머로서 유사하게 사용하여 증폭시켰다. PCR 반응을 상기 '통상의 방법' 항목에 기재한 바와 같이 총 부피 50 ㎕로 수행하였다. 열순환기 조건은 95℃에서 1분 동안, 56℃에서 30초 동안, 72℃에서 1분 동안의 35주기, 이어서 72℃에서 10분 동안의 최종 신장으로 설정하였다. YE1의 5' 부분에 상응하는 PCR 생성물을 정제하고, 이어서 NcoI 및 SacI로 소화시켜 YE1-1 단편을 수득한 반면에, YE1의 3' 부분의 PCR 생성물을 정제하고, SacI 및 NotI로 소화시켜 YE1-2 단편을 수득하였다. YE1-1 및 YE1-2 단편을 NcoI/NotI 소화 pZKUGPE1S (상기 참조, 실시예 14)와 직접 라이게이션하여 pZKUGPYE1 (도 22A, 서열 202)를 생성하였다. YE1의 내부 NcoI 부위는 이어서 pZKUGPYE1을 주형으로서 사용하고 올리고뉴클레오티드 YL571 및 YL572 (서열 436 및 437)를 프라이머로서 사용하는 부위-지정 돌연변이유발에 의해 돌연변이시킴으로써 pZKUGPYE1-N (서열 199)을 생성하였다. 서열 분석은 돌연변이가 YE1의 아미노산 서열을 변화시키지 않았음을 보여주었다. ATG 번역 개시 코돈 주변의 NcoI 부위의 첨가는 YE1의 제2 아미노산을 S에서 A로 변화시켰다.
pZF5T-PPC의 ClaI/NcoI 단편 (FBAIN 프로모터 함유) 및 pZKUGPYE1-N의 NcoI/PacI 단편 (YE1의 코딩 영역 및 Aco 종결자 함유)을 ClaI/PacI 소화 벡터 pZUF6S와 정해진 방향으로 라이게이션하여 pZUF6FYE1 (서열 203)을 생산하였다.
YE1
을 과발현하는 형질전환체
야로위아
리폴리티카
중의 지질 조성의 분석
플라스미드 pZUF6S 및 pZUF6FYE1 (서열 203)을 사용하여 야로위아 균주 Y2031 (실시예 7로부터)을 통상의 방법에 따라 따로 형질전환시켰다. 대조군 플라스미드 pZUF6S (도 21A, 서열 197; FBAIN::D6S::Pex20 키메라 유전자 포함)의 성분을 실시예 22에 기재한다. pZUF6FYE1 (도 22B, 서열 203, FBAIN::D6S::Pex20 키메라 유전자 및 FBAIN::YE1::Aco 키메라 유전자 포함)의 성분을 하기 표 54에 기재한다.
플라스미드 pZUF6FYE1 (서열 203)의 기재 | |
서열 203 중의 RE 부위 및 뉴클레오티드 | 단편 및 키메라 유전자 성분의 기재 |
EcoRI/ClaI (7047-8445) | 야로위아 자율 복제 서열 18 (ARS18; 진뱅크 관리 번호 M91600) |
SalI/PacI (1493-1) | 야로위아 Ura3 유전자 (진뱅크 관리 번호 AJ306421) |
EcoRI/BsiWI (1534-4251 ) | FBAIN::Δ6S::Pex20: pZUF6에 기재된 바와 같음 (상기 참조, 실시예 22) |
ClaI/PacI (8443-1) | ·FBAIN: FBAIN 프로모터 (서열 214) ·YE1: 야로위아 YE1 유전자 (서열 97; 진뱅크 관리 번호 CAG83378)의 코딩 영역 ·Aco: 야로위아 Aco3 유전자 (진뱅크 관리 번호 AJ001301)로부터의 Aco3 종결자 서열 을 포함하는 FBAIN::YE1::Aco |
형질전환 후, 형질전환체를 2일 동안 아미노산 보충 합성 MM에서, 이어서 4일 동안 HGM에서 성장시켰다. pZUF6S를 함유한 6개 클론 및 pZUF6FYE1을 함유한 5개 클론의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기 표 55에 나타낸다. 지방산을 16:0 (팔미테이트), 16:1 (팔미트올레산), 18:0, 18:1 (올레산), 18:2 (LA) 및 GLA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
GC 분석은 pZUF6S를 갖는 Y2031 형질전환체에서 생산된 것이 총 지질의 약 31.1% C16 (C16:0 + C16:1)임을 측정한 반면에, pZUF6FYE1을 갖는 Y2031 형질전환체에서는 약 39.6% C16이 생산되었다. pZUF6S를 갖는 형질전환체에 비해 pZUF6FYE1 형질전환체에서 C16의 총량은 약 26.7% 증가되었다. 따라서, 이들 데이타는 YE1이 C14 /16 지방산 엘론가제로서 기능하여 야로위아에서 C16 지방산을 생산한다는 것을 입증하였다. 추가로, pZUF6S 형질전환체에서보다 pZUF6FYE1 형질전환체에서 57%의 GLA를 더 생산하였으며, 이는 YE1 엘론가제가 탄소 플럭스를 유전자 조작된 경로 내로 가하여 최종 생성물 (즉, GLA)을 더 생산할 수 있었음을 제안하였다.
실시예
24
야로위아
리폴리티카
CPT1
과발현은
PUFA
(%)를 증가시킨다.
본 실시예는 야로위아 리폴리티카 CPT1 cDNA (서열 150)를 과발현하도록 형질전환된 야로위아 리폴리티카 균주 Y2067U (실시예 13)에서 증가된 EPA 생합성 및 축적을 기재한다. EPA의 합성을 유도하는 PUFA가 또한 증가하였다. Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생산하도록 유전자 조작된 야로위아 리폴리티카 숙주 균주가, 야로위아 리폴리티카 CPT1이 유사하게 동시 발현되는 경우에 (예컨대, 균주 Y3000에서) 증가된 DHA 생합성 및 축적을 입증할 수 있었음을 고려한다.
야로위아 리폴리티카 균주 ATCC #20326 cDNA를 하기 절차로 제조하였다. 세포를 YPD 배지 (2% 박토-효모 추출물, 3% 박토르-펩톤, 2% 글루코스) 200 mL에 1일 동안 30℃에서 성장시키고, 이어서 3750 rpm에서의 벡크만 GH3.8 로터에서 10분 동안 원심분리하여 펠렛화하고, HGM으로 2회 세척하였다. 세척된 세포를 HGM 200 mL에 재현탁하고, 추가 4시간 동안 30℃에서 성장시켰다. 이어서, 세포를 3750 rpm에서 10분 동안 4 x 50 mL 튜브 중에서 원심분리하여 수확하였다.
총 RNA를 퀴아젠 RNeasy 총 RNA 미디 키트로 단리하였다. 세포를 파괴하기 위해, 수확된 세포를 키트 완충제 RLT (제조자에 의해 지정된 바와 같이 β-머캅토에탄올을 보충함) 4 X 600 ㎕에 재현탁하고, 4개의 2 mL 스크루캡 튜브 중에서 동일한 부피의 0.5 mm 유리 비드와 혼합하였다. 바이오스펙 미니 비드 비터를 사용하여 2분 동안 균질화 셋팅에서 세포를 파괴하였다. 추가의 완충제 RLT 4 x 600 ㎕를 첨가하였다. 유리 비드 및 세포 파편을 원심분리로 제거하고, 상등액을 사용하여 총 RNA를 제조자의 프로토콜에 따라 단리하였다.
폴리A(+)RNA를 상기 총 RNA 샘플로부터 퀴아젠 올리고텍스 mRNA 정제 키트로 제조자의 프로토콜에 따라 단리하였다. 단리된 폴리A(+)RNA는 동일한 키트를 사용하여 추가로 1회 정제하여 mRNA 샘플의 순도를 보장하였다. 최종 정제된 폴리(A)+RNA의 농도는 30.4 ng/㎕이었다.
제1 가닥 cDNA 합성을 위해 사용되는 PCR 열순환기 조건을 20초 동안 95℃, 이어서 5초 동안 95℃ 및 6분 동안 68℃의 20주기로 설정하는 것 외에 실시예 16에 기재한 바와 같이 BD-클론테크 및 폴리A(+) RNA 샘플 0.1 ㎍로 정해진 LD-PCR 방법으로 cDNA를 생성하였다. PCR 생성물을 아가로스 겔 전기영동 및 에티듐 브로마이드 염색으로 정량하였다.
야로위아 리폴리티카 CPT1 cDNA를 하기와 같이 클로닝하였다. 프라이머 CPT1-5'-NcoI 및 CPT1-3'-NotI (서열 438 및 439)를 사용하여 야로위아 리폴리티카의 cDNA로부터 야로위아 리폴리티카 ORF를 PCR에 의해 증폭시켰다. 반응 혼합물은 cDNA 0.5 ㎕, 각 프라이머 0.5 ㎕, 물 11 ㎕ 및 ExTaq 프리믹스 2X Taq PCR 용액 (다까라 바이오 인크., 일본 520-2193 시가현 오쯔 소재) 12.5 ㎕를 함유하였다. 증폭을 하기와 같이 수행하였다: 94℃에서 300초 동안 초기 변성, 이어서 94℃에서 30초 동안 변성, 55℃에서 30초 동안 어닐링 및 72℃에서 60초 동안 신장의 30주기. 72℃에서 10분 동안의 최종 신장 주기를 수행한 후에, 반응을 4℃에서 종결하였다. ~1190 bp DNA 단편을 PCR 반응으로부터 수득하였다. 이를 퀴아젠 PCR 정제 키트로 제조자의 프로토콜에 따라 정제하였다. 정제된 PCR 생성물을 NcoI 및 NotI로 소화시키고, NcoI-NotI 절단 pZUF17 벡터 (서열 162; 도 9B) 내로 클로닝하여 유전자가 야로위아 리폴리티카 FBAIN 프로모터 및 PEX20-3' 종결자 영역의 조절 하에 놓이게 하였다. 정확한 형질전환체를 미니프렙 분석에 의해 확인하고, 생성된 플라스미드를 "pYCPT1-17" (서열 204)이라고 칭하였다.
키메라 FBAIN::CPT1::PEX20 유전자를 야로위아 리폴리티카의 게놈 내로 통합하기 위해, pYCPT1-17을 NcoI 및 NotI로 소화시키고, CPT1 ORF를 함유한 ~1190 bp 단편을 단리함으로써 플라스미드 pYCPT1-ZP217을 생성하였다. 이 단편을 이어서 NcoI 및 NotI로 소화시킨 pZP217 + Ura (서열 205) 내로 클로닝하였다. 도 22C에 나타난 바와 같이, 플라스미드 pZP217 + Ura는 키메라 TEF::합성 Δ17 데새투라제 (야로위아 리폴리티카에 코돈-최적화됨)::Pex20-3' 유전자 및 Ura3 유전자 (선별가능한 마커로서 사용하기 위함)를 포함하는 야로위아 리폴리티카 통합 플라스미드이다. 정확한 형질전환체를 미니프렙 분석에 의해 확인하고, 생성된 플라스미드를 "pYCPT1-ZP217" (서열 206)이라고 칭하였다.
야로위아 리폴리티카 균주 Y2067U (실시예 13으로부터)를 BssHII/Bbul 소화 pYCPT1-ZP217 및 pZUF-MOD-1 (상기 참조, 실시예 7)로 통상의 방법에 따라 각각 형질전환시켰다. 형질전환체를 2일 동안 아미노산 보충 합성 MM에서, 이어서 4일 동안 HGM에서 성장시켰다. pZUF-MOD-1을 함유한 2개의 형질전환체 및 pYCPT1-ZP217을 함유한 4개의 형질전환체 (게놈 내에 통합됨)의 지방산 프로파일을 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기 표에 나타낸다. 지방산을 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
상기 나타낸 바와 같이, 게놈 통합에 의한 강력한 FBAIN 프로모터 조절 하의 야로위아 리폴리티카 CPT1의 발현은 EPA(%)를 대조군" 균주에서의 13.4%에서 15.7 내지 16%로 증가시켰다. 추가로, GLA, DGLA 및 ARA 수준을 또한 증가시켰다.
실시예
25
사카로마이세스
세레비지애
ISC1
은
PUFA
(%)를 증가시킨다.
본 실시예는 사카로마이세스 세레비지애 ISC1 유전자 (서열 152)를 동시 발현하도록 형질전환된 야로위아 리폴리티카 균주 M4 (실시예 6)에서의 증가된 EPA 생합성 및 축적을 기재한다. Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생산하도록 유전자 조작된 야로위아 리폴리티카 숙주 균주는 사카로마이세스 세레비지애 ISC1이 유사하게 동시 발현되는 경우에 (예컨대, 균주 Y3000에서) 증가된 DHA 생합성 및 축적을 입증할 수 있었음을 고려한다.
사카로마이세스 세레비지애 ISC1 ORF를 하기와 같이 플라스미드 pZP217 + Ura 내로 클로닝하였다. 첫째, ORF는 사카로마이세스 세레비지애 균주 S288C (프로메가, 미국 위스콘신주 매디슨 소재)로부터의 게놈 DNA 및 프라이머 쌍 Isc1F 및 Isc1R (서열 440 및 441)을 사용하여 PCR-증폭하였다. 프라이머 Isc1F는 증폭된 ORF에서 ISC1의 야생형 5' 서열을 'ATGTACAA'에서 'ATGGACAA'로 변형시켰는데, 이는 NcoI 부위를 혼입하여 프레임에 ISC1을 유지하는데 필요하기 때문이다. 증폭을 하기와 같이 수행하였다: 94℃에서 120초 동안 초기 변성, 이어서 94℃에서 30초 동안 변성, 50℃에서 30초 동안 어닐링 및 68℃에서 120초 동안 신장의 35주기. 68℃에서 10분 동안의 최종 신장 주기를 수행하고, 이어서 4℃에서 반응을 종결하였다. 1455 bp DNA 단편을 ISC1에 대한 PCR 반응으로부터 수득하고, PCR 생성물 크기는 1% 아가로스 겔 (30분 동안 120 V) 및 인비트로젠 (미국 캘리포니아주 칼스배드 소재)로부터의 1 kB DNA 표준 래더(ladder)를 사용하는 전기영동에 의해 확인하였다.
DNA는 제조자 지시서에 따라 자이모 리써치 코포레이션 (미국 캘리포니아주 오렌지 소재)로부터의 DNA 클린 & 컨센트레이터-5 (DNA Clean & Concentrator-5) 키트로 정제하고, 이어서 NcoI/NotI로 소화시켰다. 이어서, ISC1 단편을 NcoI 및 NotI로 소화시킨 pZP217 + Ura (서열 205; 도 22C) 내로 개별적으로 클로닝하였다. 정확한 형질전환체를 겔 전기영동으로 확인하고, 생성된 플라스미드를 "pTEF::ISC1" (서열 207)이라고 칭하였다. 따라서, 이 플라스미드는 하기를 포함하는 DNA 카세트를 함유하였다: 3'-POX2, URA3, TEF::ISC1::Pex20 및 POX2 프로모터 영역.
"대조군" 벡터를 하기와 같이 제조하였다. 첫째, 사카로마이세스 세레비지애 pcl1 ORF (유사분열 세포 주기 내로의 진입 및 형태발생의 조절과 관련된 단백질을 코딩함)를 사카로마이세스 세레비지애 균주 S288C로부터의 게놈 DNA 및 프라이머 쌍 Pcl1F 및 Pcl1R (서열 442 및 443)로 PCR 증폭시켰다. 증폭을 상기와 같이 수행하였다. 861 bp DNA 단편을 pcl1에 대한 PCR 반응으로부터 수득하였다 (전기영동에 의해 확인함, 상기 참조). DNA를 DNA 클린 & 컨센트레이터-5 키트로 정제하고, 이어서 NcoI/NotI로 소화시켰다. 이어서, 단편을 유사하게 소화시킨 pZP217 + Ura 내로 클로닝하였다. 정확한 형질전환체를 겔 전기영동에 의해 확인하고, 생성된 플라스미드를 "pTEF::pcl1"이라고 칭하였다. 이어서, 플라스미드 pTEF::pcl1을 HincII로 소화시켜 pcl1 ORF를 제거하였다. 잔존 플라스미드를 재라이게이션하여 3'-POX2, URA3, TEF::Pex20 및 POX2 프로모터 영역을 포함하는 선형 DNA 카세트를 AscI/SphI의 소화 시에 생성하였다.
감응성 야로위아 리폴리티카 균주 M4 세포 (실시예 6으로부터)를 AscI/SphI-소화 pTEF::ISC1 및 "대조군"으로 각각 형질전환시켰다 (여기서, 각 플라스미드 5 ㎍을 소화시킴). 형질전환을 동결 EZ 효모 형질전환 II 키트 (자이모 리써치)로 달성하고, 형질전환체를 아미노산 없는 YNB (6.7 g/L; 벡톤, 딕킨손 앤드 코포레이션(Becton, Dickinson and Co.), 미국 메릴랜드주 스파크스 소재 [카탈로그 #291940]), 글루코스 (20 g/L) 및 아가 (20 g/L)를 함유하는 플레이트 상에서 선별하였다. 수백개 형질전환체 콜로니를 수득하였다. 각 DNA 카세트를 야로위아 리폴리티카 P0X2 유전자좌 내로 통합한 것을 ISC1에 대한 5개 독립성 형질전환체로부터의 게놈 DNA를 사용하는 PCR에 의해 확인하였다.
형질전환체를 2% 글루코스를 함유한 아미노산 없는 YNB에서 2일 동안 성장시켰다. 세포를 원심분리로 수확하고, 100 g/L 덱스트로즈, 2 g/L MgSO4 및 50 mM 포스페이트 완충제 (pH 6.5)를 함유한 배지에 추가 5일 성장 동안 재현탁하였다. 각 배양물 0.75 mL로부터의 세포를 원심분리로 수확하고, 그의 지방산 조성을 분석하였다. "대조군" 벡터를 포함한 3개 형질전환체의 지방산 프로파일 및 pTEF::ISC1을 포함한 5개 형질전환체를 (상기 '통상의 방법' 항목에 기재한 바와 같이) GC 분석에 기초하여 하기에 나타낸다. 지방산을 16:0, 16:1, 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
사카로마이세스 세레비지애 ISC1 유전자의 발현은 EPA(%)를 "대조군" 균주에서의 9.3%에서 10.7% ("M4 + pTEF::ISC1")로 개선시켰으며, 14.5% 증가를 나타냈다.
실시예
26
야로위아
리폴리티카
아실트랜스퍼라제
넉아웃의
생성
본 실시예는 PDAT, DGAT2, DGAT1, PDAT 및 DGAT2, PDAT 및 DGAT1, DGAT1 및 DGAT2, 또는 PDAT, DGAT1 및 DGAT2 유전자를 파괴한 야로위아 리폴리티카의 단일, 이중 및 삼중 넉아웃 균주의 생성을 기재한다. 각 넉아웃 균주 중의 유전자(들)의 파괴를 확인하고, 지방산 함량 및 조성에 대한 각 파괴의 분석을 실시예 27에서의 총 지질의 GC 분석에 의해 측정하였다.
야로위아
리폴리티카
DGAT2
유전자의
표적화된
파괴
야로위아 리폴리티카 ATCC #90812 중의 DGAT2 유전자의 표적화된 파괴는 플라스미드 pY21DGAT2라고 칭한 표적화 카세트를 사용하는 내인성 DGAT2 유전자의 상동성 재조합-매개 대체에 의해 달성되었다. pY21DGAT2는 플라스미드 pY20 (도 22D, 서열 208)으로부터 유래되었다. 구체적으로, pY21DGAT2는 570 bp HindIII/EcoRI 단편을 유사하게 선형화된 pY20 내로 삽입하여 생성하였다. 570 bp DNA 단편은 (5'에서 3'로의 배향에서) (서열 130 중의 코딩 서열 (ORF)의) 위치 +1090 내지 +1464로부터의 3' 상동성 서열, BglII 제한 부위 및 (서열 130 중의 코딩 서열 (ORF)의) 위치 +906 내지 +1089로부터의 5' 상동성 서열을 함유하였다. 상기 단편은 2쌍의 PCR 프라이머 P95 및 P96 (서열 444 및 445), 및 P97 및 P98 (서열 446 및 447)을 각각 사용하는 PCR 증폭에 의해 제조하였다.
pY21DGAT2를 BglII 제한 소화에 의해 선형화하고, 통상의 방법에 따라 중간-로그 단계 야로위아 리폴리티카 ATCC #90812 세포로 형질전환시켰다. 세포를 YPD 하이그로마이신 선별 플레이트 상에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다.
14개 야로위아 리폴리티카 ATCC #90812 하이그로마이신-내성 콜로니를 단리하고, 표적화된 파괴에 대해 PCR로 스크리닝하였다. 1세트의 PCR 프라이머 (P115 및 P116 [서열 448 및 449])를 디자인하여 특이적 연결 단편을 증폭시킨 후 상동성 재조합하였다. 또다른 쌍의 PCR 프라이머 (P115 및 P112 [서열 450])를 디자인하여 천연 유전자를 검출하였다.
ATCC #90812 균주의 14개 하이그로마이신-내성 콜로니 중 2개는 연결 단편에 대해 양성이었고, 천연 단편에 대해 음성이었다. 따라서, 표적화된 통합을 이들 2개 균주에서 확인하였으며, 이들 중 하나를 "S-D2"라고 칭하였다.
야로위아
리폴리티카
PDAT
유전자의
표적화된
파괴
야로위아 리폴리티카 ATCC #90812 중의 PDAT 유전자의 표적화된 파괴는 pLV13 (도 22E, 서열 209)이라고 칭한 표적화 카세트를 사용하는 내인성 PDAT 유전자의 상동성 재조합-매개 대체에 의해 달성되었다. pLV13은 플라스미드 pY20 (도 22D, 서열 208)으로부터 유래되었다. 구체적으로, pY20의 하이그로마이신 내성 유전자를 야로위아 Ura3 유전자로 대체하여 플라스미드 pLV5를 생성하였다. 이어서, pLV13은 992 bp BamHI/EcoRI 단편을 유사하게 선형화된 pLV5 내에 삽입함으로써 생성하였다. 992 bp DNA 단편은 (5'에서 3'로의 배향에서) (서열 117 중의 코딩 서열 (ORF)의) 위치 +877 내지 +1371로부터의 3' 상동성 서열, BglII 제한 부위 및 (서열 117 중의 코딩 서열 (ORF)의) 위치 +390 내지 +876으로부터의 5' 상동성 서열을 함유하였다. 상기 단편은 PCR 프라이머 P39 및 P41 (서열 451 및 452), 및 P40 및 P42 (서열 453 및 454)를 각각 사용하는 PCR 증폭에 의해 제조하였다.
pLV13을 BglII 제한 소화에 의해 선형화하고, 통상의 방법에 따라 중간-로그 단계 야로위아 리폴리티카 ATCC #90812 세포로 형질전환시켰다. 세포를 Bio101 DOB/CSM-Ura 선별 플레이트 상에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다.
10개 야로위아 리폴리티카 ATCC #90812 콜로니를 단리하고, 표적화된 파괴에 대해 PCR로 스크리닝하였다. 1세트의 PCR 프라이머 (P51 및 P52 [서열 455 및 456])를 디자인하여 표적화 카세트를 증폭시켰다. 또다른 세트의 PCR 프라이머 (P37 및 P38 [서열 457 및 458])를 디자인하여 천연 유전자를 검출하였다. 10개 균주 중 10개는 연결 단편에 대해 양성이었고, 10개 균주 중 3개는 천연 단편에 대해 음성이어서 이들 3개 균주에서 성공적인 표적화 통합을 확인하였다. 이들 중 하나를 "S-D2"라고 칭하였다.
야로위아
리폴리티카
DGAT1
유전자의
표적화된
파괴
전장 Y1 DGAT1 ORF는 추정 PCR 프라이머 P201 및 P203 (각각 서열 459 및 460) 및 주형으로서의 야로위아 리폴리티카 ATCC #76982 게놈 DNA를 사용하는 PCR에 의해 클로닝하였다. Y1 DGAT1을 코딩하는 뉴클레오티드 서열이 공지되어 있지 않기 때문에 추정 프라이머가 요구되었다.
PCR은 증폭이 하기와 같이 수행되는 RoboCycler Gradient 40 PCR 머신에서 수행하였다: 95℃에서 1분 동안 초기 변성, 이어서 95℃에서 30초 동안 변성, 55℃에서 1분 동안 어닐링 및 72℃에서 1분 동안 신장의 30주기. 72℃에서 10분 동안의 최종 신장 주기를 수행하고, 이어서 4℃에서 반응을 종결하였다. 예측된 PCR 생성물 (약 1.6 kB)을 아가로스 겔 전기영동에 의해 검출하고, 단리하고, 정제하고, TOPO® 클로닝 벡터 (인비트로젠) 내로 클로닝하고, 부분적으로 서열결정하여 그의 정체를 확인하였다.
야로위아 리폴리티카 ATCC #90812 중의 추정적 DGAT1 유전자의 표적화된 파괴는 표적화 카세트를 사용하는 내인성 DGAT1 유전자의 상동성 재조합-매개 대체에 의해 수행하였다 (DGAT2에 대한 상기 방법을 이용함). 구체적으로, 1.6 kB 단리된 Y1 DGAT1 ORF (서열 122)를 PCR 주형 분자로서 사용하여 5' 상동성 Y1 DGAT1 서열 (프라이머 P214 및 P215 (서열 461 및 462)로 증폭시킴), 야로위아 루이신2 (Leu2; 진뱅크 관리 번호 AAA35244) 유전자, 및 3' 상동성 Y1 DGAT1 서열 (프라이머 P216 및 P217 (서열 463 및 464)로 증폭시킴)로 이루어진 Y1 DGAT1 표적화 카세트를 구축하였다. 표적화 카세트의 각 개개의 부분을 Pfu 울트라 폴리머라제 (스트라타진, 카탈로그 #600630) 및 상기한 열순환기 조건으로 증폭시킨 후에, 각 단편을 정제하였다. 3개의 정확한 크기의 정제된 단편은 PCR 프라이머 P214 및 P219 (서열 465)를 사용하는 제2 PCR 반응을 위해 주형 분자로서 함께 혼합하여 Y1 DGAT1 파괴 카세트를 수득하였다.
표적화 카세트를 겔 정제하고, 이를 사용하여 중간-로그 단계 야생형 야로위아 리폴리티카 (ATCC #90812)를 형질전환시켰다. 형질전환을 상기 '통상의 방법' 항목에 기재한 바와 같이 수행하였다. 형질전환체를 Bio101 DOB/CSM-Leu 선별 플레이트 상에 플레이팅하고, 30℃에서 2 내지 3일 동안 유지시켰다. 몇몇 루이신 원시영양체를 PCR에 의해 스크리닝하여 표적화된 DGAT1 파괴를 확인하였다. 구체적으로, 1세트의 PCR 프라이머 (P226 및 P227 [서열 466 및 467])를 디자인하여 파괴 카세트와 천연 표적 유전자 간의 연결부를 증폭시켰다. 또다른 세트의 PCR 프라이머 (P214 및 P217 [서열 461 및 464])를 디지인하여 천연 유전자를 검출하였다.
모든 루이신 원시영양체 콜로니는 연결 단편에 대해 양성이고, 천연 단편에 대해 음성이었다. 따라서, 표적화된 통합을 이들 균주에서 확인하였으며, 이들 중 하나를 "S-D1"이라고 칭하였다.
PDAT
및/또는
DGAT2
및/또는
DGAT1
유전자 중에 파괴를 함유하는
야로위아
리폴리티카
이중 및 삼중
넉아웃
균주의 생성
야로위아 리폴리티카 ATCC #90812 하이그로마이신-내성 "S-D2" 돌연변이체 (DGAT2 파괴 함유)를 플라스미드 pLV13 (PDAT 파괴 함유)로 형질전환시키고, 형질전환체를 단일 PDAT 파괴에 대해 기재한 바와 같이 PCR에 의해 스크리닝하였다. 12개 형질전환체 중 2개는 DGAT2 및 PDAT 유전자 모두에서 파괴되었음을 확인하였다. 이들 균주 중 하나를 "S-D2-P"라고 칭하였다.
유사하게, DGAT1 및 PDAT ("S-D1-P"), DGAT2 및 DGAT1 ("S-D2-D1") 중의 이중 넉아웃, 및 DGAT2, DGAT1 및 PDAT ("S-D2-D1-P") 중의 삼중 넉아웃을 갖는 균주를 생성시켰다.
실시예
27
야로위아
리폴리티카
아실트랜스퍼라제
넉아웃은
지질 함량을
저하시키고
,
PUFA
(%)를 증가시킨다.
본 실시예는 지방산 함량 및 조성의 변화에 의해 측정하는 바와 같이, 야생형 야로위아 리폴리티카 및 EPA를 생산하도록 미리 유전자 조작된 야로위아 리폴리티카 균주에서의 단일 및/또는 이중 및/또는 삼중 아실트랜스퍼라제 넉아웃의 영향을 분석한다. Δ6 데새투라제/Δ6 엘론가제 경로 또는 Δ9 엘론가제/Δ8 데새투라제 경로를 통해 DHA를 생산하도록 유전자 조작된 야로위아 리폴리티카 숙주 균주가 숙주의 천연 아실트랜스퍼라제에 대한 유사한 조작물이 생성되는 경우에 (예컨대, 균주 Y3000 내에서) 증가된 DHA 생합성 및 축적을 입증할 수 있었음을 고려한다.
TAG
함량은
아실트랜스퍼라제
파괴를 갖는
야로위아
리폴리티카
ATCC
#90812에서 저하된다.
첫째, TAG 함량은 (1) PDAT, DGAT2 및 DGAT1 중의 단일 파괴; (2) PDAT 및 DGAT2, DGAT1 및 PDAT, 및 DGAT1 및 DGAT2 중의 이중 파괴; 및 (3) PDAT, DGAT2 및 DGAT1 중의 삼중 파괴를 함유한 야생형 및 돌연변이체 야로위아 리폴리티카 ATCC #90812에서 비교하였다.
구체적으로, 야생형 및 돌연변이체 야로위아 리폴리티카 ATCC #90812 (즉, 균주 S-D1, S-D2, S-P, S-D1-D2, S-D1-P, S-D2-P, 및 S-D1-D2-P)를 함유한 플레이트로부터 1백금이의 세포를 YPD 배지 3 mL에 각각 개별적으로 접종시키고, 밤새 진탕기 (300 rpm) 상에서 30℃에서 성장시켰다. 세포를 수확하고, 0.9% NaCl로 1회 세척하고, HGM 50 mL에 재현탁하였다. 이어서, 세포를 48시간 동안 진탕기 상에 성장시켰다. 세포를 물로 세척하고, 세포 펠렛을 동결건조시켰다. 세포 건중량 20 mg을 GC에 의한 총 지방산 분석에 사용하고, 오일 분획을 TLC (하기 참조) 및 GC 분석하였다.
TLC에 사용된 방법을 다음 5단계로 하기에 기재한다: (1) 15:0 지방산 (10 ㎕의 10 mg/mL) 내부 표준을 건조 세포 덩어리 2 내지 3 mg에 첨가한 후에, 총 지질을 메탄올/클로로포름 방법으로 추출하였다. (2) 5 x 20 cm 실리카 겔 60 플레이트의 하부로부터 대략 1 인치 그은 연한 연필 줄을 따라 추출된 지질 (50 ㎕)을 25 내지 50 ㎕ 마이크로피펫으로 블럿팅하였다. (3) 이어서 TLC 플레이트를 N2 하에 건조시키고, 약 ~100 mL의 헥산:에틸 에테르:아세트산 (80:20:1) 용매를 함유한 탱크 내에 삽입하였다. (4) 밴드 분리 후에, 요오드 증기를 플레이트의 한 면 상에 취입하여 밴드를 확인하였다. 이는 추가 분석을 위해 면도날을 사용하여 플레이트의 다른 면 상의 샘플을 긁어 낼 수 있게 한다. (5) 긁어 낸 샘플의 염기성 에스테르교환반응 및 GC 분석을 상기 '통상의 방법' 항목에 기재한 바와 같이 수행하였다.
GC 결과를 하기 표 58에 나타낸다. 배양물을 "S" 균주 (야생형), "S-P" (PDAT 넉아웃), "S-D1" (DGAT1 넉아웃), "S-D2" (DGAT2 넉아웃), "S-D1-D2" (DGAT1 및 DGAT2 넉아웃), "S-P-D1" (PDAT 및 DGAT1 넉아웃), "S-P-D2" (PDAT 및 DGAT2 넉아웃) 및 "S-P-D1-D2" (PDAT, DGAT1 및 DGAT2 넉아웃)로서 기재한다. 약어는 하기와 같이 사용한다: "WT" = 야생형; "FA" = 지방산; "dcw" = 세포 건중량; 및 "FA% dcw, % WT" = 야생형 (%)에 상대적인 FA% dcw (여기서 "S" 균주는 야생형임).
표 58의 결과는 오일 생합성에 대한 3개의 DAG AT의 상대적 기여도를 나타낸다. DGAT2가 최고로 기여하지만, PDAT 및 DGAT1은 DGAT2와 동일하거나 그 미만으로 기여한다. 삼중 넉아웃 균주 중의 잔류 오일 함량 약 3%는 야로위아 리폴리티카 아실-CoA:스테롤-아실트랜스퍼라제 효소 (ARE2에 의해 코딩됨) (서열 119 및 120)의 기여도일 수 있다.
파괴된
DGAT2
유전자를 갖는
야로위아
리폴리티카
균주
EU
에서
TAG
함량은 저하되고,
EPA
(%)는
증가된다
.
야생형 야로위아 리폴리티카 ATCC #90812 (상기 문헌)에서의 다양한 아실트랜스퍼라제 넉아웃의 영향을 시험한 후에, 이어서 TAG 함량 및 지방산 조성을 EU 균주의 DGAT2 넉아웃 균주 (즉, 10% EPA를 생산하도록 유전자 조작됨, 실시예 13 참조)에서 연구하였다.
구체적으로, 균주 EU 중의 DGAT2 유전자를 실시예 26에서 S 균주 (ATCC #90812)에 대해 기재한 바와 같이 파괴하였다. DGAT2-파괴 균주를 EU-D2라고 칭하였다. EU 및 EU-D2 균주를 2개의 상이한 조건에 따른 성장 후에 수확하고, 분석하였다. 하기 표에 "3 mL"로서 나타낸 조건에서는, 세포를 1일 동안 MM 배지 3 mL에서 성장시키고, 세척하고, 이어서 3일 동안 HGM 3 mL에서 성장시켰다. 별법으로, 하기 표에 "51 mL"로서 나타낸 조건에서는, 세포를 1일 동안 MM 배지 51 mL에서 성장시키고, 세척하고, 이어서 3일 동안 HGM 51 mL에서 성장시켰다. 포스파티딜콜린 (PC), 포스파티딜에탄올아민 (PE), 및 트리아실글리세롤 (TAG 또는 오일)의 지방산 조성을 배양물 51 mL의 추출물에서 TLC 분리 ("분획") 후에 측정하였다.
GC 결과를 하기 표 59에 나타낸다. 배양물을 "EU" 균주 (야생형) 및 "EU-D2" 균주 (DGAT2 넉아웃)라고 기재한다. 지방산을 16:0, 16:1, 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
결과는 DGAT2 넉아웃이 (총 지방산의) EPA(%)를 배가시키고, 지질 함량 (dcw(%))을 반감시켰음을 나타낸다. 추가로, 지질 함량에서 관찰된 거의 모든 변화는 TAG 분획에서의 변화 때문이다. 균주 EU의 배양물 51 mL에서의 예측보다 낮은 EPA(%)는 불안정성 때문인 것으로 여겨진다.
파괴된
아실트랜스퍼라제
유전자를 갖는
야로위아
리폴리티카
균주
MU
에서
TAG
함량은 저하되고,
EPA
(%)는
증가된다
.
최종적으로, 균주 EU-D2에서 단일 DGAT2 넉아웃으로부터 얻어진 증가된 EPA(%) 및 저하된 지질 함량을 기초로 하여, TAG 함량 및 지방산 조성을 이어서 균주 MU의 다양한 아실트랜스퍼라제 넉아웃 균주 (즉, 14% EPA를 생산하도록 유전자 조작됨, 실시예 15 참조)에서 연구하였다. 구체적으로, PDAT, DGAT2 및 DGAT1 중의 단일 파괴 및 PDAT 및 DGAT2 중의 이중 파괴를 균주 MU에서 생성하였다. 지질 함량 및 조성은 4개의 상이한 성장 조건에서의 성장 후에 각각의 이들 균주에서 비교하였다.
보다 구체적으로, PDAT, DGAT2, DGAT1 중의 단일 파괴를 실시예 26에 기재한 방법 (URA3 유전자에 기반한 DGAT1 파괴에 대한 선별은 제외함)으로 균주 MU에서 생성하였다. 이는 "MU-D1" (DGAT1에서 파괴됨), "MU-D2" (DGAT2에서 파괴됨), 및 "MU-P" (PDAT에서 파괴됨)라고 동정된 단일 넉아웃 균주를 생성하였다. 개개의 넉아웃 균주를 PCR로 확인하였다. 추가로, MU-D2 균주를 동일한 방법에 의해 PDAT 유전자에 대해 파괴하고, 이 파괴를 PCR에 의해 확인하였다. 생성된 이중 넉아웃 균주를 "MU-D2-P"라고 칭하였다.
MU-D1, MU-D2, MU-P, 및 M-D2-P 넉아웃 균주를 분석하여 하기에 기재하는 바와 같이 지질 함량 및 조성에 대한 각각의 넉아웃 효과를 측정하였다. 추가로, 유질성을 촉진하는 성장 조건을 총 지질 함량에 대한 그의 효과를 측정하기 위해 또한 조사하였다. 따라서, "실험 A", "실험 B", "실험 C" 및 "실험 E"로 나타내는 총 4개의 상이한 실험을 수행하였다. 구체적으로, 상기 각 균주를 함유한 플레이트로부터 3백금이의 세포를 MMU 배지 [실험 B 및 C의 경우 3 mL; 및 실험 A 및 E의 경우 50 mL]에 접종하고, 진탕기 중 30℃에서 24시간 (실험 A, B 및 C의 경우) 또는 48시간 (실험 E의 경우) 동안 성장시켰다. 세포를 수확하고, HGM으로 1회 세척하고, HGM 배지 (실험 A 및 E의 경우 50 mL; 및 실험 B의 경우 3 mL) 또는 HGM 배지 (우라실 ("HGMU") 함유) (실험 C의 경우 3 mL) 중에 재현탁하고, 4일 동안 상기와 같이 배양하였다. 하나의 분취액 (1 mL)을 상기 '통상의 방법' 항목에 기재한 바와 같이 GC에 의한 지질 분석에 사용한 반면에, 제2 분취액을 600 nm에서의 배양물 OD를 측정하는데 사용하였다. 실험 A 및 E의 잔존 배양물을 수확하고, 물로 1회 세척하고, 세포 건중량 (dew) 측정을 위해 동결건조시켰다. 반대로, 실험 B 및 C의 dcw를 그의 관계를 나타내는 방정식으로 그의 OD600으로부터 측정하였다. 또한, 실험 A, B, C 및 E 중의 각각의 상이한 균주의 지방산 조성을 측정하였다.
결과를 하기 표 60에 나타낸다. 배양물을 "MU" 균주 (모 EPA 생산 균주), "MU-P" (PDAT 넉아웃), "MU-D1" (DGAT1 넉아웃), "MU-D2" (DGAT2 넉아웃) 및 "MU-D2-P" (DGAT2 및 PDAT 넉아웃)으로 기재한다. 약어는 하기와 같이 사용한다: "WT" = 야생형 (즉, MU); "OD" = 광학 밀도; "dcw" = 세포 건중량; "TFA" = 총 지방산; 및 "TFA% dcw, % WT" = 야생형 ("MU") 균주에 상대적인 TFA% dcw. 지방산을 16:0, 16:1, 18:0, 18:1 (올레산), 18:2 (LA), GLA, DGLA, ARA, ETA 및 EPA로서 확인하고; 각각의 조성을 총 지방산(%)으로서 나타낸다.
상기 데이타는 형질전환된 세포 내의 지질 함량이 성장 조건에 따라 변하였음을 보여주었다. 추가로, 지질 함량에 대한 각각의 아실트랜스퍼라제의 기여도도 변하였다. 구체적으로, 실험 B, C 및 E에서 DGAT2는 PDAT 또는 DGAT1보다 오일 생합성에 더 기여하였다. 반대로, 실험 A에서 입증된 바와 같이, DGAT2, DGAT1 및 PDAT에서의 단일 넉아웃은 지질 함량에서 대략 동등한 손실을 발생하였다 (즉, 각각 48%, 49% 및 42% 손실 ["TFA% dcw, % WT" 참조]).
지방산 조성과 관련하여, 상기 데이타는 각각의 개개 DAG AT 유전자의 넉아웃이 오일 함량을 낮추고, EPA(%)를 증가시켰음을 보여준다. 예를 들어, DGAT2 넉아웃은 지질 함량을 대략 반감시키고, 총 지방산에서 EPA(%)를 대략 배가시켰다 (균주 EU-D2에서 관찰된 결과와 유사함, 상기 참조). DAGAT2 및 PDAT 모두의 넉아웃은 최소 오일 및 최고 EPA(%)를 생산하였다.
본원에 보고한 결과를 기초로 하여, 천연 DGAT2 및/또는 DGAT1 및/또는 PDAT의 파괴가 DHA를 비롯한 고농도의 PUFA를 생산하도록 유전자 조작된 야로위아 리폴리티카의 균주 (예컨대, 균주 Y3000 내에서)에서 실질적으로 PUFA(%)를 증가시키는 유용한 수단임을 고려한다. 사실, 야로위아 리폴리티카 균주 Y2214 중의 천연 DGAT2 유전자의 파괴 (Δ9 엘론가제/Δ8 데새투라제 경로를 통해 14% ARA를 생산함; 야생형 야로위아 리폴리티카 ATCC #20362에 대한 이 균주의 최종 유전자형은 다음과 같음: Aco2-, Lys5-, 2X GPAT::IgD9e::PEX20, 2X TEF::IgD9e::LIP1, FBAINm::IgD9e::0CT, 2X FBAIN::D8SF::PEX16, GPD::D8SF::PEX16, GPAT::MAΔ5::PEX20, FBAIN::MAΔ5::PEX20, YAT1::I.D5S::LIP1, GPM/FBAIN::I.D5S::OCT, FBAIN::F.D12S::PEX20 및 GPM/FBAIN::rELO2S::OCT)는 ARA(%)를 1.7배 증가시켰다 (데이타는 나타내지 않음).
SEQUENCE LISTING
<110> E.I. du Pont de Nemours and Company
<120> DOCOSAHEXAENOIC ACID PRODUCING STRAINS OF YARROWIA LIPOLYTICA
<130> CL3160 PCT
<140> US 60/624,812
<141> 2004-11-04
<160> 467
<170> PatentIn version 3.3
<210> 1
<211> 1374
<212> DNA
<213> Mortierella alpina AF465281
<220>
<221> misc_feature
<223> delta-6 desaturase
<400> 1
atggctgctg ctcccagtgt gaggacgttt actcgggccg aggttttgaa tgccgaggct 60
ctgaatgagg gcaagaagga tgccgaggca cccttcttga tgatcatcga caacaaggtg 120
tacgatgtcc gcgagttcgt ccctgatcat cccggtggaa gtgtgattct cacgcacgtt 180
ggcaaggacg gcactgacgt ctttgacact tttcaccccg aggctgcttg ggagactctt 240
gccaactttt acgttggtga tattgacgag agcgaccgcg atatcaagaa tgatgacttt 300
gcggccgagg tccgcaagct gcgtaccttg ttccagtctc ttggttacta cgattcttcc 360
aaggcatact acgccttcaa ggtctcgttc aacctctgca tctggggttt gtcgacggtc 420
attgtggcca agtggggcca gacctcgacc ctcgccaacg tgctctcggc tgcgcttttg 480
ggtctgttct ggcagcagtg cggatggttg gctcacgact ttttgcatca ccaggtcttc 540
caggaccgtt tctggggtga tcttttcggc gccttcttgg gaggtgtctg ccagggcttc 600
tcgtcctcgt ggtggaagga caagcacaac actcaccacg ccgcccccaa cgtccacggc 660
gaggatcccg acattgacac ccaccctctg ttgacctgga gtgagcatgc gttggagatg 720
ttctcggatg tcccagatga ggagctgacc cgcatgtggt cgcgtttcat ggtcctgaac 780
cagacctggt tttacttccc cattctctcg tttgcccgtc tctcctggtg cctccagtcc 840
attctctttg tgctgcctaa cggtcaggcc cacaagccct cgggcgcgcg tgtgcccatc 900
tcgttggtcg agcagctgtc gcttgcgatg cactggacct ggtacctcgc caccatgttc 960
ctgttcatca aggatcccgt caacatgctg gtgtactttt tggtgtcgca ggcggtgtgc 1020
ggaaacttgt tggcgatcgt gttctcgctc aaccacaacg gtatgcctgt gatctcgaag 1080
gaggaggcgg tcgatatgga tttcttcacg aagcagatca tcacgggtcg tgatgtccac 1140
ccgggtctat ttgccaactg gttcacgggt ggattgaact atcagatcga gcaccacttg 1200
ttcccttcga tgcctcgcca caacttttca aagatccagc ctgctgtcga gaccctgtgc 1260
aaaaagtaca atgtccgata ccacaccacc ggtatgatcg agggaactgc agaggtcttt 1320
agccgtctga acgaggtctc caaggctacc tccaagatgg gtaaggcgca gtaa 1374
<210> 2
<211> 457
<212> PRT
<213> Mortierella alpina AF465281
<400> 2
Met Ala Ala Ala Pro Ser Val Arg Thr Phe Thr Arg Ala Glu Val Leu
1 5 10 15
Asn Ala Glu Ala Leu Asn Glu Gly Lys Lys Asp Ala Glu Ala Pro Phe
20 25 30
Leu Met Ile Ile Asp Asn Lys Val Tyr Asp Val Arg Glu Phe Val Pro
35 40 45
Asp His Pro Gly Gly Ser Val Ile Leu Thr His Val Gly Lys Asp Gly
50 55 60
Thr Asp Val Phe Asp Thr Phe His Pro Glu Ala Ala Trp Glu Thr Leu
65 70 75 80
Ala Asn Phe Tyr Val Gly Asp Ile Asp Glu Ser Asp Arg Asp Ile Lys
85 90 95
Asn Asp Asp Phe Ala Ala Glu Val Arg Lys Leu Arg Thr Leu Phe Gln
100 105 110
Ser Leu Gly Tyr Tyr Asp Ser Ser Lys Ala Tyr Tyr Ala Phe Lys Val
115 120 125
Ser Phe Asn Leu Cys Ile Trp Gly Leu Ser Thr Val Ile Val Ala Lys
130 135 140
Trp Gly Gln Thr Ser Thr Leu Ala Asn Val Leu Ser Ala Ala Leu Leu
145 150 155 160
Gly Leu Phe Trp Gln Gln Cys Gly Trp Leu Ala His Asp Phe Leu His
165 170 175
His Gln Val Phe Gln Asp Arg Phe Trp Gly Asp Leu Phe Gly Ala Phe
180 185 190
Leu Gly Gly Val Cys Gln Gly Phe Ser Ser Ser Trp Trp Lys Asp Lys
195 200 205
His Asn Thr His His Ala Ala Pro Asn Val His Gly Glu Asp Pro Asp
210 215 220
Ile Asp Thr His Pro Leu Leu Thr Trp Ser Glu His Ala Leu Glu Met
225 230 235 240
Phe Ser Asp Val Pro Asp Glu Glu Leu Thr Arg Met Trp Ser Arg Phe
245 250 255
Met Val Leu Asn Gln Thr Trp Phe Tyr Phe Pro Ile Leu Ser Phe Ala
260 265 270
Arg Leu Ser Trp Cys Leu Gln Ser Ile Leu Phe Val Leu Pro Asn Gly
275 280 285
Gln Ala His Lys Pro Ser Gly Ala Arg Val Pro Ile Ser Leu Val Glu
290 295 300
Gln Leu Ser Leu Ala Met His Trp Thr Trp Tyr Leu Ala Thr Met Phe
305 310 315 320
Leu Phe Ile Lys Asp Pro Val Asn Met Leu Val Tyr Phe Leu Val Ser
325 330 335
Gln Ala Val Cys Gly Asn Leu Leu Ala Ile Val Phe Ser Leu Asn His
340 345 350
Asn Gly Met Pro Val Ile Ser Lys Glu Glu Ala Val Asp Met Asp Phe
355 360 365
Phe Thr Lys Gln Ile Ile Thr Gly Arg Asp Val His Pro Gly Leu Phe
370 375 380
Ala Asn Trp Phe Thr Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu
385 390 395 400
Phe Pro Ser Met Pro Arg His Asn Phe Ser Lys Ile Gln Pro Ala Val
405 410 415
Glu Thr Leu Cys Lys Lys Tyr Asn Val Arg Tyr His Thr Thr Gly Met
420 425 430
Ile Glu Gly Thr Ala Glu Val Phe Ser Arg Leu Asn Glu Val Ser Lys
435 440 445
Ala Thr Ser Lys Met Gly Lys Ala Gln
450 455
<210> 3
<211> 1374
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<223> synthetic delta-6 desaturase (codon-optimized)
<400> 3
atggctgccg ctccctctgt gcgaaccttt acccgagccg aggttctgaa cgctgaggct 60
ctgaacgagg gcaagaagga cgctgaggct cccttcctga tgatcatcga caacaaggtg 120
tacgacgtcc gagagttcgt ccctgaccat cctggaggct ccgtgattct cacccacgtt 180
ggcaaggacg gcaccgacgt ctttgacacc tttcatcccg aggctgcttg ggagactctc 240
gccaacttct acgttggaga cattgacgag tccgaccgag acatcaagaa cgatgacttt 300
gccgctgagg tccgaaagct gcgaaccctg ttccagtctc tcggctacta cgactcctct 360
aaggcctact acgccttcaa ggtctccttc aacctctgca tctggggact gtccaccgtc 420
attgtggcca agtggggtca gacctccacc ctcgccaacg tgctctctgc tgccctgctc 480
ggcctgttct ggcagcagtg cggatggctg gctcacgact ttctgcacca ccaggtcttc 540
caggaccgat tctggggtga tctcttcgga gccttcctgg gaggtgtctg ccagggcttc 600
tcctcttcct ggtggaagga caagcacaac actcaccatg ccgctcccaa cgtgcatggc 660
gaggatcctg acattgacac ccaccctctc ctgacctggt ccgagcacgc tctggagatg 720
ttctccgacg tccccgatga ggagctgacc cgaatgtggt ctcgattcat ggtcctgaac 780
cagacctggt tctacttccc cattctctcc ttcgctcgac tgtcttggtg cctccagtcc 840
attctctttg tgctgcccaa cggtcaggct cacaagccct ccggagctcg agtgcccatc 900
tccctggtcg agcagctgtc cctcgccatg cactggacct ggtacctcgc taccatgttc 960
ctgttcatca aggatcctgt caacatgctc gtgtacttcc tggtgtctca ggctgtgtgc 1020
ggaaacctgc tcgccatcgt gttctccctc aaccacaacg gtatgcctgt gatctccaag 1080
gaggaggctg tcgacatgga tttctttacc aagcagatca tcactggtcg agatgtccat 1140
cctggactgt tcgccaactg gttcaccggt ggcctgaact accagatcga gcatcacctg 1200
ttcccttcca tgcctcgaca caacttctcc aagatccagc ctgccgtcga gaccctgtgc 1260
aagaagtaca acgtccgata ccacaccact ggtatgatcg agggaactgc cgaggtcttc 1320
tcccgactga acgaggtctc caaggccacc tccaagatgg gcaaggctca gtaa 1374
<210> 4
<211> 1521
<212> DNA
<213> Mortierella alpina (GenBank Accession No. AB070555)
<220>
<221> misc_feature
<223> delta-6 desaturase
<400> 4
acaacgtgct cttgtcctca gaagactgtt gtgctcttcc ttccaccacc ccaagcactc 60
tctcacccca agcactgcct gccatgacca ccagcgaccc atctgtcaga gcgttcacac 120
gctcagaagt gttgcacgcc gatgccttga acgagggcaa aaagaacgcc gaggcaccgt 180
ttctcatgat catcgacaac aaggtctacg atgtgcgcga gtttatcccc gaccatcctg 240
gtgggagcgt cattttgacc cacgtaggca aggacggcac cgacgttttc gagaccttcc 300
atcctgaggc tgcttgggag acgctcgcca atttttatgt cggtgacatt gtagaatccg 360
atcgcgccat cgagaacgac gagtttgcag ctgaggttcg taagctgcgg acattgtttt 420
attctttggg ctactacgac tcatccaagg tttactacgc cttcaaggtc tcgttcaacc 480
tctgcatctg gggcctgtct gcattcattg ttgccaaatg gggccagacc tcgaccctcg 540
caaacgtgat atcagcctca ctcctgggtg tcttttggca acagtgcggt tggctcgccc 600
atgatttctt gcaccatcag gtctttcacg atcgattctg gggcgatctg ttcggtgcat 660
ttctcggcgg agtctgtcaa ggtttctcct cgtcctggtg gaaggacaaa cacaacaccc 720
accacgcggc gcccaatgtc catggagagg atcccgatat cgacacacat ccgcttttga 780
cgtggagtga gcatgcgctc gagatgtttt cggatgtgcc cgatgaggag cttacccaaa 840
tgtggtcccg gtttatggtt ctgaaccagg cctggtttta ctttcccatt ctgtcatttg 900
cccgcctgtc ctggtgcatc cagtcgattc tttttgtgct accgaacgga caggcacaca 960
aacctgcggg ggctcgggtt cccatctcgc tggtggagca attgtcgttg gcgatgcact 1020
ggacctggta cctggcaacc atgttcctgt tcatcaagga tcccgtcaac atgatggtgt 1080
atttcttggt ctcgcaagct gtctgcggca acctgttagc gattgtgttc tcgctgaacc 1140
ataacggtat gcctgtgatc tcgcaggagg aagcggtcga gatggatttc ttcacaaagc 1200
agatcattac gggtcgtgat gtctacccgg gttggtttgc agactggttc acgggtggat 1260
tgaactatca gattgaacac catctgttcc cgtcgatgcc tcgacaccat ttctcaaaga 1320
tccagcccgc ggttgaatcg ctgtgcaaga agtacggggt ccgataccat acgacgggga 1380
tgattgctgg caccgcagag gtcttttcgc gactgaacga ggtgtcccag gctgcaagca 1440
agctcggcaa gtctgcttga gtctttcatg tcctcaagtt gattctagat acttattttc 1500
gcagacttct atcgataaat t 1521
<210> 5
<211> 458
<212> PRT
<213> Mortierella alpina (GenBank Accession No. AB070555)
<400> 5
Met Thr Thr Ser Asp Pro Ser Val Arg Ala Phe Thr Arg Ser Glu Val
1 5 10 15
Leu His Ala Asp Ala Leu Asn Glu Gly Lys Lys Asn Ala Glu Ala Pro
20 25 30
Phe Leu Met Ile Ile Asp Asn Lys Val Tyr Asp Val Arg Glu Phe Ile
35 40 45
Pro Asp His Pro Gly Gly Ser Val Ile Leu Thr His Val Gly Lys Asp
50 55 60
Gly Thr Asp Val Phe Glu Thr Phe His Pro Glu Ala Ala Trp Glu Thr
65 70 75 80
Leu Ala Asn Phe Tyr Val Gly Asp Ile Val Glu Ser Asp Arg Ala Ile
85 90 95
Glu Asn Asp Glu Phe Ala Ala Glu Val Arg Lys Leu Arg Thr Leu Phe
100 105 110
Tyr Ser Leu Gly Tyr Tyr Asp Ser Ser Lys Val Tyr Tyr Ala Phe Lys
115 120 125
Val Ser Phe Asn Leu Cys Ile Trp Gly Leu Ser Ala Phe Ile Val Ala
130 135 140
Lys Trp Gly Gln Thr Ser Thr Leu Ala Asn Val Ile Ser Ala Ser Leu
145 150 155 160
Leu Gly Val Phe Trp Gln Gln Cys Gly Trp Leu Ala His Asp Phe Leu
165 170 175
His His Gln Val Phe His Asp Arg Phe Trp Gly Asp Leu Phe Gly Ala
180 185 190
Phe Leu Gly Gly Val Cys Gln Gly Phe Ser Ser Ser Trp Trp Lys Asp
195 200 205
Lys His Asn Thr His His Ala Ala Pro Asn Val His Gly Glu Asp Pro
210 215 220
Asp Ile Asp Thr His Pro Leu Leu Thr Trp Ser Glu His Ala Leu Glu
225 230 235 240
Met Phe Ser Asp Val Pro Asp Glu Glu Leu Thr Gln Met Trp Ser Arg
245 250 255
Phe Met Val Leu Asn Gln Ala Trp Phe Tyr Phe Pro Ile Leu Ser Phe
260 265 270
Ala Arg Leu Ser Trp Cys Ile Gln Ser Ile Leu Phe Val Leu Pro Asn
275 280 285
Gly Gln Ala His Lys Pro Ala Gly Ala Arg Val Pro Ile Ser Leu Val
290 295 300
Glu Gln Leu Ser Leu Ala Met His Trp Thr Trp Tyr Leu Ala Thr Met
305 310 315 320
Phe Leu Phe Ile Lys Asp Pro Val Asn Met Met Val Tyr Phe Leu Val
325 330 335
Ser Gln Ala Val Cys Gly Asn Leu Leu Ala Ile Val Phe Ser Leu Asn
340 345 350
His Asn Gly Met Pro Val Ile Ser Gln Glu Glu Ala Val Glu Met Asp
355 360 365
Phe Phe Thr Lys Gln Ile Ile Thr Gly Arg Asp Val Tyr Pro Gly Trp
370 375 380
Phe Ala Asp Trp Phe Thr Gly Gly Leu Asn Tyr Gln Ile Glu His His
385 390 395 400
Leu Phe Pro Ser Met Pro Arg His His Phe Ser Lys Ile Gln Pro Ala
405 410 415
Val Glu Ser Leu Cys Lys Lys Tyr Gly Val Arg Tyr His Thr Thr Gly
420 425 430
Met Ile Ala Gly Thr Ala Glu Val Phe Ser Arg Leu Asn Glu Val Ser
435 440 445
Gln Ala Ala Ser Lys Leu Gly Lys Ser Ala
450 455
<210> 6
<211> 1341
<212> DNA
<213> Mortierella alpina AF067654
<220>
<221> misc_feature
<223> delta-5 desaturase
<400> 6
atgggaacgg accaaggaaa aaccttcacc tgggaagagc tggcggccca taacaccaag 60
gacgacctac tcttggccat ccgcggcagg gtgtacgatg tcacaaagtt cttgagccgc 120
catcctggtg gagtggacac tctcctgctc ggagctggcc gagatgttac tccggtcttt 180
gagatgtatc acgcgtttgg ggctgcagat gccattatga agaagtacta tgtcggtaca 240
ctggtctcga atgagctgcc catcttcccg gagccaacgg tgttccacaa aaccatcaag 300
acgagagtcg agggctactt tacggatcgg aacattgatc ccaagaatag accagagatc 360
tggggacgat acgctcttat ctttggatcc ttgatcgctt cctactacgc gcagctcttt 420
gtgcctttcg ttgtcgaacg cacatggctt caggtggtgt ttgcaatcat catgggattt 480
gcgtgcgcac aagtcggact caaccctctt catgatgcgt ctcacttttc agtgacccac 540
aaccccactg tctggaagat tctgggagcc acgcacgact ttttcaacgg agcatcgtac 600
ctggtgtgga tgtaccaaca tatgctcggc catcacccct acaccaacat tgctggagca 660
gatcccgacg tgtcgacgtc tgagcccgat gttcgtcgta tcaagcccaa ccaaaagtgg 720
tttgtcaacc acatcaacca gcacatgttt gttcctttcc tgtacggact gctggcgttc 780
aaggtgcgca ttcaggacat caacattttg tactttgtca agaccaatga cgctattcgt 840
gtcaatccca tctcgacatg gcacactgtg atgttctggg gcggcaaggc tttctttgtc 900
tggtatcgcc tgattgttcc cctgcagtat ctgcccctgg gcaaggtgct gctcttgttc 960
acggtcgcgg acatggtgtc gtcttactgg ctggcgctga ccttccaggc gaaccacgtt 1020
gttgaggaag ttcagtggcc gttgcctgac gagaacggga tcatccaaaa ggactgggca 1080
gctatgcagg tcgagactac gcaggattac gcacacgatt cgcacctctg gaccagcatc 1140
actggcagct tgaactacca ggctgtgcac catctgttcc ccaacgtgtc gcagcaccat 1200
tatcccgata ttctggccat catcaagaac acctgcagcg agtacaaggt tccatacctt 1260
gtcaaggata cgttttggca agcatttgct tcacatttgg agcacttgcg tgttcttgga 1320
ctccgtccca aggaagagta g 1341
<210> 7
<211> 446
<212> PRT
<213> Mortierella alpina AF067654
<400> 7
Met Gly Thr Asp Gln Gly Lys Thr Phe Thr Trp Glu Glu Leu Ala Ala
1 5 10 15
His Asn Thr Lys Asp Asp Leu Leu Leu Ala Ile Arg Gly Arg Val Tyr
20 25 30
Asp Val Thr Lys Phe Leu Ser Arg His Pro Gly Gly Val Asp Thr Leu
35 40 45
Leu Leu Gly Ala Gly Arg Asp Val Thr Pro Val Phe Glu Met Tyr His
50 55 60
Ala Phe Gly Ala Ala Asp Ala Ile Met Lys Lys Tyr Tyr Val Gly Thr
65 70 75 80
Leu Val Ser Asn Glu Leu Pro Ile Phe Pro Glu Pro Thr Val Phe His
85 90 95
Lys Thr Ile Lys Thr Arg Val Glu Gly Tyr Phe Thr Asp Arg Asn Ile
100 105 110
Asp Pro Lys Asn Arg Pro Glu Ile Trp Gly Arg Tyr Ala Leu Ile Phe
115 120 125
Gly Ser Leu Ile Ala Ser Tyr Tyr Ala Gln Leu Phe Val Pro Phe Val
130 135 140
Val Glu Arg Thr Trp Leu Gln Val Val Phe Ala Ile Ile Met Gly Phe
145 150 155 160
Ala Cys Ala Gln Val Gly Leu Asn Pro Leu His Asp Ala Ser His Phe
165 170 175
Ser Val Thr His Asn Pro Thr Val Trp Lys Ile Leu Gly Ala Thr His
180 185 190
Asp Phe Phe Asn Gly Ala Ser Tyr Leu Val Trp Met Tyr Gln His Met
195 200 205
Leu Gly His His Pro Tyr Thr Asn Ile Ala Gly Ala Asp Pro Asp Val
210 215 220
Ser Thr Ser Glu Pro Asp Val Arg Arg Ile Lys Pro Asn Gln Lys Trp
225 230 235 240
Phe Val Asn His Ile Asn Gln His Met Phe Val Pro Phe Leu Tyr Gly
245 250 255
Leu Leu Ala Phe Lys Val Arg Ile Gln Asp Ile Asn Ile Leu Tyr Phe
260 265 270
Val Lys Thr Asn Asp Ala Ile Arg Val Asn Pro Ile Ser Thr Trp His
275 280 285
Thr Val Met Phe Trp Gly Gly Lys Ala Phe Phe Val Trp Tyr Arg Leu
290 295 300
Ile Val Pro Leu Gln Tyr Leu Pro Leu Gly Lys Val Leu Leu Leu Phe
305 310 315 320
Thr Val Ala Asp Met Val Ser Ser Tyr Trp Leu Ala Leu Thr Phe Gln
325 330 335
Ala Asn His Val Val Glu Glu Val Gln Trp Pro Leu Pro Asp Glu Asn
340 345 350
Gly Ile Ile Gln Lys Asp Trp Ala Ala Met Gln Val Glu Thr Thr Gln
355 360 365
Asp Tyr Ala His Asp Ser His Leu Trp Thr Ser Ile Thr Gly Ser Leu
370 375 380
Asn Tyr Gln Ala Val His His Leu Phe Pro Asn Val Ser Gln His His
385 390 395 400
Tyr Pro Asp Ile Leu Ala Ile Ile Lys Asn Thr Cys Ser Glu Tyr Lys
405 410 415
Val Pro Tyr Leu Val Lys Asp Thr Phe Trp Gln Ala Phe Ala Ser His
420 425 430
Leu Glu His Leu Arg Val Leu Gly Leu Arg Pro Lys Glu Glu
435 440 445
<210> 8
<211> 1329
<212> DNA
<213> Isochrysis galbana CCMP1323
<220>
<221> misc_feature
<223> delta-5 desaturase
<400> 8
atggtggcag gcaaatcagg cgctgcggcg cacgtgactc acagctcgac attgccccgt 60
gagtaccatg gcgcgaccaa cgactcgcgc tctgaggcgg ccgacgtcac cgtctctagc 120
atcgatgctg aaaaggagat gatcatcaac ggccgcgtgt atgacgtgtc gtcatttgtg 180
aagcggcacc caggtggctc ggtgatcaag ttccagctgg gcgccgacgc gagcgacgcg 240
tacaacaact ttcacgtccg ctccaagaag gcggacaaga tgctgtattc gctcccgtcc 300
cggccggccg aggccggcta cgcccaggac gacatctccc gcgactttga gaagctgcgc 360
ctcgagctga aggaggaggg ctacttcgag cccaacctgg tgcacgtgag ctacaggtgt 420
gtggaggttc ttgccatgta ctgggctggc gtccagctca tctggtccgg gtactggttc 480
ctcggcgcga tcgtggccgg cattgcgcag ggccgctgcg gctggctcca gcatgagggt 540
gggcactact cgctcaccgg caacatcaag atcgaccggc atctgcagat ggccatctat 600
gggcttggct gcggcatgtc gggctgctac tggcgcaacc agcacaacaa gcaccacgcc 660
acgccgcaga agctcgggac cgaccccgac ctgcagacga tgccgctggt ggccttccac 720
aagatcgtcg gcgccaaggc gcgaggcaag ggcaaggcgt ggctggcgtg gcaggcgccg 780
ctcttctttg gcgggatcat ctgctcgctc gtctctttcg gctggcagtt cgtgctccac 840
cccaaccacg cgctgcgcgt gcacaatcac ctggagctcg cgtacatggg cctgcggtac 900
gtgctgtggc acctggcctt tggccacctc gggctgctga gctcgctccg cctgtacgcc 960
ttttacgtgg ccgtgggcgg cacctacatc ttcaccaact tcgccgtctc gcacacccac 1020
aaggacgtcg tcccgcccac caagcacatc tcgtgggcac tctactcggc caaccacacg 1080
accaactgct ccgactcgcc ctttgtcaac tggtggatgg cctacctcaa cttccagatc 1140
gagcaccacc tcttcccgtc gatgccgcag tacaaccacc ccaagatcgc cccgcgggtg 1200
cgcgcgctct tcgagaagca cggggtcgag tatgacgtcc ggccatacct ggagtgtttt 1260
cgggtcacgt acgtcaacct gctcgccgta ggcaacccgg agcactccta ccacgagcac 1320
acgcactag 1329
<210> 9
<211> 442
<212> PRT
<213> Isochrysis galbana CCMP1323
<400> 9
Met Val Ala Gly Lys Ser Gly Ala Ala Ala His Val Thr His Ser Ser
1 5 10 15
Thr Leu Pro Arg Glu Tyr His Gly Ala Thr Asn Asp Ser Arg Ser Glu
20 25 30
Ala Ala Asp Val Thr Val Ser Ser Ile Asp Ala Glu Lys Glu Met Ile
35 40 45
Ile Asn Gly Arg Val Tyr Asp Val Ser Ser Phe Val Lys Arg His Pro
50 55 60
Gly Gly Ser Val Ile Lys Phe Gln Leu Gly Ala Asp Ala Ser Asp Ala
65 70 75 80
Tyr Asn Asn Phe His Val Arg Ser Lys Lys Ala Asp Lys Met Leu Tyr
85 90 95
Ser Leu Pro Ser Arg Pro Ala Glu Ala Gly Tyr Ala Gln Asp Asp Ile
100 105 110
Ser Arg Asp Phe Glu Lys Leu Arg Leu Glu Leu Lys Glu Glu Gly Tyr
115 120 125
Phe Glu Pro Asn Leu Val His Val Ser Tyr Arg Cys Val Glu Val Leu
130 135 140
Ala Met Tyr Trp Ala Gly Val Gln Leu Ile Trp Ser Gly Tyr Trp Phe
145 150 155 160
Leu Gly Ala Ile Val Ala Gly Ile Ala Gln Gly Arg Cys Gly Trp Leu
165 170 175
Gln His Glu Gly Gly His Tyr Ser Leu Thr Gly Asn Ile Lys Ile Asp
180 185 190
Arg His Leu Gln Met Ala Ile Tyr Gly Leu Gly Cys Gly Met Ser Gly
195 200 205
Cys Tyr Trp Arg Asn Gln His Asn Lys His His Ala Thr Pro Gln Lys
210 215 220
Leu Gly Thr Asp Pro Asp Leu Gln Thr Met Pro Leu Val Ala Phe His
225 230 235 240
Lys Ile Val Gly Ala Lys Ala Arg Gly Lys Gly Lys Ala Trp Leu Ala
245 250 255
Trp Gln Ala Pro Leu Phe Phe Gly Gly Ile Ile Cys Ser Leu Val Ser
260 265 270
Phe Gly Trp Gln Phe Val Leu His Pro Asn His Ala Leu Arg Val His
275 280 285
Asn His Leu Glu Leu Ala Tyr Met Gly Leu Arg Tyr Val Leu Trp His
290 295 300
Leu Ala Phe Gly His Leu Gly Leu Leu Ser Ser Leu Arg Leu Tyr Ala
305 310 315 320
Phe Tyr Val Ala Val Gly Gly Thr Tyr Ile Phe Thr Asn Phe Ala Val
325 330 335
Ser His Thr His Lys Asp Val Val Pro Pro Thr Lys His Ile Ser Trp
340 345 350
Ala Leu Tyr Ser Ala Asn His Thr Thr Asn Cys Ser Asp Ser Pro Phe
355 360 365
Val Asn Trp Trp Met Ala Tyr Leu Asn Phe Gln Ile Glu His His Leu
370 375 380
Phe Pro Ser Met Pro Gln Tyr Asn His Pro Lys Ile Ala Pro Arg Val
385 390 395 400
Arg Ala Leu Phe Glu Lys His Gly Val Glu Tyr Asp Val Arg Pro Tyr
405 410 415
Leu Glu Cys Phe Arg Val Thr Tyr Val Asn Leu Leu Ala Val Gly Asn
420 425 430
Pro Glu His Ser Tyr His Glu His Thr His
435 440
<210> 10
<211> 1329
<212> DNA
<213> Isochrysis galbana
<220>
<221> misc_feature
<223> synthetic delta-5 desaturase (codon-optimized)
<400> 10
atggtcgctg gcaagtccgg agctgcagcc cacgtgaccc actcttccac tctccctcga 60
gagtaccacg gtgctaccaa cgactcccga tctgaggctg ccgatgtcac cgtctcgtct 120
atcgacgccg agaaggagat gattatcaac ggacgagtgt acgacgtctc ctcgttcgtg 180
aagcgacacc ctggtggctc cgtcatcaag ttccagctcg gagcagatgc ttctgacgct 240
tacaacaact tccacgtccg atcgaagaag gctgacaaga tgctgtactc tcttccctcc 300
cgacctgccg aggctggcta tgcacaggac gacatctcta gagactttga gaagctgcga 360
ctggaactga aagaggaagg ttacttcgag cccaatctgg tgcacgtgtc ctaccgatgt 420
gtcgaggtgc ttgccatgta ctgggctggc gtccagctga tctggtccgg atactggttc 480
ctcggtgcca tcgttgctgg aattgctcaa ggtcgatgcg gatggctcca gcatgaaggc 540
ggacactact cgctcactgg caacatcaag attgaccgac atctccagat ggccatctat 600
ggactgggct gtggtatgtc tggctgctac tggagaaacc agcacaacaa acatcacgcc 660
actcctcaga agctcggaac cgatcccgac ctgcagacca tgcctctcgt tgccttccac 720
aagattgtcg gagccaaggc acgaggcaag ggtaaagcct ggcttgcttg gcaagctccc 780
ctcttctttg gaggcatcat ttgctccctg gtctctttcg gctggcagtt cgttctccac 840
cccaatcatg cactgcgagt gcacaaccat ctcgaactgg cctacatggg tctccgatac 900
gttctctggc accttgcctt tggccatctg ggactcctgt cctctcttcg actgtatgcc 960
ttctacgtgg ctgtcggtgg cacctacatc ttcaccaact tcgccgtctc ccatactcac 1020
aaggatgtcg ttcctcccac caagcacatt tcgtgggctc tgtactctgc caaccacact 1080
accaactgtt ccgactctcc ctttgtcaac tggtggatgg cctacctcaa cttccagatc 1140
gagcaccatc tgttcccctc catgcctcag tacaaccacc ccaagattgc tcctcgagtg 1200
cgagcactct tcgagaagca cggagtcgag tacgacgtcc gaccctatct ggaatgcttt 1260
cgagtgacct acgtcaacct ccttgctgtt ggcaaccctg agcactccta ccacgagcat 1320
actcactaa 1329
<210> 11
<211> 1335
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> delta-5 desaturase
<400> 11
atggcccccg acccggtggc cgccgagacc gcggctcagg gacctacccc gcgctacttc 60
acctgggacg aggtggccca gcgctcaggg tgcgaggagc ggtggctagt gatcgaccgt 120
aaggtgtaca acatcagcga gttcacccgc cggcatccag ggggctcccg ggtcatcagc 180
cactacgccg ggcaggatgc cacggatccc tttgtggcct tccacatcaa caagggcctt 240
gtgaagaagt atatgaactc tctcctgatt ggagaactgt ctccagagca gcccagcttt 300
gagcccacca agaataaaga gctgacagat gagttccggg agctgcgggc cacagtggag 360
cggatggggc tcatgaaggc caaccatgtc ttcttcctgc tgtacctgct gcacatcttg 420
ctgctggatg gtgcagcctg gctcaccctt tgggtctttg ggacgtcctt tttgcccttc 480
ctcctctgtg cggtgctgct cagtgcagtt caggcccagg ctggctggct gcagcatgac 540
tttgggcacc tgtcggtctt cagcacctca aagtggaacc atctgctaca tcattttgtg 600
attggccacc tgaagggggc ccccgccagt tggtggaacc acatgcactt ccagcaccat 660
gccaagccca actgcttccg caaagaccca gacatcaaca tgcatccctt cttctttgcc 720
ttggggaaga tcctctctgt ggagcttggg aaacagaaga aaaaatatat gccgtacaac 780
caccagcaca aatacttctt cctaattggg cccccagcct tgctgcctct ctacttccag 840
tggtatattt tctattttgt tatccagcga aagaagtggg tggacttggc ctggatgatt 900
accttctacg tccgcttctt cctcacttat gtgccactat tggggctgaa agccttcctg 960
ggccttttct tcatagtcag gttcctggaa agcaactggt ttgtgtgggt gacacagatg 1020
aaccatattc ccatgcacat tgatcatgac cggaacatgg actgggtttc cacccagctc 1080
caggccacat gcaatgtcca caagtctgcc ttcaatgact ggttcagtgg acacctcaac 1140
ttccagattg agcaccatct ttttcccacg atgcctcgac acaattacca caaagtggct 1200
cccctggtgc agtccttgtg tgccaagcat ggcatagagt accagtccaa gcccctgctg 1260
tcagccttcg ccgacatcat ccactcacta aaggagtcag ggcagctctg gctagatgcc 1320
tatcttcacc aataa 1335
<210> 12
<211> 444
<212> PRT
<213> Homo sapiens
<400> 12
Met Ala Pro Asp Pro Val Ala Ala Glu Thr Ala Ala Gln Gly Pro Thr
1 5 10 15
Pro Arg Tyr Phe Thr Trp Asp Glu Val Ala Gln Arg Ser Gly Cys Glu
20 25 30
Glu Arg Trp Leu Val Ile Asp Arg Lys Val Tyr Asn Ile Ser Glu Phe
35 40 45
Thr Arg Arg His Pro Gly Gly Ser Arg Val Ile Ser His Tyr Ala Gly
50 55 60
Gln Asp Ala Thr Asp Pro Phe Val Ala Phe His Ile Asn Lys Gly Leu
65 70 75 80
Val Lys Lys Tyr Met Asn Ser Leu Leu Ile Gly Glu Leu Ser Pro Glu
85 90 95
Gln Pro Ser Phe Glu Pro Thr Lys Asn Lys Glu Leu Thr Asp Glu Phe
100 105 110
Arg Glu Leu Arg Ala Thr Val Glu Arg Met Gly Leu Met Lys Ala Asn
115 120 125
His Val Phe Phe Leu Leu Tyr Leu Leu His Ile Leu Leu Leu Asp Gly
130 135 140
Ala Ala Trp Leu Thr Leu Trp Val Phe Gly Thr Ser Phe Leu Pro Phe
145 150 155 160
Leu Leu Cys Ala Val Leu Leu Ser Ala Val Gln Ala Gln Ala Gly Trp
165 170 175
Leu Gln His Asp Phe Gly His Leu Ser Val Phe Ser Thr Ser Lys Trp
180 185 190
Asn His Leu Leu His His Phe Val Ile Gly His Leu Lys Gly Ala Pro
195 200 205
Ala Ser Trp Trp Asn His Met His Phe Gln His His Ala Lys Pro Asn
210 215 220
Cys Phe Arg Lys Asp Pro Asp Ile Asn Met His Pro Phe Phe Phe Ala
225 230 235 240
Leu Gly Lys Ile Leu Ser Val Glu Leu Gly Lys Gln Lys Lys Lys Tyr
245 250 255
Met Pro Tyr Asn His Gln His Lys Tyr Phe Phe Leu Ile Gly Pro Pro
260 265 270
Ala Leu Leu Pro Leu Tyr Phe Gln Trp Tyr Ile Phe Tyr Phe Val Ile
275 280 285
Gln Arg Lys Lys Trp Val Asp Leu Ala Trp Met Ile Thr Phe Tyr Val
290 295 300
Arg Phe Phe Leu Thr Tyr Val Pro Leu Leu Gly Leu Lys Ala Phe Leu
305 310 315 320
Gly Leu Phe Phe Ile Val Arg Phe Leu Glu Ser Asn Trp Phe Val Trp
325 330 335
Val Thr Gln Met Asn His Ile Pro Met His Ile Asp His Asp Arg Asn
340 345 350
Met Asp Trp Val Ser Thr Gln Leu Gln Ala Thr Cys Asn Val His Lys
355 360 365
Ser Ala Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
His His Leu Phe Pro Thr Met Pro Arg His Asn Tyr His Lys Val Ala
385 390 395 400
Pro Leu Val Gln Ser Leu Cys Ala Lys His Gly Ile Glu Tyr Gln Ser
405 410 415
Lys Pro Leu Leu Ser Ala Phe Ala Asp Ile Ile His Ser Leu Lys Glu
420 425 430
Ser Gly Gln Leu Trp Leu Asp Ala Tyr Leu His Gln
435 440
<210> 13
<211> 1335
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> synthetic delta-5 desaturase (codon-optimized)
<400> 13
atggctcccg accctgtcgc tgccgagacc gctgcccagg gtcccactcc ccgatacttc 60
acctgggacg aggtcgccca gcgatccggt tgcgaggaac gatggctggt catcgaccga 120
aaggtgtaca acatctctga gttcacccga cgacatcccg gtggctcccg agtgatctcg 180
cactacgctg gacaggacgc cactgacccc ttcgttgcct ttcacattaa caagggcctg 240
gttaagaagt acatgaactc cctgctcatt ggagagctgt ctcccgaaca gccttcgttt 300
gagcctacca agaacaagga gctgaccgac gagtttcgag agctccgagc caccgttgag 360
cgaatgggac tgatgaaggc caaccatgtc ttctttctgc tctacctgct ccacattctt 420
ctccttgacg gagctgcctg gcttaccctg tgggtcttcg gcacttcctt tctgcccttt 480
cttctctgcg ccgtcctgct ctctgccgtg caggctcagg ctggttggct tcagcatgac 540
tttggtcacc tttccgtgtt ctctacctcc aagtggaacc acctgctcca tcacttcgtg 600
atcggccacc tcaagggtgc tcctgcctcg tggtggaacc acatgcattt ccagcaccat 660
gccaagccca actgttttcg aaaggatccc gacatcaaca tgcacccctt ctttttcgct 720
cttggcaaga tcctgtccgt cgagctcgga aagcagaaga agaagtacat gccctacaac 780
caccagcaca agtacttctt cctgattgga cctcccgctc tcctgcctct ttactttcag 840
tggtacatct tttactttgt tattcagcga aagaagtggg ttgatcttgc ctggatgatc 900
accttctacg tccgattctt cctgacctac gtccctctcc ttggactgaa ggcctttctc 960
ggtctgttct ttatcgtccg attcctggag tccaactggt tcgtgtgggt gacccagatg 1020
aaccacattc ccatgcacat tgaccatgat cgaaacatgg actgggtgtc gactcagctg 1080
caggccacct gcaacgttca caagtctgct ttcaacgact ggttttccgg tcacctcaac 1140
tttcagattg agcaccatct gtttcccacc atgcctcgac acaactacca caaggttgct 1200
cccctggtcc agtcgctctg tgccaagcat ggcatcgagt accagtccaa gcccctgctc 1260
tctgccttcg ctgacatcat tcactcgctg aaggaatctg gccagctctg gctcgatgcc 1320
tacctgcacc agtaa 1335
<210> 14
<211> 1590
<212> DNA
<213> Danio rerio (GenBank Accession No. AF309556)
<220>
<221> CDS
<222> (1)..(1335)
<220>
<221> misc_feature
<222> (1)..(1335)
<223> Drd6/d5(V)
<400> 14
atg ggt ggc gga gga cag cag aca gac cga atc acc gac acc aac ggc 48
Met Gly Gly Gly Gly Gln Gln Thr Asp Arg Ile Thr Asp Thr Asn Gly
1 5 10 15
aga ttc agc agc tac acc tgg gag gag gtg cag aaa cac acc aaa cat 96
Arg Phe Ser Ser Tyr Thr Trp Glu Glu Val Gln Lys His Thr Lys His
20 25 30
gga gat cag tgg gtg gtg gtg gag agg aag gtt tat aac gtc agc cag 144
Gly Asp Gln Trp Val Val Val Glu Arg Lys Val Tyr Asn Val Ser Gln
35 40 45
tgg gtg aag aga cac ccc gga gga ctg agg atc ctc gga cac tat gct 192
Trp Val Lys Arg His Pro Gly Gly Leu Arg Ile Leu Gly His Tyr Ala
50 55 60
gga gaa gac gcc acg gag gcg ttc act gcg ttt cat cca aac ctt cag 240
Gly Glu Asp Ala Thr Glu Ala Phe Thr Ala Phe His Pro Asn Leu Gln
65 70 75 80
ctg gtg agg aaa tac ctg aag ccg ctg cta atc gga gag ctg gag gcg 288
Leu Val Arg Lys Tyr Leu Lys Pro Leu Leu Ile Gly Glu Leu Glu Ala
85 90 95
tct gaa ccc agt cag gac cgg cag aaa aac gct gct ctc gtg gag gat 336
Ser Glu Pro Ser Gln Asp Arg Gln Lys Asn Ala Ala Leu Val Glu Asp
100 105 110
ttc cga gcc ctg cgt gag cgt ctg gag gct gaa ggc tgt ttt aaa acg 384
Phe Arg Ala Leu Arg Glu Arg Leu Glu Ala Glu Gly Cys Phe Lys Thr
115 120 125
cag ccg ctg ttt ttc gct ctg cat ttg ggc cac att ctg ctc ctg gag 432
Gln Pro Leu Phe Phe Ala Leu His Leu Gly His Ile Leu Leu Leu Glu
130 135 140
gcc atc gct ttc atg atg gtg tgg tat ttc ggc acc ggt tgg atc aac 480
Ala Ile Ala Phe Met Met Val Trp Tyr Phe Gly Thr Gly Trp Ile Asn
145 150 155 160
acg ctc atc gtc gct gtt att ctg gct act gca cag tca caa gct gga 528
Thr Leu Ile Val Ala Val Ile Leu Ala Thr Ala Gln Ser Gln Ala Gly
165 170 175
tgg ttg cag cat gac ttc ggt cat ctg tcc gtg ttt aaa acc tct gga 576
Trp Leu Gln His Asp Phe Gly His Leu Ser Val Phe Lys Thr Ser Gly
180 185 190
atg aat cat ttg gtg cac aaa ttt gtc atc gga cac ctg aag gga gcg 624
Met Asn His Leu Val His Lys Phe Val Ile Gly His Leu Lys Gly Ala
195 200 205
tct gcg ggc tgg tgg aac cat cgg cac ttc cag cat cac gct aaa ccc 672
Ser Ala Gly Trp Trp Asn His Arg His Phe Gln His His Ala Lys Pro
210 215 220
aac atc ttc aag aag gac ccg gac gtc aac atg ctg aac gcc ttt gtg 720
Asn Ile Phe Lys Lys Asp Pro Asp Val Asn Met Leu Asn Ala Phe Val
225 230 235 240
gtg gga aac gtg cag ccc gtg gag tat ggc gtt aag aag atc aag cat 768
Val Gly Asn Val Gln Pro Val Glu Tyr Gly Val Lys Lys Ile Lys His
245 250 255
ctg ccc tac aac cat cag cac aag tac ttc ttc ttc att ggt cct ccc 816
Leu Pro Tyr Asn His Gln His Lys Tyr Phe Phe Phe Ile Gly Pro Pro
260 265 270
ctg ctc atc cca gtg tat ttc cag ttc caa atc ttt cac aat atg atc 864
Leu Leu Ile Pro Val Tyr Phe Gln Phe Gln Ile Phe His Asn Met Ile
275 280 285
agt cat ggc atg tgg gtg gac ctg ctg tgg tgt atc agc tac tac gtc 912
Ser His Gly Met Trp Val Asp Leu Leu Trp Cys Ile Ser Tyr Tyr Val
290 295 300
cga tac ttc ctt tgt tac acg cag ttc tac ggc gtc ttt tgg gct att 960
Arg Tyr Phe Leu Cys Tyr Thr Gln Phe Tyr Gly Val Phe Trp Ala Ile
305 310 315 320
atc ctc ttt aat ttc gtc agg ttt atg gag agc cac tgg ttt gtt tgg 1008
Ile Leu Phe Asn Phe Val Arg Phe Met Glu Ser His Trp Phe Val Trp
325 330 335
gtc aca cag atg agc cac atc ccc atg aac att gac tat gag aaa aat 1056
Val Thr Gln Met Ser His Ile Pro Met Asn Ile Asp Tyr Glu Lys Asn
340 345 350
cag gac tgg ctc agc atg cag ctg gtc gcg acc tgt aac atc gag cag 1104
Gln Asp Trp Leu Ser Met Gln Leu Val Ala Thr Cys Asn Ile Glu Gln
355 360 365
tct gcc ttc aac gac tgg ttc agc gga cac ctc aac ttc cag atc gag 1152
Ser Ala Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
cat cat ctc ttt ccc aca gtg cct cgg cac aac tac tgg cgc gcc gct 1200
His His Leu Phe Pro Thr Val Pro Arg His Asn Tyr Trp Arg Ala Ala
385 390 395 400
cca cgg gtg cga gcg ttg tgt gag aaa tac gga gtc aaa tac caa gag 1248
Pro Arg Val Arg Ala Leu Cys Glu Lys Tyr Gly Val Lys Tyr Gln Glu
405 410 415
aag acc ttg tac gga gca ttt gcg gat atc att agg tct ttg gag aaa 1296
Lys Thr Leu Tyr Gly Ala Phe Ala Asp Ile Ile Arg Ser Leu Glu Lys
420 425 430
tct ggc gag ctc tgg ctg gat gcg tat ctc aac aaa taa agcatgactt 1345
Ser Gly Glu Leu Trp Leu Asp Ala Tyr Leu Asn Lys
435 440
ctccctaaat agaaaaaaag cggagccgaa tcctccaatc agagcgagcc ttcacagact 1405
agacatcagg aagaatcgcg actaaacccc cagtcaatca gttcagtaaa atgacgcgta 1465
gcactttgtt ttttgatatc tgcaagataa ttgtggcact ttgaatgcgt tttaaagaga 1525
cggctcaaag atgtgtgtct cgctcctaat aaaggaagaa tctgaaagga aaaaaaaaaa 1585
aaaaa 1590
<210> 15
<211> 444
<212> PRT
<213> Danio rerio (GenBank Accession No. AF309556)
<400> 15
Met Gly Gly Gly Gly Gln Gln Thr Asp Arg Ile Thr Asp Thr Asn Gly
1 5 10 15
Arg Phe Ser Ser Tyr Thr Trp Glu Glu Val Gln Lys His Thr Lys His
20 25 30
Gly Asp Gln Trp Val Val Val Glu Arg Lys Val Tyr Asn Val Ser Gln
35 40 45
Trp Val Lys Arg His Pro Gly Gly Leu Arg Ile Leu Gly His Tyr Ala
50 55 60
Gly Glu Asp Ala Thr Glu Ala Phe Thr Ala Phe His Pro Asn Leu Gln
65 70 75 80
Leu Val Arg Lys Tyr Leu Lys Pro Leu Leu Ile Gly Glu Leu Glu Ala
85 90 95
Ser Glu Pro Ser Gln Asp Arg Gln Lys Asn Ala Ala Leu Val Glu Asp
100 105 110
Phe Arg Ala Leu Arg Glu Arg Leu Glu Ala Glu Gly Cys Phe Lys Thr
115 120 125
Gln Pro Leu Phe Phe Ala Leu His Leu Gly His Ile Leu Leu Leu Glu
130 135 140
Ala Ile Ala Phe Met Met Val Trp Tyr Phe Gly Thr Gly Trp Ile Asn
145 150 155 160
Thr Leu Ile Val Ala Val Ile Leu Ala Thr Ala Gln Ser Gln Ala Gly
165 170 175
Trp Leu Gln His Asp Phe Gly His Leu Ser Val Phe Lys Thr Ser Gly
180 185 190
Met Asn His Leu Val His Lys Phe Val Ile Gly His Leu Lys Gly Ala
195 200 205
Ser Ala Gly Trp Trp Asn His Arg His Phe Gln His His Ala Lys Pro
210 215 220
Asn Ile Phe Lys Lys Asp Pro Asp Val Asn Met Leu Asn Ala Phe Val
225 230 235 240
Val Gly Asn Val Gln Pro Val Glu Tyr Gly Val Lys Lys Ile Lys His
245 250 255
Leu Pro Tyr Asn His Gln His Lys Tyr Phe Phe Phe Ile Gly Pro Pro
260 265 270
Leu Leu Ile Pro Val Tyr Phe Gln Phe Gln Ile Phe His Asn Met Ile
275 280 285
Ser His Gly Met Trp Val Asp Leu Leu Trp Cys Ile Ser Tyr Tyr Val
290 295 300
Arg Tyr Phe Leu Cys Tyr Thr Gln Phe Tyr Gly Val Phe Trp Ala Ile
305 310 315 320
Ile Leu Phe Asn Phe Val Arg Phe Met Glu Ser His Trp Phe Val Trp
325 330 335
Val Thr Gln Met Ser His Ile Pro Met Asn Ile Asp Tyr Glu Lys Asn
340 345 350
Gln Asp Trp Leu Ser Met Gln Leu Val Ala Thr Cys Asn Ile Glu Gln
355 360 365
Ser Ala Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
His His Leu Phe Pro Thr Val Pro Arg His Asn Tyr Trp Arg Ala Ala
385 390 395 400
Pro Arg Val Arg Ala Leu Cys Glu Lys Tyr Gly Val Lys Tyr Gln Glu
405 410 415
Lys Thr Leu Tyr Gly Ala Phe Ala Asp Ile Ile Arg Ser Leu Glu Lys
420 425 430
Ser Gly Glu Leu Trp Leu Asp Ala Tyr Leu Asn Lys
435 440
<210> 16
<211> 1946
<212> DNA
<213> Danio rerio (GenBank Accession No. BC068224)
<400> 16
cacaacagta ctgtatgagt gtgtgatcaa agtgcctgct gagacgtgat acgcgagcag 60
cactgttcag agatcagcga tgggtggcgg aggacagcag acagaccgaa tcaccgacac 120
caacggcaga ttcagcagct acacctggga ggaggtgcag aaacacacca aacatggaga 180
tcagtgggtg gtggtggaga ggaaggttta taacgtcagc cagtgggtga agagacaccc 240
cggaggactg aggatcctcg gacactatgc tggagaagac gccacggagg cgttcactgc 300
gtttcatcca aaccttcagc tggtgaggaa atacctgaag ccgctgctaa tcggagagct 360
ggaggcgtct gaacccagtc aggaccggca gaaaaacgct gctctcgtgg aggatttccg 420
agccctgcgt gagcgtctgg aggctgaagg ctgttttaaa acgcagccgc tgtttttcgc 480
tctgcatttg ggccacattc tgctcctgga ggccatcgct ttcatgatgg tgtggtattt 540
cggcaccggt tggatcaaca cgctcatcgt cgctgttatt ctggctactg cacagtcaca 600
agctggatgg ttgcagcatg acttcggtca tctgtccgtg tttaaaacct ctggaatgaa 660
tcatttggtg cacaaatttg tcatcggaca cctgaaggga gcgtctgcgg gctggtggaa 720
ccatcggcac ttccagcatc acgctaaacc caacatcttc aagaaggacc cggacgtcaa 780
catgctgaac gcctttgtgg tgggaaacgt gcagcccgtg gagtatggcg ttaagaagat 840
caagcatctg ccctacaacc atcagcacaa gtacttcttc ttcattggtc ctcccctgct 900
catcccagtg tatttccagt tccaaatctt tcacaatatg atcagtcatg gcatgtgggt 960
ggacctgctg tggtgtatca gctactacgt ccgatacttc ctttgttaca cgcagttcta 1020
cggcgtcttt tgggctatta tcctctttaa tttcgtcagg ttatggagag ccactggttt 1080
gtttgggtca cacagatgag ccacatcccc atgaacattg actatgagaa aaatcaggac 1140
tggctcagca tgcagctggt cgcgacctgt aacatcgagc agtctgcctt caacgactgg 1200
ttcagcggac acctcaactt ccagatcgag catcatctct ttcccacaat gcctcggcac 1260
aactactggc gcgccgctcc acgggtgcga gcgttgtgtg agaaatacgg agtcaaatac 1320
caagagaaga ccttgtacgg agcatttgcg gatatcatta ggtctttgga gaaatctggc 1380
gagctctggc tggatgcgta tctcaacaaa taaagcatga cttctcccta aatagaaaaa 1440
aagcggagcc gaatcctcca atcagagcga gccttcacag actagacatc aggaagaatc 1500
gcaactaaac ccccagtcaa tcagttcagt aaaatgacgc gtagcacttt gttttttgat 1560
atctgcaaga taattgtggc actttgaatg cgttttaaag agacggctca aagatgtgtg 1620
tctcgctcct aataaaggaa aaatctgaaa gtacatgtac gtgcatgaat gtgtgtgaaa 1680
gttgtgattg ctggtttaca atcgccgagt ttgctaggta atttcgaagt ttttatttag 1740
taaatttgca attcagatgt tgtttttata actaacattc ggacaaatga gatgacgata 1800
acactagtgg ttgcactttg tggtttatta tgaaatttaa ttggatttcc tactattggt 1860
catcgattaa acggattaaa cctcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920
aaaaaaaaaa aaaaaaaaaa aaaaaa 1946
<210> 17
<211> 1335
<212> DNA
<213> Danio rerio
<220>
<221> misc_feature
<223> Drd6/d5(M)
<400> 17
atgggtggcg gaggacagca gacagaccga atcaccgaca ccaacggcag attcagcagc 60
tacacctggg aggaggtgca gaaacacacc aaacatggag atcagtgggt ggtggtggag 120
aggaaggttt ataacgtcag ccagtgggtg aagagacacc ccggaggact gaggatcctc 180
ggacactatg ctggagaaga cgccacggag gcgttcactg cgtttcatcc aaaccttcag 240
ctggtgagga aatacctgaa gccgctgcta atcggagagc tggaggcgtc tgaacccagt 300
caggaccggc agaaaaacgc tgctctcgtg gaggatttcc gagccctgcg tgagcgtctg 360
gaggctgaag gctgttttaa aacgcagccg ctgtttttcg ctctgcattt gggccacatt 420
ctgctcctgg aggccatcgc tttcatgatg gtgtggtatt tcggcaccgg ttggatcaac 480
acgctcatcg tcgctgttat tctggctact gcacagtcac aagctggatg gttgcagcat 540
gacttcggtc atctgtccgt gtttaaaacc tctggaatga atcatttggt gcacaaattt 600
gtcatcggac acctgaaggg agcgtctgcg ggctggtgga accatcggca cttccagcat 660
cacgctaaac ccaacatctt caagaaggac ccggacgtca acatgctgaa cgcctttgtg 720
gtgggaaacg tgcagcccgt ggagtatggc gttaagaaga tcaagcatct gccctacaac 780
catcagcaca agtacttctt cttcattggt cctcccctgc tcatcccagt gtatttccag 840
ttccaaatct ttcacaatat gatcagtcat ggcatgtggg tggacctgct gtggtgtatc 900
agctactacg tccgatactt cctttgttac acgcagttct acggcgtctt ttgggctatt 960
atcctcttta atttcgtcag gtttatggag agccactggt ttgtttgggt cacacagatg 1020
agccacatcc ccatgaacat tgactatgag aaaaatcagg actggctcag catgcagctg 1080
gtcgcgacct gtaacatcga gcagtctgcc ttcaacgact ggttcagcgg acacctcaac 1140
ttccagatcg agcatcatct ctttcccaca atgcctcggc acaactactg gcgcgccgct 1200
ccacgggtgc gagcgttgtg tgagaaatac ggagtcaaat accaagagaa gaccttgtac 1260
ggagcatttg cggatatcat taggtctttg gagaaatctg gcgagctctg gctggatgcg 1320
tatctcaaca aataa 1335
<210> 18
<211> 444
<212> PRT
<213> Danio rerio
<220>
<221> MISC_FEATURE
<223> Drd6/d5(M)
<400> 18
Met Gly Gly Gly Gly Gln Gln Thr Asp Arg Ile Thr Asp Thr Asn Gly
1 5 10 15
Arg Phe Ser Ser Tyr Thr Trp Glu Glu Val Gln Lys His Thr Lys His
20 25 30
Gly Asp Gln Trp Val Val Val Glu Arg Lys Val Tyr Asn Val Ser Gln
35 40 45
Trp Val Lys Arg His Pro Gly Gly Leu Arg Ile Leu Gly His Tyr Ala
50 55 60
Gly Glu Asp Ala Thr Glu Ala Phe Thr Ala Phe His Pro Asn Leu Gln
65 70 75 80
Leu Val Arg Lys Tyr Leu Lys Pro Leu Leu Ile Gly Glu Leu Glu Ala
85 90 95
Ser Glu Pro Ser Gln Asp Arg Gln Lys Asn Ala Ala Leu Val Glu Asp
100 105 110
Phe Arg Ala Leu Arg Glu Arg Leu Glu Ala Glu Gly Cys Phe Lys Thr
115 120 125
Gln Pro Leu Phe Phe Ala Leu His Leu Gly His Ile Leu Leu Leu Glu
130 135 140
Ala Ile Ala Phe Met Met Val Trp Tyr Phe Gly Thr Gly Trp Ile Asn
145 150 155 160
Thr Leu Ile Val Ala Val Ile Leu Ala Thr Ala Gln Ser Gln Ala Gly
165 170 175
Trp Leu Gln His Asp Phe Gly His Leu Ser Val Phe Lys Thr Ser Gly
180 185 190
Met Asn His Leu Val His Lys Phe Val Ile Gly His Leu Lys Gly Ala
195 200 205
Ser Ala Gly Trp Trp Asn His Arg His Phe Gln His His Ala Lys Pro
210 215 220
Asn Ile Phe Lys Lys Asp Pro Asp Val Asn Met Leu Asn Ala Phe Val
225 230 235 240
Val Gly Asn Val Gln Pro Val Glu Tyr Gly Val Lys Lys Ile Lys His
245 250 255
Leu Pro Tyr Asn His Gln His Lys Tyr Phe Phe Phe Ile Gly Pro Pro
260 265 270
Leu Leu Ile Pro Val Tyr Phe Gln Phe Gln Ile Phe His Asn Met Ile
275 280 285
Ser His Gly Met Trp Val Asp Leu Leu Trp Cys Ile Ser Tyr Tyr Val
290 295 300
Arg Tyr Phe Leu Cys Tyr Thr Gln Phe Tyr Gly Val Phe Trp Ala Ile
305 310 315 320
Ile Leu Phe Asn Phe Val Arg Phe Met Glu Ser His Trp Phe Val Trp
325 330 335
Val Thr Gln Met Ser His Ile Pro Met Asn Ile Asp Tyr Glu Lys Asn
340 345 350
Gln Asp Trp Leu Ser Met Gln Leu Val Ala Thr Cys Asn Ile Glu Gln
355 360 365
Ser Ala Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
His His Leu Phe Pro Thr Met Pro Arg His Asn Tyr Trp Arg Ala Ala
385 390 395 400
Pro Arg Val Arg Ala Leu Cys Glu Lys Tyr Gly Val Lys Tyr Gln Glu
405 410 415
Lys Thr Leu Tyr Gly Ala Phe Ala Asp Ile Ile Arg Ser Leu Glu Lys
420 425 430
Ser Gly Glu Leu Trp Leu Asp Ala Tyr Leu Asn Lys
435 440
<210> 19
<211> 1077
<212> DNA
<213> Saprolegnia diclina (ATCC #56851)
<220>
<221> misc_feature
<223> delta-17 desaturase
<400> 19
atgactgagg ataagacgaa ggtcgagttc ccgacgctca cggagctcaa gcactcgatc 60
ccgaacgcgt gctttgagtc gaacctcggc ctctcgctct actacacggc ccgcgcgatc 120
ttcaacgcgt cggcctcggc ggcgctgctc tacgcggcgc gctcgacgcc gttcattgcc 180
gataacgttc tgctccacgc gctcgtttgc gccacctaca tctacgtgca gggcgtcatc 240
ttctggggct tcttcacggt cggccacgac tgcggccact cggccttctc gcgctaccac 300
agcgtcaact ttatcatcgg ctgcatcatg cactctgcga ttttgacgcc gttcgagagc 360
tggcgcgtga cgcaccgcca ccaccacaag aacacgggca acattgataa ggacgagatc 420
ttttacccgc accggtcggt caaggacctc caggacgtgc gccaatgggt ctacacgctc 480
ggcggtgcgt ggtttgtcta cttgaaggtc gggtatgccc cgcgcacgat gagccacttt 540
gacccgtggg acccgctcct ccttcgccgc gcgtcggccg tcatcgtgtc gctcggcgtc 600
tgggccgcct tcttcgccgc gtacgcgtac ctcacatact cgctcggctt tgccgtcatg 660
ggcctctact actatgcgcc gctctttgtc tttgcttcgt tcctcgtcat tacgaccttc 720
ttgcaccaca acgacgaagc gacgccgtgg tacggcgact cggagtggac gtacgtcaag 780
ggcaacctct cgagcgtcga ccgctcgtac ggcgcgttcg tggacaacct gagccaccac 840
attggcacgc accaggtcca ccacttgttc ccgatcattc cgcactacaa gctcaacgaa 900
gccaccaagc actttgcggc cgcgtacccg cacctcgtgc gcaggaacga cgagcccatc 960
atcacggcct tcttcaagac cgcgcacctc tttgtcaact acggcgctgt gcccgagacg 1020
gcgcagatct tcacgctcaa agagtcggcc gcggccgcca aggccaagtc ggactaa 1077
<210> 20
<211> 358
<212> PRT
<213> Saprolegnia diclina (ATCC #56851)
<400> 20
Met Ala Glu Asp Lys Thr Lys Val Glu Phe Pro Thr Leu Thr Glu Leu
1 5 10 15
Lys His Ser Ile Pro Asn Ala Cys Phe Glu Ser Asn Leu Gly Leu Ser
20 25 30
Leu Tyr Tyr Thr Ala Arg Ala Ile Phe Asn Ala Ser Ala Ser Ala Ala
35 40 45
Leu Leu Tyr Ala Ala Arg Ser Thr Pro Phe Ile Ala Asp Asn Val Leu
50 55 60
Leu His Ala Leu Val Cys Ala Thr Tyr Ile Tyr Val Gln Gly Val Ile
65 70 75 80
Phe Trp Gly Phe Phe Thr Val Gly His Asp Cys Gly His Ser Ala Phe
85 90 95
Ser Arg Tyr His Ser Val Asn Phe Ile Ile Gly Cys Ile Met His Ser
100 105 110
Ala Ile Leu Thr Pro Phe Glu Ser Trp Arg Val Thr His Arg His His
115 120 125
His Lys Asn Thr Gly Asn Ile Asp Lys Asp Glu Ile Phe Tyr Pro His
130 135 140
Arg Ser Val Lys Asp Leu Gln Asp Val Arg Gln Trp Val Tyr Thr Leu
145 150 155 160
Gly Gly Ala Trp Phe Val Tyr Leu Lys Val Gly Tyr Ala Pro Arg Thr
165 170 175
Met Ser His Phe Asp Pro Trp Asp Pro Leu Leu Leu Arg Arg Ala Ser
180 185 190
Ala Val Ile Val Ser Leu Gly Val Trp Ala Ala Phe Phe Ala Ala Tyr
195 200 205
Ala Tyr Leu Thr Tyr Ser Leu Gly Phe Ala Val Met Gly Leu Tyr Tyr
210 215 220
Tyr Ala Pro Leu Phe Val Phe Ala Ser Phe Leu Val Ile Thr Thr Phe
225 230 235 240
Leu His His Asn Asp Glu Ala Thr Pro Trp Tyr Gly Asp Ser Glu Trp
245 250 255
Thr Tyr Val Lys Gly Asn Leu Ser Ser Val Asp Arg Ser Tyr Gly Ala
260 265 270
Phe Val Asp Asn Leu Ser His His Ile Gly Thr His Gln Val His His
275 280 285
Leu Phe Pro Ile Ile Pro His Tyr Lys Leu Asn Glu Ala Thr Lys His
290 295 300
Phe Ala Ala Ala Tyr Pro His Leu Val Arg Arg Asn Asp Glu Pro Ile
305 310 315 320
Ile Thr Ala Phe Phe Lys Thr Ala His Leu Phe Val Asn Tyr Gly Ala
325 330 335
Val Pro Glu Thr Ala Gln Ile Phe Thr Leu Lys Glu Ser Ala Ala Ala
340 345 350
Ala Lys Ala Lys Ser Asp
355
<210> 21
<211> 1077
<212> DNA
<213> Saprolegnia diclina
<220>
<221> misc_feature
<223> synthetic delta-17 desaturase (codon-optimized)
<400> 21
atggctgagg ataagaccaa ggtcgagttc cctaccctga ctgagctgaa gcactctatc 60
cctaacgctt gctttgagtc caacctcgga ctctcgctct actacactgc ccgagcgatc 120
ttcaacgcat ctgcctctgc tgctctgctc tacgctgccc gatctactcc cttcattgcc 180
gataacgttc tgctccacgc tctggtttgc gccacctaca tctacgtgca gggtgtcatc 240
ttctggggtt tctttaccgt cggtcacgac tgtggtcact ctgccttctc ccgataccac 300
tccgtcaact tcatcattgg ctgcatcatg cactctgcca ttctgactcc cttcgagtcc 360
tggcgagtga cccaccgaca ccatcacaag aacactggca acattgataa ggacgagatc 420
ttctaccctc atcggtccgt caaggacctc caggacgtgc gacaatgggt ctacaccctc 480
ggaggtgctt ggtttgtcta cctgaaggtc ggatatgctc ctcgaaccat gtcccacttt 540
gacccctggg accctctcct gcttcgacga gcctccgctg tcatcgtgtc cctcggagtc 600
tgggctgcct tcttcgctgc ctacgcctac ctcacatact cgctcggctt tgccgtcatg 660
ggcctctact actatgctcc tctctttgtc tttgcttcgt tcctcgtcat tactaccttc 720
ttgcatcaca acgacgaagc tactccctgg tacggtgact cggagtggac ctacgtcaag 780
ggcaacctga gctccgtcga ccgatcgtac ggagctttcg tggacaacct gtctcaccac 840
attggcaccc accaggtcca tcacttgttc cctatcattc cccactacaa gctcaacgaa 900
gccaccaagc actttgctgc cgcttaccct cacctcgtga gacgtaacga cgagcccatc 960
attactgcct tcttcaagac cgctcacctc tttgtcaact acggagctgt gcccgagact 1020
gctcagattt tcaccctcaa agagtctgcc gctgcagcca aggccaagag cgactaa 1077
<210> 22
<211> 957
<212> DNA
<213> Mortierella alpina AX464731
<220>
<221> misc_feature
<223> elongase
<400> 22
atggagtcga ttgcgccatt cctcccatca aagatgccgc aagatctgtt tatggacctt 60
gccaccgcta tcggtgtccg ggccgcgccc tatgtcgatc ctctcgaggc cgcgctggtg 120
gcccaggccg agaagtacat ccccacgatt gtccatcaca cgcgtgggtt cctggtcgcg 180
gtggagtcgc ctttggcccg tgagctgccg ttgatgaacc cgttccacgt gctgttgatc 240
gtgctcgctt atttggtcac ggtctttgtg ggcatgcaga tcatgaagaa ctttgagcgg 300
ttcgaggtca agacgttttc gctcctgcac aacttttgtc tggtctcgat cagcgcctac 360
atgtgcggtg ggatcctgta cgaggcttat caggccaact atggactgtt tgagaacgct 420
gctgatcata ccttcaaggg tcttcctatg gccaagatga tctggctctt ctacttctcc 480
aagatcatgg agtttgtcga caccatgatc atggtcctca agaagaacaa ccgccagatc 540
tccttcttgc acgtttacca ccacagctcc atcttcacca tctggtggtt ggtcaccttt 600
gttgcaccca acggtgaagc ctacttctct gctgcgttga actcgttcat ccatgtgatc 660
atgtacggct actacttctt gtcggccttg ggcttcaagc aggtgtcgtt catcaagttc 720
tacatcacgc gctcgcagat gacacagttc tgcatgatgt cggtccagtc ttcctgggac 780
atgtacgcca tgaaggtcct tggccgcccc ggatacccct tcttcatcac ggctctgctt 840
tggttctaca tgtggaccat gctcggtctc ttctacaact tttacagaaa gaacgccaag 900
ttggccaagc aggccaaggc cgacgctgcc aaggagaagg caaggaagtt gcagtaa 957
<210> 23
<211> 318
<212> PRT
<213> Mortierella alpina AX464731
<400> 23
Met Glu Ser Ile Ala Pro Phe Leu Pro Ser Lys Met Pro Gln Asp Leu
1 5 10 15
Phe Met Asp Leu Ala Thr Ala Ile Gly Val Arg Ala Ala Pro Tyr Val
20 25 30
Asp Pro Leu Glu Ala Ala Leu Val Ala Gln Ala Glu Lys Tyr Ile Pro
35 40 45
Thr Ile Val His His Thr Arg Gly Phe Leu Val Ala Val Glu Ser Pro
50 55 60
Leu Ala Arg Glu Leu Pro Leu Met Asn Pro Phe His Val Leu Leu Ile
65 70 75 80
Val Leu Ala Tyr Leu Val Thr Val Phe Val Gly Met Gln Ile Met Lys
85 90 95
Asn Phe Glu Arg Phe Glu Val Lys Thr Phe Ser Leu Leu His Asn Phe
100 105 110
Cys Leu Val Ser Ile Ser Ala Tyr Met Cys Gly Gly Ile Leu Tyr Glu
115 120 125
Ala Tyr Gln Ala Asn Tyr Gly Leu Phe Glu Asn Ala Ala Asp His Thr
130 135 140
Phe Lys Gly Leu Pro Met Ala Lys Met Ile Trp Leu Phe Tyr Phe Ser
145 150 155 160
Lys Ile Met Glu Phe Val Asp Thr Met Ile Met Val Leu Lys Lys Asn
165 170 175
Asn Arg Gln Ile Ser Phe Leu His Val Tyr His His Ser Ser Ile Phe
180 185 190
Thr Ile Trp Trp Leu Val Thr Phe Val Ala Pro Asn Gly Glu Ala Tyr
195 200 205
Phe Ser Ala Ala Leu Asn Ser Phe Ile His Val Ile Met Tyr Gly Tyr
210 215 220
Tyr Phe Leu Ser Ala Leu Gly Phe Lys Gln Val Ser Phe Ile Lys Phe
225 230 235 240
Tyr Ile Thr Arg Ser Gln Met Thr Gln Phe Cys Met Met Ser Val Gln
245 250 255
Ser Ser Trp Asp Met Tyr Ala Met Lys Val Leu Gly Arg Pro Gly Tyr
260 265 270
Pro Phe Phe Ile Thr Ala Leu Leu Trp Phe Tyr Met Trp Thr Met Leu
275 280 285
Gly Leu Phe Tyr Asn Phe Tyr Arg Lys Asn Ala Lys Leu Ala Lys Gln
290 295 300
Ala Lys Ala Asp Ala Ala Lys Glu Lys Ala Arg Lys Leu Gln
305 310 315
<210> 24
<211> 957
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<223> synthetic elongase 1 (codon-optimized)
<400> 24
atggagtcca ttgctccctt cctgccctcc aagatgcctc aggacctgtt catggacctc 60
gccagcgcta tcggtgtccg agctgctccc tacgtcgatc ccctggaggc tgccctggtt 120
gcccaggccg agaagtacat tcccaccatt gtccatcaca ctcgaggctt cctggttgcc 180
gtggagtctc ccctggctcg agagctgcct ctgatgaacc ccttccacgt gctcctgatc 240
gtgctcgcct acctggtcac cgtgtttgtg ggtatgcaga tcatgaagaa ctttgaacga 300
ttcgaggtca agaccttctc cctcctgcac aacttctgtc tggtctccat ctccgcctac 360
atgtgcggtg gcatcctgta cgaggcttat caggccaact atggactgtt tgagaacgct 420
gccgatcaca ccttcaaggg tctccctatg gctaagatga tctggctctt ctacttctcc 480
aagatcatgg agtttgtcga caccatgatc atggtcctca agaagaacaa ccgacagatt 540
tcctttctgc acgtgtacca ccactcttcc atcttcacca tctggtggct ggtcaccttc 600
gttgctccca acggtgaagc ctacttctct gctgccctga actccttcat ccacgtcatc 660
atgtacggct actactttct gtctgccctg ggcttcaagc aggtgtcgtt catcaagttc 720
tacatcactc gatcccagat gacccagttc tgcatgatgt ctgtccagtc ttcctgggac 780
atgtacgcca tgaaggtcct tggccgacct ggatacccct tcttcatcac cgctctgctc 840
tggttctaca tgtggaccat gctcggtctc ttctacaact tttaccgaaa gaacgccaag 900
ctcgccaagc aggccaaggc tgacgctgcc aaggagaagg ccagaaagct ccagtaa 957
<210> 25
<211> 819
<212> DNA
<213> Thraustochytrium aureum
<220>
<221> misc_feature
<223> elongase 2
<400> 25
atggcaaaca gcagcgtgtg ggatgatgtg gtgggccgcg tggagaccgg cgtggaccag 60
tggatggatg gcgccaagcc gtacgcactc accgatgggc tcccgatgat ggacgtgtcc 120
accatgctgg cattcgaggt gggatacatg gccatgctgc tcttcggcat cccgatcatg 180
aagcagatgg agaagccttt tgagctcaag accatcaagc tcttgcacaa cttgtttctc 240
ttcggacttt ccttgtacat gtgcgtggag accatccgcc aggctatcct cggaggctac 300
aaagtgtttg gaaacgacat ggagaagggc aacgagtctc atgctcaggg catgtctcgc 360
atcgtgtacg tgttctacgt gtccaaggca tacgagttct tggataccgc catcatgatc 420
ctttgcaaga agttcaacca ggtttccttc ttgcatgtgt accaccatgc caccattttt 480
gccatctggt gggctatcgc caagtacgct ccaggaggtg atgcgtactt ttcagtgatc 540
ctcaactctt tcgtgcacac cgtcatgtac gcatactact tcttctcctc ccaagggttc 600
gggttcgtga agccaatcaa gccgtacatc accacccttc agatgaccca gttcatggca 660
atgcttgtgc agtccttgta cgactacctc ttcccatgcg actacccaca ggctcttgtg 720
cagctccttg gagtgtacat gatcaccttg cttgccctct tcggcaactt ttttgtgcag 780
agctatctta aaaagccaaa aaagagcaag accaactaa 819
<210> 26
<211> 272
<212> PRT
<213> Thraustochytrium aureum
<400> 26
Met Ala Asn Ser Ser Val Trp Asp Asp Val Val Gly Arg Val Glu Thr
1 5 10 15
Gly Val Asp Gln Trp Met Asp Gly Ala Lys Pro Tyr Ala Leu Thr Asp
20 25 30
Gly Leu Pro Met Met Asp Val Ser Thr Met Leu Ala Phe Glu Val Gly
35 40 45
Tyr Met Ala Met Leu Leu Phe Gly Ile Pro Ile Met Lys Gln Met Glu
50 55 60
Lys Pro Phe Glu Leu Lys Thr Ile Lys Leu Leu His Asn Leu Phe Leu
65 70 75 80
Phe Gly Leu Ser Leu Tyr Met Cys Val Glu Thr Ile Arg Gln Ala Ile
85 90 95
Leu Gly Gly Tyr Lys Val Phe Gly Asn Asp Met Glu Lys Gly Asn Glu
100 105 110
Ser His Ala Gln Gly Met Ser Arg Ile Val Tyr Val Phe Tyr Val Ser
115 120 125
Lys Ala Tyr Glu Phe Leu Asp Thr Ala Ile Met Ile Leu Cys Lys Lys
130 135 140
Phe Asn Gln Val Ser Phe Leu His Val Tyr His His Ala Thr Ile Phe
145 150 155 160
Ala Ile Trp Trp Ala Ile Ala Lys Tyr Ala Pro Gly Gly Asp Ala Tyr
165 170 175
Phe Ser Val Ile Leu Asn Ser Phe Val His Thr Val Met Tyr Ala Tyr
180 185 190
Tyr Phe Phe Ser Ser Gln Gly Phe Gly Phe Val Lys Pro Ile Lys Pro
195 200 205
Tyr Ile Thr Thr Leu Gln Met Thr Gln Phe Met Ala Met Leu Val Gln
210 215 220
Ser Leu Tyr Asp Tyr Leu Phe Pro Cys Asp Tyr Pro Gln Ala Leu Val
225 230 235 240
Gln Leu Leu Gly Val Tyr Met Ile Thr Leu Leu Ala Leu Phe Gly Asn
245 250 255
Phe Phe Val Gln Ser Tyr Leu Lys Lys Pro Lys Lys Ser Lys Thr Asn
260 265 270
<210> 27
<211> 819
<212> DNA
<213> Thraustochytrium aureum
<220>
<221> misc_feature
<223> synthetic elongase (codon-optimized)
<400> 27
atggccaact cctctgtctg ggacgacgtg gtcggacgag tcgagaccgg tgtcgaccag 60
tggatggacg gagctaagcc ctacgctctg accgacggtc tgcccatgat ggacgtctcc 120
accatgctcg ccttcgaggt cggctacatg gccatgctgc tcttcggcat tcccatcatg 180
aagcagatgg agaagccctt cgagctgaag accatcaagc tgctccacaa cctgttcctc 240
ttcggactgt ccctctacat gtgcgtcgag accatccgac aggctatcct gggtggctac 300
aaggtcttcg gcaacgacat ggagaagggc aacgagtccc acgctcaggg catgtcccga 360
atcgtctacg tgttctacgt ctccaaggcc tacgagttcc tggacaccgc tatcatgatc 420
ctgtgcaaga agttcaacca ggtctccttc ctgcacgtgt accaccatgc caccatcttc 480
gccatctggt gggctattgc caagtacgct cctggtggcg acgcctactt ctccgtcatc 540
ctcaactcct tcgtccacac cgtcatgtac gcctactact tcttttcctc tcagggcttc 600
ggcttcgtca agcccatcaa gccctacatc accactctgc agatgaccca gttcatggct 660
atgctggtgc agtccctgta cgactacctc ttcccctgcg actaccctca ggctctggtc 720
cagctgctcg gcgtgtacat gatcaccctg ctcgctctgt tcggcaactt ctttgtccag 780
tcctacctga agaagcccaa gaagtccaag accaactaa 819
<210> 28
<211> 1936
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> CDS
<222> (283)..(1539)
<223> delta-12 desaturase
<400> 28
cgtagttata tacaagaggt agatgcgtgc tggtgttaga ggggctctca ggattaggag 60
gaaaatttga cattggccct caacatataa cctcgggtgt gcctctgttt accctcagct 120
tttgcttgtc cccaagtcag tcacgccagg ccaaaaaggt tggtggattg acagggagaa 180
aaaaaaaagc ctagtgggtt taaactcgag gtaagacatt gaaatatata ccggtcggca 240
tcctgagtcc ctttctcgta ttccaacaga ccgaccatag aa atg gat tcg acc 294
Met Asp Ser Thr
1
acg cag acc aac acc ggc acc ggc aag gtg gcc gtg cag ccc ccc acg 342
Thr Gln Thr Asn Thr Gly Thr Gly Lys Val Ala Val Gln Pro Pro Thr
5 10 15 20
gcc ttc att aag ccc att gag aag gtg tcc gag ccc gtc tac gac acc 390
Ala Phe Ile Lys Pro Ile Glu Lys Val Ser Glu Pro Val Tyr Asp Thr
25 30 35
ttt ggc aac gag ttc act cct cca gac tac tct atc aag gat att ctg 438
Phe Gly Asn Glu Phe Thr Pro Pro Asp Tyr Ser Ile Lys Asp Ile Leu
40 45 50
gat gcc att ccc cag gag tgc tac aag cgg tcc tac gtt aag tcc tac 486
Asp Ala Ile Pro Gln Glu Cys Tyr Lys Arg Ser Tyr Val Lys Ser Tyr
55 60 65
tcg tac gtg gcc cga gac tgc ttc ttt atc gcc gtt ttt gcc tac atg 534
Ser Tyr Val Ala Arg Asp Cys Phe Phe Ile Ala Val Phe Ala Tyr Met
70 75 80
gcc tac gcg tac ctg cct ctt att ccc tcg gct tcc ggc cga gct gtg 582
Ala Tyr Ala Tyr Leu Pro Leu Ile Pro Ser Ala Ser Gly Arg Ala Val
85 90 95 100
gcc tgg gcc atg tac tcc att gtc cag ggt ctg ttt ggc acc ggt ctg 630
Ala Trp Ala Met Tyr Ser Ile Val Gln Gly Leu Phe Gly Thr Gly Leu
105 110 115
tgg gtt ctt gcc cac gag tgt ggc cac tct gct ttc tcc gac tct aac 678
Trp Val Leu Ala His Glu Cys Gly His Ser Ala Phe Ser Asp Ser Asn
120 125 130
acc gtc aac aac gtc acc gga tgg gtt ctg cac tcc tcc atg ctg gtc 726
Thr Val Asn Asn Val Thr Gly Trp Val Leu His Ser Ser Met Leu Val
135 140 145
cct tac tac gcc tgg aag ctg acc cac tcc atg cac cac aag tcc act 774
Pro Tyr Tyr Ala Trp Lys Leu Thr His Ser Met His His Lys Ser Thr
150 155 160
ggt cac ctc acc cgt gat atg gtg ttt gtg ccc aag gac cga aag gag 822
Gly His Leu Thr Arg Asp Met Val Phe Val Pro Lys Asp Arg Lys Glu
165 170 175 180
ttt atg gag aac cga ggc gcc cat gac tgg tct gag ctt gct gag gac 870
Phe Met Glu Asn Arg Gly Ala His Asp Trp Ser Glu Leu Ala Glu Asp
185 190 195
gct ccc ctc atg acc ctc tac ggc ctc atc acc cag cag gtg ttt gga 918
Ala Pro Leu Met Thr Leu Tyr Gly Leu Ile Thr Gln Gln Val Phe Gly
200 205 210
tgg cct ctg tat ctg ctg tct tac gtt acc gga cag aag tac ccc aag 966
Trp Pro Leu Tyr Leu Leu Ser Tyr Val Thr Gly Gln Lys Tyr Pro Lys
215 220 225
ctc aac aaa tgg gct gtc aac cac ttc aac ccc aac gcc ccg ctg ttt 1014
Leu Asn Lys Trp Ala Val Asn His Phe Asn Pro Asn Ala Pro Leu Phe
230 235 240
gag aag aag gac tgg ttc aac atc tgg atc tct aac gtc ggt att ggt 1062
Glu Lys Lys Asp Trp Phe Asn Ile Trp Ile Ser Asn Val Gly Ile Gly
245 250 255 260
atc acc atg tcc gtc atc gca tac tcc atc aac cga tgg ggc ctg gct 1110
Ile Thr Met Ser Val Ile Ala Tyr Ser Ile Asn Arg Trp Gly Leu Ala
265 270 275
tcc gtc acc ctc tac tac ctg atc ccc tac ctg tgg gtc aac cac tgg 1158
Ser Val Thr Leu Tyr Tyr Leu Ile Pro Tyr Leu Trp Val Asn His Trp
280 285 290
ctc gtg gcc atc acc tac ctg cag cac acc gac ccc act ctg ccc cac 1206
Leu Val Ala Ile Thr Tyr Leu Gln His Thr Asp Pro Thr Leu Pro His
295 300 305
tac cac gcc gac cag tgg aac ttc acc cga gga gcc gcc gcc acc atc 1254
Tyr His Ala Asp Gln Trp Asn Phe Thr Arg Gly Ala Ala Ala Thr Ile
310 315 320
gac cga gag ttt ggc ttc atc ggc tcc ttc tgc ttc cat gac atc atc 1302
Asp Arg Glu Phe Gly Phe Ile Gly Ser Phe Cys Phe His Asp Ile Ile
325 330 335 340
gag acc cac gtt ctg cac cac tac gtg tct cga att ccc ttc tac aac 1350
Glu Thr His Val Leu His His Tyr Val Ser Arg Ile Pro Phe Tyr Asn
345 350 355
gcc cga atc gcc act gag aag atc aag aag gtc atg ggc aag cac tac 1398
Ala Arg Ile Ala Thr Glu Lys Ile Lys Lys Val Met Gly Lys His Tyr
360 365 370
cga cac gac gac acc aac ttc atc aag tct ctt tac act gtc gcc cga 1446
Arg His Asp Asp Thr Asn Phe Ile Lys Ser Leu Tyr Thr Val Ala Arg
375 380 385
acc tgc cag ttt gtt gaa ggt aag gaa ggc att cag atg ttt aga aac 1494
Thr Cys Gln Phe Val Glu Gly Lys Glu Gly Ile Gln Met Phe Arg Asn
390 395 400
gtc aat gga gtc gga gtt gct cct gac ggc ctg cct tct aaa aag 1539
Val Asn Gly Val Gly Val Ala Pro Asp Gly Leu Pro Ser Lys Lys
405 410 415
tagagctaga aatgttattt gattgtgttt taactgaaca gcaccgagcc cgaggctaag 1599
ccaagcgaag ccgaggggtt gtgtagtcca tggacgtaac gagtaggcga tatcaccgca 1659
ctcggcactg cgtgtctgcg ttcatgggcg aagtcacatt acgctgacaa ccgttgtagt 1719
ttccctttag tatcaatact gttacaagta ccggtctcgt actcgtactg atacgaatct 1779
gtgggaagaa gtcaccctta tcagaccttc atactgatgt ttcggatatc aatagaactg 1839
gcatagagcc gttaaagaag tttcacttaa tcactccaac cctcctactt gtagattcaa 1899
gcagatcgat aagatggatt tgatggtcag tgctagc 1936
<210> 29
<211> 419
<212> PRT
<213> Yarrowia lipolytica
<400> 29
Met Asp Ser Thr Thr Gln Thr Asn Thr Gly Thr Gly Lys Val Ala Val
1 5 10 15
Gln Pro Pro Thr Ala Phe Ile Lys Pro Ile Glu Lys Val Ser Glu Pro
20 25 30
Val Tyr Asp Thr Phe Gly Asn Glu Phe Thr Pro Pro Asp Tyr Ser Ile
35 40 45
Lys Asp Ile Leu Asp Ala Ile Pro Gln Glu Cys Tyr Lys Arg Ser Tyr
50 55 60
Val Lys Ser Tyr Ser Tyr Val Ala Arg Asp Cys Phe Phe Ile Ala Val
65 70 75 80
Phe Ala Tyr Met Ala Tyr Ala Tyr Leu Pro Leu Ile Pro Ser Ala Ser
85 90 95
Gly Arg Ala Val Ala Trp Ala Met Tyr Ser Ile Val Gln Gly Leu Phe
100 105 110
Gly Thr Gly Leu Trp Val Leu Ala His Glu Cys Gly His Ser Ala Phe
115 120 125
Ser Asp Ser Asn Thr Val Asn Asn Val Thr Gly Trp Val Leu His Ser
130 135 140
Ser Met Leu Val Pro Tyr Tyr Ala Trp Lys Leu Thr His Ser Met His
145 150 155 160
His Lys Ser Thr Gly His Leu Thr Arg Asp Met Val Phe Val Pro Lys
165 170 175
Asp Arg Lys Glu Phe Met Glu Asn Arg Gly Ala His Asp Trp Ser Glu
180 185 190
Leu Ala Glu Asp Ala Pro Leu Met Thr Leu Tyr Gly Leu Ile Thr Gln
195 200 205
Gln Val Phe Gly Trp Pro Leu Tyr Leu Leu Ser Tyr Val Thr Gly Gln
210 215 220
Lys Tyr Pro Lys Leu Asn Lys Trp Ala Val Asn His Phe Asn Pro Asn
225 230 235 240
Ala Pro Leu Phe Glu Lys Lys Asp Trp Phe Asn Ile Trp Ile Ser Asn
245 250 255
Val Gly Ile Gly Ile Thr Met Ser Val Ile Ala Tyr Ser Ile Asn Arg
260 265 270
Trp Gly Leu Ala Ser Val Thr Leu Tyr Tyr Leu Ile Pro Tyr Leu Trp
275 280 285
Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His Thr Asp Pro
290 295 300
Thr Leu Pro His Tyr His Ala Asp Gln Trp Asn Phe Thr Arg Gly Ala
305 310 315 320
Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Ser Phe Cys Phe
325 330 335
His Asp Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Arg Ile
340 345 350
Pro Phe Tyr Asn Ala Arg Ile Ala Thr Glu Lys Ile Lys Lys Val Met
355 360 365
Gly Lys His Tyr Arg His Asp Asp Thr Asn Phe Ile Lys Ser Leu Tyr
370 375 380
Thr Val Ala Arg Thr Cys Gln Phe Val Glu Gly Lys Glu Gly Ile Gln
385 390 395 400
Met Phe Arg Asn Val Asn Gly Val Gly Val Ala Pro Asp Gly Leu Pro
405 410 415
Ser Lys Lys
<210> 30
<211> 1203
<212> DNA
<213> Mortieralla isabellina (GenBank Accession No. AF417245)
<220>
<221> CDS
<222> (1)..(1203)
<223> delta-12 desaturase
<400> 30
atg gca cct ccc aac act atc gat gcc ggc ttg acc cag cgt cat atc 48
Met Ala Pro Pro Asn Thr Ile Asp Ala Gly Leu Thr Gln Arg His Ile
1 5 10 15
acc acc acg gcc gcc cca acc tcg gcc aag ccc gct ttc gag cgc aac 96
Thr Thr Thr Ala Ala Pro Thr Ser Ala Lys Pro Ala Phe Glu Arg Asn
20 25 30
tac cag ctc ccc gag ttc act atc aag gag atc cga gag tgc atc cct 144
Tyr Gln Leu Pro Glu Phe Thr Ile Lys Glu Ile Arg Glu Cys Ile Pro
35 40 45
gcc cac tgc ttt gag cgc tcc ggt ctt cgt ggt ctc tgc cac gtt gcc 192
Ala His Cys Phe Glu Arg Ser Gly Leu Arg Gly Leu Cys His Val Ala
50 55 60
att gat ctg acc tgg gcc tcg ctc ttg ttc ctg gct gca acc cag atc 240
Ile Asp Leu Thr Trp Ala Ser Leu Leu Phe Leu Ala Ala Thr Gln Ile
65 70 75 80
gac aag ttc gag aac ccc ttg atc cgc tat ctg gcc tgg cct gcg tac 288
Asp Lys Phe Glu Asn Pro Leu Ile Arg Tyr Leu Ala Trp Pro Ala Tyr
85 90 95
tgg atc atg cag ggc att gtc tgc acc ggc ata tgg gtg ctg gcc cac 336
Trp Ile Met Gln Gly Ile Val Cys Thr Gly Ile Trp Val Leu Ala His
100 105 110
gag tgc ggt cac cag tcc ttc tcg acc tcc aag act ctc aac aac acc 384
Glu Cys Gly His Gln Ser Phe Ser Thr Ser Lys Thr Leu Asn Asn Thr
115 120 125
gtc ggc tgg atc ctg cac tcg atg ctc ttg gtc ccc tac cac tcc tgg 432
Val Gly Trp Ile Leu His Ser Met Leu Leu Val Pro Tyr His Ser Trp
130 135 140
aga atc tcg cac tcg aag cac cac aag gcc act ggc cac atg acc aag 480
Arg Ile Ser His Ser Lys His His Lys Ala Thr Gly His Met Thr Lys
145 150 155 160
gac cag gtc ttt gtt ccc aag acc cgc tcc cag gtt ggt ttg cct ccc 528
Asp Gln Val Phe Val Pro Lys Thr Arg Ser Gln Val Gly Leu Pro Pro
165 170 175
aag gag agc gct gct gct gcc gtt caa gag gag gac atg tcc gtg cac 576
Lys Glu Ser Ala Ala Ala Ala Val Gln Glu Glu Asp Met Ser Val His
180 185 190
ctg gat gag gag gcc cct att gtg act ttg ttc tgg atg gtg atc cag 624
Leu Asp Glu Glu Ala Pro Ile Val Thr Leu Phe Trp Met Val Ile Gln
195 200 205
ttc ctg ttc gga tgg cct gca tac ctg atc atg aac gcc tct ggt cag 672
Phe Leu Phe Gly Trp Pro Ala Tyr Leu Ile Met Asn Ala Ser Gly Gln
210 215 220
gac tat ggc cgc tgg acc tcg cac ttc cac act tac tcg ccc atc ttt 720
Asp Tyr Gly Arg Trp Thr Ser His Phe His Thr Tyr Ser Pro Ile Phe
225 230 235 240
gag ccc cgc aac ttc ttc gac att atc atc tcg gat ctc ggt gtg ttg 768
Glu Pro Arg Asn Phe Phe Asp Ile Ile Ile Ser Asp Leu Gly Val Leu
245 250 255
gct gcc ctc ggt gcc ctg atc tac gct tcc atg cag ctg tcg ctc ttg 816
Ala Ala Leu Gly Ala Leu Ile Tyr Ala Ser Met Gln Leu Ser Leu Leu
260 265 270
acc gtg acc aag tac tac atc atc ccg tac ctg ttt gtc aac ttt tgg 864
Thr Val Thr Lys Tyr Tyr Ile Ile Pro Tyr Leu Phe Val Asn Phe Trp
275 280 285
ttg gtc ctg att act ttc ttg cag cac acc gac ccc aag ctg ccc cat 912
Leu Val Leu Ile Thr Phe Leu Gln His Thr Asp Pro Lys Leu Pro His
290 295 300
tac cgt gag ggt gcc tgg aac ttc cag cgt gga gcc ctc tgc acc gtt 960
Tyr Arg Glu Gly Ala Trp Asn Phe Gln Arg Gly Ala Leu Cys Thr Val
305 310 315 320
gac cgc tcg ttt ggc aag ttc ttg gac cat atg ttc cac ggc atc gtc 1008
Asp Arg Ser Phe Gly Lys Phe Leu Asp His Met Phe His Gly Ile Val
325 330 335
cat acc cat gtg gcc cat cac ttg ttc tcg cag atg ccg ttc tac cat 1056
His Thr His Val Ala His His Leu Phe Ser Gln Met Pro Phe Tyr His
340 345 350
gct gaa gaa gct acc tac cat ctc aag aaa ctg ctg gga gag tac tac 1104
Ala Glu Glu Ala Thr Tyr His Leu Lys Lys Leu Leu Gly Glu Tyr Tyr
355 360 365
gtt tac gac cca tcc ccg atc gtc gtt gcg gtc tgg agg tcg ttc cgc 1152
Val Tyr Asp Pro Ser Pro Ile Val Val Ala Val Trp Arg Ser Phe Arg
370 375 380
gag tgc cga ttc gtg gag gat cat gga gac gtg gtc ttt ttc aag aag 1200
Glu Cys Arg Phe Val Glu Asp His Gly Asp Val Val Phe Phe Lys Lys
385 390 395 400
taa 1203
<210> 31
<211> 400
<212> PRT
<213> Mortieralla isabellina (GenBank Accession No. AF417245)
<400> 31
Met Ala Pro Pro Asn Thr Ile Asp Ala Gly Leu Thr Gln Arg His Ile
1 5 10 15
Thr Thr Thr Ala Ala Pro Thr Ser Ala Lys Pro Ala Phe Glu Arg Asn
20 25 30
Tyr Gln Leu Pro Glu Phe Thr Ile Lys Glu Ile Arg Glu Cys Ile Pro
35 40 45
Ala His Cys Phe Glu Arg Ser Gly Leu Arg Gly Leu Cys His Val Ala
50 55 60
Ile Asp Leu Thr Trp Ala Ser Leu Leu Phe Leu Ala Ala Thr Gln Ile
65 70 75 80
Asp Lys Phe Glu Asn Pro Leu Ile Arg Tyr Leu Ala Trp Pro Ala Tyr
85 90 95
Trp Ile Met Gln Gly Ile Val Cys Thr Gly Ile Trp Val Leu Ala His
100 105 110
Glu Cys Gly His Gln Ser Phe Ser Thr Ser Lys Thr Leu Asn Asn Thr
115 120 125
Val Gly Trp Ile Leu His Ser Met Leu Leu Val Pro Tyr His Ser Trp
130 135 140
Arg Ile Ser His Ser Lys His His Lys Ala Thr Gly His Met Thr Lys
145 150 155 160
Asp Gln Val Phe Val Pro Lys Thr Arg Ser Gln Val Gly Leu Pro Pro
165 170 175
Lys Glu Ser Ala Ala Ala Ala Val Gln Glu Glu Asp Met Ser Val His
180 185 190
Leu Asp Glu Glu Ala Pro Ile Val Thr Leu Phe Trp Met Val Ile Gln
195 200 205
Phe Leu Phe Gly Trp Pro Ala Tyr Leu Ile Met Asn Ala Ser Gly Gln
210 215 220
Asp Tyr Gly Arg Trp Thr Ser His Phe His Thr Tyr Ser Pro Ile Phe
225 230 235 240
Glu Pro Arg Asn Phe Phe Asp Ile Ile Ile Ser Asp Leu Gly Val Leu
245 250 255
Ala Ala Leu Gly Ala Leu Ile Tyr Ala Ser Met Gln Leu Ser Leu Leu
260 265 270
Thr Val Thr Lys Tyr Tyr Ile Ile Pro Tyr Leu Phe Val Asn Phe Trp
275 280 285
Leu Val Leu Ile Thr Phe Leu Gln His Thr Asp Pro Lys Leu Pro His
290 295 300
Tyr Arg Glu Gly Ala Trp Asn Phe Gln Arg Gly Ala Leu Cys Thr Val
305 310 315 320
Asp Arg Ser Phe Gly Lys Phe Leu Asp His Met Phe His Gly Ile Val
325 330 335
His Thr His Val Ala His His Leu Phe Ser Gln Met Pro Phe Tyr His
340 345 350
Ala Glu Glu Ala Thr Tyr His Leu Lys Lys Leu Leu Gly Glu Tyr Tyr
355 360 365
Val Tyr Asp Pro Ser Pro Ile Val Val Ala Val Trp Arg Ser Phe Arg
370 375 380
Glu Cys Arg Phe Val Glu Asp His Gly Asp Val Val Phe Phe Lys Lys
385 390 395 400
<210> 32
<211> 1434
<212> DNA
<213> Fusarium monoliforme
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 32
atggcgtcca cttcggctct gcccaagcag aaccctgcgc ttagacgcac cgtcacctca 60
actactgtga cggattctga gtctgccgcc gtctctcctt cagactctcc ccgccactcg 120
gcctcttcca catcgctctc gtccatgtcc gaggttgata tcgccaagcc caagtccgag 180
tatggtgtca tgctcgacac ctacggcaac cagttcgagg ttcccgactt taccatcaag 240
gacatctaca atgccatccc taagcactgc ttcaagcgct ccgctctcaa gggatacggt 300
tatatcctcc gcgacattgt cctcctgact accactttca gcatctggta caactttgtg 360
acccccgaat atatcccctc cacccccgcc cgcgctggtc tgtgggccgt gtacaccgtt 420
cttcagggtc ttttcggtac tggtctctgg gttattgccc atgagtgcgg tcacggtgct 480
ttctccgatt ctcgcatcat caacgacatt actggctggg ttcttcactc ttccctcctt 540
gtcccctact tcagctggca aatctcccac cgaaagcacc acaaggccac tggcaacatg 600
gagcgtgaca tggtcttcgt tccccgaacc cgcgagcagc aggctactcg tctcggaaag 660
atgacccacg agctcgctca tcttactgag gagacccccg ctttcactct tctcatgctc 720
gtccttcagc agctcgttgg ctggcccaac tacctcatca ccaatgttac cggccacaac 780
taccacgagc gccagcgtga gggtcgcggc aagggcaagc ataacggcct cggcggtggt 840
gttaaccact tcgatccccg cagccctctg tacgagaaca gtgacgctaa gctcatcgtc 900
ctcagcgata ttggtatcgg tctgatggcc actgctctgt acttcctcgt tcagaagttc 960
ggtttctaca acatggccat ctggtacttt gttccctacc tctgggttaa ccactggctc 1020
gttgccatca ccttcctcca gcacaccgac cctacccttc cccactacac caacgacgag 1080
tggaacttcg tccgtggtgc cgctgctacc attgaccgtg agatgggctt catcggccgc 1140
caccttctcc acggcatcat cgagactcat gtcctccacc actacgtcag cagcatcccc 1200
ttctacaacg cggacgaggc caccgaggcc attaagccca tcatgggcaa gcactaccgg 1260
gctgatgtcc aggatggtcc tcgtggcttc atccgcgcca tgtaccgcag tgcgcgtatg 1320
tgccagtggg ttgagcccag cgctggtgcc gagggtgctg gtaagggtgt tctgttcttc 1380
cgcaaccgca acaacgtggg cacccccccc gctgttatca agcccgttgc ttaa 1434
<210> 33
<211> 477
<212> PRT
<213> Fusarium monoliforme
<400> 33
Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg
1 5 10 15
Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser
20 25 30
Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser
35 40 45
Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met
50 55 60
Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys
65 70 75 80
Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu
85 90 95
Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr
100 105 110
Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr
115 120 125
Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu
130 135 140
Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala
145 150 155 160
Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His
165 170 175
Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys
180 185 190
His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro
195 200 205
Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu
210 215 220
Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu
225 230 235 240
Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val
245 250 255
Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly
260 265 270
Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser
275 280 285
Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile
290 295 300
Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe
305 310 315 320
Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val
325 330 335
Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr
340 345 350
Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala
355 360 365
Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His
370 375 380
Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro
385 390 395 400
Phe Tyr Asn Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly
405 410 415
Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg
420 425 430
Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala
435 440 445
Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn
450 455 460
Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala
465 470 475
<210> 34
<211> 1416
<212> DNA
<213> Aspergillus nidulans
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 34
atgtcgtcta ctgccctccc gaagcgcgtt gcgctgcatc gcaacccgac taccgactct 60
tcggtcccca gctccgtctc ggtctccccg ctggactcgc cccgtcagtc tccgtcgtcg 120
acttcgctct cgtcaatggc ctcggatgcg ggcaagggag acttgggcaa gatgctcgac 180
acctatggca atgagttcaa gatccccgac tacaccatca aggatatccg tgatgccatt 240
ccgtcccact gctacaaccg gtctgctatc aggagtctgt cctatgtctt ccgtgatctc 300
gccgtcctcg cttccgtctt ctacgtcttc cacaaatacg tgaccccgga gaccgtccct 360
tcgtacccgg cgcgtgttgc gctgtggact ctctacactg tcgtccaggg tctgttcggt 420
accggtattt gggttcttgc tcacgagtgt ggacaccagg cgttctctac ttccaaggtg 480
ctcaacgaca ctgttggctg gatcctgcat tcggctctgc tggtccccta tttctcgtgg 540
aagatctctc acggcaagca ccacaaggcc accggtaacc tggctcgtga catggtcttc 600
gtccccaaga cccgcgaggt gtacgcctcc cgcatcaaga agaccatcta cgacctgaac 660
gaggtgatgg aggagacccc cttggccact gccacccact ccatcctgca gcagctgttc 720
ggctggccct tgtacctgct caccaacgtt accggtcacg acaaccacga gcgccagcct 780
gaaggccgcg gcaagggcaa gcgtaacggc tacttcaccg gcgtcaacca cttcaacccc 840
aacagccctc tgttcgaggc caaggacgcc aagctcatca ttctgagtga tatcggcctc 900
gccatcaccg ccagcatcct gtacctgatc ggctccaagt tcggctggat gaacttgctc 960
gtctggtacg gtatccccta cctctgggtg aaccactggc ttgttgccat cacctacctc 1020
cagcacaccg accccactct cccccactac cagcccgagt cctggacctt cgcccgcggt 1080
gccgctgcca ccattgaccg cgagttcggc ttcatcggcc gtcacattct ccacggcatc 1140
atcgagaccc acgtcctcca ccactacgtc agcaccatcc ccttctacca cgccgacgag 1200
gccagcgagg ctatcaagaa ggtcatgggc tcgcactacc gcagcgaggc acacaccggt 1260
cctctgggct tcctcaaggc tctctggacc agcgcccgtg tctgccactg ggtcgagccc 1320
accgaaggca ccaagggcga gaacgctggt gtcttgttct tccgcaacac caacggcatc 1380
ggtgttcctc ccattaagct gaccaagcct aactaa 1416
<210> 35
<211> 471
<212> PRT
<213> Aspergillus nidulans
<400> 35
Met Ser Ser Thr Ala Leu Pro Lys Arg Val Ala Leu His Arg Asn Pro
1 5 10 15
Thr Thr Asp Ser Ser Val Pro Ser Ser Val Ser Val Ser Pro Leu Asp
20 25 30
Ser Pro Arg Gln Ser Pro Ser Ser Thr Ser Leu Ser Ser Met Ala Ser
35 40 45
Asp Ala Gly Lys Gly Asp Leu Gly Lys Met Leu Asp Thr Tyr Gly Asn
50 55 60
Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Asp Ile Arg Asp Ala Ile
65 70 75 80
Pro Ser His Cys Tyr Asn Arg Ser Ala Ile Arg Ser Leu Ser Tyr Val
85 90 95
Phe Arg Asp Leu Ala Val Leu Ala Ser Val Phe Tyr Val Phe His Lys
100 105 110
Tyr Val Thr Pro Glu Thr Val Pro Ser Tyr Pro Ala Arg Val Ala Leu
115 120 125
Trp Thr Leu Tyr Thr Val Val Gln Gly Leu Phe Gly Thr Gly Ile Trp
130 135 140
Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser Lys Val
145 150 155 160
Leu Asn Asp Thr Val Gly Trp Ile Leu His Ser Ala Leu Leu Val Pro
165 170 175
Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly
180 185 190
Asn Leu Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Val Tyr
195 200 205
Ala Ser Arg Ile Lys Lys Thr Ile Tyr Asp Leu Asn Glu Val Met Glu
210 215 220
Glu Thr Pro Leu Ala Thr Ala Thr His Ser Ile Leu Gln Gln Leu Phe
225 230 235 240
Gly Trp Pro Leu Tyr Leu Leu Thr Asn Val Thr Gly His Asp Asn His
245 250 255
Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe
260 265 270
Thr Gly Val Asn His Phe Asn Pro Asn Ser Pro Leu Phe Glu Ala Lys
275 280 285
Asp Ala Lys Leu Ile Ile Leu Ser Asp Ile Gly Leu Ala Ile Thr Ala
290 295 300
Ser Ile Leu Tyr Leu Ile Gly Ser Lys Phe Gly Trp Met Asn Leu Leu
305 310 315 320
Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala
325 330 335
Ile Thr Tyr Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro
340 345 350
Glu Ser Trp Thr Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu
355 360 365
Phe Gly Phe Ile Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His
370 375 380
Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu
385 390 395 400
Ala Ser Glu Ala Ile Lys Lys Val Met Gly Ser His Tyr Arg Ser Glu
405 410 415
Ala His Thr Gly Pro Leu Gly Phe Leu Lys Ala Leu Trp Thr Ser Ala
420 425 430
Arg Val Cys His Trp Val Glu Pro Thr Glu Gly Thr Lys Gly Glu Asn
435 440 445
Ala Gly Val Leu Phe Phe Arg Asn Thr Asn Gly Ile Gly Val Pro Pro
450 455 460
Ile Lys Leu Thr Lys Pro Asn
465 470
<210> 36
<211> 466
<212> PRT
<213> Aspergillus flavus
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 36
Met Ser Ser Thr Ala Ile Pro Lys Arg Met Ala Leu Asn Arg Asn Pro
1 5 10 15
Gly Thr Asp Ser Ser Val Pro Ser Val Ser Val Ser Pro Phe Asp Ser
20 25 30
Pro Arg His Ser Pro Ser Ser Thr Ser Leu Ser Ser Leu Ala Ser Glu
35 40 45
Ser Glu Asn Lys Gly Lys Met Leu Asp Thr Tyr Gly Asn Glu Phe Lys
50 55 60
Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp Ala Ile Pro Ala His
65 70 75 80
Cys Tyr Glu Arg Lys Ala Leu Thr Ser Leu Tyr Tyr Val Phe Arg Asp
85 90 95
Ile Ala Met Leu Gly Ser Ile Phe Tyr Val Phe His Asn Tyr Val Thr
100 105 110
Pro Glu Thr Val Pro Ser Phe Pro Ala Arg Val Ala Leu Trp Ser Leu
115 120 125
Tyr Thr Val Val Gln Gly Leu Ile Ala Thr Gly Val Trp Val Leu Ala
130 135 140
His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys Val Leu Asn Asp
145 150 155 160
Thr Val Gly Trp Ile Cys His Ser Ala Leu Leu Val Pro Tyr Phe Ser
165 170 175
Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly Asn Ile Ala
180 185 190
Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Glu Tyr Ala Ser Arg
195 200 205
Ile Gly Lys Thr Ile His Asp Leu Asn Glu Leu Met Glu Glu Thr Pro
210 215 220
Ile Ala Thr Val Thr Asn Leu Ile Leu Gln Gln Leu Phe Gly Trp Pro
225 230 235 240
Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn Asn His Glu Arg Gln
245 250 255
Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe Gly Gly Val
260 265 270
Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Ala Lys Asp Ala Lys
275 280 285
Leu Ile Val Leu Ser Asp Leu Gly Leu Ala Ile Thr Gly Ser Val Leu
290 295 300
Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn Leu Leu Val Trp Tyr
305 310 315 320
Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr
325 330 335
Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro Glu Val Trp
340 345 350
Asn Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Asp Phe Gly Phe
355 360 365
Val Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His Val Leu His
370 375 380
His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu
385 390 395 400
Ala Ile Gln Lys Val Met Gly Ser His Tyr Arg Thr Glu Ala His Thr
405 410 415
Gly Trp Thr Gly Phe Phe Lys Ala Leu Phe Thr Ser Ala Arg Val Cys
420 425 430
His Trp Val Glu Pro Thr Glu Gly Ala Arg Gly Glu Ser Glu Gly Val
435 440 445
Leu Phe Tyr Arg Asn Thr Asn Gly Ile Gly Val Pro Pro Ala Lys Leu
450 455 460
Ser Lys
465
<210> 37
<211> 424
<212> PRT
<213> Aspergillus fumigatus
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 37
Met Ala Ser Asp Ala Glu Lys Thr Ser Ser Lys Met Ile Asp Thr Tyr
1 5 10 15
Gly Asn Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp
20 25 30
Ala Ile Pro Ala His Cys Tyr Gln Arg Ser Ala Ala Thr Ser Leu Tyr
35 40 45
Tyr Val Phe Arg Asp Met Ala Ile Leu Ala Ser Val Phe Tyr Val Phe
50 55 60
His Asn Tyr Val Thr Pro Glu Thr Val Pro Ser Met Pro Val Arg Val
65 70 75 80
Val Leu Trp Thr Ile Tyr Thr Val Val Gln Gly Leu Val Gly Thr Gly
85 90 95
Val Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser
100 105 110
Lys Val Leu Asn Asp Thr Val Gly Trp Ile Cys His Ser Leu Leu Leu
115 120 125
Val Pro Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala
130 135 140
Thr Gly Asn Ile Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu
145 150 155 160
Glu Tyr Ala Thr Arg Ile Gly Arg Ala Ala His Glu Leu Ser Glu Leu
165 170 175
Met Glu Glu Thr Pro Ile Leu Thr Ala Thr Asn Leu Val Leu Gln Gln
180 185 190
Leu Phe Gly Trp Pro Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn
195 200 205
Asn His Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly
210 215 220
Tyr Phe Gly Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu
225 230 235 240
Ala Lys Asp Ala Lys Leu Ile Val Leu Ser Asp Leu Gly Leu Phe Leu
245 250 255
Val Gly Ser Leu Leu Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn
260 265 270
Leu Leu Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu
275 280 285
Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr
290 295 300
Gln Pro Glu Ala Trp Asp Phe Thr Arg Gly Ala Ala Ala Thr Ile Asp
305 310 315 320
Arg Asp Phe Gly Phe Val Gly Arg His Ile Phe His Gly Ile Ile Glu
325 330 335
Thr His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala
340 345 350
Asp Glu Ala Ser Glu Ala Ile Gln Lys Val Met Gly Pro His Tyr Arg
355 360 365
Ser Glu Ala His Thr Gly Trp Thr Gly Phe Leu Lys Ala Leu Trp Thr
370 375 380
Ser Ala Arg Thr Cys Gln Trp Val Glu Pro Thr Glu Gly Ala Lys Gly
385 390 395 400
Glu Ser Gln Tyr Val Leu Phe Tyr Arg Asn Ile Asn Gly Ile Gly Val
405 410 415
Pro Pro Ala Lys Ile Pro Ala Lys
420
<210> 38
<211> 1656
<212> DNA
<213> Magnaporthe grisea
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 38
atgccttcca ccagatcgac cacatcgggc attgcccagg agaagactcc tatgaggcga 60
acgaccacct cggccactgt cgaatcggac gtctcagctc cgggaaccgc tgttcagtcg 120
cctatggact cgccccgcca ctctgcctcg tccacctcac tctcttcact ctcttccgtt 180
gatgcggcgg ccgagaagaa atccaacgag tctgtcggca aactcgtcga cacgtacggc 240
aacacctttg agatccctga cttcaccatc aaggacatcc acgatgccat tccaaagcac 300
tgctttgaac gctctgctat tcgtagcttg agctacgtcg cccgtgatat ggtcctcctg 360
gcgacgacct tctacgtgtt ccacaactac gtgacaccag agtacattcc ctcgaagccg 420
gctcgtgctg gtctgtgggc catttacacg gtgctccagg gcctcttcgg caccggaatc 480
tgggttcttg cccatgagtg tggccaccag gctttctcgc cttccaagac catcaacaac 540
acggttggct ggattctcca ctcgtctctg ctggttccgt acttcagctg gcagatgtca 600
cacagcaagc accacaaggc cactggccat attgagcgcg acatggtctt tgtgccccgc 660
acccgggagg agcacgccag caggatcggc cgcatggtcc acgagctgtc ggagttgacc 720
gaggagacgc ctattgccac ccttatccac ttggttgggc agcagctgat cggctggcct 780
ctgtacatca tcactaacaa gaccggtcac aactaccacg agcgccagcg tgagggccgt 840
ggcaagggca agaagaacgg tcttttcact ggcgtcaacc acttcaaccc cagcagccct 900
ctgtacgaga acaaggacgc cggaaaggtg cttctcagcg acctgggtgt cggccttgtt 960
atcgctggcc tcgtgtacct ttgccaaact ttcggcaccc agaacatgct ggtttggtac 1020
tttatcccct acctctgggt gaaccactgg ctcgttgcca ttacattcct tcagcacacc 1080
gacccctcgc ttccgcacta tactgccgag gaatggaact tcgtccgagg tgccgctgcc 1140
acgatcgatc gcgagtttgg cttcgtcggc cgccacctgc ttcacggtat cattgagacc 1200
cacgtcctgc accactatgt cagcacgatc cccttttaca acgccgacga ggctactgat 1260
gccatcaaga aggtgatggg caagcactac cgcagcgaca ctgccggcgg ccctgctggc 1320
ttccttaagt cactctggac gagtagccgc atgtgccaat gggttgagcc cagcgccgag 1380
gctgagggta gtggcaaggg tgtcctgttc ttccgcaacc acaacaagat cggcactcct 1440
cctatcaaga tgtctgctca gaaaattaga ctatgcaatg accttcttgg catgcataag 1500
ggaaagaatc aaatgaatgg atcaagggag cgccgcggcg gacaaagtag tttaaagagg 1560
gtgagaaatc agcgatcgac aaatatgaac gaatcacaca tgacggtgtt ccgggcattc 1620
cgaacttgga gctcatgcac gcgcgcgtcc acatga 1656
<210> 39
<211> 551
<212> PRT
<213> Magnaporthe grisea
<400> 39
Met Pro Ser Thr Arg Ser Thr Thr Ser Gly Ile Ala Gln Glu Lys Thr
1 5 10 15
Pro Met Arg Arg Thr Thr Thr Ser Ala Thr Val Glu Ser Asp Val Ser
20 25 30
Ala Pro Gly Thr Ala Val Gln Ser Pro Met Asp Ser Pro Arg His Ser
35 40 45
Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Ser Val Asp Ala Ala Ala
50 55 60
Glu Lys Lys Ser Asn Glu Ser Val Gly Lys Leu Val Asp Thr Tyr Gly
65 70 75 80
Asn Thr Phe Glu Ile Pro Asp Phe Thr Ile Lys Asp Ile His Asp Ala
85 90 95
Ile Pro Lys His Cys Phe Glu Arg Ser Ala Ile Arg Ser Leu Ser Tyr
100 105 110
Val Ala Arg Asp Met Val Leu Leu Ala Thr Thr Phe Tyr Val Phe His
115 120 125
Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Lys Pro Ala Arg Ala Gly
130 135 140
Leu Trp Ala Ile Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr Gly Ile
145 150 155 160
Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys
165 170 175
Thr Ile Asn Asn Thr Val Gly Trp Ile Leu His Ser Ser Leu Leu Val
180 185 190
Pro Tyr Phe Ser Trp Gln Met Ser His Ser Lys His His Lys Ala Thr
195 200 205
Gly His Ile Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg Glu Glu
210 215 220
His Ala Ser Arg Ile Gly Arg Met Val His Glu Leu Ser Glu Leu Thr
225 230 235 240
Glu Glu Thr Pro Ile Ala Thr Leu Ile His Leu Val Gly Gln Gln Leu
245 250 255
Ile Gly Trp Pro Leu Tyr Ile Ile Thr Asn Lys Thr Gly His Asn Tyr
260 265 270
His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly Lys Lys Asn Gly Leu
275 280 285
Phe Thr Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Asn
290 295 300
Lys Asp Ala Gly Lys Val Leu Leu Ser Asp Leu Gly Val Gly Leu Val
305 310 315 320
Ile Ala Gly Leu Val Tyr Leu Cys Gln Thr Phe Gly Thr Gln Asn Met
325 330 335
Leu Val Trp Tyr Phe Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val
340 345 350
Ala Ile Thr Phe Leu Gln His Thr Asp Pro Ser Leu Pro His Tyr Thr
355 360 365
Ala Glu Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile Asp Arg
370 375 380
Glu Phe Gly Phe Val Gly Arg His Leu Leu His Gly Ile Ile Glu Thr
385 390 395 400
His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr Asn Ala Asp
405 410 415
Glu Ala Thr Asp Ala Ile Lys Lys Val Met Gly Lys His Tyr Arg Ser
420 425 430
Asp Thr Ala Gly Gly Pro Ala Gly Phe Leu Lys Ser Leu Trp Thr Ser
435 440 445
Ser Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu Gly Ser
450 455 460
Gly Lys Gly Val Leu Phe Phe Arg Asn His Asn Lys Ile Gly Thr Pro
465 470 475 480
Pro Ile Lys Met Ser Ala Gln Lys Ile Arg Leu Cys Asn Asp Leu Leu
485 490 495
Gly Met His Lys Gly Lys Asn Gln Met Asn Gly Ser Arg Glu Arg Arg
500 505 510
Gly Gly Gln Ser Ser Leu Lys Arg Val Arg Asn Gln Arg Ser Thr Asn
515 520 525
Met Asn Glu Ser His Met Thr Val Phe Arg Ala Phe Arg Thr Trp Ser
530 535 540
Ser Cys Thr Arg Ala Ser Thr
545 550
<210> 40
<211> 1446
<212> DNA
<213> Neurospora crassa
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 40
atggcgtccg tctcctctgc ccttcccgag ggcaacaagc ctgccctgcg caggacccaa 60
accgaggcca cctccgactc ataccctggt accgctgatg cctctccctt cgactctccc 120
cttgagcgct cggcctccaa cacctcgctt tcttcccagg cctctgacaa cgtcaagacc 180
gacaaggccg agttcggcaa gctgctcgac acgtatggca acgagttcga ggtccccgac 240
ttcaccatca aggacatccg cgatgccatc cccgcccact gctttgagcg ttcggctctt 300
cacagcttgg cgcacgtcgt ccgcgacatc atttacctca ccgtcacttt ttacgtctgg 360
aacaagtatg tcactcccga gtacatcccc atgaaggctg cccgtgtcgt cctctggggt 420
ctgtacacct tcatgcaggg ccttttcggc accggtctct gggttcttgc ccatgagtgc 480
ggtcaccagg ctttctcccc gtccaggttg atcaacgaca ccgtcggctg ggtcctccac 540
tctgcccttc tcgtccccta cttctcgtgg aagttctccc acagcaagca ccacaaggcc 600
accggcaaca tcgagcgtga catggtcttc gttcctcgga cccgcgagca gtttgcgtct 660
cgcatcggcc gtttcgtcca tgagatttcc gagttgaccg aggagacccc catctacacc 720
ttgatccacc ttatcggtca gcagctcatc ggctggccca actacctcat gaccaacgtc 780
accggccaca acttccacga gaggcagcgc gagggtcgtg gcaagggcaa gaagaacggc 840
tggttcactg gtgtcaacca cttcaacccc agctctcccc tctatgagga gcgtgaggcc 900
ccctggatca tcgtctccga catcggtatc gctatcgccg ccaccgccct catctacctc 960
ggcaacacct tcggctggtc caacatgttc gtctggtact tccttcccta cctctgggtc 1020
aaccactggc ttgttgccat cacctacctc cagcacaccg acccctcgct cccccactac 1080
acccctgatc agtggaactt tgtccgtggt gccgccgcga ctattgaccg cgagttcggc 1140
ttcatcggcc gtcacctcct ccacggcatt atcgagaccc acgttctcca ccactacgtc 1200
agcaccattc ccttttacca cgccgacgag gcctccgagg ccatcaagaa ggtcatgggc 1260
cgtcactacc gcgctgacgt ccaagatggc cccatcggtt tcatcaaggc catgtggaag 1320
gctgctcgtt ggtgccagtg ggttgagcct accgagggcg ctgagggtaa gggcaagggc 1380
gtcttgttct accgcaacca gaacggtctc ggtgtcaagc ctgccaagct ccccaaaacc 1440
aactaa 1446
<210> 41
<211> 481
<212> PRT
<213> Neurospora crassa
<400> 41
Met Ala Ser Val Ser Ser Ala Leu Pro Glu Gly Asn Lys Pro Ala Leu
1 5 10 15
Arg Arg Thr Gln Thr Glu Ala Thr Ser Asp Ser Tyr Pro Gly Thr Ala
20 25 30
Asp Ala Ser Pro Phe Asp Ser Pro Leu Glu Arg Ser Ala Ser Asn Thr
35 40 45
Ser Leu Ser Ser Gln Ala Ser Asp Asn Val Lys Thr Asp Lys Ala Glu
50 55 60
Phe Gly Lys Leu Leu Asp Thr Tyr Gly Asn Glu Phe Glu Val Pro Asp
65 70 75 80
Phe Thr Ile Lys Asp Ile Arg Asp Ala Ile Pro Ala His Cys Phe Glu
85 90 95
Arg Ser Ala Leu His Ser Leu Ala His Val Val Arg Asp Ile Ile Tyr
100 105 110
Leu Thr Val Thr Phe Tyr Val Trp Asn Lys Tyr Val Thr Pro Glu Tyr
115 120 125
Ile Pro Met Lys Ala Ala Arg Val Val Leu Trp Gly Leu Tyr Thr Phe
130 135 140
Met Gln Gly Leu Phe Gly Thr Gly Leu Trp Val Leu Ala His Glu Cys
145 150 155 160
Gly His Gln Ala Phe Ser Pro Ser Arg Leu Ile Asn Asp Thr Val Gly
165 170 175
Trp Val Leu His Ser Ala Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe
180 185 190
Ser His Ser Lys His His Lys Ala Thr Gly Asn Ile Glu Arg Asp Met
195 200 205
Val Phe Val Pro Arg Thr Arg Glu Gln Phe Ala Ser Arg Ile Gly Arg
210 215 220
Phe Val His Glu Ile Ser Glu Leu Thr Glu Glu Thr Pro Ile Tyr Thr
225 230 235 240
Leu Ile His Leu Ile Gly Gln Gln Leu Ile Gly Trp Pro Asn Tyr Leu
245 250 255
Met Thr Asn Val Thr Gly His Asn Phe His Glu Arg Gln Arg Glu Gly
260 265 270
Arg Gly Lys Gly Lys Lys Asn Gly Trp Phe Thr Gly Val Asn His Phe
275 280 285
Asn Pro Ser Ser Pro Leu Tyr Glu Glu Arg Glu Ala Pro Trp Ile Ile
290 295 300
Val Ser Asp Ile Gly Ile Ala Ile Ala Ala Thr Ala Leu Ile Tyr Leu
305 310 315 320
Gly Asn Thr Phe Gly Trp Ser Asn Met Phe Val Trp Tyr Phe Leu Pro
325 330 335
Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His
340 345 350
Thr Asp Pro Ser Leu Pro His Tyr Thr Pro Asp Gln Trp Asn Phe Val
355 360 365
Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Arg
370 375 380
His Leu Leu His Gly Ile Ile Glu Thr His Val Leu His His Tyr Val
385 390 395 400
Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu Ala Ile Lys
405 410 415
Lys Val Met Gly Arg His Tyr Arg Ala Asp Val Gln Asp Gly Pro Ile
420 425 430
Gly Phe Ile Lys Ala Met Trp Lys Ala Ala Arg Trp Cys Gln Trp Val
435 440 445
Glu Pro Thr Glu Gly Ala Glu Gly Lys Gly Lys Gly Val Leu Phe Tyr
450 455 460
Arg Asn Gln Asn Gly Leu Gly Val Lys Pro Ala Lys Leu Pro Lys Thr
465 470 475 480
Asn
<210> 42
<211> 1371
<212> DNA
<213> Fusarium graminearium
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 42
tcaaccacgg cgacggatac tgagtctgct gccgtttctc cttcagactc tccccgccat 60
tcggcctctt ccacctcgct ctcgtctctt tccgagattg atatcgccaa gcccaaggcc 120
gaatatggtg ttatgcttga cacctatggc aacaagttcg aggttcccga cttcaccatc 180
aaggagatct acaatgccat ccccaagcac tgcttccagc gctccgctct caagggatac 240
ggatacatcc tccgcgacat tgtccttctt gctaccacct ttagcatctg gtacaactat 300
gtgacccccg agtacatccc tagcactccc gcccgcgctg gtctctgggc tgtctacact 360
gttctccagg gtcttttcgg taccggtctc tgggtcatcg ctcacgagtg tggccacggt 420
gctttctccg actctcgcct tatcaacgac atcaccggct gggtcctcca ctcttctctc 480
ctcgtcccct acttcagctg gcaaatctcc caccgaaagc accacaaggc taccggaaac 540
atggagcgtg acatggtctt tgttccccga actcgcgagc agcaggctac tcgtctcggc 600
aagatgaccc acgagcttgc tcacctcact gaggagaccc ccgtcttcac tctgatcatg 660
cttgttctcc agcagctcgt cggctggccc aactacctca tgaccaacgt tactggccac 720
aactaccacg agcgtcagaa ggagggccgt ggcaagggca agcacaacgg tctcggcggc 780
ggtgtcaacc actttgatcc ccgcagccct ctttacgagc acagcgatgc taagctcatt 840
gtcttgagtg atattggtat cggtctgatg ggtaccgctc tgtacttcct cgtccagaag 900
tttggctttt acaacatggc catctggtac tttgtccctt acctttgggt caaccactgg 960
ctcgtcgcca ttactttcct ccagcacacc gaccctaccc ttccccacta caccaacgac 1020
gagtggaact ttgtccgcgg tgctgctgct accatcgatc gtgagatggg tttcattggc 1080
cgacacctcc tccacggtat catcgagact cacgtcctcc accactacgt cagcagcatc 1140
cccttctaca acgccgacga ggctaccgag gctatcaagc ctgtcatggg caagcactac 1200
cgtgccgacg tccaggatgg tccccgtggt ttcattcgtg ccatgtaccg cagtgcccgt 1260
atgtgccagt gggttgagcc cagcgctgag gccgagggtg ctggcaaggg tgttctgttc 1320
ttccgcaacc gcaacaaggt tggcactgct cctgccgtcc tcaaggctta g 1371
<210> 43
<211> 456
<212> PRT
<213> Fusarium graminearium
<400> 43
Ser Thr Thr Ala Thr Asp Thr Glu Ser Ala Ala Val Ser Pro Ser Asp
1 5 10 15
Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Glu
20 25 30
Ile Asp Ile Ala Lys Pro Lys Ala Glu Tyr Gly Val Met Leu Asp Thr
35 40 45
Tyr Gly Asn Lys Phe Glu Val Pro Asp Phe Thr Ile Lys Glu Ile Tyr
50 55 60
Asn Ala Ile Pro Lys His Cys Phe Gln Arg Ser Ala Leu Lys Gly Tyr
65 70 75 80
Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Ala Thr Thr Phe Ser Ile
85 90 95
Trp Tyr Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Thr Pro Ala Arg
100 105 110
Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr
115 120 125
Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala Phe Ser Asp
130 135 140
Ser Arg Leu Ile Asn Asp Ile Thr Gly Trp Val Leu His Ser Ser Leu
145 150 155 160
Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys His His Lys
165 170 175
Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg
180 185 190
Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu Leu Ala His
195 200 205
Leu Thr Glu Glu Thr Pro Val Phe Thr Leu Ile Met Leu Val Leu Gln
210 215 220
Gln Leu Val Gly Trp Pro Asn Tyr Leu Met Thr Asn Val Thr Gly His
225 230 235 240
Asn Tyr His Glu Arg Gln Lys Glu Gly Arg Gly Lys Gly Lys His Asn
245 250 255
Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser Pro Leu Tyr
260 265 270
Glu His Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile Gly Ile Gly
275 280 285
Leu Met Gly Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe Gly Phe Tyr
290 295 300
Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val Asn His Trp
305 310 315 320
Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His
325 330 335
Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile
340 345 350
Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His Gly Ile Ile
355 360 365
Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro Phe Tyr Asn
370 375 380
Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Val Met Gly Lys His Tyr
385 390 395 400
Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg Ala Met Tyr
405 410 415
Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu
420 425 430
Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn Lys Val Gly
435 440 445
Thr Ala Pro Ala Val Leu Lys Ala
450 455
<210> 44
<211> 1403
<212> DNA
<213> Mortierella alpina (GenBank Accession No. AB020033)
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 44
ctcctcccac caccctccga gacgactgca actgtaatca ggaaccgaaa aatatacgat 60
ttctttttac tcagcaccaa ctcaaaatct tcagcagcaa ccctttttca ggatggcacc 120
tcccaacact attgatgccg gtttgaccca gcgccatatc agcacctcgg ccgccccaac 180
ctctgccaag cccgccttcg agcgcaacta ccagctccct gagttcacca tcaaggagat 240
ccgtgagtgc atccctgcac actgctttga gcgctccggt ctccgtggtc tttgccacgt 300
tgctattgat ctgacctggg cctcgctctt gttcctggct gcgacccaga tcgacaagtt 360
cgagaaccct ttgatccgct acttggcctg gcctgcgtat tggatcatgc agggtattgt 420
ttgcaccggt atctgggtat tggcacacga atgtggtcat cagtccttct cgacctccaa 480
gacccttaac aacactgtcg gctggatctt gcactcgatg ctcttggtcc cttaccactc 540
ctggagaatc tcgcactcga agcaccacaa ggccactggc cacatgacca aggaccaggt 600
ctttgttccc aagacccgct ctcaggttgg cttgcccccc aaggagaatg ttgcagttgc 660
cgttcaggag gaggatatgt ccgtgcacct ggatgaggag gcccccattg tgactttgtt 720
ctggatggtg attcagttcc tgttcggatg gcctgcgtac cttattatga acgcctctgg 780
tcaagactat ggccgctgga cctcgcactt ccacacctac tctcctatct ttgagccccg 840
caactttttc gacattatca tttcggatct cggtgtgttg gctgctcttg gtaccttgat 900
ctacgcctcc atgcagctct cgctcttgac cgtgaccaag tactacattg tcccctactt 960
gtttgtcaac ttctggttgg tcctgatcac cttcttgcag cacaccgacc ctaagctgcc 1020
ccattaccgt gagggtgcct ggaacttcca gcgtggagcc ctctgcaccg ttgaccgctc 1080
gttcggcaag ttcttggacc atatgttcca cggcattgtc catacccatg tagcccatca 1140
cttgttctcg cagatgccgt tctaccatgc tgaggaagcc acccatcatc tcaagaaact 1200
gctgggagag tactacgtct atgacccatc gccgattgtt gttgcggtct ggaggtcgtt 1260
ccgtgaatgc cgattcgtgg aagaccatgg agacgtggtc tttttcaaga agtaaagaag 1320
catttaccgg acacaacttt gtctttacac gcctacgtac tgagtagcca tcccacttta 1380
taaaagattt cagttccagc agc 1403
<210> 45
<211> 400
<212> PRT
<213> Mortierella alpina (GenBank Accession No. AB020033)
<220>
<221> MISC_FEATURE
<223> delta-12 desaturase
<400> 45
Met Ala Pro Pro Asn Thr Ile Asp Ala Gly Leu Thr Gln Arg His Ile
1 5 10 15
Ser Thr Ser Ala Ala Pro Thr Ser Ala Lys Pro Ala Phe Glu Arg Asn
20 25 30
Tyr Gln Leu Pro Glu Phe Thr Ile Lys Glu Ile Arg Glu Cys Ile Pro
35 40 45
Ala His Cys Phe Glu Arg Ser Gly Leu Arg Gly Leu Cys His Val Ala
50 55 60
Ile Asp Leu Thr Trp Ala Ser Leu Leu Phe Leu Ala Ala Thr Gln Ile
65 70 75 80
Asp Lys Phe Glu Asn Pro Leu Ile Arg Tyr Leu Ala Trp Pro Ala Tyr
85 90 95
Trp Ile Met Gln Gly Ile Val Cys Thr Gly Ile Trp Val Leu Ala His
100 105 110
Glu Cys Gly His Gln Ser Phe Ser Thr Ser Lys Thr Leu Asn Asn Thr
115 120 125
Val Gly Trp Ile Leu His Ser Met Leu Leu Val Pro Tyr His Ser Trp
130 135 140
Arg Ile Ser His Ser Lys His His Lys Ala Thr Gly His Met Thr Lys
145 150 155 160
Asp Gln Val Phe Val Pro Lys Thr Arg Ser Gln Val Gly Leu Pro Pro
165 170 175
Lys Glu Asn Val Ala Val Ala Val Gln Glu Glu Asp Met Ser Val His
180 185 190
Leu Asp Glu Glu Ala Pro Ile Val Thr Leu Phe Trp Met Val Ile Gln
195 200 205
Phe Leu Phe Gly Trp Pro Ala Tyr Leu Ile Met Asn Ala Ser Gly Gln
210 215 220
Asp Tyr Gly Arg Trp Thr Ser His Phe His Thr Tyr Ser Pro Ile Phe
225 230 235 240
Glu Pro Arg Asn Phe Phe Asp Ile Ile Ile Ser Asp Leu Gly Val Leu
245 250 255
Ala Ala Leu Gly Thr Leu Ile Tyr Ala Ser Met Gln Leu Ser Leu Leu
260 265 270
Thr Val Thr Lys Tyr Tyr Ile Val Pro Tyr Leu Phe Val Asn Phe Trp
275 280 285
Leu Val Leu Ile Thr Phe Leu Gln His Thr Asp Pro Lys Leu Pro His
290 295 300
Tyr Arg Glu Gly Ala Trp Asn Phe Gln Arg Gly Ala Leu Cys Thr Val
305 310 315 320
Asp Arg Ser Phe Gly Lys Phe Leu Asp His Met Phe His Gly Ile Val
325 330 335
His Thr His Val Ala His His Leu Phe Ser Gln Met Pro Phe Tyr His
340 345 350
Ala Glu Glu Ala Thr His His Leu Lys Lys Leu Leu Gly Glu Tyr Tyr
355 360 365
Val Tyr Asp Pro Ser Pro Ile Val Val Ala Val Trp Arg Ser Phe Arg
370 375 380
Glu Cys Arg Phe Val Glu Asp His Gly Asp Val Val Phe Phe Lys Lys
385 390 395 400
<210> 46
<211> 416
<212> PRT
<213> Saccharomyces kluyveri (GenBank Accession No. BAD08375)
<220>
<221> MISC_FEATURE
<223> delta-12 desaturase
<400> 46
Met Ser Ala Val Thr Val Thr Gly Ser Asp Pro Lys Asn Arg Gly Ser
1 5 10 15
Ser Ser Asn Thr Glu Gln Glu Val Pro Lys Val Ala Ile Asp Thr Asn
20 25 30
Gly Asn Val Phe Ser Val Pro Asp Phe Thr Ile Lys Asp Ile Leu Gly
35 40 45
Ala Ile Pro His Glu Cys Tyr Glu Arg Arg Leu Ala Thr Ser Leu Tyr
50 55 60
Tyr Val Phe Arg Asp Ile Phe Cys Met Leu Thr Thr Gly Tyr Leu Thr
65 70 75 80
His Lys Ile Leu Tyr Pro Leu Leu Ile Ser Tyr Thr Ser Asn Ser Ile
85 90 95
Ile Lys Phe Thr Phe Trp Ala Leu Tyr Thr Tyr Val Gln Gly Leu Phe
100 105 110
Gly Thr Gly Ile Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe
115 120 125
Ser Asp Tyr Gly Ile Val Asn Asp Phe Val Gly Trp Thr Leu His Ser
130 135 140
Tyr Leu Met Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Gly Lys His
145 150 155 160
His Lys Ala Thr Gly His Met Thr Arg Asp Met Val Phe Val Pro Ala
165 170 175
Thr Lys Glu Glu Phe Lys Lys Ser Arg Asn Phe Phe Gly Asn Leu Ala
180 185 190
Glu Tyr Ser Glu Asp Ser Pro Leu Arg Thr Leu Tyr Glu Leu Leu Val
195 200 205
Gln Gln Leu Gly Gly Trp Ile Ala Tyr Leu Phe Val Asn Val Thr Gly
210 215 220
Gln Pro Tyr Pro Asp Val Pro Ser Trp Lys Trp Asn His Phe Trp Leu
225 230 235 240
Thr Ser Pro Leu Phe Glu Gln Arg Asp Ala Leu Tyr Ile Phe Leu Ser
245 250 255
Asp Leu Gly Ile Leu Thr Gln Gly Ile Val Leu Thr Leu Trp Tyr Lys
260 265 270
Lys Phe Gly Gly Trp Ser Leu Phe Ile Asn Trp Phe Val Pro Tyr Ile
275 280 285
Trp Val Asn His Trp Leu Val Phe Ile Thr Phe Leu Gln His Thr Asp
290 295 300
Pro Thr Met Pro His Tyr Asn Ala Glu Glu Trp Thr Phe Ala Lys Gly
305 310 315 320
Ala Ala Ala Thr Ile Asp Arg Lys Phe Gly Phe Ile Gly Pro His Ile
325 330 335
Phe His Asp Ile Ile Glu Thr His Val Leu His His Tyr Cys Ser Arg
340 345 350
Ile Pro Phe Tyr Asn Ala Arg Pro Ala Ser Glu Ala Ile Lys Lys Val
355 360 365
Met Gly Lys His Tyr Arg Ser Ser Asp Glu Asn Met Trp Lys Ser Leu
370 375 380
Trp Lys Ser Phe Arg Ser Cys Gln Tyr Val Asp Gly Asp Asn Gly Val
385 390 395 400
Leu Met Phe Arg Asn Ile Asn Asn Cys Gly Val Gly Ala Ala Glu Lys
405 410 415
<210> 47
<211> 1948
<212> DNA
<213> Kluyveromyces lactis (gnl|GLV|KLLA0B00473g)
<220>
<221> misc_feature
<223> delta-12 desaturase
<400> 47
gaaaaaaaac aaacacagtc tcgaagaaga ttcagacaaa cagtagcaca agactatttt 60
ctacaccgac gaatgttcgt actaccgcgt tacttggcga acaccgccca tgcttaatgt 120
gaaaaagcac acacattgat gcgtgtagct agaccaattg caacccatta gatttactgc 180
agaaagagga aaagtgctac tttttttcag tcaatggtat cacaattggc gatgagcctt 240
gacgaaagga agcagcgata aaaagaaaat ggattaaaaa aaatgtcctg cttagttatg 300
ggcaattgat agttttactt caaatatcgt ttgaagattt ccgttcagtc agtttccatt 360
cacatttggc ttcagcttat ataaatataa tatataaaga attttatgat catgatatat 420
gatcattact ttacctaagt ggaagattaa gtggtagttg tacatcatat acacccgcag 480
aacgtagcta gacagaccca atgagcaaaa gcaccggcgt cgagcatcat atcagtggtg 540
ttgctactac agaaacggca acagagacag ttactgttcc tcctgccaag acagctattg 600
acacacatgg taacatcttc aaggttccag actatactat caaagacatc ctaggtgcca 660
tcccaaagga gtgttacaag agagacactc tttggtcatt gcattatgtg gtaagagata 720
ttattgccat ctgtattatt gggtatgttg gtaccaacta cattccagtt tggtttccaa 780
atagtggtct cctaagattt gttgcctata tggtgcaatc atacttaatt gggttatttg 840
gttttgggtt gtggattttg gctcacgaat gcggtcatgg tgccttctct gattcaagat 900
taatcaacga taccgttggg tgggttttgc actcatggtg gatggtccca tacttttctt 960
ggaaattctc tcactctaag catcataaag ctaccggtca tttgactaga gatatggttt 1020
ttgttccata cacgaaaaaa gaatacttgg aaatgaaggg taaatcaaaa ctaagggaga 1080
tcaccgaaga agcaccaatt gtaactttat taactttgat tggccaacaa attggtggtt 1140
tgcagttgta tttagcaaca aatgccactg gccaatctta tcctggtgtt cctaaattct 1200
tcaaatccca ttactggcct acttctccgg tgttcgatac caaggacttc tggtacatca 1260
ttctgagtga cattggtatt atttccacac ttacaatcaa ttatttgtgg gcaaagacct 1320
atggctccca tgtcatgttg atcaactggt ttgttccatg gttatgggtt aaccactggt 1380
tagtatttgt cacatttttg caacacactg acccaaccat gcctcattac gaagccagtg 1440
aatggacctt cgctaaaggt gctgctgcca ccattgatag aaactttggc tttgttggtc 1500
aacatatttt ccacgatatt attgaaacgc atgttttgca tcattactgt tcaagaattc 1560
ctttctacaa cgctcgtgta gccactgaag ctattaagaa agttatgggt gaacattatc 1620
gttatgaagg cgaaaatatg tggcaatcat tatggaaggt ggcaagatcc tgtcagtttg 1680
tagatggtga caacggtgtt ttgatgttca gaaacacaaa cggagtcgga gcaccatgtc 1740
aagaatgagt gcacatagag tatcaatttt tcattcatca agttcattcc cttatcatta 1800
tcattcttat tattatttat cttaactgta cattaaaatt ttacccgatg caaaatatca 1860
accgaatgtg cttatgccac gtcggttaat tggaaaatat taatcttacc agtcaaattg 1920
ctttactctc aaaatttttg ataggagt 1948
<210> 48
<211> 415
<212> PRT
<213> Kluyveromyces lactis (gnl|GLV|KLLA0B00473g)
<220>
<221> MISC_FEATURE
<223> delta-12 desaturase
<400> 48
Met Ser Lys Ser Thr Gly Val Glu His His Ile Ser Gly Val Ala Thr
1 5 10 15
Thr Glu Thr Ala Thr Glu Thr Val Thr Val Pro Pro Ala Lys Thr Ala
20 25 30
Ile Asp Thr His Gly Asn Ile Phe Lys Val Pro Asp Tyr Thr Ile Lys
35 40 45
Asp Ile Leu Gly Ala Ile Pro Lys Glu Cys Tyr Lys Arg Asp Thr Leu
50 55 60
Trp Ser Leu His Tyr Val Val Arg Asp Ile Ile Ala Ile Cys Ile Ile
65 70 75 80
Gly Tyr Val Gly Thr Asn Tyr Ile Pro Val Trp Phe Pro Asn Ser Gly
85 90 95
Leu Leu Arg Phe Val Ala Tyr Met Val Gln Ser Tyr Leu Ile Gly Leu
100 105 110
Phe Gly Phe Gly Leu Trp Ile Leu Ala His Glu Cys Gly His Gly Ala
115 120 125
Phe Ser Asp Ser Arg Leu Ile Asn Asp Thr Val Gly Trp Val Leu His
130 135 140
Ser Trp Trp Met Val Pro Tyr Phe Ser Trp Lys Phe Ser His Ser Lys
145 150 155 160
His His Lys Ala Thr Gly His Leu Thr Arg Asp Met Val Phe Val Pro
165 170 175
Tyr Thr Lys Lys Glu Tyr Leu Glu Met Lys Gly Lys Ser Lys Leu Arg
180 185 190
Glu Ile Thr Glu Glu Ala Pro Ile Val Thr Leu Leu Thr Leu Ile Gly
195 200 205
Gln Gln Ile Gly Gly Leu Gln Leu Tyr Leu Ala Thr Asn Ala Thr Gly
210 215 220
Gln Ser Tyr Pro Gly Val Pro Lys Phe Phe Lys Ser His Tyr Trp Pro
225 230 235 240
Thr Ser Pro Val Phe Asp Thr Lys Asp Phe Trp Tyr Ile Ile Leu Ser
245 250 255
Asp Ile Gly Ile Ile Ser Thr Leu Thr Ile Asn Tyr Leu Trp Ala Lys
260 265 270
Thr Tyr Gly Ser His Val Met Leu Ile Asn Trp Phe Val Pro Trp Leu
275 280 285
Trp Val Asn His Trp Leu Val Phe Val Thr Phe Leu Gln His Thr Asp
290 295 300
Pro Thr Met Pro His Tyr Glu Ala Ser Glu Trp Thr Phe Ala Lys Gly
305 310 315 320
Ala Ala Ala Thr Ile Asp Arg Asn Phe Gly Phe Val Gly Gln His Ile
325 330 335
Phe His Asp Ile Ile Glu Thr His Val Leu His His Tyr Cys Ser Arg
340 345 350
Ile Pro Phe Tyr Asn Ala Arg Val Ala Thr Glu Ala Ile Lys Lys Val
355 360 365
Met Gly Glu His Tyr Arg Tyr Glu Gly Glu Asn Met Trp Gln Ser Leu
370 375 380
Trp Lys Val Ala Arg Ser Cys Gln Phe Val Asp Gly Asp Asn Gly Val
385 390 395 400
Leu Met Phe Arg Asn Thr Asn Gly Val Gly Ala Pro Cys Gln Glu
405 410 415
<210> 49
<211> 436
<212> PRT
<213> Candida albicans SC5314 (GenBank Accession No. EAK94955)
<220>
<221> MISC_FEATURE
<223> delta-12 desaturase
<400> 49
Met Ala Ala Ala Thr Thr Ser Phe Ser Ser Gly Phe Asn Asn Asn Asn
1 5 10 15
Asn Ala Asp Gln Ser Thr Asp Ser Ser Ala Thr Ile Ser Lys Ser Gly
20 25 30
Asn Val Ala Ser Phe Lys Thr Thr Ser Thr Thr Ser Thr Tyr Gln Thr
35 40 45
Asn Leu Thr Ala Ile Asp Thr Tyr Gly Asn Glu Phe Lys Val Pro Asp
50 55 60
Tyr Thr Ile Lys Asp Ile Leu Ser Ala Ile Pro Thr His Cys Tyr Glu
65 70 75 80
Arg Arg Leu Leu Gln Ser Leu Ser Tyr Val Phe Arg Asp Ile Phe Cys
85 90 95
Met Val Val Leu Gly Phe Ile Ala Asn Asn Tyr Ile His Leu Ile Pro
100 105 110
Asn Gln Phe Ile Arg Phe Ala Ala Trp Thr Gly Tyr Val Trp Cys Gln
115 120 125
Gly Leu Phe Gly Thr Gly Ile Trp Val Leu Ala His Glu Cys Gly His
130 135 140
Gln Ala Phe Ser Asp Tyr Gly Ser Val Asn Asp Phe Val Gly Trp Val
145 150 155 160
Leu His Ser Tyr Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe Ser His
165 170 175
Gly Lys His His Lys Ala Thr Gly His Leu Thr Arg Asp Met Val Phe
180 185 190
Val Pro Lys Thr Lys Glu Glu Phe Leu Gln Asn Arg Gly Val Lys Asp
195 200 205
Leu Asp Asp Leu Leu Gly Asp Ser Pro Met Tyr Ser Leu Leu Thr Leu
210 215 220
Ile Phe Gln Gln Thr Phe Gly Trp Ile Ser Tyr Leu Val Ala Asn Val
225 230 235 240
Ser Gly Gln Lys Tyr Pro Gly Val Ser Phe Leu Lys Leu Asn His Phe
245 250 255
Asn Pro Asn Ser Leu Ile Phe Asp Lys Lys Asp Tyr Trp Tyr Ile Leu
260 265 270
Leu Ser Asp Leu Gly Ile Leu Leu Gln Phe Phe Asn Leu Tyr Val Trp
275 280 285
Tyr Gln Ser Phe Gly Gly Phe Asn Leu Leu Val Asn Tyr Val Leu Pro
290 295 300
Tyr Phe Leu Val Asn His Trp Leu Val Phe Ile Thr Tyr Leu Gln His
305 310 315 320
Ser Asp Pro Gln Met Pro His Tyr Glu Ala Ser Gln Trp Thr Phe Ala
325 330 335
Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Val Gly Lys
340 345 350
His Ile Phe His Asp Ile Ile Glu Thr His Val Leu His His Tyr Val
355 360 365
Ser Arg Ile Pro Phe Tyr Asn Ala Arg Glu Ala Ser Glu Ala Ile Lys
370 375 380
Lys Val Met Gly Ile His Tyr Gln His Ser Asp Glu Asn Met Trp Val
385 390 395 400
Ser Leu Trp Lys Ser Ala Arg Trp Cys Gln Phe Val Asp Gly Asn Asn
405 410 415
Gly Val Leu Met Tyr Arg Asn Thr Asn Gly Phe Gly Val Asp Pro Lys
420 425 430
Lys Gln Thr His
435
<210> 50
<211> 416
<212> PRT
<213> Debaryomyces hansenii CBS767 (GenBank Accession No. CAG90237)
<220>
<221> MISC_FEATURE
<223> delta-12 desaturase
<400> 50
Met Ala Ser Gln Ile Ala Ser Ser Thr Lys Ser Ser Gly Ile Gly Gly
1 5 10 15
Ser Ser Ser Ile Gln Lys Arg Gly Asn Val Ala Thr Leu Gln Thr Asn
20 25 30
Glu Asn Leu Thr Ala Ile Asp Ala His Gly Asn Val Phe Lys Val Pro
35 40 45
Asp Tyr Thr Ile Lys Asp Ile Leu Lys Ala Ile Pro Ala His Cys Tyr
50 55 60
Glu Arg Arg Val Ala Glu Ser Met Tyr Tyr Val Phe Arg Asp Ile Phe
65 70 75 80
Trp Leu Leu Thr Ile Gly Tyr Val Ala Asn Asn Tyr Ile Gln Leu Leu
85 90 95
Pro Asn Ala Phe Thr Arg Phe Val Ala Trp Ser Gly Tyr Val Tyr Val
100 105 110
Gln Ser Leu Phe Leu Thr Gly Leu Trp Val Leu Ala His Glu Cys Gly
115 120 125
His Gln Ala Phe Ser Asp Tyr Gly Trp Val Asn Asp Thr Val Gly Trp
130 135 140
Val Leu His Ser Tyr Leu Met Val Pro Tyr Phe Ser Trp Lys Phe Ser
145 150 155 160
His Ser Lys His His Lys Ala Thr Gly His Leu Thr Arg Asp Met Val
165 170 175
Phe Val Pro Tyr Thr Lys Glu Glu Phe Val Ala Ser Lys Asn Ala His
180 185 190
His Ile Asp Asp Ile Val Gly Asp Ser Pro Ile Tyr Thr Leu Tyr Gln
195 200 205
Leu Val Val Gln Gln Phe Gly Gly Trp Ile Ala Tyr Leu Phe Thr Asn
210 215 220
Val Thr Gly Gln Gln Tyr Glu Asn Lys Ser Phe Trp Gly Val Ser His
225 230 235 240
Phe Asn Pro Asn Ala Ala Ile Phe Glu Lys Lys Glu Gln Trp Tyr Val
245 250 255
Leu Leu Ser Asp Ile Gly Ile Phe Ala Gln Gly Leu Val Leu His Thr
260 265 270
Trp Tyr Lys Asn Phe Gly Gly Phe Asn Leu Leu Val Asn Trp Phe Leu
275 280 285
Pro Tyr Ile Leu Val Asn His Trp Leu Val Phe Ile Thr Tyr Leu Gln
290 295 300
His Thr Asp Ser Gln Met Pro His Tyr Glu Ser His Gln Trp Asn Phe
305 310 315 320
Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Val Gly
325 330 335
Lys Phe Met Phe His Asp Ile Ile Glu Thr His Val Leu His His Tyr
340 345 350
Cys Ser Arg Ile Pro Phe Tyr Asn Gly Arg Glu Ala Ser Glu Ala Ile
355 360 365
Lys Lys Val Met Gly Glu His Tyr Gln Tyr Ser Asp Glu Asn Met Trp
370 375 380
Val Ser Leu Trp Lys Ser Ala Arg Thr Cys Gln Tyr Val Asp Gly Asp
385 390 395 400
Asn Gly Val Leu Met Phe Arg Asn Ala Ala Phe Lys Gly Pro Lys Ala
405 410 415
<210> 51
<211> 1209
<212> DNA
<213> Fusarium monoliforme
<220>
<221> misc_feature
<223> delta-15 desaturase
<400> 51
atggcgactc gacagcgaac tgccaccact gttgtggtcg aggaccttcc caaggtcact 60
cttgaggcca agtctgaacc tgtgttcccc gatatcaaga ccatcaagga tgccattccc 120
gcgcactgct tccagccctc gctcgtcacc tcattctact acgtcttccg cgattttgcc 180
atggtctctg ccctcgtctg ggctgctctc acctacatcc ccagcatccc cgaccagacc 240
ctccgcgtcg cagcttggat ggtctacggc ttcgtccagg gtctgttctg caccggtgtc 300
tggattctcg gccatgagtg cggccacggt gctttctctc tccacggaaa ggtcaacaat 360
gtgaccggct ggttcctcca ctcgttcctc ctcgtcccct acttcagctg gaagtactct 420
caccaccgcc accaccgctt caccggccac atggatctcg acatggcttt cgtccccaag 480
actgagccca agccctccaa gtcgctcatg attgctggca ttgacgtcgc cgagcttgtt 540
gaggacaccc ccgctgctca gatggtcaag ctcatcttcc accagctttt cggatggcag 600
gcgtacctct tcttcaacgc tagctctggc aagggcagca agcagtggga gcccaagact 660
ggcctctcca agtggttccg agtcagtcac ttcgagccta ccagcgctgt cttccgcccc 720
aacgaggcca tcttcatcct catctccgat atcggtcttg ctctaatggg aactgctctg 780
tactttgctt ccaagcaagt tggtgtttcg accattctct tcctctacct tgttccctac 840
ctgtgggttc accactggct cgttgccatt acctacctcc accaccacca caccgagctc 900
cctcactaca ccgctgaggg ctggacctac gtcaagggag ctctcgccac tgtcgaccgt 960
gagtttggct tcatcggaaa gcacctcttc cacggtatca ttgagaagca cgttgttcac 1020
catctcttcc ctaagatccc cttctacaag gctgacgagg ccaccgaggc catcaagccc 1080
gtcattggcg accactactg ccacgacgac cgaagcttcc tgggccagct gtggaccatc 1140
ttcggcacgc tcaagtacgt cgagcacgac cctgcccgac ccggtgccat gcgatggaac 1200
aaggactag 1209
<210> 52
<211> 402
<212> PRT
<213> Fusarium monoliforme
<400> 52
Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Asp Leu
1 5 10 15
Pro Lys Val Thr Leu Glu Ala Lys Ser Glu Pro Val Phe Pro Asp Ile
20 25 30
Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser Leu
35 40 45
Val Thr Ser Phe Tyr Tyr Val Phe Arg Asp Phe Ala Met Val Ser Ala
50 55 60
Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Ser Ile Pro Asp Gln Thr
65 70 75 80
Leu Arg Val Ala Ala Trp Met Val Tyr Gly Phe Val Gln Gly Leu Phe
85 90 95
Cys Thr Gly Val Trp Ile Leu Gly His Glu Cys Gly His Gly Ala Phe
100 105 110
Ser Leu His Gly Lys Val Asn Asn Val Thr Gly Trp Phe Leu His Ser
115 120 125
Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg His
130 135 140
His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro Lys
145 150 155 160
Thr Glu Pro Lys Pro Ser Lys Ser Leu Met Ile Ala Gly Ile Asp Val
165 170 175
Ala Glu Leu Val Glu Asp Thr Pro Ala Ala Gln Met Val Lys Leu Ile
180 185 190
Phe His Gln Leu Phe Gly Trp Gln Ala Tyr Leu Phe Phe Asn Ala Ser
195 200 205
Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Thr Gly Leu Ser Lys
210 215 220
Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg Pro
225 230 235 240
Asn Glu Ala Ile Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu Met
245 250 255
Gly Thr Ala Leu Tyr Phe Ala Ser Lys Gln Val Gly Val Ser Thr Ile
260 265 270
Leu Phe Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu Val
275 280 285
Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr Thr
290 295 300
Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp Arg
305 310 315 320
Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu Lys
325 330 335
His Val Val His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala Asp
340 345 350
Glu Ala Thr Glu Ala Ile Lys Pro Val Ile Gly Asp His Tyr Cys His
355 360 365
Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Thr Leu
370 375 380
Lys Tyr Val Glu His Asp Pro Ala Arg Pro Gly Ala Met Arg Trp Asn
385 390 395 400
Lys Asp
<210> 53
<211> 1206
<212> DNA
<213> Aspergillus nidulans
<220>
<221> misc_feature
<223> delta-15 desaturase
<400> 53
atggctgcaa ctgcaacaac cctagcagag attgaaaaga aaaaagaaga aataactctg 60
cagacaatca aaaatgcgat tcccaaacac tgcttcaacc gctctctcct catttcctct 120
gcctacgtcg tccgcgatct cctctacgcc tccgtcctct tctactttgc cctgcacatt 180
gacaccctct tttcctcgca actcctccgc atcctcgcct ggaccgccta cggtttcatg 240
caaggctgcg tcggcaccgg aatctggatc ctcgcacacg aatgcggcca tggagctttc 300
tccccatacc aaacgtggaa cgatgtcgtc ggatggacat tgcactccct cctgatggtc 360
ccgtatttca gctggaagat cacgcacgct cgacaccacc ggtacacaaa caacacagag 420
cgagatacag catttgtccc ctggacagag aaggaatacg acactcgccc gcgctacttc 480
cctgcctggt ttgagatgtt tgaggacacg cccgtctaca accttattag cctactggcg 540
catcagatcg caggatggca gatgtatctc tgtttttacg ttagcgccgg cgcaaagagt 600
aagcctgtac cgcagggaaa acagagcggg tggtttggag gccagcagag cgccagccac 660
tttgatccgg gcagttcgct gtggacggaa aaccagcggc atctgattgc gatttcggac 720
ctggggttgc tgcttgttgc ggcggcaaat tggtaccttg cgcagcaagt gggcgtgctc 780
cgcatggtgc tgatctatgt tgtgccgtac ttctgggtgc accattggct tgtggcgatc 840
acgtacctcc accacacaca cccctcgatc ccgcactaca ctgatagcac ctggacgttc 900
accaaaggcg ctctgtccac cgtcgaccgc gacttcggtt tcatcgggcg gcatttcttc 960
caccatatca ttgaccacca tgtcgtgcat cacttgttta accggatccc gttctaccat 1020
gccgaggagg cgactaatgc cattattccc gtactcgggg acatgtatca tcgcgaagag 1080
accggcttct tgtggagttt aatggagacg tacaagaact gtcggtttgt aggcgttgaa 1140
aatgatgttg gaaaggaggg cgttttgcat tgggtttttg aggagaagaa gggtgccaaa 1200
gcggaa 1206
<210> 54
<211> 401
<212> PRT
<213> Aspergillus nidulans
<400> 54
Met Ala Ala Thr Ala Thr Thr Leu Ala Glu Ile Glu Lys Lys Lys Glu
1 5 10 15
Glu Ile Thr Leu Gln Thr Ile Lys Asn Ala Ile Pro Lys His Cys Phe
20 25 30
Asn Arg Ser Leu Leu Ile Ser Ser Ala Tyr Val Val Arg Asp Leu Leu
35 40 45
Tyr Ala Ser Val Leu Phe Tyr Phe Ala Leu His Ile Asp Thr Leu Phe
50 55 60
Ser Ser Gln Leu Leu Arg Ile Leu Ala Trp Thr Ala Tyr Gly Phe Met
65 70 75 80
Gln Gly Cys Val Gly Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly
85 90 95
His Gly Ala Phe Ser Pro Tyr Gln Thr Trp Asn Asp Val Val Gly Trp
100 105 110
Thr Leu His Ser Leu Leu Met Val Pro Tyr Phe Ser Trp Lys Ile Thr
115 120 125
His Ala Arg His His Arg Tyr Thr Asn Asn Thr Glu Arg Asp Thr Ala
130 135 140
Phe Val Pro Trp Thr Glu Lys Glu Tyr Asp Thr Arg Pro Arg Tyr Phe
145 150 155 160
Pro Ala Trp Phe Glu Met Phe Glu Asp Thr Pro Val Tyr Asn Leu Ile
165 170 175
Ser Leu Leu Ala His Gln Ile Ala Gly Trp Gln Met Tyr Leu Cys Phe
180 185 190
Tyr Val Ser Ala Gly Ala Lys Ser Lys Pro Val Pro Gln Gly Lys Gln
195 200 205
Ser Gly Trp Phe Gly Gly Gln Gln Ser Ala Ser His Phe Asp Pro Gly
210 215 220
Ser Ser Leu Trp Thr Glu Asn Gln Arg His Leu Ile Ala Ile Ser Asp
225 230 235 240
Leu Gly Leu Leu Leu Val Ala Ala Ala Asn Trp Tyr Leu Ala Gln Gln
245 250 255
Val Gly Val Leu Arg Met Val Leu Ile Tyr Val Val Pro Tyr Phe Trp
260 265 270
Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Pro
275 280 285
Ser Ile Pro His Tyr Thr Asp Ser Thr Trp Thr Phe Thr Lys Gly Ala
290 295 300
Leu Ser Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Arg His Phe Phe
305 310 315 320
His His Ile Ile Asp His His Val Val His His Leu Phe Asn Arg Ile
325 330 335
Pro Phe Tyr His Ala Glu Glu Ala Thr Asn Ala Ile Ile Pro Val Leu
340 345 350
Gly Asp Met Tyr His Arg Glu Glu Thr Gly Phe Leu Trp Ser Leu Met
355 360 365
Glu Thr Tyr Lys Asn Cys Arg Phe Val Gly Val Glu Asn Asp Val Gly
370 375 380
Lys Glu Gly Val Leu His Trp Val Phe Glu Glu Lys Lys Gly Ala Lys
385 390 395 400
Ala
<210> 55
<211> 1185
<212> DNA
<213> Magnaporthe grisea
<220>
<221> misc_feature
<223> delta-15 desaturase
<400> 55
atgtccacca ccgtcactca gcggccgggc gccgctagcc gcgctgaagc caagcccaag 60
gagcagcaat ttccagacat caacaccatc aggaatgcta tccccgcaca ctgttttgag 120
gcatctctgg tgacttcagt tggttacttg gtgcgagatg tggccctcat caccgctctc 180
ggctgggccg ccttgaccta cattccccaa attccggatt cgactttgcg ctggaccgcc 240
tgggccgctt acggctttgt tcagggtctc tttggcaccg gtctctggat tctggcccac 300
gagtgcggcc acggtgcttt cagcaagcac acgcgcatta acaacattct tggctgggcc 360
gcccactcgg ccctgctggt accgtacttc agctggaagt tctctcacca ccgccaccac 420
aacttcaccg gccacatgga gaaggacatg gcctttgtgc ccccccaggc tgccgaccgc 480
gagtcccgcg ccagcttgct gtcccgcttc ggcatcgacc tcgaggtctt tgaggatacc 540
cccatctttc agcttgctcg cctcgtgagc caccagctct tcggctggca gacttacctg 600
ctcttcaacg ccacctgcgg caaggagtct ctgcagaaca agggtgccgc gtggttccgc 660
cagagccact ttgagcccac ctctgccgtc ttccgctcca gcgaggccct ctacatcgcc 720
atctctgaca ttggcctggc catcgttgcc gccgccatct actggggctc caccaaggtc 780
ggcgccggca ccatgttcct cctctacgcc gttccctaca tgtgggttca ccactggctc 840
gtcgccatca cctaccttca ccacaccaac aaggaggtgc accactacga ggccgacagc 900
tggacctttg tcaagggtgc cgtcgccact gtcgaccgtg actttggttt cattgaccgc 960
cacctgttcc acggtatcat tggaacccac gtcgcccacc atctgttccc tcgcattccc 1020
ttttacaagg cagaggaggc caccgaggcc atcaagcctg tcctcggaga cctttaccac 1080
agcgacaatc gccccttcat gcaggctctg tggagcaact tcaccacctg caagtacgtc 1140
gagaaggacc ccaaggttcc cggcgccatg aggtgggccg attga 1185
<210> 56
<211> 394
<212> PRT
<213> Magnaporthe grisea
<400> 56
Met Ser Thr Thr Val Thr Gln Arg Pro Gly Ala Ala Ser Arg Ala Glu
1 5 10 15
Ala Lys Pro Lys Glu Gln Gln Phe Pro Asp Ile Asn Thr Ile Arg Asn
20 25 30
Ala Ile Pro Ala His Cys Phe Glu Ala Ser Leu Val Thr Ser Val Gly
35 40 45
Tyr Leu Val Arg Asp Val Ala Leu Ile Thr Ala Leu Gly Trp Ala Ala
50 55 60
Leu Thr Tyr Ile Pro Gln Ile Pro Asp Ser Thr Leu Arg Trp Thr Ala
65 70 75 80
Trp Ala Ala Tyr Gly Phe Val Gln Gly Leu Phe Gly Thr Gly Leu Trp
85 90 95
Ile Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys His Thr Arg
100 105 110
Ile Asn Asn Ile Leu Gly Trp Ala Ala His Ser Ala Leu Leu Val Pro
115 120 125
Tyr Phe Ser Trp Lys Phe Ser His His Arg His His Asn Phe Thr Gly
130 135 140
His Met Glu Lys Asp Met Ala Phe Val Pro Pro Gln Ala Ala Asp Arg
145 150 155 160
Glu Ser Arg Ala Ser Leu Leu Ser Arg Phe Gly Ile Asp Leu Glu Val
165 170 175
Phe Glu Asp Thr Pro Ile Phe Gln Leu Ala Arg Leu Val Ser His Gln
180 185 190
Leu Phe Gly Trp Gln Thr Tyr Leu Leu Phe Asn Ala Thr Cys Gly Lys
195 200 205
Glu Ser Leu Gln Asn Lys Gly Ala Ala Trp Phe Arg Gln Ser His Phe
210 215 220
Glu Pro Thr Ser Ala Val Phe Arg Ser Ser Glu Ala Leu Tyr Ile Ala
225 230 235 240
Ile Ser Asp Ile Gly Leu Ala Ile Val Ala Ala Ala Ile Tyr Trp Gly
245 250 255
Ser Thr Lys Val Gly Ala Gly Thr Met Phe Leu Leu Tyr Ala Val Pro
260 265 270
Tyr Met Trp Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His
275 280 285
Thr Asn Lys Glu Val His His Tyr Glu Ala Asp Ser Trp Thr Phe Val
290 295 300
Lys Gly Ala Val Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Asp Arg
305 310 315 320
His Leu Phe His Gly Ile Ile Gly Thr His Val Ala His His Leu Phe
325 330 335
Pro Arg Ile Pro Phe Tyr Lys Ala Glu Glu Ala Thr Glu Ala Ile Lys
340 345 350
Pro Val Leu Gly Asp Leu Tyr His Ser Asp Asn Arg Pro Phe Met Gln
355 360 365
Ala Leu Trp Ser Asn Phe Thr Thr Cys Lys Tyr Val Glu Lys Asp Pro
370 375 380
Lys Val Pro Gly Ala Met Arg Trp Ala Asp
385 390
<210> 57
<211> 1290
<212> DNA
<213> Neurospora crassa
<220>
<221> misc_feature
<223> delta-15 desaturase
<400> 57
atgacggtca ccacccgcag ccacaaggcc gcggccgcca ccgagcccga ggttgtcagc 60
accggcgttg acgccgtctc tgctgctgct ccctcctcct cctcctcctc ttccagccaa 120
aagtcggccg agcccatcga ataccccgac atcaagacca tccgcgacgc catccccgac 180
cactgcttcc gcccgcgcgt ctggatctcc atggcctact tcatccgcga cttcgccatg 240
gcctttggcc tcggctacct cgcctggcag tacatccccc tgatcgcctc caccccgctc 300
cgctacggcg cctgggctct gtacggctac ctccagggtc tcgtctgcac gggcatctgg 360
attctggcgc acgagtgcgg ccacggcgcc ttctcgaggc acacgtggtt caacaacgtc 420
atggggtgga ttggccactc cttcctcttg gtcccttact tcagctggaa gttcagccac 480
catcgccacc atcgcttcac cggccacatg gagaaggaca tggcgtttgt gcctgccacc 540
gaggctgatc gcaaccagag gaagctggcc aacttgtaca tggacaagga gacggccgag 600
atgtttgagg atgtgcccat tgtccagctc gtcaagctca tcgcccacca gctggccggc 660
tggcagatgt acctcctctt caacgtctcc gccggtaagg gcagcaagca gtgggagact 720
ggcaagggcg gcatgggctg gttgagggtt agccactttg agccttcctc tgctgtgttc 780
cgcaactccg aggccatcta cattgccctg tccgatcttg gtctcatgat catgggctat 840
atcctctacc aggccgcgca ggttgttggc tggcagatgg taggtctgct gtacttccag 900
cagtacttct gggttcacca ttggttggtc gccatcactt acctccacca cacccacgag 960
gaagtccacc actttgacgc cgactcgtgg accttcgtca agggcgctct cgccaccgtc 1020
gaccgcgatt ttggcttcat tggcaagcac ctcttccaca acattatcga ccaccacgtc 1080
gtccaccact tgttccctcg catccccttc tactacgccg aagaagccac caactcgatc 1140
cgccccatgc tcggccccct ctaccaccgc gacgaccgct ccttcatggg ccagctgtgg 1200
tacaacttca cccactgcaa gtgggtcgtt ccggaccccc aggtccccgg cgcgcttatt 1260
tgggcgcaca ccgttcagag cacccagtaa 1290
<210> 58
<211> 429
<212> PRT
<213> Neurospora crassa
<400> 58
Met Thr Val Thr Thr Arg Ser His Lys Ala Ala Ala Ala Thr Glu Pro
1 5 10 15
Glu Val Val Ser Thr Gly Val Asp Ala Val Ser Ala Ala Ala Pro Ser
20 25 30
Ser Ser Ser Ser Ser Ser Ser Gln Lys Ser Ala Glu Pro Ile Glu Tyr
35 40 45
Pro Asp Ile Lys Thr Ile Arg Asp Ala Ile Pro Asp His Cys Phe Arg
50 55 60
Pro Arg Val Trp Ile Ser Met Ala Tyr Phe Ile Arg Asp Phe Ala Met
65 70 75 80
Ala Phe Gly Leu Gly Tyr Leu Ala Trp Gln Tyr Ile Pro Leu Ile Ala
85 90 95
Ser Thr Pro Leu Arg Tyr Gly Ala Trp Ala Leu Tyr Gly Tyr Leu Gln
100 105 110
Gly Leu Val Cys Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly His
115 120 125
Gly Ala Phe Ser Arg His Thr Trp Phe Asn Asn Val Met Gly Trp Ile
130 135 140
Gly His Ser Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe Ser His
145 150 155 160
His Arg His His Arg Phe Thr Gly His Met Glu Lys Asp Met Ala Phe
165 170 175
Val Pro Ala Thr Glu Ala Asp Arg Asn Gln Arg Lys Leu Ala Asn Leu
180 185 190
Tyr Met Asp Lys Glu Thr Ala Glu Met Phe Glu Asp Val Pro Ile Val
195 200 205
Gln Leu Val Lys Leu Ile Ala His Gln Leu Ala Gly Trp Gln Met Tyr
210 215 220
Leu Leu Phe Asn Val Ser Ala Gly Lys Gly Ser Lys Gln Trp Glu Thr
225 230 235 240
Gly Lys Gly Gly Met Gly Trp Leu Arg Val Ser His Phe Glu Pro Ser
245 250 255
Ser Ala Val Phe Arg Asn Ser Glu Ala Ile Tyr Ile Ala Leu Ser Asp
260 265 270
Leu Gly Leu Met Ile Met Gly Tyr Ile Leu Tyr Gln Ala Ala Gln Val
275 280 285
Val Gly Trp Gln Met Val Gly Leu Leu Tyr Phe Gln Gln Tyr Phe Trp
290 295 300
Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Glu
305 310 315 320
Glu Val His His Phe Asp Ala Asp Ser Trp Thr Phe Val Lys Gly Ala
325 330 335
Leu Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Lys His Leu Phe
340 345 350
His Asn Ile Ile Asp His His Val Val His His Leu Phe Pro Arg Ile
355 360 365
Pro Phe Tyr Tyr Ala Glu Glu Ala Thr Asn Ser Ile Arg Pro Met Leu
370 375 380
Gly Pro Leu Tyr His Arg Asp Asp Arg Ser Phe Met Gly Gln Leu Trp
385 390 395 400
Tyr Asn Phe Thr His Cys Lys Trp Val Val Pro Asp Pro Gln Val Pro
405 410 415
Gly Ala Leu Ile Trp Ala His Thr Val Gln Ser Thr Gln
420 425
<210> 59
<211> 1212
<212> DNA
<213> Fusarium graminearium
<220>
<221> misc_feature
<223> delta-15 desaturase
<400> 59
atggccacca gacagcgaac tgccaccact gttgtggtcg agaaggacct gcccaaggtc 60
actctcgagg ccacttctca gcctcaattc cccgacatca agaccatcaa ggatgccatc 120
cccgcccact gcttccagcc ctcgctcatc acctcatact actatgtcgt ccgcgacttc 180
gccatggtcg gctccctcgt ctgggccgcc ctcacctaca tccccggcat tgaggaccag 240
tacctccgcg tcgccgcctg gatggcctac ggcttcctcc agggtctctt ctgcaccgga 300
atctggattc tcggtcatga gtgcggccac ggtgccttct ctacccacag caagctcaac 360
aatgtgaccg gctggttcct ccactcgttc ctcatggtcc cctatttcag ctggaagtac 420
tctcaccacc gtcaccaccg cttcaccggc cacatggatc tcgacatggc ctttgtcccc 480
cgcacttcgc ccaagccttc tttgtctttc cgcattgctg gtatggacgt cgctgagctg 540
attgaggaca cccccattgc ccaggccgtc aagctcatct tccaccagct cttcggatgg 600
caggtgtaca ccttcttcaa cgccagctct ggcaagggta gcaagcagtg ggagcccaag 660
agcggcttgg ccagctggtt ccgcgtcagc cacttcgagc ccaccagcgc tgtcttccgc 720
cccgccgagg ctcctttcat cctcatctcc gacattggtc tcgccctcac tggaactgct 780
ctgtactttg cttccaagga ggtcggcgtt tccaccgttc tctacctcta cctcgtcccc 840
tacctctggg tccaccactg gctcgtcgcc atcacctacc tccaccacca ccacaccgag 900
cttccccact acaccgccga gggctggacc tacgtcaagg gtgctctcgc tactgttgac 960
cgcgagtttg gcttcattgg caagcacctt ttccacggca tcattgagaa gcacgtcatt 1020
caccacctgt tccctaagat ccccttctac aaggctgacg aggccaccga ggccatcaag 1080
cccatcatcg gcgaccacta ctgccacgac gaccgcagct tccttggcca gctctggacc 1140
atctttggca gcctcaagta cgtcgagcac gaccccgccg tccctggtgc catgcgctgg 1200
gccaaggagt ag 1212
<210> 60
<211> 403
<212> PRT
<213> Fusarium graminearium
<400> 60
Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Lys Asp
1 5 10 15
Leu Pro Lys Val Thr Leu Glu Ala Thr Ser Gln Pro Gln Phe Pro Asp
20 25 30
Ile Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser
35 40 45
Leu Ile Thr Ser Tyr Tyr Tyr Val Val Arg Asp Phe Ala Met Val Gly
50 55 60
Ser Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Gly Ile Glu Asp Gln
65 70 75 80
Tyr Leu Arg Val Ala Ala Trp Met Ala Tyr Gly Phe Leu Gln Gly Leu
85 90 95
Phe Cys Thr Gly Ile Trp Ile Leu Gly His Glu Cys Gly His Gly Ala
100 105 110
Phe Ser Thr His Ser Lys Leu Asn Asn Val Thr Gly Trp Phe Leu His
115 120 125
Ser Phe Leu Met Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg
130 135 140
His His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro
145 150 155 160
Arg Thr Ser Pro Lys Pro Ser Leu Ser Phe Arg Ile Ala Gly Met Asp
165 170 175
Val Ala Glu Leu Ile Glu Asp Thr Pro Ile Ala Gln Ala Val Lys Leu
180 185 190
Ile Phe His Gln Leu Phe Gly Trp Gln Val Tyr Thr Phe Phe Asn Ala
195 200 205
Ser Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Ser Gly Leu Ala
210 215 220
Ser Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg
225 230 235 240
Pro Ala Glu Ala Pro Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu
245 250 255
Thr Gly Thr Ala Leu Tyr Phe Ala Ser Lys Glu Val Gly Val Ser Thr
260 265 270
Val Leu Tyr Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu
275 280 285
Val Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr
290 295 300
Thr Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp
305 310 315 320
Arg Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu
325 330 335
Lys His Val Ile His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala
340 345 350
Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Ile Gly Asp His Tyr Cys
355 360 365
His Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Ser
370 375 380
Leu Lys Tyr Val Glu His Asp Pro Ala Val Pro Gly Ala Met Arg Trp
385 390 395 400
Ala Lys Glu
<210> 61
<211> 1353
<212> DNA
<213> Mortierella alpina (GenBank Accession No. AB182163)
<220>
<221> misc_feature
<223> delta-15 desaturase
<400> 61
atggcccccc ctcacgttgt cgacgaacaa gttcgacgca ggatcgtcgt tgaggacgag 60
atcaagtcta agaagcaatt tgagcgcaac tatgtgccca tggactttac gattaaggag 120
attcgagatg cgatccctgc ccacctcttc atccgtgata ccacaaagtc gatcctgcat 180
gtcgtcaagg atctggtcac catcgccatc gtcttttact gtgcaacctt cattgagact 240
ctgccctcgc tcgctctgcg agttcctgcc tggatcacct actggatcat ccaaggaact 300
gtcatggtcg gcccctggat cttggctcat ggtaaggaaa cgaaaaatcc catgtgtatt 360
tctgtactac agaaggcgaa gtttgtacct gaaaagatca gcgtcgtccc ttgatttaga 420
atgtaactaa ccttgcaatc gtatgaccta aattttcttg tgtcaacgac agagtgcggc 480
cacggagctt tctcggatag caagacgatc aacaccatct ttggatgggt cctccactct 540
gctcttttgg tgccctacca ggcctgggct atgtcacact ccaagcatca caagggtact 600
ggatcgatga ccaaagatgt cgttttcatc cctgccactc gttcctacaa gggcctccca 660
gcactggaga agcctgccgt cgaagaggag gtttcggagc aggaacacca ccaccacgag 720
gagtccatct ttgccgaaac tcccatctac acgctcggag cgcttttgtt cgtcttgacc 780
ttcggatggc ccttgtactt gatcgtcaac ttttcaggac acgaggcccc tcactgggtc 840
aaccatttcc agactgtcgc tcctctctat gagcctcacc agcgcaagaa catcttctac 900
tccaactgcg gcattgtcgc catgggttcg atcttgactt acctttcgat ggtcttctcg 960
cccttgactg tcttcatgta ctatggcatc ccttacctcg gagtcaacgc ctggatcgtc 1020
tgcattacct atctccagca caccgatccc aaggtgcctc acttccgtga taacgagtgg 1080
aacttccagc gcggtgctgc ctgcactatc gaccgatcct tcggtaccat cgtgaaccac 1140
ctgcaccacc acattggcga ctctcaccag tgccaccata tgttctcgca gatgcccttc 1200
tacaatgctg tggaggctac aaagtacttg aaggccaaac ttggcaagta ctacatattt 1260
gacgacacgc ccattgccaa agccctctac cgcaattgga gagagtgcaa attcgtggag 1320
gacgagggag atgtagtgtt ttacaagcat taa 1353
<210> 62
<211> 403
<212> PRT
<213> Mortierella alpina (GenBank Accession No. AB182163)
<220>
<221> MISC_FEATURE
<223> delta-15 desaturase
<400> 62
Met Ala Pro Pro His Val Val Asp Glu Gln Val Arg Arg Arg Ile Val
1 5 10 15
Val Glu Asp Glu Ile Lys Ser Lys Lys Gln Phe Glu Arg Asn Tyr Val
20 25 30
Pro Met Asp Phe Thr Ile Lys Glu Ile Arg Asp Ala Ile Pro Ala His
35 40 45
Leu Phe Ile Arg Asp Thr Thr Lys Ser Ile Leu His Val Val Lys Asp
50 55 60
Leu Val Thr Ile Ala Ile Val Phe Tyr Cys Ala Thr Phe Ile Glu Thr
65 70 75 80
Leu Pro Ser Leu Ala Leu Arg Val Pro Ala Trp Ile Thr Tyr Trp Ile
85 90 95
Ile Gln Gly Thr Val Met Val Gly Pro Trp Ile Leu Ala His Glu Cys
100 105 110
Gly His Gly Ala Phe Ser Asp Ser Lys Thr Ile Asn Thr Ile Phe Gly
115 120 125
Trp Val Leu His Ser Ala Leu Leu Val Pro Tyr Gln Ala Trp Ala Met
130 135 140
Ser His Ser Lys His His Lys Gly Thr Gly Ser Met Thr Lys Asp Val
145 150 155 160
Val Phe Ile Pro Ala Thr Arg Ser Tyr Lys Gly Leu Pro Ala Leu Glu
165 170 175
Lys Pro Ala Val Glu Glu Glu Val Ser Glu Gln Glu His His His His
180 185 190
Glu Glu Ser Ile Phe Ala Glu Thr Pro Ile Tyr Thr Leu Gly Ala Leu
195 200 205
Leu Phe Val Leu Thr Phe Gly Trp Pro Leu Tyr Leu Ile Val Asn Phe
210 215 220
Ser Gly His Glu Ala Pro His Trp Val Asn His Phe Gln Thr Val Ala
225 230 235 240
Pro Leu Tyr Glu Pro His Gln Arg Lys Asn Ile Phe Tyr Ser Asn Cys
245 250 255
Gly Ile Val Ala Met Gly Ser Ile Leu Thr Tyr Leu Ser Met Val Phe
260 265 270
Ser Pro Leu Thr Val Phe Met Tyr Tyr Gly Ile Pro Tyr Leu Gly Val
275 280 285
Asn Ala Trp Ile Val Cys Ile Thr Tyr Leu Gln His Thr Asp Pro Lys
290 295 300
Val Pro His Phe Arg Asp Asn Glu Trp Asn Phe Gln Arg Gly Ala Ala
305 310 315 320
Cys Thr Ile Asp Arg Ser Phe Gly Thr Ile Val Asn His Leu His His
325 330 335
His Ile Gly Asp Ser His Gln Cys His His Met Phe Ser Gln Met Pro
340 345 350
Phe Tyr Asn Ala Val Glu Ala Thr Lys Tyr Leu Lys Ala Lys Leu Gly
355 360 365
Lys Tyr Tyr Ile Phe Asp Asp Thr Pro Ile Ala Lys Ala Leu Tyr Arg
370 375 380
Asn Trp Arg Glu Cys Lys Phe Val Glu Asp Glu Gly Asp Val Val Phe
385 390 395 400
Tyr Lys His
<210> 63
<211> 1248
<212> DNA
<213> Kluyveromyces lactis (GenBank Accession No. XM_451551)
<220>
<221> misc_feature
<223> delta-15 desaturase
<400> 63
atgagcaaaa gcaccggcgt cgagcatcat atcagtggtg ttgctactac agaaacggca 60
acagagacag ttactgttcc tcctgccaag acagctattg acacacatgg taacatcttc 120
aaggttccag actatactat caaagacatc ctaggtgcca tcccaaagga gtgttacaag 180
agagacactc tttggtcatt gcattatgtg gtaagagata ttattgccat ctgtattatt 240
gggtatgttg gtaccaacta cattccagtt tggtttccaa atagtggtct cctaagattt 300
gttgcctata tggtgcaatc atacttaatt gggttatttg gttttgggtt gtggattttg 360
gctcacgaat gcggtcatgg tgccttctct gattcaagat taatcaacga taccgttggg 420
tgggttttgc actcatggtg gatggtccca tacttttctt ggaaattctc tcactctaag 480
catcataaag ctaccggtca tttgactaga gatatggttt ttgttccata cacgaaaaaa 540
gaatacttgg aaatgaaggg taaatcaaaa ctaagggaga tcaccgaaga agcaccaatt 600
gtaactttat taactttgat tggccaacaa attggtggtt tgcagttgta tttagcaaca 660
aatgccactg gccaatctta tcctggtgtt cctaaattct tcaaatccca ttactggcct 720
acttctccgg tgttcgatac caaggacttc tggtacatca ttctgagtga cattggtatt 780
atttccacac ttacaatcaa ttatttgtgg gcaaagacct atggctccca tgtcatgttg 840
atcaactggt ttgttccatg gttatgggtt aaccactggt tagtatttgt cacatttttg 900
caacacactg acccaaccat gcctcattac gaagccagtg aatggacctt cgctaaaggt 960
gctgctgcca ccattgatag aaactttggc tttgttggtc aacatatttt ccacgatatt 1020
attgaaacgc atgttttgca tcattactgt tcaagaattc ctttctacaa cgctcgtgta 1080
gccactgaag ctattaagaa agttatgggt gaacattatc gttatgaagg cgaaaatatg 1140
tggcaatcat tatggaaggt ggcaagatcc tgtcagtttg tagatggtga caacggtgtt 1200
ttgatgttca gaaacacaaa cggagtcgga gcaccatgtc aagaatga 1248
<210> 64
<211> 415
<212> PRT
<213> Kluyveromyces lactis (GenBank Accession No. XM_451551)
<220>
<221> MISC_FEATURE
<223> delta-15 desaturase
<400> 64
Met Ser Lys Ser Thr Gly Val Glu His His Ile Ser Gly Val Ala Thr
1 5 10 15
Thr Glu Thr Ala Thr Glu Thr Val Thr Val Pro Pro Ala Lys Thr Ala
20 25 30
Ile Asp Thr His Gly Asn Ile Phe Lys Val Pro Asp Tyr Thr Ile Lys
35 40 45
Asp Ile Leu Gly Ala Ile Pro Lys Glu Cys Tyr Lys Arg Asp Thr Leu
50 55 60
Trp Ser Leu His Tyr Val Val Arg Asp Ile Ile Ala Ile Cys Ile Ile
65 70 75 80
Gly Tyr Val Gly Thr Asn Tyr Ile Pro Val Trp Phe Pro Asn Ser Gly
85 90 95
Leu Leu Arg Phe Val Ala Tyr Met Val Gln Ser Tyr Leu Ile Gly Leu
100 105 110
Phe Gly Phe Gly Leu Trp Ile Leu Ala His Glu Cys Gly His Gly Ala
115 120 125
Phe Ser Asp Ser Arg Leu Ile Asn Asp Thr Val Gly Trp Val Leu His
130 135 140
Ser Trp Trp Met Val Pro Tyr Phe Ser Trp Lys Phe Ser His Ser Lys
145 150 155 160
His His Lys Ala Thr Gly His Leu Thr Arg Asp Met Val Phe Val Pro
165 170 175
Tyr Thr Lys Lys Glu Tyr Leu Glu Met Lys Gly Lys Ser Lys Leu Arg
180 185 190
Glu Ile Thr Glu Glu Ala Pro Ile Val Thr Leu Leu Thr Leu Ile Gly
195 200 205
Gln Gln Ile Gly Gly Leu Gln Leu Tyr Leu Ala Thr Asn Ala Thr Gly
210 215 220
Gln Ser Tyr Pro Gly Val Pro Lys Phe Phe Lys Ser His Tyr Trp Pro
225 230 235 240
Thr Ser Pro Val Phe Asp Thr Lys Asp Phe Trp Tyr Ile Ile Leu Ser
245 250 255
Asp Ile Gly Ile Ile Ser Thr Leu Thr Ile Asn Tyr Leu Trp Ala Lys
260 265 270
Thr Tyr Gly Ser His Val Met Leu Ile Asn Trp Phe Val Pro Trp Leu
275 280 285
Trp Val Asn His Trp Leu Val Phe Val Thr Phe Leu Gln His Thr Asp
290 295 300
Pro Thr Met Pro His Tyr Glu Ala Ser Glu Trp Thr Phe Ala Lys Gly
305 310 315 320
Ala Ala Ala Thr Ile Asp Arg Asn Phe Gly Phe Val Gly Gln His Ile
325 330 335
Phe His Asp Ile Ile Glu Thr His Val Leu His His Tyr Cys Ser Arg
340 345 350
Ile Pro Phe Tyr Asn Ala Arg Val Ala Thr Glu Ala Ile Lys Lys Val
355 360 365
Met Gly Glu His Tyr Arg Tyr Glu Gly Glu Asn Met Trp Gln Ser Leu
370 375 380
Trp Lys Val Ala Arg Ser Cys Gln Phe Val Asp Gly Asp Asn Gly Val
385 390 395 400
Leu Met Phe Arg Asn Thr Asn Gly Val Gly Ala Pro Cys Gln Glu
405 410 415
<210> 65
<211> 433
<212> PRT
<213> Candida albicans SC5314 (GenBank Accession No. EAL03493)
<220>
<221> MISC_FEATURE
<223> delta-15 desaturase
<400> 65
Met Ser Val Val Glu Ala Ser Ser Ser Ser Val Val Glu Asp Ser Thr
1 5 10 15
Ala Ser Asn Val Val Gln Arg Gly Asn Ile Ser Ser Phe Ala Ser Thr
20 25 30
Thr Ala Ser Ser Asn Leu Thr Thr Ile Asp Thr Asn Gly Lys Val Phe
35 40 45
Lys Val Pro Asp Tyr Ser Ile Lys Asp Ile Leu Gln Ala Ile Pro Lys
50 55 60
His Cys Tyr Glu Arg Ser Leu Ile Arg Ser Leu Gly Tyr Val Val Arg
65 70 75 80
Asp Ile Thr Met Met Val Ile Ile Gly Tyr Val Gly His Thr Phe Ile
85 90 95
Pro Met Val Gln Ile Pro Glu Tyr Pro Ser Leu Ala Tyr Gly Leu Arg
100 105 110
Gly Ala Leu Trp Met Val Gln Ser Tyr Cys Ile Gly Leu Phe Gly Phe
115 120 125
Gly Leu Trp Ile Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Asp
130 135 140
Tyr Gln Asn Ile Asn Asp Phe Ile Gly Trp Val Leu His Ser Tyr Leu
145 150 155 160
Ile Val Pro Tyr Phe Ser Trp Lys Phe Ser His Ala Lys His His Lys
165 170 175
Ala Thr Gly His Leu Thr Lys Asp Met Val Phe Ile Pro Tyr Thr Lys
180 185 190
Glu Glu Tyr Leu Glu Lys Asn Lys Val Glu Lys Val Ala Asp Leu Met
195 200 205
Glu Glu Ser Pro Ile Tyr Ser Phe Leu Val Leu Val Phe Gln Gln Leu
210 215 220
Gly Gly Leu Gln Leu Tyr Leu Ala Thr Asn Ala Thr Gly Gln Val Tyr
225 230 235 240
Pro Gly Tyr Ser Lys Ile Ala Lys Ser His Tyr Thr Pro Thr Ser Pro
245 250 255
Val Phe Asp Lys His Gln Tyr Trp Tyr Ile Val Leu Ser Asp Ile Gly
260 265 270
Ile Ile Leu Ala Phe Thr Thr Val Tyr Gln Trp Tyr Lys Asn Phe Gly
275 280 285
Leu Phe Asn Met Met Ile Asn Trp Phe Val Pro Trp Leu Trp Val Asn
290 295 300
His Trp Leu Val Phe Val Thr Phe Leu Gln His Thr Asp Pro Thr Met
305 310 315 320
Pro His Tyr Thr Ser Lys Glu Trp Thr Phe Ala Arg Gly Ala Ala Ala
325 330 335
Thr Ile Asp Arg Asn Phe Gly Phe Val Gly Gln His Ile Phe His Asp
340 345 350
Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Arg Ile Pro Phe
355 360 365
Tyr Asn Ala Arg Glu Ala Thr Asp Ala Ile Arg Lys Val Met Gly Glu
370 375 380
His Tyr Arg Tyr Glu Gly Glu Ser Met Trp Tyr Ser Leu Trp Lys Cys
385 390 395 400
Met Arg Met Cys Gln Phe Val Asp Asp Asp Lys Glu Asp Ala Lys Gly
405 410 415
Val Met Met Phe Arg Asn Val Asn Gly Trp Gly Pro Val Lys Pro Lys
420 425 430
Asp
<210> 66
<211> 419
<212> PRT
<213> Saccharomyces kluyveri (GenBank Accession No. BAD11952)
<220>
<221> MISC_FEATURE
<223> delta-15 desaturase
<400> 66
Met Ser Ile Glu Thr Val Gly Ser Ser Ser Gly Val Ala Ile Asn Ser
1 5 10 15
Lys Ala Val Ser Ser Thr Ala Thr Thr Val Val Gln Pro Lys Thr Ala
20 25 30
Ile Asp Thr Asn Gly Asn Val Phe Lys Val Pro Asp Tyr Thr Ile Lys
35 40 45
Asp Ile Leu Ser Ala Ile Pro Lys Glu Cys Tyr Lys Arg Asp Thr Leu
50 55 60
Trp Ser Leu His Tyr Val Val Arg Asp Ile Ala Ala Ile Leu Val Ile
65 70 75 80
Gly Tyr Leu Gly Thr Asn Tyr Ile Pro Val Leu Phe Pro Asn Ser Ala
85 90 95
Leu Leu Arg Gly Ile Ala Tyr Ala Ile Gln Ser Tyr Leu Ile Gly Leu
100 105 110
Phe Gly Phe Gly Leu Trp Ile Leu Ala His Glu Cys Gly His Ser Ala
115 120 125
Phe Ser Glu Ser Asn Ala Val Asn Asp Thr Val Gly Trp Val Leu His
130 135 140
Ser Trp Trp Met Val Pro Tyr Phe Pro Trp Lys Phe Ser His Ser Lys
145 150 155 160
His His Lys Ala Thr Gly His Met Thr Arg Asp Met Val Phe Ile Pro
165 170 175
Tyr Thr Lys Asp Glu Phe Ile Thr Met Lys Lys Lys Ser Lys Phe Ala
180 185 190
Glu Ile Thr Glu Glu Ala Pro Val Met Thr Leu Phe Asn Leu Ile Ala
195 200 205
Gln Gln Val Gly Gly Leu Gln Leu Tyr Leu Ala Thr Asn Ala Thr Gly
210 215 220
Gln Pro Tyr Pro Gly Val Lys Lys Phe Phe Lys Ser His Tyr Trp Pro
225 230 235 240
Thr Ser Pro Val Phe Asp Ala Lys Asp Phe Trp Trp Ile Ile Met Ser
245 250 255
Asp Ile Gly Ile Val Ser Thr Leu Leu Ile Asn Tyr Leu Trp Tyr Arg
260 265 270
Ala Tyr Gly Ala His Val Val Leu Ile Asn Trp Phe Ile Pro Trp Leu
275 280 285
Trp Val Asn His Trp Leu Val Phe Val Thr Phe Leu Gln His Thr Asp
290 295 300
Pro Thr Met Pro His Tyr Asp Ala Glu Glu Trp Thr Phe Ala Lys Gly
305 310 315 320
Ala Ala Ala Thr Ile Asp Arg Asn Phe Gly Phe Val Gly Gln His Ile
325 330 335
Phe His Asp Ile Ile Glu Thr His Val Leu His His Tyr Cys Ser Arg
340 345 350
Ile Pro Phe Tyr Asn Ala Arg Lys Ala Thr Ser Ala Ile Lys Glu Val
355 360 365
Met Gly Gln His Tyr Arg Tyr Glu Gly Glu Asn Met Trp Lys Ser Leu
370 375 380
Trp Lys Val Ala Arg Ser Cys Gln Tyr Val Glu Gly Asp Asn Gly Val
385 390 395 400
Arg Met Phe Arg Asn Thr Asn Gly Val Gly Val Lys Pro Glu Asp Gly
405 410 415
Ser Ser Gln
<210> 67
<211> 435
<212> PRT
<213> Debaryomyces hansenii CBS767 (GenBank Accession No. CAG88182)
<220>
<221> MISC_FEATURE
<223> delta-15 desaturase
<400> 67
Met Ser Val Val Asp Leu Thr Ser Thr Thr Ser Gly Ser Ala Ile Asn
1 5 10 15
Ser Ser Asn Ile Ser Gln Arg Gly Asn Gly Ser Thr Ile Val Glu Thr
20 25 30
Lys Lys Gly Pro Ser Ser Asn Leu Lys Ala Ile Asp Thr Phe Gly Asn
35 40 45
Glu Phe Lys Val Pro Asp Tyr Thr Ile Lys Gln Ile Leu Ser Ala Ile
50 55 60
Pro Lys His Cys Tyr Glu Arg Ser Leu Val Arg Ser Leu Gly Tyr Val
65 70 75 80
Ala Arg Asp Ile Thr Met Met Cys Leu Ile Gly Tyr Val Gly Gln Lys
85 90 95
Thr Ile Pro Met Val Gln Ile Ala Asp Gln Glu Gly Leu Ser Thr Ala
100 105 110
Ile Arg Gly Gly Leu Trp Cys Val Tyr Ser Tyr Leu Leu Gly Leu Phe
115 120 125
Gly Phe Gly Leu Trp Ile Leu Ala His Glu Cys Gly His Gly Ala Phe
130 135 140
Ser Asp Tyr Gln Asn Val Asn Asp Val Val Gly Trp Ile Leu His Ser
145 150 155 160
Tyr Leu Ile Val Pro Tyr Phe Ser Trp Lys Phe Ser His Ser Lys His
165 170 175
His Lys Ala Thr Gly His Leu Thr Lys Asp Met Val Phe Ile Pro Tyr
180 185 190
Thr Lys Asp Glu Phe Val Glu Lys Ser Gly Val Ser Lys Val Ser Glu
195 200 205
Val Met Glu Asp Ser Pro Ile Trp Ser Leu Met Val Leu Ile Phe Gln
210 215 220
Gln Ile Gly Gly Leu Gln Leu Tyr Leu Ala Thr Asn Ala Thr Gly Gln
225 230 235 240
Ser Tyr Gln Gly His Ser Lys Ile Ala Lys Ser His Tyr Ala Pro Ala
245 250 255
Ser Pro Val Phe Asp Lys Glu His Tyr Trp Tyr Ile Ile Leu Ser Asp
260 265 270
Ile Gly Ile Ile Thr Thr Ile Thr Val Val Tyr Gln Trp Tyr Lys Asn
275 280 285
Phe Gly Phe Phe Asn Met Phe Val Asn Trp Phe Met Pro Trp Leu Trp
290 295 300
Val Asn His Trp Leu Val Phe Val Thr Phe Leu Gln His Thr Asp Pro
305 310 315 320
Thr Met Pro His Tyr Arg Asp Asn Glu Trp Thr Phe Ala Arg Gly Ala
325 330 335
Ala Ala Thr Ile Asp Arg Asn Phe Gly Phe Ile Gly Gln His Ile Phe
340 345 350
His Asp Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Arg Ile
355 360 365
Pro Phe Tyr Asn Ala Arg Glu Ala Thr Asp Ala Ile Arg Lys Val Met
370 375 380
Gly Glu His Tyr Arg Tyr Glu Gly Glu Ser Met Trp Tyr Ser Leu Trp
385 390 395 400
Lys Cys Met Arg Met Cys Gln Tyr Val Asp Asp Ala Asp Thr Asp Ala
405 410 415
Lys Gly Val Leu Met Tyr Arg Asn Val Asn Gly Ala Gly Pro Val Lys
420 425 430
Pro Ile Asp
435
<210> 68
<211> 396
<212> PRT
<213> Aspergillus fumigatus (GenBank Accession No. EAL85733)
<220>
<221> MISC_FEATURE
<223> delta-15 desaturase
<400> 68
Met Ala Gly Lys Met Ala Glu Val Arg Gln Arg Asp Val Gln Thr Glu
1 5 10 15
Thr Glu Val Val Gln Asp Ser Ile Pro Ser Leu Lys Ser Leu Lys Asp
20 25 30
Ala Ile Pro Lys Glu Cys Phe Glu Ser Ser Leu Ala Ile Ser Phe Leu
35 40 45
Tyr Leu Ala Arg Asp Ile Leu Tyr Cys Ala Ile Leu Thr Tyr Gly Ala
50 55 60
Phe His Ile His Leu Leu Pro Ser Leu Pro Leu Arg Val Leu Ala Trp
65 70 75 80
Ala Thr Tyr Gly Phe Phe Gln Gly Cys Val Gly Thr Gly Met Trp Ile
85 90 95
Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Pro Tyr Gln Gly Ile
100 105 110
Asn Asp Phe Ile Gly Trp Ala Thr His Ser Phe Leu Leu Val Pro Tyr
115 120 125
Phe Ser Trp Lys Ile Thr His Ala Arg His His Arg Tyr Thr Gly His
130 135 140
Met Glu Lys Asp Thr Val Phe Val Pro Trp Thr Asp Glu Gln Leu Ala
145 150 155 160
Lys Lys Arg Asn Val Arg Ile Glu Gln Leu Lys His Phe Ala Glu Glu
165 170 175
Thr Pro Ile Val Ser Phe Leu Gln Leu Ile Gly His Gln Leu Gly Gly
180 185 190
Trp Gln Leu Tyr Leu Leu Thr Asn Ala Thr Ala Gly Ala Gln Ser Trp
195 200 205
Pro Glu Gly Lys Pro Lys Thr Gly Pro Ala Ser His Phe Asn Pro Val
210 215 220
Gly Ala Leu Trp Thr Pro Ser Gln Arg Leu Ser Ile Ala Ile Ser Asp
225 230 235 240
Leu Gly Leu Leu Ile Met Ala Ala Val Leu Tyr Tyr Ala Ser Thr Gln
245 250 255
Ile Gly Ala Trp Asn Val Val Leu Leu Tyr Phe Val Pro Tyr Leu Trp
260 265 270
Val His His Trp Leu Ile Ala Ile Thr Tyr Leu Gln His Thr His Pro
275 280 285
Ser Val Pro His Tyr Thr Pro Glu Ala Trp Thr Tyr Thr Lys Gly Ala
290 295 300
Leu Ala Thr Val Asp Arg Thr Met Gly Phe Ile Gly Arg His Phe Phe
305 310 315 320
His Glu Ile Ile Asp Tyr His Val Val His His Leu Phe Ser Arg Ile
325 330 335
Pro Phe Tyr Lys Ala Glu Gln Ala Thr Trp Ala Ile Gln Pro Leu Leu
340 345 350
Gly Ala Gln Tyr His Glu Glu Lys Glu Gln Ser Phe Leu Gly Ser Leu
355 360 365
Val Thr Thr Phe Arg Lys Cys Ile Tyr Val Ser Ala Thr Gly Gln Pro
370 375 380
Gly Val Leu His Phe Val Lys Ala Asp Glu Gly Asn
385 390 395
<210> 69
<211> 792
<212> DNA
<213> Isochrysis galbana
<220>
<221> misc_feature
<223> delta-9 elongase
<400> 69
atggccctcg caaacgacgc gggagagcgc atctgggcgg ctgtgaccga cccggaaatc 60
ctcattggca ccttctcgta cttgctactc aaaccgctgc tccgcaattc cgggctggtg 120
gatgagaaga agggcgcata caggacgtcc atgatctggt acaacgttct gctggcgctc 180
ttctctgcgc tgagcttcta cgtgacggcg accgccctcg gctgggacta tggtacgggc 240
gcgtggctgc gcaggcaaac cggcgacaca ccgcagccgc tcttccagtg cccgtccccg 300
gtttgggact cgaagctctt cacatggacc gccaaggcat tctattactc caagtacgtg 360
gagtacctcg acacggcctg gctggtgctc aagggcaaga gggtctcctt tctccaggcc 420
ttccaccact ttggcgcgcc gtgggatgtg tacctcggca ttcggctgca caacgagggc 480
gtatggatct tcatgttttt caactcgttc attcacacca tcatgtacac ctactacggc 540
ctcaccgccg ccgggtataa gttcaaggcc aagccgctca tcaccgcgat gcagatctgc 600
cagttcgtgg gcggcttcct gttggtctgg gactacatca acgtcccctg cttcaactcg 660
gacaaaggga agttgttcag ctgggctttc aactatgcat acgtcggctc ggtcttcttg 720
ctcttctgcc actttttcta ccaggacaac ttggcaacga agaaatcggc caaggcgggc 780
aagcagctct ag 792
<210> 70
<211> 263
<212> PRT
<213> Isochrysis galbana
<400> 70
Met Ala Leu Ala Asn Asp Ala Gly Glu Arg Ile Trp Ala Ala Val Thr
1 5 10 15
Asp Pro Glu Ile Leu Ile Gly Thr Phe Ser Tyr Leu Leu Leu Lys Pro
20 25 30
Leu Leu Arg Asn Ser Gly Leu Val Asp Glu Lys Lys Gly Ala Tyr Arg
35 40 45
Thr Ser Met Ile Trp Tyr Asn Val Leu Leu Ala Leu Phe Ser Ala Leu
50 55 60
Ser Phe Tyr Val Thr Ala Thr Ala Leu Gly Trp Asp Tyr Gly Thr Gly
65 70 75 80
Ala Trp Leu Arg Arg Gln Thr Gly Asp Thr Pro Gln Pro Leu Phe Gln
85 90 95
Cys Pro Ser Pro Val Trp Asp Ser Lys Leu Phe Thr Trp Thr Ala Lys
100 105 110
Ala Phe Tyr Tyr Ser Lys Tyr Val Glu Tyr Leu Asp Thr Ala Trp Leu
115 120 125
Val Leu Lys Gly Lys Arg Val Ser Phe Leu Gln Ala Phe His His Phe
130 135 140
Gly Ala Pro Trp Asp Val Tyr Leu Gly Ile Arg Leu His Asn Glu Gly
145 150 155 160
Val Trp Ile Phe Met Phe Phe Asn Ser Phe Ile His Thr Ile Met Tyr
165 170 175
Thr Tyr Tyr Gly Leu Thr Ala Ala Gly Tyr Lys Phe Lys Ala Lys Pro
180 185 190
Leu Ile Thr Ala Met Gln Ile Cys Gln Phe Val Gly Gly Phe Leu Leu
195 200 205
Val Trp Asp Tyr Ile Asn Val Pro Cys Phe Asn Ser Asp Lys Gly Lys
210 215 220
Leu Phe Ser Trp Ala Phe Asn Tyr Ala Tyr Val Gly Ser Val Phe Leu
225 230 235 240
Leu Phe Cys His Phe Phe Tyr Gln Asp Asn Leu Ala Thr Lys Lys Ser
245 250 255
Ala Lys Ala Gly Lys Gln Leu
260
<210> 71
<211> 792
<212> DNA
<213> Artificial Sequence
<220>
<223> IgD9e: synthetic delta-9 elongase (codon-optimized for Yarrowia
lipolytica)
<400> 71
atggctctgg ccaacgacgc tggcgagcga atctgggctg ccgtcaccga tcccgaaatc 60
ctcattggca ccttctccta cctgctcctg aagcctctcc tgcgaaactc tggtctcgtg 120
gacgagaaga aaggagccta ccgaacctcc atgatctggt acaacgtcct cctggctctc 180
ttctctgccc tgtccttcta cgtgactgcc accgctctcg gctgggacta cggtactgga 240
gcctggctgc gaagacagac cggtgatact ccccagcctc tctttcagtg tccctctcct 300
gtctgggact ccaagctgtt cacctggact gccaaggcct tctactattc taagtacgtg 360
gagtacctcg acaccgcttg gctggtcctc aagggcaagc gagtgtcctt tctgcaggcc 420
ttccatcact ttggagctcc ctgggacgtc tacctcggca ttcgactgca caacgagggt 480
gtgtggatct tcatgttctt taactcgttc attcacacca tcatgtacac ctactatgga 540
ctgactgccg ctggctacaa gttcaaggcc aagcctctga tcactgccat gcagatttgc 600
cagttcgtcg gtggctttct cctggtctgg gactacatca acgttccctg cttcaactct 660
gacaagggca agctgttctc ctgggctttc aactacgcct acgtcggatc tgtctttctc 720
ctgttctgtc acttctttta ccaggacaac ctggccacca agaaatccgc taaggctggt 780
aagcagcttt ag 792
<210> 72
<211> 1275
<212> DNA
<213> Euglena gracilis (GenBank Accession Nos. AF139720 and AAD45877)
<220>
<221> misc_feature
<222> (14)..(1273)
<223> non-functional delta-8 desaturase
<400> 72
attttttttc gaaatgaagt caaagcgcca agcgctatcc cccttacaat tgatggaaca 60
aacatatgat gtggtcaatt tccaccctgg tggtgcggaa attatagaga attaccaagg 120
aagggatgcc actgatgcct tcatggttat gcactttcaa gaagccttcg acaagctcaa 180
gcgcatgccc aaaatcaatc ccagttttga gttgccaccc caggctgcag tgaatgaagc 240
tcaagaggat ttccggaagc tccgagaaga gttgatcgca actggcatgt ttgatgcctc 300
ccccctctgg tactcataca aaatcagcac cacactgggc cttggagtgc tgggttattt 360
cctgatggtt cagtatcaga tgtatttcat tggggcagtg ttgcttggga tgcactatca 420
acagatgggc tggctttctc atgacatttg ccaccaccag actttcaaga accggaactg 480
gaacaacctc gtgggactgg tatttggcaa tggtctgcaa ggtttttccg tgacatgttg 540
gaaggacaga cacaatgcac atcattcggc aaccaatgtt caagggcacg accctgatat 600
tgacaacctc ccccccttag cctggtctga ggatgacgtc acacgggcgt caccgatttc 660
ccgcaagctc attcagttcc agcagtacta tttcttggtc atctgtatct tgttgcggtt 720
catttggtgt ttccagtgcg tgttgaccgt gcgcagtttg aaggacagag ataaccaatt 780
ctatcgctct cagtataaga aggaggccat tggcctcgcc ctgcactgga ccttgaaggc 840
cctgttccac ttattcttta tgcccagcat cctcacatcg ctgttggtgt ttttcgtttc 900
ggagctggtt ggcggcttcg gcattgcgat cgtggtgttc atgaaccact acccactgga 960
gaagatcggg gacccagtct gggatggcca tggattctcg gttggccaga tccatgagac 1020
catgaacatt cggcgaggga ttatcacaga ttggtttttc ggaggcttga attaccagat 1080
tgagcaccat ttgtggccga ccctccctcg ccacaacctg acagcggtta gctaccaggt 1140
ggaacagctg tgccagaagc acaacctgcc gtatcggaac ccgctgcccc atgaagggtt 1200
ggtcatcctg ctgcgctatc tggcggtgtt cgcccggatg gcggagaagc aacccgcggg 1260
gaaggctcta taagg 1275
<210> 73
<211> 419
<212> PRT
<213> Euglena gracilis (GenBank Accession No. AF139720 and AAD45877)
<400> 73
Met Lys Ser Lys Arg Gln Ala Leu Ser Pro Leu Gln Leu Met Glu Gln
1 5 10 15
Thr Tyr Asp Val Val Asn Phe His Pro Gly Gly Ala Glu Ile Ile Glu
20 25 30
Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val Met His Phe
35 40 45
Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile Asn Pro Ser
50 55 60
Phe Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln Glu Asp Phe
65 70 75 80
Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe Asp Ala Ser
85 90 95
Pro Leu Trp Tyr Ser Tyr Lys Ile Ser Thr Thr Leu Gly Leu Gly Val
100 105 110
Leu Gly Tyr Phe Leu Met Val Gln Tyr Gln Met Tyr Phe Ile Gly Ala
115 120 125
Val Leu Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu Ser His Asp
130 135 140
Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn Asn Leu Val
145 150 155 160
Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val Thr Cys Trp
165 170 175
Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val Gln Gly His
180 185 190
Asp Pro Asp Ile Asp Asn Leu Pro Pro Leu Ala Trp Ser Glu Asp Asp
195 200 205
Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln Phe Gln Gln
210 215 220
Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile Trp Cys Phe
225 230 235 240
Gln Cys Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp Asn Gln Phe
245 250 255
Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala Leu His Trp
260 265 270
Thr Leu Lys Ala Leu Phe His Leu Phe Phe Met Pro Ser Ile Leu Thr
275 280 285
Ser Leu Leu Val Phe Phe Val Ser Glu Leu Val Gly Gly Phe Gly Ile
290 295 300
Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys Ile Gly Asp
305 310 315 320
Pro Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile His Glu Thr
325 330 335
Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe Gly Gly Leu
340 345 350
Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro Arg His Asn
355 360 365
Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln Lys His Asn
370 375 380
Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val Ile Leu Leu
385 390 395 400
Arg Tyr Leu Ala Val Phe Ala Arg Met Ala Glu Lys Gln Pro Ala Gly
405 410 415
Lys Ala Leu
<210> 74
<211> 422
<212> PRT
<213> Euglena gracilis
<400> 74
Met Lys Ser Lys Arg Gln Ala Leu Ser Pro Leu Gln Leu Met Glu Gln
1 5 10 15
Thr Tyr Asp Val Ser Ala Trp Val Asn Phe His Pro Gly Gly Ala Glu
20 25 30
Ile Ile Glu Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val
35 40 45
Met His Phe Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile
50 55 60
Asn Pro Ser Phe Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln
65 70 75 80
Glu Asp Phe Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe
85 90 95
Asp Ala Ser Pro Leu Trp Tyr Ser Tyr Lys Ile Ser Thr Thr Leu Gly
100 105 110
Leu Gly Val Leu Gly Tyr Phe Leu Met Val Gln Tyr Gln Met Tyr Phe
115 120 125
Ile Gly Ala Val Leu Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu
130 135 140
Ser His Asp Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn
145 150 155 160
Asn Leu Val Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val
165 170 175
Thr Cys Trp Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val
180 185 190
Gln Gly His Asp Pro Asp Ile Asp Asn Leu Pro Pro Leu Ala Trp Ser
195 200 205
Glu Asp Asp Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln
210 215 220
Phe Gln Gln Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile
225 230 235 240
Trp Cys Phe Gln Cys Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp
245 250 255
Asn Gln Phe Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala
260 265 270
Leu His Trp Thr Leu Lys Ala Leu Phe His Leu Phe Phe Met Pro Ser
275 280 285
Ile Leu Thr Ser Leu Leu Val Phe Phe Val Ser Glu Leu Val Gly Gly
290 295 300
Phe Gly Ile Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys
305 310 315 320
Ile Gly Asp Pro Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile
325 330 335
His Glu Thr Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe
340 345 350
Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro
355 360 365
Arg His Asn Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln
370 375 380
Lys His Asn Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val
385 390 395 400
Ile Leu Leu Arg Tyr Leu Ala Val Phe Ala Arg Met Ala Glu Lys Gln
405 410 415
Pro Ala Gly Lys Ala Leu
420
<210> 75
<211> 1270
<212> DNA
<213> Artificial Sequence
<220>
<223> D8S-1: Synthetic gene codon-optimized for expression in Yarrowia
lipolytica
<400> 75
ccatggagtc caagcgacag gctctgtctc ccctccagct gatggaacag acctacgacg 60
tcgtgaactt ccaccctggt ggagctgaaa tcattgagaa ctaccaggga cgagatgcta 120
ctgacgcctt catggttatg cactttcagg aagccttcga caagctcaag cgaatgccca 180
agatcaaccc ctcctttgag ctgcctcccc aggctgccgt caacgaagct caggaggatt 240
tccgaaagct ccgagaagag ctgatcgcca ctggcatgtt tgacgcctct cccctctggt 300
actcgtacaa gatctccacc accctgggtc ttggcgtgct tggatacttc ctgatggtcc 360
agtaccagat gtacttcatt ggtgctgtgc tgctcggtat gcactaccag caaatgggat 420
ggctgtctca tgacatctgc caccaccaga ccttcaagaa ccgaaactgg aataacctcg 480
tgggtctggt ctttggcaac ggactccagg gcttctccgt gacctgttgg aaggacagac 540
acaacgccca tcattctgct accaacgttc agggtcacga tcccgacatt gataacctgc 600
ctcccctcgc ctggtccgag gacgatgtca ctcgagcttc tcccatctcc cgaaagctca 660
ttcagttcca acagtactat ttcctggtca tctgtattct cctgcgattc atctggtgtt 720
tccagtgcgt gctgaccgtt cgatccctca aggaccgaga caaccagttc taccgatctc 780
agtacaagaa agaggccatt ggactcgctc tgcactggac tctcaaggct ctgttccacc 840
tcttctttat gccctccatc ctgacctcgc tcctggtgtt ctttgtttcc gagctcgtcg 900
gtggcttcgg aattgccatc gtggtcttca tgaaccacta ccctctggag aagatcggtg 960
atcccgtctg ggacggacat ggcttctctg tgggtcagat ccatgagacc atgaacattc 1020
gacgaggcat cattactgac tggttctttg gaggcctgaa ctaccagatc gagcaccatc 1080
tctggcccac cctgcctcga cacaacctca ctgccgtttc ctaccaggtg gaacagctgt 1140
gccagaagca caacctcccc taccgaaacc ctctgcccca tgaaggtctc gtcatcctgc 1200
tccgatacct ggccgtgttc gctcgaatgg ccgagaagca gcccgctggc aaggctctct 1260
aagcggccgc 1270
<210> 76
<211> 1269
<212> DNA
<213> Artificial Sequence
<220>
<223> D8S-3: synthetic delta 8-desaturase gene codon-optimized for
Yarrowia lipolytica in pDMW261
<400> 76
atgaagtcca agcgacaggc tctgtctccc ctccagctga tggaacagac ctacgacgtc 60
tccgcttggg tgaacttcca ccctggtgga gctgaaatca ttgagaacta ccagggacga 120
gatgctactg acgccttcat ggttatgcac tttcaggaag ccttcgacaa gctcaagcga 180
atgcccaaga tcaacccctc ctttgagctg cctccccagg ctgccgtcaa cgaagctcag 240
gaggatttcc gaaagctccg agaagagctg atcgccactg gcatgtttga cgcctctccc 300
ctctggtact cgtacaagat ctccaccacc ctgggtcttg gcgtgcttgg atacttcctg 360
atggtccagt accagatgta cttcattggt gctgtgctgc tcggtatgca ctaccagcaa 420
atgggatggc tgtctcatga catctgccac caccagacct tcaagaaccg aaactggaat 480
aacctcgtgg gtctggtctt tggcaacgga ctccagggct tctccgtgac ctgttggaag 540
gacagacaca acgcccatca ttctgctacc aacgttcagg gtcacgatcc cgacattgat 600
aacctgcctc ccctcgcctg gtccgaggac gatgtcactc gagcttctcc catctcccga 660
aagctcattc agttccaaca gtactatttc ctggtcatct gtattctcct gcgattcatc 720
tggtgtttcc agtgcgtgct gaccgttcga tccctcaagg accgagacaa ccagttctac 780
cgatctcagt acaagaaaga ggccattgga ctcgctctgc actggactct caaggctctg 840
ttccacctct tctttatgcc ctccatcctg acctcgctcc tggtgttctt tgtttccgag 900
ctcgtcggtg gcttcggaat tgccatcgtg gtcttcatga accactaccc tctggagaag 960
atcggtgatc ccgtctggga cggacatggc ttctctgtgg gtcagatcca tgagaccatg 1020
aacattcgac gaggcatcat tactgactgg ttctttggag gcctgaacta ccagatcgag 1080
caccatctct ggcccaccct gcctcgacac aacctcactg ccgtttccta ccaggtggaa 1140
cagctgtgcc agaagcacaa cctcccctac cgaaaccctc tgccccatga aggtctcgtc 1200
atcctgctcc gatacctggc cgtgttcgct cgaatggccg agaagcagcc cgctggcaag 1260
gctctctaa 1269
<210> 77
<211> 1271
<212> DNA
<213> Euglena gracilis
<220>
<221> misc_feature
<222> (4)..(1269)
<223> Eg5: delta-8 desaturase
<400> 77
gaaatgaagt caaagcgcca agcgcttccc cttacaattg atggaacaac atatgatgtg 60
tctgcctggg tcaatttcca ccctggtggt gcggaaatta tagagaatta ccaaggaagg 120
gatgccactg atgccttcat ggttatgcac tctcaagaag ccttcgacaa gctcaagcgc 180
atgcccaaaa tcaatcccag ttctgagttg ccaccccagg ctgcagtgaa tgaagctcaa 240
gaggatttcc ggaagctccg agaagagttg atcgcaactg gcatgtttga tgcctccccc 300
ctctggtact catacaaaat cagcaccaca ctgggccttg gagtgctggg ttatttcctg 360
atggttcagt atcagatgta tttcattggg gcagtgttgc ttgggatgca ctatcaacag 420
atgggctggc tttctcatga catttgccac caccagactt tcaagaaccg gaactggaac 480
aacctcgtgg gactggtatt tggcaatggt ctgcaaggtt tttccgtgac atggtggaag 540
gacagacaca atgcacatca ttcggcaacc aatgttcaag ggcacgaccc tgatattgac 600
aacctccccc tcttagcctg gtctgaggat gacgtcacac gggcgtcacc gatttcccgc 660
aagctcattc agttccagca gtactatttc ttggtcatct gtatcttgtt gcggttcatt 720
tggtgtttcc agagcgtgtt gaccgtgcgc agtttgaagg acagagataa ccaattctat 780
cgctctcagt ataagaagga ggccattggc ctcgccctgc actggacctt gaagaccctg 840
ttccacttat tctttatgcc cagcatcctc acatcgctgt tggtgttttt cgtttcggag 900
ctggttggcg gcttcggcat tgcgatcgtg gtgttcatga accactaccc actggagaag 960
atcggggact cagtctggga tggccatgga ttctcggttg gccagatcca tgagaccatg 1020
aacattcggc gagggattat cacagattgg tttttcggag gcttgaatta ccagattgag 1080
caccatttgt ggccgaccct ccctcgccac aacctgacag cggttagcta ccaggtggaa 1140
cagctgtgcc agaagcacaa cctgccgtat cggaacccgc tgccccatga agggttggtc 1200
atcctgctgc gctatctggc ggtgttcgcc cggatggcgg agaagcaacc cgcggggaag 1260
gctctataag g 1271
<210> 78
<211> 421
<212> PRT
<213> Euglena gracilis
<400> 78
Met Lys Ser Lys Arg Gln Ala Leu Pro Leu Thr Ile Asp Gly Thr Thr
1 5 10 15
Tyr Asp Val Ser Ala Trp Val Asn Phe His Pro Gly Gly Ala Glu Ile
20 25 30
Ile Glu Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val Met
35 40 45
His Ser Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile Asn
50 55 60
Pro Ser Ser Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln Glu
65 70 75 80
Asp Phe Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe Asp
85 90 95
Ala Ser Pro Leu Trp Tyr Ser Tyr Lys Ile Ser Thr Thr Leu Gly Leu
100 105 110
Gly Val Leu Gly Tyr Phe Leu Met Val Gln Tyr Gln Met Tyr Phe Ile
115 120 125
Gly Ala Val Leu Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu Ser
130 135 140
His Asp Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn Asn
145 150 155 160
Leu Val Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val Thr
165 170 175
Trp Trp Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val Gln
180 185 190
Gly His Asp Pro Asp Ile Asp Asn Leu Pro Leu Leu Ala Trp Ser Glu
195 200 205
Asp Asp Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln Phe
210 215 220
Gln Gln Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile Trp
225 230 235 240
Cys Phe Gln Ser Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp Asn
245 250 255
Gln Phe Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala Leu
260 265 270
His Trp Thr Leu Lys Thr Leu Phe His Leu Phe Phe Met Pro Ser Ile
275 280 285
Leu Thr Ser Leu Leu Val Phe Phe Val Ser Glu Leu Val Gly Gly Phe
290 295 300
Gly Ile Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys Ile
305 310 315 320
Gly Asp Ser Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile His
325 330 335
Glu Thr Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe Gly
340 345 350
Gly Leu Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro Arg
355 360 365
His Asn Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln Lys
370 375 380
His Asn Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val Ile
385 390 395 400
Leu Leu Arg Tyr Leu Ala Val Phe Ala Arg Met Ala Glu Lys Gln Pro
405 410 415
Ala Gly Lys Ala Leu
420
<210> 79
<211> 1271
<212> DNA
<213> Euglena gracilis
<220>
<221> misc_feature
<222> (4)..(1269)
<223> Eg12: delta-8 desaturase
<400> 79
gaaatgaagt caaagcgcca agcgcttccc cttacaattg atggaacaac atatgatgtg 60
tctgcctggg tcaatttcca ccctggtggt gcggaaatta tagagaatta ccaaggaagg 120
gatgccactg atgccttcat ggttatgcac tctcaagaag ccttcgacaa gctcaagcgc 180
atgcccaaaa tcaatcccag ttctgagttg ccaccccagg ctgcagtgaa tgaagctcaa 240
gaggatttcc ggaagctccg agaagagttg atcgcaactg gcatgtttga tgcctccccc 300
ctctggtact catacaaaat cagcaccaca ctgggccttg gagtgctggg ttatttcctg 360
atggttcagt atcagatgta tttcattggg gcagtgttgc ttgggatgca ctatcaacag 420
atgggctggc tttctcatga catttgccac caccagactt tcaagaaccg gaactggaac 480
aacctcgtgg gactggtatt tggcaatggt ctgcaaggtt tttccgtgac atggtggaag 540
gacagacaca atgcacatca ttcggcaacc aatgttcaag ggcacgaccc tgatattgac 600
aacctccccc tcttagcctg gtctgaggat gacgtcacac gggcgtcacc gatttcccgc 660
aagctcattc agttccagca gtactatttc ttggtcatct gtatcttgtt gcggttcatt 720
tggtgtttcc agagcgtgtt gaccgtgcgc agtttgaagg acagagataa ccaattctat 780
cgctctcagt ataagaagga ggccattggc ctcgccctgc actggacctt gaaggccctg 840
ttccacttat tctttatgcc cagcatcctc acatcgctgt tggtgttttt cgtttcggag 900
ctggttggcg gcttcggcat tgcgatcgtg gtgttcatga accactaccc actggagaag 960
atcggggact cagtctggga tggccatgga ttctcggttg gccagatcca tgagaccatg 1020
aacattcggc gagggattat cacagattgg tttttcggag gcttgaatta ccagattgag 1080
caccatttgt ggccgaccct ccctcgccac aacctgacag cggttagcta ccaggtggaa 1140
cagctgtgcc agaagcacaa cctgccgtat cggaacccgc tgccccatga agggttggtc 1200
atcctgctgc gctatctggc ggtgttcgcc cggatggcgg agaagcaacc cgcggggaag 1260
gctctataag g 1271
<210> 80
<211> 421
<212> PRT
<213> Euglena gracilis
<400> 80
Met Lys Ser Lys Arg Gln Ala Leu Pro Leu Thr Ile Asp Gly Thr Thr
1 5 10 15
Tyr Asp Val Ser Ala Trp Val Asn Phe His Pro Gly Gly Ala Glu Ile
20 25 30
Ile Glu Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val Met
35 40 45
His Ser Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile Asn
50 55 60
Pro Ser Ser Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln Glu
65 70 75 80
Asp Phe Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe Asp
85 90 95
Ala Ser Pro Leu Trp Tyr Ser Tyr Lys Ile Ser Thr Thr Leu Gly Leu
100 105 110
Gly Val Leu Gly Tyr Phe Leu Met Val Gln Tyr Gln Met Tyr Phe Ile
115 120 125
Gly Ala Val Leu Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu Ser
130 135 140
His Asp Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn Asn
145 150 155 160
Leu Val Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val Thr
165 170 175
Trp Trp Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val Gln
180 185 190
Gly His Asp Pro Asp Ile Asp Asn Leu Pro Leu Leu Ala Trp Ser Glu
195 200 205
Asp Asp Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln Phe
210 215 220
Gln Gln Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile Trp
225 230 235 240
Cys Phe Gln Ser Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp Asn
245 250 255
Gln Phe Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala Leu
260 265 270
His Trp Thr Leu Lys Ala Leu Phe His Leu Phe Phe Met Pro Ser Ile
275 280 285
Leu Thr Ser Leu Leu Val Phe Phe Val Ser Glu Leu Val Gly Gly Phe
290 295 300
Gly Ile Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys Ile
305 310 315 320
Gly Asp Ser Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile His
325 330 335
Glu Thr Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe Gly
340 345 350
Gly Leu Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro Arg
355 360 365
His Asn Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln Lys
370 375 380
His Asn Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val Ile
385 390 395 400
Leu Leu Arg Tyr Leu Ala Val Phe Ala Arg Met Ala Glu Lys Gln Pro
405 410 415
Ala Gly Lys Ala Leu
420
<210> 81
<211> 1272
<212> DNA
<213> Artificial Sequence
<220>
<223> D8SF: synthetic delta-8 desaturase (codon-optimized for Yarrowia
lipolytica)
<400> 81
catggtgaag tccaagcgac aggctctgcc cctcaccatc gacggaacta cctacgacgt 60
ctccgcttgg gtgaacttcc accctggtgg agctgaaatc attgagaact accagggacg 120
agatgctact gacgccttca tggttatgca ctctcaggaa gccttcgaca agctcaagcg 180
aatgcccaag atcaacccct cctccgagct gcctccccag gctgccgtca acgaagctca 240
ggaggatttc cgaaagctcc gagaagagct gatcgccact ggcatgtttg acgcctctcc 300
cctctggtac tcgtacaaga tctccaccac cctgggtctt ggcgtgcttg gatacttcct 360
gatggtccag taccagatgt acttcattgg tgctgtgctg ctcggtatgc actaccagca 420
aatgggatgg ctgtctcatg acatctgcca ccaccagacc ttcaagaacc gaaactggaa 480
taacctcgtg ggtctggtct ttggcaacgg actccagggc ttctccgtga cctggtggaa 540
ggacagacac aacgcccatc attctgctac caacgttcag ggtcacgatc ccgacattga 600
taacctgcct ctgctcgcct ggtccgagga cgatgtcact cgagcttctc ccatctcccg 660
aaagctcatt cagttccaac agtactattt cctggtcatc tgtattctcc tgcgattcat 720
ctggtgtttc cagtctgtgc tgaccgttcg atccctcaag gaccgagaca accagttcta 780
ccgatctcag tacaagaaag aggccattgg actcgctctg cactggactc tcaagaccct 840
gttccacctc ttctttatgc cctccatcct gacctcgctc ctggtgttct ttgtttccga 900
gctcgtcggt ggcttcggaa ttgccatcgt ggtcttcatg aaccactacc ctctggagaa 960
gatcggtgat tccgtctggg acggacatgg cttctctgtg ggtcagatcc atgagaccat 1020
gaacattcga cgaggcatca ttactgactg gttctttgga ggcctgaact accagatcga 1080
gcaccatctc tggcccaccc tgcctcgaca caacctcact gccgtttcct accaggtgga 1140
acagctgtgc cagaagcaca acctccccta ccgaaaccct ctgccccatg aaggtctcgt 1200
catcctgctc cgatacctgg ccgtgttcgc tcgaatggcc gagaagcagc ccgctggcaa 1260
ggctctctaa gc 1272
<210> 82
<211> 422
<212> PRT
<213> Artificial Sequence
<220>
<223> D8SF: synthetic delta-8 desaturase (codon-optimized for Yarrowia
lipolytica)
<400> 82
Met Val Lys Ser Lys Arg Gln Ala Leu Pro Leu Thr Ile Asp Gly Thr
1 5 10 15
Thr Tyr Asp Val Ser Ala Trp Val Asn Phe His Pro Gly Gly Ala Glu
20 25 30
Ile Ile Glu Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val
35 40 45
Met His Ser Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile
50 55 60
Asn Pro Ser Ser Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln
65 70 75 80
Glu Asp Phe Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe
85 90 95
Asp Ala Ser Pro Leu Trp Tyr Ser Tyr Lys Ile Ser Thr Thr Leu Gly
100 105 110
Leu Gly Val Leu Gly Tyr Phe Leu Met Val Gln Tyr Gln Met Tyr Phe
115 120 125
Ile Gly Ala Val Leu Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu
130 135 140
Ser His Asp Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn
145 150 155 160
Asn Leu Val Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val
165 170 175
Thr Trp Trp Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val
180 185 190
Gln Gly His Asp Pro Asp Ile Asp Asn Leu Pro Leu Leu Ala Trp Ser
195 200 205
Glu Asp Asp Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln
210 215 220
Phe Gln Gln Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile
225 230 235 240
Trp Cys Phe Gln Ser Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp
245 250 255
Asn Gln Phe Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala
260 265 270
Leu His Trp Thr Leu Lys Thr Leu Phe His Leu Phe Phe Met Pro Ser
275 280 285
Ile Leu Thr Ser Leu Leu Val Phe Phe Val Ser Glu Leu Val Gly Gly
290 295 300
Phe Gly Ile Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys
305 310 315 320
Ile Gly Asp Ser Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile
325 330 335
His Glu Thr Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe
340 345 350
Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro
355 360 365
Arg His Asn Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln
370 375 380
Lys His Asn Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val
385 390 395 400
Ile Leu Leu Arg Tyr Leu Ala Val Phe Ala Arg Met Ala Glu Lys Gln
405 410 415
Pro Ala Gly Lys Ala Leu
420
<210> 83
<211> 2628
<212> DNA
<213> Rattus norvegicus (GenBank Accession No. AB071986)
<220>
<221> CDS
<222> (90)..(893)
<223> C16/18 elongase
<400> 83
tggatgcgga cgctgggagg agagcccctg agctaggagc tgggagccga ggcgcagaga 60
acacgtagcg actccgaaga tcagcccca atg aac atg tca gtg ttg act tta 113
Met Asn Met Ser Val Leu Thr Leu
1 5
caa gaa tat gaa ttc gag aag cag ttc aac gag aat gaa gcc atc caa 161
Gln Glu Tyr Glu Phe Glu Lys Gln Phe Asn Glu Asn Glu Ala Ile Gln
10 15 20
tgg atg cag gaa aac tgg aag aaa tct ttc ctg ttt tct gcg ctg tac 209
Trp Met Gln Glu Asn Trp Lys Lys Ser Phe Leu Phe Ser Ala Leu Tyr
25 30 35 40
gct gcc ttt ata ttt ggt ggt cgg cat ctg atg aac aag cgg gcc aag 257
Ala Ala Phe Ile Phe Gly Gly Arg His Leu Met Asn Lys Arg Ala Lys
45 50 55
ttt gaa ctg cgg aag ccg ctc gtg ctc tgg tca ctg act ctt gcg gtc 305
Phe Glu Leu Arg Lys Pro Leu Val Leu Trp Ser Leu Thr Leu Ala Val
60 65 70
ttc agt ata ttc ggt gct ctt cga act ggt gct tac atg ctg tac att 353
Phe Ser Ile Phe Gly Ala Leu Arg Thr Gly Ala Tyr Met Leu Tyr Ile
75 80 85
ttg atg acc aaa ggc ctg aag cag tca gtt tgt gac cag agt ttt tac 401
Leu Met Thr Lys Gly Leu Lys Gln Ser Val Cys Asp Gln Ser Phe Tyr
90 95 100
aac gga cct gtc agc aaa ttc tgg gct tac gcg ttt gtg ctc agc aaa 449
Asn Gly Pro Val Ser Lys Phe Trp Ala Tyr Ala Phe Val Leu Ser Lys
105 110 115 120
gca ccc gaa cta ggt gat acg ata ttc atc att ctg agg aag cag aag 497
Ala Pro Glu Leu Gly Asp Thr Ile Phe Ile Ile Leu Arg Lys Gln Lys
125 130 135
ctg atc ttc ctg cac tgg tac cac cac atc act gtg ctc ctg tac tct 545
Leu Ile Phe Leu His Trp Tyr His His Ile Thr Val Leu Leu Tyr Ser
140 145 150
tgg tac tcc tac aaa gac atg gta gct ggg ggt ggt tgg ttc atg act 593
Trp Tyr Ser Tyr Lys Asp Met Val Ala Gly Gly Gly Trp Phe Met Thr
155 160 165
atg aac tat ggc gta cac gcc gtc atg tac tct tac tac gcc ttg cgg 641
Met Asn Tyr Gly Val His Ala Val Met Tyr Ser Tyr Tyr Ala Leu Arg
170 175 180
gct gcg ggt ttc cgg gtc tcc cgg aag ttt gcc atg ttc atc acg ttg 689
Ala Ala Gly Phe Arg Val Ser Arg Lys Phe Ala Met Phe Ile Thr Leu
185 190 195 200
tcc cag atc act cag atg ctg atg ggc tgt gtc att aac tac ctg gtc 737
Ser Gln Ile Thr Gln Met Leu Met Gly Cys Val Ile Asn Tyr Leu Val
205 210 215
ttc aac tgg atg cag cat gac aat gac cag tgc tac tcc cac ttt cag 785
Phe Asn Trp Met Gln His Asp Asn Asp Gln Cys Tyr Ser His Phe Gln
220 225 230
aac atc ttc tgg tcc tca ctc atg tac ctc agc tac ctt ctg ctc ttc 833
Asn Ile Phe Trp Ser Ser Leu Met Tyr Leu Ser Tyr Leu Leu Leu Phe
235 240 245
tgc cat ttc ttc ttt gag gcc tac atc ggc aaa gtg aag aaa gcg acg 881
Cys His Phe Phe Phe Glu Ala Tyr Ile Gly Lys Val Lys Lys Ala Thr
250 255 260
aag gcc gag tag tgtcagagct gaggaggaag acatagctca gggtcatcac 933
Lys Ala Glu
265
gaaaaataat agacaaaaag aaaatggcac aaggaatcac atatggtgca gctaaaacaa 993
aacaaaacat tatgagcaga cgctaagccc aaggcagctt gggagtgaag attaggttgt 1053
aagtttatga tcctttttgg gtgaggactc actgagaaca ctgctgctga gggaccccct 1113
tccctcttac ctgtcaactc tagaacacac tagaagccaa ggcagccatg ggcaaggaga 1173
ttagtggaca gcaagcaaaa cactgcagga agagggggga gatctattca gagttttttg 1233
ttttgttttg ttttgttttt ctctaaggat aaaggagttt ccccttttca aactgtgtga 1293
gcacacccac gcgcatgcgg acacacacac acacacacat acacacacac acacacatac 1353
acacatacac acacacacac acacacacac acacaatctt ttccacagga aaccagagct 1413
ggtagaaaag ataaacggta agcgacaggg tttctatcta ggacagcaat gcttttgcaa 1473
aaacctaagc cttttaaaga agttagcttg taactccttg acaaaagatg tcttaattct 1533
ttttactgta actgaaagtc aaaaaggtag ataccttccc cttcactgca cagcctcggg 1593
cttgttcgtt tgctacaacg gagcagagga cagttcttcc gtgatacttt atttctggga 1653
gaaagaaaac catgcagccc aaatcccgag aaggcggccc atagctaacc ctgcagttga 1713
agcatcacac tgacagctgt tatttctgct cttcggtgag aattgaagca gccgttgttc 1773
aattacccca aactttagga tgggggagta aatacggaat tgaaaagaaa gaagctcgac 1833
tggttggctt gaaaatggaa tcttgtacta tctataacaa aactcagccc atcgtccctg 1893
gagctggaag gactatcaga agagaccaga actgaagatt catccaatac acagatggca 1953
tgttcgcctc cttccccgtt tgacctcaca catagtcctg gctttctaaa tgaggtccta 2013
tgacccagtc tgtgttttct atatttttgt gactttcaaa aacagatccg cagggctctg 2073
catttggggt aaacactgtg tttctgcagc ctctgcattc gctcccttca gcaatgcaga 2133
ggcgtgagaa gtgccctctg ctggcttagt gagaagcttc aacaaacact tcataatagg 2193
ttgaaatagc tgaccacaaa gggcctgcgt agattaaacc ctaagttaag ttctaagtgc 2253
tgtcaaacac ctgacatata tttgaccaaa tcagaagaga gagaacctct atgcttcaag 2313
taagcttcat aaaaaatttt taaagtgact ttcacttggg aactcagaaa gtcaatgtat 2373
taagagccat attcttaaaa aaaaaaagaa agaaagaaaa gaagaagaag aaagctagac 2433
aatgttatct gtaatatttc agtcctttac aagccaaata aatgtgtcga tgttcctaaa 2493
aaaaaaaaaa aaaacggtcc gcggccgccc tttagtgagg gttaatttaa atcgtacgtc 2553
gcgattaatt aaccgcggta ccttctgagg cggaaagaac cagccggatc cctcgaggga 2613
tccagacatg ataaa 2628
<210> 84
<211> 267
<212> PRT
<213> Rattus norvegicus (GenBank Accession No. AB071986)
<400> 84
Met Asn Met Ser Val Leu Thr Leu Gln Glu Tyr Glu Phe Glu Lys Gln
1 5 10 15
Phe Asn Glu Asn Glu Ala Ile Gln Trp Met Gln Glu Asn Trp Lys Lys
20 25 30
Ser Phe Leu Phe Ser Ala Leu Tyr Ala Ala Phe Ile Phe Gly Gly Arg
35 40 45
His Leu Met Asn Lys Arg Ala Lys Phe Glu Leu Arg Lys Pro Leu Val
50 55 60
Leu Trp Ser Leu Thr Leu Ala Val Phe Ser Ile Phe Gly Ala Leu Arg
65 70 75 80
Thr Gly Ala Tyr Met Leu Tyr Ile Leu Met Thr Lys Gly Leu Lys Gln
85 90 95
Ser Val Cys Asp Gln Ser Phe Tyr Asn Gly Pro Val Ser Lys Phe Trp
100 105 110
Ala Tyr Ala Phe Val Leu Ser Lys Ala Pro Glu Leu Gly Asp Thr Ile
115 120 125
Phe Ile Ile Leu Arg Lys Gln Lys Leu Ile Phe Leu His Trp Tyr His
130 135 140
His Ile Thr Val Leu Leu Tyr Ser Trp Tyr Ser Tyr Lys Asp Met Val
145 150 155 160
Ala Gly Gly Gly Trp Phe Met Thr Met Asn Tyr Gly Val His Ala Val
165 170 175
Met Tyr Ser Tyr Tyr Ala Leu Arg Ala Ala Gly Phe Arg Val Ser Arg
180 185 190
Lys Phe Ala Met Phe Ile Thr Leu Ser Gln Ile Thr Gln Met Leu Met
195 200 205
Gly Cys Val Ile Asn Tyr Leu Val Phe Asn Trp Met Gln His Asp Asn
210 215 220
Asp Gln Cys Tyr Ser His Phe Gln Asn Ile Phe Trp Ser Ser Leu Met
225 230 235 240
Tyr Leu Ser Tyr Leu Leu Leu Phe Cys His Phe Phe Phe Glu Ala Tyr
245 250 255
Ile Gly Lys Val Lys Lys Ala Thr Lys Ala Glu
260 265
<210> 85
<211> 804
<212> DNA
<213> Rattus norvegicus
<220>
<221> misc_feature
<223> synthetic C16/18 elongase (codon-optimized)
<400> 85
atggacatgt ccgtcctgac tctccaagag tacgagttcg agaagcagtt caacgagaat 60
gaagccatcc aatggatgca ggaaaactgg aagaaatcct tcctgttttc tgccctctac 120
gctgccttta tctttggtgg acgacatctg atgaacaagc gagccaagtt tgagctgcga 180
aaacctctcg tgctctggtc cctgaccctc gctgtcttct ctatcttcgg tgctctgcga 240
actggagcct acatgctcta catcctgatg accaaaggcc tgaaacagtc tgtttgtgac 300
cagtcctttt acaacggacc cgtctcgaaa ttctgggctt acgcctttgt gctctccaaa 360
gctcccgaac ttggcgatac catcttcatc attctgcgaa agcagaaact catcttcctg 420
cactggtatc accacatcac cgtcctcctg tactcttggt actcctacaa ggacatggtg 480
gctggaggtg gctggttcat gactatgaac tacggtgtcc acgccgtgat gtactcctac 540
tacgccctcc gagctgccgg tttccgagtc tctcgaaagt ttgccatgtt catcaccctg 600
tcgcagatca ctcagatgct catgggctgt gtcattaact acctggtctt caactggatg 660
cagcatgaca atgaccagtg ctactcccac tttcagaaca tcttctggtc ctctctcatg 720
tacctctcct accttctgct cttctgccat ttcttctttg aggcctacat tggcaaagtg 780
aagaaagcca ccaaggctga gtaa 804
<210> 86
<211> 828
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<223> C16/18 elongase
<400> 86
atggagtctg gacctatgcc tgccgggatc cccttccctg aatactatga ctttttcatg 60
gactggaaga cacccctggc aattgctgcc acctacaccg ccgctgttgg gctcttcaac 120
cccaaggttg gcaaagtctc gcgcgtggta gccaagtcgg ctaacgccaa gccggcagag 180
cgcacgcagt ccggcgccgc catgaccgcc tttgtctttg tccacaacct tatcctctgc 240
gtgtactctg gaatcacctt ctactacatg ttcccagcca tggtcaagaa ctttagaaca 300
cataccctcc atgaggccta ctgcgatacg gatcagagcc tgtggaacaa cgcccttggc 360
tactggggct acctcttcta cctttcaaag ttttacgagg tcattgacac catcatcatc 420
atcttgaagg ggcgccgctc gtccctgctc cagacctacc accacgccgg cgctatgatc 480
accatgtggt ccggcatcaa ctaccaggca acgcccattt ggatttttgt cgtcttcaac 540
tcgttcatcc acaccatcat gtactgttac tatgccttca cctcaatcgg cttccacccc 600
ccaggcaaga agtacctcac ctccatgcag atcacccagt ttttggtcgg catcactatc 660
gccgtctctt atctcttcgt ccctggatgt atccgcacac ccggtgctca gatggctgtc 720
tggatcaacg tcggatacct ctttcccctc acttatctct ttgtggattt tgccaagcgt 780
acttactcca agcgtagtgc catcgccgct cagaagaagg cccagtaa 828
<210> 87
<211> 275
<212> PRT
<213> Mortierella alpina
<400> 87
Met Glu Ser Gly Pro Met Pro Ala Gly Ile Pro Phe Pro Glu Tyr Tyr
1 5 10 15
Asp Phe Phe Met Asp Trp Lys Thr Pro Leu Ala Ile Ala Ala Thr Tyr
20 25 30
Thr Ala Ala Val Gly Leu Phe Asn Pro Lys Val Gly Lys Val Ser Arg
35 40 45
Val Val Ala Lys Ser Ala Asn Ala Lys Pro Ala Glu Arg Thr Gln Ser
50 55 60
Gly Ala Ala Met Thr Ala Phe Val Phe Val His Asn Leu Ile Leu Cys
65 70 75 80
Val Tyr Ser Gly Ile Thr Phe Tyr Tyr Met Phe Pro Ala Met Val Lys
85 90 95
Asn Phe Arg Thr His Thr Leu His Glu Ala Tyr Cys Asp Thr Asp Gln
100 105 110
Ser Leu Trp Asn Asn Ala Leu Gly Tyr Trp Gly Tyr Leu Phe Tyr Leu
115 120 125
Ser Lys Phe Tyr Glu Val Ile Asp Thr Ile Ile Ile Ile Leu Lys Gly
130 135 140
Arg Arg Ser Ser Leu Leu Gln Thr Tyr His His Ala Gly Ala Met Ile
145 150 155 160
Thr Met Trp Ser Gly Ile Asn Tyr Gln Ala Thr Pro Ile Trp Ile Phe
165 170 175
Val Val Phe Asn Ser Phe Ile His Thr Ile Met Tyr Cys Tyr Tyr Ala
180 185 190
Phe Thr Ser Ile Gly Phe His Pro Pro Gly Lys Lys Tyr Leu Thr Ser
195 200 205
Met Gln Ile Thr Gln Phe Leu Val Gly Ile Thr Ile Ala Val Ser Tyr
210 215 220
Leu Phe Val Pro Gly Cys Ile Arg Thr Pro Gly Ala Gln Met Ala Val
225 230 235 240
Trp Ile Asn Val Gly Tyr Leu Phe Pro Leu Thr Tyr Leu Phe Val Asp
245 250 255
Phe Ala Lys Arg Thr Tyr Ser Lys Arg Ser Ala Ile Ala Ala Gln Lys
260 265 270
Lys Ala Gln
275
<210> 88
<211> 607
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (133)..(135)
<223> ATG translation initiation codon
<400> 88
cccgtcttca ccctccctct tccccccgtt cctacgtcta cagccgttgg ctcatcttgc 60
agttgcttgt ctactatttg gtgccgacct atattcctct gtcacccaac ctaccgcact 120
cacactcgca taatggagtc tggacctatg cctgccggga tccccttccc tgaatactat 180
gactttttca tggactggaa gacacccctg gcaattgctg ccacctacac cgccgctgtt 240
gggctcttca accccaaggt tggcaaagtc tcgcgcgtgg tagccaagtc ggctaacgcc 300
aagccggcag agcgcacgca gtccggcgcc gccatgaccg cctttgtctt tgtccacaac 360
cttatcctct gcgtgtactc tggaatcacc ttctactaca tgttcccagc catggtcaag 420
aactttagaa cacataccct ccatgaggcc tactgcgata cggatcagag cctgtggaac 480
aacgcccttg gctactgggg ctacctcttc tacctttcaa agttttacga ggtcattgac 540
accatcatca tcatcttgaa ggggcgccgc tcgtccctgc tccagaccta ccaccacgcc 600
ggcgcta 607
<210> 89
<211> 1042
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (402)..(404)
<223> Stop codon
<400> 89
tgaaggggcg ccgctcgtcc ctgctccaga cctaccacca cgccggcgct atgatcacca 60
tgtggtccgg catcaactac caggcaacgc ccatttggat ttttgtcgtc ttcaactcgt 120
tcatccacac catcatgtac tgttactatg ccttcacctc aatcggcttc caccccccag 180
gcaagaagta cctcacctcc atgcagatca cccagttttt ggtcggcatc actatcgccg 240
tctcttatct cttcgtccct ggatgtatcc gcacacccgg tgctcagatg gctgtctgga 300
tcaacgtcgg atacctcttt cccctcactt atctctttgt ggattttgcc aagcgtactt 360
actccaagcg tagtgccatc gccgctcaga agaaggccca gtaaagaggc cacttcttgt 420
cgtttactct actgtttcca acatttacat ctctcaatgg cagcctcctc cctctatcct 480
tcgcactttc attttagttc cttgtattca taaaargtca aaattcattg taactccaaa 540
agtgccaatg gctttatcat ggatgagtgc catgtttatg gcccattgca tcaatacagg 600
aagatatgag cggtcagcga tagctattcc tctgagttgt cctggccttg tatgcactct 660
cgaaggagga aatggatcgg agcatcagca ctatttcagg actaggagag atacatccaa 720
aattttaaag gcatctctgg tcagtacaag agcgacttgg caacaagtct ttagtcaaac 780
ttcctcacct ttgaacttcc tcagaggtcg ccgtggcact gtggacggag acccgtgaaa 840
agaactcatg cagcaggtta agcaaccttg gaaatccatc gatgaatgcc tgatgtaaaa 900
attgagaagc tgcaagagcc aaaagttcag ttcagcacat ataagagact ttggccaaga 960
gcgatgaagt cacatgggaa ccacgtaaac aaacctcgtg cggagsacca gcccgggccg 1020
tcgaccacgc gtgccctata gt 1042
<210> 90
<211> 2223
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (2092)..(2094)
<223> ATG translation initiation codon
<400> 90
actatagggc acgcgtggtc gacggcccgg gctggtccta cctctcaatc ttgttgccct 60
gtagtcctga aatgagctcg tcatgggtct ctgtcctctc ctcgttatgg tcaaacgcat 120
tggacccggt tttctttaga ggagcattct tcttgtttaa gccgactcct cttcccgtcc 180
cgaacgacaa cttgataggt ccaccatttc catttggtgg gtgaagcggg ctgtcctcag 240
cggacatgac tctgagctag aaggaagggt gtagaggacg aaggagtaag tgctaccgtt 300
cactggcagg tgaggagcgt cgggtctaag ccacatgcct gccaattgtc ctcgccaagt 360
gcttggaagg tgtattgatg ctcatgcagc tccactctgg acctggaaac gccaccgcat 420
cgcattctta atgagctctg ctacaaacga caatctgcga accagtttgc acagggagct 480
agtcgagtct ggaaagcggg accagtgagt gactcggcgg ggcttgcatc gctgaacatc 540
gccattggga tttcttagaa agcagctctt gctcttatac aaacaccttc ctgcgtgcct 600
caccttactt acgaggagta atgttgtttt tacaggctag tggaactctt gcgcgcgagg 660
ctgatcgagt ccggctggcg ggacgatctg aaggcattta caaaaggtac accactcggc 720
acttggcctg ttttgttgcc actagctacc aggccgtgac tgaccacgaa cccttcctct 780
ggagaataga aaggatccag tcccgggaga ctacaatgtc tgttgacgag gtcatcagag 840
aagtcggccc acatgctaga ggtaagcccc gcgagaacct tatatgctga ttagtgccat 900
ccgttgaaca tcgtctgatc tgcgacaagt tctggtaata cttgatagcc accgtcccag 960
acaaggtcaa gacagaactt cttgcgcaaa tcagtacttt tatcgaagac aacatgtaac 1020
gaaaaataaa aatgctgata tggaagggaa catcacgtac gccaggtacg tgagatgttt 1080
ttcctttttt ttttattttt tttgttgggg cttgagatgt tttgggtctt tcatgaagac 1140
gttcatgaca aacaagaaat acggacagcg agtttaccgc aatggaaaag tttacctcaa 1200
ccgaactttg aacgtttcgt gaaaacctgc gtgagaattc tttgagcatg gccataccta 1260
attgtcgccg gactgatctg tgatttgatc catggtccat cgctcctgac tcgctgcacg 1320
tcctgacaga gataacctcg catagtgtcg tacagaaacc aaaagcacgc gctcggtcca 1380
gtacagtaat ggggaactgg gtactgagga cagcttgaaa gtatatcctg taggggacga 1440
taacatgggc aatcttgatg gtgtggttga gtacagggta tatgcgttcc aggtaagcaa 1500
atatcacctt tgtgagacga tagggggcag ctatagtaaa tggccaggcg cttttatacg 1560
ggaagcaatt gcagcgatgg aggtgtgtac gctgcagccg cttgtatagc agaacgtaac 1620
cccaatcctc caactccggc aaggacaatg gggaaagaag gccggatata taaaatgctt 1680
gtcagcagaa ttaaagactg tgcggactga tctgccttaa tcggaaactt cagcagggct 1740
tctcgcagtg catgaaccct cggaccatct cctgtcccaa caacacgcca atgggcttat 1800
tattaatttt ttttggctgc cgttcaaaaa aaaaaagaaa aaaactgcca cttcttattt 1860
gagggctgca ggactgcttg ttaaggcgga taacctcaat ccgcccgatg ccttttaacg 1920
ctggcctgtt cttcctcttt tctttcttct ctcccttcac ccgtcttcac cctccctctt 1980
ccccccgttc ctacgtctac agccgttggc tcatcttgca gttgcttgtc tactatttgg 2040
tgccgaccta tattcctctg tcacccaacc taccgcactc acactcgcat aatggagtct 2100
ggacctatgc ctgccgggat ccccttccct gaatactatg actttttcat ggactggaag 2160
acacccctgg caattgctgc cacctacacc gccgctgttg ggctcttcaa ccccaaggtt 2220
ggc 2223
<210> 91
<211> 3557
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (2092)..(2094)
<223> ATG translation initiation codon
<220>
<221> misc_feature
<222> (2917)..(2919)
<223> 'TAA' stop codon
<400> 91
actatagggc acgcgtggtc gacggcccgg gctggtccta cctctcaatc ttgttgccct 60
gtagtcctga aatgagctcg tcatgggtct ctgtcctctc ctcgttatgg tcaaacgcat 120
tggacccggt tttctttaga ggagcattct tcttgtttaa gccgactcct cttcccgtcc 180
cgaacgacaa cttgataggt ccaccatttc catttggtgg gtgaagcggg ctgtcctcag 240
cggacatgac tctgagctag aaggaagggt gtagaggacg aaggagtaag tgctaccgtt 300
cactggcagg tgaggagcgt cgggtctaag ccacatgcct gccaattgtc ctcgccaagt 360
gcttggaagg tgtattgatg ctcatgcagc tccactctgg acctggaaac gccaccgcat 420
cgcattctta atgagctctg ctacaaacga caatctgcga accagtttgc acagggagct 480
agtcgagtct ggaaagcggg accagtgagt gactcggcgg ggcttgcatc gctgaacatc 540
gccattggga tttcttagaa agcagctctt gctcttatac aaacaccttc ctgcgtgcct 600
caccttactt acgaggagta atgttgtttt tacaggctag tggaactctt gcgcgcgagg 660
ctgatcgagt ccggctggcg ggacgatctg aaggcattta caaaaggtac accactcggc 720
acttggcctg ttttgttgcc actagctacc aggccgtgac tgaccacgaa cccttcctct 780
ggagaataga aaggatccag tcccgggaga ctacaatgtc tgttgacgag gtcatcagag 840
aagtcggccc acatgctaga ggtaagcccc gcgagaacct tatatgctga ttagtgccat 900
ccgttgaaca tcgtctgatc tgcgacaagt tctggtaata cttgatagcc accgtcccag 960
acaaggtcaa gacagaactt cttgcgcaaa tcagtacttt tatcgaagac aacatgtaac 1020
gaaaaataaa aatgctgata tggaagggaa catcacgtac gccaggtacg tgagatgttt 1080
ttcctttttt ttttattttt tttgttgggg cttgagatgt tttgggtctt tcatgaagac 1140
gttcatgaca aacaagaaat acggacagcg agtttaccgc aatggaaaag tttacctcaa 1200
ccgaactttg aacgtttcgt gaaaacctgc gtgagaattc tttgagcatg gccataccta 1260
attgtcgccg gactgatctg tgatttgatc catggtccat cgctcctgac tcgctgcacg 1320
tcctgacaga gataacctcg catagtgtcg tacagaaacc aaaagcacgc gctcggtcca 1380
gtacagtaat ggggaactgg gtactgagga cagcttgaaa gtatatcctg taggggacga 1440
taacatgggc aatcttgatg gtgtggttga gtacagggta tatgcgttcc aggtaagcaa 1500
atatcacctt tgtgagacga tagggggcag ctatagtaaa tggccaggcg cttttatacg 1560
ggaagcaatt gcagcgatgg aggtgtgtac gctgcagccg cttgtatagc agaacgtaac 1620
cccaatcctc caactccggc aaggacaatg gggaaagaag gccggatata taaaatgctt 1680
gtcagcagaa ttaaagactg tgcggactga tctgccttaa tcggaaactt cagcagggct 1740
tctcgcagtg catgaaccct cggaccatct cctgtcccaa caacacgcca atgggcttat 1800
tattaatttt ttttggctgc cgttcaaaaa aaaaaagaaa aaaactgcca cttcttattt 1860
gagggctgca ggactgcttg ttaaggcgga taacctcaat ccgcccgatg ccttttaacg 1920
ctggcctgtt cttcctcttt tctttcttct ctcccttcac ccgtcttcac cctccctctt 1980
ccccccgttc ctacgtctac agccgttggc tcatcttgca gttgcttgtc tactatttgg 2040
tgccgaccta tattcctctg tcacccaacc taccgcactc acactcgcat aatggagtct 2100
ggacctatgc ctgccgggat ccccttccct gaatactatg actttttcat ggactggaag 2160
acacccctgg caattgctgc cacctacacc gccgctgttg ggctcttcaa ccccaaggtt 2220
ggcaaagtct cgcgcgtggt agccaagtcg gctaacgcca agccggcaga gcgcacgcag 2280
tccggcgccg ccatgaccgc ctttgtcttt gtccacaacc ttatcctctg cgtgtactct 2340
ggaatcacct tctactacat gttcccagcc atggtcaaga actttagaac acataccctc 2400
catgaggcct actgcgatac ggatcagagc ctgtggaaca acgcccttgg ctactggggc 2460
tacctcttct acctttcaaa gttttacgag gtcattgaca ccatcatcat catcttgaag 2520
gggcgccgct cgtccctgct ccagacctac caccacgccg gcgctatgat caccatgtgg 2580
tccggcatca actaccaggc aacgcccatt tggatttttg tcgtcttcaa ctcgttcatc 2640
cacaccatca tgtactgtta ctatgccttc acctcaatcg gcttccaccc cccaggcaag 2700
aagtacctca cctccatgca gatcacccag tttttggtcg gcatcactat cgccgtctct 2760
tatctcttcg tccctggatg tatccgcaca cccggtgctc agatggctgt ctggatcaac 2820
gtcggatacc tctttcccct cacttatctc tttgtggatt ttgccaagcg tacttactcc 2880
aagcgtagtg ccatcgccgc tcagaagaag gcccagtaaa gaggccactt cttgtcgttt 2940
actctactgt ttccaacatt tacatctctc aatggcagcc tcctccctct atccttcgca 3000
ctttcatttt agttccttgt attcataaaa rgtcaaaatt cattgtaact ccaaaagtgc 3060
caatggcttt atcatggatg agtgccatgt ttatggccca ttgcatcaat acaggaagat 3120
atgagcggtc agcgatagct attcctctga gttgtcctgg ccttgtatgc actctcgaag 3180
gaggaaatgg atcggagcat cagcactatt tcaggactag gagagataca tccaaaattt 3240
taaaggcatc tctggtcagt acaagagcga cttggcaaca agtctttagt caaacttcct 3300
cacctttgaa cttcctcaga ggtcgccgtg gcactgtgga cggagacccg tgaaaagaac 3360
tcatgcagca ggttaagcaa ccttggaaat ccatcgatga atgcctgatg taaaaattga 3420
gaagctgcaa gagccaaaag ttcagttcag cacatataag agactttggc caagagcgat 3480
gaagtcacat gggaaccacg taaacaaacc tcgtgcggag saccagcccg ggccgtcgac 3540
cacgcgtgcc ctatagt 3557
<210> 92
<211> 542
<212> DNA
<213> Mortierella alpina
<220>
<221> Intron
<222> (1)..(542)
<400> 92
cgtaagttga caacggttca aatttcgaaa cttgcactgt gggtttgtcc tggttttatt 60
cggcagcttt tttctccgaa gtcttggccc agggaggagg caagaagagc aattcagggt 120
aggggcgtcc ggagattgga ccctgccttg gactagcgaa tggaatacga gagcgaagct 180
gtctgcatgg gctgatgata atatttttta ctggagatga ttgtaaggtg cggcgcgagg 240
gtgtagtaca tcagtcgaca tggattcaac caaatgttct ctagcagcga taaccctggc 300
tgtcttttgt taatcacggc aatgctatcc ccaaagaaaa aaaaaagggt gcggttggca 360
cacggttgca caatggctta gccagacaat taacccaaaa aagtcaagag attccttttt 420
tttttttttt ttttttgggg ggggaacggg aaagtggggg ctgtgtgaaa ttggggcgaa 480
gtgaaccatg caactttgag ctacaaacac ctaattgttt ttgtcttgcc tgacattatt 540
ag 542
<210> 93
<211> 4099
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (2092)..(2094)
<223> ATG translation initiation codon
<220>
<221> Intron
<222> (2410)..(2951)
<220>
<221> misc_feature
<222> (3459)..(3461)
<223> 'TAA' stop codon
<400> 93
actatagggc acgcgtggtc gacggcccgg gctggtccta cctctcaatc ttgttgccct 60
gtagtcctga aatgagctcg tcatgggtct ctgtcctctc ctcgttatgg tcaaacgcat 120
tggacccggt tttctttaga ggagcattct tcttgtttaa gccgactcct cttcccgtcc 180
cgaacgacaa cttgataggt ccaccatttc catttggtgg gtgaagcggg ctgtcctcag 240
cggacatgac tctgagctag aaggaagggt gtagaggacg aaggagtaag tgctaccgtt 300
cactggcagg tgaggagcgt cgggtctaag ccacatgcct gccaattgtc ctcgccaagt 360
gcttggaagg tgtattgatg ctcatgcagc tccactctgg acctggaaac gccaccgcat 420
cgcattctta atgagctctg ctacaaacga caatctgcga accagtttgc acagggagct 480
agtcgagtct ggaaagcggg accagtgagt gactcggcgg ggcttgcatc gctgaacatc 540
gccattggga tttcttagaa agcagctctt gctcttatac aaacaccttc ctgcgtgcct 600
caccttactt acgaggagta atgttgtttt tacaggctag tggaactctt gcgcgcgagg 660
ctgatcgagt ccggctggcg ggacgatctg aaggcattta caaaaggtac accactcggc 720
acttggcctg ttttgttgcc actagctacc aggccgtgac tgaccacgaa cccttcctct 780
ggagaataga aaggatccag tcccgggaga ctacaatgtc tgttgacgag gtcatcagag 840
aagtcggccc acatgctaga ggtaagcccc gcgagaacct tatatgctga ttagtgccat 900
ccgttgaaca tcgtctgatc tgcgacaagt tctggtaata cttgatagcc accgtcccag 960
acaaggtcaa gacagaactt cttgcgcaaa tcagtacttt tatcgaagac aacatgtaac 1020
gaaaaataaa aatgctgata tggaagggaa catcacgtac gccaggtacg tgagatgttt 1080
ttcctttttt ttttattttt tttgttgggg cttgagatgt tttgggtctt tcatgaagac 1140
gttcatgaca aacaagaaat acggacagcg agtttaccgc aatggaaaag tttacctcaa 1200
ccgaactttg aacgtttcgt gaaaacctgc gtgagaattc tttgagcatg gccataccta 1260
attgtcgccg gactgatctg tgatttgatc catggtccat cgctcctgac tcgctgcacg 1320
tcctgacaga gataacctcg catagtgtcg tacagaaacc aaaagcacgc gctcggtcca 1380
gtacagtaat ggggaactgg gtactgagga cagcttgaaa gtatatcctg taggggacga 1440
taacatgggc aatcttgatg gtgtggttga gtacagggta tatgcgttcc aggtaagcaa 1500
atatcacctt tgtgagacga tagggggcag ctatagtaaa tggccaggcg cttttatacg 1560
ggaagcaatt gcagcgatgg aggtgtgtac gctgcagccg cttgtatagc agaacgtaac 1620
cccaatcctc caactccggc aaggacaatg gggaaagaag gccggatata taaaatgctt 1680
gtcagcagaa ttaaagactg tgcggactga tctgccttaa tcggaaactt cagcagggct 1740
tctcgcagtg catgaaccct cggaccatct cctgtcccaa caacacgcca atgggcttat 1800
tattaatttt ttttggctgc cgttcaaaaa aaaaaagaaa aaaactgcca cttcttattt 1860
gagggctgca ggactgcttg ttaaggcgga taacctcaat ccgcccgatg ccttttaacg 1920
ctggcctgtt cttcctcttt tctttcttct ctcccttcac ccgtcttcac cctccctctt 1980
ccccccgttc ctacgtctac agccgttggc tcatcttgca gttgcttgtc tactatttgg 2040
tgccgaccta tattcctctg tcacccaacc taccgcactc acactcgcat aatggagtct 2100
ggacctatgc ctgccgggat ccccttccct gaatactatg actttttcat ggactggaag 2160
acacccctgg caattgctgc cacctacacc gccgctgttg ggctcttcaa ccccaaggtt 2220
ggcaaagtct cgcgcgtggt agccaagtcg gctaacgcca agccggcaga gcgcacgcag 2280
tccggcgccg ccatgaccgc ctttgtcttt gtccacaacc ttatcctctg cgtgtactct 2340
ggaatcacct tctactacat gttcccagcc atggtcaaga actttagaac acataccctc 2400
catgaggccc gtaagttgac aacggttcaa atttcgaaac ttgcactgtg ggtttgtcct 2460
ggttttattc ggcagctttt ttctccgaag tcttggccca gggaggaggc aagaagagca 2520
attcagggta ggggcgtccg gagattggac cctgccttgg actagcgaat ggaatacgag 2580
agcgaagctg tctgcatggg ctgatgataa tattttttac tggagatgat tgtaaggtgc 2640
ggcgcgaggg tgtagtacat cagtcgacat ggattcaacc aaatgttctc tagcagcgat 2700
aaccctggct gtcttttgtt aatcacggca atgctatccc caaagaaaaa aaaaagggtg 2760
cggttggcac acggttgcac aatggcttag ccagacaatt aacccaaaaa agtcaagaga 2820
ttcctttttt tttttttttt tttttggggg gggaacggga aagtgggggc tgtgtgaaat 2880
tggggcgaag tgaaccatgc aactttgagc tacaaacacc taattgtttt tgtcttgcct 2940
gacattatta gtactgcgat acggatcaga gcctgtggaa caacgccctt ggctactggg 3000
gctacctctt ctacctttca aagttttacg aggtcattga caccatcatc atcatcttga 3060
aggggcgccg ctcgtccctg ctccagacct accaccacgc cggcgctatg atcaccatgt 3120
ggtccggcat caactaccag gcaacgccca tttggatttt tgtcgtcttc aactcgttca 3180
tccacaccat catgtactgt tactatgcct tcacctcaat cggcttccac cccccaggca 3240
agaagtacct cacctccatg cagatcaccc agtttttggt cggcatcact atcgccgtct 3300
cttatctctt cgtccctgga tgtatccgca cacccggtgc tcagatggct gtctggatca 3360
acgtcggata cctctttccc ctcacttatc tctttgtgga ttttgccaag cgtacttact 3420
ccaagcgtag tgccatcgcc gctcagaaga aggcccagta aagaggccac ttcttgtcgt 3480
ttactctact gtttccaaca tttacatctc tcaatggcag cctcctccct ctatccttcg 3540
cactttcatt ttagttcctt gtattcataa aargtcaaaa ttcattgtaa ctccaaaagt 3600
gccaatggct ttatcatgga tgagtgccat gtttatggcc cattgcatca atacaggaag 3660
atatgagcgg tcagcgatag ctattcctct gagttgtcct ggccttgtat gcactctcga 3720
aggaggaaat ggatcggagc atcagcacta tttcaggact aggagagata catccaaaat 3780
tttaaaggca tctctggtca gtacaagagc gacttggcaa caagtcttta gtcaaacttc 3840
ctcacctttg aacttcctca gaggtcgccg tggcactgtg gacggagacc cgtgaaaaga 3900
actcatgcag caggttaagc aaccttggaa atccatcgat gaatgcctga tgtaaaaatt 3960
gagaagctgc aagagccaaa agttcagttc agcacatata agagactttg gccaagagcg 4020
atgaagtcac atgggaacca cgtaaacaaa cctcgtgcgg agsaccagcc cgggccgtcg 4080
accacgcgtg ccctatagt 4099
<210> 94
<211> 915
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> CDS
<222> (1)..(915)
<223> C16/18 elongase
<400> 94
atg ctc tcg tca atc tcg ccc gac cta tac tcg tcc ttc tcg ttc aaa 48
Met Leu Ser Ser Ile Ser Pro Asp Leu Tyr Ser Ser Phe Ser Phe Lys
1 5 10 15
aac tcg ctc gcc gag gcc atg ccc tcc gtg cca cac gaa ctc atc aac 96
Asn Ser Leu Ala Glu Ala Met Pro Ser Val Pro His Glu Leu Ile Asn
20 25 30
tca aaa aca ctc tca tgg atg tac aat gcc tct ctg gac att cgg gtt 144
Ser Lys Thr Leu Ser Trp Met Tyr Asn Ala Ser Leu Asp Ile Arg Val
35 40 45
cct ctg act atc gga acc atc tac gcc gtc tcc gtg cac ctg acc aac 192
Pro Leu Thr Ile Gly Thr Ile Tyr Ala Val Ser Val His Leu Thr Asn
50 55 60
tca tct gaa cga atc aag aaa cgc cag ccc att gcc ttt gcc aag acc 240
Ser Ser Glu Arg Ile Lys Lys Arg Gln Pro Ile Ala Phe Ala Lys Thr
65 70 75 80
gca ctc ttc aag tgg ctc tgt gtc ctc cac aat gca ggt ctg tgt ctc 288
Ala Leu Phe Lys Trp Leu Cys Val Leu His Asn Ala Gly Leu Cys Leu
85 90 95
tac tca gca tgg acc ttt gtc ggt atc ctc aac gcc gtc aaa cac gcc 336
Tyr Ser Ala Trp Thr Phe Val Gly Ile Leu Asn Ala Val Lys His Ala
100 105 110
tac caa atc aca gga gac agc tcc gcc ccc ttc tcc ttc aac acc ctc 384
Tyr Gln Ile Thr Gly Asp Ser Ser Ala Pro Phe Ser Phe Asn Thr Leu
115 120 125
tgg gga tcg ttt tgt tca cgt gac tcc ctc tgg gtc acc ggc ctc aac 432
Trp Gly Ser Phe Cys Ser Arg Asp Ser Leu Trp Val Thr Gly Leu Asn
130 135 140
tac tac gga tac tgg ttc tat ctg tcc aaa ttc tac gaa gtg gtg gac 480
Tyr Tyr Gly Tyr Trp Phe Tyr Leu Ser Lys Phe Tyr Glu Val Val Asp
145 150 155 160
acc atg atc atc ctc gca aag gga aaa ccg tcc tca atg ctc cag aca 528
Thr Met Ile Ile Leu Ala Lys Gly Lys Pro Ser Ser Met Leu Gln Thr
165 170 175
tac cac cac acc ggc gcc atg ttc tcc atg tgg gcc ggc atc cga ttc 576
Tyr His His Thr Gly Ala Met Phe Ser Met Trp Ala Gly Ile Arg Phe
180 185 190
gcc tct ccc ccc atc tgg atc ttt gtg gtt ttc aac tcc ctc atc cac 624
Ala Ser Pro Pro Ile Trp Ile Phe Val Val Phe Asn Ser Leu Ile His
195 200 205
aca atc atg tac ttt tac tac acc ctc acc acc ctc aag atc aag gtt 672
Thr Ile Met Tyr Phe Tyr Tyr Thr Leu Thr Thr Leu Lys Ile Lys Val
210 215 220
ccc aag atc ctc aag gca tct ctg acc acc gcc cag atc acc cag att 720
Pro Lys Ile Leu Lys Ala Ser Leu Thr Thr Ala Gln Ile Thr Gln Ile
225 230 235 240
gtc gga ggt ggc atc ctg gct gcc tcc cac gcc ttt att tat tac aag 768
Val Gly Gly Gly Ile Leu Ala Ala Ser His Ala Phe Ile Tyr Tyr Lys
245 250 255
gac cac cag act gag acc gtc tgt tct tgt ctc act acc cag ggt cag 816
Asp His Gln Thr Glu Thr Val Cys Ser Cys Leu Thr Thr Gln Gly Gln
260 265 270
ttt ttc gct ctc gcc gtc aat gtc atc tat ctg agt cct ctg gcc tat 864
Phe Phe Ala Leu Ala Val Asn Val Ile Tyr Leu Ser Pro Leu Ala Tyr
275 280 285
ctc ttt att gcc ttc tgg att cga tct tac ttg aag gcc aag tcc aac 912
Leu Phe Ile Ala Phe Trp Ile Arg Ser Tyr Leu Lys Ala Lys Ser Asn
290 295 300
tag 915
<210> 95
<211> 304
<212> PRT
<213> Yarrowia lipolytica
<400> 95
Met Leu Ser Ser Ile Ser Pro Asp Leu Tyr Ser Ser Phe Ser Phe Lys
1 5 10 15
Asn Ser Leu Ala Glu Ala Met Pro Ser Val Pro His Glu Leu Ile Asn
20 25 30
Ser Lys Thr Leu Ser Trp Met Tyr Asn Ala Ser Leu Asp Ile Arg Val
35 40 45
Pro Leu Thr Ile Gly Thr Ile Tyr Ala Val Ser Val His Leu Thr Asn
50 55 60
Ser Ser Glu Arg Ile Lys Lys Arg Gln Pro Ile Ala Phe Ala Lys Thr
65 70 75 80
Ala Leu Phe Lys Trp Leu Cys Val Leu His Asn Ala Gly Leu Cys Leu
85 90 95
Tyr Ser Ala Trp Thr Phe Val Gly Ile Leu Asn Ala Val Lys His Ala
100 105 110
Tyr Gln Ile Thr Gly Asp Ser Ser Ala Pro Phe Ser Phe Asn Thr Leu
115 120 125
Trp Gly Ser Phe Cys Ser Arg Asp Ser Leu Trp Val Thr Gly Leu Asn
130 135 140
Tyr Tyr Gly Tyr Trp Phe Tyr Leu Ser Lys Phe Tyr Glu Val Val Asp
145 150 155 160
Thr Met Ile Ile Leu Ala Lys Gly Lys Pro Ser Ser Met Leu Gln Thr
165 170 175
Tyr His His Thr Gly Ala Met Phe Ser Met Trp Ala Gly Ile Arg Phe
180 185 190
Ala Ser Pro Pro Ile Trp Ile Phe Val Val Phe Asn Ser Leu Ile His
195 200 205
Thr Ile Met Tyr Phe Tyr Tyr Thr Leu Thr Thr Leu Lys Ile Lys Val
210 215 220
Pro Lys Ile Leu Lys Ala Ser Leu Thr Thr Ala Gln Ile Thr Gln Ile
225 230 235 240
Val Gly Gly Gly Ile Leu Ala Ala Ser His Ala Phe Ile Tyr Tyr Lys
245 250 255
Asp His Gln Thr Glu Thr Val Cys Ser Cys Leu Thr Thr Gln Gly Gln
260 265 270
Phe Phe Ala Leu Ala Val Asn Val Ile Tyr Leu Ser Pro Leu Ala Tyr
275 280 285
Leu Phe Ile Ala Phe Trp Ile Arg Ser Tyr Leu Lys Ala Lys Ser Asn
290 295 300
<210> 96
<211> 353
<212> PRT
<213> Candida albicans (GenBank Accession No. EAL04510)
<400> 96
Met Leu Ala Lys Phe Lys Leu Pro Asn Ala Glu Val Trp Lys Thr Phe
1 5 10 15
Pro Pro Phe Asp Thr Pro Val Pro Pro Ser Pro Phe Glu Asn Glu Phe
20 25 30
Leu Asn Lys Ile Tyr Tyr Ala Ser Met Asn Val Thr Thr Pro Leu Thr
35 40 45
Ile Ala Ile Ile Tyr Phe Thr Ser Val His Phe Ile Asn Ser Ile Ile
50 55 60
Arg Asn Lys Gln Ile Ala Lys Tyr Asn Ser Lys Thr Ser Ser Glu Ser
65 70 75 80
Lys Val Asp Ile Thr Lys Leu Asp Asp Lys Lys Leu Gln Lys Ile Leu
85 90 95
Pro Thr Val Pro Asn Ser Ile Ala Lys Thr Ser Ile Phe Lys Leu Phe
100 105 110
Val Phe Leu His Asn Val Phe Leu Cys Leu Tyr Ser Ile Trp Thr Phe
115 120 125
Leu Gly Met Ser His Thr Ile Ala Thr Thr Met Asn Leu Phe Glu Gly
130 135 140
Asn Phe Leu Gln Ser Leu Val Asn Tyr Gln Pro Lys Lys Leu Asp Ile
145 150 155 160
Phe Leu His Ser Val Cys Asp Pro Lys Ile Gly Ile Phe Ser Arg Leu
165 170 175
Leu Thr Asn Glu Lys Gly Leu His Asn Leu Glu Val Phe Gly Trp Trp
180 185 190
Phe Tyr Ile Ser Lys Phe Tyr Glu Val Leu Asp Thr Ala Ile Ile Leu
195 200 205
Leu Lys Gly Arg Pro Ser Ser Leu Leu Gln Ser Tyr His His Ala Gly
210 215 220
Ala Met Met Cys Met Trp Ala Gly Ile Arg Tyr Gln Ser Pro Pro Ile
225 230 235 240
Trp Ile Phe Val Val Phe Asn Ser Phe Ile His Ser Leu Met Tyr Phe
245 250 255
Tyr Phe Ser Leu Ser Cys Leu Lys Ile Arg Val Pro Asn Phe Phe Lys
260 265 270
Arg Ile Leu Thr Thr Met Gln Ile Thr Gln Phe Ile Val Gly Gly Ser
275 280 285
Ile Ala Ile Leu His Ser Phe Val Trp Ile Val Asp Thr Ser His Val
290 295 300
Ile Ser Pro Asp Asn Leu Lys Trp Val Ser Cys Ile Ser Thr Pro Asp
305 310 315 320
Gln Ala Leu Pro Ile Leu Ile Asn Val Leu Tyr Leu Leu Pro Leu Thr
325 330 335
Ala Leu Phe Thr Ala Phe Tyr Ile Glu Ser Tyr Leu Lys Lys Lys Ser
340 345 350
Ala
<210> 97
<211> 978
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> CDS
<222> (1)..(978)
<223> C14/16 elongase
<400> 97
atg agc gcc gtc cct att gaa ttc aac gtc ccc tcc gtg gac cga ccc 48
Met Ser Ala Val Pro Ile Glu Phe Asn Val Pro Ser Val Asp Arg Pro
1 5 10 15
ttt ggt atc tac ctc tgg gcc atc ttt gac cag gcc tgg gag aag ctt 96
Phe Gly Ile Tyr Leu Trp Ala Ile Phe Asp Gln Ala Trp Glu Lys Leu
20 25 30
ttc ggc tgg ccc gcg tcc tct ttc att ttc gtg cga aat gac ccc aac 144
Phe Gly Trp Pro Ala Ser Ser Phe Ile Phe Val Arg Asn Asp Pro Asn
35 40 45
atc ccc ttt tcc tct acc cct ccc gtg atc att gcc atc att gtg tac 192
Ile Pro Phe Ser Ser Thr Pro Pro Val Ile Ile Ala Ile Ile Val Tyr
50 55 60
tac att gtc atc ttt ggc ggc cga gag gtg atg cga aac ctg tct ccc 240
Tyr Ile Val Ile Phe Gly Gly Arg Glu Val Met Arg Asn Leu Ser Pro
65 70 75 80
atc cga ctc aac tgg ctc ttc cag atc cac aac atc ttc ctc acc ctt 288
Ile Arg Leu Asn Trp Leu Phe Gln Ile His Asn Ile Phe Leu Thr Leu
85 90 95
ctg tcc ggt atg ctc ctc ctc ctc ctc gtt gag cag ctc ttc ccc atc 336
Leu Ser Gly Met Leu Leu Leu Leu Leu Val Glu Gln Leu Phe Pro Ile
100 105 110
att gtc cga cag ggt atc ctc tac gcc atc tgc gac tac gga tct tgg 384
Ile Val Arg Gln Gly Ile Leu Tyr Ala Ile Cys Asp Tyr Gly Ser Trp
115 120 125
act cag ccc att gtc ttc tgc tac tac ctc aac tac ctg acc aag tac 432
Thr Gln Pro Ile Val Phe Cys Tyr Tyr Leu Asn Tyr Leu Thr Lys Tyr
130 135 140
ttt gag ctg atc gac acc gtt ttc ctt gtg ctg cga aag aag aag ctg 480
Phe Glu Leu Ile Asp Thr Val Phe Leu Val Leu Arg Lys Lys Lys Leu
145 150 155 160
act ttc ctc cac acc tac cac cat ggt gcc act gct ctt ctg tgc tac 528
Thr Phe Leu His Thr Tyr His His Gly Ala Thr Ala Leu Leu Cys Tyr
165 170 175
acc cag ctc att ggt aag acc tcg gtc tct tgg gtc ccc atc acc ctt 576
Thr Gln Leu Ile Gly Lys Thr Ser Val Ser Trp Val Pro Ile Thr Leu
180 185 190
aac ctg ttt gtc cac gtt gtc atg tac ttc tac tac ttc ctg gct gcg 624
Asn Leu Phe Val His Val Val Met Tyr Phe Tyr Tyr Phe Leu Ala Ala
195 200 205
cga ggt atc cga gtg tgg tgg aag gag tgg gtc acc cgg ctc cag atc 672
Arg Gly Ile Arg Val Trp Trp Lys Glu Trp Val Thr Arg Leu Gln Ile
210 215 220
atc cag ttc gtt atc gat ctt gga ttt gtc tac ttt gcc tct tac acc 720
Ile Gln Phe Val Ile Asp Leu Gly Phe Val Tyr Phe Ala Ser Tyr Thr
225 230 235 240
tac ttc acc tct acc tac tgg ccc tgg atg ccc aac atg ggc tct tgt 768
Tyr Phe Thr Ser Thr Tyr Trp Pro Trp Met Pro Asn Met Gly Ser Cys
245 250 255
gcc ggc gag gag ttt gct gct att tac ggc tgt ggt ctg ctg acc tct 816
Ala Gly Glu Glu Phe Ala Ala Ile Tyr Gly Cys Gly Leu Leu Thr Ser
260 265 270
tac ctc ttc ctc ttc atc gcc ttc tac atc aac tct tac cga aag ccc 864
Tyr Leu Phe Leu Phe Ile Ala Phe Tyr Ile Asn Ser Tyr Arg Lys Pro
275 280 285
tct tcc aag gga cct tcc aag cct gtt gtt gct gtc gat ggc cct gtt 912
Ser Ser Lys Gly Pro Ser Lys Pro Val Val Ala Val Asp Gly Pro Val
290 295 300
ggc ggc gtc aac gcc cag act ggt gct tct cga ggc cag acc act acc 960
Gly Gly Val Asn Ala Gln Thr Gly Ala Ser Arg Gly Gln Thr Thr Thr
305 310 315 320
cga tct cga cga gca taa 978
Arg Ser Arg Arg Ala
325
<210> 98
<211> 325
<212> PRT
<213> Yarrowia lipolytica
<400> 98
Met Ser Ala Val Pro Ile Glu Phe Asn Val Pro Ser Val Asp Arg Pro
1 5 10 15
Phe Gly Ile Tyr Leu Trp Ala Ile Phe Asp Gln Ala Trp Glu Lys Leu
20 25 30
Phe Gly Trp Pro Ala Ser Ser Phe Ile Phe Val Arg Asn Asp Pro Asn
35 40 45
Ile Pro Phe Ser Ser Thr Pro Pro Val Ile Ile Ala Ile Ile Val Tyr
50 55 60
Tyr Ile Val Ile Phe Gly Gly Arg Glu Val Met Arg Asn Leu Ser Pro
65 70 75 80
Ile Arg Leu Asn Trp Leu Phe Gln Ile His Asn Ile Phe Leu Thr Leu
85 90 95
Leu Ser Gly Met Leu Leu Leu Leu Leu Val Glu Gln Leu Phe Pro Ile
100 105 110
Ile Val Arg Gln Gly Ile Leu Tyr Ala Ile Cys Asp Tyr Gly Ser Trp
115 120 125
Thr Gln Pro Ile Val Phe Cys Tyr Tyr Leu Asn Tyr Leu Thr Lys Tyr
130 135 140
Phe Glu Leu Ile Asp Thr Val Phe Leu Val Leu Arg Lys Lys Lys Leu
145 150 155 160
Thr Phe Leu His Thr Tyr His His Gly Ala Thr Ala Leu Leu Cys Tyr
165 170 175
Thr Gln Leu Ile Gly Lys Thr Ser Val Ser Trp Val Pro Ile Thr Leu
180 185 190
Asn Leu Phe Val His Val Val Met Tyr Phe Tyr Tyr Phe Leu Ala Ala
195 200 205
Arg Gly Ile Arg Val Trp Trp Lys Glu Trp Val Thr Arg Leu Gln Ile
210 215 220
Ile Gln Phe Val Ile Asp Leu Gly Phe Val Tyr Phe Ala Ser Tyr Thr
225 230 235 240
Tyr Phe Thr Ser Thr Tyr Trp Pro Trp Met Pro Asn Met Gly Ser Cys
245 250 255
Ala Gly Glu Glu Phe Ala Ala Ile Tyr Gly Cys Gly Leu Leu Thr Ser
260 265 270
Tyr Leu Phe Leu Phe Ile Ala Phe Tyr Ile Asn Ser Tyr Arg Lys Pro
275 280 285
Ser Ser Lys Gly Pro Ser Lys Pro Val Val Ala Val Asp Gly Pro Val
290 295 300
Gly Gly Val Asn Ala Gln Thr Gly Ala Ser Arg Gly Gln Thr Thr Thr
305 310 315 320
Arg Ser Arg Arg Ala
325
<210> 99
<211> 337
<212> PRT
<213> Neurospora crassa (GenBank Accession #CAD70918)
<400> 99
Met Ala Thr Ala Ser Pro Val Ser Phe Leu Asp Ser Leu Pro Arg Pro
1 5 10 15
Thr Leu Asp Arg Pro Phe Gly Ile His Leu Trp Pro Ile Phe Ser Lys
20 25 30
Ala Phe Glu Ala Val Val Gly Tyr Pro Ala Glu Asp Phe Arg Phe Val
35 40 45
Pro Gly Glu Thr Pro Met Ser Thr Leu Lys Glu Thr Ser Ile Phe Ile
50 55 60
Val Ile Tyr Tyr Thr Ile Ile Phe Gly Gly Arg Glu Leu Met Arg Asn
65 70 75 80
Arg Glu Pro Phe Lys Leu Arg Thr Leu Phe Leu Ile His Asn Phe Tyr
85 90 95
Leu Thr Ala Ile Ser Ala Ile Leu Leu Ala Leu Phe Ile Glu Gln Leu
100 105 110
Leu Pro Ile Val Val Arg Gly Gly Ile Phe His Ala Ile Cys His Ile
115 120 125
Asp Gly Gly Trp Thr Gln Pro Leu Val Val Leu Tyr Tyr Leu Asn Tyr
130 135 140
Leu Thr Lys Tyr Leu Glu Leu Leu Asp Thr Cys Phe Leu Phe Leu Lys
145 150 155 160
Lys Lys Pro Leu Thr Phe Leu His Cys Tyr His His Gly Ala Thr Ala
165 170 175
Leu Leu Cys Tyr Thr Gln Leu Ile Gly Ser Thr Ser Val Ser Trp Val
180 185 190
Pro Ile Thr Leu Asn Leu Thr Val His Val Val Met Tyr Trp Tyr Tyr
195 200 205
Phe Gln Ser Ala Arg Gly Ile Arg Ile Trp Trp Lys Glu Trp Ile Thr
210 215 220
Arg Leu Gln Ile Ile Gln Phe Ile Ile Asp Leu Gly Phe Val Tyr Phe
225 230 235 240
Ala Ser Tyr Thr Tyr Phe Thr Ser Thr Tyr Phe Pro Trp Met Pro Asn
245 250 255
Ala Gly Lys Cys Ala Gly Glu Glu Phe Ala Ala Phe Ser Gly Ile Gly
260 265 270
Ile Leu Ser Ser Tyr Leu Val Leu Phe Ile Ser Phe Tyr Phe Ala Thr
275 280 285
Tyr Lys Lys Asp Gly Lys Arg Pro Thr Gly Arg Lys Ser Leu Arg Arg
290 295 300
Met Ser Gln Ala Pro Leu Pro Asp Pro Lys Asp Ile Val Ser Ala Lys
305 310 315 320
Ala Ser Gly Ala Arg Pro Ser Gly Ala Ala Thr Ala Arg Ser Arg Lys
325 330 335
Ala
<210> 100
<211> 903
<212> DNA
<213> Ostreococcus tauri (GenBank Accession No. AY591336)
<400> 100
atgagcgcct ccggtgcgct gctgcccgcg atcgcgtccg ccgcgtacgc gtacgcgacg 60
tacgcctacg cctttgagtg gtcgcacgcg aatggcatcg acaacgtcga cgcgcgcgag 120
tggatcggtg cgctgtcgtt gaggctcccg gcgatcgcga cgacgatgta cctgttgttc 180
tgcctggtcg gaccgaggtt gatggcgaag cgcgaggcgt tcgacccgaa ggggttcatg 240
ctggcgtaca atgcgtatca gacggcgttc aacgtcgtcg tgctcgggat gttcgcgcga 300
gagatctcgg ggctggggca gcccgtgtgg gggtcaacca tgccgtggag cgatagaaaa 360
tcgtttaaga tcctcctcgg ggtgtggttg cactacaaca acaaatattt ggagctattg 420
gacactgtgt tcatggttgc gcgcaagaag acgaagcagt tgagcttctt gcacgtttat 480
catcacgccc tgttgatctg ggcgtggtgg ttggtgtgtc acttgatggc cacgaacgat 540
tgtatcgatg cctacttcgg cgcggcgtgc aactcgttca ttcacatcgt gatgtactcg 600
tattatctca tgtcggcgct cggcattcga tgcccgtgga agcgatacat cacccaggct 660
caaatgctcc aattcgtcat tgtcttcgcg cacgccgtgt tcgtgctgcg tcagaagcac 720
tgcccggtca cccttccttg ggcgcaaatg ttcgtcatga cgaacatgct cgtgctcttc 780
gggaacttct acctcaaggc gtactcgaac aagtcgcgcg gcgacggcgc gagttccgtg 840
aaaccagccg agaccacgcg cgcgcccagc gtgcgacgca cgcgatctcg aaaaattgac 900
taa 903
<210> 101
<211> 300
<212> PRT
<213> Ostreococcus tauri (GenBank Accession No. AY591336)
<400> 101
Met Ser Ala Ser Gly Ala Leu Leu Pro Ala Ile Ala Ser Ala Ala Tyr
1 5 10 15
Ala Tyr Ala Thr Tyr Ala Tyr Ala Phe Glu Trp Ser His Ala Asn Gly
20 25 30
Ile Asp Asn Val Asp Ala Arg Glu Trp Ile Gly Ala Leu Ser Leu Arg
35 40 45
Leu Pro Ala Ile Ala Thr Thr Met Tyr Leu Leu Phe Cys Leu Val Gly
50 55 60
Pro Arg Leu Met Ala Lys Arg Glu Ala Phe Asp Pro Lys Gly Phe Met
65 70 75 80
Leu Ala Tyr Asn Ala Tyr Gln Thr Ala Phe Asn Val Val Val Leu Gly
85 90 95
Met Phe Ala Arg Glu Ile Ser Gly Leu Gly Gln Pro Val Trp Gly Ser
100 105 110
Thr Met Pro Trp Ser Asp Arg Lys Ser Phe Lys Ile Leu Leu Gly Val
115 120 125
Trp Leu His Tyr Asn Asn Lys Tyr Leu Glu Leu Leu Asp Thr Val Phe
130 135 140
Met Val Ala Arg Lys Lys Thr Lys Gln Leu Ser Phe Leu His Val Tyr
145 150 155 160
His His Ala Leu Leu Ile Trp Ala Trp Trp Leu Val Cys His Leu Met
165 170 175
Ala Thr Asn Asp Cys Ile Asp Ala Tyr Phe Gly Ala Ala Cys Asn Ser
180 185 190
Phe Ile His Ile Val Met Tyr Ser Tyr Tyr Leu Met Ser Ala Leu Gly
195 200 205
Ile Arg Cys Pro Trp Lys Arg Tyr Ile Thr Gln Ala Gln Met Leu Gln
210 215 220
Phe Val Ile Val Phe Ala His Ala Val Phe Val Leu Arg Gln Lys His
225 230 235 240
Cys Pro Val Thr Leu Pro Trp Ala Gln Met Phe Val Met Thr Asn Met
245 250 255
Leu Val Leu Phe Gly Asn Phe Tyr Leu Lys Ala Tyr Ser Asn Lys Ser
260 265 270
Arg Gly Asp Gly Ala Ser Ser Val Lys Pro Ala Glu Thr Thr Arg Ala
275 280 285
Pro Ser Val Arg Arg Thr Arg Ser Arg Lys Ile Asp
290 295 300
<210> 102
<211> 903
<212> DNA
<213> Ostreococcus tauri
<220>
<221> misc_feature
<223> synthetic C20/22 fatty acid elongase (codon-optimized)
<400> 102
atggctgcct ctggtgctct gcttcctgcc attgcctccg ctgcctacgc ctacgctacc 60
tacgcctacg ccttcgagtg gtcgcacgcc aacggcatcg acaacgtgga cgcacgagag 120
tggatcggag ccctgtcctt gcgacttccc gctattgcca ctaccatgta cctgctcttc 180
tgcctggtcg gtcctcgact catggccaag cgagaggcct ttgatcccaa gggcttcatg 240
ctggcataca acgcctacca gactgctttc aacgttgtcg tgctcggaat gtttgctcga 300
gaaatctctg gactgggaca gcccgtctgg ggttccacca tgccttggag cgatcgaaag 360
tccttcaaga ttctgctcgg tgtgtggctg cactacaaca acaagtatct ggagctgctt 420
gacaccgtgt tcatggttgc tcggaagaag accaagcagc tgtcgtttct ccacgtttac 480
catcacgcac tgctcatttg ggcctggtgg ctggtgtgtc atctcatggc taccaacgat 540
tgcatcgacg cctactttgg tgctgcctgc aattccttca ttcacatcgt catgtactcg 600
tactatctca tgtctgctct tggcattcga tgtccctgga agcgatacat cactcaggca 660
cagatgctgc aattcgtcat tgtcttcgct catgccgtgt ttgtcttgag acagaagcac 720
tgtcccgtta cacttccttg ggctcagatg ttcgtcatga ccaacatgct cgtgctgttt 780
ggcaacttct acctcaaagc ctactccaac aagtctcgag gcgacggtgc cagctccgtc 840
aaacctgccg agactacccg agcaccctcc gttcgaagaa cacgatctcg aaagatcgac 900
taa 903
<210> 103
<211> 300
<212> PRT
<213> Ostreococcus tauri
<220>
<221> MISC_FEATURE
<223> synthetic C20/22 fatty acid elongase (codon-optimized)
<400> 103
Met Ala Ala Ser Gly Ala Leu Leu Pro Ala Ile Ala Ser Ala Ala Tyr
1 5 10 15
Ala Tyr Ala Thr Tyr Ala Tyr Ala Phe Glu Trp Ser His Ala Asn Gly
20 25 30
Ile Asp Asn Val Asp Ala Arg Glu Trp Ile Gly Ala Leu Ser Leu Arg
35 40 45
Leu Pro Ala Ile Ala Thr Thr Met Tyr Leu Leu Phe Cys Leu Val Gly
50 55 60
Pro Arg Leu Met Ala Lys Arg Glu Ala Phe Asp Pro Lys Gly Phe Met
65 70 75 80
Leu Ala Tyr Asn Ala Tyr Gln Thr Ala Phe Asn Val Val Val Leu Gly
85 90 95
Met Phe Ala Arg Glu Ile Ser Gly Leu Gly Gln Pro Val Trp Gly Ser
100 105 110
Thr Met Pro Trp Ser Asp Arg Lys Ser Phe Lys Ile Leu Leu Gly Val
115 120 125
Trp Leu His Tyr Asn Asn Lys Tyr Leu Glu Leu Leu Asp Thr Val Phe
130 135 140
Met Val Ala Arg Lys Lys Thr Lys Gln Leu Ser Phe Leu His Val Tyr
145 150 155 160
His His Ala Leu Leu Ile Trp Ala Trp Trp Leu Val Cys His Leu Met
165 170 175
Ala Thr Asn Asp Cys Ile Asp Ala Tyr Phe Gly Ala Ala Cys Asn Ser
180 185 190
Phe Ile His Ile Val Met Tyr Ser Tyr Tyr Leu Met Ser Ala Leu Gly
195 200 205
Ile Arg Cys Pro Trp Lys Arg Tyr Ile Thr Gln Ala Gln Met Leu Gln
210 215 220
Phe Val Ile Val Phe Ala His Ala Val Phe Val Leu Arg Gln Lys His
225 230 235 240
Cys Pro Val Thr Leu Pro Trp Ala Gln Met Phe Val Met Thr Asn Met
245 250 255
Leu Val Leu Phe Gly Asn Phe Tyr Leu Lys Ala Tyr Ser Asn Lys Ser
260 265 270
Arg Gly Asp Gly Ala Ser Ser Val Lys Pro Ala Glu Thr Thr Arg Ala
275 280 285
Pro Ser Val Arg Arg Thr Arg Ser Arg Lys Ile Asp
290 295 300
<210> 104
<211> 1548
<212> DNA
<213> Thraustochytrium aureum (GenBank Accession No. AAN75707)
<400> 104
atgacggtcg ggtttgacga aacggtgact atggacacgg tccgcaacca caacatgccg 60
gacgacgcct ggtgcgcgat ccacggcacc gtgtacgaca tcaccaagtt cagcaaggtg 120
caccccggcg gggacatcat catgctggcc gctggcaagg aggccaccat cctgttcgag 180
acctaccaca tcaagggcgt cccggacgcg gtgctgcgca agtacaaggt cggcaagctc 240
ccccagggca agaagggcga aacgagccac atgcccaccg ggctcgactc ggcctcctac 300
tactcgtggg acagcgagtt ttacagggtg ctccgcgagc gcgtcgccaa gaagctggcc 360
gagcccggcc tcatgcagcg cgcgcgcatg gagctctggg ccaaggcgat cttcctcctg 420
gcaggtttct ggggctccct ttacgccatg tgcgtgctag acccgcacgg cggtgccatg 480
gtagccgccg ttacgctcgg cgtgttcgct gcctttgtcg gaacttgcat ccagcacgac 540
ggcagccacg gcgccttctc caagtcgcga ttcatgaaca aggcggcggg ctggaccctc 600
gacatgatcg gcgcgagcgc gatgacctgg gagatgcagc acgttcttgg tcaccacccg 660
tacaccaacc tcatcgagat ggagaacggt ttggccaagg tcaagggcgc cgacgtcgac 720
ccgaagaagg tcgaccagga gagcgacccg gacgtcttca gtacgtaccc gatgcttcgc 780
ctgcacccgt ggcaccgcca gcggttttac cacaagttcc agcacctgta cgccccgctt 840
atctttgggt ttatgacgat taacaaggtg atttcccagg atgtcggggt tgtgctgcgc 900
aagcgcctgt tccagatcga cgccaactgc cggtatggca gcccctggaa cgtggcccgc 960
ttctggatca tgaagctcct caccacgctc tacatggtgg cgcttcccat gtacatgcag 1020
gggcctgctc agggcttgaa gcttttcttc atggcccact tcacctgcgg agaggtcctc 1080
gccaccatgt ttattgtcaa ccacatcatc gagggcgtca gctacgcttc caaggacgcg 1140
gtcaagggcg tcatggctcc gccgcgcact gtgcacggtg tcaccccgat gcaggtgacg 1200
caaaaggcgc tcagtgcggc cgagtcgacc aagtcggacg ccgacaagac gaccatgatc 1260
cccctcaacg actgggccgc tgtgcagtgc cagacctctg tgaactgggc tgtcgggtcg 1320
tggttttgga accacttttc gggcggccta aaccaccaga ttgagcacca ctgcttcccc 1380
caaaaccccc acacggtcaa cgtctacatc tcgggcatcg tcaaggagac ctgcgaagaa 1440
tacggcgtgc cgtaccaggc tgagatcagc ctcttctctg cctatttcaa gatgctgtcg 1500
cacctccgca cgctcggcaa cgaggacctc acggcctggt ccacgtga 1548
<210> 105
<211> 515
<212> PRT
<213> Thraustochytrium aureum (GenBank Accession No. AAN75707)
<400> 105
Met Thr Val Gly Phe Asp Glu Thr Val Thr Met Asp Thr Val Arg Asn
1 5 10 15
His Asn Met Pro Asp Asp Ala Trp Cys Ala Ile His Gly Thr Val Tyr
20 25 30
Asp Ile Thr Lys Phe Ser Lys Val His Pro Gly Gly Asp Ile Ile Met
35 40 45
Leu Ala Ala Gly Lys Glu Ala Thr Ile Leu Phe Glu Thr Tyr His Ile
50 55 60
Lys Gly Val Pro Asp Ala Val Leu Arg Lys Tyr Lys Val Gly Lys Leu
65 70 75 80
Pro Gln Gly Lys Lys Gly Glu Thr Ser His Met Pro Thr Gly Leu Asp
85 90 95
Ser Ala Ser Tyr Tyr Ser Trp Asp Ser Glu Phe Tyr Arg Val Leu Arg
100 105 110
Glu Arg Val Ala Lys Lys Leu Ala Glu Pro Gly Leu Met Gln Arg Ala
115 120 125
Arg Met Glu Leu Trp Ala Lys Ala Ile Phe Leu Leu Ala Gly Phe Trp
130 135 140
Gly Ser Leu Tyr Ala Met Cys Val Leu Asp Pro His Gly Gly Ala Met
145 150 155 160
Val Ala Ala Val Thr Leu Gly Val Phe Ala Ala Phe Val Gly Thr Cys
165 170 175
Ile Gln His Asp Gly Ser His Gly Ala Phe Ser Lys Ser Arg Phe Met
180 185 190
Asn Lys Ala Ala Gly Trp Thr Leu Asp Met Ile Gly Ala Ser Ala Met
195 200 205
Thr Trp Glu Met Gln His Val Leu Gly His His Pro Tyr Thr Asn Leu
210 215 220
Ile Glu Met Glu Asn Gly Leu Ala Lys Val Lys Gly Ala Asp Val Asp
225 230 235 240
Pro Lys Lys Val Asp Gln Glu Ser Asp Pro Asp Val Phe Ser Thr Tyr
245 250 255
Pro Met Leu Arg Leu His Pro Trp His Arg Gln Arg Phe Tyr His Lys
260 265 270
Phe Gln His Leu Tyr Ala Pro Leu Ile Phe Gly Phe Met Thr Ile Asn
275 280 285
Lys Val Ile Ser Gln Asp Val Gly Val Val Leu Arg Lys Arg Leu Phe
290 295 300
Gln Ile Asp Ala Asn Cys Arg Tyr Gly Ser Pro Trp Asn Val Ala Arg
305 310 315 320
Phe Trp Ile Met Lys Leu Leu Thr Thr Leu Tyr Met Val Ala Leu Pro
325 330 335
Met Tyr Met Gln Gly Pro Ala Gln Gly Leu Lys Leu Phe Phe Met Ala
340 345 350
His Phe Thr Cys Gly Glu Val Leu Ala Thr Met Phe Ile Val Asn His
355 360 365
Ile Ile Glu Gly Val Ser Tyr Ala Ser Lys Asp Ala Val Lys Gly Val
370 375 380
Met Ala Pro Pro Arg Thr Val His Gly Val Thr Pro Met Gln Val Thr
385 390 395 400
Gln Lys Ala Leu Ser Ala Ala Glu Ser Thr Lys Ser Asp Ala Asp Lys
405 410 415
Thr Thr Met Ile Pro Leu Asn Asp Trp Ala Ala Val Gln Cys Gln Thr
420 425 430
Ser Val Asn Trp Ala Val Gly Ser Trp Phe Trp Asn His Phe Ser Gly
435 440 445
Gly Leu Asn His Gln Ile Glu His His Cys Phe Pro Gln Asn Pro His
450 455 460
Thr Val Asn Val Tyr Ile Ser Gly Ile Val Lys Glu Thr Cys Glu Glu
465 470 475 480
Tyr Gly Val Pro Tyr Gln Ala Glu Ile Ser Leu Phe Ser Ala Tyr Phe
485 490 495
Lys Met Leu Ser His Leu Arg Thr Leu Gly Asn Glu Asp Leu Thr Ala
500 505 510
Trp Ser Thr
515
<210> 106
<211> 1545
<212> DNA
<213> Thraustochytrium aureum
<220>
<221> misc_feature
<223> synthetic delta-4 desaturase (codon-optimized)
<400> 106
atggtcggct tcgacgagac cgtcactatg gacaccgtcc gaaaccacaa catgcccgac 60
gatgcctggt gcgctatcca cggcaccgtg tacgacatca ccaagttctc caaggtgcat 120
cctggtggag acattatcat gctggccgct ggcaaggagg ccaccatcct gttcgagacc 180
taccacatca agggtgttcc cgacgctgtc ctgcgaaagt acaaggtcgg caagctccct 240
cagggcaaga agggtgagac ctcccacatg cccaccggac tcgactctgc ctcctactac 300
tcctgggact ctgagttcta ccgagtcctc cgagagcgag tcgccaagaa gctggccgag 360
cccggtctca tgcagcgagc tcgaatggag ctctgggcca aggctatctt tctcctggct 420
ggtttctggg gatccctgta cgccatgtgc gtgctcgacc ctcacggagg tgctatggtc 480
gctgccgtca ccctcggtgt gtttgctgcc ttcgtcggaa cctgcatcca gcacgacggc 540
tcccacggag ccttctccaa gtctcgattc atgaacaagg ctgccggttg gaccctcgac 600
atgattggtg cctccgctat gacctgggag atgcagcacg tcctcggtca ccatccctac 660
accaacctga tcgagatgga gaacggtctg gccaaggtca agggtgccga cgtggacccc 720
aagaaggtcg accaggagtc cgaccctgac gtcttctcta cctaccctat gctgcgactg 780
catccctggc accgacagcg attctaccac aagtttcagc acctgtacgc tcccctgatc 840
ttcggcttca tgaccatcaa caaggtgatc tcccaggacg tcggtgtcgt gctgcgaaag 900
cgactgtttc agatcgacgc caactgccga tatggctctc cctggaacgt ggctcgattc 960
tggatcatga agctcctgac cactctctac atggtggctc tgcccatgta catgcaggga 1020
cccgctcagg gtctgaagct gttctttatg gctcacttca cctgcggaga ggtcctcgcc 1080
accatgttca ttgttaacca cattatcgag ggtgtctcct acgcctccaa ggacgctgtc 1140
aagggcgtca tggctcctcc ccgaaccgtg cacggtgtca ctcccatgca ggtgacccag 1200
aaggctctct ctgctgccga gtccaccaag tctgacgctg acaagaccac tatgatccct 1260
ctcaacgact gggctgccgt ccagtgccag acctccgtca actgggctgt cggatcctgg 1320
ttctggaacc acttctctgg aggtctcaac caccagattg agcaccattg ctttcctcag 1380
aacccccaca ccgtcaacgt ctacatctcc ggcatcgtca aggagacctg cgaggagtac 1440
ggcgtgccct accaggctga gatctccctc ttctctgcct atttcaagat gctgtcccac 1500
ctccgaaccc tcggcaacga ggacctcacc gcctggtcca cctaa 1545
<210> 107
<211> 514
<212> PRT
<213> Thraustochytrium aureum
<220>
<221> MISC_FEATURE
<223> synthetic delta-4 desaturase (codon-optimized)
<400> 107
Met Val Gly Phe Asp Glu Thr Val Thr Met Asp Thr Val Arg Asn His
1 5 10 15
Asn Met Pro Asp Asp Ala Trp Cys Ala Ile His Gly Thr Val Tyr Asp
20 25 30
Ile Thr Lys Phe Ser Lys Val His Pro Gly Gly Asp Ile Ile Met Leu
35 40 45
Ala Ala Gly Lys Glu Ala Thr Ile Leu Phe Glu Thr Tyr His Ile Lys
50 55 60
Gly Val Pro Asp Ala Val Leu Arg Lys Tyr Lys Val Gly Lys Leu Pro
65 70 75 80
Gln Gly Lys Lys Gly Glu Thr Ser His Met Pro Thr Gly Leu Asp Ser
85 90 95
Ala Ser Tyr Tyr Ser Trp Asp Ser Glu Phe Tyr Arg Val Leu Arg Glu
100 105 110
Arg Val Ala Lys Lys Leu Ala Glu Pro Gly Leu Met Gln Arg Ala Arg
115 120 125
Met Glu Leu Trp Ala Lys Ala Ile Phe Leu Leu Ala Gly Phe Trp Gly
130 135 140
Ser Leu Tyr Ala Met Cys Val Leu Asp Pro His Gly Gly Ala Met Val
145 150 155 160
Ala Ala Val Thr Leu Gly Val Phe Ala Ala Phe Val Gly Thr Cys Ile
165 170 175
Gln His Asp Gly Ser His Gly Ala Phe Ser Lys Ser Arg Phe Met Asn
180 185 190
Lys Ala Ala Gly Trp Thr Leu Asp Met Ile Gly Ala Ser Ala Met Thr
195 200 205
Trp Glu Met Gln His Val Leu Gly His His Pro Tyr Thr Asn Leu Ile
210 215 220
Glu Met Glu Asn Gly Leu Ala Lys Val Lys Gly Ala Asp Val Asp Pro
225 230 235 240
Lys Lys Val Asp Gln Glu Ser Asp Pro Asp Val Phe Ser Thr Tyr Pro
245 250 255
Met Leu Arg Leu His Pro Trp His Arg Gln Arg Phe Tyr His Lys Phe
260 265 270
Gln His Leu Tyr Ala Pro Leu Ile Phe Gly Phe Met Thr Ile Asn Lys
275 280 285
Val Ile Ser Gln Asp Val Gly Val Val Leu Arg Lys Arg Leu Phe Gln
290 295 300
Ile Asp Ala Asn Cys Arg Tyr Gly Ser Pro Trp Asn Val Ala Arg Phe
305 310 315 320
Trp Ile Met Lys Leu Leu Thr Thr Leu Tyr Met Val Ala Leu Pro Met
325 330 335
Tyr Met Gln Gly Pro Ala Gln Gly Leu Lys Leu Phe Phe Met Ala His
340 345 350
Phe Thr Cys Gly Glu Val Leu Ala Thr Met Phe Ile Val Asn His Ile
355 360 365
Ile Glu Gly Val Ser Tyr Ala Ser Lys Asp Ala Val Lys Gly Val Met
370 375 380
Ala Pro Pro Arg Thr Val His Gly Val Thr Pro Met Gln Val Thr Gln
385 390 395 400
Lys Ala Leu Ser Ala Ala Glu Ser Thr Lys Ser Asp Ala Asp Lys Thr
405 410 415
Thr Met Ile Pro Leu Asn Asp Trp Ala Ala Val Gln Cys Gln Thr Ser
420 425 430
Val Asn Trp Ala Val Gly Ser Trp Phe Trp Asn His Phe Ser Gly Gly
435 440 445
Leu Asn His Gln Ile Glu His His Cys Phe Pro Gln Asn Pro His Thr
450 455 460
Val Asn Val Tyr Ile Ser Gly Ile Val Lys Glu Thr Cys Glu Glu Tyr
465 470 475 480
Gly Val Pro Tyr Gln Ala Glu Ile Ser Leu Phe Ser Ala Tyr Phe Lys
485 490 495
Met Leu Ser His Leu Arg Thr Leu Gly Asn Glu Asp Leu Thr Ala Trp
500 505 510
Ser Thr
<210> 108
<211> 945
<212> DNA
<213> Mortierella alpina
<400> 108
atgtccatag gttcttccaa tcctgtcctg ctggcagcga tccccttcgt ctacctcttc 60
gtcctccctc gtgtcctcgc cttcctccct caaaaggccc agttcctcgc aaaatgcatc 120
gtggtcttga tcgccaccct tatcatgtcc gtcgcaggct gcttcatttc catcgtctgt 180
gcgctcctcg ataaacgcta tgtgatcaac tacgtcgtct caagactctt ctcattcctc 240
gctgcaagac cctgcggtgt cacctacaag atcgtcggcg aggaacatct ggacaagtac 300
cccgccattg tcgtctgcaa ccaccagagc tccatggaca tgatggtcct gggacgcgtc 360
ttcccaaagc actgtgtcgt catggcaaag aaggaacttc tttactttcc gttcctgggc 420
atgtttatga agctgagtaa cgccatcttc attgaccgca agaaccacaa gaaggcgatc 480
gagtccacca cccaagctgt cgccgacatg aagaagcaca actctggaat ctggattttc 540
cccgaaggaa cacgttcccg cttggacaag gccgatctct tgcccttcaa gaagggagcc 600
ttccacctcg ccattcaagc ccaactcccg atcctcccca tcatctcgca aggatactca 660
cacatctacg attcgtcaaa acgctacttc cccggtggag agctcgagat cagagtcctg 720
gaacctatcc ccaccacggg attgaccaca gacgatgtga acgacctgat ggacaagact 780
cgcaacctga tgctgaagca cctcaaggag atggattctc aatactcctc ctccaccgct 840
gaaaacggat cgacccatat tgacgccgat atcgcaaagt caactgccac atcgatcgga 900
aacacggacg atgctatcac aaagaggagg acaccaaaag agtag 945
<210> 109
<211> 314
<212> PRT
<213> Mortierella alpina
<400> 109
Met Ser Ile Gly Ser Ser Asn Pro Val Leu Leu Ala Ala Ile Pro Phe
1 5 10 15
Val Tyr Leu Phe Val Leu Pro Arg Val Leu Ala Phe Leu Pro Gln Lys
20 25 30
Ala Gln Phe Leu Ala Lys Cys Ile Val Val Leu Ile Ala Thr Leu Ile
35 40 45
Met Ser Val Ala Gly Cys Phe Ile Ser Ile Val Cys Ala Leu Leu Asp
50 55 60
Lys Arg Tyr Val Ile Asn Tyr Val Val Ser Arg Leu Phe Ser Phe Leu
65 70 75 80
Ala Ala Arg Pro Cys Gly Val Thr Tyr Lys Ile Val Gly Glu Glu His
85 90 95
Leu Asp Lys Tyr Pro Ala Ile Val Val Cys Asn His Gln Ser Ser Met
100 105 110
Asp Met Met Val Leu Gly Arg Val Phe Pro Lys His Cys Val Val Met
115 120 125
Ala Lys Lys Glu Leu Leu Tyr Phe Pro Phe Leu Gly Met Phe Met Lys
130 135 140
Leu Ser Asn Ala Ile Phe Ile Asp Arg Lys Asn His Lys Lys Ala Ile
145 150 155 160
Glu Ser Thr Thr Gln Ala Val Ala Asp Met Lys Lys His Asn Ser Gly
165 170 175
Ile Trp Ile Phe Pro Glu Gly Thr Arg Ser Arg Leu Asp Lys Ala Asp
180 185 190
Leu Leu Pro Phe Lys Lys Gly Ala Phe His Leu Ala Ile Gln Ala Gln
195 200 205
Leu Pro Ile Leu Pro Ile Ile Ser Gln Gly Tyr Ser His Ile Tyr Asp
210 215 220
Ser Ser Lys Arg Tyr Phe Pro Gly Gly Glu Leu Glu Ile Arg Val Leu
225 230 235 240
Glu Pro Ile Pro Thr Thr Gly Leu Thr Thr Asp Asp Val Asn Asp Leu
245 250 255
Met Asp Lys Thr Arg Asn Leu Met Leu Lys His Leu Lys Glu Met Asp
260 265 270
Ser Gln Tyr Ser Ser Ser Thr Ala Glu Asn Gly Ser Thr His Ile Asp
275 280 285
Ala Asp Ile Ala Lys Ser Thr Ala Thr Ser Ile Gly Asn Thr Asp Asp
290 295 300
Ala Ile Thr Lys Arg Arg Thr Pro Lys Glu
305 310
<210> 110
<211> 927
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<223> LPAAT2
<400> 110
atgctcgggt ccgtcacccg acccacaaag gccctgctct atggatcagc cctcttcagt 60
ttctgctcat tgctcaatgt ggtccaggtg ttctccatac tcctgcagcc gttctcgaag 120
cgtctcttct ttgaagtgaa cgctcgcgtg gccggctcca tgtggaaggt tatgcagctg 180
attatggaga aaaagcacaa ggccgccatc aycttctcag gagacaagat ccctcaccac 240
gagagtgcca tcgtctttgg caaccaccgg tcctttgtcg acttttacat gtttcacacc 300
gttgctgcty ggagaggcat gctcaactat atgaagtact ttgccaagga ctctctgaaa 360
tacattccat tctatggatg gggcatgtgg aycatgggaa tgctattcat caatcgcaac 420
tggcagcagg atcagctcaa gatcaacaag atgtttgcac ggatattgga catccaagcg 480
cccgtttggg tcgccagttt cttggagggc tctcggttga cgcccagcaa actgkctgcc 540
tctcaaaagt tcatgctggg acgcggattg cctctgctgt caaacgtcat gatgcccagg 600
accaagggat tcattgcctg tgtcaacaaa ttccggggaa ctcatgtgaa atgtgtttat 660
gatttcacgt tcgcctacta ccacaagacc aagggctttg gagtgyctcc agatctggtc 720
cgtgttcaca stggccagct cagccccgag tacaaattcc atgttcatgt gagacgctat 780
cagctcgacg atctgcccac ggatgaggag aagctgagcg agtgggtggt ccaaaagtat 840
gtggagaagg acgccttttt ggagcagatg aaggagaatt ggacagatgg tattgatggg 900
ggtgtgtggt cagagaactg gatgtga 927
<210> 111
<211> 308
<212> PRT
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (71)..(71)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (104)..(104)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (131)..(131)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (179)..(179)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (236)..(236)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (244)..(244)
<223> Xaa can be any naturally occurring amino acid
<400> 111
Met Leu Gly Ser Val Thr Arg Pro Thr Lys Ala Leu Leu Tyr Gly Ser
1 5 10 15
Ala Leu Phe Ser Phe Cys Ser Leu Leu Asn Val Val Gln Val Phe Ser
20 25 30
Ile Leu Leu Gln Pro Phe Ser Lys Arg Leu Phe Phe Glu Val Asn Ala
35 40 45
Arg Val Ala Gly Ser Met Trp Lys Val Met Gln Leu Ile Met Glu Lys
50 55 60
Lys His Lys Ala Ala Ile Xaa Phe Ser Gly Asp Lys Ile Pro His His
65 70 75 80
Glu Ser Ala Ile Val Phe Gly Asn His Arg Ser Phe Val Asp Phe Tyr
85 90 95
Met Phe His Thr Val Ala Ala Xaa Arg Gly Met Leu Asn Tyr Met Lys
100 105 110
Tyr Phe Ala Lys Asp Ser Leu Lys Tyr Ile Pro Phe Tyr Gly Trp Gly
115 120 125
Met Trp Xaa Met Gly Met Leu Phe Ile Asn Arg Asn Trp Gln Gln Asp
130 135 140
Gln Leu Lys Ile Asn Lys Met Phe Ala Arg Ile Leu Asp Ile Gln Ala
145 150 155 160
Pro Val Trp Val Ala Ser Phe Leu Glu Gly Ser Arg Leu Thr Pro Ser
165 170 175
Lys Leu Xaa Ala Ser Gln Lys Phe Met Leu Gly Arg Gly Leu Pro Leu
180 185 190
Leu Ser Asn Val Met Met Pro Arg Thr Lys Gly Phe Ile Ala Cys Val
195 200 205
Asn Lys Phe Arg Gly Thr His Val Lys Cys Val Tyr Asp Phe Thr Phe
210 215 220
Ala Tyr Tyr His Lys Thr Lys Gly Phe Gly Val Xaa Pro Asp Leu Val
225 230 235 240
Arg Val His Xaa Gly Gln Leu Ser Pro Glu Tyr Lys Phe His Val His
245 250 255
Val Arg Arg Tyr Gln Leu Asp Asp Leu Pro Thr Asp Glu Glu Lys Leu
260 265 270
Ser Glu Trp Val Val Gln Lys Tyr Val Glu Lys Asp Ala Phe Leu Glu
275 280 285
Gln Met Lys Glu Asn Trp Thr Asp Gly Ile Asp Gly Gly Val Trp Ser
290 295 300
Glu Asn Trp Met
305
<210> 112
<211> 1549
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> LPAAT1
<220>
<221> CDS
<222> (501)..(1349)
<400> 112
cacagcataa taccacggca tgaccccgct gactccaacc ttcatttcgg cacatgtagg 60
tgcacaaggg acttcaagag gggccaattt catgcggaca catggcgcaa aaaacgcccg 120
actttgatta cacagacacg taataacgac gaagccgaga tgagcacacg tggccaagtc 180
tgccaatggc cccctggacc cccctgacaa agtttcccaa caagcccagc cgtgcatggt 240
gtgtttttgt gcggagacac acgccaatta ggctcatttg agggtatgca gcgaaaaaaa 300
attagtgtgg gtagtttgtt tgcaggaatc aagtgggtgg ttgaaaaaca agaaagagcg 360
acgacaagag agagagaaaa agagagagag actccataaa gcgtgcatca aaattaaggt 420
gtgtgactat ccgaaaacca aacatgaaca gttggatata tgtcgctgtg attgcagttg 480
ctgccgttct cattgcccga atg tcc gtt gca tcc aag ctc gtc ttc tac gtc 533
Met Ser Val Ala Ser Lys Leu Val Phe Tyr Val
1 5 10
cgc gcc gcc atc gcc gtg gtc atc ttt gcc gcc tgt gcc acc tac ggc 581
Arg Ala Ala Ile Ala Val Val Ile Phe Ala Ala Cys Ala Thr Tyr Gly
15 20 25
gtg ctg gcg tcc acc att ctc acc gcc atc ggc aag cag ggc ctg gcc 629
Val Leu Ala Ser Thr Ile Leu Thr Ala Ile Gly Lys Gln Gly Leu Ala
30 35 40
caa tgg acc gtt gcc aga gcc ttc tac tac tcg gtg cgc atc ttc ctg 677
Gln Trp Thr Val Ala Arg Ala Phe Tyr Tyr Ser Val Arg Ile Phe Leu
45 50 55
ggt atc agc atc aag ctg cgt agc cgg cag gtg acc gga acc gcc ggt 725
Gly Ile Ser Ile Lys Leu Arg Ser Arg Gln Val Thr Gly Thr Ala Gly
60 65 70 75
ctg gat gcc tcc aag atc cag gtc gcc aac acc acc aag ccc att gac 773
Leu Asp Ala Ser Lys Ile Gln Val Ala Asn Thr Thr Lys Pro Ile Asp
80 85 90
gac atc acc aaa cac ctg ccc cga cca tgc att ctg att tcc aac cac 821
Asp Ile Thr Lys His Leu Pro Arg Pro Cys Ile Leu Ile Ser Asn His
95 100 105
cag aac gaa atg gac att ctg gtg ctc ggt cgc atc ttc ccc cag tac 869
Gln Asn Glu Met Asp Ile Leu Val Leu Gly Arg Ile Phe Pro Gln Tyr
110 115 120
tgc tcc gtc acc gcc aaa aag gcc ctc aag tgg tac cct ctg ctg ggc 917
Cys Ser Val Thr Ala Lys Lys Ala Leu Lys Trp Tyr Pro Leu Leu Gly
125 130 135
cag ttc atg gcg ctg tcc ggc acc atc ttc ctg gac cga aag gac cga 965
Gln Phe Met Ala Leu Ser Gly Thr Ile Phe Leu Asp Arg Lys Asp Arg
140 145 150 155
acc aag tcc gtg cag acc ctc ggc ggc gcc gtc aag acc atc cag agc 1013
Thr Lys Ser Val Gln Thr Leu Gly Gly Ala Val Lys Thr Ile Gln Ser
160 165 170
ggc aac gga ggc aag ggc cag agc gtc ttc atg ttc ccc gag gga acc 1061
Gly Asn Gly Gly Lys Gly Gln Ser Val Phe Met Phe Pro Glu Gly Thr
175 180 185
cga tcc tac tcc aag gac gtc ggc atc atg ccc ttc aag aag ggc tgt 1109
Arg Ser Tyr Ser Lys Asp Val Gly Ile Met Pro Phe Lys Lys Gly Cys
190 195 200
ttc cac ctg gcg gtc cag tcg ggc gct ccc att gtc ccc gtg gtg gtc 1157
Phe His Leu Ala Val Gln Ser Gly Ala Pro Ile Val Pro Val Val Val
205 210 215
cag aac acc tcc cga atg ttt tct ttc ggc cga ggc aag ctg gac gcc 1205
Gln Asn Thr Ser Arg Met Phe Ser Phe Gly Arg Gly Lys Leu Asp Ala
220 225 230 235
gga gag atc ctt gtc gac gtc ctg agc ccc att gag acc aag ggt ctg 1253
Gly Glu Ile Leu Val Asp Val Leu Ser Pro Ile Glu Thr Lys Gly Leu
240 245 250
gac gcc agc aac gtc gac gct ctc atg gcc acc act tat aag gcc atg 1301
Asp Ala Ser Asn Val Asp Ala Leu Met Ala Thr Thr Tyr Lys Ala Met
255 260 265
tgc gag act gcc gac cag att ggc tac gct ggc cag aag act cag tag 1349
Cys Glu Thr Ala Asp Gln Ile Gly Tyr Ala Gly Gln Lys Thr Gln
270 275 280
agactgcagc acaagaagtg cttgtagcta ctttaggaga gagataggta atatgaaaca 1409
tttttcagat cgacacccac ggcgaaccat tggctgtgga gctatgggtg aatggattaa 1469
tatagcaacg aaatctacct cgattaccaa cgcaaaacga gcccactttc tctgtactgt 1529
gctatatcgt gtatacccca 1549
<210> 113
<211> 282
<212> PRT
<213> Yarrowia lipolytica
<400> 113
Met Ser Val Ala Ser Lys Leu Val Phe Tyr Val Arg Ala Ala Ile Ala
1 5 10 15
Val Val Ile Phe Ala Ala Cys Ala Thr Tyr Gly Val Leu Ala Ser Thr
20 25 30
Ile Leu Thr Ala Ile Gly Lys Gln Gly Leu Ala Gln Trp Thr Val Ala
35 40 45
Arg Ala Phe Tyr Tyr Ser Val Arg Ile Phe Leu Gly Ile Ser Ile Lys
50 55 60
Leu Arg Ser Arg Gln Val Thr Gly Thr Ala Gly Leu Asp Ala Ser Lys
65 70 75 80
Ile Gln Val Ala Asn Thr Thr Lys Pro Ile Asp Asp Ile Thr Lys His
85 90 95
Leu Pro Arg Pro Cys Ile Leu Ile Ser Asn His Gln Asn Glu Met Asp
100 105 110
Ile Leu Val Leu Gly Arg Ile Phe Pro Gln Tyr Cys Ser Val Thr Ala
115 120 125
Lys Lys Ala Leu Lys Trp Tyr Pro Leu Leu Gly Gln Phe Met Ala Leu
130 135 140
Ser Gly Thr Ile Phe Leu Asp Arg Lys Asp Arg Thr Lys Ser Val Gln
145 150 155 160
Thr Leu Gly Gly Ala Val Lys Thr Ile Gln Ser Gly Asn Gly Gly Lys
165 170 175
Gly Gln Ser Val Phe Met Phe Pro Glu Gly Thr Arg Ser Tyr Ser Lys
180 185 190
Asp Val Gly Ile Met Pro Phe Lys Lys Gly Cys Phe His Leu Ala Val
195 200 205
Gln Ser Gly Ala Pro Ile Val Pro Val Val Val Gln Asn Thr Ser Arg
210 215 220
Met Phe Ser Phe Gly Arg Gly Lys Leu Asp Ala Gly Glu Ile Leu Val
225 230 235 240
Asp Val Leu Ser Pro Ile Glu Thr Lys Gly Leu Asp Ala Ser Asn Val
245 250 255
Asp Ala Leu Met Ala Thr Thr Tyr Lys Ala Met Cys Glu Thr Ala Asp
260 265 270
Gln Ile Gly Tyr Ala Gly Gln Lys Thr Gln
275 280
<210> 114
<211> 1495
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> LPAAT2
<400> 114
tagagtactc atagctactg tattccataa tcaaggttca ctgtgcttcg atactgcctg 60
gagataagac agatgcgata atacacgaca tgttggatgt aagggcatgt aatacgtgtt 120
gatattaatt gatctgacgt attatataaa cgatgtatat ccaggactca ttcaacacta 180
gacgcaaccc gatgctctcg tcacaatgat tggattcttg gtctcggtct caggttgcgt 240
cttctttcgg ctcctctcac cacacttctt taacacccct caacccacca ccattctatt 300
ccacatcacc tcacaccact tcaagagaga taccgacaca atataatttc atcgatgaaa 360
ctggaaacca gaaaatacct gctggtgacc atcctggtgg tcatgttcac tatcggctcg 420
gtcatggacc tatggctcta cctcctgtgt cttagccgat cacccaacct caagcactac 480
agagctatgt tggctcgaag atggtggtcg tggacgatgt tctcggtggg tcaggtggtc 540
aacttcaaga tcaagatgca cggcgacaaa atgatacccg agggaaacat gctgataatc 600
agtgagatac ctatgatgtg gtcgacgaga cacgaaatac taacacaggt aatcatctat 660
caagatacga ctatatgatc tacgcactaa tcaacaacca gcattgcgcc aagtcgcacc 720
ttgcattcct gtcctggaaa cacatctttt ctctctttag cctcagcaag attctgccct 780
tctaccgact tgacgaaaac tggatgttcg aatcagcagc cgaccttgag aaagaactag 840
ccaagctaat caacccttac tgtctggtgc tgttcccaga agtctcggtg gcaaccccac 900
aacttatcag acgacataga gagctctgca gagcgtgttt tgcacctgaa ctcactcatg 960
tactctaccc tcgccacagc agctttgcag acttcatatt gggactgaat aagggccagg 1020
ctcttagtta catctacgac gccaccatct cgtatactga caagaaagat aagattctat 1080
gtaatcctgg aaacatagat actctgttga ctcaagtgga aacggttcat gttcacatac 1140
accgagaaca gtatcgtcgg ctgccgcgcc acagacgtgg tattcagaag tggctggaaa 1200
acacatgggt ccacaaggat aagagtatca gaaaggccta caagcagtct ggatcaatca 1260
tggatgatgg caagctcaag gagaaggata agtgatacta actaactgca tgtaaaaaca 1320
gataaatatg ttaatgaatc aatgaaatgg tatacgatga ctacagtaaa ctctggtata 1380
ccttacttga atgtttttga taaatattat tgacaacact atattgacaa tgatgctatc 1440
tagttgatgt gagccttctt ctccagctca tcggcaagat cgtcaacggt cttgt 1495
<210> 115
<211> 672
<212> DNA
<213> Yarrowia lipolytica
<400> 115
atggtggtcg tggacgatgt tctcggtaat catctatcaa gatacgacta tatgatctac 60
gcactaatca acaaccagca ttgcgccaag tcgcaccttg cattcctgtc ctggaaacac 120
atcttttctc tctttagcct cagcaagatt ctgcccttct accgacttga cgaaaactgg 180
atgttcgaat cagcagccga ccttgagaaa gaactagcca agctaatcaa cccttactgt 240
ctggtgctgt tcccagaagt ctcggtggca accccacaac ttatcagacg acatagagag 300
ctctgcagag cgtgttttgc acctgaactc actcatgtac tctaccctcg ccacagcagc 360
tttgcagact tcatattggg actgaataag ggccaggctc ttagttacat ctacgacgcc 420
accatctcgt atactgacaa gaaagataag attctatgta atcctggaaa catagatact 480
ctgttgactc aagtggaaac ggttcatgtt cacatacacc gagaacagta tcgtcggctg 540
ccgcgccaca gacgtggtat tcagaagtgg ctggaaaaca catgggtcca caaggataag 600
agtatcagaa aggcctacaa gcagtctgga tcaatcatgg atgatggcaa gctcaaggag 660
aaggataagt ga 672
<210> 116
<211> 223
<212> PRT
<213> Yarrowia lipolytica
<400> 116
Met Val Val Val Asp Asp Val Leu Gly Asn His Leu Ser Arg Tyr Asp
1 5 10 15
Tyr Met Ile Tyr Ala Leu Ile Asn Asn Gln His Cys Ala Lys Ser His
20 25 30
Leu Ala Phe Leu Ser Trp Lys His Ile Phe Ser Leu Phe Ser Leu Ser
35 40 45
Lys Ile Leu Pro Phe Tyr Arg Leu Asp Glu Asn Trp Met Phe Glu Ser
50 55 60
Ala Ala Asp Leu Glu Lys Glu Leu Ala Lys Leu Ile Asn Pro Tyr Cys
65 70 75 80
Leu Val Leu Phe Pro Glu Val Ser Val Ala Thr Pro Gln Leu Ile Arg
85 90 95
Arg His Arg Glu Leu Cys Arg Ala Cys Phe Ala Pro Glu Leu Thr His
100 105 110
Val Leu Tyr Pro Arg His Ser Ser Phe Ala Asp Phe Ile Leu Gly Leu
115 120 125
Asn Lys Gly Gln Ala Leu Ser Tyr Ile Tyr Asp Ala Thr Ile Ser Tyr
130 135 140
Thr Asp Lys Lys Asp Lys Ile Leu Cys Asn Pro Gly Asn Ile Asp Thr
145 150 155 160
Leu Leu Thr Gln Val Glu Thr Val His Val His Ile His Arg Glu Gln
165 170 175
Tyr Arg Arg Leu Pro Arg His Arg Arg Gly Ile Gln Lys Trp Leu Glu
180 185 190
Asn Thr Trp Val His Lys Asp Lys Ser Ile Arg Lys Ala Tyr Lys Gln
195 200 205
Ser Gly Ser Ile Met Asp Asp Gly Lys Leu Lys Glu Lys Asp Lys
210 215 220
<210> 117
<211> 2326
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> PDAT
<220>
<221> misc_feature
<222> (2271)..(2271)
<223> n is a, c, g, or t
<400> 117
tattaatatt atgctcttca tgcaccagca aaataaccga aacgcgcata tgatagtggg 60
attctcgatt tgcccggcag acaaacgccg ctaaaatcgc cacagtatcg aattttaatt 120
gaatacgaac gtcaattccg gcttatcctt ctagcagttg tctcccgcag ctcgctccat 180
gactaatcat tcacgcgaca tgtctcagct accccggtct ggctcatgta aaaaaagtgt 240
aatcggcttt tttccggttg atcacaacca tcaatgacac aacctgtgaa tcggaaggcg 300
actgtcgagc gggtcgagcc agcagtggag gtggctgact ccgagtccga ggccaagacc 360
gacgtccacg ttcaccacca tcatcaccac cacaagcgaa aatccgtcaa gggcaagatt 420
ctcaacttct tcacccgaag tcgacgtatc accttcgtcc tcggcgccgt ggtcggtgtg 480
atagccgcgg gatactacgc tgcgccaccg gagctcagca ttgatatcga tgctcttctc 540
ggcgacttgc cctcgttcga ctttgacgct ctatctctcg acaacttgtc catggacagt 600
gtgtcggact ttgtacaaga catgaaatcg cggtttccga ccaagattct gcaggaggcg 660
gccaagatcg agaagcacca gaaaagcgaa cagaaggctg ccccttttgc tgtgggcaag 720
gctatgaaga gcgagggact caacgccaag tacccggtgg tgctggtgcc cggcgtcatc 780
tccacgggac tggagagctg gtccctggag ggaaccgagg agtgtcccac cgagtcgcac 840
ttcagaaagc gaatgtgggg ctcctggtac atgatccgag tcatgctgct ggacaagtac 900
tgctggctgc agaacctgat gctggacaca gagaccggtc tagaccctcc ccatttcaag 960
ctgcgagccg cccagggatt tgcctccgcc gacttcttta tggcaggcta ctggctgtgg 1020
aacaagctgc tcgagaacct ggctgttatt ggatacgata cggatacaat gtctgctgcg 1080
gcgtacgact ggagactgtc ctaccctgat ttggagcacc gagacggata cttctccaag 1140
ctcaaagctt caatcgaaga gactaagcgt atgacaggtg agaagacagt tctgacgggc 1200
cattccatgg gctcccaggt catcttctac ttcatgaagt gggctgaggc cgagggatat 1260
ggaggaggag gtcccaactg ggtcaatgac catattgaat cctttgtcga catttccggc 1320
tccatgctgg gtactcccaa gaccctggtt gctcttctgt ctggagaaat gaaggatacc 1380
gtgcagctga acgcgatggc tgtgtatgga ctggagcagt tcttctctcg acgagagcga 1440
gccgatctgc tgcgaacatg gggaggaatt gcttccatga ttcccaaggg tggtaaggct 1500
atctggggtg atcattctgg agcccctgat gacgagcccg gccagaatgt cacctttggc 1560
aacttcatca agttcaagga gtccttgacc gagtactctg ctaagaacct caccatggat 1620
gaaaccgttg acttcctgta ttctcagtct cccgagtggt ttgtgaaccg aaccgagggt 1680
gcttactcct ttggaattgc caagactcga aagcaggttg agcagaatga gaagcgacct 1740
tctacctgga gcaaccctct ggaagctgct ctccccaatg cccccgatct caagatctac 1800
tgcttctatg gagtcggtaa ggataccgag cgagcctact actaccagga tgagcccaat 1860
cccgagcaga ccaacttgaa cgtcagtatc gctggaaacg accctgatgg tgtgcttatg 1920
ggtcagggcg atggaaccgt ctcccttgtg acccatacca tgtgtcaccg atggaaggac 1980
gagaattcca agttcaaccc tggtaacgcc caggtcaagg ttgtggagat gttgcaccag 2040
cctgatcgac ttgatattcg aggcggtgct cagactgccg agcatgtgga cattctgggg 2100
cgttctgagt tgaacgagat ggttctgaag gtggctagtg gaaagggaaa tgagattgaa 2160
gagagagtca tctccaacat tgatgagtgg gtgtggaaga ttgatctcgg cagcaattag 2220
agagtccgtt ttgtagagta atatgttttg tatatcacac tgatggagaa nggcgttcga 2280
tttctcatga ttccatgtgg ttgtttaatg agcacgtaga acgacg 2326
<210> 118
<211> 648
<212> PRT
<213> Yarrowia lipolytica
<400> 118
Met Thr Gln Pro Val Asn Arg Lys Ala Thr Val Glu Arg Val Glu Pro
1 5 10 15
Ala Val Glu Val Ala Asp Ser Glu Ser Glu Ala Lys Thr Asp Val His
20 25 30
Val His His His His His His His Lys Arg Lys Ser Val Lys Gly Lys
35 40 45
Ile Leu Asn Phe Phe Thr Arg Ser Arg Arg Ile Thr Phe Val Leu Gly
50 55 60
Ala Val Val Gly Val Ile Ala Ala Gly Tyr Tyr Ala Ala Pro Pro Glu
65 70 75 80
Leu Ser Ile Asp Ile Asp Ala Leu Leu Gly Asp Leu Pro Ser Phe Asp
85 90 95
Phe Asp Ala Leu Ser Leu Asp Asn Leu Ser Met Asp Ser Val Ser Asp
100 105 110
Phe Val Gln Asp Met Lys Ser Arg Phe Pro Thr Lys Ile Leu Gln Glu
115 120 125
Ala Ala Lys Ile Glu Lys His Gln Lys Ser Glu Gln Lys Ala Ala Pro
130 135 140
Phe Ala Val Gly Lys Ala Met Lys Ser Glu Gly Leu Asn Ala Lys Tyr
145 150 155 160
Pro Val Val Leu Val Pro Gly Val Ile Ser Thr Gly Leu Glu Ser Trp
165 170 175
Ser Leu Glu Gly Thr Glu Glu Cys Pro Thr Glu Ser His Phe Arg Lys
180 185 190
Arg Met Trp Gly Ser Trp Tyr Met Ile Arg Val Met Leu Leu Asp Lys
195 200 205
Tyr Cys Trp Leu Gln Asn Leu Met Leu Asp Thr Glu Thr Gly Leu Asp
210 215 220
Pro Pro His Phe Lys Leu Arg Ala Ala Gln Gly Phe Ala Ser Ala Asp
225 230 235 240
Phe Phe Met Ala Gly Tyr Trp Leu Trp Asn Lys Leu Leu Glu Asn Leu
245 250 255
Ala Val Ile Gly Tyr Asp Thr Asp Thr Met Ser Ala Ala Ala Tyr Asp
260 265 270
Trp Arg Leu Ser Tyr Pro Asp Leu Glu His Arg Asp Gly Tyr Phe Ser
275 280 285
Lys Leu Lys Ala Ser Ile Glu Glu Thr Lys Arg Met Thr Gly Glu Lys
290 295 300
Thr Val Leu Thr Gly His Ser Met Gly Ser Gln Val Ile Phe Tyr Phe
305 310 315 320
Met Lys Trp Ala Glu Ala Glu Gly Tyr Gly Gly Gly Gly Pro Asn Trp
325 330 335
Val Asn Asp His Ile Glu Ser Phe Val Asp Ile Ser Gly Ser Met Leu
340 345 350
Gly Thr Pro Lys Thr Leu Val Ala Leu Leu Ser Gly Glu Met Lys Asp
355 360 365
Thr Val Gln Leu Asn Ala Met Ala Val Tyr Gly Leu Glu Gln Phe Phe
370 375 380
Ser Arg Arg Glu Arg Ala Asp Leu Leu Arg Thr Trp Gly Gly Ile Ala
385 390 395 400
Ser Met Ile Pro Lys Gly Gly Lys Ala Ile Trp Gly Asp His Ser Gly
405 410 415
Ala Pro Asp Asp Glu Pro Gly Gln Asn Val Thr Phe Gly Asn Phe Ile
420 425 430
Lys Phe Lys Glu Ser Leu Thr Glu Tyr Ser Ala Lys Asn Leu Thr Met
435 440 445
Asp Glu Thr Val Asp Phe Leu Tyr Ser Gln Ser Pro Glu Trp Phe Val
450 455 460
Asn Arg Thr Glu Gly Ala Tyr Ser Phe Gly Ile Ala Lys Thr Arg Lys
465 470 475 480
Gln Val Glu Gln Asn Glu Lys Arg Pro Ser Thr Trp Ser Asn Pro Leu
485 490 495
Glu Ala Ala Leu Pro Asn Ala Pro Asp Leu Lys Ile Tyr Cys Phe Tyr
500 505 510
Gly Val Gly Lys Asp Thr Glu Arg Ala Tyr Tyr Tyr Gln Asp Glu Pro
515 520 525
Asn Pro Glu Gln Thr Asn Leu Asn Val Ser Ile Ala Gly Asn Asp Pro
530 535 540
Asp Gly Val Leu Met Gly Gln Gly Asp Gly Thr Val Ser Leu Val Thr
545 550 555 560
His Thr Met Cys His Arg Trp Lys Asp Glu Asn Ser Lys Phe Asn Pro
565 570 575
Gly Asn Ala Gln Val Lys Val Val Glu Met Leu His Gln Pro Asp Arg
580 585 590
Leu Asp Ile Arg Gly Gly Ala Gln Thr Ala Glu His Val Asp Ile Leu
595 600 605
Gly Arg Ser Glu Leu Asn Glu Met Val Leu Lys Val Ala Ser Gly Lys
610 615 620
Gly Asn Glu Ile Glu Glu Arg Val Ile Ser Asn Ile Asp Glu Trp Val
625 630 635 640
Trp Lys Ile Asp Leu Gly Ser Asn
645
<210> 119
<211> 1632
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> ARE2
<400> 119
atggccacac tccaccccga agacgccgca ggacggcccg tgcgacgacg acctcgtccc 60
tccagttcgg gcggctccag atcgccgtcc accaaacgac actcgatagt gcgggagcat 120
ctcggagaag agctcaatgt gcccgacggc caggaaatgg acctgggcca ggtcaacaag 180
aacctcaatg ccgcatacgc caaggccgag aaggactcgg acgacgagaa ggaaaagaag 240
gaggagggcg tggtggacga gctgccagag aagtattcct accctcgatt ctcaaagaac 300
aaccgacgct acagattcac cgacatcaag ttcaagccaa caccgtcgat tctcgacaag 360
ttcgcccaca aggactcgga gttctttggc ttctacaccc tgctgtggat ggtgtttgcc 420
ttctgcgtct tccgaaccgg cctgctcaac tacacaaacg aaggcatcct gttccggggc 480
cagattttcg ccattctcag caaagatctc tggaaagtcg cattggtcga tctgggcatg 540
tacctgacca cctatctgtc tgtgtttctg caattggccg tcaagcacgg tctggtcgac 600
tggaactcgt ttggctggat catccagaac gtgcaccaga ccctgttcct cttcttctac 660
ctttgggtcg ccaagtcgag taacctgcct tggatcggta acatcttcat tgtgcttcat 720
gcctttgtca tgctcatgaa acaacactcg tacgccttct acaatggcta cctatggact 780
gtcgaggacg agctctccca cgcaaagcag cgtctcaccg aagacattcc tgtttcagag 840
aaggaggatc tcaagctgga catcgagttc tgcgagacag agctcaaggt ccaatccaga 900
cacacccctt tccccaccaa catcaccttt tctaactact tctggtactc catgttccca 960
acgctcgtct acgaaattga gttccctcga accccccgaa tcaagtggac atacgtgctg 1020
gagaaggtcg ccgcagtctt tggcgtcttc ttccttatga tctgggtcgc agagtcgtac 1080
ctgtatcccc ctgtggtggc tgttattcaa atgcgagacg aacccttctg gaacaaggtc 1140
cgaatctatc ccattttcct gtcggacatt ctgctgccct ttgtcattga gtacatgctt 1200
gttttctaca tcatctggga cgccattctc aacggcattg ccgagctcac tcgcttcgcc 1260
gacagagact tttatggccc ctggtggaac tgtaccagct gggagcagtt tagccgagaa 1320
tggaacattc ctgtctacca gttcctcaag cgacacgtct accactcgtc catctctgct 1380
ttcaagttct ccaagggcgc agctaccctc accaccttct tgctgtcttc tcttgtccac 1440
gagctggtca tgtttgccat ctttaagaag ttccgaggat acctgctgtt gctgcagatg 1500
acccagctgc ccctggccat gctgcagaaa accaaatgga tccaggacag acccgttttt 1560
ggcaacgctt tcttctggtt ctcgctcatg atcggacctt ctctcatgtg ttccatgtac 1620
ctcctcttct aa 1632
<210> 120
<211> 543
<212> PRT
<213> Yarrowia lipolytica
<400> 120
Met Ala Thr Leu His Pro Glu Asp Ala Ala Gly Arg Pro Val Arg Arg
1 5 10 15
Arg Pro Arg Pro Ser Ser Ser Gly Gly Ser Arg Ser Pro Ser Thr Lys
20 25 30
Arg His Ser Ile Val Arg Glu His Leu Gly Glu Glu Leu Asn Val Pro
35 40 45
Asp Gly Gln Glu Met Asp Leu Gly Gln Val Asn Lys Asn Leu Asn Ala
50 55 60
Ala Tyr Ala Lys Ala Glu Lys Asp Ser Asp Asp Glu Lys Glu Lys Lys
65 70 75 80
Glu Glu Gly Val Val Asp Glu Leu Pro Glu Lys Tyr Ser Tyr Pro Arg
85 90 95
Phe Ser Lys Asn Asn Arg Arg Tyr Arg Phe Thr Asp Ile Lys Phe Lys
100 105 110
Pro Thr Pro Ser Ile Leu Asp Lys Phe Ala His Lys Asp Ser Glu Phe
115 120 125
Phe Gly Phe Tyr Thr Leu Leu Trp Met Val Phe Ala Phe Cys Val Phe
130 135 140
Arg Thr Gly Leu Leu Asn Tyr Thr Asn Glu Gly Ile Leu Phe Arg Gly
145 150 155 160
Gln Ile Phe Ala Ile Leu Ser Lys Asp Leu Trp Lys Val Ala Leu Val
165 170 175
Asp Leu Gly Met Tyr Leu Thr Thr Tyr Leu Ser Val Phe Leu Gln Leu
180 185 190
Ala Val Lys His Gly Leu Val Asp Trp Asn Ser Phe Gly Trp Ile Ile
195 200 205
Gln Asn Val His Gln Thr Leu Phe Leu Phe Phe Tyr Leu Trp Val Ala
210 215 220
Lys Ser Ser Asn Leu Pro Trp Ile Gly Asn Ile Phe Ile Val Leu His
225 230 235 240
Ala Phe Val Met Leu Met Lys Gln His Ser Tyr Ala Phe Tyr Asn Gly
245 250 255
Tyr Leu Trp Thr Val Glu Asp Glu Leu Ser His Ala Lys Gln Arg Leu
260 265 270
Thr Glu Asp Ile Pro Val Ser Glu Lys Glu Asp Leu Lys Leu Asp Ile
275 280 285
Glu Phe Cys Glu Thr Glu Leu Lys Val Gln Ser Arg His Thr Pro Phe
290 295 300
Pro Thr Asn Ile Thr Phe Ser Asn Tyr Phe Trp Tyr Ser Met Phe Pro
305 310 315 320
Thr Leu Val Tyr Glu Ile Glu Phe Pro Arg Thr Pro Arg Ile Lys Trp
325 330 335
Thr Tyr Val Leu Glu Lys Val Ala Ala Val Phe Gly Val Phe Phe Leu
340 345 350
Met Ile Trp Val Ala Glu Ser Tyr Leu Tyr Pro Pro Val Val Ala Val
355 360 365
Ile Gln Met Arg Asp Glu Pro Phe Trp Asn Lys Val Arg Ile Tyr Pro
370 375 380
Ile Phe Leu Ser Asp Ile Leu Leu Pro Phe Val Ile Glu Tyr Met Leu
385 390 395 400
Val Phe Tyr Ile Ile Trp Asp Ala Ile Leu Asn Gly Ile Ala Glu Leu
405 410 415
Thr Arg Phe Ala Asp Arg Asp Phe Tyr Gly Pro Trp Trp Asn Cys Thr
420 425 430
Ser Trp Glu Gln Phe Ser Arg Glu Trp Asn Ile Pro Val Tyr Gln Phe
435 440 445
Leu Lys Arg His Val Tyr His Ser Ser Ile Ser Ala Phe Lys Phe Ser
450 455 460
Lys Gly Ala Ala Thr Leu Thr Thr Phe Leu Leu Ser Ser Leu Val His
465 470 475 480
Glu Leu Val Met Phe Ala Ile Phe Lys Lys Phe Arg Gly Tyr Leu Leu
485 490 495
Leu Leu Gln Met Thr Gln Leu Pro Leu Ala Met Leu Gln Lys Thr Lys
500 505 510
Trp Ile Gln Asp Arg Pro Val Phe Gly Asn Ala Phe Phe Trp Phe Ser
515 520 525
Leu Met Ile Gly Pro Ser Leu Met Cys Ser Met Tyr Leu Leu Phe
530 535 540
<210> 121
<211> 282
<212> PRT
<213> Caenorhabditis elegans (clone TO6E8.1)
<220>
<221> misc_feature
<223> LPCAT
<300>
<310> WO 2004/076617A2
<311> 2004-01-29
<312> 2004-09-10
<400> 121
Met Glu Asn Phe Trp Ser Ile Val Val Phe Phe Leu Leu Ser Ile Leu
1 5 10 15
Phe Ile Leu Tyr Asn Ile Ser Thr Val Cys His Tyr Tyr Met Arg Ile
20 25 30
Ser Phe Tyr Tyr Phe Thr Ile Leu Leu His Gly Met Glu Val Cys Val
35 40 45
Thr Met Ile Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe
50 55 60
His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val
65 70 75 80
Tyr Gly Tyr Glu Lys Thr Gln Val Glu Gly Pro Ala Val Val Ile Cys
85 90 95
Asn His Gln Ser Ser Leu Asp Ile Leu Ser Met Ala Ser Ile Trp Pro
100 105 110
Lys Asn Cys Val Val Met Met Lys Arg Ile Leu Ala Tyr Val Pro Phe
115 120 125
Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr Ile Phe Ile Asp Arg Tyr
130 135 140
Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met
145 150 155 160
Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn
165 170 175
Arg Glu Gly Gly Phe Ile Pro Phe Lys Lys Gly Ala Phe Asn Ile Ala
180 185 190
Val Arg Ala Gln Ile Pro Ile Ile Pro Val Val Phe Ser Asp Tyr Arg
195 200 205
Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val
210 215 220
Val Ile Arg Val Leu Asp Ala Ile Pro Thr Lys Gly Leu Thr Leu Asp
225 230 235 240
Asp Val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala
245 250 255
Tyr Lys Glu Val Thr Leu Glu Ala Gln Gln Arg Asn Ala Thr Arg Arg
260 265 270
Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu
275 280
<210> 122
<211> 1578
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> DGAT1
<400> 122
atggaggtcc gacgacgaaa gatagacgtg ctcaaggccc agaaaaacgg ctacgaatcg 60
ggcccaccat ctcgacaatc gtcgcagccc tcctcaagag catcgtccag aacccgcaac 120
aaacactcct cgtccaccct gtcgctcagc ggactgacca tgaaagtcca gaagaaacct 180
gcgggacccc cggcgaactc caaaacgcca ttcctacaca tcaagcccgt gcacacgtgc 240
tgctccacat caatgctttc gcgcgattat gacggctcca accccagctt caagggcttc 300
aaaaacatcg gcatgatcat tctcattgtg ggaaatctac ggctcgcatt cgaaaactac 360
ctcaaatacg gcatttccaa cccgttcttc gaccccaaaa ttactccttc cgagtggcag 420
ctctcaggct tgctcatagt cgtggcctac gcacatatcc tcatggccta cgctattgag 480
agcgctgcca agctgctgtt cctctctagc aaacaccact acatggccgt ggggcttctg 540
cataccatga acactttgtc gtccatctcg ttgctgtcct acgtcgtcta ctactacctg 600
cccaaccccg tggcaggcac aatagtcgag tttgtggccg ttattctgtc tctcaaactc 660
gcctcatacg ccctcactaa ctcggatctc cgaaaagccg caattcatgc ccagaagctc 720
gacaagacgc aagacgataa cgaaaaggaa tccacctcgt cttcctcttc ttcagatgac 780
gcagagactt tggcagacat tgacgtcatt cctgcatact acgcacagct gccctacccc 840
cagaatgtga cgctgtcgaa cctgctgtac ttctggtttg ctcccacact ggtctaccag 900
cccgtgtacc ccaagacgga gcgtattcga cccaagcacg tgatccgaaa cctgtttgag 960
ctcgtctctc tgtgcatgct tattcagttt ctcatcttcc agtacgccta ccccatcatg 1020
cagtcgtgtc tggctctgtt cttccagccc aagctcgatt atgccaacat ctccgagcgc 1080
ctcatgaagt tggcctccgt gtctatgatg gtctggctca ttggattcta cgctttcttc 1140
cagaacggtc tcaatcttat tgccgagctc acctgttttg gaaacagaac cttctaccag 1200
cagtggtgga attcccgctc cattggccag tactggactc tatggaacaa gccagtcaac 1260
cagtacttta gacaccacgt ctacgtgcct cttctcgctc ggggcatgtc gcggttcaat 1320
gcgtcggtgg tggttttctt tttctccgcc gtcatccatg aactgcttgt cggcatcccc 1380
actcacaaca tcatcggagc cgccttcttc ggcatgatgt cgcaggtgcc tctgatcatg 1440
gctactgaga accttcagca tattaactcc tctctgggcc ccttccttgg caactgtgca 1500
ttctggttca cctttttcct gggacaaccc acttgtgcat tcctttacta tttggcctac 1560
aactacaagc agaaccag 1578
<210> 123
<211> 526
<212> PRT
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (518)..(518)
<223> Xaa can be any naturally occurring amino acid
<400> 123
Met Glu Val Arg Arg Arg Lys Ile Asp Val Leu Lys Ala Gln Lys Asn
1 5 10 15
Gly Tyr Glu Ser Gly Pro Pro Ser Arg Gln Ser Ser Gln Pro Ser Ser
20 25 30
Arg Ala Ser Ser Arg Thr Arg Asn Lys His Ser Ser Ser Thr Leu Ser
35 40 45
Leu Ser Gly Leu Thr Met Lys Val Gln Lys Lys Pro Ala Gly Pro Pro
50 55 60
Ala Asn Ser Lys Thr Pro Phe Leu His Ile Lys Pro Val His Thr Cys
65 70 75 80
Cys Ser Thr Ser Met Leu Ser Arg Asp Tyr Asp Gly Ser Asn Pro Ser
85 90 95
Phe Lys Gly Phe Lys Asn Ile Gly Met Ile Ile Leu Ile Val Gly Asn
100 105 110
Leu Arg Leu Ala Phe Glu Asn Tyr Leu Lys Tyr Gly Ile Ser Asn Pro
115 120 125
Phe Phe Asp Pro Lys Ile Thr Pro Ser Glu Trp Gln Leu Ser Gly Leu
130 135 140
Leu Ile Val Val Ala Tyr Ala His Ile Leu Met Ala Tyr Ala Ile Glu
145 150 155 160
Ser Ala Ala Lys Leu Leu Phe Leu Ser Ser Lys His His Tyr Met Ala
165 170 175
Val Gly Leu Leu His Thr Met Asn Thr Leu Ser Ser Ile Ser Leu Leu
180 185 190
Ser Tyr Val Val Tyr Tyr Tyr Leu Pro Asn Pro Val Ala Gly Thr Ile
195 200 205
Val Glu Phe Val Ala Val Ile Leu Ser Leu Lys Leu Ala Ser Tyr Ala
210 215 220
Leu Thr Asn Ser Asp Leu Arg Lys Ala Ala Ile His Ala Gln Lys Leu
225 230 235 240
Asp Lys Thr Gln Asp Asp Asn Glu Lys Glu Ser Thr Ser Ser Ser Ser
245 250 255
Ser Ser Asp Asp Ala Glu Thr Leu Ala Asp Ile Asp Val Ile Pro Ala
260 265 270
Tyr Tyr Ala Gln Leu Pro Tyr Pro Gln Asn Val Thr Leu Ser Asn Leu
275 280 285
Leu Tyr Phe Trp Phe Ala Pro Thr Leu Val Tyr Gln Pro Val Tyr Pro
290 295 300
Lys Thr Glu Arg Ile Arg Pro Lys His Val Ile Arg Asn Leu Phe Glu
305 310 315 320
Leu Val Ser Leu Cys Met Leu Ile Gln Phe Leu Ile Phe Gln Tyr Ala
325 330 335
Tyr Pro Ile Met Gln Ser Cys Leu Ala Leu Phe Phe Gln Pro Lys Leu
340 345 350
Asp Tyr Ala Asn Ile Ser Glu Arg Leu Met Lys Leu Ala Ser Val Ser
355 360 365
Met Met Val Trp Leu Ile Gly Phe Tyr Ala Phe Phe Gln Asn Gly Leu
370 375 380
Asn Leu Ile Ala Glu Leu Thr Cys Phe Gly Asn Arg Thr Phe Tyr Gln
385 390 395 400
Gln Trp Trp Asn Ser Arg Ser Ile Gly Gln Tyr Trp Thr Leu Trp Asn
405 410 415
Lys Pro Val Asn Gln Tyr Phe Arg His His Val Tyr Val Pro Leu Leu
420 425 430
Ala Arg Gly Met Ser Arg Phe Asn Ala Ser Val Val Val Phe Phe Phe
435 440 445
Ser Ala Val Ile His Glu Leu Leu Val Gly Ile Pro Thr His Asn Ile
450 455 460
Ile Gly Ala Ala Phe Phe Gly Met Met Ser Gln Val Pro Leu Ile Met
465 470 475 480
Ala Thr Glu Asn Leu Gln His Ile Asn Ser Ser Leu Gly Pro Phe Leu
485 490 495
Gly Asn Cys Ala Phe Trp Phe Thr Phe Phe Leu Gly Gln Pro Thr Cys
500 505 510
Ala Phe Leu Tyr Tyr Xaa Ala Tyr Asn Tyr Lys Gln Asn Gln
515 520 525
<210> 124
<211> 1578
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<223> DGAT1
<220>
<221> misc_feature
<222> (466)..(466)
<223> n is a, c, g, or t
<400> 124
atgacagagt cgacaacaac gacatgtgca aaggaggagg gcattgccaa cagcgctgct 60
ttgcctgaca ttcccccaaa gatggaagac ctcaagtcct ccaggaagac cggctcttct 120
tacaagcaca ccttccccgt ccatacaaaa accatcccca gcccattgtc taaagaggca 180
cctccagaga gctatcgtgg attcgtcaac ctcggcatgc tcctactttt cggcaacaac 240
atccgattga tcatcgagaa ttacctcaaa tacggcttcc tgctctcaat ccctggatca 300
agcgtctcga agcaggactg gatcctggct gccctcaccc acgccatcct acccgtcaac 360
ctcatcctgg cctacaagct tgagagctgg gccaaggaga gagccgtcgg ctatcgcaag 420
cgtcgatctg acgaacccat tgcccaggaa tcaaccaagg ccgtgncagc aggagataat 480
gacgctatca aaaccacaaa acccgccaag gcccaggatc tcacacccga ggcccttgca 540
aggaaggaac aatcgaccgt gggctggctc catgtcttca atctgttcac catcgttgcc 600
tggccctcct tcatgtccta ctttatgatc taccacccct tcgtggccat gtcctgcctc 660
atgaacggac ttatcctctt cctcaaaatg acctcctttg cgcttgtgaa ccaggagctc 720
cgagcagcct acatctttgg aacacccgtg gacacgttcc agcacatggc taaagtgcac 780
gacatctctg gcaaggacct gacaaagaag gagatcttcc agtatgacat ccagtacccc 840
gacaacatca ccctcaagaa cattggctat ttctggctcg cccccacgct ctgctaccag 900
ccatcatacc caaggacgac cgtcttccgc aaatccttct tcctcaagcg tgtggccgag 960
atcgtgacct gtctgggcat gatgtacttt ttagtcgagc agtacgccac ccccaccctg 1020
cagaactcgg tccgagcatt cgatgagttg gcgttcggca ccattctgga gagagtgctg 1080
aagctgagca ccaccagtgt catcatctgg ctactcatgt tctacacctt tttccactcg 1140
ttctttaatg ctcttgcaga ggcactgtac tttggagacc gtcgcttcta tctcgcctgg 1200
tggaatgcca ctggtgtcgg catgtactgg aagacgtgga actcgcccgt ctacaccttc 1260
ttcaaacgcc acgtatacct gcccctgatc acctctggca cctctcccat ggtcgcctcg 1320
atcgtcatct tcctcatctc ggctgtcttg cacgagatct tgatcggctt ccccactcat 1380
atgatctatg gatacgcatt cgccggcatg ttcctccaga tcccgctgat cattctgacc 1440
cgacccctcg aaaaatggcg aggcaccgga tcgggtctcg gcaacatgat cttctgggtc 1500
tcgttcacca tcctgggcca gccagcgtgt gcgctgctct actactacca ctggaccaag 1560
cgccatatgg atgtttga 1578
<210> 125
<211> 525
<212> PRT
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (156)..(156)
<223> Xaa can be any naturally occurring amino acid
<400> 125
Met Thr Glu Ser Thr Thr Thr Thr Cys Ala Lys Glu Glu Gly Ile Ala
1 5 10 15
Asn Ser Ala Ala Leu Pro Asp Ile Pro Pro Lys Met Glu Asp Leu Lys
20 25 30
Ser Ser Arg Lys Thr Gly Ser Ser Tyr Lys His Thr Phe Pro Val His
35 40 45
Thr Lys Thr Ile Pro Ser Pro Leu Ser Lys Glu Ala Pro Pro Glu Ser
50 55 60
Tyr Arg Gly Phe Val Asn Leu Gly Met Leu Leu Leu Phe Gly Asn Asn
65 70 75 80
Ile Arg Leu Ile Ile Glu Asn Tyr Leu Lys Tyr Gly Phe Leu Leu Ser
85 90 95
Ile Pro Gly Ser Ser Val Ser Lys Gln Asp Trp Ile Leu Ala Ala Leu
100 105 110
Thr His Ala Ile Leu Pro Val Asn Leu Ile Leu Ala Tyr Lys Leu Glu
115 120 125
Ser Trp Ala Lys Glu Arg Ala Val Gly Tyr Arg Lys Arg Arg Ser Asp
130 135 140
Glu Pro Ile Ala Gln Glu Ser Thr Lys Ala Val Xaa Ala Gly Asp Asn
145 150 155 160
Asp Ala Ile Lys Thr Thr Lys Pro Ala Lys Ala Gln Asp Leu Thr Pro
165 170 175
Glu Ala Leu Ala Arg Lys Glu Gln Ser Thr Val Gly Trp Leu His Val
180 185 190
Phe Asn Leu Phe Thr Ile Val Ala Trp Pro Ser Phe Met Ser Tyr Phe
195 200 205
Met Ile Tyr His Pro Phe Val Ala Met Ser Cys Leu Met Asn Gly Leu
210 215 220
Ile Leu Phe Leu Lys Met Thr Ser Phe Ala Leu Val Asn Gln Glu Leu
225 230 235 240
Arg Ala Ala Tyr Ile Phe Gly Thr Pro Val Asp Thr Phe Gln His Met
245 250 255
Ala Lys Val His Asp Ile Ser Gly Lys Asp Leu Thr Lys Lys Glu Ile
260 265 270
Phe Gln Tyr Asp Ile Gln Tyr Pro Asp Asn Ile Thr Leu Lys Asn Ile
275 280 285
Gly Tyr Phe Trp Leu Ala Pro Thr Leu Cys Tyr Gln Pro Ser Tyr Pro
290 295 300
Arg Thr Thr Val Phe Arg Lys Ser Phe Phe Leu Lys Arg Val Ala Glu
305 310 315 320
Ile Val Thr Cys Leu Gly Met Met Tyr Phe Leu Val Glu Gln Tyr Ala
325 330 335
Thr Pro Thr Leu Gln Asn Ser Val Arg Ala Phe Asp Glu Leu Ala Phe
340 345 350
Gly Thr Ile Leu Glu Arg Val Leu Lys Leu Ser Thr Thr Ser Val Ile
355 360 365
Ile Trp Leu Leu Met Phe Tyr Thr Phe Phe His Ser Phe Phe Asn Ala
370 375 380
Leu Ala Glu Ala Leu Tyr Phe Gly Asp Arg Arg Phe Tyr Leu Ala Trp
385 390 395 400
Trp Asn Ala Thr Gly Val Gly Met Tyr Trp Lys Thr Trp Asn Ser Pro
405 410 415
Val Tyr Thr Phe Phe Lys Arg His Val Tyr Leu Pro Leu Ile Thr Ser
420 425 430
Gly Thr Ser Pro Met Val Ala Ser Ile Val Ile Phe Leu Ile Ser Ala
435 440 445
Val Leu His Glu Ile Leu Ile Gly Phe Pro Thr His Met Ile Tyr Gly
450 455 460
Tyr Ala Phe Ala Gly Met Phe Leu Gln Ile Pro Leu Ile Ile Leu Thr
465 470 475 480
Arg Pro Leu Glu Lys Trp Arg Gly Thr Gly Ser Gly Leu Gly Asn Met
485 490 495
Ile Phe Trp Val Ser Phe Thr Ile Leu Gly Gln Pro Ala Cys Ala Leu
500 505 510
Leu Tyr Tyr Tyr His Trp Thr Lys Arg His Met Asp Val
515 520 525
<210> 126
<211> 533
<212> PRT
<213> Neurospora crassa strain OR74A [GenBank Accession No. XP_322121]
<220>
<221> misc_feature
<223> DGAT1
<400> 126
Met Ser Ser Ser Thr Ala Thr Thr Thr Gly Leu Asp Pro Ala Val His
1 5 10 15
Thr Ser Asn Asp Asn Val Ile Arg Arg Thr His Gly Thr Glu Asn Gly
20 25 30
Ser Thr Pro Asn Asp Lys Ala Asn Ala Gly Gly Glu Pro Glu Thr Glu
35 40 45
Thr Lys Arg His Ser Lys Lys Val Val Arg Ser Lys Tyr Arg His Val
50 55 60
Glu Ala Val His Ser Gln Ser Arg Pro Ser Cys Leu Ser His Asp Thr
65 70 75 80
Thr Glu Ser Pro Ser Phe Leu Gly Phe Arg Asn Leu Met Val Ile Val
85 90 95
Leu Ala Asn Asn Ser His Gln Tyr Gly Val Leu Ile Cys Ile Gly Cys
100 105 110
His Asp Phe Arg Lys Ser Asp Ile Asn Leu Gly Leu Leu Leu Tyr Phe
115 120 125
Leu Ile Pro Cys His Leu Phe Ile Ala Tyr Ile Ile Glu Tyr Tyr Ala
130 135 140
Ala Val Gln Ala Arg Ala Glu Arg Asn Val Ser Ala Ser Glu Gln Asn
145 150 155 160
Ala Lys Glu His Gln His Gln Asp Gly Thr Asn Ser Pro Thr Glu Glu
165 170 175
Gln His Arg Lys Phe Gln Ser Thr Trp Lys Leu Val Arg Leu Leu His
180 185 190
Ala Ile Asn Val Thr Thr Ala Leu Val Leu Thr Ser Tyr Val Val Tyr
195 200 205
Tyr His Ile His His Pro Leu Ile Gly Thr Leu Thr Glu Val His Ala
210 215 220
Ile Val Val Trp Leu Lys Thr Ala Ser Tyr Ala Phe Thr Asn Arg Asp
225 230 235 240
Leu Arg His Ala Tyr Leu His Pro Ala Arg Gly Glu Leu Asp Ala Leu
245 250 255
Pro Gly Leu Tyr Ala Glu Cys Pro Tyr Pro Glu Asn Ile Thr Met Gly
260 265 270
Asn Leu Cys Tyr Phe Trp Trp Ala Pro Thr Leu Val Tyr Gln Pro Val
275 280 285
Tyr Pro Arg Thr Ala Lys Ile Arg Trp Ser Phe Val Ala Lys Arg Cys
290 295 300
Gly Glu Val Ile Cys Leu Ser Val Phe Ile Trp Phe Leu Ser Ala Gln
305 310 315 320
Tyr Ala Thr Pro Val Leu Arg Asn Ser Leu Asp Lys Ile Ala Ser Leu
325 330 335
Asp Ile Pro Ser Ile Val Glu Arg Leu Leu Lys Leu Ser Thr Ile Ser
340 345 350
Leu Ile Ile Trp Leu Ala Gly Phe Phe Ala Leu Phe Gln Ser Phe Leu
355 360 365
Asn Ala Leu Ala Glu Val Thr Arg Phe Ala Asp Arg Ser Phe Tyr Asp
370 375 380
Glu Trp Trp Asn Ser Glu Ser Leu Gly Val Tyr Trp Arg Thr Trp Asn
385 390 395 400
Lys Pro Val Tyr Gln Tyr Phe Lys Arg His Val Tyr Ser Pro Met Arg
405 410 415
Ser Arg Gly Trp Ser Asn Ala Thr Ala Ser Leu Ala Val Phe Phe Leu
420 425 430
Ser Ala Val Leu His Glu Leu Leu Val Gly Val Pro Thr His Asn Leu
435 440 445
Ile Gly Val Ala Phe Leu Gly Met Phe Leu Gln Leu Pro Leu Ile Gln
450 455 460
Phe Thr Lys Pro Leu Glu Lys Lys Thr Ser Pro Asn Gly Lys Leu Leu
465 470 475 480
Gly Asn Ile Ile Phe Trp Val Ser Phe Thr Ile Phe Gly Gln Pro Phe
485 490 495
Ala Ala Leu Met Tyr Phe Tyr Ala Trp Gln Ala Lys Tyr Gly Ser Val
500 505 510
Ser Lys Met Thr Thr Ser Gln Gln Leu Val Gln Gln Gly Gln Gly Thr
515 520 525
Cys Pro Pro Leu Val
530
<210> 127
<211> 499
<212> PRT
<213> Gibberella zeae PH-1 [GenBank Accession No. EAA77624]
<220>
<221> misc_feature
<223> DGAT1
<400> 127
Met Asn Ser Ala Thr Thr Thr Ser Thr Glu Thr Ser Asn Gly Ser Thr
1 5 10 15
Ser Val Ser Lys Arg Asn Gly His Asp Val Thr Arg Thr Asn Gly Asn
20 25 30
Gly Thr Thr Thr Thr Ser Pro Pro Lys Lys Ala Gly Gln Lys Tyr Arg
35 40 45
His Val Ala Ala Val His Lys Lys Thr Arg Pro Ser Cys Leu Ser His
50 55 60
Asp Ser Asp Ala Ala Pro Ser Phe Ile Gly Phe Arg Asn Leu Met Val
65 70 75 80
Ile Val Leu Gly Ile Tyr His Ile Gly Met Ser Gln Phe Asp Ser Glu
85 90 95
Gln Pro Ile Asp Thr Ala Ser Tyr Arg Gln Asp Ile Phe Leu Gly Leu
100 105 110
Leu Leu Tyr Phe Leu Ile Pro Cys His Leu Leu Ala Ala Tyr Leu Ile
115 120 125
Glu Leu Ala Ala Ala Gln Gln Ala Arg Gly Ser Leu Lys Arg Tyr Asn
130 135 140
Asp Ser Ala Ser Gly Gly Pro Ser Asp Gln Glu Arg Lys Lys Phe His
145 150 155 160
Lys Thr Trp Val Ile Val Ala Trp Ala His Leu Phe Asn Ile Thr Leu
165 170 175
Ala Leu Val Leu Thr Thr Trp Val Val Tyr Phe Lys Ile His His Pro
180 185 190
Leu Ile Gly Thr Leu Thr Glu Met His Ala Ile Ala Val Trp Leu Lys
195 200 205
Thr Ala Ser Tyr Ala Phe Thr Asn Arg Asp Leu Arg His Ala Tyr Leu
210 215 220
His Pro Val Glu Gly Glu Arg Glu Leu Val Pro Glu Leu Tyr Thr Gln
225 230 235 240
Cys Pro Tyr Pro Gln Asn Ile Thr Phe Ser Asn Leu Ala Tyr Phe Trp
245 250 255
Trp Ala Pro Thr Leu Val Tyr Gln Pro Val Tyr Pro Arg Thr Asp Lys
260 265 270
Ile Arg Trp Gly Phe Val Ala Lys Arg Val Gly Glu Ile Phe Gly Leu
275 280 285
Ser Val Phe Ile Trp Val Ala Ser Ala Gln Tyr Ala Ala Pro Val Leu
290 295 300
Arg Asn Ser Leu Asp Lys Ile Ala Ser Leu Asp Leu Met Ser Ile Leu
305 310 315 320
Glu Arg Leu Leu Lys Leu Ser Thr Ile Ser Leu Ala Ile Trp Leu Ala
325 330 335
Gly Phe Phe Ala Leu Phe Gln Ser Phe Leu Asn Ala Leu Ala Glu Val
340 345 350
Leu Arg Phe Gly Asp Arg Ser Phe Tyr Asp Asp Trp Trp Asn Ser Glu
355 360 365
Ser Leu Gly Ala Tyr Trp Arg Thr Trp Asn Lys Pro Val Tyr Thr Tyr
370 375 380
Phe Lys Arg His Leu Tyr Met Pro Met Ile Gly Arg Gly Trp Ser Pro
385 390 395 400
Gln Ala Ala Ser Phe Phe Val Phe Leu Val Ser Ala Ile Leu His Glu
405 410 415
Ile Leu Val Gly Val Pro Thr His Asn Ile Ile Gly Val Ala Phe Leu
420 425 430
Gly Met Phe Leu Gln Leu Pro Leu Ile His Leu Thr Lys Pro Leu Glu
435 440 445
Asn Met Lys Leu Gly His Thr Gly Lys Ile Val Gly Asn Thr Ile Phe
450 455 460
Trp Val Ser Phe Thr Ile Phe Gly Gln Pro Phe Ala Ala Leu Met Tyr
465 470 475 480
Phe Tyr Ala Trp Gln Ala Lys Tyr Gly Ser Val Thr Asp Ser Gly Phe
485 490 495
Ser Ile Ser
<210> 128
<211> 503
<212> PRT
<213> Magnaporthe grisea 70-15 [GenBank Accession No. EAA52634]
<220>
<221> misc_feature
<223> DGAT1
<400> 128
Met Ala Ala Ala Thr Ala Thr Gly Leu Asp Leu Ala Ala Gln Glu Gly
1 5 10 15
Ala Gln Gln Arg Arg Ser Thr Ala Thr Asn Gln Ser Ala Asp Asp Asp
20 25 30
Val Thr Thr Asn Ala Asp Gly Ala Ala Ala Ala Pro Ser Leu Lys Gly
35 40 45
Thr Thr Ala Asp Thr Asn Gly Thr Ser Asn Gly Asn Gly Asn Gly Asn
50 55 60
Gly Asn Val Asp Glu Asp Glu Gln Thr Lys Ala Leu Arg Lys Ala Phe
65 70 75 80
Thr Arg Lys Tyr Arg His Val Ala Ala Leu His Ser Gln Ala Arg Pro
85 90 95
Ser Thr Leu Ser His Asp Ser Glu Ala Ser Pro Ser Phe Val Gly Phe
100 105 110
Arg Asn Leu Met Val Ile Val Leu Glu Leu Leu Ala Ala Gln Gln Ala
115 120 125
Arg Asn Ser Arg Gly Tyr Phe Asn Arg Gly Arg Thr Gly Ser Ser Arg
130 135 140
Asp Gly Ser Thr Ser Pro Thr Glu Asp Glu Ser Arg Arg Phe Val Ser
145 150 155 160
Thr Trp Lys Leu Ile Ala Leu Val His Gly Ile Asn Val Asn Ser Ala
165 170 175
Leu Leu Ile Thr Thr Tyr Thr Val Tyr Phe His Ile His His Pro Leu
180 185 190
Ile Gly Thr Leu Thr Glu Met His Ala Val Ile Val Trp Leu Lys Thr
195 200 205
Ala Ser Tyr Ala Phe Thr Asn Arg Asp Leu Arg His Ala Tyr Leu His
210 215 220
Pro Val Lys Gly Glu Leu Asp Ala Leu Pro Glu Leu Tyr Lys Gln Cys
225 230 235 240
Pro Tyr Pro Asn Asn Ile Thr Met Lys Asn Leu Cys Tyr Phe Trp Trp
245 250 255
Ala Pro Thr Leu Ile Tyr Gln Pro Val Tyr Pro Arg Ser Gly Arg Ile
260 265 270
Arg Trp Val Phe Phe Phe Lys Arg Val Ala Glu Val Phe Cys Leu Ser
275 280 285
Val Cys Ile Trp Phe Leu Ser Ala Gln Tyr Ala Thr Pro Val Leu Val
290 295 300
Asn Ser Leu Asp Lys Ile Ala Ser Leu Asp Met Pro Ala Ile Leu Glu
305 310 315 320
Arg Leu Leu Lys Leu Ser Thr Ile Ser Leu Ala Ile Trp Leu Ala Gly
325 330 335
Phe Phe Ala Leu Phe Gln Ser Phe Leu Asn Ala Leu Ala Glu Ile Thr
340 345 350
Arg Phe Gly Asp Arg Ser Phe Tyr Glu Ala Trp Trp Asn Ser Glu Ser
355 360 365
Leu Gly Val Tyr Trp Arg Thr Trp Asn Lys Pro Val Tyr Gln Tyr Phe
370 375 380
Lys Arg His Val Tyr Ser Pro Met Leu Gly Arg Gly Trp Ala Pro Arg
385 390 395 400
Thr Ala Ser Ala Ser Val Phe Leu Ile Ser Ala Val Leu His Glu Ile
405 410 415
Leu Val Gly Val Pro Thr His Asn Ile Ile Gly Val Ala Phe Met Gly
420 425 430
Met Phe Leu Gln Val Pro Leu Ile Ile Leu Thr Ala Pro Leu Glu Lys
435 440 445
Arg Lys Ser Pro Thr Gly Lys Leu Ile Gly Asn Ser Ile Phe Trp Val
450 455 460
Ser Phe Thr Ile Phe Gly Gln Pro Leu Ala Ala Leu Met Tyr Phe Tyr
465 470 475 480
Ala Trp Gln Ala Lys Tyr Gly Ser Val Ser Lys Met Gly Tyr Ala Thr
485 490 495
Ser Lys Ala Ala Leu Thr Asn
500
<210> 129
<211> 458
<212> PRT
<213> Aspergillus nidulans FGSC A4 [GenBank Accession No. EAA57945]
<220>
<221> misc_feature
<223> DGAT1
<400> 129
Met Ala Thr Arg Lys Thr Ala Ile Tyr Arg His Ala Val Ala Val His
1 5 10 15
Ser Gln Val Gln His Ser Cys Leu Ser Arg Asp Ser Thr Lys Ala Thr
20 25 30
Ser Phe Ile Gly Phe Arg Asn Leu Met Val Val Val Leu Val Ala Met
35 40 45
Asn Leu Arg Leu Val Ile Glu Asn Phe Leu Lys Tyr Gly Val Leu Ile
50 55 60
Cys Ile Arg Cys His Asp Tyr Arg Lys Gln Asp Val Val Ile Gly Ala
65 70 75 80
Ile Leu Phe Ala Leu Val Pro Cys Gln Leu Leu Cys Ser Tyr Phe Ile
85 90 95
Glu Leu Ala Ala Ser Arg His Ala Gln Arg Val Ile Gly Arg Ala Lys
100 105 110
Lys Gln Asp Lys Asp Arg Ile Leu Asn Glu Ser Lys Arg Thr Trp Phe
115 120 125
Ala Ile Ala Leu Leu His Ser Ile Ile Ser Phe Phe Gly Leu Ala Ala
130 135 140
Thr Ser Tyr Val Ile Phe Tyr Tyr Val Asn His Pro Gly Ile Gly Thr
145 150 155 160
Val Cys Glu Val Gln Val Ile Ile Val Ser Leu Lys Ser Tyr Ser Tyr
165 170 175
Ala Leu Thr Asn Arg Asp Leu Arg Arg Ala Met Leu Gly Ser Pro Ser
180 185 190
Ala Asp Ser Asp Ile Pro Glu Leu Tyr Arg Ser Cys Pro Tyr Pro Arg
195 200 205
Asn Ile Thr Leu Gly Asn Leu Ala Tyr Phe Leu Trp Ala Pro Thr Leu
210 215 220
Val Tyr Gln Pro Val Tyr Pro Arg Thr Pro Arg Ile Arg Trp Ser Phe
225 230 235 240
Val Gly Lys Arg Leu Phe Glu Phe Val Cys Leu Ser Val Val Met Trp
245 250 255
Leu Leu Ser Ala Gln Tyr Ala Ala Pro Leu Leu Arg Asn Ala Thr Gln
260 265 270
Lys Ile Ala Thr Leu Asp Ile Ala Ser Ile Leu Glu Arg Gly Leu Lys
275 280 285
Leu Ser Thr Ile Ser Leu Val Ile Trp Leu Ala Gly Phe Tyr Ala Leu
290 295 300
Phe Gln Ser Leu Leu Asn Gly Leu Ala Glu Ile Met Arg Phe Gly Asp
305 310 315 320
Arg Glu Phe Tyr Thr Asp Trp Trp Asn Ser Pro Ser Phe Gly Val Tyr
325 330 335
Trp Arg Ser Trp Asn Arg Pro Val Tyr Ile Phe Met Lys Arg His Val
340 345 350
Tyr Met Pro Leu Val Thr Arg Gly Trp Asn Pro Thr Leu Ala Gly Thr
355 360 365
Val Val Phe Ala Val Ser Ala Val Leu His Glu Ile Leu Val Gly Val
370 375 380
Pro Thr His Asn Leu Ile Gly Val Ala Ser Ile Ala Met Met Phe Gln
385 390 395 400
Leu Pro Leu Ile Leu Leu Thr Ala Pro Phe Glu Arg Phe Lys Ser Pro
405 410 415
Leu Gly Lys Ala Ile Gly Asn Ser Phe Phe Trp Val Thr Phe Cys Val
420 425 430
Val Gly Gln Pro Leu Gly Ala Leu Leu Tyr Phe Phe Ala Trp Gln Ala
435 440 445
Lys Tyr Gly Ser Val Ser Gln Thr His Pro
450 455
<210> 130
<211> 2119
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> CDS
<222> (291)..(1835)
<223> DGAT2 opening reading frame, comprising 2 smaller internal
opening reading frames
<220>
<221> misc_feature
<222> (291)..(293)
<223> initiation codon ('ATG')
<220>
<221> misc_feature
<222> (456)..(458)
<223> initiation codon ('ATG')
<220>
<221> misc_feature
<222> (768)..(770)
<223> initiation codon ('ATG')
<400> 130
aaacgcaccc actgctcgtc ctccttgctc ctcgaaaccg actcctctac acacgtcaaa 60
tccgaggttg aaatcttccc cacatttggc agccaaacca gcacatccca gcaacctcgc 120
acagcgccga aatcgacctg tcgacttggc cacaaaaaaa agcaccggct ctgcaacagt 180
tctcacgacc aattacgtac aagtacgaaa tcgttcgtgg accgtgactg ataagctccc 240
actttttctt ctaacaacag gcaacagaca agtcacacaa aacaaaagct atg act 296
Met Thr
1
atc gac tca caa tac tac aag tcg cga gac aaa aac gac acg gca ccc 344
Ile Asp Ser Gln Tyr Tyr Lys Ser Arg Asp Lys Asn Asp Thr Ala Pro
5 10 15
aaa atc gcg gga atc cga tat gcc ccg cta tcg aca cca tta ctc aac 392
Lys Ile Ala Gly Ile Arg Tyr Ala Pro Leu Ser Thr Pro Leu Leu Asn
20 25 30
cga tgt gag acc ttc tct ctg gtc tgg cac att ttc agc att ccc act 440
Arg Cys Glu Thr Phe Ser Leu Val Trp His Ile Phe Ser Ile Pro Thr
35 40 45 50
ttc ctc aca att ttc atg cta tgc tgc gca att cca ctg ctc tgg cca 488
Phe Leu Thr Ile Phe Met Leu Cys Cys Ala Ile Pro Leu Leu Trp Pro
55 60 65
ttt gtg att gcg tat gta gtg tac gct gtt aaa gac gac tcc ccg tcc 536
Phe Val Ile Ala Tyr Val Val Tyr Ala Val Lys Asp Asp Ser Pro Ser
70 75 80
aac gga gga gtg gtc aag cga tac tcg cct att tca aga aac ttc ttc 584
Asn Gly Gly Val Val Lys Arg Tyr Ser Pro Ile Ser Arg Asn Phe Phe
85 90 95
atc tgg aag ctc ttt ggc cgc tac ttc ccc ata act ctg cac aag acg 632
Ile Trp Lys Leu Phe Gly Arg Tyr Phe Pro Ile Thr Leu His Lys Thr
100 105 110
gtg gat ctg gag ccc acg cac aca tac tac cct ctg gac gtc cag gag 680
Val Asp Leu Glu Pro Thr His Thr Tyr Tyr Pro Leu Asp Val Gln Glu
115 120 125 130
tat cac ctg att gct gag aga tac tgg ccg cag aac aag tac ctc cga 728
Tyr His Leu Ile Ala Glu Arg Tyr Trp Pro Gln Asn Lys Tyr Leu Arg
135 140 145
gca atc atc tcc acc atc gag tac ttt ctg ccc gcc ttc atg aaa cgg 776
Ala Ile Ile Ser Thr Ile Glu Tyr Phe Leu Pro Ala Phe Met Lys Arg
150 155 160
tct ctt tct atc aac gag cag gag cag cct gcc gag cga gat cct ctc 824
Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg Asp Pro Leu
165 170 175
ctg tct ccc gtt tct ccc agc tct ccg ggt tct caa cct gac aag tgg 872
Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro Asp Lys Trp
180 185 190
att aac cac gac agc aga tat agc cgt gga gaa tca tct ggc tcc aac 920
Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser Gly Ser Asn
195 200 205 210
ggc cac gcc tcg ggc tcc gaa ctt aac ggc aac ggc aac aat ggc acc 968
Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn Asn Gly Thr
215 220 225
act aac cga cga cct ttg tcg tcc gcc tct gct ggc tcc act gca tct 1016
Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser Thr Ala Ser
230 235 240
gat tcc acg ctt ctt aac ggg tcc ctc aac tcc tac gcc aac cag atc 1064
Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala Asn Gln Ile
245 250 255
att ggc gaa aac gac cca cag ctg tcg ccc aca aaa ctc aag ccc act 1112
Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu Lys Pro Thr
260 265 270
ggc aga aaa tac atc ttc ggc tac cac ccc cac ggc att atc ggc atg 1160
Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile Gly Met
275 280 285 290
gga gcc ttt ggt gga att gcc acc gag gga gct gga tgg tcc aag ctc 1208
Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp Ser Lys Leu
295 300 305
ttt ccg ggc atc cct gtt tct ctt atg act ctc acc aac aac ttc cga 1256
Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn Asn Phe Arg
310 315 320
gtg cct ctc tac aga gag tac ctc atg agt ctg gga gtc gct tct gtc 1304
Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val Ala Ser Val
325 330 335
tcc aag aag tcc tgc aag gcc ctc ctc aag cga aac cag tct atc tgc 1352
Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln Ser Ile Cys
340 345 350
att gtc gtt ggt gga gca cag gaa agt ctt ctg gcc aga ccc ggt gtc 1400
Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg Pro Gly Val
355 360 365 370
atg gac ctg gtg cta ctc aag cga aag ggt ttt gtt cga ctt ggt atg 1448
Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg Leu Gly Met
375 380 385
gag gtc gga aat gtc gcc ctt gtt ccc atc atg gcc ttt ggt gag aac 1496
Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe Gly Glu Asn
390 395 400
gac ctc tat gac cag gtt agc aac gac aag tcg tcc aag ctg tac cga 1544
Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys Leu Tyr Arg
405 410 415
ttc cag cag ttt gtc aag aac ttc ctt gga ttc acc ctt cct ttg atg 1592
Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu Pro Leu Met
420 425 430
cat gcc cga ggc gtc ttc aac tac gat gtc ggt ctt gtc ccc tac agg 1640
His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val Pro Tyr Arg
435 440 445 450
cga ccc gtc aac att gtg gtt ggt tcc ccc att gac ttg cct tat ctc 1688
Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu Pro Tyr Leu
455 460 465
cca cac ccc acc gac gaa gaa gtg tcc gaa tac cac gac cga tac atc 1736
Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp Arg Tyr Ile
470 475 480
gcc gag ctg cag cga atc tac aac gag cac aag gat gaa tat ttc atc 1784
Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu Tyr Phe Ile
485 490 495
gat tgg acc gag gag ggc aaa gga gcc cca gag ttc cga atg att gag 1832
Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg Met Ile Glu
500 505 510
taa ggaaaactgc ctgggttagg caaatagcta atgagtattt ttttgatggc 1885
aaccaaatgt agaaagaaaa aaaaaaaaaa agaaaaaaaa aagagaatat tatatctatg 1945
taattctatt aaaagctctg ttgagtgagc ggaataaata ctgttgaaga ggggattgtg 2005
tagagatctg tttactcaat ggcaaactca tctgggggag atccttccac tgtgggaagc 2065
tcctggatag cctttgcatc ggggttcaag aagaccattg tgaacagccc ttga 2119
<210> 131
<211> 514
<212> PRT
<213> Yarrowia lipolytica
<400> 131
Met Thr Ile Asp Ser Gln Tyr Tyr Lys Ser Arg Asp Lys Asn Asp Thr
1 5 10 15
Ala Pro Lys Ile Ala Gly Ile Arg Tyr Ala Pro Leu Ser Thr Pro Leu
20 25 30
Leu Asn Arg Cys Glu Thr Phe Ser Leu Val Trp His Ile Phe Ser Ile
35 40 45
Pro Thr Phe Leu Thr Ile Phe Met Leu Cys Cys Ala Ile Pro Leu Leu
50 55 60
Trp Pro Phe Val Ile Ala Tyr Val Val Tyr Ala Val Lys Asp Asp Ser
65 70 75 80
Pro Ser Asn Gly Gly Val Val Lys Arg Tyr Ser Pro Ile Ser Arg Asn
85 90 95
Phe Phe Ile Trp Lys Leu Phe Gly Arg Tyr Phe Pro Ile Thr Leu His
100 105 110
Lys Thr Val Asp Leu Glu Pro Thr His Thr Tyr Tyr Pro Leu Asp Val
115 120 125
Gln Glu Tyr His Leu Ile Ala Glu Arg Tyr Trp Pro Gln Asn Lys Tyr
130 135 140
Leu Arg Ala Ile Ile Ser Thr Ile Glu Tyr Phe Leu Pro Ala Phe Met
145 150 155 160
Lys Arg Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg Asp
165 170 175
Pro Leu Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro Asp
180 185 190
Lys Trp Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser Gly
195 200 205
Ser Asn Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn Asn
210 215 220
Gly Thr Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser Thr
225 230 235 240
Ala Ser Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala Asn
245 250 255
Gln Ile Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu Lys
260 265 270
Pro Thr Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile
275 280 285
Gly Met Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp Ser
290 295 300
Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn Asn
305 310 315 320
Phe Arg Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val Ala
325 330 335
Ser Val Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln Ser
340 345 350
Ile Cys Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg Pro
355 360 365
Gly Val Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg Leu
370 375 380
Gly Met Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe Gly
385 390 395 400
Glu Asn Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys Leu
405 410 415
Tyr Arg Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu Pro
420 425 430
Leu Met His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val Pro
435 440 445
Tyr Arg Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu Pro
450 455 460
Tyr Leu Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp Arg
465 470 475 480
Tyr Ile Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu Tyr
485 490 495
Phe Ile Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg Met
500 505 510
Ile Glu
<210> 132
<211> 1380
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> DGAT2
<400> 132
atgctatgct gcgcaattcc actgctctgg ccatttgtga ttgcgtatgt agtgtacgct 60
gttaaagacg actccccgtc caacggagga gtggtcaagc gatactcgcc tatttcaaga 120
aacttcttca tctggaagct ctttggccgc tacttcccca taactctgca caagacggtg 180
gatctggagc ccacgcacac atactaccct ctggacgtcc aggagtatca cctgattgct 240
gagagatact ggccgcagaa caagtacctc cgagcaatca tctccaccat cgagtacttt 300
ctgcccgcct tcatgaaacg gtctctttct atcaacgagc aggagcagcc tgccgagcga 360
gatcctctcc tgtctcccgt ttctcccagc tctccgggtt ctcaacctga caagtggatt 420
aaccacgaca gcagatatag ccgtggagaa tcatctggct ccaacggcca cgcctcgggc 480
tccgaactta acggcaacgg caacaatggc accactaacc gacgaccttt gtcgtccgcc 540
tctgctggct ccactgcatc tgattccacg cttcttaacg ggtccctcaa ctcctacgcc 600
aaccagatca ttggcgaaaa cgacccacag ctgtcgccca caaaactcaa gcccactggc 660
agaaaataca tcttcggcta ccacccccac ggcattatcg gcatgggagc ctttggtgga 720
attgccaccg agggagctgg atggtccaag ctctttccgg gcatccctgt ttctcttatg 780
actctcacca acaacttccg agtgcctctc tacagagagt acctcatgag tctgggagtc 840
gcttctgtct ccaagaagtc ctgcaaggcc ctcctcaagc gaaaccagtc tatctgcatt 900
gtcgttggtg gagcacagga aagtcttctg gccagacccg gtgtcatgga cctggtgcta 960
ctcaagcgaa agggttttgt tcgacttggt atggaggtcg gaaatgtcgc ccttgttccc 1020
atcatggcct ttggtgagaa cgacctctat gaccaggtta gcaacgacaa gtcgtccaag 1080
ctgtaccgat tccagcagtt tgtcaagaac ttccttggat tcacccttcc tttgatgcat 1140
gcccgaggcg tcttcaacta cgatgtcggt cttgtcccct acaggcgacc cgtcaacatt 1200
gtggttggtt cccccattga cttgccttat ctcccacacc ccaccgacga agaagtgtcc 1260
gaataccacg accgatacat cgccgagctg cagcgaatct acaacgagca caaggatgaa 1320
tatttcatcg attggaccga ggagggcaaa ggagccccag agttccgaat gattgagtaa 1380
<210> 133
<211> 459
<212> PRT
<213> Yarrowia lipolytica
<400> 133
Met Leu Cys Cys Ala Ile Pro Leu Leu Trp Pro Phe Val Ile Ala Tyr
1 5 10 15
Val Val Tyr Ala Val Lys Asp Asp Ser Pro Ser Asn Gly Gly Val Val
20 25 30
Lys Arg Tyr Ser Pro Ile Ser Arg Asn Phe Phe Ile Trp Lys Leu Phe
35 40 45
Gly Arg Tyr Phe Pro Ile Thr Leu His Lys Thr Val Asp Leu Glu Pro
50 55 60
Thr His Thr Tyr Tyr Pro Leu Asp Val Gln Glu Tyr His Leu Ile Ala
65 70 75 80
Glu Arg Tyr Trp Pro Gln Asn Lys Tyr Leu Arg Ala Ile Ile Ser Thr
85 90 95
Ile Glu Tyr Phe Leu Pro Ala Phe Met Lys Arg Ser Leu Ser Ile Asn
100 105 110
Glu Gln Glu Gln Pro Ala Glu Arg Asp Pro Leu Leu Ser Pro Val Ser
115 120 125
Pro Ser Ser Pro Gly Ser Gln Pro Asp Lys Trp Ile Asn His Asp Ser
130 135 140
Arg Tyr Ser Arg Gly Glu Ser Ser Gly Ser Asn Gly His Ala Ser Gly
145 150 155 160
Ser Glu Leu Asn Gly Asn Gly Asn Asn Gly Thr Thr Asn Arg Arg Pro
165 170 175
Leu Ser Ser Ala Ser Ala Gly Ser Thr Ala Ser Asp Ser Thr Leu Leu
180 185 190
Asn Gly Ser Leu Asn Ser Tyr Ala Asn Gln Ile Ile Gly Glu Asn Asp
195 200 205
Pro Gln Leu Ser Pro Thr Lys Leu Lys Pro Thr Gly Arg Lys Tyr Ile
210 215 220
Phe Gly Tyr His Pro His Gly Ile Ile Gly Met Gly Ala Phe Gly Gly
225 230 235 240
Ile Ala Thr Glu Gly Ala Gly Trp Ser Lys Leu Phe Pro Gly Ile Pro
245 250 255
Val Ser Leu Met Thr Leu Thr Asn Asn Phe Arg Val Pro Leu Tyr Arg
260 265 270
Glu Tyr Leu Met Ser Leu Gly Val Ala Ser Val Ser Lys Lys Ser Cys
275 280 285
Lys Ala Leu Leu Lys Arg Asn Gln Ser Ile Cys Ile Val Val Gly Gly
290 295 300
Ala Gln Glu Ser Leu Leu Ala Arg Pro Gly Val Met Asp Leu Val Leu
305 310 315 320
Leu Lys Arg Lys Gly Phe Val Arg Leu Gly Met Glu Val Gly Asn Val
325 330 335
Ala Leu Val Pro Ile Met Ala Phe Gly Glu Asn Asp Leu Tyr Asp Gln
340 345 350
Val Ser Asn Asp Lys Ser Ser Lys Leu Tyr Arg Phe Gln Gln Phe Val
355 360 365
Lys Asn Phe Leu Gly Phe Thr Leu Pro Leu Met His Ala Arg Gly Val
370 375 380
Phe Asn Tyr Asp Val Gly Leu Val Pro Tyr Arg Arg Pro Val Asn Ile
385 390 395 400
Val Val Gly Ser Pro Ile Asp Leu Pro Tyr Leu Pro His Pro Thr Asp
405 410 415
Glu Glu Val Ser Glu Tyr His Asp Arg Tyr Ile Ala Glu Leu Gln Arg
420 425 430
Ile Tyr Asn Glu His Lys Asp Glu Tyr Phe Ile Asp Trp Thr Glu Glu
435 440 445
Gly Lys Gly Ala Pro Glu Phe Arg Met Ile Glu
450 455
<210> 134
<211> 1068
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> DGAT2
<400> 134
atgaaacggt ctctttctat caacgagcag gagcagcctg ccgagcgaga tcctctcctg 60
tctcccgttt ctcccagctc tccgggttct caacctgaca agtggattaa ccacgacagc 120
agatatagcc gtggagaatc atctggctcc aacggccacg cctcgggctc cgaacttaac 180
ggcaacggca acaatggcac cactaaccga cgacctttgt cgtccgcctc tgctggctcc 240
actgcatctg attccacgct tcttaacggg tccctcaact cctacgccaa ccagatcatt 300
ggcgaaaacg acccacagct gtcgcccaca aaactcaagc ccactggcag aaaatacatc 360
ttcggctacc acccccacgg cattatcggc atgggagcct ttggtggaat tgccaccgag 420
ggagctggat ggtccaagct ctttccgggc atccctgttt ctcttatgac tctcaccaac 480
aacttccgag tgcctctcta cagagagtac ctcatgagtc tgggagtcgc ttctgtctcc 540
aagaagtcct gcaaggccct cctcaagcga aaccagtcta tctgcattgt cgttggtgga 600
gcacaggaaa gtcttctggc cagacccggt gtcatggacc tggtgctact caagcgaaag 660
ggttttgttc gacttggtat ggaggtcgga aatgtcgccc ttgttcccat catggccttt 720
ggtgagaacg acctctatga ccaggttagc aacgacaagt cgtccaagct gtaccgattc 780
cagcagtttg tcaagaactt ccttggattc acccttcctt tgatgcatgc ccgaggcgtc 840
ttcaactacg atgtcggtct tgtcccctac aggcgacccg tcaacattgt ggttggttcc 900
cccattgact tgccttatct cccacacccc accgacgaag aagtgtccga ataccacgac 960
cgatacatcg ccgagctgca gcgaatctac aacgagcaca aggatgaata tttcatcgat 1020
tggaccgagg agggcaaagg agccccagag ttccgaatga ttgagtaa 1068
<210> 135
<211> 355
<212> PRT
<213> Yarrowia lipolytica
<400> 135
Met Lys Arg Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg
1 5 10 15
Asp Pro Leu Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro
20 25 30
Asp Lys Trp Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser
35 40 45
Gly Ser Asn Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn
50 55 60
Asn Gly Thr Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser
65 70 75 80
Thr Ala Ser Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala
85 90 95
Asn Gln Ile Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu
100 105 110
Lys Pro Thr Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile
115 120 125
Ile Gly Met Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp
130 135 140
Ser Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn
145 150 155 160
Asn Phe Arg Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val
165 170 175
Ala Ser Val Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln
180 185 190
Ser Ile Cys Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg
195 200 205
Pro Gly Val Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg
210 215 220
Leu Gly Met Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe
225 230 235 240
Gly Glu Asn Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys
245 250 255
Leu Tyr Arg Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu
260 265 270
Pro Leu Met His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val
275 280 285
Pro Tyr Arg Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu
290 295 300
Pro Tyr Leu Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp
305 310 315 320
Arg Tyr Ile Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu
325 330 335
Tyr Phe Ile Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg
340 345 350
Met Ile Glu
355
<210> 136
<211> 996
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<223> DGAT2
<400> 136
atgccgctct ttgcgccttt acggatgccc gtcaagcgtc gtatgcagac aggagctgtc 60
ctatactgga ttgcggggat gatttactgc attggcatct ttgccttcct ctgcacgttc 120
aagatccttc gacccttgat catcatctat gtcctgtggg cctacatgct cgaccgagca 180
ccagagcggg gtgcacgcac agtccaatgg tattgtaact ggatcggatg gaaacacttt 240
gcacagtact ttcctatgac ccttgtcaag gagggagagc tggacccatc caagaactac 300
atctttgggt atcacccaca cggaatcatt tccttgggtg ccctctgcgc ctttgggacc 360
gagggccttc atttctccaa acgcttcccg ggtatcaagc ctcatctgct caccattcac 420
gccaactttc agatcccact ctatcgcgat atgatcatgg cccacggctg tgcttccgtg 480
tcgagggcct cttgtgaaca catcctgcgg tctggcgaag gatcctcggt cgtgatcgtt 540
gtcgggggtg cacaagaaag tttgtcgact caacctggca cgttaaatct gacactcaag 600
aaaagactgg gattttgcaa gctggccttt gtcaatggcg caagtctggt acctacgttg 660
gcctttggtg agaacgagct ctatgaggtg taccacacca agcccacaag cctgatatac 720
aagctccagc agttgactaa acgcacgatc ggcttcacaa tgcccgtgtt caacggacga 780
ggaatcttca attatgagtt tggactgctg ccaaggagga agcctgtcta tatcgttata 840
ggaaacccca ttcatgtaga caaggtcgag aacccaacga ttgaacagat gcagaaactg 900
cagtcaattt acattgatga ggtgctaaac atttgggaaa gatacaagga caagtatgcc 960
gcaggacgaa ctcaggaact gtgcatcatc gaatag 996
<210> 137
<211> 331
<212> PRT
<213> Mortierella alpina
<400> 137
Met Pro Leu Phe Ala Pro Leu Arg Met Pro Val Lys Arg Arg Met Gln
1 5 10 15
Thr Gly Ala Val Leu Tyr Trp Ile Ala Gly Met Ile Tyr Cys Ile Gly
20 25 30
Ile Phe Ala Phe Leu Cys Thr Phe Lys Ile Leu Arg Pro Leu Ile Ile
35 40 45
Ile Tyr Val Leu Trp Ala Tyr Met Leu Asp Arg Ala Pro Glu Arg Gly
50 55 60
Ala Arg Thr Val Gln Trp Tyr Cys Asn Trp Ile Gly Trp Lys His Phe
65 70 75 80
Ala Gln Tyr Phe Pro Met Thr Leu Val Lys Glu Gly Glu Leu Asp Pro
85 90 95
Ser Lys Asn Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile Ser Leu
100 105 110
Gly Ala Leu Cys Ala Phe Gly Thr Glu Gly Leu His Phe Ser Lys Arg
115 120 125
Phe Pro Gly Ile Lys Pro His Leu Leu Thr Ile His Ala Asn Phe Gln
130 135 140
Ile Pro Leu Tyr Arg Asp Met Ile Met Ala His Gly Cys Ala Ser Val
145 150 155 160
Ser Arg Ala Ser Cys Glu His Ile Leu Arg Ser Gly Glu Gly Ser Ser
165 170 175
Val Val Ile Val Val Gly Gly Ala Gln Glu Ser Leu Ser Thr Gln Pro
180 185 190
Gly Thr Leu Asn Leu Thr Leu Lys Lys Arg Leu Gly Phe Cys Lys Leu
195 200 205
Ala Phe Val Asn Gly Ala Ser Leu Val Pro Thr Leu Ala Phe Gly Glu
210 215 220
Asn Glu Leu Tyr Glu Val Tyr His Thr Lys Pro Thr Ser Leu Ile Tyr
225 230 235 240
Lys Leu Gln Gln Leu Thr Lys Arg Thr Ile Gly Phe Thr Met Pro Val
245 250 255
Phe Asn Gly Arg Gly Ile Phe Asn Tyr Glu Phe Gly Leu Leu Pro Arg
260 265 270
Arg Lys Pro Val Tyr Ile Val Ile Gly Asn Pro Ile His Val Asp Lys
275 280 285
Val Glu Asn Pro Thr Ile Glu Gln Met Gln Lys Leu Gln Ser Ile Tyr
290 295 300
Ile Asp Glu Val Leu Asn Ile Trp Glu Arg Tyr Lys Asp Lys Tyr Ala
305 310 315 320
Ala Gly Arg Thr Gln Glu Leu Cys Ile Ile Glu
325 330
<210> 138
<211> 2151
<212> DNA
<213> Mortierella alpina
<400> 138
atggcccttc agatctacga ctttgtgtcg ttcttcttca ctatcctgct cgacatcttc 60
ttcagggaga ttcgtcccag aggcgcacac aagattccac aaaaaggccc cgtgatcttt 120
gtcgccgctc ctcatgccaa tcagtttgtc gatcctctcg tcttgatgcg agagtgcggc 180
cgcagagtct cattccttgc agccaaaaag tccatggacc gccggtggat tggtgcaatg 240
gcacgctcga tgaatgcgat tcctgttgag cgcccccagg accttgctaa agccggctcg 300
ggaatcatca aacttctgga tcgttatggc gaccctcttc gggtcaccgg tgtcggcact 360
aaattcacaa aggagctgct tgtgggcgac cagatctccc ttccaaagga cgtcggtgtc 420
ycagctgtgg gcgagatcat atctgatacc gagctgattg tcaagaagga attcaaagag 480
ctcaaggccc ttgagttgct gaccagtgct gaaggaacca agtacaaatg cctaccccat 540
atggaccaga cgaacgtcta caaaactgtc tttgagcgcc ttaacgcagg acattgcgtt 600
ggcattttcc ccgagggagg ctcccacgat cgtgctgaaa tgctgccatt gaaagctgga 660
gtcaccatca tggccctggg cgcattagcc gccaaccctt ccttggatct caagattgtc 720
acctgcggcc tcaactactt tcacccgcat cgcttccgct cgcgtgcagt agtcgagttt 780
ggcgagccat tgacggtttc gcctgagctg gtcgaaatgt acaagcgagg cggggcggaa 840
aagcgagagg cttgcggaaa actgctcgac acgatctatg aagctctccg cggtgtcact 900
ctcaacgcgc ctgattacga gacattgatg gtcattcaag cggcccgtcg cctttacaag 960
cctactcatc gcaagctgca gatctcgcag gtcgttgagt tgaaccgtag gttcgtcgca 1020
ggatacatgc acttcaagga caatccaaaa gtcattgaag ccaaggataa agtcatgcat 1080
tacaacactc agctgcggta ccatggattg cgggatcacc aagtgaatat tcgcaccacc 1140
aggaagcacg ctatcggcat gctcatctct cggctgatcc agatgatctt tttgagttgt 1200
ctggcgctac ctggaactct gatgaatctt ccggtcgcca ttgtcgctcg tgtcatcagc 1260
aacaaaaagg ccaaagaggc gctggctgcc tcgacagtca aaattgctgg aagggacgtc 1320
ttggctacgt ggaagttgct ggtcgctcta ggattgatgc ctgttctgta cttcacgtac 1380
tccgtcatgg tcttcatcta ttgcagccgc ttcgacctat cgttcaagtc gcgtcttttg 1440
gttgcttggg cagcatgggc gcttattcct tttgtaacct acgcaagcat ccgctttggt 1500
gaagttggta tcgatatctt caagtctatt cgcccattgt tcctgtccat catcccgggc 1560
gaggagagca cgatcaacga cctgcgcaag gcgcgcgcag aacttcaaaa gaccatcacc 1620
aatctcatca atgagctagc gccgcagata tatcccgact ttgattcaaa gcgcatcctc 1680
gatccatccc ctgcagatcg tcccagccgc tcagcatcag gcaccaacct tgcacagacg 1740
attttcaaca cggctgctca gcccttgaac caatggctag gcaaggatgg ccgctttgaa 1800
tgggagcgta ccgaggactc tgatgcagat gacgtgttct tctttttgga cccagcgaga 1860
ggaattatgg ggcggtctag ggcgtcgtct tggggaggtg gagcatttac gcctgctgtt 1920
gatgggtcgc gatcccggaa tcggagcagg acaagcagct tcacgtcggg ccagatccag 1980
ctgggcgagg gcttcaaact cgaggcactg acggagctgc cgcgggacaa cccttttgca 2040
gaagtgacca ggcggttgag tgtgagccga atgcagagat atgggctgga gggtatgacg 2100
cgctcggata cggatgaaaa cgaaggcccc gccaagtcaa aagacattta g 2151
<210> 139
<211> 716
<212> PRT
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (141)..(141)
<223> Xaa can be any naturally occurring amino acid
<400> 139
Met Ala Leu Gln Ile Tyr Asp Phe Val Ser Phe Phe Phe Thr Ile Leu
1 5 10 15
Leu Asp Ile Phe Phe Arg Glu Ile Arg Pro Arg Gly Ala His Lys Ile
20 25 30
Pro Gln Lys Gly Pro Val Ile Phe Val Ala Ala Pro His Ala Asn Gln
35 40 45
Phe Val Asp Pro Leu Val Leu Met Arg Glu Cys Gly Arg Arg Val Ser
50 55 60
Phe Leu Ala Ala Lys Lys Ser Met Asp Arg Arg Trp Ile Gly Ala Met
65 70 75 80
Ala Arg Ser Met Asn Ala Ile Pro Val Glu Arg Pro Gln Asp Leu Ala
85 90 95
Lys Ala Gly Ser Gly Ile Ile Lys Leu Leu Asp Arg Tyr Gly Asp Pro
100 105 110
Leu Arg Val Thr Gly Val Gly Thr Lys Phe Thr Lys Glu Leu Leu Val
115 120 125
Gly Asp Gln Ile Ser Leu Pro Lys Asp Val Gly Val Xaa Ala Val Gly
130 135 140
Glu Ile Ile Ser Asp Thr Glu Leu Ile Val Lys Lys Glu Phe Lys Glu
145 150 155 160
Leu Lys Ala Leu Glu Leu Leu Thr Ser Ala Glu Gly Thr Lys Tyr Lys
165 170 175
Cys Leu Pro His Met Asp Gln Thr Asn Val Tyr Lys Thr Val Phe Glu
180 185 190
Arg Leu Asn Ala Gly His Cys Val Gly Ile Phe Pro Glu Gly Gly Ser
195 200 205
His Asp Arg Ala Glu Met Leu Pro Leu Lys Ala Gly Val Thr Ile Met
210 215 220
Ala Leu Gly Ala Leu Ala Ala Asn Pro Ser Leu Asp Leu Lys Ile Val
225 230 235 240
Thr Cys Gly Leu Asn Tyr Phe His Pro His Arg Phe Arg Ser Arg Ala
245 250 255
Val Val Glu Phe Gly Glu Pro Leu Thr Val Ser Pro Glu Leu Val Glu
260 265 270
Met Tyr Lys Arg Gly Gly Ala Glu Lys Arg Glu Ala Cys Gly Lys Leu
275 280 285
Leu Asp Thr Ile Tyr Glu Ala Leu Arg Gly Val Thr Leu Asn Ala Pro
290 295 300
Asp Tyr Glu Thr Leu Met Val Ile Gln Ala Ala Arg Arg Leu Tyr Lys
305 310 315 320
Pro Thr His Arg Lys Leu Gln Ile Ser Gln Val Val Glu Leu Asn Arg
325 330 335
Arg Phe Val Ala Gly Tyr Met His Phe Lys Asp Asn Pro Lys Val Ile
340 345 350
Glu Ala Lys Asp Lys Val Met His Tyr Asn Thr Gln Leu Arg Tyr His
355 360 365
Gly Leu Arg Asp His Gln Val Asn Ile Arg Thr Thr Arg Lys His Ala
370 375 380
Ile Gly Met Leu Ile Ser Arg Leu Ile Gln Met Ile Phe Leu Ser Cys
385 390 395 400
Leu Ala Leu Pro Gly Thr Leu Met Asn Leu Pro Val Ala Ile Val Ala
405 410 415
Arg Val Ile Ser Asn Lys Lys Ala Lys Glu Ala Leu Ala Ala Ser Thr
420 425 430
Val Lys Ile Ala Gly Arg Asp Val Leu Ala Thr Trp Lys Leu Leu Val
435 440 445
Ala Leu Gly Leu Met Pro Val Leu Tyr Phe Thr Tyr Ser Val Met Val
450 455 460
Phe Ile Tyr Cys Ser Arg Phe Asp Leu Ser Phe Lys Ser Arg Leu Leu
465 470 475 480
Val Ala Trp Ala Ala Trp Ala Leu Ile Pro Phe Val Thr Tyr Ala Ser
485 490 495
Ile Arg Phe Gly Glu Val Gly Ile Asp Ile Phe Lys Ser Ile Arg Pro
500 505 510
Leu Phe Leu Ser Ile Ile Pro Gly Glu Glu Ser Thr Ile Asn Asp Leu
515 520 525
Arg Lys Ala Arg Ala Glu Leu Gln Lys Thr Ile Thr Asn Leu Ile Asn
530 535 540
Glu Leu Ala Pro Gln Ile Tyr Pro Asp Phe Asp Ser Lys Arg Ile Leu
545 550 555 560
Asp Pro Ser Pro Ala Asp Arg Pro Ser Arg Ser Ala Ser Gly Thr Asn
565 570 575
Leu Ala Gln Thr Ile Phe Asn Thr Ala Ala Gln Pro Leu Asn Gln Trp
580 585 590
Leu Gly Lys Asp Gly Arg Phe Glu Trp Glu Arg Thr Glu Asp Ser Asp
595 600 605
Ala Gly Asp Val Phe Phe Phe Leu Asp Pro Ala Arg Gly Ile Met Gly
610 615 620
Arg Ser Arg Ala Ser Ser Trp Gly Gly Gly Ala Phe Thr Pro Ala Val
625 630 635 640
Asp Gly Ser Arg Ser Arg Asn Arg Ser Arg Thr Ser Ser Phe Thr Ser
645 650 655
Gly Gln Ile Gln Leu Gly Glu Gly Phe Lys Leu Glu Ala Leu Thr Glu
660 665 670
Leu Pro Arg Asp Asn Pro Phe Ala Glu Val Thr Arg Arg Leu Ser Val
675 680 685
Ser Arg Met Gln Arg Tyr Gly Leu Glu Gly Met Thr Arg Ser Asp Thr
690 695 700
Asp Glu Asn Glu Gly Pro Ala Lys Ser Lys Asp Ile
705 710 715
<210> 140
<211> 1212
<212> DNA
<213> Mortierella alpina
<400> 140
ccgcatgcca atcagtttgt cgatcctctc gtcttgatgc gagagtgcgg ccgcagagtc 60
tcattccttg cagccaaaaa gtccatggac cgccggtgga ttggtgcaat ggcacgctcg 120
atgaatgcga ttcctgttga gcgtccccag gaccttgcta aagccggctc gggaatcatc 180
aaacttctgg atcgttatgg cgaccctctt cgggtcaccg gtgtcggcac taaattcaca 240
aaggagctgc ttgtgggcga ccagatctcc cttccaaagg acgtcggtgt cycagctgtg 300
ggcgagatca tatctgatac cgagctgatt gtcaagaagg aattcaaaga gctcaaggcc 360
cttgagttgc tgaccagtgc tgaaggaacc aagtacaaat gcctacccca tatggaccag 420
acgaacgtct acaaaactgt ctttgagcgc cttaacgcag gacattgcgt tggcattttc 480
cccgagggag gctcccacga tcgtgctgaa atgctgccat tgaaagctgg agtcaccatc 540
atggccctgg gcgcattagc cgccaaccct tccttggatc tcaagattgt cacctgcggc 600
ctcaactact ttcacccgca tcgcttccgc tcgcgtgcag tagtcgagtt tggcgagcca 660
ttgacggttt cgcctgagct ggtcgaaatg tacaagcgag gcggggcgga aaagcgagag 720
gcttgcggaa aactgctcga cacgatctat gaagctctcc gcggtgtcac tctcaacgcg 780
cctgattacg agacattgat ggtcattcaa gcggcccgtc gcctttacaa gcctactcat 840
cgcaagctgc agatctcgca ggtcgttgag ttgaaccgta ggttcgtcgc aggatacatg 900
cacttcaagg acaatccaaa agtcattgaa gccaaggata aagtcatgca ttacaacact 960
cagctgcggt accatggatt gcgggatcac caagtgaata ttcgcaccac caggaagcac 1020
gctatcggca tgctcatctc tcggctgatc cagatgatct ttttgagttg tctggcgcta 1080
cctggaacyc tgatgaatct tccggtcgcc attgtcgctc gtgtcatcag caacaaaaag 1140
gccaaagagg cgctggctgc ctcgacagtc aaaattgctg gaagggacga catggcyaca 1200
tggaaaaggg cg 1212
<210> 141
<211> 3935
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (1051)..(1053)
<223> ATG translation initiation codon
<220>
<221> Intron
<222> (1195)..(1469)
<220>
<221> misc_feature
<222> (1379)..(1379)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1381)..(1381)
<223> n is a, c, g, or t
<220>
<221> Intron
<222> (1585)..(1839)
<220>
<221> Intron
<222> (2795)..(2877)
<220>
<221> Intron
<222> (2940)..(3038)
<220>
<221> misc_feature
<222> (3911)..(3913)
<223> TAG stop codon
<400> 141
actatagggc acgcgtggtc gacggcccgg gctggtcctt gaccctcgtt ctatgaatat 60
gcattacgac aaaagaaaat gaaaaaaaaa gagcacgcga gcaggagcgc ggttgtcaat 120
tttcaagcct acctcactcc tgtcatgtcg cgccattttc tttctttttc tcgtctcacg 180
atctctttga tcgaccagag tcgaatagaa tatgaacatg atcaacctaa ttgcgcgaga 240
gtgagccatt attgactatc agaccgggga gcatgcagcc tgatgcagca aaaatttgag 300
ctgtgcacaa tatttgtcat acataaaagt cggcccacat gtccaacagg gcggggtggc 360
ctgaacaccc aacgtgagaa tatggacctg actgctcaca ccatcgatac cgaggattgc 420
cgcatgcact cagctgccgt agacacgcac catataccat gtgataacgg atctggctgt 480
ggtgtaccca ggggcgatat acgcgcgcgt ccctgcggac ttgacgtgtt aacgactctg 540
tatgtggctc tgatgatgca tcgggtgcat tgaggctacg gccgaggcgg caatcgagac 600
gatgccattc tctcttttgg acggagaaag agaaggagga aggaaagcga ggccgaggga 660
cggaggaacg aggaagagag agcgagaggw agcgagagcg aaggcgacgg gctgtccaat 720
ggagcgcgta gagggtgatt tgggttcgct ctgccatact ttattcgcct gcatattcac 780
cacccgctgc atctttgcag tgtttgccct cttccttttc cttttccttt tcttttttct 840
tttttcgtct ttctgcccct catccgcatc tcccctgtcg cccattacct gctcgctttc 900
cacccctgtt tgcacaccta ccccagccca atcctgtcct agcgcactct ctctgcccgt 960
ccgcacgttt cttctatggc cctctaggcg cctttttgct gcccattctc tattgtccac 1020
ttacccacgc aggcacggcc gagtccagtc atggcccttc agatctacga ctttgtgtcg 1080
ttcttcttca ctatcctgct cgacatcttc ttcagggaga ttcgtcccag aggcgcacac 1140
aagattccac aaaaaggccc cgtgatcttt gtcgccgctc ctcatgccaa tcaggtacgt 1200
gcacgcaggc gttgttttct cggaccctac ctcgtcaaat agctgtacac gctggaatga 1260
gagcgcataa tcgcctggac acgggtgcag agttcatgca cgataagccg aacagcggga 1320
gccgacactc caaaagacct caggactagg ggaaaaaaaa aaaaaaaaaa aaaaaaaana 1380
nctggactcg attagcccta ttcccaaggg tgggggttcg tcattggttg tcgcaaacat 1440
cccaacttac agcactcttg tcctcatagt ttgtcgatcc tctcgtcttg atgcgagagt 1500
gcggccgcag agtctcattc cttgcagcca aaaagtccat ggaccgccgg tggattggtg 1560
caatggcacg ctcgatgaat gcgagtaagt tgctaggatt cccaccctcc cggctttatt 1620
ttgcagctct ctcatacacg tacacacaca cacacaaaga agattctcga tggtcactgg 1680
atgctttggt ggtgctgtcg aaagggctgc agactcttgc tgtgtggtga tagagtgccg 1740
gctttgatcc cccatcgacc gtttgggtcc ctcaccaaga catcagccct gagagcagat 1800
taattgatct gatactgttg aatcgttttc tacccatagt tcctgttgag cgcccccagg 1860
accttgctaa agccggctcg ggaatcatca aacttctgga tcgttatggc gaccctcttc 1920
gggtcaccgg tgtcggcact aaattcacaa aggagctgct tgtgggcgac cagatctccc 1980
ttccaaagga cgtcggtgtc ycagctgtgg gcgagatcat atctgatacc gagctgattg 2040
tcaagaagga attcaaagag ctcaaggccc ttgagttgct gaccagtgct gaaggaacca 2100
agtacaaatg cctaccccat atggaccaga cgaacgtcta caaaactgtc tttgagcgcc 2160
ttaacgcagg acattgcgtt ggcattttcc ccgagggagg ctcccacgat cgtgctgaaa 2220
tgctgccatt gaaagctgga gtcaccatca tggccctggg cgcattagcc gccaaccctt 2280
ccttggatct caagattgtc acctgcggcc tcaactactt tcacccgcat cgcttccgct 2340
cgcgtgcagt agtcgagttt ggcgagccat tgacggtttc gcctgagctg gtcgaaatgt 2400
acaagcgagg cggggcggaa aagcgagagg cttgcggaaa actgctcgac acgatctatg 2460
aagctctccg cggtgtcact ctcaacgcgc ctgattacga gacattgatg gtcattcaag 2520
cggcccgtcg cctttacaag cctactcatc gcaagctgca gatctcgcag gtcgttgagt 2580
tgaaccgtag gttcgtcgca ggatacatgc acttcaagga caatccaaaa gtcattgaag 2640
ccaaggataa agtcatgcat tacaacactc agctgcggta ccatggattg cgggatcacc 2700
aagtgaatat tcgcaccacc aggaagcacg ctatcggcat gctcatctct cggctgatcc 2760
agatgatctt tttgagttgt ctggcgctac ctgggtaaga gcatttttct atatcgacaa 2820
gggtctctag tgagttggct acggaatggt cactaacgca tgcttttgcc aatacagaac 2880
tctgatgaat cttccggtcg ccattgtcgc tcgtgtcatc agcaacaaaa aggccaaagg 2940
tatacttttt tttttttttt tttttttttt tcgcctttgt gttttgtgct cgacctgtga 3000
aaactaattt atttcttcct tcgttctgcc accggtagag gcgctggctg cctcgacagt 3060
caaaattgct ggaagggacg tcttggctac gtggaagttg ctggtcgctc taggattgat 3120
gcctgttctg tacttcacgt actccgtcat ggtcttcatc tattgcagcc gcttcgacct 3180
atcgttcaag tcgcgtcttt tggttgcttg ggcagcatgg gcgcttattc cttttgtaac 3240
ctacgcaagc atccgctttg gtgaagttgg tatcgatatc ttcaagtcta ttcgcccatt 3300
gttcctgtcc atcatcccgg gcgaggagag cacgatcaac gacctgcgca aggcgcgcgc 3360
agaacttcaa aagaccatca ccaatctcat caatgagcta gcgccgcaga tatatcccga 3420
ctttgattca aagcgcatcc tcgatccatc ccctgcagat cgtcccagcc gctcagcatc 3480
aggcaccaac cttgcacaga cgattttcaa cacggctgct cagcccttga accaatggct 3540
aggcaaggat ggccgctttg aatgggagcg taccgaggac tctgatgcag atgacgtgtt 3600
cttctttttg gacccagcga gaggaattat ggggcggtct agggcgtcgt cttggggagg 3660
tggagcattt acgcctgctg ttgatgggtc gcgatcccgg aatcggagca ggacaagcag 3720
cttcacgtcg ggccagatcc agctgggcga gggcttcaaa ctcgaggcac tgacggagct 3780
gccgcgggac aacccttttg cagaagtgac caggcggttg agtgtgagcc gaatgcagag 3840
atatgggctg gagggtatga cgcgctcgga tacggatgaa aacgaaggcc ccgccaagtc 3900
aaaagacatt taggaataaa cgcccgtatt tcccc 3935
<210> 142
<211> 965
<212> DNA
<213> Mortierella alpina
<400> 142
cattgtcgct cgtgtcatca gcaacaaaaa ggccaaagag gcgctggctg cctcgacagt 60
caaaattgct ggaagggacg tcttggctac gtggaagttg ctggtcgctc taggattgat 120
gcctgttctg tacttcacgt actccgtcat ggtcttcatc tattgcagcc gcttcgacct 180
atcgttcaag tcgcgtcttt tggttgcttg ggcagcatgg gcgcttattc cttttgtaac 240
ctacgcaagc atccgctttg gtgaagttgg tatcgatatc ttcaagtcta ttcgcccatt 300
gttcctgtcc atcatcccgg gcgaggagag cacgattaac gacctgcgca aggcgcgcgc 360
agaacttcaa aagaccatca ccaatctcat caatgagcta gcgccgcaga tatatcccga 420
ctttgattca aagcgcatcc tcgatccatc ccctgcagat cgtcccagcc gctcagcatc 480
aggcaccaac cttgcacaga cgattttcaa cacggctgct cagcccttga accaatggct 540
aggcaaggat ggccgctttg aatgggagcg taccgaggac tctgatgcag gtgacgtgtt 600
cttctttttg gacccagcga gaggaattat ggggcggtct agggcgtcgt cttggggagg 660
tggagcattt acccctgctg ttgatgggtc gcgatcccgg aatcggagca ggacaagcag 720
cttcacgtcg ggccagatcc agctgggcga gggcttcaaa ctcgaggcac tgacggagct 780
gccgcgggac aacccttttg cagaagtgac caggcggttg agtgtgagcc gaatgcagag 840
atatgggctg gagggtatga cgcgctcgga tacggatgaa aacgaaggcc ccgccaagtc 900
aaaagacatt taggaataaa cgcccgtatt tccccaaaaa aaaaaaaaaa aaaaaaaaaa 960
aaaaa 965
<210> 143
<211> 1908
<212> DNA
<213> Mortierella alpina
<220>
<221> misc_feature
<222> (1051)..(1053)
<223> ATG translation initiation codon
<220>
<221> Intron
<222> (1195)..(1469)
<220>
<221> misc_feature
<222> (1379)..(1379)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1381)..(1381)
<223> n is a, c, g, or t
<220>
<221> Intron
<222> (1585)..(1839)
<400> 143
actatagggc acgcgtggtc gacggcccgg gctggtcctt gaccctcgtt ctatgaatat 60
gcattacgac aaaagaaaat gaaaaaaaaa gagcacgcga gcaggagcgc ggttgtcaat 120
tttcaagcct acctcactcc tgtcatgtcg cgccattttc tttctttttc tcgtctcacg 180
atctctttga tcgaccagag tcgaatagaa tatgaacatg atcaacctaa ttgcgcgaga 240
gtgagccatt attgactatc agaccgggga gcatgcagcc tgatgcagca aaaatttgag 300
ctgtgcacaa tatttgtcat acataaaagt cggcccacat gtccaacagg gcggggtggc 360
ctgaacaccc aacgtgagaa tatggacctg actgctcaca ccatcgatac cgaggattgc 420
cgcatgcact cagctgccgt agacacgcac catataccat gtgataacgg atctggctgt 480
ggtgtaccca ggggcgatat acgcgcgcgt ccctgcggac ttgacgtgtt aacgactctg 540
tatgtggctc tgatgatgca tcgggtgcat tgaggctacg gccgaggcgg caatcgagac 600
gatgccattc tctcttttgg acggagaaag agaaggagga aggaaagcga ggccgaggga 660
cggaggaacg aggaagagag agcgagaggw agcgagagcg aaggcgacgg gctgtccaat 720
ggagcgcgta gagggtgatt tgggttcgct ctgccatact ttattcgcct gcatattcac 780
cacccgctgc atctttgcag tgtttgccct cttccttttc cttttccttt tcttttttct 840
tttttcgtct ttctgcccct catccgcatc tcccctgtcg cccattacct gctcgctttc 900
cacccctgtt tgcacaccta ccccagccca atcctgtcct agcgcactct ctctgcccgt 960
ccgcacgttt cttctatggc cctctaggcg cctttttgct gcccattctc tattgtccac 1020
ttacccacgc aggcacggcc gagtccagtc atggcccttc agatctacga ctttgtgtcg 1080
ttcttcttca ctatcctgct cgacatcttc ttcagggaga ttcgtcccag aggcgcacac 1140
aagattccac aaaaaggccc cgtgatcttt gtcgccgctc ctcatgccaa tcaggtacgt 1200
gcacgcaggc gttgttttct cggaccctac ctcgtcaaat agctgtacac gctggaatga 1260
gagcgcataa tcgcctggac acgggtgcag agttcatgca cgataagccg aacagcggga 1320
gccgacactc caaaagacct caggactagg ggaaaaaaaa aaaaaaaaaa aaaaaaaana 1380
nctggactcg attagcccta ttcccaaggg tgggggttcg tcattggttg tcgcaaacat 1440
cccaacttac agcactcttg tcctcatagt ttgtcgatcc tctcgtcttg atgcgagagt 1500
gcggccgcag agtctcattc cttgcagcca aaaagtccat ggaccgccgg tggattggtg 1560
caatggcacg ctcgatgaat gcgagtaagt tgctaggatt cccaccctcc cggctttatt 1620
ttgcagctct ctcatacacg tacacacaca cacacaaaga agattctcga tggtcactgg 1680
atgctttggt ggtgctgtcg aaagggctgc agactcttgc tgtgtggtga tagagtgccg 1740
gctttgatcc cccatcgacc gtttgggtcc ctcaccaaga catcagccct gagagcagat 1800
taattgatct gatactgttg aatcgttttc tacccatagt tcctgttgag cgcccccagg 1860
accttgctaa agccggctcg ggaatcatca aacttctgga tcgttatg 1908
<210> 144
<211> 966
<212> DNA
<213> Mortierella alpina
<220>
<221> Intron
<222> (19)..(101)
<220>
<221> Intron
<222> (164)..(262)
<400> 144
ttgtctggcg ctacctgggt aagagcattt ttctatatcg acaagggtct ctagtgagtt 60
ggctacggaa tggtcactaa cgcatgcttt tgccaataca gaactctgat gaatcttccg 120
gtcgccattg tcgctcgtgt catcagcaac aaaaaggcca aaggtatact tttttttttt 180
tttttttttt tttttcgcct ttgtgttttg tgctcgacct gtgaaaacta atttatttct 240
tccttcgttc tgccaccggt agaggcgctg gctgcctcga cagtcaaaat tgctggaagg 300
gacgtcttgg ctacgtggaa gttgctggtc gctctaggat tgatgcctgt tctgtacttc 360
acgtactccg tcatggtctt catctattgc agccgcttcg acctatcgtt caagtcgcgt 420
cttttggttg cttgggcagc atgggcgctt attccttttg taacctacgc aagcatccgc 480
tttggtgaag ttggtatcga tatcttcaag tctattcgcc cattgttcct gtccatcatc 540
ccgggcgagg agagcacgat caacgacctg cgcaaggcgc gcgcagaact tcaaaagacc 600
atcaccaatc tcatcaatga gctagcgccg cagatatatc ccgactttga ttcaaagcgc 660
atcctcgatc catcccctgc agatcgtccc agccgctcag catcaggcac caaccttgca 720
cagacgattt tcaacacggc tgctcagccc ttgaaccaat ggctaggcaa ggatggccgc 780
tttgaatggg agcgtaccga ggactctgat gcagatgacg tgttcttctt tttggaccca 840
gcgagaggaa ttatggggcg gtctagggcg tcgtcttggg gaggtggagc atttacgcct 900
gctgttgatg ggtcgcgatc ccggaatcgg agcaggacaa gcagcttcac gtcgggccag 960
atccag 966
<210> 145
<211> 275
<212> DNA
<213> Mortierella alpina
<220>
<221> Intron
<222> (1)..(275)
<220>
<221> Intron
<222> (1)..(275)
<220>
<221> misc_feature
<222> (185)..(185)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (187)..(187)
<223> n is a, c, g, or t
<400> 145
gtacgtgcac gcaggcgttg ttttctcgga ccctacctcg tcaaatagct gtacacgctg 60
gaatgagagc gcataatcgc ctggacacgg gtgcagagtt catgcacgat aagccgaaca 120
gcgggagccg acactccaaa agacctcagg actaggggaa aaaaaaaaaa aaaaaaaaaa 180
aaaananctg gactcgatta gccctattcc caagggtggg ggttcgtcat tggttgtcgc 240
aaacatccca acttacagca ctcttgtcct catag 275
<210> 146
<211> 255
<212> DNA
<213> Mortierella alpina
<220>
<221> Intron
<222> (1)..(255)
<220>
<221> Intron
<222> (1)..(255)
<400> 146
gtaagttgct aggattccca ccctcccggc tttattttgc agctctctca tacacgtaca 60
cacacacaca caaagaagat tctcgatggt cactggatgc tttggtggtg ctgtcgaaag 120
ggctgcagac tcttgctgtg tggtgataga gtgccggctt tgatccccca tcgaccgttt 180
gggtccctca ccaagacatc agccctgaga gcagattaat tgatctgata ctgttgaatc 240
gttttctacc catag 255
<210> 147
<211> 83
<212> DNA
<213> Mortierella alpina
<220>
<221> Intron
<222> (1)..(83)
<220>
<221> Intron
<222> (1)..(83)
<400> 147
gtaagagcat ttttctatat cgacaagggt ctctagtgag ttggctacgg aatggtcact 60
aacgcatgct tttgccaata cag 83
<210> 148
<211> 99
<212> DNA
<213> Mortierella alpina
<220>
<221> Intron
<222> (1)..(99)
<220>
<221> Intron
<222> (1)..(99)
<400> 148
gtatactttt tttttttttt tttttttttt ttcgcctttg tgttttgtgc tcgacctgtg 60
aaaactaatt tatttcttcc ttcgttctgc caccggtag 99
<210> 149
<211> 2133
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> CPT1
<400> 149
attctgttgc tcttgttgcc agctttcgtc tggtatattt ggatctcgat cttcatgtgt 60
gatgactcag ctggcaggag gtgaacaatt ttggagcggc caaatgcgcc acactgaatg 120
ccgcaagaat cggatgagaa ccgtagacat actggcatgt caattgaaac tgtgggtgtc 180
tactcgtgta ctcttctgat atataattat cgattttctt cttccagact ggaaatagct 240
cagattccca actgtccctc cacctacctc cctggttgtc tcacaaggct gaaacttgaa 300
ctgggccatc tttatcaagt ataaaaccca ttgtcacctt ctctgtcccc acagaccttc 360
caacggcttc tttttggccc cgcaagttca tcctgaagcc ccccacccac ctatcacgag 420
aataagcttt ctggcaacaa cccaaataaa tttatttggc aagcgaaaaa agtaaaatca 480
aacttgacca ttcaaccatc atgggcgtat tcattaaaca ggagcagctt ccggctctca 540
agaagtacaa gtgagtatgg atgtggcgaa gttggaagaa cggtcacgtg agctcgacga 600
gtggtgttga cgttcacttt gacagtcctg aggtggagat aatgacgtac taccaatagt 660
gtaggggatg aggacgtgtt ggggttgtgg cagcagatac atggtcataa tatatggctg 720
tctgttatct aagacaagtg ccggatcgat cgcgtggatg tatatcctaa tctacgccag 780
tggttcatgc taacccaggt actccgccga ggatcactcg ttcatctcca acaacattct 840
gcgccccttc tggcgacagt ttgtcaaaat cttccctctg tggatggccc ccaacatggt 900
gactctgttg ggcttcttct ttgtcattgt gaacttcatc accatgctca ttgttgatcc 960
cacccacgac cgcgagcctc ccagatgggt ctacctcacc tacgctctgg gtctgttcct 1020
ttaccagaca tttgatgcct gtgacggatc ccatgcccga cgaactggcc agagtggacc 1080
ccttggagag ctgtttgacc actgtgtcga cgccatgaat acctctctga ttctcacggt 1140
ggtggtgtcc accacccata tgggatataa catgaagctg ctgattgtgc agattgccgc 1200
tctcggaaac ttctacctgt cgacctggga gacctaccat accggaactc tgtacctttc 1260
tggcttctct ggtcctgttg aaggtatctt gattctggtg gctcttttcg tcctcacctt 1320
cttcactggt cccaacgtgt acgctctgac cgtctacgag gctcttcccg aatccatcac 1380
ttcgctgctg cctgccagct tcctggacgt caccatcacc cagatctaca ttggattcgg 1440
agtgctgggc atggtgttca acatctacgg cgcctgcgga aacgtgatca agtactacaa 1500
caacaagggc aagagcgctc tccccgccat tctcggaatc gccccctttg gcatcttcta 1560
cgtcggcgtc tttgcctggg cccatgttgc tcctctgctt ctctccaagt acgccatcgt 1620
ctatctgttt gccattgggg ctgcctttgc catgcaagtc ggccagatga ttcttgccca 1680
tctcgtgctt gctcccttcc cccactggaa cgtgctgctc ttcttcccct ttgtgggact 1740
ggcagtgcac tacattgcac ccgtgtttgg ctgggacgcc gatatcgtgt cggttaacac 1800
tctcttcacc tgttttggcg ccaccctctc catttacgcc ttctttgtgc ttgagatcat 1860
cgacgagatc accaactacc tcgatatctg gtgtctgcga atcaagtacc ctcaggagaa 1920
gaagactgag taatcgagtc ccgacacggt ccaaaagaca ttatatatag acagaaataa 1980
atttatacat tgactaacga gtgagtacag cagtgaatgg caagtcacca gccacaagac 2040
aagttcaagt aagtacaaga acagtgcgta tcagtagatg ctgtacttgc aacgtgcttc 2100
tctgtcaatc tcagtctctc attttgtctt gtc 2133
<210> 150
<211> 1185
<212> DNA
<213> Yarrowia lipolytica
<400> 150
atgggcgtat tcattaaaca ggagcagctt ccggctctca agaagtacaa gtactccgcc 60
gaggatcact cgttcatctc caacaacatt ctgcgcccct tctggcgaca gtttgtcaaa 120
atcttccctc tgtggatggc ccccaacatg gtgactctgt tgggcttctt ctttgtcatt 180
gtgaacttca tcaccatgct cattgttgat cccacccacg accgcgagcc tcccagatgg 240
gtctacctca cctacgctct gggtctgttc ctttaccaga catttgatgc ctgtgacgga 300
tcccatgccc gacgaactgg ccagagtgga ccccttggag agctgtttga ccactgtgtc 360
gacgccatga atacctctct gattctcacg gtggtggtgt ccaccaccca tatgggatat 420
aacatgaagc tgctgattgt gcagattgcc gctctcggaa acttctacct gtcgacctgg 480
gagacctacc ataccggaac tctgtacctt tctggcttct ctggtcctgt tgaaggtatc 540
ttgattctgg tggctctttt cgtcctcacc ttcttcactg gtcccaacgt gtacgctctg 600
accgtctacg aggctcttcc cgaatccatc acttcgctgc tgcctgccag cttcctggac 660
gtcaccatca cccagatcta cattggattc ggagtgctgg gcatggtgtt caacatctac 720
ggcgcctgcg gaaacgtgat caagtactac aacaacaagg gcaagagcgc tctccccgcc 780
attctcggaa tcgccccctt tggcatcttc tacgtcggcg tctttgcctg ggcccatgtt 840
gctcctctgc ttctctccaa gtacgccatc gtctatctgt ttgccattgg ggctgccttt 900
gccatgcaag tcggccagat gattcttgcc catctcgtgc ttgctccctt cccccactgg 960
aacgtgctgc tcttcttccc ctttgtggga ctggcagtgc actacattgc acccgtgttt 1020
ggctgggacg ccgatatcgt gtcggttaac actctcttca cctgttttgg cgccaccctc 1080
tccatttacg ccttctttgt gcttgagatc atcgacgaga tcaccaacta cctcgatatc 1140
tggtgtctgc gaatcaagta ccctcaggag aagaagactg agtaa 1185
<210> 151
<211> 394
<212> PRT
<213> Yarrowia lipolytica
<400> 151
Met Gly Val Phe Ile Lys Gln Glu Gln Leu Pro Ala Leu Lys Lys Tyr
1 5 10 15
Lys Tyr Ser Ala Glu Asp His Ser Phe Ile Ser Asn Asn Ile Leu Arg
20 25 30
Pro Phe Trp Arg Gln Phe Val Lys Ile Phe Pro Leu Trp Met Ala Pro
35 40 45
Asn Met Val Thr Leu Leu Gly Phe Phe Phe Val Ile Val Asn Phe Ile
50 55 60
Thr Met Leu Ile Val Asp Pro Thr His Asp Arg Glu Pro Pro Arg Trp
65 70 75 80
Val Tyr Leu Thr Tyr Ala Leu Gly Leu Phe Leu Tyr Gln Thr Phe Asp
85 90 95
Ala Cys Asp Gly Ser His Ala Arg Arg Thr Gly Gln Ser Gly Pro Leu
100 105 110
Gly Glu Leu Phe Asp His Cys Val Asp Ala Met Asn Thr Ser Leu Ile
115 120 125
Leu Thr Val Val Val Ser Thr Thr His Met Gly Tyr Asn Met Lys Leu
130 135 140
Leu Ile Val Gln Ile Ala Ala Leu Gly Asn Phe Tyr Leu Ser Thr Trp
145 150 155 160
Glu Thr Tyr His Thr Gly Thr Leu Tyr Leu Ser Gly Phe Ser Gly Pro
165 170 175
Val Glu Gly Ile Leu Ile Leu Val Ala Leu Phe Val Leu Thr Phe Phe
180 185 190
Thr Gly Pro Asn Val Tyr Ala Leu Thr Val Tyr Glu Ala Leu Pro Glu
195 200 205
Ser Ile Thr Ser Leu Leu Pro Ala Ser Phe Leu Asp Val Thr Ile Thr
210 215 220
Gln Ile Tyr Ile Gly Phe Gly Val Leu Gly Met Val Phe Asn Ile Tyr
225 230 235 240
Gly Ala Cys Gly Asn Val Ile Lys Tyr Tyr Asn Asn Lys Gly Lys Ser
245 250 255
Ala Leu Pro Ala Ile Leu Gly Ile Ala Pro Phe Gly Ile Phe Tyr Val
260 265 270
Gly Val Phe Ala Trp Ala His Val Ala Pro Leu Leu Leu Ser Lys Tyr
275 280 285
Ala Ile Val Tyr Leu Phe Ala Ile Gly Ala Ala Phe Ala Met Gln Val
290 295 300
Gly Gln Met Ile Leu Ala His Leu Val Leu Ala Pro Phe Pro His Trp
305 310 315 320
Asn Val Leu Leu Phe Phe Pro Phe Val Gly Leu Ala Val His Tyr Ile
325 330 335
Ala Pro Val Phe Gly Trp Asp Ala Asp Ile Val Ser Val Asn Thr Leu
340 345 350
Phe Thr Cys Phe Gly Ala Thr Leu Ser Ile Tyr Ala Phe Phe Val Leu
355 360 365
Glu Ile Ile Asp Glu Ile Thr Asn Tyr Leu Asp Ile Trp Cys Leu Arg
370 375 380
Ile Lys Tyr Pro Gln Glu Lys Lys Thr Glu
385 390
<210> 152
<211> 1434
<212> DNA
<213> Saccharomyces cerevisiae
<400> 152
atgtacaaca gaaaagacag agatgttcac gagaggaagg aagatggtca atctgagttt 60
gaagcactga acgggaccaa cgcaattatg tccgataata gtaaagcgta ttccataaag 120
tttctgacct tcaatacatg ggggttaaaa tacgtctcca aacaccgtaa agaaagactc 180
agagcaattg ctgataaatt ggcgggccac tcaatgctta cgccaatatc tgacgagttg 240
ttgcccaatg gtggagatag taatgaaaac gaagattacg acgtgattgc cttacaagaa 300
atctggtgtg tggaagactg gaagtatcta gcttctgcgt gtgcctccaa gtatccgtat 360
cagcgtttgt tccattctgg tattctgacg gggcctgggt tggccatact gtccaaggtc 420
ccgatagagt cgacctttct ttaccggttc ccgataaacg gtagaccgag tgcggtgttc 480
cgtggcgact ggtacgtagg gaaatctata gcaatcaccg tattgaacac aggaacccgc 540
cccattgcaa taatgaacag tcacatgcac gccccatacg ccaagcaggg tgatgccgcc 600
tacttgtgcc acagatcttg tcaggcctgg gatttcagca ggctcattaa gctttacagg 660
caggccggtt atgcggtgat tgtggtgggt gacttaaact ccagaccggg ctcactgccc 720
cacaaatttc tcacgcagga ggccggcctg gtcgactcct gggagcaatt gcatgggaag 780
caagacttgg cggtgatcgc tcgtctgtct ccattgcaac aattgcttaa gggctgtacc 840
acgtgcgatt cgctgctcaa cacatggagg gcccaaagac aacccgatga ggcatgcagg 900
ttggattatg ctcttatcga ccctgatttc ttgcaaacag tagacgcagg tgtcaggttc 960
actgaacgga tccctcacct ggactgcagt gtctctgacc attttgcata ctcatgcacc 1020
cttaacatcg tcccacaggg cacagagtcc cgtccatcca cctccgttaa gcgtgcgaag 1080
actcatgata gagagctgat cttgcagaga tactccaact acgaaaccat gatagaatgc 1140
atccacacgt acttgaagac agcccaaaga cagaaatttt tccgtggcct acatttctgg 1200
gcctcaatac ttctcctaat agcgtcgttg gtcgtgacaa cgtttactgc aaacaaggca 1260
ggctggtcct ccatcttctg ggtccttttc gctattgctg tctccatctc gggcaccatc 1320
gacggtgcca tctccttctt gtttggcagg tctgaaatca gagccctcat cgaagtcgaa 1380
caagaggttc tggacgcgga gcaccacctg caaactttct tgagcgagaa atga 1434
<210> 153
<211> 477
<212> PRT
<213> Saccharomyces cerevisiae (GenBank Accession No. NP_010935)
<400> 153
Met Tyr Asn Arg Lys Asp Arg Asp Val His Glu Arg Lys Glu Asp Gly
1 5 10 15
Gln Ser Glu Phe Glu Ala Leu Asn Gly Thr Asn Ala Ile Met Ser Asp
20 25 30
Asn Ser Lys Ala Tyr Ser Ile Lys Phe Leu Thr Phe Asn Thr Trp Gly
35 40 45
Leu Lys Tyr Val Ser Lys His Arg Lys Glu Arg Leu Arg Ala Ile Ala
50 55 60
Asp Lys Leu Ala Gly His Ser Met Leu Thr Pro Ile Ser Asp Glu Leu
65 70 75 80
Leu Pro Asn Gly Gly Asp Ser Asn Glu Asn Glu Asp Tyr Asp Val Ile
85 90 95
Ala Leu Gln Glu Ile Trp Cys Val Glu Asp Trp Lys Tyr Leu Ala Ser
100 105 110
Ala Cys Ala Ser Lys Tyr Pro Tyr Gln Arg Leu Phe His Ser Gly Ile
115 120 125
Leu Thr Gly Pro Gly Leu Ala Ile Leu Ser Lys Val Pro Ile Glu Ser
130 135 140
Thr Phe Leu Tyr Arg Phe Pro Ile Asn Gly Arg Pro Ser Ala Val Phe
145 150 155 160
Arg Gly Asp Trp Tyr Val Gly Lys Ser Ile Ala Ile Thr Val Leu Asn
165 170 175
Thr Gly Thr Arg Pro Ile Ala Ile Met Asn Ser His Met His Ala Pro
180 185 190
Tyr Ala Lys Gln Gly Asp Ala Ala Tyr Leu Cys His Arg Ser Cys Gln
195 200 205
Ala Trp Asp Phe Ser Arg Leu Ile Lys Leu Tyr Arg Gln Ala Gly Tyr
210 215 220
Ala Val Ile Val Val Gly Asp Leu Asn Ser Arg Pro Gly Ser Leu Pro
225 230 235 240
His Lys Phe Leu Thr Gln Glu Ala Gly Leu Val Asp Ser Trp Glu Gln
245 250 255
Leu His Gly Lys Gln Asp Leu Ala Val Ile Ala Arg Leu Ser Pro Leu
260 265 270
Gln Gln Leu Leu Lys Gly Cys Thr Thr Cys Asp Ser Leu Leu Asn Thr
275 280 285
Trp Arg Ala Gln Arg Gln Pro Asp Glu Ala Cys Arg Leu Asp Tyr Ala
290 295 300
Leu Ile Asp Pro Asp Phe Leu Gln Thr Val Asp Ala Gly Val Arg Phe
305 310 315 320
Thr Glu Arg Ile Pro His Leu Asp Cys Ser Val Ser Asp His Phe Ala
325 330 335
Tyr Ser Cys Thr Leu Asn Ile Val Pro Gln Gly Thr Glu Ser Arg Pro
340 345 350
Ser Thr Ser Val Lys Arg Ala Lys Thr His Asp Arg Glu Leu Ile Leu
355 360 365
Gln Arg Tyr Ser Asn Tyr Glu Thr Met Ile Glu Cys Ile His Thr Tyr
370 375 380
Leu Lys Thr Ala Gln Arg Gln Lys Phe Phe Arg Gly Leu His Phe Trp
385 390 395 400
Ala Ser Ile Leu Leu Leu Ile Ala Ser Leu Val Val Thr Thr Phe Thr
405 410 415
Ala Asn Lys Ala Gly Trp Ser Ser Ile Phe Trp Val Leu Phe Ala Ile
420 425 430
Ala Val Ser Ile Ser Gly Thr Ile Asp Gly Ala Ile Ser Phe Leu Phe
435 440 445
Gly Arg Ser Glu Ile Arg Ala Leu Ile Glu Val Glu Gln Glu Val Leu
450 455 460
Asp Ala Glu His His Leu Gln Thr Phe Leu Ser Glu Lys
465 470 475
<210> 154
<211> 8953
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY5-30
<400> 154
ggtggagctc cagcttttgt tccctttagt gagggttaat ttcgagcttg gcgtaatcat 60
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 120
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 180
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 240
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 300
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 360
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 420
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 480
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 540
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 600
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 660
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 720
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 780
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 840
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 900
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 960
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 1020
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 1080
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 1140
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 1200
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 1260
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 1320
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 1380
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 1440
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 1500
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 1560
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 1620
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 1680
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 1740
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 1800
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 1860
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 1920
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 1980
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 2040
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 2100
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 2160
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgcgc 2220
cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 2280
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 2340
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 2400
tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc 2460
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 2520
tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga 2580
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 2640
attttaacaa aatattaacg cttacaattt ccattcgcca ttcaggctgc gcaactgttg 2700
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 2760
tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 2820
ggccagtgaa ttgtaatacg actcactata gggcgaattg ggtaccgggc cccccctcga 2880
ggtcgatggt gtcgataagc ttgatatcga attcatgtca cacaaaccga tcttcgcctc 2940
aaggaaacct aattctacat ccgagagact gccgagatcc agtctacact gattaatttt 3000
cgggccaata atttaaaaaa atcgtgttat ataatattat atgtattata tatatacatc 3060
atgatgatac tgacagtcat gtcccattgc taaatagaca gactccatct gccgcctcca 3120
actgatgttc tcaatattta aggggtcatc tcgcattgtt taataataaa cagactccat 3180
ctaccgcctc caaatgatgt tctcaaaata tattgtatga acttattttt attacttagt 3240
attattagac aacttacttg ctttatgaaa aacacttcct atttaggaaa caatttataa 3300
tggcagttcg ttcatttaac aatttatgta gaataaatgt tataaatgcg tatgggaaat 3360
cttaaatatg gatagcataa atgatatctg cattgcctaa ttcgaaatca acagcaacga 3420
aaaaaatccc ttgtacaaca taaatagtca tcgagaaata tcaactatca aagaacagct 3480
attcacacgt tactattgag attattattg gacgagaatc acacactcaa ctgtctttct 3540
ctcttctaga aatacaggta caagtatgta ctattctcat tgttcatact tctagtcatt 3600
tcatcccaca tattccttgg atttctctcc aatgaatgac attctatctt gcaaattcaa 3660
caattataat aagatatacc aaagtagcgg tatagtggca atcaaaaagc ttctctggtg 3720
tgcttctcgt atttattttt attctaatga tccattaaag gtatatattt atttcttgtt 3780
atataatcct tttgtttatt acatgggctg gatacataaa ggtattttga tttaattttt 3840
tgcttaaatt caatcccccc tcgttcagtg tcaactgtaa tggtaggaaa ttaccatact 3900
tttgaagaag caaaaaaaat gaaagaaaaa aaaaatcgta tttccaggtt agacgttccg 3960
cagaatctag aatgcggtat gcggtacatt gttcttcgaa cgtaaaagtt gcgctccctg 4020
agatattgta catttttgct tttacaagta caagtacatc gtacaactat gtactactgt 4080
tgatgcatcc acaacagttt gttttgtttt tttttgtttt ttttttttct aatgattcat 4140
taccgctatg tatacctact tgtacttgta gtaagccggg ttattggcgt tcaattaatc 4200
atagacttat gaatctgcac ggtgtgcgct gcgagttact tttagcttat gcatgctact 4260
tgggtgtaat attgggatct gttcggaaat caacggatgc tcaaccgatt tcgacagtaa 4320
taatttgaat cgaatcggag cctaaaatga acccgagtat atctcataaa attctcggtg 4380
agaggtctgt gactgtcagt acaaggtgcc ttcattatgc cctcaacctt accatacctc 4440
actgaatgta gtgtacctct aaaaatgaaa tacagtgcca aaagccaagg cactgagctc 4500
gtctaacgga cttgatatac aaccaattaa aacaaatgaa aagaaataca gttctttgta 4560
tcatttgtaa caattaccct gtacaaacta aggtattgaa atcccacaat attcccaaag 4620
tccacccctt tccaaattgt catgcctaca actcatatac caagcactaa cctaccaaac 4680
accactaaaa ccccacaaaa tatatcttac cgaatataca gtaacaagct accaccacac 4740
tcgttgggtg cagtcgccag cttaaagata tctatccaca tcagccacaa ctcccttcct 4800
ttaataaacc gactacaccc ttggctattg aggttatgag tgaatatact gtagacaaga 4860
cactttcaag aagactgttt ccaaaacgta ccactgtcct ccactacaaa cacacccaat 4920
ctgcttcttc tagtcaaggt tgctacaccg gtaaattata aatcatcatt tcattagcag 4980
ggcagggccc tttttataga gtcttataca ctagcggacc ctgccggtag accaacccgc 5040
aggcgcgtca gtttgctcct tccatcaatg cgtcgtagaa acgacttact ccttcttgag 5100
cagctccttg accttgttgg caacaagtct ccgacctcgg aggtggagga agagcctccg 5160
atatcggcgg tagtgatacc agcctcgacg gactccttga cggcagcctc aacagcgtca 5220
ccggcgggct tcatgttaag agagaacttg agcatcatgg cggcagacag aatggtggca 5280
atggggttga ccttctgctt gccgagatcg ggggcagatc cgtgacaggg ctcgtacaga 5340
ccgaacgcct cgttggtgtc gggcagagaa gccagagagg cggagggcag cagacccaga 5400
gaaccgggga tgacggaggc ctcgtcggag atgatatcgc caaacatgtt ggtggtgatg 5460
atgataccat tcatcttgga gggctgcttg atgaggatca tggcggccga gtcgatcagc 5520
tggtggttga gctcgagctg ggggaattcg tccttgagga ctcgagtgac agtctttcgc 5580
caaagtcgag aggaggccag cacgttggcc ttgtcaagag accacacggg aagagggggg 5640
ttgtgctgaa gggccaggaa ggcggccatt cgggcaattc gctcaacctc aggaacggag 5700
taggtctcgg tgtcggaagc gacgccagat ccgtcatcct cctttcgctc tccaaagtag 5760
atacctccga cgagctctcg gacaatgatg aagtcggtgc cctcaacgtt tcggatgggg 5820
gagagatcgg cgagcttggg cgacagcagc tggcagggtc gcaggttggc gtacaggttc 5880
aggtcctttc gcagcttgag gagaccctgc tcgggtcgca cgtcggttcg tccgtcggga 5940
gtggtccata cggtgttggc agcgcctccg acagcaccga gcataataga gtcagccttt 6000
cggcagatgt cgagagtagc gtcggtgatg ggctcgccct ccttctcaat ggcagctcct 6060
ccaatgagtc ggtcctcaaa cacaaactcg gtgccggagg cctcagcaac agacttgagc 6120
accttgacgg cctcggcaat cacctcgggg ccacagaagt cgccgccgag aagaacaatc 6180
ttcttggagt cagtcttggt cttcttagtt tcgggttcca ttgtggatgt gtgtggttgt 6240
atgtgtgatg tggtgtgtgg agtgaaaatc tgtggctggc aaacgctctt gtatatatac 6300
gcacttttgc ccgtgctatg tggaagacta aacctccgaa gattgtgact caggtagtgc 6360
ggtatcggct agggacccaa accttgtcga tgccgatagc gctatcgaac gtaccccagc 6420
cggccgggag tatgtcggag gggacatacg agatcgtcaa gggtttgtgg ccaactggta 6480
aataaatgat gtcgactcag gcgacgacgg aattcctgca gcccatctgc agaattcagg 6540
agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc cccaattgac 6600
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttcacc ccacatatca 6660
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 6720
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 6780
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 6840
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 6900
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaccatgg atggtacgtc 6960
ctgtagaaac cccaacccgt gaaatcaaaa aactcgacgg cctgtgggca ttcagtctgg 7020
atcgcgaaaa ctgtggaatt gatcagcgtt ggtgggaaag cgcgttacaa gaaagccggg 7080
caattgctgt gccaggcagt tttaacgatc agttcgccga tgcagatatt cgtaattatg 7140
cgggcaacgt ctggtatcag cgcgaagtct ttataccgaa aggttgggca ggccagcgta 7200
tcgtgctgcg tttcgatgcg gtcactcatt acggcaaagt gtgggtcaat aatcaggaag 7260
tgatggagca tcagggcggc tatacgccat ttgaagccga tgtcacgccg tatgttattg 7320
ccgggaaaag tgtacgtatc accgtttgtg tgaacaacga actgaactgg cagactatcc 7380
cgccgggaat ggtgattacc gacgaaaacg gcaagaaaaa gcagtcttac ttccatgatt 7440
tctttaacta tgccgggatc catcgcagcg taatgctcta caccacgccg aacacctggg 7500
tggacgatat caccgtggtg acgcatgtcg cgcaagactg taaccacgcg tctgttgact 7560
ggcaggtggt ggccaatggt gatgtcagcg ttgaactgcg tgatgcggat caacaggtgg 7620
ttgcaactgg acaaggcact agcgggactt tgcaagtggt gaatccgcac ctctggcaac 7680
cgggtgaagg ttatctctat gaactgtgcg tcacagccaa aagccagaca gagtgtgata 7740
tctacccgct tcgcgtcggc atccggtcag tggcagtgaa gggcgaacag ttcctgatta 7800
accacaaacc gttctacttt actggctttg gtcgtcatga agatgcggac ttacgtggca 7860
aaggattcga taacgtgctg atggtgcacg accacgcatt aatggactgg attggggcca 7920
actcctaccg tacctcgcat tacccttacg ctgaagagat gctcgactgg gcagatgaac 7980
atggcatcgt ggtgattgat gaaactgctg ctgtcggctt taacctctct ttaggcattg 8040
gtttcgaagc gggcaacaag ccgaaagaac tgtacagcga agaggcagtc aacggggaaa 8100
ctcagcaagc gcacttacag gcgattaaag agctgatagc gcgtgacaaa aaccacccaa 8160
gcgtggtgat gtggagtatt gccaacgaac cggatacccg tccgcaagtg cacgggaata 8220
tttcgccact ggcggaagca acgcgtaaac tcgacccgac gcgtccgatc acctgcgtca 8280
atgtaatgtt ctgcgacgct cacaccgata ccatcagcga tctctttgat gtgctgtgcc 8340
tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt ggaaacggca gagaaggtac 8400
tggaaaaaga acttctggcc tggcaggaga aactgcatca gccgattatc atcaccgaat 8460
acggcgtgga tacgttagcc gggctgcact caatgtacac cgacatgtgg agtgaagagt 8520
atcagtgtgc atggctggat atgtatcacc gcgtctttga tcgcgtcagc gccgtcgtcg 8580
gtgaacaggt atggaatttc gccgattttg cgacctcgca aggcatattg cgcgttggcg 8640
gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa gtcggcggct tttctgctgc 8700
aaaaacgctg gactggcatg aacttcggtg aaaaaccgca gcagggaggc aaacaatgat 8760
taattaacta gagcggccgc caccgcggcc cgagattccg gcctcttcgg ccgccaagcg 8820
acccgggtgg acgtctagag gtacctagca attaacagat agtttgccgg tgataattct 8880
cttaacctcc cacactcctt tgacataacg atttatgtaa cgaaactgaa atttgaccag 8940
atattgtgtc cgc 8953
<210> 155
<211> 10
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (8)..(8)
<223> n is a, c, g, or t
<400> 155
mammatgnhs 10
<210> 156
<211> 12649
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pKUNF12T6E
<220>
<221> misc_feature
<222> (2507)..(2507)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (2512)..(2515)
<223> n is a, c, g, or t
<400> 156
taaccctcac taaagggaac aaaagctgga gctccaccgc ggacacaata tctggtcaaa 60
tttcagtttc gttacataaa tcgttatgtc aaaggagtgt gggaggttaa gagaattatc 120
accggcaaac tatctgttaa ttgctaggta cctctagacg tccacccggg tcgcttggcg 180
gccgaagagg ccggaatctc gggccgcggt ggcggccgct tagttggtct tggacttctt 240
gggcttcttc aggtaggact ggacaaagaa gttgccgaac agagcgagca gggtgatcat 300
gtacacgccg agcagctgga ccagagcctg agggtagtcg caggggaaga ggtagtcgta 360
cagggactgc accagcatag ccatgaactg ggtcatctgc agagtggtga tgtagggctt 420
gatgggcttg acgaagccga agccctgaga ggaaaagaag tagtaggcgt acatgacggt 480
gtggacgaag gagttgagga tgacggagaa gtaggcgtcg ccaccaggag cgtacttggc 540
aatagcccac cagatggcga agatggtggc atggtggtac acgtgcagga aggagacctg 600
gttgaacttc ttgcacagga tcatgatagc ggtgtccagg aactcgtagg ccttggagac 660
gtagaacacg tagacgattc gggacatgcc ctgagcgtgg gactcgttgc ccttctccat 720
gtcgttgccg aagaccttgt agccacccag gatagcctgt cggatggtct cgacgcacat 780
gtagagggac agtccgaaga ggaacaggtt gtggagcagc ttgatggtct tcagctcgaa 840
gggcttctcc atctgcttca tgatgggaat gccgaagagc agcatggcca tgtagccgac 900
ctcgaaggcg agcatggtgg agacgtccat catgggcaga ccgtcggtca gagcgtaggg 960
cttagctccg tccatccact ggtcgacacc ggtctcgact cgtccgacca cgtcgtccca 1020
gacagaggag ttggccatgg tgaatgattc ttatactcag aaggaaatgc ttaacgattt 1080
cgggtgtgag ttgacaagga gagagagaaa agaagaggaa aggtaattcg gggacggtgg 1140
tcttttatac ccttggctaa agtcccaacc acaaagcaaa aaaattttca gtagtctatt 1200
ttgcgtccgg catgggttac ccggatggcc agacaaagaa actagtacaa agtctgaaca 1260
agcgtagatt ccagactgca gtaccctacg cccttaacgg caagtgtggg aaccggggga 1320
ggtttgatat gtggggtgaa gggggctctc gccggggttg ggcccgctac tgggtcaatt 1380
tggggtcaat tggggcaatt ggggctgttt tttgggacac aaatacgccg ccaacccggt 1440
ctctcctgaa ttctgcatcg atcgaggaag aggacaagcg gctgcttctt aagtttgtga 1500
catcagtatc caaggcacca ttgcaaggat tcaaggcttt gaacccgtca tttgccattc 1560
gtaacgctgg tagacaggtt gatcggttcc ctacggcctc cacctgtgtc aatcttctca 1620
agctgcctga ctatcaggac attgatcaac ttcggaagaa acttttgtat gccattcgat 1680
cacatgctgg tttcgatttg tcttagagga acgcatatac agtaatcata gagaataaac 1740
gatattcatt tattaaagta gatagttgag gtagaagttg taaagagtga taaatagcgg 1800
ccgcgcctac ttaagcaacg ggcttgataa cagcgggggg ggtgcccacg ttgttgcggt 1860
tgcggaagaa cagaacaccc ttaccagcac cctcggcacc agcgctgggc tcaacccact 1920
ggcacatacg cgcactgcgg tacatggcgc ggatgaagcc acgaggacca tcctggacat 1980
cagcccggta gtgcttgccc atgatgggct taatggcctc ggtggcctcg tccgcgttgt 2040
agaaggggat gctgctgacg tagtggtgga ggacatgagt ctcgatgatg ccgtggagaa 2100
ggtggcggcc gatgaagccc atctcacggt caatggtagc agcggcacca cggacgaagt 2160
tccactcgtc gttggtgtag tggggaaggg tagggtcggt gtgctggagg aaggtgatgg 2220
caacgagcca gtggttaacc cagaggtagg gaacaaagta ccagatggcc atgttgtaga 2280
aaccgaactt ctgaacgagg aagtacagag cagtggccat cagaccgata ccaatatcgc 2340
tgaggacgat gagcttagcg tcactgttct cgtacagagg gctgcgggga tcgaagtggt 2400
taacaccacc gccgaggccg ttatgcttgc ccttgccgcg accctcacgc tggcgctcgt 2460
ggtagttgtg gccggtaaca ttggtgatga ggtagttggg ccagccnacg annnnctcag 2520
taagatgagc gagctcgtgg gtcatctttc cgagacgagt agcctgctgc tcgcgggttc 2580
ggggaacgaa gaccatgtca cgctccatgt tgccagtggc cttgtggtgc tttcggtggg 2640
agatttgcca gctgaagtag gggacaagga gggaagagtg aagaacccag ccagtaatgt 2700
cgttgatgat gcgagaatcg gagaaagcac cgtgaccgca ctcatgggca ataacccaga 2760
gaccagtacc gaaaagaccc tgaagaacgg tgtacacggc ccacagacca gcgcgggcgg 2820
gggtggaggg gatatattcg ggggtcacaa agttgtacca gatgctgaaa gtggtagtca 2880
ggaggacaat gtcgcggagg atataaccgt atcccttgag agcggagcgc ttgaagcagt 2940
gcttagggat ggcattgtag atgtccttga tggtaaagtc gggaacctcg aactggttgc 3000
cgtaggtgtc gagcatgaca ccatactcgg acttgggctt ggcgatatca acctcggaca 3060
tggacgagag cgatgtggaa gaggccgagt ggcggggaga gtctgaagga gagacggcgg 3120
cagactcaga atccgtcaca gtagttgagg tgacggtgcg tctaagcgca gggttctgct 3180
tgggcagagc cgaagtggac gccatggaga gctgggttag tttgtgtaga gagtgtgtgt 3240
tgctagcgac tttcggattg tgtcattaca caaaacgcgt cgtctcgaca ctgatcttgt 3300
cgtggatact cacggctcgg acatcgtcgc cgacgatgac accggacttt cgcttaagga 3360
cgtcagtaac aggcattgtg tgatgtgtag tttagatttc gaatctgtgg ggaaagaaag 3420
gaaaaaagag actggcaacc gattgggaga gccactgttt atatataccc tagacaagcc 3480
ccccgcttgt aagatgttgg tcaatgtaaa ccagtattaa ggttggcaag tgcaggagaa 3540
gcaaggtgtg ggtaccgagc aatggaaatg tgcggaaggc aaaaaaatga ggccacggcc 3600
tattgtcggg gctatatcca gggggcgatt gaagtacact aacatgacat gtgtccacag 3660
accctcaatc tggcctgatg agccaaatcc atacgcgctt tcgcagctct aaaggctata 3720
acaagtcaca ccaccctgct cgacctcagc gccctcactt tttgttaaga caaactgtac 3780
acgctgttcc agcgttttct gcctgcacct ggtgggacat ttggtgcaac ctaaagtgct 3840
cggaacctct gtggtgtcca gatcagcgca gcagttccga ggtagttttg aggcccttag 3900
atgatgcaat ggtgtcagtc gctggatcac gagtcttaat ggcagtattc gttcttattt 3960
gtgccattga gccccgttat cctcgtatct tctacccccc atcccatccc tttgttggtg 4020
caaccctacc catttattgt tgggtgcagc ccaaccgacg tggagagctt ggcttggcca 4080
tataaaaagg ccccccccta gtggcaatgg cagaaagtca gctgtgagtt gttgaatttg 4140
tcatctaggc ggcctggccg tcttctccgg ggcaattgtt cctctatagt actgcgtaca 4200
ctgtttaaac agtgtacgca gatctgcgac gacggaattc ctgcagccca tctgcagaat 4260
tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa aacagcccca attgccccaa 4320
ttgaccccaa attgacccag tagcgggccc aaccccggcg agagccccct tcaccccaca 4380
tatcaaacct cccccggttc ccacacttgc cgttaagggc gtagggtact gcagtctgga 4440
atctacgctt gttcagactt tgtactagtt tctttgtctg gccatccggg taacccatgc 4500
cggacgcaaa atagactact gaaaattttt ttgctttgtg gttgggactt tagccaaggg 4560
tataaaagac caccgtcccc gaattacctt tcctcttctt ttctctctct ccttgtcaac 4620
tcacacccga aatcgttaag catttccttc tgagtataag aatcattcac catggctgcc 4680
gctccctctg tgcgaacctt tacccgagcc gaggttctga acgctgaggc tctgaacgag 4740
ggcaagaagg acgctgaggc tcccttcctg atgatcatcg acaacaaggt gtacgacgtc 4800
cgagagttcg tccctgacca tcctggaggc tccgtgattc tcacccacgt tggcaaggac 4860
ggcaccgacg tctttgacac ctttcatccc gaggctgctt gggagactct cgccaacttc 4920
tacgttggag acattgacga gtccgaccga gacatcaaga acgatgactt tgccgctgag 4980
gtccgaaagc tgcgaaccct gttccagtct ctcggctact acgactcctc taaggcctac 5040
tacgccttca aggtctcctt caacctctgc atctggggac tgtccaccgt cattgtggcc 5100
aagtggggtc agacctccac cctcgccaac gtgctctctg ctgccctgct cggcctgttc 5160
tggcagcagt gcggatggct ggctcacgac tttctgcacc accaggtctt ccaggaccga 5220
ttctggggtg atctcttcgg agccttcctg ggaggtgtct gccagggctt ctcctcttcc 5280
tggtggaagg acaagcacaa cactcaccat gccgctccca acgtgcatgg cgaggatcct 5340
gacattgaca cccaccctct cctgacctgg tccgagcacg ctctggagat gttctccgac 5400
gtccccgatg aggagctgac ccgaatgtgg tctcgattca tggtcctgaa ccagacctgg 5460
ttctacttcc ccattctctc cttcgctcga ctgtcttggt gcctccagtc cattctcttt 5520
gtgctgccca acggtcaggc tcacaagccc tccggagctc gagtgcccat ctccctggtc 5580
gagcagctgt ccctcgccat gcactggacc tggtacctcg ctaccatgtt cctgttcatc 5640
aaggatcctg tcaacatgct cgtgtacttc ctggtgtctc aggctgtgtg cggaaacctg 5700
ctcgccatcg tgttctccct caaccacaac ggtatgcctg tgatctccaa ggaggaggct 5760
gtcgacatgg atttctttac caagcagatc atcactggtc gagatgtcca tcctggactg 5820
ttcgccaact ggttcaccgg tggcctgaac taccagatcg agcatcacct gttcccttcc 5880
atgcctcgac acaacttctc caagatccag cctgccgtcg agaccctgtg caagaagtac 5940
aacgtccgat accacaccac tggtatgatc gagggaactg ccgaggtctt ctcccgactg 6000
aacgaggtct ccaaggccac ctccaagatg ggcaaggctc agtaagcggc cgcatgagaa 6060
gataaatata taaatacatt gagatattaa atgcgctaga ttagagagcc tcatactgct 6120
cggagagaag ccaagacgag tactcaaagg ggattacacc atccatatcc acagacacaa 6180
gctggggaaa ggttctatat acactttccg gaataccgta gtttccgatg ttatcaatgg 6240
gggcagccag gatttcaggc acttcggtgt ctcggggtga aatggcgttc ttggcctcca 6300
tcaagtcgta ccatgtcttc atttgcctgt caaagtaaaa cagaagcaga tgaagaatga 6360
acttgaagtg aaggaattta aattgccccg gagaagacgg ccaggccgcc tagatgacaa 6420
attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct ttttatatgg 6480
ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt agggttgcac 6540
caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca atggcacaaa 6600
taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt gcatcatcta 6660
agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga ggttccgagc 6720
actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga acagcgtgta 6780
cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt gacttgttat 6840
agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat tgagggtctg 6900
tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc gacaataggc 6960
cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac accttgcttc 7020
tcctgcactt gccaacctta atactggttt acattgacca acatcttaca agcggggggc 7080
ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc ttttttcctt 7140
tctttcccca cagattcgaa atctaaacta cacatcacac aatgcctgtt actgacgtcc 7200
ttaagcgaaa gtccggtgtc atcgtcggcg acgatgtccg agccgtgagt atccacgaca 7260
agatcagtgt cgagacgacg cgttttgtgt aatgacacaa tccgaaagtc gctagcaaca 7320
cacactctct acacaaacta acccagctct ccatggagtc cattgctccc ttcctgccct 7380
ccaagatgcc tcaggacctg ttcatggacc tcgccagcgc tatcggtgtc cgagctgctc 7440
cctacgtcga tcccctggag gctgccctgg ttgcccaggc cgagaagtac attcccacca 7500
ttgtccatca cactcgaggc ttcctggttg ccgtggagtc tcccctggct cgagagctgc 7560
ctctgatgaa ccccttccac gtgctcctga tcgtgctcgc ctacctggtc accgtgtttg 7620
tgggtatgca gatcatgaag aactttgaac gattcgaggt caagaccttc tccctcctgc 7680
acaacttctg tctggtctcc atctccgcct acatgtgcgg tggcatcctg tacgaggctt 7740
atcaggccaa ctatggactg tttgagaacg ctgccgatca caccttcaag ggtctcccta 7800
tggctaagat gatctggctc ttctacttct ccaagatcat ggagtttgtc gacaccatga 7860
tcatggtcct caagaagaac aaccgacaga tttcctttct gcacgtgtac caccactctt 7920
ccatcttcac catctggtgg ctggtcacct tcgttgctcc caacggtgaa gcctacttct 7980
ctgctgccct gaactccttc atccacgtca tcatgtacgg ctactacttt ctgtctgccc 8040
tgggcttcaa gcaggtgtcg ttcatcaagt tctacatcac tcgatcccag atgacccagt 8100
tctgcatgat gtctgtccag tcttcctggg acatgtacgc catgaaggtc cttggccgac 8160
ctggataccc cttcttcatc accgctctgc tctggttcta catgtggacc atgctcggtc 8220
tcttctacaa cttttaccga aagaacgcca agctcgccaa gcaggccaag gctgacgctg 8280
ccaaggagaa ggccagaaag ctccagtaag cggccgcaag tgtggatggg gaagtgagtg 8340
cccggttctg tgtgcacaat tggcaatcca agatggatgg attcaacaca gggatatagc 8400
gagctacgtg gtggtgcgag gatatagcaa cggatattta tgtttgacac ttgagaatgt 8460
acgatacaag cactgtccaa gtacaatact aaacatactg tacatactca tactcgtacc 8520
cgggcaacgg tttcacttga gtgcagtggc tagtgctctt actcgtacag tgtgcaatac 8580
tgcgtatcat agtctttgat gtatatcgta ttcattcatg ttagttgcgt acgaagtcgt 8640
caatgatgtc gatatgggtt ttgatcatgc acacataagg tccgacctta tcggcaagct 8700
caatgagctc cttggtggtg gtaacatcca gagaagcaca caggttggtt ttcttggctg 8760
ccacgagctt gagcactcga gcggcaaagg cggacttgtg gacgttagct cgagcttcgt 8820
aggagggcat tttggtggtg aagaggagac tgaaataaat ttagtctgca gaacttttta 8880
tcggaacctt atctggggca gtgaagtata tgttatggta atagttacga gttagttgaa 8940
cttatagata gactggacta tacggctatc ggtccaaatt agaaagaacg tcaatggctc 9000
tctgggcgtc gcctttgccg acaaaaatgt gatcatgatg aaagccagca atgacgttgc 9060
agctgatatt gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca 9120
acgaagaatg tatcgtcaaa gtgatccaag cacactcata gttggagtcg tactccaaag 9180
gcggcaatga cgagtcagac agatactcgt cgaccttttc cttgggaacc accaccgtca 9240
gcccttctga ctcacgtatt gtagccaccg acacaggcaa cagtccgtgg atagcagaat 9300
atgtcttgtc ggtccatttc tcaccaactt taggcgtcaa gtgaatgttg cagaagaagt 9360
atgtgccttc attgagaatc ggtgttgctg atttcaataa agtcttgaga tcagtttggc 9420
gcgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 9480
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 9540
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 9600
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 9660
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 9720
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 9780
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 9840
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 9900
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 9960
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 10020
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 10080
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 10140
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 10200
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 10260
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 10320
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 10380
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 10440
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 10500
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 10560
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 10620
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 10680
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 10740
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 10800
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 10860
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 10920
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 10980
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 11040
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 11100
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 11160
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 11220
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 11280
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 11340
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 11400
aaaagtgcca cctgatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 11460
tcaggaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 11520
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 11580
cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 11640
ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 11700
accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 11760
gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 11820
gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 11880
caccacaccc gccgcgctta atgcgccgct acagggcgcg tccattcgcc attcaggctg 11940
cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 12000
gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt 12060
tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt gggcccgacg 12120
tcgcatgcag tggtggtatt gtgactgggg atgtagttga gaataagtca tacacaagtc 12180
agctttcttc gagcctcata taagtataag tagttcaacg tattagcact gtacccagca 12240
tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt 12300
tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa 12360
gcgctccata cttgcacgct ctctatatac acagttaaat tacatatcca tagtctaacc 12420
tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct 12480
caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg 12540
tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa 12600
gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaat 12649
<210> 157
<211> 13034
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW271
<400> 157
cgatgcagaa ttcaggagag accgggttgg cggcgtattt gtgtcccaaa aaacagcccc 60
aattgcccca attgacccca aattgaccca gtagcgggcc caaccccggc gagagccccc 120
ttcaccccac atatcaaacc tcccccggtt cccacacttg ccgttaaggg cgtagggtac 180
tgcagtctgg aatctacgct tgttcagact ttgtactagt ttctttgtct ggccatccgg 240
gtaacccatg ccggacgcaa aatagactac tgaaaatttt tttgctttgt ggttgggact 300
ttagccaagg gtataaaaga ccaccgtccc cgaattacct ttcctcttct tttctctctc 360
tccttgtcaa ctcacacccg aaatcgttaa gcatttcctt ctgagtataa gaatcattca 420
ccatggatgg ctcccgaccc tgtcgctgcc gagaccgctg cccagggtcc cactccccga 480
tacttcacct gggacgaggt cgcccagcga tccggttgcg aggaacgatg gctggtcatc 540
gaccgaaagg tgtacaacat ctctgagttc acccgacgac atcccggtgg ctcccgagtg 600
atctcgcact acgctggaca ggacgccact gaccccttcg ttgcctttca cattaacaag 660
ggcctggtta agaagtacat gaactccctg ctcattggag agctgtctcc cgaacagcct 720
tcgtttgagc ctaccaagaa caaggagctg accgacgagt ttcgagagct ccgagccacc 780
gttgagcgaa tgggactgat gaaggccaac catgtcttct ttctgctcta cctgctccac 840
attcttctcc ttgacggagc tgcctggctt accctgtggg tcttcggcac ttcctttctg 900
ccctttcttc tctgcgccgt cctgctctct gccgtgcagg ctcaggctgg ttggcttcag 960
catgactttg gtcacctttc cgtgttctct acctccaagt ggaaccacct gctccatcac 1020
ttcgtgatcg gccacctcaa gggtgctcct gcctcgtggt ggaaccacat gcatttccag 1080
caccatgcca agcccaactg ttttcgaaag gatcccgaca tcaacatgca ccccttcttt 1140
ttcgctcttg gcaagatcct gtccgtcgag ctcggaaagc agaagaagaa gtacatgccc 1200
tacaaccacc agcacaagta cttcttcctg attggacctc ccgctctcct gcctctttac 1260
tttcagtggt acatctttta ctttgttatt cagcgaaaga agtgggttga tcttgcctgg 1320
atgatcacct tctacgtccg attcttcctg acctacgtcc ctctccttgg actgaaggcc 1380
tttctcggtc tgttctttat cgtccgattc ctggagtcca actggttcgt gtgggtgacc 1440
cagatgaacc acattcccat gcacattgac catgatcgaa acatggactg ggtgtcgact 1500
cagctgcagg ccacctgcaa cgttcacaag tctgctttca acgactggtt ttccggtcac 1560
ctcaactttc agattgagca ccatctgttt cccaccatgc ctcgacacaa ctaccacaag 1620
gttgctcccc tggtccagtc gctctgtgcc aagcatggca tcgagtacca gtccaagccc 1680
ctgctctctg ccttcgctga catcattcac tcgctgaagg aatctggcca gctctggctc 1740
gatgcctacc tgcaccagta agcggccgca ttgatgattg gaaacacaca catgggttat 1800
atctaggtga gagttagttg gacagttata tattaaatca gctatgccaa cggtaacttc 1860
attcatgtca acgaggaacc agtgactgca agtaatatag aatttgacca ccttgccatt 1920
ctcttgcact cctttactat atctcattta tttcttatat acaaatcact tcttcttccc 1980
agcatcgagc tcggaaacct catgagcaat aacatcgtgg atctcgtcaa tagagggctt 2040
tttggactcc ttgctgttgg ccaccttgtc cttgctgtct ggctcattct gtttcaacgc 2100
cttttaatta acggagtagg tctcggtgtc ggaagcgacg ccagatccgt catcctcctt 2160
tcgctctcca aagtagatac ctccgacgag ctctcggaca atgatgaagt cggtgccctc 2220
aacgtttcgg atgggggaga gatcggcgag cttgggcgac agcagctggc agggtcgcag 2280
gttggcgtac aggttcaggt cctttcgcag cttgaggaga ccctgctcgg gtcgcacgtc 2340
ggttcgtccg tcgggagtgg tccatacggt gttggcagcg cctccgacag caccgagcat 2400
aatagagtca gcctttcggc agatgtcgag agtagcgtcg gtgatgggct cgccctcctt 2460
ctcaatggca gctcctccaa tgagtcggtc ctcaaacaca aactcggtgc cggaggcctc 2520
agcaacagac ttgagcacct tgacggcctc ggcaatcacc tcggggccac agaagtcgcc 2580
gccgagaaga acaatcttct tggagtcagt cttggtcttc ttagtttcgg gttccattgt 2640
ggatgtgtgt ggttgtatgt gtgatgtggt gtgtggagtg aaaatctgtg gctggcaaac 2700
gctcttgtat atatacgcac ttttgcccgt gctatgtgga agactaaacc tccgaagatt 2760
gtgactcagg tagtgcggta tcggctaggg acccaaacct tgtcgatgcc gatagcatgc 2820
gacgtcgggc ccaattcgcc ctatagtgag tcgtattaca attcactggc cgtcgtttta 2880
caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc 2940
cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg 3000
cgcagcctga atggcgaatg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 3060
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 3120
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 3180
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 3240
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 3300
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 3360
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 3420
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcct 3480
gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatca ggtggcactt 3540
ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 3600
atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 3660
tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 3720
tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 3780
gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 3840
aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 3900
gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 3960
ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 4020
gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 4080
gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 4140
atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 4200
ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 4260
cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 4320
cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 4380
gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 4440
cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 4500
cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt 4560
taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga 4620
ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 4680
aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 4740
caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 4800
taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag 4860
gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 4920
cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 4980
taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 5040
agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 5100
ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 5160
gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 5220
acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 5280
acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 5340
tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 5400
ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 5460
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 5520
gcgcccactg agctcgtcta acggacttga tatacaacca attaaaacaa atgaaaagaa 5580
atacagttct ttgtatcatt tgtaacaatt accctgtaca aactaaggta ttgaaatccc 5640
acaatattcc caaagtccac ccctttccaa attgtcatgc ctacaactca tataccaagc 5700
actaacctac caaacaccac taaaacccca caaaatatat cttaccgaat atacagtaac 5760
aagctaccac cacactcgtt gggtgcagtc gccagcttaa agatatctat ccacatcagc 5820
cacaactccc ttcctttaat aaaccgacta cacccttggc tattgaggtt atgagtgaat 5880
atactgtaga caagacactt tcaagaagac tgtttccaaa acgtaccact gtcctccact 5940
acaaacacac ccaatctgct tcttctagtc aaggttgcta caccggtaaa ttataaatca 6000
tcatttcatt agcagggcag ggcccttttt atagagtctt atacactagc ggaccctgcc 6060
ggtagaccaa cccgcaggcg cgtcagtttg ctccttccat caatgcgtcg tagaaacgac 6120
ttactccttc ttgagcagct ccttgacctt gttggcaaca agtctccgac ctcggaggtg 6180
gaggaagagc ctccgatatc ggcggtagtg ataccagcct cgacggactc cttgacggca 6240
gcctcaacag cgtcaccggc gggcttcatg ttaagagaga acttgagcat catggcggca 6300
gacagaatgg tggcgtacgc aactaacatg aatgaatacg atatacatca aagactatga 6360
tacgcagtat tgcacactgt acgagtaaga gcactagcca ctgcactcaa gtgaaaccgt 6420
tgcccgggta cgagtatgag tatgtacagt atgtttagta ttgtacttgg acagtgcttg 6480
tatcgtacat tctcaagtgt caaacataaa tatccgttgc tatatcctcg caccaccacg 6540
tagctcgcta tatccctgtg ttgaatccat ccatcttgga ttgccaattg tgcacacaga 6600
accgggcact cacttcccca tccacacttg cggccgctta gctgcctact cttccttggg 6660
acggagtcca agaacacgca agtgctccaa atgtgaagca aatgcttgcc aaaacgtatc 6720
cttgacaagg tatggaacct tgtactcgct gcaggtgttc ttgatgatgg ccagaatatc 6780
gggataatgg tgctgcgaca cgttggggaa cagatggtgc acagcctggt agttcaagct 6840
gccagtgatg ctggtccaga ggtgcgaatc gtgtgcgtaa tcctgcgtag tctcgacctg 6900
catagctgcc cagtcctttt ggatgatccc gttctcgtca ggcaacggcc actgaacttc 6960
ctcaacaacg tggttcgcct ggaaggtcag cgccagccag taagacgaca ccatgtccgc 7020
gaccgtgaac aagagcagca ccttgcccag gggcagatac tgcaggggaa caatcaggcg 7080
ataccagaca aagaaagcct tgccgcccca gaacatcaca gtgtgccatg tcgagatggg 7140
attgacacga atagcgtcat tggtcttgac aaagtacaaa atgttgatgt cctgaatgcg 7200
caccttgaac gccagcagtc cgtacaggaa aggaacaaac atgtgctggt tgatgtggtt 7260
gacaaaccac ttttggttgg gcttgatacg acgaacatcg ggctcagacg tcgacacgtc 7320
gggatctgct ccagcaatgt tggtgtaggg gtgatggccg agcatatgtt ggtacatcca 7380
caccaggtac gatgctccgt tgaaaaagtc gtgcgtggct cccagaatct tccagacagt 7440
ggggttgtgg gtcactgaaa agtgagacgc atcatgaaga gggttgagtc cgacttgtgc 7500
gcacgcaaat cccatgatga ttgcaaacac cacctgaagc catgtgcgtt cgacaacgaa 7560
aggcacaaag agctgcgcgt agtaggaagc gatcaaggat ccaaagataa gagcgtatcg 7620
tccccagatc tctggtctat tcttgggatc aatgttccga tccgtaaagt agccctcgac 7680
tctcgtcttg atggttttgt ggaacaccgt tggctccggg aagatgggca gctcattcga 7740
gaccagtgta ccgacatagt acttcttcat aatggcatct gcagccccaa acgcgtgata 7800
catctcaaag accggagtaa catctcggcc agctccgagc aggagagtgt ccactccacc 7860
aggatggcgg ctcaagaact ttgtgacatc gtacaccctg ccgcggatgg ccaagagtag 7920
gtcgtccttg gtgttatggg ccgccagctc ttcccaggtg aaggtttttc cttggtccgt 7980
tcccatggag agctgggtta gtttgtgtag agagtgtgtg ttgctagcga ctttcggatt 8040
gtgtcattac acaaaacgcg tcgtctcgac actgatcttg tcgtggatac tcacggctcg 8100
gacatcgtcg ccgacgatga caccggactt tcgcttaagg acgtcagtaa caggcattgt 8160
gtgatgtgta gtttagattt cgaatctgtg gggaaagaaa ggaaaaaaga gactggcaac 8220
cgattgggag agccactgtt tatatatacc ctagacaagc cccccgcttg taagatgttg 8280
gtcaatgtaa accagtatta aggttggcaa gtgcaggaga agcaaggtgt gggtaccgag 8340
caatggaaat gtgcggaagg caaaaaaatg aggccacggc ctattgtcgg ggctatatcc 8400
agggggcgat tgaagtacac taacatgaca tgtgtccaca gaccctcaat ctggcctgat 8460
gagccaaatc catacgcgct ttcgcagctc taaaggctat aacaagtcac accaccctgc 8520
tcgacctcag cgccctcact ttttgttaag acaaactgta cacgctgttc cagcgttttc 8580
tgcctgcacc tggtgggaca tttggtgcaa cctaaagtgc tcggaacctc tgtggtgtcc 8640
agatcagcgc agcagttccg aggtagtttt gaggccctta gatgatgcaa tggtgtcagt 8700
cgctggatca cgagtcttaa tggcagtatt cgttcttatt tgtgccattg agccccgtta 8760
tcctcgtatc ttctaccccc catcccatcc ctttgttggt gcaaccctac ccatttattg 8820
ttgggtgcag cccaaccgac gtggagagct tggcttggcc atataaaaag gcccccccct 8880
agtggcaatg gcagaaagtc agctgtgagt tgttgaattt gtcatctagg cggcctggcc 8940
gtcttctccg gggcaattta aattccttca cttcaagttc attcttcatc tgcttctgtt 9000
ttactttgac aggcaaatga agacatggta cgacttgatg gaggccaaga acgccatttc 9060
accccgagac accgaagtgc ctgaaatcct ggctgccccc attgataaca tcggaaacta 9120
cggtattccg gaaagtgtat atagaacctt tccccagctt gtgtctgtgg atatggatgg 9180
tgtaatcccc tttgagtact cgtcttggct tctctccgag cagtatgagg ctctctaatc 9240
tagcgcattt aatatctcaa tgtatttata tatttatctt ctcatgcggc cgcttagctg 9300
cctactcttc cttgggacgg agtccaagaa cacgcaagtg ctccaaatgt gaagcaaatg 9360
cttgccaaaa cgtatccttg acaaggtatg gaaccttgta ctcgctgcag gtgttcttga 9420
tgatggccag aatatcggga taatggtgct gcgacacgtt ggggaacaga tggtgcacag 9480
cctggtagtt caagctgcca gtgatgctgg tccagaggtg cgaatcgtgt gcgtaatcct 9540
gcgtagtctc gacctgcata gctgcccagt ccttttggat gatcccgttc tcgtcaggca 9600
acggccactg aacttcctca acaacgtggt tcgcctggaa ggtcagcgcc agccagtaag 9660
acgacaccat gtccgcgacc gtgaacaaga gcagcacctt gcccaggggc agatactgca 9720
ggggaacaat caggcgatac cagacaaaga aagccttgcc gccccagaac atcacagtgt 9780
gccatgtcga gatgggattg acacgaatag cgtcattggt cttgacaaag tacaaaatgt 9840
tgatgtcctg aatgcgcacc ttgaacgcca gcagtccgta caggaaagga acaaacatgt 9900
gctggttgat gtggttgaca aaccactttt ggttgggctt gatacgacga acatcgggct 9960
cagacgtcga cacgtcggga tctgctccag caatgttggt gtaggggtga tggccgagca 10020
tatgttggta catccacacc aggtacgatg ctccgttgaa aaagtcgtgc gtggctccca 10080
gaatcttcca gacagtgggg ttgtgggtca ctgaaaagtg agacgcatca tgaagagggt 10140
tgagtccgac ttgtgcgcac gcaaatccca tgatgattgc aaacaccacc tgaagccatg 10200
tgcgttcgac aacgaaaggc acaaagagct gcgcgtagta ggaagcgatc aaggatccaa 10260
agataagagc gtatcgtccc cagatctctg gtctattctt gggatcaatg ttccgatccg 10320
taaagtagcc ctcgactctc gtcttgatgg ttttgtggaa caccgttggc tccgggaaga 10380
tgggcagctc attcgagacc agtgtaccga catagtactt cttcataatg gcatctgcag 10440
ccccaaacgc gtgatacatc tcaaagaccg gagtaacatc tcggccagct ccgagcagga 10500
gagtgtccac tccaccagga tggcggctca agaactttgt gacatcgtac accctgccgc 10560
ggatggccaa gagtaggtcg tccttggtgt tatgggccgc cagctcttcc caggtgaagg 10620
tttttccttg gtccgttccc atggtgaatg attcttatac tcagaaggaa atgcttaacg 10680
atttcgggtg tgagttgaca aggagagaga gaaaagaaga ggaaaggtaa ttcggggacg 10740
gtggtctttt atacccttgg ctaaagtccc aaccacaaag caaaaaaatt ttcagtagtc 10800
tattttgcgt ccggcatggg ttacccggat ggccagacaa agaaactagt acaaagtctg 10860
aacaagcgta gattccagac tgcagtaccc tacgccctta acggcaagtg tgggaaccgg 10920
gggaggtttg atatgtgggg tgaagggggc tctcgccggg gttgggcccg ctactgggtc 10980
aatttggggt caattggggc aattggggct gttttttggg acacaaatac gccgccaacc 11040
cggtctctcc tgatcgatgg gctgcaggaa ttctacaata cgtgagtcag aagggctgac 11100
ggtggtggtt cccaaggaaa aggtcgacga gtatctgtct gactcgtcat tgccgccttt 11160
ggagtacgac tccaactatg agtgtgcttg gatcactttg acgatacatt cttcgttgga 11220
ggctgtgggt ctgacagctg cgttttcggc gcggttggcc gacaacaata tcagctgcaa 11280
cgtcattgct ggctttcatc atgatcacat ttttgtcggc aaaggcgacg cccagagagc 11340
cattgacgtt ctttctaatt tggaccgata gccgtatagt ccagtctatc tataagttca 11400
actaactcgt aactattacc ataacatata cttcactgcc ccagataagg ttccgataaa 11460
aagttctgca gactaaattt atttcagtct cctcttcacc accaaaatgc cctcctacga 11520
agctcgagct aacgtccaca agtccgcctt tgccgctcga gtgctcaagc tcgtggcagc 11580
caagaaaacc aacctgtgtg cttctctgga tgttaccacc accaaggagc tcattgagct 11640
tgccgataag gtcggacctt atgtgtgcat gatcaaaacc catatcgaca tcattgacga 11700
cttcacctac gccggcactg tgctccccct caaggaactt gctcttaagc acggtttctt 11760
cctgttcgag gacagaaagt tcgcagatat tggcaacact gtcaagcacc agtaccggtg 11820
tcaccgaatc gccgagtggt ccgatatcac caacgcccac ggtgtacccg gaaccggaat 11880
cattgctggc ctgcgagctg gtgccgagga aactgtctct gaacagaaga aggaggacgt 11940
ctctgactac gagaactccc agtacaagga gttcctagtc ccctctccca acgagaagct 12000
ggccagaggt ctgctcatgc tggccgagct gtcttgcaag ggctctctgg ccactggcga 12060
gtactccaag cagaccattg agcttgcccg atccgacccc gagtttgtgg ttggcttcat 12120
tgcccagaac cgacctaagg gcgactctga ggactggctt attctgaccc ccggggtggg 12180
tcttgacgac aagggagacg ctctcggaca gcagtaccga actgttgagg atgtcatgtc 12240
taccggaacg gatatcataa ttgtcggccg aggtctgtac ggccagaacc gagatcctat 12300
tgaggaggcc aagcgatacc agaaggctgg ctgggaggct taccagaaga ttaactgtta 12360
gaggttagac tatggatatg taatttaact gtgtatatag agagcgtgca agtatggagc 12420
gcttgttcag cttgtatgat ggtcagacga cctgtctgat cgagtatgta tgatactgca 12480
caacctgtgt atccgcatga tctgtccaat ggggcatgtt gttgtgtttc tcgatacgga 12540
gatgctgggt acagtgctaa tacgttgaac tacttatact tatatgaggc tcgaagaaag 12600
ctgacttgtg tatgacttat tctcaactac atccccagtc acaataccac cactgcacta 12660
ccactacacc agatctgcgt acactgttta aacggtaggt tagtgcttgg tatatgagtt 12720
gtaggcatga caatttggaa aggggtggac tttgggaata ttgtgggatt tcaatacctt 12780
agtttgtaca gggtaattgt tacaaatgat acaaagaact gtatttcttt tcatttgttt 12840
taattggttg tatatcaagt ccgttagacg agctcagtgc cttggctttt ggcactgtat 12900
ttcattttta gaggtacact acattcagtg aggtatggta aggttgaggg cataatgaag 12960
gcaccttgta ctgacagtca cagacctctc accgagaatt ttatgagata tactcgggtt 13020
cattttaggc tcat 13034
<210> 158
<211> 12690
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZP3L37
<400> 158
aaataccagt tggccacaaa cccttgacga tctcgtatgt cccctccgac atactcccgg 60
ccggctgggg tacgttcgat agcgctatcg gcatcgacaa ggtttgggtc cctagccgat 120
accgcactac ctgagtcaca atcttcggag gtttagtctt ccacatagca cgggcaaaag 180
tgcgtatata tacaagagcg tttgccagcc acagattttc actccacaca ccacatcaca 240
catacaacca cacacatcca caatggaacc cgaaactaag aagaccaaga ctgactccaa 300
gaagattgtt cttctcggcg gcgacttctg tggccccgag gtgattgccg aggccgtcaa 360
ggtgctcaag tctgttgctg aggcctccgg caccgagttt gtgtttgagg accgactcat 420
tggaggagct gccattgaga aggagggcga gcccatcacc gacgctactc tcgacatctg 480
ccgaaaggct gactctatta tgctcggtgc tgtcggaggc gctgccaaca ccgtatggac 540
cactcccgac ggacgaaccg acgtgcgacc cgagcagggt ctcctcaagc tgcgaaagga 600
cctgaacctg tacgccaacc tgcgaccctg ccagctgctg tcgcccaagc tcgccgatct 660
ctcccccatc cgaaacgttg agggcaccga cttcatcatt gtccgagagc tcgtcggagg 720
tatctacttt ggagagcgaa aggaggatga cggatctggc gtcgcttccg acaccgagac 780
ctactccgtt cctgaggttg agcgaattgc ccgaatggcc gccttcctgg cccttcagca 840
caacccccct cttcccgtgt ggtctcttga caaggccaac gtgctggcct cctctcgact 900
ttggcgaaag actgtcactc gagtcctcaa ggacgaattc ccccagctcg agctcaacca 960
ccagctgatc gactcggccg ccatgatcct catcaagcag ccctccaaga tgaatggtat 1020
catcatcacc accaacatgt ttggcgatat catctccgac gaggcctccg tcatccccgg 1080
ttctctgggt ctgctgccct ccgcctctct ggcttctctg cccgacacca acgaggcgtt 1140
cggtctgtac gagccctgtc acggatctgc ccccgatctc ggcaagcaga aggtcaaccc 1200
cattgccacc attctgtctg ccgccatgat gctcaagttc tctcttaaca tgaagcccgc 1260
cggtgacgct gttgaggctg ccgtcaagga gtccgtcgag gctggtatca ctaccgccga 1320
tatcggaggc tcttcctcca cctccgaggt cggagacttg ttgccaacaa ggtcaaggag 1380
ctgctcaaga aggagtaagt cgtttctacg acgcattgat ggaaggagca aactgacgcg 1440
cctgcgggtt ggtctaccgg cagggtccgc tagtgtataa gactctataa aaagggccct 1500
gccctgctaa tgaaatgatg atttataatt taccggtgta gcaaccttga ctagaagaag 1560
cagattgggt gtgtttgtag tggaggacag tggtacgttt tggaaacagt cttcttgaaa 1620
gtgtcttgtc tacagtatat tcactcataa cctcaatagc caagggtgta gtcggtttat 1680
taaaggaagg gagttgtggc tgatgtggat agatatcttt aagctggcga ctgcacccaa 1740
cgagtgtggt ggtagcttgt tagatctgta tattcggtaa gatatatttt gtggggtttt 1800
agtggtgttt aaacagtgta cgcagtacta tagaggaaca attgccccgg agaagacggc 1860
caggccgcct agatgacaaa ttcaacaact cacagctgac tttctgccat tgccactagg 1920
ggggggcctt tttatatggc caagccaagc tctccacgtc ggttgggctg cacccaacaa 1980
taaatgggta gggttgcacc aacaaaggga tgggatgggg ggtagaagat acgaggataa 2040
cggggctcaa tggcacaaat aagaacgaat actgccatta agactcgtga tccagcgact 2100
gacaccattg catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga 2160
caccacagag gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa 2220
aacgctggaa cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca 2280
gggtggtgtg acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc 2340
aggccagatt gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga 2400
tatagccccg acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc 2460
ggtacccaca ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa 2520
catcttacaa gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt 2580
gccagtctct tttttccttt ctttccccac agattcgaaa tctaaactac acatcacaca 2640
atgcctgtta ctgacgtcct taagcgaaag tccggtgtca tcgtcggcga cgatgtccga 2700
gccgtgagta tccacgacaa gatcagtgtc gagacgacgc gttttgtgta atgacacaat 2760
ccgaaagtcg ctagcaacac acactctcta cacaaactaa cccagctctc catggctgag 2820
gataagacca aggtcgagtt ccctaccctg actgagctga agcactctat ccctaacgct 2880
tgctttgagt ccaacctcgg actctcgctc tactacactg cccgagcgat cttcaacgca 2940
tctgcctctg ctgctctgct ctacgctgcc cgatctactc ccttcattgc cgataacgtt 3000
ctgctccacg ctctggtttg cgccacctac atctacgtgc agggtgtcat cttctggggt 3060
ttctttaccg tcggtcacga ctgtggtcac tctgccttct cccgatacca ctccgtcaac 3120
ttcatcattg gctgcatcat gcactctgcc attctgactc ccttcgagtc ctggcgagtg 3180
acccaccgac accatcacaa gaacactggc aacattgata aggacgagat cttctaccct 3240
catcggtccg tcaaggacct ccaggacgtg cgacaatggg tctacaccct cggaggtgct 3300
tggtttgtct acctgaaggt cggatatgct cctcgaacca tgtcccactt tgacccctgg 3360
gaccctctcc tgcttcgacg agcctccgct gtcatcgtgt ccctcggagt ctgggctgcc 3420
ttcttcgctg cctacgccta cctcacatac tcgctcggct ttgccgtcat gggcctctac 3480
tactatgctc ctctctttgt ctttgcttcg ttcctcgtca ttactacctt cttgcatcac 3540
aacgacgaag ctactccctg gtacggtgac tcggagtgga cctacgtcaa gggcaacctg 3600
agctccgtcg accgatcgta cggagctttc gtggacaacc tgtctcacca cattggcacc 3660
caccaggtcc atcacttgtt ccctatcatt ccccactaca agctcaacga agccaccaag 3720
cactttgctg ccgcttaccc tcacctcgtg agacgtaacg acgagcccat cattactgcc 3780
ttcttcaaga ccgctcacct ctttgtcaac tacggagctg tgcccgagac tgctcagatt 3840
ttcaccctca aagagtctgc cgctgcagcc aaggccaaga gcgactaagc ggccgctatt 3900
tatcactctt tacaacttct acctcaacta tctactttaa taaatgaata tcgtttattc 3960
tctatgatta ctgtatatgc gttcctctaa gacaaatcga aaccagcatg tgatcgaatg 4020
gcatacaaaa gtttcttccg aagttgatca atgtcctgat agtcaggcag cttgagaaga 4080
ttgacacagg tggaggccgt agggaaccga tcaacctgtc taccagcgtt acgaatggca 4140
aatgacgggt tcaaagcctt gaatccttgc aatggtgcct tggatactga tgtcacaaac 4200
ttaagaagca gccgcttgtc ctcttcctcg atcgatcagg agagaccggg ttggcggcgt 4260
atttgtgtcc caaaaaacag ccccaattgc cccaattgac cccaaattga cccagtagcg 4320
ggcccaaccc cggcgagagc ccccttcacc ccacatatca aacctccccc ggttcccaca 4380
cttgccgtta agggcgtagg gtactgcagt ctggaatcta cgcttgttca gactttgtac 4440
tagtttcttt gtctggccat ccgggtaacc catgccggac gcaaaataga ctactgaaaa 4500
tttttttgct ttgtggttgg gactttagcc aagggtataa aagaccaccg tccccgaatt 4560
acctttcctc ttcttttctc tctctccttg tcaactcaca cccgaaatcg ttaagcattt 4620
ccttctgagt ataagaatca ttcaccatgg ctgaggataa gaccaaggtc gagttcccta 4680
ccctgactga gctgaagcac tctatcccta acgcttgctt tgagtccaac ctcggactct 4740
cgctctacta cactgcccga gcgatcttca acgcatctgc ctctgctgct ctgctctacg 4800
ctgcccgatc tactcccttc attgccgata acgttctgct ccacgctctg gtttgcgcca 4860
cctacatcta cgtgcagggt gtcatcttct ggggtttctt taccgtcggt cacgactgtg 4920
gtcactctgc cttctcccga taccactccg tcaacttcat cattggctgc atcatgcact 4980
ctgccattct gactcccttc gagtcctggc gagtgaccca ccgacaccat cacaagaaca 5040
ctggcaacat tgataaggac gagatcttct accctcatcg gtccgtcaag gacctccagg 5100
acgtgcgaca atgggtctac accctcggag gtgcttggtt tgtctacctg aaggtcggat 5160
atgctcctcg aaccatgtcc cactttgacc cctgggaccc tctcctgctt cgacgagcct 5220
ccgctgtcat cgtgtccctc ggagtctggg ctgccttctt cgctgcctac gcctacctca 5280
catactcgct cggctttgcc gtcatgggcc tctactacta tgctcctctc tttgtctttg 5340
cttcgttcct cgtcattact accttcttgc atcacaacga cgaagctact ccctggtacg 5400
gtgactcgga gtggacctac gtcaagggca acctgagctc cgtcgaccga tcgtacggag 5460
ctttcgtgga caacctgtct caccacattg gcacccacca ggtccatcac ttgttcccta 5520
tcattcccca ctacaagctc aacgaagcca ccaagcactt tgctgccgct taccctcacc 5580
tcgtgagacg taacgacgag cccatcatta ctgccttctt caagaccgct cacctctttg 5640
tcaactacgg agctgtgccc gagactgctc agattttcac cctcaaagag tctgccgctg 5700
cagccaaggc caagagcgac taagcggccg caagtgtgga tggggaagtg agtgcccggt 5760
tctgtgtgca caattggcaa tccaagatgg atggattcaa cacagggata tagcgagcta 5820
cgtggtggtg cgaggatata gcaacggata tttatgtttg acacttgaga atgtacgata 5880
caagcactgt ccaagtacaa tactaaacat actgtacata ctcatactcg tacccgggca 5940
acggtttcac ttgagtgcag tggctagtgc tcttactcgt acagtgtgca atactgcgta 6000
tcatagtctt tgatgtatat cgtattcatt catgttagtt gcgtacggtg tgtatcgtag 6060
aggtagtgac gtgttgtcca cagggcgact gtgtccgtgt atatatatat tcctcggccc 6120
gagcttattt gtgtggggtt gaggaaatca aaccaaatcg gtagtcagag aaataaaaca 6180
aaaagaaata aaaagaaata gaggacgcac aacgccatca ccgtcggaga gacaggagaa 6240
gggaaaatgg gcaaaaatgc ccttatcaca cccgcccgct ttgtgctctc attcggctcc 6300
cacaagagcc tcttgtcctg gttccccccc cccacatttt aacaccccac acgacgttgc 6360
tgcacgtgga attttcggcc gaaaacctgt ggggtactta cttttggcac tggagagaag 6420
catctgggat tttgggaacc taggcagaag atgaggaaaa aaataagagg aaccgttgtg 6480
agcttgctta tcagtgtcat atactccccc ctccttgcgt ttttgcgtct tttcccccta 6540
tttttcaaat tttgcgattt tttttctctt tttttccgct tttttccgct ttttttttgg 6600
ccggctttta tccatttctc caagccgagg atcacatcta tgcagcccag tccgttggag 6660
catatctgcg gtagagtttc ggaacggcgt taagcactgt gtccgggtcg gtctggaacg 6720
agattgagcg ggaaattcgg gggaataaga ccaccgttgg actccccgca atgaggagat 6780
caagatgtgc ttttcagaat tctgattggt ggcgcgccag ctgcattaat gaatcggcca 6840
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 6900
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 6960
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 7020
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 7080
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 7140
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 7200
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 7260
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 7320
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 7380
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 7440
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 7500
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 7560
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 7620
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 7680
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 7740
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 7800
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 7860
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 7920
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 7980
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 8040
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 8100
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 8160
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 8220
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 8280
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 8340
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 8400
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 8460
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 8520
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 8580
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 8640
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 8700
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 8760
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgatg cggtgtgaaa 8820
taccgcacag atgcgtaagg agaaaatacc gcatcaggaa attgtaagcg ttaatatttt 8880
gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat 8940
cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt 9000
ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt 9060
ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag 9120
gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg 9180
aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc 9240
gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc 9300
gctacagggc gcgtccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 9360
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 9420
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa 9480
tacgactcac tatagggcga attgggcccg acgtcgcatg cgtcgagata tcgacattgt 9540
tccatctcca gtttaacccc aacttatcga gagtatttgt gagacacgca ataaatgaat 9600
ttataccaat caaatccata ttctacgctg tctacatata gatacttttt gtcatctctt 9660
gccctactat ttcgtcgata tatgaaggat acgccaaccg aacccatact ccacgctaca 9720
cacgcgcctt ttcacgcatt tctggggaaa atagacaccc ttggtgtcac ctgaagaata 9780
tgaaagaaga tattcattgt attgagctgt agatctgtgt atttcttgac ctcatcaatg 9840
acttctgggc tctttacctc gaatcatggt ggtactgtac cacatctcaa caccttgtag 9900
cacacctatg ggaaaattga gactatgaat ggattcccgt gcccgtatta ctctactaat 9960
ttgatcttgg aacgcgaaaa tacgtttcta ggactccaaa gaatctcaac tcttgtcctt 10020
actaaatata ctacccatag ttgatggttt acttgaacag agaggacatg ttcacttgac 10080
ccaaagtttc tcgcatctct tggatatttg aacaacggcg tccactgacc gtcagttatc 10140
cagtcacaaa acccccacat tcatacattc ccatgtacgt ttacaaagtt ctcaattcca 10200
tcgtgcaaat caaaatcaca tctattcatt catcatatat aaacccatca tgtctactaa 10260
cactcacaac tccatagaaa acatcgactc agaacacacg ctccatctat tcctcgtcca 10320
gctcgcaaat gtcgtcatct taattaaaag gcgttgaaac agaatgagcc agacagcaag 10380
gacaaggtgg ccaacagcaa ggagtccaaa aagccctcta ttgacgagat ccacgatgtt 10440
attgctcatg aggtttccga gctcgatgct gggaagaaga agtgatttgt atataagaaa 10500
taaatgagat atagtaaagg agtgcaagag aatggcaagg tggtcaaatt ctatattact 10560
tgcagtcact ggttcctcgt tgacatgaat gaagttaccg ttggcatagc tgatttaata 10620
tataactgtc caactaactc tcacctagat ataacccatg tgtgtgtttc caatcatcaa 10680
tgcggccgct tagtcgctct tggccttggc tgcagcggca gactctttga gggtgaaaat 10740
ctgagcagtc tcgggcacag ctccgtagtt gacaaagagg tgagcggtct tgaagaaggc 10800
agtaatgatg ggctcgtcgt tacgtctcac gaggtgaggg taagcggcag caaagtgctt 10860
ggtggcttcg ttgagcttgt agtggggaat gatagggaac aagtgatgga cctggtgggt 10920
gccaatgtgg tgagacaggt tgtccacgaa agctccgtac gatcggtcga cggagctcag 10980
gttgcccttg acgtaggtcc actccgagtc accgtaccag ggagtagctt cgtcgttgtg 11040
atgcaagaag gtagtaatga cgaggaacga agcaaagaca aagagaggag catagtagta 11100
gaggcccatg acggcaaagc cgagcgagta tgtgaggtag gcgtaggcag cgaagaaggc 11160
agcccagact ccgagggaca cgatgacagc ggaggctcgt cgaagcagga gagggtccca 11220
ggggtcaaag tgggacatgg ttcgaggagc atatccgacc ttcaggtaga caaaccaagc 11280
acctccgagg gtgtagaccc attgtcgcac gtcctggagg tccttgacgg accgatgagg 11340
gtagaagatc tcgtccttat caatgttgcc agtgttcttg tgatggtgtc ggtgggtcac 11400
tcgccaggac tcgaagggag tcagaatggc agagtgcatg atgcagccaa tgatgaagtt 11460
gacggagtgg tatcgggaga aggcagagtg accacagtcg tgaccgacgg taaagaaacc 11520
ccagaagatg acaccctgca cgtagatgta ggtggcgcaa accagagcgt ggagcagaac 11580
gttatcggca atgaagggag tagatcgggc agcgtagagc agagcagcag aggcagatgc 11640
gttgaagatc gctcgggcag tgtagtagag cgagagtccg aggttggact caaagcaagc 11700
gttagggata gagtgcttca gctcagtcag ggtagggaac tcgaccttgg tcttatcctc 11760
agccatggta ccagagctgg gttagtttgt gtagagagtg tgtgttgcta gcgactttcg 11820
gattgtgtca ttacacaaaa cgcgtcgtct cgacactgat cttgtcgtgg atactcacgg 11880
ctcggaattc tgtgatgtgt agtttagatt tcgaatctgt ggggaaagaa aggaaaaaag 11940
agactggcaa ccgattggga gagccactgt ttatatatac cctagacaag ccccccgctt 12000
gtaagatgtt ggtcaatgta aaccagtatt aaggttggca agtgcaggag aagcaaggtg 12060
tgggtaccga gcaatggaaa tgtgcggaag gcaaaaaaat gaggccacgg cctattgtcg 12120
gggctatatc cagggggcga ttgaagtaca ctaacatgac atgtgtccac agaccctcaa 12180
tctggcctga tgagccaaat ccatacgcgc tttcgcagct ctaaaggcta taacaagtca 12240
caccaccctg ctcgacctca gcgccctcac tttttgttaa gacaaactgt acacgctgtt 12300
ccagcgtttt ctgcctgcac ctggtgggac atttggtgca acctaaagtg ctcggaacct 12360
ctgtggtgtc cagatcagcg cagcagttcc gaggtagttt tgaggccctt agatgatgca 12420
atggtgtcag tcgctggatc acgagtctta atggcagtat tcgttcttat ttgtgccatt 12480
gagccccgtt atcctcgtat cttctacccc ccatcccatc cctttgttgg tgcaacccta 12540
cccatttatt gttgggtgca gcccaaccga cgtggagagc ttggcttggc catataaaaa 12600
ggcccccccc tagtggcaat ggcagaaagt cagctgtgag ttgttgaatt tgtcatctag 12660
gcggcctggc cgtcttctcc ggggcaattt 12690
<210> 159
<211> 5833
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZKUT16
<400> 159
gtacgaggaa actgtctctg aacagaagaa ggaggacgtc tctgactacg agaactccca 60
gtacaaggag ttcctagtcc cctctcccaa cgagaagctg gccagaggtc tgctcatgct 120
ggccgagctg tcttgcaagg gctctctggc cactggcgag tactccaagc agaccattga 180
gcttgcccga tccgaccccg agtttgtggt tggcttcatt gcccagaacc gacctaaggg 240
cgactctgag gactggctta ttctgacccc cggggtgggt cttgacgaca agggagacgc 300
tctcggacag cagtaccgaa ctgttgagga tgtcatgtct accggaacgg atatcataat 360
tgtcggccga ggtctgtacg gccagaaccg agatcctatt gaggaggcca agcgatacca 420
gaaggctggc tgggaggctt accagaagat taactgttag aggttagact atggatatgt 480
aatttaactg tgtatataga gagcgtgcaa gtatggagcg cttgttcagc ttgtatgatg 540
gtcagacgac ctgtctgatc gagtatgtat gatactgcac aacctgtgta tccgcatgat 600
ctgtccaatg gggcatgttg ttgtgtttct cgatacggag atgctgggta cagtgctaat 660
acgttgaact acttatactt atatgaggct cgaagaaagc tgacttgtgt atgacttaat 720
taatcgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 780
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 840
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 900
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 960
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 1020
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 1080
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 1140
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 1200
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 1260
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 1320
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 1380
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 1440
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 1500
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 1560
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 1620
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 1680
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 1740
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 1800
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 1860
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 1920
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 1980
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 2040
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 2100
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 2160
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 2220
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 2280
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 2340
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 2400
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 2460
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 2520
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 2580
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 2640
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 2700
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 2760
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 2820
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 2880
cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 2940
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 3000
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 3060
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 3120
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 3180
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 3240
tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 3300
atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc 3360
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 3420
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 3480
agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat 3540
tgggtaccgg gccccccctc gaggtcgacg agtatctgtc tgactcgtca ttgccgcctt 3600
tggagtacga ctccaactat gagtgtgctt ggatcacttt gacgatacat tcttcgttgg 3660
aggctgtggg tctgacagct gcgttttcgg cgcggttggc cgacaacaat atcagctgca 3720
acgtcattgc tggctttcat catgatcaca tttttgtcgg caaaggcgac gcccagagag 3780
ccattgacgt tctttctaat ttggaccgat agccgtatag tccagtctat ctataagttc 3840
aactaactcg taactattac cataacatat acttcactgc cccagataag gttccgataa 3900
aaagttctgc agactaaatt tatttcagtc tcctcttcac caccaaaatg ccctcctacg 3960
aagctcgagt gctcaagctc gtggcagcca agaaaaccaa cctgtgtgct tctctggatg 4020
ttaccaccac caaggagctc attgagcttg ccgataaggt cggaccttat gtgtgcatga 4080
tcaaaaccca tatcgacatc attgacgact tcacctacgc cggcactgtg ctccccctca 4140
aggaacttgc tcttaagcac ggtttcttcc tgttcgagga cagaaagttc gcagatattg 4200
gcaacactgt caagcaccag taccggtgtc accgaatcgc cgagtggtcc gatatcacca 4260
acgcccacgg tgtacccgga accggaatcg atgcagaatt caggagagac cgggttggcg 4320
gcgtatttgt gtcccaaaaa acagccccaa ttgccccaat tgaccccaaa ttgacccagt 4380
agcgggccca accccggcga gagccccctt caccccacat atcaaacctc ccccggttcc 4440
cacacttgcc gttaagggcg tagggtactg cagtctggaa tctacgcttg ttcagacttt 4500
gtactagttt ctttgtctgg ccatccgggt aacccatgcc ggacgcaaaa tagactactg 4560
aaaatttttt tgctttgtgg ttgggacttt agccaagggt ataaaagacc accgtccccg 4620
aattaccttt cctcttcttt tctctctctc cttgtcaact cacacccgaa atcgttaagc 4680
atttccttct gagtataaga atcattcacc atggacatgt ccgtcctgac tctccaagag 4740
tacgagttcg agaagcagtt caacgagaat gaagccatcc aatggatgca ggaaaactgg 4800
aagaaatcct tcctgttttc tgccctctac gctgccttta tctttggtgg acgacatctg 4860
atgaacaagc gagccaagtt tgagctgcga aaacctctcg tgctctggtc cctgaccctc 4920
gctgtcttct ctatcttcgg tgctctgcga actggagcct acatgctcta catcctgatg 4980
accaaaggcc tgaaacagtc tgtttgtgac cagtcctttt acaacggacc cgtctcgaaa 5040
ttctgggctt acgcctttgt gctctccaaa gctcccgaac ttggcgatac catcttcatc 5100
attctgcgaa agcagaaact catcttcctg cactggtatc accacatcac cgtcctcctg 5160
tactcttggt actcctacaa ggacatggtg gctggaggtg gctggttcat gactatgaac 5220
tacggtgtcc acgccgtgat gtactcctac tacgccctcc gagctgccgg tttccgagtc 5280
tctcgaaagt ttgccatgtt catcaccctg tcgcagatca ctcagatgct catgggctgt 5340
gtcattaact acctggtctt caactggatg cagcatgaca atgaccagtg ctactcccac 5400
tttcagaaca tcttctggtc ctctctcatg tacctctcct accttctgct cttctgccat 5460
ttcttctttg aggcctacat tggcaaagtg aagaaagcca ccaaggctga gtaagcggcc 5520
gcaagtgtgg atggggaagt gagtgcccgg ttctgtgtgc acaattggca atccaagatg 5580
gatggattca acacagggat atagcgagct acgtggtggt gcgaggatat agcaacggat 5640
atttatgttt gacacttgag aatgtacgat acaagcactg tccaagtaca atactaaaca 5700
tactgtacat actcatactc gtacccgggc aacggtttca cttgagtgca gtggctagtg 5760
ctcttactcg tacagtgtgc aatactgcgt atcatagtct ttgatgtata tcgtattcat 5820
tcatgttagt tgc 5833
<210> 160
<211> 12663
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pKO2UM25E
<400> 160
agcttccact ggtcggcgtg gtagtggggc agagtggggt cggtgtgctg caggtaggtg 60
atggccacga gccagtggtt gacccacagg taggggatca ggtagtagag ggtgacggaa 120
gccaggcccc atcggttgat ggagtatgcg atgacggaca tggtgatacc aataccgacg 180
ttagagatcc agatgttgaa ccagtccttc ttctcaaaca gcggggcgtt ggggttgaag 240
tggttgacag cccatttgtt gagcttgggg tacttctgtc cggtaacgta agacagcaga 300
tacagaggcc atccaaacac ctgctgggtg atgaggccgt agagggtcat gaggggagcg 360
tcctcagcaa gctcagacca gtcatgggcg cctcggttct ccataaactc ctttcggtcc 420
ttgggcacaa acaccatatc acgggtgagg tgaccagtgg acttgtggtg catggagtgg 480
gtcagcttcc aggcgtagta agggaccagc atggaggagt gcagaaccca tccggtgacg 540
ttgttgacgg tgttagagtc ggagaaagca gagtggccac actcgtgggc aagaacccac 600
agaccggtgc caaacagacc ctggacaatg gagtacatgg cccaggccac agctcggccg 660
gaagccgagg gaataagagg caggtacgcg taggccatgt aggcaaaaac ggcgataaag 720
aagcaggcgc gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 780
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 840
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 900
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 960
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 1020
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 1080
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 1140
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 1200
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 1260
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 1320
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 1380
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 1440
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 1500
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 1560
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 1620
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 1680
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 1740
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 1800
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 1860
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 1920
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 1980
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 2040
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 2100
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 2160
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 2220
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 2280
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 2340
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 2400
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 2460
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 2520
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 2580
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 2640
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 2700
tttccccgaa aagtgccacc tgatgcggtg tgaaataccg cacagatgcg taaggagaaa 2760
ataccgcatc aggaaattgt aagcgttaat attttgttaa aattcgcgtt aaatttttgt 2820
taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa 2880
gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag 2940
aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt 3000
gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac 3060
cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag 3120
gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg 3180
cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc cattcgccat 3240
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 3300
tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 3360
cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag ggcgaattgg 3420
gcccgacgtc gcatgcttga atctacaagt aggagggttg gagtgattaa gtgaaacttc 3480
tttaacggct ctatgccagt tctattgata tccgaaacat cagtatgaag gtctgataag 3540
ggtgacttct tcccacagat tcgtatcagt acgagtacga gaccggtact tgtaacagta 3600
ttgatactaa agggaaacta caacggttgt cagcgtaatg tgacttcgcc catgaacgca 3660
gacacgcagt gccgagtgcg gtgatatcgc ctactcgtta cgtccatgga ctacacaacc 3720
cctcggcttc gcttggctta gcctcgggct cggtgctgtt cagttaaaac acaatcaaat 3780
aacatttcta ctttttagaa ggcaggccgt caggagcaac tccgactcca ttgacgtttc 3840
taaacatctg aatgccttcc ttaccttcaa caaactggca ggttcgggcg acagtgtaaa 3900
gagacttgat gaagttggtg tcgtcgtgtc ggtagtgctt gcccatgacc ttcttgatct 3960
tctcagtggc gattcgggcg ttgtagaagg gaattcagga gagaccgggt tggcggcgta 4020
tttgtgtccc aaaaaacagc cccaattgcc ccaattgacc ccaaattgac ccagtagcgg 4080
gcccaacccc ggcgagagcc cccttcaccc cacatatcaa acctcccccg gttcccacac 4140
ttgccgttaa gggcgtaggg tactgcagtc tggaatctac gcttgttcag actttgtact 4200
agtttctttg tctggccatc cgggtaaccc atgccggacg caaaatagac tactgaaaat 4260
ttttttgctt tgtggttggg actttagcca agggtataaa agaccaccgt ccccgaatta 4320
cctttcctct tcttttctct ctctccttgt caactcacac ccgaaatcgt taagcatttc 4380
cttctgagta taagaatcat tcaccatggt cgctggcaag tccggagctg cagcccacgt 4440
gacccactct tccactctcc ctcgagagta ccacggtgct accaacgact cccgatctga 4500
ggctgccgat gtcaccgtct cgtctatcga cgccgagaag gagatgatta tcaacggacg 4560
agtgtacgac gtctcctcgt tcgtgaagcg acaccctggt ggctccgtca tcaagttcca 4620
gctcggagca gatgcttctg acgcttacaa caacttccac gtccgatcga agaaggctga 4680
caagatgctg tactctcttc cctcccgacc tgccgaggct ggctatgcac aggacgacat 4740
ctctagagac tttgagaagc tgcgactgga actgaaagag gaaggttact tcgagcccaa 4800
tctggtgcac gtgtcctacc gatgtgtcga ggtgcttgcc atgtactggg ctggcgtcca 4860
gctgatctgg tccggatact ggttcctcgg tgccatcgtt gctggaattg ctcaaggtcg 4920
atgcggatgg ctccagcatg aaggcggaca ctactcgctc actggcaaca tcaagattga 4980
ccgacatctc cagatggcca tctatggact gggctgtggt atgtctggct gctactggag 5040
aaaccagcac aacaaacatc acgccactcc tcagaagctc ggaaccgatc ccgacctgca 5100
gaccatgcct ctcgttgcct tccacaagat tgtcggagcc aaggcacgag gcaagggtaa 5160
agcctggctt gcttggcaag ctcccctctt ctttggaggc atcatttgct ccctggtctc 5220
tttcggctgg cagttcgttc tccaccccaa tcatgcactg cgagtgcaca accatctcga 5280
actggcctac atgggtctcc gatacgttct ctggcacctt gcctttggcc atctgggact 5340
cctgtcctct cttcgactgt atgccttcta cgtggctgtc ggtggcacct acatcttcac 5400
caacttcgcc gtctcccata ctcacaagga tgtcgttcct cccaccaagc acatttcgtg 5460
ggctctgtac tctgccaacc acactaccaa ctgttccgac tctccctttg tcaactggtg 5520
gatggcctac ctcaacttcc agatcgagca ccatctgttc ccctccatgc ctcagtacaa 5580
ccaccccaag attgctcctc gagtgcgagc actcttcgag aagcacggag tcgagtacga 5640
cgtccgaccc tatctggaat gctttcgagt gacctacgtc aacctccttg ctgttggcaa 5700
ccctgagcac tcctaccacg agcatactca ctaagcggcc gcaagtgtgg atggggaagt 5760
gagtgcccgg ttctgtgtgc acaattggca atccaagatg gatggattca acacagggat 5820
atagcgagct acgtggtggt gcgaggatat agcaacggat atttatgttt gacacttgag 5880
aatgtacgat acaagcactg tccaagtaca atactaaaca tactgtacat actcatactc 5940
gtacccgggc aacggtttca cttgagtgca gtggctagtg ctcttactcg tacagtgtgc 6000
aatactgcgt atcatagtct ttgatgtata tcgtattcat tcatgtcgac gagtatctgt 6060
ctgactcgtc attgccgcct ttggagtacg actccaacta tgagtgtgct tggatcactt 6120
tgacgataca ttcttcgttg gaggctgtgg gtctgacagc tgcgttttcg gcgcggttgg 6180
ccgacaacaa tatcagctgc aacgtcattg ctggctttca tcatgatcac atttttgtcg 6240
gcaaaggcga cgcccagaga gccattgacg ttctttctaa tttggaccga tagccgtata 6300
gtccagtcta tctataagtt caactaactc gtaactatta ccataacata tacttcactg 6360
ccccagataa ggttccgata aaaagttctg cagactaaat ttatttcagt ctcctcttca 6420
ccaccaaaat gccctcctac gaagctcgag ctaacgtcca caagtccgcc tttgccgctc 6480
gagtgctcaa gctcgtggca gccaagaaaa ccaacctgtg tgcttctctg gatgttacca 6540
ccaccaagga gctcattgag cttgccgata aggtcggacc ttatgtgtgc atgatcaaaa 6600
cccatatcga catcattgac gacttcacct acgccggcac tgtgctcccc ctcaaggaac 6660
ttgctcttaa gcacggtttc ttcctgttcg aggacagaaa gttcgcagat attggcaaca 6720
ctgtcaagca ccagtaccgg tgtcaccgaa tcgccgagtg gtccgatatc accaacgccc 6780
acggtgtacc cggaaccgga atcattgctg gcctgcgagc tggtgccgag gaaactgtct 6840
ctgaacagaa gaaggaggac gtctctgact acgagaactc ccagtacaag gagttcctag 6900
tcccctctcc caacgagaag ctggccagag gtctgctcat gctggccgag ctgtcttgca 6960
agggctctct ggccactggc gagtactcca agcagaccat tgagcttgcc cgatccgacc 7020
ccgagtttgt ggttggcttc attgcccaga accgacctaa gggcgactct gaggactggc 7080
ttattctgac ccccggggtg ggtcttgacg acaagggaga cgctctcgga cagcagtacc 7140
gaactgttga ggatgtcatg tctaccggaa cggatatcat aattgtcggc cgaggtctgt 7200
acggccagaa ccgagatcct attgaggagg ccaagcgata ccagaaggct ggctgggagg 7260
cttaccagaa gattaactgt tagaggttag actatggata tgtaatttaa ctgtgtatat 7320
agagagcgtg caagtatgga gcgcttgttc agcttgtatg atggtcagac gacctgtctg 7380
atcgagtatg tatgatactg cacaacctgt gtatccgcat gatctgtcca atggggcatg 7440
ttgttgtgtt tctcgatacg gagatgctgg gtacagtgct aatacgttga actacttata 7500
cttatatgag gctcgaagaa agctgacttg tgtatgactt aattaatttg aatcgaatcg 7560
atgagcctaa aatgaacccg agtatatctc ataaaattct cggtgagagg tctgtgactg 7620
tcagtacaag gtgccttcat tatgccctca accttaccat acctcactga atgtagtgta 7680
cctctaaaaa tgaaatacag tgccaaaagc caaggcactg agctcgtcta acggacttga 7740
tatacaacca attaaaacaa atgaaaagaa atacagttct ttgtatcatt tgtaacaatt 7800
accctgtaca aactaaggta ttgaaatccc acaatattcc caaagtccac ccctttccaa 7860
attgtcatgc ctacaactca tataccaagc actaacctac cgtttaaaca gtgtacgcag 7920
atctactata gaggaacatt taaattgccc cggagaagac ggccaggccg cctagatgac 7980
aaattcaaca actcacagct gactttctgc cattgccact aggggggggc ctttttatat 8040
ggccaagcca agctctccac gtcggttggg ctgcacccaa caataaatgg gtagggttgc 8100
accaacaaag ggatgggatg gggggtagaa gatacgagga taacggggct caatggcaca 8160
aataagaacg aatactgcca ttaagactcg tgatccagcg actgacacca ttgcatcatc 8220
taagggcctc aaaactacct cggaactgct gcgctgatct ggacaccaca gaggttccga 8280
gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca gaaaacgctg gaacagcgtg 8340
tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga gcagggtggt gtgacttgtt 8400
atagccttta gagctgcgaa agcgcgtatg gatttggctc atcaggccag attgagggtc 8460
tgtggacaca tgtcatgtta gtgtacttca atcgccccct ggatatagcc ccgacaatag 8520
gccgtggcct catttttttg ccttccgcac atttccattg ctcggtaccc acaccttgct 8580
tctcctgcac ttgccaacct taatactggt ttacattgac caacatctta caagcggggg 8640
gcttgtctag ggtatatata aacagtggct ctcccaatcg gttgccagtc tcttttttcc 8700
tttctttccc cacagattcg aaatctaaac tacacatcac acaatgcctg ttactgacgt 8760
ccttaagcga aagtccggtg tcatcgtcgg cgacgatgtc cgagccgtga gtatccacga 8820
caagatcagt gtcgagacga cgcgttttgt gtaatgacac aatccgaaag tcgctagcaa 8880
cacacactct ctacacaaac taacccagct ctccatggca cctcccaaca ctatcgacgc 8940
tggcttgacc cagcgtcata tcaccaccac ggccgcccca acctcggcca agcccgcttt 9000
cgagcgcaac taccagctcc ccgagttcac catcaaggag atccgagagt gcatccctgc 9060
ccactgcttt gagcgctccg gtcttcgtgg tctctgccac gttgccattg atctgacctg 9120
ggcctcgctc ttgttcctgg ctgcaaccca gatcgacaag ttcgagaacc ccttgatccg 9180
ctatctggcc tggcctgcgt actggatcat gcagggcatt gtctgcaccg gcatatgggt 9240
gctggcccac gagtgcggtc accagtcctt ctcgacctcc aagactctca acaacaccgt 9300
cggctggatc ctgcactcga tgctcttggt cccctaccac tcctggagaa tctcgcactc 9360
gaagcaccac aaggccactg gccacatgac caaggaccag gtctttgttc ccaagacccg 9420
ctcccaggtt ggtttgcctc ccaaggagag cgctgctgct gccgttcaag aggaggacat 9480
gtccgtgcac ctggatgagg aggcccctat tgtgactttg ttctggatgg tgatccagtt 9540
cctgttcgga tggcctgcat acctgatcat gaacgcctct ggtcaggact atggccgctg 9600
gacctcgcac ttccacactt actcgcccat ctttgagccc cgcaacttct tcgacattat 9660
catctcggat ctcggtgtgt tggctgccct cggtgccctg atctacgctt ccatgcagct 9720
gtcgctcttg accgtgacca agtactacat catcccgtac ctgtttgtca acttttggtt 9780
ggtcctgatt actttcttgc agcacaccga ccccaagctg ccccattacc gtgagggtgc 9840
ctggaacttc cagcgtggag ccctctgcac cgttgaccgc tcgtttggca agttcttgga 9900
ccatatgttc cacggcatcg tccataccca tgtggcccat cacttgttct cgcagatgcc 9960
gttctaccat gctgaagaag ctacctacca tctcaagaaa ctgctgggag agtactacgt 10020
ttacgaccca tccccgatcg tcgttgcggt ctggaggtcg ttccgcgagt gccgattcgt 10080
ggaggatcag ggagacgtgg tctttttcaa gaagtaagcg gccgcaagtg tggatgggga 10140
agtgagtgcc cggttctgtg tgcacaattg gcaatccaag atggatggat tcaacacagg 10200
gatatagcga gctacgtggt ggtgcgagga tatagcaacg gatatttatg tttgacactt 10260
gagaatgtac gatacaagca ctgtccaagt acaatactaa acatactgta catactcata 10320
ctcgtacccg ggcaacggtt tcacttgagt gcagtggcta gtgctcttac tcgtacagtg 10380
tgcaatactg cgtatcatag tctttgatgt atatcgtatt cattcatgtt agttgcgtac 10440
gagatcgtca agggtttgtg gccaactggt atttaaatgt agctaacggt agcaggcgaa 10500
ctactggtac atacctcccc cggaatatgt acaggcataa tgcgtatctg tgggacatgt 10560
ggtcgttgcg ccattatgta agcagcgtgt actcctctga ctgtccatat ggtttgctcc 10620
atctcaccct catcgttttc attgttcaca ggcggccaca aaaaaactgt cttctctcct 10680
tctctcttcg ccttagtcta ctcggaccag ttttagttta gcttggcgcc actggataaa 10740
tgagacctca ggccttgtga tgaggaggtc acttatgaag catgttagga ggtgcttgta 10800
tggatagaga agcacccaaa ataataagaa taataataaa acagggggcg ttgtcatttc 10860
atatcgtgtt ttcaccatca atacacctcc aaacaatgcc cttcatgtgg ccagccccaa 10920
tattgtcctg tagttcaact ctatgcagct cgtatcttat tgagcaagta aaactctgtc 10980
agccgatatt gcccgacccg cgacaagggt caacaaggtg gtgtaaggcc ttcgcagaag 11040
tcaaaactgt gccaaacaaa catctagagt ctctttggtg tttctcgcat atatttwatc 11100
ggctgtctta cgtatttgcg cctcggtacc ggactaattt cggatcatcc ccaatacgct 11160
ttttcttcgc agctgtcaac agtgtccatg atctatccac ctaaatgggt catatgaggc 11220
gtataatttc gtggtgctga taataattcc catatatttg acacaaaact tcccccccta 11280
gacatacatc tcacaatctc acttcttgtg cttctgtcac acatctcctc cagctgactt 11340
caactcacac ctctgcccca gttggtctac agcggtataa ggtttctccg catagaggtg 11400
caccactcct cccgatactt gtttgtgtga cttgtgggtc acgacatata tatctacaca 11460
cattgcgcca ccctttggtt cttccagcac aacaaaaaca cgacacgcta accatggagt 11520
ccattgctcc cttcctgccc tccaagatgc ctcaggacct gttcatggac ctcgccagcg 11580
ctatcggtgt ccgagctgct ccctacgtcg atcccctgga ggctgccctg gttgcccagg 11640
ccgagaagta cattcccacc attgtccatc acactcgagg cttcctggtt gccgtggagt 11700
ctcccctggc tcgagagctg cctctgatga accccttcca cgtgctcctg atcgtgctcg 11760
cctacctggt caccgtgttt gtgggtatgc agatcatgaa gaactttgaa cgattcgagg 11820
tcaagacctt ctccctcctg cacaacttct gtctggtctc catctccgcc tacatgtgcg 11880
gtggcatcct gtacgaggct tatcaggcca actatggact gtttgagaac gctgccgatc 11940
acaccttcaa gggtctccct atggctaaga tgatctggct cttctacttc tccaagatca 12000
tggagtttgt cgacaccatg atcatggtcc tcaagaagaa caaccgacag atttcctttc 12060
tgcacgtgta ccaccactct tccatcttca ccatctggtg gctggtcacc ttcgttgctc 12120
ccaacggtga agcctacttc tctgctgccc tgaactcctt catccacgtc atcatgtacg 12180
gctactactt tctgtctgcc ctgggcttca agcaggtgtc gttcatcaag ttctacatca 12240
ctcgatccca gatgacccag ttctgcatga tgtctgtcca gtcttcctgg gacatgtacg 12300
ccatgaaggt ccttggccga cctggatacc ccttcttcat caccgctctg ctctggttct 12360
acatgtggac catgctcggt ctcttctaca acttttaccg aaagaacgcc aagctcgcca 12420
agcaggccaa ggctgacgct gccaaggaga aggccagaaa gctccagtaa gcggccgcca 12480
ccgcggcccg agattccggc ctcttcggcc gccaagcgac ccgggtggac gtctagaggt 12540
acctagcaat taacagatag tttgccggtg ataattctct taacctccca cactcctttg 12600
acataacgat ttatgtaacg aaactgaaat ttgaccagat attgtgtccg cggtggagct 12660
cca 12663
<210> 161
<211> 15996
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW303
<220>
<221> misc_feature
<222> (5344)..(5344)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (5349)..(5352)
<223> n is a, c, g, or t
<400> 161
gtacgatagt tagtagacaa caatcagaac atctccctcc ttatataatc acacaggcca 60
gaacgcgcta aactaaagcg ctttggacac tatgttacat tggcattgat tgaactgaaa 120
ccacagtctc cctcgcctga atcgagcaat ggatgttgtc ggaagtcaac ttcactagaa 180
gagcggttct atgccttgtc aagatcatat cataaactca ctctgtatta ccccatctat 240
agaacacttg ttatgaatgg gcggaaacat tccgcttata tgcacctttc cacactaatg 300
caaagatgtg catcttcaac gggtagtaag actggttccg acttccgttg catggagagc 360
aatgacctcg ataatgcgaa catcccccac atatacactc ttacacaggc caatataatc 420
tgtgcattta ctaaatattt aagtctatgc acctgcttga tgaaaagcgg cagcggatgg 480
tatcatctag tttccgccaa tccaagaacc aactgtgttg gcagtggtgt agcccatggc 540
acacagacca aagatgaaaa tacagacatc ggcggttcga gccgtggtgc ctcgagcaac 600
acccttgtaa tgcaaaagag gagggtaaat gtacaccaga ggcacacatg caaacgatcc 660
ggtgagagcg acgaaccgat cgagatcgtc ggcacctccc catgcaacaa aggcggtgac 720
aaacacaagg aagaaccgga aaatgttctt ctgccacttg atggtagagt tgtacttgcc 780
tgatcgggtg aagagaccat tctcgatgat tcggatggcg cgccagctgc attaatgaat 840
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 900
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 960
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 1020
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1080
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1140
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1200
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1260
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1320
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1380
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1440
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1500
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1560
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 1620
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 1680
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 1740
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 1800
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 1860
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 1920
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 1980
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2040
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 2100
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 2160
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 2220
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 2280
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 2340
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 2400
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 2460
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 2520
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 2580
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 2640
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 2700
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 2760
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgatgcggt 2820
gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggaaattg taagcgttaa 2880
tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc 2940
cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt 3000
tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa 3060
aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg 3120
gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg 3180
acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc 3240
tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa 3300
tgcgccgcta cagggcgcgt ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 3360
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 3420
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 3480
ttgtaatacg actcactata gggcgaattg ggcccgacgt cgcatgctta gaagtgagga 3540
ttacaagaag cctctggata tcaatgatga acgtactcag cggctggtca agcatttcga 3600
ccgtcgaatc gacgaggtgt tcacctttga caagcgaggg ttcccaattg atcacgttct 3660
cgagttgttc aaatcttctc tcaacatctc tctgcatgaa ctatctctgt tgacgaacgt 3720
gtcacccact gttcctcgaa cgcccttctc cgagtttggt ctgaacatct tcgatctcaa 3780
actgaccccc gcagtgatca atagtgccat ggccactgcc gatgcggtgc gaacatccct 3840
ggagggattc tcggagctct acacaatgca gattctgtcg tcgagtactc tctaccttgc 3900
tcggatgact tattgtgcta ctactgcact catgcttcga tcatgtgccc tactgcaccc 3960
caaatttggt gatctgattg agacagagta ccctcttcag ctgattcaga agatcatcag 4020
caacatgaat gatgtggttg accaggcagg ctgttgtagt cacgtccttc acttcaagtt 4080
cattcttcat ctgcttctgt tttactttga caggcaaatg aagacatggt acgacttgat 4140
ggaggccaag aacgccattt caccccgaga caccgaagtg cctgaaatcc tggctgcccc 4200
cattgataac atcggaaact acggtattcc ggaaagtgta tatagaacct ttccccagct 4260
tgtgtctgtg gatatggatg gtgtaatccc cttaattaaa aggcgttgaa acagaatgag 4320
ccagacagca aggacaaggt ggccaacagc aaggagtcca aaaagccctc tattgacgag 4380
atccacgatg ttattgctca tgaggtttcc gagctcgatg ctgggaagaa gaagtgattt 4440
gtatataaga aataaatgag atatagtaaa ggagtgcaag agaatggcaa ggtggtcaaa 4500
ttctatatta cttgcagtca ctggttcctc gttgacatga atgaagttac cgttggcata 4560
gctgatttaa tatataactg tccaactaac tctcacctag atataaccca tgtgtgtgtt 4620
tccaatcatc aatgcggccg cgcctactta agcaacgggc ttgataacag cggggggggt 4680
gcccacgttg ttgcggttgc ggaagaacag aacaccctta ccagcaccct cggcaccagc 4740
gctgggctca acccactggc acatacgcgc actgcggtac atggcgcgga tgaagccacg 4800
aggaccatcc tggacatcag cccggtagtg cttgcccatg atgggcttaa tggcctcggt 4860
ggcctcgtcc gcgttgtaga aggggatgct gctgacgtag tggtggagga catgagtctc 4920
gatgatgccg tggagaaggt ggcggccgat gaagcccatc tcacggtcaa tggtagcagc 4980
ggcaccacgg acgaagttcc actcgtcgtt ggtgtagtgg ggaagggtag ggtcggtgtg 5040
ctggaggaag gtgatggcaa cgagccagtg gttaacccag aggtagggaa caaagtacca 5100
gatggccatg ttgtagaaac cgaacttctg aacgaggaag tacagagcag tggccatcag 5160
accgatacca atatcgctga ggacgatgag cttagcgtca ctgttctcgt acagagggct 5220
gcggggatcg aagtggttaa caccaccgcc gaggccgtta tgcttgccct tgccgcgacc 5280
ctcacgctgg cgctcgtggt agttgtggcc ggtaacattg gtgatgaggt agttgggcca 5340
gccnacgann nnctcagtaa gatgagcgag ctcgtgggtc atctttccga gacgagtagc 5400
ctgctgctcg cgggttcggg gaacgaagac catgtcacgc tccatgttgc cagtggcctt 5460
gtggtgcttt cggtgggaga tttgccagct gaagtagggg acaaggaggg aagagtgaag 5520
aacccagcca gtaatgtcgt tgatgatgcg agaatcggag aaagcaccgt gaccgcactc 5580
atgggcaata acccagagac cagtaccgaa aagaccctga agaacggtgt acacggccca 5640
cagaccagcg cgggcggggg tggaggggat atattcgggg gtcacaaagt tgtaccagat 5700
gctgaaagtg gtagtcagga ggacaatgtc gcggaggata taaccgtatc ccttgagagc 5760
ggagcgcttg aagcagtgct tagggatggc attgtagatg tccttgatgg taaagtcggg 5820
aacctcgaac tggttgccgt aggtgtcgag catgacacca tactcggact tgggcttggc 5880
gatatcaacc tcggacatgg acgagagcga tgtggaagag gccgagtggc ggggagagtc 5940
tgaaggagag acggcggcag actcagaatc cgtcacagta gttgaggtga cggtgcgtct 6000
aagcgcaggg ttctgcttgg gcagagccga agtggacgcc atggtgaatg attcttatac 6060
tcagaaggaa atgcttaacg atttcgggtg tgagttgaca aggagagaga gaaaagaaga 6120
ggaaaggtaa ttcggggacg gtggtctttt atacccttgg ctaaagtccc aaccacaaag 6180
caaaaaaatt ttcagtagtc tattttgcgt ccggcatggg ttacccggat ggccagacaa 6240
agaaactagt acaaagtctg aacaagcgta gattccagac tgcagtaccc tacgccctta 6300
acggcaagtg tgggaaccgg gggaggtttg atatgtgggg tgaagggggc tctcgccggg 6360
gttgggcccg ctactgggtc aatttggggt caattggggc aattggggct gttttttggg 6420
acacaaatac gccgccaacc cggtctctcc tgaattctct ctcttgagct tttccataac 6480
aagttcttct gcctccagga agtccatggg tggtttgatc atggttttgg tgtagtggta 6540
gtgcagtggt ggtattgtga ctggggatgt agttgagaat aagtcataca caagtcagct 6600
ttcttcgagc ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc 6660
cgtatcgaga aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg 6720
cagtatcata catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc 6780
tccatacttg cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta 6840
acagttaatc ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat 6900
aggatctcgg ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga 6960
catgacatcc tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc 7020
caccccgggg gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat 7080
gaagccaacc acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc 7140
gccagtggcc agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag 7200
cttctcgttg ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac 7260
gtcctccttc ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat 7320
tccggttccg ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca 7380
ccggtactgg tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa 7440
gaaaccgtgc ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc 7500
gtcaatgatg tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag 7560
ctcaatgagc tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc 7620
tgccacgagc ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc 7680
gtaggagggc attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt 7740
tatcggaacc ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg 7800
aacttataga tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc 7860
tctctgggcg tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt 7920
gcagctgata ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc 7980
caacgaagaa tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa 8040
aggcggcaat gacgagtcag acagatactc gtcgactcat cgatcgagga agaggacaag 8100
cggctgcttc ttaagtttgt gacatcagta tccaaggcac cattgcaagg attcaaggct 8160
ttgaacccgt catttgccat tcgtaacgct ggtagacagg ttgatcggtt ccctacggcc 8220
tccacctgtg tcaatcttct caagctgcct gactatcagg acattgatca acttcggaag 8280
aaacttttgt atgccattcg atcacatgct ggtttcgatt tgtcttagag gaacgcatat 8340
acagtaatca tagagaataa acgatattca tttattaaag tagatagttg aggtagaagt 8400
tgtaaagagt gataaatagc ggccgcttac tggagctttc tggccttctc cttggcagcg 8460
tcagccttgg cctgcttggc gagcttggcg ttctttcggt aaaagttgta gaagagaccg 8520
agcatggtcc acatgtagaa ccagagcaga gcggtgatga agaaggggta tccaggtcgg 8580
ccaaggacct tcatggcgta catgtcccag gaagactgga cagacatcat gcagaactgg 8640
gtcatctggg atcgagtgat gtagaacttg atgaacgaca cctgcttgaa gcccagggca 8700
gacagaaagt agtagccgta catgatgacg tggatgaagg agttcagggc agcagagaag 8760
taggcttcac cgttgggagc aacgaaggtg accagccacc agatggtgaa gatggaagag 8820
tggtggtaca cgtgcagaaa ggaaatctgt cggttgttct tcttgaggac catgatcatg 8880
gtgtcgacaa actccatgat cttggagaag tagaagagcc agatcatctt agccataggg 8940
agacccttga aggtgtgatc ggcagcgttc tcaaacagtc catagttggc ctgataagcc 9000
tcgtacagga tgccaccgca catgtaggcg gagatggaga ccagacagaa gttgtgcagg 9060
agggagaagg tcttgacctc gaatcgttca aagttcttca tgatctgcat acccacaaac 9120
acggtgacca ggtaggcgag cacgatcagg agcacgtgga aggggttcat cagaggcagc 9180
tctcgagcca ggggagactc cacggcaacc aggaagcctc gagtgtgatg gacaatggtg 9240
ggaatgtact tctcggcctg ggcaaccagg gcagcctcca ggggatcgac gtagggagca 9300
gctcggacac cgatagcgct ggcgaggtcc atgaacaggt cctgaggcat cttggagggc 9360
aggaagggag caatggactc catgggcagg acctgtgtta gtacattgtc ggggagtcat 9420
caattggttc gacaggttgt cgactgttag tatgagctca attgggctct ggtgggtcga 9480
tgacacttgt catctgtttc tgttgggtca tgtttccatc accttctatg gtactcacaa 9540
ttcgtccgat tcgcccgaat ccgttaatac cgactttgat ggccatgttg atgtgtgttt 9600
aattcaagaa tgaatataga gaagagaaga agaaaaaaga ttcaattgag ccggcgatgc 9660
agacccttat ataaatgttg ccttggacag acggagcaag cccgcccaaa cctacgttcg 9720
gtataatatg ttaagctttt taacacaaag gtttggcttg gggtaacctg atgtggtgca 9780
aaagaccggg cgttggcgag ccattgcgcg ggcgaatggg gccgtgactc gtctcaaatt 9840
cgagggcgtg cctcaattcg tgcccccgtg gctttttccc gccgtttccg ccccgtttgc 9900
accactgcag ccgcttcttt ggttcggaca ccttgctgcg agctaggtgc cttgtgctac 9960
ttaaaaagtg gcctcccaac accaacatga catgagtgcg tgggccaaga cacgttggcg 10020
gggtcgcagt cggctcaatg gcccggaaaa aacgctgctg gagctggttc ggacgcagtc 10080
cgccgcggcg tatggatatc cgcaaggttc catagcgcca ttgccctccg tcggcgtcta 10140
tcccgcaacc tctaaataga gcgggaatat aacccaagct tctttttttt cctttaacac 10200
gcacaccccc aactatcatg ttgctgctgc tgtttgactc tactctgtgg aggggtgctc 10260
ccacccaacc caacctacag gtggatccgg cgctgtgatt ggctgataag tctcctatcc 10320
ggactaattc tgaccaatgg gacatgcgcg caggacccaa atgccgcaat tacgtaaccc 10380
caacgaaatg cctacccctc tttggagccc agcggcccca aatcccccca agcagcccgg 10440
ttctaccggc ttccatctcc aagcacaagc agcccggttc taccggcttc catctccaag 10500
cacccctttc tccacacccc acaaaaagac ccgtgcagga catcctactg cgtgtttaaa 10560
caccactaaa accccacaaa atatatctta ccgaatatac agatctacta tagaggaaca 10620
attgccccgg agaagacggc caggccgcct agatgacaaa ttcaacaact cacagctgac 10680
tttctgccat tgccactagg ggggggcctt tttatatggc caagccaagc tctccacgtc 10740
ggttgggctg cacccaacaa taaatgggta gggttgcacc aacaaaggga tgggatgggg 10800
ggtagaagat acgaggataa cggggctcaa tggcacaaat aagaacgaat actgccatta 10860
agactcgtga tccagcgact gacaccattg catcatctaa gggcctcaaa actacctcgg 10920
aactgctgcg ctgatctgga caccacagag gttccgagca ctttaggttg caccaaatgt 10980
cccaccaggt gcaggcagaa aacgctggaa cagcgtgtac agtttgtctt aacaaaaagt 11040
gagggcgctg aggtcgagca gggtggtgtg acttgttata gcctttagag ctgcgaaagc 11100
gcgtatggat ttggctcatc aggccagatt gagggtctgt ggacacatgt catgttagtg 11160
tacttcaatc gccccctgga tatagccccg acaataggcc gtggcctcat ttttttgcct 11220
tccgcacatt tccattgctc ggtacccaca ccttgcttct cctgcacttg ccaaccttaa 11280
tactggttta cattgaccaa catcttacaa gcggggggct tgtctagggt atatataaac 11340
agtggctctc ccaatcggtt gccagtctct tttttccttt ctttccccac agattcgaaa 11400
tctaaactac acatcacaca atgcctgtta ctgacgtcct taagcgaaag tccggtgtca 11460
tcgtcggcga cgatgtccga gccgtgagta tccacgacaa gatcagtgtc gagacgacgc 11520
gttttgtgta atgacacaat ccgaaagtcg ctagcaacac acactctcta cacaaactaa 11580
cccagctctc catggctgcc gctccctctg tgcgaacctt tacccgagcc gaggttctga 11640
acgctgaggc tctgaacgag ggcaagaagg acgctgaggc tcccttcctg atgatcatcg 11700
acaacaaggt gtacgacgtc cgagagttcg tccctgacca tcctggaggc tccgtgattc 11760
tcacccacgt tggcaaggac ggcaccgacg tctttgacac ctttcatccc gaggctgctt 11820
gggagactct cgccaacttc tacgttggag acattgacga gtccgaccga gacatcaaga 11880
acgatgactt tgccgctgag gtccgaaagc tgcgaaccct gttccagtct ctcggctact 11940
acgactcctc taaggcctac tacgccttca aggtctcctt caacctctgc atctggggac 12000
tgtccaccgt cattgtggcc aagtggggtc agacctccac cctcgccaac gtgctctctg 12060
ctgccctgct cggcctgttc tggcagcagt gcggatggct ggctcacgac tttctgcacc 12120
accaggtctt ccaggaccga ttctggggtg atctcttcgg agccttcctg ggaggtgtct 12180
gccagggctt ctcctcttcc tggtggaagg acaagcacaa cactcaccat gccgctccca 12240
acgtgcatgg cgaggatcct gacattgaca cccaccctct cctgacctgg tccgagcacg 12300
ctctggagat gttctccgac gtccccgatg aggagctgac ccgaatgtgg tctcgattca 12360
tggtcctgaa ccagacctgg ttctacttcc ccattctctc cttcgctcga ctgtcttggt 12420
gcctccagtc cattctcttt gtgctgccca acggtcaggc tcacaagccc tccggagctc 12480
gagtgcccat ctccctggtc gagcagctgt ccctcgccat gcactggacc tggtacctcg 12540
ctaccatgtt cctgttcatc aaggatcctg tcaacatgct cgtgtacttc ctggtgtctc 12600
aggctgtgtg cggaaacctg ctcgccatcg tgttctccct caaccacaac ggtatgcctg 12660
tgatctccaa ggaggaggct gtcgacatgg atttctttac caagcagatc atcactggtc 12720
gagatgtcca tcctggactg ttcgccaact ggttcaccgg tggcctgaac taccagatcg 12780
agcatcacct gttcccttcc atgcctcgac acaacttctc caagatccag cctgccgtcg 12840
agaccctgtg caagaagtac aacgtccgat accacaccac tggtatgatc gagggaactg 12900
ccgaggtctt ctcccgactg aacgaggtct ccaaggccac ctccaagatg ggcaaggctc 12960
agtaagcggc cgcatgagaa gataaatata taaatacatt gagatattaa atgcgctaga 13020
ttagagagcc tcatactgct cggagagaag ccaagacgag tactcaaagg ggattacacc 13080
atccatatcc acagacacaa gctggggaaa ggttctatat acactttccg gaataccgta 13140
gtttccgatg ttatcaatgg gggcagccag gatttcaggc acttcggtgt ctcggggtga 13200
aatggcgttc ttggcctcca tcaagtcgta ccatgtcttc atttgcctgt caaagtaaaa 13260
cagaagcaga tgaagaatga acttgaagtg aaggaattta aatgtagcta acggtagcag 13320
gcgaactact ggtacatacc tcccccggaa tatgtacagg cataatgcgt atctgtggga 13380
catgtggtcg ttgcgccatt atgtaagcag cgtgtactcc tctgactgtc catatggttt 13440
gctccatctc accctcatcg ttttcattgt tcacaggcgg ccacaaaaaa actgtcttct 13500
ctccttctct cttcgcctta gtctactcgg accagtttta gtttagcttg gcgccactgg 13560
ataaatgaga cctcaggcct tgtgatgagg aggtcactta tgaagcatgt taggaggtgc 13620
ttgtatggat agagaagcac ccaaaataat aagaataata ataaaacagg gggcgttgtc 13680
atttcatatc gtgttttcac catcaataca cctccaaaca atgcccttca tgtggccagc 13740
cccaatattg tcctgtagtt caactctatg cagctcgtat cttattgagc aagtaaaact 13800
ctgtcagccg atattgcccg acccgcgaca agggtcaaca aggtggtgta aggccttcgc 13860
agaagtcaaa actgtgccaa acaaacatct agagtctctt tggtgtttct cgcatatatt 13920
twatcggctg tcttacgtat ttgcgcctcg gtaccggact aatttcggat catccccaat 13980
acgctttttc ttcgcagctg tcaacagtgt ccatgatcta tccacctaaa tgggtcatat 14040
gaggcgtata atttcgtggt gctgataata attcccatat atttgacaca aaacttcccc 14100
ccctagacat acatctcaca atctcacttc ttgtgcttct gtcacacatc tcctccagct 14160
gacttcaact cacacctctg ccccagttgg tctacagcgg tataaggttt ctccgcatag 14220
aggtgcacca ctcctcccga tacttgtttg tgtgacttgt gggtcacgac atatatatct 14280
acacacattg cgccaccctt tggttcttcc agcacaacaa aaacacgaca cgctaaccat 14340
ggatggctcc cgaccctgtc gctgccgaga ccgctgccca gggtcccact ccccgatact 14400
tcacctggga cgaggtcgcc cagcgatccg gttgcgagga acgatggctg gtcatcgacc 14460
gaaaggtgta caacatctct gagttcaccc gacgacatcc cggtggctcc cgagtgatct 14520
cgcactacgc tggacaggac gccactgacc ccttcgttgc ctttcacatt aacaagggcc 14580
tggttaagaa gtacatgaac tccctgctca ttggagagct gtctcccgaa cagccttcgt 14640
ttgagcctac caagaacaag gagctgaccg acgagtttcg agagctccga gccaccgttg 14700
agcgaatggg actgatgaag gccaaccatg tcttctttct gctctacctg ctccacattc 14760
ttctccttga cggagctgcc tggcttaccc tgtgggtctt cggcacttcc tttctgccct 14820
ttcttctctg cgccgtcctg ctctctgccg tgcaggctca ggctggttgg cttcagcatg 14880
actttggtca cctttccgtg ttctctacct ccaagtggaa ccacctgctc catcacttcg 14940
tgatcggcca cctcaagggt gctcctgcct cgtggtggaa ccacatgcat ttccagcacc 15000
atgccaagcc caactgtttt cgaaaggatc ccgacatcaa catgcacccc ttctttttcg 15060
ctcttggcaa gatcctgtcc gtcgagctcg gaaagcagaa gaagaagtac atgccctaca 15120
accaccagca caagtacttc ttcctgattg gacctcccgc tctcctgcct ctttactttc 15180
agtggtacat cttttacttt gttattcagc gaaagaagtg ggttgatctt gcctggatga 15240
tcaccttcta cgtccgattc ttcctgacct acgtccctct ccttggactg aaggcctttc 15300
tcggtctgtt ctttatcgtc cgattcctgg agtccaactg gttcgtgtgg gtgacccaga 15360
tgaaccacat tcccatgcac attgaccatg atcgaaacat ggactgggtg tcgactcagc 15420
tgcaggccac ctgcaacgtt cacaagtctg ctttcaacga ctggttttcc ggtcacctca 15480
actttcagat tgagcaccat ctgtttccca ccatgcctcg acacaactac cacaaggttg 15540
ctcccctggt ccagtcgctc tgtgccaagc atggcatcga gtaccagtcc aagcccctgc 15600
tctctgcctt cgctgacatc attcactcgc tgaaggaatc tggccagctc tggctcgatg 15660
cctacctgca ccagtaagcg gccgcaagtg tggatgggga agtgagtgcc cggttctgtg 15720
tgcacaattg gcaatccaag atggatggat tcaacacagg gatatagcga gctacgtggt 15780
ggtgcgagga tatagcaacg gatatttatg tttgacactt gagaatgtac gatacaagca 15840
ctgtccaagt acaatactaa acatactgta catactcata ctcgtacccg ggcaacggtt 15900
tcacttgagt gcagtggcta gtgctcttac tcgtacagtg tgcaatactg cgtatcatag 15960
tctttgatgt atatcgtatt cattcatgtt agttgc 15996
<210> 162
<211> 8165
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF17
<400> 162
gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 60
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 120
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 180
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 240
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 300
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 360
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 420
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 480
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 540
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 600
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 660
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 720
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 780
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 840
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 900
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 960
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1020
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1080
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1140
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 1200
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 1260
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1320
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1380
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1440
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 1500
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 1560
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 1620
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 1680
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 1740
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 1800
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 1860
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 1920
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 1980
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2040
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2100
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2160
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2220
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2280
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2340
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2400
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2460
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2520
aacgcgaatt ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca 2580
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 2640
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 2700
aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc 2760
ccctcgaggt cgatggtgtc gataagcttg atatcgaatt catgtcacac aaaccgatct 2820
tcgcctcaag gaaacctaat tctacatccg agagactgcc gagatccagt ctacactgat 2880
taattttcgg gccaataatt taaaaaaatc gtgttatata atattatatg tattatatat 2940
atacatcatg atgatactga cagtcatgtc ccattgctaa atagacagac tccatctgcc 3000
gcctccaact gatgttctca atatttaagg ggtcatctcg cattgtttaa taataaacag 3060
actccatcta ccgcctccaa atgatgttct caaaatatat tgtatgaact tatttttatt 3120
acttagtatt attagacaac ttacttgctt tatgaaaaac acttcctatt taggaaacaa 3180
tttataatgg cagttcgttc atttaacaat ttatgtagaa taaatgttat aaatgcgtat 3240
gggaaatctt aaatatggat agcataaatg atatctgcat tgcctaattc gaaatcaaca 3300
gcaacgaaaa aaatcccttg tacaacataa atagtcatcg agaaatatca actatcaaag 3360
aacagctatt cacacgttac tattgagatt attattggac gagaatcaca cactcaactg 3420
tctttctctc ttctagaaat acaggtacaa gtatgtacta ttctcattgt tcatacttct 3480
agtcatttca tcccacatat tccttggatt tctctccaat gaatgacatt ctatcttgca 3540
aattcaacaa ttataataag atataccaaa gtagcggtat agtggcaatc aaaaagcttc 3600
tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc attaaaggta tatatttatt 3660
tcttgttata taatcctttt gtttattaca tgggctggat acataaaggt attttgattt 3720
aattttttgc ttaaattcaa tcccccctcg ttcagtgtca actgtaatgg taggaaatta 3780
ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa aatcgtattt ccaggttaga 3840
cgttccgcag aatctagaat gcggtatgcg gtacattgtt cttcgaacgt aaaagttgcg 3900
ctccctgaga tattgtacat ttttgctttt acaagtacaa gtacatcgta caactatgta 3960
ctactgttga tgcatccaca acagtttgtt ttgttttttt ttgttttttt tttttctaat 4020
gattcattac cgctatgtat acctacttgt acttgtagta agccgggtta ttggcgttca 4080
attaatcata gacttatgaa tctgcacggt gtgcgctgcg agttactttt agcttatgca 4140
tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa cggatgctca atcgatttcg 4200
acagtaatta attaagtcat acacaagtca gctttcttcg agcctcatat aagtataagt 4260
agttcaacgt attagcactg tacccagcat ctccgtatcg agaaacacaa caacatgccc 4320
cattggacag atcatgcgga tacacaggtt gtgcagtatc atacatactc gatcagacag 4380
gtcgtctgac catcatacaa gctgaacaag cgctccatac ttgcacgctc tctatataca 4440
cagttaaatt acatatccat agtctaacct ctaacagtta atcttctggt aagcctccca 4500
gccagccttc tggtatcgct tggcctcctc aataggatct cggttctggc cgtacagacc 4560
tcggccgaca attatgatat ccgttccggt agacatgaca tcctcaacag ttcggtactg 4620
ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg ggggtcagaa taagccagtc 4680
ctcagagtcg cccttaggtc ggttctgggc aatgaagcca accacaaact cggggtcgga 4740
tcgggcaagc tcaatggtct gcttggagta ctcgccagtg gccagagagc ccttgcaaga 4800
cagctcggcc agcatgagca gacctctggc cagcttctcg ttgggagagg ggactaggaa 4860
ctccttgtac tgggagttct cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt 4920
ttcctcggca ccagctcgca ggccagcaat gattccggtt ccgggtacac cgtgggcgtt 4980
ggtgatatcg gaccactcgg cgattcggtg acaccggtac tggtgcttga cagtgttgcc 5040
aatatctgcg aactttctgt cctcgaacag gaagaaaccg tgcttaagag caagttcctt 5100
gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat 5160
catgcacaca taaggtccga ccttatcggc aagctcaatg agctccttgg tggtggtaac 5220
atccagagaa gcacacaggt tggttttctt ggctgccacg agcttgagca ctcgagcggc 5280
aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag ggcattttgg tggtgaagag 5340
gagactgaaa taaatttagt ctgcagaact ttttatcgga accttatctg gggcagtgaa 5400
gtatatgtta tggtaatagt tacgagttag ttgaacttat agatagactg gactatacgg 5460
ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa 5520
aatgtgatca tgatgaaagc cagcaatgac gttgcagctg atattgttgt cggccaaccg 5580
cgccgaaaac gcagctgtca gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat 5640
ccaagcacac tcatagttgg agtcgtactc caaaggcggc aatgacgagt cagacagata 5700
ctcgtcgact caggcgacga cggaattcct gcagcccatc tgcagaattc aggagagacc 5760
gggttggcgg cgtatttgtg tcccaaaaaa cagccccaat tgccccggag aagacggcca 5820
ggccgcctag atgacaaatt caacaactca cagctgactt tctgccattg ccactagggg 5880
ggggcctttt tatatggcca agccaagctc tccacgtcgg ttgggctgca cccaacaata 5940
aatgggtagg gttgcaccaa caaagggatg ggatgggggg tagaagatac gaggataacg 6000
gggctcaatg gcacaaataa gaacgaatac tgccattaag actcgtgatc cagcgactga 6060
caccattgca tcatctaagg gcctcaaaac tacctcggaa ctgctgcgct gatctggaca 6120
ccacagaggt tccgagcact ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa 6180
cgctggaaca gcgtgtacag tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg 6240
gtggtgtgac ttgttatagc ctttagagct gcgaaagcgc gtatggattt ggctcatcag 6300
gccagattga gggtctgtgg acacatgtca tgttagtgta cttcaatcgc cccctggata 6360
tagccccgac aataggccgt ggcctcattt ttttgccttc cgcacatttc cattgctcgg 6420
tacccacacc ttgcttctcc tgcacttgcc aaccttaata ctggtttaca ttgaccaaca 6480
tcttacaagc ggggggcttg tctagggtat atataaacag tggctctccc aatcggttgc 6540
cagtctcttt tttcctttct ttccccacag attcgaaatc taaactacac atcacacaat 6600
gcctgttact gacgtcctta agcgaaagtc cggtgtcatc gtcggcgacg atgtccgagc 6660
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 6720
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctcca tggctgagga 6780
taagaccaag gtcgagttcc ctaccctgac tgagctgaag cactctatcc ctaacgcttg 6840
ctttgagtcc aacctcggac tctcgctcta ctacactgcc cgagcgatct tcaacgcatc 6900
tgcctctgct gctctgctct acgctgcccg atctactccc ttcattgccg ataacgttct 6960
gctccacgct ctggtttgcg ccacctacat ctacgtgcag ggtgtcatct tctggggttt 7020
ctttaccgtc ggtcacgact gtggtcactc tgccttctcc cgataccact ccgtcaactt 7080
catcattggc tgcatcatgc actctgccat tctgactccc ttcgagtcct ggcgagtgac 7140
ccaccgacac catcacaaga acactggcaa cattgataag gacgagatct tctaccctca 7200
tcggtccgtc aaggacctcc aggacgtgcg acaatgggtc tacaccctcg gaggtgcttg 7260
gtttgtctac ctgaaggtcg gatatgctcc tcgaaccatg tcccactttg acccctggga 7320
ccctctcctg cttcgacgag cctccgctgt catcgtgtcc ctcggagtct gggctgcctt 7380
cttcgctgcc tacgcctacc tcacatactc gctcggcttt gccgtcatgg gcctctacta 7440
ctatgctcct ctctttgtct ttgcttcgtt cctcgtcatt actaccttct tgcatcacaa 7500
cgacgaagct actccctggt acggtgactc ggagtggacc tacgtcaagg gcaacctgag 7560
ctccgtcgac cgatcgtacg gagctttcgt ggacaacctg tctcaccaca ttggcaccca 7620
ccaggtccat cacttgttcc ctatcattcc ccactacaag ctcaacgaag ccaccaagca 7680
ctttgctgcc gcttaccctc acctcgtgag acgtaacgac gagcccatca ttactgcctt 7740
cttcaagacc gctcacctct ttgtcaacta cggagctgtg cccgagactg ctcagatttt 7800
caccctcaaa gagtctgccg ctgcagccaa ggccaagagc gactaagcgg ccgcaagtgt 7860
ggatggggaa gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt 7920
caacacaggg atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt 7980
ttgacacttg agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac 8040
atactcatac tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact 8100
cgtacagtgt gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta 8160
gttgc 8165
<210> 163
<211> 8633
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF4
<400> 163
catggtcggc ttcgacgaga ccgtcactat ggacaccgtc cgaaaccaca acatgcccga 60
cgatgcctgg tgcgctatcc acggcaccgt gtacgacatc accaagttct ccaaggtgca 120
tcctggtgga gacattatca tgctggccgc tggcaaggag gccaccatcc tgttcgagac 180
ctaccacatc aagggtgttc ccgacgctgt cctgcgaaag tacaaggtcg gcaagctccc 240
tcagggcaag aagggtgaga cctcccacat gcccaccgga ctcgactctg cctcctacta 300
ctcctgggac tctgagttct accgagtcct ccgagagcga gtcgccaaga agctggccga 360
gcccggtctc atgcagcgag ctcgaatgga gctctgggcc aaggctatct ttctcctggc 420
tggtttctgg ggatccctgt acgccatgtg cgtgctcgac cctcacggag gtgctatggt 480
cgctgccgtc accctcggtg tgtttgctgc cttcgtcgga acctgcatcc agcacgacgg 540
ctcccacgga gccttctcca agtctcgatt catgaacaag gctgccggtt ggaccctcga 600
catgattggt gcctccgcta tgacctggga gatgcagcac gtcctcggtc accatcccta 660
caccaacctg atcgagatgg agaacggtct ggccaaggtc aagggtgccg acgtggaccc 720
caagaaggtc gaccaggagt ccgaccctga cgtcttctct acctacccta tgctgcgact 780
gcatccctgg caccgacagc gattctacca caagcttcag cacctgtacg ctcccctgat 840
cttcggcttc atgaccatca acaaggtgat ctcccaggac gtcggtgtcg tgctgcgaaa 900
gcgactgttt cagatcgacg ccaactgccg atatggctct ccctggaacg tggctcgatt 960
ctggatcatg aagctcctga ccactctcta catggtggct ctgcccatgt acatgcaggg 1020
acccgctcag ggtctgaagc tgttctttat ggctcacttc acctgcggag aggtcctcgc 1080
caccatgttc attgttaacc acattatcga gggtgtctcc tacgcctcca aggacgctgt 1140
caagggcgtc atggctcctc cccgaaccgt gcacggtgtc actcccatgc aggtgaccca 1200
gaaggctctc tctgctgccg agtccaccaa gtctgacgct gacaagacca ctatgatccc 1260
tctcaacgac tgggctgccg tccagtgcca gacctccgtc aactgggctg tcggatcctg 1320
gttctggaac cacttctctg gaggtctcaa ccaccagatt gagcaccatt gctttcctca 1380
gaacccccac accgtcaacg tctacatctc cggcatcgtc aaggagacct gcgaggagta 1440
cggcgtgccc taccaggctg agatctccct cttctctgcc tatttcaaga tgctgtccca 1500
cctccgaacc ctcggcaacg aggacctcac cgcctggtcc acctaagcgg ccgcaagtgt 1560
ggatggggaa gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt 1620
caacacaggg atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt 1680
ttgacacttg agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac 1740
atactcatac tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact 1800
cgtacagtgt gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta 1860
gttgcgtacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 1920
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 1980
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 2040
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 2100
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 2160
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 2220
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 2280
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 2340
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 2400
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 2460
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 2520
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 2580
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 2640
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 2700
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 2760
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 2820
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 2880
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 2940
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 3000
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 3060
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 3120
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 3180
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 3240
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 3300
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 3360
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 3420
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 3480
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 3540
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 3600
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 3660
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 3720
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 3780
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 3840
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 3900
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 3960
cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 4020
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 4080
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 4140
gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 4200
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 4260
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 4320
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 4380
aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 4440
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 4500
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 4560
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg 4620
gccccccctc gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt cacacaaacc 4680
gatcttcgcc tcaaggaaac ctaattctac atccgagaga ctgccgagat ccagtctaca 4740
ctgattaatt ttcgggccaa taatttaaaa aaatcgtgtt atataatatt atatgtatta 4800
tatatataca tcatgatgat actgacagtc atgtcccatt gctaaataga cagactccat 4860
ctgccgcctc caactgatgt tctcaatatt taaggggtca tctcgcattg tttaataata 4920
aacagactcc atctaccgcc tccaaatgat gttctcaaaa tatattgtat gaacttattt 4980
ttattactta gtattattag acaacttact tgctttatga aaaacacttc ctatttagga 5040
aacaatttat aatggcagtt cgttcattta acaatttatg tagaataaat gttataaatg 5100
cgtatgggaa atcttaaata tggatagcat aaatgatatc tgcattgcct aattcgaaat 5160
caacagcaac gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa tatcaactat 5220
caaagaacag ctattcacac gttactattg agattattat tggacgagaa tcacacactc 5280
aactgtcttt ctctcttcta gaaatacagg tacaagtatg tactattctc attgttcata 5340
cttctagtca tttcatccca catattcctt ggatttctct ccaatgaatg acattctatc 5400
ttgcaaattc aacaattata ataagatata ccaaagtagc ggtatagtgg caatcaaaaa 5460
gcttctctgg tgtgcttctc gtatttattt ttattctaat gatccattaa aggtatatat 5520
ttatttcttg ttatataatc cttttgttta ttacatgggc tggatacata aaggtatttt 5580
gatttaattt tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt aatggtagga 5640
aattaccata cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg tatttccagg 5700
ttagacgttc cgcagaatct agaatgcggt atgcggtaca ttgttcttcg aacgtaaaag 5760
ttgcgctccc tgagatattg tacatttttg cttttacaag tacaagtaca tcgtacaact 5820
atgtactact gttgatgcat ccacaacagt ttgttttgtt tttttttgtt tttttttttt 5880
ctaatgattc attaccgcta tgtataccta cttgtacttg tagtaagccg ggttattggc 5940
gttcaattaa tcatagactt atgaatctgc acggtgtgcg ctgcgagtta cttttagctt 6000
atgcatgcta cttgggtgta atattgggat ctgttcggaa atcaacggat gctcaatcga 6060
tttcgacagt aattaattaa gtcatacaca agtcagcttt cttcgagcct catataagta 6120
taagtagttc aacgtattag cactgtaccc agcatctccg tatcgagaaa cacaacaaca 6180
tgccccattg gacagatcat gcggatacac aggttgtgca gtatcataca tactcgatca 6240
gacaggtcgt ctgaccatca tacaagctga acaagcgctc catacttgca cgctctctat 6300
atacacagtt aaattacata tccatagtct aacctctaac agttaatctt ctggtaagcc 6360
tcccagccag ccttctggta tcgcttggcc tcctcaatag gatctcggtt ctggccgtac 6420
agacctcggc cgacaattat gatatccgtt ccggtagaca tgacatcctc aacagttcgg 6480
tactgctgtc cgagagcgtc tcccttgtcg tcaagaccca ccccgggggt cagaataagc 6540
cagtcctcag agtcgccctt aggtcggttc tgggcaatga agccaaccac aaactcgggg 6600
tcggatcggg caagctcaat ggtctgcttg gagtactcgc cagtggccag agagcccttg 6660
caagacagct cggccagcat gagcagacct ctggccagct tctcgttggg agaggggact 6720
aggaactcct tgtactggga gttctcgtag tcagagacgt cctccttctt ctgttcagag 6780
acagtttcct cggcaccagc tcgcaggcca gcaatgattc cggttccggg tacaccgtgg 6840
gcgttggtga tatcggacca ctcggcgatt cggtgacacc ggtactggtg cttgacagtg 6900
ttgccaatat ctgcgaactt tctgtcctcg aacaggaaga aaccgtgctt aagagcaagt 6960
tccttgaggg ggagcacagt gccggcgtag gtgaagtcgt caatgatgtc gatatgggtt 7020
ttgatcatgc acacataagg tccgacctta tcggcaagct caatgagctc cttggtggtg 7080
gtaacatcca gagaagcaca caggttggtt ttcttggctg ccacgagctt gagcactcga 7140
gcggcaaagg cggacttgtg gacgttagct cgagcttcgt aggagggcat tttggtggtg 7200
aagaggagac tgaaataaat ttagtctgca gaacttttta tcggaacctt atctggggca 7260
gtgaagtata tgttatggta atagttacga gttagttgaa cttatagata gactggacta 7320
tacggctatc ggtccaaatt agaaagaacg tcaatggctc tctgggcgtc gcctttgccg 7380
acaaaaatgt gatcatgatg aaagccagca atgacgttgc agctgatatt gttgtcggcc 7440
aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca acgaagaatg tatcgtcaaa 7500
gtgatccaag cacactcata gttggagtcg tactccaaag gcggcaatga cgagtcagac 7560
agatactcgt cgactcaggc gacgacggaa ttcctgcagc ccatctgcag aattcaggag 7620
agaccgggtt ggcggcgtat ttgtgtccca aaaaacagcc ccaattgccc cggagaagac 7680
ggccaggccg cctagatgac aaattcaaca actcacagct gactttctgc cattgccact 7740
aggggggggc ctttttatat ggccaagcca agctctccac gtcggttggg ctgcacccaa 7800
caataaatgg gtagggttgc accaacaaag ggatgggatg gggggtagaa gatacgagga 7860
taacggggct caatggcaca aataagaacg aatactgcca ttaagactcg tgatccagcg 7920
actgacacca ttgcatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 7980
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 8040
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 8100
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 8160
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 8220
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 8280
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 8340
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 8400
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 8460
acaatgcctg ttactgacgt ccttaagcga aagtccggtg tcatcgtcgg cgacgatgtc 8520
cgagccgtga gtatccacga caagatcagt gtcgagacga cgcgttttgt gtaatgacac 8580
aatccgaaag tcgctagcaa cacacactct ctacacaaac taacccagct ctc 8633
<210> 164
<211> 8633
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF4S
<400> 164
catggtcggc ttcgacgaga ccgtcactat ggacaccgtc cgaaaccaca acatgcccga 60
cgatgcctgg tgcgctatcc acggcaccgt gtacgacatc accaagttct ccaaggtgca 120
tcctggtgga gacattatca tgctggccgc tggcaaggag gccaccatcc tgttcgagac 180
ctaccacatc aagggtgttc ccgacgctgt cctgcgaaag tacaaggtcg gcaagctccc 240
tcagggcaag aagggtgaga cctcccacat gcccaccgga ctcgactctg cctcctacta 300
ctcctgggac tctgagttct accgagtcct ccgagagcga gtcgccaaga agctggccga 360
gcccggtctc atgcagcgag ctcgaatgga gctctgggcc aaggctatct ttctcctggc 420
tggtttctgg ggatccctgt acgccatgtg cgtgctcgac cctcacggag gtgctatggt 480
cgctgccgtc accctcggtg tgtttgctgc cttcgtcgga acctgcatcc agcacgacgg 540
ctcccacgga gccttctcca agtctcgatt catgaacaag gctgccggtt ggaccctcga 600
catgattggt gcctccgcta tgacctggga gatgcagcac gtcctcggtc accatcccta 660
caccaacctg atcgagatgg agaacggtct ggccaaggtc aagggtgccg acgtggaccc 720
caagaaggtc gaccaggagt ccgaccctga cgtcttctct acctacccta tgctgcgact 780
gcatccctgg caccgacagc gattctacca caagtttcag cacctgtacg ctcccctgat 840
cttcggcttc atgaccatca acaaggtgat ctcccaggac gtcggtgtcg tgctgcgaaa 900
gcgactgttt cagatcgacg ccaactgccg atatggctct ccctggaacg tggctcgatt 960
ctggatcatg aagctcctga ccactctcta catggtggct ctgcccatgt acatgcaggg 1020
acccgctcag ggtctgaagc tgttctttat ggctcacttc acctgcggag aggtcctcgc 1080
caccatgttc attgttaacc acattatcga gggtgtctcc tacgcctcca aggacgctgt 1140
caagggcgtc atggctcctc cccgaaccgt gcacggtgtc actcccatgc aggtgaccca 1200
gaaggctctc tctgctgccg agtccaccaa gtctgacgct gacaagacca ctatgatccc 1260
tctcaacgac tgggctgccg tccagtgcca gacctccgtc aactgggctg tcggatcctg 1320
gttctggaac cacttctctg gaggtctcaa ccaccagatt gagcaccatt gctttcctca 1380
gaacccccac accgtcaacg tctacatctc cggcatcgtc aaggagacct gcgaggagta 1440
cggcgtgccc taccaggctg agatctccct cttctctgcc tatttcaaga tgctgtccca 1500
cctccgaacc ctcggcaacg aggacctcac cgcctggtcc acctaagcgg ccgcaagtgt 1560
ggatggggaa gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt 1620
caacacaggg atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt 1680
ttgacacttg agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac 1740
atactcatac tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact 1800
cgtacagtgt gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta 1860
gttgcgtacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 1920
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 1980
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 2040
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 2100
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 2160
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 2220
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 2280
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 2340
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 2400
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 2460
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 2520
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 2580
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 2640
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 2700
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 2760
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 2820
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 2880
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 2940
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 3000
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 3060
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 3120
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 3180
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 3240
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 3300
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 3360
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 3420
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 3480
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 3540
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 3600
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 3660
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 3720
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 3780
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 3840
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 3900
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 3960
cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 4020
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 4080
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 4140
gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 4200
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 4260
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 4320
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 4380
aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 4440
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 4500
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 4560
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg 4620
gccccccctc gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt cacacaaacc 4680
gatcttcgcc tcaaggaaac ctaattctac atccgagaga ctgccgagat ccagtctaca 4740
ctgattaatt ttcgggccaa taatttaaaa aaatcgtgtt atataatatt atatgtatta 4800
tatatataca tcatgatgat actgacagtc atgtcccatt gctaaataga cagactccat 4860
ctgccgcctc caactgatgt tctcaatatt taaggggtca tctcgcattg tttaataata 4920
aacagactcc atctaccgcc tccaaatgat gttctcaaaa tatattgtat gaacttattt 4980
ttattactta gtattattag acaacttact tgctttatga aaaacacttc ctatttagga 5040
aacaatttat aatggcagtt cgttcattta acaatttatg tagaataaat gttataaatg 5100
cgtatgggaa atcttaaata tggatagcat aaatgatatc tgcattgcct aattcgaaat 5160
caacagcaac gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa tatcaactat 5220
caaagaacag ctattcacac gttactattg agattattat tggacgagaa tcacacactc 5280
aactgtcttt ctctcttcta gaaatacagg tacaagtatg tactattctc attgttcata 5340
cttctagtca tttcatccca catattcctt ggatttctct ccaatgaatg acattctatc 5400
ttgcaaattc aacaattata ataagatata ccaaagtagc ggtatagtgg caatcaaaaa 5460
gcttctctgg tgtgcttctc gtatttattt ttattctaat gatccattaa aggtatatat 5520
ttatttcttg ttatataatc cttttgttta ttacatgggc tggatacata aaggtatttt 5580
gatttaattt tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt aatggtagga 5640
aattaccata cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg tatttccagg 5700
ttagacgttc cgcagaatct agaatgcggt atgcggtaca ttgttcttcg aacgtaaaag 5760
ttgcgctccc tgagatattg tacatttttg cttttacaag tacaagtaca tcgtacaact 5820
atgtactact gttgatgcat ccacaacagt ttgttttgtt tttttttgtt tttttttttt 5880
ctaatgattc attaccgcta tgtataccta cttgtacttg tagtaagccg ggttattggc 5940
gttcaattaa tcatagactt atgaatctgc acggtgtgcg ctgcgagtta cttttagctt 6000
atgcatgcta cttgggtgta atattgggat ctgttcggaa atcaacggat gctcaatcga 6060
tttcgacagt aattaattaa gtcatacaca agtcagcttt cttcgagcct catataagta 6120
taagtagttc aacgtattag cactgtaccc agcatctccg tatcgagaaa cacaacaaca 6180
tgccccattg gacagatcat gcggatacac aggttgtgca gtatcataca tactcgatca 6240
gacaggtcgt ctgaccatca tacaagctga acaagcgctc catacttgca cgctctctat 6300
atacacagtt aaattacata tccatagtct aacctctaac agttaatctt ctggtaagcc 6360
tcccagccag ccttctggta tcgcttggcc tcctcaatag gatctcggtt ctggccgtac 6420
agacctcggc cgacaattat gatatccgtt ccggtagaca tgacatcctc aacagttcgg 6480
tactgctgtc cgagagcgtc tcccttgtcg tcaagaccca ccccgggggt cagaataagc 6540
cagtcctcag agtcgccctt aggtcggttc tgggcaatga agccaaccac aaactcgggg 6600
tcggatcggg caagctcaat ggtctgcttg gagtactcgc cagtggccag agagcccttg 6660
caagacagct cggccagcat gagcagacct ctggccagct tctcgttggg agaggggact 6720
aggaactcct tgtactggga gttctcgtag tcagagacgt cctccttctt ctgttcagag 6780
acagtttcct cggcaccagc tcgcaggcca gcaatgattc cggttccggg tacaccgtgg 6840
gcgttggtga tatcggacca ctcggcgatt cggtgacacc ggtactggtg cttgacagtg 6900
ttgccaatat ctgcgaactt tctgtcctcg aacaggaaga aaccgtgctt aagagcaagt 6960
tccttgaggg ggagcacagt gccggcgtag gtgaagtcgt caatgatgtc gatatgggtt 7020
ttgatcatgc acacataagg tccgacctta tcggcaagct caatgagctc cttggtggtg 7080
gtaacatcca gagaagcaca caggttggtt ttcttggctg ccacgagctt gagcactcga 7140
gcggcaaagg cggacttgtg gacgttagct cgagcttcgt aggagggcat tttggtggtg 7200
aagaggagac tgaaataaat ttagtctgca gaacttttta tcggaacctt atctggggca 7260
gtgaagtata tgttatggta atagttacga gttagttgaa cttatagata gactggacta 7320
tacggctatc ggtccaaatt agaaagaacg tcaatggctc tctgggcgtc gcctttgccg 7380
acaaaaatgt gatcatgatg aaagccagca atgacgttgc agctgatatt gttgtcggcc 7440
aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca acgaagaatg tatcgtcaaa 7500
gtgatccaag cacactcata gttggagtcg tactccaaag gcggcaatga cgagtcagac 7560
agatactcgt cgactcaggc gacgacggaa ttcctgcagc ccatctgcag aattcaggag 7620
agaccgggtt ggcggcgtat ttgtgtccca aaaaacagcc ccaattgccc cggagaagac 7680
ggccaggccg cctagatgac aaattcaaca actcacagct gactttctgc cattgccact 7740
aggggggggc ctttttatat ggccaagcca agctctccac gtcggttggg ctgcacccaa 7800
caataaatgg gtagggttgc accaacaaag ggatgggatg gggggtagaa gatacgagga 7860
taacggggct caatggcaca aataagaacg aatactgcca ttaagactcg tgatccagcg 7920
actgacacca ttgcatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 7980
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 8040
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 8100
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 8160
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 8220
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 8280
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 8340
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 8400
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 8460
acaatgcctg ttactgacgt ccttaagcga aagtccggtg tcatcgtcgg cgacgatgtc 8520
cgagccgtga gtatccacga caagatcagt gtcgagacga cgcgttttgt gtaatgacac 8580
aatccgaaag tcgctagcaa cacacactct ctacacaaac taacccagct ctc 8633
<210> 165
<211> 10660
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZP2FOEN4
<400> 165
aaatagttgg agcaagggag aaatgtagag tgtgaaagac tcactatggt ccgggcttat 60
ctcgaccaat agccaaagtc tggagtttct gagagaaaaa ggcaagatac gtatgtaaca 120
aagcgacgca tggtacaata ataccggagg catgtatcat agagagttag tggttcgatg 180
atggcactgg tgcctggtat gactttatac ggctgactac atatttgtcc tcagacatac 240
aattacagtc aagcacttac ccttggacat ctgtaggtac cccccggcca agacgatctc 300
agcgtgtcgt atgtcggatt ggcgtagctc cctcgctcgt caattggctc ccatctactt 360
tcttctgctt ggctacaccc agcatgtctg ctatggctcg ttttcgtgcc ttatctatcc 420
tcccagtatt accaactcta aatgacatga tgtgattggg tctacacttt catatcagag 480
ataaggagta gcacagttgc ataaaaagcc caactctaat cagcttcttc ctttcttgta 540
attagtacaa aggtgattag cgaaatctgg aagcttagtt ggccctaaaa aaatcaaaaa 600
aagcaaaaaa cgaaaaacga aaaaccacag ttttgagaac agggaggtaa cgaaggatcg 660
tatatatata tatatatata tatacccacg gatcccgaga ccggcctttg attcttccct 720
acaaccaacc attctcacca ccctaattca caaccatggt cggcttcgac gagaccgtca 780
ctatggacac cgtccgaaac cacaacatgc ccgacgatgc ctggtgcgct atccacggca 840
ccgtgtacga catcaccaag ttctccaagg tgcatcctgg tggagacatt atcatgctgg 900
ccgctggcaa ggaggccacc atcctgttcg agacctacca catcaagggt gttcccgacg 960
ctgtcctgcg aaagtacaag gtcggcaagc tccctcaggg caagaagggt gagacctccc 1020
acatgcccac cggactcgac tctgcctcct actactcctg ggactctgag ttctaccgag 1080
tcctccgaga gcgagtcgcc aagaagctgg ccgagcccgg tctcatgcag cgagctcgaa 1140
tggagctctg ggccaaggct atctttctcc tggctggttt ctggggatcc ctgtacgcca 1200
tgtgcgtgct cgaccctcac ggaggtgcta tggtcgctgc cgtcaccctc ggtgtgtttg 1260
ctgccttcgt cggaacctgc atccagcacg acggctccca cggagccttc tccaagtctc 1320
gattcatgaa caaggctgcc ggttggaccc tcgacatgat tggtgcctcc gctatgacct 1380
gggagatgca gcacgtcctc ggtcaccatc cctacaccaa cctgatcgag atggagaacg 1440
gtctggccaa ggtcaagggt gccgacgtgg accccaagaa ggtcgaccag gagtccgacc 1500
ctgacgtctt ctctacctac cctatgctgc gactgcatcc ctggcaccga cagcgattct 1560
accacaagtt ccagcacctg tacgctcccc tgatcttcgg cttcatgacc atcaacaagg 1620
tgatctccca ggacgtcggt gtcgtgctgc gaaagcgact gtttcagatc gacgccaact 1680
gccgatatgg ctctccctgg aacgtggctc gattctggat catgaagctc ctgaccactc 1740
tctacatggt ggctctgccc atgtacatgc agggacccgc tcagggtctg aagctgttct 1800
ttatggctca cttcacctgc ggagaggtcc tcgccaccat gttcattgtt aaccacatta 1860
tcgagggtgt ctcctacgcc tccaaggacg ctgtcaaggg cgtcatggct cctccccgaa 1920
ccgtgcacgg tgtcactccc atgcaggtga cccagaaggc tctctctgct gccgagtcca 1980
ccaagtctga cgctgacaag accactatga tccctctcaa cgactgggct gccgtccagt 2040
gccagacctc cgtcaactgg gctgtcggat cctggttctg gaaccacttc tctggaggtc 2100
tcaaccacca gattgagcac cattgctttc ctcagaaccc ccacaccgtc aacgtctaca 2160
tctccggcat cgtcaaggag acctgcgagg agtacggcgt gccctaccag gctgagatct 2220
ccctcttctc tgcctatttc aagatgctgt cccacctccg aaccctcggc aacgaggacc 2280
tcaccgcctg gtccacctaa gcggccgcat tgatgattgg aaacacacac atgggttata 2340
tctaggtgag agttagttgg acagttatat attaaatcag ctatgccaac ggtaacttca 2400
ttcatgtcaa cgaggaacca gtgactgcaa gtaatataga atttgaccac cttgccattc 2460
tcttgcactc ctttactata tctcatttat ttcttatata caaatcactt cttcttccca 2520
gcatcgagct cggaaacctc atgagcaata acatcgtgga tctcgtcaat agagggcttt 2580
ttggactcct tgctgttggc caccttgtcc ttgctgtctg gctcattctg tttcaacgcc 2640
ttttaattaa gacgcccaag aacttccttg gtgattatgg aatacgtggt ctgctatatc 2700
tcaattttgc tgtaatgaat cattagaatt aaaaaaaaaa ccccattttt gtgtgattgt 2760
cggccaagag atggaacagg aagaatacgt gaacaagcga gcacgaatgc catatgctct 2820
tctgaacaac cgagtccgaa tccgatttgt gggtatcaca tgtctcaagt agctgaaatg 2880
tatttcgcta gaataaaata aatgagatta agaattaaaa atattggaat atattttcct 2940
agaatagaaa ctttggattt tttttcggct attacagtct gaactggaca aacggctgac 3000
tatatataaa tattattggg tctgttttct tgtttatgtc gaaattatct gggttttact 3060
actgtgtcgt cgagtataga gtggcctgac tggagaaaat gcagtagtat ggacagtagg 3120
tactgccagc cagagaagtt tttggaattg atacttgagt catttttcca ttccccattc 3180
cccattccaa cacaatcaac tgtttctgaa cattttccaa aacgcggaga tgtatgtcac 3240
ttgggcactg caagtttggg attcaaaatg catctctttc agaccaaagt gtcatcagcg 3300
catgcgacgt cgggcccaat tcgccctata gtgagtcgta ttacaattca ctggccgtcg 3360
ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc cttgcagcac 3420
atcccccttt cgccagctgg cgtaatagcg aagaggcccg caccgatcgc ccttcccaac 3480
agttgcgcag cctgaatggc gaatggacgc gccctgtagc ggcgcattaa gcgcggcggg 3540
tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt 3600
cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 3660
ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 3720
ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 3780
gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 3840
tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa 3900
aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat 3960
ttcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catcaggtgg 4020
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa 4080
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 4140
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 4200
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 4260
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 4320
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 4380
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 4440
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 4500
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 4560
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 4620
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 4680
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 4740
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 4800
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 4860
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 4920
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 4980
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 5040
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 5100
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 5160
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 5220
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 5280
gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta 5340
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 5400
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 5460
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 5520
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 5580
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 5640
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 5700
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 5760
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 5820
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 5880
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 5940
ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 6000
ctggcgcgcc ggcaatacgg gggagaagcg atcgcccgtc tgttcaatcg ccacaagtcc 6060
gagtaatgct cgagtatcga agtcttgtac ctccctgtca atcatggcac cactggtctt 6120
gacttgtcta ttcatactgg acaagcgcca gagttaagct tgtagcgaat ttcgccctcg 6180
gacatcaccc catacgacgg acacacatgc ccgacaaaca gcctctctta ttgtagctga 6240
aagtatattg aatgtgaacg tgtacaatat caggtaccag cgggaggtta cggccaaggt 6300
gataccggaa taaccctggc ttggagatgg tcggtccatt gtactgaagt gtccgtgtcg 6360
tttccgtcac tgccccaatt ggacatgttt gtttttccga tctttcgggc gccctctcct 6420
tgtctccttg tctgtctcct ggactgttgc taccccattt ctttggcctc cattggttcc 6480
tccccgtctt tcacgtcgtc tatggttgca tggtttccct tatacttttc cccacagtca 6540
catgttatgg aggggtctag agtcatacac aagtcagctt tcttcgagcc tcatataagt 6600
ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac 6660
atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc 6720
agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta 6780
tatacacagt taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc 6840
ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta 6900
cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg 6960
gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag 7020
ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg 7080
gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt 7140
gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac 7200
taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga 7260
gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg 7320
ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt 7380
gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag 7440
ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt 7500
tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt 7560
ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg 7620
agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt 7680
gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc 7740
agtgaagtat atgttatggt aatagttacg agttagttga acttatagat agactggact 7800
atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc 7860
gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc 7920
caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa 7980
agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga 8040
cagatactca ctagtgcttc caaacactat acagtggttc tgggtcgttt atggcaagga 8100
atactcactc agcagttgcc ggctgggcag caggggcttt tgtgttggaa acatatcgca 8160
gaccaagaga atacttggat ctggagattc tggccaggtt agtggcccgt cgggcgagtc 8220
gcgattgcat gttagtatac agagacaaat caagacgctt gcaatcttat aaaccacccg 8280
gtgagtaatt gcggagacaa ggacgtgaaa aattgccaac cttaatccgg ctgcagggta 8340
agcgataaac accactaaaa ccccacaaaa tatatcttac cgaatataca gatcccgtca 8400
acagttttat atatcgtagt tacaaccatc aacacttttt ggtaagtgta ccattctata 8460
ctccaactgg tctgcaactg tacaagtaga catgttaatg gtagttaata acatctacag 8520
cagaacctat ggtaaagaca ttgcattttt acaggaagta tcgtcctaca cgttgataaa 8580
tccaaagatg cggaacttct tccactttta tcatcatccc ctactcgtac actcgtactc 8640
tttgttcgat cgcgattcat ttctataaat aatcttgtat gtacatgcgg ccgcttagtc 8700
gatctttcga gatcgtgttc ttcgaacgga gggtgctcgg gtagtctcgg caggtttgac 8760
ggagctggca ccgtcgcctc gagacttgtt ggagtaggct ttgaggtaga agttgccaaa 8820
cagcacgagc atgttggtca tgacgaacat ctgagcccaa ggaagtgtaa cgggacagtg 8880
cttctgtctc aagacaaaca cggcatgagc gaagacaatg acgaattgca gcatctgtgc 8940
ctgagtgatg tatcgcttcc agggacatcg aatgccaaga gcagacatga gatagtacga 9000
gtacatgacg atgtgaatga aggaattgca ggcagcacca aagtaggcgt cgatgcaatc 9060
gttggtagcc atgagatgac acaccagcca ccaggcccaa atgagcagtg cgtgatggta 9120
aacgtggaga aacgacagct gcttggtctt cttccgagca accatgaaca cggtgtcaag 9180
cagctccaga tacttgttgt tgtagtgcag ccacacaccg agcagaatct tgaaggactt 9240
tcgatcgctc caaggcatgg tggaacccca gacgggctgt cccagtccag agatttctcg 9300
agcaaacatt ccgagcacga caacgttgaa agcagtctgg taggcgttgt atgccagcat 9360
gaagcccttg ggatcaaagg cctctcgctt ggccatgagt cgaggaccga ccaggcagaa 9420
gagcaggtac atggtagtgg caatagcggg aagtcgcaag gacagggctc cgatccactc 9480
tcgtgcgtcc acgttgtcga tgccgttggc gtgcgaccac tcgaaggcgt aggcgtaggt 9540
agcgtaggcg taggcagcgg aggcaatggc aggaagcaga gcaccagagg cagccatgga 9600
gagctgggtt agtttgtgta gagagtgtgt gttgctagcg actttcggat tgtgtcatta 9660
cacaaaacgc gtcgtctcga cactgatctt gtcgtggata ctcacggctc ggacatcgtc 9720
gccgacgatg acaccggact ttcgcttaag gacgtcagta acaggcattg tgtgatgtgt 9780
agtttagatt tcgaatctgt ggggaaagaa aggaaaaaag agactggcaa ccgattggga 9840
gagccactgt ttatatatac cctagacaag ccccccgctt gtaagatgtt ggtcaatgta 9900
aaccagtatt aaggttggca agtgcaggag aagcaaggtg tgggtaccga gcaatggaaa 9960
tgtgcggaag gcaaaaaaat gaggccacgg cctattgtcg gggctatatc cagggggcga 10020
ttgaagtaca ctaacatgac atgtgtccac agaccctcaa tctggcctga tgagccaaat 10080
ccatacgcgc tttcgcagct ctaaaggcta taacaagtca caccaccctg ctcgacctca 10140
gcgccctcac tttttgttaa gacaaactgt acacgctgtt ccagcgtttt ctgcctgcac 10200
ctggtgggac atttggtgca acctaaagtg ctcggaacct ctgtggtgtc cagatcagcg 10260
cagcagttcc gaggtagttt tgaggccctt agatgatgca atggtgtcag tcgctggatc 10320
acgagtctta atggcagtat tcgttcttat ttgtgccatt gagccccgtt atcctcgtat 10380
cttctacccc ccatcccatc cctttgttgg tgcaacccta cccatttatt gttgggtgca 10440
gcccaaccga cgtggagagc ttggcttggc catataaaaa ggcccccccc tagtggcaat 10500
ggcagaaagt cagctgtgag ttgttgaatt tgtcatctag gcggcctggc cgtcttctcc 10560
ggggcaattg gggctgtttt ttgggacaca aatacgccgc caacccggtc tctcctgaat 10620
tctgcagatg ggctgcagga attccgtcgt cgcctgagtc 10660
<210> 166
<211> 6457
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pKUNT2
<400> 166
tttgaatcga atcgatgagc ctaaaatgaa cccgagtata tctcataaaa ttctcggtga 60
gaggtctgtg actgtcagta caaggtgcct tcattatgcc ctcaacctta ccatacctca 120
ctgaatgtag tgtacctcta aaaatgaaat acagtgccaa aagccaaggc actgagctcg 180
tctaacggac ttgatataca accaattaaa acaaatgaaa agaaatacag ttctttgtat 240
catttgtaac aattaccctg tacaaactaa ggtattgaaa tcccacaata ttcccaaagt 300
ccaccccttt ccaaattgtc atgcctacaa ctcatatacc aagcactaac ctaccgttta 360
aacaccacta aaaccccaca aaatatatct taccgaatat acagatctgc gacgacggaa 420
ttcctgcagc ccatctgcag aattcaggag agaccgggtt ggcggcgtat ttgtgtccca 480
aaaaacagcc ccaattgccc caattgaccc caaattgacc cagtagcggg cccaaccccg 540
gcgagagccc ccttcacccc acatatcaaa cctcccccgg ttcccacact tgccgttaag 600
ggcgtagggt actgcagtct ggaatctacg cttgttcaga ctttgtacta gtttctttgt 660
ctggccatcc gggtaaccca tgccggacgc aaaatagact actgaaaatt tttttgcttt 720
gtggttggga ctttagccaa gggtataaaa gaccaccgtc cccgaattac ctttcctctt 780
cttttctctc tctccttgtc aactcacacc cgaaatcgtt aagcatttcc ttctgagtat 840
aagaatcatt caccatggat tcgaccacgc agaccaacac cggcaccggc aaggtggccg 900
tgcagccccc cacggccttc attaagccca ttgagaaggt gtccgagccc gtctacgaca 960
cctttggcaa cgagttcact cctccagact actctatcaa ggatattctg gatgccattc 1020
cccaggagtg ctacaagcgg tcctacgtta agtcctactc gtacgtggcc cgagactgct 1080
tctttatcgc cgtttttgcc tacatggcct acgcgtacct gcctcttatt ccctcggctt 1140
ccggccgagc tgtggcctgg gccatgtact ccattgtcca gggtctgttt ggcaccggtc 1200
tgtgggttct tgcccacgag tgtggccact ctgctttctc cgactctaac accgtcaaca 1260
acgtcaccgg atgggttctg cactcctcca tgctggtccc ttactacgcc tggaagctga 1320
cccactccat gcaccacaag tccactggtc acctcacccg tgatatggtg tttgtgccca 1380
aggaccgaaa ggagtttatg gagaaccgag gcgcccatga ctggtctgag cttgctgagg 1440
acgctcccct catgaccctc tacggcctca tcacccagca ggtgtttgga tggcctctgt 1500
atctgctgtc ttacgttacc ggacagaagt accccaagct caacaaatgg gctgtcaacc 1560
acttcaaccc caacgccccg ctgtttgaga agaaggactg gttcaacatc tggatctcta 1620
acgtcggtat tggtatcacc atgtccgtca tcgcatactc catcaaccga tggggcctgg 1680
cttccgtcac cctctactac ctgatcccct acctgtgggt caaccactgg ctcgtggcca 1740
tcacctacct gcagcacacc gaccccactc tgccccacta ccacgccgac cagtggaact 1800
tcacccgagg agccgccgcc accatcgacc gagagtttgg cttcatcggc tccttctgct 1860
tccatgacat catcgagacc cacgttctgc accactacgt gtctcgaatt cccttctaca 1920
acgcccgaat cgccactgag aagatcaaga aggtcatggg caagcactac cgacacgacg 1980
acaccaactt catcaagtct ctttacactg tcgcccgaac ctgccagttt gttgaaggta 2040
aggaaggcat tcagatgttt agaaacgtca atggagtcgg agttgctcct gacggcctgc 2100
cttctaaaaa gtaggcggcc gcaagtgtgg atggggaagt gagtgcccgg ttctgtgtgc 2160
acaattggca atccaagatg gatggattca acacagggat atagcgagct acgtggtggt 2220
gcgaggatat agcaacggat atttatgttt gacacttgag aatgtacgat acaagcactg 2280
tccaagtaca atactaaaca tactgtacat actcatactc gtacccgggc aacggtttca 2340
cttgagtgca gtggctagtg ctcttactcg tacagtgtgc aatactgcgt atcatagtct 2400
ttgatgtata tcgtattcat tcatgttagt tgcgtacgaa gtcgtcaatg atgtcgatat 2460
gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg agctccttgg 2520
tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg agcttgagca 2580
ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag ggcattttgg 2640
tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga accttatctg 2700
gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat agatagactg 2760
gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg gcgtcgcctt 2820
tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg atattgttgt 2880
cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa gaatgtatcg 2940
tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc aatgacgagt 3000
cagacagata ctcgtcgacc ttttccttgg gaaccaccac cgtcagccct tctgactcac 3060
gtattgtagc caccgacaca ggcaacagtc cgtggatagc agaatatgtc ttgtcggtcc 3120
atttctcacc aactttaggc gtcaagtgaa tgttgcagaa gaagtatgtg ccttcattga 3180
gaatcggtgt tgctgatttc aataaagtct tgagatcagt ttggcgcgcc agctgcatta 3240
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 3300
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 3360
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 3420
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 3480
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 3540
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 3600
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 3660
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 3720
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 3780
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 3840
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 3900
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 3960
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 4020
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 4080
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 4140
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 4200
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 4260
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 4320
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 4380
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 4440
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 4500
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 4560
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 4620
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 4680
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 4740
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 4800
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 4860
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 4920
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 4980
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 5040
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 5100
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 5160
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 5220
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg aaattgtaag 5280
cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca 5340
ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag 5400
tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg 5460
gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt 5520
tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag 5580
agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc 5640
gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc 5700
gcttaatgcg ccgctacagg gcgcgtccat tcgccattca ggctgcgcaa ctgttgggaa 5760
gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca 5820
aggcgattaa gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggcc 5880
agtgaattgt aatacgactc actatagggc gaattgggcc cgacgtcgca tgcagtggtg 5940
gtattgtgac tggggatgta gttgagaata agtcatacac aagtcagctt tcttcgagcc 6000
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 6060
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 6120
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 6180
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 6240
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 6300
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 6360
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 6420
tcagaataag ccagtcctca gagtcgccct taattaa 6457
<210> 167
<211> 7879
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW237
<400> 167
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000
gacgagtcag acagatactc gtcgactcag gcgacgacgg aattcctgca gcccatctgc 6060
agaattcagg agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc 6120
cccggagaag acggccaggc cgcctagatg acaaattcaa caactcacag ctgactttct 6180
gccattgcca ctaggggggg gcctttttat atggccaagc caagctctcc acgtcggttg 6240
ggctgcaccc aacaataaat gggtagggtt gcaccaacaa agggatggga tggggggtag 6300
aagatacgag gataacgggg ctcaatggca caaataagaa cgaatactgc cattaagact 6360
cgtgatccag cgactgacac cattgcatca tctaagggcc tcaaaactac ctcggaactg 6420
ctgcgctgat ctggacacca cagaggttcc gagcacttta ggttgcacca aatgtcccac 6480
caggtgcagg cagaaaacgc tggaacagcg tgtacagttt gtcttaacaa aaagtgaggg 6540
cgctgaggtc gagcagggtg gtgtgacttg ttatagcctt tagagctgcg aaagcgcgta 6600
tggatttggc tcatcaggcc agattgaggg tctgtggaca catgtcatgt tagtgtactt 6660
caatcgcccc ctggatatag ccccgacaat aggccgtggc ctcatttttt tgccttccgc 6720
acatttccat tgctcggtac ccacaccttg cttctcctgc acttgccaac cttaatactg 6780
gtttacattg accaacatct tacaagcggg gggcttgtct agggtatata taaacagtgg 6840
ctctcccaat cggttgccag tctctttttt cctttctttc cccacagatt cgaaatctaa 6900
actacacatc acacaatgcc tgttactgac gtccttaagc gaaagtccgg tgtcatcgtc 6960
ggcgacgatg tccgagccgt gagtatccac gacaagatca gtgtcgagac gacgcgtttt 7020
gtgtaatgac acaatccgaa agtcgctagc aacacacact ctctacacaa actaacccag 7080
ctctccatgg ctctggccaa cgacgctggc gagcgaatct gggctgccgt caccgatccc 7140
gaaatcctca ttggcacctt ctcctacctg ctcctgaagc ctctcctgcg aaactctggt 7200
ctcgtggacg agaagaaagg agcctaccga acctccatga tctggtacaa cgtcctcctg 7260
gctctcttct ctgccctgtc cttctacgtg actgccaccg ctctcggctg ggactacggt 7320
actggagcct ggctgcgaag acagaccggt gatactcccc agcctctctt tcagtgtccc 7380
tctcctgtct gggactccaa gctgttcacc tggactgcca aggccttcta ctattctaag 7440
tacgtggagt acctcgacac cgcttggctg gtcctcaagg gcaagcgagt gtcctttctg 7500
caggccttcc atcactttgg agctccctgg gacgtctacc tcggcattcg actgcacaac 7560
gagggtgtgt ggatcttcat gttctttaac tcgttcattc acaccatcat gtacacctac 7620
tatggactga ctgccgctgg ctacaagttc aaggccaagc ctctgatcac tgccatgcag 7680
atttgccagt tcgtcggtgg ctttctcctg gtctgggact acatcaacgt tccctgcttc 7740
aactctgaca agggcaagct gttctcctgg gctttcaact acgcctacgt cggatctgtc 7800
tttctcctgt tctgtcactt cttttaccag gacaacctgg ccaccaagaa atccgctaag 7860
gctggtaagc agctttagc 7879
<210> 168
<211> 8502
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY54PC
<400> 168
ggccgccacc gcggcccgag attccggcct cttcggccgc caagcgaccc gggtggacgt 60
ctagaggtac ctagcaatta acagatagtt tgccggtgat aattctctta acctcccaca 120
ctcctttgac ataacgattt atgtaacgaa actgaaattt gaccagatat tgtgtccgcg 180
gtggagctcc agcttttgtt ccctttagtg agggttaatt aatcgagctt ggcgtaatca 240
tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 300
gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 360
gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 420
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 480
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 540
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 600
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 660
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 720
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 780
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 840
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 900
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 960
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 1020
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 1080
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 1140
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 1200
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 1260
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 1320
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 1380
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 1440
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 1500
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 1560
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 1620
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 1680
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 1740
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 1800
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 1860
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 1920
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 1980
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 2040
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 2100
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 2160
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 2220
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 2280
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 2340
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg 2400
ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 2460
cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 2520
gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 2580
ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 2640
ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 2700
ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 2760
attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 2820
aattttaaca aaatattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt 2880
gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg 2940
ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga 3000
cggccagtga attgtaatac gactcactat agggcgaatt gggtaccggg ccccccctcg 3060
aggtcgacgg tatcgataag cttgatatcg aattcatgtc acacaaaccg atcttcgcct 3120
caaggaaacc taattctaca tccgagagac tgccgagatc cagtctacac tgattaattt 3180
tcgggccaat aatttaaaaa aatcgtgtta tataatatta tatgtattat atatatacat 3240
catgatgata ctgacagtca tgtcccattg ctaaatagac agactccatc tgccgcctcc 3300
aactgatgtt ctcaatattt aaggggtcat ctcgcattgt ttaataataa acagactcca 3360
tctaccgcct ccaaatgatg ttctcaaaat atattgtatg aacttatttt tattacttag 3420
tattattaga caacttactt gctttatgaa aaacacttcc tatttaggaa acaatttata 3480
atggcagttc gttcatttaa caatttatgt agaataaatg ttataaatgc gtatgggaaa 3540
tcttaaatat ggatagcata aatgatatct gcattgccta attcgaaatc aacagcaacg 3600
aaaaaaatcc cttgtacaac ataaatagtc atcgagaaat atcaactatc aaagaacagc 3660
tattcacacg ttactattga gattattatt ggacgagaat cacacactca actgtctttc 3720
tctcttctag aaatacaggt acaagtatgt actattctca ttgttcatac ttctagtcat 3780
ttcatcccac atattccttg gatttctctc caatgaatga cattctatct tgcaaattca 3840
acaattataa taagatatac caaagtagcg gtatagtggc aatcaaaaag cttctctggt 3900
gtgcttctcg tatttatttt tattctaatg atccattaaa ggtatatatt tatttcttgt 3960
tatataatcc ttttgtttat tacatgggct ggatacataa aggtattttg atttaatttt 4020
ttgcttaaat tcaatccccc ctcgttcagt gtcaactgta atggtaggaa attaccatac 4080
ttttgaagaa gcaaaaaaaa tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc 4140
gcagaatcta gaatgcggta tgcggtacat tgttcttcga acgtaaaagt tgcgctccct 4200
gagatattgt acatttttgc ttttacaagt acaagtacat cgtacaacta tgtactactg 4260
ttgatgcatc cacaacagtt tgttttgttt ttttttgttt tttttttttc taatgattca 4320
ttaccgctat gtatacctac ttgtacttgt agtaagccgg gttattggcg ttcaattaat 4380
catagactta tgaatctgca cggtgtgcgc tgcgagttac ttttagctta tgcatgctac 4440
ttgggtgtaa tattgggatc tgttcggaaa tcaacggatg ctcaaccgat ttcgacagta 4500
ataatttgaa tcgaatcgga gcctaaaatg aacccgagta tatctcataa aattctcggt 4560
gagaggtctg tgactgtcag tacaaggtgc cttcattatg ccctcaacct taccatacct 4620
cactgaatgt agtgtacctc taaaaatgaa atacagtgcc aaaagccaag gcactgagct 4680
cgtctaacgg acttgatata caaccaatta aaacaaatga aaagaaatac agttctttgt 4740
atcatttgta acaattaccc tgtacaaact aaggtattga aatcccacaa tattcccaaa 4800
gtccacccct ttccaaattg tcatgcctac aactcatata ccaagcacta acctaccaaa 4860
caccactaaa accccacaaa atatatctta ccgaatatac agtaacaagc taccaccaca 4920
ctcgttgggt gcagtcgcca gcttaaagat atctatccac atcagccaca actcccttcc 4980
tttaataaac cgactacacc cttggctatt gaggttatga gtgaatatac tgtagacaag 5040
acactttcaa gaagactgtt tccaaaacgt accactgtcc tccactacaa acacacccaa 5100
tctgcttctt ctagtcaagg ttgctacacc ggtaaattat aaatcatcat ttcattagca 5160
gggcagggcc ctttttatag agtcttatac actagcggac cctgccggta gaccaacccg 5220
caggcgcgtc agtttgctcc ttccatcaat gcgtcgtaga aacgacttac tccttcttga 5280
gcagctcctt gaccttgttg gcaacaagtc tccgacctcg gaggtggagg aagagcctcc 5340
gatatcggcg gtagtgatac cagcctcgac ggactccttg acggcagcct caacagcgtc 5400
accggcgggc ttcatgttaa gagagaactt gagcatcatg gcggcagaca gaatggtggc 5460
aatggggttg accttctgct tgccgagatc gggggcagat ccgtgacagg gctcgtacag 5520
accgaacgcc tcgttggtgt cgggcagaga agccagagag gcggagggca gcagacccag 5580
agaaccgggg atgacggagg cctcgtcgga gatgatatcg ccaaacatgt tggtggtgat 5640
gatgatacca ttcatcttgg agggctgctt gatgaggatc atggcggccg agtcgatcag 5700
ctggtggttg agctcgagct gggggaattc gtccttgagg actcgagtga cagtctttcg 5760
ccaaagtcga gaggaggcca gcacgttggc cttgtcaaga gaccacacgg gaagaggggg 5820
gttgtgctga agggccagga aggcggccat tcgggcaatt cgctcaacct caggaacgga 5880
gtaggtctcg gtgtcggaag cgacgccaga tccgtcatcc tcctttcgct ctccaaagta 5940
gatacctccg acgagctctc ggacaatgat gaagtcggtg ccctcaacgt ttcggatggg 6000
ggagagatcg gcgagcttgg gcgacagcag ctggcagggt cgcaggttgg cgtacaggtt 6060
caggtccttt cgcagcttga ggagaccctg ctcgggtcgc acgtcggttc gtccgtcggg 6120
agtggtccat acggtgttgg cagcgcctcc gacagcaccg agcataatag agtcagcctt 6180
tcggcagatg tcgagagtag cgtcggtgat gggctcgccc tccttctcaa tggcagctcc 6240
tccaatgagt cggtcctcaa acacaaactc ggtgccggag gcctcagcaa cagacttgag 6300
caccttgacg gcctcggcaa tcacctcggg gccacagaag tcgccgccga gaagaacaat 6360
cttcttggag tcagtcttgg tcttcttagt ttcgggttcc attgtggatg tgtgtggttg 6420
tatgtgtgat gtggtgtgtg gagtgaaaat ctgtggctgg caaacgctct tgtatatata 6480
cgcacttttg cccgtgctat gtggaagact aaacctccga agattgtgac tcaggtagtg 6540
cggtatcggc tagggaccca aaccttgtcg atgccgatag cgctatcgaa cgtaccccag 6600
ccggccggga gtatgtcgga ggggacatac gagatcgtca agggtttgtg gccaactggt 6660
aaataaatga tgactcaggc gacgacggaa ttcctgcagc ccatcgatgc agaattcagg 6720
agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc cccaattgac 6780
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttcacc ccacatatca 6840
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 6900
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 6960
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 7020
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 7080
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaccatgg ctgctgctcc 7140
cagtgtgagg acgtttactc gggccgaggt tttgaatgcc gaggctctga atgagggcaa 7200
gaaggatgcc gaggcaccct tcttgatgat catcgacaac aaggtgtacg atgtccgcga 7260
gttcgtccct gatcatcccg gtggaagtgt gattctcacg cacgttggca aggacggcac 7320
tgacgtcttt gacacttttc accccgaggc tgcttgggag actcttgcca acttttacgt 7380
tggtgatatt gacgagagcg accgcgatat caagaatgat gactttgcgg ccgaggtccg 7440
caagctgcgt accttgttcc agtctcttgg ttactacgat tcttccaagg catactacgc 7500
cttcaaggtc tcgttcaacc tctgcatctg gggtttgtcg acggtcattg tggccaagtg 7560
gggccagacc tcgaccctcg ccaacgtgct ctcggctgcg cttttgggtc tgttctggca 7620
gcagtgcgga tggttggctc acgacttttt gcatcaccag gtcttccagg accgtttctg 7680
gggtgatctt ttcggcgcct tcttgggagg tgtctgccag ggcttctcgt cctcgtggtg 7740
gaaggacaag cacaacactc accacgccgc ccccaacgtc cacggcgagg atcccgacat 7800
tgacacccac cctctgttga cctggagtga gcatgcgttg gagatgttct cggatgtccc 7860
agatgaggag ctgacccgca tgtggtcgcg tttcatggtc ctgaaccaga cctggtttta 7920
cttccccatt ctctcgtttg cccgtctctc ctggtgcctc cagtccattc tctttgtgct 7980
gcctaacggt caggcccaca agccctcggg cgcgcgtgtg cccatctcgt tggtcgagca 8040
gctgtcgctt gcgatgcact ggacctggta cctcgccacc atgttcctgt tcatcaagga 8100
tcccgtcaac atgctggtgt actttttggt gtcgcaggcg gtgtgcggaa acttgttggc 8160
gatcgtgttc tcgctcaacc acaacggtat gcctgtgatc tcgaaggagg aggcggtcga 8220
tatggatttc ttcacgaagc agatcatcac gggtcgtgat gtccacccgg gtctatttgc 8280
caactggttc acgggtggat tgaactatca gatcgagcac cacttgttcc cttcgatgcc 8340
tcgccacaac ttttcaaaga tccagcctgc tgtcgagacc ctgtgcaaaa agtacaatgt 8400
ccgataccac accaccggta tgatcgaggg aactgcagag gtctttagcc gtctgaacga 8460
ggtctccaag gctacctcca agatgggtaa ggcgcagtaa gc 8502
<210> 169
<211> 7145
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pKUNFmkF2
<220>
<221> misc_feature
<222> (692)..(695)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (700)..(700)
<223> n is a, c, g, or t
<400> 169
catggcgtcc acttcggctc tgcccaagca gaaccctgcg cttagacgca ccgtcacctc 60
aactactgtg acggattctg agtctgccgc cgtctctcct tcagactctc cccgccactc 120
ggcctcttcc acatcgctct cgtccatgtc cgaggttgat atcgccaagc ccaagtccga 180
gtatggtgtc atgctcgaca cctacggcaa ccagttcgag gttcccgact ttaccatcaa 240
ggacatctac aatgccatcc ctaagcactg cttcaagcgc tccgctctca agggatacgg 300
ttatatcctc cgcgacattg tcctcctgac taccactttc agcatctggt acaactttgt 360
gacccccgaa tatatcccct ccacccccgc ccgcgctggt ctgtgggccg tgtacaccgt 420
tcttcagggt cttttcggta ctggtctctg ggttattgcc catgagtgcg gtcacggtgc 480
tttctccgat tctcgcatca tcaacgacat tactggctgg gttcttcact cttccctcct 540
tgtcccctac ttcagctggc aaatctccca ccgaaagcac cacaaggcca ctggcaacat 600
ggagcgtgac atggtcttcg ttccccgaac ccgcgagcag caggctactc gtctcggaaa 660
gatgacccac gagctcgctc atcttactga gnnnntcgtn ggctggccca actacctcat 720
caccaatgtt accggccaca actaccacga gcgccagcgt gagggtcgcg gcaagggcaa 780
gcataacggc ctcggcggtg gtgttaacca cttcgatccc cgcagccctc tgtacgagaa 840
cagtgacgct aagctcatcg tcctcagcga tattggtatc ggtctgatgg ccactgctct 900
gtacttcctc gttcagaagt tcggtttcta caacatggcc atctggtact ttgttcccta 960
cctctgggtt aaccactggc tcgttgccat caccttcctc cagcacaccg accctaccct 1020
tccccactac accaacgacg agtggaactt cgtccgtggt gccgctgcta ccattgaccg 1080
tgagatgggc ttcatcggcc gccaccttct ccacggcatc atcgagactc atgtcctcca 1140
ccactacgtc agcagcatcc ccttctacaa cgcggacgag gccaccgagg ccattaagcc 1200
catcatgggc aagcactacc gggctgatgt ccaggatggt cctcgtggct tcatccgcgc 1260
catgtaccgc agtgcgcgta tgtgccagtg ggttgagccc agcgctggtg ccgagggtgc 1320
tggtaagggt gttctgttct tccgcaaccg caacaacgtg ggcacccccc ccgctgttat 1380
caagcccgtt gcttaagtag gcgcggccgc tatttatcac tctttacaac ttctacctca 1440
actatctact ttaataaatg aatatcgttt attctctatg attactgtat atgcgttcct 1500
ctaagacaaa tcgaaaccag catgtgatcg aatggcatac aaaagtttct tccgaagttg 1560
atcaatgtcc tgatagtcag gcagcttgag aagattgaca caggtggagg ccgtagggaa 1620
ccgatcaacc tgtctaccag cgttacgaat ggcaaatgac gggttcaaag ccttgaatcc 1680
ttgcaatggt gccttggata ctgatgtcac aaacttaaga agcagccgct tgtcctcttc 1740
ctcgatcgat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 1800
aacgtacgaa gtcgtcaatg atgtcgatat gggttttgat catgcacaca taaggtccga 1860
ccttatcggc aagctcaatg agctccttgg tggtggtaac atccagagaa gcacacaggt 1920
tggttttctt ggctgccacg agcttgagca ctcgagcggc aaaggcggac ttgtggacgt 1980
tagctcgagc ttcgtaggag ggcattttgg tggtgaagag gagactgaaa taaatttagt 2040
ctgcagaact ttttatcgga accttatctg gggcagtgaa gtatatgtta tggtaatagt 2100
tacgagttag ttgaacttat agatagactg gactatacgg ctatcggtcc aaattagaaa 2160
gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc 2220
cagcaatgac gttgcagctg atattgttgt cggccaaccg cgccgaaaac gcagctgtca 2280
gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg 2340
agtcgtactc caaaggcggc aatgacgagt cagacagata ctcgtcgacc ttttccttgg 2400
gaaccaccac cgtcagccct tctgactcac gtattgtagc caccgacaca ggcaacagtc 2460
cgtggatagc agaatatgtc ttgtcggtcc atttctcacc aactttaggc gtcaagtgaa 2520
tgttgcagaa gaagtatgtg ccttcattga gaatcggtgt tgctgatttc aataaagtct 2580
tgagatcagt ttggcgcgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 2640
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 2700
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 2760
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 2820
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 2880
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 2940
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 3000
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 3060
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 3120
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 3180
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 3240
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 3300
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 3360
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 3420
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 3480
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 3540
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 3600
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 3660
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 3720
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 3780
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 3840
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 3900
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 3960
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 4020
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 4080
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 4140
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 4200
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 4260
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 4320
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 4380
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 4440
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 4500
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 4560
gcgcacattt ccccgaaaag tgccacctga tgcggtgtga aataccgcac agatgcgtaa 4620
ggagaaaata ccgcatcagg aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa 4680
tttttgttaa atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa 4740
atcaaaagaa tagaccgaga tagggttgag tgttgttcca gtttggaaca agagtccact 4800
attaaagaac gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc 4860
actacgtgaa ccatcaccct aatcaagttt tttggggtcg aggtgccgta aagcactaaa 4920
tcggaaccct aaagggagcc cccgatttag agcttgacgg ggaaagccgg cgaacgtggc 4980
gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt 5040
cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg ccgctacagg gcgcgtccat 5100
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 5160
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 5220
tcccagtcac gacgttgtaa aacgacggcc agtgaattgt aatacgactc actatagggc 5280
gaattgggcc cgacgtcgca tgcagtggtg gtattgtgac tggggatgta gttgagaata 5340
agtcatacac aagtcagctt tcttcgagcc tcatataagt ataagtagtt caacgtatta 5400
gcactgtacc cagcatctcc gtatcgagaa acacaacaac atgccccatt ggacagatca 5460
tgcggataca caggttgtgc agtatcatac atactcgatc agacaggtcg tctgaccatc 5520
atacaagctg aacaagcgct ccatacttgc acgctctcta tatacacagt taaattacat 5580
atccatagtc taacctctaa cagttaatct tctggtaagc ctcccagcca gccttctggt 5640
atcgcttggc ctcctcaata ggatctcggt tctggccgta cagacctcgg ccgacaatta 5700
tgatatccgt tccggtagac atgacatcct caacagttcg gtactgctgt ccgagagcgt 5760
ctcccttgtc gtcaagaccc accccggggg tcagaataag ccagtcctca gagtcgccct 5820
taattaattt gaatcgaatc gatgagccta aaatgaaccc gagtatatct cataaaattc 5880
tcggtgagag gtctgtgact gtcagtacaa ggtgccttca ttatgccctc aaccttacca 5940
tacctcactg aatgtagtgt acctctaaaa atgaaataca gtgccaaaag ccaaggcact 6000
gagctcgtct aacggacttg atatacaacc aattaaaaca aatgaaaaga aatacagttc 6060
tttgtatcat ttgtaacaat taccctgtac aaactaaggt attgaaatcc cacaatattc 6120
ccaaagtcca cccctttcca aattgtcatg cctacaactc atataccaag cactaaccta 6180
ccgtttaaac agtgtacgca gatctactat agaggaacat ttaaattgcc ccggagaaga 6240
cggccaggcc gcctagatga caaattcaac aactcacagc tgactttctg ccattgccac 6300
tagggggggg cctttttata tggccaagcc aagctctcca cgtcggttgg gctgcaccca 6360
acaataaatg ggtagggttg caccaacaaa gggatgggat ggggggtaga agatacgagg 6420
ataacggggc tcaatggcac aaataagaac gaatactgcc attaagactc gtgatccagc 6480
gactgacacc attgcatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc 6540
tggacaccac agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc 6600
agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg 6660
agcagggtgg tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct 6720
catcaggcca gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc 6780
tggatatagc cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt 6840
gctcgatacc cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga 6900
ccaacatctt acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc 6960
ggttgccagt ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca 7020
cagaattccg agccgtgagt atccacgaca agatcagtgt cgagacgacg cgttttgtgt 7080
aatgacacaa tccgaaagtc gctagcaaca cacactctct acacaaacta acccagctct 7140
ggtac 7145
<210> 170
<211> 5553
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZF5T-PPC
<400> 170
ggccgcattg atgattggaa acacacacat gggttatatc taggtgagag ttagttggac 60
agttatatat taaatcagct atgccaacgg taacttcatt catgtcaacg aggaaccagt 120
gactgcaagt aatatagaat ttgaccacct tgccattctc ttgcactcct ttactatatc 180
tcatttattt cttatataca aatcacttct tcttcccagc atcgagctcg gaaacctcat 240
gagcaataac atcgtggatc tcgtcaatag agggcttttt ggactccttg ctgttggcca 300
ccttgtcctt gctgtctggc tcattctgtt tcaacgcctt ttaattaatc gagcttggcg 360
taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 420
atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 480
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 540
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 600
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 660
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 720
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 780
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 840
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 900
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 960
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 1020
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 1080
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 1140
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 1200
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 1260
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 1320
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 1380
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1440
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1500
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1560
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 1620
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 1680
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1740
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1800
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1860
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 1920
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 1980
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 2040
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 2100
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 2160
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 2220
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 2280
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 2340
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 2400
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2460
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2520
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2580
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2640
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2700
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2760
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2820
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2880
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2940
aacgcgaatt ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca 3000
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 3060
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 3120
aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc 3180
ccctcgaggt cgacgtttaa acagtgtacg cagtactata gaggaacatc gattgccccg 3240
gagaagacgg ccaggccgcc tagatgacaa attcaacaac tcacagctga ctttctgcca 3300
ttgccactag gggggggcct ttttatatgg ccaagccaag ctctccacgt cggttgggct 3360
gcacccaaca ataaatgggt agggttgcac caacaaaggg atgggatggg gggtagaaga 3420
tacgaggata acggggctca atggcacaaa taagaacgaa tactgccatt aagactcgtg 3480
atccagcgac tgacaccatt gcatcatcta agggcctcaa aactacctcg gaactgctgc 3540
gctgatctgg acaccacaga ggttccgagc actttaggtt gcaccaaatg tcccaccagg 3600
tgcaggcaga aaacgctgga acagcgtgta cagtttgtct taacaaaaag tgagggcgct 3660
gaggtcgagc agggtggtgt gacttgttat agcctttaga gctgcgaaag cgcgtatgga 3720
tttggctcat caggccagat tgagggtctg tggacacatg tcatgttagt gtacttcaat 3780
cgccccctgg atatagcccc gacaataggc cgtggcctca tttttttgcc ttccgcacat 3840
ttccattgct cggtacccac accttgcttc tcctgcactt gccaacctta atactggttt 3900
acattgacca acatcttaca agcggggggc ttgtctaggg tatatataaa cagtggctct 3960
cccaatcggt tgccagtctc ttttttcctt tctttcccca cagattcgaa atctaaacta 4020
cacatcacac aatgcctgtt actgacgtcc ttaagcgaaa gtccggtgtc atcgtcggcg 4080
acgatgtccg agccgtgagt atccacgaca agatcagtgt cgagacgacg cgttttgtgt 4140
aatgacacaa tccgaaagtc gctagcaaca cacactctct acacaaacta acccagctct 4200
ccatgggaac ggaccaagga aaaaccttca cctgggaaga gctggcggcc cataacacca 4260
aggacgacct actcttggcc atccgcggca gggtgtacga tgtcacaaag ttcttgagcc 4320
gccatcctgg tggagtggac actctcctgc tcggagctgg ccgagatgtt actccggtct 4380
ttgagatgta tcacgcgttt ggggctgcag atgccattat gaagaagtac tatgtcggta 4440
cactggtctc gaatgagctg cccatcttcc cggagccaac ggtgttccac aaaaccatca 4500
agacgagagt cgagggctac tttacggatc ggaacattga tcccaagaat agaccagaga 4560
tctggggacg atacgctctt atctttggat ccttgatcgc ttcctactac gcgcagctct 4620
ttgtgccttt cgttgtcgaa cgcacatggc ttcaggtggt gtttgcaatc atcatgggat 4680
ttgcgtgcgc acaagtcgga ctcaaccctc ttcatgatgc gtctcacttt tcagtgaccc 4740
acaaccccac tgtctggaag attctgggag ccacgcacga ctttttcaac ggagcatcgt 4800
acctggtgtg gatgtaccaa catatgctcg gccatcaccc ctacaccaac attgctggag 4860
cagatcccga cgtgtcgacg tctgagcccg atgttcgtcg tatcaagccc aaccaaaagt 4920
ggtttgtcaa ccacatcaac cagcacatgt ttgttccttt cctgtacgga ctgctggcgt 4980
tcaaggtgcg cattcaggac atcaacattt tgtactttgt caagaccaat gacgctattc 5040
gtgtcaatcc catctcgaca tggcacactg tgatgttctg gggcggcaag gctttctttg 5100
tctggtatcg cctgattgtt cccctgcagt atctgcccct gggcaaggtg ctgctcttgt 5160
tcacggtcgc ggacatggtg tcgtcttact ggctggcgct gaccttccag gcgaaccacg 5220
ttgttgagga agttcagtgg ccgttgcctg acgagaacgg gatcatccaa aaggactggg 5280
cagctatgca ggtcgagact acgcaggatt acgcacacga ttcgcacctc tggaccagca 5340
tcactggcag cttgaactac caggctgtgc accatctgtt ccccaacgtg tcgcagcacc 5400
attatcccga tattctggcc atcatcaaga acacctgcag cgagtacaag gttccatacc 5460
ttgtcaagga tacgttttgg caagcatttg cttcacattt ggagcacttg cgtgttcttg 5520
gactccgtcc caaggaagag taggcagcta agc 5553
<210> 171
<211> 10448
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW297
<400> 171
cgattgcccc ggagaagacg gccaggccgc ctagatgaca aattcaacaa ctcacagctg 60
actttctgcc attgccacta ggggggggcc tttttatatg gccaagccaa gctctccacg 120
tcggttgggc tgcacccaac aataaatggg tagggttgca ccaacaaagg gatgggatgg 180
ggggtagaag atacgaggat aacggggctc aatggcacaa ataagaacga atactgccat 240
taagactcgt gatccagcga ctgacaccat tgcatcatct aagggcctca aaactacctc 300
ggaactgctg cgctgatctg gacaccacag aggttccgag cactttaggt tgcaccaaat 360
gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt acagtttgtc ttaacaaaaa 420
gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta tagcctttag agctgcgaaa 480
gcgcgtatgg atttggctca tcaggccaga ttgagggtct gtggacacat gtcatgttag 540
tgtacttcaa tcgccccctg gatatagccc cgacaatagg ccgtggcctc atttttttgc 600
cttccgcaca tttccattgc tcggtaccca caccttgctt ctcctgcact tgccaacctt 660
aatactggtt tacattgacc aacatcttac aagcgggggg cttgtctagg gtatatataa 720
acagtggctc tcccaatcgg ttgccagtct cttttttcct ttctttcccc acagattcga 780
aatctaaact acacatcaca caatgcctgt tactgacgtc cttaagcgaa agtccggtgt 840
catcgtcggc gacgatgtcc gagccgtgag tatccacgac aagatcagtg tcgagacgac 900
gcgttttgtg taatgacaca atccgaaagt cgctagcaac acacactctc tacacaaact 960
aacccagctc tccatggtga agtccaagcg acaggctctg cccctcacca tcgacggaac 1020
tacctacgac gtctccgctt gggtgaactt ccaccctggt ggagctgaaa tcattgagaa 1080
ctaccaggga cgagatgcta ctgacgcctt catggttatg cactctcagg aagccttcga 1140
caagctcaag cgaatgccca agatcaaccc ctcctccgag ctgcctcccc aggctgccgt 1200
caacgaagct caggaggatt tccgaaagct ccgagaagag ctgatcgcca ctggcatgtt 1260
tgacgcctct cccctctggt actcgtacaa gatctccacc accctgggtc ttggcgtgct 1320
tggatacttc ctgatggtcc agtaccagat gtacttcatt ggtgctgtgc tgctcggtat 1380
gcactaccag caaatgggat ggctgtctca tgacatctgc caccaccaga ccttcaagaa 1440
ccgaaactgg aataacctcg tgggtctggt ctttggcaac ggactccagg gcttctccgt 1500
gacctggtgg aaggacagac acaacgccca tcattctgct accaacgttc agggtcacga 1560
tcccgacatt gataacctgc ctctgctcgc ctggtccgag gacgatgtca ctcgagcttc 1620
tcccatctcc cgaaagctca ttcagttcca acagtactat ttcctggtca tctgtattct 1680
cctgcgattc atctggtgtt tccagtctgt gctgaccgtt cgatccctca aggaccgaga 1740
caaccagttc taccgatctc agtacaagaa agaggccatt ggactcgctc tgcactggac 1800
tctcaagacc ctgttccacc tcttctttat gccctccatc ctgacctcgc tcctggtgtt 1860
ctttgtttcc gagctcgtcg gtggcttcgg aattgccatc gtggtcttca tgaaccacta 1920
ccctctggag aagatcggtg attccgtctg ggacggacat ggcttctctg tgggtcagat 1980
ccatgagacc atgaacattc gacgaggcat cattactgac tggttctttg gaggcctgaa 2040
ctaccagatc gagcaccatc tctggcccac cctgcctcga cacaacctca ctgccgtttc 2100
ctaccaggtg gaacagctgt gccagaagca caacctcccc taccgaaacc ctctgcccca 2160
tgaaggtctc gtcatcctgc tccgatacct ggccgtgttc gctcgaatgg ccgagaagca 2220
gcccgctggc aaggctctct aagcggccgc attgatgatt ggaaacacac acatgggtta 2280
tatctaggtg agagttagtt ggacagttat atattaaatc agctatgcca acggtaactt 2340
cattcatgtc aacgaggaac cagtgactgc aagtaatata gaatttgacc accttgccat 2400
tctcttgcac tcctttacta tatctcattt atttcttata tacaaatcac ttcttcttcc 2460
cagcatcgag ctcggaaacc tcatgagcaa taacatcgtg gatctcgtca atagagggct 2520
ttttggactc cttgctgttg gccaccttgt ccttgctgtc tggctcattc tgtttcaacg 2580
ccttttaatt aagtcataca caagtcagct ttcttcgagc ctcatataag tataagtagt 2640
tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa catgccccat 2700
tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat cagacaggtc 2760
gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct atatacacag 2820
ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag cctcccagcc 2880
agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt acagacctcg 2940
gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc ggtactgctg 3000
tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa gccagtcctc 3060
agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg ggtcggatcg 3120
ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct tgcaagacag 3180
ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga ctaggaactc 3240
cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag agacagtttc 3300
ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt gggcgttggt 3360
gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag tgttgccaat 3420
atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa gttccttgag 3480
ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg ttttgatcat 3540
gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg tggtaacatc 3600
cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc gagcggcaaa 3660
ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg tgaagaggag 3720
actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg cagtgaagta 3780
tatgttatgg taatagttac gagttagttg aacttataga tagactggac tatacggcta 3840
tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc cgacaaaaat 3900
gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg ccaaccgcgc 3960
cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca aagtgatcca 4020
agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag acagatactc 4080
gtcgactcag gcgacgacgg aattcctgca gcccatctgc agaattcagg agagaccggg 4140
ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc cccggagaag acggccaggc 4200
cgcctagatg acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg 4260
gcctttttat atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat 4320
gggtagggtt gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg 4380
ctcaatggca caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac 4440
cattgcatca tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca 4500
cagaggttcc gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc 4560
tggaacagcg tgtacagttt gtcttaacaa aaagtgaggg cgctgaggtc gagcagggtg 4620
gtgtgacttg ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc 4680
agattgaggg tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag 4740
ccccgacaat aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcggtac 4800
ccacaccttg cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct 4860
tacaagcggg gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag 4920
tctctttttt cctttctttc cccacagatt cgaaatctaa actacacatc acacaatgcc 4980
tgttactgac gtccttaagc gaaagtccgg tgtcatcgtc ggcgacgatg tccgagccgt 5040
gagtatccac gacaagatca gtgtcgagac gacgcgtttt gtgtaatgac acaatccgaa 5100
agtcgctagc aacacacact ctctacacaa actaacccag ctctccatgg ctctggccaa 5160
cgacgctggc gagcgaatct gggctgccgt caccgatccc gaaatcctca ttggcacctt 5220
ctcctacctg ctcctgaagc ctctcctgcg aaactctggt ctcgtggacg agaagaaagg 5280
agcctaccga acctccatga tctggtacaa cgtcctcctg gctctcttct ctgccctgtc 5340
cttctacgtg actgccaccg ctctcggctg ggactacggt actggagcct ggctgcgaag 5400
acagaccggt gatactcccc agcctctctt tcagtgtccc tctcctgtct gggactccaa 5460
gctgttcacc tggactgcca aggccttcta ctattctaag tacgtggagt acctcgacac 5520
cgcttggctg gtcctcaagg gcaagcgagt gtcctttctg caggccttcc atcactttgg 5580
agctccctgg gacgtctacc tcggcattcg actgcacaac gagggtgtgt ggatcttcat 5640
gttctttaac tcgttcattc acaccatcat gtacacctac tatggactga ctgccgctgg 5700
ctacaagttc aaggccaagc ctctgatcac tgccatgcag atttgccagt tcgtcggtgg 5760
ctttctcctg gtctgggact acatcaacgt tccctgcttc aactctgaca agggcaagct 5820
gttctcctgg gctttcaact acgcctacgt cggatctgtc tttctcctgt tctgtcactt 5880
cttttaccag gacaacctgg ccaccaagaa atccgctaag gctggtaagc agctttagcg 5940
gccgcaagtg tggatgggga agtgagtgcc cggttctgtg tgcacaattg gcaatccaag 6000
atggatggat tcaacacagg gatatagcga gctacgtggt ggtgcgagga tatagcaacg 6060
gatatttatg tttgacactt gagaatgtac gatacaagca ctgtccaagt acaatactaa 6120
acatactgta catactcata ctcgtacccg ggcaacggtt tcacttgagt gcagtggcta 6180
gtgctcttac tcgtacagtg tgcaatactg cgtatcatag tctttgatgt atatcgtatt 6240
cattcatgtt agttgcgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 6300
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 6360
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 6420
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 6480
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 6540
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 6600
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 6660
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 6720
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 6780
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 6840
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 6900
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 6960
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 7020
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 7080
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 7140
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 7200
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 7260
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 7320
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 7380
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 7440
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 7500
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 7560
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 7620
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 7680
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 7740
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 7800
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 7860
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 7920
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 7980
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 8040
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 8100
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 8160
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 8220
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 8280
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 8340
ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt 8400
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt 8460
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc 8520
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga 8580
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc 8640
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt 8700
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 8760
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg 8820
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 8880
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 8940
cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa 9000
ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg 9060
tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga 9120
tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat 9180
tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag 9240
acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt 9300
gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta 9360
tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt 9420
cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa 9480
tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc 9540
taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa 9600
atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga 9660
atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct 9720
cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat 9780
gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg 9840
gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta 9900
aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat 9960
aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg 10020
taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc 10080
gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc 10140
gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac 10200
atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt 10260
tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc 10320
gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt 10380
acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga 10440
tgctcaat 10448
<210> 172
<211> 15543
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZP2C16M899
<400> 172
catggttagc gtgtcgtgtt tttgttgtgc tggaagaacc aaagggtggc gcaatgtgtg 60
tagatatata tgtcgtgacc cacaagtcac acaaacaagt atcgggagga gtggtgcacc 120
tctatgcgga gaaaccttat accgctgtag accaactggg gcagaggtgt gagttgaagt 180
cagctggagg agatgtgtga cagaagcaca agaagtgaga ttgtgagatg tatgtctagg 240
gggggaagtt ttgtgtcaaa tatatgggaa ttattatcag caccacgaaa ttatacgcct 300
catatgaccc atttaggtgg atagatcatg gacactgttg acagctgcga agaaaaagcg 360
tattggggat gatccgaaat tagtccggta ccgaggcgca aatacgtaag acagccgatw 420
aaatatatgc gagaaacacc aaagagactc tagatgtttg tttggcacag ttttgacttc 480
tgcgaaggcc ttacaccacc ttgttgaccc ttgtcgcggg tcgggcaata tcggctgaca 540
gagttttact tgctcaataa gatacgagct gcatagagtt gaactacagg acaatattgg 600
ggctggccac atgaagggca ttgtttggag gtgtattgat ggtgaaaaca cgatatgaaa 660
tgacaacgcc ccctgtttta ttattattct tattattttg ggtgcttctc tatccataca 720
agcacctcct aacatgcttc ataagtgacc tcctcatcac aaggcctgag gtctcattta 780
tccagtggcg ccaagctaaa ctaaaactgg tccgagtaga ctaaggcgaa gagagaagga 840
gagaagacag tttttttgtg gccgcctgtg aacaatgaaa acgatgaggg tgagatggag 900
caaaccatat ggacagtcag aggagtacgt acgctgctta cataatggcg caacgaccac 960
atgtcccaca gatacgcatc gattccggtt ccgggtacac cgtgggcgtt ggtgatatca 1020
ccaacgccca cggtgtaccc ggaaccggaa tcgataacgt ctcgtaccaa ccacagatta 1080
cgacccattc gcagtcacag ttcactaggg tttgggttgc atccgttgag agcggtttgt 1140
ttttaacctt ctccatgtgc tcactcaggt tttgggttca gatcaaatca aggcgtgaac 1200
cactttgttt gaggacaaat gtgacacaac caaccagtgt caggggcaag tccgtgacaa 1260
aggggaagat acaatgcaat tactgacagt tacagactgc ctcgatgccc taaccttgcc 1320
ccaaaataag acaactgtcc tcgtttaagc gcaaccctat tcagcgtcac gtcataatag 1380
cgtttggata gcactagtct atgaggagcg ttttatgttg cggtgagggc gattggtgct 1440
catatgggtt caattgaggt ggcggaacga gcttagtctt caattgaggt gcgagcgaca 1500
caattgggtg tcacgtggcc taattgacct cgggtcgtgg agtccccagt tatacagcaa 1560
ccacgaggtg catgggtagg agacgtcacc agacaatagg gttttttttg gactggagag 1620
ggttgggcaa aagcgctcaa cgggctgttt ggggagctgt gggggaggaa ttggcgatat 1680
ttgtgaggtt aacggctccg atttgcgtgt tttgtcgctc ctgcatctcc ccatacccat 1740
atcttccctc cccacctctt tccacgataa ttttacggat cagcaataag gttccttctc 1800
ctagtttcca cgtccatata tatctatgct gcgtcgtcct tttcgtgaca tcaccaaaac 1860
acatacaaca atggctgtta ctgacgtcct taagcgaaag tccggtgtca tcgtcggcga 1920
cgatgtccga gccgtgagta tccacgacaa gatcagtgtc gagacgacgc gttttgtgta 1980
atgacacaat ccgaaagtcg ctagcaacac acactctcta cacaaactaa cccagctctc 2040
catggacatg tccgtcctga ctctccaaga gtacgagttc gagaagcagt tcaacgagaa 2100
tgaagccatc caatggatgc aggaaaactg gaagaaatcc ttcctgtttt ctgccctcta 2160
cgctgccttt atctttggtg gacgacatct gatgaacaag cgagccaagt ttgagctgcg 2220
aaaacctctc gtgctctggt ccctgaccct cgctgtcttc tctatcttcg gtgctctgcg 2280
aactggagcc tacatgctct acatcctgat gaccaaaggc ctgaaacagt ctgtttgtga 2340
ccagtccttt tacaacggac ccgtctcgaa attctgggct tacgcctttg tgctctccaa 2400
agctcccgaa cttggcgata ccatcttcat cattctgcga aagcagaaac tcatcttcct 2460
gcactggtat caccacatca ccgtcctcct gtactcttgg tactcctaca aggacatggt 2520
ggctggaggt ggctggttca tgactatgaa ctacggtgtc cacgccgtga tgtactccta 2580
ctacgccctc cgagctgccg gtttccgagt ctctcgaaag tttgccatgt tcatcaccct 2640
gtcgcagatc actcagatgc tcatgggctg tgtcattaac tacctggtct tcaactggat 2700
gcagcatgac aatgaccagt gctactccca ctttcagaac atcttctggt cctctctcat 2760
gtacctctcc taccttctgc tcttctgcca tttcttcttt gaggcctaca ttggcaaagt 2820
gaagaaagcc accaaggctg agtaagcggc cgcatgtaca tacaagatta tttatagaaa 2880
tgaatcgcga tcgaacaaag agtacgagtg tacgagtagg ggatgatgat aaaagtggaa 2940
gaagttccgc atctttggat ttatcaacgt gtaggacgat acttcctgta aaaatgcaat 3000
gtctttacca taggttctgc tgtagatgtt attaactacc attaacatgt ctacttgtac 3060
agttgcagac cagttggagt atagaatggt acacttacca aaaagtgttg atggttgtaa 3120
ctacgatata taaaactgtt gacgggatct gtatattcgg taagatatat tttgtggggt 3180
tttagtggtg tttatcgctt accctgcagc cggattaagg ttggcaattt ttcacgtcct 3240
tgtctccgca attactcacc gggtggttta taagattgca agcgtcttga tttgtctctg 3300
tatactaaca tgcaatcgcg actcgcccga cgggccacta acctggccag aatctccaga 3360
tccaagtatt ctcttggtct gcgatatgtt tccaacacaa aagcccctgc tgcccagccg 3420
gcaactgctg agtgagtatt ccttgccata aacgacccag aaccactgta tagtgtttgg 3480
aagcactagt cagaagacca gcgaaaacag gtggaaaaaa ctgagacgaa aagcaacgac 3540
cagaaatgta atgtgtggaa aagcgacaca cacagagcag ataaagaggt gacaaataac 3600
gacaaatgaa atatcagtat cttcccacaa tcactacctc tcagctgtct gaaggtgcgg 3660
ctgatatatc catcccacgt ctaacgtatg gagtgtgata gaatatgacg acacaagcat 3720
gagaactcgc tctctatcca accaccgaaa cactgtcact acagccgttc ttgttgctcc 3780
attcgctttt gtgattccat gccttctctg gtgactgaca acattccttc cttttctcca 3840
gccctgttgt tatctgctca tgacctacgg ccactctcta tcgcatacta acatagacga 3900
tcccagcccg ctccccactt ccagggcacc gttggcaagc ctcctatcct caagaaggct 3960
gaggctgcca acgctgacat ggacgagtcc ttcatcggaa tgtctggagg agagatcttc 4020
cacgagatga tgctgcgaca caacgtcgac actgtcttcg gttaccccgg tggagccatt 4080
ctccccgtct ttgacgccat tcacaactct gagtacttca actttgtgct ccctcgacac 4140
gagcagggtg ccggccacat ggccgagggc tacgctcgag cctctggtaa gcccggtgtc 4200
gttctcgtca cctctggccc cggtgccacc aacgtcatca cccccatgca ggacgctctt 4260
tccgatggta cccccatggt tgtcttcacc ggtcaggtcc tgacctccgt tatcggcact 4320
gacgccttcc aggaggccga tgttgtcggc atctcccgat cttgcaccaa gtggaacgtc 4380
atggtcaaga acgttgctga gctcccccga cgaatcaacg aggcctttga gattgctact 4440
tccggccgac ccggtcccgt tctcgtcgat ctgcccaagg atgttactgc tgccatcctg 4500
cgagagccca tccccaccaa gtccaccatt ccctcgcatt ctctgaccaa cctcacctct 4560
gccgccgcca ccgagttcca gaagcaggct atccagcgag ccgccaacct catcaaccag 4620
tccaagaagc ccgtccttta cgtcggacag ggtatccttg gctccgagga gggtcctaag 4680
ctgcttaagg agctggctga gaaggccgag attcccgtca ccactactct gcagggtctt 4740
ggtgcctttg acgagcgaga ccccaagtct ctgcacatgc tcggtatgca cggttccggc 4800
tacgccaaca tggccatgca gaacgctgac tgtatcattg ctctcggcgc ccgatttgat 4860
gaccgagtta ccggctccat ccccaagttt gcccccgagg ctcgagccgc tgcccttgag 4920
ggtcgaggtg gtattgttca ctttgagatc caggccaaga acatcaacaa ggttgttcag 4980
gccaccgaag ccgttgaggg agacgttacc gagtctgtcc gacagctcat ccccctcatc 5040
aacaaggtct ctgccgctga gcgagctccc tggactgaga ctatccagtc ctggaagcag 5100
cagttcccct tcctcttcga ggctgaaggt gaggatggtg ttatcaagcc ccagtccgtc 5160
attgctctgc tctctgacct gacagagaac aacaaggaca agaccatcat caccaccggt 5220
gttggtcagc atcagatgtg gactgcccag catttccgat ggcgacaccc tcgaaccatg 5280
atcacttctg gtggtcttgg aactatgggt tacggcctgc ccgccgctat cggcgccaag 5340
gttgcccgac ctgactgcga cgtcattgac atcgatggtg acgcttcttt caacatgact 5400
ctgaccgagc tgtccaccgc cgttcagttc aacattggcg tcaaggctat tgtcctcaac 5460
aacgaggaac agggtatggt cacccagctg cagtctctct tctacgagaa ccgatactgc 5520
cacactcatc agaagaaccc cgacttcatg aagctggccg agtccatggg catgaagggt 5580
atccgaatca ctcacattga ccagctggag gccggtctca aggagatgct cgcatacaag 5640
ggccctgtgc tcgttgaggt tgttgtcgac aagaagatcc ccgttcttcc catggttccc 5700
gctggtaagg ctttgcatga gttccttgtc tacgacgctg acgccgaggc tgcttctcga 5760
cccgatcgac tgaagaatgc ccccgcccct cacgtccacc agaccacctt tgagaactaa 5820
gtggaaagga acacaagcaa tccgaaccaa aaataattgg ggtcccgtgc ccacagagtc 5880
tagtgcagac ctaaaatgac cacagtaaat tatagctgtt attaaacatg agattttgac 5940
caacaagagc gtaggaatgt tattagctac tacttgtaca tacacagcat ttgttttaaa 6000
taatgttgcc tccaggggca gtgagatcag gacccagatc cgtggccagc tctctgactt 6060
cagaccgctt gtacttaagc agctcgcaac actgttgtcg aggattgaac ttgccatatt 6120
cgattttgtg gtcatgaatc cagcacacct cgtacgggcg tcgttgcttg tgtgattttt 6180
gaggacccat ccctttggta tataagtata ctctggggtt aaggttgccc gtgtagtcta 6240
ggttatagtt ttcatgtgaa ataccgagag ccgagggaga ataaacgggg gtatttggac 6300
ttgttttttt cgcggaaaag cgtcgaatca accctgcggg ccttgcacca tgtccacgac 6360
gtgtttctcg ccccaattcg ccccttgcac gtcaaaatta ggcctccatc tagacccctc 6420
cataacatgt gactgtgggg aaaagtataa gggaaaccat gcaaccatag acgacgtgaa 6480
agacggggag gaaccaatgg aggccaaaga aatggggtag caacagtcca ggagacagac 6540
aaggagacaa ggagagggcg cccgaaagat cggaaaaaca aacatgtcca attggggcag 6600
tgacggaaac gacacggaca cttcagtaca atggaccgac catctccaag ccagggttat 6660
tccggtatca ccttggccgt aacctcccgc tggtacctga tattgtacac gttcacattc 6720
aatatacttt cagctacaat aagagaggct gtttgtcggg catgtgtgtc cgtcgtatgg 6780
ggtgatgtcc gagggcgaaa ttcgctacaa gcttaactct ggcgcttgtc cagtatgaat 6840
agacaagtca agaccagtgg tgccatgatt gacagggagg tacaagactt cgatactcga 6900
gcattactcg gacttgtggc gattgaacag acgggcgatc gcttctcccc cgtattgccg 6960
gcgcgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 7020
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 7080
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 7140
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 7200
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 7260
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 7320
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 7380
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 7440
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 7500
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 7560
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 7620
tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 7680
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 7740
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 7800
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 7860
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 7920
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 7980
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 8040
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 8100
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 8160
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 8220
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 8280
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 8340
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 8400
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 8460
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 8520
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 8580
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 8640
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 8700
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 8760
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 8820
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 8880
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 8940
cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg 9000
catcaggaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc 9060
agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag 9120
accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg 9180
gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca 9240
tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa 9300
gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg 9360
aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta 9420
accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtccattcg ccattcaggc 9480
tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga 9540
aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac 9600
gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa ttgggcccga 9660
cgtcgcatgc gctgatgaca ctttggtctg aaagagatgc attttgaatc ccaaacttgc 9720
agtgcccaag tgacatacat ctccgcgttt tggaaaatgt tcagaaacag ttgattgtgt 9780
tggaatgggg aatggggaat ggaaaaatga ctcaagtatc aattccaaaa acttctctgg 9840
ctggcagtac ctactgtcca tactactgca ttttctccag tcaggccact ctatactcga 9900
cgacacagta gtaaaaccca gataatttcg acataaacaa gaaaacagac ccaataatat 9960
ttatatatag tcagccgttt gtccagttca gactgtaata gccgaaaaaa aatccaaagt 10020
ttctattcta ggaaaatata ttccaatatt tttaattctt aatctcattt attttattct 10080
agcgaaatac atttcagcta cttgagacat gtgataccca caaatcggat tcggactcgg 10140
ttgttcagaa gagcatatgg cattcgtgct cgcttgttca cgtattcttc ctgttccatc 10200
tcttggccga caatcacaca aaaatggggt ttttttttta attctaatga ttcattacag 10260
caaaattgag atatagcaga ccacgtattc cataatcacc aaggaagttc ttgggcgtct 10320
taattaaaag gcgttgaaac agaatgagcc agacagcaag gacaaggtgg ccaacagcaa 10380
ggagtccaaa aagccctcta ttgacgagat ccacgatgtt attgctcatg aggtttccga 10440
gctcgatgct gggaagaaga agtgatttgt atataagaaa taaatgagat atagtaaagg 10500
agtgcaagag aatggcaagg tggtcaaatt ctatattact tgcagtcact ggttcctcgt 10560
tgacatgaat gaagttaccg ttggcatagc tgatttaata tataactgtc caactaactc 10620
tcacctagat ataacccatg tgtgtgtttc caatcatcaa tgcggccgct tagagagcct 10680
tgccagcggg ctgcttctcg gccattcgag cgaacacggc caggtatcgg agcaggatga 10740
cgagaccttc atggggcaga gggtttcggt aggggaggtt gtgcttctgg cacagctgtt 10800
ccacctggta ggaaacggca gtgaggttgt gtcgaggcag ggtgggccag agatggtgct 10860
cgatctggta gttcaggcct ccaaagaacc agtcagtaat gatgcctcgt cgaatgttca 10920
tggtctcatg gatctgaccc acagagaagc catgtccgtc ccagacggaa tcaccgatct 10980
tctccagagg gtagtggttc atgaagacca cgatggcaat tccgaagcca ccgacgagct 11040
cggaaacaaa gaacaccagg agcgaggtca ggatggaggg cataaagaag aggtggaaca 11100
gggtcttgag agtccagtgc agagcgagtc caatggcctc tttcttgtac tgagatcggt 11160
agaactggtt gtctcggtcc ttgagggatc gaacggtcag cacagactgg aaacaccaga 11220
tgaatcgcag gagaatacag atgaccagga aatagtactg ttggaactga atgagctttc 11280
gggagatggg agaagctcga gtgacatcgt cctcggacca ggcgagcaga ggcaggttat 11340
caatgtcggg atcgtgaccc tgaacgttgg tagcagaatg atgggcgttg tgtctgtcct 11400
tccaccaggt cacggagaag ccctggagtc cgttgccaaa gaccagaccc acgaggttat 11460
tccagtttcg gttcttgaag gtctggtggt ggcagatgtc atgagacagc catcccattt 11520
gctggtagtg cataccgagc agcacagcac caatgaagta catctggtac tggaccatca 11580
ggaagtatcc aagcacgcca agacccaggg tggtggagat cttgtacgag taccagaggg 11640
gagaggcgtc aaacatgcca gtggcgatca gctcttctcg gagctttcgg aaatcctcct 11700
gagcttcgtt gacggcagcc tggggaggca gctcggagga ggggttgatc ttgggcattc 11760
gcttgagctt gtcgaaggct tcctgagagt gcataaccat gaaggcgtca gtagcatctc 11820
gtccctggta gttctcaatg atttcagctc caccagggtg gaagttcacc caagcggaga 11880
cgtcgtaggt agttccgtcg atggtgaggg gcagagcctg tcgcttggac ttcaccatgg 11940
agagctgggt tagtttgtgt agagagtgtg tgttgctagc gactttcgga ttgtgtcatt 12000
acacaaaacg cgtcgtctcg acactgatct tgtcgtggat actcacggct cggacatcgt 12060
cgccgacgat gacaccggac tttcgcttaa ggacgtcagt aacaggcatt gtgtgatgtg 12120
tagtttagat ttcgaatctg tggggaaaga aaggaaaaaa gagactggca accgattggg 12180
agagccactg tttatatata ccctagacaa gccccccgct tgtaagatgt tggtcaatgt 12240
aaaccagtat taaggttggc aagtgcagga gaagcaaggt gtgggtaccg agcaatggaa 12300
atgtgcggaa ggcaaaaaaa tgaggccacg gcctattgtc ggggctatat ccagggggcg 12360
attgaagtac actaacatga catgtgtcca cagaccctca atctggcctg atgagccaaa 12420
tccatacgcg ctttcgcagc tctaaaggct ataacaagtc acaccaccct gctcgacctc 12480
agcgccctca ctttttgtta agacaaactg tacacgctgt tccagcgttt tctgcctgca 12540
cctggtggga catttggtgc aacctaaagt gctcggaacc tctgtggtgt ccagatcagc 12600
gcagcagttc cgaggtagtt ttgaggccct tagatgatgc aatggtgtca gtcgctggat 12660
cacgagtctt aatggcagta ttcgttctta tttgtgccat tgagccccgt tatcctcgta 12720
tcttctaccc cccatcccat ccctttgttg gtgcaaccct acccatttat tgttgggtgc 12780
agcccaaccg acgtggagag cttggcttgg ccatataaaa aggccccccc ctagtggcaa 12840
tggcagaaag tcagctgtga gttgttgaat ttgtcatcta ggcggcctgg ccgtcttctc 12900
cggggcaatt taaattcctt cacttcaagt tcattcttca tctgcttctg ttttactttg 12960
acaggcaaat gaagacatgg tacgacttga tggaggccaa gaacgccatt tcaccccgag 13020
acaccgaagt gcctgaaatc ctggctgccc ccattgataa catcggaaac tacggtattc 13080
cggaaagtgt atatagaacc tttccccagc ttgtgtctgt ggatatggat ggtgtaatcc 13140
cctttgagta ctcgtcttgg cttctctccg agcagtatga ggctctctaa tctagcgcat 13200
ttaatatctc aatgtattta tatatttatc ttctcatgcg gccgctaaag ctgcttacca 13260
gccttagcgg atttcttggt ggccaggttg tcctggtaaa agaagtgaca gaacaggaga 13320
aagacagatc cgacgtaggc gtagttgaaa gcccaggaga acagcttgcc cttgtcagag 13380
ttgaagcagg gaacgttgat gtagtcccag accaggagaa agccaccgac gaactggcaa 13440
atctgcatgg cagtgatcag aggcttggcc ttgaacttgt agccagcggc agtcagtcca 13500
tagtaggtgt acatgatggt gtgaatgaac gagttaaaga acatgaagat ccacacaccc 13560
tcgttgtgca gtcgaatgcc gaggtagacg tcccagggag ctccaaagtg atggaaggcc 13620
tgcagaaagg acactcgctt gcccttgagg accagccaag cggtgtcgag gtactccacg 13680
tacttagaat agtagaaggc cttggcagtc caggtgaaca gcttggagtc ccagacagga 13740
gagggacact gaaagagagg ctggggagta tcaccggtct gtcttcgcag ccaggctcca 13800
gtaccgtagt cccagccgag agcggtggca gtcacgtaga aggacagggc agagaagaga 13860
gccaggagga cgttgtacca gatcatggag gttcggtagg ctcctttctt ctcgtccacg 13920
agaccagagt ttcgcaggag aggcttcagg agcaggtagg agaaggtgcc aatgaggatt 13980
tcgggatcgg tgacggcagc ccagattcgc tcgccagcgt cgttggccag agccatggtg 14040
aatgattctt atactcagaa ggaaatgctt aacgatttcg ggtgtgagtt gacaaggaga 14100
gagagaaaag aagaggaaag gtaattcggg gacggtggtc ttttataccc ttggctaaag 14160
tcccaaccac aaagcaaaaa aattttcagt agtctatttt gcgtccggca tgggttaccc 14220
ggatggccag acaaagaaac tagtacaaag tctgaacaag cgtagattcc agactgcagt 14280
accctacgcc cttaacggca agtgtgggaa ccgggggagg tttgatatgt ggggtgaagg 14340
gggctctcgc cggggttggg cccgctactg ggtcaatttg gggtcaattg gggcaattgg 14400
ggctgttttt tgggacacaa atacgccgcc aacccggtct ctcctgaatt cgaatacgat 14460
atacatcaaa gactatgata cgcagtattg cacactgtac gagtaagagc actagccact 14520
gcactcaagt gaaaccgttg cccgggtacg agtatgagta tgtacagtat gtttagtatt 14580
gtacttggac agtgcttgta tcgtacattc tcaagtgtca aacataaata tccgttgcta 14640
tatcctcgca ccaccacgta gctcgctata tccctgtgtt gaatccatcc atcttggatt 14700
gccaattgtg cacacagaac cgggcactca cttccccatc cacacttgcg gccgctaaag 14760
ctgcttacca gccttagcgg atttcttggt ggccaggttg tcctggtaaa agaagtgaca 14820
gaacaggaga aagacagatc cgacgtaggc gtagttgaaa gcccaggaga acagcttgcc 14880
cttgtcagag ttgaagcagg gaacgttgat gtagtcccag accaggagaa agccaccgac 14940
gaactggcaa atctgcatgg cagtgatcag aggcttggcc ttgaacttgt agccagcggc 15000
agtcagtcca tagtaggtgt acatgatggt gtgaatgaac gagttaaaga acatgaagat 15060
ccacacaccc tcgttgtgca gtcgaatgcc gaggtagacg tcccagggag ctccaaagtg 15120
atggaaggcc tgcagaaagg acactcgctt gcccttgagg accagccaag cggtgtcgag 15180
gtactccacg tacttagaat agtagaaggc cttggcagtc caggtgaaca gcttggagtc 15240
ccagacagga gagggacact gaaagagagg ctggggagta tcaccggtct gtcttcgcag 15300
ccaggctcca gtaccgtagt cccagccgag agcggtggca gtcacgtaga aggacagggc 15360
agagaagaga gccaggagga cgttgtacca gatcatggag gttcggtagg ctcctttctt 15420
ctcgtccacg agaccagagt ttcgcaggag aggcttcagg agcaggtagg agaaggtgcc 15480
aatgaggatt tcgggatcgg tgacggcagc ccagattcgc tcgccagcgt cgttggccag 15540
agc 15543
<210> 173
<211> 13295
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW314
<220>
<221> misc_feature
<222> (10915)..(10918)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (10923)..(10923)
<223> n is a, c, g, or t
<400> 173
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 60
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 120
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 180
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 240
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 300
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 360
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 420
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 480
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 540
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 600
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 660
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 720
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 780
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 840
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 900
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 960
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 1020
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 1080
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 1140
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 1200
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 1260
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 1320
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 1380
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgatgcg 1440
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt 1500
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 1560
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 1620
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 1680
aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 1740
gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct 1800
tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc 1860
gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt 1920
aatgcgccgc tacagggcgc gtccattcgc cattcaggct gcgcaactgt tgggaagggc 1980
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 2040
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 2100
aattgtaata cgactcacta tagggcgaat tgggcccgac gtcgcatgca gtggtggtat 2160
tgtgactggg gatgtagttg agaataagtc atacacaagt cagctttctt cgagcctcat 2220
ataagtataa gtagttcaac gtattagcac tgtacccagc atctccgtat cgagaaacac 2280
aacaacatgc cccattggac agatcatgcg gatacacagg ttgtgcagta tcatacatac 2340
tcgatcagac aggtcgtctg accatcatac aagctgaaca agcgctccat acttgcacgc 2400
tctctatata cacagttaaa ttacatatcc atagtctaac ctctaacagt taatcttctg 2460
gtaagcctcc cagccagcct tctggtatcg cttggcctcc tcaataggat ctcggttctg 2520
gccgtacaga cctcggccga caattatgat atccgttccg gtagacatga catcctcaac 2580
agttcggtac tgctgtccga gagcgtctcc cttgtcgtca agacccaccc cgggggtcag 2640
aataagccag tcctcagagt cgcccttaat taaaaggcgt tgaaacagaa tgagccagac 2700
agcaaggaca aggtggccaa cagcaaggag tccaaaaagc cctctattga cgagatccac 2760
gatgttattg ctcatgaggt ttccgagctc gatgctggga agaagaagtg atttgtatat 2820
aagaaataaa tgagatatag taaaggagtg caagagaatg gcaaggtggt caaattctat 2880
attacttgca gtcactggtt cctcgttgac atgaatgaag ttaccgttgg catagctgat 2940
ttaatatata actgtccaac taactctcac ctagatataa cccatgtgtg tgtttccaat 3000
catcaatgcg gccgcttaga gagccttgcc agcgggctgc ttctcggcca ttcgagcgaa 3060
cacggccagg tatcggagca ggatgacgag accttcatgg ggcagagggt ttcggtaggg 3120
gaggttgtgc ttctggcaca gctgttccac ctggtaggaa acggcagtga ggttgtgtcg 3180
aggcagggtg ggccagagat ggtgctcgat ctggtagttc aggcctccaa agaaccagtc 3240
agtaatgatg cctcgtcgaa tgttcatggt ctcatggatc tgacccacag agaagccatg 3300
tccgtcccag acggaatcac cgatcttctc cagagggtag tggttcatga agaccacgat 3360
ggcaattccg aagccaccga cgagctcgga aacaaagaac accaggagcg aggtcaggat 3420
ggagggcata aagaagaggt ggaacagggt cttgagagtc cagtgcagag cgagtccaat 3480
ggcctctttc ttgtactgag atcggtagaa ctggttgtct cggtccttga gggatcgaac 3540
ggtcagcaca gactggaaac accagatgaa tcgcaggaga atacagatga ccaggaaata 3600
gtactgttgg aactgaatga gctttcggga gatgggagaa gctcgagtga catcgtcctc 3660
ggaccaggcg agcagaggca ggttatcaat gtcgggatcg tgaccctgaa cgttggtagc 3720
agaatgatgg gcgttgtgtc tgtccttcca ccaggtcacg gagaagccct ggagtccgtt 3780
gccaaagacc agacccacga ggttattcca gtttcggttc ttgaaggtct ggtggtggca 3840
gatgtcatga gacagccatc ccatttgctg gtagtgcata ccgagcagca cagcaccaat 3900
gaagtacatc tggtactgga ccatcaggaa gtatccaagc acgccaagac ccagggtggt 3960
ggagatcttg tacgagtacc agaggggaga ggcgtcaaac atgccagtgg cgatcagctc 4020
ttctcggagc tttcggaaat cctcctgagc ttcgttgacg gcagcctggg gaggcagctc 4080
ggaggagggg ttgatcttgg gcattcgctt gagcttgtcg aaggcttcct gagagtgcat 4140
aaccatgaag gcgtcagtag catctcgtcc ctggtagttc tcaatgattt cagctccacc 4200
agggtggaag ttcacccaag cggagacgtc gtaggtagtt ccgtcgatgg tgaggggcag 4260
agcctgtcgc ttggacttca ccatggagag ctgggttagt ttgtgtagag agtgtgtgtt 4320
gctagcgact ttcggattgt gtcattacac aaaacgcgtc gtctcgacac tgatcttgtc 4380
gtggatactc acggctcgga catcgtcgcc gacgatgaca ccggactttc gcttaaggac 4440
gtcagtaaca ggcattgtgt gatgtgtagt ttagatttcg aatctgtggg gaaagaaagg 4500
aaaaaagaga ctggcaaccg attgggagag ccactgttta tatataccct agacaagccc 4560
cccgcttgta agatgttggt caatgtaaac cagtattaag gttggcaagt gcaggagaag 4620
caaggtgtgg gtaccgagca atggaaatgt gcggaaggca aaaaaatgag gccacggcct 4680
attgtcgggg ctatatccag ggggcgattg aagtacacta acatgacatg tgtccacaga 4740
ccctcaatct ggcctgatga gccaaatcca tacgcgcttt cgcagctcta aaggctataa 4800
caagtcacac caccctgctc gacctcagcg ccctcacttt ttgttaagac aaactgtaca 4860
cgctgttcca gcgttttctg cctgcacctg gtgggacatt tggtgcaacc taaagtgctc 4920
ggaacctctg tggtgtccag atcagcgcag cagttccgag gtagttttga ggcccttaga 4980
tgatgcaatg gtgtcagtcg ctggatcacg agtcttaatg gcagtattcg ttcttatttg 5040
tgccattgag ccccgttatc ctcgtatctt ctacccccca tcccatccct ttgttggtgc 5100
aaccctaccc atttattgtt gggtgcagcc caaccgacgt ggagagcttg gcttggccat 5160
ataaaaaggc ccccccctag tggcaatggc agaaagtcag ctgtgagttg ttgaatttgt 5220
catctaggcg gcctggccgt cttctccggg gcaatttaaa ttccttcact tcaagttcat 5280
tcttcatctg cttctgtttt actttgacag gcaaatgaag acatggtacg acttgatgga 5340
ggccaagaac gccatttcac cccgagacac cgaagtgcct gaaatcctgg ctgcccccat 5400
tgataacatc ggaaactacg gtattccgga aagtgtatat agaacctttc cccagcttgt 5460
gtctgtggat atggatggtg taatcccctt tgagtactcg tcttggcttc tctccgagca 5520
gtatgaggct ctctaatcta gcgcatttaa tatctcaatg tatttatata tttatcttct 5580
catgcggccg ctaaagctgc ttaccagcct tagcggattt cttggtggcc aggttgtcct 5640
ggtaaaagaa gtgacagaac aggagaaaga cagatccgac gtaggcgtag ttgaaagccc 5700
aggagaacag cttgcccttg tcagagttga agcagggaac gttgatgtag tcccagacca 5760
ggagaaagcc accgacgaac tggcaaatct gcatggcagt gatcagaggc ttggccttga 5820
acttgtagcc agcggcagtc agtccatagt aggtgtacat gatggtgtga atgaacgagt 5880
taaagaacat gaagatccac acaccctcgt tgtgcagtcg aatgccgagg tagacgtccc 5940
agggagctcc aaagtgatgg aaggcctgca gaaaggacac tcgcttgccc ttgaggacca 6000
gccaagcggt gtcgaggtac tccacgtact tagaatagta gaaggccttg gcagtccagg 6060
tgaacagctt ggagtcccag acaggagagg gacactgaaa gagaggctgg ggagtatcac 6120
cggtctgtct tcgcagccag gctccagtac cgtagtccca gccgagagcg gtggcagtca 6180
cgtagaagga cagggcagag aagagagcca ggaggacgtt gtaccagatc atggaggttc 6240
ggtaggctcc tttcttctcg tccacgagac cagagtttcg caggagaggc ttcaggagca 6300
ggtaggagaa ggtgccaatg aggatttcgg gatcggtgac ggcagcccag attcgctcgc 6360
cagcgtcgtt ggccagagcc atggtgaatg attcttatac tcagaaggaa atgcttaacg 6420
atttcgggtg tgagttgaca aggagagaga gaaaagaaga ggaaaggtaa ttcggggacg 6480
gtggtctttt atacccttgg ctaaagtccc aaccacaaag caaaaaaatt ttcagtagtc 6540
tattttgcgt ccggcatggg ttacccggat ggccagacaa agaaactagt acaaagtctg 6600
aacaagcgta gattccagac tgcagtaccc tacgccctta acggcaagtg tgggaaccgg 6660
gggaggtttg atatgtgggg tgaagggggc tctcgccggg gttgggcccg ctactgggtc 6720
aatttggggt caattggggc aattggggct gttttttggg acacaaatac gccgccaacc 6780
cggtctctcc tgaattcgaa tacgatatac atcaaagact atgatacgca gtattgcaca 6840
ctgtacgagt aagagcacta gccactgcac tcaagtgaaa ccgttgcccg ggtacgagta 6900
tgagtatgta cagtatgttt agtattgtac ttggacagtg cttgtatcgt acattctcaa 6960
gtgtcaaaca taaatatccg ttgctatatc ctcgcaccac cacgtagctc gctatatccc 7020
tgtgttgaat ccatccatct tggattgcca attgtgcaca cagaaccggg cactcacttc 7080
cccatccaca cttgcggccg ctaaagctgc ttaccagcct tagcggattt cttggtggcc 7140
aggttgtcct ggtaaaagaa gtgacagaac aggagaaaga cagatccgac gtaggcgtag 7200
ttgaaagccc aggagaacag cttgcccttg tcagagttga agcagggaac gttgatgtag 7260
tcccagacca ggagaaagcc accgacgaac tggcaaatct gcatggcagt gatcagaggc 7320
ttggccttga acttgtagcc agcggcagtc agtccatagt aggtgtacat gatggtgtga 7380
atgaacgagt taaagaacat gaagatccac acaccctcgt tgtgcagtcg aatgccgagg 7440
tagacgtccc agggagctcc aaagtgatgg aaggcctgca gaaaggacac tcgcttgccc 7500
ttgaggacca gccaagcggt gtcgaggtac tccacgtact tagaatagta gaaggccttg 7560
gcagtccagg tgaacagctt ggagtcccag acaggagagg gacactgaaa gagaggctgg 7620
ggagtatcac cggtctgtct tcgcagccag gctccagtac cgtagtccca gccgagagcg 7680
gtggcagtca cgtagaagga cagggcagag aagagagcca ggaggacgtt gtaccagatc 7740
atggaggttc ggtaggctcc tttcttctcg tccacgagac cagagtttcg caggagaggc 7800
ttcaggagca ggtaggagaa ggtgccaatg aggatttcgg gatcggtgac ggcagcccag 7860
attcgctcgc cagcgtcgtt ggccagagcc atggttagcg tgtcgtgttt ttgttgtgct 7920
ggaagaacca aagggtggcg caatgtgtgt agatatatat gtcgtgaccc acaagtcaca 7980
caaacaagta tcgggaggag tggtgcacct ctatgcggag aaaccttata ccgctgtaga 8040
ccaactgggg cagaggtgtg agttgaagtc agctggagga gatgtgtgac agaagcacaa 8100
gaagtgagat tgtgagatgt atgtctaggg ggggaagttt tgtgtcaaat atatgggaat 8160
tattatcagc accacgaaat tatacgcctc atatgaccca tttaggtgga tagatcatgg 8220
acactgttga cagctgcgaa gaaaaagcgt attggggatg atccgaaatt agtccggtac 8280
cgaggcgcaa atacgtaaga cagccgatwa aatatatgcg agaaacacca aagagactct 8340
agatgtttgt ttggcacagt tttgacttct gcgaaggcct tacaccacct tgttgaccct 8400
tgtcgcgggt cgggcaatat cggctgacag agttttactt gctcaataag atacgagctg 8460
catagagttg aactacagga caatattggg gctggccaca tgaagggcat tgtttggagg 8520
tgtattgatg gtgaaaacac gatatgaaat gacaacgccc cctgttttat tattattctt 8580
attattttgg gtgcttctct atccatacaa gcacctccta acatgcttca taagtgacct 8640
cctcatcaca aggcctgagg tctcatttat ccagtggcgc caagctaaac taaaactggt 8700
ccgagtagac taaggcgaag agagaaggag agaagacagt ttttttgtgg ccgcctgtga 8760
acaatgaaaa cgatgagggt gagatggagc aaaccatatg gacagtcaga ggagtacgta 8820
cgctgcttac ataatggcgc aacgaccaca tgtcccacag atacgcatcg atgagcctaa 8880
aatgaacccg agtatatctc ataaaattct cggtgagagg tctgtgactg tcagtacaag 8940
gtgccttcat tatgccctca accttaccat acctcactga atgtagtgta cctctaaaaa 9000
tgaaatacag tgccaaaagc caaggcactg agctcgtcta acggacttga tatacaacca 9060
attaaaacaa atgaaaagaa atacagttct ttgtatcatt tgtaacaatt accctgtaca 9120
aactaaggta ttgaaatccc acaatattcc caaagtccac ccctttccaa attgtcatgc 9180
ctacaactca tataccaagc actaacctac cgtttaaaca gtgtacgcag atctactata 9240
gaggaacatt taaattgccc cggagaagac ggccaggccg cctagatgac aaattcaaca 9300
actcacagct gactttctgc cattgccact aggggggggc ctttttatat ggccaagcca 9360
agctctccac gtcggttggg ctgcacccaa caataaatgg gtagggttgc accaacaaag 9420
ggatgggatg gggggtagaa gatacgagga taacggggct caatggcaca aataagaacg 9480
aatactgcca ttaagactcg tgatccagcg actgacacca ttgcatcatc taagggcctc 9540
aaaactacct cggaactgct gcgctgatct ggacaccaca gaggttccga gcactttagg 9600
ttgcaccaaa tgtcccacca ggtgcaggca gaaaacgctg gaacagcgtg tacagtttgt 9660
cttaacaaaa agtgagggcg ctgaggtcga gcagggtggt gtgacttgtt atagccttta 9720
gagctgcgaa agcgcgtatg gatttggctc atcaggccag attgagggtc tgtggacaca 9780
tgtcatgtta gtgtacttca atcgccccct ggatatagcc ccgacaatag gccgtggcct 9840
catttttttg ccttccgcac atttccattg ctcggtaccc acaccttgct tctcctgcac 9900
ttgccaacct taatactggt ttacattgac caacatctta caagcggggg gcttgtctag 9960
ggtatatata aacagtggct ctcccaatcg gttgccagtc tcttttttcc tttctttccc 10020
cacagattcg aaatctaaac tacacatcac acaatgcctg ttactgacgt ccttaagcga 10080
aagtccggtg tcatcgtcgg cgacgatgtc cgagccgtga gtatccacga caagatcagt 10140
gtcgagacga cgcgttttgt gtaatgacac aatccgaaag tcgctagcaa cacacactct 10200
ctacacaaac taacccagct ctccatggcg tccacttcgg ctctgcccaa gcagaaccct 10260
gcgcttagac gcaccgtcac ctcaactact gtgacggatt ctgagtctgc cgccgtctct 10320
ccttcagact ctccccgcca ctcggcctct tccacatcgc tctcgtccat gtccgaggtt 10380
gatatcgcca agcccaagtc cgagtatggt gtcatgctcg acacctacgg caaccagttc 10440
gaggttcccg actttaccat caaggacatc tacaatgcca tccctaagca ctgcttcaag 10500
cgctccgctc tcaagggata cggttatatc ctccgcgaca ttgtcctcct gactaccact 10560
ttcagcatct ggtacaactt tgtgaccccc gaatatatcc cctccacccc cgcccgcgct 10620
ggtctgtggg ccgtgtacac cgttcttcag ggtcttttcg gtactggtct ctgggttatt 10680
gcccatgagt gcggtcacgg tgctttctcc gattctcgca tcatcaacga cattactggc 10740
tgggttcttc actcttccct ccttgtcccc tacttcagct ggcaaatctc ccaccgaaag 10800
caccacaagg ccactggcaa catggagcgt gacatggtct tcgttccccg aacccgcgag 10860
cagcaggcta ctcgtctcgg aaagatgacc cacgagctcg ctcatcttac tgagnnnntc 10920
gtnggctggc ccaactacct catcaccaat gttaccggcc acaactacca cgagcgccag 10980
cgtgagggtc gcggcaaggg caagcataac ggcctcggcg gtggtgttaa ccacttcgat 11040
ccccgcagcc ctctgtacga gaacagtgac gctaagctca tcgtcctcag cgatattggt 11100
atcggtctga tggccactgc tctgtacttc ctcgttcaga agttcggttt ctacaacatg 11160
gccatctggt actttgttcc ctacctctgg gttaaccact ggctcgttgc catcaccttc 11220
ctccagcaca ccgaccctac ccttccccac tacaccaacg acgagtggaa cttcgtccgt 11280
ggtgccgctg ctaccattga ccgtgagatg ggcttcatcg gccgccacct tctccacggc 11340
atcatcgaga ctcatgtcct ccaccactac gtcagcagca tccccttcta caacgcggac 11400
gaggccaccg aggccattaa gcccatcatg ggcaagcact accgggctga tgtccaggat 11460
ggtcctcgtg gcttcatccg cgccatgtac cgcagtgcgc gtatgtgcca gtgggttgag 11520
cccagcgctg gtgccgaggg tgctggtaag ggtgttctgt tcttccgcaa ccgcaacaac 11580
gtgggcaccc cccccgctgt tatcaagccc gttgcttaag taggcgcggc cgcaagtgtg 11640
gatggggaag tgagtgcccg gttctgtgtg cacaattggc aatccaagat ggatggattc 11700
aacacaggga tatagcgagc tacgtggtgg tgcgaggata tagcaacgga tatttatgtt 11760
tgacacttga gaatgtacga tacaagcact gtccaagtac aatactaaac atactgtaca 11820
tactcatact cgtacccggg caacggtttc acttgagtgc agtggctagt gctcttactc 11880
gtacagtgtg caatactgcg tatcatagtc tttgatgtat atcgtattca ttcatgttag 11940
ttgcgtacga agtcgtcaat gatgtcgata tgggttttga tcatgcacac ataaggtccg 12000
accttatcgg caagctcaat gagctccttg gtggtggtaa catccagaga agcacacagg 12060
ttggttttct tggctgccac gagcttgagc actcgagcgg caaaggcgga cttgtggacg 12120
ttagctcgag cttcgtagga gggcattttg gtggtgaaga ggagactgaa ataaatttag 12180
tctgcagaac tttttatcgg aaccttatct ggggcagtga agtatatgtt atggtaatag 12240
ttacgagtta gttgaactta tagatagact ggactatacg gctatcggtc caaattagaa 12300
agaacgtcaa tggctctctg ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag 12360
ccagcaatga cgttgcagct gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc 12420
agacccacag cctccaacga agaatgtatc gtcaaagtga tccaagcaca ctcatagttg 12480
gagtcgtact ccaaaggcgg caatgacgag tcagacagat actcgtcgac cttttccttg 12540
ggaaccacca ccgtcagccc ttctgactca cgtattgtag ccaccgacac aggcaacagt 12600
ccgtggatag cagaatatgt cttgtcggtc catttctcac caactttagg cgtcaagtga 12660
atgttgcaga agaagtatgt gccttcattg agaatcggtg ttgctgattt caataaagtc 12720
ttgagatcag tttggcgcgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 12780
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 12840
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 12900
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 12960
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 13020
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 13080
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 13140
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 13200
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 13260
gctgcgcctt atccggtaac tatcgtcttg agtcc 13295
<210> 174
<211> 15559
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW325
<400> 174
catggctgag gataagacca aggtcgagtt ccctaccctg actgagctga agcactctat 60
ccctaacgct tgctttgagt ccaacctcgg actctcgctc tactacactg cccgagcgat 120
cttcaacgca tctgcctctg ctgctctgct ctacgctgcc cgatctactc ccttcattgc 180
cgataacgtt ctgctccacg ctctggtttg cgccacctac atctacgtgc agggtgtcat 240
cttctggggt ttctttaccg tcggtcacga ctgtggtcac tctgccttct cccgatacca 300
ctccgtcaac ttcatcattg gctgcatcat gcactctgcc attctgactc ccttcgagtc 360
ctggcgagtg acccaccgac accatcacaa gaacactggc aacattgata aggacgagat 420
cttctaccct catcggtccg tcaaggacct ccaggacgtg cgacaatggg tctacaccct 480
cggaggtgct tggtttgtct acctgaaggt cggatatgct cctcgaacca tgtcccactt 540
tgacccctgg gaccctctcc tgcttcgacg agcctccgct gtcatcgtgt ccctcggagt 600
ctgggctgcc ttcttcgctg cctacgccta cctcacatac tcgctcggct ttgccgtcat 660
gggcctctac tactatgctc ctctctttgt ctttgcttcg ttcctcgtca ttactacctt 720
cttgcatcac aacgacgaag ctactccctg gtacggtgac tcggagtgga cctacgtcaa 780
gggcaacctg agctccgtcg accgatcgta cggagctttc gtggacaacc tgtctcacca 840
cattggcacc caccaggtcc atcacttgtt ccctatcatt ccccactaca agctcaacga 900
agccaccaag cactttgctg ccgcttaccc tcacctcgtg agacgtaacg acgagcccat 960
cattactgcc ttcttcaaga ccgctcacct ctttgtcaac tacggagctg tgcccgagac 1020
tgctcagatt ttcaccctca aagagtctgc cgctgcagcc aaggccaaga gcgactaagc 1080
ggccgcattg atgattggaa acacacacat gggttatatc taggtgagag ttagttggac 1140
agttatatat taaatcagct atgccaacgg taacttcatt catgtcaacg aggaaccagt 1200
gactgcaagt aatatagaat ttgaccacct tgccattctc ttgcactcct ttactatatc 1260
tcatttattt cttatataca aatcacttct tcttcccagc atcgagctcg gaaacctcat 1320
gagcaataac atcgtggatc tcgtcaatag agggcttttt ggactccttg ctgttggcca 1380
ccttgtcctt gctgtctggc tcattctgtt tcaacgcctt ttaattaacg gagtaggtct 1440
cggtgtcgga agcgacgcca gatccgtcat cctcctttcg ctctccaaag tagatacctc 1500
cgacgagctc tcggacaatg atgaagtcgg tgccctcaac gtttcggatg ggggagagat 1560
cggcgagctt gggcgacagc agctggcagg gtcgcaggtt ggcgtacagg ttcaggtcct 1620
ttcgcagctt gaggagaccc tgctcgggtc gcacgtcggt tcgtccgtcg ggagtggtcc 1680
atacggtgtt ggcagcgcct ccgacagcac cgagcataat agagtcagcc tttcggcaga 1740
tgtcgagagt agcgtcggtg atgggctcgc cctccttctc aatggcagct cctccaatga 1800
gtcggtcctc aaacacaaac tcggtgccgg aggcctcagc aacagacttg agcaccttga 1860
cggcctcggc aatcacctcg gggccacaga agtcgccgcc gagaagaaca atcttcttgg 1920
agtcagtctt ggtcttctta gtttcgggtt ccattgtgga tgtgtgtggt tgtatgtgtg 1980
atgtggtgtg tggagtgaaa atctgtggct ggcaaacgct cttgtatata tacgcacttt 2040
tgcccgtgct atgtggaaga ctaaacctcc gaagattgtg actcaggtag tgcggtatcg 2100
gctagggacc caaaccttgt cgatgccgat agcatgcgac gtcgggccca attcgcccta 2160
tagtgagtcg tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 2220
tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 2280
cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggac 2340
gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 2400
acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 2460
ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 2520
gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 2580
tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 2640
ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 2700
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 2760
gcgaatttta acaaaatatt aacgcttaca atttcctgat gcggtatttt ctccttacgc 2820
atctgtgcgg tatttcacac cgcatcaggt ggcacttttc ggggaaatgt gcgcggaacc 2880
cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 2940
tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc 3000
gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg 3060
gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat 3120
ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc 3180
acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa 3240
ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa 3300
aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt 3360
gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct 3420
tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat 3480
gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg 3540
cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg 3600
atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt 3660
attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg 3720
ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg 3780
gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg 3840
tcagaccaag tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa 3900
aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt 3960
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 4020
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 4080
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 4140
ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 4200
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 4260
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 4320
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 4380
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 4440
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 4500
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 4560
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 4620
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 4680
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 4740
accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct 4800
ctccccgcgc gttggccgat tcattaatgc agctggcgcg cccactgagc tcgtctaacg 4860
gacttgatat acaaccaatt aaaacaaatg aaaagaaata cagttctttg tatcatttgt 4920
aacaattacc ctgtacaaac taaggtattg aaatcccaca atattcccaa agtccacccc 4980
tttccaaatt gtcatgccta caactcatat accaagcact aacctaccaa acaccactaa 5040
aaccccacaa aatatatctt accgaatata cagtaacaag ctaccaccac actcgttggg 5100
tgcagtcgcc agcttaaaga tatctatcca catcagccac aactcccttc ctttaataaa 5160
ccgactacac ccttggctat tgaggttatg agtgaatata ctgtagacaa gacactttca 5220
agaagactgt ttccaaaacg taccactgtc ctccactaca aacacaccca atctgcttct 5280
tctagtcaag gttgctacac cggtaaatta taaatcatca tttcattagc agggcagggc 5340
cctttttata gagtcttata cactagcgga ccctgccggt agaccaaccc gcaggcgcgt 5400
cagtttgctc cttccatcaa tgcgtcgtag aaacgactta ctccttcttg agcagctcct 5460
tgaccttgtt ggcaacaagt ctccgacctc ggaggtggag gaagagcctc cgatatcggc 5520
ggtagtgata ccagcctcga cggactcctt gacggcagcc tcaacagcgt caccggcggg 5580
cttcatgtta agagagaact tgagcatcat ggcggcagac agaatggtgg cgtacgcaac 5640
taacatgaat gaatacgata tacatcaaag actatgatac gcagtattgc acactgtacg 5700
agtaagagca ctagccactg cactcaagtg aaaccgttgc ccgggtacga gtatgagtat 5760
gtacagtatg tttagtattg tacttggaca gtgcttgtat cgtacattct caagtgtcaa 5820
acataaatat ccgttgctat atcctcgcac caccacgtag ctcgctatat ccctgtgttg 5880
aatccatcca tcttggattg ccaattgtgc acacagaacc gggcactcac ttccccatcc 5940
acacttgcgg ccgcttagct gcctactctt ccttgggacg gagtccaaga acacgcaagt 6000
gctccaaatg tgaagcaaat gcttgccaaa acgtatcctt gacaaggtat ggaaccttgt 6060
actcgctgca ggtgttcttg atgatggcca gaatatcggg ataatggtgc tgcgacacgt 6120
tggggaacag atggtgcaca gcctggtagt tcaagctgcc agtgatgctg gtccagaggt 6180
gcgaatcgtg tgcgtaatcc tgcgtagtct cgacctgcat agctgcccag tccttttgga 6240
tgatcccgtt ctcgtcaggc aacggccact gaacttcctc aacaacgtgg ttcgcctgga 6300
aggtcagcgc cagccagtaa gacgacacca tgtccgcgac cgtgaacaag agcagcacct 6360
tgcccagggg cagatactgc aggggaacaa tcaggcgata ccagacaaag aaagccttgc 6420
cgccccagaa catcacagtg tgccatgtcg agatgggatt gacacgaata gcgtcattgg 6480
tcttgacaaa gtacaaaatg ttgatgtcct gaatgcgcac cttgaacgcc agcagtccgt 6540
acaggaaagg aacaaacatg tgctggttga tgtggttgac aaaccacttt tggttgggct 6600
tgatacgacg aacatcgggc tcagacgtcg acacgtcggg atctgctcca gcaatgttgg 6660
tgtaggggtg atggccgagc atatgttggt acatccacac caggtacgat gctccgttga 6720
aaaagtcgtg cgtggctccc agaatcttcc agacagtggg gttgtgggtc actgaaaagt 6780
gagacgcatc atgaagaggg ttgagtccga cttgtgcgca cgcaaatccc atgatgattg 6840
caaacaccac ctgaagccat gtgcgttcga caacgaaagg cacaaagagc tgcgcgtagt 6900
aggaagcgat caaggatcca aagataagag cgtatcgtcc ccagatctct ggtctattct 6960
tgggatcaat gttccgatcc gtaaagtagc cctcgactct cgtcttgatg gttttgtgga 7020
acaccgttgg ctccgggaag atgggcagct cattcgagac cagtgtaccg acatagtact 7080
tcttcataat ggcatctgca gccccaaacg cgtgatacat ctcaaagacc ggagtaacat 7140
ctcggccagc tccgagcagg agagtgtcca ctccaccagg atggcggctc aagaactttg 7200
tgacatcgta caccctgccg cggatggcca agagtaggtc gtccttggtg ttatgggccg 7260
ccagctcttc ccaggtgaag gtttttcctt ggtccgttcc catggagagc tgggttagtt 7320
tgtgtagaga gtgtgtgttg ctagcgactt tcggattgtg tcattacaca aaacgcgtcg 7380
tctcgacact gatcttgtcg tggatactca cggctcggac atcgtcgccg acgatgacac 7440
cggactttcg cttaaggacg tcagtaacag gcattgtgtg atgtgtagtt tagatttcga 7500
atctgtgggg aaagaaagga aaaaagagac tggcaaccga ttgggagagc cactgtttat 7560
atatacccta gacaagcccc ccgcttgtaa gatgttggtc aatgtaaacc agtattaagg 7620
ttggcaagtg caggagaagc aaggtgtggg taccgagcaa tggaaatgtg cggaaggcaa 7680
aaaaatgagg ccacggccta ttgtcggggc tatatccagg gggcgattga agtacactaa 7740
catgacatgt gtccacagac cctcaatctg gcctgatgag ccaaatccat acgcgctttc 7800
gcagctctaa aggctataac aagtcacacc accctgctcg acctcagcgc cctcactttt 7860
tgttaagaca aactgtacac gctgttccag cgttttctgc ctgcacctgg tgggacattt 7920
ggtgcaacct aaagtgctcg gaacctctgt ggtgtccaga tcagcgcagc agttccgagg 7980
tagttttgag gcccttagat gatgcaatgg tgtcagtcgc tggatcacga gtcttaatgg 8040
cagtattcgt tcttatttgt gccattgagc cccgttatcc tcgtatcttc taccccccat 8100
cccatccctt tgttggtgca accctaccca tttattgttg ggtgcagccc aaccgacgtg 8160
gagagcttgg cttggccata taaaaaggcc cccccctagt ggcaatggca gaaagtcagc 8220
tgtgagttgt tgaatttgtc atctaggcgg cctggccgtc ttctccgggg caatttaaac 8280
agtgtacgca gatcccgtca acagttttat atatcgtagt tacaaccatc aacacttttt 8340
ggtaagtgta ccattctata ctccaactgg tctgcaactg tacaagtaga catgttaatg 8400
gtagttaata acatctacag cagaacctat ggtaaagaca ttgcattttt acaggaagta 8460
tcgtcctaca cgttgataaa tccaaagatg cggaacttct tccactttta tcatcatccc 8520
ctactcgtac actcgtactc tttgttcgat cgcgattcat ttctataaat aatcttgtat 8580
gtacatgcgg ccgcttagtg agtatgctcg tggtaggagt gctcagggtt gccaacagca 8640
aggaggttga cgtaggtcac tcgaaagcat tccagatagg gtcggacgtc gtactcgact 8700
ccgtgcttct cgaagagtgc tcgcactcga ggagcaatct tggggtggtt gtactgaggc 8760
atggagggga acagatggtg ctcgatctgg aagttgaggt aggccatcca ccagttgaca 8820
aagggagagt cggaacagtt ggtagtgtgg ttggcagagt acagagccca cgaaatgtgc 8880
ttggtgggag gaacgacatc cttgtgagta tgggagacgg cgaagttggt gaagatgtag 8940
gtgccaccga cagccacgta gaaggcatac agtcgaagag aggacaggag tcccagatgg 9000
ccaaaggcaa ggtgccagag aacgtatcgg agacccatgt aggccagttc gagatggttg 9060
tgcactcgca gtgcatgatt ggggtggaga acgaactgcc agccgaaaga gaccagggag 9120
caaatgatgc ctccaaagaa gaggggagct tgccaagcaa gccaggcttt acccttgcct 9180
cgtgccttgg ctccgacaat cttgtggaag gcaacgagag gcatggtctg caggtcggga 9240
tcggttccga gcttctgagg agtggcgtga tgtttgttgt gctggtttct ccagtagcag 9300
ccagacatac cacagcccag tccatagatg gccatctgga gatgtcggtc aatcttgatg 9360
ttgccagtga gcgagtagtg tccgccttca tgctggagcc atccgcatcg accttgagca 9420
attccagcaa cgatggcacc gaggaaccag tatccggacc agatcagctg gacgccagcc 9480
cagtacatgg caagcacctc gacacatcgg taggacacgt gcaccagatt gggctcgaag 9540
taaccttcct ctttcagttc cagtcgcagc ttctcaaagt ctctagagat gtcgtcctgt 9600
gcatagccag cctcggcagg tcgggaggga agagagtaca gcatcttgtc agccttcttc 9660
gatcggacgt ggaagttgtt gtaagcgtca gaagcatctg ctccgagctg gaacttgatg 9720
acggagccac cagggtgtcg cttcacgaac gaggagacgt cgtacactcg tccgttgata 9780
atcatctcct tctcggcgtc gatagacgag acggtgacat cggcagcctc agatcgggag 9840
tcgttggtag caccgtggta ctctcgaggg agagtggaag agtgggtcac gtgggctgca 9900
gctccggact tgccagcgac catggagagc tgggttagtt tgtgtagaga gtgtgtgttg 9960
ctagcgactt tcggattgtg tcattacaca aaacgcgtcg tctcgacact gatcttgtcg 10020
tggatactca cggctcggac atcgtcgccg acgatgacac cggactttcg cttaaggacg 10080
tcagtaacag ccattgttgt atgtgttttg gtgatgtcac gaaaaggacg acgcagcata 10140
gatatatatg gacgtggaaa ctaggagaag gaaccttatt gctgatccgt aaaattatcg 10200
tggaaagagg tggggaggga agatatgggt atggggagat gcaggagcga caaaacacgc 10260
aaatcggagc cgttaacctc acaaatatcg ccaattcctc ccccacagct ccccaaacag 10320
cccgttgagc gcttttgccc aaccctctcc agtccaaaaa aaaccctatt gtctggtgac 10380
gtctcctacc catgcacctc gtggttgctg tataactggg gactccacga cccgaggtca 10440
attaggccac gtgacaccca attgtgtcgc tcgcacctca attgaagact aagctcgttc 10500
cgccacctca attgaaccca tatgagcacc aatcgccctc accgcaacat aaaacgctcc 10560
tcatagacta gtgctatcca aacgctatta tgacgtgacg ctgaataggg ttgcgcttaa 10620
acgaggacag ttgtcttatt ttggggcaag gttagggcat cgaggcagtc tgtaactgtc 10680
agtaattgca ttgtatcttc ccctttgtca cggacttgcc cctgacactg gttggttgtg 10740
tcacatttgt cctcaaacaa agtggttcac gccttgattt gatctgaacc caaaacctga 10800
gtgagcacat ggagaaggtt aaaaacaaac cgctctcaac ggatgcaacc caaaccctag 10860
tgaactgtga ctgcgaattc tacaatacgt gagtcagaag ggctgacggt ggtggttccc 10920
aaggaaaagg tcgacgagta tctgtctgac tcgtcattgc cgcctttgga gtacgactcc 10980
aactatgagt gtgcttggat cactttgacg atacattctt cgttggaggc tgtgggtctg 11040
acagctgcgt tttcggcgcg gttggccgac aacaatatca gctgcaacgt cattgctggc 11100
tttcatcatg atcacatttt tgtcggcaaa ggcgacgccc agagagccat tgacgttctt 11160
tctaatttgg accgatagcc gtatagtcca gtctatctat aagttcaact aactcgtaac 11220
tattaccata acatatactt cactgcccca gataaggttc cgataaaaag ttctgcagac 11280
taaatttatt tcagtctcct cttcaccacc aaaatgccct cctacgaagc tcgagctaac 11340
gtccacaagt ccgcctttgc cgctcgagtg ctcaagctcg tggcagccaa gaaaaccaac 11400
ctgtgtgctt ctctggatgt taccaccacc aaggagctca ttgagcttgc cgataaggtc 11460
ggaccttatg tgtgcatgat caaaacccat atcgacatca ttgacgactt cacctacgcc 11520
ggcactgtgc tccccctcaa ggaacttgct cttaagcacg gtttcttcct gttcgaggac 11580
agaaagttcg cagatattgg caacactgtc aagcaccagt accggtgtca ccgaatcgcc 11640
gagtggtccg atatcaccaa cgcccacggt gtacccggaa ccggaatcat tgctggcctg 11700
cgagctggtg ccgaggaaac tgtctctgaa cagaagaagg aggacgtctc tgactacgag 11760
aactcccagt acaaggagtt cctagtcccc tctcccaacg agaagctggc cagaggtctg 11820
ctcatgctgg ccgagctgtc ttgcaagggc tctctggcca ctggcgagta ctccaagcag 11880
accattgagc ttgcccgatc cgaccccgag tttgtggttg gcttcattgc ccagaaccga 11940
cctaagggcg actctgagga ctggcttatt ctgacccccg gggtgggtct tgacgacaag 12000
ggagacgctc tcggacagca gtaccgaact gttgaggatg tcatgtctac cggaacggat 12060
atcataattg tcggccgagg tctgtacggc cagaaccgag atcctattga ggaggccaag 12120
cgataccaga aggctggctg ggaggcttac cagaagatta actgttagag gttagactat 12180
ggatatgtaa tttaactgtg tatatagaga gcgtgcaagt atggagcgct tgttcagctt 12240
gtatgatggt cagacgacct gtctgatcga gtatgtatga tactgcacaa cctgtgtatc 12300
cgcatgatct gtccaatggg gcatgttgtt gtgtttctcg atacggagat gctgggtaca 12360
gtgctaatac gttgaactac ttatacttat atgaggctcg aagaaagctg acttgtgtat 12420
gacttattct caactacatc cccagtcaca ataccaccac tgcactacca ctacaccaga 12480
tctgcgtaca ctgtttaaac agagtgtgaa agactcacta tggtccgggc ttatctcgac 12540
caatagccaa agtctggagt ttctgagaga aaaaggcaag atacgtatgt aacaaagcga 12600
cgcatggtac aataataccg gaggcatgta tcatagagag ttagtggttc gatgatggca 12660
ctggtgcctg gtatgacttt atacggctga ctacatattt gtcctcagac atacaattac 12720
agtcaagcac ttacccttgg acatctgtag gtaccccccg gccaagacga tctcagcgtg 12780
tcgtatgtcg gattggcgta gctccctcgc tcgtcaattg gctcccatct actttcttct 12840
gcttggctac acccagcatg tctgctatgg ctcgttttcg tgccttatct atcctcccag 12900
tattaccaac tctaaatgac atgatgtgat tgggtctaca ctttcatatc agagataagg 12960
agtagcacag ttgcataaaa agcccaactc taatcagctt cttcctttct tgtaattagt 13020
acaaaggtga ttagcgaaat ctggaagctt agttggccct aaaaaaatca aaaaaagcaa 13080
aaaacgaaaa acgaaaaacc acagttttga gaacagggag gtaacgaagg atcgtatata 13140
tatatatata tatatatacc cacggatccc gagaccggcc tttgattctt ccctacaacc 13200
aaccattctc accaccctaa ttcacaacca tggctgagga taagaccaag gtcgagttcc 13260
ctaccctgac tgagctgaag cactctatcc ctaacgcttg ctttgagtcc aacctcggac 13320
tctcgctcta ctacactgcc cgagcgatct tcaacgcatc tgcctctgct gctctgctct 13380
acgctgcccg atctactccc ttcattgccg ataacgttct gctccacgct ctggtttgcg 13440
ccacctacat ctacgtgcag ggtgtcatct tctggggttt ctttaccgtc ggtcacgact 13500
gtggtcactc tgccttctcc cgataccact ccgtcaactt catcattggc tgcatcatgc 13560
actctgccat tctgactccc ttcgagtcct ggcgagtgac ccaccgacac catcacaaga 13620
acactggcaa cattgataag gacgagatct tctaccctca tcggtccgtc aaggacctcc 13680
aggacgtgcg acaatgggtc tacaccctcg gaggtgcttg gtttgtctac ctgaaggtcg 13740
gatatgctcc tcgaaccatg tcccactttg acccctggga ccctctcctg cttcgacgag 13800
cctccgctgt catcgtgtcc ctcggagtct gggctgcctt cttcgctgcc tacgcctacc 13860
tcacatactc gctcggcttt gccgtcatgg gcctctacta ctatgctcct ctctttgtct 13920
ttgcttcgtt cctcgtcatt actaccttct tgcatcacaa cgacgaagct actccctggt 13980
acggtgactc ggagtggacc tacgtcaagg gcaacctgag ctccgtcgac cgatcgtacg 14040
gagctttcgt ggacaacctg tctcaccaca ttggcaccca ccaggtccat cacttgttcc 14100
ctatcattcc ccactacaag ctcaacgaag ccaccaagca ctttgctgcc gcttaccctc 14160
acctcgtgag acgtaacgac gagcccatca ttactgcctt cttcaagacc gctcacctct 14220
ttgtcaacta cggagctgtg cccgagactg ctcagatttt caccctcaaa gagtctgccg 14280
ctgcagccaa ggccaagagc gactaagcgg ccgctattta tcactcttta caacttctac 14340
ctcaactatc tactttaata aatgaatatc gtttattctc tatgattact gtatatgcgt 14400
tcctctaaga caaatcgaaa ccagcatgtg atcgaatggc atacaaaagt ttcttccgaa 14460
gttgatcaat gtcctgatag tcaggcagct tgagaagatt gacacaggtg gaggccgtag 14520
ggaaccgatc aacctgtcta ccagcgttac gaatggcaaa tgacgggttc aaagccttga 14580
atccttgcaa tggtgccttg gatactgatg tcacaaactt aagaagcagc cgcttgtcct 14640
cttcctcgat cgatggaagc cggtagaacc gggctgcttg tgcttggaga tggaagccgg 14700
tagaaccggg ctgcttgggg ggatttgggg ccgctgggct ccaaagaggg gtaggcattt 14760
cgttggggtt acgtaattgc ggcatttggg tcctgcgcgc atgtcccatt ggtcagaatt 14820
agtccggata ggagacttat cagccaatca cagcgccgga tccacctgta ggttgggttg 14880
ggtgggagca cccctccaca gagtagagtc aaacagcagc agcaacatga tagttggggg 14940
tgtgcgtgtt aaaggaaaaa aaagaagctt gggttatatt cccgctctat ttagaggttg 15000
cgggatagac gccgacggag ggcaatggcg ctatggaacc ttgcggatat ccatacgccg 15060
cggcggactg cgtccgaacc agctccagca gcgttttttc cgggccattg agccgactgc 15120
gaccccgcca acgtgtcttg gcccacgcac tcatgtcatg ttggtgttgg gaggccactt 15180
tttaagtagc acaaggcacc tagctcgcag caaggtgtcc gaaccaaaga agcggctgca 15240
gtggtgcaaa cggggcggaa acggcgggaa aaagccacgg gggcacgaat tgaggcacgc 15300
cctcgaattt gagacgagtc acggccccat tcgcccgcgc aatggctcgc caacgcccgg 15360
tcttttgcac cacatcaggt taccccaagc caaacctttg tgttaaaaag cttaacatat 15420
tataccgaac gtaggtttgg gcgggcttgc tccgtctgtc caaggcaaca tttatataag 15480
ggtctgcatc gccggctcaa ttgaatcttt tttcttcttc tcttctctat attcattctt 15540
gaattaaaca cacatcaac 15559
<210> 175
<211> 16325
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZKSL5598
<400> 175
cgatgagcct aaaatgaacc cgagtatatc tcataaaatt ctcggtgaga ggtctgtgac 60
tgtcagtaca aggtgccttc attatgccct caaccttacc atacctcact gaatgtagtg 120
tacctctaaa aatgaaatac agtgccaaaa gccaaggcac tgagctcgtc taacggactt 180
gatatacaac caattaaaac aaatgaaaag aaatacagtt ctttgtatca tttgtaacaa 240
ttaccctgta caaactaagg tattgaaatc ccacaatatt cccaaagtcc acccctttcc 300
aaattgtcat gcctacaact catataccaa gcactaacct accgtttaaa cagtgtacgc 360
agatcccgtc aacagtttta tatatcgtag ttacaaccat caacactttt tggtaagtgt 420
accattctat actccaactg gtctgcaact gtacaagtag acatgttaat ggtagttaat 480
aacatctaca gcagaaccta tggtaaagac attgcatttt tacaggaagt atcgtcctac 540
acgttgataa atccaaagat gcggaacttc ttccactttt atcatcatcc cctactcgta 600
cactcgtact ctttgttcga tcgcgattca tttctataaa taatcttgta tgtacatgcg 660
gccgctaaag ctgcttacca gccttagcgg atttcttggt ggccaggttg tcctggtaaa 720
agaagtgaca gaacaggaga aagacagatc cgacgtaggc gtagttgaaa gcccaggaga 780
acagcttgcc cttgtcagag ttgaagcagg gaacgttgat gtagtcccag accaggagaa 840
agccaccgac gaactggcaa atctgcatgg cagtgatcag aggcttggcc ttgaacttgt 900
agccagcggc agtcagtcca tagtaggtgt acatgatggt gtgaatgaac gagttaaaga 960
acatgaagat ccacacaccc tcgttgtgca gtcgaatgcc gaggtagacg tcccagggag 1020
ctccaaagtg atggaaggcc tgcagaaagg acactcgctt gcccttgagg accagccaag 1080
cggtgtcgag gtactccacg tacttagaat agtagaaggc cttggcagtc caggtgaaca 1140
gcttggagtc ccagacagga gagggacact gaaagagagg ctggggagta tcaccggtct 1200
gtcttcgcag ccaggctcca gtaccgtagt cccagccgag agcggtggca gtcacgtaga 1260
aggacagggc agagaagaga gccaggagga cgttgtacca gatcatggag gttcggtagg 1320
ctcctttctt ctcgtccacg agaccagagt ttcgcaggag aggcttcagg agcaggtagg 1380
agaaggtgcc aatgaggatt tcgggatcgg tgacggcagc ccagattcgc tcgccagcgt 1440
cgttggccag agccatggta ccagagctgg gttagtttgt gtagagagtg tgtgttgcta 1500
gcgactttcg gattgtgtca ttacacaaaa cgcgtcgtct cgacactgat cttgtcgtgg 1560
atactcacgg ctcggaattc tgtgatgtgt agtttagatt tcgaatctgt ggggaaagaa 1620
aggaaaaaag agactggcaa ccgattggga gagccactgt ttatatatac cctagacaag 1680
ccccccgctt gtaagatgtt ggtcaatgta aaccagtatt aaggttggca agtgcaggag 1740
aagcaaggtg tgggtaccga gcaatggaaa tgtgcggaag gcaaaaaaat gaggccacgg 1800
cctattgtcg gggctatatc cagggggcga ttgaagtaca ctaacatgac atgtgtccac 1860
agaccctcaa tctggcctga tgagccaaat ccatacgcgc tttcgcagct ctaaaggcta 1920
taacaagtca caccaccctg ctcgacctca gcgccctcac tttttgttaa gacaaactgt 1980
acacgctgtt ccagcgtttt ctgcctgcac ctggtgggac atttggtgca acctaaagtg 2040
ctcggaacct ctgtggtgtc cagatcagcg cagcagttcc gaggtagttt tgaggccctt 2100
agatgatgca atggtgtcag tcgctggatc acgagtctta atggcagtat tcgttcttat 2160
ttgtgccatt gagccccgtt atcctcgtat cttctacccc ccatcccatc cctttgttgg 2220
tgcaacccta cccatttatt gttgggtgca gcccaaccga cgtggagagc ttggcttggc 2280
catataaaaa ggcccccccc tagtggcaat ggcagaaagt cagctgtgag ttgttgaatt 2340
tgtcatctag gcggcctggc cgtcttctcc ggggcaattt aaatgttcct ctatagtaga 2400
tctgcgtaca ctgtttaaac aagctaccac cacactcgtt gggtgcagtc gccagcttaa 2460
agatatctat ccacatcagc cacaactccc ttcctttaat aaaccgacta cacccttggc 2520
tattgaggtt atgagtgaat atactgtaga caagacactt tcaagaagac tgtttccaaa 2580
acgtaccact gtcctccact acaaacacac ccaatctgct tcttctagtc aaggttgcta 2640
caccggtaaa ttataaatca tcatttcatt agcagggcag ggcccttttt atagagtctt 2700
atacactagc ggaccctgcc ggtagaccaa cccgcaggcg cgtcagtttg ctccttccat 2760
caatgcgtcg tagaaacgac ttactccttc ttgagcagct ccttgacctt gttggcaaca 2820
agtctccgac ctcggaggtg gaggaagagc ctccgatatc ggcggtagtg ataccagcct 2880
cgacggactc cttgacggca gcctcaacag cgtcaccggc gggcttcatg ttaagagaga 2940
acttgagcat catggcggca gacagaatgg tggcaatggg gttgaccttc tgcttgccga 3000
gatcgggggc agatccgtga cagggctcgt acagaccgaa cgcctcgttg gtgtcgggca 3060
gagaagccag agaggcggag ggcagcagac ccagagaacc ggggatgacg gaggcctcgt 3120
cggagatgat atcgccaaac atgttggtgg tgatgatgat accattcatc ttggagggct 3180
gcttgatgag gatcatggcg gccgagtcga tcagctggtg gttgagctcg agctggggga 3240
attcgtcctt gaggactcga gtgacagtct ttcgccaaag tcgagaggag gccagcacgt 3300
tggccttgtc aagagaccac acgggaagag gggggttgtg ctgaagggcc aggaaggcgg 3360
ccattcgggc aattcgctca acctcaggaa cggagtaggt ctcggtgtcg gaagcgacgc 3420
cagatccgtc atcctccttt cgctctccaa agtagatacc tccgacgagc tctcggacaa 3480
tgatgaagtc ggtgccctca acgtttcgga tgggggagag atcggcgagc ttgggcgaca 3540
gcagctggca gggtcgcagg ttggcgtaca ggttcaggtc ctttcgcagc ttgaggagac 3600
cctgctcggg tcgcacgtcg gttcgtccgt cgggagtggt ccatacggtg ttggcagcgc 3660
ctccgacagc accgagcata atagagtcag cctttcggca gatgtcgaga gtagcgtcgg 3720
tgatgggctc gccctccttc tcaatggcag ctcctccaat gagtcggtcc tcaaacacaa 3780
actcggtgcc ggaggcctca gcaacagact tgagcacctt gacggcctcg gcaatcacct 3840
cggggccaca gaagtcgccg ccgagaagaa caatcttctt ggagtcagtc ttggtcttct 3900
tagtttcggg ttccattgtg gatgtgtgtg gttgtatgtg tgatgtggtg tgtggagtga 3960
aaatctgtgg ctggcaaacg ctcttgtata tatacgcact tttgcccgtg ctatgtggaa 4020
gactaaacct ccgaagattg tgactcaggt agtgcggtat cggctaggga cccaaacctt 4080
gtcgatgccg atagcgctat cgaacgtacc ccagccggcc gggagtatgt cggaggggac 4140
atacgagatc gtcaagggtt tgtggccaac tggtaaataa atgatgactc aggcgacgac 4200
ggaattcgac agcaactact cctttcacca accatgtgca ttttagctcg aataacattc 4260
acaggcttgg tgatctacat ccatggtgtc tggccgatta ccgtggtgtt ttggcagtaa 4320
cgagaatatt gagtgaactc ttcccatcac caataaagac tcatactaca atcacgagcg 4380
cttcagctgc cactatagtg ttggtgacac aatacccctc gatgctgggc attactgtag 4440
caagagatat tcatttcatg gcgcattttc cagtctacct gactttttag tgccgatttc 4500
ttctccacat tttacgctca gtgtgaaaag ttggagtcga cttgcgccat tatgtaagca 4560
gcgtgtactc ctctgactgt ccatatggtt tgctccatct caccctcatc gttttcattg 4620
ttcacaggcg gccacaaaaa aactgtcttc tctccttctc tcttcgcctt agtctactcg 4680
gaccagtttt agtttagctt ggcgccactg gataaatgag acctcaggcc ttgtgatgag 4740
gaggtcactt atgaagcatg ttaggaggtg cttgtatgga tagagaagca cccaaaataa 4800
taagaataat aataaaacag ggggcgttgt catttcatat cgtgttttca ccatcaatac 4860
acctccaaac aatgcccttc atgtggccag ccccaatatt gtcctgtagt tcaactctat 4920
gcagctcgta tcttattgag caagtaaaac tctgtcagcc gatattgccc gacccgcgac 4980
aagggtcaac aaggtggtgt aaggccttcg cagaagtcaa aactgtgcca aacaaacatc 5040
tagagtctct ttggtgtttc tcgcatatat ttwatcggct gtcttacgta tttgcgcctc 5100
ggtaccggac taatttcgga tcatccccaa tacgcttttt cttcgcagct gtcaacagtg 5160
tccatgatct atccacctaa atgggtcata tgaggcgtat aatttcgtgg tgctgataat 5220
aattcccata tatttgacac aaaacttccc cccctagaca tacatctcac aatctcactt 5280
cttgtgcttc tgtcacacat ctcctccagc tgacttcaac tcacacctct gccccagttg 5340
gtctacagcg gtataaggtt tctccgcata gaggtgcacc actcctcccg atacttgttt 5400
gtgtgacttg tgggtcacga catatatatc tacacacatt gcgccaccct ttggttcttc 5460
cagcacaaca aaaacacgac acgctaacca tgggaacgga ccaaggaaaa accttcacct 5520
gggaagagct ggcggcccat aacaccaagg acgacctact cttggccatc cgcggcaggg 5580
tgtacgatgt cacaaagttc ttgagccgcc atcctggtgg agtggacact ctcctgctcg 5640
gagctggccg agatgttact ccggtctttg agatgtatca cgcgtttggg gctgcagatg 5700
ccattatgaa gaagtactat gtcggtacac tggtctcgaa tgagctgccc atcttcccgg 5760
agccaacggt gttccacaaa accatcaaga cgagagtcga gggctacttt acggatcgga 5820
acattgatcc caagaataga ccagagatct ggggacgata cgctcttatc tttggatcct 5880
tgatcgcttc ctactacgcg cagctctttg tgcctttcgt tgtcgaacgc acatggcttc 5940
aggtggtgtt tgcaatcatc atgggatttg cgtgcgcaca agtcggactc aaccctcttc 6000
atgatgcgtc tcacttttca gtgacccaca accccactgt ctggaagatt ctgggagcca 6060
cgcacgactt tttcaacgga gcatcgtacc tggtgtggat gtaccaacat atgctcggcc 6120
atcaccccta caccaacatt gctggagcag atcccgacgt gtcgacgtct gagcccgatg 6180
ttcgtcgtat caagcccaac caaaagtggt ttgtcaacca catcaaccag cacatgtttg 6240
ttcctttcct gtacggactg ctggcgttca aggtgcgcat tcaggacatc aacattttgt 6300
actttgtcaa gaccaatgac gctattcgtg tcaatcccat ctcgacatgg cacactgtga 6360
tgttctgggg cggcaaggct ttctttgtct ggtatcgcct gattgttccc ctgcagtatc 6420
tgcccctggg caaggtgctg ctcttgttca cggtcgcgga catggtgtcg tcttactggc 6480
tggcgctgac cttccaggcg aaccacgttg ttgaggaagt tcagtggccg ttgcctgacg 6540
agaacgggat catccaaaag gactgggcag ctatgcaggt cgagactacg caggattacg 6600
cacacgattc gcacctctgg accagcatca ctggcagctt gaactaccag gctgtgcacc 6660
atctgttccc caacgtgtcg cagcaccatt atcccgatat tctggccatc atcaagaaca 6720
cctgcagcga gtacaaggtt ccataccttg tcaaggatac gttttggcaa gcatttgctt 6780
cacatttgga gcacttgcgt gttcttggac tccgtcccaa ggaagagtag gcggccgcaa 6840
gtgtggatgg ggaagtgagt gcccggttct gtgtgcacaa ttggcaatcc aagatggatg 6900
gattcaacac agggatatag cgagctacgt ggtggtgcga ggatatagca acggatattt 6960
atgtttgaca cttgagaatg tacgatacaa gcactgtcca agtacaatac taaacatact 7020
gtacatactc atactcgtac ccgggcaacg gtttcacttg agtgcagtgg ctagtgctct 7080
tactcgtaca gtgtgcaata ctgcgtatca tagtctttga tgtatatcgt attcattcat 7140
gttagttgcg tacgttatag ttggagcaag ggagaaatgt agagtgtgaa agactcacta 7200
tggtccgggc ttatctcgac caatagccaa agtctggagt ttctgagaga aaaaggcaag 7260
atacgtatgt aacaaagcga cgcatggtac aataataccg gaggcatgta tcatagagag 7320
ttagtggttc gatgatggca ctggtgcctg gtatgacttt atacggctga ctacatattt 7380
gtcctcagac atacaattac agtcaagcac ttacccttgg acatctgtag gtaccccccg 7440
gccaagacga tctcagcgtg tcgtatgtcg gattggcgta gctccctcgc tcgtcaattg 7500
gctcccatct actttcttct gcttggctac acccagcatg tctgctatgg ctcgttttcg 7560
tgccttatct atcctcccag tattaccaac tctaaatgac atgatgtgat tgggtctaca 7620
ctttcatatc agagataagg agtagcacag ttgcataaaa agcccaactc taatcagctt 7680
cttcctttct tgtaattagt acaaaggtga ttagcgaaat ctggaagctt agttggccct 7740
aaaaaaatca aaaaaagcaa aaaacgaaaa acgaaaaacc acagttttga gaacagggag 7800
gtaacgaagg atcgtatata tatatatata tatatatacc cacggatccc gagaccggcc 7860
tttgattctt ccctacaacc aaccattctc accaccctaa ttcacaacca tggtcgctgg 7920
caagtccgga gctgcagccc acgtgaccca ctcttccact ctccctcgag agtaccacgg 7980
tgctaccaac gactcccgat ctgaggctgc cgatgtcacc gtctcgtcta tcgacgccga 8040
gaaggagatg attatcaacg gacgagtgta cgacgtctcc tcgttcgtga agcgacaccc 8100
tggtggctcc gtcatcaagt tccagctcgg agcagatgct tctgacgctt acaacaactt 8160
ccacgtccga tcgaagaagg ctgacaagat gctgtactct cttccctccc gacctgccga 8220
ggctggctat gcacaggacg acatctctag agactttgag aagctgcgac tggaactgaa 8280
agaggaaggt tacttcgagc ccaatctggt gcacgtgtcc taccgatgtg tcgaggtgct 8340
tgccatgtac tgggctggcg tccagctgat ctggtccgga tactggttcc tcggtgccat 8400
cgttgctgga attgctcaag gtcgatgcgg atggctccag catgaaggcg gacactactc 8460
gctcactggc aacatcaaga ttgaccgaca tctccagatg gccatctatg gactgggctg 8520
tggtatgtct ggctgctact ggagaaacca gcacaacaaa catcacgcca ctcctcagaa 8580
gctcggaacc gatcccgacc tgcagaccat gcctctcgtt gccttccaca agattgtcgg 8640
agccaaggca cgaggcaagg gtaaagcctg gcttgcttgg caagctcccc tcttctttgg 8700
aggcatcatt tgctccctgg tctctttcgg ctggcagttc gttctccacc ccaatcatgc 8760
actgcgagtg cacaaccatc tcgaactggc ctacatgggt ctccgatacg ttctctggca 8820
ccttgccttt ggccatctgg gactcctgtc ctctcttcga ctgtatgcct tctacgtggc 8880
tgtcggtggc acctacatct tcaccaactt cgccgtctcc catactcaca aggatgtcgt 8940
tcctcccacc aagcacattt cgtgggctct gtactctgcc aaccacacta ccaactgttc 9000
cgactctccc tttgtcaact ggtggatggc ctacctcaac ttccagatcg agcaccatct 9060
gttcccctcc atgcctcagt acaaccaccc caagattgct cctcgagtgc gagcactctt 9120
cgagaagcac ggagtcgagt acgacgtccg accctatctg gaatgctttc gagtgaccta 9180
cgtcaacctc cttgctgttg gcaaccctga gcactcctac cacgagcata ctcactaagc 9240
ggccgcatga gaagataaat atataaatac attgagatat taaatgcgct agattagaga 9300
gcctcatact gctcggagag aagccaagac gagtactcaa aggggattac accatccata 9360
tccacagaca caagctgggg aaaggttcta tatacacttt ccggaatacc gtagtttccg 9420
atgttatcaa tgggggcagc caggatttca ggcacttcgg tgtctcgggg tgaaatggcg 9480
ttcttggcct ccatcaagtc gtaccatgtc ttcatttgcc tgtcaaagta aaacagaagc 9540
agatgaagaa tgaacttgaa gtgaaggaat ttaaatgtaa cgaaactgaa atttgaccag 9600
atattgtgtc cgcggtggag ctccagcttt tgttcccttt agtgagggtt aatttcgagc 9660
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaagcttg 9720
acaatggatg gtgtgtcgta tcaggctggg gaacaattgt gcttaagtat gctgcagttg 9780
agtaagagtc atcgctccac caaaataaag tttgccatta gggttggaga gagagatggt 9840
ggctggaaga attaaatgac atcaagctga ggattgtggg tgtgcaataa cacatgttag 9900
gggtgacctg tggctcgaaa tctgataatt attttgtaac tttatgatta ttcttagatt 9960
ttttaatatt cctctatata acacataagt agctgtcgtc tagttgttca tagcctgact 10020
cctgcaatag attagtgcag agtgattttg tgcaattgag agccacggtt gagtcaagtg 10080
actttgtgtg tgaagtcatc ttacgtttca agtctcacag gttactcaat tggttggttg 10140
tctgcccttt acagatattt acagtacctg agcgtaaagt cgttcatcca cggaatgact 10200
gttcctgtca cgcagtcatg atcatggatg tggctggtca ggaaccattt tggataggag 10260
acttagggat tggactatta ttgaaaaaac tgagccgaat atgatatagt tctatttgaa 10320
tgcagaactt ctgatggtca attcacttat ttcaggcata tcggtcatgg tggcagctgc 10380
cacgatgtta tctcgttgga aacctcggcg cgccagctgc attaatgaat cggccaacgc 10440
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 10500
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 10560
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 10620
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 10680
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 10740
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 10800
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 10860
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 10920
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 10980
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 11040
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 11100
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 11160
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 11220
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 11280
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 11340
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 11400
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 11460
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 11520
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 11580
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 11640
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 11700
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 11760
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 11820
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 11880
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 11940
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 12000
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 12060
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 12120
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 12180
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 12240
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 12300
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 12360
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgatgcggt gtgaaatacc 12420
gcacagatgc gtaaggagaa aataccgcat caggaaattg taagcgttaa tattttgtta 12480
aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc 12540
aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg 12600
aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 12660
cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc 12720
cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 12780
ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg 12840
gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 12900
cagggcgcgt ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg 12960
cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg 13020
taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa ttgtaatacg 13080
actcactata gggcgaattg ggcccgacgt cgcatgcatt ccatagccac acctttgcct 13140
atggcttcac aaccgaaggc aattcgagag gtcgcgctta tggaatcgac tcgtataaag 13200
ctgaagggaa agggagacgt tccgagcgct cagatgcaat agtcgtccag ctaatgtgga 13260
ttcaaaaaca accccaacag taatcttgaa aatttgaacg gatcaatctg aacactcttg 13320
ctccaggtca ttcttctaac gcacatcccc agagtctaga gggagttgtg ttgtgaacat 13380
cctaataaac aatgcaatgg attcgggata tcttctgtct cgccccctac tcgatgtcga 13440
gtaaaccgat caccaactaa caatactcct ccgcgttctg ccattgactc tcaaacagac 13500
atcgctatca acggaacagc atattttagc ttcttaggac aataaatatt gataatgccg 13560
gctctccctc ggtatattaa gcaatccatt catacactca ttcatcaggt taattttata 13620
tatataattt gtctattcaa acaccgtaaa ttactggtac catcatctcc tccttttcaa 13680
atacacgtct atttgcatta atgaaattac tcgccaattc gcagaacgtg tttgtcgaac 13740
agagccttag ctcgggtcca gacaggagca gtgtctcgct gaggaagctg caggagagtt 13800
aattaaaagg cgttgaaaca gaatgagcca gacagcaagg acaaggtggc caacagcaag 13860
gagtccaaaa agccctctat tgacgagatc cacgatgtta ttgctcatga ggtttccgag 13920
ctcgatgctg ggaagaagaa gtgatttgta tataagaaat aaatgagata tagtaaagga 13980
gtgcaagaga atggcaaggt ggtcaaattc tatattactt gcagtcactg gttcctcgtt 14040
gacatgaatg aagttaccgt tggcatagct gatttaatat ataactgtcc aactaactct 14100
cacctagata taacccatgt gtgtgtttcc aatcatcaat gcggccgctt agagagcctt 14160
gccagcgggc tgcttctcgg ccattcgagc gaacacggcc aggtatcgga gcaggatgac 14220
gagaccttca tggggcagag ggtttcggta ggggaggttg tgcttctggc acagctgttc 14280
cacctggtag gaaacggcag tgaggttgtg tcgaggcagg gtgggccaga gatggtgctc 14340
gatctggtag ttcaggcctc caaagaacca gtcagtaatg atgcctcgtc gaatgttcat 14400
ggtctcatgg atctgaccca cagagaagcc atgtccgtcc cagacggaat caccgatctt 14460
ctccagaggg tagtggttca tgaagaccac gatggcaatt ccgaagccac cgacgagctc 14520
ggaaacaaag aacaccagga gcgaggtcag gatggagggc ataaagaaga ggtggaacag 14580
ggtcttgaga gtccagtgca gagcgagtcc aatggcctct ttcttgtact gagatcggta 14640
gaactggttg tctcggtcct tgagggatcg aacggtcagc acagactgga aacaccagat 14700
gaatcgcagg agaatacaga tgaccaggaa atagtactgt tggaactgaa tgagctttcg 14760
ggagatggga gaagctcgag tgacatcgtc ctcggaccag gcgagcagag gcaggttatc 14820
aatgtcggga tcgtgaccct gaacgttggt agcagaatga tgggcgttgt gtctgtcctt 14880
ccaccaggtc acggagaagc cctggagtcc gttgccaaag accagaccca cgaggttatt 14940
ccagtttcgg ttcttgaagg tctggtggtg gcagatgtca tgagacagcc atcccatttg 15000
ctggtagtgc ataccgagca gcacagcacc aatgaagtac atctggtact ggaccatcag 15060
gaagtatcca agcacgccaa gacccagggt ggtggagatc ttgtacgagt accagagggg 15120
agaggcgtca aacatgccag tggcgatcag ctcttctcgg agctttcgga aatcctcctg 15180
agcttcgttg acggcagcct ggggaggcag ctcggaggag gggttgatct tgggcattcg 15240
cttgagcttg tcgaaggctt cctgagagtg cataaccatg aaggcgtcag tagcatctcg 15300
tccctggtag ttctcaatga tttcagctcc accagggtgg aagttcaccc aagcggagac 15360
gtcgtaggta gttccgtcga tggtgagggg cagagcctgt cgcttggact tcaccatggt 15420
tgatgtgtgt ttaattcaag aatgaatata gagaagagaa gaagaaaaaa gattcaattg 15480
agccggcgat gcagaccctt atataaatgt tgccttggac agacggagca agcccgccca 15540
aacctacgtt cggtataata tgttaagctt tttaacacaa aggtttggct tggggtaacc 15600
tgatgtggtg caaaagaccg ggcgttggcg agccattgcg cgggcgaatg gggccgtgac 15660
tcgtctcaaa ttcgagggcg tgcctcaatt cgtgcccccg tggctttttc ccgccgtttc 15720
cgccccgttt gcaccactgc agccgcttct ttggttcgga caccttgctg cgagctaggt 15780
gccttgtgct acttaaaaag tggcctccca acaccaacat gacatgagtg cgtgggccaa 15840
gacacgttgg cggggtcgca gtcggctcaa tggcccggaa aaaacgctgc tggagctggt 15900
tcggacgcag tccgccgcgg cgtatggata tccgcaaggt tccatagcgc cattgccctc 15960
cgtcggcgtc tatcccgcaa cctctaaata gagcgggaat ataacccaag cttctttttt 16020
ttcctttaac acgcacaccc ccaactatca tgttgctgct gctgtttgac tctactctgt 16080
ggaggggtgc tcccacccaa cccaacctac aggtggatcc ggcgctgtga ttggctgata 16140
agtctcctat ccggactaat tctgaccaat gggacatgcg cgcaggaccc aaatgccgca 16200
attacgtaac cccaacgaaa tgcctacccc tctttggagc ccagcggccc caaatccccc 16260
caagcagccc ggttctaccg gcttccatct ccaagcacaa gcagcccggt tctaccggct 16320
tccat 16325
<210> 176
<211> 10189
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY72
<400> 176
taactttggc cggccagtgt acgcagatct actatagagg aacatttaaa ttgccccgga 60
gaagacggcc aggccgccta gatgacaaat tcaacaactc acagctgact ttctgccatt 120
gccactaggg gggggccttt ttatatggcc aagccaagct ctccacgtcg gttgggctgc 180
acccaacaat aaatgggtag ggttgcacca acaaagggat gggatggggg gtagaagata 240
cgaggataac ggggctcaat ggcacaaata agaacgaata ctgccattaa gactcgtgat 300
ccagcgactg acaccattgc atcatctaag ggcctcaaaa ctacctcgga actgctgcgc 360
tgatctggac accacagagg ttccgagcac tttaggttgc accaaatgtc ccaccaggtg 420
caggcagaaa acgctggaac agcgtgtaca gtttgtctta acaaaaagtg agggcgctga 480
ggtcgagcag ggtggtgtga cttgttatag cctttagagc tgcgaaagcg cgtatggatt 540
tggctcatca ggccagattg agggtctgtg gacacatgtc atgttagtgt acttcaatcg 600
ccccctggat atagccccga caataggccg tggcctcatt tttttgcctt ccgcacattt 660
ccattgctcg gtacccacac cttgcttctc ctgcacttgc caaccttaat actggtttac 720
attgaccaac atcttacaag cggggggctt gtctagggta tatataaaca gtggctctcc 780
caatcggttg ccagtctctt ttttcctttc tttccccaca gattcgaaat ctaaactaca 840
catcacagaa ttccgagccg tgagtatcca cgacaagatc agtgtcgaga cgacgcgttt 900
tgtgtaatga cacaatccga aagtcgctag caacacacac tctctacaca aactaaccca 960
gctctggtac catggcgact cgacagcgaa ctgccaccac tgttgtggtc gaggaccttc 1020
ccaaggtcac tcttgaggcc aagtctgaac ctgtgttccc cgatatcaag accatcaagg 1080
atgccattcc cgcgcactgc ttccagccct cgctcgtcac ctcattctac tacgtcttcc 1140
gcgattttgc tatggtctct gccctcgtct gggctgctct cacctacatc cccagcatcc 1200
ccgaccagac cctccgcgtc gcagcttgga tggtctacgg cttcgtccag ggtctgttct 1260
gcaccggtgt ctggattctc ggccatgagt gcggccacgg tgctttctct ctccacggaa 1320
aggtcaacaa tgtgaccggc tggttcctcc actcgttcct cctcgtcccc tacttcagct 1380
ggaagtactc tcaccaccgc caccaccgct tcaccggcca catggatctc gacatggctt 1440
tcgtccccaa gactgagccc aagccctcca agtcgctcat gattgctggc attgacgtcg 1500
ccgagcttgt tgaggacacc cccgctgctc agatggtcaa gctcatcttc caccagcttt 1560
tcggatggca ggcgtacctc ttcttcaacg ctagctctgg caagggcagc aagcagtggg 1620
agcccaagac tggcctctcc aagtggttcc gagtcagtca cttcgagcct accagcgctg 1680
tcttccgccc caacgaggcc atcttcatcc tcatctccga tatcggtctt gctctaatgg 1740
gaactgctct gtactttgct tccaagcaag ttggtgtttc gaccattctc ttcctctacc 1800
ttgttcccta cctgtgggtt caccactggc tcgttgccat tacctacctc caccaccacc 1860
acaccgagct ccctcactac accgctgagg gctggaccta cgtcaaggga gctctcgcca 1920
ctgtcgaccg tgagtttggc ttcatcggaa agcacctctt ccacggtatc attgagaagc 1980
acgttgttca ccatctcttc cctaagatcc ccttctacaa ggctgacgag gccaccgagg 2040
ccatcaagcc cgtcattggc gaccactact gccacgacga ccgaagcttc ctgggccagc 2100
tgtggaccat cttcggcacg ctcaagtacg tcgagcacga ccctgcccga cccggtgcca 2160
tgcgatggaa caaggactag gcggccgcta tttatcactc tttacaactt ctacctcaac 2220
tatctacttt aataaatgaa tatcgtttat tctctatgat tactgtatat gcgttcctct 2280
aagacaaatc gaaaccagca tgtgatcgaa tggcatacaa aagtttcttc cgaagttgat 2340
caatgtcctg atagtcaggc agcttgagaa gattgacaca ggtggaggcc gtagggaacc 2400
gatcaacctg tctaccagcg ttacgaatgg caaatgacgg gttcaaagcc ttgaatcctt 2460
gcaatggtgc cttggatact gatgtcacaa acttaagaag cagccgcttg tcctcttcct 2520
cgcctgcagg ataacttcgt ataatgtatg ctatacgaag ttatgaattc tctctcttga 2580
gcttttccat aacaagttct tctgcctcca ggaagtccat gggtggtttg atcatggttt 2640
tggtgtagtg gtagtgcagt ggtggtattg tgactgggga tgtagttgag aataagtcat 2700
acacaagtca gctttcttcg agcctcatat aagtataagt agttcaacgt attagcactg 2760
tacccagcat ctccgtatcg agaaacacaa caacatgccc cattggacag atcatgcgga 2820
tacacaggtt gtgcagtatc atacatactc gatcagacag gtcgtctgac catcatacaa 2880
gctgaacaag cgctccatac ttgcacgctc tctatataca cagttaaatt acatatccat 2940
agtctaacct ctaacagtta atcttctggt aagcctccca gccagccttc tggtatcgct 3000
tggcctcctc aataggatct cggttctggc cgtacagacc tcggccgaca attatgatat 3060
ccgttccggt agacatgaca tcctcaacag ttcggtactg ctgtccgaga gcgtctccct 3120
tgtcgtcaag acccaccccg ggggtcagaa taagccagtc ctcagagtcg cccttaggtc 3180
ggttctgggc aatgaagcca accacaaact cggggtcgga tcgggcaagc tcaatggtct 3240
gcttggagta ctcgccagtg gccagagagc ccttgcaaga cagctcggcc agcatgagca 3300
gacctctggc cagcttctcg ttgggagagg ggactaggaa ctccttgtac tgggagttct 3360
cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt ttcctcggca ccagctcgca 3420
ggccagcaat gattccggtt ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg 3480
cgattcggtg acaccggtac tggtgcttga cagtgttgcc aatatctgcg aactttctgt 3540
cctcgaacag gaagaaaccg tgcttaagag caagttcctt gagggggagc acagtgccgg 3600
cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat catgcacaca taaggtccga 3660
ccttatcggc aagctcaatg agctccttgg tggtggtaac atccagagaa gcacacaggt 3720
tggttttctt ggctgccacg agcttgagca ctcgagcggc aaaggcggac ttgtggacgt 3780
tagctcgagc ttcgtaggag ggcattttgg tggtgaagag gagactgaaa taaatttagt 3840
ctgcagaact ttttatcgga accttatctg gggcagtgaa gtatatgtta tggtaatagt 3900
tacgagttag ttgaacttat agatagactg gactatacgg ctatcggtcc aaattagaaa 3960
gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc 4020
cagcaatgac gttgcagctg atattgttgt cggccaaccg cgccgaaaac gcagctgtca 4080
gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg 4140
agtcgtactc caaaggcggc aatgacgagt cagacagata ctcgtcgact catcgatcag 4200
gagagaccgg gttggcggcg tatttgtgtc ccaaaaaaca gccccaattg ccccaattga 4260
ccccaaattg acccagtagc gggcccaacc ccggcgagag cccccttcac cccacatatc 4320
aaacctcccc cggttcccac acttgccgtt aagggcgtag ggtactgcag tctggaatct 4380
acgcttgttc agactttgta ctagtttctt tgtctggcca tccgggtaac ccatgccgga 4440
cgcaaaatag actactgaaa atttttttgc tttgtggttg ggactttagc caagggtata 4500
aaagaccacc gtccccgaat tacctttcct cttcttttct ctctctcctt gtcaactcac 4560
acccgaaatc gttaagcatt tccttctgag tataagaatc attcaaagga tccactagtt 4620
ctagagcggc cgcttaaacc atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt 4680
ttctgatcga aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat 4740
ctcgtgcttt cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg 4800
ccgatggttt ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga 4860
ttccggaagt gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc 4920
gtgcacaggg tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc 4980
cggtcgcgga ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg 5040
gcccattcgg accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga 5100
ttgctgatcc ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg 5160
tcgcgcaggc tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc 5220
tcgtgcacgc ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg 5280
tcattgactg gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct 5340
tctggaggcc gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc 5400
cggagcttgc aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac 5460
tctatcagag cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg 5520
acgcaatcgt ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg 5580
cggccgtctg gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca 5640
gcactcgtcc gagggcaaag gaatagtgag gtacctaaag cggccgccac cgcggcccga 5700
gattccggcc tcttcggccg ccaagcgacc cgggtggacg tctagaggta cctagcaatt 5760
aacagatagt ttgccggtga taattctctt aacctcccac actcctttga cataacgatt 5820
tatgtaacga aactgaaatt tgaccagata ttgtgtccgc gataacttcg tataatgtat 5880
gctatacgaa gttatcgtac gatagttagt agacaacaat cagaacatct ccctccttat 5940
ataatcacac aggccagaac gcgctaaact aaagcgcttt ggacactatg ttacattggc 6000
attgattgaa ctgaaaccac agtctccctc gcctgaatcg agcaatggat gttgtcggaa 6060
gtcaacttca ctagaagagc ggttctatgc cttgtcaaga tcatatcata aactcactct 6120
gtattacccc atctatagaa cacttgttat gaatgggcgg aaacattccg ctatatgcac 6180
ctttccacac taatgcaaag atgtgcatct tcaacgggta gtaagactgg ttccgacttc 6240
cgttgcatgg agagcaatga cctcgataat gcgaacatcc cccacatata cactcttaca 6300
caggccaata taatctgtgc atttactaaa tatttaagtc tatgcacctg cttgatgaaa 6360
agcggcacgg atggtatcat ctagtttccg ccaatccaag aaccaactgt gttggcagtg 6420
gtgtagccca tggcacacag accaaagatg aaaatacaga catcggcggt tcgagccgtg 6480
gtgcctcgag caacaccctt gtaatgcaaa agaggagggt aaatgtacac cagaggcaca 6540
catgcaaacg atccggtgag agcgacgaac cgatcgagat cgtcggcacc tccccatgca 6600
acaaaggcgg tgacaaacac aaggaagaac cggaaaatgt tcttctgcca cttgatggta 6660
gagttgtact tgcctgatcg ggtgaagaga ccattctcga tgattcggat ggcgcgccag 6720
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 6780
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 6840
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 6900
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 6960
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 7020
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 7080
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 7140
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 7200
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 7260
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 7320
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 7380
tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 7440
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 7500
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 7560
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 7620
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 7680
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 7740
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 7800
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 7860
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 7920
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 7980
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 8040
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 8100
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 8160
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 8220
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 8280
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 8340
aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 8400
cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 8460
cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 8520
aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 8580
ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 8640
tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 8700
ccacctgatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggaa 8760
attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt 8820
tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata 8880
gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac 8940
gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa 9000
tcaagttttt tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc 9060
cgatttagag cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg 9120
aaaggagcgg gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca 9180
cccgccgcgc ttaatgcgcc gctacagggc gcgtccattc gccattcagg ctgcgcaact 9240
gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat 9300
gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa 9360
cgacggccag tgaattgtaa tacgactcac tatagggcga attgggcccg acgtcgcatg 9420
cttagaagtg aggattacaa gaagcctctg gatatcaatg atgaacgtac tcagcggctg 9480
gtcaagcatt tcgaccgtcg aatcgacgag gtgttcacct ttgacaagcg agggttccca 9540
attgatcacg ttctcgagtt gttcaaatct tctctcaaca tctctctgca tgaactatct 9600
ctgttgacga acgtgtcacc cactgttcct cgaacgccct tctccgagtt tggtctgaac 9660
atcttcgatc tcaaactgac ccccgcagtg atcaatagtg ccatgccact gccgatgcgg 9720
tgcgaacatc cctggaggga ttctcggagc tctacacaat gcagattctg tcgtcgagta 9780
ctctctacct tgctcgaatg acttattgtg ctactactgc actcatgctt cgatcatgtg 9840
ccctactgca ccccaaattt ggtgatctga ttgagacaga gtaccctctt cagctgattc 9900
agaagatcat cagcaacatg aatgatgtgg ttgaccaggc aggctgttgt agtcacgtcc 9960
ttcacttcaa gttcattctt catctgcttc tgttttactt tgacaggcaa atgaagacat 10020
ggtacgactt gatggaggcc aagaacgcca tttcaccccg agacaccgaa gtgcctgaaa 10080
tcctggctgc ccccattgat aacatcggaa actacggtat tccggaaagt gtatatagaa 10140
cctttcccca gcttgtgtct gtggatatgg atggtgtaat ccccttaat 10189
<210> 177
<211> 12558
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY80
<400> 177
taacgcggac acaatatctg gtcaaatttc agtttcgtta cataaatcgt tatgtcaaag 60
gagtgtggga ggttaagaga attatcaccg gcaaactatc tgttaattgc taggtacctc 120
tagacgtcca cccgggtcgc ttggcggccg aagaggccgg aattcgggcc gcggtggcgg 180
ccgcctagtc cttgttccat cgcatggcac cgggtcgggc agggtcgtgc tcgacgtact 240
tgagcgtgcc gaagatggtc cacagctggc ccaggaagct tcggtcgtcg tggcagtagt 300
ggtcgccaat gacgggcttg atggcctcgg tggcctcgtc agccttgtag aaggggatct 360
tagggaagag atggtgaaca acgtgcttct caatgatacc gtggaagagg tgctttccga 420
tgaagccaaa ctcacggtcg acagtggcga gagctccctt gacgtaggtc cagccctcag 480
cggtgtagtg agggagctcg gtgtggtggt ggtggaggta ggtaatggca acgagccagt 540
ggtgaaccca caggtaggga acaaggtaga ggaagagaat ggtcgaaaca ccaacttgct 600
tggaagcaaa gtacagagca gttcccatta gagcaagacc gatatcggag atgaggatga 660
agatggcctc gttggggcgg aagacagcgc tggtaggctc gaagtgactg actcggaacc 720
acttggagag gccagtcttg ggctcccact gcttgctgcc cttgccagag ctagcgttga 780
agaagaggta cgcctgccat ccgaaaagct ggtggaagat gagcttgacc atctgagcag 840
cgggggtgtc ctcaacaagc tcggcgacgt caatgccagc aatcatgagc gacttggagg 900
gcttgggctc agtcttgggg acgaaagcca tgtcgagatc catgtggccg gtgaagcggt 960
ggtggcggtg gtgagagtac ttccagctga agtaggggac gaggaggaac gagtggagga 1020
accagccggt cacattgttg acctttccgt ggagagagaa agcaccgtgg ccgcactcat 1080
ggccgagaat ccagacaccg gtgcagaaca gaccctggac gaagccgtag accatccaag 1140
ctgcgacgcg gagggtctgg tcggggatgc tggggatgta ggtgagagca gcccagacga 1200
gggcagagac catggcaaaa tcgcggaaga cgtagtagaa tgaggtgacg agcgagggct 1260
ggaagcagtg cgcgggaatg gcatccttga tggtcttgat atcggggaac acaggttcag 1320
acttggcctc aagagtgacc ttgggaaggt cctcgaccac aacagtggtg gcagttcgct 1380
gtcgagtcgc cattgtgcgg ccgcggattg atgtgtgttt aattcaagaa tgaatataga 1440
gaagagaaga agaaaaaaga ttcaattgag ccggcgatgc agacccttat ataaatgttg 1500
ccttggacag acggagcaag cccgcccaaa cctacgttcg gtataatatg ttaagctttt 1560
taacacaaag gtttggcttg gggtaacctg atgtggtgca aaagaccggg cgttggcgag 1620
ccattgcgcg ggcgaatggg gccgtgactc gtctcaaatt cgagggcgtg cctcaattcg 1680
tgcccccgtg gctttttccc gccgtttccg ccccgtttgc accactgcag ccgcttcttt 1740
ggttcggaca ccttgctgcg agctaggtgc cttgtgctac ttaaaaagtg gcctcccaac 1800
accaacatga catgagtgcg tgggccaaga cacgttggcg gggtcgcagt cggctcaatg 1860
gcccggaaaa aacgctgctg gagctggttc ggacgcagtc cgccgcggcg tatcgatatc 1920
cgcaaggttc catggcgcca ttgccctccg tcggcgtcta tcccgcaacc tctaaataga 1980
gcgggaatat aacccaagct tctttttttt cctttaacac gcacaccccc aactatcatg 2040
ttgctgctgc tgtttgactc tactctgtgg aggggtgctc ccacccaacc caacctacag 2100
gtggatccgg cgctgtgatt ggctgataag tctcctatcc ggactaattc tgaccaatgg 2160
gacatgcgcg caggacccaa atgccgcaat tacgtaaccc caacgaaatg cctacccctc 2220
tttggagccc agcggcccca aatcccccca agcagcccgg ttctaccggc ttccatctcc 2280
aagcacaagc agcccggttc taccggcttc catctccaag cacccctttc tccacacccc 2340
acaaaaagac ccgtgcagga catcctactg cgtcgaggcc ggccagtgta cgcagatcta 2400
ctatagagga acatttaaat tgccccggag aagacggcca ggccgcctag atgacaaatt 2460
caacaactca cagctgactt tctgccattg ccactagggg ggggcctttt tatatggcca 2520
agccaagctc tccacgtcgg ttgggctgca cccaacaata aatgggtagg gttgcaccaa 2580
caaagggatg ggatgggggg tagaagatac gaggataacg gggctcaatg gcacaaataa 2640
gaacgaatac tgccattaag actcgtgatc cagcgactga caccattgca tcatctaagg 2700
gcctcaaaac tacctcggaa ctgctgcgct gatctggaca ccacagaggt tccgagcact 2760
ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca gcgtgtacag 2820
tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac ttgttatagc 2880
ctttagagct gcgaaagcgc gtatggattt ggctcatcag gccagattga gggtctgtgg 2940
acacatgtca tgttagtgta cttcaatcgc cccctggata tagccccgac aataggccgt 3000
ggcctcattt ttttgccttc cgcacatttc cattgctcgg tacccacacc ttgcttctcc 3060
tgcacttgcc aaccttaata ctggtttaca ttgaccaaca tcttacaagc ggggggcttg 3120
tctagggtat atataaacag tggctctccc aatcggttgc cagtctcttt tttcctttct 3180
ttccccacag attcgaaatc taaactacac atcacagaat tccgagccgt gagtatccac 3240
gacaagatca gtgtcgagac gacgcgtttt gtgtaatgac acaatccgaa agtcgctagc 3300
aacacacact ctctacacaa actaacccag ctctggtacc atggcgactc gacagcgaac 3360
tgccaccact gttgtggtcg aggaccttcc caaggtcact cttgaggcca agtctgaacc 3420
tgtgttcccc gatatcaaga ccatcaagga tgccattccc gcgcactgct tccagccctc 3480
gctcgtcacc tcattctact acgtcttccg cgattttgct atggtctctg ccctcgtctg 3540
ggctgctctc acctacatcc ccagcatccc cgaccagacc ctccgcgtcg cagcttggat 3600
ggtctacggc ttcgtccagg gtctgttctg caccggtgtc tggattctcg gccatgagtg 3660
cggccacggt gctttctctc tccacggaaa ggtcaacaat gtgaccggct ggttcctcca 3720
ctcgttcctc ctcgtcccct acttcagctg gaagtactct caccaccgcc accaccgctt 3780
caccggccac atggatctcg acatggcttt cgtccccaag actgagccca agccctccaa 3840
gtcgctcatg attgctggca ttgacgtcgc cgagcttgtt gaggacaccc ccgctgctca 3900
gatggtcaag ctcatcttcc accagctttt cggatggcag gcgtacctct tcttcaacgc 3960
tagctctggc aagggcagca agcagtggga gcccaagact ggcctctcca agtggttccg 4020
agtcagtcac ttcgagccta ccagcgctgt cttccgcccc aacgaggcca tcttcatcct 4080
catctccgat atcggtcttg ctctaatggg aactgctctg tactttgctt ccaagcaagt 4140
tggtgtttcg accattctct tcctctacct tgttccctac ctgtgggttc accactggct 4200
cgttgccatt acctacctcc accaccacca caccgagctc cctcactaca ccgctgaggg 4260
ctggacctac gtcaagggag ctctcgccac tgtcgaccgt gagtttggct tcatcggaaa 4320
gcacctcttc cacggtatca ttgagaagca cgttgttcac catctcttcc ctaagatccc 4380
cttctacaag gctgacgagg ccaccgaggc catcaagccc gtcattggcg accactactg 4440
ccacgacgac cgaagcttcc tgggccagct gtggaccatc ttcggcacgc tcaagtacgt 4500
cgagcacgac cctgcccgac ccggtgccat gcgatggaac aaggactagg cggccgctat 4560
ttatcactct ttacaacttc tacctcaact atctacttta ataaatgaat atcgtttatt 4620
ctctatgatt actgtatatg cgttcctcta agacaaatcg aaaccagcat gtgatcgaat 4680
ggcatacaaa agtttcttcc gaagttgatc aatgtcctga tagtcaggca gcttgagaag 4740
attgacacag gtggaggccg tagggaaccg atcaacctgt ctaccagcgt tacgaatggc 4800
aaatgacggg ttcaaagcct tgaatccttg caatggtgcc ttggatactg atgtcacaaa 4860
cttaagaagc agccgcttgt cctcttcctc gcctgcagga taacttcgta taatgtatgc 4920
tatacgaagt tatgaattct ctctcttgag cttttccata acaagttctt ctgcctccag 4980
gaagtccatg ggtggtttga tcatggtttt ggtgtagtgg tagtgcagtg gtggtattgt 5040
gactggggat gtagttgaga ataagtcata cacaagtcag ctttcttcga gcctcatata 5100
agtataagta gttcaacgta ttagcactgt acccagcatc tccgtatcga gaaacacaac 5160
aacatgcccc attggacaga tcatgcggat acacaggttg tgcagtatca tacatactcg 5220
atcagacagg tcgtctgacc atcatacaag ctgaacaagc gctccatact tgcacgctct 5280
ctatatacac agttaaatta catatccata gtctaacctc taacagttaa tcttctggta 5340
agcctcccag ccagccttct ggtatcgctt ggcctcctca ataggatctc ggttctggcc 5400
gtacagacct cggccgacaa ttatgatatc cgttccggta gacatgacat cctcaacagt 5460
tcggtactgc tgtccgagag cgtctccctt gtcgtcaaga cccaccccgg gggtcagaat 5520
aagccagtcc tcagagtcgc ccttaggtcg gttctgggca atgaagccaa ccacaaactc 5580
ggggtcggat cgggcaagct caatggtctg cttggagtac tcgccagtgg ccagagagcc 5640
cttgcaagac agctcggcca gcatgagcag acctctggcc agcttctcgt tgggagaggg 5700
gactaggaac tccttgtact gggagttctc gtagtcagag acgtcctcct tcttctgttc 5760
agagacagtt tcctcggcac cagctcgcag gccagcaatg attccggttc cgggtacacc 5820
gtgggcgttg gtgatatcgg accactcggc gattcggtga caccggtact ggtgcttgac 5880
agtgttgcca atatctgcga actttctgtc ctcgaacagg aagaaaccgt gcttaagagc 5940
aagttccttg agggggagca cagtgccggc gtaggtgaag tcgtcaatga tgtcgatatg 6000
ggttttgatc atgcacacat aaggtccgac cttatcggca agctcaatga gctccttggt 6060
ggtggtaaca tccagagaag cacacaggtt ggttttcttg gctgccacga gcttgagcac 6120
tcgagcggca aaggcggact tgtggacgtt agctcgagct tcgtaggagg gcattttggt 6180
ggtgaagagg agactgaaat aaatttagtc tgcagaactt tttatcggaa ccttatctgg 6240
ggcagtgaag tatatgttat ggtaatagtt acgagttagt tgaacttata gatagactgg 6300
actatacggc tatcggtcca aattagaaag aacgtcaatg gctctctggg cgtcgccttt 6360
gccgacaaaa atgtgatcat gatgaaagcc agcaatgacg ttgcagctga tattgttgtc 6420
ggccaaccgc gccgaaaacg cagctgtcag acccacagcc tccaacgaag aatgtatcgt 6480
caaagtgatc caagcacact catagttgga gtcgtactcc aaaggcggca atgacgagtc 6540
agacagatac tcgtcgactc atcgatcagg agagaccggg ttggcggcgt atttgtgtcc 6600
caaaaaacag ccccaattgc cccaattgac cccaaattga cccagtagcg ggcccaaccc 6660
cggcgagagc ccccttcacc ccacatatca aacctccccc ggttcccaca cttgccgtta 6720
agggcgtagg gtactgcagt ctggaatcta cgcttgttca gactttgtac tagtttcttt 6780
gtctggccat ccgggtaacc catgccggac gcaaaataga ctactgaaaa tttttttgct 6840
ttgtggttgg gactttagcc aagggtataa aagaccaccg tccccgaatt acctttcctc 6900
ttcttttctc tctctccttg tcaactcaca cccgaaatcg ttaagcattt ccttctgagt 6960
ataagaatca ttcaaaggat ccactagttc tagagcggcc gcttaaacca tgaaaaagcc 7020
tgaactcacc gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca gcgtctccga 7080
cctgatgcag ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg 7140
tggatatgtc ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta 7200
tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg gggaattcag 7260
cgagagcctg acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctgcc 7320
tgaaaccgaa ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg cgatcgctgc 7380
ggccgatctt agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata 7440
cactacatgg cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac 7500
tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tgatgctttg 7560
ggccgaggac tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt 7620
cctgacggac aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga 7680
ttcccaatac gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca 7740
gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc 7800
gtatatgctc cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga 7860
tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt 7920
cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt 7980
actcgccgat agtggaaacc gacgccccag cactcgtccg agggcaaagg aatagtgagg 8040
tacctaaagc ggccgccacc gcggcccgag attccggcct cttcggccgc caagcgaccc 8100
gggtggacgt ctagaggtac ctagcaatta acagatagtt tgccggtgat aattctctta 8160
acctcccaca ctcctttgac ataacgattt atgtaacgaa actgaaattt gaccagatat 8220
tgtgtccgcg ataacttcgt ataatgtatg ctatacgaag ttatcgtacg atagttagta 8280
gacaacaatc agaacatctc cctccttata taatcacaca ggccagaacg cgctaaacta 8340
aagcgctttg gacactatgt tacattggca ttgattgaac tgaaaccaca gtctccctcg 8400
cctgaatcga gcaatggatg ttgtcggaag tcaacttcac tagaagagcg gttctatgcc 8460
ttgtcaagat catatcataa actcactctg tattacccca tctatagaac acttgttatg 8520
aatgggcgga aacattccgc tatatgcacc tttccacact aatgcaaaga tgtgcatctt 8580
caacgggtag taagactggt tccgacttcc gttgcatgga gagcaatgac ctcgataatg 8640
cgaacatccc ccacatatac actcttacac aggccaatat aatctgtgca tttactaaat 8700
atttaagtct atgcacctgc ttgatgaaaa gcggcacgga tggtatcatc tagtttccgc 8760
caatccaaga accaactgtg ttggcagtgg tgtagcccat ggcacacaga ccaaagatga 8820
aaatacagac atcggcggtt cgagccgtgg tgcctcgagc aacacccttg taatgcaaaa 8880
gaggagggta aatgtacacc agaggcacac atgcaaacga tccggtgaga gcgacgaacc 8940
gatcgagatc gtcggcacct ccccatgcaa caaaggcggt gacaaacaca aggaagaacc 9000
ggaaaatgtt cttctgccac ttgatggtag agttgtactt gcctgatcgg gtgaagagac 9060
cattctcgat gattcggatg gcgcgccagc tgcattaatg aatcggccaa cgcgcgggga 9120
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 9180
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 9240
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 9300
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 9360
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 9420
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 9480
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 9540
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 9600
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 9660
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 9720
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 9780
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 9840
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 9900
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 9960
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 10020
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 10080
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 10140
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 10200
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 10260
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 10320
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 10380
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 10440
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 10500
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 10560
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 10620
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 10680
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 10740
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 10800
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 10860
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 10920
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 10980
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 11040
gggttccgcg cacatttccc cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga 11100
tgcgtaagga gaaaataccg catcaggaaa ttgtaagcgt taatattttg ttaaaattcg 11160
cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc 11220
cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt tggaacaaga 11280
gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg 11340
atggcccact acgtgaacca tcaccctaat caagtttttt ggggtcgagg tgccgtaaag 11400
cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga aagccggcga 11460
acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg ctggcaagtg 11520
tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg ctacagggcg 11580
cgtccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 11640
gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 11700
agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact 11760
atagggcgaa ttgggcccga cgtcgcatgc ttagaagtga ggattacaag aagcctctgg 11820
atatcaatga tgaacgtact cagcggctgg tcaagcattt cgaccgtcga atcgacgagg 11880
tgttcacctt tgacaagcga gggttcccaa ttgatcacgt tctcgagttg ttcaaatctt 11940
ctctcaacat ctctctgcat gaactatctc tgttgacgaa cgtgtcaccc actgttcctc 12000
gaacgccctt ctccgagttt ggtctgaaca tcttcgatct caaactgacc cccgcagtga 12060
tcaatagtgc catgccactg ccgatgcggt gcgaacatcc ctggagggat tctcggagct 12120
ctacacaatg cagattctgt cgtcgagtac tctctacctt gctcgaatga cttattgtgc 12180
tactactgca ctcatgcttc gatcatgtgc cctactgcac cccaaatttg gtgatctgat 12240
tgagacagag taccctcttc agctgattca gaagatcatc agcaacatga atgatgtggt 12300
tgaccaggca ggctgttgta gtcacgtcct tcacttcaag ttcattcttc atctgcttct 12360
gttttacttt gacaggcaaa tgaagacatg gtacgacttg atggaggcca agaacgccat 12420
ttcaccccga gacaccgaag tgcctgaaat cctggctgcc cccattgata acatcggaaa 12480
ctacggtatt ccggaaagtg tatatagaac ctttccccag cttgtgtctg tggatatgga 12540
tggtgtaatc cccttaat 12558
<210> 178
<211> 8982
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY79
<400> 178
ggtggagctc cagcttttgt tccctttagt gagggttaat ttcgagcttg gcgtaatcat 60
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacgtacgag 120
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 180
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 240
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 300
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 360
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 420
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 480
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 540
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 600
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 660
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 720
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 780
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 840
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 900
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 960
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 1020
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 1080
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 1140
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 1200
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 1260
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 1320
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 1380
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 1440
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 1500
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 1560
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 1620
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 1680
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 1740
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 1800
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 1860
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 1920
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 1980
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 2040
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 2100
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 2160
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgcgc 2220
cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 2280
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 2340
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 2400
tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc 2460
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 2520
tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga 2580
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 2640
attttaacaa aatattaacg cttacaattt ccattcgcca ttcaggctgc gcaactgttg 2700
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 2760
tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 2820
ggccagtgaa ttgtaatacg actcactata gggcgaattg ggtaccgggc cccccctcga 2880
ggtcgatggt gtcgataagc ttgatatcga attcatgtca cacaaaccga tcttcgcctc 2940
aaggaaacct aattctacat ccgagagact gccgagatcc agtctacact gattaatttt 3000
cgggccaata atttaaaaaa atcgtgttat ataatattat atgtattata tatatacatc 3060
atgatgatac tgacagtcat gtcccattgc taaatagaca gactccatct gccgcctcca 3120
actgatgttc tcaatattta aggggtcatc tcgcattgtt taataataaa cagactccat 3180
ctaccgcctc caaatgatgt tctcaaaata tattgtatga acttattttt attacttagt 3240
attattagac aacttacttg ctttatgaaa aacacttcct atttaggaaa caatttataa 3300
tggcagttcg ttcatttaac aatttatgta gaataaatgt tataaatgcg tatgggaaat 3360
cttaaatatg gatagcataa atgatatctg cattgcctaa ttcgaaatca acagcaacga 3420
aaaaaatccc ttgtacaaca taaatagtca tcgagaaata tcaactatca aagaacagct 3480
attcacacgt tactattgag attattattg gacgagaatc acacactcaa ctgtctttct 3540
ctcttctaga aatacaggta caagtatgta ctattctcat tgttcatact tctagtcatt 3600
tcatcccaca tattccttgg atttctctcc aatgaatgac attctatctt gcaaattcaa 3660
caattataat aagatatacc aaagtagcgg tatagtggca atcaaaaagc ttctctggtg 3720
tgcttctcgt atttattttt attctaatga tccattaaag gtatatattt atttcttgtt 3780
atataatcct tttgtttatt acatgggctg gatacataaa ggtattttga tttaattttt 3840
tgcttaaatt caatcccccc tcgttcagtg tcaactgtaa tggtaggaaa ttaccatact 3900
tttgaagaag caaaaaaaat gaaagaaaaa aaaaatcgta tttccaggtt agacgttccg 3960
cagaatctag aatgcggtat gcggtacatt gttcttcgaa cgtaaaagtt gcgctccctg 4020
agatattgta catttttgct tttacaagta caagtacatc gtacaactat gtactactgt 4080
tgatgcatcc acaacagttt gttttgtttt tttttgtttt ttttttttct aatgattcat 4140
taccgctatg tatacctact tgtacttgta gtaagccggg ttattggcgt tcaattaatc 4200
atagacttat gaatctgcac ggtgtgcgct gcgagttact tttagcttat gcatgctact 4260
tgggtgtaat attgggatct gttcggaaat caacggatgc tcaaccgatt tcgacagtaa 4320
ttaattaatt ccctagtccc agtgtacacc cgccgatatc gcttaccctg cagccggatt 4380
aaggttggca atttttcacg tccttgtctc cgcaattact caccgggtgg tttataagat 4440
tgcaagcgtc ttgatttgtc tctgtatact aacatgcaat cgcgactcgc ccgacgggcc 4500
actaacctgg ccagaatctc cagatccaag tattctcttg gtctgcgata tgtttccaac 4560
acaaaagccc ctgctgccca gccggcaact gctgagtgag tattccttgc cataaacgac 4620
ccagaaccac tgtatagtgt ttggaagcac tagtcagaag accagcgaaa acaggtggaa 4680
aaaactgaga cgaaaagcaa cgaccagaaa tgtaatgtgt ggaaaagcga cacacacaga 4740
gcagataaag aggtgacaaa taacgacaaa tgaaatatca gtatcttccc acaatcacta 4800
cctctcagct gtctgaaggt gcggctgata tatccatccc acgtctaacg tatggagtgt 4860
gatagaatat gacgacacaa gcatgagaac tcgctctcta tccaaccacc gaaacactgt 4920
cactacagcc gttcttgttg ctccattcgc ttttgtgatt ccatgccttc tctggtgact 4980
gacaacattc cttccttttc tccagccctg ttgttatctg ctcatgacct acggccactc 5040
tctatcgcat actaacatag acgatcccag cccgctcccc acttccaggg caccgttggc 5100
aagcctccta tcctcaagaa ggctgaggct gccaacgctg acatggacga gtccttcatc 5160
ggaatgtctg gaggagagat cttccacgag atgatgctgc gacacaacgt cgacactgtc 5220
ttcggttacc ccggtggagc cattctcccc gtctttgacg ccattcacaa ctctgagtac 5280
ttcaactttg tgctccctcg acacgagcag ggtgccggcc acatggccga gggctacgct 5340
cgagcctctg gtaagcccgg tgtcgttctc gtcacctctg gccccggtgc caccaacgtc 5400
atcaccccca tgcaggacgc tctttccgat ggtaccccca tggttgtctt caccggtcag 5460
gtcctgacct ccgttatcgg cactgacgcc ttccaggagg ccgatgttgt cggcatctcc 5520
cgatcttgca ccaagtggaa cgtcatggtc aagaacgttg ctgagctccc ccgacgaatc 5580
aacgaggcct ttgagattgc tacttccggc cgacccggtc ccgttctcgt cgatctgccc 5640
aaggatgtta ctgctgccat cctgcgagag cccatcccca ccaagtccac cattccctcg 5700
cattctctga ccaacctcac ctctgccgcc gccaccgagt tccagaagca ggctatccag 5760
cgagccgcca acctcatcaa ccagtccaag aagcccgtcc tttacgtcgg acagggtatc 5820
cttggctccg aggagggtcc taagctgctt aaggagctgg ctgagaaggc cgagattccc 5880
gtcaccacta ctctgcaggg tcttggtgcc tttgacgagc gagaccccaa gtctctgcac 5940
atgctcggta tgcacggttc cggctacgcc aacatggcca tgcagaacgc tgactgtatc 6000
attgctctcg gcgcccgatt tgatgaccga gttaccggct ccatccccaa gtttgccccc 6060
gaggctcgag ccgctgccct tgagggtcga ggtggtattg ttcactttga gatccaggcc 6120
aagaacatca acaaggttgt tcaggccacc gaagccgttg agggagacgt taccgagtct 6180
gtccgacagc tcatccccct catcaacaag gtctctgccg ctgagcgagc tccctggact 6240
gagactatcc agtcctggaa gcagcagttc cccttcctct tcgaggctga aggtgaggat 6300
ggtgttatca agccccagtc cgtcattgct ctgctctctg acctgacaga gaacaacaag 6360
gacaagacca tcatcaccac cggtgttggt cagcatcaga tgtggactgc ccagcatttc 6420
cgatggcgac accctcgaac catgatcact tctggtggtc ttggaactat gggttacggc 6480
ctgcccgccg ctatcggcgc caaggttgcc cgacctgact gcgacgtcat tgacatcgat 6540
ggtgacgctt ctttcaacat gactctgacc gagctgtcca ccgccgttca gttcaacatt 6600
ggcgtcaagg ctattgtcct caacaacgag gaacagggta tggtcaccca gctgcagtct 6660
ctcttctacg agaaccgata ctgccacact catcagaaga accccgactt catgaagctg 6720
gccgagtcca tgggcatgaa gggtatccga atcactcaca ttgaccagct ggaggccggt 6780
ctcaaggaga tgctcgcata caagggccct gtgctcgttg aggttgttgt cgacaagaag 6840
atccccgttc ttcccatggt tcccgctggt aaggctttgc atgagttcct tgtctacgac 6900
gctgacgccg aggctgcttc tcgacccgat cgactgaaga atgcccccgc ccctcacgtc 6960
caccagacca cctttgagaa ctaagtggaa aggaacacaa gcaatccgaa ccaaaaataa 7020
ttggggtccc gtgcccacag agtctagtgc agacctaaaa tgaccacagt aaattatagc 7080
tgttattaaa catgagattt tgaccaacaa gagcgtagga atgttattag ctactacttg 7140
tacatacaca gcatttgttt taaataatgt tgcctccagg ggcagtgaga tcaggaccca 7200
gatccgtggc cagctctctg acttcagacc gcttgtactt aagcagctcg caacactgtt 7260
gtcgaggatt gaacttgcca tattcgattt tgtggtcatg aatccagcac acctcgtcga 7320
ctcaggcgac gacggaattc ctgcagccca tctgcagaat tcaggagaga ccgggttggc 7380
ggcgtatttg tgtcccaaaa aacagcccca attgccccaa ttgaccccaa attgacccag 7440
tagcgggccc aaccccggcg agagccccct tcaccccaca tatcaaacct cccccggttc 7500
ccacacttgc cgttaagggc gtagggtact gcagtctgga atctacgctt gttcagactt 7560
tgtactagtt tctttgtctg gccatccggg taacccatgc cggacgcaaa atagactact 7620
gaaaattttt ttgctttgtg gttgggactt tagccaaggg tataaaagac caccgtcccc 7680
gaattacctt tcctcttctt ttctctctct ccttgtcaac tcacacccga aatcgttaag 7740
catttccttc tgagtataag aatcattcac catgtccaat ttactgaccg tacaccaaaa 7800
tttgcctgca ttaccggtcg atgcaacgag tgatgaggtt cgcaagaacc tgatggacat 7860
gttcagggat cgccaggcgt tttctgagca tacctggaaa atgcttctgt ccgtttgccg 7920
gtcgtgggcg gcatggtgca agttgaataa ccggaaatgg tttcccgcag aacctgaaga 7980
tgttcgcgat tatcttctat atcttcaggc gcgcggtctg gcagtaaaaa ctatccagca 8040
acatttgggc cagctaaaca tgcttcatcg tcggtccggg ctgccacgac caagtgacag 8100
caatgctgtt tcactggtta tgcggcggat ccgaaaagaa aacgttgatg ccggtgaacg 8160
tgcaaaacag gctctagcgt tcgaacgcac tgatttcgac caggttcgtt cactcatgga 8220
aaatagcgat cgctgccagg atatacgtaa tctggcattt ctggggattg cttataacac 8280
cctgttacgt atagccgaaa ttgccaggat cagggttaaa gatatctcac gtactgacgg 8340
tgggagaatg ttaatccata ttggcagaac gaaaacgctg gttagcaccg caggtgtaga 8400
gaaggcactt agcctggggg taactaaact ggtcgagcga tggatttccg tctctggtgt 8460
agctgatgat ccgaataact acctgttttg ccgggtcaga aaaaatggtg ttgccgcgcc 8520
atctgccacc agccagctat caactcgcgc cctggaaggg atttttgaag caactcatcg 8580
attgatttac ggcgctaagg atgactctgg tcagagatac ctggcctggt ctggacacag 8640
tgcccgtgtc ggagccgcgc gagatatggc ccgcgctgga gtttcaatac cggagatcat 8700
gcaagctggt ggctggacca atgtaaatat tgtcatgaac tatatccgta acctggatag 8760
tgaaacaggg gcaatggtgc gcctgctgga agatggcgat taaggccgcc accgcggccc 8820
gagattccgg cctcttcggc cgccaagcga cccgggtgga cgtctagagg tacctagcaa 8880
ttaacagata gtttgccggt gataattctc ttaacctccc acactccttt gacataacga 8940
tttatgtaac gaaactgaaa tttgaccaga tattgtgtcc gc 8982
<210> 179
<211> 10424
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY86
<220>
<221> misc_feature
<222> (8734)..(8734)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (8739)..(8742)
<223> n is a, c, g, or t
<400> 179
acactgtggc cggcctttac ctgcaggata acttcgtata atgtatgcta tacgaagtta 60
tgaattctct ctcttgagct tttccataac aagttcttct gcctccagga agtccatggg 120
tggtttgatc atggttttgg tgtagtggta gtgcagtggt ggtattgtga ctggggatgt 180
agttgagaat aagtcataca caagtcagct ttcttcgagc ctcatataag tataagtagt 240
tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa catgccccat 300
tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat cagacaggtc 360
gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct atatacacag 420
ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag cctcccagcc 480
agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt acagacctcg 540
gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc ggtactgctg 600
tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa gccagtcctc 660
agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg ggtcggatcg 720
ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct tgcaagacag 780
ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga ctaggaactc 840
cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag agacagtttc 900
ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt gggcgttggt 960
gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag tgttgccaat 1020
atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa gttccttgag 1080
ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg ttttgatcat 1140
gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg tggtaacatc 1200
cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc gagcggcaaa 1260
ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg tgaagaggag 1320
actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg cagtgaagta 1380
tatgttatgg taatagttac gagttagttg aacttataga tagactggac tatacggcta 1440
tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc cgacaaaaat 1500
gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg ccaaccgcgc 1560
cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca aagtgatcca 1620
agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag acagatactc 1680
gtcgactcat cgatcaggag agaccgggtt ggcggcgtat ttgtgtccca aaaaacagcc 1740
ccaattgccc caattgaccc caaattgacc cagtagcggg cccaaccccg gcgagagccc 1800
ccttcacccc acatatcaaa cctcccccgg ttcccacact tgccgttaag ggcgtagggt 1860
actgcagtct ggaatctacg cttgttcaga ctttgtacta gtttctttgt ctggccatcc 1920
gggtaaccca tgccggacgc aaaatagact actgaaaatt tttttgcttt gtggttggga 1980
ctttagccaa gggtataaaa gaccaccgtc cccgaattac ctttcctctt cttttctctc 2040
tctccttgtc aactcacacc cgaaatcgtt aagcatttcc ttctgagtat aagaatcatt 2100
caaaggatcc actagttcta gagcggccgc ttaaaccatg aaaaagcctg aactcaccgc 2160
gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc gtctccgacc tgatgcagct 2220
ctcggagggc gaagaatctc gtgctttcag cttcgatgta ggagggcgtg gatatgtcct 2280
gcgggtaaat agctgcgccg atggtttcta caaagatcgt tatgtttatc ggcactttgc 2340
atcggccgcg ctcccgattc cggaagtgct tgacattggg gaattcagcg agagcctgac 2400
ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa gacctgcctg aaaccgaact 2460
gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg atcgctgcgg ccgatcttag 2520
ccagacgagc gggttcggcc cattcggacc gcaaggaatc ggtcaataca ctacatggcg 2580
tgatttcata tgcgcgattg ctgatcccca tgtgtatcac tggcaaactg tgatggacga 2640
caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg atgctttggg ccgaggactg 2700
ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc aacaatgtcc tgacggacaa 2760
tggccgcata acagcggtca ttgactggag cgaggcgatg ttcggggatt cccaatacga 2820
ggtcgccaac atcttcttct ggaggccgtg gttggcttgt atggagcagc agacgcgcta 2880
cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg ctccgggcgt atatgctccg 2940
cattggtctt gaccaactct atcagagctt ggttgacggc aatttcgatg atgcagcttg 3000
ggcgcagggt cgatgcgacg caatcgtccg atccggagcc gggactgtcg ggcgtacaca 3060
aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt gtagaagtac tcgccgatag 3120
tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa tagtgaggta cctaaagcgg 3180
ccgccaccgc ggcccgagat tccggcctct tcggccgcca agcgacccgg gtggacgtct 3240
agaggtacct agcaattaac agatagtttg ccggtgataa ttctcttaac ctcccacact 3300
cctttgacat aacgatttat gtaacgaaac tgaaatttga ccagatattg tgtccgcgat 3360
aacttcgtat aatgtatgct atacgaagtt atcgtacgat agttagtaga caacaatcag 3420
aacatctccc tccttatata atcacacagg ccagaacgcg ctaaactaaa gcgctttgga 3480
cactatgtta cattggcatt gattgaactg aaaccacagt ctccctcgcc tgaatcgagc 3540
aatggatgtt gtcggaagtc aacttcacta gaagagcggt tctatgcctt gtcaagatca 3600
tatcataaac tcactctgta ttaccccatc tatagaacac ttgttatgaa tgggcggaaa 3660
cattccgcta tatgcacctt tccacactaa tgcaaagatg tgcatcttca acgggtagta 3720
agactggttc cgacttccgt tgcatggaga gcaatgacct cgataatgcg aacatccccc 3780
acatatacac tcttacacag gccaatataa tctgtgcatt tactaaatat ttaagtctat 3840
gcacctgctt gatgaaaagc ggcacggatg gtatcatcta gtttccgcca atccaagaac 3900
caactgtgtt ggcagtggtg tagcccatgg cacacagacc aaagatgaaa atacagacat 3960
cggcggttcg agccgtggtg cctcgagcaa cacccttgta atgcaaaaga ggagggtaaa 4020
tgtacaccag aggcacacat gcaaacgatc cggtgagagc gacgaaccga tcgagatcgt 4080
cggcacctcc ccatgcaaca aaggcggtga caaacacaag gaagaaccgg aaaatgttct 4140
tctgccactt gatggtagag ttgtacttgc ctgatcgggt gaagagacca ttctcgatga 4200
ttcggatggc gcgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 4260
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 4320
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 4380
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 4440
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 4500
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 4560
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 4620
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 4680
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 4740
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 4800
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 4860
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 4920
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 4980
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 5040
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 5100
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 5160
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 5220
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 5280
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 5340
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 5400
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 5460
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 5520
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 5580
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 5640
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 5700
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 5760
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 5820
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 5880
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 5940
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 6000
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 6060
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 6120
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 6180
catttccccg aaaagtgcca cctgatgcgg tgtgaaatac cgcacagatg cgtaaggaga 6240
aaataccgca tcaggaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt 6300
gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa 6360
aagaatagac cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa 6420
agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac 6480
gtgaaccatc accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga 6540
accctaaagg gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa 6600
aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc 6660
tgcgcgtaac caccacaccc gccgcgctta atgcgccgct acagggcgcg tccattcgcc 6720
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 6780
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 6840
gtcacgacgt tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt 6900
gggcccgacg tcgcatgctt agaagtgagg attacaagaa gcctctggat atcaatgatg 6960
aacgtactca gcggctggtc aagcatttcg accgtcgaat cgacgaggtg ttcacctttg 7020
acaagcgagg gttcccaatt gatcacgttc tcgagttgtt caaatcttct ctcaacatct 7080
ctctgcatga actatctctg ttgacgaacg tgtcacccac tgttcctcga acgcccttct 7140
ccgagtttgg tctgaacatc ttcgatctca aactgacccc cgcagtgatc aatagtgcca 7200
tgccactgcc gatgcggtgc gaacatccct ggagggattc tcggagctct acacaatgca 7260
gattctgtcg tcgagtactc tctaccttgc tcgaatgact tattgtgcta ctactgcact 7320
catgcttcga tcatgtgccc tactgcaccc caaatttggt gatctgattg agacagagta 7380
ccctcttcag ctgattcaga agatcatcag caacatgaat gatgtggttg accaggcagg 7440
ctgttgtagt cacgtccttc acttcaagtt cattcttcat ctgcttctgt tttactttga 7500
caggcaaatg aagacatggt acgacttgat ggaggccaag aacgccattt caccccgaga 7560
caccgaagtg cctgaaatcc tggctgcccc cattgataac atcggaaact acggtattcc 7620
ggaaagtgta tatagaacct ttccccagct tgtgtctgtg gatatggatg gtgtaatccc 7680
cttaattaac gaggaagagg acaagcggct gcttcttaag tttgtgacat cagtatccaa 7740
ggcaccattg caaggattca aggctttgaa cccgtcattt gccattcgta acgctggtag 7800
acaggttgat cggttcccta cggcctccac ctgtgtcaat cttctcaagc tgcctgacta 7860
tcaggacatt gatcaacttc ggaagaaact tttgtatgcc attcgatcac atgctggttt 7920
cgatttgtct tagaggaacg catatacagt aatcatagag aataaacgat attcatttat 7980
taaagtagat agttgaggta gaagttgtaa agagtgataa atagcggccg cgcctactta 8040
agcaacgggc ttgataacag cggggggggt gcccacgttg ttgcggttgc ggaagaacag 8100
aacaccctta ccagcaccct cggcaccagc gctgggctca acccactggc acatacgcgc 8160
actgcggtac atggcgcgga tgaagccacg aggaccatcc tggacatcag cccggtagtg 8220
cttgcccatg atgggcttaa tggcctcggt ggcctcgtcc gcgttgtaga aggggatgct 8280
gctgacgtag tggtggagga catgagtctc gatgatgccg tggagaaggt ggcggccgat 8340
gaagcccatc tcacggtcaa tggtagcagc ggcaccacgg acgaagttcc actcgtcgtt 8400
ggtgtagtgg ggaagggtag ggtcggtgtg ctggaggaag gtgatggcaa cgagccagtg 8460
gttaacccag aggtagggaa caaagtacca gatggccatg ttgtagaaac cgaacttctg 8520
aacgaggaag tacagagcag tggccatcag accgatacca atatcgctga ggacgatgag 8580
cttagcgtca ctgttctcgt acagagggct gcggggatcg aagtggttaa caccaccgcc 8640
gaggccgtta tgcttgccct tgccgcgacc ctcacgctgg cgctcgtggt agttgtggcc 8700
ggtaacattg gtgatgaggt agttgggcca gccnacgann nnctcagtaa gatgagcgag 8760
ctcgtgggtc atctttccga gacgagtagc ctgctgctcg cgggttcggg gaacgaagac 8820
catgtcacgc tccatgttgc cagtggcctt gtggtgcttt cggtgggaga tttgccagct 8880
gaagtagggg acaaggaggg aagagtgaag aacccagcca gtaatgtcgt tgatgatgcg 8940
agaatcggag aaagcaccgt gaccgcactc atgggcaata acccagagac cagtaccgaa 9000
aagaccctga agaacggtgt acacggccca cagaccagcg cgggcggggg tggaggggat 9060
atattcgggg gtcacaaagt tgtaccagat gctgaaagtg gtagtcagga ggacaatgtc 9120
gcggaggata taaccgtatc ccttgagagc ggagcgcttg aagcagtgct tagggatggc 9180
attgtagatg tccttgatgg taaagtcggg aacctcgaac tggttgccgt aggtgtcgag 9240
catgacacca tactcggact tgggcttggc gatatcaacc tcggacatgg acgagagcga 9300
tgtggaagag gccgagtggc ggggagagtc tgaaggagag acggcggcag actcagaatc 9360
cgtcacagta gttgaggtga cggtgcgtct aagcgcaggg ttctgcttgg gcagagccga 9420
agtggacgcc atggagagct gggttagttt gtgtagagag tgtgtgttgc tagcgacttt 9480
cggattgtgt cattacacaa aacgcgtcgt ctcgacactg atcttgtcgt ggatactcac 9540
ggctcggaca tcgtcgccga cgatgacacc ggactttcgc ttaaggacgt cagtaacagg 9600
cattgtgtga tgtgtagttt agatttcgaa tctgtgggga aagaaaggaa aaaagagact 9660
ggcaaccgat tgggagagcc actgtttata tataccctag acaagccccc cgcttgtaag 9720
atgttggtca atgtaaacca gtattaaggt tggcaagtgc aggagaagca aggtgtgggt 9780
accgagcaat ggaaatgtgc ggaaggcaaa aaaatgaggc cacggcctat tgtcggggct 9840
atatccaggg ggcgattgaa gtacactaac atgacatgtg tccacagacc ctcaatctgg 9900
cctgatgagc caaatccata cgcgctttcg cagctctaaa ggctataaca agtcacacca 9960
ccctgctcga cctcagcgcc ctcacttttt gttaagacaa actgtacacg ctgttccagc 10020
gttttctgcc tgcacctggt gggacatttg gtgcaaccta aagtgctcgg aacctctgtg 10080
gtgtccagat cagcgcagca gttccgaggt agttttgagg cccttagatg atgcaatggt 10140
gtcagtcgct ggatcacgag tcttaatggc agtattcgtt cttatttgtg ccattgagcc 10200
ccgttatcct cgtatcttct accccccatc ccatcccttt gttggtgcaa ccctacccat 10260
ttattgttgg gtgcagccca accgacgtgg agagcttggc ttggccatat aaaaaggccc 10320
ccccctagtg gcaatggcag aaagtcagct gtgagttgtt gaatttgtca tctaggcggc 10380
ctggccgtct tctccggggc aattgttcct ctatagtact gcgt 10424
<210> 180
<211> 10485
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY94
<400> 180
taaaaggcgt tgaaacagaa tgagccagac agcaaggaca aggtggccaa cagcaaggag 60
tccaaaaagc cctctattga cgagatccac gatgttattg ctcatgaggt ttccgagctc 120
gatgctggga agaagaagtg atttgtatat aagaaataaa tgagatatag taaaggagtg 180
caagagaatg gcaaggtggt caaattctat attacttgca gtcactggtt cctcgttgac 240
atgaatgaag ttaccgttgg catagctgat ttaatatata actgtccaac taactctcac 300
ctagatataa cccatgtgtg tgtttccaat catcaatgcg gccgcttaga gagccttgcc 360
agcgggctgc ttctcggcca ttcgagcgaa cacggccagg tatcggagca ggatgacgag 420
accttcatgg ggcagagggt ttcggtaggg gaggttgtgc ttctggcaca gctgttccac 480
ctggtaggaa acggcagtga ggttgtgtcg aggcagggtg ggccagagat ggtgctcgat 540
ctggtagttc aggcctccaa agaaccagtc agtaatgatg cctcgtcgaa tgttcatggt 600
ctcatggatc tgacccacag agaagccatg tccgtcccag acggaatcac cgatcttctc 660
cagagggtag tggttcatga agaccacgat ggcaattccg aagccaccga cgagctcgga 720
aacaaagaac accaggagcg aggtcaggat ggagggcata aagaagaggt ggaacagggt 780
cttgagagtc cagtgcagag cgagtccaat ggcctctttc ttgtactgag atcggtagaa 840
ctggttgtct cggtccttga gggatcgaac ggtcagcaca gactggaaac accagatgaa 900
tcgcaggaga atacagatga ccaggaaata gtactgttgg aactgaatga gctttcggga 960
gatgggagaa gctcgagtga catcgtcctc ggaccaggcg agcagaggca ggttatcaat 1020
gtcgggatcg tgaccctgaa cgttggtagc agaatgatgg gcgttgtgtc tgtccttcca 1080
ccaggtcacg gagaagccct ggagtccgtt gccaaagacc agacccacga ggttattcca 1140
gtttcggttc ttgaaggtct ggtggtggca gatgtcatga gacagccatc ccatttgctg 1200
gtagtgcata ccgagcagca cagcaccaat gaagtacatc tggtactgga ccatcaggaa 1260
gtatccaagc acgccaagac ccagggtggt ggagatcttg tacgagtacc agaggggaga 1320
ggcgtcaaac atgccagtgg cgatcagctc ttctcggagc tttcggaaat cctcctgagc 1380
ttcgttgacg gcagcctggg gaggcagctc ggaggagggg ttgatcttgg gcattcgctt 1440
gagcttgtcg aaggcttcct gagagtgcat aaccatgaag gcgtcagtag catctcgtcc 1500
ctggtagttc tcaatgattt cagctccacc agggtggaag ttcacccaag cggagacgtc 1560
gtaggtagtt ccgtcgatgg tgaggggcag agcctgtcgc ttggacttca ccatggagag 1620
ctgggttagt ttgtgtagag agtgtgtgtt gctagcgact ttcggattgt gtcattacac 1680
aaaacgcgtc gtctcgacac tgatcttgtc gtggatactc acggctcgga catcgtcgcc 1740
gacgatgaca ccggactttc gcttaaggac gtcagtaaca ggcattgtgt gatgtgtagt 1800
ttagatttcg aatctgtggg gaaagaaagg aaaaaagaga ctggcaaccg attgggagag 1860
ccactgttta tatataccct agacaagccc cccgcttgta agatgttggt caatgtaaac 1920
cagtattaag gttggcaagt gcaggagaag caaggtgtgg gtaccgagca atggaaatgt 1980
gcggaaggca aaaaaatgag gccacggcct attgtcgggg ctatatccag ggggcgattg 2040
aagtacacta acatgacatg tgtccacaga ccctcaatct ggcctgatga gccaaatcca 2100
tacgcgcttt cgcagctcta aaggctataa caagtcacac caccctgctc gacctcagcg 2160
ccctcacttt ttgttaagac aaactgtaca cgctgttcca gcgttttctg cctgcacctg 2220
gtgggacatt tggtgcaacc taaagtgctc ggaacctctg tggtgtccag atcagcgcag 2280
cagttccgag gtagttttga ggcccttaga tgatgcaatg gtgtcagtcg ctggatcacg 2340
agtcttaatg gcagtattcg ttcttatttg tgccattgag ccccgttatc ctcgtatctt 2400
ctacccccca tcccatccct ttgttggtgc aaccctaccc atttattgtt gggtgcagcc 2460
caaccgacgt ggagagcttg gcttggccat ataaaaaggc ccccccctag tggcaatggc 2520
agaaagtcag ctgtgagttg ttgaatttgt catctaggcg gcctggccgt cttctccggg 2580
gcaatttaaa ttccttcact tcaagttcat tcttcatctg cttctgtttt actttgacag 2640
gcaaatgaag acatggtacg acttgatgga ggccaagaac gccatttcac cccgagacac 2700
cgaagtgcct gaaatcctgg ctgcccccat tgataacatc ggaaactacg gtattccgga 2760
aagtgtatat agaacctttc cccagcttgt gtctgtggat atggatggtg taatcccctt 2820
tgagtactcg tcttggcttc tctccgagca gtatgaggct ctctaatcta gcgcatttaa 2880
tatctcaatg tatttatata tttatcttct catgcggccg ctaaagctgc ttaccagcct 2940
tagcggattt cttggtggcc aggttgtcct ggtaaaagaa gtgacagaac aggagaaaga 3000
cagatccgac gtaggcgtag ttgaaagccc aggagaacag cttgcccttg tcagagttga 3060
agcagggaac gttgatgtag tcccagacca ggagaaagcc accgacgaac tggcaaatct 3120
gcatggcagt gatcagaggc ttggccttga acttgtagcc agcggcagtc agtccatagt 3180
aggtgtacat gatggtgtga atgaacgagt taaagaacat gaagatccac acaccctcgt 3240
tgtgcagtcg aatgccgagg tagacgtccc agggagctcc aaagtgatgg aaggcctgca 3300
gaaaggacac tcgcttgccc ttgaggacca gccaagcggt gtcgaggtac tccacgtact 3360
tagaatagta gaaggccttg gcagtccagg tgaacagctt ggagtcccag acaggagagg 3420
gacactgaaa gagaggctgg ggagtatcac cggtctgtct tcgcagccag gctccagtac 3480
cgtagtccca gccgagagcg gtggcagtca cgtagaagga cagggcagag aagagagcca 3540
ggaggacgtt gtaccagatc atggaggttc ggtaggctcc tttcttctcg tccacgagac 3600
cagagtttcg caggagaggc ttcaggagca ggtaggagaa ggtgccaatg aggatttcgg 3660
gatcggtgac ggcagcccag attcgctcgc cagcgtcgtt ggccagagcc atggttagcg 3720
tgtcgtgttt ttgttgtgct ggaagaacca aagggtggcg caatgtgtgt agatatatat 3780
gtcgtgaccc acaagtcaca caaacaagta tcgggaggag tggtgcacct ctatgcggag 3840
aaaccttata ccgctgtaga ccaactgggg cagaggtgtg agttgaagtc agctggagga 3900
gatgtgtgac agaagcacaa gaagtgagat tgtgagatgt atgtctaggg ggggaagttt 3960
tgtgtcaaat atatgggaat tattatcagc accacgaaat tatacgcctc atatgaccca 4020
tttaggtgga tagatcatgg acactgttga cagctgcgaa gaaaaagcgt attggggatg 4080
atccgaaatt agtccggtac cgaggcgcaa atacgtaaga cagccgatwa aatatatgcg 4140
agaaacacca aagagactct agatgtttgt ttggcacagt tttgacttct gcgaaggcct 4200
tacaccacct tgttgaccct tgtcgcgggt cgggcaatat cggctgacag agttttactt 4260
gctcaataag atacgagctg catagagttg aactacagga caatattggg gctggccaca 4320
tgaagggcat tgtttggagg tgtattgatg gtgaaaacac gatatgaaat gacaacgccc 4380
cctgttttat tattattctt attattttgg gtgcttctct atccatacaa gcacctccta 4440
acatgcttca taagtgacct cctcatcaca aggcctgagg tctcatttat ccagtggcgc 4500
caagctaaac taaaactggt ccgagtagac taaggcgaag agagaaggag agaagacagt 4560
ttttttgtgg ccgcctgtga acaatgaaaa cgatgagggt gagatggagc aaaccatatg 4620
gacagtcaga ggagtacgta cgctgcttac ataatggcgc aacgaccaca tgtcccacag 4680
atacgcatcc gtacggtgag atctatacct aggataactt cgtatagcat acattatacg 4740
aagttatatc gatgagtcga cgagtatctg tctgactcgt cattgccgcc tttggagtac 4800
gactccaact atgagtgtgc ttggatcact ttgacgatac attcttcgtt ggaggctgtg 4860
ggtctgacag ctgcgttttc ggcgcggttg gccgacaaca atatcagctg caacgtcatt 4920
gctggctttc atcatgatca catttttgtc ggcaaaggcg acgcccagag agccattgac 4980
gttctttcta atttggaccg atagccgtat agtccagtct atctataagt tcaactaact 5040
cgtaactatt accataacat atacttcact gccccagata aggttccgat aaaaagttct 5100
gcagactaaa tttatttcag tctcctcttc accaccaaaa tgccctccta cgaagctcga 5160
gctaacgtcc acaagtccgc ctttgccgct cgagtgctca agctcgtggc agccaagaaa 5220
accaacctgt gtgcttctct ggatgttacc accaccaagg agctcattga gcttgccgat 5280
aaggtcggac cttatgtgtg catgatcaaa acccatatcg acatcattga cgacttcacc 5340
tacgccggca ctgtgctccc cctcaaggaa cttgctctta agcacggttt cttcctgttc 5400
gaggacagaa agttcgcaga tattggcaac actgtcaagc accagtaccg gtgtcaccga 5460
atcgccgagt ggtccgatat caccaacgcc cacggtgtac ccggaaccgg aatcattgct 5520
ggcctgcgag ctggtgccga ggaaactgtc tctgaacaga agaaggagga cgtctctgac 5580
tacgagaact cccagtacaa ggagttccta gtcccctctc ccaacgagaa gctggccaga 5640
ggtctgctca tgctggccga gctgtcttgc aagggctctc tggccactgg cgagtactcc 5700
aagcagacca ttgagcttgc ccgatccgac cccgagtttg tggttggctt cattgcccag 5760
aaccgaccta agggcgactc tgaggactgg cttattctga cccccggggt gggtcttgac 5820
gacaagggag acgctctcgg acagcagtac cgaactgttg aggatgtcat gtctaccgga 5880
acggatatca taattgtcgg ccgaggtctg tacggccaga accgagatcc tattgaggag 5940
gccaagcgat accagaaggc tggctgggag gcttaccaga agattaactg ttagaggtta 6000
gactatggat atgtaattta actgtgtata tagagagcgt gcaagtatgg agcgcttgtt 6060
cagcttgtat gatggtcaga cgacctgtct gatcgagtat gtatgatact gcacaacctg 6120
tgtatccgca tgatctgtcc aatggggcat gttgttgtgt ttctcgatac ggagatgctg 6180
ggtacagtgc taatacgttg aactacttat acttatatga ggctcgaaga aagctgactt 6240
gtgtatgact tattctcaac tacatcccca gtcacaatac caccactgca ctaccactac 6300
accaaaacca tgatcaaacc acccatggac ttcctggagg cagaagaact tgttatggaa 6360
aagctcaagg agagaattca taacttcgta tagcatacat tatacgaagt tatcctgcag 6420
gtaaaggccg gccgatgtat atcgtattca ttcatgttag ttgcgtacga agtcgtcaat 6480
gatgtcgata tgggttttga tcatgcacac ataaggtccg accttatcgg caagctcaat 6540
gagctccttg gtggtggtaa catccagaga agcacacagg ttggttttct tggctgccac 6600
gagcttgagc actcgagcgg caaaggcgga cttgtggacg ttagctcgag cttcgtagga 6660
gggcattttg gtggtgaaga ggagactgaa ataaatttag tctgcagaac tttttatcgg 6720
aaccttatct ggggcagtga agtatatgtt atggtaatag ttacgagtta gttgaactta 6780
tagatagact ggactatacg gctatcggtc caaattagaa agaacgtcaa tggctctctg 6840
ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag ccagcaatga cgttgcagct 6900
gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc agacccacag cctccaacga 6960
agaatgtatc gtcaaagtga tccaagcaca ctcatagttg gagtcgtact ccaaaggcgg 7020
caatgacgag tcagacagat actcgtcgac cttttccttg ggaaccacca ccgtcagccc 7080
ttctgactca cgtattgtag ccaccgacac aggcaacagt ccgtggatag cagaatatgt 7140
cttgtcggtc catttctcac caactttagg cgtcaagtga atgttgcaga agaagtatgt 7200
gccttcattg agaatcggtg ttgctgattt caataaagtc ttgagatcag tttggcgcgc 7260
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 7320
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 7380
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 7440
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 7500
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 7560
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 7620
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 7680
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 7740
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 7800
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 7860
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 7920
aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 7980
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 8040
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 8100
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 8160
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 8220
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 8280
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 8340
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 8400
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 8460
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 8520
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 8580
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 8640
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 8700
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 8760
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 8820
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 8880
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 8940
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 9000
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 9060
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 9120
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 9180
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 9240
gtgccacctg atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 9300
gaaattgtaa gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta aatcagctca 9360
ttttttaacc aataggccga aatcggcaaa atcccttata aatcaaaaga atagaccgag 9420
atagggttga gtgttgttcc agtttggaac aagagtccac tattaaagaa cgtggactcc 9480
aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga accatcaccc 9540
taatcaagtt ttttggggtc gaggtgccgt aaagcactaa atcggaaccc taaagggagc 9600
ccccgattta gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa 9660
gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc 9720
acacccgccg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggctgcgca 9780
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 9840
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 9900
aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggc ccgacgtcgc 9960
atgcagtggt ggtattgtga ctggggatgt agttgagaat aagtcataca caagtcagct 10020
ttcttcgagc ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc 10080
cgtatcgaga aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg 10140
cagtatcata catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc 10200
tccatacttg cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta 10260
acagttaatc ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat 10320
aggatctcgg ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga 10380
catgacatcc tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc 10440
caccccgggg gtcagaataa gccagtcctc agagtcgccc ttaat 10485
<210> 181
<211> 8423
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY91M
<400> 181
gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 60
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 120
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 180
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 240
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 300
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 360
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 420
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 480
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 540
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 600
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 660
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 720
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 780
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 840
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 900
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 960
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1020
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1080
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1140
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 1200
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 1260
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1320
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1380
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1440
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 1500
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 1560
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 1620
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 1680
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 1740
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 1800
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 1860
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 1920
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 1980
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2040
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2100
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2160
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2220
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2280
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2340
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2400
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2460
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2520
aacgcgaatt ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca 2580
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 2640
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 2700
aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc 2760
ccctcgaggt cgatggtgtc gataagcttg atatcgaatt catgtcacac aaaccgatct 2820
tcgcctcaag gaaacctaat tctacatccg agagactgcc gagatccagt ctacactgat 2880
taattttcgg gccaataatt taaaaaaatc gtgttatata atattatatg tattatatat 2940
atacatcatg atgatactga cagtcatgtc ccattgctaa atagacagac tccatctgcc 3000
gcctccaact gatgttctca atatttaagg ggtcatctcg cattgtttaa taataaacag 3060
actccatcta ccgcctccaa atgatgttct caaaatatat tgtatgaact tatttttatt 3120
acttagtatt attagacaac ttacttgctt tatgaaaaac acttcctatt taggaaacaa 3180
tttataatgg cagttcgttc atttaacaat ttatgtagaa taaatgttat aaatgcgtat 3240
gggaaatctt aaatatggat agcataaatg atatctgcat tgcctaattc gaaatcaaca 3300
gcaacgaaaa aaatcccttg tacaacataa atagtcatcg agaaatatca actatcaaag 3360
aacagctatt cacacgttac tattgagatt attattggac gagaatcaca cactcaactg 3420
tctttctctc ttctagaaat acaggtacaa gtatgtacta ttctcattgt tcatacttct 3480
agtcatttca tcccacatat tccttggatt tctctccaat gaatgacatt ctatcttgca 3540
aattcaacaa ttataataag atataccaaa gtagcggtat agtggcaatc aaaaagcttc 3600
tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc attaaaggta tatatttatt 3660
tcttgttata taatcctttt gtttattaca tgggctggat acataaaggt attttgattt 3720
aattttttgc ttaaattcaa tcccccctcg ttcagtgtca actgtaatgg taggaaatta 3780
ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa aatcgtattt ccaggttaga 3840
cgttccgcag aatctagaat gcggtatgcg gtacattgtt cttcgaacgt aaaagttgcg 3900
ctccctgaga tattgtacat ttttgctttt acaagtacaa gtacatcgta caactatgta 3960
ctactgttga tgcatccaca acagtttgtt ttgttttttt ttgttttttt tttttctaat 4020
gattcattac cgctatgtat acctacttgt acttgtagta agccgggtta ttggcgttca 4080
attaatcata gacttatgaa tctgcacggt gtgcgctgcg agttactttt agcttatgca 4140
tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa cggatgctca atcgatttcg 4200
acagtaatta attaagtcat acacaagtca gctttcttcg agcctcatat aagtataagt 4260
agttcaacgt attagcactg tacccagcat ctccgtatcg agaaacacaa caacatgccc 4320
cattggacag atcatgcgga tacacaggtt gtgcagtatc atacatactc gatcagacag 4380
gtcgtctgac catcatacaa gctgaacaag cgctccatac ttgcacgctc tctatataca 4440
cagttaaatt acatatccat agtctaacct ctaacagtta atcttctggt aagcctccca 4500
gccagccttc tggtatcgct tggcctcctc aataggatct cggttctggc cgtacagacc 4560
tcggccgaca attatgatat ccgttccggt agacatgaca tcctcaacag ttcggtactg 4620
ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg ggggtcagaa taagccagtc 4680
ctcagagtcg cccttaggtc ggttctgggc aatgaagcca accacaaact cggggtcgga 4740
tcgggcaagc tcaatggtct gcttggagta ctcgccagtg gccagagagc ccttgcaaga 4800
cagctcggcc agcatgagca gacctctggc cagcttctcg ttgggagagg ggactaggaa 4860
ctccttgtac tgggagttct cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt 4920
ttcctcggca ccagctcgca ggccagcaat gattccggtt ccgggtacac cgtgggcgtt 4980
ggtgatatcg gaccactcgg cgattcggtg acaccggtac tggtgcttga cagtgttgcc 5040
aatatctgcg aactttctgt cctcgaacag gaagaaaccg tgcttaagag caagttcctt 5100
gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat 5160
catgcacaca taaggtccga ccttatcggc aagctcaatg agctccttgg tggtggtaac 5220
atccagagaa gcacacaggt tggttttctt ggctgccacg agcttgagca ctcgagcggc 5280
aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag ggcattttgg tggtgaagag 5340
gagactgaaa taaatttagt ctgcagaact ttttatcgga accttatctg gggcagtgaa 5400
gtatatgtta tggtaatagt tacgagttag ttgaacttat agatagactg gactatacgg 5460
ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa 5520
aatgtgatca tgatgaaagc cagcaatgac gttgcagctg atattgttgt cggccaaccg 5580
cgccgaaaac gcagctgtca gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat 5640
ccaagcacac tcatagttgg agtcgtactc caaaggcggc aatgacgagt cagacagata 5700
ctcgtcgact caggcgacga cggaattcct gcagcccatc tgcagaattc aggagagacc 5760
gggttggcgg cgtatttgtg tcccaaaaaa cagccccaat tgccccggag aagacggcca 5820
ggccgcctag atgacaaatt caacaactca cagctgactt tctgccattg ccactagggg 5880
ggggcctttt tatatggcca agccaagctc tccacgtcgg ttgggctgca cccaacaata 5940
aatgggtagg gttgcaccaa caaagggatg ggatgggggg tagaagatac gaggataacg 6000
gggctcaatg gcacaaataa gaacgaatac tgccattaag actcgtgatc cagcgactga 6060
caccattgca tcatctaagg gcctcaaaac tacctcggaa ctgctgcgct gatctggaca 6120
ccacagaggt tccgagcact ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa 6180
cgctggaaca gcgtgtacag tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg 6240
gtggtgtgac ttgttatagc ctttagagct gcgaaagcgc gtatggattt ggctcatcag 6300
gccagattga gggtctgtgg acacatgtca tgttagtgta cttcaatcgc cccctggata 6360
tagccccgac aataggccgt ggcctcattt ttttgccttc cgcacatttc cattgctcgg 6420
tacccacacc ttgcttctcc tgcacttgcc aaccttaata ctggtttaca ttgaccaaca 6480
tcttacaagc ggggggcttg tctagggtat atataaacag tggctctccc aatcggttgc 6540
cagtctcttt tttcctttct ttccccacag attcgaaatc taaactacac atcacacaat 6600
gcctgttact gacgtcctta agcgaaagtc cggtgtcatc gtcggcgacg atgtccgagc 6660
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 6720
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctcca tgggtggcgg 6780
aggacagcag acagaccgaa tcaccgacac caacggcaga ttcagcagct acacctggga 6840
ggaggtgcag aaacacacca aacatggaga tcagtgggtg gtggtggaga ggaaggttta 6900
taacgtcagc cagtgggtga agagacaccc cggaggactg aggatcctcg gacactatgc 6960
tggagaagac gccacggagg cgttcactgc gtttcatcca aaccttcagc tggtgaggaa 7020
atacctgaag ccgctgctaa tcggagagct ggaggcgtct gaacccagtc aggaccggca 7080
gaaaaacgct gctctcgtgg aggatttccg agccctgcgt gagcgtctgg aggctgaagg 7140
ctgttttaaa acgcagccgc tgtttttcgc tctgcatttg ggccacattc tgctcctgga 7200
ggccatcgct ttcatgatgg tgtggtattt cggcaccggt tggatcaaca cgctcatcgt 7260
cgctgttatt ctggctactg cacagtcaca agctggatgg ttgcagcatg acttcggtca 7320
tctgtccgtg tttaaaacct ctggaatgaa tcatttggtg cacaaatttg tcatcggaca 7380
cctgaaggga gcgtctgcgg gctggtggaa ccatcggcac ttccagcatc acgctaaacc 7440
caacatcttc aagaaggacc cggacgtcaa catgctgaac gcctttgtgg tgggaaacgt 7500
gcagcccgtg gagtatggcg ttaagaagat caagcatctg ccctacaacc atcagcacaa 7560
gtacttcttc ttcattggtc ctcccctgct catcccagtg tatttccagt tccaaatctt 7620
tcacaatatg atcagtcatg gcatgtgggt ggacctgctg tggtgtatca gctactacgt 7680
ccgatacttc ctttgttaca cgcagttcta cggcgtcttt tgggctatta tcctctttaa 7740
tttcgtcagg tttatggaga gccactggtt tgtttgggtc acacagatga gccacatccc 7800
catgaacatt gactatgaga aaaatcagga ctggctcagc atgcagctgg tcgcgacctg 7860
taacatcgag cagtctgcct tcaacgactg gttcagcgga cacctcaact tccagatcga 7920
gcatcatctc tttcccacaa tgcctcggca caactactgg cgcgccgctc cacgggtgcg 7980
agcgttgtgt gagaaatacg gagtcaaata ccaagagaag accttgtacg gagcatttgc 8040
ggatatcatt aggtctttgg agaaatctgg cgagctctgg ctggatgcgt atctcaacaa 8100
ataagcggcc gcaagtgtgg atggggaagt gagtgcccgg ttctgtgtgc acaattggca 8160
atccaagatg gatggattca acacagggat atagcgagct acgtggtggt gcgaggatat 8220
agcaacggat atttatgttt gacacttgag aatgtacgat acaagcactg tccaagtaca 8280
atactaaaca tactgtacat actcatactc gtacccgggc aacggtttca cttgagtgca 8340
gtggctagtg ctcttactcg tacagtgtgc aatactgcgt atcatagtct ttgatgtata 8400
tcgtattcat tcatgttagt tgc 8423
<210> 182
<211> 10945
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW232
<400> 182
aattcctgca gcccatcgat caggagagac cgggttggcg gcgtatttgt gtcccaaaaa 60
acagccccaa ttgccccaat tgaccccaaa ttgacccagt agcgggccca accccggcga 120
gagccccctt caccccacat atcaaacctc ccccggttcc cacacttgcc gttaagggcg 180
tagggtactg cagtctggaa tctacgcttg ttcagacttt gtactagttt ctttgtctgg 240
ccatccgggt aacccatgcc ggacgcaaaa tagactactg aaaatttttt tgctttgtgg 300
ttgggacttt agccaagggt ataaaagacc accgtccccg aattaccttt cctcttcttt 360
tctctctctc cttgtcaact cacacccgaa atcgttaagc atttccttct gagtataaga 420
atcattcacc atgggaacgg accaaggaaa aaccttcacc tgggaagagc tggcggccca 480
taacaccaag gacgacctac tcttggccat ccgcggcagg gtgtacgatg tcacaaagtt 540
cttgagccgc catcctggtg gagtggacac tctcctgctc ggagctggcc gagatgttac 600
tccggtcttt gagatgtatc acgcgtttgg ggctgcagat gccattatga agaagtacta 660
tgtcggtaca ctggtctcga atgagctgcc catcttcccg gagccaacgg tgttccacaa 720
aaccatcaag acgagagtcg agggctactt tacggatcgg aacattgatc ccaagaatag 780
accagagatc tggggacgat acgctcttat ctttggatcc ttgatcgctt cctactacgc 840
gcagctcttt gtgcctttcg ttgtcgaacg cacatggctt caggtggtgt ttgcaatcat 900
catgggattt gcgtgcgcac aagtcggact caaccctctt catgatgcgt ctcacttttc 960
agtgacccac aaccccactg tctggaagat tctgggagcc acgcacgact ttttcaacgg 1020
agcatcgtac ctggtgtgga tgtaccaaca tatgctcggc catcacccct acaccaacat 1080
tgctggagca gatcccgacg tgtcgacgtc tgagcccgat gttcgtcgta tcaagcccaa 1140
ccaaaagtgg tttgtcaacc acatcaacca gcacatgttt gttcctttcc tgtacggact 1200
gctggcgttc aaggtgcgca ttcaggacat caacattttg tactttgtca agaccaatga 1260
cgctattcgt gtcaatccca tctcgacatg gcacactgtg atgttctggg gcggcaaggc 1320
tttctttgtc tggtatcgcc tgattgttcc cctgcagtat ctgcccctgg gcaaggtgct 1380
gctcttgttc acggtcgcgg acatggtgtc gtcttactgg ctggcgctga ccttccaggc 1440
gaaccacgtt gttgaggaag ttcagtggcc gttgcctgac gagaacggga tcatccaaaa 1500
ggactgggca gctatgcagg tcgagactac gcaggattac gcacacgatt cgcacctctg 1560
gaccagcatc actggcagct tgaactacca ggctgtgcac catctgttcc ccaacgtgtc 1620
gcagcaccat tatcccgata ttctggccat catcaagaac acctgcagcg agtacaaggt 1680
tccatacctt gtcaaggata cgttttggca agcatttgct tcacatttgg agcacttgcg 1740
tgttcttgga ctccgtccca aggaagagta ggcagctaag cggccgcatg agaagataaa 1800
tatataaata cattgagata ttaaatgcgc tagattagag agcctcatac tgctcggaga 1860
gaagccaaga cgagtactca aaggggatta caccatccat atccacagac acaagctggg 1920
gaaaggttct atatacactt tccggaatac cgtagtttcc gatgttatca atgggggcag 1980
ccaggatttc aggcacttcg gtgtctcggg gtgaaatggc gttcttggcc tccatcaagt 2040
cgtaccatgt cttcatttgc ctgtcaaagt aaaacagaag cagatgaaga atgaacttga 2100
agtgaaggaa tttaaattgc cccggagaag acggccaggc cgcctagatg acaaattcaa 2160
caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat atggccaagc 2220
caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt gcaccaacaa 2280
agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca caaataagaa 2340
cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca tctaagggcc 2400
tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc gagcacttta 2460
ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg tgtacagttt 2520
gtcttaacaa aaagtgaggg cgctgaggtc gagcagggtg gtgtgacttg ttatagcctt 2580
tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg tctgtggaca 2640
catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat aggccgtggc 2700
ctcatttttt tgccttccgc acatttccat tgctcggtac ccacaccttg cttctcctgc 2760
acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg gggcttgtct 2820
agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt cctttctttc 2880
cccacagatt cgaaatctaa actacacatc acacaatgcc tgttactgac gtccttaagc 2940
gaaagtccgg tgtcatcgtc ggcgacgatg tccgagccgt gagtatccac gacaagatca 3000
gtgtcgagac gacgcgtttt gtgtaatgac acaatccgaa agtcgctagc aacacacact 3060
ctctacacaa actaacccag ctctccatgg gaacggacca aggaaaaacc ttcacctggg 3120
aagagctggc ggcccataac accaaggacg acctactctt ggccatccgc ggcagggtgt 3180
acgatgtcac aaagttcttg agccgccatc ctggtggagt ggacactctc ctgctcggag 3240
ctggccgaga tgttactccg gtctttgaga tgtatcacgc gtttggggct gcagatgcca 3300
ttatgaagaa gtactatgtc ggtacactgg tctcgaatga gctgcccatc ttcccggagc 3360
caacggtgtt ccacaaaacc atcaagacga gagtcgaggg ctactttacg gatcggaaca 3420
ttgatcccaa gaatagacca gagatctggg gacgatacgc tcttatcttt ggatccttga 3480
tcgcttccta ctacgcgcag ctctttgtgc ctttcgttgt cgaacgcaca tggcttcagg 3540
tggtgtttgc aatcatcatg ggatttgcgt gcgcacaagt cggactcaac cctcttcatg 3600
atgcgtctca cttttcagtg acccacaacc ccactgtctg gaagattctg ggagccacgc 3660
acgacttttt caacggagca tcgtacctgg tgtggatgta ccaacatatg ctcggccatc 3720
acccctacac caacattgct ggagcagatc ccgacgtgtc gacgtctgag cccgatgttc 3780
gtcgtatcaa gcccaaccaa aagtggtttg tcaaccacat caaccagcac atgtttgttc 3840
ctttcctgta cggactgctg gcgttcaagg tgcgcattca ggacatcaac attttgtact 3900
ttgtcaagac caatgacgct attcgtgtca atcccatctc gacatggcac actgtgatgt 3960
tctggggcgg caaggctttc tttgtctggt atcgcctgat tgttcccctg cagtatctgc 4020
ccctgggcaa ggtgctgctc ttgttcacgg tcgcggacat ggtgtcgtct tactggctgg 4080
cgctgacctt ccaggcgaac cacgttgttg aggaagttca gtggccgttg cctgacgaga 4140
acgggatcat ccaaaaggac tgggcagcta tgcaggtcga gactacgcag gattacgcac 4200
acgattcgca cctctggacc agcatcactg gcagcttgaa ctaccaggct gtgcaccatc 4260
tgttccccaa cgtgtcgcag caccattatc ccgatattct ggccatcatc aagaacacct 4320
gcagcgagta caaggttcca taccttgtca aggatacgtt ttggcaagca tttgcttcac 4380
atttggagca cttgcgtgtt cttggactcc gtcccaagga agagtaggca gctaagcggc 4440
cgcaagtgtg gatggggaag tgagtgcccg gttctgtgtg cacaattggc aatccaagat 4500
ggatggattc aacacaggga tatagcgagc tacgtggtgg tgcgaggata tagcaacgga 4560
tatttatgtt tgacacttga gaatgtacga tacaagcact gtccaagtac aatactaaac 4620
atactgtaca tactcatact cgtacccggg caacggtttc acttgagtgc agtggctagt 4680
gctcttactc gtacagtgtg caatactgcg tatcatagtc tttgatgtat atcgtattca 4740
ttcatgttag ttgcgtacgc caccattctg tctgccgcca tgatgctcaa gttctctctt 4800
aacatgaagc ccgccggtga cgctgttgag gctgccgtca aggagtccgt cgaggctggt 4860
atcactaccg ccgatatcgg aggctcttcc tccacctccg aggtcggaga cttgttgcca 4920
acaaggtcaa ggagctgctc aagaaggagt aagtcgtttc tacgacgcat tgatggaagg 4980
agcaaactga cgcgcctgcg ggttggtcta ccggcagggt ccgctagtgt ataagactct 5040
ataaaaaggg ccctgccctg ctaatgaaat gatgatttat aatttaccgg tgtagcaacc 5100
ttgactagaa gaagcagatt gggtgtgttt gtagtggagg acagtggtac gttttggaaa 5160
cagtcttctt gaaagtgtct tgtctacagt atattcactc ataacctcaa tagccaaggg 5220
tgtagtcggt ttattaaagg aagggagttg tggctgatgt ggatagatat ctttaagctg 5280
gcgactgcac ccaacgagtg tggtggtagc ttgttactgt atattcggta agatatattt 5340
tgtggggttt tagtggtgtt tggtaggtta gtgcttggta tatgagttgt aggcatgaca 5400
atttggaaag gggtggactt tgggaatatt gtgggatttc aataccttag tttgtacagg 5460
gtaattgtta caaatgatac aaagaactgt atttcttttc atttgtttta attggttgta 5520
tatcaagtcc gttagacgag ctcagtgggc gcgccagctg cattaatgaa tcggccaacg 5580
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 5640
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 5700
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 5760
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 5820
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 5880
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 5940
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 6000
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 6060
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 6120
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 6180
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 6240
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 6300
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 6360
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 6420
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 6480
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 6540
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 6600
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 6660
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 6720
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 6780
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 6840
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 6900
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 6960
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 7020
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 7080
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 7140
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 7200
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 7260
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 7320
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 7380
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 7440
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 7500
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgatgcgg tgtgaaatac 7560
cgcacagatg cgtaaggaga aaataccgca tcaggaaatt gtaagcgtta atattttgtt 7620
aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 7680
caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg 7740
gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta 7800
tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg 7860
ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa 7920
gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct 7980
ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct 8040
acagggcgcg tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg 8100
gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg 8160
gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac 8220
gactcactat agggcgaatt gggcccgacg tcgcatgcta tcggcatcga caaggtttgg 8280
gtccctagcc gataccgcac tacctgagtc acaatcttcg gaggtttagt cttccacata 8340
gcacgggcaa aagtgcgtat atatacaaga gcgtttgcca gccacagatt ttcactccac 8400
acaccacatc acacatacaa ccacacacat ccacaatgga acccgaaact aagaagacca 8460
agactgactc caagaagatt gttcttctcg gcggcgactt ctgtggcccc gaggtgattg 8520
ccgaggccgt caaggtgctc aagtctgttg ctgaggcctc cggcaccgag tttgtgtttg 8580
aggaccgact cattggagga gctgccattg agaaggaggg cgagcccatc accgacgcta 8640
ctctcgacat ctgccgaaag gctgactcta ttatgctcgg tgctgtcgga ggcgctgcca 8700
acaccgtatg gaccactccc gacggacgaa ccgacgtgcg acccgagcag ggtctcctca 8760
agctgcgaaa ggacctgaac ctgtacgcca acctgcgacc ctgccagctg ctgtcgccca 8820
agctcgccga tctctccccc atccgaaacg ttgagggcac cgacttcatc attgtccgag 8880
agctcgtcgg aggtatctac tttggagagc gaaaggagga tgacggatct ggcgtcgctt 8940
ccgacaccga gacctactcc gttaattaat ttgaatcgaa tcgatgagcc taaaatgaac 9000
ccgagtatat ctcataaaat tctcggtgag aggtctgtga ctgtcagtac aaggtgcctt 9060
cattatgccc tcaaccttac catacctcac tgaatgtagt gtacctctaa aaatgaaata 9120
cagtgccaaa agccaaggca ctgagctcgt ctaacggact tgatatacaa ccaattaaaa 9180
caaatgaaaa gaaatacagt tctttgtatc atttgtaaca attaccctgt acaaactaag 9240
gtattgaaat cccacaatat tcccaaagtc cacccctttc caaattgtca tgcctacaac 9300
tcatatacca agcactaacc taccgtttaa acagtgtacg cagatctggt gtagtggtag 9360
tgcagtggtg gtattgtgac tggggatgta gttgagaata agtcatacac aagtcagctt 9420
tcttcgagcc tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc 9480
gtatcgagaa acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc 9540
agtatcatac atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct 9600
ccatacttgc acgctctcta tatacacagt taaattacat atccatagtc taacctctaa 9660
cagttaatct tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata 9720
ggatctcggt tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac 9780
atgacatcct caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc 9840
accccggggg tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg 9900
aagccaacca caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg 9960
ccagtggcca gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc 10020
ttctcgttgg gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg 10080
tcctccttct tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt 10140
ccggttccgg gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac 10200
cggtactggt gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag 10260
aaaccgtgct taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg 10320
tcaatgatgt cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc 10380
tcaatgagct ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct 10440
gccacgagct tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg 10500
taggagggca ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt 10560
atcggaacct tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga 10620
acttatagat agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct 10680
ctctgggcgt cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg 10740
cagctgatat tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc 10800
aacgaagaat gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa 10860
ggcggcaatg acgagtcaga cagatactcg tcgacctttt ccttgggaac caccaccgtc 10920
agcccttctg actcacgtat tgtag 10945
<210> 183
<211> 8194
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY37/F15
<400> 183
ggccgcacaa tggcgactcg acagcgaact gccaccactg ttgtggtcga ggaccttccc 60
aaggtcactc ttgaggccaa gtctgaacct gtgttccccg atatcaagac catcaaggat 120
gccattcccg cgcactgctt ccagccctcg ctcgtcacct cattctacta cgtcttccgc 180
gattttgcca tggtctctgc cctcgtctgg gctgctctca cctacatccc cagcatcccc 240
gaccagaccc tccgcgtcgc agcttggatg gtctacggct tcgtccaggg tctgttctgc 300
accggtgtct ggattctcgg ccatgagtgc ggccacggtg ctttctctct ccacggaaag 360
gtcaacaatg tgaccggctg gttcctccac tcgttcctcc tcgtccccta cttcagctgg 420
aagtactctc accaccgcca ccaccgcttc accggccaca tggatctcga catggctttc 480
gtccccaaga ctgagcccaa gccctccaag tcgctcatga ttgctggcat tgacgtcgcc 540
gagcttgttg aggacacccc cgctgctcag atggtcaagc tcatcttcca ccagcttttc 600
ggatggcagg cgtacctctt cttcaacgct agctctggca agggcagcaa gcagtgggag 660
cccaagactg gcctctccaa gtggttccga gtcagtcact tcgagcctac cagcgctgtc 720
ttccgcccca acgaggccat cttcatcctc atctccgata tcggtcttgc tctaatggga 780
actgctctgt actttgcttc caagcaagtt ggtgtttcga ccattctctt cctctacctt 840
gttccctacc tgtgggttca ccactggctc gttgccatta cctacctcca ccaccaccac 900
accgagctcc ctcactacac cgctgagggc tggacctacg tcaagggagc tctcgccact 960
gtcgaccgtg agtttggctt catcggaaag cacctcttcc acggtatcat tgagaagcac 1020
gttgttcacc atctcttccc taagatcccc ttctacaagg ctgacgaggc caccgaggcc 1080
atcaagcccg tcattggcga ccactactgc cacgacgacc gaagcttcct gggccagctg 1140
tggaccatct tcggcacgct caagtacgtc gagcacgacc ctgcccgacc cggtgccatg 1200
cgatggaaca aggactaggc taggcggccg ccaccgcggc ccgaattccg gcctcttcgg 1260
ccgccaagcg acccgggtgg acgtctagag gtacctagca attaacagat agtttgccgg 1320
tgataattct cttaacctcc cacactcctt tgacataacg atttatgtaa cgaaactgaa 1380
atttgaccag atattgtgtc cgcggtggag ctccagcttt tgttcccttt agtgagggtt 1440
aatttcgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 1500
cacaattcca cacaacgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 1560
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 1620
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 1680
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 1740
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 1800
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 1860
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 1920
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 1980
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2040
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2100
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2160
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 2220
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 2280
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 2340
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 2400
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 2460
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 2520
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 2580
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 2640
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 2700
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 2760
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 2820
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 2880
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 2940
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 3000
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 3060
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 3120
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 3180
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 3240
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 3300
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 3360
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 3420
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 3480
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 3540
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 3600
ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt 3660
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt 3720
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc 3780
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga 3840
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc 3900
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt 3960
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 4020
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg 4080
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 4140
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 4200
cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa 4260
ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg 4320
tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga 4380
tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat 4440
tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag 4500
acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt 4560
gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta 4620
tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt 4680
cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa 4740
tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc 4800
taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa 4860
atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga 4920
atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct 4980
cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat 5040
gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg 5100
gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta 5160
aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat 5220
aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg 5280
taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc 5340
gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc 5400
gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac 5460
atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt 5520
tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc 5580
gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt 5640
acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga 5700
tgctcaaccg atttcgacag taattaatta agtcatacac aagtcagctt tcttcgagcc 5760
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 5820
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 5880
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 5940
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 6000
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 6060
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 6120
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 6180
tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 6240
caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 6300
gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 6360
gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 6420
tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 6480
gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 6540
gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 6600
taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 6660
cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 6720
ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 6780
tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 6840
ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 6900
tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 6960
agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 7020
cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 7080
tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 7140
gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 7200
acgagtcaga cagatactcg tcgacgcagt aggatgtcct gcacgggtct ttttgtgggg 7260
tgtggagaaa ggggtgcttg gagatggaag ccggtagaac cgggctgctt gtgcttggag 7320
atggaagccg gtagaaccgg gctgcttggg gggatttggg gccgctgggc tccaaagagg 7380
ggtaggcatt tcgttggggt tacgtaattg cggcatttgg gtcctgcgcg catgtcccat 7440
tggtcagaat tagtccggat aggagactta tcagccaatc acagcgccgg atccacctgt 7500
aggttgggtt gggtgggagc acccctccac agagtagagt caaacagcag cagcaacatg 7560
atagttgggg gtgtgcgtgt taaaggaaaa aaaagaagct tgggttatat tcccgctcta 7620
tttagaggtt gcgggataga cgccgacgga gggcaatggc gccatggaac cttgcggata 7680
tcgatacgcc gcggcggact gcgtccgaac cagctccagc agcgtttttt ccgggccatt 7740
gagccgactg cgaccccgcc aacgtgtctt ggcccacgca ctcatgtcat gttggtgttg 7800
ggaggccact ttttaagtag cacaaggcac ctagctcgca gcaaggtgtc cgaaccaaag 7860
aagcggctgc agtggtgcaa acggggcgga aacggcggga aaaagccacg ggggcacgaa 7920
ttgaggcacg ccctcgaatt tgagacgagt cacggcccca ttcgcccgcg caatggctcg 7980
ccaacgcccg gtcttttgca ccacatcagg ttaccccaag ccaaaccttt gtgttaaaaa 8040
gcttaacata ttataccgaa cgtaggtttg ggcgggcttg ctccgtctgt ccaaggcaac 8100
atttatataa gggtctgcat cgccggctca attgaatctt ttttcttctt ctcttctcta 8160
tattcattct tgaattaaac acacatcaat ccgc 8194
<210> 184
<211> 10838
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pKO2UF2PE
<220>
<221> misc_feature
<222> (1615)..(1618)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1623)..(1623)
<223> n is a, c, g, or t
<400> 184
aaattgcccc ggagaagacg gccaggccgc ctagatgaca aattcaacaa ctcacagctg 60
actttctgcc attgccacta ggggggggcc tttttatatg gccaagccaa gctctccacg 120
tcggttgggc tgcacccaac aataaatggg tagggttgca ccaacaaagg gatgggatgg 180
ggggtagaag atacgaggat aacggggctc aatggcacaa ataagaacga atactgccat 240
taagactcgt gatccagcga ctgacaccat tgcatcatct aagggcctca aaactacctc 300
ggaactgctg cgctgatctg gacaccacag aggttccgag cactttaggt tgcaccaaat 360
gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt acagtttgtc ttaacaaaaa 420
gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta tagcctttag agctgcgaaa 480
gcgcgtatgg atttggctca tcaggccaga ttgagggtct gtggacacat gtcatgttag 540
tgtacttcaa tcgccccctg gatatagccc cgacaatagg ccgtggcctc atttttttgc 600
cttccgcaca tttccattgc tcgataccca caccttgctt ctcctgcact tgccaacctt 660
aatactggtt tacattgacc aacatcttac aagcgggggg cttgtctagg gtatatataa 720
acagtggctc tcccaatcgg ttgccagtct cttttttcct ttctttcccc acagattcga 780
aatctaaact acacatcaca gaattccgag ccgtgagtat ccacgacaag atcagtgtcg 840
agacgacgcg ttttgtgtaa tgacacaatc cgaaagtcgc tagcaacaca cactctctac 900
acaaactaac ccagctctgg taccatggcg tccacttcgg ctctgcccaa gcagaaccct 960
gcgcttagac gcaccgtcac ctcaactact gtgacggatt ctgagtctgc cgccgtctct 1020
ccttcagact ctccccgcca ctcggcctct tccacatcgc tctcgtccat gtccgaggtt 1080
gatatcgcca agcccaagtc cgagtatggt gtcatgctcg acacctacgg caaccagttc 1140
gaggttcccg actttaccat caaggacatc tacaatgcca tccctaagca ctgcttcaag 1200
cgctccgctc tcaagggata cggttatatc ctccgcgaca ttgtcctcct gactaccact 1260
ttcagcatct ggtacaactt tgtgaccccc gaatatatcc cctccacccc cgcccgcgct 1320
ggtctgtggg ccgtgtacac cgttcttcag ggtcttttcg gtactggtct ctgggttatt 1380
gcccatgagt gcggtcacgg tgctttctcc gattctcgca tcatcaacga cattactggc 1440
tgggttcttc actcttccct ccttgtcccc tacttcagct ggcaaatctc ccaccgaaag 1500
caccacaagg ccactggcaa catggagcgt gacatggtct tcgttccccg aacccgcgag 1560
cagcaggcta ctcgtctcgg aaagatgacc cacgagctcg ctcatcttac tgagnnnntc 1620
gtnggctggc ccaactacct catcaccaat gttaccggcc acaactacca cgagcgccag 1680
cgtgagggtc gcggcaaggg caagcataac ggcctcggcg gtggtgttaa ccacttcgat 1740
ccccgcagcc ctctgtacga gaacagtgac gctaagctca tcgtcctcag cgatattggt 1800
atcggtctga tggccactgc tctgtacttc ctcgttcaga agttcggttt ctacaacatg 1860
gccatctggt actttgttcc ctacctctgg gttaaccact ggctcgttgc catcaccttc 1920
ctccagcaca ccgaccctac ccttccccac tacaccaacg acgagtggaa cttcgtccgt 1980
ggtgccgctg ctaccattga ccgtgagatg ggcttcatcg gccgccacct tctccacggc 2040
atcatcgaga ctcatgtcct ccaccactac gtcagcagca tccccttcta caacgcggac 2100
gaggccaccg aggccattaa gcccatcatg ggcaagcact accgggctga tgtccaggat 2160
ggtcctcgtg gcttcatccg cgccatgtac cgcagtgcgc gtatgtgcca gtgggttgag 2220
cccagcgctg gtgccgaggg tgctggtaag ggtgttctgt tcttccgcaa ccgcaacaac 2280
gtgggcaccc cccccgctgt tatcaagccc gttgcttaag taggcgcggc cgcaagtgtg 2340
gatggggaag tgagtgcccg gttctgtgtg cacaattggc aatccaagat ggatggattc 2400
aacacaggga tatagcgagc tacgtggtgg tgcgaggata tagcaacgga tatttatgtt 2460
tgacacttga gaatgtacga tacaagcact gtccaagtac aatactaaac atactgtaca 2520
tactcatact cgtacccggg caacggtttc acttgagtgc agtggctagt gctcttactc 2580
gtacagtgtg caatactgcg tatcatagtc tttgatgtat atcgtattca ttcatgttag 2640
ttgcgtacgg gtgaagcttc cactggtcgg cgtggtagtg gggcagagtg gggtcggtgt 2700
gctgcaggta ggtgatggcc acgagccagt ggttgaccca caggtagggg atcaggtagt 2760
agagggtgac ggaagccagg ccccatcggt tgatggagta tgcgatgacg gacatggtga 2820
taccaatacc gacgttagag atccagatgt tgaaccagtc cttcttctca aacagcgggg 2880
cgttggggtt gaagtggttg acagcccatt tgttgagctt ggggtacttc tgtccggtaa 2940
cgtaagacag cagatacaga ggccatccaa acacctgctg ggtgatgagg ccgtagaggg 3000
tcatgagggg agcgtcctca gcaagctcag accagtcatg ggcgcctcgg ttctccataa 3060
actcctttcg gtccttgggc acaaacacca tatcacgggt gaggtgacca gtggacttgt 3120
ggtgcatgga gtgggtcagc ttccaggcgt agtaagggac cagcatggag gagtgcagaa 3180
cccatccggt gacgttgttg acggtgttag agtcggagaa agcagagtgg ccacactcgt 3240
gggcaagaac ccacagaccg gtgccaaaca gaccctggac aatggagtac atggcccagg 3300
ccacagctcg gccggaagcc gagggaataa gaggcaggta cgcgtaggcc atgtaggcaa 3360
aaacggcgat aaagaagcag gcgcgccagc tgcattaatg aatcggccaa cgcgcgggga 3420
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 3480
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 3540
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 3600
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 3660
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 3720
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 3780
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 3840
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 3900
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 3960
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 4020
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 4080
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 4140
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 4200
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 4260
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 4320
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 4380
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 4440
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 4500
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 4560
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 4620
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 4680
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 4740
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 4800
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 4860
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 4920
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 4980
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 5040
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 5100
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 5160
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 5220
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 5280
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 5340
gggttccgcg cacatttccc cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga 5400
tgcgtaagga gaaaataccg catcaggaaa ttgtaagcgt taatattttg ttaaaattcg 5460
cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc 5520
cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt tggaacaaga 5580
gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg 5640
atggcccact acgtgaacca tcaccctaat caagtttttt ggggtcgagg tgccgtaaag 5700
cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga aagccggcga 5760
acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg ctggcaagtg 5820
tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg ctacagggcg 5880
cgtccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 5940
gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 6000
agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact 6060
atagggcgaa ttgggcccga cgtcgcatgc ttgaatctac aagtaggagg gttggagtga 6120
ttaagtgaaa cttctttaac ggctctatgc cagttctatt gatatccgaa acatcagtat 6180
gaaggtctga taagggtgac ttcttcccac agattcgtat cagtacgagt acgagaccgg 6240
tacttgtaac agtattgata ctaaagggaa actacaacgg ttgtcagcgt aatgtgactt 6300
cgcccatgaa cgcagacacg cagtgccgag tgcggtgata tcgcctactc gttacgtcca 6360
tggactacac aacccctcgg cttcgcttgg cttagcctcg ggctcggtgc tgttcagtta 6420
aaacacaatc aaataacatt tctacttttt agaaggcagg ccgtcaggag caactccgac 6480
tccattgacg tttctaaaca tctgaatgcc ttccttacct tcaacaaact ggcaggttcg 6540
ggcgacagtg taaagagact tgatgaagtt ggtgtcgtcg tgtcggtagt gcttgcccat 6600
gaccttcttg atcttctcag tggcgattcg ggcgttgtag aagggaattc cgtcgtcgcc 6660
tgagtcgacg agtatctgtc tgactcgtca ttgccgcctt tggagtacga ctccaactat 6720
gagtgtgctt ggatcacttt gacgatacat tcttcgttgg aggctgtggg tctgacagct 6780
gcgttttcgg cgcggttggc cgacaacaat atcagctgca acgtcattgc tggctttcat 6840
catgatcaca tttttgtcgg caaaggcgac gcccagagag ccattgacgt tctttctaat 6900
ttggaccgat agccgtatag tccagtctat ctataagttc aactaactcg taactattac 6960
cataacatat acttcactgc cccagataag gttccgataa aaagttctgc agactaaatt 7020
tatttcagtc tcctcttcac caccaaaatg ccctcctacg aagctcgagc taacgtccac 7080
aagtccgcct ttgccgctcg agtgctcaag ctcgtggcag ccaagaaaac caacctgtgt 7140
gcttctctgg atgttaccac caccaaggag ctcattgagc ttgccgataa ggtcggacct 7200
tatgtgtgca tgatcaaaac ccatatcgac atcattgacg acttcaccta cgccggcact 7260
gtgctccccc tcaaggaact tgctcttaag cacggtttct tcctgttcga ggacagaaag 7320
ttcgcagata ttggcaacac tgtcaagcac cagtaccggt gtcaccgaat cgccgagtgg 7380
tccgatatca ccaacgccca cggtgtaccc ggaaccggaa tcattgctgg cctgcgagct 7440
ggtgccgagg aaactgtctc tgaacagaag aaggaggacg tctctgacta cgagaactcc 7500
cagtacaagg agttcctagt cccctctccc aacgagaagc tggccagagg tctgctcatg 7560
ctggccgagc tgtcttgcaa gggctctctg gccactggcg agtactccaa gcagaccatt 7620
gagcttgccc gatccgaccc cgagtttgtg gttggcttca ttgcccagaa ccgacctaag 7680
ggcgactctg aggactggct tattctgacc cccggggtgg gtcttgacga caagggagac 7740
gctctcggac agcagtaccg aactgttgag gatgtcatgt ctaccggaac ggatatcata 7800
attgtcggcc gaggtctgta cggccagaac cgagatccta ttgaggaggc caagcgatac 7860
cagaaggctg gctgggaggc ttaccagaag attaactgtt agaggttaga ctatggatat 7920
gtaatttaac tgtgtatata gagagcgtgc aagtatggag cgcttgttca gcttgtatga 7980
tggtcagacg acctgtctga tcgagtatgt atgatactgc acaacctgtg tatccgcatg 8040
atctgtccaa tggggcatgt tgttgtgttt ctcgatacgg agatgctggg tacagtgcta 8100
atacgttgaa ctacttatac ttatatgagg ctcgaagaaa gctgacttgt gtatgactta 8160
attaatttga atcgaatcga tgagcctaaa atgaacccga gtatatctca taaaattctc 8220
ggtgagaggt ctgtgactgt cagtacaagg tgccttcatt atgccctcaa ccttaccata 8280
cctcactgaa tgtagtgtac ctctaaaaat gaaatacagt gccaaaagcc aaggcactga 8340
gctcgtctaa cggacttgat atacaaccaa ttaaaacaaa tgaaaagaaa tacagttctt 8400
tgtatcattt gtaacaatta ccctgtacaa actaaggtat tgaaatccca caatattccc 8460
aaagtccacc cctttccaaa ttgtcatgcc tacaactcat ataccaagca ctaacctacc 8520
gtttaaacag tgtacgcaga tcccgtcaac agttttatat atcgtagtta caaccatcaa 8580
cactttttgg taagtgtacc attctatact ccaactggtc tgcaactgta caagtagaca 8640
tgttaatggt agttaataac atctacagca gaacctatgg taaagacatt gcatttttac 8700
aggaagtatc gtcctacacg ttgataaatc caaagatgcg gaacttcttc cacttttatc 8760
atcatcccct actcgtacac tcgtactctt tgttcgatcg cgattcattt ctataaataa 8820
tcttgtatgt acatgcggcc gcttactgga gctttctggc cttctccttg gcagcgtcag 8880
ccttggcctg cttggcgagc ttggcgttct ttcggtaaaa gttgtagaag agaccgagca 8940
tggtccacat gtagaaccag agcagagcgg tgatgaagaa ggggtatcca ggtcggccaa 9000
ggaccttcat ggcgtacatg tcccaggaag actggacaga catcatgcag aactgggtca 9060
tctgggatcg agtgatgtag aacttgatga acgacacctg cttgaagccc agggcagaca 9120
gaaagtagta gccgtacatg atgacgtgga tgaaggagtt cagggcagca gagaagtagg 9180
cttcaccgtt gggagcaacg aaggtgacca gccaccagat ggtgaagatg gaagagtggt 9240
ggtacacgtg cagaaaggaa atctgtcggt tgttcttctt gaggaccatg atcatggtgt 9300
cgacaaactc catgatcttg gagaagtaga agagccagat catcttagcc atagggagac 9360
ccttgaaggt gtgatcggca gcgttctcaa acagtccata gttggcctga taagcctcgt 9420
acaggatgcc accgcacatg taggcggaga tggagaccag acagaagttg tgcaggaggg 9480
agaaggtctt gacctcgaat cgttcaaagt tcttcatgat ctgcataccc acaaacacgg 9540
tgaccaggta ggcgagcacg atcaggagca cgtggaaggg gttcatcaga ggcagctctc 9600
gagccagggg agactccacg gcaaccagga agcctcgagt gtgatggaca atggtgggaa 9660
tgtacttctc ggcctgggca accagggcag cctccagggg atcgacgtag ggagcagctc 9720
ggacaccgat agcgctggcg aggtccatga acaggtcctg aggcatcttg gagggcagga 9780
agggagcaat ggactccatg gttagcgtgt cgtgtttttg ttgtgctgga agaaccaaag 9840
ggtggcgcaa tgtgtgtaga tatatatgtc gtgacccaca agtcacacaa acaagtatcg 9900
ggaggagtgg tgcacctcta tgcggagaaa ccttataccg ctgtagacca actggggcag 9960
aggtgtgagt tgaagtcagc tggaggagat gtgtgacaga agcacaagaa gtgagattgt 10020
gagatgtatg tctagggggg gaagttttgt gtcaaatata tgggaattat tatcagcacc 10080
acgaaattat acgcctcata tgacccattt aggtggatag atcatggaca ctgttgacag 10140
ctgcgaagaa aaagcgtatt ggggatgatc cgaaattagt ccggtaccga ggcgcaaata 10200
cgtaagacag ccgatwaaat atatgcgaga aacaccaaag agactctaga tgtttgtttg 10260
gcacagtttt gacttctgcg aaggccttac accaccttgt tgacccttgt cgcgggtcgg 10320
gcaatatcgg ctgacagagt tttacttgct caataagata cgagctgcat agagttgaac 10380
tacaggacaa tattggggct ggccacatga agggcattgt ttggaggtgt attgatggtg 10440
aaaacacgat atgaaatgac aacgccccct gttttattat tattcttatt attttgggtg 10500
cttctctatc catacaagca cctcctaaca tgcttcataa gtgacctcct catcacaagg 10560
cctgaggtct catttatcca gtggcgccaa gctaaactaa aactggtccg agtagactaa 10620
ggcgaagaga gaaggagaga agacagtttt tttgtggccg cctgtgaaca atgaaaacga 10680
tgagggtgag atggagcaaa ccatatggac agtcagagga gtacacgctg cttacataat 10740
ggcgcaacga ccacatgtcc cacagatacg cattatgcct gtacatattc cgggggaggt 10800
atgtaccagt agttcgcctg ctaccgttag ctacattt 10838
<210> 185
<211> 6912
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZKUGPI5S
<400> 185
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgaggaaact gtctctgaac agaagaagga ggacgtctct 360
gactacgaga actcccagta caaggagttc ctagtcccct ctcccaacga gaagctggcc 420
agaggtctgc tcatgctggc cgagctgtct tgcaagggct ctctggccac tggcgagtac 480
tccaagcaga ccattgagct tgcccgatcc gaccccgagt ttgtggttgg cttcattgcc 540
cagaaccgac ctaagggcga ctctgaggac tggcttattc tgacccccgg ggtgggtctt 600
gacgacaagg gagacgctct cggacagcag taccgaactg ttgaggatgt catgtctacc 660
ggaacggata tcataattgt cggccgaggt ctgtacggcc agaaccgaga tcctattgag 720
gaggccaagc gataccagaa ggctggctgg gaggcttacc agaagattaa ctgttagagg 780
ttagactatg gatatgtaat ttaactgtgt atatagagag cgtgcaagta tggagcgctt 840
gttcagcttg tatgatggtc agacgacctg tctgatcgag tatgtatgat actgcacaac 900
ctgtgtatcc gcatgatctg tccaatgggg catgttgttg tgtttctcga tacggagatg 960
ctgggtacag tgctaatacg ttgaactact tatacttata tgaggctcga agaaagctga 1020
cttgtgtatg acttaattaa tcgagcttgg cgtaatcatg gtcatagctg tttcctgtgt 1080
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 1140
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 1200
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 1260
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 1380
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 1440
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 1500
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1560
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 1620
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 1680
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 1740
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 1800
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 1860
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 1920
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 1980
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 2040
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 2100
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 2160
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 2220
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 2280
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 2340
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 2400
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 2460
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 2520
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 2580
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 2640
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 2700
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 2760
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 2820
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 2880
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 2940
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 3000
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 3060
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 3120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 3180
ttccgcgcac atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg 3240
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 3300
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 3360
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 3420
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 3480
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 3540
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 3600
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc 3660
ttacaatttc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 3720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 3780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga 3840
ctcactatag ggcgaattgg gtaccgggcc ccccctcgag gtcgacgagt atctgtctga 3900
ctcgtcattg ccgcctttgg agtacgactc caactatgag tgtgcttgga tcactttgac 3960
gatacattct tcgttggagg ctgtgggtct gacagctgcg ttttcggcgc ggttggccga 4020
caacaatatc agctgcaacg tcattgctgg ctttcatcat gatcacattt ttgtcggcaa 4080
aggcgacgcc cagagagcca ttgacgttct ttctaatttg gaccgatagc cgtatagtcc 4140
agtctatcta taagttcaac taactcgtaa ctattaccat aacatatact tcactgcccc 4200
agataaggtt ccgataaaaa gttctgcaga ctaaatttat ttcagtctcc tcttcaccac 4260
caaaatgccc tcctacgaag ctcgagtgct caagctcgtg gcagccaaga aaaccaacct 4320
gtgtgcttct ctggatgtta ccaccaccaa ggagctcatt gagcttgccg ataaggtcgg 4380
accttatgtg tgcatgatca aaacccatat cgacatcatt gacgacttca cctacgccgg 4440
cactgtgctc cccctcaagg aacttgctct taagcacggt ttcttcctgt tcgaggacag 4500
aaagttcgca gatattggca acactgtcaa gcaccagtac cggtgtcacc gaatcgccga 4560
gtggtccgat atcaccaacg cccacggtgt acccggaacc ggaatcgatg cgtatctgtg 4620
ggacatgtgg tcgttgcgcc attatgtaag cagcgtgtac tcctctgact gtccatatgg 4680
tttgctccat ctcaccctca tcgttttcat tgttcacagg cggccacaaa aaaactgtct 4740
tctctccttc tctcttcgcc ttagtctact cggaccagtt ttagtttagc ttggcgccac 4800
tggataaatg agacctcagg ccttgtgatg aggaggtcac ttatgaagca tgttaggagg 4860
tgcttgtatg gatagagaag cacccaaaat aataagaata ataataaaac agggggcgtt 4920
gtcatttcat atcgtgtttt caccatcaat acacctccaa acaatgccct tcatgtggcc 4980
agccccaata ttgtcctgta gttcaactct atgcagctcg tatcttattg agcaagtaaa 5040
actctgtcag ccgatattgc ccgacccgcg acaagggtca acaaggtggt gtaaggcctt 5100
cgcagaagtc aaaactgtgc caaacaaaca tctagagtct ctttggtgtt tctcgcatat 5160
atttwatcgg ctgtcttacg tatttgcgcc tcggtaccgg actaatttcg gatcatcccc 5220
aatacgcttt ttcttcgcag ctgtcaacag tgtccatgat ctatccacct aaatgggtca 5280
tatgaggcgt ataatttcgt ggtgctgata ataattccca tatatttgac acaaaacttc 5340
cccccctaga catacatctc acaatctcac ttcttgtgct tctgtcacac atctcctcca 5400
gctgacttca actcacacct ctgccccagt tggtctacag cggtataagg tttctccgca 5460
tagaggtgca ccactcctcc cgatacttgt ttgtgtgact tgtgggtcac gacatatata 5520
tctacacaca ttgcgccacc ctttggttct tccagcacaa caaaaacacg acacgctaac 5580
catggtcgct ggcaagtccg gagctgcagc ccacgtgacc cactcttcca ctctccctcg 5640
agagtaccac ggtgctacca acgactcccg atctgaggct gccgatgtca ccgtctcgtc 5700
tatcgacgcc gagaaggaga tgattatcaa cggacgagtg tacgacgtct cctcgttcgt 5760
gaagcgacac cctggtggct ccgtcatcaa gttccagctc ggagcagatg cttctgacgc 5820
ttacaacaac ttccacgtcc gatcgaagaa ggctgacaag atgctgtact ctcttccctc 5880
ccgacctgcc gaggctggct atgcacagga cgacatctct agagactttg agaagctgcg 5940
actggaactg aaagaggaag gttacttcga gcccaatctg gtgcacgtgt cctaccgatg 6000
tgtcgaggtg cttgccatgt actgggctgg cgtccagctg atctggtccg gatactggtt 6060
cctcggtgcc atcgttgctg gaattgctca aggtcgatgc ggatggctcc agcatgaagg 6120
cggacactac tcgctcactg gcaacatcaa gattgaccga catctccaga tggccatcta 6180
tggactgggc tgtggtatgt ctggctgcta ctggagaaac cagcacaaca aacatcacgc 6240
cactcctcag aagctcggaa ccgatcccga cctgcagacc atgcctctcg ttgccttcca 6300
caagattgtc ggagccaagg cacgaggcaa gggtaaagcc tggcttgctt ggcaagctcc 6360
cctcttcttt ggaggcatca tttgctccct ggtctctttc ggctggcagt tcgttctcca 6420
ccccaatcat gcactgcgag tgcacaacca tctcgaactg gcctacatgg gtctccgata 6480
cgttctctgg caccttgcct ttggccatct gggactcctg tcctctcttc gactgtatgc 6540
cttctacgtg gctgtcggtg gcacctacat cttcaccaac ttcgccgtct cccatactca 6600
caaggatgtc gttcctccca ccaagcacat ttcgtgggct ctgtactctg ccaaccacac 6660
taccaactgt tccgactctc cctttgtcaa ctggtggatg gcctacctca acttccagat 6720
cgagcaccat ctgttcccct ccatgcctca gtacaaccac cccaagattg ctcctcgagt 6780
gcgagcactc ttcgagaagc acggagtcga gtacgacgtc cgaccctatc tggaatgctt 6840
tcgagtgacc tacgtcaacc tccttgctgt tggcaaccct gagcactcct accacgagca 6900
tactcactaa gc 6912
<210> 186
<211> 14864
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDMW302T16
<220>
<221> misc_feature
<222> (5341)..(5341)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (5346)..(5349)
<223> n is a, c, g, or t
<400> 186
gtacgatagt tagtagacaa caatcagaac atctccctcc ttatataatc acacaggcca 60
gaacgcgcta aactaaagcg ctttggacac tatgttacat tggcattgat tgaactgaaa 120
ccacagtctc cctcgcctga atcgagcaat ggatgttgtc ggaagtcaac ttcactagaa 180
gagcggttct atgccttgtc aagatcatat cataaactca ctctgtatta ccccatctat 240
agaacacttg ttatgaatgg gcggaaacat tccgctatat gcacctttcc acactaatgc 300
aaagatgtgc atcttcaacg ggtagtaaga ctggttccga cttccgttgc atggagagca 360
atgacctcga taatgcgaac atcccccaca tatacactct tacacaggcc aatataatct 420
gtgcatttac taaatattta agtctatgca cctgcttgat gaaaagcggc acggatggta 480
tcatctagtt tccgccaatc caagaaccaa ctgtgttggc agtggtgtag cccatggcac 540
acagaccaaa gatgaaaata cagacatcgg cggttcgagc cgtggtgcct cgagcaacac 600
ccttgtaatg caaaagagga gggtaaatgt acaccagagg cacacatgca aacgatccgg 660
tgagagcgac gaaccgatcg agatcgtcgg cacctcccca tgcaacaaag gcggtgacaa 720
acacaaggaa gaaccggaaa atgttcttct gccacttgat ggtagagttg tacttgcctg 780
atcgggtgaa gagaccattc tcgatgattc ggatggcgcg ccagctgcat taatgaatcg 840
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 900
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 960
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 1020
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 1080
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 1140
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 1200
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 1260
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 1320
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 1380
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 1440
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 1500
gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 1560
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 1620
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 1680
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 1740
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 1800
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 1860
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 1920
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 1980
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 2040
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 2100
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 2160
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 2220
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 2280
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 2340
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 2400
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 2460
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 2520
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 2580
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 2640
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 2700
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 2760
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gatgcggtgt 2820
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta agcgttaata 2880
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 2940
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 3000
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 3060
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 3120
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 3180
ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 3240
gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 3300
cgccgctaca gggcgcgtcc attcgccatt caggctgcgc aactgttggg aagggcgatc 3360
ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt 3420
aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt 3480
gtaatacgac tcactatagg gcgaattggg cccgacgtcg catgcttaga agtgaggatt 3540
acaagaagcc tctggatatc aatgatgaac gtactcagcg gctggtcaag catttcgacc 3600
gtcgaatcga cgaggtgttc acctttgaca agcgagggtt cccaattgat cacgttctcg 3660
agttgttcaa atcttctctc aacatctctc tgcatgaact atctctgttg acgaacgtgt 3720
cacccactgt tcctcgaacg cccttctccg agtttggtct gaacatcttc gatctcaaac 3780
tgacccccgc agtgatcaat agtgccatgc cactgccgat gcggtgcgaa catccctgga 3840
gggattctcg gagctctaca caatgcagat tctgtcgtcg agtactctct accttgctcg 3900
aatgacttat tgtgctacta ctgcactcat gcttcgatca tgtgccctac tgcaccccaa 3960
atttggtgat ctgattgaga cagagtaccc tcttcagctg attcagaaga tcatcagcaa 4020
catgaatgat gtggttgacc aggcaggctg ttgtagtcac gtccttcact tcaagttcat 4080
tcttcatctg cttctgtttt actttgacag gcaaatgaag acatggtacg acttgatgga 4140
ggccaagaac gccatttcac cccgagacac cgaagtgcct gaaatcctgg ctgcccccat 4200
tgataacatc ggaaactacg gtattccgga aagtgtatat agaacctttc cccagcttgt 4260
gtctgtggat atggatggtg taatcccctt aattaaaagg cgttgaaaca gaatgagcca 4320
gacagcaagg acaaggtggc caacagcaag gagtccaaaa agccctctat tgacgagatc 4380
cacgatgtta ttgctcatga ggtttccgag ctcgatgctg ggaagaagaa gtgatttgta 4440
tataagaaat aaatgagata tagtaaagga gtgcaagaga atggcaaggt ggtcaaattc 4500
tatattactt gcagtcactg gttcctcgtt gacatgaatg aagttaccgt tggcatagct 4560
gatttaatat ataactgtcc aactaactct cacctagata taacccatgt gtgtgtttcc 4620
aatcatcaat gcggccgcgc ctacttaagc aacgggcttg ataacagcgg ggggggtgcc 4680
cacgttgttg cggttgcgga agaacagaac acccttacca gcaccctcgg caccagcgct 4740
gggctcaacc cactggcaca tacgcgcact gcggtacatg gcgcggatga agccacgagg 4800
accatcctgg acatcagccc ggtagtgctt gcccatgatg ggcttaatgg cctcggtggc 4860
ctcgtccgcg ttgtagaagg ggatgctgct gacgtagtgg tggaggacat gagtctcgat 4920
gatgccgtgg agaaggtggc ggccgatgaa gcccatctca cggtcaatgg tagcagcggc 4980
accacggacg aagttccact cgtcgttggt gtagtgggga agggtagggt cggtgtgctg 5040
gaggaaggtg atggcaacga gccagtggtt aacccagagg tagggaacaa agtaccagat 5100
ggccatgttg tagaaaccga acttctgaac gaggaagtac agagcagtgg ccatcagacc 5160
gataccaata tcgctgagga cgatgagctt agcgtcactg ttctcgtaca gagggctgcg 5220
gggatcgaag tggttaacac caccgccgag gccgttatgc ttgcccttgc cgcgaccctc 5280
acgctggcgc tcgtggtagt tgtggccggt aacattggtg atgaggtagt tgggccagcc 5340
nacgannnnc tcagtaagat gagcgagctc gtgggtcatc tttccgagac gagtagcctg 5400
ctgctcgcgg gttcggggaa cgaagaccat gtcacgctcc atgttgccag tggccttgtg 5460
gtgctttcgg tgggagattt gccagctgaa gtaggggaca aggagggaag agtgaagaac 5520
ccagccagta atgtcgttga tgatgcgaga atcggagaaa gcaccgtgac cgcactcatg 5580
ggcaataacc cagagaccag taccgaaaag accctgaaga acggtgtaca cggcccacag 5640
accagcgcgg gcgggggtgg aggggatata ttcgggggtc acaaagttgt accagatgct 5700
gaaagtggta gtcaggagga caatgtcgcg gaggatataa ccgtatccct tgagagcgga 5760
gcgcttgaag cagtgcttag ggatggcatt gtagatgtcc ttgatggtaa agtcgggaac 5820
ctcgaactgg ttgccgtagg tgtcgagcat gacaccatac tcggacttgg gcttggcgat 5880
atcaacctcg gacatggacg agagcgatgt ggaagaggcc gagtggcggg gagagtctga 5940
aggagagacg gcggcagact cagaatccgt cacagtagtt gaggtgacgg tgcgtctaag 6000
cgcagggttc tgcttgggca gagccgaagt ggacgccatg gtgaatgatt cttatactca 6060
gaaggaaatg cttaacgatt tcgggtgtga gttgacaagg agagagagaa aagaagagga 6120
aaggtaattc ggggacggtg gtcttttata cccttggcta aagtcccaac cacaaagcaa 6180
aaaaattttc agtagtctat tttgcgtccg gcatgggtta cccggatggc cagacaaaga 6240
aactagtaca aagtctgaac aagcgtagat tccagactgc agtaccctac gcccttaacg 6300
gcaagtgtgg gaaccggggg aggtttgata tgtggggtga agggggctct cgccggggtt 6360
gggcccgcta ctgggtcaat ttggggtcaa ttggggcaat tggggctgtt ttttgggaca 6420
caaatacgcc gccaacccgg tctctcctga attctctctc ttgagctttt ccataacaag 6480
ttcttctgcc tccaggaagt ccatgggtgg tttgatcatg gttttggtgt agtggtagtg 6540
cagtggtggt attgtgactg gggatgtagt tgagaataag tcatacacaa gtcagctttc 6600
ttcgagcctc atataagtat aagtagttca acgtattagc actgtaccca gcatctccgt 6660
atcgagaaac acaacaacat gccccattgg acagatcatg cggatacaca ggttgtgcag 6720
tatcatacat actcgatcag acaggtcgtc tgaccatcat acaagctgaa caagcgctcc 6780
atacttgcac gctctctata tacacagtta aattacatat ccatagtcta acctctaaca 6840
gttaatcttc tggtaagcct cccagccagc cttctggtat cgcttggcct cctcaatagg 6900
atctcggttc tggccgtaca gacctcggcc gacaattatg atatccgttc cggtagacat 6960
gacatcctca acagttcggt actgctgtcc gagagcgtct cccttgtcgt caagacccac 7020
cccgggggtc agaataagcc agtcctcaga gtcgccctta ggtcggttct gggcaatgaa 7080
gccaaccaca aactcggggt cggatcgggc aagctcaatg gtctgcttgg agtactcgcc 7140
agtggccaga gagcccttgc aagacagctc ggccagcatg agcagacctc tggccagctt 7200
ctcgttggga gaggggacta ggaactcctt gtactgggag ttctcgtagt cagagacgtc 7260
ctccttcttc tgttcagaga cagtttcctc ggcaccagct cgcaggccag caatgattcc 7320
ggttccgggt acaccgtggg cgttggtgat atcggaccac tcggcgattc ggtgacaccg 7380
gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt ctgtcctcga acaggaagaa 7440
accgtgctta agagcaagtt ccttgagggg gagcacagtg ccggcgtagg tgaagtcgtc 7500
aatgatgtcg atatgggttt tgatcatgca cacataaggt ccgaccttat cggcaagctc 7560
aatgagctcc ttggtggtgg taacatccag agaagcacac aggttggttt tcttggctgc 7620
cacgagcttg agcactcgag cggcaaaggc ggacttgtgg acgttagctc gagcttcgta 7680
ggagggcatt ttggtggtga agaggagact gaaataaatt tagtctgcag aactttttat 7740
cggaacctta tctggggcag tgaagtatat gttatggtaa tagttacgag ttagttgaac 7800
ttatagatag actggactat acggctatcg gtccaaatta gaaagaacgt caatggctct 7860
ctgggcgtcg cctttgccga caaaaatgtg atcatgatga aagccagcaa tgacgttgca 7920
gctgatattg ttgtcggcca accgcgccga aaacgcagct gtcagaccca cagcctccaa 7980
cgaagaatgt atcgtcaaag tgatccaagc acactcatag ttggagtcgt actccaaagg 8040
cggcaatgac gagtcagaca gatactcgtc gactcatcga tcgaggaaga ggacaagcgg 8100
ctgcttctta agtttgtgac atcagtatcc aaggcaccat tgcaaggatt caaggctttg 8160
aacccgtcat ttgccattcg taacgctggt agacaggttg atcggttccc tacggcctcc 8220
acctgtgtca atcttctcaa gctgcctgac tatcaggaca ttgatcaact tcggaagaaa 8280
cttttgtatg ccattcgatc acatgctggt ttcgatttgt cttagaggaa cgcatataca 8340
gtaatcatag agaataaacg atattcattt attaaagtag atagttgagg tagaagttgt 8400
aaagagtgat aaatagcggc cgcttactgg agctttctgg ccttctcctt ggcagcgtca 8460
gccttggcct gcttggcgag cttggcgttc tttcggtaaa agttgtagaa gagaccgagc 8520
atggtccaca tgtagaacca gagcagagcg gtgatgaaga aggggtatcc aggtcggcca 8580
aggaccttca tggcgtacat gtcccaggaa gactggacag acatcatgca gaactgggtc 8640
atctgggatc gagtgatgta gaacttgatg aacgacacct gcttgaagcc cagggcagac 8700
agaaagtagt agccgtacat gatgacgtgg atgaaggagt tcagggcagc agagaagtag 8760
gcttcaccgt tgggagcaac gaaggtgacc agccaccaga tggtgaagat ggaagagtgg 8820
tggtacacgt gcagaaagga aatctgtcgg ttgttcttct tgaggaccat gatcatggtg 8880
tcgacaaact ccatgatctt ggagaagtag aagagccaga tcatcttagc catagggaga 8940
cccttgaagg tgtgatcggc agcgttctca aacagtccat agttggcctg ataagcctcg 9000
tacaggatgc caccgcacat gtaggcggag atggagacca gacagaagtt gtgcaggagg 9060
gagaaggtct tgacctcgaa tcgttcaaag ttcttcatga tctgcatacc cacaaacacg 9120
gtgaccaggt aggcgagcac gatcaggagc acgtggaagg ggttcatcag aggcagctct 9180
cgagccaggg gagactccac ggcaaccagg aagcctcgag tgtgatggac aatggtggga 9240
atgtacttct cggcctgggc aaccagggca gcctccaggg gatcgacgta gggagcagct 9300
cggacaccga tagcgctggc gaggtccatg aacaggtcct gaggcatctt ggagggcagg 9360
aagggagcaa tggactccat gggcaggacc tgtgttagta cattgtcggg gagtcatcaa 9420
ttggttcgac aggttgtcga ctgttagtat gagctcaatt gggctctggt gggtcgatga 9480
cacttgtcat ctgtttctgt tgggtcatgt ttccatcacc ttctatggta ctcacaattc 9540
gtccgattcg cccgaatccg ttaataccga ctttgatggc catgttgatg tgtgtttaat 9600
tcaagaatga atatagagaa gagaagaaga aaaaagattc aattgagccg gcgatgcaga 9660
cccttatata aatgttgcct tggacagacg gagcaagccc gcccaaacct acgttcggta 9720
taatatgtta agctttttaa cacaaaggtt tggcttgggg taacctgatg tggtgcaaaa 9780
gaccgggcgt tggcgagcca ttgcgcgggc gaatggggcc gtgactcgtc tcaaattcga 9840
gggcgtgcct caattcgtgc ccccgtggct ttttcccgcc gtttccgccc cgtttgcacc 9900
actgcagccg cttctttggt tcggacacct tgctgcgagc taggtgcctt gtgctactta 9960
aaaagtggcc tcccaacacc aacatgacat gagtgcgtgg gccaagacac gttggcgggg 10020
tcgcagtcgg ctcaatggcc cggaaaaaac gctgctggag ctggttcgga cgcagtccgc 10080
cgcggcgtat ggatatccgc aaggttccat agcgccattg ccctccgtcg gcgtctatcc 10140
cgcaacctct aaatagagcg ggaatataac ccaagcttct tttttttcct ttaacacgca 10200
cacccccaac tatcatgttg ctgctgctgt ttgactctac tctgtggagg ggtgctccca 10260
cccaacccaa cctacaggtg gatccggcgc tgtgattggc tgataagtct cctatccgga 10320
ctaattctga ccaatgggac atgcgcgcag gacccaaatg ccgcaattac gtaaccccaa 10380
cgaaatgcct acccctcttt ggagcccagc ggccccaaat ccccccaagc agcccggttc 10440
taccggcttc catctccaag cacaagcagc ccggttctac cggcttccat ctccaagcac 10500
ccctttctcc acaccccaca aaaagacccg tgcaggacat cctactgcgt gtttaaacac 10560
cactaaaacc ccacaaaata tatcttaccg aatatacaga tctactatag aggaacaatt 10620
gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac agctgacttt 10680
ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct ccacgtcggt 10740
tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg gatggggggt 10800
agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact gccattaaga 10860
ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact acctcggaac 10920
tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac caaatgtccc 10980
accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac aaaaagtgag 11040
ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg cgaaagcgcg 11100
tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat gttagtgtac 11160
ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt tttgccttcc 11220
gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca accttaatac 11280
tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata tataaacagt 11340
ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga ttcgaaatct 11400
aaactacaca tcacacaatg cctgttactg acgtccttaa gcgaaagtcc ggtgtcatcg 11460
tcggcgacga tgtccgagcc gtgagtatcc acgacaagat cagtgtcgag acgacgcgtt 11520
ttgtgtaatg acacaatccg aaagtcgcta gcaacacaca ctctctacac aaactaaccc 11580
agctctccat ggctgccgct ccctctgtgc gaacctttac ccgagccgag gttctgaacg 11640
ctgaggctct gaacgagggc aagaaggacg ctgaggctcc cttcctgatg atcatcgaca 11700
acaaggtgta cgacgtccga gagttcgtcc ctgaccatcc tggaggctcc gtgattctca 11760
cccacgttgg caaggacggc accgacgtct ttgacacctt tcatcccgag gctgcttggg 11820
agactctcgc caacttctac gttggagaca ttgacgagtc cgaccgagac atcaagaacg 11880
atgactttgc cgctgaggtc cgaaagctgc gaaccctgtt ccagtctctc ggctactacg 11940
actcctctaa ggcctactac gccttcaagg tctccttcaa cctctgcatc tggggactgt 12000
ccaccgtcat tgtggccaag tggggtcaga cctccaccct cgccaacgtg ctctctgctg 12060
ccctgctcgg cctgttctgg cagcagtgcg gatggctggc tcacgacttt ctgcaccacc 12120
aggtcttcca ggaccgattc tggggtgatc tcttcggagc cttcctggga ggtgtctgcc 12180
agggcttctc ctcttcctgg tggaaggaca agcacaacac tcaccatgcc gctcccaacg 12240
tgcatggcga ggatcctgac attgacaccc accctctcct gacctggtcc gagcacgctc 12300
tggagatgtt ctccgacgtc cccgatgagg agctgacccg aatgtggtct cgattcatgg 12360
tcctgaacca gacctggttc tacttcccca ttctctcctt cgctcgactg tcttggtgcc 12420
tccagtccat tctctttgtg ctgcccaacg gtcaggctca caagccctcc ggagctcgag 12480
tgcccatctc cctggtcgag cagctgtccc tcgccatgca ctggacctgg tacctcgcta 12540
ccatgttcct gttcatcaag gatcctgtca acatgctcgt gtacttcctg gtgtctcagg 12600
ctgtgtgcgg aaacctgctc gccatcgtgt tctccctcaa ccacaacggt atgcctgtga 12660
tctccaagga ggaggctgtc gacatggatt tctttaccaa gcagatcatc actggtcgag 12720
atgtccatcc tggactgttc gccaactggt tcaccggtgg cctgaactac cagatcgagc 12780
atcacctgtt cccttccatg cctcgacaca acttctccaa gatccagcct gccgtcgaga 12840
ccctgtgcaa gaagtacaac gtccgatacc acaccactgg tatgatcgag ggaactgccg 12900
aggtcttctc ccgactgaac gaggtctcca aggccacctc caagatgggc aaggctcagt 12960
aagcggccgc atgagaagat aaatatataa atacattgag atattaaatg cgctagatta 13020
gagagcctca tactgctcgg agagaagcca agacgagtac tcaaagggga ttacaccatc 13080
catatccaca gacacaagct ggggaaaggt tctatataca ctttccggaa taccgtagtt 13140
tccgatgtta tcaatggggg cagccaggat ttcaggcact tcggtgtctc ggggtgaaat 13200
ggcgttcttg gcctccatca agtcgtacca tgtcttcatt tgcctgtcaa agtaaaacag 13260
aagcagatga agaatgaact tgaagtgaag gaatttaaac gacggaattc ctgcagccca 13320
tctgcagaat tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa aacagcccca 13380
attgccccaa ttgaccccaa attgacccag tagcgggccc aaccccggcg agagccccct 13440
tcaccccaca tatcaaacct cccccggttc ccacacttgc cgttaagggc gtagggtact 13500
gcagtctgga atctacgctt gttcagactt tgtactagtt tctttgtctg gccatccggg 13560
taacccatgc cggacgcaaa atagactact gaaaattttt ttgctttgtg gttgggactt 13620
tagccaaggg tataaaagac caccgtcccc gaattacctt tcctcttctt ttctctctct 13680
ccttgtcaac tcacacccga aatcgttaag catttccttc tgagtataag aatcattcac 13740
catggacatg tccgtcctga ctctccaaga gtacgagttc gagaagcagt tcaacgagaa 13800
tgaagccatc caatggatgc aggaaaactg gaagaaatcc ttcctgtttt ctgccctcta 13860
cgctgccttt atctttggtg gacgacatct gatgaacaag cgagccaagt ttgagctgcg 13920
aaaacctctc gtgctctggt ccctgaccct cgctgtcttc tctatcttcg gtgctctgcg 13980
aactggagcc tacatgctct acatcctgat gaccaaaggc ctgaaacagt ctgtttgtga 14040
ccagtccttt tacaacggac ccgtctcgaa attctgggct tacgcctttg tgctctccaa 14100
agctcccgaa cttggcgata ccatcttcat cattctgcga aagcagaaac tcatcttcct 14160
gcactggtat caccacatca ccgtcctcct gtactcttgg tactcctaca aggacatggt 14220
ggctggaggt ggctggttca tgactatgaa ctacggtgtc cacgccgtga tgtactccta 14280
ctacgccctc cgagctgccg gtttccgagt ctctcgaaag tttgccatgt tcatcaccct 14340
gtcgcagatc actcagatgc tcatgggctg tgtcattaac tacctggtct tcaactggat 14400
gcagcatgac aatgaccagt gctactccca ctttcagaac atcttctggt cctctctcat 14460
gtacctctcc taccttctgc tcttctgcca tttcttcttt gaggcctaca ttggcaaagt 14520
gaagaaagcc accaaggctg agtaagcggc cgcaagtgtg gatggggaag tgagtgcccg 14580
gttctgtgtg cacaattggc aatccaagat ggatggattc aacacaggga tatagcgagc 14640
tacgtggtgg tgcgaggata tagcaacgga tatttatgtt tgacacttga gaatgtacga 14700
tacaagcact gtccaagtac aatactaaac atactgtaca tactcatact cgtacccggg 14760
caacggtttc acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg 14820
tatcatagtc tttgatgtat atcgtattca ttcatgttag ttgc 14864
<210> 187
<211> 6540
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZKUGPE1S
<400> 187
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgaggaaact gtctctgaac agaagaagga ggacgtctct 360
gactacgaga actcccagta caaggagttc ctagtcccct ctcccaacga gaagctggcc 420
agaggtctgc tcatgctggc cgagctgtct tgcaagggct ctctggccac tggcgagtac 480
tccaagcaga ccattgagct tgcccgatcc gaccccgagt ttgtggttgg cttcattgcc 540
cagaaccgac ctaagggcga ctctgaggac tggcttattc tgacccccgg ggtgggtctt 600
gacgacaagg gagacgctct cggacagcag taccgaactg ttgaggatgt catgtctacc 660
ggaacggata tcataattgt cggccgaggt ctgtacggcc agaaccgaga tcctattgag 720
gaggccaagc gataccagaa ggctggctgg gaggcttacc agaagattaa ctgttagagg 780
ttagactatg gatatgtaat ttaactgtgt atatagagag cgtgcaagta tggagcgctt 840
gttcagcttg tatgatggtc agacgacctg tctgatcgag tatgtatgat actgcacaac 900
ctgtgtatcc gcatgatctg tccaatgggg catgttgttg tgtttctcga tacggagatg 960
ctgggtacag tgctaatacg ttgaactact tatacttata tgaggctcga agaaagctga 1020
cttgtgtatg acttaattaa tcgagcttgg cgtaatcatg gtcatagctg tttcctgtgt 1080
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 1140
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 1200
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 1260
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 1380
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 1440
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 1500
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1560
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 1620
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 1680
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 1740
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 1800
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 1860
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 1920
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 1980
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 2040
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 2100
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 2160
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 2220
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 2280
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 2340
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 2400
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 2460
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 2520
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 2580
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 2640
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 2700
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 2760
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 2820
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 2880
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 2940
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 3000
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 3060
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 3120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 3180
ttccgcgcac atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg 3240
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 3300
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 3360
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 3420
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 3480
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 3540
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 3600
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc 3660
ttacaatttc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 3720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 3780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga 3840
ctcactatag ggcgaattgg gtaccgggcc ccccctcgag gtcgacgagt atctgtctga 3900
ctcgtcattg ccgcctttgg agtacgactc caactatgag tgtgcttgga tcactttgac 3960
gatacattct tcgttggagg ctgtgggtct gacagctgcg ttttcggcgc ggttggccga 4020
caacaatatc agctgcaacg tcattgctgg ctttcatcat gatcacattt ttgtcggcaa 4080
aggcgacgcc cagagagcca ttgacgttct ttctaatttg gaccgatagc cgtatagtcc 4140
agtctatcta taagttcaac taactcgtaa ctattaccat aacatatact tcactgcccc 4200
agataaggtt ccgataaaaa gttctgcaga ctaaatttat ttcagtctcc tcttcaccac 4260
caaaatgccc tcctacgaag ctcgagtgct caagctcgtg gcagccaaga aaaccaacct 4320
gtgtgcttct ctggatgtta ccaccaccaa ggagctcatt gagcttgccg ataaggtcgg 4380
accttatgtg tgcatgatca aaacccatat cgacatcatt gacgacttca cctacgccgg 4440
cactgtgctc cccctcaagg aacttgctct taagcacggt ttcttcctgt tcgaggacag 4500
aaagttcgca gatattggca acactgtcaa gcaccagtac cggtgtcacc gaatcgccga 4560
gtggtccgat atcaccaacg cccacggtgt acccggaacc ggaatcgatg cgtatctgtg 4620
ggacatgtgg tcgttgcgcc attatgtaag cagcgtgtac tcctctgact gtccatatgg 4680
tttgctccat ctcaccctca tcgttttcat tgttcacagg cggccacaaa aaaactgtct 4740
tctctccttc tctcttcgcc ttagtctact cggaccagtt ttagtttagc ttggcgccac 4800
tggataaatg agacctcagg ccttgtgatg aggaggtcac ttatgaagca tgttaggagg 4860
tgcttgtatg gatagagaag cacccaaaat aataagaata ataataaaac agggggcgtt 4920
gtcatttcat atcgtgtttt caccatcaat acacctccaa acaatgccct tcatgtggcc 4980
agccccaata ttgtcctgta gttcaactct atgcagctcg tatcttattg agcaagtaaa 5040
actctgtcag ccgatattgc ccgacccgcg acaagggtca acaaggtggt gtaaggcctt 5100
cgcagaagtc aaaactgtgc caaacaaaca tctagagtct ctttggtgtt tctcgcatat 5160
atttwatcgg ctgtcttacg tatttgcgcc tcggtaccgg actaatttcg gatcatcccc 5220
aatacgcttt ttcttcgcag ctgtcaacag tgtccatgat ctatccacct aaatgggtca 5280
tatgaggcgt ataatttcgt ggtgctgata ataattccca tatatttgac acaaaacttc 5340
cccccctaga catacatctc acaatctcac ttcttgtgct tctgtcacac atctcctcca 5400
gctgacttca actcacacct ctgccccagt tggtctacag cggtataagg tttctccgca 5460
tagaggtgca ccactcctcc cgatacttgt ttgtgtgact tgtgggtcac gacatatata 5520
tctacacaca ttgcgccacc ctttggttct tccagcacaa caaaaacacg acacgctaac 5580
catggagtcc attgctccct tcctgccctc caagatgcct caggacctgt tcatggacct 5640
cgccagcgct atcggtgtcc gagctgctcc ctacgtcgat cccctggagg ctgccctggt 5700
tgcccaggcc gagaagtaca ttcccaccat tgtccatcac actcgaggct tcctggttgc 5760
cgtggagtct cccctggctc gagagctgcc tctgatgaac cccttccacg tgctcctgat 5820
cgtgctcgcc tacctggtca ccgtgtttgt gggtatgcag atcatgaaga actttgaacg 5880
attcgaggtc aagaccttct ccctcctgca caacttctgt ctggtctcca tctccgccta 5940
catgtgcggt ggcatcctgt acgaggctta tcaggccaac tatggactgt ttgagaacgc 6000
tgccgatcac accttcaagg gtctccctat ggctaagatg atctggctct tctacttctc 6060
caagatcatg gagtttgtcg acaccatgat catggtcctc aagaagaaca accgacagat 6120
ttcctttctg cacgtgtacc accactcttc catcttcacc atctggtggc tggtcacctt 6180
cgttgctccc aacggtgaag cctacttctc tgctgccctg aactccttca tccacgtcat 6240
catgtacggc tactactttc tgtctgccct gggcttcaag caggtgtcgt tcatcaagtt 6300
ctacatcact cgatcccaga tgacccagtt ctgcatgatg tctgtccagt cttcctggga 6360
catgtacgcc atgaaggtcc ttggccgacc tggatacccc ttcttcatca ccgctctgct 6420
ctggttctac atgtggacca tgctcggtct cttctacaac ttttaccgaa agaacgccaa 6480
gctcgccaag caggccaagg ctgacgctgc caaggagaag gccagaaagc tccagtaagc 6540
<210> 188
<211> 13321
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pKO2UM26E
<400> 188
tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 60
atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 120
tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 180
cacatttccc cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga 240
gaaaataccg catcaggaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt 300
ttgttaaatc agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc 360
aaaagaatag accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt 420
aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact 480
acgtgaacca tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg 540
gaaccctaaa gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag 600
aaaggaaggg aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac 660
gctgcgcgta accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtccattcg 720
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 780
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 840
cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa 900
ttgggcccga cgtcgcatgc ttgaatctac aagtaggagg gttggagtga ttaagtgaaa 960
cttctttaac ggctctatgc cagttctatt gatatccgaa acatcagtat gaaggtctga 1020
taagggtgac ttcttcccac agattcgtat cagtacgagt acgagaccgg tacttgtaac 1080
agtattgata ctaaagggaa actacaacgg ttgtcagcgt aatgtgactt cgcccatgaa 1140
cgcagacacg cagtgccgag tgcggtgata tcgcctactc gttacgtcca tggactacac 1200
aacccctcgg cttcgcttgg cttagcctcg ggctcggtgc tgttcagtta aaacacaatc 1260
aaataacatt tctacttttt agaaggcagg ccgtcaggag caactccgac tccattgacg 1320
tttctaaaca tctgaatgcc ttccttacct tcaacaaact ggcaggttcg ggcgacagtg 1380
taaagagact tgatgaagtt ggtgtcgtcg tgtcggtagt gcttgcccat gaccttcttg 1440
atcttctcag tggcgattcg ggcgttgtag aagggaattc aggagagacc gggttggcgg 1500
cgtatttgtg tcccaaaaaa cagccccaat tgccccggag aagacggcca ggccgcctag 1560
atgacaaatt caacaactca cagctgactt tctgccattg ccactagggg ggggcctttt 1620
tatatggcca agccaagctc tccacgtcgg ttgggctgca cccaacaata aatgggtagg 1680
gttgcaccaa caaagggatg ggatgggggg tagaagatac gaggataacg gggctcaatg 1740
gcacaaataa gaacgaatac tgccattaag actcgtgatc cagcgactga caccattgca 1800
tcatctaagg gcctcaaaac tacctcggaa ctgctgcgct gatctggaca ccacagaggt 1860
tccgagcact ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca 1920
gcgtgtacag tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac 1980
ttgttatagc ctttagagct gcgaaagcgc gtatggattt ggctcatcag gccagattga 2040
gggtctgtgg acacatgtca tgttagtgta cttcaatcgc cccctggata tagccccgac 2100
aataggccgt ggcctcattt ttttgccttc cgcacatttc cattgctcgg tacccacacc 2160
ttgcttctcc tgcacttgcc aaccttaata ctggtttaca ttgaccaaca tcttacaagc 2220
ggggggcttg tctagggtat atataaacag tggctctccc aatcggttgc cagtctcttt 2280
tttcctttct ttccccacag attcgaaatc taaactacac atcacacaat gcctgttact 2340
gacgtcctta agcgaaagtc cggtgtcatc gtcggcgacg atgtccgagc cgtgagtatc 2400
cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc gaaagtcgct 2460
agcaacacac actctctaca caaactaacc cagctctcca tggctacctc tgacccttcc 2520
gtccgagctt tcacacgatc tgaagtcttg cacgccgatg ccttgaacga gggcaaaaag 2580
aatgctgaag ccccgttcct catgatcatt gacaacaaag tctacgatgt gcgcgagttt 2640
gtccccgacc atcctggcgg tagtgtcatt ttgacccacg taggcaagga cggcacggac 2700
gtcttcgaga ccttccatcc cgaggccgcg tgggaaacgc tcgccaactt ttatgtcggc 2760
gacattgcag aatccgatcg tgcgattgag aatgacgagt ttgcagccga agtccgcaag 2820
ctgcgtactt tgttccagtc tctgggatat tacaactcat ccaaaaccta ctacgccttc 2880
aaggtctcat tcaacctctg catctggggc ctgtcggcgt ttatggttgc caagtggggc 2940
cagacctcga ccctcgccaa cgtggtgtct gcgtcgcttc tgggtgtctt ttggcaacag 3000
tgtggttggc tcgcccatga cttcttacac caccaggtct ttcacgatcg gttctggggt 3060
gatttgtttg gtgccttcct cggcggagtc tgtcaggggt tctcctcttc ctggtggaag 3120
gacaaacaca acacccacca cgcggcgccc aatgtccacg gagaggatcc cgatatcgac 3180
acgcacccac tgttgacatg gagcgaacat gcgctcgaga tgttttcgga tgtgcccgat 3240
gaggagttgg cccaaatgtg gtcccggttt atggttgtga accagacctg gttttacttt 3300
cccattctgt cgttcgcccg gttgtcgtgg tgcattcagt ccattctttt tgtgctcccg 3360
aacggacagg cacacaagcc tgcgggagcc cgggtcccca tctcgctggt ggagcaattg 3420
tcgctggcga tgcattggac ctggtatctg gcgaccatgt tcttgtttat caaggatcct 3480
gtcaacataa tggtgtattt cttggtctcg caagcggtct gtggcaacct gttggcgatt 3540
gtgttctctc tgaaccataa cggaatgcct gtgatctctc aggaagaagc ggtcgagatg 3600
gatttcttta caaagcagat cattacgggc cgtgatgtcc acccaggctg gttcgcagac 3660
tggttcacgg gcggattgaa ctatcaaatt gagcaccacc tgttcccgtc gatgcctcgc 3720
cactatttct caaagatcca accaacggtc gaatcattgt gcaaaaagta cggggtccga 3780
tatcacacga cggggatgat agatggcacc gcagaggtct tttcgcgact gaacgaggtc 3840
tctcaggctg cctccaagct cggcaagtct gcttgagcgg ccgcaagtgt ggatggggaa 3900
gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt caacacaggg 3960
atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt ttgacacttg 4020
agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac atactcatac 4080
tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact cgtacagtgt 4140
gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtcg acgagtatct 4200
gtctgactcg tcattgccgc ctttggagta cgactccaac tatgagtgtg cttggatcac 4260
tttgacgata cattcttcgt tggaggctgt gggtctgaca gctgcgtttt cggcgcggtt 4320
ggccgacaac aatatcagct gcaacgtcat tgctggcttt catcatgatc acatttttgt 4380
cggcaaaggc gacgcccaga gagccattga cgttctttct aatttggacc gatagccgta 4440
tagtccagtc tatctataag ttcaactaac tcgtaactat taccataaca tatacttcac 4500
tgccccagat aaggttccga taaaaagttc tgcagactaa atttatttca gtctcctctt 4560
caccaccaaa atgccctcct acgaagctcg agctaacgtc cacaagtccg cctttgccgc 4620
tcgagtgctc aagctcgtgg cagccaagaa aaccaacctg tgtgcttctc tggatgttac 4680
caccaccaag gagctcattg agcttgccga taaggtcgga ccttatgtgt gcatgatcaa 4740
aacccatatc gacatcattg acgacttcac ctacgccggc actgtgctcc ccctcaagga 4800
acttgctctt aagcacggtt tcttcctgtt cgaggacaga aagttcgcag atattggcaa 4860
cactgtcaag caccagtacc ggtgtcaccg aatcgccgag tggtccgata tcaccaacgc 4920
ccacggtgta cccggaaccg gaatcattgc tggcctgcga gctggtgccg aggaaactgt 4980
ctctgaacag aagaaggagg acgtctctga ctacgagaac tcccagtaca aggagttcct 5040
agtcccctct cccaacgaga agctggccag aggtctgctc atgctggccg agctgtcttg 5100
caagggctct ctggccactg gcgagtactc caagcagacc attgagcttg cccgatccga 5160
ccccgagttt gtggttggct tcattgccca gaaccgacct aagggcgact ctgaggactg 5220
gcttattctg acccccgggg tgggtcttga cgacaaggga gacgctctcg gacagcagta 5280
ccgaactgtt gaggatgtca tgtctaccgg aacggatatc ataattgtcg gccgaggtct 5340
gtacggccag aaccgagatc ctattgagga ggccaagcga taccagaagg ctggctggga 5400
ggcttaccag aagattaact gttagaggtt agactatgga tatgtaattt aactgtgtat 5460
atagagagcg tgcaagtatg gagcgcttgt tcagcttgta tgatggtcag acgacctgtc 5520
tgatcgagta tgtatgatac tgcacaacct gtgtatccgc atgatctgtc caatggggca 5580
tgttgttgtg tttctcgata cggagatgct gggtacagtg ctaatacgtt gaactactta 5640
tacttatatg aggctcgaag aaagctgact tgtgtatgac ttaattaatt tgaatcgaat 5700
cgatgagcct aaaatgaacc cgagtatatc tcataaaatt ctcggtgaga ggtctgtgac 5760
tgtcagtaca aggtgccttc attatgccct caaccttacc atacctcact gaatgtagtg 5820
tacctctaaa aatgaaatac agtgccaaaa gccaaggcac tgagctcgtc taacggactt 5880
gatatacaac caattaaaac aaatgaaaag aaatacagtt ctttgtatca tttgtaacaa 5940
ttaccctgta caaactaagg tattgaaatc ccacaatatt cccaaagtcc acccctttcc 6000
aaattgtcat gcctacaact catataccaa gcactaacct accgtttaaa cagtgtacgc 6060
agatctacta tagaggaaca tttaaattgc cccggagaag acggccaggc cgcctagatg 6120
acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat 6180
atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt 6240
gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca 6300
caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca 6360
tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc 6420
gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg 6480
tgtacagttt gtcttaacaa aaagtgaggg cgctgaggtc gagcagggtg gtgtgacttg 6540
ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg 6600
tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat 6660
aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcggtac ccacaccttg 6720
cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg 6780
gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt 6840
cctttctttc cccacagatt cgaaatctaa actacacatc acacaatgcc tgttactgac 6900
gtccttaagc gaaagtccgg tgtcatcgtc ggcgacgatg tccgagccgt gagtatccac 6960
gacaagatca gtgtcgagac gacgcgtttt gtgtaatgac acaatccgaa agtcgctagc 7020
aacacacact ctctacacaa actaacccag ctctccatgg cacctcccaa cactatcgac 7080
gctggcttga cccagcgtca tatcaccacc acggccgccc caacctcggc caagcccgct 7140
ttcgagcgca actaccagct ccccgagttc accatcaagg agatccgaga gtgcatccct 7200
gcccactgct ttgagcgctc cggtcttcgt ggtctctgcc acgttgccat tgatctgacc 7260
tgggcctcgc tcttgttcct ggctgcaacc cagatcgaca agttcgagaa ccccttgatc 7320
cgctatctgg cctggcctgc gtactggatc atgcagggca ttgtctgcac cggcatatgg 7380
gtgctggccc acgagtgcgg tcaccagtcc ttctcgacct ccaagactct caacaacacc 7440
gtcggctgga tcctgcactc gatgctcttg gtcccctacc actcctggag aatctcgcac 7500
tcgaagcacc acaaggccac tggccacatg accaaggacc aggtctttgt tcccaagacc 7560
cgctcccagg ttggtttgcc tcccaaggag agcgctgctg ctgccgttca agaggaggac 7620
atgtccgtgc acctggatga ggaggcccct attgtgactt tgttctggat ggtgatccag 7680
ttcctgttcg gatggcctgc atacctgatc atgaacgcct ctggtcagga ctatggccgc 7740
tggacctcgc acttccacac ttactcgccc atctttgagc cccgcaactt cttcgacatt 7800
atcatctcgg atctcggtgt gttggctgcc ctcggtgccc tgatctacgc ttccatgcag 7860
ctgtcgctct tgaccgtgac caagtactac atcatcccgt acctgtttgt caacttttgg 7920
ttggtcctga ttactttctt gcagcacacc gaccccaagc tgccccatta ccgtgagggt 7980
gcctggaact tccagcgtgg agccctctgc accgttgacc gctcgtttgg caagttcttg 8040
gaccatatgt tccacggcat cgtccatacc catgtggccc atcacttgtt ctcgcagatg 8100
ccgttctacc atgctgaaga agctacctac catctcaaga aactgctggg agagtactac 8160
gtttacgacc catccccgat cgtcgttgcg gtctggaggt cgttccgcga gtgccgattc 8220
gtggaggatc agggagacgt ggtctttttc aagaagtaag cggccgcaag tgtggatggg 8280
gaagtgagtg cccggttctg tgtgcacaat tggcaatcca agatggatgg attcaacaca 8340
gggatatagc gagctacgtg gtggtgcgag gatatagcaa cggatattta tgtttgacac 8400
ttgagaatgt acgatacaag cactgtccaa gtacaatact aaacatactg tacatactca 8460
tactcgtacc cgggcaacgg tttcacttga gtgcagtggc tagtgctctt actcgtacag 8520
tgtgcaatac tgcgtatcat agtctttgat gtatatcgta ttcattcatg ttagttgcgt 8580
acgagatcgt caagggtttg tggccaactg gtatttaaat gtagctaacg gtagcaggcg 8640
aactactggt acatacctcc cccggaatat gtacaggcat aatgcgtatc tgtgggacat 8700
gtggtcgttg cgccattatg taagcagcgt gtactcctct gactgtccat atggtttgct 8760
ccatctcacc ctcatcgttt tcattgttca caggcggcca caaaaaaact gtcttctctc 8820
cttctctctt cgccttagtc tactcggacc agttttagtt tagcttggcg ccactggata 8880
aatgagacct caggccttgt gatgaggagg tcacttatga agcatgttag gaggtgcttg 8940
tatggataga gaagcaccca aaataataag aataataata aaacaggggg cgttgtcatt 9000
tcatatcgtg ttttcaccat caatacacct ccaaacaatg cccttcatgt ggccagcccc 9060
aatattgtcc tgtagttcaa ctctatgcag ctcgtatctt attgagcaag taaaactctg 9120
tcagccgata ttgcccgacc cgcgacaagg gtcaacaagg tggtgtaagg ccttcgcaga 9180
agtcaaaact gtgccaaaca aacatctaga gtctctttgg tgtttctcgc atatatttwa 9240
tcggctgtct tacgtatttg cgcctcggta ccggactaat ttcggatcat ccccaatacg 9300
ctttttcttc gcagctgtca acagtgtcca tgatctatcc acctaaatgg gtcatatgag 9360
gcgtataatt tcgtggtgct gataataatt cccatatatt tgacacaaaa cttccccccc 9420
tagacataca tctcacaatc tcacttcttg tgcttctgtc acacatctcc tccagctgac 9480
ttcaactcac acctctgccc cagttggtct acagcggtat aaggtttctc cgcatagagg 9540
tgcaccactc ctcccgatac ttgtttgtgt gacttgtggg tcacgacata tatatctaca 9600
cacattgcgc caccctttgg ttcttccagc acaacaaaaa cacgacacgc taaccatgga 9660
gtccattgct cccttcctgc cctccaagat gcctcaggac ctgttcatgg acctcgccag 9720
cgctatcggt gtccgagctg ctccctacgt cgatcccctg gaggctgccc tggttgccca 9780
ggccgagaag tacattccca ccattgtcca tcacactcga ggcttcctgg ttgccgtgga 9840
gtctcccctg gctcgagagc tgcctctgat gaaccccttc cacgtgctcc tgatcgtgct 9900
cgcctacctg gtcaccgtgt ttgtgggtat gcagatcatg aagaactttg aacgattcga 9960
ggtcaagacc ttctccctcc tgcacaactt ctgtctggtc tccatctccg cctacatgtg 10020
cggtggcatc ctgtacgagg cttatcaggc caactatgga ctgtttgaga acgctgccga 10080
tcacaccttc aagggtctcc ctatggctaa gatgatctgg ctcttctact tctccaagat 10140
catggagttt gtcgacacca tgatcatggt cctcaagaag aacaaccgac agatttcctt 10200
tctgcacgtg taccaccact cttccatctt caccatctgg tggctggtca ccttcgttgc 10260
tcccaacggt gaagcctact tctctgctgc cctgaactcc ttcatccacg tcatcatgta 10320
cggctactac tttctgtctg ccctgggctt caagcaggtg tcgttcatca agttctacat 10380
cactcgatcc cagatgaccc agttctgcat gatgtctgtc cagtcttcct gggacatgta 10440
cgccatgaag gtccttggcc gacctggata ccccttcttc atcaccgctc tgctctggtt 10500
ctacatgtgg accatgctcg gtctcttcta caacttttac cgaaagaacg ccaagctcgc 10560
caagcaggcc aaggctgacg ctgccaagga gaaggccaga aagctccagt aagcggccgc 10620
caccgcggcc cgagattccg gcctcttcgg ccgccaagcg acccgggtgg acgtctagag 10680
gtacctagca attaacagat agtttgccgg tgataattct cttaacctcc cacactcctt 10740
tgacataacg atttatgtaa cgaaactgaa atttgaccag atattgtgtc cgcggtggag 10800
ctccaagctt ccactggtcg gcgtggtagt ggggcagagt ggggtcggtg tgctgcaggt 10860
aggtgatggc cacgagccag tggttgaccc acaggtaggg gatcaggtag tagagggtga 10920
cggaagccag gccccatcgg ttgatggagt atgcgatgac ggacatggtg ataccaatac 10980
cgacgttaga gatccagatg ttgaaccagt ccttcttctc aaacagcggg gcgttggggt 11040
tgaagtggtt gacagcccat ttgttgagct tggggtactt ctgtccggta acgtaagaca 11100
gcagatacag aggccatcca aacacctgct gggtgatgag gccgtagagg gtcatgaggg 11160
gagcgtcctc agcaagctca gaccagtcat gggcgcctcg gttctccata aactcctttc 11220
ggtccttggg cacaaacacc atatcacggg tgaggtgacc agtggacttg tggtgcatgg 11280
agtgggtcag cttccaggcg tagtaaggga ccagcatgga ggagtgcaga acccatccgg 11340
tgacgttgtt gacggtgtta gagtcggaga aagcagagtg gccacactcg tgggcaagaa 11400
cccacagacc ggtgccaaac agaccctgga caatggagta catggcccag gccacagctc 11460
ggccggaagc cgagggaata agaggcaggt acgcgtaggc catgtaggca aaaacggcga 11520
taaagaagca ggcgcgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 11580
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 11640
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 11700
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 11760
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 11820
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 11880
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 11940
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 12000
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 12060
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 12120
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 12180
tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt atctgcgctc 12240
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 12300
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 12360
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 12420
gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 12480
aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 12540
aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 12600
cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg 12660
ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc 12720
cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta 12780
ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg 12840
ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct 12900
ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta 12960
gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg 13020
ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga 13080
ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt 13140
gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca 13200
ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt 13260
cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt 13320
c 13321
<210> 189
<211> 4313
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZKUM
<400> 189
taatcgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 60
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 120
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 180
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 240
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 300
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 360
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 420
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 480
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 540
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 600
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 660
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 720
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 780
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 840
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 900
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 960
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 1020
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 1080
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 1140
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 1200
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 1260
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 1320
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 1380
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 1440
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 1500
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 1560
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 1620
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 1680
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 1740
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 1800
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 1860
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 1920
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 1980
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 2040
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 2100
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 2160
cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 2220
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 2280
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 2340
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 2400
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 2460
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 2520
tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 2580
atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc 2640
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 2700
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 2760
agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat 2820
tgggtaccgg gccccccctc gaggtcgacg agtatctgtc tgactcgtca ttgccgcctt 2880
tggagtacga ctccaactat gagtgtgctt ggatcacttt gacgatacat tcttcgttgg 2940
aggctgtggg tctgacagct gcgttttcgg cgcggttggc cgacaacaat atcagctgca 3000
acgtcattgc tggctttcat catgatcaca tttttgtcgg caaaggcgac gcccagagag 3060
ccattgacgt tctttctaat ttggaccgat agccgtatag tccagtctat ctataagttc 3120
aactaactcg taactattac cataacatat acttcactgc cccagataag gttccgataa 3180
aaagttctgc agactaaatt tatttcagtc tcctcttcac caccaaaatg ccctcctacg 3240
aagctcgagt gctcaagctc gtggcagcca agaaaaccaa cctgtgtgct tctctggatg 3300
ttaccaccac caaggagctc attgagcttg ccgataaggt cggaccttat gtgtgcatga 3360
tcaaaaccca tatcgacatc attgacgact tcacctacgc cggcactgtg ctccccctca 3420
aggaacttgc tcttaagcac ggtttcttcc tgttcgagga cagaaagttc gcagatattg 3480
gcaacactgt caagcaccag taccggtgtc accgaatcgc cgagtggtcc gatatcacca 3540
acgcccacgg tgtacccgga accggaatcg attgctggcc tgcgagctgg tgcgtacgag 3600
gaaactgtct ctgaacagaa gaaggaggac gtctctgact acgagaactc ccagtacaag 3660
gagttcctag tcccctctcc caacgagaag ctggccagag gtctgctcat gctggccgag 3720
ctgtcttgca agggctctct ggccactggc gagtactcca agcagaccat tgagcttgcc 3780
cgatccgacc ccgagtttgt ggttggcttc attgcccaga accgacctaa gggcgactct 3840
gaggactggc ttattctgac ccccggggtg ggtcttgacg acaagggaga cgctctcgga 3900
cagcagtacc gaactgttga ggatgtcatg tctaccggaa cggatatcat aattgtcggc 3960
cgaggtctgt acggccagaa ccgagatcct attgaggagg ccaagcgata ccagaaggct 4020
ggctgggagg cttaccagaa gattaactgt tagaggttag actatggata tgtaatttaa 4080
ctgtgtatat agagagcgtg caagtatgga gcgcttgttc agcttgtatg atggtcagac 4140
gacctgtctg atcgagtatg tatgatactg cacaacctgt gtatccgcat gatctgtcca 4200
atggggcatg ttgttgtgtt tctcgatacg gagatgctgg gtacagtgct aatacgttga 4260
actacttata cttatatgag gctcgaagaa agctgacttg tgtatgactt aat 4313
<210> 190
<211> 8015
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pMLPAT-17
<400> 190
ctccatggtc gggtccgtca cccgacccac aaaggccctg ctctatggat cagccctctt 60
cagtttctgc tcattgctca atgtggtcca ggtgttctcc atactcctgc agccgttctc 120
gaagcgtctc ttctttgaag tgaacgctcg cgtggccggc tccatgtgga aggttatgca 180
gctgattatg gagaaaaagc acaaggccgc catcaycttc tcaggagaca agatccctca 240
ccacgagagt gccatcgtct ttggcaacca ccggtccttt gtcgactttt acatgtttca 300
caccgttgct gctyggagag gcatgctcaa ctatatgaag tactttgcca aggactctct 360
gaaatacatt ccattctatg gatggggcat gtggaycatg ggaatgctat tcatcaatcg 420
caactggcag caggatcagc tcaagatcaa caagatgttt gcacggatat tggacatcca 480
agcgcccgtt tgggtcgcca gtttcttgga gggctctcgg ttgacgccca gcaaactgkc 540
tgcctctcaa aagttcatgc tgggacgcgg attgcctctg ctgtcaaacg tcatgatgcc 600
caggaccaag ggattcattg cctgtgtcaa caaattccgg ggaactcatg tgaaatgtgt 660
ttatgatttc acgttcgcct actaccacaa gaccaagggc tttggagtgy ctccagatct 720
ggtccgtgtt cacastggcc agctcagccc cgagtacaaa ttccatgttc atgtgagacg 780
ctatcagctc gacgatctgc ccacggatga ggagaagctg agcgagtggg tggtccaaaa 840
gtatgtggag aaggacgcct ttttggagca gatgaaggag aattggacag atggtattga 900
tgggggtgtg tggtcagaga actggatgtg agcggccgca agtgtggatg gggaagtgag 960
tgcccggttc tgtgtgcaca attggcaatc caagatggat ggattcaaca cagggatata 1020
gcgagctacg tggtggtgcg aggatatagc aacggatatt tatgtttgac acttgagaat 1080
gtacgataca agcactgtcc aagtacaata ctaaacatac tgtacatact catactcgta 1140
cccgggcaac ggtttcactt gagtgcagtg gctagtgctc ttactcgtac agtgtgcaat 1200
actgcgtatc atagtctttg atgtatatcg tattcattca tgttagttgc gtacgagccg 1260
gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 1320
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 1380
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 1440
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 1500
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 1560
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 1620
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 1680
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 1740
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 1800
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 1860
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 1920
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 1980
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 2040
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 2100
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 2160
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 2220
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 2280
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 2340
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 2400
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 2460
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 2520
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 2580
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 2640
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 2700
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 2760
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 2820
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 2880
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 2940
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 3000
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 3060
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 3120
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 3180
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 3240
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 3300
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgcgccct 3360
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 3420
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 3480
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 3540
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 3600
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 3660
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 3720
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 3780
ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca actgttggga 3840
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 3900
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 3960
cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc ccctcgaggt 4020
cgatggtgtc gataagcttg atatcgaatt catgtcacac aaaccgatct tcgcctcaag 4080
gaaacctaat tctacatccg agagactgcc gagatccagt ctacactgat taattttcgg 4140
gccaataatt taaaaaaatc gtgttatata atattatatg tattatatat atacatcatg 4200
atgatactga cagtcatgtc ccattgctaa atagacagac tccatctgcc gcctccaact 4260
gatgttctca atatttaagg ggtcatctcg cattgtttaa taataaacag actccatcta 4320
ccgcctccaa atgatgttct caaaatatat tgtatgaact tatttttatt acttagtatt 4380
attagacaac ttacttgctt tatgaaaaac acttcctatt taggaaacaa tttataatgg 4440
cagttcgttc atttaacaat ttatgtagaa taaatgttat aaatgcgtat gggaaatctt 4500
aaatatggat agcataaatg atatctgcat tgcctaattc gaaatcaaca gcaacgaaaa 4560
aaatcccttg tacaacataa atagtcatcg agaaatatca actatcaaag aacagctatt 4620
cacacgttac tattgagatt attattggac gagaatcaca cactcaactg tctttctctc 4680
ttctagaaat acaggtacaa gtatgtacta ttctcattgt tcatacttct agtcatttca 4740
tcccacatat tccttggatt tctctccaat gaatgacatt ctatcttgca aattcaacaa 4800
ttataataag atataccaaa gtagcggtat agtggcaatc aaaaagcttc tctggtgtgc 4860
ttctcgtatt tatttttatt ctaatgatcc attaaaggta tatatttatt tcttgttata 4920
taatcctttt gtttattaca tgggctggat acataaaggt attttgattt aattttttgc 4980
ttaaattcaa tcccccctcg ttcagtgtca actgtaatgg taggaaatta ccatactttt 5040
gaagaagcaa aaaaaatgaa agaaaaaaaa aatcgtattt ccaggttaga cgttccgcag 5100
aatctagaat gcggtatgcg gtacattgtt cttcgaacgt aaaagttgcg ctccctgaga 5160
tattgtacat ttttgctttt acaagtacaa gtacatcgta caactatgta ctactgttga 5220
tgcatccaca acagtttgtt ttgttttttt ttgttttttt tttttctaat gattcattac 5280
cgctatgtat acctacttgt acttgtagta agccgggtta ttggcgttca attaatcata 5340
gacttatgaa tctgcacggt gtgcgctgcg agttactttt agcttatgca tgctacttgg 5400
gtgtaatatt gggatctgtt cggaaatcaa cggatgctca atcgatttcg acagtaatta 5460
attaagtcat acacaagtca gctttcttcg agcctcatat aagtataagt agttcaacgt 5520
attagcactg tacccagcat ctccgtatcg agaaacacaa caacatgccc cattggacag 5580
atcatgcgga tacacaggtt gtgcagtatc atacatactc gatcagacag gtcgtctgac 5640
catcatacaa gctgaacaag cgctccatac ttgcacgctc tctatataca cagttaaatt 5700
acatatccat agtctaacct ctaacagtta atcttctggt aagcctccca gccagccttc 5760
tggtatcgct tggcctcctc aataggatct cggttctggc cgtacagacc tcggccgaca 5820
attatgatat ccgttccggt agacatgaca tcctcaacag ttcggtactg ctgtccgaga 5880
gcgtctccct tgtcgtcaag acccaccccg ggggtcagaa taagccagtc ctcagagtcg 5940
cccttaggtc ggttctgggc aatgaagcca accacaaact cggggtcgga tcgggcaagc 6000
tcaatggtct gcttggagta ctcgccagtg gccagagagc ccttgcaaga cagctcggcc 6060
agcatgagca gacctctggc cagcttctcg ttgggagagg ggactaggaa ctccttgtac 6120
tgggagttct cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt ttcctcggca 6180
ccagctcgca ggccagcaat gattccggtt ccgggtacac cgtgggcgtt ggtgatatcg 6240
gaccactcgg cgattcggtg acaccggtac tggtgcttga cagtgttgcc aatatctgcg 6300
aactttctgt cctcgaacag gaagaaaccg tgcttaagag caagttcctt gagggggagc 6360
acagtgccgg cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat catgcacaca 6420
taaggtccga ccttatcggc aagctcaatg agctccttgg tggtggtaac atccagagaa 6480
gcacacaggt tggttttctt ggctgccacg agcttgagca ctcgagcggc aaaggcggac 6540
ttgtggacgt tagctcgagc ttcgtaggag ggcattttgg tggtgaagag gagactgaaa 6600
taaatttagt ctgcagaact ttttatcgga accttatctg gggcagtgaa gtatatgtta 6660
tggtaatagt tacgagttag ttgaacttat agatagactg gactatacgg ctatcggtcc 6720
aaattagaaa gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca 6780
tgatgaaagc cagcaatgac gttgcagctg atattgttgt cggccaaccg cgccgaaaac 6840
gcagctgtca gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac 6900
tcatagttgg agtcgtactc caaaggcggc aatgacgagt cagacagata ctcgtcgact 6960
caggcgacga cggaattcct gcagcccatc tgcagaattc aggagagacc gggttggcgg 7020
cgtatttgtg tcccaaaaaa cagccccaat tgccccggag aagacggcca ggccgcctag 7080
atgacaaatt caacaactca cagctgactt tctgccattg ccactagggg ggggcctttt 7140
tatatggcca agccaagctc tccacgtcgg ttgggctgca cccaacaata aatgggtagg 7200
gttgcaccaa caaagggatg ggatgggggg tagaagatac gaggataacg gggctcaatg 7260
gcacaaataa gaacgaatac tgccattaag actcgtgatc cagcgactga caccattgca 7320
tcatctaagg gcctcaaaac tacctcggaa ctgctgcgct gatctggaca ccacagaggt 7380
tccgagcact ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca 7440
gcgtgtacag tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac 7500
ttgttatagc ctttagagct gcgaaagcgc gtatggattt ggctcatcag gccagattga 7560
gggtctgtgg acacatgtca tgttagtgta cttcaatcgc cccctggata tagccccgac 7620
aataggccgt ggcctcattt ttttgccttc cgcacatttc cattgctcgg tacccacacc 7680
ttgcttctcc tgcacttgcc aaccttaata ctggtttaca ttgaccaaca tcttacaagc 7740
ggggggcttg tctagggtat atataaacag tggctctccc aatcggttgc cagtctcttt 7800
tttcctttct ttccccacag attcgaaatc taaactacac atcacacaat gcctgttact 7860
gacgtcctta agcgaaagtc cggtgtcatc gtcggcgacg atgtccgagc cgtgagtatc 7920
cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc gaaagtcgct 7980
agcaacacac actctctaca caaactaacc cagct 8015
<210> 191
<211> 8411
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pMLPAT-Int
<400> 191
cgataccatg gtcgggcaat gagaacggca gcaactgcaa tcacagcgac atatatccaa 60
ctgttcatgt ttggttttcg gatagtcaca caccttaatt ttgatgcacg ctttatggag 120
tctctctctc tttttctctc tctcttgtcg tcgctctttc ttgtttttca accacccact 180
tgattcctgc aaacaaacta cccacactaa ttttttttcg ctgcataccc tcaaatgagc 240
ctaattggcg tgtgtctccg cacaaaaaca caccatgcac ggctgggctt gttgggaaac 300
tttgtcaggg gggtccaggg ggccattggc agacttggcc acgtgtgctc atctcggctt 360
cgtcgttatt acgtgtctgt gtaatcaaag tcgggcgttt tttgcgccat gtgtccgcat 420
gaaattggcc cctcttgaag tcccttgtgc acctacacgt gccgaaatga aggttggagt 480
cagcggggtc atgccgtggt attatgctgt ggcatgtggc attaagctgt ggcatcaagc 540
cgtggaatca agccgtggtt cacgcccttg attgcgcagg cacatggcgc cattcttgcc 600
tctgctgtaa gcccggcttt gtgtgattca gagacgctgc taccgcacaa ctgcccatac 660
tccttctcct actgtataca tccacccctc atgctgataa cattatcatc tcatctcaac 720
tcaacatttc caccaacttg ggatcaaaaa cacgttctaa tactgtacac tgtctacgat 780
ataattaccg tacagtgtgg ttataatgaa catctattag agagaattgt ttgttgctcg 840
tatcagtcat tgggaagcgg gataccatgt cattttcacc tatatcaacc atgaaactac 900
agtatgtaca gtagaagtat atactgtact gttttgtaac tatatgtaca gtagaagtat 960
atactatact gttattaact atacttgtga ctagtgttcc aaactacaag tatatactgt 1020
acttgtacac gactatccga ccagtatcca gtatacaata accaactact ctacgtacgt 1080
actaaactaa acaaatagat caatgctcaa tgtcgagctc cagcttttgt tccctttagt 1140
gagggttaat ttcgagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 1200
atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 1260
cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 1320
gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 1380
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 1440
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 1500
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 1560
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 1620
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 1680
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 1740
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 1800
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 1860
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 1920
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 1980
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 2040
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 2100
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 2160
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 2220
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 2280
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 2340
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 2400
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 2460
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 2520
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 2580
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 2640
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 2700
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 2760
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 2820
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 2880
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 2940
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 3000
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 3060
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 3120
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 3180
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 3240
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 3300
catttccccg aaaagtgcca cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg 3360
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 3420
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 3480
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 3540
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 3600
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 3660
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 3720
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt 3780
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 3840
attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg 3900
gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa ttgtaatacg actcactata 3960
gggcgaattg ggtaccgggc cccccctcga gtctagagca gggtgttgga ggggatggag 4020
aggttgagta aagcggaagt tgcggtttgc tggtcgcgtt ttaatcttct tttgtaattt 4080
aatctcggta tgccgacgtg tttcggcgag ttaattttag ctgtcaaaaa aatggatcac 4140
caggatagac aaagaagaga gtgggacaag gatctttcca gccgctaata tcggccagtt 4200
taagagcaat tcacggtccc tggagtccat ataacaacgc caatctcgca cttgtctgct 4260
ccctcgtcac ccgtccaact gtccaatcca atctatgcct ctcatgatca tcttcacact 4320
acagtagagt aggtaaaggt agacttatgg gctcctcgaa taattggact ctgtctaaac 4380
cttgtgaagt tacctcggtc ggtagagttc ggctggaagg ccatgattac taacaacatc 4440
gtacgagaga aaatcaagat gagtaataca atctcgatga gtaatacaat ctcgatgagt 4500
aatacaatct cgatgagtaa gactaggtgg tgtcacgact tttagaggaa tgagcagctt 4560
tcagggttat tatagagaca cgtccgcgga cgaagtagct ggtacatcga gcataagcat 4620
ggtacaagta ggagtagact aaaaaccaac agtttgaata gtccatgaca gtacgggcgg 4680
gtacgactga tctaagagaa ctggggtata cacgatatag cacagtacag agaaagtggg 4740
ctcgttttgc gttggtaatc gaggtagatt tcgttgctat attaatccat tcacccatag 4800
ctccacagcc aatggttcgc cgtgggtgtc gatctgaaaa atgtttcata ttacctatct 4860
ctctcctaaa gtagctacaa gcacttcttg tgctgcagtc tgcggccgct cacatccagt 4920
tctctgacca cacaccccca tcaataccat ctgtccaatt ctccttcatc tgctccaaaa 4980
aggcgtcctt ctccacatac ttttggacca cccactcgct cagcttctcc tcatccgtgg 5040
gcagatcgtc gagctgatag cgtctcacat gaacatggaa tttgtactcg gggctgagct 5100
ggccastgtg aacacggacc agatctggag rcactccaaa gcccttggtc ttgtggtagt 5160
aggcgaacgt gaaatcataa acacatttca catgagttcc ccggaatttg ttgacacagg 5220
caatgaatcc cttggtcctg ggcatcatga cgtttgacag cagaggcaat ccgcgtccca 5280
gcatgaactt ttgagaggca gmcagtttgc tgggcgtcaa ccgagagccc tccaagaaac 5340
tggcgaccca aacgggcgct tggatgtcca atatccgtgc aaacatcttg ttgatcttga 5400
gctgatcctg ctgccagttg cgattgatga atagcattcc catgrtccac atgccccatc 5460
catagaatgg aatgtatttc agagagtcct tggcaaagta cttcatatag ttgagcatgc 5520
ctctccragc agcaacggtg tgaaacatgt aaaagtcgac aaaggaccgg tggttgccaa 5580
agacgatggc actctcgtgg tgagggatct tgtctcctga gaagrtgatg gcggccttgt 5640
gctttttctc cataatcagc tgcataacct tccacatgga gccggccacg cgagcgttca 5700
cttcaaagaa gagacgcttc gagaacggct gcaggagtat ggagaacacc tggaccacat 5760
tgagcaatga gcagaaactg aagagggctg atccatagag cagggccttt gtgggtcggg 5820
tgacggaccc gaccatggag agctgggtta gtttgtgtag agagtgtgtg ttgctagcga 5880
ctttcggatt gtgtcattac acaaaacgcg tcgtctcgac actgatcttg tcgtggatac 5940
tcacggctcg gacatcgtcg ccgacgatga caccggactt tcgcttaagg acgtcagtaa 6000
caggcattgt gtgatgtgta gtttagattt cgaatctgtg gggaaagaaa ggaaaaaaga 6060
gactggcaac cgattgggag agccactgtt tatatatacc ctagacaagc cccccgcttg 6120
taagatgttg gtcaatgtaa accagtatta aggttggcaa gtgcaggaga agcaaggtgt 6180
gggtaccgag caatggaaat gtgcggaagg caaaaaaatg aggccacggc ctattgtcgg 6240
ggctatatcc agggggcgat tgaagtacac taacatgaca tgtgtccaca gaccctcaat 6300
ctggcctgat gagccaaatc catacgcgct ttcgcagctc taaaggctat aacaagtcac 6360
accaccctgc tcgacctcag cgccctcact ttttgttaag acaaactgta cacgctgttc 6420
cagcgttttc tgcctgcacc tggtgggaca tttggtgcaa cctaaagtgc tcggaacctc 6480
tgtggtgtcc agatcagcgc agcagttccg aggtagtttt gaggccctta gatgatgcaa 6540
tggtgtcagt cgctggatca cgagtcttaa tggcagtatt cgttcttatt tgtgccattg 6600
agccccgtta tcctcgtatc ttctaccccc catcccatcc ctttgttggt gcaaccctac 6660
ccatttattg ttgggtgcag cccaaccgac gtggagagct tggcttggcc atataaaaag 6720
gcccccccct agtggcaatg gcagaaagtc agctgtgagt tgttgaattt gtcatctagg 6780
cggcctggcc gtcttctccg gggcaattgg ggctgttttt tgggacacaa atacgccgcc 6840
aacccggtct ctcctgaatt ctgcagatgg gctgcaggaa ttccgtcgtc gcctgagtcg 6900
acgagtatct gtctgactcg tcattgccgc ctttggagta cgactccaac tatgagtgtg 6960
cttggatcac tttgacgata cattcttcgt tggaggctgt gggtctgaca gctgcgtttt 7020
cggcgcggtt ggccgacaac aatatcagct gcaacgtcat tgctggcttt catcatgatc 7080
acatttttgt cggcaaaggc gacgcccaga gagccattga cgttctttct aatttggacc 7140
gatagccgta tagtccagtc tatctataag ttcaactaac tcgtaactat taccataaca 7200
tatacttcac tgccccagat aaggttccga taaaaagttc tgcagactaa atttatttca 7260
gtctcctctt caccaccaaa atgccctcct acgaagctcg agctaacgtc cacaagtccg 7320
cctttgccgc tcgagtgctc aagctcgtgg cagccaagaa aaccaacctg tgtgcttctc 7380
tggatgttac caccaccaag gagctcattg agcttgccga taaggtcgga ccttatgtgt 7440
gcatgatcaa aacccatatc gacatcattg acgacttcac ctacgccggc actgtgctcc 7500
ccctcaagga acttgctctt aagcacggtt tcttcctgtt cgaggacaga aagttcgcag 7560
atattggcaa cactgtcaag caccagtacc ggtgtcaccg aatcgccgag tggtccgata 7620
tcaccaacgc ccacggtgta cccggaaccg gaatcattgc tggcctgcga gctggtgccg 7680
aggaaactgt ctctgaacag aagaaggagg acgtctctga ctacgagaac tcccagtaca 7740
aggagttcct agtcccctct cccaacgaga agctggccag aggtctgctc atgctggccg 7800
agctgtcttg caagggctct ctggccactg gcgagtactc caagcagacc attgagcttg 7860
cccgatccga ccccgagttt gtggttggct tcattgccca gaaccgacct aagggcgact 7920
ctgaggactg gcttattctg acccccgggg tgggtcttga cgacaaggga gacgctctcg 7980
gacagcagta ccgaactgtt gaggatgtca tgtctaccgg aacggatatc ataattgtcg 8040
gccgaggtct gtacggccag aaccgagatc ctattgagga ggccaagcga taccagaagg 8100
ctggctggga ggcttaccag aagattaact gttagaggtt agactatgga tatgtaattt 8160
aactgtgtat atagagagcg tgcaagtatg gagcgcttgt tcagcttgta tgatggtcag 8220
acgacctgtc tgatcgagta tgtatgatac tgcacaacct gtgtatccgc atgatctgtc 8280
caatggggca tgttgttgtg tttctcgata cggagatgct gggtacagtg ctaatacgtt 8340
gaactactta tacttatatg aggctcgaag aaagctgact tgtgtatgac ttaattaatt 8400
actgtcgaaa t 8411
<210> 192
<211> 7323
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF-MOD-1
<400> 192
gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 60
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 120
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 180
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 240
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 300
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 360
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 420
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 480
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 540
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 600
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 660
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 720
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 780
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 840
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 900
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 960
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1020
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1080
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1140
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 1200
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 1260
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1320
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1380
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1440
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 1500
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 1560
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 1620
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 1680
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 1740
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 1800
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 1860
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 1920
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 1980
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2040
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2100
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2160
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2220
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2280
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2340
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2400
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2460
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2520
aacgcgaatt ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca 2580
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 2640
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 2700
aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc 2760
ccctcgaggt cgatggtgtc gataagcttg atatcgaatt catgtcacac aaaccgatct 2820
tcgcctcaag gaaacctaat tctacatccg agagactgcc gagatccagt ctacactgat 2880
taattttcgg gccaataatt taaaaaaatc gtgttatata atattatatg tattatatat 2940
atacatcatg atgatactga cagtcatgtc ccattgctaa atagacagac tccatctgcc 3000
gcctccaact gatgttctca atatttaagg ggtcatctcg cattgtttaa taataaacag 3060
actccatcta ccgcctccaa atgatgttct caaaatatat tgtatgaact tatttttatt 3120
acttagtatt attagacaac ttacttgctt tatgaaaaac acttcctatt taggaaacaa 3180
tttataatgg cagttcgttc atttaacaat ttatgtagaa taaatgttat aaatgcgtat 3240
gggaaatctt aaatatggat agcataaatg atatctgcat tgcctaattc gaaatcaaca 3300
gcaacgaaaa aaatcccttg tacaacataa atagtcatcg agaaatatca actatcaaag 3360
aacagctatt cacacgttac tattgagatt attattggac gagaatcaca cactcaactg 3420
tctttctctc ttctagaaat acaggtacaa gtatgtacta ttctcattgt tcatacttct 3480
agtcatttca tcccacatat tccttggatt tctctccaat gaatgacatt ctatcttgca 3540
aattcaacaa ttataataag atataccaaa gtagcggtat agtggcaatc aaaaagcttc 3600
tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc attaaaggta tatatttatt 3660
tcttgttata taatcctttt gtttattaca tgggctggat acataaaggt attttgattt 3720
aattttttgc ttaaattcaa tcccccctcg ttcagtgtca actgtaatgg taggaaatta 3780
ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa aatcgtattt ccaggttaga 3840
cgttccgcag aatctagaat gcggtatgcg gtacattgtt cttcgaacgt aaaagttgcg 3900
ctccctgaga tattgtacat ttttgctttt acaagtacaa gtacatcgta caactatgta 3960
ctactgttga tgcatccaca acagtttgtt ttgttttttt ttgttttttt tttttctaat 4020
gattcattac cgctatgtat acctacttgt acttgtagta agccgggtta ttggcgttca 4080
attaatcata gacttatgaa tctgcacggt gtgcgctgcg agttactttt agcttatgca 4140
tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa cggatgctca atcgatttcg 4200
acagtaatta attaagtcat acacaagtca gctttcttcg agcctcatat aagtataagt 4260
agttcaacgt attagcactg tacccagcat ctccgtatcg agaaacacaa caacatgccc 4320
cattggacag atcatgcgga tacacaggtt gtgcagtatc atacatactc gatcagacag 4380
gtcgtctgac catcatacaa gctgaacaag cgctccatac ttgcacgctc tctatataca 4440
cagttaaatt acatatccat agtctaacct ctaacagtta atcttctggt aagcctccca 4500
gccagccttc tggtatcgct tggcctcctc aataggatct cggttctggc cgtacagacc 4560
tcggccgaca attatgatat ccgttccggt agacatgaca tcctcaacag ttcggtactg 4620
ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg ggggtcagaa taagccagtc 4680
ctcagagtcg cccttaggtc ggttctgggc aatgaagcca accacaaact cggggtcgga 4740
tcgggcaagc tcaatggtct gcttggagta ctcgccagtg gccagagagc ccttgcaaga 4800
cagctcggcc agcatgagca gacctctggc cagcttctcg ttgggagagg ggactaggaa 4860
ctccttgtac tgggagttct cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt 4920
ttcctcggca ccagctcgca ggccagcaat gattccggtt ccgggtacac cgtgggcgtt 4980
ggtgatatcg gaccactcgg cgattcggtg acaccggtac tggtgcttga cagtgttgcc 5040
aatatctgcg aactttctgt cctcgaacag gaagaaaccg tgcttaagag caagttcctt 5100
gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat 5160
catgcacaca taaggtccga ccttatcggc aagctcaatg agctccttgg tggtggtaac 5220
atccagagaa gcacacaggt tggttttctt ggctgccacg agcttgagca ctcgagcggc 5280
aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag ggcattttgg tggtgaagag 5340
gagactgaaa taaatttagt ctgcagaact ttttatcgga accttatctg gggcagtgaa 5400
gtatatgtta tggtaatagt tacgagttag ttgaacttat agatagactg gactatacgg 5460
ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa 5520
aatgtgatca tgatgaaagc cagcaatgac gttgcagctg atattgttgt cggccaaccg 5580
cgccgaaaac gcagctgtca gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat 5640
ccaagcacac tcatagttgg agtcgtactc caaaggcggc aatgacgagt cagacagata 5700
ctcgtcgact caggcgacga cggaattcct gcagcccatc tgcagaattc aggagagacc 5760
gggttggcgg cgtatttgtg tcccaaaaaa cagccccaat tgccccggag aagacggcca 5820
ggccgcctag atgacaaatt caacaactca cagctgactt tctgccattg ccactagggg 5880
ggggcctttt tatatggcca agccaagctc tccacgtcgg ttgggctgca cccaacaata 5940
aatgggtagg gttgcaccaa caaagggatg ggatgggggg tagaagatac gaggataacg 6000
gggctcaatg gcacaaataa gaacgaatac tgccattaag actcgtgatc cagcgactga 6060
caccattgca tcatctaagg gcctcaaaac tacctcggaa ctgctgcgct gatctggaca 6120
ccacagaggt tccgagcact ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa 6180
cgctggaaca gcgtgtacag tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg 6240
gtggtgtgac ttgttatagc ctttagagct gcgaaagcgc gtatggattt ggctcatcag 6300
gccagattga gggtctgtgg acacatgtca tgttagtgta cttcaatcgc cccctggata 6360
tagccccgac aataggccgt ggcctcattt ttttgccttc cgcacatttc cattgctcgg 6420
tacccacacc ttgcttctcc tgcacttgcc aaccttaata ctggtttaca ttgaccaaca 6480
tcttacaagc ggggggcttg tctagggtat atataaacag tggctctccc aatcggttgc 6540
cagtctcttt tttcctttct ttccccacag attcgaaatc taaactacac atcacacaat 6600
gcctgttact gacgtcctta agcgaaagtc cggtgtcatc gtcggcgacg atgtccgagc 6660
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 6720
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctcca tggatccagg 6780
cctgttaacg gccattacgg cctgcaggat ccgaaaaaac ctcccacacc tccccctgaa 6840
cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg 6900
ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 6960
tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgcggcc gcaagtgtgg 7020
atggggaagt gagtgcccgg ttctgtgtgc acaattggca atccaagatg gatggattca 7080
acacagggat atagcgagct acgtggtggt gcgaggatat agcaacggat atttatgttt 7140
gacacttgag aatgtacgat acaagcactg tccaagtaca atactaaaca tactgtacat 7200
actcatactc gtacccgggc aacggtttca cttgagtgca gtggctagtg ctcttactcg 7260
tacagtgtgc aatactgcgt atcatagtct ttgatgtata tcgtattcat tcatgttagt 7320
tgc 7323
<210> 193
<211> 8666
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pMDGAT1-17
<220>
<221> misc_feature
<222> (467)..(467)
<223> n is a, c, g, or t
<400> 193
catggcagag tcgacaacaa cgacatgtgc aaaggaggag ggcattgcca acagcgctgc 60
tttgcctgac attcccccaa agatggaaga cctcaagtcc tccaggaaga ccggctcttc 120
ttacaagcac accttccccg tccatacaaa aaccatcccc agcccattgt ctaaagaggc 180
acctccagag agctatcgtg gattcgtcaa cctcggcatg ctcctacttt tcggcaacaa 240
catccgattg atcatcgaga attacctcaa atacggcttc ctgctctcaa tccctggatc 300
aagcgtctcg aagcaggact ggatcctggc tgccctcacc cacgccatcc tacccgtcaa 360
cctcatcctg gcctacaagc ttgagagctg ggccaaggag agagccgtcg gctatcgcaa 420
gcgtcgatct gacgaaccca ttgcccagga atcaaccaag gccgtgncag caggagataa 480
tgacgctatc aaaaccacaa aacccgccaa ggcccaggat ctcacacccg aggcccttgc 540
aaggaaggaa caatcgaccg tgggctggct ccatgtcttc aatctgttca ccatcgttgc 600
ctggccctcc ttcatgtcct actttatgat ctaccacccc ttcgtggcca tgtcctgcct 660
catgaacgga cttatcctct tcctcaaaat gacctccttt gcgcttgtga accaggagct 720
ccgagcagcc tacatctttg gaacacccgt ggacacgttc cagcacatgg ctaaagtgca 780
cgacatctct ggcaaggacc tgacaaagaa ggagatcttc cagtatgaca tccagtaccc 840
cgacaacatc accctcaaga acattggcta tttctggctc gcccccacgc tctgctacca 900
gccatcatac ccaaggacga ccgtcttccg caaatccttc ttcctcaagc gtgtggccga 960
gatcgtgacc tgtctgggca tgatgtactt tttagtcgag cagtacgcca cccccaccct 1020
gcagaactcg gtccgagcat tcgatgagtt ggcgttcggc accattctgg agagagtgct 1080
gaagctgagc accaccagtg tcatcatctg gctactcatg ttctacacct ttttccactc 1140
gttctttaat gctcttgcag aggcactgta ctttggagac cgtcgcttct atctcgcctg 1200
gtggaatgcc actggtgtcg gcatgtactg gaagacgtgg aactcgcccg tctacacctt 1260
cttcaaacgc cacgtatacc tgcccctgat cacctctggc acctctccca tggtcgcctc 1320
gatcgtcatc ttcctcatct cggctgtctt gcacgagatc ttgatcggct tccccactca 1380
tatgatctat ggatacgcat tcgccggcat gttcctccag atcccgctga tcattctgac 1440
ccgacccctc gaaaaatggc gaggcaccgg atcgggtctc ggcaacatga tcttctgggt 1500
ctcgttcacc atcctgggcc agccagcgtg tgcgctgctc tactactacc actggaccaa 1560
gcgccatatg gatgtttgag cggccgcaag tgtggatggg gaagtgagtg cccggttctg 1620
tgtgcacaat tggcaatcca agatggatgg attcaacaca gggatatagc gagctacgtg 1680
gtggtgcgag gatatagcaa cggatattta tgtttgacac ttgagaatgt acgatacaag 1740
cactgtccaa gtacaatact aaacatactg tacatactca tactcgtacc cgggcaacgg 1800
tttcacttga gtgcagtggc tagtgctctt actcgtacag tgtgcaatac tgcgtatcat 1860
agtctttgat gtatatcgta ttcattcatg ttagttgcgt acgagccgga agcataaagt 1920
gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc 1980
ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 2040
ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct 2100
cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 2160
cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 2220
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 2280
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 2340
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 2400
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 2460
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 2520
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 2580
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 2640
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg 2700
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 2760
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 2820
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 2880
acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 2940
tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 3000
ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 3060
catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat 3120
ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag 3180
caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct 3240
ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt 3300
tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg 3360
cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca 3420
aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt 3480
tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat 3540
gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac 3600
cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa 3660
aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt 3720
tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt 3780
tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa 3840
gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt 3900
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 3960
taggggttcc gcgcacattt ccccgaaaag tgccacctga cgcgccctgt agcggcgcat 4020
taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag 4080
cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc 4140
aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc 4200
ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt 4260
ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa 4320
caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg 4380
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 4440
taacgcttac aatttccatt cgccattcag gctgcgcaac tgttgggaag ggcgatcggt 4500
gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa ggcgattaag 4560
ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtgaattgta 4620
atacgactca ctatagggcg aattgggtac cgggcccccc ctcgaggtcg atggtgtcga 4680
taagcttgat atcgaattca tgtcacacaa accgatcttc gcctcaagga aacctaattc 4740
tacatccgag agactgccga gatccagtct acactgatta attttcgggc caataattta 4800
aaaaaatcgt gttatataat attatatgta ttatatatat acatcatgat gatactgaca 4860
gtcatgtccc attgctaaat agacagactc catctgccgc ctccaactga tgttctcaat 4920
atttaagggg tcatctcgca ttgtttaata ataaacagac tccatctacc gcctccaaat 4980
gatgttctca aaatatattg tatgaactta tttttattac ttagtattat tagacaactt 5040
acttgcttta tgaaaaacac ttcctattta ggaaacaatt tataatggca gttcgttcat 5100
ttaacaattt atgtagaata aatgttataa atgcgtatgg gaaatcttaa atatggatag 5160
cataaatgat atctgcattg cctaattcga aatcaacagc aacgaaaaaa atcccttgta 5220
caacataaat agtcatcgag aaatatcaac tatcaaagaa cagctattca cacgttacta 5280
ttgagattat tattggacga gaatcacaca ctcaactgtc tttctctctt ctagaaatac 5340
aggtacaagt atgtactatt ctcattgttc atacttctag tcatttcatc ccacatattc 5400
cttggatttc tctccaatga atgacattct atcttgcaaa ttcaacaatt ataataagat 5460
ataccaaagt agcggtatag tggcaatcaa aaagcttctc tggtgtgctt ctcgtattta 5520
tttttattct aatgatccat taaaggtata tatttatttc ttgttatata atccttttgt 5580
ttattacatg ggctggatac ataaaggtat tttgatttaa ttttttgctt aaattcaatc 5640
ccccctcgtt cagtgtcaac tgtaatggta ggaaattacc atacttttga agaagcaaaa 5700
aaaatgaaag aaaaaaaaaa tcgtatttcc aggttagacg ttccgcagaa tctagaatgc 5760
ggtatgcggt acattgttct tcgaacgtaa aagttgcgct ccctgagata ttgtacattt 5820
ttgcttttac aagtacaagt acatcgtaca actatgtact actgttgatg catccacaac 5880
agtttgtttt gttttttttt gttttttttt tttctaatga ttcattaccg ctatgtatac 5940
ctacttgtac ttgtagtaag ccgggttatt ggcgttcaat taatcataga cttatgaatc 6000
tgcacggtgt gcgctgcgag ttacttttag cttatgcatg ctacttgggt gtaatattgg 6060
gatctgttcg gaaatcaacg gatgctcaat cgatttcgac agtaattaat taagtcatac 6120
acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 6180
cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 6240
cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 6300
tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 6360
tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 6420
gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 6480
gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 6540
tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 6600
ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 6660
ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 6720
cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 6780
tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 6840
ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 6900
attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 6960
tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 7020
taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 7080
ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 7140
gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 7200
gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 7260
gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 7320
cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 7380
acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 7440
gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 7500
cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 7560
tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcgactca ggcgacgacg 7620
gaattcctgc agcccatctg cagaattcag gagagaccgg gttggcggcg tatttgtgtc 7680
ccaaaaaaca gccccaattg ccccggagaa gacggccagg ccgcctagat gacaaattca 7740
acaactcaca gctgactttc tgccattgcc actagggggg ggccttttta tatggccaag 7800
ccaagctctc cacgtcggtt gggctgcacc caacaataaa tgggtagggt tgcaccaaca 7860
aagggatggg atggggggta gaagatacga ggataacggg gctcaatggc acaaataaga 7920
acgaatactg ccattaagac tcgtgatcca gcgactgaca ccattgcatc atctaagggc 7980
ctcaaaacta cctcggaact gctgcgctga tctggacacc acagaggttc cgagcacttt 8040
aggttgcacc aaatgtccca ccaggtgcag gcagaaaacg ctggaacagc gtgtacagtt 8100
tgtcttaaca aaaagtgagg gcgctgaggt cgagcagggt ggtgtgactt gttatagcct 8160
ttagagctgc gaaagcgcgt atggatttgg ctcatcaggc cagattgagg gtctgtggac 8220
acatgtcatg ttagtgtact tcaatcgccc cctggatata gccccgacaa taggccgtgg 8280
cctcattttt ttgccttccg cacatttcca ttgctcggta cccacacctt gcttctcctg 8340
cacttgccaa ccttaatact ggtttacatt gaccaacatc ttacaagcgg ggggcttgtc 8400
tagggtatat ataaacagtg gctctcccaa tcggttgcca gtctcttttt tcctttcttt 8460
ccccacagat tcgaaatcta aactacacat cacacaatgc ctgttactga cgtccttaag 8520
cgaaagtccg gtgtcatcgt cggcgacgat gtccgagccg tgagtatcca cgacaagatc 8580
agtgtcgaga cgacgcgttt tgtgtaatga cacaatccga aagtcgctag caacacacac 8640
tctctacaca aactaaccca gctctc 8666
<210> 194
<211> 8084
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pMDGAT2-17
<400> 194
catggcgctc tttgcgcctt tacggatgcc cgtcaagcgt cgtatgcaga caggagctgt 60
cctatactgg attgcgggga tgatttactg cattggcatc tttgccttcc tctgcacgtt 120
caagatcctt cgacccttga tcatcatcta tgtcctgtgg gcctacatgc tcgaccgagc 180
accagagcgg ggtgcacgca cagtccaatg gtattgtaac tggatcggat ggaaacactt 240
tgcacagtac tttcctatga cccttgtcaa ggagggagag ctggacccat ccaagaacta 300
catctttggg tatcacccac acggaatcat ttccttgggt gccctctgcg cctttgggac 360
cgagggcctt catttctcca aacgcttccc gggtatcaag cctcatctgc tcaccattca 420
cgccaacttt cagatcccac tctatcgcga tatgatcatg gcccacggct gtgcttccgt 480
gtcgagggcc tcttgtgaac acatcctgcg gtctggcgaa ggatcctcgg tcgtgatcgt 540
tgtcgggggt gcacaagaaa gtttgtcgac tcaacctggc acgttaaatc tgacactcaa 600
gaaaagactg ggattttgca agctggcctt tgtcaatggc gcaagtctgg tacctacgtt 660
ggcctttggt gagaacgagc tctatgaggt gtaccacacc aagcccacaa gcctgatata 720
caagctccag cagttgacta aacgcacgat cggcttcaca atgcccgtgt tcaacggacg 780
aggaatcttc aattatgagt ttggactgct gccaaggagg aagcctgtct atatcgttat 840
aggaaacccc attcatgtag acaaggtcga gaacccaacg attgaacaga tgcagaaact 900
gcagtcaatt tacattgatg aggtgctaaa catttgggaa agatacaagg acaagtatgc 960
cgcaggacga actcaggaac tgtgcatcat cgaataggcg gccgcaagtg tggatgggga 1020
agtgagtgcc cggttctgtg tgcacaattg gcaatccaag atggatggat tcaacacagg 1080
gatatagcga gctacgtggt ggtgcgagga tatagcaacg gatatttatg tttgacactt 1140
gagaatgtac gatacaagca ctgtccaagt acaatactaa acatactgta catactcata 1200
ctcgtacccg ggcaacggtt tcacttgagt gcagtggcta gtgctcttac tcgtacagtg 1260
tgcaatactg cgtatcatag tctttgatgt atatcgtatt cattcatgtt agttgcgtac 1320
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 1380
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 1440
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 1500
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 1560
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 1620
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 1680
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 1740
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 1800
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 1860
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 1920
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 1980
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 2040
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 2100
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 2160
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 2220
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 2280
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 2340
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 2400
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 2460
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 2520
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 2580
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 2640
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 2700
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 2760
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 2820
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 2880
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 2940
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 3000
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 3060
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 3120
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 3180
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 3240
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 3300
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 3360
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 3420
cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 3480
cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 3540
tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 3600
ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 3660
cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 3720
tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 3780
ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 3840
cgaattttaa caaaatatta acgcttacaa tttccattcg ccattcaggc tgcgcaactg 3900
ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg 3960
tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac 4020
gacggccagt gaattgtaat acgactcact atagggcgaa ttgggtaccg ggccccccct 4080
cgaggtcgat ggtgtcgata agcttgatat cgaattcatg tcacacaaac cgatcttcgc 4140
ctcaaggaaa cctaattcta catccgagag actgccgaga tccagtctac actgattaat 4200
tttcgggcca ataatttaaa aaaatcgtgt tatataatat tatatgtatt atatatatac 4260
atcatgatga tactgacagt catgtcccat tgctaaatag acagactcca tctgccgcct 4320
ccaactgatg ttctcaatat ttaaggggtc atctcgcatt gtttaataat aaacagactc 4380
catctaccgc ctccaaatga tgttctcaaa atatattgta tgaacttatt tttattactt 4440
agtattatta gacaacttac ttgctttatg aaaaacactt cctatttagg aaacaattta 4500
taatggcagt tcgttcattt aacaatttat gtagaataaa tgttataaat gcgtatggga 4560
aatcttaaat atggatagca taaatgatat ctgcattgcc taattcgaaa tcaacagcaa 4620
cgaaaaaaat cccttgtaca acataaatag tcatcgagaa atatcaacta tcaaagaaca 4680
gctattcaca cgttactatt gagattatta ttggacgaga atcacacact caactgtctt 4740
tctctcttct agaaatacag gtacaagtat gtactattct cattgttcat acttctagtc 4800
atttcatccc acatattcct tggatttctc tccaatgaat gacattctat cttgcaaatt 4860
caacaattat aataagatat accaaagtag cggtatagtg gcaatcaaaa agcttctctg 4920
gtgtgcttct cgtatttatt tttattctaa tgatccatta aaggtatata tttatttctt 4980
gttatataat ccttttgttt attacatggg ctggatacat aaaggtattt tgatttaatt 5040
ttttgcttaa attcaatccc ccctcgttca gtgtcaactg taatggtagg aaattaccat 5100
acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc gtatttccag gttagacgtt 5160
ccgcagaatc tagaatgcgg tatgcggtac attgttcttc gaacgtaaaa gttgcgctcc 5220
ctgagatatt gtacattttt gcttttacaa gtacaagtac atcgtacaac tatgtactac 5280
tgttgatgca tccacaacag tttgttttgt ttttttttgt tttttttttt tctaatgatt 5340
cattaccgct atgtatacct acttgtactt gtagtaagcc gggttattgg cgttcaatta 5400
atcatagact tatgaatctg cacggtgtgc gctgcgagtt acttttagct tatgcatgct 5460
acttgggtgt aatattggga tctgttcgga aatcaacgga tgctcaatcg atttcgacag 5520
taattaatta agtcatacac aagtcagctt tcttcgagcc tcatataagt ataagtagtt 5580
caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac atgccccatt 5640
ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc agacaggtcg 5700
tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta tatacacagt 5760
taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc ctcccagcca 5820
gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta cagacctcgg 5880
ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg gtactgctgt 5940
ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag ccagtcctca 6000
gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg gtcggatcgg 6060
gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt gcaagacagc 6120
tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac taggaactcc 6180
ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga gacagtttcc 6240
tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg ggcgttggtg 6300
atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt gttgccaata 6360
tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag ttccttgagg 6420
gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt tttgatcatg 6480
cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt ggtaacatcc 6540
agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg agcggcaaag 6600
gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt gaagaggaga 6660
ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc agtgaagtat 6720
atgttatggt aatagttacg agttagttga acttatagat agactggact atacggctat 6780
cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc gacaaaaatg 6840
tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc caaccgcgcc 6900
gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa agtgatccaa 6960
gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga cagatactcg 7020
tcgactcagg cgacgacgga attcctgcag cccatctgca gaattcagga gagaccgggt 7080
tggcggcgta tttgtgtccc aaaaaacagc cccaattgcc ccggagaaga cggccaggcc 7140
gcctagatga caaattcaac aactcacagc tgactttctg ccattgccac tagggggggg 7200
cctttttata tggccaagcc aagctctcca cgtcggttgg gctgcaccca acaataaatg 7260
ggtagggttg caccaacaaa gggatgggat ggggggtaga agatacgagg ataacggggc 7320
tcaatggcac aaataagaac gaatactgcc attaagactc gtgatccagc gactgacacc 7380
attgcatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 7440
agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 7500
ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 7560
tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 7620
gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 7680
cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 7740
cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 7800
acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 7860
ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca cacaatgcct 7920
gttactgacg tccttaagcg aaagtccggt gtcatcgtcg gcgacgatgt ccgagccgtg 7980
agtatccacg acaagatcag tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa 8040
gtcgctagca acacacactc tctacacaaa ctaacccagc tctc 8084
<210> 195
<211> 9239
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pMGPAT-17
<220>
<221> misc_feature
<222> (1510)..(1510)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1577)..(1577)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1584)..(1584)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1712)..(1712)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1729)..(1729)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1759)..(1759)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1820)..(1820)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1822)..(1822)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1831)..(1831)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1841)..(1841)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1913)..(1913)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1941)..(1941)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (2033)..(2033)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (2130)..(2130)
<223> n is a, c, g, or t
<400> 195
ccatggatcc tcagatctac gactttgtgt cgttcttctt cactatcctg ctcgacatct 60
tcttcaggga gattcgtccc agaggcgcac acaagattcc acaaaaaggc cccgtgatct 120
ttgtcgccgc tcctcatgcc aatcagtttg tcgatcctct cgtcttgatg cgagagtgcg 180
gccgcagagt ctcattcctt gcagccaaaa agtccatgga ccgccggtgg attggtgcaa 240
tggcacgctc gatgaatgcg attcctgttg agcgccccca ggaccttgct aaagccggct 300
cgggaatcat caaacttctg gatcgttatg gcgaccctct tcgggtcacc ggtgtcggca 360
ctaaattcac aaaggagctg cttgtgggcg accagatctc ccttccaaag gacgtcggtg 420
tcycagctgt gggcgagatc atatctgata ccgagctgat tgtcaagaag gaattcaaag 480
agctcaaggc ccttgagttg ctgaccagtg ctgaaggaac caagtacaaa tgcctacccc 540
atatggacca gacgaacgtc tacaaaactg tctttgagcg ccttaacgca ggacattgcg 600
ttggcatttt ccccgaggga ggctcccacg atcgtgctga aatgctgcca ttgaaagctg 660
gagtcaccat catggccctg ggcgcattag ccgccaaccc ttccttggat ctcaagattg 720
tcacctgcgg cctcaactac tttcacccgc atcgcttccg ctcgcgtgca gtagtcgagt 780
ttggcgagcc attgacggtt tcgcctgagc tggtcgaaat gtacaagcga ggcggggcgg 840
aaaagcgaga ggcttgcgga aaactgctcg acacgatcta tgaagctctc cgcggtgtca 900
ctctcaacgc gcctgattac gagacattga tggtcattca agcggcccgt cgcctttaca 960
agcctactca tcgcaagctg cagatctcgc aggtcgttga gttgaaccgt aggttcgtcg 1020
caggatacat gcacttcaag gacaatccaa aagtcattga agccaaggat aaagtcatgc 1080
attacaacac tcagctgcgg taccatggat tgcgggatca ccaagtgaat attcgcacca 1140
ccaggaagca cgctatcggc atgctcatct ctcggctgat ccagatgatc tttttgagtt 1200
gtctggcgct acctggaacy ctgatgaatc ttccggtcgc cattgtcgct cgtgtcatca 1260
gcaacaaaaa ggccaaagag gcgctggctg cctcgacagt caaaattgct ggaagggacg 1320
tcttggctac gtggaagttg ctggtcgctc taggattgat gcctgttctg tacttcacgt 1380
actccgtcat ggtcttcatc tattgcagcc gcttcgacct atcgttcaag tcgcgtcttt 1440
tggttgcttg ggcagcatgg gcgcttattc cttttgtaac ctacgcaagc atccgctttg 1500
gtgaagttgn tatcgatatc ttcaagtcta ttcgcccatt gttcctgtcc atcatcccgg 1560
gcgaggagag cacgatnaac gacntgcgca aggcgcgcgc agaacttcaa aagaccatca 1620
ccaatctcat caatgagcta gcgccgcaga tatatcccga ctttgattca aagcgcatcc 1680
tcgatccatc ccctgcagat cgtcccagcc gntcagcatc aggcaccanc cttgcacaga 1740
cgattttcaa cacggctgnt cagcccttga accaatggct aggcaaggat ggccgctttg 1800
aatgggagcg taccgaggan tntgatgcag ntgacgtgtt nttctttttg gacccagcga 1860
gaggaattat ggggcggtct agggcgtcgt cttggggagg tggagcattt acncctgctg 1920
ttgatgggtc gcgatcccgg natcggagca ggacaagcag cttcacgtcg ggccagatcc 1980
agctgggcga gggcttcaaa ctcgaggcac tgacggagct gccgcgggac aanccttttg 2040
cagaagtgac caggcggttg agtgtgagcc gaatgcagag atatgggctg gagggtatga 2100
cgcgctcgga tacggatgaa aacgaaggcn ccgccaagtc aaaagacatt taggcggccg 2160
caagtgtgga tggggaagtg agtgcccggt tctgtgtgca caattggcaa tccaagatgg 2220
atggattcaa cacagggata tagcgagcta cgtggtggtg cgaggatata gcaacggata 2280
tttatgtttg acacttgaga atgtacgata caagcactgt ccaagtacaa tactaaacat 2340
actgtacata ctcatactcg tacccgggca acggtttcac ttgagtgcag tggctagtgc 2400
tcttactcgt acagtgtgca atactgcgta tcatagtctt tgatgtatat cgtattcatt 2460
catgttagtt gcgtacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 2520
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 2580
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 2640
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 2700
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 2760
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 2820
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 2880
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 2940
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3000
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3060
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3120
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3180
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3240
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 3300
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3360
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3420
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 3480
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 3540
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 3600
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 3660
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 3720
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 3780
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 3840
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 3900
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 3960
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4020
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4080
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4140
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4200
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4260
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4320
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4380
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4440
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 4500
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 4560
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 4620
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 4680
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 4740
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 4800
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 4860
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 4920
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 4980
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc cattcgccat 5040
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 5100
tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 5160
cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag ggcgaattgg 5220
gtaccgggcc ccccctcgag gtcgatggtg tcgataagct tgatatcgaa ttcatgtcac 5280
acaaaccgat cttcgcctca aggaaaccta attctacatc cgagagactg ccgagatcca 5340
gtctacactg attaattttc gggccaataa tttaaaaaaa tcgtgttata taatattata 5400
tgtattatat atatacatca tgatgatact gacagtcatg tcccattgct aaatagacag 5460
actccatctg ccgcctccaa ctgatgttct caatatttaa ggggtcatct cgcattgttt 5520
aataataaac agactccatc taccgcctcc aaatgatgtt ctcaaaatat attgtatgaa 5580
cttattttta ttacttagta ttattagaca acttacttgc tttatgaaaa acacttccta 5640
tttaggaaac aatttataat ggcagttcgt tcatttaaca atttatgtag aataaatgtt 5700
ataaatgcgt atgggaaatc ttaaatatgg atagcataaa tgatatctgc attgcctaat 5760
tcgaaatcaa cagcaacgaa aaaaatccct tgtacaacat aaatagtcat cgagaaatat 5820
caactatcaa agaacagcta ttcacacgtt actattgaga ttattattgg acgagaatca 5880
cacactcaac tgtctttctc tcttctagaa atacaggtac aagtatgtac tattctcatt 5940
gttcatactt ctagtcattt catcccacat attccttgga tttctctcca atgaatgaca 6000
ttctatcttg caaattcaac aattataata agatatacca aagtagcggt atagtggcaa 6060
tcaaaaagct tctctggtgt gcttctcgta tttattttta ttctaatgat ccattaaagg 6120
tatatattta tttcttgtta tataatcctt ttgtttatta catgggctgg atacataaag 6180
gtattttgat ttaatttttt gcttaaattc aatcccccct cgttcagtgt caactgtaat 6240
ggtaggaaat taccatactt ttgaagaagc aaaaaaaatg aaagaaaaaa aaaatcgtat 6300
ttccaggtta gacgttccgc agaatctaga atgcggtatg cggtacattg ttcttcgaac 6360
gtaaaagttg cgctccctga gatattgtac atttttgctt ttacaagtac aagtacatcg 6420
tacaactatg tactactgtt gatgcatcca caacagtttg ttttgttttt ttttgttttt 6480
tttttttcta atgattcatt accgctatgt atacctactt gtacttgtag taagccgggt 6540
tattggcgtt caattaatca tagacttatg aatctgcacg gtgtgcgctg cgagttactt 6600
ttagcttatg catgctactt gggtgtaata ttgggatctg ttcggaaatc aacggatgct 6660
caatcgattt cgacagtaat taattaagtc atacacaagt cagctttctt cgagcctcat 6720
ataagtataa gtagttcaac gtattagcac tgtacccagc atctccgtat cgagaaacac 6780
aacaacatgc cccattggac agatcatgcg gatacacagg ttgtgcagta tcatacatac 6840
tcgatcagac aggtcgtctg accatcatac aagctgaaca agcgctccat acttgcacgc 6900
tctctatata cacagttaaa ttacatatcc atagtctaac ctctaacagt taatcttctg 6960
gtaagcctcc cagccagcct tctggtatcg cttggcctcc tcaataggat ctcggttctg 7020
gccgtacaga cctcggccga caattatgat atccgttccg gtagacatga catcctcaac 7080
agttcggtac tgctgtccga gagcgtctcc cttgtcgtca agacccaccc cgggggtcag 7140
aataagccag tcctcagagt cgcccttagg tcggttctgg gcaatgaagc caaccacaaa 7200
ctcggggtcg gatcgggcaa gctcaatggt ctgcttggag tactcgccag tggccagaga 7260
gcccttgcaa gacagctcgg ccagcatgag cagacctctg gccagcttct cgttgggaga 7320
ggggactagg aactccttgt actgggagtt ctcgtagtca gagacgtcct ccttcttctg 7380
ttcagagaca gtttcctcgg caccagctcg caggccagca atgattccgg ttccgggtac 7440
accgtgggcg ttggtgatat cggaccactc ggcgattcgg tgacaccggt actggtgctt 7500
gacagtgttg ccaatatctg cgaactttct gtcctcgaac aggaagaaac cgtgcttaag 7560
agcaagttcc ttgaggggga gcacagtgcc ggcgtaggtg aagtcgtcaa tgatgtcgat 7620
atgggttttg atcatgcaca cataaggtcc gaccttatcg gcaagctcaa tgagctcctt 7680
ggtggtggta acatccagag aagcacacag gttggttttc ttggctgcca cgagcttgag 7740
cactcgagcg gcaaaggcgg acttgtggac gttagctcga gcttcgtagg agggcatttt 7800
ggtggtgaag aggagactga aataaattta gtctgcagaa ctttttatcg gaaccttatc 7860
tggggcagtg aagtatatgt tatggtaata gttacgagtt agttgaactt atagatagac 7920
tggactatac ggctatcggt ccaaattaga aagaacgtca atggctctct gggcgtcgcc 7980
tttgccgaca aaaatgtgat catgatgaaa gccagcaatg acgttgcagc tgatattgtt 8040
gtcggccaac cgcgccgaaa acgcagctgt cagacccaca gcctccaacg aagaatgtat 8100
cgtcaaagtg atccaagcac actcatagtt ggagtcgtac tccaaaggcg gcaatgacga 8160
gtcagacaga tactcgtcga ctcaggcgac gacggaattc ctgcagccca tctgcagaat 8220
tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa aacagcccca attgccccgg 8280
agaagacggc caggccgcct agatgacaaa ttcaacaact cacagctgac tttctgccat 8340
tgccactagg ggggggcctt tttatatggc caagccaagc tctccacgtc ggttgggctg 8400
cacccaacaa taaatgggta gggttgcacc aacaaaggga tgggatgggg ggtagaagat 8460
acgaggataa cggggctcaa tggcacaaat aagaacgaat actgccatta agactcgtga 8520
tccagcgact gacaccattg catcatctaa gggcctcaaa actacctcgg aactgctgcg 8580
ctgatctgga caccacagag gttccgagca ctttaggttg caccaaatgt cccaccaggt 8640
gcaggcagaa aacgctggaa cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg 8700
aggtcgagca gggtggtgtg acttgttata gcctttagag ctgcgaaagc gcgtatggat 8760
ttggctcatc aggccagatt gagggtctgt ggacacatgt catgttagtg tacttcaatc 8820
gccccctgga tatagccccg acaataggcc gtggcctcat ttttttgcct tccgcacatt 8880
tccattgctc ggtacccaca ccttgcttct cctgcacttg ccaaccttaa tactggttta 8940
cattgaccaa catcttacaa gcggggggct tgtctagggt atatataaac agtggctctc 9000
ccaatcggtt gccagtctct tttttccttt ctttccccac agattcgaaa tctaaactac 9060
acatcacaca atgcctgtta ctgacgtcct taagcgaaag tccggtgtca tcgtcggcga 9120
cgatgtccga gccgtgagta tccacgacaa gatcagtgtc gagacgacgc gttttgtgta 9180
atgacacaat ccgaaagtcg ctagcaacac acactctcta cacaaactaa cccagctct 9239
<210> 196
<211> 5031
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZF5T-PPC-E3
<400> 196
atggagtctg gacctatgcc tgccgggatc cccttccctg aatactatga ctttttcatg 60
gactggaaga cacccctggc aattgctgcc acctacaccg ccgctgttgg gctcttcaac 120
cccaaggttg gcaaagtctc gcgcgtggta gccaagtcgg ctaacgccaa gccggcagag 180
cgcacgcagt ccggcgccgc catgaccgcc tttgtctttg tccacaacct tatcctctgc 240
gtgtactctg gaatcacctt ctactacatg ttcccagcca tggtcaagaa ctttagaaca 300
cataccctcc atgaggccta ctgcgatacg gatcagagcc tgtggaacaa cgcccttggc 360
tactggggct acctcttcta cctttcaaag ttttacgagg tcattgacac catcatcatc 420
atcttgaagg ggcgccgctc gtccctgctc cagacctacc accacgccgg cgctatgatc 480
accatgtggt ccggcatcaa ctaccaggca acgcccattt ggatttttgt cgtcttcaac 540
tcgttcatcc acaccatcat gtactgttac tatgccttca cctcaatcgg cttccacccc 600
ccargcaaga agtacctcac ctccatgcag atcacccagt ttttggtcgg catcactatc 660
gccgtctctt atctcttcgt ccctggatgt atccgcacac ccggtgctca gatggctgtc 720
tggatcaacg tcggatacct ctttcccctc acttatctct ttgtggattt tgccaagcgt 780
acttactcca agcgtagtgc catcgccgct cagaagaagg cccagtaagg ccgcattgat 840
gattggaaac acacacatgg gttatatcta ggtgagagtt agttggacag ttatatatta 900
aatcagctat gccaacggta acttcattca tgtcaacgag gaaccagtga ctgcaagtaa 960
tatagaattt gaccaccttg ccattctctt gcactccttt actatatctc atttatttct 1020
tatatacaaa tcacttcttc ttcccagcat cgagctcgga aacctcatga gcaataacat 1080
cgtggatctc gtcaatagag ggctttttgg actccttgct gttggccacc ttgtccttgc 1140
tgtctggctc attctgtttc aacgcctttt aattaatcga gcttggcgta atcatggtca 1200
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 1260
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 1320
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 1380
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 1440
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 1500
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 1560
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 1620
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 1680
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 1740
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 1800
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 1860
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 1920
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 1980
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 2040
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 2100
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 2160
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 2220
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 2280
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 2340
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 2400
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 2460
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 2520
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 2580
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 2640
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 2700
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 2760
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 2820
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 2880
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 2940
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 3000
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 3060
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 3120
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 3180
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 3240
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 3300
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgcgccctgt 3360
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 3420
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 3480
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 3540
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 3600
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 3660
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 3720
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 3780
aacaaaatat taacgcttac aatttccatt cgccattcag gctgcgcaac tgttgggaag 3840
ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 3900
ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 3960
gtgaattgta atacgactca ctatagggcg aattgggtac cgggcccccc ctcgaggtcg 4020
acgtttaaac agtgtacgca gtactataga ggaacatcga ttgccccgga gaagacggcc 4080
aggccgccta gatgacaaat tcaacaactc acagctgact ttctgccatt gccactaggg 4140
gggggccttt ttatatggcc aagccaagct ctccacgtcg gttgggctgc acccaacaat 4200
aaatgggtag ggttgcacca acaaagggat gggatggggg gtagaagata cgaggataac 4260
ggggctcaat ggcacaaata agaacgaata ctgccattaa gactcgtgat ccagcgactg 4320
acaccattgc atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac 4380
accacagagg ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa 4440
acgctggaac agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag 4500
ggtggtgtga cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca 4560
ggccagattg agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat 4620
atagccccga caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg 4680
gtacccacac cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac 4740
atcttacaag cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg 4800
ccagtctctt ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacacaa 4860
tgcctgttac tgacgtcctt aagcgaaagt ccggtgtcat cgtcggcgac gatgtccgag 4920
ccgtgagtat ccacgacaag atcagtgtcg agacgacgcg ttttgtgtaa tgacacaatc 4980
cgaaagtcgc tagcaacaca cactctctac acaaactaac ccagctctcc a 5031
<210> 197
<211> 8462
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF6S
<400> 197
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000
gacgagtcag acagatactc gtcgactcag gcgacgacgg aattcctgca gcccatctgc 6060
agaattcagg agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc 6120
cccggagaag acggccaggc cgcctagatg acaaattcaa caactcacag ctgactttct 6180
gccattgcca ctaggggggg gcctttttat atggccaagc caagctctcc acgtcggttg 6240
ggctgcaccc aacaataaat gggtagggtt gcaccaacaa agggatggga tggggggtag 6300
aagatacgag gataacgggg ctcaatggca caaataagaa cgaatactgc cattaagact 6360
cgtgatccag cgactgacac cattgcatca tctaagggcc tcaaaactac ctcggaactg 6420
ctgcgctgat ctggacacca cagaggttcc gagcacttta ggttgcacca aatgtcccac 6480
caggtgcagg cagaaaacgc tggaacagcg tgtacagttt gtcttaacaa aaagtgaggg 6540
cgctgaggtc gagcagggtg gtgtgacttg ttatagcctt tagagctgcg aaagcgcgta 6600
tggatttggc tcatcaggcc agattgaggg tctgtggaca catgtcatgt tagtgtactt 6660
caatcgcccc ctggatatag ccccgacaat aggccgtggc ctcatttttt tgccttccgc 6720
acatttccat tgctcggtac ccacaccttg cttctcctgc acttgccaac cttaatactg 6780
gtttacattg accaacatct tacaagcggg gggcttgtct agggtatata taaacagtgg 6840
ctctcccaat cggttgccag tctctttttt cctttctttc cccacagatt cgaaatctaa 6900
actacacatc acacaatgcc tgttactgac gtccttaagc gaaagtccgg tgtcatcgtc 6960
ggcgacgatg tccgagccgt gagtatccac gacaagatca gtgtcgagac gacgcgtttt 7020
gtgtaatgac acaatccgaa agtcgctagc aacacacact ctctacacaa actaacccag 7080
ctctccatgg ctgccgctcc ctctgtgcga acctttaccc gagccgaggt tctgaacgct 7140
gaggctctga acgagggcaa gaaggacgct gaggctccct tcctgatgat catcgacaac 7200
aaggtgtacg acgtccgaga gttcgtccct gaccatcctg gaggctccgt gattctcacc 7260
cacgttggca aggacggcac cgacgtcttt gacacctttc atcccgaggc tgcttgggag 7320
actctcgcca acttctacgt tggagacatt gacgagtccg accgagacat caagaacgat 7380
gactttgccg ctgaggtccg aaagctgcga accctgttcc agtctctcgg ctactacgac 7440
tcctctaagg cctactacgc cttcaaggtc tccttcaacc tctgcatctg gggactgtcc 7500
accgtcattg tggccaagtg gggtcagacc tccaccctcg ccaacgtgct ctctgctgcc 7560
ctgctcggcc tgttctggca gcagtgcgga tggctggctc acgactttct gcaccaccag 7620
gtcttccagg accgattctg gggtgatctc ttcggagcct tcctgggagg tgtctgccag 7680
ggcttctcct cttcctggtg gaaggacaag cacaacactc accatgccgc tcccaacgtg 7740
catggcgagg atcctgacat tgacacccac cctctcctga cctggtccga gcacgctctg 7800
gagatgttct ccgacgtccc cgatgaggag ctgacccgaa tgtggtctcg attcatggtc 7860
ctgaaccaga cctggttcta cttccccatt ctctccttcg ctcgactgtc ttggtgcctc 7920
cagtccattc tctttgtgct gcccaacggt caggctcaca agccctccgg agctcgagtg 7980
cccatctccc tggtcgagca gctgtccctc gccatgcact ggacctggta cctcgctacc 8040
atgttcctgt tcatcaagga tcctgtcaac atgctcgtgt acttcctggt gtctcaggct 8100
gtgtgcggaa acctgctcgc catcgtgttc tccctcaacc acaacggtat gcctgtgatc 8160
tccaaggagg aggctgtcga catggatttc tttaccaagc agatcatcac tggtcgagat 8220
gtccatcctg gactgttcgc caactggttc accggtggcc tgaactacca gatcgagcat 8280
cacctgttcc cttccatgcc tcgacacaac ttctccaaga tccagcctgc cgtcgagacc 8340
ctgtgcaaga agtacaacgt ccgataccac accactggta tgatcgaggg aactgccgag 8400
gtcttctccc gactgaacga ggtctccaag gccacctcca agatgggcaa ggctcagtaa 8460
gc 8462
<210> 198
<211> 11046
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF6S-E3WT
<400> 198
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500
atgctcaatc gatgcagaat tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa 4560
aacagcccca attgccccaa ttgaccccaa attgacccag tagcgggccc aaccccggcg 4620
agagccccct tcaccccaca tatcaaacct cccccggttc ccacacttgc cgttaagggc 4680
gtagggtact gcagtctgga atctacgctt gttcagactt tgtactagtt tctttgtctg 4740
gccatccggg taacccatgc cggacgcaaa atagactact gaaaattttt ttgctttgtg 4800
gttgggactt tagccaaggg tataaaagac caccgtcccc gaattacctt tcctcttctt 4860
ttctctctct ccttgtcaac tcacacccga aatcgttaag catttccttc tgagtataag 4920
aatcattcac caggagagac cgggttggcg gcgtatttgt gtcccaaaaa acagccccaa 4980
ttgccccgga gaagacggcc aggccgccta gatgacaaat tcaacaactc acagctgact 5040
ttctgccatt gccactaggg gggggccttt ttatatggcc aagccaagct ctccacgtcg 5100
gttgggctgc acccaacaat aaatgggtag ggttgcacca acaaagggat gggatggggg 5160
gtagaagata cgaggataac ggggctcaat ggcacaaata agaacgaata ctgccattaa 5220
gactcgtgat ccagcgactg acaccattgc atcatctaag ggcctcaaaa ctacctcgga 5280
actgctgcgc tgatctggac accacagagg ttccgagcac tttaggttgc accaaatgtc 5340
ccaccaggtg caggcagaaa acgctggaac agcgtgtaca gtttgtctta acaaaaagtg 5400
agggcgctga ggtcgagcag ggtggtgtga cttgttatag cctttagagc tgcgaaagcg 5460
cgtatggatt tggctcatca ggccagattg agggtctgtg gacacatgtc atgttagtgt 5520
acttcaatcg ccccctggat atagccccga caataggccg tggcctcatt tttttgcctt 5580
ccgcacattt ccattgctcg gtacccacac cttgcttctc ctgcacttgc caaccttaat 5640
actggtttac attgaccaac atcttacaag cggggggctt gtctagggta tatataaaca 5700
gtggctctcc caatcggttg ccagtctctt ttttcctttc tttccccaca gattcgaaat 5760
ctaaactaca catcacacaa tgcctgttac tgacgtcctt aagcgaaagt ccggtgtcat 5820
cgtcggcgac gatgtccgag ccgtgagtat ccacgacaag atcagtgtcg agacgacgcg 5880
ttttgtgtaa tgacacaatc cgaaagtcgc tagcaacaca cactctctac acaaactaac 5940
ccagctatgg agtctggacc tatgcctgcc gggatcccct tccctgaata ctatgacttt 6000
ttcatggact ggaagacacc cctggcaatt gctgccacct acaccgccgc tgttgggctc 6060
ttcaacccca aggttggcaa agtctcgcgc gtggtagcca agtcggctaa cgccaagccg 6120
gcagagcgca cgcagtccgg cgccgccatg accgcctttg tctttgtcca caaccttatc 6180
ctctgcgtgt actctggaat caccttctac tacatgttcc cagccatggt caagaacttt 6240
agaacacata ccctccatga ggcctactgc gatacggatc agagcctgtg gaacaacgcc 6300
cttggctact ggggctacct cttctacctt tcaaagtttt acgaggtcat tgacaccatc 6360
atcatcatct tgaaggggcg ccgctcgtcc ctgctccaga cctaccacca cgccggcgct 6420
atgatcacca tgtggtccgg catcaactac caggcaacgc ccatttggat ttttgtcgtc 6480
ttcaactcgt tcatccacac catcatgtac tgttactatg ccttcacctc aatcggcttc 6540
caccccccar gcaagaagta cctcacctcc atgcagatca cccagttttt ggtcggcatc 6600
actatcgccg tctcttatct cttcgtccct ggatgtatcc gcacacccgg tgctcagatg 6660
gctgtctgga tcaacgtcgg atacctcttt cccctcactt atctctttgt ggattttgcc 6720
aagcgtactt actccaagcg tagtgccatc gccgctcaga agaaggccca gtaaattgat 6780
gattggaaac acacacatgg gttatatcta ggtgagagtt agttggacag ttatatatta 6840
aatcagctat gccaacggta acttcattca tgtcaacgag gaaccagtga ctgcaagtaa 6900
tatagaattt gaccaccttg ccattctctt gcactccttt actatatctc atttatttct 6960
tatatacaaa tcacttcttc ttcccagcat cgagctcgga aacctcatga gcaataacat 7020
cgtggatctc gtcaatagag ggctttttgg actccttgct gttggccacc ttgtccttgc 7080
tgtctggctc attctgtttc aacgcctttt aattaagtca tacacaagtc agctttcttc 7140
gagcctcata taagtataag tagttcaacg tattagcact gtacccagca tctccgtatc 7200
gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt tgtgcagtat 7260
catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa gcgctccata 7320
cttgcacgct ctctatatac acagttaaat tacatatcca tagtctaacc tctaacagtt 7380
aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct caataggatc 7440
tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg tagacatgac 7500
atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa gacccacccc 7560
gggggtcaga ataagccagt cctcagagtc gcccttaggt cggttctggg caatgaagcc 7620
aaccacaaac tcggggtcgg atcgggcaag ctcaatggtc tgcttggagt actcgccagt 7680
ggccagagag cccttgcaag acagctcggc cagcatgagc agacctctgg ccagcttctc 7740
gttgggagag gggactagga actccttgta ctgggagttc tcgtagtcag agacgtcctc 7800
cttcttctgt tcagagacag tttcctcggc accagctcgc aggccagcaa tgattccggt 7860
tccgggtaca ccgtgggcgt tggtgatatc ggaccactcg gcgattcggt gacaccggta 7920
ctggtgcttg acagtgttgc caatatctgc gaactttctg tcctcgaaca ggaagaaacc 7980
gtgcttaaga gcaagttcct tgagggggag cacagtgccg gcgtaggtga agtcgtcaat 8040
gatgtcgata tgggttttga tcatgcacac ataaggtccg accttatcgg caagctcaat 8100
gagctccttg gtggtggtaa catccagaga agcacacagg ttggttttct tggctgccac 8160
gagcttgagc actcgagcgg caaaggcgga cttgtggacg ttagctcgag cttcgtagga 8220
gggcattttg gtggtgaaga ggagactgaa ataaatttag tctgcagaac tttttatcgg 8280
aaccttatct ggggcagtga agtatatgtt atggtaatag ttacgagtta gttgaactta 8340
tagatagact ggactatacg gctatcggtc caaattagaa agaacgtcaa tggctctctg 8400
ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag ccagcaatga cgttgcagct 8460
gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc agacccacag cctccaacga 8520
agaatgtatc gtcaaagtga tccaagcaca ctcatagttg gagtcgtact ccaaaggcgg 8580
caatgacgag tcagacagat actcgtcgac tcaggcgacg acggaattcc tgcagcccat 8640
ctgcagaatt caggagagac cgggttggcg gcgtatttgt gtcccaaaaa acagccccaa 8700
ttgccccgga gaagacggcc aggccgccta gatgacaaat tcaacaactc acagctgact 8760
ttctgccatt gccactaggg gggggccttt ttatatggcc aagccaagct ctccacgtcg 8820
gttgggctgc acccaacaat aaatgggtag ggttgcacca acaaagggat gggatggggg 8880
gtagaagata cgaggataac ggggctcaat ggcacaaata agaacgaata ctgccattaa 8940
gactcgtgat ccagcgactg acaccattgc atcatctaag ggcctcaaaa ctacctcgga 9000
actgctgcgc tgatctggac accacagagg ttccgagcac tttaggttgc accaaatgtc 9060
ccaccaggtg caggcagaaa acgctggaac agcgtgtaca gtttgtctta acaaaaagtg 9120
agggcgctga ggtcgagcag ggtggtgtga cttgttatag cctttagagc tgcgaaagcg 9180
cgtatggatt tggctcatca ggccagattg agggtctgtg gacacatgtc atgttagtgt 9240
acttcaatcg ccccctggat atagccccga caataggccg tggcctcatt tttttgcctt 9300
ccgcacattt ccattgctcg gtacccacac cttgcttctc ctgcacttgc caaccttaat 9360
actggtttac attgaccaac atcttacaag cggggggctt gtctagggta tatataaaca 9420
gtggctctcc caatcggttg ccagtctctt ttttcctttc tttccccaca gattcgaaat 9480
ctaaactaca catcacacaa tgcctgttac tgacgtcctt aagcgaaagt ccggtgtcat 9540
cgtcggcgac gatgtccgag ccgtgagtat ccacgacaag atcagtgtcg agacgacgcg 9600
ttttgtgtaa tgacacaatc cgaaagtcgc tagcaacaca cactctctac acaaactaac 9660
ccagctctcc atggctgccg ctccctctgt gcgaaccttt acccgagccg aggttctgaa 9720
cgctgaggct ctgaacgagg gcaagaagga cgctgaggct cccttcctga tgatcatcga 9780
caacaaggtg tacgacgtcc gagagttcgt ccctgaccat cctggaggct ccgtgattct 9840
cacccacgtt ggcaaggacg gcaccgacgt ctttgacacc tttcatcccg aggctgcttg 9900
ggagactctc gccaacttct acgttggaga cattgacgag tccgaccgag acatcaagaa 9960
cgatgacttt gccgctgagg tccgaaagct gcgaaccctg ttccagtctc tcggctacta 10020
cgactcctct aaggcctact acgccttcaa ggtctccttc aacctctgca tctggggact 10080
gtccaccgtc attgtggcca agtggggtca gacctccacc ctcgccaacg tgctctctgc 10140
tgccctgctc ggcctgttct ggcagcagtg cggatggctg gctcacgact ttctgcacca 10200
ccaggtcttc caggaccgat tctggggtga tctcttcgga gccttcctgg gaggtgtctg 10260
ccagggcttc tcctcttcct ggtggaagga caagcacaac actcaccatg ccgctcccaa 10320
cgtgcatggc gaggatcctg acattgacac ccaccctctc ctgacctggt ccgagcacgc 10380
tctggagatg ttctccgacg tccccgatga ggagctgacc cgaatgtggt ctcgattcat 10440
ggtcctgaac cagacctggt tctacttccc cattctctcc ttcgctcgac tgtcttggtg 10500
cctccagtcc attctctttg tgctgcccaa cggtcaggct cacaagccct ccggagctcg 10560
agtgcccatc tccctggtcg agcagctgtc cctcgccatg cactggacct ggtacctcgc 10620
taccatgttc ctgttcatca aggatcctgt caacatgctc gtgtacttcc tggtgtctca 10680
ggctgtgtgc ggaaacctgc tcgccatcgt gttctccctc aaccacaacg gtatgcctgt 10740
gatctccaag gaggaggctg tcgacatgga tttctttacc aagcagatca tcactggtcg 10800
agatgtccat cctggactgt tcgccaactg gttcaccggt ggcctgaact accagatcga 10860
gcatcacctg ttcccttcca tgcctcgaca caacttctcc aagatccagc ctgccgtcga 10920
gaccctgtgc aagaagtaca acgtccgata ccacaccact ggtatgatcg agggaactgc 10980
cgaggtcttc tcccgactga acgaggtctc caaggccacc tccaagatgg gcaaggctca 11040
gtaagc 11046
<210> 199
<211> 6561
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZKUGPYE1-N
<400> 199
gtacgaggaa actgtctctg aacagaagaa ggaggacgtc tctgactacg agaactccca 60
gtacaaggag ttcctagtcc cctctcccaa cgagaagctg gccagaggtc tgctcatgct 120
ggccgagctg tcttgcaagg gctctctggc cactggcgag tactccaagc agaccattga 180
gcttgcccga tccgaccccg agtttgtggt tggcttcatt gcccagaacc gacctaaggg 240
cgactctgag gactggctta ttctgacccc cggggtgggt cttgacgaca agggagacgc 300
tctcggacag cagtaccgaa ctgttgagga tgtcatgtct accggaacgg atatcataat 360
tgtcggccga ggtctgtacg gccagaaccg agatcctatt gaggaggcca agcgatacca 420
gaaggctggc tgggaggctt accagaagat taactgttag aggttagact atggatatgt 480
aatttaactg tgtatataga gagcgtgcaa gtatggagcg cttgttcagc ttgtatgatg 540
gtcagacgac ctgtctgatc gagtatgtat gatactgcac aacctgtgta tccgcatgat 600
ctgtccaatg gggcatgttg ttgtgtttct cgatacggag atgctgggta cagtgctaat 660
acgttgaact acttatactt atatgaggct cgaagaaagc tgacttgtgt atgacttaat 720
taatcgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 780
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 840
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 900
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 960
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 1020
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 1080
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 1140
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 1200
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 1260
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 1320
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 1380
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 1440
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 1500
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 1560
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 1620
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 1680
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 1740
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 1800
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 1860
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 1920
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 1980
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 2040
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 2100
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 2160
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 2220
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 2280
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 2340
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 2400
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 2460
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 2520
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 2580
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 2640
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 2700
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 2760
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 2820
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 2880
cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 2940
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 3000
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 3060
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 3120
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 3180
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 3240
tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 3300
atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc 3360
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 3420
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 3480
agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat 3540
tgggtaccgg gccccccctc gaggtcgacg agtatctgtc tgactcgtca ttgccgcctt 3600
tggagtacga ctccaactat gagtgtgctt ggatcacttt gacgatacat tcttcgttgg 3660
aggctgtggg tctgacagct gcgttttcgg cgcggttggc cgacaacaat atcagctgca 3720
acgtcattgc tggctttcat catgatcaca tttttgtcgg caaaggcgac gcccagagag 3780
ccattgacgt tctttctaat ttggaccgat agccgtatag tccagtctat ctataagttc 3840
aactaactcg taactattac cataacatat acttcactgc cccagataag gttccgataa 3900
aaagttctgc agactaaatt tatttcagtc tcctcttcac caccaaaatg ccctcctacg 3960
aagctcgagt gctcaagctc gtggcagcca agaaaaccaa cctgtgtgct tctctggatg 4020
ttaccaccac caaggagctc attgagcttg ccgataaggt cggaccttat gtgtgcatga 4080
tcaaaaccca tatcgacatc attgacgact tcacctacgc cggcactgtg ctccccctca 4140
aggaacttgc tcttaagcac ggtttcttcc tgttcgagga cagaaagttc gcagatattg 4200
gcaacactgt caagcaccag taccggtgtc accgaatcgc cgagtggtcc gatatcacca 4260
acgcccacgg tgtacccgga accggaatcg atgcgtatct gtgggacatg tggtcgttgc 4320
gccattatgt aagcagcgtg tactcctctg actgtccata tggtttgctc catctcaccc 4380
tcatcgtttt cattgttcac aggcggccac aaaaaaactg tcttctctcc ttctctcttc 4440
gccttagtct actcggacca gttttagttt agcttggcgc cactggataa atgagacctc 4500
aggccttgtg atgaggaggt cacttatgaa gcatgttagg aggtgcttgt atggatagag 4560
aagcacccaa aataataaga ataataataa aacagggggc gttgtcattt catatcgtgt 4620
tttcaccatc aatacacctc caaacaatgc ccttcatgtg gccagcccca atattgtcct 4680
gtagttcaac tctatgcagc tcgtatctta ttgagcaagt aaaactctgt cagccgatat 4740
tgcccgaccc gcgacaaggg tcaacaaggt ggtgtaaggc cttcgcagaa gtcaaaactg 4800
tgccaaacaa acatctagag tctctttggt gtttctcgca tatatttwat cggctgtctt 4860
acgtatttgc gcctcggtac cggactaatt tcggatcatc cccaatacgc tttttcttcg 4920
cagctgtcaa cagtgtccat gatctatcca cctaaatggg tcatatgagg cgtataattt 4980
cgtggtgctg ataataattc ccatatattt gacacaaaac ttccccccct agacatacat 5040
ctcacaatct cacttcttgt gcttctgtca cacatctcct ccagctgact tcaactcaca 5100
cctctgcccc agttggtcta cagcggtata aggtttctcc gcatagaggt gcaccactcc 5160
tcccgatact tgtttgtgtg acttgtgggt cacgacatat atatctacac acattgcgcc 5220
accctttggt tcttccagca caacaaaaac acgacacgct aaccatggct gccgtcccta 5280
ttgaattcaa cgtcccctcc gtggaccgac cctttggtat ctacctctgg gccatctttg 5340
accaggcctg ggagaagctt ttcggctggc ccgcgtcctc tttcattttc gtgcgaaatg 5400
accccaacat ccccttttcc tctacccctc ccgtgatcat tgccatcatt gtgtactaca 5460
ttgtcatctt tggcggccga gaggtgatgc gaaacctgtc tcccatccga ctcaactggc 5520
tcttccagat ccacaacatc ttcctcaccc ttctgtccgg tatgctcctc ctcctcctcg 5580
ttgagcagct cttccccatc attgtccgac agggtatcct ctacgccatc tgcgactacg 5640
gatcttggac tcagcccatt gtcttctgct actacctcaa ctacctgacc aagtactttg 5700
agctgatcga caccgttttc cttgtgctgc gaaagaagaa gctgactttc ctccacacct 5760
accatcacgg tgccactgct cttctgtgct acacccagct cattggtaag acctcggtct 5820
cttgggtccc catcaccctt aacctgtttg tccacgttgt catgtacttc tactacttcc 5880
tggctgcgcg aggtatccga gtgtggtgga aggagtgggt cacccggctc cagatcatcc 5940
agttcgttat cgatcttgga tttgtctact ttgcctctta cacctacttc acctctacct 6000
actggccctg gatgcccaac atgggctctt gtgccggcga ggagtttgct gctatttacg 6060
gctgtggtct gctgacctct tacctcttcc tcttcatcgc cttctacatc aactcttacc 6120
gaaagccctc ttccaaggga ccttccaagc ctgttgttgc tgtcgatggc cctgttggcg 6180
gcgtcaacgc ccagactggt gcttctcgag gccagaccac tacccgatct cgacgagcat 6240
aagcggccgc aagtgtggat ggggaagtga gtgcccggtt ctgtgtgcac aattggcaat 6300
ccaagatgga tggattcaac acagggatat agcgagctac gtggtggtgc gaggatatag 6360
caacggatat ttatgtttga cacttgagaa tgtacgatac aagcactgtc caagtacaat 6420
actaaacata ctgtacatac tcatactcgt acccgggcaa cggtttcact tgagtgcagt 6480
ggctagtgct cttactcgta cagtgtgcaa tactgcgtat catagtcttt gatgtatatc 6540
gtattcattc atgttagttg c 6561
<210> 200
<211> 6498
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZKUGPYE2
<400> 200
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgaggaaact gtctctgaac agaagaagga ggacgtctct 360
gactacgaga actcccagta caaggagttc ctagtcccct ctcccaacga gaagctggcc 420
agaggtctgc tcatgctggc cgagctgtct tgcaagggct ctctggccac tggcgagtac 480
tccaagcaga ccattgagct tgcccgatcc gaccccgagt ttgtggttgg cttcattgcc 540
cagaaccgac ctaagggcga ctctgaggac tggcttattc tgacccccgg ggtgggtctt 600
gacgacaagg gagacgctct cggacagcag taccgaactg ttgaggatgt catgtctacc 660
ggaacggata tcataattgt cggccgaggt ctgtacggcc agaaccgaga tcctattgag 720
gaggccaagc gataccagaa ggctggctgg gaggcttacc agaagattaa ctgttagagg 780
ttagactatg gatatgtaat ttaactgtgt atatagagag cgtgcaagta tggagcgctt 840
gttcagcttg tatgatggtc agacgacctg tctgatcgag tatgtatgat actgcacaac 900
ctgtgtatcc gcatgatctg tccaatgggg catgttgttg tgtttctcga tacggagatg 960
ctgggtacag tgctaatacg ttgaactact tatacttata tgaggctcga agaaagctga 1020
cttgtgtatg acttaattaa tcgagcttgg cgtaatcatg gtcatagctg tttcctgtgt 1080
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 1140
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 1200
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 1260
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 1380
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 1440
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 1500
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1560
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 1620
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 1680
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 1740
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 1800
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 1860
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 1920
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 1980
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 2040
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 2100
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 2160
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 2220
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 2280
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 2340
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 2400
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 2460
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 2520
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 2580
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 2640
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 2700
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 2760
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 2820
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 2880
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 2940
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 3000
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 3060
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 3120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 3180
ttccgcgcac atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg 3240
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 3300
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 3360
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 3420
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 3480
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 3540
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 3600
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc 3660
ttacaatttc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 3720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 3780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga 3840
ctcactatag ggcgaattgg gtaccgggcc ccccctcgag gtcgacgagt atctgtctga 3900
ctcgtcattg ccgcctttgg agtacgactc caactatgag tgtgcttgga tcactttgac 3960
gatacattct tcgttggagg ctgtgggtct gacagctgcg ttttcggcgc ggttggccga 4020
caacaatatc agctgcaacg tcattgctgg ctttcatcat gatcacattt ttgtcggcaa 4080
aggcgacgcc cagagagcca ttgacgttct ttctaatttg gaccgatagc cgtatagtcc 4140
agtctatcta taagttcaac taactcgtaa ctattaccat aacatatact tcactgcccc 4200
agataaggtt ccgataaaaa gttctgcaga ctaaatttat ttcagtctcc tcttcaccac 4260
caaaatgccc tcctacgaag ctcgagtgct caagctcgtg gcagccaaga aaaccaacct 4320
gtgtgcttct ctggatgtta ccaccaccaa ggagctcatt gagcttgccg ataaggtcgg 4380
accttatgtg tgcatgatca aaacccatat cgacatcatt gacgacttca cctacgccgg 4440
cactgtgctc cccctcaagg aacttgctct taagcacggt ttcttcctgt tcgaggacag 4500
aaagttcgca gatattggca acactgtcaa gcaccagtac cggtgtcacc gaatcgccga 4560
gtggtccgat atcaccaacg cccacggtgt acccggaacc ggaatcgatg cgtatctgtg 4620
ggacatgtgg tcgttgcgcc attatgtaag cagcgtgtac tcctctgact gtccatatgg 4680
tttgctccat ctcaccctca tcgttttcat tgttcacagg cggccacaaa aaaactgtct 4740
tctctccttc tctcttcgcc ttagtctact cggaccagtt ttagtttagc ttggcgccac 4800
tggataaatg agacctcagg ccttgtgatg aggaggtcac ttatgaagca tgttaggagg 4860
tgcttgtatg gatagagaag cacccaaaat aataagaata ataataaaac agggggcgtt 4920
gtcatttcat atcgtgtttt caccatcaat acacctccaa acaatgccct tcatgtggcc 4980
agccccaata ttgtcctgta gttcaactct atgcagctcg tatcttattg agcaagtaaa 5040
actctgtcag ccgatattgc ccgacccgcg acaagggtca acaaggtggt gtaaggcctt 5100
cgcagaagtc aaaactgtgc caaacaaaca tctagagtct ctttggtgtt tctcgcatat 5160
atttwatcgg ctgtcttacg tatttgcgcc tcggtaccgg actaatttcg gatcatcccc 5220
aatacgcttt ttcttcgcag ctgtcaacag tgtccatgat ctatccacct aaatgggtca 5280
tatgaggcgt ataatttcgt ggtgctgata ataattccca tatatttgac acaaaacttc 5340
cccccctaga catacatctc acaatctcac ttcttgtgct tctgtcacac atctcctcca 5400
gctgacttca actcacacct ctgccccagt tggtctacag cggtataagg tttctccgca 5460
tagaggtgca ccactcctcc cgatacttgt ttgtgtgact tgtgggtcac gacatatata 5520
tctacacaca ttgcgccacc ctttggttct tccagcacaa caaaaacacg acacgctaac 5580
catggtctcg tcaatctcgc ccgacctata ctcgtccttc tcgttcaaaa actcgctcgc 5640
cgaggccatg ccctccgtgc cacacgaact catcaactca aaaacactct catggatgta 5700
caatgcctct ctggacattc gggttcctct gactatcgga accatctacg ccgtctccgt 5760
gcacctgacc aactcatctg aacgaatcaa gaaacgccag cccattgcct ttgccaagac 5820
cgcactcttc aagtggctct gtgtcctcca caatgcaggt ctgtgtctct actcagcatg 5880
gacctttgtc ggtatcctca acgccgtcaa acacgcctac caaatcacag gagacagctc 5940
cgcccccttc tccttcaaca ccctctgggg atcgttttgt tcacgtgact ccctctgggt 6000
caccggcctc aactactacg gatactggtt ctatctgtcc aaattctacg aagtggtgga 6060
caccatgatc atcctcgcaa agggaaaacc gtcctcaatg ctccagacat accaccacac 6120
cggcgccatg ttctccatgt gggccggcat ccgattcgcc tctcccccca tctggatctt 6180
tgtggttttc aactccctca tccacacaat catgtacttt tactacaccc tcaccaccct 6240
caagatcaag gttcccaaga tcctcaaggc atctctgacc accgcccaga tcacccagat 6300
tgtcggaggt ggcatcctgg ctgcctccca cgcctttatt tattacaagg accaccagac 6360
tgagaccgtc tgttcttgtc tcactaccca gggtcagttt ttcgctctcg ccgtcaatgt 6420
catctatctg agtcctctgg cctatctctt tattgccttc tggattcgat cttacttgaa 6480
ggccaagtcc aactaagc 6498
<210> 201
<211> 10195
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF6TYE2
<400> 201
ggccgcatgg agcgtgtgtt ctgagtcgat gttttctatg gagttgtgag tgttagtaga 60
catgatgggt ttatatatga tgaatgaata gatgtgattt tgatttgcac gatggaattg 120
agaactttgt aaacgtacat gggaatgtat gaatgtgggg gttttgtgac tggataactg 180
acggtcagtg gacgccgttg ttcaaatatc caagagatgc gagaaacttt gggtcaagtg 240
aacatgtcct ctctgttcaa gtaaaccatc aactatgggt agtatattta gtaaggacaa 300
gagttgagat tctttggagt cctagaaacg tattttcgcg ttccaagatc aaattagtag 360
agtaatacgg gcacgggaat ccattcatag tctcaatcct gcaggtgagt taattaagtc 420
atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 480
tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 540
gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 600
aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 660
atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 720
cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 780
atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 840
cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 900
tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 960
ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 1020
cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 1080
ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 1140
caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 1200
ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 1260
gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 1320
ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 1380
gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 1440
gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 1500
gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 1560
gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 1620
gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 1680
aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 1740
gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 1800
cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 1860
ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga ctcaggcgac 1920
gacggaattc ctgcagccca tctgcagaat tcaggagaga ccgggttggc ggcgtatttg 1980
tgtcccaaaa aacagcccca attgccccgg agaagacggc caggccgcct agatgacaaa 2040
ttcaacaact cacagctgac tttctgccat tgccactagg ggggggcctt tttatatggc 2100
caagccaagc tctccacgtc ggttgggctg cacccaacaa taaatgggta gggttgcacc 2160
aacaaaggga tgggatgggg ggtagaagat acgaggataa cggggctcaa tggcacaaat 2220
aagaacgaat actgccatta agactcgtga tccagcgact gacaccattg catcatctaa 2280
gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag gttccgagca 2340
ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa cagcgtgtac 2400
agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg acttgttata 2460
gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt gagggtctgt 2520
ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg acaataggcc 2580
gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca ccttgcttct 2640
cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa gcggggggct 2700
tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct tttttccttt 2760
ctttccccac agattcgaaa tctaaactac acatcacaca atgcctgtta ctgacgtcct 2820
taagcgaaag tccggtgtca tcgtcggcga cgatgtccga gccgtgagta tccacgacaa 2880
gatcagtgtc gagacgacgc gttttgtgta atgacacaat ccgaaagtcg ctagcaacac 2940
acactctcta cacaaactaa cccagctctc catggctgcc gctccctctg tgcgaacctt 3000
tacccgagcc gaggttctga acgctgaggc tctgaacgag ggcaagaagg acgctgaggc 3060
tcccttcctg atgatcatcg acaacaaggt gtacgacgtc cgagagttcg tccctgacca 3120
tcctggaggc tccgtgattc tcacccacgt tggcaaggac ggcaccgacg tctttgacac 3180
ctttcatccc gaggctgctt gggagactct cgccaacttc tacgttggag acattgacga 3240
gtccgaccga gacatcaaga acgatgactt tgccgctgag gtccgaaagc tgcgaaccct 3300
gttccagtct ctcggctact acgactcctc taaggcctac tacgccttca aggtctcctt 3360
caacctctgc atctggggac tgtccaccgt cattgtggcc aagtggggtc agacctccac 3420
cctcgccaac gtgctctctg ctgccctgct cggcctgttc tggcagcagt gcggatggct 3480
ggctcacgac tttctgcacc accaggtctt ccaggaccga ttctggggtg atctcttcgg 3540
agccttcctg ggaggtgtct gccagggctt ctcctcttcc tggtggaagg acaagcacaa 3600
cactcaccat gccgctccca acgtgcatgg cgaggatcct gacattgaca cccaccctct 3660
cctgacctgg tccgagcacg ctctggagat gttctccgac gtccccgatg aggagctgac 3720
ccgaatgtgg tctcgattca tggtcctgaa ccagacctgg ttctacttcc ccattctctc 3780
cttcgctcga ctgtcttggt gcctccagtc cattctcttt gtgctgccca acggtcaggc 3840
tcacaagccc tccggagctc gagtgcccat ctccctggtc gagcagctgt ccctcgccat 3900
gcactggacc tggtacctcg ctaccatgtt cctgttcatc aaggatcctg tcaacatgct 3960
cgtgtacttc ctggtgtctc aggctgtgtg cggaaacctg ctcgccatcg tgttctccct 4020
caaccacaac ggtatgcctg tgatctccaa ggaggaggct gtcgacatgg atttctttac 4080
caagcagatc atcactggtc gagatgtcca tcctggactg ttcgccaact ggttcaccgg 4140
tggcctgaac taccagatcg agcatcacct gttcccttcc atgcctcgac acaacttctc 4200
caagatccag cctgccgtcg agaccctgtg caagaagtac aacgtccgat accacaccac 4260
tggtatgatc gagggaactg ccgaggtctt ctcccgactg aacgaggtct ccaaggccac 4320
ctccaagatg ggcaaggctc agtaagcggc cgcaagtgtg gatggggaag tgagtgcccg 4380
gttctgtgtg cacaattggc aatccaagat ggatggattc aacacaggga tatagcgagc 4440
tacgtggtgg tgcgaggata tagcaacgga tatttatgtt tgacacttga gaatgtacga 4500
tacaagcact gtccaagtac aatactaaac atactgtaca tactcatact cgtacccggg 4560
caacggtttc acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg 4620
tatcatagtc tttgatgtat atcgtattca ttcatgttag ttgcgtacga gccggaagca 4680
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 4740
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 4800
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 4860
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 4920
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 4980
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 5040
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 5100
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 5160
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 5220
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 5280
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 5340
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 5400
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 5460
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 5520
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 5580
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 5640
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 5700
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 5760
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 5820
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 5880
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 5940
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 6000
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 6060
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 6120
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 6180
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 6240
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 6300
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 6360
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 6420
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 6480
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 6540
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 6600
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 6660
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 6720
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg 6780
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 6840
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 6900
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 6960
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 7020
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 7080
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 7140
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 7200
aaatattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 7260
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 7320
attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 7380
attgtaatac gactcactat agggcgaatt gggtaccggg ccccccctcg aggtcgatgg 7440
tgtcgataag cttgatatcg aattcatgtc acacaaaccg atcttcgcct caaggaaacc 7500
taattctaca tccgagagac tgccgagatc cagtctacac tgattaattt tcgggccaat 7560
aatttaaaaa aatcgtgtta tataatatta tatgtattat atatatacat catgatgata 7620
ctgacagtca tgtcccattg ctaaatagac agactccatc tgccgcctcc aactgatgtt 7680
ctcaatattt aaggggtcat ctcgcattgt ttaataataa acagactcca tctaccgcct 7740
ccaaatgatg ttctcaaaat atattgtatg aacttatttt tattacttag tattattaga 7800
caacttactt gctttatgaa aaacacttcc tatttaggaa acaatttata atggcagttc 7860
gttcatttaa caatttatgt agaataaatg ttataaatgc gtatgggaaa tcttaaatat 7920
ggatagcata aatgatatct gcattgccta attcgaaatc aacagcaacg aaaaaaatcc 7980
cttgtacaac ataaatagtc atcgagaaat atcaactatc aaagaacagc tattcacacg 8040
ttactattga gattattatt ggacgagaat cacacactca actgtctttc tctcttctag 8100
aaatacaggt acaagtatgt actattctca ttgttcatac ttctagtcat ttcatcccac 8160
atattccttg gatttctctc caatgaatga cattctatct tgcaaattca acaattataa 8220
taagatatac caaagtagcg gtatagtggc aatcaaaaag cttctctggt gtgcttctcg 8280
tatttatttt tattctaatg atccattaaa ggtatatatt tatttcttgt tatataatcc 8340
ttttgtttat tacatgggct ggatacataa aggtattttg atttaatttt ttgcttaaat 8400
tcaatccccc ctcgttcagt gtcaactgta atggtaggaa attaccatac ttttgaagaa 8460
gcaaaaaaaa tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc gcagaatcta 8520
gaatgcggta tgcggtacat tgttcttcga acgtaaaagt tgcgctccct gagatattgt 8580
acatttttgc ttttacaagt acaagtacat cgtacaacta tgtactactg ttgatgcatc 8640
cacaacagtt tgttttgttt ttttttgttt tttttttttc taatgattca ttaccgctat 8700
gtatacctac ttgtacttgt agtaagccgg gttattggcg ttcaattaat catagactta 8760
tgaatctgca cggtgtgcgc tgcgagttac ttttagctta tgcatgctac ttgggtgtaa 8820
tattgggatc tgttcggaaa tcaacggatg ctcaatcgat gcagaattca ggagagaccg 8880
ggttggcggc gtatttgtgt cccaaaaaac agccccaatt gccccaattg accccaaatt 8940
gacccagtag cgggcccaac cccggcgaga gcccccttca ccccacatat caaacctccc 9000
ccggttccca cacttgccgt taagggcgta gggtactgca gtctggaatc tacgcttgtt 9060
cagactttgt actagtttct ttgtctggcc atccgggtaa cccatgccgg acgcaaaata 9120
gactactgaa aatttttttg ctttgtggtt gggactttag ccaagggtat aaaagaccac 9180
cgtccccgaa ttacctttcc tcttcttttc tctctctcct tgtcaactca cacccgaaat 9240
cgttaagcat ttccttctga gtataagaat cattcaccat ggtctcgtca atctcgcccg 9300
acctatactc gtccttctcg ttcaaaaact cgctcgccga ggccatgccc tccgtgccac 9360
acgaactcat caactcaaaa acactctcat ggatgtacaa tgcctctctg gacattcggg 9420
ttcctctgac tatcggaacc atctacgccg tctccgtgca cctgaccaac tcatctgaac 9480
gaatcaagaa acgccagccc attgcctttg ccaagaccgc actcttcaag tggctctgtg 9540
tcctccacaa tgcaggtctg tgtctctact cagcatggac ctttgtcggt atcctcaacg 9600
ccgtcaaaca cgcctaccaa atcacaggag acagctccgc ccccttctcc ttcaacaccc 9660
tctggggatc gttttgttca cgtgactccc tctgggtcac cggcctcaac tactacggat 9720
actggttcta tctgtccaaa ttctacgaag tggtggacac catgatcatc ctcgcaaagg 9780
gaaaaccgtc ctcaatgctc cagacatacc accacaccgg cgccatgttc tccatgtggg 9840
ccggcatccg attcgcctct ccccccatct ggatctttgt ggttttcaac tccctcatcc 9900
acacaatcat gtacttttac tacaccctca ccaccctcaa gatcaaggtt cccaagatcc 9960
tcaaggcatc tctgaccacc gcccagatca cccagattgt cggaggtggc atcctggctg 10020
cctcccacgc ctttatttat tacaaggacc accagactga gaccgtctgt tcttgtctca 10080
ctacccaggg tcagtttttc gctctcgccg tcaatgtcat ctatctgagt cctctggcct 10140
atctctttat tgccttctgg attcgatctt acttgaaggc caagtccaac taagc 10195
<210> 202
<211> 6561
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pKUGPYE1
<400> 202
gtacgaggaa actgtctctg aacagaagaa ggaggacgtc tctgactacg agaactccca 60
gtacaaggag ttcctagtcc cctctcccaa cgagaagctg gccagaggtc tgctcatgct 120
ggccgagctg tcttgcaagg gctctctggc cactggcgag tactccaagc agaccattga 180
gcttgcccga tccgaccccg agtttgtggt tggcttcatt gcccagaacc gacctaaggg 240
cgactctgag gactggctta ttctgacccc cggggtgggt cttgacgaca agggagacgc 300
tctcggacag cagtaccgaa ctgttgagga tgtcatgtct accggaacgg atatcataat 360
tgtcggccga ggtctgtacg gccagaaccg agatcctatt gaggaggcca agcgatacca 420
gaaggctggc tgggaggctt accagaagat taactgttag aggttagact atggatatgt 480
aatttaactg tgtatataga gagcgtgcaa gtatggagcg cttgttcagc ttgtatgatg 540
gtcagacgac ctgtctgatc gagtatgtat gatactgcac aacctgtgta tccgcatgat 600
ctgtccaatg gggcatgttg ttgtgtttct cgatacggag atgctgggta cagtgctaat 660
acgttgaact acttatactt atatgaggct cgaagaaagc tgacttgtgt atgacttaat 720
taatcgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 780
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 840
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 900
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 960
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 1020
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 1080
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 1140
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 1200
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 1260
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 1320
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 1380
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 1440
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 1500
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 1560
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 1620
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 1680
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 1740
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 1800
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 1860
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 1920
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 1980
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 2040
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 2100
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 2160
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 2220
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 2280
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 2340
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 2400
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 2460
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 2520
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 2580
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 2640
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 2700
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 2760
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 2820
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 2880
cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 2940
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 3000
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 3060
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 3120
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 3180
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 3240
tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 3300
atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc 3360
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 3420
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 3480
agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat 3540
tgggtaccgg gccccccctc gaggtcgacg agtatctgtc tgactcgtca ttgccgcctt 3600
tggagtacga ctccaactat gagtgtgctt ggatcacttt gacgatacat tcttcgttgg 3660
aggctgtggg tctgacagct gcgttttcgg cgcggttggc cgacaacaat atcagctgca 3720
acgtcattgc tggctttcat catgatcaca tttttgtcgg caaaggcgac gcccagagag 3780
ccattgacgt tctttctaat ttggaccgat agccgtatag tccagtctat ctataagttc 3840
aactaactcg taactattac cataacatat acttcactgc cccagataag gttccgataa 3900
aaagttctgc agactaaatt tatttcagtc tcctcttcac caccaaaatg ccctcctacg 3960
aagctcgagt gctcaagctc gtggcagcca agaaaaccaa cctgtgtgct tctctggatg 4020
ttaccaccac caaggagctc attgagcttg ccgataaggt cggaccttat gtgtgcatga 4080
tcaaaaccca tatcgacatc attgacgact tcacctacgc cggcactgtg ctccccctca 4140
aggaacttgc tcttaagcac ggtttcttcc tgttcgagga cagaaagttc gcagatattg 4200
gcaacactgt caagcaccag taccggtgtc accgaatcgc cgagtggtcc gatatcacca 4260
acgcccacgg tgtacccgga accggaatcg atgcgtatct gtgggacatg tggtcgttgc 4320
gccattatgt aagcagcgtg tactcctctg actgtccata tggtttgctc catctcaccc 4380
tcatcgtttt cattgttcac aggcggccac aaaaaaactg tcttctctcc ttctctcttc 4440
gccttagtct actcggacca gttttagttt agcttggcgc cactggataa atgagacctc 4500
aggccttgtg atgaggaggt cacttatgaa gcatgttagg aggtgcttgt atggatagag 4560
aagcacccaa aataataaga ataataataa aacagggggc gttgtcattt catatcgtgt 4620
tttcaccatc aatacacctc caaacaatgc ccttcatgtg gccagcccca atattgtcct 4680
gtagttcaac tctatgcagc tcgtatctta ttgagcaagt aaaactctgt cagccgatat 4740
tgcccgaccc gcgacaaggg tcaacaaggt ggtgtaaggc cttcgcagaa gtcaaaactg 4800
tgccaaacaa acatctagag tctctttggt gtttctcgca tatatttwat cggctgtctt 4860
acgtatttgc gcctcggtac cggactaatt tcggatcatc cccaatacgc tttttcttcg 4920
cagctgtcaa cagtgtccat gatctatcca cctaaatggg tcatatgagg cgtataattt 4980
cgtggtgctg ataataattc ccatatattt gacacaaaac ttccccccct agacatacat 5040
ctcacaatct cacttcttgt gcttctgtca cacatctcct ccagctgact tcaactcaca 5100
cctctgcccc agttggtcta cagcggtata aggtttctcc gcatagaggt gcaccactcc 5160
tcccgatact tgtttgtgtg acttgtgggt cacgacatat atatctacac acattgcgcc 5220
accctttggt tcttccagca caacaaaaac acgacacgct aaccatggct gccgtcccta 5280
ttgaattcaa cgtcccctcc gtggaccgac cctttggtat ctacctctgg gccatctttg 5340
accaggcctg ggagaagctt ttcggctggc ccgcgtcctc tttcattttc gtgcgaaatg 5400
accccaacat ccccttttcc tctacccctc ccgtgatcat tgccatcatt gtgtactaca 5460
ttgtcatctt tggcggccga gaggtgatgc gaaacctgtc tcccatccga ctcaactggc 5520
tcttccagat ccacaacatc ttcctcaccc ttctgtccgg tatgctcctc ctcctcctcg 5580
ttgagcagct cttccccatc attgtccgac agggtatcct ctacgccatc tgcgactacg 5640
gatcttggac tcagcccatt gtcttctgct actacctcaa ctacctgacc aagtactttg 5700
agctgatcga caccgttttc cttgtgctgc gaaagaagaa gctgactttc ctccacacct 5760
accaccatgg tgccactgct cttctgtgct acacccagct cattggtaag acctcggtct 5820
cttgggtccc catcaccctt aacctgtttg tccacgttgt catgtacttc tactacttcc 5880
tggctgcgcg aggtatccga gtgtggtgga aggagtgggt cacccggctc cagatcatcc 5940
agttcgttat cgatcttgga tttgtctact ttgcctctta cacctacttc acctctacct 6000
actggccctg gatgcccaac atgggctctt gtgccggcga ggagtttgct gctatttacg 6060
gctgtggtct gctgacctct tacctcttcc tcttcatcgc cttctacatc aactcttacc 6120
gaaagccctc ttccaaggga ccttccaagc ctgttgttgc tgtcgatggc cctgttggcg 6180
gcgtcaacgc ccagactggt gcttctcgag gccagaccac tacccgatct cgacgagcat 6240
aagcggccgc aagtgtggat ggggaagtga gtgcccggtt ctgtgtgcac aattggcaat 6300
ccaagatgga tggattcaac acagggatat agcgagctac gtggtggtgc gaggatatag 6360
caacggatat ttatgtttga cacttgagaa tgtacgatac aagcactgtc caagtacaat 6420
actaaacata ctgtacatac tcatactcgt acccgggcaa cggtttcact tgagtgcagt 6480
ggctagtgct cttactcgta cagtgtgcaa tactgcgtat catagtcttt gatgtatatc 6540
gtattcattc atgttagttg c 6561
<210> 203
<211> 10809
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZUF6FYE1
<400> 203
taagtcatac acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat 60
tagcactgta cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat 120
catgcggata cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca 180
tcatacaagc tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac 240
atatccatag tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg 300
gtatcgcttg gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat 360
tatgatatcc gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc 420
gtctcccttg tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc 480
cttaggtcgg ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc 540
aatggtctgc ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag 600
catgagcaga cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg 660
ggagttctcg tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc 720
agctcgcagg ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga 780
ccactcggcg attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa 840
ctttctgtcc tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac 900
agtgccggcg taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata 960
aggtccgacc ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc 1020
acacaggttg gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt 1080
gtggacgtta gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata 1140
aatttagtct gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg 1200
gtaatagtta cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa 1260
attagaaaga acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg 1320
atgaaagcca gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc 1380
agctgtcaga cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc 1440
atagttggag tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcgactca 1500
ggcgacgacg gaattcctgc agcccatctg cagaattcag gagagaccgg gttggcggcg 1560
tatttgtgtc ccaaaaaaca gccccaattg ccccggagaa gacggccagg ccgcctagat 1620
gacaaattca acaactcaca gctgactttc tgccattgcc actagggggg ggccttttta 1680
tatggccaag ccaagctctc cacgtcggtt gggctgcacc caacaataaa tgggtagggt 1740
tgcaccaaca aagggatggg atggggggta gaagatacga ggataacggg gctcaatggc 1800
acaaataaga acgaatactg ccattaagac tcgtgatcca gcgactgaca ccattgcatc 1860
atctaagggc ctcaaaacta cctcggaact gctgcgctga tctggacacc acagaggttc 1920
cgagcacttt aggttgcacc aaatgtccca ccaggtgcag gcagaaaacg ctggaacagc 1980
gtgtacagtt tgtcttaaca aaaagtgagg gcgctgaggt cgagcagggt ggtgtgactt 2040
gttatagcct ttagagctgc gaaagcgcgt atggatttgg ctcatcaggc cagattgagg 2100
gtctgtggac acatgtcatg ttagtgtact tcaatcgccc cctggatata gccccgacaa 2160
taggccgtgg cctcattttt ttgccttccg cacatttcca ttgctcggta cccacacctt 2220
gcttctcctg cacttgccaa ccttaatact ggtttacatt gaccaacatc ttacaagcgg 2280
ggggcttgtc tagggtatat ataaacagtg gctctcccaa tcggttgcca gtctcttttt 2340
tcctttcttt ccccacagat tcgaaatcta aactacacat cacacaatgc ctgttactga 2400
cgtccttaag cgaaagtccg gtgtcatcgt cggcgacgat gtccgagccg tgagtatcca 2460
cgacaagatc agtgtcgaga cgacgcgttt tgtgtaatga cacaatccga aagtcgctag 2520
caacacacac tctctacaca aactaaccca gctctccatg gctgccgctc cctctgtgcg 2580
aacctttacc cgagccgagg ttctgaacgc tgaggctctg aacgagggca agaaggacgc 2640
tgaggctccc ttcctgatga tcatcgacaa caaggtgtac gacgtccgag agttcgtccc 2700
tgaccatcct ggaggctccg tgattctcac ccacgttggc aaggacggca ccgacgtctt 2760
tgacaccttt catcccgagg ctgcttggga gactctcgcc aacttctacg ttggagacat 2820
tgacgagtcc gaccgagaca tcaagaacga tgactttgcc gctgaggtcc gaaagctgcg 2880
aaccctgttc cagtctctcg gctactacga ctcctctaag gcctactacg ccttcaaggt 2940
ctccttcaac ctctgcatct ggggactgtc caccgtcatt gtggccaagt ggggtcagac 3000
ctccaccctc gccaacgtgc tctctgctgc cctgctcggc ctgttctggc agcagtgcgg 3060
atggctggct cacgactttc tgcaccacca ggtcttccag gaccgattct ggggtgatct 3120
cttcggagcc ttcctgggag gtgtctgcca gggcttctcc tcttcctggt ggaaggacaa 3180
gcacaacact caccatgccg ctcccaacgt gcatggcgag gatcctgaca ttgacaccca 3240
ccctctcctg acctggtccg agcacgctct ggagatgttc tccgacgtcc ccgatgagga 3300
gctgacccga atgtggtctc gattcatggt cctgaaccag acctggttct acttccccat 3360
tctctccttc gctcgactgt cttggtgcct ccagtccatt ctctttgtgc tgcccaacgg 3420
tcaggctcac aagccctccg gagctcgagt gcccatctcc ctggtcgagc agctgtccct 3480
cgccatgcac tggacctggt acctcgctac catgttcctg ttcatcaagg atcctgtcaa 3540
catgctcgtg tacttcctgg tgtctcaggc tgtgtgcgga aacctgctcg ccatcgtgtt 3600
ctccctcaac cacaacggta tgcctgtgat ctccaaggag gaggctgtcg acatggattt 3660
ctttaccaag cagatcatca ctggtcgaga tgtccatcct ggactgttcg ccaactggtt 3720
caccggtggc ctgaactacc agatcgagca tcacctgttc ccttccatgc ctcgacacaa 3780
cttctccaag atccagcctg ccgtcgagac cctgtgcaag aagtacaacg tccgatacca 3840
caccactggt atgatcgagg gaactgccga ggtcttctcc cgactgaacg aggtctccaa 3900
ggccacctcc aagatgggca aggctcagta agcggccgca agtgtggatg gggaagtgag 3960
tgcccggttc tgtgtgcaca attggcaatc caagatggat ggattcaaca cagggatata 4020
gcgagctacg tggtggtgcg aggatatagc aacggatatt tatgtttgac acttgagaat 4080
gtacgataca agcactgtcc aagtacaata ctaaacatac tgtacatact catactcgta 4140
cccgggcaac ggtttcactt gagtgcagtg gctagtgctc ttactcgtac agtgtgcaat 4200
actgcgtatc atagtctttg atgtatatcg tattcattca tgttagttgc gtacgagccg 4260
gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 4320
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 4380
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 4440
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 4500
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 4560
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 4620
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 4680
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 4740
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 4800
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 4860
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 4920
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 4980
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 5040
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 5100
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 5160
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 5220
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 5280
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 5340
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 5400
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 5460
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 5520
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 5580
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 5640
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 5700
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 5760
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 5820
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 5880
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 5940
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 6000
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 6060
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 6120
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 6180
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 6240
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 6300
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgcgccct 6360
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 6420
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 6480
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 6540
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 6600
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 6660
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 6720
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 6780
ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca actgttggga 6840
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 6900
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 6960
cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc ccctcgaggt 7020
cgatggtgtc gataagcttg atatcgaatt catgtcacac aaaccgatct tcgcctcaag 7080
gaaacctaat tctacatccg agagactgcc gagatccagt ctacactgat taattttcgg 7140
gccaataatt taaaaaaatc gtgttatata atattatatg tattatatat atacatcatg 7200
atgatactga cagtcatgtc ccattgctaa atagacagac tccatctgcc gcctccaact 7260
gatgttctca atatttaagg ggtcatctcg cattgtttaa taataaacag actccatcta 7320
ccgcctccaa atgatgttct caaaatatat tgtatgaact tatttttatt acttagtatt 7380
attagacaac ttacttgctt tatgaaaaac acttcctatt taggaaacaa tttataatgg 7440
cagttcgttc atttaacaat ttatgtagaa taaatgttat aaatgcgtat gggaaatctt 7500
aaatatggat agcataaatg atatctgcat tgcctaattc gaaatcaaca gcaacgaaaa 7560
aaatcccttg tacaacataa atagtcatcg agaaatatca actatcaaag aacagctatt 7620
cacacgttac tattgagatt attattggac gagaatcaca cactcaactg tctttctctc 7680
ttctagaaat acaggtacaa gtatgtacta ttctcattgt tcatacttct agtcatttca 7740
tcccacatat tccttggatt tctctccaat gaatgacatt ctatcttgca aattcaacaa 7800
ttataataag atataccaaa gtagcggtat agtggcaatc aaaaagcttc tctggtgtgc 7860
ttctcgtatt tatttttatt ctaatgatcc attaaaggta tatatttatt tcttgttata 7920
taatcctttt gtttattaca tgggctggat acataaaggt attttgattt aattttttgc 7980
ttaaattcaa tcccccctcg ttcagtgtca actgtaatgg taggaaatta ccatactttt 8040
gaagaagcaa aaaaaatgaa agaaaaaaaa aatcgtattt ccaggttaga cgttccgcag 8100
aatctagaat gcggtatgcg gtacattgtt cttcgaacgt aaaagttgcg ctccctgaga 8160
tattgtacat ttttgctttt acaagtacaa gtacatcgta caactatgta ctactgttga 8220
tgcatccaca acagtttgtt ttgttttttt ttgttttttt tttttctaat gattcattac 8280
cgctatgtat acctacttgt acttgtagta agccgggtta ttggcgttca attaatcata 8340
gacttatgaa tctgcacggt gtgcgctgcg agttactttt agcttatgca tgctacttgg 8400
gtgtaatatt gggatctgtt cggaaatcaa cggatgctca atcgattgcc ccggagaaga 8460
cggccaggcc gcctagatga caaattcaac aactcacagc tgactttctg ccattgccac 8520
tagggggggg cctttttata tggccaagcc aagctctcca cgtcggttgg gctgcaccca 8580
acaataaatg ggtagggttg caccaacaaa gggatgggat ggggggtaga agatacgagg 8640
ataacggggc tcaatggcac aaataagaac gaatactgcc attaagactc gtgatccagc 8700
gactgacacc attgcatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc 8760
tggacaccac agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc 8820
agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg 8880
agcagggtgg tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct 8940
catcaggcca gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc 9000
tggatatagc cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt 9060
gctcggtacc cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga 9120
ccaacatctt acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc 9180
ggttgccagt ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca 9240
cacaatgcct gttactgacg tccttaagcg aaagtccggt gtcatcgtcg gcgacgatgt 9300
ccgagccgtg agtatccacg acaagatcag tgtcgagacg acgcgttttg tgtaatgaca 9360
caatccgaaa gtcgctagca acacacactc tctacacaaa ctaacccagc tctccatggc 9420
tgccgtccct attgaattca acgtcccctc cgtggaccga ccctttggta tctacctctg 9480
ggccatcttt gaccaggcct gggagaagct tttcggctgg cccgcgtcct ctttcatttt 9540
cgtgcgaaat gaccccaaca tccccttttc ctctacccct cccgtgatca ttgccatcat 9600
tgtgtactac attgtcatct ttggcggccg agaggtgatg cgaaacctgt ctcccatccg 9660
actcaactgg ctcttccaga tccacaacat cttcctcacc cttctgtccg gtatgctcct 9720
cctcctcctc gttgagcagc tcttccccat cattgtccga cagggtatcc tctacgccat 9780
ctgcgactac ggatcttgga ctcagcccat tgtcttctgc tactacctca actacctgac 9840
caagtacttt gagctgatcg acaccgtttt ccttgtgctg cgaaagaaga agctgacttt 9900
cctccacacc taccatcacg gtgccactgc tcttctgtgc tacacccagc tcattggtaa 9960
gacctcggtc tcttgggtcc ccatcaccct taacctgttt gtccacgttg tcatgtactt 10020
ctactacttc ctggctgcgc gaggtatccg agtgtggtgg aaggagtggg tcacccggct 10080
ccagatcatc cagttcgtta tcgatcttgg atttgtctac tttgcctctt acacctactt 10140
cacctctacc tactggccct ggatgcccaa catgggctct tgtgccggcg aggagtttgc 10200
tgctatttac ggctgtggtc tgctgacctc ttacctcttc ctcttcatcg ccttctacat 10260
caactcttac cgaaagccct cttccaaggg accttccaag cctgttgttg ctgtcgatgg 10320
ccctgttggc ggcgtcaacg cccagactgg tgcttctcga ggccagacca ctacccgatc 10380
tcgacgagca taagcggccg catggagcgt gtgttctgag tcgatgtttt ctatggagtt 10440
gtgagtgtta gtagacatga tgggtttata tatgatgaat gaatagatgt gattttgatt 10500
tgcacgatgg aattgagaac tttgtaaacg tacatgggaa tgtatgaatg tgggggtttt 10560
gtgactggat aactgacggt cagtggacgc cgttgttcaa atatccaaga gatgcgagaa 10620
actttgggtc aagtgaacat gtcctctctg ttcaagtaaa ccatcaacta tgggtagtat 10680
atttagtaag gacaagagtt gagattcttt ggagtcctag aaacgtattt tcgcgttcca 10740
agatcaaatt agtagagtaa tacgggcacg ggaatccatt catagtctca atcctgcagg 10800
tgagttaat 10809
<210> 204
<211> 8273
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pYCPT1-17
<400> 204
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000
gacgagtcag acagatactc gtcgactcag gcgacgacgg aattcctgca gcccatctgc 6060
agaattcagg agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc 6120
cccggagaag acggccaggc cgcctagatg acaaattcaa caactcacag ctgactttct 6180
gccattgcca ctaggggggg gcctttttat atggccaagc caagctctcc acgtcggttg 6240
ggctgcaccc aacaataaat gggtagggtt gcaccaacaa agggatggga tggggggtag 6300
aagatacgag gataacgggg ctcaatggca caaataagaa cgaatactgc cattaagact 6360
cgtgatccag cgactgacac cattgcatca tctaagggcc tcaaaactac ctcggaactg 6420
ctgcgctgat ctggacacca cagaggttcc gagcacttta ggttgcacca aatgtcccac 6480
caggtgcagg cagaaaacgc tggaacagcg tgtacagttt gtcttaacaa aaagtgaggg 6540
cgctgaggtc gagcagggtg gtgtgacttg ttatagcctt tagagctgcg aaagcgcgta 6600
tggatttggc tcatcaggcc agattgaggg tctgtggaca catgtcatgt tagtgtactt 6660
caatcgcccc ctggatatag ccccgacaat aggccgtggc ctcatttttt tgccttccgc 6720
acatttccat tgctcggtac ccacaccttg cttctcctgc acttgccaac cttaatactg 6780
gtttacattg accaacatct tacaagcggg gggcttgtct agggtatata taaacagtgg 6840
ctctcccaat cggttgccag tctctttttt cctttctttc cccacagatt cgaaatctaa 6900
actacacatc acacaatgcc tgttactgac gtccttaagc gaaagtccgg tgtcatcgtc 6960
ggcgacgatg tccgagccgt gagtatccac gacaagatca gtgtcgagac gacgcgtttt 7020
gtgtaatgac acaatccgaa agtcgctagc aacacacact ctctacacaa actaacccag 7080
ctctccatgg gcgtattcat taaacaggag cagcttccgg ctctcaagaa gtacaagtac 7140
tccgccgagg atcactcgtt catctccaac aacattctgc gccccttctg gcgacagttt 7200
gtcaaaatct tccctctgtg gatggccccc aacatggtga ctctgttggg cttcttcttt 7260
gtcattgtga acttcatcac catgctcatt gttgatccca cccacgaccg cgagcctccc 7320
agatgggtct acctcaccta cgctctgggt ctgttccttt accagacatt tgatgcctgt 7380
gacggatccc atgcccgacg aactggccag agtggacccc ttggagagct gtttgaccac 7440
tgtgtcgacg ccatgaatac ctctctgatt ctcacggtgg tggtgtccac cacccatatg 7500
ggatataaca tgaagctgct gattgtgcag attgccgctc tcggaaactt ctacctgtcg 7560
acctgggaga cctaccatac cggaactctg tacctttctg gcttctctgg tcctgttgaa 7620
ggtatcttga ttctggtggc tcttttcgtc ctcaccttct tcactggtcc caacgtgtac 7680
gctctgaccg tctacgaggc tcttcccgaa tccatcactt cgctgctgcc tgccagcttc 7740
ctggacgtca ccatcaccca gatctacatt ggattcggag tgctgggcat ggtgttcaac 7800
atctacggcg cctgcggaaa cgtgatcaag tactacaaca acaagggcaa gagcgctctc 7860
cccgccattc tcggaatcgc cccctttggc atcttctacg tcggcgtctt tgcctgggcc 7920
catgttgctc ctctgcttct ctccaagtac gccatcgtct atctgtttgc cattggggct 7980
gcctttgcca tgcaagtcgg ccagatgatt cttgcccatc tcgtgcttgc tcccttcccc 8040
cactggaacg tgctgctctt cttccccttt gtgggactgg cagtgcacta cattgcaccc 8100
gtgtttggct gggacgccga tatcgtgtcg gttaacactc tcttcacctg ttttggcgcc 8160
accctctcca tttacgcctt ctttgtgctt gagatcatcg acgagatcac caactacctc 8220
gatatctggt gtctgcgaat caagtaccct caggagaaga agactgagta agc 8273
<210> 205
<211> 7822
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pZP2l7+Ura
<400> 205
aaacggtagg ttagtgcttg gtatatgagt tgtaggcatg acaatttgga aaggggtgga 60
ctttgggaat attgtgggat ttcaatacct tagtttgtac agggtaattg ttacaaatga 120
tacaaagaac tgtatttctt ttcatttgtt ttaattggtt gtatatcaag tccgttagac 180
gagctcagtg ccttggcttt tggcactgta tttcattttt agaggtacac tacattcagt 240
gaggtatggt aaggttgagg gcataatgaa ggcaccttgt actgacagtc acagacctct 300
caccgagaat tttatgagat atactcgggt tcattttagg ctcatcgatc aggagagacc 360
gggttggcgg cgtatttgtg tcccaaaaaa cagccccaat tgccccaatt gaccccaaat 420
tgacccagta gcgggcccaa ccccggcgag agcccccttc accccacata tcaaacctcc 480
cccggttccc acacttgccg ttaagggcgt agggtactgc agtctggaat ctacgcttgt 540
tcagactttg tactagtttc tttgtctggc catccgggta acccatgccg gacgcaaaat 600
agactactga aaattttttt gctttgtggt tgggacttta gccaagggta taaaagacca 660
ccgtccccga attacctttc ctcttctttt ctctctctcc ttgtcaactc acacccgaaa 720
tcgttaagca tttccttctg agtataagaa tcattcacca tggctgagga taagaccaag 780
gtcgagttcc ctaccctgac tgagctgaag cactctatcc ctaacgcttg ctttgagtcc 840
aacctcggac tctcgctcta ctacactgcc cgagcgatct tcaacgcatc tgcctctgct 900
gctctgctct acgctgcccg atctactccc ttcattgccg ataacgttct gctccacgct 960
ctggtttgcg ccacctacat ctacgtgcag ggtgtcatct tctggggttt ctttaccgtc 1020
ggtcacgact gtggtcactc tgccttctcc cgataccact ccgtcaactt catcattggc 1080
tgcatcatgc actctgccat tctgactccc ttcgagtcct ggcgagtgac ccaccgacac 1140
catcacaaga acactggcaa cattgataag gacgagatct tctaccctca tcggtccgtc 1200
aaggacctcc aggacgtgcg acaatgggtc tacaccctcg gaggtgcttg gtttgtctac 1260
ctgaaggtcg gatatgctcc tcgaaccatg tcccactttg acccctggga ccctctcctg 1320
cttcgacgag cctccgctgt catcgtgtcc ctcggagtct gggctgcctt cttcgctgcc 1380
tacgcctacc tcacatactc gctcggcttt gccgtcatgg gcctctacta ctatgctcct 1440
ctctttgtct ttgcttcgtt cctcgtcatt actaccttct tgcatcacaa cgacgaagct 1500
actccctggt acggtgactc ggagtggacc tacgtcaagg gcaacctgag ctccgtcgac 1560
cgatcgtacg gagctttcgt ggacaacctg tctcaccaca ttggcaccca ccaggtccat 1620
cacttgttcc ctatcattcc ccactacaag ctcaacgaag ccaccaagca ctttgctgcc 1680
gcttaccctc acctcgtgag acgtaacgac gagcccatca ttactgcctt cttcaagacc 1740
gctcacctct ttgtcaacta cggagctgtg cccgagactg ctcagatttt caccctcaaa 1800
gagtctgccg ctgcagccaa ggccaagagc gactaagcgg ccgcaagtgt ggatggggaa 1860
gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt caacacaggg 1920
atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt ttgacacttg 1980
agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac atactcatac 2040
tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact cgtacagtgt 2100
gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta gttgcgtacg 2160
ggcgtcgttg cttgtgtgat ttttgaggac ccatcccttt ggtatataag tatactctgg 2220
ggttaaggtt gcccgtgtag tctaggttat agttttcatg tgaaataccg agagccgagg 2280
gagaataaac gggggtattt ggacttgttt ttttcgcgga aaagcgtcga atcaaccctg 2340
cgggccttgc accatgtcca cgacgtgttt ctcgccccaa ttcgcccctt gcacgtcaaa 2400
attaggcctc catctagacc cctccataac atgtgactgt ggggaaaagt ataagggaaa 2460
ccatgcaacc atagacgacg tgaaagacgg ggaggaacca atggaggcca aagaaatggg 2520
gtagcaacag tccaggagac agacaaggag acaaggagag ggcgcccgaa agatcggaaa 2580
aacaaacatg tccaattggg gcagtgacgg aaacgacacg gacacttcag tacaatggac 2640
cgaccatctc caagccaggg ttattccggt atcaccttgg ccgtaacctc ccgctggtac 2700
ctgatattgt acacgttcac attcaatata ctttcagcta caataagaga ggctgtttgt 2760
cgggcatgtg tgtccgtcgt atggggtgat gtccgagggc gaaattcgct acaagcttaa 2820
ctctggcgct tgtccagtat gaatagacaa gtcaagacca gtggtgccat gattgacagg 2880
gaggtacaag acttcgatac tcgagcatta ctcggacttg tggcgattga acagacgggc 2940
gatcgcttct cccccgtatt gccggcgcgc cagctgcatt aatgaatcgg ccaacgcgcg 3000
gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 3060
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 3120
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 3180
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 3240
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3300
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3360
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 3420
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 3480
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 3540
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 3600
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 3660
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 3720
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 3780
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3840
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3900
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3960
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 4020
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 4080
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 4140
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 4200
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 4260
ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 4320
gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 4380
aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 4440
ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 4500
tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 4560
ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 4620
aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 4680
ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 4740
ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 4800
agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 4860
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 4920
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg atgcggtgtg aaataccgca 4980
cagatgcgta aggagaaaat accgcatcag gaaattgtaa gcgttaatat tttgttaaaa 5040
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 5100
atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac 5160
aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag 5220
ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt 5280
aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg 5340
gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca 5400
agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag 5460
ggcgcgtcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 5520
cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 5580
cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact 5640
cactataggg cgaattgggc ccgacgtcgc atgcgctgat gacactttgg tctgaaagag 5700
atgcattttg aatcccaaac ttgcagtgcc caagtgacat acatctccgc gttttggaaa 5760
atgttcagaa acagttgatt gtgttggaat ggggaatggg gaatggaaaa atgactcaag 5820
tatcaattcc aaaaacttct ctggctggca gtacctactg tccatactac tgcattttct 5880
ccagtcaggc cactctatac tcgacgacac agtagtaaaa cccagataat ttcgacataa 5940
acaagaaaac agacccaata atatttatat atagtcagcc gtttgtccag ttcagactgt 6000
aatagccgaa aaaaaatcca aagtttctat tctaggaaaa tatattccaa tatttttaat 6060
tcttaatctc atttatttta ttctagcgaa atacatttca gctacttgag acatgtgata 6120
cccacaaatc ggattcggac tcggttgttc agaagagcat atggcattcg tgctcgcttg 6180
ttcacgtatt cttcctgttc catctcttgg ccgacaatca cacaaaaatg gggttttttt 6240
tttaattcta atgattcatt acagcaaaat tgagatatag cagaccacgt attccataat 6300
caccaaggaa gttcttgggc gtcttaatta agtcatacac aagtcagctt tcttcgagcc 6360
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 6420
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 6480
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 6540
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 6600
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 6660
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 6720
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 6780
tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 6840
caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 6900
gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 6960
gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 7020
tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 7080
gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 7140
gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 7200
taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 7260
cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 7320
ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 7380
tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 7440
ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 7500
tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 7560
agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 7620
cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 7680
tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 7740
gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 7800
acgagtcaga cagatactcg tc 7822
<210> 206
<211> 7930
<212> DNA
<213> Artificial Sequence
<220>
<223> pYCPT1-ZP2l7
<400> 206
catgggcgta ttcattaaac aggagcagct tccggctctc aagaagtaca agtactccgc 60
cgaggatcac tcgttcatct ccaacaacat tctgcgcccc ttctggcgac agtttgtcaa 120
aatcttccct ctgtggatgg cccccaacat ggtgactctg ttgggcttct tctttgtcat 180
tgtgaacttc atcaccatgc tcattgttga tcccacccac gaccgcgagc ctcccagatg 240
ggtctacctc acctacgctc tgggtctgtt cctttaccag acatttgatg cctgtgacgg 300
atcccatgcc cgacgaactg gccagagtgg accccttgga gagctgtttg accactgtgt 360
cgacgccatg aatacctctc tgattctcac ggtggtggtg tccaccaccc atatgggata 420
taacatgaag ctgctgattg tgcagattgc cgctctcgga aacttctacc tgtcgacctg 480
ggagacctac cataccggaa ctctgtacct ttctggcttc tctggtcctg ttgaaggtat 540
cttgattctg gtggctcttt tcgtcctcac cttcttcact ggtcccaacg tgtacgctct 600
gaccgtctac gaggctcttc ccgaatccat cacttcgctg ctgcctgcca gcttcctgga 660
cgtcaccatc acccagatct acattggatt cggagtgctg ggcatggtgt tcaacatcta 720
cggcgcctgc ggaaacgtga tcaagtacta caacaacaag ggcaagagcg ctctccccgc 780
cattctcgga atcgccccct ttggcatctt ctacgtcggc gtctttgcct gggcccatgt 840
tgctcctctg cttctctcca agtacgccat cgtctatctg tttgccattg gggctgcctt 900
tgccatgcaa gtcggccaga tgattcttgc ccatctcgtg cttgctccct tcccccactg 960
gaacgtgctg ctcttcttcc cctttgtggg actggcagtg cactacattg cacccgtgtt 1020
tggctgggac gccgatatcg tgtcggttaa cactctcttc acctgttttg gcgccaccct 1080
ctccatttac gccttctttg tgcttgagat catcgacgag atcaccaact acctcgatat 1140
ctggtgtctg cgaatcaagt accctcagga gaagaagact gagtaagcgg ccgcaagtgt 1200
ggatggggaa gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt 1260
caacacaggg atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt 1320
ttgacacttg agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac 1380
atactcatac tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact 1440
cgtacagtgt gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta 1500
gttgcgtacg ggcgtcgttg cttgtgtgat ttttgaggac ccatcccttt ggtatataag 1560
tatactctgg ggttaaggtt gcccgtgtag tctaggttat agttttcatg tgaaataccg 1620
agagccgagg gagaataaac gggggtattt ggacttgttt ttttcgcgga aaagcgtcga 1680
atcaaccctg cgggccttgc accatgtcca cgacgtgttt ctcgccccaa ttcgcccctt 1740
gcacgtcaaa attaggcctc catctagacc cctccataac atgtgactgt ggggaaaagt 1800
ataagggaaa ccatgcaacc atagacgacg tgaaagacgg ggaggaacca atggaggcca 1860
aagaaatggg gtagcaacag tccaggagac agacaaggag acaaggagag ggcgcccgaa 1920
agatcggaaa aacaaacatg tccaattggg gcagtgacgg aaacgacacg gacacttcag 1980
tacaatggac cgaccatctc caagccaggg ttattccggt atcaccttgg ccgtaacctc 2040
ccgctggtac ctgatattgt acacgttcac attcaatata ctttcagcta caataagaga 2100
ggctgtttgt cgggcatgtg tgtccgtcgt atggggtgat gtccgagggc gaaattcgct 2160
acaagcttaa ctctggcgct tgtccagtat gaatagacaa gtcaagacca gtggtgccat 2220
gattgacagg gaggtacaag acttcgatac tcgagcatta ctcggacttg tggcgattga 2280
acagacgggc gatcgcttct cccccgtatt gccggcgcgc cagctgcatt aatgaatcgg 2340
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 2400
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 2460
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 2520
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 2580
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 2640
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 2700
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 2760
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 2820
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 2880
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 2940
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 3000
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 3060
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 3120
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 3180
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 3240
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 3300
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 3360
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 3420
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 3480
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 3540
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 3600
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 3660
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 3720
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 3780
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 3840
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 3900
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 3960
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 4020
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 4080
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 4140
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 4200
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 4260
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg atgcggtgtg 4320
aaataccgca cagatgcgta aggagaaaat accgcatcag gaaattgtaa gcgttaatat 4380
tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 4440
aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 4500
agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 4560
cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 4620
gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 4680
gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 4740
ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 4800
gccgctacag ggcgcgtcca ttcgccattc aggctgcgca actgttggga agggcgatcg 4860
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 4920
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg 4980
taatacgact cactataggg cgaattgggc ccgacgtcgc atgcgctgat gacactttgg 5040
tctgaaagag atgcattttg aatcccaaac ttgcagtgcc caagtgacat acatctccgc 5100
gttttggaaa atgttcagaa acagttgatt gtgttggaat ggggaatggg gaatggaaaa 5160
atgactcaag tatcaattcc aaaaacttct ctggctggca gtacctactg tccatactac 5220
tgcattttct ccagtcaggc cactctatac tcgacgacac agtagtaaaa cccagataat 5280
ttcgacataa acaagaaaac agacccaata atatttatat atagtcagcc gtttgtccag 5340
ttcagactgt aatagccgaa aaaaaatcca aagtttctat tctaggaaaa tatattccaa 5400
tatttttaat tcttaatctc atttatttta ttctagcgaa atacatttca gctacttgag 5460
acatgtgata cccacaaatc ggattcggac tcggttgttc agaagagcat atggcattcg 5520
tgctcgcttg ttcacgtatt cttcctgttc catctcttgg ccgacaatca cacaaaaatg 5580
gggttttttt tttaattcta atgattcatt acagcaaaat tgagatatag cagaccacgt 5640
attccataat caccaaggaa gttcttgggc gtcttaatta agtcatacac aagtcagctt 5700
tcttcgagcc tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc 5760
gtatcgagaa acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc 5820
agtatcatac atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct 5880
ccatacttgc acgctctcta tatacacagt taaattacat atccatagtc taacctctaa 5940
cagttaatct tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata 6000
ggatctcggt tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac 6060
atgacatcct caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc 6120
accccggggg tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg 6180
aagccaacca caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg 6240
ccagtggcca gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc 6300
ttctcgttgg gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg 6360
tcctccttct tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt 6420
ccggttccgg gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac 6480
cggtactggt gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag 6540
aaaccgtgct taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg 6600
tcaatgatgt cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc 6660
tcaatgagct ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct 6720
gccacgagct tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg 6780
taggagggca ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt 6840
atcggaacct tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga 6900
acttatagat agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct 6960
ctctgggcgt cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg 7020
cagctgatat tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc 7080
aacgaagaat gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa 7140
ggcggcaatg acgagtcaga cagatactcg tcaaacggta ggttagtgct tggtatatga 7200
gttgtaggca tgacaatttg gaaaggggtg gactttggga atattgtggg atttcaatac 7260
cttagtttgt acagggtaat tgttacaaat gatacaaaga actgtatttc ttttcatttg 7320
ttttaattgg ttgtatatca agtccgttag acgagctcag tgccttggct tttggcactg 7380
tatttcattt ttagaggtac actacattca gtgaggtatg gtaaggttga gggcataatg 7440
aaggcacctt gtactgacag tcacagacct ctcaccgaga attttatgag atatactcgg 7500
gttcatttta ggctcatcga tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa 7560
aacagcccca attgccccaa ttgaccccaa attgacccag tagcgggccc aaccccggcg 7620
agagccccct tcaccccaca tatcaaacct cccccggttc ccacacttgc cgttaagggc 7680
gtagggtact gcagtctgga atctacgctt gttcagactt tgtactagtt tctttgtctg 7740
gccatccggg taacccatgc cggacgcaaa atagactact gaaaattttt ttgctttgtg 7800
gttgggactt tagccaaggg tataaaagac caccgtcccc gaattacctt tcctcttctt 7860
ttctctctct ccttgtcaac tcacacccga aatcgttaag catttccttc tgagtataag 7920
aatcattcac 7930
<210> 207
<211> 8179
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pTEF::ISC1
<400> 207
gcggccgcaa gtgtggatgg ggaagtgagt gcccggttct gtgtgcacaa ttggcaatcc 60
aagatggatg gattcaacac agggatatag cgagctacgt ggtggtgcga ggatatagca 120
acggatattt atgtttgaca cttgagaatg tacgatacaa gcactgtcca agtacaatac 180
taaacatact gtacatactc atactcgtac ccgggcaacg gtttcacttg agtgcagtgg 240
ctagtgctct tactcgtaca gtgtgcaata ctgcgtatca tagtctttga tgtatatcgt 300
attcattcat gttagttgcg tacgggcgtc gttgcttgtg tgatttttga ggacccatcc 360
ctttggtata taagtatact ctggggttaa ggttgcccgt gtagtctagg ttatagtttt 420
catgtgaaat accgagagcc gagggagaat aaacgggggt atttggactt gtttttttcg 480
cggaaaagcg tcgaatcaac cctgcgggcc ttgcaccatg tccacgacgt gtttctcgcc 540
ccaattcgcc ccttgcacgt caaaattagg cctccatcta gacccctcca taacatgtga 600
ctgtggggaa aagtataagg gaaaccatgc aaccatagac gacgtgaaag acggggagga 660
accaatggag gccaaagaaa tggggtagca acagtccagg agacagacaa ggagacaagg 720
agagggcgcc cgaaagatcg gaaaaacaaa catgtccaat tggggcagtg acggaaacga 780
cacggacact tcagtacaat ggaccgacca tctccaagcc agggttattc cggtatcacc 840
ttggccgtaa cctcccgctg gtacctgata ttgtacacgt tcacattcaa tatactttca 900
gctacaataa gagaggctgt ttgtcgggca tgtgtgtccg tcgtatgggg tgatgtccga 960
gggcgaaatt cgctacaagc ttaactctgg cgcttgtcca gtatgaatag acaagtcaag 1020
accagtggtg ccatgattga cagggaggta caagacttcg atactcgagc attactcgga 1080
cttgtggcga ttgaacagac gggcgatcgc ttctcccccg tattgccggc gcgccagctg 1140
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 1200
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 1260
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 1320
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 1380
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 1440
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 1500
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 1560
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 1620
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 1680
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 1740
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 1800
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 1860
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 1920
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 1980
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2040
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2100
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2160
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2220
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 2280
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 2340
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 2400
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 2460
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 2520
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 2580
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 2640
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 2700
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 2760
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 2820
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 2880
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 2940
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3000
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3060
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3120
cctgatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggaaatt 3180
gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt 3240
aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg 3300
ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc 3360
aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca 3420
agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga 3480
tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa 3540
ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc 3600
gccgcgctta atgcgccgct acagggcgcg tccattcgcc attcaggctg cgcaactgtt 3660
gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg 3720
ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga 3780
cggccagtga attgtaatac gactcactat agggcgaatt gggcccgacg tcgcatgcgc 3840
tgatgacact ttggtctgaa agagatgcat tttgaatccc aaacttgcag tgcccaagtg 3900
acatacatct ccgcgttttg gaaaatgttc agaaacagtt gattgtgttg gaatggggaa 3960
tggggaatgg aaaaatgact caagtatcaa ttccaaaaac ttctctggct ggcagtacct 4020
actgtccata ctactgcatt ttctccagtc aggccactct atactcgacg acacagtagt 4080
aaaacccaga taatttcgac ataaacaaga aaacagaccc aataatattt atatatagtc 4140
agccgtttgt ccagttcaga ctgtaatagc cgaaaaaaaa tccaaagttt ctattctagg 4200
aaaatatatt ccaatatttt taattcttaa tctcatttat tttattctag cgaaatacat 4260
ttcagctact tgagacatgt gatacccaca aatcggattc ggactcggtt gttcagaaga 4320
gcatatggca ttcgtgctcg cttgttcacg tattcttcct gttccatctc ttggccgaca 4380
atcacacaaa aatggggttt tttttttaat tctaatgatt cattacagca aaattgagat 4440
atagcagacc acgtattcca taatcaccaa ggaagttctt gggcgtctta attaagtcat 4500
acacaagtca gctttcttcg agcctcatat aagtataagt agttcaacgt attagcactg 4560
tacccagcat ctccgtatcg agaaacacaa caacatgccc cattggacag atcatgcgga 4620
tacacaggtt gtgcagtatc atacatactc gatcagacag gtcgtctgac catcatacaa 4680
gctgaacaag cgctccatac ttgcacgctc tctatataca cagttaaatt acatatccat 4740
agtctaacct ctaacagtta atcttctggt aagcctccca gccagccttc tggtatcgct 4800
tggcctcctc aataggatct cggttctggc cgtacagacc tcggccgaca attatgatat 4860
ccgttccggt agacatgaca tcctcaacag ttcggtactg ctgtccgaga gcgtctccct 4920
tgtcgtcaag acccaccccg ggggtcagaa taagccagtc ctcagagtcg cccttaggtc 4980
ggttctgggc aatgaagcca accacaaact cggggtcgga tcgggcaagc tcaatggtct 5040
gcttggagta ctcgccagtg gccagagagc ccttgcaaga cagctcggcc agcatgagca 5100
gacctctggc cagcttctcg ttgggagagg ggactaggaa ctccttgtac tgggagttct 5160
cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt ttcctcggca ccagctcgca 5220
ggccagcaat gattccggtt ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg 5280
cgattcggtg acaccggtac tggtgcttga cagtgttgcc aatatctgcg aactttctgt 5340
cctcgaacag gaagaaaccg tgcttaagag caagttcctt gagggggagc acagtgccgg 5400
cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat catgcacaca taaggtccga 5460
ccttatcggc aagctcaatg agctccttgg tggtggtaac atccagagaa gcacacaggt 5520
tggttttctt ggctgccacg agcttgagca ctcgagcggc aaaggcggac ttgtggacgt 5580
tagctcgagc ttcgtaggag ggcattttgg tggtgaagag gagactgaaa taaatttagt 5640
ctgcagaact ttttatcgga accttatctg gggcagtgaa gtatatgtta tggtaatagt 5700
tacgagttag ttgaacttat agatagactg gactatacgg ctatcggtcc aaattagaaa 5760
gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc 5820
cagcaatgac gttgcagctg atattgttgt cggccaaccg cgccgaaaac gcagctgtca 5880
gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg 5940
agtcgtactc caaaggcggc aatgacgagt cagacagata ctcgtcaaac ggtaggttag 6000
tgcttggtat atgagttgta ggcatgacaa tttggaaagg ggtggacttt gggaatattg 6060
tgggatttca ataccttagt ttgtacaggg taattgttac aaatgataca aagaactgta 6120
tttcttttca tttgttttaa ttggttgtat atcaagtccg ttagacgagc tcagtgcctt 6180
ggcttttggc actgtatttc atttttagag gtacactaca ttcagtgagg tatggtaagg 6240
ttgagggcat aatgaaggca ccttgtactg acagtcacag acctctcacc gagaatttta 6300
tgagatatac tcgggttcat tttaggctca tcgatcagga gagaccgggt tggcggcgta 6360
tttgtgtccc aaaaaacagc cccaattgcc ccaattgacc ccaaattgac ccagtagcgg 6420
gcccaacccc ggcgagagcc cccttcaccc cacatatcaa acctcccccg gttcccacac 6480
ttgccgttaa gggcgtaggg tactgcagtc tggaatctac gcttgttcag actttgtact 6540
agtttctttg tctggccatc cgggtaaccc atgccggacg caaaatagac tactgaaaat 6600
ttttttgctt tgtggttggg actttagcca agggtataaa agaccaccgt ccccgaatta 6660
cctttcctct tcttttctct ctctccttgt caactcacac ccgaaatcgt taagcatttc 6720
cttctgagta taagaatcat tcaccatgga caacagaaaa gacagagatg ttcacgagag 6780
gaaggaagat ggtcaatctg agtttgaagc actgaacggg accaacgcaa ttatgtccga 6840
taatagtaaa gcgtattcca taaagtttct gaccttcaat acatgggggt taaaatacgt 6900
ctccaaacac cgtaaagaaa gactcagagc aattgctgat aaattggcgg gccactcaat 6960
gcttacgcca atatctgacg agttgttgcc caatggtgga gatagtaatg aaaacgaaga 7020
ttacgacgtg attgccttac aagaaatctg gtgtgtggaa gactggaagt atctagcttc 7080
tgcgtgtgcc tccaagtatc cgtatcagcg tttgttccat tctggtattc tgacggggcc 7140
tgggttggcc atactgtcca aggtcccgat agagtcgacc tttctttacc ggttcccgat 7200
aaacggtaga ccgagtgcgg tgttccgtgg cgactggtac gtagggaaat ctatagcaat 7260
caccgtattg aacacaggaa cccgccccat tgcaataatg aacagtcaca tgcacgcccc 7320
atacgccaag cagggtgatg ccgcctactt gtgccacaga tcttgtcagg cctgggattt 7380
cagcaggctc attaagcttt acaggcaggc cggttatgcg gtgattgtgg tgggtgactt 7440
aaactccaga ccgggctcac tgccccacaa atttctcacg caggaggccg gcctggtcga 7500
ctcctgggag caattgcatg ggaagcaaga cttggcggtg atcgctcgtc tgtctccatt 7560
gcaacaattg cttaagggct gtaccacgtg cgattcgctg ctcaacacat ggagggccca 7620
aagacaaccc gatgaggcat gcaggttgga ttatgctctt atcgaccctg atttcttgca 7680
aacagtagac gcaggtgtca ggttcactga acggatccct cacctggact gcagtgtctc 7740
tgaccatttt gcatactcat gcacccttaa catcgtccca cagggcacag agtcccgtcc 7800
atccacctcc gttaagcgtg cgaagactca tgatagagag ctgatcttgc agagatactc 7860
caactacgaa accatgatag aatgcatcca cacgtacttg aagacagccc aaagacagaa 7920
atttttccgt ggcctacatt tctgggcctc aatacttctc ctaatagcgt cgttggtcgt 7980
gacaacgttt actgcaaaca aggcaggctg gtcctccatc ttctgggtcc ttttcgctat 8040
tgctgtctcc atctcgggca ccatcgacgg tgccatctcc ttcttgtttg gcaggtctga 8100
aatcagagcc ctcatcgaag tcgaacaaga ggttctggac gcggagcacc acctgcaaac 8160
tttcttgagc gagaaatga 8179
<210> 208
<211> 8196
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pY20
<400> 208
tggagctcca gcttttgttc cctttagtga gggttaattt cgagcttggc gtaatcatgg 60
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 120
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 180
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 240
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 300
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 360
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 420
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 480
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 540
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 600
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 660
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 720
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 780
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 840
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 900
aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 960
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 1020
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 1080
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 1140
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 1200
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 1260
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 1320
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 1380
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 1440
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 1500
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 1560
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 1620
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 1680
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 1740
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 1800
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 1860
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 1920
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 1980
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 2040
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 2100
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 2160
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgcgccc 2220
tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt 2280
gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc 2340
ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta 2400
cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc 2460
tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg 2520
ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt 2580
ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 2640
tttaacaaaa tattaacgct tacaatttcc attcgccatt caggctgcgc aactgttggg 2700
aagggcgatc ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg 2760
caaggcgatt aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg 2820
ccagtgaatt gtaatacgac tcactatagg gcgaattggg taccgggccc cccctcgagg 2880
tcgacggtat cgataagctt gatatcgaat tcatgtcaca caaaccgatc ttcgcctcaa 2940
ggaaacctaa ttctacatcc gagagactgc cgagatccag tctacactga ttaattttcg 3000
ggccaataat ttaaaaaaat cgtgttatat aatattatat gtattatata tatacatcat 3060
gatgatactg acagtcatgt cccattgcta aatagacaga ctccatctgc cgcctccaac 3120
tgatgttctc aatatttaag gggtcatctc gcattgttta ataataaaca gactccatct 3180
accgcctcca aatgatgttc tcaaaatata ttgtatgaac ttatttttat tacttagtat 3240
tattagacaa cttacttgct ttatgaaaaa cacttcctat ttaggaaaca atttataatg 3300
gcagttcgtt catttaacaa tttatgtaga ataaatgtta taaatgcgta tgggaaatct 3360
taaatatgga tagcataaat gatatctgca ttgcctaatt cgaaatcaac agcaacgaaa 3420
aaaatccctt gtacaacata aatagtcatc gagaaatatc aactatcaaa gaacagctat 3480
tcacacgtta ctattgagat tattattgga cgagaatcac acactcaact gtctttctct 3540
cttctagaaa tacaggtaca agtatgtact attctcattg ttcatacttc tagtcatttc 3600
atcccacata ttccttggat ttctctccaa tgaatgacat tctatcttgc aaattcaaca 3660
attataataa gatataccaa agtagcggta tagtggcaat caaaaagctt ctctggtgtg 3720
cttctcgtat ttatttttat tctaatgatc cattaaaggt atatatttat ttcttgttat 3780
ataatccttt tgtttattac atgggctgga tacataaagg tattttgatt taattttttg 3840
cttaaattca atcccccctc gttcagtgtc aactgtaatg gtaggaaatt accatacttt 3900
tgaagaagca aaaaaaatga aagaaaaaaa aaatcgtatt tccaggttag acgttccgca 3960
gaatctagaa tgcggtatgc ggtacattgt tcttcgaacg taaaagttgc gctccctgag 4020
atattgtaca tttttgcttt tacaagtaca agtacatcgt acaactatgt actactgttg 4080
atgcatccac aacagtttgt tttgtttttt tttgtttttt ttttttctaa tgattcatta 4140
ccgctatgta tacctacttg tacttgtagt aagccgggtt attggcgttc aattaatcat 4200
agacttatga atctgcacgg tgtgcgctgc gagttacttt tagcttatgc atgctacttg 4260
ggtgtaatat tgggatctgt tcggaaatca acggatgctc aaccgatttc gacagtaata 4320
atttgaatcg aatcggagcc taaaatgaac ccgagtatat ctcataaaat tctcggtgag 4380
aggtctgtga ctgtcagtac aaggtgcctt cattatgccc tcaaccttac catacctcac 4440
tgaatgtagt gtacctctaa aaatgaaata cagtgccaaa agccatggca ctgagctcgt 4500
ctaacggact tgatatacaa ccaattaaaa caaatgaaaa gaaatacagt tctttgtatc 4560
atttgtaaca attaccctgt acaaactaag gtattgaaat cccacaatat tcccaaagtc 4620
cacccctttc caaattgtca tgcctacaac tcatatacca agcactaacc taccaaacac 4680
cactaaaacc ccacaaaata tatcttaccg aatatacagt aacaagctac caccacactc 4740
gttgggtgca gtcgccagct taaagatatc tatccacatc agccacaact cccttccttt 4800
aataaaccga ctacaccctt ggctattgag gttatgagtg aatatactgt agacaagaca 4860
ctttcaagaa gactgtttcc aaaacgtacc actgtcctcc actacaaaca cacccaatct 4920
gcttcttcta gtcaaggttg ctacaccggt aaattataaa tcatcatttc attagcaggg 4980
cagggccctt tttatagagt cttatacact agcggaccct gccggtagac caacccgcag 5040
gcgcgtcagt ttgctccttc catcaatgcg tcgtagaaac gacttactcc ttcttgagca 5100
gctccttgac cttgttggca acaagtctcc gacctcggag gtggaggaag agcctccgat 5160
atcggcggta gtgataccag cctcgacgga ctccttgacg gcagcctcaa cagcgtcacc 5220
ggcgggcttc atgttaagag agaacttgag catcatggcg gcagacagaa tggtggcaat 5280
ggggttgacc ttctgcttgc cgagatcggg ggcagatccg tgacagggct cgtacagacc 5340
gaacgcctcg ttggtgtcgg gcagagaagc cagagaggcg gagggcagca gacccagaga 5400
accggggatg acggaggcct cgtcggagat gatatcgcca aacatgttgg tggtgatgat 5460
gataccattc atcttggagg gctgcttgat gaggatcatg gcggccgagt cgatcagctg 5520
gtggttgagc tcgagctggg ggaattcgtc cttgaggact cgagtgacag tctttcgcca 5580
aagtcgagag gaggccagca cgttggcctt gtcaagagac cacacgggaa gaggggggtt 5640
gtgctgaagg gccaggaagg cggccattcg ggcaattcgc tcaacctcag gaacggagta 5700
ggtctcggtg tcggaagcga cgccagatcc gtcatcctcc tttcgctctc caaagtagat 5760
acctccgacg agctctcgga caatgatgaa gtcggtgccc tcaacgtttc ggatggggga 5820
gagatcggcg agcttgggcg acagcagctg gcagggtcgc aggttggcgt acaggttcag 5880
gtcctttcgc agcttgagga gaccctgctc gggtcgcacg tcggttcgtc cgtcgggagt 5940
ggtccatacg gtgttggcag cgcctccgac agcaccgagc ataatagagt cagcctttcg 6000
gcagatgtcg agagtagcgt cggtgatggg ctcgccctcc ttctcaatgg cagctcctcc 6060
aatgagtcgg tcctcaaaca caaactcggt gccggaggcc tcagcaacag acttgagcac 6120
cttgacggcc tcggcaatca cctcggggcc acagaagtcg ccgccgagaa gaacaatctt 6180
cttggagtca gtcttggtct tcttagtttc gggttccatt gtggatgtgt gtggttgtat 6240
gtgtgatgtg gtgtgtggag tgaaaatctg tggctggcaa acgctcttgt atatatacgc 6300
acttttgccc gtgctatgtg gaagactaaa cctccgaaga ttgtgactca ggtagtgcgg 6360
tatcggctag ggacccaaac cttgtcgatg ccgatagcgc tatcgaacgt accccagccg 6420
gccgggagta tgtcggaggg gacatacgag atcgtcaagg gtttgtggcc aactggtaaa 6480
taaatgatga ctcaggcgac gacggaattc ctgcagccca tctgcagaat tcaggagaga 6540
ccgggttggc ggcgtatttg tgtcccaaaa aacagcccca attgccccaa ttgaccccaa 6600
attgacccag tagcgggccc aaccccggcg agagccccct tcaccccaca tatcaaacct 6660
cccccggttc ccacacttgc cgttaagggc gtagggtact gcagtctgga atctacgctt 6720
gttcagactt tgtactagtt tctttgtctg gccatccggg taacccatgc cggacgcaaa 6780
atagactact gaaaattttt ttgctttgtg gttgggactt tagccaaggg tataaaagac 6840
caccgtcccc gaattacctt tcctcttctt ttctctctct ccttgtcaac tcacacccga 6900
aatcgttaag catttccttc tgagtataag aatcattcaa aggatccact agttctagag 6960
cggccgctta aaccatgaaa aagcctgaac tcaccgcgac gtctgtcgag aagtttctga 7020
tcgaaaagtt cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg 7080
ctttcagctt cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg 7140
gtttctacaa agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg 7200
aagtgcttga cattggggaa ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac 7260
agggtgtcac gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg 7320
cggaggccat ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat 7380
tcggaccgca aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg 7440
atccccatgt gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc 7500
aggctctcga tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc 7560
acgcggattt cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg 7620
actggagcga ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga 7680
ggccgtggtt ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc 7740
ttgcaggatc gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc 7800
agagcttggt tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa 7860
tcgtccgatc cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg 7920
tctggaccga tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc 7980
gtccgagggc aaaggaatag tgaggtacct aaagcggccg ccaccgcggc ccgagattcc 8040
ggcctcttcg gccgccaagc gacccgggtg gacgtctaga ggtacctagc aattaacaga 8100
tagtttgccg gtgataattc tcttaacctc ccacactcct ttgacataac gatttatgta 8160
acgaaactga aatttgacca gatattgtgt ccgcgg 8196
<210> 209
<211> 5105
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pLV13
<220>
<221> misc_feature
<222> (4446)..(4446)
<223> n is a, c, g, or t
<400> 209
gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 60
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 120
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 180
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 240
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 300
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 360
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 420
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 480
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 540
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 600
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 660
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 720
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 780
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 840
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 900
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 960
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1020
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1080
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1140
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 1200
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 1260
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1320
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1380
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1440
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 1500
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 1560
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 1620
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 1680
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 1740
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 1800
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 1860
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 1920
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 1980
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2040
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2100
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2160
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2220
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2280
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2340
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2400
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2460
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2520
aacgcgaatt ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca 2580
actgttggga agggcgatta agtcatacac aagtcagctt tcttcgagcc tcatataagt 2640
ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac 2700
atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc 2760
agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta 2820
tatacacagt taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc 2880
ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta 2940
cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg 3000
gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag 3060
ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg 3120
gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt 3180
gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac 3240
taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga 3300
gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg 3360
ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt 3420
gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag 3480
ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt 3540
tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt 3600
ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg 3660
agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt 3720
gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc 3780
agtgaagtat atgttatggt aatagttacg agttagttga acttatagat agactggact 3840
atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc 3900
gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc 3960
caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa 4020
agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga 4080
cagatactcg tcgactcagg cgacgacgga attcagcttt gagcttggag aagtatccgt 4140
ctcggtgctc caaatcaggg taggacagtc tccagtcgta cgccgcagca gacattgtat 4200
ccgtatcgta tccaataaca gccaggttct cgagcagctt gttccacagc cagtagcctg 4260
ccataaagaa gtcggcggag gcaaatccct gggcggctcg cagcttgaaa tggggagggt 4320
ctagaccggt ctctgtgtcc agcatcaggt tctgcagcca gcagtacttg tccagcagca 4380
tgactcggat catgtaccag gagccccaca ttcgctttct gaagtgcgac tcggtgggac 4440
actccnyggt tccctccagg gaccagctct ccagtcccgt ggagatgacg ccgggcacca 4500
gcaccaccgg gtacttggcg ttgagtccct cgctcttcat agccttgccc acagcaaaag 4560
gggcagcctt ctgttcgctt ttctggtgct tctcgatctt gagatctaga atacagaagt 4620
caacggttca tccatggtga ggtcttagca gagtactcgg tcaagactcc ttgaacttga 4680
tgaagttgcc aaaggtgaca ttctggccgg gctcgtcatc aggggctcca gaatgatcac 4740
cccagatagc cttaccaccc ttgggaatca tggaagcaat tcctccccat gttcgcagca 4800
gatcggctcg ctctcgtcga gagaagaact gctccagtcc atacacagcc atcgcgttca 4860
gctgcacggt atccttcatt tctccagaca gaagagcaac cagggtcttg ggagtaccca 4920
gcatggagcc ggaaatgtcg acaaaggatt caatatggtc attgacccag ttgggacctc 4980
ctcctccata tccctcggcc tcagcccact tcatgaagta gaagatgacc tgggagccca 5040
tggaatggcc cgtcagaact gtcttctcac ctgtcatacg cttagtctct tcgattgagg 5100
atccg 5105
<210> 210
<211> 971
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter GPD
<400> 210
gacgcagtag gatgtcctgc acgggtcttt ttgtggggtg tggagaaagg ggtgcttgga 60
gatggaagcc ggtagaaccg ggctgcttgt gcttggagat ggaagccggt agaaccgggc 120
tgcttggggg gatttggggc cgctgggctc caaagagggg taggcatttc gttggggtta 180
cgtaattgcg gcatttgggt cctgcgcgca tgtcccattg gtcagaatta gtccggatag 240
gagacttatc agccaatcac agcgccggat ccacctgtag gttgggttgg gtgggagcac 300
ccctccacag agtagagtca aacagcagca gcaacatgat agttgggggt gtgcgtgtta 360
aaggaaaaaa aagaagcttg ggttatattc ccgctctatt tagaggttgc gggatagacg 420
ccgacggagg gcaatggcgc catggaacct tgcggatatc gatacgccgc ggcggactgc 480
gtccgaacca gctccagcag cgttttttcc gggccattga gccgactgcg accccgccaa 540
cgtgtcttgg cccacgcact catgtcatgt tggtgttggg aggccacttt ttaagtagca 600
caaggcacct agctcgcagc aaggtgtccg aaccaaagaa gcggctgcag tggtgcaaac 660
ggggcggaaa cggcgggaaa aagccacggg ggcacgaatt gaggcacgcc ctcgaatttg 720
agacgagtca cggccccatt cgcccgcgca atggctcgcc aacgcccggt cttttgcacc 780
acatcaggtt accccaagcc aaacctttgt gttaaaaagc ttaacatatt ataccgaacg 840
taggtttggg cgggcttgct ccgtctgtcc aaggcaacat ttatataagg gtctgcatcg 900
ccggctcaat tgaatctttt ttcttcttct cttctctata ttcattcttg aattaaacac 960
acatcaacat g 971
<210> 211
<211> 1174
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter GPDIN
<400> 211
aaacacgcag taggatgtcc tgcacgggtc tttttgtggg gtgtggagaa aggggtgctt 60
ggagatggaa gccggtagaa ccgggctgct tgtgcttgga gatggaagcc ggtagaaccg 120
ggctgcttgg ggggatttgg ggccgctggg ctccaaagag gggtaggcat ttcgttgggg 180
ttacgtaatt gcggcatttg ggtcctgcgc gcatgtccca ttggtcagaa ttagtccgga 240
taggagactt atcagccaat cacagcgccg gatccacctg taggttgggt tgggtgggag 300
cacccctcca cagagtagag tcaaacagca gcagcaacat gatagttggg ggtgtgcgtg 360
ttaaaggaaa aaaaagaagc ttgggttata ttcccgctct atttagaggt tgcgggatag 420
acgccgacgg agggcaatgg cgctatggaa ccttgcggat atccatacgc cgcggcggac 480
tgcgtccgaa ccagctccag cagcgttttt tccgggccat tgagccgact gcgaccccgc 540
caacgtgtct tggcccacgc actcatgtca tgttggtgtt gggaggccac tttttaagta 600
gcacaaggca cctagctcgc agcaaggtgt ccgaaccaaa gaagcggctg cagtggtgca 660
aacggggcgg aaacggcggg aaaaagccac gggggcacga attgaggcac gccctcgaat 720
ttgagacgag tcacggcccc attcgcccgc gcaatggctc gccaacgccc ggtcttttgc 780
accacatcag gttaccccaa gccaaacctt tgtgttaaaa agcttaacat attataccga 840
acgtaggttt gggcgggctt gctccgtctg tccaaggcaa catttatata agggtctgca 900
tcgccggctc aattgaatct tttttcttct tctcttctct atattcattc ttgaattaaa 960
cacacatcaa catggccatc aaagtcggta ttaacggatt cgggcgaatc ggacgaattg 1020
tgagtaccat agaaggtgat ggaaacatga cccaacagaa acagatgaca agtgtcatcg 1080
acccaccaga gcccaattga gctcatacta acagtcgaca acctgtcgaa ccaattgatg 1140
actccccgac aatgtactaa cacaggtcct gccc 1174
<210> 212
<211> 878
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter GPM
<400> 212
gcctctgaat actttcaaca agttacaccc ttcattaatt ctcacgtgac acagattatt 60
aacgtctcgt accaaccaca gattacgacc cattcgcagt cacagttcac tagggtttgg 120
gttgcatccg ttgagagcgg tttgttttta accttctcca tgtgctcact caggttttgg 180
gttcagatca aatcaaggcg tgaaccactt tgtttgagga caaatgtgac acaaccaacc 240
agtgtcaggg gcaagtccgt gacaaagggg aagatacaat gcaattactg acagttacag 300
actgcctcga tgccctaacc ttgccccaaa ataagacaac tgtcctcgtt taagcgcaac 360
cctattcagc gtcacgtcat aatagcgttt ggatagcact agtctatgag gagcgtttta 420
tgttgcggtg agggcgattg gtgctcatat gggttcaatt gaggtggcgg aacgagctta 480
gtcttcaatt gaggtgcgag cgacacaatt gggtgtcacg tggcctaatt gacctcgggt 540
cgtggagtcc ccagttatac agcaaccacg aggtgcatgg gtaggagacg tcaccagaca 600
atagggtttt ttttggactg gagagggttg ggcaaaagcg ctcaacgggc tgtttgggga 660
gctgtggggg aggaattggc gatatttgtg aggttaacgg ctccgatttg cgtgttttgt 720
cgctcctgca tctccccata cccatatctt ccctccccac ctctttccac gataatttta 780
cggatcagca ataaggttcc ttctcctagt ttccacgtcc atatatatct atgctgcgtc 840
gtccttttcg tgacatcacc aaaacacata caaaaatg 878
<210> 213
<211> 1001
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter FBA
<400> 213
taaacagtgt acgcagtact atagaggaac aattgccccg gagaagacgg ccaggccgcc 60
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag ggggggcctt 120
tttatatggc caagccaagc tctccacgtc ggttgggctg cacccaacaa taaatgggta 180
gggttgcacc aacaaaggga tgggatgggg ggtagaagat acgaggataa cggggctcaa 240
tggcacaaat aagaacgaat actgccatta agactcgtga tccagcgact gacaccattg 300
catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag 360
gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa 420
cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg 480
acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt 540
gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg 600
acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca 660
ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa 720
gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct 780
tttttccttt ctttccccac agattcgaaa tctaaactac acatcacaca atgcctgtta 840
ctgacgtcct taagcgaaag tccggtgtca tcgtcggcga cgatgtccga gccgtgagta 900
tccacgacaa gatcagtgtc gagacgacgc gttttgtgta atgacacaat ccgaaagtcg 960
ctagcaacac acactctcta cacaaactaa cccagctctc c 1001
<210> 214
<211> 973
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter FBAIN
<400> 214
aaattgcccc ggagaagacg gccaggccgc ctagatgaca aattcaacaa ctcacagctg 60
actttctgcc attgccacta ggggggggcc tttttatatg gccaagccaa gctctccacg 120
tcggttgggc tgcacccaac aataaatggg tagggttgca ccaacaaagg gatgggatgg 180
ggggtagaag atacgaggat aacggggctc aatggcacaa ataagaacga atactgccat 240
taagactcgt gatccagcga ctgacaccat tgcatcatct aagggcctca aaactacctc 300
ggaactgctg cgctgatctg gacaccacag aggttccgag cactttaggt tgcaccaaat 360
gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt acagtttgtc ttaacaaaaa 420
gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta tagcctttag agctgcgaaa 480
gcgcgtatgg atttggctca tcaggccaga ttgagggtct gtggacacat gtcatgttag 540
tgtacttcaa tcgccccctg gatatagccc cgacaatagg ccgtggcctc atttttttgc 600
cttccgcaca tttccattgc tcggtaccca caccttgctt ctcctgcact tgccaacctt 660
aatactggtt tacattgacc aacatcttac aagcgggggg cttgtctagg gtatatataa 720
acagtggctc tcccaatcgg ttgccagtct cttttttcct ttctttcccc acagattcga 780
aatctaaact acacatcaca caatgcctgt tactgacgtc cttaagcgaa agtccggtgt 840
catcgtcggc gacgatgtcc gagccgtgag tatccacgac aagatcagtg tcgagacgac 900
gcgttttgtg taatgacaca atccgaaagt cgctagcaac acacactctc tacacaaact 960
aacccagctc tcc 973
<210> 215
<211> 924
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter FBAINm
<400> 215
aaattgcccc ggagaagacg gccaggccgc ctagatgaca aattcaacaa ctcacagctg 60
actttctgcc attgccacta ggggggggcc tttttatatg gccaagccaa gctctccacg 120
tcggttgggc tgcacccaac aataaatggg tagggttgca ccaacaaagg gatgggatgg 180
ggggtagaag atacgaggat aacggggctc aatggcacaa ataagaacga atactgccat 240
taagactcgt gatccagcga ctgacaccat tgcatcatct aagggcctca aaactacctc 300
ggaactgctg cgctgatctg gacaccacag aggttccgag cactttaggt tgcaccaaat 360
gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt acagtttgtc ttaacaaaaa 420
gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta tagcctttag agctgcgaaa 480
gcgcgtatgg atttggctca tcaggccaga ttgagggtct gtggacacat gtcatgttag 540
tgtacttcaa tcgccccctg gatatagccc cgacaatagg ccgtggcctc atttttttgc 600
cttccgcaca tttccattgc tcggtaccca caccttgctt ctcctgcact tgccaacctt 660
aatactggtt tacattgacc aacatcttac aagcgggggg cttgtctagg gtatatataa 720
acagtggctc tcccaatcgg ttgccagtct cttttttcct ttctttcccc acagattcga 780
aatctaaact acacatcaca gaattccgag ccgtgagtat ccacgacaag atcagtgtcg 840
agacgacgcg ttttgtgtaa tgacacaatc cgaaagtcgc tagcaacaca cactctctac 900
acaaactaac ccagctctgg tacc 924
<210> 216
<211> 1130
<212> DNA
<213> Yarrowia lipolytica
<400> 216
caacttttct tgtcgacctg agataccgag gttgcgcagg ggatcaactt ttgtgtctca 60
gagggaccca agtgcgtacg gagagtacag tacatactgt agctaacggt agcaggcgaa 120
ctactggtac atacctcccc cggaatatgt acaggcataa tgcgtatctg tgggacatgt 180
ggtcgttgcg ccattatgta agcagcgtgt actcctctga ctgtccatat ggtttgctcc 240
atctcaccct catcgttttc attgttcaca ggcggccaca aaaaaactgt cttctctcct 300
tctctcttcg ccttagtcta ctcggaccag ttttagttta gcttggcgcc actggataaa 360
tgagacctca ggccttgtga tgaggaggtc acttatgaag catgttagga ggtgcttgta 420
tggatagaga agcacccaaa ataataagaa taataataaa acagggggcg ttgtcatttc 480
atatcgtgtt ttcaccatca atacacctcc aaacaatgcc cttcatgtgg ccagccccaa 540
tattgtcctg tagttcaact ctatgcagct cgtatcttat tgagcaagta aaactctgtc 600
agccgatatt gcccgacccg cgacaagggt caacaaggtg gtgtaaggcc ttcgcagaag 660
tcaaaactgt gccaaacaaa catctagagt ctctttggtg tttctcgcat atatttaatc 720
ggctgtctta cgtatttggc ctcggtaccg gactaatttc ggatcatccc caatacgctt 780
tttcttcgca gctgtcaaca gtgtccatga tctatccacc taaatgggtc atatgaggcg 840
tataatttcg tggtgctgat aataattccc atatatttga cacaaaactt ccccccctag 900
acatacatct cacaatctca cttcttgtgc ttctgtcaca catctcctcc agctgacttc 960
aactcacacc tctgccccag ttggtctaca gcggtataag gtttctccgc atagaggtgc 1020
accactcctc ccgatacttg tttgtgtgac ttgtgggtca cgacatatat atctacacac 1080
attgcgccac cctttggttc ttccagcaca acaaaaacac gacacgctaa 1130
<210> 217
<211> 778
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter YAT1
<400> 217
ataagtttgc aaaaagatcg tattatagtt ggagcaaggg agaaatgtag agtgtgaaag 60
actcactatg gtccgggctt atctcgacca atagccaaag tctggagttt ctgagagaaa 120
aaggcaagat acgtatgtaa caaagcgacg catggtacaa taataccgga ggcatgtatc 180
atagagagtt agtggttcga tgatggcact ggtgcctggt atgactttat acggctgact 240
acatatttgt cctcagacat acaattacag tcaagcactt acccttggac atctgtaggt 300
accccccggc caagacgatc tcagcgtgtc gtatgtcgga ttggcgtagc tccctcgctc 360
gtcaattggc tcccatctac tttcttctgc ttggctacac ccagcatgtc tgccatggct 420
cgttttcgtg ccttatctat cctcccagta ttaccaactc taaatgacat gatgtgattg 480
ggtctacact ttcatatcag agataaggag tagcacagtt gcataaaaag cccaactcta 540
atcagcttct tcctttcttg taattagtac aaaggtgatt agcgaaatct ggaagcttag 600
ttggccctaa aaaaatcaaa aaaagcaaaa aacgaaaaac gaaaaaccac agttttgaga 660
acagggaggt aacgaaggat cgtatatata tatatatata tatataccca cggatcccga 720
gaccggcctt tgattcttcc ctacaaccaa ccattctcac caccctaatt cacaaatg 778
<210> 218
<211> 436
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter TEF
<400> 218
gaccgggttg gcggcgtatt tgtgtcccaa aaaacagccc caattgcccc aattgacccc 60
aaattgaccc agtagcgggc ccaaccccgg cgagagcccc cttcacccca catatcaaac 120
ctcccccggt tcccacactt gccgttaagg gcgtagggta ctgcagtctg gaatctacgc 180
ttgttcagac tttgtactag tttctttgtc tggccatccg ggtaacccat gccggacgca 240
aaatagacta ctgaaaattt ttttgctttg tggttgggac tttagccaag ggtataaaag 300
accaccgtcc ccgaattacc tttcctcttc ttttctctct ctccttgtca actcacaccc 360
gaaatcgtta agcatttcct tctgagtata agaatcattc aaaggatcca ctagttctag 420
agcggccgct taaacc 436
<210> 219
<211> 1020
<212> DNA
<213> Artificial Sequence
<220>
<223> GPM::FBAIN chimeric Yarrowia lipolytica promoter
<400> 219
gtcgaccatt aattctcacg tgacacagat tattaacgtc tcgtaccaac cacagattac 60
gacccattcg cagtcacagt tcactagggt ttgggttgca tccgttgaga gcggtttgtt 120
tttaaccttc tccatgtgct cactcaggtt ttgggttcag atcaaatcaa ggcgtgaacc 180
actttgtttg aggacaaatg tgacacaacc aaccagtgtc aggggcaagt ccgtgacaaa 240
ggggaagata caatgcaatt actgacagtt acagactgcc tcgatgccct aaccttgccc 300
caaaataaga caactgtcct cgtttaagcg caaccctatt cagcgtcacg tcataatagc 360
gtttggatag cactagtcta tgaggagcgt tttatgttgc ggtgagggcg attggtgctc 420
atatgggttc aattgaggtg gcggaacgag cttagtcttc aattgaggtg cgagcgacac 480
aattgggtgt cacgtggcct aattgacctc gggtcgtgga gtccccagtt atacagcaac 540
cacgaggtgc atgggtagga gacgtcacca gacaataggg ttttttttgg actggagagg 600
gttgggcaaa agcgctcaac gggctgtttg gggagctgtg ggggaggaat tggcgatatt 660
tgtgaggtta acggctccga tttgcgtgtt ttgtcgctcc tgcatctccc catacccata 720
tcttccctcc ccacctcttt ccacgataat tttacggatc agcaataagg ttccttctcc 780
tagtttccac gtccatatat atctatgctg cgtcgtcctt ttcgtgacat caccaaaaca 840
catacaacca tggctgttac tgacgtcctt aagcgaaagt ccggtgtcat cgtcggcgac 900
gatgtccgag ccgtgagtat ccacgacaag atcagtgtcg agacgacgcg ttttgtgtaa 960
tgacacaatc cgaaagtcgc tagcaacaca cactctctac acaaactaac ccagctctcc 1020
<210> 220
<211> 1052
<212> DNA
<213> Artificial Sequence
<220>
<223> GPM::GPDIN chimeric Yarrowia lipolytica promoter
<400> 220
gtcgaccatt aattctcacg tgacacagat tattaacgtc tcgtaccaac cacagattac 60
gacccattcg cagtcacagt tcactagggt ttgggttgca tccgttgaga gcggtttgtt 120
tttaaccttc tccatgtgct cactcaggtt ttgggttcag atcaaatcaa ggcgtgaacc 180
actttgtttg aggacaaatg tgacacaacc aaccagtgtc aggggcaagt ccgtgacaaa 240
ggggaagata caatgcaatt actgacagtt acagactgcc tcgatgccct aaccttgccc 300
caaaataaga caactgtcct cgtttaagcg caaccctatt cagcgtcacg tcataatagc 360
gtttggatag cactagtcta tgaggagcgt tttatgttgc ggtgagggcg attggtgctc 420
atatgggttc aattgaggtg gcggaacgag cttagtcttc aattgaggtg cgagcgacac 480
aattgggtgt cacgtggcct aattgacctc gggtcgtgga gtccccagtt atacagcaac 540
cacgaggtgc atgggtagga gacgtcacca gacaataggg ttttttttgg actggagagg 600
gttgggcaaa agcgctcaac gggctgtttg gggagctgtg ggggaggaat tggcgatatt 660
tgtgaggtta acggctccga tttgcgtgtt ttgtcgctcc tgcatctccc catacccata 720
tcttccctcc ccacctcttt ccacgataat tttacggatc agcaataagg ttccttctcc 780
tagtttccac gtccatatat atctatgctg cgtcgtcctt ttcgtgacat caccaaaaca 840
catacaacca tggccatcaa agtcggtatt aacggattcg ggcgaatcgg acgaattgtg 900
agtaccatag aaggtgatgg aaacatgacc caacagaaac agatgacaag tgtcatcgac 960
ccaccagagc ccaattgagc tcatactaac agtcgacaac ctgtcgaacc aattgatgac 1020
tccccgacaa tgtactaaca caggtcctgc cc 1052
<210> 221
<211> 1000
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> Promoter EXP1
<400> 221
ggagtttggc gcccgttttt tcgagcccca cacgtttcgg tgagtatgag cggcggcaga 60
ttcgagcgtt tccggtttcc gcggctggac gagagcccat gatgggggct cccaccacca 120
gcaatcaggg ccctgattac acacccacct gtaatgtcat gctgttcatc gtggttaatg 180
ctgctgtgtg ctgtgtgtgt gtgttgtttg gcgctcattg ttgcgttatg cagcgtacac 240
cacaatattg gaagcttatt agcctttcta ttttttcgtt tgcaaggctt aacaacattg 300
ctgtggagag ggatggggat atggaggccg ctggagggag tcggagaggc gttttggagc 360
ggcttggcct ggcgcccagc tcgcgaaacg cacctaggac cctttggcac gccgaaatgt 420
gccacttttc agtctagtaa cgccttacct acgtcattcc atgcatgcat gtttgcgcct 480
tttttccctt gcccttgatc gccacacagt acagtgcact gtacagtgga ggttttgggg 540
gggtcttaga tgggagctaa aagcggccta gcggtacact agtgggattg tatggagtgg 600
catggagcct aggtggagcc tgacaggacg cacgaccggc tagcccgtga cagacgatgg 660
gtggctcctg ttgtccaccg cgtacaaatg tttgggccaa agtcttgtca gccttgcttg 720
cgaacctaat tcccaatttt gtcacttcgc acccccattg atcgagccct aacccctgcc 780
catcaggcaa tccaattaag ctcgcattgt ctgccttgtt tagtttggct cctgcccgtt 840
tcggcgtcca cttgcacaaa cacaaacaag cattatatat aaggctcgtc tctccctccc 900
aaccacactc acttttttgc ccgtcttccc ttgctaacac aaaagtcaag aacacaaaca 960
accaccccaa cccccttaca cacaagacat atctacagca 1000
<210> 222
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> His Box 1
<400> 222
His Glu Cys Gly His
1 5
<210> 223
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Delta-15 desaturase motif
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 223
Ile Xaa Xaa His Glu Cys Gly His
1 5
<210> 224
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Delta-12 desaturase motif
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 224
Val Xaa Xaa His Glu Cys Gly His
1 5
<210> 225
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL211
<400> 225
tttgtcgacg cagtaggatg tcctgcacgg 30
<210> 226
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL212
<400> 226
tttccatggt tgatgtgtgt ttaattcaag aatg 34
<210> 227
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL376
<400> 227
aatctgcagt ggtgcaaacg gggcgga 27
<210> 228
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL377
<400> 228
tttccatggg caggacctgt gttagtacat tg 32
<210> 229
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL203
<400> 229
tttccatggt tgtatgtgtt ttggtgatgt cac 33
<210> 230
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL204
<400> 230
tttgtcgacc gtttaagcgc aaccctattc agc 33
<210> 231
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GPAT-5-1
<400> 231
caacttttct tgtcgacctg ag 22
<210> 232
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GPAT-5-2
<400> 232
gatcccatgg ttagcgtgtc gtgtttttgt tgtg 34
<210> 233
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW314
<400> 233
cgtgccatgg tgtgatgtgt agtttagatt tcg 33
<210> 234
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL341
<400> 234
tttgtcgacg tttaaacagt gtacgcagta ctatagagg 39
<210> 235
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW320
<400> 235
cgtgccatgg agagctgggt tagtttgtgt agag 34
<210> 236
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW341
<400> 236
tttgtcgacg tttaaacagt gtacgcagta ctatagagg 39
<210> 237
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 27203-F
<400> 237
gatcgtcgac ataagtttgc aaaaagatcg ta 32
<210> 238
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 27203-R
<400> 238
gatcccatgg ttgtgaatta gggtggtgag aatg 34
<210> 239
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL-URA-16F
<400> 239
gctcgagcta acgtccacaa g 21
<210> 240
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL-URA-78R
<400> 240
cttggctgcc acgagctt 18
<210> 241
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GUS-767F
<400> 241
ccaaaagcca gacagagtgt ga 22
<210> 242
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GUS-891R
<400> 242
ttcatgacga ccaaagccag ta 22
<210> 243
<211> 2987
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<223> mutant acetohydroxyacid synthase (AHAS) with W497L mutation
<400> 243
ttccctagtc ccagtgtaca cccgccgata tcgcttaccc tgcagccgga ttaaggttgg 60
caatttttca cgtccttgtc tccgcaatta ctcaccgggt ggtttataag attgcaagcg 120
tcttgatttg tctctgtata ctaacatgca atcgcgactc gcccgacggg ccactaacct 180
ggccagaatc tccagatcca agtattctct tggtctgcga tatgtttcca acacaaaagc 240
ccctgctgcc cagccggcaa ctgctgagtg agtattcctt gccataaacg acccagaacc 300
actgtatagt gtttggaagc actagtcaga agaccagcga aaacaggtgg aaaaaactga 360
gacgaaaagc aacgaccaga aatgtaatgt gtggaaaagc gacacacaca gagcagataa 420
agaggtgaca aataacgaca aatgaaatat cagtatcttc ccacaatcac tacctctcag 480
ctgtctgaag gtgcggctga tatatccatc ccacgtctaa cgtatggagt gtgatagaat 540
atgacgacac aagcatgaga actcgctctc tatccaacca ccgaaacact gtcactacag 600
ccgttcttgt tgctccattc gcttttgtga ttccatgcct tctctggtga ctgacaacat 660
tccttccttt tctccagccc tgttgttatc tgctcatgac ctacggccac tctctatcgc 720
atactaacat agacgatccc agcccgctcc ccacttccag ggcaccgttg gcaagcctcc 780
tatcctcaag aaggctgagg ctgccaacgc tgacatggac gagtccttca tcggaatgtc 840
tggaggagag atcttccacg agatgatgct gcgacacaac gtcgacactg tcttcggtta 900
ccccggtgga gccattctcc ccgtctttga cgccattcac aactctgagt acttcaactt 960
tgtgctccct cgacacgagc agggtgccgg ccacatggcc gagggctacg ctcgagcctc 1020
tggtaagccc ggtgtcgttc tcgtcacctc tggccccggt gccaccaacg tcatcacccc 1080
catgcaggac gctctttccg atggtacccc catggttgtc ttcaccggtc aggtcctgac 1140
ctccgttatc ggcactgacg ccttccagga ggccgatgtt gtcggcatct cccgatcttg 1200
caccaagtgg aacgtcatgg tcaagaacgt tgctgagctc ccccgacgaa tcaacgaggc 1260
ctttgagatt gctacttccg gccgacccgg tcccgttctc gtcgatctgc ccaaggatgt 1320
tactgctgcc atcctgcgag agcccatccc caccaagtcc accattccct cgcattctct 1380
gaccaacctc acctctgccg ccgccaccga gttccagaag caggctatcc agcgagccgc 1440
caacctcatc aaccagtcca agaagcccgt cctttacgtc ggacagggta tccttggctc 1500
cgaggagggt cctaagctgc ttaaggagct ggctgagaag gccgagattc ccgtcaccac 1560
tactctgcag ggtcttggtg cctttgacga gcgagacccc aagtctctgc acatgctcgg 1620
tatgcacggt tccggctacg ccaacatggc catgcagaac gctgactgta tcattgctct 1680
cggcgcccga tttgatgacc gagttaccgg ctccatcccc aagtttgccc ccgaggctcg 1740
agccgctgcc cttgagggtc gaggtggtat tgttcacttt gagatccagg ccaagaacat 1800
caacaaggtt gttcaggcca ccgaagccgt tgagggagac gttaccgagt ctgtccgaca 1860
gctcatcccc ctcatcaaca aggtctctgc cgctgagcga gctccctgga ctgagactat 1920
ccagtcctgg aagcagcagt tccccttcct cttcgaggct gaaggtgagg atggtgttat 1980
caagccccag tccgtcattg ctctgctctc tgacctgaca gagaacaaca aggacaagac 2040
catcatcacc accggtgttg gtcagcatca gatgtggact gcccagcatt tccgatggcg 2100
acaccctcga accatgatca cttctggtgg tcttggaact atgggttacg gcctgcccgc 2160
cgctatcggc gccaaggttg cccgacctga ctgcgacgtc attgacatcg atggtgacgc 2220
ttctttcaac atgactctga ccgagctgtc caccgccgtt cagttcaaca ttggcgtcaa 2280
ggctattgtc ctcaacaacg aggaacaggg tatggtcacc cagctgcagt ctctcttcta 2340
cgagaaccga tactgccaca ctcatcagaa gaaccccgac ttcatgaagc tggccgagtc 2400
catgggcatg aagggtatcc gaatcactca cattgaccag ctggaggccg gtctcaagga 2460
gatgctcgca tacaagggcc ctgtgctcgt tgaggttgtt gtcgacaaga agatccccgt 2520
tcttcccatg gttcccgctg gtaaggcttt gcatgagttc cttgtctacg acgctgacgc 2580
cgaggctgct tctcgacccg atcgactgaa gaatgccccc gcccctcacg tccaccagac 2640
cacctttgag aactaagtgg aaaggaacac aagcaatccg aaccaaaaat aattggggtc 2700
ccgtgcccac agagtctagt gcagacctaa aatgaccaca gtaaattata gctgttatta 2760
aacatgagat tttgaccaac aagagcgtag gaatgttatt agctactact tgtacataca 2820
cagcatttgt tttaaataat gttgcctcca ggggcagtga gatcaggacc cagatccgtg 2880
gccagctctc tgacttcaga ccgcttgtac ttaagcagct cgcaacactg ttgtcgagga 2940
ttgaacttgc catattcgat tttgtggtca tgaatccagc acacctc 2987
<210> 244
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 410
<400> 244
ttccctagtc ccagtgtaca cccgc 25
<210> 245
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 411
<400> 245
agagagactg cagctgggtg accat 25
<210> 246
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 412
<400> 246
gtatggtcac ccagctgcag tctctct 27
<210> 247
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 413
<400> 247
gaggtgtgct ggattcatga ccaca 25
<210> 248
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 414
<400> 248
ctggtaaata aatgatgttc cctagtccca gtgtacaccc gccg 44
<210> 249
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 415
<400> 249
tatgcttccg gctcgtacga ggtgtgctgg attcatgacc ac 42
<210> 250
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-1A
<400> 250
ggtcggcttc gacgagaccg tcactatgga caccgtccga aaccacaaca tgcccgacga 60
tgcctggtgc gctatccacg gcaccgtgta cgacatcacc aagtt 105
<210> 251
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-1B
<400> 251
ggagaacttg gtgatgtcgt acacggtgcc gtggatagcg caccaggcat cgtcgggcat 60
gttgtggttt cggacggtgt ccatagtgac ggtctcgtcg aagccga 107
<210> 252
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-2A
<400> 252
ctccaaggtg catcctggtg gagacattat catgctggcc gctggcaagg aggccaccat 60
cctgttcgag acctaccaca tcaagggtgt tcccgacgct gtcctgc 107
<210> 253
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-2B
<400> 253
tttcgcagga cagcgtcggg aacacccttg atgtggtagg tctcgaacag gatggtggcc 60
tccttgccag cggccagcat gataatgtct ccaccaggat gcacctt 107
<210> 254
<211> 106
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-3A
<400> 254
gaaagtacaa ggtcggcaag ctccctcagg gcaagaaggg tgagacctcc cacatgccca 60
ccggactcga ctctgcctcc tactactcct gggactctga gttcta 106
<210> 255
<211> 106
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-3B
<400> 255
tcggtagaac tcagagtccc aggagtagta ggaggcagag tcgagtccgg tgggcatgtg 60
ggaggtctca cccttcttgc cctgagggag cttgccgacc ttgtac 106
<210> 256
<211> 106
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-4A
<400> 256
ccgagtcctc cgagagcgag tcgccaagaa gctggccgag cccggtctca tgcagcgagc 60
tcgaatggag ctctgggcca aggctatctt tctcctggct ggtttc 106
<210> 257
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-4B
<400> 257
cagaaaccag ccaggagaaa gatagccttg gcccagagct ccattcgagc tcgctgcatg 60
agaccgggct cggccagctt cttggcgact cgctctcgga ggac 104
<210> 258
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-5A
<400> 258
ctgtacgcca tgtgcgtgct cgaccctcac ggaggtgcta tggtcgctgc cgtcaccctc 60
ggtgtgtttg ctgccttcgt cggaacctg 89
<210> 259
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-5B
<400> 259
gatgcaggtt ccgacgaagg cagcaaacac accgagggtg acggcagcga ccatagcacc 60
tccgtgaggg tcgagcacgc acatggcgta c 91
<210> 260
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-6A
<400> 260
catccagcac gacggctccc acggagcctt ctccaagtct cgattcatga acaaggctgc 60
cggttggacc ctcgacatga ttggtgcctc cgctatgac 99
<210> 261
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-6B
<400> 261
ccaggtcata gcggaggcac caatcatgtc gagggtccaa ccggcagcct tgttcatgaa 60
tcgagacttg gagaaggctc cgtgggagcc gtcgtgctg 99
<210> 262
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-7A
<400> 262
ctgggagatg cagcacgtcc tcggtcacca tccctacacc aacctgatcg agatggagaa 60
cggtctggcc aaggtcaagg gtgccgacgt ggacc 95
<210> 263
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-7B
<400> 263
ttggggtcca cgtcggcacc cttgaccttg gccagaccgt tctccatctc gatcaggttg 60
gtgtagggat ggtgaccgag gacgtgctgc atctc 95
<210> 264
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-8A
<400> 264
ccaagaaggt cgaccaggag tccgaccctg acgtcttctc tacctaccct atgctgcgac 60
tgcatccctg gcaccgacag cgattcta 88
<210> 265
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-8B
<400> 265
gtggtagaat cgctgtcggt gccagggatg cagtcgcagc atagggtagg tagagaagac 60
gtcagggtcg gactcctggt cgaccttc 88
<210> 266
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-9A
<400> 266
cagcacctgt acgctcccct gatcttcggc ttcatgacca tcaacaaggt gatctcccag 60
gacgtcggtg tcgtgctgcg aaagcgactg t 91
<210> 267
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-9B
<400> 267
tgaaacagtc gctttcgcag cacgacaccg acgtcctggg agatcacctt gttgatggtc 60
atgaagccga agatcagggg agcgtacagg t 91
<210> 268
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-10A
<400> 268
ttcagatcga cgccaactgc cgatatggct ctccctggaa cgtggctcga ttctggatca 60
tgaagctcct gaccactctc tacatggtg 89
<210> 269
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-10B
<400> 269
gagccaccat gtagagagtg gtcaggagct tcatgatcca gaatcgagcc acgttccagg 60
gagagccata tcggcagttg gcgtcgatc 89
<210> 270
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-11A
<400> 270
gctctgccca tgtacatgca gggacccgct cagggtctga agctgttctt tatggctcac 60
ttcacctgcg gagaggtcct cgcc 84
<210> 271
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-11B
<400> 271
tggtggcgag gacctctccg caggtgaagt gagccataaa gaacagcttc agaccctgag 60
cgggtccctg catgtacatg ggca 84
<210> 272
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-12A
<400> 272
accatgttca ttgttaacca cattatcgag ggtgtctcct acgcctccaa ggacgctgtc 60
aagggcgtca tggctcctcc ccgaa 85
<210> 273
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-12B
<400> 273
ggttcgggga ggagccatga cgcccttgac agcgtccttg gaggcgtagg agacaccctc 60
gataatgtgg ttaacaatga aca 83
<210> 274
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-13A
<400> 274
ggtgtcactc ccatgcaggt gacccagaag gctctctctg ctgccgagtc caccaagtct 60
gacgctgaca agaccactat gatccct 87
<210> 275
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-13B
<400> 275
tgagagggat catagtggtc ttgtcagcgt cagacttggt ggactcggca gcagagagag 60
ccttctgggt cacctgcatg ggagtgaca 89
<210> 276
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-14A
<400> 276
ctcaacgact gggctgccgt ccagtgccag acctccgtca actgggctgt cggatcctgg 60
ttctggaacc acttctctgg aggtctca 88
<210> 277
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-14B
<400> 277
tggttgagac ctccagagaa gtggttccag aaccaggatc cgacagccca gttgacggag 60
gtctggcact ggacggcagc ccagtcgt 88
<210> 278
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-15A
<400> 278
accaccagat tgagcaccat tgctttcctc agaaccccca caccgtcaac gtctacatct 60
ccggcatcgt caaggagacc tgcgaggagt acggcgtgc 99
<210> 279
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-15B
<400> 279
tagggcacgc cgtactcctc gcaggtctcc ttgacgatgc cggagatgta gacgttgacg 60
gtgtgggggt tctgaggaaa gcaatggtgc tcaatctgg 99
<210> 280
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-16A
<400> 280
cctaccaggc tgagatctcc ctcttctctg cctatttcaa gatgctgtcc cacctccgaa 60
ccctcggcaa cgaggacctc accgcctggt ccacc 95
<210> 281
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-16B
<400> 281
ttaggtggac caggcggtga ggtcctcgtt gccgagggtt cggaggtggg acagcatctt 60
gaaataggca gagaagaggg agatctcagc ctgg 94
<210> 282
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-1F
<400> 282
ttccatggtc ggcttcgacg agaccgtc 28
<210> 283
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-4R
<400> 283
ttggatcccc agaaaccagc caggagaaag atag 34
<210> 284
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-5F
<400> 284
ttggatccct gtacgccatg tgcgtgctc 29
<210> 285
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-8R
<400> 285
ccaagcttgt ggtagaatcg ctgtcggtgc c 31
<210> 286
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-9F
<400> 286
ccaagcttca gcacctgtac gctcccctga tc 32
<210> 287
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-12R
<400> 287
ttgtgcacgg ttcggggagg agccatgacg ccct 34
<210> 288
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-13F
<400> 288
ttgtgcacgg tgtcactccc atgcaggtg 29
<210> 289
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D4-16R
<400> 289
ttgcggccgc ttaggtggac caggcggtga ggtc 34
<210> 290
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL251
<400> 290
cgattctacc acaagttcca gcacctgtac gct 33
<210> 291
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL252
<400> 291
agcgtacagg tgctggaact tgtggtagaa tcg 33
<210> 292
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-1A
<400> 292
gccaacgacg ctggcgagcg aatctgggct gccgtcaccg atcccgaaat cctcattggc 60
accttctcct acctgctcct gaagcctctc ctgcgaaact c 101
<210> 293
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-1B
<400> 293
accagagttt cgcaggagag gcttcaggag caggtaggag aaggtgccaa tgaggatttc 60
gggatcggtg acggcagccc agattcgctc gccagcgtcg t 101
<210> 294
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-2A
<400> 294
tggtctcgtg gacgagaaga aaggagccta ccgaacctcc atgatctggt acaacgtcct 60
cctggctctc ttctctgccc tgtccttcta cgtgactgcc 100
<210> 295
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-2B
<400> 295
cggtggcagt cacgtagaag gacagggcag agaagagagc caggaggacg ttgtaccaga 60
tcatggaggt tcggtaggct cctttcttct cgtccacgag 100
<210> 296
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-3A
<400> 296
accgctctcg gctgggacta cggtactgga gcctggctgc gaagacagac cggtgatact 60
ccccagcctc tctttcagtg tccctctcct gtctgggact 100
<210> 297
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-3B
<400> 297
ttggagtccc agacaggaga gggacactga aagagaggct ggggagtatc accggtctgt 60
cttcgcagcc aggctccagt accgtagtcc cagccgagag 100
<210> 298
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-4A
<400> 298
ccaagctgtt cacctggact gccaaggcct tctactattc taagtacgtg gagtacctcg 60
acaccgcttg gctggtcctc aagggcaagc gagtgtcctt 100
<210> 299
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-4B
<400> 299
cagaaaggac actcgcttgc ccttgaggac cagccaagcg gtgtcgaggt actccacgta 60
cttagaatag tagaaggcct tggcagtcca ggtgaacagc 100
<210> 300
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-5A
<400> 300
ttccatcact ttggagctcc ctgggacgtc tacctcggca ttcgactgca caacgagggt 60
gtgtggatct tcatgttctt taactcgtt 89
<210> 301
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-5B
<400> 301
aatgaacgag ttaaagaaca tgaagatcca cacaccctcg ttgtgcagtc gaatgccgag 60
gtagacgtcc cagggagctc caaagtgat 89
<210> 302
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-6A
<400> 302
cattcacacc atcatgtaca cctactatgg actgactgcc gctggctaca agttcaaggc 60
caagcctctg atcactgcca tgcagatttg c 91
<210> 303
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-6B
<400> 303
actggcaaat ctgcatggca gtgatcagag gcttggcctt gaacttgtag ccagcggcag 60
tcagtccata gtaggtgtac atgatggtgt g 91
<210> 304
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-7A
<400> 304
cagttcgtcg gtggctttct cctggtctgg gactacatca acgttccctg cttcaactct 60
gacaagggca agctgttctc ctgggctttc aact 94
<210> 305
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-7B
<400> 305
gcgtagttga aagcccagga gaacagcttg cccttgtcag agttgaagca gggaacgttg 60
atgtagtccc agaccaggag aaagccaccg acga 94
<210> 306
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-8A
<400> 306
acgcctacgt cggatctgtc tttctcctgt tctgtcactt cttttaccag gacaacctgg 60
ccaccaagaa atccgctaag gctggtaagc a 91
<210> 307
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-8B
<400> 307
aagctgctta ccagccttag cggatttctt ggtggccagg ttgtcctggt aaaagaagtg 60
acagaacagg agaaagacag atccgacgta g 91
<210> 308
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-1F
<400> 308
tttccatggc tctggccaac gacgctggcg agcgaatctg g 41
<210> 309
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-4R
<400> 309
tttctgcaga aaggacactc gcttgccctt gaggac 36
<210> 310
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-5F
<400> 310
tttctgcagg ccttccatca ctttggagct ccctgggacg t 41
<210> 311
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer IL3-8R
<400> 311
tttgcggccg ctaaagctgc ttaccagcct tagcggattt ct 42
<210> 312
<211> 417
<212> DNA
<213> Artificial Sequence
<220>
<223> 417 bp NcoI/PstI fragment pT9(1-4)
<400> 312
catggctctg gccaacgacg ctggcgagcg aatctgggct gccgtcaccg atcccgaaat 60
cctcattggc accttctcct acctgctcct gaagcctctc ctgcgaaact ctggtctcgt 120
ggacgagaag aaaggagcct accgaacctc catgatctgg tacaacgtcc tcctggctct 180
cttctctgcc ctgtccttct acgtgactgc caccgctctc ggctgggact acggtactgg 240
agcctggctg cgaagacaga ccggtgatac tccccagcct ctctttcagt gtccctctcc 300
tgtctgggac tccaagctgt tcacctggac tgccaaggcc ttctactatt ctaagtacgt 360
ggagtacctc gacaccgctt ggctggtcct caagggcaag cgagtgtcct ttctgca 417
<210> 313
<211> 377
<212> DNA
<213> Artificial Sequence
<220>
<223> 377 bp PstI/Not1 fragment pT9(5-8)
<400> 313
ggccttccat cactttggag ctccctggga cgtctacctc ggcattcgac tgcacaacga 60
gggtgtgtgg atcttcatgt tctttaactc gttcattcac accatcatgt acacctacta 120
tggactgact gccgctggct acaagttcaa ggccaagcct ctgatcactg ccatgcagat 180
ttgccagttc gtcggtggct ttctcctggt ctgggactac atcaacgttc cctgcttcaa 240
ctctgacaag ggcaagctgt tctcctgggc tttcaactac gcctacgtcg gatctgtctt 300
tctcctgttc tgtcacttct tttaccagga caacctggcc accaagaaat ccgctaaggc 360
tggtaagcag ctttagc 377
<210> 314
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-1A
<400> 314
atggagtcca agcgacaggc tctgtctccc ctccagctga tggaacagac ctacgacgtc 60
gtgaacttcc accctggtgg agctgaaatc attgagaact acca 104
<210> 315
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-1B
<400> 315
tccctggtag ttctcaatga tttcagctcc accagggtgg aagttcacga cgtcgtaggt 60
ctgttccatc agctggaggg gagacagagc ctgtcgcttg gact 104
<210> 316
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-2A
<400> 316
gggacgagat gctactgacg ccttcatggt tatgcacttt caggaagcct tcgacaagct 60
caagcgaatg cccaagatca acccctcctt tgagctgcct cc 102
<210> 317
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-2B
<400> 317
ctggggaggc agctcaaagg aggggttgat cttgggcatt cgcttgagct tgtcgaaggc 60
ttcctgaaag tgcataacca tgaaggcgtc agtagcatct cg 102
<210> 318
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-3A
<400> 318
ccaggctgcc gtcaacgaag ctcaggagga tttccgaaag ctccgagaag agctgatcgc 60
cactggcatg tttgacgcct ctcccctctg gtactcgtac a 101
<210> 319
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-3B
<400> 319
atcttgtacg agtaccagag gggagaggcg tcaaacatgc cagtggcgat cagctcttct 60
cggagctttc ggaaatcctc ctgagcttcg ttgacggcag c 101
<210> 320
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-4A
<400> 320
ccaccaccct gggtcttggc gtgcttggat acttcctgat ggtccagtac cagatgtact 60
tcattggtgc tgtgctgctc ggtatgcact accagcaaat g 101
<210> 321
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-4B
<400> 321
atcccatttg ctggtagtgc ataccgagca gcacagcacc aatgaagtac atctggtact 60
ggaccatcag gaagtatcca agcacgccaa gacccagggt g 101
<210> 322
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-5A
<400> 322
ggatggctgt ctcatgacat ctgccaccac cagaccttca agaaccgaaa ctggaataac 60
ctcgtgggtc tggtctttgg caacggactc cagggcttct ccgt 104
<210> 323
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-5B
<400> 323
ggtcacggag aagccctgga gtccgttgcc aaagaccaga cccacgaggt tattccagtt 60
tcggttcttg aaggtctggt ggtggcagat gtcatgagac agcc 104
<210> 324
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-6A
<400> 324
gacctgttgg aaggacagac acaacgccca tcattctgct accaacgttc agggtcacga 60
tcccgacatt gataacctgc ctcccctcgc ctggtccgag g 101
<210> 325
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-6B
<400> 325
tcgtcctcgg accaggcgag gggaggcagg ttatcaatgt cgggatcgtg accctgaacg 60
ttggtagcag aatgatgggc gttgtgtctg tccttccaac a 101
<210> 326
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-7A
<400> 326
tcactcgagc ttctcccatc tcccgaaagc tcattcagtt ccaacagtac tatttcctgg 60
tcatctgtat tctcctgcga ttcatctggt gtttc 95
<210> 327
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-7B
<400> 327
actggaaaca ccagatgaat cgcaggagaa tacagatgac caggaaatag tactgttgga 60
actgaatgag ctttcgggag atgggagaag ctcga 95
<210> 328
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-8A
<400> 328
cagtgcgtgc tgaccgttcg atccctcaag gaccgagaca accagttcta ccgatctcag 60
tacaagaaag aggccattgg actcgctct 89
<210> 329
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-8B
<400> 329
gtgcagagcg agtccaatgg cctctttctt gtactgagat cggtagaact ggttgtctcg 60
gtccttgagg gatcgaacgg tcagcacgc 89
<210> 330
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-9A
<400> 330
gcactggact ctcaaggctc tgttccacct cttctttatg ccctccatcc tgacctcgct 60
cctggtgttc tttgtttccg agctc 85
<210> 331
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-9B
<400> 331
cgacgagctc ggaaacaaag aacaccagga gcgaggtcag gatggagggc ataaagaaga 60
ggtggaacag agccttgaga gtcca 85
<210> 332
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-10A
<400> 332
gtcggtggct tcggaattgc catcgtggtc ttcatgaacc actaccctct ggagaagatc 60
ggtgatcccg tctgggacgg acatggcttc t 91
<210> 333
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-10B
<400> 333
acagagaagc catgtccgtc ccagacggga tcaccgatct tctccagagg gtagtggttc 60
atgaagacca cgatggcaat tccgaagcca c 91
<210> 334
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-11A
<400> 334
ctgtgggtca gatccatgag accatgaaca ttcgacgagg catcattact gactggttct 60
ttggaggcct gaactaccag atcgagcacc at 92
<210> 335
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-11B
<400> 335
agagatggtg ctcgatctgg tagttcaggc ctccaaagaa ccagtcagta atgatgcctc 60
gtcgaatgtt catggtctca tggatctgac cc 92
<210> 336
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-12A
<400> 336
ctctggccca ctctgcctcg acacaacctc actgccgttt cctaccaggt ggaacagctg 60
tgccagaagc acaacctccc ctaccgaaac cct 93
<210> 337
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-12B
<400> 337
gcagagggtt tcggtagggg aggttgtgct tctggcacag ctgttccacc tggtaggaaa 60
cggcagtgag gttgtgtcga ggcagagtgg gcc 93
<210> 338
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-13A
<400> 338
ctgccccatg aaggtctcgt catcctgctc cgatacctgg ccgtgttcgc tcgaatggcc 60
gagaagcagc ccgctggcaa ggctctctaa 90
<210> 339
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-13B
<400> 339
ccgcttagag agccttgcca gcgggctgct tctcggccat tcgagcgaac acggccaggt 60
atcggagcag gatgacgaga ccttcatggg 90
<210> 340
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-1F
<400> 340
tttccatgga gtccaagcga caggctctgt ctcccctc 38
<210> 341
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-3R
<400> 341
tttagatctt gtacgagtac cagaggggag aggcgtc 37
<210> 342
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-4F
<400> 342
acaagatctc caccaccctg ggtcttggcg tgcttggata c 41
<210> 343
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-6R
<400> 343
tttctcgagt gacatcgtcc tcggaccagg cgaggggagg cag 43
<210> 344
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-7F
<400> 344
tcactcgagc ttctcccatc tcccgaaagc tc 32
<210> 345
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-9R
<400> 345
cgacgagctc ggaaacaaag aacaccagg 29
<210> 346
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-10F
<400> 346
tttgagctcg tcggtggctt cggaattgcc atcgtggtc 39
<210> 347
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D8-13R
<400> 347
tttgcggccg cttagagagc cttgccagcg ggctgc 36
<210> 348
<211> 309
<212> DNA
<213> Artificial Sequence
<220>
<223> 309 bp NcoI/BglII fragment of pT8(1-3)
<400> 348
catggagtcc aagcgacagg ctctgtctcc cctccagctg atggaacaga cctacgacgt 60
cgtgaacttc caccctggtg gagctgaaat cattgagaac taccagggac gagatgctac 120
tgacgccttc atggttatgc actttcagga agccttcgac aagctcaagc gaatgcccaa 180
gatcaacccc tcctttgagc tgcctcccca ggctgccgtc aacgaagctc aggaggattt 240
ccgaaagctc cgagaagagc tgatcgccac tggcatgttt gacgcctctc ccctctggta 300
ctcgtacaa 309
<210> 349
<211> 321
<212> DNA
<213> Artificial Sequence
<220>
<223> 321 bp BglII/XhoI fragment of pT8(4-6)
<400> 349
gatctccacc accctgggtc ttggcgtgct tggatacttc ctgatggtcc agtaccagat 60
gtacttcatt ggtgctgtgc tgctcggtat gcactaccag caaatgggat ggctgtctca 120
tgacatctgc caccaccaga ccttcaagaa ccgaaactgg aataacctcg tgggtctggt 180
ctttggcaac ggactccagg gcttctccgt gacctgttgg aaggacagac acaacgccca 240
tcattctgct accaacgttc agggtcacga tcccgacatt gataacctgc ctcccctcgc 300
ctggtccgag gacgatgtca c 321
<210> 350
<211> 264
<212> DNA
<213> Artificial Sequence
<220>
<223> 264 bp XhoI/SacI fragment of pT8(7-9)
<400> 350
tcgagcttct cccatctccc gaaagctcat tcagttccaa cagtactatt tcctggtcat 60
ctgtattctc ctgcgattca tctggtgttt ccagtgcgtg ctgaccgttc gatccctcaa 120
ggaccgagac aaccagttct accgatctca gtacaagaaa gaggccattg gactcgctct 180
gcactggact ctcaaggctc tgttccacct cttctttatg ccctccatcc tgacctcgct 240
cctggtgttc tttgtttccg agct 264
<210> 351
<211> 369
<212> DNA
<213> Artificial Sequence
<220>
<223> 369 bp Sac1/Not1 fragment of pT8(10-13)
<400> 351
cgtcggtggc ttcggaattg ccatcgtggt cttcatgaac cactaccctc tggagaagat 60
cggtgatccc gtctgggacg gacatggctt ctctgtgggt cagatccatg agaccatgaa 120
cattcgacga ggcatcatta ctgactggtt ctttggaggc ctgaactacc agatcgagca 180
ccatctctgg cccaccctgc ctcgacacaa cctcactgcc gtttcctacc aggtggaaca 240
gctgtgccag aagcacaacc tcccctaccg aaaccctctg ccccatgaag gtctcgtcat 300
cctgctccga tacctggccg tgttcgctcg aatggccgag aagcagcccg ctggcaaggc 360
tctctaagc 369
<210> 352
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW390
<400> 352
aagaatcatt caccatgaag tccaagcgac aggc 34
<210> 353
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW391
<400> 353
gcctgtcgct tggacttcat ggtgaatgat tctt 34
<210> 354
<211> 1852
<212> DNA
<213> Artificial Sequence
<220>
<223> chimeric D8S-1::XPR gene
<400> 354
cgatcaggag agaccgggtt ggcggcgtat ttgtgtccca aaaaacagcc ccaattgccc 60
caattgaccc caaattgacc cagtagcggg cccaaccccg gcgagagccc ccttcacccc 120
acatatcaaa cctcccccgg ttcccacact tgccgttaag ggcgtagggt actgcagtct 180
ggaatctacg cttgttcaga ctttgtacta gtttctttgt ctggccatcc gggtaaccca 240
tgccggacgc aaaatagact actgaaaatt tttttgcttt gtggttggga ctttagccaa 300
gggtataaaa gaccaccgtc cccgaattac ctttcctctt cttttctctc tctccttgtc 360
aactcacacc cgaaatcgtt aagcatttcc ttctgagtat aagaatcatt caccatggag 420
tccaagcgac aggctctgtc tcccctccag ctgatggaac agacctacga cgtcgtgaac 480
ttccaccctg gtggagctga aatcattgag aactaccagg gacgagatgc tactgacgcc 540
ttcatggtta tgcactttca ggaagccttc gacaagctca agcgaatgcc caagatcaac 600
ccctcctttg agctgcctcc ccaggctgcc gtcaacgaag ctcaggagga tttccgaaag 660
ctccgagaag agctgatcgc cactggcatg tttgacgcct ctcccctctg gtactcgtac 720
aagatctcca ccaccctggg tcttggcgtg cttggatact tcctgatggt ccagtaccag 780
atgtacttca ttggtgctgt gctgctcggt atgcactacc agcaaatggg atggctgtct 840
catgacatct gccaccacca gaccttcaag aaccgaaact ggaataacct cgtgggtctg 900
gtctttggca acggactcca gggcttctcc gtgacctgtt ggaaggacag acacaacgcc 960
catcattctg ctaccaacgt tcagggtcac gatcccgaca ttgataacct gcctcccctc 1020
gcctggtccg aggacgatgt cactcgagct tctcccatct cccgaaagct cattcagttc 1080
caacagtact atttcctggt catctgtatt ctcctgcgat tcatctggtg tttccagtgc 1140
gtgctgaccg ttcgatccct caaggaccga gacaaccagt tctaccgatc tcagtacaag 1200
aaagaggcca ttggactcgc tctgcactgg actctcaagg ctctgttcca cctcttcttt 1260
atgccctcca tcctgacctc gctcctggtg ttctttgttt ccgagctcgt cggtggcttc 1320
ggaattgcca tcgtggtctt catgaaccac taccctctgg agaagatcgg tgatcccgtc 1380
tgggacggac atggcttctc tgtgggtcag atccatgaga ccatgaacat tcgacgaggc 1440
atcattactg actggttctt tggaggcctg aactaccaga tcgagcacca tctctggccc 1500
accctgcctc gacacaacct cactgccgtt tcctaccagg tggaacagct gtgccagaag 1560
cacaacctcc cctaccgaaa ccctctgccc catgaaggtc tcgtcatcct gctccgatac 1620
ctggccgtgt tcgctcgaat ggccgagaag cagcccgctg gcaaggctct ctaagcggcc 1680
gccaccgccg agattccggc ctcttcggcc gccaagcgac ccgggtggac gtctagaggt 1740
acctagcaat taacagatag tttgccggtg ataattctct taacctccca cactcctttg 1800
acataacgat ttatgtaacg aaactgaaat ttgaccagat attgtgtccg cg 1852
<210> 355
<211> 1898
<212> DNA
<213> Artificial Sequence
<220>
<223> chimeric D8S-2::XPR gene
<400> 355
cgatcaggag agaccgggtt ggcggcgtat ttgtgtccca aaaaacagcc ccaattgccc 60
caattgaccc caaattgacc cagtagcggg cccaaccccg gcgagagccc ccttcacccc 120
acatatcaaa cctcccccgg ttcccacact tgccgttaag ggcgtagggt actgcagtct 180
ggaatctacg cttgttcaga ctttgtacta gtttctttgt ctggccatcc gggtaaccca 240
tgccggacgc aaaatagact actgaaaatt tttttgcttt gtggttggga ctttagccaa 300
gggtataaaa gaccaccgtc cccgaattac ctttcctctt cttttctctc tctccttgtc 360
aactcacacc cgaaatcgtt aagcatttcc ttctgagtat aagaatcatt caccatgaag 420
tccaagcgac aggctctgtc tcccctccag ctgatggaac agacctacga cgtcgtgaac 480
ttccaccctg gtggagctga aatcattgag aactaccagg gacgagatgc tactgacgcc 540
ttcatggtta tgcactttca ggaagccttc gacaagctca agcgaatgcc caagatcaac 600
ccctcctttg agctgcctcc ccaggctgcc gtcaacgaag ctcaggagga tttccgaaag 660
ctccgagaag agctgatcgc cactggcatg tttgacgcct ctcccctctg gtactcgtac 720
aagatctcca ccaccctggg tcttggcgtg cttggatact tcctgatggt ccagtaccag 780
atgtacttca ttggtgctgt gctgctcggt atgcactacc agcaaatggg atggctgtct 840
catgacatct gccaccacca gaccttcaag aaccgaaact ggaataacct cgtgggtctg 900
gtctttggca acggactcca gggcttctcc gtgacctgtt ggaaggacag acacaacgcc 960
catcattctg ctaccaacgt tcagggtcac gatcccgaca ttgataacct gcctcccctc 1020
gcctggtccg aggacgatgt cactcgagct tctcccatct cccgaaagct cattcagttc 1080
caacagtact atttcctggt catctgtatt ctcctgcgat tcatctggtg tttccagtgc 1140
gtgctgaccg ttcgatccct caaggaccga gacaaccagt tctaccgatc tcagtacaag 1200
aaagaggcca ttggactcgc tctgcactgg actctcaagg ctctgttcca cctcttcttt 1260
atgccctcca tcctgacctc gctcctggtg ttctttgttt ccgagctcgt cggtggcttc 1320
ggaattgcca tcgtggtctt catgaaccac taccctctgg agaagatcgg tgatcccgtc 1380
tgggacggac atggcttctc tgtgggtcag atccatgaga ccatgaacat tcgacgaggc 1440
atcattactg actggttctt tggaggcctg aactaccaga tcgagcacca tctctggccc 1500
accctgcctc gacacaacct cactgccgtt tcctaccagg tggaacagct gtgccagaag 1560
cacaacctcc cctaccgaaa ccctctgccc catgaaggtc tcgtcatcct gctccgatac 1620
ctggccgtgt tcgctcgaat ggccgagaag cagcccgctg gcaaggctct ctaagcggcc 1680
gccaccgcgg cccgagattc cggcctcttc ggccgccaag cgacccgggt ggacgtctag 1740
aggtacctag caattaacag atagtttgcc ggtgataatt ctcttaacct cccacactcc 1800
tttgacataa cgatttatgt aacgaaactg aaatttgacc agatattgtg tccgcggtgg 1860
agctccagct tttgttccct ttagtgaggg ttaattaa 1898
<210> 356
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW392
<400> 356
gaacagacct acgacgtctc cgcttgggtg aacttccacc ctggt 45
<210> 357
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW393
<400> 357
accagggtgg aagttcaccc aagcggagac gtcgtaggtc tgttc 45
<210> 358
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Eg5-1
<400> 358
gaaatgaagt caaagcgcc 19
<210> 359
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Eg3-3
<400> 359
ccttatagag ccttccccg 19
<210> 360
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer T7
<400> 360
gtaatacgac tcactatagg gc 22
<210> 361
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer M13-28Rev
<400> 361
ggaaacagct atgaccatg 19
<210> 362
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Eg3-2
<400> 362
ttggcaatgg tctgcaagg 19
<210> 363
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Eg5-2
<400> 363
aatgttcatg gtctcatgg 19
<210> 364
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ODMW404
<400> 364
cctggtacca tgaagtccaa gcgacaggc 29
<210> 365
<211> 1272
<212> DNA
<213> Artificial Sequence
<220>
<223> chimeric gene
<400> 365
catgaagtcc aagcgacagg ctctgtctcc cctccagctg atggaacaga cctacgacgt 60
ctccgcttgg gtgaacttcc accctggtgg agctgaaatc attgagaact accagggacg 120
agatgctact gacgccttca tggttatgca ctttcaggaa gccttcgaca agctcaagcg 180
aatgcccaag atcaacccct cctttgagct gcctccccag gctgccgtca acgaagctca 240
ggaggatttc cgaaagctcc gagaagagct gatcgccact ggcatgtttg acgcctctcc 300
cctctggtac tcgtacaaga tctccaccac cctgggtctt ggcgtgcttg gatacttcct 360
gatggtccag taccagatgt acttcattgg tgctgtgctg ctcggtatgc actaccagca 420
aatgggatgg ctgtctcatg acatctgcca ccaccagacc ttcaagaacc gaaactggaa 480
taacctcgtg ggtctggtct ttggcaacgg actccagggc ttctccgtga cctgttggaa 540
ggacagacac aacgcccatc attctgctac caacgttcag ggtcacgatc ccgacattga 600
taacctgcct cccctcgcct ggtccgagga cgatgtcact cgagcttctc ccatctcccg 660
aaagctcatt cagttccaac agtactattt cctggtcatc tgtattctcc tgcgattcat 720
ctggtgtttc cagtgcgtgc tgaccgttcg atccctcaag gaccgagaca accagttcta 780
ccgatctcag tacaagaaag aggccattgg actcgctctg cactggactc tcaaggctct 840
gttccacctc ttctttatgc cctccatcct gacctcgctc ctggtgttct ttgtttccga 900
gctcgtcggt ggcttcggaa ttgccatcgt ggtcttcatg aaccactacc ctctggagaa 960
gatcggtgat cccgtctggg acggacatgg cttctctgtg ggtcagatcc atgagaccat 1020
gaacattcga cgaggcatca ttactgactg gttctttgga ggcctgaact accagatcga 1080
gcaccatctc tggcccaccc tgcctcgaca caacctcact gccgtttcct accaggtgga 1140
acagctgtgc cagaagcaca acctccccta ccgaaaccct ctgccccatg aaggtctcgt 1200
catcctgctc cgatacctgg ccgtgttcgc tcgaatggcc gagaagcagc ccgctggcaa 1260
ggctctctaa gc 1272
<210> 366
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL521
<400> 366
tttccatggt gaagtccaag cgacaggctc tgcccctcac catcgacgga actacctacg 60
acgtctccgc ttgggtgaac 80
<210> 367
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL522
<400> 367
tggagatctt gtacgagtac cagaggggag 30
<210> 368
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL525
<400> 368
ccttcatggt tatgcactct caggaagcct tcgacaa 37
<210> 369
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL526
<400> 369
ttgtcgaagg cttcctgaga gtgcataacc atgaagg 37
<210> 370
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL527
<400> 370
ccaagatcaa cccctcctcc gagctgcctc cccaggct 38
<210> 371
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL528
<400> 371
agcctgggga ggcagctcgg aggaggggtt gatcttgg 38
<210> 372
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL529
<400> 372
gggcttctcc gtgacctggt ggaaggacag acacaac 37
<210> 373
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL530
<400> 373
gttgtgtctg tccttccacc aggtcacgga gaagccc 37
<210> 374
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL531
<400> 374
acattgataa cctgcctctg ctcgcctggt ccgaggac 38
<210> 375
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL532
<400> 375
gtcctcggac caggcgagca gaggcaggtt atcaatgt 38
<210> 376
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL533
<400> 376
tcatctggtg tttccagtct gtgctgaccg ttcgatcc 38
<210> 377
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL534
<400> 377
ggatcgaacg gtcagcacag actggaaaca ccagatga 38
<210> 378
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL535
<400> 378
ctgcactgga ctctcaagac cctgttccac ctcttcttt 39
<210> 379
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL536
<400> 379
aaagaagagg tggaacaggg tcttgagagt ccagtgcag 39
<210> 380
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL537
<400> 380
ctggagaaga tcggtgattc cgtctgggac ggacatg 37
<210> 381
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL538
<400> 381
catgtccgtc ccagacggaa tcaccgatct tctccag 37
<210> 382
<211> 34
<212> DNA
<213> cow cat
<400> 382
ataacttcgt ataatgtatg ctatacgaag ttat 34
<210> 383
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 436
<400> 383
tatctgctgt cgtggttaat taacgcggac acaatatctg gtcaa 45
<210> 384
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 437
<400> 384
ctgcaggtaa aggccggcct cgacgcagta ggatgtcctg 40
<210> 385
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 475
<400> 385
ccatccacac ttgcggccgc ttatttgttg agatacgc 38
<210> 386
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 477
<400> 386
acaagcttgc ggccgcttat ttgttgagat acgcatcc 38
<210> 387
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 478
<400> 387
agtggctctc cataaacctg acgaaattaa agagg 35
<210> 388
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 476
<400> 388
ctagtggatc cgaattccat gggtggcgga ggacagcaga 40
<210> 389
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 505
<400> 389
catcatctct ttcccacagt gcctcggcac aactac 36
<210> 390
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 506
<400> 390
gtagttgtgc cgaggcactg tgggaaagag atgatg 36
<210> 391
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> SMART IV oligonucleotide
<400> 391
aagcagtggt atcaacgcag agtggccatt acggccggg 39
<210> 392
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> CDSIII/3'PCR primer
<220>
<221> misc_feature
<222> (28)..(57)
<223> thymidine (dT); see BD Biosciences Clontech's SMART cDNA
technology
<220>
<221> misc_feature
<222> (59)..(59)
<223> n is a, c, g, or t
<400> 392
attctagagg ccgaggcggc cgacatgttt tttttttttt tttttttttt tttttttvn 59
<210> 393
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'-PCR primer
<400> 393
aagcagtggt atcaacgcag agt 23
<210> 394
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer M13
<400> 394
tgtaaaacga cggccagt 18
<210> 395
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MLPAT-F
<400> 395
gatcccatgg tcgggtccgt cacccgaccc aca 33
<210> 396
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MLPAT-R
<400> 396
gatcgcggcc gctcacatcc agttctctga ccac 34
<210> 397
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer LPAT-Re-5-1
<400> 397
gatcgagctc gacattgagc attgatctat tt 32
<210> 398
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer LPAT-Re-5-2
<400> 398
gactatcgat accatggtcg ggcaatgaga acggcagcaa g 41
<210> 399
<211> 1129
<212> DNA
<213> Yarrowia lipolytica
<400> 399
gatcgagctc gacattgagc attgatctat ttgtttagtt tagtacgtac gtagagtagt 60
tggttattgt atactggata ctggtcggat agtcgtgtac aagtacagta tatacttgta 120
gtttggaaca ctagtcacaa gtatagttaa taacagtata gtatatactt ctactgtaca 180
tatagttaca aaacagtaca gtatatactt ctactgtaca tactgtagtt tcatggttga 240
tataggtgaa aatgacatgg tatcccgctt cccaatgact gatacgagca acaaacaatt 300
ctctctaata gatgttcatt ataaccacac tgtacggtaa ttatatcgta gacagtgtac 360
agtattagaa cgtgtttttg atcccaagtt ggtggaaatg ttgagttgag atgagatgat 420
aatgttatca gcatgagggg tggatgtata cagtaggaga aggagtatgg gcagttgtgc 480
ggtagcagcg tctctgaatc acacaaagcc gggcttacag cagaggcaag aatggcgcca 540
tgtgcctgcg caatcaaggg cgtgaaccac ggcttgattc cacggcttga tgccacagct 600
taatgccaca tgccacagca taataccacg gcatgacccc gctgactcca accttcattt 660
cggcacgtgt aggtgcacaa gggacttcaa gaggggccaa tttcatgcgg acacatggcg 720
caaaaaacgc ccgactttga ttacacagac acgtaataac gacgaagccg agatgagcac 780
acgtggccaa gtctgccaat ggccccctgg acccccctga caaagtttcc caacaagccc 840
agccgtgcat ggtgtgtttt tgtgcggaga cacacgccaa ttaggctcat ttgagggtat 900
gcagcgaaaa aaaattagtg tgggtagttt gtttgcagga atcaagtggg tggttgaaaa 960
acaagaaaga gcgacgacaa gagagagaga aaaagagaga gagactccat aaagcgtgca 1020
tcaaaattaa ggtgtgtgac tatccgaaaa ccaaacatga acagttggat atatgtcgct 1080
gtgattgcag ttgctgccgt tctcattgcc cgaccatgga tcgatgatc 1129
<210> 400
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer LPAT-Re-3-1
<400> 400
gactatcgat gcggccgcag actgcagcac aagaagtgct 40
<210> 401
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer LPAT-Re-3-2
<400> 401
gatcctcgag tctagagcag ggtgttggag gggatggaga 40
<210> 402
<211> 938
<212> DNA
<213> Yarrowia lipolytica
<400> 402
gactatcgat gcggccgcag actgcagcac aagaagtgct tgtagctact ttaggagaga 60
gataggtaat atgaaacatt tttcagatcg acacccacgg cgaaccattg gctgtggagc 120
tatgggtgaa tggattaata tagcaacgaa atctacctcg attaccaacg caaaacgagc 180
ccactttctc tgtactgtgc tatatcgtgt ataccccagt tctcttagat cagtcgtacc 240
cgcccgtact gtcatggact attcaaactg ttggttttta gtctactcct acttgtacca 300
tgcttatgct cgatgtacca gctacttcgt ccgcggacgt gtctctataa taaccctgaa 360
agctgctcat tcctctaaaa gtcgtgacac cacctagtct tactcatcga gattgtatta 420
ctcatcgaga ttgtattact catcgagatt gtattactca tcttgatttt ctctcgtacg 480
atgttgttag taatcatggc cttccagccg aactctaccg accgaggtaa cttcacaagg 540
tttagacaga gtccaattat tcgaggagcc cataagtcta cctttaccta ctctactgta 600
gtgtgaagat gatcatgaga ggcatagatt ggattggaca gttggacggg tgacgaggga 660
gcagacaagt gcgagattgg cgttgttata tggactccag ggaccgtgaa ttgctcttaa 720
actggccgat attagcggct ggaaagatcc ttgtcccact ctcttctttg tctatcctgg 780
tgatccattt ttttgacagc taaaattaac tcgccgaaac acgtcggcat accgagatta 840
aattacaaaa gaagattaaa acgcgaccag caaaccgcaa cttccgcttt actcaacctc 900
tccatcccct ccaacaccct gctctagact cgaggatc 938
<210> 403
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer PZUF-mod1
<400> 403
gatcccatgg atccaggcct gttaacgg 28
<210> 404
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer PZUF-mod2
<400> 404
gatcgcggcc gcagacatga taagatacat tg 32
<210> 405
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MACAT-F1
<400> 405
gatcccatgg cagagtcgac aacaacgaca tg 32
<210> 406
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MACAT-R
<400> 406
gatcgcggcc gctcaaacat ccatatggcg cttg 34
<210> 407
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MDGAT-F
<400> 407
gatcccatgg cgctctttgc gcctttac 28
<210> 408
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MDGAT-R1
<400> 408
gatcgcggcc gcctattcga tgatgcacag ttcct 35
<210> 409
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-N1
<220>
<221> misc_feature
<222> (3)..(3)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(9)
<223> n is a, c, g, or t
<400> 409
ccncaygcna aycarttygt 20
<210> 410
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-NR5
<220>
<221> misc_feature
<222> (6)..(6)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(9)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, or t
<400> 410
ttccangtng ccatntcrtc 20
<210> 411
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-5N1
<400> 411
catctctcgg ctgatccaga tg 22
<210> 412
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-5N2
<400> 412
ttgtctggcg ctacctggaa c 21
<210> 413
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-5N3
<400> 413
cattgtcgct cgtgtcatca gc 22
<210> 414
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Genome Walker adaptor-1
<400> 414
gtaatacgac tatagggcac gcgtggtcga cggcccgggc tggt 44
<210> 415
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Genome Walker adaptor-2
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5' end is associated with a -PO4 group
<220>
<221> misc_feature
<222> (8)..(8)
<223> 3' end is associated with a -H2N group
<400> 415
accagccc 8
<210> 416
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-5-1A
<400> 416
cagctccttt gtgaatttag tg 22
<210> 417
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer AP1
<400> 417
gtaatacgac tcactatagg gc 22
<210> 418
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-3N1
<400> 418
cataacgatc cagaagtttg atg 23
<210> 419
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer AP2
<400> 419
actatagggc acgcgtggt 19
<210> 420
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer mgpat-cdna-5
<400> 420
gatcggatcc tcagatctac gactttgtgt cg 32
<210> 421
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MGPAT-cDNA-R
<400> 421
gatcgcggcc gcctaaatgt cttttgactt ggc 33
<210> 422
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MA Elong 3'1
<400> 422
gatacggatc agagcctgtg gaaca 25
<210> 423
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MA elong 3'2
<400> 423
cttctacctt tcaaagtttt acgag 25
<210> 424
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MA Elong 5'1
<400> 424
gcataggtcc agactccatt atgcg 25
<210> 425
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MA Elong 5'2
<400> 425
cagaggaata taggtcggca ccaaa 25
<210> 426
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MA ELONG 5' NcoI 3
<400> 426
gatcccatgg agtctggacc tatg 24
<210> 427
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer MA ELONG 3' NotI 1
<400> 427
gatcgcggcc gcttactggg ccttcttctg 30
<210> 428
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL597
<400> 428
tttccatggt ctcgtcaatc tcgccgac 28
<210> 429
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL598
<400> 429
tttgcggccg cttagatgga cttggccttc aag 33
<210> 430
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL325
<400> 430
tttgcggccg catggagcgt gtgttctgag tc 32
<210> 431
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL326
<400> 431
cccttaatta actcacctgc aggattgaga ctatgaatgg attccc 46
<210> 432
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL567
<400> 432
tttccatggc tgccgtccct attgaattca acgtcc 36
<210> 433
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL568
<400> 433
gatcagctca aagtacttgg tcag 24
<210> 434
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL569
<400> 434
ctgaccaagt actttgagct gatc 24
<210> 435
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL570
<400> 435
tttgcggccg cttatgctcg tcgagatcgg gtagtg 36
<210> 436
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL571
<400> 436
tcctccacac ctaccatcac ggtgccactg ctcttc 36
<210> 437
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer YL572
<400> 437
gaagagcagt ggcaccgtga tggtaggtgt ggagga 36
<210> 438
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer CPT1-5'-NcoI
<400> 438
acgtccatgg gcgtattcat taaacagg 28
<210> 439
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer CPT1-3'-NotI
<400> 439
acgtgcggcc gcttattcgg tcttcttctc ctg 33
<210> 440
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Isc1F
<400> 440
ataccatgga caacagaaaa gacagagatg 30
<210> 441
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Isc1R
<400> 441
tgcggccgct catttctcgc tcaagaaagt t 31
<210> 442
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Pcl1F
<400> 442
ataccatggg tgaatacagc aaaggctctt 30
<210> 443
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Pcl1R
<400> 443
tgcggccgct taaaacccat gttgactcat gat 33
<210> 444
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P95
<400> 444
ggcaagctta ttgtcgttgg tggagcaca 29
<210> 445
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P96
<400> 445
aattccacca gatctgtcgt ggtattcgga cactt 35
<210> 446
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P97
<400> 446
ataccacgac agatctggtg gaattgccac cgagggagc 39
<210> 447
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P98
<400> 447
gcggaattcg cagatagact ggtttcgctt 30
<210> 448
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P115
<400> 448
aactacatct tcggctatca cc 22
<210> 449
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P116
<400> 449
tgaacaagcg tagattccag ac 22
<210> 450
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P112
<400> 450
cacccttgct cggcgatgta tc 22
<210> 451
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P39
<400> 451
ggcggtaccg gatcctcaat cgaagagact aagc 34
<210> 452
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P41
<400> 452
cttctgtatt ctagatctca agatcgagaa gcaccagaaa a 41
<210> 453
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P40
<400> 453
gcttctcgat cttgagatct agaatacaga agtcaacggt tcatccat 48
<210> 454
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P42
<400> 454
ccggaattca gctttgagct tggagaagta 30
<210> 455
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P51
<400> 455
tagatagact ggactatacg gc 22
<210> 456
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P52
<400> 456
gactgtccta ccctgatttg 20
<210> 457
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P37
<400> 457
ccaggtacca agatcgagaa gcaccagaaa agc 33
<210> 458
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P38
<400> 458
ctcgaattca gaatacagaa gtcaacggtt catcca 36
<210> 459
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P201
<400> 459
ctcgcggccg ccatggaggt ccgacgacga aarathgayg t 41
<210> 460
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P203
<220>
<221> misc_feature
<222> (38)..(38)
<223> n is a, c, g, or t
<400> 460
gaggcggccg ctactggttc tgcttgtagt tgtaggcnar rtarta 46
<210> 461
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P214
<400> 461
atctcgacaa tcgtcgcagc cctcctcaag agcatcgtcc agaa 44
<210> 462
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P215
<400> 462
cgaacagatc ccaatattac atgaggcgag tttgagagac ag 42
<210> 463
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P216
<400> 463
aactggtatt taaatgatgt ccccaagacg gagcgtattc gacc 44
<210> 464
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P217
<400> 464
gtagttgtag gctaggtagt aaaggaatgc acaagtgggt 40
<210> 465
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P219
<400> 465
cgaatacgct ccgtcttggg gacatcattt aaataccagt 40
<210> 466
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P226
<400> 466
cgacgaaaaa ttgacgtgct 20
<210> 467
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P227
<400> 467
gatttccgaa cagatcccaa 20
Claims (46)
- ω-3/ω-6 지방산 생합성 경로의 유전자인a) Δ6 데새투라제(desaturase)를 코딩하는 하나 이상의 유전자;b) C18 /20 엘론가제(elongase)를 코딩하는 하나 이상의 유전자;c) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;d) Δ17 데새투라제를 코딩하는 하나 이상의 유전자;e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자를 포함하는 유전자 풀(gene pool)을 포함하는 백그라운드 야로위아 종(Yarrowia sp.)을 포함하는, 도코사헥사엔산의 생성을 위한 재조합 생성 숙주 세포.
- ω-3/ω-6 지방산 생합성 경로의 유전자인a) Δ15 데새투라제를 코딩하는 하나 이상의 유전자;b) Δ6 데새투라제를 코딩하는 하나 이상의 유전자;c) C18 /20 엘론가제를 코딩하는 하나 이상의 유전자;d) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하는, 도코사헥사엔산의 생성을 위한 재조합 생성 숙주 세포.
- ω-3/ω-6 지방산 생합성 경로의 유전자인a) Δ9 엘론가제를 코딩하는 하나 이상의 유전자;b) Δ8 데새투라제를 코딩하는 하나 이상의 유전자;c) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;d) Δ17 데새투라제를 코딩하는 하나 이상의 유전자;e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하는, 도코사헥사엔산의 생성을 위한 재조합 생성 숙주 세포.
- ω-3/ω-6 지방산 생합성 경로의 유전자인a) Δ15 데새투라제를 코딩하는 하나 이상의 유전자;b) Δ9 엘론가제를 코딩하는 하나 이상의 유전자;c) Δ8 데새투라제를 코딩하는 하나 이상의 유전자;d) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하는, 도코사헥사엔산의 생성을 위한 재조합 생성 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 유전자 풀이 Δ12 데새투라제를 코딩하는 하나 이상의 유전자를 임의로 포함하는 것인 재조합 생성 숙주.
- 제5항에 있어서, 상기 백그라운드 야로위아 종이 Δ12 데새투라제 활성을 갖는 폴리펩티드를 코딩하는 임의의 천연 유전자가 결여된 것인 재조합 생성 숙주.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 ω-3/ω-6 지방산 생합성 경로 유전자 중 하나 이상이 서열 210 내지 221로 이루어진 군으로부터 선택된 핵산 서열을 갖는 프로모터 서열의 조절하에 있는 것인 재조합 생성 숙주.
- 제5항에 있어서, 상기 Δ12 데새투라제가 서열 29, 31, 33, 35, 36, 37, 39, 41, 43, 45, 46, 48 내지 50으로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 것인 재조합 생성 숙주.
- 제1항 또는 제2항에 있어서, 상기 Δ6 데새투라제가 서열 2 및 5로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 C18 /20 엘론가제가 서열 23 및 26으로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 것인 재조합 생성 숙주 세포.
- 제3항 또는 제4항에 있어서, 상기 Δ9 엘론가제가 서열 70 및 23으로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 Δ8 데새투라제가 서열 78, 80 및 82로 이루어진 군으로부터 선택된 아미노산을 갖는 것인 재조합 생성 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 Δ5 데새투라제를 코딩하는 하나 이상의 유전자가 효소성 기질로서a) 리놀렌산 및 디호모-γ-리놀렌산;b) α-리놀렌산 및 에이코사테트라엔산; 및c) 리놀렌산, 디호모-γ-리놀렌산, α-리놀렌산 및 에이코사테트라엔산으로 이루어진 군으로부터 선택된 2종 이상의 지방산에 결합하는 이작용성 Δ5/Δ6 데새투라제 폴리펩티드를 코딩하는 것인 재조합 생성 숙주.
- 제11항에 있어서, 상기 이작용성 Δ5/Δ6 데새투라제 폴리펩티드가 서열 15 및 18로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 것인 재조합 생성 숙 주.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 Δ5 데새투라제가 서열 7, 9, 12, 15 및 18로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 C20 /22 엘론가제가 서열 101 및 103으로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 Δ4 데새투라제가 서열 105 및 107로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 것인 재조합 생성 숙주 세포.
- 제1항 또는 제3항에 있어서, 상기 Δ17 데새투라제가 서열 20에 기재된 아미노산 서열을 갖는 것인 재조합 생성 숙주 세포.
- 제1항 또는 제3항에 있어서, 상기 유전자 풀이 Δ15 데새투라제를 코딩하는 하나 이상의 유전자를 임의로 포함하는 것인 재조합 생성 숙주 세포.
- 제2항 또는 제4항에 있어서, 상기 Δ15 데새투라제를 코딩하는 상기 하나 이상의 유전자가 효소성 기질로서의 올레산 및 리놀레산 둘다에 결합하는 이작용성 Δ15/Δ12 데새투라제 폴리펩티드를 코딩하는 것인 재조합 생성 숙주.
- 제16항에 있어서, 상기 이작용성 Δ15/Δ12 데새투라제 폴리펩티드가 서열 52에 기재된 아미노산 서열을 갖는 것인 재조합 생성 숙주.
- 제2항 또는 제4항에 있어서, 상기 Δ15 데새투라제가 서열 52, 54, 56, 58, 60, 62 및 64 내지 68로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 것인 재조합 생성 숙주.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 유전자 풀이 임의로a) Δ9 데새투라제를 코딩하는 하나 이상의 유전자;b) C16 /18 엘론가제를 코딩하는 하나 이상의 유전자; 및c) C14 /16 엘론가제를 코딩하는 하나 이상의 유전자로 이루어진 군으로부터 선택된 ω-3/ω-6 지방산 생합성 경로 유전자를 포함하는 것인 재조합 생성 숙주.
- 제19항에 있어서, 상기 C16 /18 엘론가제가 서열 84, 87 및 95로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 C14 /16 엘론가제가 서열 98에 기재된 아미노산 서열을 갖는 것인 재조합 생성 숙주.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 유전자 풀이 임의로a) 디아실글리세롤 아실트랜스퍼라제 (DGAT1);b) 디아실글리세롤 아실트랜스퍼라제 (DGAT2);c) 인지질:디아실글리세롤 아실트랜스퍼라제 (PDAT);d) 아실-CoA:1-아실 리소포스파티딜콜린 아실트랜스퍼라제 (LPCAT);e) 글리세롤-3-포스페이트 아실트랜스퍼라제 (GPAT); 및f) 리소포스파티드산 아실트랜스퍼라제 (LPAAT)로 이루어진 군으로부터 선택된 아실트랜스퍼라제를 코딩하는 하나 이상의 유전자를 포함하는 것인 재조합 생성 숙주.
- 제21항에 있어서, 상기 디아실글리세롤 아실트랜스퍼라제 (DGAT1)가 서열 123 및 125 내지 129로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 디아실글리세롤 아실트랜스퍼라제 (DGAT2)가 서열 131, 133, 135 및 137로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 인지질:디아실글리세롤 아실트랜스퍼라제 (PDAT)가 서열 118에 기재된 아미노산 서열을 갖고; 상기 글리세롤-3-포스페이트 아실트랜스퍼라제 (GPAT)가 서열 139에 기재된 아미노산 서열을 갖고; 상기 리소포스파티드산 아실트랜스퍼라제 (LPAAT)가 서열 109, 111, 113 및 116으로 이루어진 군으로부터 선택된 아미노산 서열을 갖고; 상기 아실-CoA:1-아실 리소포스파티딜콜린 아실트랜스퍼라제 (LPCAT)가 서열 121에 기재된 아미노산 서열을 갖는 것인 재조합 생성 숙주.
- ω-3/ω-6 지방산 생합성 경로의 유전자인a) Δ6 데새투라제를 코딩하는 하나 이상의 유전자;b) C18 /20 엘론가제를 코딩하는 하나 이상의 유전자;c) Δ5 데새투라제를 코딩하는 하나 이상의 유전자;d) Δ17 데새투라제를 코딩하는 하나 이상의 유전자;e) C20 /22 엘론가제를 코딩하는 하나 이상의 유전자;f) Δ4 데새투라제를 코딩하는 하나 이상의 유전자;g) C16 /18 엘론가제를 코딩하는 하나 이상의 유전자; 및h) Δ12 데새투라제를 코딩하는 하나 이상의 유전자를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하고;상기 백그라운드 야로위아 종이 오로티딘-5'-포스페이트 데카르복실라제 (Ura3), 이소프로필 말레이트 데히드로게나제 (Leu2), 아실-CoA 옥시다제 (Pox3), 아실-CoA 옥시다제 (Pox2), Δ12 데새투라제 및 리파제 1 (Lip1)로 이루어진 군으로부터 선택된 효소를 코딩하는 임의의 천연 유전자가 결여된 것인,도코사헥사엔산 생성을 위한 재조합 생성 숙주 세포.
- ω-3/ω-6 지방산 생합성 경로의 유전자인a) i. Δ6 데새투라제를 코딩하는 하나 이상의 유전자; C18 /20 엘론가제를 코딩하는 하나 이상의 유전자; Δ5 데새투라제를 코딩하는 하나 이상의 유전자; Δ 17 데새투라제를 코딩하는 하나 이상의 유전자; C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및 Δ4 데새투라제를 코딩하는 하나 이상의 유전자;ii. Δ9 엘론가제를 코딩하는 하나 이상의 유전자; Δ8 데새투라제를 코딩하는 하나 이상의 유전자; Δ5 데새투라제를 코딩하는 하나 이상의 유전자; Δ17 데새투라제를 코딩하는 하나 이상의 유전자; C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및 Δ4 데새투라제를 코딩하는 하나 이상의 유전자;iii. Δ15 데새투라제를 코딩하는 하나 이상의 유전자; Δ6 데새투라제를 코딩하는 하나 이상의 유전자; C18 /20 엘론가제를 코딩하는 하나 이상의 유전자; Δ5 데새투라제를 코딩하는 하나 이상의 유전자; C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및 Δ4 데새투라제를 코딩하는 하나 이상의 유전자; 및iv. Δ15 데새투라제를 코딩하는 하나 이상의 유전자; Δ9 엘론가제를 코딩하는 하나 이상의 유전자; Δ8 데새투라제를 코딩하는 하나 이상의 유전자; Δ5 데새투라제를 코딩하는 하나 이상의 유전자; C20 /22 엘론가제를 코딩하는 하나 이상의 유전자; 및 Δ4 데새투라제를 코딩하는 하나 이상의 유전자로 이루어진 군으로부터 선택된 하나 이상의 유전자 세트;b) i. Δ12 데새투라제;ii. Δ9 데새투라제;iii. C14 /16 엘론가제; 및iv. C16 /18 엘론가제로 이루어진 군으로부터 선택된 효소를 코딩하는 하나 이상의 유전자; 및c) (i) DGAT1, DGAT2 및 PDAT로 이루어진 군으로부터 선택된 디아실글리세롤 아실트랜스퍼라제;(ii) 아실-CoA:1-아실 리소포스파티딜콜린 아실트랜스퍼라제 (LPCAT);(iii) 글리세롤-3-포스페이트 아실트랜스퍼라제 (GPAT);(iv) 리소포스파티드산 아실트랜스퍼라제 (LPAAT);(v) 포스포리파제 C; 및(vi) 포스포리파제 A2로 이루어진 군으로부터 선택된 효소를 코딩하는 하나 이상의 유전자를 포함하는 유전자 풀을 포함하는 백그라운드 야로위아 종을 포함하며,여기서,(1) 상기 백그라운드 야로위아 종이 Δ12 데새투라제 활성을 갖는 폴리펩티드를 코딩하는 임의의 천연 유전자가 결여되고;(2) 상기 백그라운드 야로위아 종이 리파제 1 (Lip1-), 퍼옥시좀 아실 CoA 옥시다제 ACO3 (Pox3-), 아실-CoA 옥시다제 2 (Pox2-), 오로티딘-5'-포스페이트 데카르복실라제 (Ura3-), 사카로핀 데히드로게나제 (Lys5-), 리파제 2 (Lip2-) 및 이소프로필 말레이트 데히드로게나제 (Leu2-)로 이루어진 군으로부터 선택된 효소를 코딩하는 임의의 천연 유전자가 결여된 것인,도코사헥사엔산 생성을 위한 재조합 생성 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 전체 지방산의 백분율로서 약 5% 이상의 도코사헥사엔산을 포함하는 미생물성 오일을 생성하는 재조합 생성 숙주.
- 제25항에 있어서, 도코사헥사엔산을 포함하는 미생물성 오일을 생성하고, 상기 미생물성 오일이 임의의 γ-리놀레산이 결여된 것인 재조합 생성 숙주.
- a) 도코사헥사엔산을 포함한 미생물성 오일을 생성하는, 제1항 내지 제4항 중 어느 한 항에 따른 생성 숙주를 배양하는 단계; 및b) 임의로 단계 a)의 미생물성 오일을 회수하는 단계를 포함하는, 도코헥사엔산을 포함한 미생물성 오일을 생성하는 방법.
- 제27항의 방법에 의해 생성된 미생물성 오일.
- 제28항에 있어서, 약 5% 이상의 도코사헥사엔산을 함유하는 미생물성 오일.
- 제28항에 있어서, 임의의 γ-리놀레산이 결여된 미생물성 오일.
- 제28항에 있어서, 리놀레산, γ-리놀렌산, 에이코사디엔산, 디호모-γ-리놀레산, 아라키돈산, α-리놀렌산, 스테아리돈산, 에이코사트리엔산, 에이코사테트라엔산, 도코사펜타엔산 및 도코사헥사엔산으로 이루어진 군으로부터 선택된 지방산을 포함하는 블렌딩 오일.
- 제27항의 방법에 의해 생성된 유효량의 미생물성 오일을 포함하는 식품.
- 제32항에 있어서, 식품 유사물, 육류 제품, 곡물 제품, 베이킹 식품, 스낵 식품 및 유제품으로 이루어진 군으로부터 선택된 식품.
- 제27항의 방법에 의해 생성된 유효량의된 미생물성 오일을 포함하는, 의료용 식품, 식이 보조제, 유아용 조제식 및 약제로 이루어진 군으로부터 선택된 제품.
- 제27항의 방법에 의해 생성된 유효량의 미생물성 오일을 포함하는 동물 사료.
- 제35항에 있어서, 애완 동물 사료, 반추 동물 사료, 가금류 사료 및 양식용 사료로 이루어진 군으로부터 선택된 동물 사료.
- 유효량의 미생물성 오일을 포함하고, 임의로 제1항 내지 제4항 중 어느 한 항의 재조합 숙주를 포함하는 효모 생물체를 포함하는 동물 사료.
- 제37항에 있어서, 상기 효모 생물체가 단백질, 지질, 탄수화물, 비타민, 미네랄 및 핵산으로 이루어진 군으로부터 선택된 사료 영양분을 포함하는 것인 동물 사료.
- 제27항의 방법에 의해 생성된 미생물성 오일과 식품을 배합하는 것을 포함하는, 도코사헥사엔산이 보충된 식품의 제조 방법.
- 제27항의 방법에 의해 생성된 미생물성 오일과, 의료용 식품, 식이 보조제, 유아용 조제식 및 약제로 이루어진 군으로부터 선택된 제품을 배합하는 것을 포함하는, 도코사헥사엔산이 보충된 상기 제품의 제조 방법.
- 제27항의 방법에 의해 생성된 미생물성 오일과 동물 사료를 배합하는 것을 포함하는, 도코사헥사엔산이 보충된 동물 사료의 제조 방법.
- 제37항의 동물 사료와, 사료 영양분을 포함하는 효모 생물체를 배합하는 것을 포함하는, 도코헥사엔산을 포함하는 동물 사료에 사료 영양분을 보충하는 방법.
- 제42항에 있어서, 상기 사료 영양분이 단백질, 지질, 탄수화물, 비타민, 미 네랄 및 핵산으로 이루어진 군으로부터 선택된 것인 방법.
- 제27항의 방법에 의해 생성된 도코사헥사엔산 함유 미생물성 오일을 인간 또는 동물이 소모가능하거나 사용가능한 형태로 제공하는 것을 포함하는, 에이코사펜타엔산이 풍부한 식이 보충제를 인간, 동물 또는 양식 유기체에게 제공하는 방법.
- 제27항의 방법에 의해 생성된 도코사헥사엔산 함유 미생물성 오일을 인간 또는 동물이 소모가능하거나 사용가능한 형태로 제공하여 도코사헥사엔산의 결핍을 치료하는 것을 포함하는, 동물 또는 인간에서 도코사헥사엔산의 결핍을 치료하는 방법.
- ATCC 기탁번호 ATCC PTA-7187의 야로위아 리폴리티카(Yarrowia lipolytica) Y3000인, 도코사헥사엔산의 생성에 유용한 재조합 생성 숙주.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62481204P | 2004-11-04 | 2004-11-04 | |
US60/624,812 | 2004-11-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070085665A true KR20070085665A (ko) | 2007-08-27 |
Family
ID=36337096
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077012441A KR20070085649A (ko) | 2004-11-04 | 2005-11-03 | 고농도의 에이코사펜타엔산을 생성하는 야로위아리폴리티카 균주 |
KR1020077012473A KR20070085665A (ko) | 2004-11-04 | 2005-11-03 | 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 |
KR1020077012480A KR20070085669A (ko) | 2004-11-04 | 2005-11-03 | 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077012441A KR20070085649A (ko) | 2004-11-04 | 2005-11-03 | 고농도의 에이코사펜타엔산을 생성하는 야로위아리폴리티카 균주 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077012480A KR20070085669A (ko) | 2004-11-04 | 2005-11-03 | 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주 |
Country Status (9)
Country | Link |
---|---|
US (8) | US7588931B2 (ko) |
EP (5) | EP1807526A4 (ko) |
JP (3) | JP5080979B2 (ko) |
KR (3) | KR20070085649A (ko) |
CN (4) | CN101437951A (ko) |
CA (3) | CA2584719C (ko) |
DK (4) | DK1809756T3 (ko) |
NO (3) | NO20072517L (ko) |
WO (3) | WO2006052870A2 (ko) |
Families Citing this family (169)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8313911B2 (en) * | 2003-05-07 | 2012-11-20 | E I Du Pont De Nemours And Company | Production of polyunsaturated fatty acids in oleaginous yeasts |
US11952581B2 (en) | 2003-08-01 | 2024-04-09 | Basf Plant Science Gmbh | Process for the production of polyunsaturated fatty acids in transgenic organisms |
PT2172536T (pt) | 2003-08-01 | 2016-08-17 | Basf Plant Science Gmbh | Processo para a produção de ácidos gordos poli-insaturados em organismos transgénicos |
EP2623584B1 (de) | 2004-02-27 | 2019-04-10 | BASF Plant Science GmbH | Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren in transgenen Pflanzen |
EP2363492A3 (en) | 2004-04-22 | 2012-03-14 | Commonwealth Scientific and Industrial Research Organisation | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells. |
US7807849B2 (en) | 2004-04-22 | 2010-10-05 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
NZ552254A (en) * | 2004-06-04 | 2008-12-24 | Fluxone Sciences As | Metabolically engineered cells for the production of polyunsaturated fatty acids |
US7879591B2 (en) | 2004-11-04 | 2011-02-01 | E.I. Du Pont De Nemours And Company | High eicosapentaenoic acid producing strains of Yarrowia lipolytica |
US7588931B2 (en) | 2004-11-04 | 2009-09-15 | E. I. Du Pont De Nemours And Company | High arachidonic acid producing strains of Yarrowia lipolytica |
US20060094102A1 (en) * | 2004-11-04 | 2006-05-04 | Zhixiong Xue | Ammonium transporter promoter for gene expression in oleaginous yeast |
GB0503657D0 (en) | 2005-02-22 | 2005-03-30 | Fluxome Sciences As | Metabolically engineered cells for the production of resveratrol or an oligomeric or glycosidically-bound derivative thereof |
US7470532B2 (en) * | 2005-10-19 | 2008-12-30 | E.I. Du Pont De Nemours And Company | Mortierella alpina C16/18 fatty acid elongase |
BRPI0620552A2 (pt) | 2005-11-23 | 2011-11-22 | Du Pont | polinucleotìdeo isolado, polipeptìdeo delta-9 elongase, construção recombinante, célula vegetal, método para transformar uma célula, método para produção de uma planta transgênica, sementes transgênicas, método para fabricar ácidos graxos poliinsaturados de cadeia longa, óleos, método para produzir pelo menos um ácido graxo poliinsaturado, plantas de semente oleaginosa, sementes, alimentos, fragmento de ácido nucléico isolado e progênies de plantas |
AR059376A1 (es) * | 2006-02-21 | 2008-03-26 | Basf Plant Science Gmbh | Procedimiento para la produccion de acidos grasos poliinsaturados |
US7465793B2 (en) | 2006-04-20 | 2008-12-16 | E.I. Du Pont De Nemours And Company | Synthetic Δ17 desaturase derived from Phytophthora ramourum and its use in making polyunsaturated fatty acids |
AU2007243282A1 (en) * | 2006-04-28 | 2007-11-08 | Resolvyx Pharmaceuticals, Inc. | Compositions and methods for the treatment of cardiovascular disease |
US7943823B2 (en) | 2006-04-28 | 2011-05-17 | E.I. Du Pont De Nemours And Company | Delta-8 desaturase and its use in making polyunsaturated fatty acids |
US7695950B2 (en) | 2006-05-17 | 2010-04-13 | E. I. Du Pont De Nemours And Company | Δ5 desaturase and its use in making polyunsaturated fatty acids |
US7678560B2 (en) | 2006-05-17 | 2010-03-16 | E.I. Du Pont De Nemours And Company | Δ 5 desaturase and its use in making polyunsaturated fatty acids |
GB0614442D0 (en) | 2006-07-20 | 2006-08-30 | Fluxome Sciences As | Metabolically engineered cells for the production of pinosylvin |
EP2500420B1 (en) * | 2006-08-24 | 2016-06-22 | BASF Plant Science GmbH | Pythium omega 3 desaturase with specificity to all omega 6 fatty acids longer than 18 carbon chains |
CN101578363A (zh) | 2006-08-29 | 2009-11-11 | 联邦科学技术研究组织 | 脂肪酸的合成 |
US20080095711A1 (en) * | 2006-08-31 | 2008-04-24 | Falck John R | Modulators of Pulmonary Hypertension |
BRPI0716306A2 (pt) | 2006-10-23 | 2015-06-16 | Du Pont | "polinucleotídeo isolado, constructo de dna recombinante célula, yarrowia sp transformada, método para transformar uma célula, método para produzir uma planta transformada, método para produzir leveduras, sementes trangênicas, método para produzir ácidos graxos poli-insaturados de cadeia longa em ima célula, óleo ou subprodutos, método para produzir pelo menos um ácido graxo poli-insaturada em uma célula vegetal oleaginosa, plantas oleaginosas, sementes trangênicas, alimentos ou alimentações e plantas da progênie" |
US7709239B2 (en) * | 2006-12-07 | 2010-05-04 | E.I. Du Pont De Nemours And Company | Mutant Δ8 desaturase genes engineered by targeted mutagenesis and their use in making polyunsaturated fatty acids |
US8846374B2 (en) | 2006-12-12 | 2014-09-30 | E I Du Pont De Nemours And Company | Carotenoid production in a recombinant oleaginous yeast |
US7923223B2 (en) | 2006-12-20 | 2011-04-12 | E. I. Du Pont De Nemours And Company | Δ-9 desaturase and its use in making polyunsaturated fatty acids |
BRPI0806354A2 (pt) | 2007-02-12 | 2011-09-06 | Du Pont | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados |
US7790156B2 (en) * | 2007-04-10 | 2010-09-07 | E. I. Du Pont De Nemours And Company | Δ-8 desaturases and their use in making polyunsaturated fatty acids |
US7794701B2 (en) | 2007-04-16 | 2010-09-14 | E.I. Du Pont De Nemours And Company | Δ-9 elongases and their use in making polyunsaturated fatty acids |
US8957280B2 (en) | 2007-05-03 | 2015-02-17 | E. I. Du Pont De Nemours And Company | Delta-5 desaturases and their use in making polyunsaturated fatty acids |
JP5371749B2 (ja) * | 2007-05-25 | 2013-12-18 | サントリーホールディングス株式会社 | 新規なリゾホスファチジン酸アシル基転移酵素遺伝子 |
US8476059B2 (en) | 2007-06-01 | 2013-07-02 | Solazyme, Inc. | Sucrose feedstock utilization for oil-based fuel manufacturing |
BRPI0809911A2 (pt) * | 2007-06-18 | 2014-10-07 | Suntory Holdings Ltd | Homólogos de glicerol-3-fosfato aciltransferase (gpat) e uso dos mesmos |
CA2694661C (en) * | 2007-07-31 | 2017-10-03 | Basf Plant Science Gmbh | Desaturases and process for the production of polyunsaturated fatty acids in transgenic organisms |
JP5711968B2 (ja) * | 2007-10-03 | 2015-05-07 | イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニーE.I.Du Pont De Nemours And Company | 高エイコサペンタエン酸を生成するためのヤロウィア・リポリティカ(YarrowiaLipolytica)の最適化株 |
EP2198005B1 (en) * | 2007-10-03 | 2014-05-07 | E. I. du Pont de Nemours and Company | Peroxisome biogenesis factor protein (pex) disruptions for altering the content of polyunsaturated fatty acids and the total lipid content in oleaginous eukaryotic organisms |
US8343753B2 (en) * | 2007-11-01 | 2013-01-01 | Wake Forest University School Of Medicine | Compositions, methods, and kits for polyunsaturated fatty acids from microalgae |
US8206772B2 (en) | 2007-11-08 | 2012-06-26 | Kraft Foods Global Brands Llc | Structured lipid compositions and methods of formulation thereof |
US8486478B2 (en) | 2007-11-08 | 2013-07-16 | International Great Brands LLC | Structured lipid compositions |
US7879384B2 (en) | 2007-11-08 | 2011-02-01 | Kraft Foods Global Brands Llc | Structured glycerol esters useful as edible moisture barriers |
WO2009126548A2 (en) * | 2008-04-07 | 2009-10-15 | Rich Products Corporation | Method for preparing edible aquatic animals for storage |
US20090291479A1 (en) * | 2008-05-23 | 2009-11-26 | E. I. Du Pont De Nemours And Company | Manipulation of acyl-coa binding protein expression for altered lipid production in microbial hosts |
US8168858B2 (en) | 2008-06-20 | 2012-05-01 | E. I. Du Pont De Nemours And Company | Delta-9 fatty acid elongase genes and their use in making polyunsaturated fatty acids |
JP4955813B2 (ja) * | 2008-07-10 | 2012-06-20 | 株式会社J−オイルミルズ | 飲食品の呈味向上剤 |
DE112009002048T5 (de) * | 2008-08-26 | 2012-01-26 | Basf Plant Science Gmbh | Nukleinsäure, die Desaturasen kodieren, und modifiziertes Planzenöl |
AU2009285590B2 (en) | 2008-08-29 | 2015-02-05 | E. I. Du Pont De Nemours And Company | Manipulation of SNF1 protein kinase activity for altered oil content in oleaginous organisms |
US20100297296A1 (en) * | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Healthier Baked Goods Containing Microalgae |
US20100303989A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Microalgal Flour |
CA2743880C (en) | 2008-11-18 | 2020-08-18 | James Robertson Petrie | Recombinant cells comprising exogenous a5 elongase and methods for producing docosapentaenoic acid |
CA3037322A1 (en) | 2008-11-28 | 2010-06-03 | Corbion Biotech, Inc. | Production of tailored oils in heterotrophic microorganisms |
BRPI0917722A2 (pt) | 2008-12-18 | 2017-05-30 | Du Pont | organismo transgênico e método para manipular o teor de malonatos em um organismo transgênico |
EP2410051B1 (en) | 2009-03-18 | 2014-12-31 | Suntory Holdings Limited | NOVEL ACETYL-CoA CARBOXYLASE |
US8207363B2 (en) * | 2009-03-19 | 2012-06-26 | Martek Biosciences Corporation | Thraustochytrids, fatty acid compositions, and methods of making and uses thereof |
SG174413A1 (en) * | 2009-03-19 | 2011-10-28 | Los Angeles Biomed Res Inst | Vaccine compositions and methods for treatment of mucormycosis and other fungal diseases |
WO2010110375A1 (ja) * | 2009-03-26 | 2010-09-30 | サントリーホールディングス株式会社 | 新規なリゾリン脂質アシル基転移酵素 |
BRPI1009731A2 (pt) * | 2009-06-16 | 2015-08-25 | Du Pont | Óleo extraído, óleo mesclado, alimento ou ração, produto, biomassa microbiana e ração para animais |
US8524485B2 (en) | 2009-06-16 | 2013-09-03 | E I Du Pont De Nemours And Company | Long chain omega-3 and omega-6 polyunsaturated fatty acid biosynthesis by expression of acyl-CoA lysophospholipid acyltransferases |
EP2443248B1 (en) * | 2009-06-16 | 2017-12-27 | E. I. du Pont de Nemours and Company | IMPROVEMENT OF LONG CHAIN OMEGA-3 AND OMEGA-6 POLYUNSATURATED FATTY ACID BIOSYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYLTRANSFERASES |
CA2761589C (en) * | 2009-06-16 | 2017-12-19 | E. I. Du Pont De Nemours And Company | Improved optimized strains of yarrowia lipolytica for high eicosapentaenoic acid production |
AU2010296296B2 (en) * | 2009-09-18 | 2014-04-17 | Suntory Holdings Limited | Glycerol-3-phosphate acyl transferase |
WO2011079005A1 (en) | 2009-12-24 | 2011-06-30 | E.I. Dupont De Nemours And Company | Plant membrane bound o-acyl transferase (mboat) family protein sequences and their uses for altering fatty acid compositions |
WO2011087981A2 (en) | 2010-01-15 | 2011-07-21 | E. I. Du Pont De Nemours And Company | Clinical benefits of eicosapentaenoic acid in humans |
EA031136B1 (ru) * | 2010-01-19 | 2018-11-30 | ДСМ АйПи АССЕТС Б.В. | Микроорганизмы, продуцирующие эйкозапентаеновую кислоту, композиции жирных кислот и способы их получения и применения |
JP5890687B2 (ja) * | 2010-02-03 | 2016-03-22 | サントリーホールディングス株式会社 | グリセロール−3−リン酸アシル基転移酵素ホモログとその利用 |
CA2795460A1 (en) | 2010-04-22 | 2011-10-27 | E. I. Du Pont De Nemours And Company | Method for obtaining polyunsaturated fatty acid-containing compositions from microbial biomass |
GB201008826D0 (en) | 2010-05-26 | 2010-07-14 | Fluxome Sciences As | Production of metabolites |
SG10201504197SA (en) | 2010-05-28 | 2015-06-29 | Solazyme Inc | Food Compositions Comprising Tailored Oils |
US8769868B2 (en) | 2010-06-09 | 2014-07-08 | Photonz Corporation Limited | Compositions comprising eicosapentaenoic acid suitable for high purification |
AU2011289384A1 (en) | 2010-08-11 | 2013-01-24 | E. I. Du Pont De Nemours And Company | A sustainable aquaculture feeding strategy |
WO2012021686A1 (en) | 2010-08-11 | 2012-02-16 | E. I. Du Pont De Nemours And Company | Improved aquaculture meat products |
US20120040076A1 (en) | 2010-08-11 | 2012-02-16 | E. I. Du Pont De Nemours And Company | Aquaculture feed compositions |
US8980589B2 (en) | 2010-08-26 | 2015-03-17 | E I Du Pont De Nemours And Company | Mutant delta-9 elongases and their use in making polyunsaturated fatty acids |
CN103080317B (zh) | 2010-08-26 | 2017-07-11 | 纳幕尔杜邦公司 | 突变型hpgg基序和hdash基序δ‑5去饱和酶以及它们在制备多不饱和脂肪酸中的用途 |
KR20130138760A (ko) | 2010-08-26 | 2013-12-19 | 이 아이 듀폰 디 네모아 앤드 캄파니 | 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포 |
CN101979622B (zh) * | 2010-09-13 | 2012-10-10 | 北京凯泰新世纪生物技术有限公司 | 一种脂肪酶催化合成鱼油乙酯的方法 |
KR101964886B1 (ko) | 2010-11-03 | 2019-04-03 | 테라비아 홀딩스 인코포레이티드 | 유동점이 낮은 미생물 오일, 이 오일로 제조된 유전성 유체 및 관련 방법 |
AU2011353002A1 (en) | 2010-12-30 | 2013-05-30 | E. I. Du Pont De Nemours And Company | Use of Saccharomyces cerevisiae SUC2 gene in Yarrowia lipolytica for sucrose utilization |
EP2658985A1 (en) | 2010-12-30 | 2013-11-06 | E.I. Du Pont De Nemours And Company | Increased oil content by increasing yap1 transcription factor activity in oleaginous yeasts |
AU2012212079B2 (en) | 2011-02-02 | 2016-07-28 | Corbion Biotech, Inc. | Tailored oils produced from recombinant oleaginous microorganisms |
US20130040340A1 (en) | 2011-02-07 | 2013-02-14 | E. I. Du Pont De Nemours And Company | Production of alcohol esters in situ using alcohols and fatty acids produced by microorganisms |
EP2673063A1 (en) * | 2011-02-11 | 2013-12-18 | E.I. Du Pont De Nemours And Company | Purification of triglyceride oil from microbial sources using short path distillation |
US8999663B2 (en) | 2011-02-11 | 2015-04-07 | E L Du Pont De Nemours And Company | Method for obtaining a lipid-containing composition from microbial biomass |
US8969049B2 (en) | 2011-03-31 | 2015-03-03 | E I Du Pont De Nemours And Company | Yarrowia diacylglycerol acyltransferase promoter regions for gene expression in yeast |
US20120247066A1 (en) | 2011-04-01 | 2012-10-04 | Ice House America, Llc | Ice bagging apparatus and methods |
US8906650B2 (en) | 2011-04-01 | 2014-12-09 | E I Du Pont De Nemours And Company | Yarrowia esterase/lipase promoter regions for gene expression in yeast |
US8735094B2 (en) | 2011-04-05 | 2014-05-27 | E I Du Pont De Nemours And Company | Yarrowia n-alkane-hydroxylating cytochrome P450 promoter regions for gene expression in yeast |
EP2702148A1 (en) | 2011-04-07 | 2014-03-05 | E.I. Du Pont De Nemours And Company | Yarrowia peroxisomal 2,4-dienoyl-coa reductase promoter regions for gene expression in yeast |
US8846352B2 (en) | 2011-05-06 | 2014-09-30 | Solazyme, Inc. | Genetically engineered microorganisms that metabolize xylose |
EP2714724A1 (en) * | 2011-05-26 | 2014-04-09 | E. I. Du Pont de Nemours and Company | Expression of caleosin in recombinant oleaginous microorganisms to increase oil content therein |
CN102559710B (zh) * | 2011-06-27 | 2013-10-30 | 中国农业科学院油料作物研究所 | 等鞭金藻δ4-脂肪酸去饱和酶基因及其克隆方法 |
CN102373229B (zh) * | 2011-06-27 | 2013-09-11 | 中国农业科学院油料作物研究所 | 油脂酵母δ12和δ15双功能脂肪酸去饱和酶基因及其克隆方法 |
MX342216B (es) | 2011-07-21 | 2016-09-20 | Dsm Ip Assets Bv | Composiciones de acidos grasos. |
ES2857173T3 (es) * | 2011-07-21 | 2021-09-28 | Dsm Ip Assets Bv | Aceites microbianos enriquecidos en ácidos grasos poliinsaturados |
EP3388516A1 (en) | 2011-10-19 | 2018-10-17 | Massachusetts Institute Of Technology | Engineered microbes and methods for microbial oil production |
JP5685783B2 (ja) * | 2012-01-19 | 2015-03-18 | 国立大学法人名古屋大学 | 新規ヤロウィア属微生物、並びにそれを用いた油分解剤及び油分解除去方法 |
CN110358686A (zh) | 2012-04-18 | 2019-10-22 | 柯碧恩生物技术公司 | 定制油 |
US9719114B2 (en) | 2012-04-18 | 2017-08-01 | Terravia Holdings, Inc. | Tailored oils |
BR122019026149A8 (pt) | 2012-06-15 | 2022-06-28 | Commw Scient Ind Res Org | Célula hospedeira, processo de produzir um lipídio de planta extraído, método de produzir semente, farinha de semente, método para produzir um produto alimentício, uso e processo para produzir ésteres de etila |
DK2861727T3 (en) | 2012-06-19 | 2018-06-14 | Du Pont | MUTERED ACYL-COA: LYSOPHOSPHATIDYLCHOLINE ACYL TRANSFERASES |
CN109182238A (zh) | 2012-08-10 | 2019-01-11 | 嘉吉有限公司 | 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法 |
CN105121646B (zh) * | 2012-10-30 | 2020-07-21 | 农业研究有限公司 | 新的酰基转移酶多核苷酸、多肽、及其使用方法 |
JP6064573B2 (ja) * | 2012-12-12 | 2017-01-25 | 栗田工業株式会社 | 飼料用添加物及び混合飼料 |
CA2892516A1 (en) | 2012-12-21 | 2014-06-26 | E. I. Du Pont De Nemours And Company | Down-regulation of a polynucleotide encoding a sou2 sorbitol utilization protein to modify lipid production in microbial cells |
EP2935601B1 (en) | 2012-12-21 | 2018-03-21 | E. I. du Pont de Nemours and Company | Recombinant microbial cells that produce at least 28% eicosapentaenoic acid as dry cell weight |
SG10201709538QA (en) | 2012-12-24 | 2017-12-28 | Qualitas Health Ltd | Eicosapentaenoic acid (epa) formulations |
US10098371B2 (en) | 2013-01-28 | 2018-10-16 | Solazyme Roquette Nutritionals, LLC | Microalgal flour |
US9816079B2 (en) | 2013-01-29 | 2017-11-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
US9567615B2 (en) | 2013-01-29 | 2017-02-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
US10047383B2 (en) | 2013-03-15 | 2018-08-14 | Cargill, Incorporated | Bioproduction of chemicals |
US9290749B2 (en) | 2013-03-15 | 2016-03-22 | Solazyme, Inc. | Thioesterases and cells for production of tailored oils |
US9783836B2 (en) | 2013-03-15 | 2017-10-10 | Terravia Holdings, Inc. | Thioesterases and cells for production of tailored oils |
BR112015026948A8 (pt) | 2013-04-26 | 2017-10-03 | Solazyme Inc | "composições, lubrificante, tensoativo, solvente, formulação de limpeza, composição de borracha reticulável ou reticulada, tira de pneu, espuma de poliuretano e seu método de preparação |
WO2015010103A2 (en) | 2013-07-19 | 2015-01-22 | Opx Biotechnologies, Inc. | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
US11408013B2 (en) | 2013-07-19 | 2022-08-09 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
FR3009619B1 (fr) | 2013-08-07 | 2017-12-29 | Roquette Freres | Compositions de biomasse de microalgues riches en proteines de qualite sensorielle optimisee |
WO2015021352A2 (en) | 2013-08-08 | 2015-02-12 | Knipbio | Methylotrophs for aquaculture and animal feed |
JP6619229B2 (ja) * | 2013-08-22 | 2019-12-11 | 協和発酵バイオ株式会社 | アラキドン酸生産ポリケチドシンターゼ及びその利用 |
JP6517196B2 (ja) | 2013-10-04 | 2019-05-22 | テラヴィア ホールディングス, インコーポレイテッド | 調整油 |
ES2875965T3 (es) | 2013-12-04 | 2021-11-11 | Nippon Suisan Kaisha Ltd | Aceite microbiano que contiene ácido dihomo-gamma-linolénico y biomasa microbiana que contiene ácido dihomo-gamma-linolénico |
CA3241340A1 (en) * | 2013-12-18 | 2015-06-25 | Grains Research And Development Corporation | Lipid comprising long chain polyunsaturated fatty acids |
BR112016017468A2 (pt) | 2014-01-31 | 2017-10-10 | Dsm Ip Assets Bv | promotores adequados para a expressão de genes heterólogos em leveduras |
ES2656390T3 (es) | 2014-02-12 | 2018-02-27 | Omnigen Research, Llc | Composición y método para promover la reducción de estrés por calor en animales |
WO2015127421A1 (en) | 2014-02-24 | 2015-08-27 | Novogy, Inc. | Diacylglycerol acyl transferase (dga1) polynucleotides, and methods of increasing yeast cell lipid production by overexpression of heterologous dga1 |
WO2015149026A1 (en) | 2014-03-28 | 2015-10-01 | Solazyme, Inc. | Lauric ester compositions |
DK3137616T3 (da) * | 2014-05-01 | 2023-08-21 | Ginkgo Bioworks Inc | Forøgelse af cellulær lipid produktion ved forøgelse af aktiviteten af diacylglycerolacyltransferase og formindskelse af aktiviteten af triacylglycerollipase |
EP3149153B1 (en) | 2014-05-29 | 2022-07-13 | Ginkgo Bioworks, Inc. | Increasing lipid production in oleaginous yeast |
KR102527795B1 (ko) * | 2014-06-27 | 2023-05-02 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 도코사펜타에노산을 포함하는 지질 |
SG10201909391QA (en) * | 2014-06-27 | 2019-11-28 | Commw Scient Ind Res Org | Lipid comprising docosapentaenoic acid |
US9969990B2 (en) | 2014-07-10 | 2018-05-15 | Corbion Biotech, Inc. | Ketoacyl ACP synthase genes and uses thereof |
CN104099254B (zh) * | 2014-07-11 | 2017-02-15 | 无锡超科食品有限公司 | 一株产多不饱和脂肪酸的菌株及其筛选方法 |
WO2016014968A1 (en) | 2014-07-24 | 2016-01-28 | Solazyme, Inc. | Variant thioesterases and methods of use |
EP2993228B1 (en) | 2014-09-02 | 2019-10-09 | Cargill, Incorporated | Production of fatty acid esters |
CN107208103A (zh) | 2014-09-18 | 2017-09-26 | 泰拉瑞亚控股公司 | 酰基‑acp硫酯酶及其突变体 |
FR3028527A1 (fr) | 2014-11-13 | 2016-05-20 | Pivert | Identification de facteurs de transcription de yarrowia lipolytica |
WO2016075314A1 (fr) | 2014-11-13 | 2016-05-19 | Institut National De La Recherche Agronomique | Identification de facteurs de transcription de yarrowia lipolytica affectant la production de proteines |
BR112017011542A2 (pt) * | 2014-12-10 | 2018-03-13 | Novogy Inc | produção de ácido oleico em levedura |
CA2969304C (en) | 2014-12-12 | 2023-08-22 | Dsm Ip Assets B.V. | Feed supplement material for use in aquaculture feed |
CA2987508A1 (en) | 2015-05-28 | 2016-12-01 | Evolva Sa | Biosynthesis of phenylpropanoids and phenylpropanoid derivatives |
CN105176848B (zh) * | 2015-08-19 | 2017-05-17 | 江南大学 | 一株过表达3‑磷酸甘油脱氢酶基因的高山被孢霉、其构建方法及应用 |
MX2018002964A (es) | 2015-09-09 | 2018-05-17 | Omnigen Res Llc | Una composicion y/o combinacion para acuacultivo. |
EP3370542A1 (en) | 2015-10-01 | 2018-09-12 | DSM IP Assets B.V. | Supplement material for use in pet food |
JP7011590B2 (ja) | 2015-10-12 | 2022-02-10 | イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー | 細胞内での遺伝子組換えおよび相同組換えの増加のための保護dna鋳型および使用方法 |
US20180362961A1 (en) | 2015-12-11 | 2018-12-20 | Danisco Us Inc. | Methods and compositions for enhanced nuclease-mediated genome modification and reduced off-target site effects |
DK3390631T3 (da) | 2015-12-18 | 2020-07-13 | Danisco Us Inc | Fremgangsmåder og sammensætninger til t-rna-baseret guide-rna-ekspression |
CN106434416B (zh) * | 2016-07-28 | 2019-08-30 | 中国农业科学院油料作物研究所 | 一种产二十碳五烯酸的菌株及其应用 |
WO2018144701A2 (en) | 2017-02-02 | 2018-08-09 | Cargill Incorporated | Genetically modified cells that produce c6-c10 fatty acid derivatives |
CN107345211A (zh) * | 2017-04-27 | 2017-11-14 | 广州弘宝元生物科技有限公司 | 引入外源多肽的活细胞脂质体及其应用 |
EP3630943A4 (en) | 2017-06-01 | 2021-06-09 | Knipbio, Inc. | HETEROLOGICAL CAROTINOID PRODUCTION IN MICROORGANISMS |
CN109234216B (zh) * | 2017-07-10 | 2022-05-20 | 上海医药工业研究院 | 一种生产鲨烯的基因工程菌及其方法 |
CN108467841B (zh) * | 2018-03-23 | 2021-08-24 | 辽宁大学 | 蛭石固定化耐低温降解多环芳烃混合菌颗粒及其制备方法和应用 |
CN110358692B (zh) | 2018-04-09 | 2021-07-27 | 中国科学院青岛生物能源与过程研究所 | 生产神经酸的重组酵母菌株及其应用 |
EP3784791A1 (en) | 2018-04-23 | 2021-03-03 | DuPont Nutrition Biosciences ApS | Increasing export of 2' fucosyllactose from microbial cells through the expression of a heterologous nucleic acid |
CN110373437B (zh) * | 2018-12-11 | 2022-09-27 | 山东理工大学 | 一种产十八碳四烯酸卷枝毛霉细胞工厂的构建及其发酵技术 |
CN109929870B (zh) * | 2019-02-20 | 2021-03-16 | 天津大学 | 糖代谢与脂质代谢协同提高解脂耶氏酵母合成脂肪酸衍生物的产量的应用 |
CN111685223B (zh) * | 2019-03-13 | 2024-02-02 | 吉态来博(北京)生物科技发展有限公司 | 含有解脂亚罗酵母的饲料、其制备方法及其应用 |
CN109837256B (zh) * | 2019-03-21 | 2020-12-01 | 江南大学 | 一种二酰甘油酰基转移酶1及其在生产甘油三酯中的应用 |
CN110229832A (zh) * | 2019-06-16 | 2019-09-13 | 山东理工大学 | 一种提高耶式解脂酵母生物量和细胞壁产量的菌株和方法 |
CN110499259B (zh) * | 2019-07-22 | 2021-07-27 | 浙江工业大学 | 一种解酯耶氏酵母yw100-1及其应用 |
CN110923261B (zh) * | 2019-12-20 | 2021-12-17 | 江南大学 | 一种提高酿酒酵母细胞膜脂肪酸c20:0和/或c22:0含量的方法 |
WO2021130078A1 (en) | 2019-12-23 | 2021-07-01 | Dsm Ip Assets B.V. | Aquaculture feed |
CN112538438B (zh) * | 2020-12-11 | 2023-04-04 | 南京工业大学 | 一株高产油酸的重组解脂耶氏酵母菌及其构建方法和应用 |
EP4262427A1 (en) | 2020-12-17 | 2023-10-25 | DSM IP Assets B.V. | Aquaculture feed |
EP4294932A1 (en) * | 2021-02-18 | 2023-12-27 | Zero Acre Farms Inc. | Systems and methods of making oil from microorganisms |
AU2022231106A1 (en) * | 2021-03-03 | 2023-10-12 | Nourish Ingredients Pty Ltd | Production of phospholipids in microbes and uses thereof |
CN113388533B (zh) * | 2021-06-11 | 2022-09-20 | 东北农业大学 | 一株发酵性能良好且具有产香功能的汉逊德巴利酵母菌及其筛选方法 |
KR20240145461A (ko) * | 2021-12-10 | 2024-10-07 | 파이코일 바이오테크놀로지 인터내셔널, 아이엔씨. | 옥세노클로렐라 프로토테코이데스에서 필수 장쇄 다중불포화 지질 (lcpufa)의 종속영양 생산 |
CN118632928A (zh) | 2022-02-02 | 2024-09-10 | 帝斯曼知识产权资产管理有限公司 | 耶氏酵母属生产方法 |
CN115029257B (zh) * | 2022-05-05 | 2023-09-26 | 南京工业大学 | 产β-胡萝卜素的重组解脂耶氏酵母及其构建方法和应用 |
Family Cites Families (118)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2454404A (en) | 1942-10-03 | 1948-11-23 | American Cyanamid Co | Preparation of piperazine |
US2454504A (en) | 1946-01-29 | 1948-11-23 | Franz F Ehrenhaft | Nonintermittent cinematographic projector |
NZ190194A (en) | 1978-05-08 | 1982-02-23 | Cpc International Inc | Production of oil by fermenting yeast in fatty acids |
US4670285A (en) | 1982-08-06 | 1987-06-02 | The University Of Toronto Innovations Foundation | Infant formula |
US5071764A (en) | 1983-10-06 | 1991-12-10 | Pfizer Inc. | Process for integrative transformation of yarrowia lipolytica |
US4880741A (en) | 1983-10-06 | 1989-11-14 | Pfizer Inc. | Process for transformation of Yarrowia lipolytica |
GB8407195D0 (en) | 1984-03-20 | 1984-04-26 | Cadbury Schweppes Plc | Microbial desaturase enzyme inhibitors |
US4792523A (en) | 1984-08-31 | 1988-12-20 | Cetus Corporation | 3'Expression enhancing fragments and method |
DD227448A1 (de) | 1984-10-18 | 1985-09-18 | Akad Wissenschaften Ddr | Verfahren zur herstellung von zitronensaeure auf mikrobiellem wege |
JPH075484B2 (ja) | 1985-03-06 | 1995-01-25 | 帝人株式会社 | 血液脳関門通過性医薬品組成物 |
US5107065A (en) | 1986-03-28 | 1992-04-21 | Calgene, Inc. | Anti-sense regulation of gene expression in plant cells |
CA1317901C (en) | 1986-07-08 | 1993-05-18 | Yoshifumi Shinmen | Process for production of bishomo-_-linolenic acid and eicosapentaenoic acid |
JP2527340B2 (ja) | 1986-12-15 | 1996-08-21 | アプライド バイオシステムズ インコーポレイテッド | ロ―ダミン染料の5−及び6−スクシニミジルカルボキシレ―ト異性体 |
US5246841A (en) | 1986-12-26 | 1993-09-21 | Sagami Chemical Research Center | Microbial process for production of eicosapentaenoic acid |
DD259637A1 (de) | 1987-04-09 | 1988-08-31 | Adw Ddr | Verfahren zur herstellung von isozitratlyase in rekombinanten mikroorganismen |
SU1454852A1 (ru) | 1987-05-19 | 1989-01-30 | Институт Микробиологии Им.Августа Кирхенштейна | Штамм дрожжей JaRRoWIa LIроLYтIса-продуцент липазы и питательна среда дл его культивировани |
JP2582622B2 (ja) | 1987-10-27 | 1997-02-19 | 日東化学工業株式会社 | 糸状菌による高度不飽和脂肪酸の製造法 |
DD267999B5 (de) | 1988-01-06 | 2000-08-10 | Akad Wissenschaften Ddr | Verfahren zur herstellung von 2-oxoglutarsaeure durch hefen |
US5340742A (en) | 1988-09-07 | 1994-08-23 | Omegatech Inc. | Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids |
DD275480A1 (de) | 1988-09-15 | 1990-01-24 | Ve Forschungszentrum Biotechno | Verfahren zur herstellung von zitronensaeure durch aerobe submerse kultivierung von hefen |
US5057419A (en) | 1988-09-22 | 1991-10-15 | Rutgers University | Genetically engineered plasmid and organisms for the production of specialized oils |
DD279267A1 (de) | 1989-01-05 | 1990-05-30 | Akad Wissenschaften Ddr | Verfahren zur herstellung mikrobieller lipase |
PL160027B1 (pl) | 1989-03-23 | 1993-01-29 | Akad Rolnicza | Sposób jednoczesnego otrzymywania kwasu cytrynowego i kwasu izocytrynowego PL |
DD285370A5 (de) | 1989-06-29 | 1990-12-12 | Ingenieurtechnik Im Stammbetrieb Veb Kombinat Suesswaren,Dd | Verfahren zur immobilisierung von mikroorganismen bzw. coimmobilisierung von mikroorganismen und enzymen |
DD285372A5 (de) | 1989-06-29 | 1990-12-12 | Ingenieurtechnik,Dd | Verfahren zur immobilisierung von mikroorganismen bzw. coimmobilisierung von mikroorganismen und enzymen |
US5366860A (en) | 1989-09-29 | 1994-11-22 | Applied Biosystems, Inc. | Spectrally resolvable rhodamine dyes for nucleic acid sequence determination |
JP3007119B2 (ja) | 1990-01-12 | 2000-02-07 | 紀夫 村田 | グリセロール―3―リン酸アシルトランスフェラーゼをコードするdna鎖 |
DE69133261D1 (de) | 1990-03-16 | 2003-06-26 | Calgene Llc Davis | Dnas, die für pflanzliche desaturasen kodieren und deren anwendungen |
US5244921A (en) | 1990-03-21 | 1993-09-14 | Martek Corporation | Eicosapentaenoic acids and methods for their production |
AU659087B2 (en) | 1990-05-25 | 1995-05-11 | E.I. Du Pont De Nemours And Company | Nucleotide sequence of soybean stearoyl-ACP desaturase gene |
US5658767A (en) | 1991-01-24 | 1997-08-19 | Martek Corporation | Arachidonic acid and methods for the production and use thereof |
US5246842A (en) | 1991-10-30 | 1993-09-21 | The United States Of America As Represented By The Secretary Of Agriculture | Production of eicosapentaenoic acid from filamentous fungi utilizing lactose as a primary carbon source |
AU675923B2 (en) | 1991-12-04 | 1997-02-27 | E.I. Du Pont De Nemours And Company | Fatty acid desaturase genes from plants |
US5246642A (en) * | 1992-02-04 | 1993-09-21 | Slaughter Jr Gibbs M | Method for resurfacing fiberglass boat hulls |
JPH05308978A (ja) | 1992-05-11 | 1993-11-22 | Onoda Cement Co Ltd | 藻類によるドコサヘキサエン酸の製造方法 |
DE69321885T2 (de) | 1992-06-25 | 1999-05-12 | International Flavors & Fragrances Inc., New York, N.Y. | Verfahren zur fermentativen Herstellung von 10-Hydroxy-C18-Carbonsäure und Gamma-Dodekalaktonderivaten |
IT1256043B (it) | 1992-08-12 | 1995-11-21 | Ceppo mutante di yarrowia lipolytica e procedimento per la produzione di acido citrico | |
DE69333025T2 (de) | 1992-11-17 | 2004-04-29 | E.I. Du Pont De Nemours And Co., Wilmington | Für mikrosom delta 12 fettsäuredesaturase kodierende gene und verwandte enzyme von pflanzen |
US6093568A (en) | 1994-04-06 | 2000-07-25 | Calgene, Inc. | Plant lysophosphatidic acid acyltransferases |
US5910630A (en) | 1994-04-06 | 1999-06-08 | Davies; Huw Maelor | Plant lysophosphatidic acid acyltransferases |
WO1996033263A1 (fr) | 1995-04-17 | 1996-10-24 | JAPAN, represented by DIRECTOR-GENERAL OF AGENCY OF INDUSTRIAL SCIENCE AND TECHNOLOGY | Nouveaux micro-organismes capables de produire des acides gras hautement insatures et procede de production d'acides gras hautement insatures utilisant ces micro-organismes |
FR2734843A1 (fr) | 1995-06-02 | 1996-12-06 | Centre Nat Rech Scient | Nouveau procede de bioconversion microbienne. |
EP0770683A1 (en) | 1995-10-04 | 1997-05-02 | Mitsubishi Chemical Corporation | Method for producing erythritol |
JPH09252790A (ja) | 1996-03-21 | 1997-09-30 | Japan Energy Corp | 発酵法によるピルビン酸の製造方法 |
EP0894142B2 (en) * | 1996-03-28 | 2013-11-20 | DSM IP Assets B.V. | Microbial oil containing a polyunsaturated fatty acid and method of producing oil from pasteurised and granulated biomass |
AU2887897A (en) | 1996-05-21 | 1997-12-09 | Novo Nordisk A/S | Novel yeast promoters suitable for expression cloning in yeast and heterologous expression of proteins in yeast |
AU723553C (en) | 1996-07-23 | 2005-04-14 | Nagase & Co., Ltd. | Process for preparing docosahexaenoic acid and docosapentaenoic acid |
JP3792309B2 (ja) * | 1996-08-30 | 2006-07-05 | サントリー株式会社 | 不飽和脂肪酸含有油脂の製造方法 |
RU2090611C1 (ru) | 1996-09-27 | 1997-09-20 | Финогенова Татьяна Васильевна | Штамм дрожжей yarrowia lipolytica - продуцент лимонной кислоты, способ получения лимонной кислоты и способ выделения цитрата натрия |
PL190181B1 (pl) | 1996-10-11 | 2005-11-30 | Scarista Ltd | Zastosowanie oleju zawierającego kwas eikozapentaenowy (KEP) i/lub kwas stearydonowy (KS) oraz preparat farmaceutyczny zawierający olej |
US6432684B1 (en) * | 1997-04-11 | 2002-08-13 | Abbott Laboratories | Human desaturase gene and uses thereof |
US5968809A (en) | 1997-04-11 | 1999-10-19 | Abbot Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids |
US5972664A (en) * | 1997-04-11 | 1999-10-26 | Abbott Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids |
US6075183A (en) | 1997-04-11 | 2000-06-13 | Abbott Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants |
EP1034308A4 (en) | 1997-12-04 | 2002-04-03 | Smithkline Beecham Corp | PROCESS USING ANTISENSE EXPRESSION SEQUENCES TO PRODUCE CONDITIONALLY EXPRESSED MUTANT CELLS |
US20030167483A1 (en) | 1998-06-24 | 2003-09-04 | Farese Robert V. | Diacylglycerol O-acyltransferase |
US6344548B1 (en) | 1998-06-24 | 2002-02-05 | The Regents Of The University Of California | Diacylglycerol o-acyltransferase |
BR9911800A (pt) | 1998-07-02 | 2001-02-28 | Calgene Llc | Proteìnas de diacil glicerol acil transferase |
US7135617B2 (en) | 1998-07-02 | 2006-11-14 | Calgene Llc | Diacylglycerol acyl transferase proteins |
US6677145B2 (en) * | 1998-09-02 | 2004-01-13 | Abbott Laboratories | Elongase genes and uses thereof |
US6403349B1 (en) | 1998-09-02 | 2002-06-11 | Abbott Laboratories | Elongase gene and uses thereof |
US6100077A (en) | 1998-10-01 | 2000-08-08 | The Trustees Of Columbia University In The City Of New York | Isolation of a gene encoding diacylglycerol acyltransferase |
EP0997533A1 (de) | 1998-10-24 | 2000-05-03 | Haarmann & Reimer Gmbh | Verfahren zur Gewinnung von Gamma-Decalacton |
FR2785911B1 (fr) | 1998-11-18 | 2001-01-26 | Agronomique Inst Nat Rech | Gene codant pour une acyltransferase de colza, et ses utilisations |
AU1837600A (en) | 1998-12-02 | 2000-06-19 | E.I. Du Pont De Nemours And Company | Plant diacylglycerol acyltransferases |
NZ512656A (en) | 1998-12-07 | 2003-09-26 | Univ Washington | Desaturases and methods of using them for synthesis of polyunsaturated fatty acids |
DE69933391T2 (de) * | 1998-12-17 | 2007-11-15 | National Research Council Of Canada, Ottawa | Diacylglyzerin-acyltransferase gen aus pflanzen |
CA2362650A1 (en) | 1999-02-22 | 2000-08-24 | E.I. Du Pont De Nemours And Company | Lysophosphatidic acid acetyltransferases |
CA2366187C (en) | 1999-04-01 | 2010-05-25 | Basf Plant Science Gmbh | A new class of enzymes in the biosynthetic pathway for the production of triacylglycerol and recombinant dna molecules encoding these enzymes |
KR19990046733A (ko) | 1999-04-20 | 1999-07-05 | 류성구 | 미생물슈도모나스에의한도코사핵사노인산(dha)의제조방법 |
EP1230373B1 (en) | 1999-11-12 | 2007-02-07 | BASF Plant Science GmbH | Use of a class of enzymes and their encoding genes to increase the oil content in transgenic organisms |
IL150414A0 (en) * | 2000-02-09 | 2002-12-01 | Basf Ag | Novel elongase gene and method for producing multiple-unsaturated fatty acid |
DE60036647T2 (de) | 2000-04-28 | 2008-07-17 | Laboratoires Mayoly Spindler | Klonierung und expression einer extrazellulären säurebeständigen lipase aus yarrowia lipolytica |
CN1380903A (zh) | 2000-05-19 | 2002-11-20 | 钟渊化学工业株式会社 | 转化体和用其生成聚酯的方法 |
US6552250B1 (en) | 2000-06-14 | 2003-04-22 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Agriculture And Agri-Food | Diacylglycerol O-acyltransferase |
DE10102337A1 (de) * | 2001-01-19 | 2002-07-25 | Basf Plant Science Gmbh | Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren, neue Biosynthesegene sowie neue pflanzliche Expressionskonstrukte |
US6635451B2 (en) * | 2001-01-25 | 2003-10-21 | Abbott Laboratories | Desaturase genes and uses thereof |
GB2377455A (en) | 2001-02-09 | 2003-01-15 | Univ Hull | Method of culturing crypthecodinium cohnii |
US7045326B2 (en) | 2001-02-23 | 2006-05-16 | The Regents Of The University Of California | Mono- and diacylglycerol acyltransferases and methods of use thereof |
GB0107510D0 (en) * | 2001-03-26 | 2001-05-16 | Univ Bristol | New elongase gene and a process for the production of -9-polyunsaturated fatty acids |
JP2002296554A (ja) | 2001-03-30 | 2002-10-09 | Minebea Co Ltd | ファラデー回転子 |
US7045683B2 (en) * | 2001-05-04 | 2006-05-16 | Abbott Laboratories | Δ4-desaturase genes and uses thereof |
WO2003025165A1 (en) | 2001-09-21 | 2003-03-27 | National Research Council Of Canada | Higher plant cytosolic er-based glycerol-3-phosphate acyltransferase genes |
US7211656B2 (en) * | 2002-01-30 | 2007-05-01 | Abbott Laboratories | Desaturase genes, enzymes encoded thereby, and uses thereof |
DE10219203A1 (de) * | 2002-04-29 | 2003-11-13 | Basf Plant Science Gmbh | Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren in Pflanzen |
BR122014000528B1 (pt) | 2002-05-22 | 2016-02-16 | Monsanto Technology Llc | polinucleotídeo e vetor com atividade dessasturase no carbono 12 de molécula de ácido graxo, bem como método para produção de planta com óleo de semente contendo níveis alterados de ácidos graxos de ômega-3 |
CN112280807A (zh) * | 2002-06-19 | 2021-01-29 | 帝斯曼知识产权资产管理有限公司 | 包含多不饱和脂肪酸的微生物油的制备 |
BR0313536A (pt) | 2002-07-31 | 2005-06-14 | Monsanto Technology Llc | Sequencias de ácido nucléico de diacilglicerol acetiltransferase e produtos associados |
EP1576166B1 (en) | 2002-12-19 | 2014-10-15 | University Of Bristol | Novel method for the production of polyunsaturated fatty acids |
JP4280158B2 (ja) | 2002-12-27 | 2009-06-17 | 富士フイルム株式会社 | ドコサヘキサエン酸生産能を有する微生物及びその利用 |
US20040172682A1 (en) * | 2003-02-12 | 2004-09-02 | Kinney Anthony J. | Production of very long chain polyunsaturated fatty acids in oilseed plants |
CA2517253C (en) | 2003-02-27 | 2018-07-03 | Basf Plant Science Gmbh | Method for the production of polyunsaturated fatty acids |
CA2520795C (en) | 2003-03-31 | 2015-06-23 | University Of Bristol | Novel plant acyltransferases specific for long-chained, multiply unsaturated fatty acids |
US7214491B2 (en) * | 2003-05-07 | 2007-05-08 | E. I. Du Pont De Nemours And Company | Δ-12 desaturase gene suitable for altering levels of polyunsaturated fatty acids in oleaginous yeasts |
US7125672B2 (en) * | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7238482B2 (en) | 2003-05-07 | 2007-07-03 | E. I. Du Pont De Nemours And Company | Production of polyunsaturated fatty acids in oleaginous yeasts |
KR100952263B1 (ko) | 2003-06-04 | 2010-04-09 | 세키스이가가쿠 고교가부시키가이샤 | 경화성 수지 조성물 |
ATE440509T1 (de) | 2003-06-04 | 2009-09-15 | Nestec Sa | Getränk zur gewichtskontrolle |
AU2003903058A0 (en) | 2003-06-18 | 2003-07-03 | Phytopharm Australia Ltd | A process and apparatus for the modification of plant extracts |
US7259255B2 (en) * | 2003-06-25 | 2007-08-21 | E. I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast |
US7459546B2 (en) * | 2003-06-25 | 2008-12-02 | E.I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase regulatory sequences for gene expression in oleaginous yeast |
US7267976B2 (en) | 2003-07-02 | 2007-09-11 | E.I. Du Pont De Nemours And Company | Acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous yeasts |
PT2172536T (pt) * | 2003-08-01 | 2016-08-17 | Basf Plant Science Gmbh | Processo para a produção de ácidos gordos poli-insaturados em organismos transgénicos |
CA2542574C (en) | 2003-11-12 | 2014-03-18 | E. I. Du Pont De Nemours And Company | Delta-15 desaturases suitable for altering levels of polyunsaturated fatty acids in oleaginous plants and yeast |
US7504259B2 (en) * | 2003-11-12 | 2009-03-17 | E. I. Du Pont De Nemours And Company | Δ12 desaturases suitable for altering levels of polyunsaturated fatty acids in oleaginous yeast |
US7202356B2 (en) * | 2003-11-14 | 2007-04-10 | E. I. Du Pont De Nemours And Company | Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast |
US7264408B2 (en) | 2004-04-28 | 2007-09-04 | Finisar Corporation | Modular optical device package |
US7256033B2 (en) * | 2004-06-25 | 2007-08-14 | E. I. Du Pont De Nemours And Company | Delta-8 desaturase and its use in making polyunsaturated fatty acids |
US7264949B2 (en) * | 2004-09-15 | 2007-09-04 | E.I. Du Pont De Nemours And Company | Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast |
US7273746B2 (en) | 2004-11-04 | 2007-09-25 | E.I. Dupont De Nemours And Company | Diacylglycerol acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms |
US7192762B2 (en) | 2004-11-04 | 2007-03-20 | E. I. Du Pont De Nemours And Company | Mortierella alpina glycerol-3-phosphate o-acyltransferase for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms |
US7198937B2 (en) | 2004-11-04 | 2007-04-03 | E. I. Du Pont De Nemours And Company | Mortierella alpina diacylglycerol acyltransferase for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms |
US7189559B2 (en) | 2004-11-04 | 2007-03-13 | E. I. Du Pont De Nemours And Company | Mortierella alpina lysophosphatidic acid acyltransferase homolog for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms |
US8685679B2 (en) | 2004-11-04 | 2014-04-01 | E I Du Pont De Nemours And Company | Acyltransferase regulation to increase the percent of polyunsaturated fatty acids in total lipids and oils of oleaginous organisms |
US20060094102A1 (en) | 2004-11-04 | 2006-05-04 | Zhixiong Xue | Ammonium transporter promoter for gene expression in oleaginous yeast |
US7588931B2 (en) | 2004-11-04 | 2009-09-15 | E. I. Du Pont De Nemours And Company | High arachidonic acid producing strains of Yarrowia lipolytica |
WO2006064317A1 (en) | 2004-12-14 | 2006-06-22 | Avestha Gengraine Technologies Pvt. Ltd. | Recombinant production docosahexaenoic acid (dha) in yeast |
US7470532B2 (en) | 2005-10-19 | 2008-12-30 | E.I. Du Pont De Nemours And Company | Mortierella alpina C16/18 fatty acid elongase |
-
2005
- 2005-11-01 US US11/264,784 patent/US7588931B2/en not_active Expired - Fee Related
- 2005-11-01 US US11/264,737 patent/US7550286B2/en not_active Expired - Fee Related
- 2005-11-02 US US11/265,761 patent/US7932077B2/en not_active Expired - Fee Related
- 2005-11-03 WO PCT/US2005/040255 patent/WO2006052870A2/en active Application Filing
- 2005-11-03 CN CNA2005800457798A patent/CN101437951A/zh active Pending
- 2005-11-03 JP JP2007540127A patent/JP5080979B2/ja not_active Expired - Fee Related
- 2005-11-03 EP EP05818267A patent/EP1807526A4/en not_active Withdrawn
- 2005-11-03 DK DK05818385.6T patent/DK1809756T3/en active
- 2005-11-03 CN CN200580045823.5A patent/CN101111601B/zh not_active Expired - Fee Related
- 2005-11-03 KR KR1020077012441A patent/KR20070085649A/ko not_active Application Discontinuation
- 2005-11-03 WO PCT/US2005/040256 patent/WO2006052871A2/en active Application Filing
- 2005-11-03 CA CA2584719A patent/CA2584719C/en not_active Expired - Fee Related
- 2005-11-03 CA CA2585235A patent/CA2585235C/en not_active Expired - Fee Related
- 2005-11-03 KR KR1020077012473A patent/KR20070085665A/ko not_active Application Discontinuation
- 2005-11-03 EP EP13161757.3A patent/EP2649887B1/en not_active Not-in-force
- 2005-11-03 WO PCT/US2005/040306 patent/WO2006055322A2/en active Application Filing
- 2005-11-03 EP EP05851406.8A patent/EP1807527B1/en not_active Not-in-force
- 2005-11-03 KR KR1020077012480A patent/KR20070085669A/ko not_active Application Discontinuation
- 2005-11-03 CN CN2005800459172A patent/CN101437953B/zh not_active Expired - Fee Related
- 2005-11-03 JP JP2007540126A patent/JP5129574B2/ja not_active Expired - Fee Related
- 2005-11-03 DK DK05851406.8T patent/DK1807527T3/da active
- 2005-11-03 CA CA2585178A patent/CA2585178C/en not_active Expired - Fee Related
- 2005-11-03 EP EP05818385.6A patent/EP1809756B1/en not_active Not-in-force
- 2005-11-03 DK DK13161757.3T patent/DK2649887T3/en active
- 2005-11-03 CN CNA2005800459100A patent/CN101437952A/zh active Pending
- 2005-11-03 EP EP12152258.5A patent/EP2458000B1/en not_active Not-in-force
- 2005-11-03 JP JP2007540139A patent/JP5139806B2/ja not_active Expired - Fee Related
- 2005-11-03 DK DK12152258.5T patent/DK2458000T3/da active
-
2007
- 2007-05-15 NO NO20072517A patent/NO20072517L/no not_active Application Discontinuation
- 2007-05-16 NO NO20072516A patent/NO20072516L/no not_active Application Discontinuation
- 2007-05-21 NO NO20072575A patent/NO20072575L/no not_active Application Discontinuation
-
2009
- 2009-05-14 US US12/466,072 patent/US8685682B2/en not_active Expired - Fee Related
- 2009-07-30 US US12/512,507 patent/US20100022647A1/en not_active Abandoned
-
2010
- 2010-09-29 US US12/893,469 patent/US8518674B2/en active Active
-
2012
- 2012-11-13 US US13/675,144 patent/US20130123361A1/en not_active Abandoned
-
2013
- 2013-07-17 US US13/943,992 patent/US8815566B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
KR20070085665A (ko) | 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
KR102700050B1 (ko) | 조작된 내수송/외수송을 가진 미생물 숙주에서 모유 올리고당류의 생산 | |
DK2087106T3 (en) | MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS | |
AU2023270322A1 (en) | Compositions and methods for modifying genomes | |
DK2140006T3 (en) | DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
KR102711998B1 (ko) | 조작되고 완전-기능 맞춤 당단백질 | |
CN101646766B (zh) | △17去饱和酶及其用于制备多不饱和脂肪酸的用途 | |
DK2324119T3 (en) | Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
DK2443248T3 (en) | IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
CN109689856A (zh) | 用于海藻宿主细胞的CRISPR-Cas系统 | |
KR20130032897A (ko) | 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거 | |
BRPI0711020A2 (pt) | polinucleotìdeo isolado, construto de dna recombinente, célula, método para transformar uma célula, método para produzir uma planta trasfornanda, sementes transgênicas, método para a produção de ácidos graxos poliinsaturados de cadeia longa em uma célula vegetal, óleos ou subporudots, método para produzir pelo menos um ácido graxo poliinsaturado em uma célula vegetal de uma semente oleaginosa, plantas de semente oleoginosa, sementes transgênicas, produto alimentìcios, progênies de plantas e molécula de ácido nucléico isolada | |
KR20130138760A (ko) | 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
KR20130105649A (ko) | 피루베이트로부터 아세토락테이트로의 전환을 촉매작용시키는 폴리펩티드를 암호화하는 폴리뉴클레오티드의 통합 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
KR20130087013A (ko) | 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매 | |
BRPI0817233A2 (pt) | construções terapêuticas de gene de trca e bireatores para a expressão de moléculas bioterapêuticas, e usos das mesmas | |
KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E601 | Decision to refuse application |