KR102199018B1 - 식물에서 인플루엔자 바이러스-유사 입자 생산 - Google Patents
식물에서 인플루엔자 바이러스-유사 입자 생산 Download PDFInfo
- Publication number
- KR102199018B1 KR102199018B1 KR1020157030865A KR20157030865A KR102199018B1 KR 102199018 B1 KR102199018 B1 KR 102199018B1 KR 1020157030865 A KR1020157030865 A KR 1020157030865A KR 20157030865 A KR20157030865 A KR 20157030865A KR 102199018 B1 KR102199018 B1 KR 102199018B1
- Authority
- KR
- South Korea
- Prior art keywords
- modified
- seq
- sequence
- plant
- protein
- Prior art date
Links
- 206010022000 influenza Diseases 0.000 title claims abstract description 106
- 239000002245 particle Substances 0.000 title claims abstract description 27
- 238000004519 manufacturing process Methods 0.000 title claims description 32
- 101710154606 Hemagglutinin Proteins 0.000 claims abstract description 660
- 101710093908 Outer capsid protein VP4 Proteins 0.000 claims abstract description 660
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 claims abstract description 660
- 101710176177 Protein A56 Proteins 0.000 claims abstract description 660
- 239000000185 hemagglutinin Substances 0.000 claims abstract description 591
- 230000002797 proteolythic effect Effects 0.000 claims abstract description 308
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 233
- 239000002773 nucleotide Substances 0.000 claims abstract description 230
- 230000014509 gene expression Effects 0.000 claims abstract description 229
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 147
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 132
- 230000007017 scission Effects 0.000 claims abstract description 132
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 117
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 87
- 238000000034 method Methods 0.000 claims abstract description 86
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 84
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 84
- 230000001105 regulatory effect Effects 0.000 claims abstract description 20
- 238000012258 culturing Methods 0.000 claims abstract description 9
- 230000002829 reductive effect Effects 0.000 claims abstract description 9
- 241000196324 Embryophyta Species 0.000 claims description 256
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 144
- 241000577998 Bean yellow dwarf virus Species 0.000 claims description 85
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 79
- 230000003321 amplification Effects 0.000 claims description 71
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 71
- 239000003623 enhancer Substances 0.000 claims description 57
- 150000001413 amino acids Chemical class 0.000 claims description 55
- 210000005220 cytoplasmic tail Anatomy 0.000 claims description 37
- 230000001965 increasing effect Effects 0.000 claims description 35
- 239000002243 precursor Substances 0.000 claims description 25
- 239000000203 mixture Substances 0.000 claims description 22
- 230000004048 modification Effects 0.000 claims description 22
- 238000012986 modification Methods 0.000 claims description 22
- 108091006146 Channels Proteins 0.000 claims description 21
- 102000034573 Channels Human genes 0.000 claims description 21
- 230000028993 immune response Effects 0.000 claims description 20
- 229960005486 vaccine Drugs 0.000 claims description 20
- 150000002632 lipids Chemical class 0.000 claims description 18
- 241000712461 unidentified influenza virus Species 0.000 claims description 16
- 239000012588 trypsin Substances 0.000 claims description 12
- 108090000631 Trypsin Proteins 0.000 claims description 11
- 102000004142 Trypsin Human genes 0.000 claims description 11
- 241000723607 Comovirus Species 0.000 claims description 10
- 230000002163 immunogen Effects 0.000 claims description 6
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 5
- 230000029087 digestion Effects 0.000 claims description 5
- 230000036039 immunity Effects 0.000 claims description 5
- 230000001939 inductive effect Effects 0.000 claims description 5
- 230000009385 viral infection Effects 0.000 claims description 5
- 239000003937 drug carrier Substances 0.000 claims description 4
- 108091033319 polynucleotide Proteins 0.000 claims description 4
- 102000040430 polynucleotide Human genes 0.000 claims description 4
- 239000002157 polynucleotide Substances 0.000 claims description 4
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 3
- 108010029566 avian influenza A virus hemagglutinin Proteins 0.000 claims description 3
- 230000001747 exhibiting effect Effects 0.000 claims description 3
- 108090000317 Chymotrypsin Proteins 0.000 claims description 2
- 101710199769 Matrix protein 2 Proteins 0.000 claims description 2
- 229960002376 chymotrypsin Drugs 0.000 claims description 2
- 108010015530 tryptase Clara Proteins 0.000 claims description 2
- 241000723655 Cowpea mosaic virus Species 0.000 claims 5
- 241000700605 Viruses Species 0.000 abstract description 39
- 239000004365 Protease Substances 0.000 abstract description 29
- 108091005804 Peptidases Proteins 0.000 abstract description 28
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 abstract 2
- 239000013612 plasmid Substances 0.000 description 93
- 230000004186 co-expression Effects 0.000 description 82
- 238000010586 diagram Methods 0.000 description 72
- 208000037798 influenza B Diseases 0.000 description 69
- 108020003589 5' Untranslated Regions Proteins 0.000 description 63
- 239000012634 fragment Substances 0.000 description 54
- 210000004027 cell Anatomy 0.000 description 52
- 208000037797 influenza A Diseases 0.000 description 52
- 108090000765 processed proteins & peptides Proteins 0.000 description 49
- 230000037430 deletion Effects 0.000 description 48
- 238000012217 deletion Methods 0.000 description 48
- 102000004196 processed proteins & peptides Human genes 0.000 description 42
- 229920001184 polypeptide Polymers 0.000 description 40
- 241000219823 Medicago Species 0.000 description 39
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 39
- 101710085938 Matrix protein Proteins 0.000 description 36
- 101710127721 Membrane protein Proteins 0.000 description 36
- 230000035772 mutation Effects 0.000 description 36
- 108091026890 Coding region Proteins 0.000 description 35
- 101150033195 Victoria gene Proteins 0.000 description 34
- 238000010367 cloning Methods 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 28
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 description 27
- 238000009825 accumulation Methods 0.000 description 27
- 108020003519 protein disulfide isomerase Proteins 0.000 description 27
- 230000000694 effects Effects 0.000 description 26
- 239000000284 extract Substances 0.000 description 26
- 239000000047 product Substances 0.000 description 26
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 25
- 108010067390 Viral Proteins Proteins 0.000 description 24
- 230000004927 fusion Effects 0.000 description 24
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 22
- 241000208125 Nicotiana Species 0.000 description 21
- 235000019419 proteases Nutrition 0.000 description 21
- 230000002068 genetic effect Effects 0.000 description 20
- 238000001262 western blot Methods 0.000 description 20
- 108090000051 Plastocyanin Proteins 0.000 description 19
- 239000000306 component Substances 0.000 description 19
- 108091008146 restriction endonucleases Proteins 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 18
- 239000003112 inhibitor Substances 0.000 description 17
- 108091081024 Start codon Proteins 0.000 description 15
- 101900024951 Tomato bushy stunt virus RNA silencing suppressor p19 Proteins 0.000 description 15
- 108010058731 nopaline synthase Proteins 0.000 description 14
- 108091035707 Consensus sequence Proteins 0.000 description 13
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 12
- 210000000170 cell membrane Anatomy 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 241000589158 Agrobacterium Species 0.000 description 11
- 239000002028 Biomass Substances 0.000 description 11
- 102100029721 DnaJ homolog subfamily B member 1 Human genes 0.000 description 11
- 102000004190 Enzymes Human genes 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 11
- 108010042283 HSP40 Heat-Shock Proteins Proteins 0.000 description 11
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 11
- 230000017854 proteolysis Effects 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- 101150073246 AGL1 gene Proteins 0.000 description 10
- 108010006519 Molecular Chaperones Proteins 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 230000003612 virological effect Effects 0.000 description 10
- 239000000427 antigen Substances 0.000 description 9
- 108091007433 antigens Proteins 0.000 description 9
- 102000036639 antigens Human genes 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 9
- 239000012528 membrane Substances 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 108020005345 3' Untranslated Regions Proteins 0.000 description 8
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 8
- 241000702463 Geminiviridae Species 0.000 description 8
- 102000005431 Molecular Chaperones Human genes 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- LGJMUZUPVCAVPU-UHFFFAOYSA-N beta-Sitostanol Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(CC)C(C)C)C1(C)CC2 LGJMUZUPVCAVPU-UHFFFAOYSA-N 0.000 description 8
- 230000000670 limiting effect Effects 0.000 description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 7
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 7
- 108020001507 fusion proteins Proteins 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000005847 immunogenicity Effects 0.000 description 7
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 7
- 229940068065 phytosterols Drugs 0.000 description 7
- 230000007065 protein hydrolysis Effects 0.000 description 7
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 7
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 6
- 102000030902 Galactosyltransferase Human genes 0.000 description 6
- 108060003306 Galactosyltransferase Proteins 0.000 description 6
- 108091029795 Intergenic region Proteins 0.000 description 6
- 239000000232 Lipid Bilayer Substances 0.000 description 6
- 229930195725 Mannitol Natural products 0.000 description 6
- 241000283973 Oryctolagus cuniculus Species 0.000 description 6
- 230000002238 attenuated effect Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- -1 but not limited to Proteins 0.000 description 6
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 230000008595 infiltration Effects 0.000 description 6
- 238000001764 infiltration Methods 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 239000000594 mannitol Substances 0.000 description 6
- 235000010355 mannitol Nutrition 0.000 description 6
- 230000001717 pathogenic effect Effects 0.000 description 6
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 235000019750 Crude protein Nutrition 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- 108010059820 Polygalacturonase Proteins 0.000 description 5
- 229930182558 Sterol Natural products 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- NJKOMDUNNDKEAI-UHFFFAOYSA-N beta-sitosterol Natural products CCC(CCC(C)C1CCC2(C)C3CC=C4CC(O)CCC4C3CCC12C)C(C)C NJKOMDUNNDKEAI-UHFFFAOYSA-N 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000010790 dilution Methods 0.000 description 5
- 239000012895 dilution Substances 0.000 description 5
- 210000003743 erythrocyte Anatomy 0.000 description 5
- 108010093305 exopolygalacturonase Proteins 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000013595 glycosylation Effects 0.000 description 5
- 230000007062 hydrolysis Effects 0.000 description 5
- 238000006460 hydrolysis reaction Methods 0.000 description 5
- 238000003119 immunoblot Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- KZJWDPNRJALLNS-VJSFXXLFSA-N sitosterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CC[C@@H](CC)C(C)C)[C@@]1(C)CC2 KZJWDPNRJALLNS-VJSFXXLFSA-N 0.000 description 5
- 229950005143 sitosterol Drugs 0.000 description 5
- 150000003432 sterols Chemical class 0.000 description 5
- 235000003702 sterols Nutrition 0.000 description 5
- 239000013638 trimer Substances 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- OILXMJHPFNGGTO-UHFFFAOYSA-N (22E)-(24xi)-24-methylcholesta-5,22-dien-3beta-ol Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)C=CC(C)C(C)C)C1(C)CC2 OILXMJHPFNGGTO-UHFFFAOYSA-N 0.000 description 4
- OQMZNAMGEHIHNN-UHFFFAOYSA-N 7-Dehydrostigmasterol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)C=CC(CC)C(C)C)CCC33)C)C3=CC=C21 OQMZNAMGEHIHNN-UHFFFAOYSA-N 0.000 description 4
- 241000271566 Aves Species 0.000 description 4
- 241000287828 Gallus gallus Species 0.000 description 4
- 108090000288 Glycoproteins Proteins 0.000 description 4
- 102000003886 Glycoproteins Human genes 0.000 description 4
- BTEISVKTSQLKST-UHFFFAOYSA-N Haliclonasterol Natural products CC(C=CC(C)C(C)(C)C)C1CCC2C3=CC=C4CC(O)CCC4(C)C3CCC12C BTEISVKTSQLKST-UHFFFAOYSA-N 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 101150046652 M2 gene Proteins 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 241000831652 Salinivibrio sharmensis Species 0.000 description 4
- 210000001744 T-lymphocyte Anatomy 0.000 description 4
- 210000003719 b-lymphocyte Anatomy 0.000 description 4
- 235000013330 chicken meat Nutrition 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000006206 glycosylation reaction Methods 0.000 description 4
- 210000002865 immune cell Anatomy 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 4
- 229920000053 polysorbate 80 Polymers 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- NLQLSVXGSXCXFE-UHFFFAOYSA-N sitosterol Natural products CC=C(/CCC(C)C1CC2C3=CCC4C(C)C(O)CCC4(C)C3CCC2(C)C1)C(C)C NLQLSVXGSXCXFE-UHFFFAOYSA-N 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 210000002845 virion Anatomy 0.000 description 4
- KZJWDPNRJALLNS-VPUBHVLGSA-N (-)-beta-Sitosterol Natural products O[C@@H]1CC=2[C@@](C)([C@@H]3[C@H]([C@H]4[C@@](C)([C@H]([C@H](CC[C@@H](C(C)C)CC)C)CC4)CC3)CC=2)CC1 KZJWDPNRJALLNS-VPUBHVLGSA-N 0.000 description 3
- CSVWWLUMXNHWSU-UHFFFAOYSA-N (22E)-(24xi)-24-ethyl-5alpha-cholest-22-en-3beta-ol Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(C)C=CC(CC)C(C)C)C1(C)CC2 CSVWWLUMXNHWSU-UHFFFAOYSA-N 0.000 description 3
- SGNBVLSWZMBQTH-QGOUJLTDSA-N (3s,8s,9s,10r,13r,14s,17r)-17-[(2r)-5,6-dimethylheptan-2-yl]-10,13-dimethyl-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-ol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCC(C)C(C)C)[C@@]1(C)CC2 SGNBVLSWZMBQTH-QGOUJLTDSA-N 0.000 description 3
- CPQUIAPJXYFMHN-UHFFFAOYSA-N 24-methylcholesterol Natural products C1CC2=CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(C)C(C)C)C1(C)CC2 CPQUIAPJXYFMHN-UHFFFAOYSA-N 0.000 description 3
- KLEXDBGYSOIREE-UHFFFAOYSA-N 24xi-n-propylcholesterol Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(CCC)C(C)C)C1(C)CC2 KLEXDBGYSOIREE-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 3
- LPZCCMIISIBREI-MTFRKTCUSA-N Citrostadienol Natural products CC=C(CC[C@@H](C)[C@H]1CC[C@H]2C3=CC[C@H]4[C@H](C)[C@@H](O)CC[C@]4(C)[C@H]3CC[C@]12C)C(C)C LPZCCMIISIBREI-MTFRKTCUSA-N 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- ARVGMISWLZPBCH-UHFFFAOYSA-N Dehydro-beta-sitosterol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)CCC(CC)C(C)C)CCC33)C)C3=CC=C21 ARVGMISWLZPBCH-UHFFFAOYSA-N 0.000 description 3
- 241000283073 Equus caballus Species 0.000 description 3
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 3
- 101710091688 Patatin Proteins 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- 229920001213 Polysorbate 20 Polymers 0.000 description 3
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 3
- 101001039853 Sonchus yellow net virus Matrix protein Proteins 0.000 description 3
- 108091036066 Three prime untranslated region Proteins 0.000 description 3
- HZYXFRGVBOPPNZ-UHFFFAOYSA-N UNPD88870 Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)=CCC(CC)C(C)C)C1(C)CC2 HZYXFRGVBOPPNZ-UHFFFAOYSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 3
- MJVXAPPOFPTTCA-UHFFFAOYSA-N beta-Sistosterol Natural products CCC(CCC(C)C1CCC2C3CC=C4C(C)C(O)CCC4(C)C3CCC12C)C(C)C MJVXAPPOFPTTCA-UHFFFAOYSA-N 0.000 description 3
- 239000011942 biocatalyst Substances 0.000 description 3
- 230000020411 cell activation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 235000012000 cholesterol Nutrition 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 210000001163 endosome Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 150000002339 glycosphingolipids Chemical class 0.000 description 3
- 230000008348 humoral response Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 210000004779 membrane envelope Anatomy 0.000 description 3
- 210000000581 natural killer T-cell Anatomy 0.000 description 3
- 210000000822 natural killer cell Anatomy 0.000 description 3
- 150000003904 phospholipids Chemical class 0.000 description 3
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 230000012846 protein folding Effects 0.000 description 3
- 230000006337 proteolytic cleavage Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 3
- 235000015500 sitosterol Nutrition 0.000 description 3
- 235000020183 skimmed milk Nutrition 0.000 description 3
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 3
- 239000008279 sol Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- HCXVJBMSMIARIN-PHZDYDNGSA-N stigmasterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)/C=C/[C@@H](CC)C(C)C)[C@@]1(C)CC2 HCXVJBMSMIARIN-PHZDYDNGSA-N 0.000 description 3
- 235000016831 stigmasterol Nutrition 0.000 description 3
- 229940032091 stigmasterol Drugs 0.000 description 3
- BFDNMXAIBMJLBB-UHFFFAOYSA-N stigmasterol Natural products CCC(C=CC(C)C1CCCC2C3CC=C4CC(O)CCC4(C)C3CCC12C)C(C)C BFDNMXAIBMJLBB-UHFFFAOYSA-N 0.000 description 3
- 229940031626 subunit vaccine Drugs 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000029812 viral genome replication Effects 0.000 description 3
- 241000272525 Anas platyrhynchos Species 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 101000914947 Bungarus multicinctus Long neurotoxin homolog TA-bm16 Proteins 0.000 description 2
- 241000700199 Cavia porcellus Species 0.000 description 2
- 101000622010 Crotalus atrox Snake venom metalloproteinase atrolysin-B Proteins 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 229930186217 Glycolipid Natural products 0.000 description 2
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 description 2
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 2
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 2
- 101001016865 Homo sapiens Heat shock protein HSP 90-alpha Proteins 0.000 description 2
- 101000747588 Homo sapiens UDP-glucuronosyltransferase 1-6 Proteins 0.000 description 2
- 101000841498 Homo sapiens UDP-glucuronosyltransferase 1A1 Proteins 0.000 description 2
- 241000712431 Influenza A virus Species 0.000 description 2
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 2
- 241000702459 Mastrevirus Species 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 2
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 2
- 241000207746 Nicotiana benthamiana Species 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 230000024932 T cell mediated immunity Effects 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 102100029151 UDP-glucuronosyltransferase 1A10 Human genes 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- RGCKGOZRHPZPFP-UHFFFAOYSA-N alizarin Chemical compound C1=CC=C2C(=O)C3=C(O)C(O)=CC=C3C(=O)C2=C1 RGCKGOZRHPZPFP-UHFFFAOYSA-N 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 229940076810 beta sitosterol Drugs 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 2
- 229960003669 carbenicillin Drugs 0.000 description 2
- 150000001720 carbohydrates Chemical group 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 210000004443 dendritic cell Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 235000015872 dietary supplement Nutrition 0.000 description 2
- 239000012470 diluted sample Substances 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 238000011067 equilibration Methods 0.000 description 2
- 239000006167 equilibration buffer Substances 0.000 description 2
- 230000033581 fucosylation Effects 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 210000002288 golgi apparatus Anatomy 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 230000002147 killing effect Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000004660 morphological change Effects 0.000 description 2
- 229950006780 n-acetylglucosamine Drugs 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 230000037039 plant physiology Effects 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000005829 trimerization reaction Methods 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- TZCPCKNHXULUIY-RGULYWFUSA-N 1,2-distearoyl-sn-glycero-3-phosphoserine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCCCCCCCCCCCC TZCPCKNHXULUIY-RGULYWFUSA-N 0.000 description 1
- QAPSNMNOIOSXSQ-YNEHKIRRSA-N 1-[(2r,4s,5r)-4-[tert-butyl(dimethyl)silyl]oxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O[Si](C)(C)C(C)(C)C)C1 QAPSNMNOIOSXSQ-YNEHKIRRSA-N 0.000 description 1
- 102100024341 10 kDa heat shock protein, mitochondrial Human genes 0.000 description 1
- 101710122378 10 kDa heat shock protein, mitochondrial Proteins 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- 101800000535 3C-like proteinase Proteins 0.000 description 1
- 101800002396 3C-like proteinase nsp5 Proteins 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- FYQSMXKJYTZYRP-UHFFFAOYSA-N 6-amino-2-[2-(pyrrolidine-2-carbonylamino)propanoylamino]hexanoic acid Chemical compound NCCCCC(C(O)=O)NC(=O)C(C)NC(=O)C1CCCN1 FYQSMXKJYTZYRP-UHFFFAOYSA-N 0.000 description 1
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 description 1
- 101710154868 60 kDa heat shock protein, mitochondrial Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101100339685 Arabidopsis thaliana HSP70-4 gene Proteins 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 238000011725 BALB/c mouse Methods 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- OILXMJHPFNGGTO-NRHJOKMGSA-N Brassicasterol Natural products O[C@@H]1CC=2[C@@](C)([C@@H]3[C@H]([C@H]4[C@](C)([C@H]([C@@H](/C=C/[C@H](C(C)C)C)C)CC4)CC3)CC=2)CC1 OILXMJHPFNGGTO-NRHJOKMGSA-N 0.000 description 1
- 108010004032 Bromelains Proteins 0.000 description 1
- 210000004366 CD4-positive T-lymphocyte Anatomy 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 108010056891 Calnexin Proteins 0.000 description 1
- 102100021868 Calnexin Human genes 0.000 description 1
- SGNBVLSWZMBQTH-FGAXOLDCSA-N Campesterol Natural products O[C@@H]1CC=2[C@@](C)([C@@H]3[C@H]([C@H]4[C@@](C)([C@H]([C@H](CC[C@H](C(C)C)C)C)CC4)CC3)CC=2)CC1 SGNBVLSWZMBQTH-FGAXOLDCSA-N 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 108090000227 Chymases Proteins 0.000 description 1
- 102000003858 Chymases Human genes 0.000 description 1
- 102100025566 Chymotrypsin-like protease CTRL-1 Human genes 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108090000056 Complement factor B Proteins 0.000 description 1
- 102000003712 Complement factor B Human genes 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- 108010041986 DNA Vaccines Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 229940021995 DNA vaccine Drugs 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 102100029714 DnaJ homolog subfamily B member 2 Human genes 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 238000011510 Elispot assay Methods 0.000 description 1
- 108700041152 Endoplasmic Reticulum Chaperone BiP Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- ZWZWYGMENQVNFU-UHFFFAOYSA-N Glycerophosphorylserin Natural products OC(=O)C(N)COP(O)(=O)OCC(O)CO ZWZWYGMENQVNFU-UHFFFAOYSA-N 0.000 description 1
- 101710114810 Glycoprotein Proteins 0.000 description 1
- 108060003393 Granulin Proteins 0.000 description 1
- 102100023737 GrpE protein homolog 1, mitochondrial Human genes 0.000 description 1
- 102000004447 HSP40 Heat-Shock Proteins Human genes 0.000 description 1
- 108010027814 HSP72 Heat-Shock Proteins Proteins 0.000 description 1
- 101150112743 HSPA5 gene Proteins 0.000 description 1
- 101150043239 HSPA8 gene Proteins 0.000 description 1
- 101000856199 Homo sapiens Chymotrypsin-like protease CTRL-1 Proteins 0.000 description 1
- 101100387776 Homo sapiens DNAJB1 gene Proteins 0.000 description 1
- 101000866020 Homo sapiens DnaJ homolog subfamily B member 2 Proteins 0.000 description 1
- 101000829489 Homo sapiens GrpE protein homolog 1, mitochondrial Proteins 0.000 description 1
- 101001014213 Homo sapiens Morphogenetic neuropeptide Proteins 0.000 description 1
- 101000621371 Homo sapiens WD and tetratricopeptide repeats protein 1 Proteins 0.000 description 1
- 101000892274 Human adenovirus C serotype 2 Adenovirus death protein Proteins 0.000 description 1
- 241000713196 Influenza B virus Species 0.000 description 1
- 241000713297 Influenza C virus Species 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 206010022678 Intestinal infections Diseases 0.000 description 1
- 102100027612 Kallikrein-11 Human genes 0.000 description 1
- 206010024774 Localised infection Diseases 0.000 description 1
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 101000686985 Mouse mammary tumor virus (strain C3H) Protein PR73 Proteins 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- 241000186366 Mycobacterium bovis Species 0.000 description 1
- 241000186362 Mycobacterium leprae Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 241001460678 Napo <wasp> Species 0.000 description 1
- 241000712464 Orthomyxoviridae Species 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 101000820656 Rattus norvegicus Seminal vesicle secretory protein 4 Proteins 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 241000952054 Rhizopus sp. Species 0.000 description 1
- 108091006035 S-modified proteins Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101710167605 Spike glycoprotein Proteins 0.000 description 1
- 235000019892 Stellar Nutrition 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 108010008038 Synthetic Vaccines Proteins 0.000 description 1
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 1
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 1
- 210000004241 Th2 cell Anatomy 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 101710152431 Trypsin-like protease Proteins 0.000 description 1
- 108060005989 Tryptase Proteins 0.000 description 1
- 102000001400 Tryptase Human genes 0.000 description 1
- 206010053613 Type IV hypersensitivity reaction Diseases 0.000 description 1
- OILXMJHPFNGGTO-ZRUUVFCLSA-N UNPD197407 Natural products C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)C=C[C@H](C)C(C)C)[C@@]1(C)CC2 OILXMJHPFNGGTO-ZRUUVFCLSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 230000010530 Virus Neutralization Effects 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- OGBUMNBNEWYMNJ-UHFFFAOYSA-N batilol Chemical class CCCCCCCCCCCCCCCCCCOCC(O)CO OGBUMNBNEWYMNJ-UHFFFAOYSA-N 0.000 description 1
- 108010087667 beta-1,4-mannosyl-glycoprotein beta-1,4-N-acetylglucosaminyltransferase Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 235000004420 brassicasterol Nutrition 0.000 description 1
- OILXMJHPFNGGTO-ZAUYPBDWSA-N brassicasterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)/C=C/[C@H](C)C(C)C)[C@@]1(C)CC2 OILXMJHPFNGGTO-ZAUYPBDWSA-N 0.000 description 1
- 235000019835 bromelain Nutrition 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 210000000233 bronchiolar non-ciliated Anatomy 0.000 description 1
- 210000003123 bronchiole Anatomy 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 235000000431 campesterol Nutrition 0.000 description 1
- SGNBVLSWZMBQTH-PODYLUTMSA-N campesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CC[C@@H](C)C(C)C)[C@@]1(C)CC2 SGNBVLSWZMBQTH-PODYLUTMSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000001516 cell proliferation assay Methods 0.000 description 1
- 230000008618 cell wall macromolecule catabolic process Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000002038 chemiluminescence detection Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000016396 cytokine production Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- OQMZNAMGEHIHNN-CIFIHVIMSA-N delta7-stigmasterol Chemical compound C1[C@@H](O)CC[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@H](C)/C=C/[C@@H](CC)C(C)C)CC[C@H]33)C)C3=CC=C21 OQMZNAMGEHIHNN-CIFIHVIMSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000012537 formulation buffer Substances 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 230000004727 humoral immunity Effects 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000010189 intracellular transport Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 235000021332 kidney beans Nutrition 0.000 description 1
- 229940124590 live attenuated vaccine Drugs 0.000 description 1
- 229940023012 live-attenuated vaccine Drugs 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- HWYHZTIRURJOHG-UHFFFAOYSA-N luminol Chemical compound O=C1NNC(=O)C2=C1C(N)=CC=C2 HWYHZTIRURJOHG-UHFFFAOYSA-N 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 230000014207 opsonization Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 229940023041 peptide vaccine Drugs 0.000 description 1
- 102000013415 peroxidase activity proteins Human genes 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000013105 post hoc analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 230000006432 protein unfolding Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000010837 receptor-mediated endocytosis Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001235 sensitizing effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 150000003408 sphingolipids Chemical class 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 231100000617 superantigen Toxicity 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000003656 tris buffered saline Substances 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 230000008478 viral entry into host cell Effects 0.000 description 1
- 230000007919 viral pathogenicity Effects 0.000 description 1
- 230000017613 viral reproduction Effects 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 235000020138 yakult Nutrition 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
- C12N15/8258—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon for the production of oral vaccines (antigens) or immunoglobulins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/145—Orthomyxoviridae, e.g. influenza virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/54—Medicinal preparations containing antigens or antibodies characterised by the route of administration
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16123—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16171—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16222—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16223—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16234—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16251—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16271—Demonstrated in vivo effect
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Pharmacology & Pharmacy (AREA)
- Biochemistry (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pulmonology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
Abstract
변형된 헤마글루티닌을 포함하는 식물에서 바이러스 유사 입자 (VLP)를 생산하는 방법이 제공된다. 방법은 식물에서 활성이고 변형된 인플루엔자 헤마글루티닌 (HA) 단백질을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 조절 영역을 포함하는 핵산을 식물, 또는 식물의 일부로 도입하는 단계를 포함하며, 변형된 HA 단백질은 변형된 단백질 가수분해 루프를 포함한다. 핵산의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 VLP를 생산하는 단계가 뒤따른다. 변형된 단백질 가수분해 루프는 프로테아제에 의해 감소되거나 폐지된 분열을 나타내는 하나 이상의 프로테아제 분열 부위를 포함할 수도 있다. HA를 암호화하는 뉴클레오타이드 서열은 B HA, C, H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, 및 H16으로 구성된 군으로부터 선택될 수도 있다. 또한 방법에 의해 생산된 바이러스 유사 입자 (VLP), 및 VLP를 발현하는 식물이 기술된다. 바이러스 유사 입자 (VLP)는 식물-특이적 N-글리칸, 또는 변형된 N- 글리칸을 포함할 수도 있다.
Description
본 발명은 식물에서 바이러스 유사 입자의 생산에 관한 것이다.
인플루엔자는 오쏘믹소비리대(orthomyxoviridae) 과의 RNA 바이러스에 의해 유발된다. 이 바이러스에는 세 가지 타입이 있는데 그것들은 세 가지 다른 타입, 타입 A, B 및 C의 인플루엔자를 유발한다. 인플루엔자 바이러스 타입 A 바이러스는 포유동물 (인간, 돼지, 페릿, 말) 및 조류를 감염시킨다. 이는 인류에게 매우 중요한데, 이것이 전 세계적 유행병을 유발했던 바이러스의 타입이기 때문이다. 인플루엔자 바이러스 타입 B (단순히 인플루엔자 B로도 공지되어 있음)는 인간만을 감염시킨다. 그것은 가끔 독감의 지역 발생을 유발한다. 인플루엔자 C 바이러스 또한 인간만을 감염시킨다. 그것들은 어릴 때 대부분의 사람을 감염시키고 드물게는 심각한 병을 유발한다.
백신 접종은 감염 전에 대상체가 방어를 탑재하도록 유도함으로써 유사한 작용물에 의해 유발된 질병에 대한 보호를 제공한다. 통상적으로, 이는 면역원으로서 생 약독화되거나 전체 비활성화된 형태의 감염원의 사용을 통해 달성되었다. 백신으로서 전체 바이러스 (예를 들어, 죽은 또는 약독화된 바이러스) 사용의 위험을 방지하기 위해서, 재조합 바이러스 단백질, 예를 들어, 서브유닛이 백신으로서 추구되었다. 펩타이드 및 서브유닛 백신 둘 다는 많은 잠재적 제한의 대상이다. 서브유닛 백신은, 부정확한 폴딩(folding) 또는 불량한 항원 제공 때문에, 불량한 면역원성을 나타낼 수도 있다. 주요 문제점은 조작된 단백질의 형태가 자연적 환경에서 항원의 형태를 모방한다는 것을 보장하는 어려움이다. 적합한 보조제 및, 펩타이드의 경우에는, 담체 단백질이 면역 반응을 촉진하는데 사용되어야 한다. 이에 더하여 이 백신은 주로 체액 반응을 유도하고, 따라서 효과적인 면역력을 일으키는데 실패할 수도 있다. 서브유닛 백신은 전체 비활성화된 바이러스가 보호를 제공하는 것으로 입증될 수 있는 질환에 대하여 종종 효과가 없다.
바이러스-유사 입자 (VLP)는 면역원성 조성물에 포함되는 잠재적인 후보물질이다. VLP는 성숙한 비리온과 매우 유사하지만, 그것들은 바이러스 유전 물질을 함유하지 않는다. 그러므로, VLP는 자연에서 복제 불가능한데, 이는 그것들을 백신으로서 투여에 안전하게 만든다. 이에 더하여, VLP는 VLP의 표면 상에서 바이러스 당단백질을 발현하도록 조작될 수 있으며, 이것은 그것들의 가장 고유한 생리학적 구성이다. 더욱이, VLP는 온전한 비리온과 유사하고 다원자가 미립자 구조이기 때문에, VLP는 가용성 외피 단백질 항원보다 항체의 당단백질로의 중화를 유도하는데 더 효과적일 수도 있다.
VLP는 식물에서 (WO2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/003235; WO 2011/03522; WO 2010/148511; 이것들은 본원에 참고로 포함됨), 및 곤충 및 포유동물 시스템에서 생산되었다 (Noad, R. and Roy, P., 2003, Trends Microbiol 11: 438-44; Neumann et al., 2000, J. Virol., 74, 547-551). Latham 및 Galarza (2001, J. Virol., 75, 6154-6165)는 헤마글루티닌 (HA), 뉴라민다제 (NA), M1, 및 M2 유전자를 동시-발현하는 재조합 바큘로바이러스(baculovirus)로 감염된 곤충 세포에서 인플루엔자 VLP의 형성을 보고하였다. 이 연구는 인플루엔자 비리온 단백질이 진핵생물 세포에서 동시-발현 시 자가-조립하고 M1 매트릭스 단백질이 VLP 생산에 필요하다는 것을 입증하였다. Gomez-Puertas et al., (1999, J. Gen. Virol, 80, 1635-1645)은 M2의 과발현이 MDCK 배양물로 CAT RNA 전달을 완벽하게 차단한다는 것을 나타냈다.
인플루엔자 바이러스의 스파이크(spike) 당단백질 헤마글루티닌 (HA)은 숙주 세포에 의한 바이러스 입자의 흡수에 매우 중요하다. 그것은 시알산-함유 세포 수용체에 그것들의 부착의 원인이 되고, 그것은 바이러스 외피의 세포막과의 융합을 통한 바이러스 침투에 수반된다. 융합 활성 및 그 결과, 바이러스 감염성은 HA 전구체 분자, HA0의 이황화-결합된 폴리펩타이드 사슬, HA1 및 HA2로 분열에 의존한다. 분열, 이후의 pH-의존적 형태 변화는 막관통 폴리펩타이드 HA2의 아미노 말단에서 고도로 보존된 소수성 펩타이드의 노출 및 재배치를 초래하며, 막 융합을 중재한다.
HA는 전구체 단백질 HA0로서 합성되며, 이것은 이황화 브릿지(bridge)에 의해 함께 결합된 두 개의 서브유닛 (HA1 및 HA2)으로의 단백질 가수분해 과정을 거친다. 두 개의 구조적 특징은 HA 분열성에 수반된 것으로 생각된다: 제한된 분열성의 HA에서, 링커(linker)는 보통 단일 아르기닌으로 구성되는 반면에, 광범위한 다른 세포 타입에서 분열 가능한 HA는 X는 비염기성 아미노산인, 주요 효소 인식 모티프(motif) Arg-X-Lys/Arg-Arg가 있는 이 위치에서 일련의 다중 염기성 잔기의 삽입을 가진다. 다수의 염기성 분열 부위를 가진 HA는 바이러스 진입 단계에서, 세포 외 공간에서, 또는 WSN 균주에 대하여 나타난 바와 같이, 바이러스 입자에서 활성화되는 일염기 링커를 가진 HA와 달리, 세포 표면 상의 버딩(budding) 부위에 도달하기 전에 세포 외 유출 수송 경로에서 분열된다. HA 분열의 제2 결정요인은 분열 부위의 가까운 부근에 존재하고 프로테아제 접근성을 방해하는 탄수화물 측쇄인 것으로 나타난다. 이 탄수화물의 손실은 향상된 HA 분열성 및 바이러스 병원성을 초래한다.
포유동물 및 비병원성 조류 인플루엔자 바이러스 균주는 HA0 전구체를 세포 밖으로 분열시킬 수 있는 프로테아제를 분비하는 세포의 제한된 범위의 결과로서 해부학적으로 국소화된 감염을 유발한다 (Chen J, et. al. 1998, Cell. Vol 95 : 409-417). 인간의 인플루엔자 감염 시 HA0 분열의 원인이 되는 프로테아제는 기도의 세포에 의해, 또는 박테리아 또는 마이코플라스마를 동시에 감염시킴으로써 분비되거나, 또는 그것들은 감염에 대한 염증 반응에서 생산될 수도 있다. 주요 프로테아제 후보 물질은 세기관지 상피의 클라라 세포에 의해 생산된 트립타제 클라라(Clara)이고, 제한된 조직 분포를 갖는다 (상기도). 프로테아제는 H1, H2, H3, 및 H6의 분열 부위에서 발견된 일염기 서열 Q/E-X-R에 특이적이다. H9의 HA 및 B 균주는 각각 SSR 및 KER 서열과 약간 다른 일염기 분열 부위를 나타낸다. 물새에서 나타나는 장 및 호흡기 감염을 유발하는 대부분의 인플루엔자 바이러스에 대하여 아무 프로테아제도 확인되지 않았다. 대부분의 세포주는 외인성 프로테아제 (보통 트립신)가 추가되지 않으면 다중 주기 복제를 지지하지 않는다.
매우 병원성인 조류 균주에서는, 하지만, HA0은 더 광범위한 세포 내 프로테아제의 과에 의해 분열되며, 전신성 독감 감염을 초래한다. 이 병원성의 차이는 HA0 분열 부위에서의 구조적 차이와 연관성이 있다. 병원성 균주는 일염기 부위 내에, 또는 그 옆에 다염기 아미노산의 삽입물을 갖는다. 이 경우에 분열은 세포 내로 발생하며 수반된 프로테아제는 퓨린, 및 다른 서브틸리신-유사 효소로서 확인되었고, 골지(Golgi)에서 발견되었고 호르몬 및 성장 인자 전구체의 번역 후 과정에 수반된다. 퓨린 인식 서열 R-X-R/K-R은 H5 및 H7의 HA0 분열 부위에서 빈번한 삽입 아미노산이다. 효소의 넓은 조직 분포, 및 세포 내 분열의 효율은 이 바이러스에 의해 유발된 광범위하고 치명적인 전신성 감염에 기여한다.
HA 분열 부위는 바이러스 약독화에 대한 표적인데, 숙주 프로테아제에 의한 HA0 전구체의 HA1 및 HA2 단편으로의 활성화 분열이 모든 인플루엔자 A 및 B 바이러스 균주의 복제 주기의 단계이기 때문이다. 분열된 HA만이 엔도솜 및 비리온 막 사이에서 융합을 중재하는 HA2 단편의 소수성 N 말단을노출하기 위한 수용체-중재된 세포 내 섭취(endocytosis) 후에 엔도솜의 산성 환경에서 형태 변화를 거칠 수 있다.
Horimoto T, et.al. (2006, Vaccine, Vol 24 : 3669-3676)은 H5에서 H5 다염기 분열 부위 (RERRRKKR↓G)의 폐지를 기술한다. 선택된 돌연변이는 마우스의 면역원성 연구에 제출되었는데, 처음 4개의 하전된 아미노산 (RERR)의 결실 및 다염기 분열 부위를 비활성화시키기 위한 변형 (RKKR를 TETR로)을 가진 돌연변이를 포함한다. 분열 부위의 폐지는 돌연변이 H5의 면역원성 특성에 영향을 미치지 않았다. 돌연변이 NIBSC 05/240 NIBSC 인플루엔자 참조 바이러스 NIBG-23을 생산하기 위한 다염기 부위의 폐지 (GERRRKKR↓G는 RETR로 대체됨)가 또한 보고되었다. Hoffman et. al. (2002, 2002, Vaccine, Vol 20 : 3165-3170)은 난세포에서 발현을 촉진하기 위해 H5 HA의 다염기 분열 부위를 H6의 일염기 부위로 대체하였다. 처음 4개의 잔기는 결실되었고 다염기 부위의 마지막 4개의 아미노산은 IETR로 대체되었다 (RERRRKKR↓G의 IETR↓G로의 대체). 이 돌연변이 H5는 숙주 세포에서 바이러스 복제 및 생산에 필요한 낮은 pH에서 높은 발현 수준, 잠재적 단백질 가수분해 및 형태 변화를 나타냈으며, 면역원성 데이터는 보고되지 않았다. 이 연구들은 바이러스 입자의 병독성을 줄이기 위해 이용될 수 있으며 (이 경우에 진짜 바이러스가 복제됨), 바이러스가 숙주 난세포를 죽이지 않고 복제할 수 있게 한다는 것을 나타낸다. 이러한 돌연변이가 없으면, 바이러스는 높은 역가에 도달하기 전에 난세포를 죽인다.
Sirko et al.의 WO2013043067은 변형된 H5 헤마글루티닌 (HA) 단백질을 암호화하는 cDNA를 함유하는 닭에 대한 DNA 백신을 기술하며, HA 서브유닛 사이에서 단백질 가수분해 분열 부위가 결실된다. Sirko et al.은 이것이 백신의 더 높은 안전성 및 길고, 비-가공된 폴리펩타이드 형태의 "초항원(super antigen)" 발현을 제공한다고 진술한다. Sirko et al.은 HA의 암호화 영역이 조류 세포에서 단백질 생산량이 최대 수율을 달성하는 이러한 방법으로 변형된다고 진술한다. 주요 변형은 닭에 대한 코돈 최적화 및 HA의 단백질 가수분해 감작 영역의 결실이다.
WO 2013/044390은 변형된 헤마글루티닌 (HA)을 가진 식물에서 바이러스 유사 입자 (VLP)를 생산하는 방법을 기술하며, 변형된 HA 단백질은 변형된 단백질 가수분해 루프를 포함한다. 변형된 HA는 조절 영역 동부 모자이크 바이러스 (Cowpea mosaic virus; CPMV) HT 및 강낭콩 황고병 바이러스 (Bean Yellow Dwarf virus; BeYDV)의 제미니바이러스(geminivirus) 증폭 요소의 존재 하에 발현된다.
Yang et al.의 US 2008/0069821은 백신으로서 인플루엔자 바이러스의 생산에 사용되는 인플루엔자 HA의 폴리펩타이드 및 폴리뉴클레오타이드의 변종을 개시한다. 재조합체 인플루엔자 바이러스는 인플루엔자 HA의 변종으로부터 유래된 상보성 세그먼트와 결합하여, 마스터 인플루엔자 바이러스의 게놈 세그먼트에 해당하는 벡터의 서브세트를 도입함으로써 얻어진다. 전형적으로 마스터 균주는 백신 투여에 적절한 바람직한 특성에 기초하여 선택된다. 예를 들어, 백신 생산, 예를 들어, 생 약독화 백신의 생산에 대하여, 마스터 기증자 바이러스 균주가 약독화된 표현형, 한랭 적응, 및/또는 온도 감도에 대하여 선택될 수 있다.
요약
본 발명은 식물에서 바이러스 유사 입자 및 변형된 HA 단백질의 생산에 관한 것이다.
식물에서 바이러스 유사 입자 및 HA 단백질의 개선된 생산을 제공하는 것이 본 발명의 목적이다.
본원에서는, 식물에서 활성인 발현 인핸서(enhancer)를 포함하고 변형된 단백질 가수분해 루프를 포함하는 변형된 인플루엔자 헤마글루티닌 (HA)를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 핵산이 기술된다.
더 나아가 본원에서는, 식물에서 바이러스 유사 입자 (VLP)를 생산하는 방법 (A)이 기술되는데,
a) 식물에서 활성인 발현 인핸서를 포함하고 변형된 단백질 가수분해 루프를 포함하는 변형된 인플루엔자 헤마글루티닌 (HA)을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 핵산을 식물, 또는 식물의 일부로 도입하는 단계;
b) 핵산의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 VLP를 생산하는 단계를 포함한다.
이에 더하여, 본원에서는, 식물에서 인플루엔자 바이러스 유사 입자s (VLP)를 생산하는 방법 (B)이 기술되는데,
a) 식물에서 활성인 발현 인핸서를 포함하고 변형된 단백질 가수분해 루프를 포함하는 변형된 인플루엔자 헤마글루티닌 (HA)을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 핵산을 포함하는, 식물, 또는 식물의 일부를 제공하는 단계, 및
b) 핵산의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 VLP를 생산하는 단계를 포함한다.
더 나아가 본원에서는, 식물에서 감소되거나 폐지된 분열을 나타내는 하나 이상의 프로테아제 분열 부위를 포함하는 변형된 단백질 가수분해 루프를 포함하는 변형된 HA 단백질을 생산하는 방법 (C)이 기술되는데,
a) 식물에서 활성인 발현 인핸서를 포함하고 변형된 단백질 가수분해 루프를 포함하는 변형된 인플루엔자 헤마글루티닌 (HA)을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 핵산을 식물, 또는 식물의 일부로 도입하는 단계,
b) HA 단백질의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 변형된 HA 단백질을 생산하는 단계,
c) 식물을 수득하고 변형된 HA 단백질을 정제하는 단계를 포함한다.
상기 기술된 방법 (A), (B) 또는 (C)는
c) 식물을 수득하는 단계, 및
d) VLP를 정제하는 단계로서, VLP는 크기가 80-300 nm의 범위에 있는 단계를 더 포함할 수도 있다.
더 나아가, 본원에서는, 식물에서 HA 단백질의 생산 수율을 증가시키는 방법 (D)이 기술되는데,
a) 식물에서 활성인 발현 인핸서를 포함하고 변형된 단백질 가수분해 루프를 포함하는 변형된 인플루엔자 헤마글루티닌 (HA)을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 핵산을 식물, 또는 식물의 일부로 도입하는 단계;
b) HA 단백질의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 변형된 HA 단백질을 생산하는 단계,
c) 식물을 수득하고 HA 단백질을 정제하는 단계를 포함한다.
발현 인핸서는 CPMVX, CPMVX+또는 CPMV-HT+일 수도 있다. 더 나아가, 뉴클레오타이드 산은 제미니바이러스 증폭 요소를 포함하지 않을 수도 있다. 그러므로 뉴클레오타이드 산은 강낭콩 황고병 바이러스 긴 유전자 간 영역 (BeYDV LIR), 및 BeYDV 짧은 유전자 간 영역 (BeYDV SIR)을 포함하지 않을 수도 있다. 변형된 단백질 가수분해 루프는 프로테아제에 의해 감소되거나 폐지된 분열을 나타내는 하나 이상의 프로테아제 분열 부위를 포함할 수도 있다. 프로테아제는 클라라-유사하거나 또는 퓨린-유사할 수도 있다. 더 나아가 변형된 단백질 가수분해 루프는 링커 서열을 포함할 수도 있고 링커 서열은 아미노산 서열 GG, TETQ 또는 TETR을 가질 수도 있다. 변형된 HA는 고유한 또는 비-고유한 신호 펩타이드를 포함할 수도 있다. 더 나아가 변형된 HA를 암호화하는 뉴클레오타이드 서열은 변형된 단백질 가수분해 루프, 인플루엔자 막관통 도메인, 및 세포질 꼬리를 포함하는 변형된 HA 엑토도메인(ectodomain)을, 연속적으로, 암호화하는 키메라 뉴클레오타이드 서열을 포함할 수도 있으며, 변형된 HA 엑토도메인은 제1 인플루엔자 균주의 것이며 막관통 도메인 및 세포질 꼬리는 제2 인플루엔자 균주의 것이다.
변형된 단백질 가수분해 루프는 프로테아제에 의해 감소되거나 폐지된 분열을 나타내는 하나 이상의 프로테아제 분열 부위를 포함할 수도 있다. 더 나아가, HA를 암호화하는 뉴클레오타이드 서열은 B HA, C, H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, 및 H16으로 구성된 군으로부터 선택된다. 또한 본원에서는, 방법 (A)에 의해 생산된 바이러스 유사 입자 (VLP)가 기술된다. 바이러스 유사 입자 (VLP)는 식물-특이적 N-글리칸, 또는 변형된 N-글리칸을 포함할 수도 있다.
본 개시물은 또한 면역 반응을 유도하는 VLP의 유효량, 및 약학적으로 허용 가능한 담체를 포함하는 조성물을 제공한다.
또한 본원에서는, 인플루엔자 헤마글루티닌 (HA)을 암호화하는 뉴클레오티드 서열, 식물에서 활성인 조절 영역과 작동 가능하게 결합된 뉴클레오타이드 서열을 포함하는 핵산이 기술되며, HA는 변형된 단백질 가수분해 루프 서열을 포함한다. 핵산은 변형된 단백질 가수분해 루프를 포함하는 HA를 암호화할 수도 있고, 단백질은 헤마글루티닌 (HA) 활성을 갖는다. 핵산을 포함하는 식물이 또한 제공된다. 또한 식물에서 생산된 바이러스 유사 입자 (VLP), 핵산에 의해 암호화된 인플루엔자 바이러스 헤마글루티닌 (HA)을 포함하는 VLP 및 식물로부터 유래된 하나 또는 하나 이상의 지질이 포함된다.
본 발명의 이 요약은 반드시 본 발명의 모든 특징을 기술할 필요는 없다.
본 발명의 이러한 및 다른 특징은 첨부된 도에 대한 참조가 이루어지는 하기 기술으로부터 더 분명해질 것이다.
도 1은 A-2X35S/CPMV-HT/H5 Indonesia/NOS (구조 번호 489)를 제조하는데 사용된 구성요소를 나타낸다. 도 1A는 프라이머 IF-H5A-I-05.s1+3c (서열 번호: 2)를 나타낸다. 도 1B는 프라이머 IF-H5dTm.r (서열 번호: 3)을 나타낸다. 도 1C는 구조 1191의 개략도를 나타낸다. 도 1D는 구조 1191 (서열 번호 4)을 나타낸다. 도 1E는 발현 카세트 번호 489 (서열 번호 5)를 나타낸다. 도 1F는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 아미노산 서열 (서열 번호: 6)을 나타낸다. 도 1G는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5를 암호화하는 뉴클레오타이드 서열 (서열 번호: 42)을 나타낸다.
도 2는 B-2X35S/CPMV HT/M2 New Caledonia/NOS (구조 번호 1261)를 제조하는데 사용되는 구성요소를 나타낸다. 도 2A는 프라이머 IF-S1-M1+M2ANC.c (서열 번호: 7)을 나타낸다. 도 2B는 프라이머 IF-S1-4-M2ANC.r (서열 번호: 8)을 나타낸다. 도 2C는 합성된 M2 유전자 (Genbank 수납 번호 DQ508860의 715-982에 결합된 nt 1-26에 해당함)에 대한 뉴클레오타이드 서열 (서열 번호: 9)을 나타낸다. 도 2D는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1261을 나타낸다. 인플루엔자 A/New Caledonia/20/1999 (H1N1)의 M2는 밑줄 그어져 있다. (서열 번호: 10). 도 2E는 인플루엔자 A/New Caledonia/20/1999 (H1N1)의 M2의 아미노산 서열 (서열 번호: 11)을 나타낸다.
도 3은 C-2X35S/CPMV-HT/M2 Puerto Rico/NOS (구조 번호 859)를 제조하는데 사용된 구성요소를 나타낸다. 도 3A는 합성된 M2 유전자의 뉴클레오타이드 서열 (Genebank 수납 번호 EF467824의 nt 740-1007에 결합된 nt 26-51에 해당함) (서열 번호: 12)을 나타낸다. 도 3B는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 859를 나타낸다. 인플루엔자 A/Puerto Rico/8/1934 (H1N1)의 M2는 밑줄 그어져 있다. (서열 번호: 13). 도 3C는 인플루엔자 A/Puerto Rico/8/1934 (H1N1)의 M2의 아미노산 서열 (서열 번호: 14)을 나타낸다.
도 4는 BeYDV+레플리카제 증폭 시스템 내 G-2X35S/CPMV-HT/PDISP/HA B Brisbane/NOS (구조 번호 1008)을 제조하는데 사용된 구성요소를 나타낸다. 도 4A는 구조 1194의 개략도를 나타낸다. 플라스미드 선형화에 사용된 SacII 및 StuI 제한 효소 부위는 도면에 주석이 달린다. 도 4B는 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 구조 1194 (밑줄 그어져 있음)를 나타낸다. 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트가 있는 BeYDV+레플리카제 증폭 시스템 내 2X35S/CPMV-HT/PDISP/NOS (서열 번호: 31). 도 4C는 BeYDV 왼쪽 LIR에서 BeYDV 오른쪽 LIR까지의 발현 카세트 번호 1008을 나타낸다. 인플루엔자 B/Brisbane/60/2008의 PDISP/HA는 밑줄 그어져 있다. (서열 번호: 32).
도 5는 I-2X35S/CPMV-HT/BeYDV+레플리카제 증폭 시스템 내 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Brisbane/NOS (구조 번호 1059)를 제조하는데 사용된 구성요소를 나타낸다. 도 5A는 프라이머 1039+1059.r (서열 번호: 38)을 나타낸다. 도 5B는 프라이머 1039+1059.c (서열 번호: 39)를 나타낸다. 도 5C는 BeYDV 왼쪽 LIR에서 BeYDV 오른쪽 LIR까지의 발현 카세트 번호 1059를 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 PDISP/HA (SEQ ID NO: 40)는 밑줄 그어져 있다. 도 5D는 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 아미노산 서열 (서열 번호: 41)을 나타낸다. 도 5E는 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 뉴클레오타이드 서열 (SEQ ID NO: 43)을 나타낸다.
도 6은 BeYDV(m)+레플리카제 증폭 시스템 내 B-2X35S/CPMV-HT/HA B Wisconsin/NOS (구조 번호 1462)를 제조하는데 사용된 구성요소를 나타낸다. 도 6A는 프라이머 IF-HAB110.S1+3c (서열 번호: 49)를 나타낸다. 도 6B는 프라이머 IF-HAB110.s1-4r (서열 번호: 50)을 나타낸다. 도 6C는 합성된 HA B Wisconsin의 뉴클레오타이드 서열 (Genbank 수납 번호 JN993010) (서열 번호: 51)을 나타낸다. 도 6D는 구조 193의 개략도를 나타낸다. 도 6E은 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 구조 193 (밑줄 그어져 있음)을 나타낸다. 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트가 있는 BeYDV(m)+레플리카제 증폭 시스템 내 2X35S/CPMV-HT/NOS (서열 번호: 52). 도 6F는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1462의 뉴클레오타이드 서열을 나타낸다. 인플루엔자 B/Wisconsin/1/2010의 HA (서열 번호: 53)는 밑줄 그어져 있다. 도 6G는 인플루엔자 B/Wisconsin/1/2010의 HA의 아미노산 서열 (서열 번호: 54)을 나타낸다. 도 6H는 구조 1462의 개략도를 나타낸다.
도 7은 BeYDV(m)+레플리카제 증폭 시스템 내 C-2X35S/CPMV-HT/결실된 단백질 가수분해 루프를 가진 HA B Wisconsin/NOS (구조 번호 1467)을 제조하는데 사용된 구성요소를 나타낸다. 도 7A는 프라이머 HAB110(PrL-).r (서열 번호: 55)을 나타낸다. 도 7B는 프라이머 HAB110(PrL-).c (서열 번호: 56)를 나타낸다. 도 7C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1467의 뉴클레오타이드 서열을 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Wisconsin/1/2010의 HA (서열 번호: 57)는 밑줄 그어져 있다. 도 7D는 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Wisconsin/1/2010의 아미노산 서열 (서열 번호: 58)을 나타낸다. 도 7E는 구조 1467의 개략도를 나타낸다.
도 8은 A-2X35S/CPMV-HT/결실된 단백질 가수분해 루프를 가진 PDISP/HA B Brisbane/NOS (구조 번호 1039)을 제조하는데 사용된 구성요소를 나타낸다. 도 8A는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1039의 뉴클레오타이드 서열을 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 HA (서열 번호: 15)는 밑줄 그어져 있다. 도 8B는 구조 1039의 개략도를 나타낸다.
도 9는 구조 번호 1008의 플라스미드 맵을 나타낸다. 구조 번호 1008은 인플루엔자 균주 B/Brisbane/60/2008의 야생형 HA의 발현을 지시한다. 이 구조는 DNA 증폭을 위해 BeYDV-유래 요소를 포함한다.
도 10은 구조 번호 1059의 플라스미드 맵을 나타낸다. 구조 번호 1059는 결실된 단백질 가수분해 루프를 가진 인플루엔자 균주 B/Brisbane/60/2008의 돌연변이 HA의 발현을 지시한다. 이 구조는 DNA 증폭을 위해 BeYDV-유래 요소를 포함한다.
도 11은 구조 번호 1261의 플라스미드 맵을 나타낸다. 구조 번호 1261은 인플루엔자 균주 A/New Caledonia/20/99 (H1N1)의 야생형 M2의 발현을 지시한다.
도 12는 구조 번호 859의 플라스미드 맵을 나타낸다. 구조 번호 859는 인플루엔자 균주 A/Puerto Rico/8/34 (H1N1)의 야생형 M2의 발현을 지시한다.
도 13A는 아그로필트레이션된(agroinfiltrated) 니코티아나 벤타미아 나(Nicotiana benthamiana ) 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. "1008": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 야생형 HA의 발현; "1008+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 야생형 HA from B/Brisbane/60/2008의 동시-발현; "1059": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 발현; "1059+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. 3번의 별개의 침윤 (A, B 및 C)으로부터 식물이 분석되었다. 비는 동시-발현 실험에서 사용된 아그로박테리움(Agrobacterium) 배양물의 비율이다. 도 13B는 HA-생산 식물의 미가공 단백질 추출물의 헤마글루티닌화 수용량의 비교를 나타낸다.
도 14는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질의 웨스턴 블롯 분석을 나타낸다. "1059": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 발현; "1059+1261": A/New Caledonia/20/99와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. "1059+859": A/Puerto Rico/8/34의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. 3번의 별개의 침윤 (A, B 및 C)으로부터 식물이 분석되었다. 비는 동시-발현 실험에서 사용된 아그로박테리움 배양물의 비율이다.
도 15는 여러 인플루엔자 균주의 HA의 링커를 둘러싼 영역의 아미노산 서열 정렬을 나타낸다: H1 New Cal (서열 번호: 22); H1 Brisbane (서열 번호: 23); H1 Sol Islands (서열 번호: 24); H2A Singapore (서열 번호: 25); H3A Brisbane (서열 번호: 26); H3A WCN (서열 번호: 27); H5 Anhui (서열 번호: 28); H5 Indo (서열 번호: 29); H5 Vietnam (서열 번호: 30); H6 Teal HK (서열 번호: 33); H7 Eq Prague (서열 번호: 34); H9A HK (서열 번호: 35); B Florida (서열 번호: 36); B Malaysia (서열 번호: 37). 전구체 HA0의 분열 부위는 화살표로 표시된다.
도 16A는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. B/Wisconsin/1/2010의 HA는 A/New Caledonia/20/99의 M2와 함께 동시-발현된다. 단백질 추출물 10 마이크로그램이 레인마다 로딩되었다. "C+": 양성 대조군, 영국 국립생물표준통제연구원(National Institute for Biological Standards and Control, United Kingdom)의 반-정제된 B/Wisconsin/1/2010 바이러스; "1462": 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 야생형 HA의 발현; "1467": 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 돌연변이 HA의 발현; "1462+1261": M2의 함께 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 야생형 HA의 동시-발현; "1467+1261": M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 돌연변이 HA의 동시-발현. 비는 발현 및 동시-발현 실험에 사용된 각 아그로박테리움에 대한 시각적 밀도를 나타낸다. 도 16B는 AGL1/1462, AGL1/1467, AGL1/1462+AGL1/1261 및 AGL1/1467+AGL1/1261로 형질전환된 식물의 미가공 단백질 추출물의 헤마글루티닌화 수용량의 비교를 나타낸다.
도 17A 및 17B는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. "1008": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 야생형 HA의 발현; "1008+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 야생형 HA의 동시-발현; "1039": 증폭 요소 (BeYDV)의 부재 시 B/Brisbane/60/2008의 돌연변이 HA의 발현. "1039+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 부재 시 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. A/Brisbane/59/2007 (H1N1)의 HA. "1059": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 발현; "1059+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현.
도 18A는 클라라-유사 및/또는 퓨린 유사 프로테아제에 의한 HA0의 HA1 및 HA2로의 분열의 개략도를 나타낸다. 도 18B는 여러 인플루엔자 균주의 HA의 서열 정렬을 나타낸다: H1 New Cal (서열 번호: 22); H1 Brisbane (서열 번호: 23); H1 Sol Islands (서열 번호: 24); H2A Singapore (서열 번호: 25); H3A Brisbane (서열 번호: 26); H3A WCN (서열 번호: 27); H5 Anhui (서열 번호: 28); H5 Indo (서열 번호: 29); H5 Vietnam (서열 번호: 30); H6 Teal HK (서열 번호: 33); H7 Eq Prague (서열 번호: 34); H9A HK (서열 번호: 35); B Florida (서열 번호: 36); B Malaysia (서열 번호: 37). 도 18C는 H5 균주, A/Anhui/1/2005 (H5N1) 서열 번호: 69, A/Indonesia/5/2005 (H5N1) 서열 번호: 70, A/Vietnam/1194/2004 (H5N1) 서열 번호: 71, 및 타입 B 균주, B/Florida/4/2006 서열 번호: 72, 및 B/Malaysia/2506/2004 서열 번호: 73에서 분열 부위의 일부의 결실을 나타낸다.
도 19는 H5/Indo에서 분열 부위의 돌연변이를 나타낸다. 고유한 서열 (서열 번호: 44); TETR (서열 번호: 45)을 포함하는 H5/Indo 변형된 분열 부위; TETQ (서열 번호: 46)를 포함하는 H5/Indo 변형된 분열 부위.
도 20은 단백질 가수분해 루프 내에서 돌연변이를 포함하는 다른 변형된 H5/Indo HA의 효소-추출 후에 초기 바이오매스에서 발견된 역가를 나타낸다. H5/Indo 대조군 (구조 489); GG 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 928); TETR 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 676); TETQ 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 766).
도 21은 타입 B HA의 단백질 가수분해 루프를 변형시키기 위한 다양한 접근법을 나타낸다. 도 21A는 고유한 B/Brisbane/60/2008의 아미노산 서열 (서열 번호: 16)을 나타낸다. 밑줄 그어진 부분은 단백질 가수분해 루프 및 HA2 도메인이다. 도 21B는 변형된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008의 아미노산 서열 (서열 번호: 17)을 나타내며, 서열 AKLLKERGFFGAIAGFLEG을 포함하는 19개 아미노산 잔기가 GG 링커 (이탤릭체)로 대체된다. 도 21C는 B/Brisbane/60/2008의 아미노산 서열 (서열 번호: 18)을 나타내며, 서열 PPAKLLKER을 포함하는 9개 아미노산은 -GSSSGSSSG- 링커 (이탤릭체)로 대체되었다. 도 21D는 고유한 H3 A/Perth/16/2009의 아미노산 서열 (서열 번호: 19)을 나타낸다. 도 21E는 GS 링커 (이탤릭체)로 대체된 서열 RNVPEKQTRGIF를 포함하는 12개 아미노산 잔기를 가진 H3 A/Perth/16/2009의 아미노산 서열 (서열 번호: 20)을 나타낸다. 도 21F는 GSSGSSGSS- 링커 (이탤릭체)로 대체된 서열 RNVPEKQTR을 포함하는 9개 아미노산 잔기를 가진 H3 A/Perth/16/2009의 아미노산 서열 (서열 번호: 21)을 나타낸다.
도 22는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. H5/Indo의 HA. 상단 패널 각 레인에 로딩된 구성요소의 목록; 하단 패널 웨스턴 블롯. C: 재조합 H5 Indonesia/5/05 S-STD-0002; 1차 항체: 항-HA A/Indonesia/05/2005 CBER # S-BIO-0003 1/50 000; 블롯. 레인1 및 2: H5/Indo 대조군 (구조 489); 레인3 및 4 GG 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 928); 레인5 및 6 TETR 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 676); 레인7 및 8 TETQ 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 766); 레인 9 MW 마커; 레인 10 H5 대조군.
도 23은 TETR 분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 B-2X35S/CPMV-HT/H5 (구조 번호 676)를 제조하는데 사용된 구성요소를 나타낸다. 도 23A는 프라이머 서열 MutCleavage-H5(Indo).r (서열 번호: 74)을 나타낸다. 도 23B는 프라이머 서열 MutCleavage-H5(Indo).c (서열 번호: 75)를 나타낸다. 도 23C은 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 676에 대한 뉴클레오타이드 서열 (서열 번호: 76)을 나타낸다. 인플루엔자 A/Indonesia/5/2005 (H5N1) TETR 분열 부위 돌연변이의 H5는 밑줄 그어져 있다. 도 23D는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 TETR 분열 부위 돌연변이의 아미노산 서열 (서열 번호: 77)을 나타낸다. 도 23E는 구조 번호 676의 개략도를 나타낸다.
도 24는 TETQ 분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 B-2X35S/CPMV-HT/H5 (구조 번호 766)를 제조하는데 사용된 구성요소를 나타낸다. 도 24A는 프라이머 서열 H5I505_TETQ.r (서열 번호: 78)을 나타낸다. 도 24B는 프라이머 서열 H5I505_TETQ.c (서열 번호: 79)를 나타낸다. 도 24C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 766에 대한 뉴클레오타이드 서열 (서열 번호: 80)을 나타낸다. 인플루엔자 A/Indonesia/5/2005 (H5N1) TETQ 분열 부위 돌연변이의 H5는 밑줄 그어져 있다. 도 24D는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 TETQ 분열 부위 돌연변이의 아미노산 서열 (서열 번호: 81)을 나타낸다. 도 24E는 구조 번호 766의 개략도를 나타낸다.
도 25는 결실된 단백질 가수분해 루프를 가진 A/Indonesia/5/2005의 B-2X35S/CPMV-HT/H5 (구조 번호 928)를 제조하는데 사용된 구성요소를 나타낸다. 도 25A는 프라이머 서열 H5I505(PrL-).r (서열 번호: 82)을 나타낸다. 도 25B는 프라이머 서열 H5I505(PrL-).c (서열 번호: 83)을 나타낸다. 도 25C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 928에 대한 뉴클레오타이드 서열 (서열 번호: 84)을 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5는 밑줄 그어져 있다. 도 25D는 결실된 단백질 가수분해 루프를 포함하는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 돌연변이의 아미노산 서열 (서열 번호: 85)을 나타낸다. 도 25E는 구조 번호 928의 개략도를 나타낸다.
도 26A는 여러 인핸서 서열, CPMVX, 및 CPMVX+(CPMVX, 및 스터퍼(stuffer) 단편을 포함하며, 이 비-제한 예에서, 이것은 다클로닝 부위 및 식물 코자크 서열을 포함함)의 예의 일반적인 개략도를 나타내며, 본원에서 기술된 바와 같다. CPMCX 및 CPMVX+는 각각 그것들의 5' 끝, 및 3' 끝에서, 식물 조절 영역, 연속적으로, 원하는 뉴클레오타이드 서열 (ATG 개시 부위 및 종결 부위), 3'UTR, 및 종결자서열에 작동 가능하게 결합된 것으로 나타난다. 본원에서 기술된 구초 CPMVX의 예는 CPMV160이다. 본원에서 기술된 구조 CPMVX+의 예는 CPMV160+이다. 도 26B는 CPMV-HT 발현 구조, 및 CPMV160+기반 발현 구조를 포함하는 식물에서 생산된 변형된 HA 단백질의 미가공 단백질 추출물에서 상대적인 헤마글루티닌화 역가 (HMG)를 나타낸다. 단백질 가수분해 루프가 결실되고 PDI 신호 펩타이드를 가진 HA B Brisbane/60/08 (구조 번호 1039, 5'UTR: CMPVHT; 및 구조 번호 1937, 5'UTR: CMPV160+; 실시예 5.7 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1의 그것으로 대체된 B Brisbane/60/08+H1Tm, 단백질 가수분해 루프가 결실되고 PDI 신호 펩타이드를 가진 B Massachusetts/2/2012 2012 (구조 번호 2072, 5'UTR: CMPV HT; 및 구조 번호 2050, 5'UTR: CMPV160+; 실시예 5.14 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 PDI 신호 펩타이드를 가진 B Massachusetts/2/2012+H1Tm (구조 번호 2074, 5'UTR: CMPV HT; 및 구조 번호 2060, 5'UTR: CMPV160+; 실시예 5.15 참조), 단백질 가수분해 루프가 결실되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010 (구조 번호 1445, 5'UTR: CMPV HT; 및 구조 번호 1975, 5'UTR: CMPV160+; 실시예 5.16 참조), 및 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010+H1Tm (구조 번호 1454, 5'UTR: CMPV HT; 및 구조 번호 1893, 5'UTR: CMPV160+; 실시예 5.18 참조)의 발현에 대한 데이터가 나타난다.
도 27A는 원하는 뉴클레오타이드 서열에 융합된 CPMV HT 및 CPMV HT+의 인핸서 서열의 일반적인 개략도를 나타낸다. 이 도면에서 나타난 모든 요소가 인핸서 서열 내에 필요한 것은 아닐 수도 있다. 추가적인 요소는 코모바이러스(comovirus) 3' 비번역 영역 (UTR), 플라스토시아닌 3' UTR, 또는 코모바이러스 3' UTR 및 플라스토시아닌 3' UTR의 조합을 암호화하는 서열을 포함하는, 원하는 뉴클레오타이드 서열 (미도시)의 3' 끝에 포함될 수도 있다. 도 27B는 CPMV-HT 발현 구조, 및 CPMV HT+기반 발현 구조를 포함하고, 원하는 뉴클레오타이드 서열에 작동 가능하게 결합된 식물에서 생산된 단백질의 미가공 단백질 추출물에서 상대적인 헤마글루티닌화 역가를 나타낸다. 단백질 가수분해 루프가 결실되고 PDI 신호 펩타이드를 가진 HA B Brisbane/60/08 (구조 번호 1039: CPMV HT; 실시예 5.7 참조 및 구조 번호 1829: CPMV HT+; 실시예 5.12 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고, PDI 신호 펩타이드를 가진 B Brisbane/60/08+H1TM (구조 번호 1067: CPMV HT; 실시예 5.14 참조 및 구조 번호 1875: CPMV HT+; 실시예 5.19 참조), 단백질 가수분해 루프가 결실되고, PDI 신호 펩타이드를 가진 B Massachusetts/2/2012 (구조 번호 2072: CMPV HT; 실시예 5.15 참조 및 구조 번호 2052: CMPV HT+; 실시예 5.20 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 PDI 신호 펩타이드를 가진 B Massachusetts/2/2012+H1Tm (구조 번호 2074: CMPV HT; 실시예 5.16 참조 및 구조 번호 2062: CMPV HT+; 실시예 5.21 참조), 단백질 가수분해 루프가 결실되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010 (구조 번호 1445: CMPV HT; 실시예 5.17 참조 및 구조 번호 1839: CMPV HT+; 실시예 5.22 참조), 및 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010+H1Tm (구조 번호 1454: CMPV HT; 실시예 5.18 참조 및 구조 번호 1860: CMPV HT+; 실시예 5.23 참조)의 발현에 대한 데이터가 나타난다.
도 28A는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 H3 Perth 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (2019+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H3 Perth-16-09의 고유한 (야생형) HA의 동시-발현; 레인 2: (2139+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H3 Perth-16-09의 고유한 (야생형) HA의 동시-발현; 레인 3 (2039+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+)의 존재 하에 H3 Perth-16-09의 돌연변이 (변형된) HA의 동시-발현; 레인 4: (2159+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H3 Perth-16-09의 돌연변이 (변형된) HA의 동시-발현.
도 28B는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 B Malaysia 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 2: (2013+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-160+)의 존재 하에 B Malaysia 2506-04의 고유한 (야생형) HA의 동시-발현; 레인 2: (2014+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 B Malaysia 2506-04의 돌연변이 (변형된) HA의 동시-발현.
도 28C는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 H9 Hong Kong 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (1610+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT)의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 2: (1630+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+) 및 증폭 요소 BEYDV의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 3: (2244+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 4: (2226+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현. 레인 6: (2246+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-160+) 및 증폭 요소 BeYDV의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 7: (2225+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현; 레인 8: (2245+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+) 및 증폭 요소 BeYDV의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현. 레인 9: (2227+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현. 레인 10: (2247+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+) 및 증폭 요소 BeYDV의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현.
도 28D는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 B Massachusetts 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (2070+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT)의 존재 하에 B Massachusetts -2-12의 고유한 (야생형) HA의 동시-발현; 레인 2: (2080+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 B Massachusetts -2-12의 고유한 (야생형) HA의 동시-발현; 레인 3: (2090+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-160+)의 존재 하에 B Massachusetts -2-12의 고유한 (야생형) HA의 동시-발현; 레인 4: (2072+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT)의 존재 하에 B Massachusetts -2-12의 돌연변이 (변형된) HA의 동시-발현; 레인 5: (2052+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+)의 존재 하에 B Massachusetts -2-12의 돌연변이 (변형된) HA의 동시-발현; 레인 6: (2050+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 B Massachusetts -2-12의 돌연변이 (변형된) HA의 동시-발현.
도 28E는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 H2 Sin 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (2220+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H2 Singapore -1-57의 고유한 (야생형) HA의 동시-발현; 레인 2: (2222+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H2 Singapore -1-57의 고유한 (야생형) HA의 동시-발현. 레인 3: (2221+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H2 Singapore -1-57의 돌연변이 (변형된) HA의 동시-발현; 레인 4: (2223+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H2 Singapore -1-57의 돌연변이 (변형된) HA의 동시-발현.
도 28F는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 B/Forida 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (1004+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT)의 존재 하에 B/Florida의 고유한 (야생형) HA의 동시-발현; 레인 2: (1003+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT) 및 증폭 요소 BeYDV의 존재 하에 B/Florida의 고유한 (야생형) HA의 동시-발현. 레인 3: (2102+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 B/Florida의 돌연변이 (변형된) HA의 동시-발현; 레인 4: (2104+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+) 및 증폭 요소 BeYDV의 존재 하에 B/Florida의 돌연변이 (변형된) HA의 동시-발현. 레인 5: (2106+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+)의 존재 하에 B/Florida+H1 California TMCT의 돌연변이 (변형된) HA의 동시-발현. 레인 6: (2108+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+) 및 증폭 요소 BeYDV의 존재 하에 B/Florida+H1 California TMCT의 돌연변이 (변형된) HA의 동시-발현.
도 29A는 인핸서 요소 CPMV HT, CPMV HT+또는 CPMV 160+의 존재 하에 발현되는 다양한 인플루엔자 균주의 변형된 HA의 상대적인 HA 역가를 나타낸다. 활성은 같은 인핸서 요소와 함께 발현된 고유한 HA 단백질과 비교된다. H3 A Perth/16/09 (H3 Per1609), H3 Victoria/361/11 (H3 Vic26111), B Brisbane 60/2008 (HB Bris60008), B Malaysia 2506/04 (HB Mal 250604) 및 B Massachusetts 2/12 (Ma212)가 인플루엔자 M2 단백질과 동시-발현되었다.
도 30A는 프라이머 IF-S2+S4-B Bris.c (서열 번호: 86)를 나타낸다. 도 30B는 프라이머 IF-S1a4-B Bris.r (서열 번호: 87)을 나타낸다. 도 30C는 합성된 HA B Brisbane 유전자의 뉴클레오타이드 서열 (Genbank 수납 번호 FJ766840의 nt 34-1791에 해당함) (서열 번호: 88)을 나타낸다. 도 30D는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1029의 뉴클레오타이드 서열을 나타낸다. 인플루엔자 B/Brisbane/60/2008의 PDISP/HA는 밑줄 그어져 있다. (서열 번호: 89). 도 30E는 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 아미노산 서열 (서열 번호: 90)을 나타낸다. 도 30F는 구조 1029의 개략도를 나타낸다. 플라스미드 선형화에 사용된 SacII 및 StuI 제한 효소 부위는 도면에 주석이 달린다.
도 31은 구조 번호 1039 및 1829 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (PrL-) NOS 및 2X35S/CPMV HT+PDISP/HA B Brisbane (PrL-) NOS; 실시예 5.12 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1039는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1829는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 31A는 PDISP/HA B Brisbane (PrL-)의 뉴클레오타이드 서열 (서열 번호: 91)을 나타낸다. 도 31B는 PDISP/HA B Brisbane (PrL-)의 아미노산 서열 (서열 번호: 92)을 나타낸다. 도 31C는 구조 번호 1829 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 32는 구조 번호 1039 및 1937 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (PrL-) NOS 및 2X35S/CPMV160+PDISP/HA B Brisbane (PrL-) NOS; 실시예 5.7 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1039는 선행 업계 CPV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1937은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열을 포함하며 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다) CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 32A는 구조 번호 1937 (2X35S/CPMV160+; CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 33은 구조 번호 1067 및 1977 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (Prl-)+H1 California TMCT NOS 및 2X35S/CPMV160+PDISP/HA B Brisbane (PrL-)+H1 California TMCT NOS; 실시예 5.14 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1067는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1977은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열을 포함하며 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다) CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 33A는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 95)을 나타낸다. 도 33B는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 96)을 나타낸다. 도 33C는 구조 번호 1067 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 33D는 구조 번호 1977 (2X35S/CPMV160+; CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 34는 구조 번호 2072 및 2050 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-) NOS 및 2X35S/CPMV160+PDISP/HA B Massachusetts (PrL-) NOS; 실시예 5.15 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2072는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2050은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 34A는 PDISP/HA B Massachusetts (PrL-)의 뉴클레오타이드 서열 (서열 번호: 97)을 나타낸다. 도 34B는 PDISP/HA B Massachusetts (PrL-)의 아미노산 서열 (서열 번호: 98)을 나타낸다. 도 34C는 구조 번호 2072 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 34D는 구조 번호 2050 (2X35S/CPMV160+; a CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 35는 구조 번호 2074 및 2060 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV160+PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS; 실시예 5.16 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2074는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2060은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 35A는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 99)을 나타낸다. 도 35B는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 100)을 나타낸다. 도 35C는 구조 번호 2074 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 35D는 구조 번호 2060 (2X35S/CPMV160+; a CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 36은 구조 번호 1445, 1820 및 1975 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-) NOS, 2X35S/CPMV160+HA B Wisconsin (PrL-) NOS 및 2X35S/CPMV160 HA B Wisconsin (PrL-) NOS; 실시예 15.17 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1445는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1820은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. 구조 번호 1975는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR를 포함하고, 스터퍼 단편 (다클로닝 부위), 또는 식물 코자크 서열 (이 구조는 또한 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하지 않으며 "CPMV160" (CPMVX) 기반 구조의 예이다. PrL-: 결실된 단백질 가수분해 루프; NOS: 노팔린 신타제 종결자. 도 36A는 HA B Wisconsin (PrL-)의 뉴클레오타이드 서열 (서열 번호: 101)을 나타낸다. 도 36B는 HA B Wisconsin (PrL-)의 아미노산 서열 (서열 번호: 102)을 나타낸다. 도 36C는 구조 번호 1445 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 36D는 구조 번호 1820 (2X35S/CPMV160+; a CPMVX+기반 구조)의 개략도를 나타낸다. 도 36E는 구조 번호 1975 (2X35S/CPMV160; a CPMVX 기반 구조, X=160이면)의 개략도를 나타낸다.
도 37은 구조 번호 1454 및 1893 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV160+HA B Wisconsin (PrL-)+H1 California TMCT NOS; 실시예 5.18 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1454는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1893은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 37A는 HA B Wisconsin (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 103)을 나타낸다. 도 37B는 PDISP/HA B Wisconsin (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 104)을 나타낸다. 도 37C는 구조 번호 1454 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 37D는 구조 번호 1893 (2X35S/CPMV160+; a CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 38은 구조 번호 1067 및 1875 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (Prl-)+H1 California TMCT NOS 및 2X35S/CPMV HT+PDISP/HA B Brisbane (PrL-)+H1 California TMCT NOS; 실시예 5.19 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1067은 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1875는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 38A는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 105)을 나타낸다. 도 38B는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 106)을 나타낸다. 도 38C는 구조 번호 1875 (2X35S/CPMV160+)의 개략도를 나타낸다.
도 39는 구조 번호 2072 및 2052 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-) NOS 및 2X35S/CPMV HT+PDISP/HA B Massachusetts (PrL-) NOS; 실시예 5.20 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2072는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2052는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 39A는 PDISP/HA B Massachusetts (PrL-)의 뉴클레오타이드 서열 (서열 번호: 107)을 나타낸다. 도 39B는 PDISP/HA B Massachusetts (PrL-)의 아미노산 서열 (서열 번호: 108)을 나타낸다. 도 39C는 구조 번호 2052 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 40은 구조 번호 2074 및 2062 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV HT+PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS; 실시예 5.21 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2074는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2062는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 40A는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 109)을 나타낸다. 도 40B는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 110)을 나타낸다. 도 40C는 구조 번호 2062 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 41은 구조 번호 1445 및 1839 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-) NOS, 및 2X35S/CPMV HT+HA B Wisconsin (PrL-) NOS; 실시예 5.22 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1445는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1839는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PrL-: 결실된 단백질 가수분해 루프; NOS: 노팔린 신타제 종결자. 도 41A는 HA B Wisconsin (PrL-)의 뉴클레오타이드 서열 (서열 번호: 111)을 나타낸다. 도 41B는 HA B Wisconsin (PrL-)의 아미노산 서열 (서열 번호: 112)을 나타낸다. 도 41C는 구조 번호 1839 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 42는 구조 번호 1454 및 1860 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV HT+HA B Wisconsin (PrL-)+H1 California TMCT NOS; 실시예 5.23 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1454는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1860은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 42A는 HA B Wisconsin (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 113)을 나타낸다. 도 42B는 PDISP/HA B Wisconsin (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 114)을 나타낸다. 도 42C는 구조 번호 1893 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 43은 구조 번호 489 (2X35S/CPMV HT H5 Indonesia NOS 실시예 5.24 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 489는 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/H1 California) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 도 43A는 고유한 H5 Indonesia의 뉴클레오타이드 서열 (서열 번호: 115)을 나타낸다. 도 43B는 고유한 H5 Indonesia의 아미노산 서열 (서열 번호: 116)을 나타낸다. 도 43C는 구조 번호 489 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다.
도 44는 구조 번호 1800 (A-2X35S CPMV160+PDISP H3Victoria NOS; 실시예 5.25 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1800은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드. NOS: 노팔린 신타제 종결자. 도 44A는 프라이머 서열 IF**(SacII)-PDI.s1+4c (서열 번호: 117)을 나타낸다. 도 44B는 프라이머 서열 IF-H3V36111.s1-4r (서열 번호: 118)을 나타낸다. 도 44C는 PDISP/H3 Victoria의 서열 (서열 번호: 119)을 나타낸다. 도 44D는 구조 2171의 개략도를 나타낸다 (플라스미드 선형화에 사용된 SacII 및 StuI 제한 효소 부위가 표시됨). 도 44E는 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 구조 2171 (밑줄 그어져 있음), 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트, H1 California 막관통 세포질 꼬리, 및 CPMV3'UTR을 가진 2X35S/CPMV160+/NOS (서열 번호: 120)를 나타낸다. 도 44F는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1800을 나타낸다. PDISP/H3 Victoria 뉴클레오타이드 서열은 밑줄 그어져 있다; 5'UTR은 볼드체로 나타난다; 식물 코자크 서열은 이중으로 밑줄 그어져 있다; 16개 염기쌍의 스터퍼 단편 (다클로닝 부위)은 5'UTR 및 식물 코자크 서열 (서열 번호: 121) 사이에 위치한다. 도 44G는 PDISP/H3 Victoria (서열 번호: 122)의 아미노산 서열을 나타낸다. 도 44H는 구조 번호 1800 (CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 45는 구조 번호 1819 (2X35S CPMV-HT+PDISP H3Victoria NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1819는 CPMV-HT+서열 (불완전 M 단백질을 암호화하는 스터퍼 단편, 다클로닝 부위에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고, 다클로닝 부위 및 원하는 뉴클레오타이드 서열 (PDISP/H3 Victoria)) 사이에서 식물 코자크 서열을 포함한다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드. NOS: 노팔린 신타제 종결자. 도 45A는 프라이머 서열 IF(SacII)-Kozac_PDI.c (서열 번호: 123)을 나타낸다. 도 45B는 프라이머 서열 IF-H3V36111.s1-4r (서열 번호: 124)을 나타낸다. 도 45C는 구조 2181의 개략도를 나타낸다. 도 45D는 구조 2181에 대한 서열을 나타낸다 (왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지, 밑줄 그어져 있음; 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트가 있는 2X35S/CPMV-HT+/NOS; 서열 번호: 126). 도 45E는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1819를 나타낸다. PDISP/H3 Victoria 뉴클레오타이드 서열은 밑줄 그어져 있다 (서열 번호: 127). 도 45F는 구조 1819의 개략도를 나타낸다.
도 46A는 고유한 H7 Hangzhou HA 및 M2와 동시-발현될 때 결실된 단백질 가수분해 루프를 가진, 변형된 H7 Hangzhou HA의 상대적인 헤마글루티닌화 활성을 나타낸다. 고유한 및 변형된 H7 Hangzhou HA (구조 #2142 및 2152, 실시예 5.33 및 5.34 참조)는 M2 (구조 #1261 실시예 5.1 참조)의 존재 하에 발현되었고 식물로부터 정제되었다. 도 46B는 고유한 H7 Hangzhou HA (construct #2142) 및 결실된 단백질 가수분해 루프를 가진 변형된 H7 Hangzhou HA (구조 #2152)의 단백질 수율을 나타낸다. 도 46C는 SDS-PAGE를 나타내는데, 레인 2는 단백질 가수분해 루프가 제거된, 정제된 변형된 H7 Hangzhou HA (구조 #2152)를 나타내고 레인 3은 정제된 고유한 H7 Hangzhou HA (구조 #2142)를 나타낸다. 각 레인에 대하여, 총 단백질 2μg이 겔에 로딩되었다. 단백질 프로파일의 순도는 두 구조에서 유사하다.
도 47A는 고유한 HA 단백질과 단백질 가수분해 루프가 GG 링커로 대체된 변형된 HA (prl-), 단백질 가수분해 루프가 TETQ 링커로 대체된 변형된 HA (TETQ) 및 단백질 가수분해 루프가 TETR 링커로 대체된 변형된 HA (TETR) 사이에서 트립신 저항성을 나타낸다. 고유한 (# 489), PRL- (# 928), TETQ (#766) 및 TETR (#676) H5 Indonesia HA VLP 구조가 정제되었다. 각 로트에 대하여, HA VLP의 두 개의 샘플은 pH 7.4에서 150μg/mL의 표적 농도로 버퍼 (100 mM Na/KPO4, 150 mM NaCl, 0.01% TWEEN 80)에서 재현탁되었다. 트립신은 하나의 재현탁된 샘플에 1: 100 단백질 비로 추가되었다. 샘플은 실온에서 30, 60 및 120분 동안 배양되었다. 30μL의 비-소화된 추출물 (대조군) 및 30μL의 소화된 추출물이 SDS-PAGE 겔에 로딩되었으며, 이것은 쿠마시 블루(Coomassie blue)로 염색되었다. 도 47B는 2회 투여 후 마우스에서 고유한 H5 VLP 및 그것의 돌연변이 대응물 (prl-, TETQ 및 TETR)의 면역원성 (HI 역가)을 나타낸다. 막대는 고유한 H5 VLP와 각 H5 돌연변이 LP의 상대적인 (%) HI 역가 비교를 나타낸다.
도 48은 구조 번호 2220 (2X35S/CPMV HT+/PDISP/H2 Singapore/NOS; 실시예 5.27 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 도 48A는 프라이머 IF**-H2S157.s1-6r의 뉴클레오타이드 서열 (서열 번호: 127)을 나타낸다. 도 48B는 PDISP/H2 Singapore의 뉴클레오타이드 서열 (서열 번호: 128)을 나타낸다. 도 48C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2220의 뉴클레오타이드 서열을 나타낸다. PDISP/H2 Singapore 뉴클레오타이드 서열은 밑줄 그어져 있다. 도 48D는 PDISP/H2 Singapore의 아미노산 서열을 나타낸다. 도 48E는 구조 번호 2220의 개략도를 나타낸다.
도 49는 구조 번호 2221 (2X35S/CPMV HT+/단백질 가수분해 루프가 결실된 PDISP/H2 Singapore/NOS; 실시예 5.28 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 도 49A는 프라이머 H2S157(Prl-).r의 뉴클레오타이드 서열 (서열 번호: 131)을 나타낸다. 도 49B는 프라이머 H2S157(Prl-).c의 뉴클레오타이드 서열 (서열 번호: 132)을 나타낸다. 도 49C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2221의 뉴클레오타이드 서열을 나타낸다. PDISP/H2 Singapore 뉴클레오타이드 서열은 밑줄 그어져 있다 (서열 번호: 133). 도 49D는 결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore의 아미노산 서열 (서열 번호: 134)을 나타낸다. 도 49E는 구조 번호 2221의 개략도를 나타낸다.
도 50은 구조 번호 2222 (2X35S/CPMV 160+/PDISP/H2 Singapore) 및 2223 (2X35S/CPMV 160+/결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore/NOS) 실시예 5.29 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 도 50A는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2222의 뉴클레오타이드 서열을 나타낸다. PDISP/H2 Singapore 뉴클레오타이드는 서열 밑줄 그어져 있다 (서열 번호: 135). 도 50B는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2223의 뉴클레오타이드 서열을 나타낸다. 단백질 가수분해 루프 뉴클레오타이드 서열이 결실된 PDISP/H2 Singapore는 밑줄 그어져 있다 (서열 번호: 136). 도 50C는 구조 번호 2222의 개략도를, 도 50D는 구조 번호 2223의 개략도를 나타낸다.
도 51은 구조 번호 2219 (2X35S/CPMV HT+PDISP/H3 Perth) 및 2139 (2X35S/CPMV 160+/PDISP/H3 Perth; 실시예 5.30 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 도 51A는 PDISP/H3 Perth의 뉴클레오타이드 서열 (서열 번호: 137)을 나타낸다. 도 51B는 프라이머 IF**-H3P1609.S1-6r의 뉴클레오타이드 서열 (서열 번호: 138)을 나타낸다. 도 51C는 PDISP/H3 Perth (서열 번호: 139)의 아미노산 서열을 나타낸다. 도 51D는 구조 번호 2219의 개략도를 나타낸다. 도 51E는 구조 번호 2139의 개략도를 나타낸다.
도 52는 구조 번호 2039 (2X35S/CPMV HT+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth) 및 2159 (2X35S/CPMV 160+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.31 참조. 도 52A는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth의 뉴클레오타이드 서열 (서열 번호: 140)을 나타낸다. 도 52B는 프라이머 H3P1609(Prl-)#2.r의 뉴클레오타이드 서열 (서열 번호: 141)을 나타낸다. 도 52C는 프라이머 H3P1609(Prl-)#2.c의 뉴클레오타이드 서열 (서열 번호: 142). 도 52D는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth의 아미노산 서열 (서열 번호: 143)을 나타낸다. 도 52E는 구조 번호 2039의 개략도를 나타낸다. 도 52F는 구조 번호 2159의 개략도를 나타낸다.
도 53은 구조 번호 2230 (2X35S/CPMV HT+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria ) 및 2250 (2X35S/CPMV 160+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria )을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.32 참조. 도 53A는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria의 뉴클레오타이드 서열 (서열 번호: 144)을 나타낸다. 도 53B는 프라이머 H3V36111(Prl-).r의 뉴클레오타이드 서열 (서열 번호: 145)을 나타낸다. 도 53C는 프라이머 H3V36111(Prl-).c의 뉴클레오타이드 서열 (서열 번호: 146)을 나타낸다. 도 53D는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria의 아미노산 서열 (서열 번호: 147)을 나타낸다. 도 53E는 구조 번호 2230의 개략도를 나타낸다. 도 53F는 구조 번호 2250의 개략도를 나타낸다.
도 54 구조 번호 2142 (2X35S/CPMV HT+/PDISP/H7 Hangzhou/NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.33 참조. 도 54A는 PDISP/H7 Hangzhou의 뉴클레오타이드 서열 (서열 번호: 148)을 나타낸다. 도 54B는 프라이머 IF*-H7H113.s1-6r의 뉴클레오타이드 서열 (서열 번호: 149)을 나타낸다. 도 54C는 PDISP/H7 Hangzhou의 아미노산 서열 (서열 번호: 150)을 나타낸다. 도 53D는 구조 번호 2142의 개략도를 나타낸다.
도 55는 구조 번호 2152 (2X35S/CPMV HT+/결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou/NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.34 참조. 도 55A는 결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou의 뉴클레오타이드 서열 (서열 번호: 151)을 나타낸다. 도 55B는 프라이머 H7H113(PrL-).r의 뉴클레오타이드 서열 (서열 번호: 152)을 나타낸다. 도 55C는 프라이머 H7H113(PrL-).c의 뉴클레오타이드 서열 (서열 번호: 153)을 나타낸다. 도 55D는 결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou의 아미노산 서열 (서열 번호: 154)을 나타낸다. 도 53E는 구조 번호 2152의 개략도를 나타낸다.
도 56은 구조 번호 2224 (2X35S/CPMV HT+PDISP/H9 Hong Kong) 및 2226 (2X35S/CPMV 160+PDISP/H9 Hong Kong)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.35 참조. 도 56A는 PDISP/H9 Hong Kong의 뉴클레오타이드 서열 (서열 번호: 155)을 나타낸다. 도 56B는 프라이머 IF**-H9HK107399.S1-6r의 뉴클레오타이드 서열 (서열 번호: 156)을 나타낸다. 도 56C는 PDISP/H9 Hong Kong의 아미노산 서열 (서열 번호: 157)을 나타낸다. 도 56D는 구조 번호 2224의 개략도를 나타낸다. 도 56E는 구조 번호 2226의 개략도를 나타낸다.
도 57은 구조 번호 2225 (2X35S/CPMV HT+결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong) 및 2227 (2X35S/CPMV 160+결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.36 참조. 도 57A는 결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong의 뉴클레오타이드 서열 (서열 번호: 158)을 나타낸다. 도 57B는 프라이머 H9HK107399(Prl-).r의 뉴클레오타이드 서열 (서열 번호: 159)을 나타낸다. 도 57C는 프라이머 H9HK107399(Prl-).c의 뉴클레오타이드 서열 (서열 번호: 160)을 나타낸다. 도 57D는 결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong의 아미노산 서열 (서열 번호: 161)을 나타낸다. 도 57E는 구조 번호 2225의 개략도를 나타낸다. 도 57F는 구조 번호 2227의 개략도를 나타낸다.
도 58은 구조 번호 2013 (2X35S/CPMV 160+/PDISP/HA B Malaysia/NOS)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.37 참조. 도 58A는 PDISP/HA B Malaysia의 뉴클레오타이드 서열 (서열 번호: 162)을 나타낸다. 도 58B는 프라이머 IF**-HBM250604.S1-6r의 뉴클레오타이드 서열 (서열 번호: 163)을 나타낸다. 도 58C는 PDISP/HA B Malaysia의 아미노산 서열 (서열 번호: 164)을 나타낸다. 도 58D는 구조 번호 2013의 개략도를 나타낸다.
도 59는 구조 번호 2014 (2X35S/CPMV 160+/결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia/NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.38 참조. 도 59A는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia의 뉴클레오타이드 서열 (서열 번호: 165)을 나타낸다. 도 59B는 프라이머 HBM250604(PrL-).r의 뉴클레오타이드 서열 (서열 번호: 166)을 나타낸다. 도 59C는 프라이머 HBM250604(PrL-).c의 뉴클레오타이드 서열 (서열 번호: 167)을 나타낸다. 도 59D는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia의 아미노산 서열 (서열 번호: 168)을 나타낸다. 도 59E는 구조 번호 2014의 개략도를 나타낸다.
도 60은 구조 번호 2070 (2X35S/CPMV HT PDISP/HA B Massachusetts), 2080 (2X35S/CPMV HT+PDISP/HA B Massachusetts) 및 2090 (2X35S/CPMV 160+PDISP/HA B Massachusetts)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.39 참조. 도 60A는 PDISP/HA B Massachusetts의 뉴클레오타이드 서열 (서열 번호: 169)을 나타낸다. 도 60B는 PDISP/HA B Massachusetts의 아미노산 서열 (서열 번호: 170)을 나타낸다. 도 60C는 구조 번호 2070의 개략도를 나타낸다. 도 60D는 구조 번호 2080의 개략도를 나타낸다. 도 60E는 구조 번호 2090의 개략도를 나타낸다.
도 61은 구조 번호 2102 (2X35S/CPMV HT 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida) 및 2104 (2X35S/CPMV HT+/BeYDV/결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.40 참조. 도 61A는 프라이머 HBF406(PrL-).r의 뉴클레오타이드 서열 (서열 번호: 190)을 포함한다. 도 61B는 프라이머 HBF406(PrL-).c의 뉴클레오타이드 서열 (서열 번호: 191)을 포함한다. 도 61C는 프라이머 IF*-HBF406.s1-6r의 뉴클레오타이드 서열 (서열 번호: 192)을 나타낸다. 도 61D는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida의 뉴클레오타이드 서열을 나타낸다. 도 61E는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida의 아미노산 서열을 나타낸다. 도 61F는 발현 카세트 번호 2102의 뉴클레오타이드 서열을 나타낸다. 도 61G는 구조 번호 2102의 개략도를 나타낸다. 도 61H는 발현 카세트 번호 2104의 뉴클레오타이드 서열을 나타낸다. 도 61I는 구조 번호 2104의 개략도를 나타낸다.
도 62는 구조 번호 2106 (2X35S/CPMV HT+/결실된 단백질 가수분해 루프를 가진 PDISP/B Florida+H1 California TMCT/NOS) 및 2108 (2X35S/CPMV HT+/BeYDV/결실된 단백질 가수분해 루프를 가진 PDISP/B Florida+H1 California TMCT/NOS를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.41 참조. 도 62A는 프라이머 IF-H1cTMCT.S1-4r의 뉴클레오타이드 서열 (서열 번호: 197)을 나타낸다. 도 62B는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida+H1Cal TMCT의 뉴클레오타이드 서열 (서열 번호: 198)을 나타낸다. 도 62C는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida+H1Cal TMCT의 아미노산 서열을 나타낸다. 도 62D는 발현 카세트 번호 2106의 뉴클레오타이드 서열을 나타낸다. 도 62E는 구조 번호 2106의 개략도를 나타낸다. 도 62F는 발현 카세트 번호 2108의 뉴클레오타이드 서열을 나타낸다. 도 62G는 구조 번호 2108의 개략도를 나타낸다.
도 1은 A-2X35S/CPMV-HT/H5 Indonesia/NOS (구조 번호 489)를 제조하는데 사용된 구성요소를 나타낸다. 도 1A는 프라이머 IF-H5A-I-05.s1+3c (서열 번호: 2)를 나타낸다. 도 1B는 프라이머 IF-H5dTm.r (서열 번호: 3)을 나타낸다. 도 1C는 구조 1191의 개략도를 나타낸다. 도 1D는 구조 1191 (서열 번호 4)을 나타낸다. 도 1E는 발현 카세트 번호 489 (서열 번호 5)를 나타낸다. 도 1F는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 아미노산 서열 (서열 번호: 6)을 나타낸다. 도 1G는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5를 암호화하는 뉴클레오타이드 서열 (서열 번호: 42)을 나타낸다.
도 2는 B-2X35S/CPMV HT/M2 New Caledonia/NOS (구조 번호 1261)를 제조하는데 사용되는 구성요소를 나타낸다. 도 2A는 프라이머 IF-S1-M1+M2ANC.c (서열 번호: 7)을 나타낸다. 도 2B는 프라이머 IF-S1-4-M2ANC.r (서열 번호: 8)을 나타낸다. 도 2C는 합성된 M2 유전자 (Genbank 수납 번호 DQ508860의 715-982에 결합된 nt 1-26에 해당함)에 대한 뉴클레오타이드 서열 (서열 번호: 9)을 나타낸다. 도 2D는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1261을 나타낸다. 인플루엔자 A/New Caledonia/20/1999 (H1N1)의 M2는 밑줄 그어져 있다. (서열 번호: 10). 도 2E는 인플루엔자 A/New Caledonia/20/1999 (H1N1)의 M2의 아미노산 서열 (서열 번호: 11)을 나타낸다.
도 3은 C-2X35S/CPMV-HT/M2 Puerto Rico/NOS (구조 번호 859)를 제조하는데 사용된 구성요소를 나타낸다. 도 3A는 합성된 M2 유전자의 뉴클레오타이드 서열 (Genebank 수납 번호 EF467824의 nt 740-1007에 결합된 nt 26-51에 해당함) (서열 번호: 12)을 나타낸다. 도 3B는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 859를 나타낸다. 인플루엔자 A/Puerto Rico/8/1934 (H1N1)의 M2는 밑줄 그어져 있다. (서열 번호: 13). 도 3C는 인플루엔자 A/Puerto Rico/8/1934 (H1N1)의 M2의 아미노산 서열 (서열 번호: 14)을 나타낸다.
도 4는 BeYDV+레플리카제 증폭 시스템 내 G-2X35S/CPMV-HT/PDISP/HA B Brisbane/NOS (구조 번호 1008)을 제조하는데 사용된 구성요소를 나타낸다. 도 4A는 구조 1194의 개략도를 나타낸다. 플라스미드 선형화에 사용된 SacII 및 StuI 제한 효소 부위는 도면에 주석이 달린다. 도 4B는 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 구조 1194 (밑줄 그어져 있음)를 나타낸다. 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트가 있는 BeYDV+레플리카제 증폭 시스템 내 2X35S/CPMV-HT/PDISP/NOS (서열 번호: 31). 도 4C는 BeYDV 왼쪽 LIR에서 BeYDV 오른쪽 LIR까지의 발현 카세트 번호 1008을 나타낸다. 인플루엔자 B/Brisbane/60/2008의 PDISP/HA는 밑줄 그어져 있다. (서열 번호: 32).
도 5는 I-2X35S/CPMV-HT/BeYDV+레플리카제 증폭 시스템 내 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Brisbane/NOS (구조 번호 1059)를 제조하는데 사용된 구성요소를 나타낸다. 도 5A는 프라이머 1039+1059.r (서열 번호: 38)을 나타낸다. 도 5B는 프라이머 1039+1059.c (서열 번호: 39)를 나타낸다. 도 5C는 BeYDV 왼쪽 LIR에서 BeYDV 오른쪽 LIR까지의 발현 카세트 번호 1059를 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 PDISP/HA (SEQ ID NO: 40)는 밑줄 그어져 있다. 도 5D는 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 아미노산 서열 (서열 번호: 41)을 나타낸다. 도 5E는 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 뉴클레오타이드 서열 (SEQ ID NO: 43)을 나타낸다.
도 6은 BeYDV(m)+레플리카제 증폭 시스템 내 B-2X35S/CPMV-HT/HA B Wisconsin/NOS (구조 번호 1462)를 제조하는데 사용된 구성요소를 나타낸다. 도 6A는 프라이머 IF-HAB110.S1+3c (서열 번호: 49)를 나타낸다. 도 6B는 프라이머 IF-HAB110.s1-4r (서열 번호: 50)을 나타낸다. 도 6C는 합성된 HA B Wisconsin의 뉴클레오타이드 서열 (Genbank 수납 번호 JN993010) (서열 번호: 51)을 나타낸다. 도 6D는 구조 193의 개략도를 나타낸다. 도 6E은 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 구조 193 (밑줄 그어져 있음)을 나타낸다. 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트가 있는 BeYDV(m)+레플리카제 증폭 시스템 내 2X35S/CPMV-HT/NOS (서열 번호: 52). 도 6F는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1462의 뉴클레오타이드 서열을 나타낸다. 인플루엔자 B/Wisconsin/1/2010의 HA (서열 번호: 53)는 밑줄 그어져 있다. 도 6G는 인플루엔자 B/Wisconsin/1/2010의 HA의 아미노산 서열 (서열 번호: 54)을 나타낸다. 도 6H는 구조 1462의 개략도를 나타낸다.
도 7은 BeYDV(m)+레플리카제 증폭 시스템 내 C-2X35S/CPMV-HT/결실된 단백질 가수분해 루프를 가진 HA B Wisconsin/NOS (구조 번호 1467)을 제조하는데 사용된 구성요소를 나타낸다. 도 7A는 프라이머 HAB110(PrL-).r (서열 번호: 55)을 나타낸다. 도 7B는 프라이머 HAB110(PrL-).c (서열 번호: 56)를 나타낸다. 도 7C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1467의 뉴클레오타이드 서열을 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Wisconsin/1/2010의 HA (서열 번호: 57)는 밑줄 그어져 있다. 도 7D는 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Wisconsin/1/2010의 아미노산 서열 (서열 번호: 58)을 나타낸다. 도 7E는 구조 1467의 개략도를 나타낸다.
도 8은 A-2X35S/CPMV-HT/결실된 단백질 가수분해 루프를 가진 PDISP/HA B Brisbane/NOS (구조 번호 1039)을 제조하는데 사용된 구성요소를 나타낸다. 도 8A는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1039의 뉴클레오타이드 서열을 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 HA (서열 번호: 15)는 밑줄 그어져 있다. 도 8B는 구조 1039의 개략도를 나타낸다.
도 9는 구조 번호 1008의 플라스미드 맵을 나타낸다. 구조 번호 1008은 인플루엔자 균주 B/Brisbane/60/2008의 야생형 HA의 발현을 지시한다. 이 구조는 DNA 증폭을 위해 BeYDV-유래 요소를 포함한다.
도 10은 구조 번호 1059의 플라스미드 맵을 나타낸다. 구조 번호 1059는 결실된 단백질 가수분해 루프를 가진 인플루엔자 균주 B/Brisbane/60/2008의 돌연변이 HA의 발현을 지시한다. 이 구조는 DNA 증폭을 위해 BeYDV-유래 요소를 포함한다.
도 11은 구조 번호 1261의 플라스미드 맵을 나타낸다. 구조 번호 1261은 인플루엔자 균주 A/New Caledonia/20/99 (H1N1)의 야생형 M2의 발현을 지시한다.
도 12는 구조 번호 859의 플라스미드 맵을 나타낸다. 구조 번호 859는 인플루엔자 균주 A/Puerto Rico/8/34 (H1N1)의 야생형 M2의 발현을 지시한다.
도 13A는 아그로필트레이션된(agroinfiltrated) 니코티아나 벤타미아 나(Nicotiana benthamiana ) 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. "1008": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 야생형 HA의 발현; "1008+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 야생형 HA from B/Brisbane/60/2008의 동시-발현; "1059": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 발현; "1059+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. 3번의 별개의 침윤 (A, B 및 C)으로부터 식물이 분석되었다. 비는 동시-발현 실험에서 사용된 아그로박테리움(Agrobacterium) 배양물의 비율이다. 도 13B는 HA-생산 식물의 미가공 단백질 추출물의 헤마글루티닌화 수용량의 비교를 나타낸다.
도 14는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질의 웨스턴 블롯 분석을 나타낸다. "1059": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 발현; "1059+1261": A/New Caledonia/20/99와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. "1059+859": A/Puerto Rico/8/34의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. 3번의 별개의 침윤 (A, B 및 C)으로부터 식물이 분석되었다. 비는 동시-발현 실험에서 사용된 아그로박테리움 배양물의 비율이다.
도 15는 여러 인플루엔자 균주의 HA의 링커를 둘러싼 영역의 아미노산 서열 정렬을 나타낸다: H1 New Cal (서열 번호: 22); H1 Brisbane (서열 번호: 23); H1 Sol Islands (서열 번호: 24); H2A Singapore (서열 번호: 25); H3A Brisbane (서열 번호: 26); H3A WCN (서열 번호: 27); H5 Anhui (서열 번호: 28); H5 Indo (서열 번호: 29); H5 Vietnam (서열 번호: 30); H6 Teal HK (서열 번호: 33); H7 Eq Prague (서열 번호: 34); H9A HK (서열 번호: 35); B Florida (서열 번호: 36); B Malaysia (서열 번호: 37). 전구체 HA0의 분열 부위는 화살표로 표시된다.
도 16A는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. B/Wisconsin/1/2010의 HA는 A/New Caledonia/20/99의 M2와 함께 동시-발현된다. 단백질 추출물 10 마이크로그램이 레인마다 로딩되었다. "C+": 양성 대조군, 영국 국립생물표준통제연구원(National Institute for Biological Standards and Control, United Kingdom)의 반-정제된 B/Wisconsin/1/2010 바이러스; "1462": 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 야생형 HA의 발현; "1467": 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 돌연변이 HA의 발현; "1462+1261": M2의 함께 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 야생형 HA의 동시-발현; "1467+1261": M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Wisconsin/1/2010의 돌연변이 HA의 동시-발현. 비는 발현 및 동시-발현 실험에 사용된 각 아그로박테리움에 대한 시각적 밀도를 나타낸다. 도 16B는 AGL1/1462, AGL1/1467, AGL1/1462+AGL1/1261 및 AGL1/1467+AGL1/1261로 형질전환된 식물의 미가공 단백질 추출물의 헤마글루티닌화 수용량의 비교를 나타낸다.
도 17A 및 17B는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. "1008": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 야생형 HA의 발현; "1008+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 야생형 HA의 동시-발현; "1039": 증폭 요소 (BeYDV)의 부재 시 B/Brisbane/60/2008의 돌연변이 HA의 발현. "1039+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 부재 시 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현. A/Brisbane/59/2007 (H1N1)의 HA. "1059": 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 발현; "1059+1261": A/New Caledonia/20/99의 M2와 함께 증폭 요소 (BeYDV)의 존재 하에 B/Brisbane/60/2008의 돌연변이 HA의 동시-발현.
도 18A는 클라라-유사 및/또는 퓨린 유사 프로테아제에 의한 HA0의 HA1 및 HA2로의 분열의 개략도를 나타낸다. 도 18B는 여러 인플루엔자 균주의 HA의 서열 정렬을 나타낸다: H1 New Cal (서열 번호: 22); H1 Brisbane (서열 번호: 23); H1 Sol Islands (서열 번호: 24); H2A Singapore (서열 번호: 25); H3A Brisbane (서열 번호: 26); H3A WCN (서열 번호: 27); H5 Anhui (서열 번호: 28); H5 Indo (서열 번호: 29); H5 Vietnam (서열 번호: 30); H6 Teal HK (서열 번호: 33); H7 Eq Prague (서열 번호: 34); H9A HK (서열 번호: 35); B Florida (서열 번호: 36); B Malaysia (서열 번호: 37). 도 18C는 H5 균주, A/Anhui/1/2005 (H5N1) 서열 번호: 69, A/Indonesia/5/2005 (H5N1) 서열 번호: 70, A/Vietnam/1194/2004 (H5N1) 서열 번호: 71, 및 타입 B 균주, B/Florida/4/2006 서열 번호: 72, 및 B/Malaysia/2506/2004 서열 번호: 73에서 분열 부위의 일부의 결실을 나타낸다.
도 19는 H5/Indo에서 분열 부위의 돌연변이를 나타낸다. 고유한 서열 (서열 번호: 44); TETR (서열 번호: 45)을 포함하는 H5/Indo 변형된 분열 부위; TETQ (서열 번호: 46)를 포함하는 H5/Indo 변형된 분열 부위.
도 20은 단백질 가수분해 루프 내에서 돌연변이를 포함하는 다른 변형된 H5/Indo HA의 효소-추출 후에 초기 바이오매스에서 발견된 역가를 나타낸다. H5/Indo 대조군 (구조 489); GG 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 928); TETR 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 676); TETQ 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 766).
도 21은 타입 B HA의 단백질 가수분해 루프를 변형시키기 위한 다양한 접근법을 나타낸다. 도 21A는 고유한 B/Brisbane/60/2008의 아미노산 서열 (서열 번호: 16)을 나타낸다. 밑줄 그어진 부분은 단백질 가수분해 루프 및 HA2 도메인이다. 도 21B는 변형된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008의 아미노산 서열 (서열 번호: 17)을 나타내며, 서열 AKLLKERGFFGAIAGFLEG을 포함하는 19개 아미노산 잔기가 GG 링커 (이탤릭체)로 대체된다. 도 21C는 B/Brisbane/60/2008의 아미노산 서열 (서열 번호: 18)을 나타내며, 서열 PPAKLLKER을 포함하는 9개 아미노산은 -GSSSGSSSG- 링커 (이탤릭체)로 대체되었다. 도 21D는 고유한 H3 A/Perth/16/2009의 아미노산 서열 (서열 번호: 19)을 나타낸다. 도 21E는 GS 링커 (이탤릭체)로 대체된 서열 RNVPEKQTRGIF를 포함하는 12개 아미노산 잔기를 가진 H3 A/Perth/16/2009의 아미노산 서열 (서열 번호: 20)을 나타낸다. 도 21F는 GSSGSSGSS- 링커 (이탤릭체)로 대체된 서열 RNVPEKQTR을 포함하는 9개 아미노산 잔기를 가진 H3 A/Perth/16/2009의 아미노산 서열 (서열 번호: 21)을 나타낸다.
도 22는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 HA 단백질 발현의 웨스턴 블롯 분석을 나타낸다. H5/Indo의 HA. 상단 패널 각 레인에 로딩된 구성요소의 목록; 하단 패널 웨스턴 블롯. C: 재조합 H5 Indonesia/5/05 S-STD-0002; 1차 항체: 항-HA A/Indonesia/05/2005 CBER # S-BIO-0003 1/50 000; 블롯. 레인1 및 2: H5/Indo 대조군 (구조 489); 레인3 및 4 GG 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 928); 레인5 및 6 TETR 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 676); 레인7 및 8 TETQ 링커로 대체된 H5/Indo 단백질 가수분해 루프 (구조 766); 레인 9 MW 마커; 레인 10 H5 대조군.
도 23은 TETR 분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 B-2X35S/CPMV-HT/H5 (구조 번호 676)를 제조하는데 사용된 구성요소를 나타낸다. 도 23A는 프라이머 서열 MutCleavage-H5(Indo).r (서열 번호: 74)을 나타낸다. 도 23B는 프라이머 서열 MutCleavage-H5(Indo).c (서열 번호: 75)를 나타낸다. 도 23C은 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 676에 대한 뉴클레오타이드 서열 (서열 번호: 76)을 나타낸다. 인플루엔자 A/Indonesia/5/2005 (H5N1) TETR 분열 부위 돌연변이의 H5는 밑줄 그어져 있다. 도 23D는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 TETR 분열 부위 돌연변이의 아미노산 서열 (서열 번호: 77)을 나타낸다. 도 23E는 구조 번호 676의 개략도를 나타낸다.
도 24는 TETQ 분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 B-2X35S/CPMV-HT/H5 (구조 번호 766)를 제조하는데 사용된 구성요소를 나타낸다. 도 24A는 프라이머 서열 H5I505_TETQ.r (서열 번호: 78)을 나타낸다. 도 24B는 프라이머 서열 H5I505_TETQ.c (서열 번호: 79)를 나타낸다. 도 24C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 766에 대한 뉴클레오타이드 서열 (서열 번호: 80)을 나타낸다. 인플루엔자 A/Indonesia/5/2005 (H5N1) TETQ 분열 부위 돌연변이의 H5는 밑줄 그어져 있다. 도 24D는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 TETQ 분열 부위 돌연변이의 아미노산 서열 (서열 번호: 81)을 나타낸다. 도 24E는 구조 번호 766의 개략도를 나타낸다.
도 25는 결실된 단백질 가수분해 루프를 가진 A/Indonesia/5/2005의 B-2X35S/CPMV-HT/H5 (구조 번호 928)를 제조하는데 사용된 구성요소를 나타낸다. 도 25A는 프라이머 서열 H5I505(PrL-).r (서열 번호: 82)을 나타낸다. 도 25B는 프라이머 서열 H5I505(PrL-).c (서열 번호: 83)을 나타낸다. 도 25C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 928에 대한 뉴클레오타이드 서열 (서열 번호: 84)을 나타낸다. 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5는 밑줄 그어져 있다. 도 25D는 결실된 단백질 가수분해 루프를 포함하는 인플루엔자 A/Indonesia/5/2005 (H5N1)의 H5의 돌연변이의 아미노산 서열 (서열 번호: 85)을 나타낸다. 도 25E는 구조 번호 928의 개략도를 나타낸다.
도 26A는 여러 인핸서 서열, CPMVX, 및 CPMVX+(CPMVX, 및 스터퍼(stuffer) 단편을 포함하며, 이 비-제한 예에서, 이것은 다클로닝 부위 및 식물 코자크 서열을 포함함)의 예의 일반적인 개략도를 나타내며, 본원에서 기술된 바와 같다. CPMCX 및 CPMVX+는 각각 그것들의 5' 끝, 및 3' 끝에서, 식물 조절 영역, 연속적으로, 원하는 뉴클레오타이드 서열 (ATG 개시 부위 및 종결 부위), 3'UTR, 및 종결자서열에 작동 가능하게 결합된 것으로 나타난다. 본원에서 기술된 구초 CPMVX의 예는 CPMV160이다. 본원에서 기술된 구조 CPMVX+의 예는 CPMV160+이다. 도 26B는 CPMV-HT 발현 구조, 및 CPMV160+기반 발현 구조를 포함하는 식물에서 생산된 변형된 HA 단백질의 미가공 단백질 추출물에서 상대적인 헤마글루티닌화 역가 (HMG)를 나타낸다. 단백질 가수분해 루프가 결실되고 PDI 신호 펩타이드를 가진 HA B Brisbane/60/08 (구조 번호 1039, 5'UTR: CMPVHT; 및 구조 번호 1937, 5'UTR: CMPV160+; 실시예 5.7 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1의 그것으로 대체된 B Brisbane/60/08+H1Tm, 단백질 가수분해 루프가 결실되고 PDI 신호 펩타이드를 가진 B Massachusetts/2/2012 2012 (구조 번호 2072, 5'UTR: CMPV HT; 및 구조 번호 2050, 5'UTR: CMPV160+; 실시예 5.14 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 PDI 신호 펩타이드를 가진 B Massachusetts/2/2012+H1Tm (구조 번호 2074, 5'UTR: CMPV HT; 및 구조 번호 2060, 5'UTR: CMPV160+; 실시예 5.15 참조), 단백질 가수분해 루프가 결실되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010 (구조 번호 1445, 5'UTR: CMPV HT; 및 구조 번호 1975, 5'UTR: CMPV160+; 실시예 5.16 참조), 및 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010+H1Tm (구조 번호 1454, 5'UTR: CMPV HT; 및 구조 번호 1893, 5'UTR: CMPV160+; 실시예 5.18 참조)의 발현에 대한 데이터가 나타난다.
도 27A는 원하는 뉴클레오타이드 서열에 융합된 CPMV HT 및 CPMV HT+의 인핸서 서열의 일반적인 개략도를 나타낸다. 이 도면에서 나타난 모든 요소가 인핸서 서열 내에 필요한 것은 아닐 수도 있다. 추가적인 요소는 코모바이러스(comovirus) 3' 비번역 영역 (UTR), 플라스토시아닌 3' UTR, 또는 코모바이러스 3' UTR 및 플라스토시아닌 3' UTR의 조합을 암호화하는 서열을 포함하는, 원하는 뉴클레오타이드 서열 (미도시)의 3' 끝에 포함될 수도 있다. 도 27B는 CPMV-HT 발현 구조, 및 CPMV HT+기반 발현 구조를 포함하고, 원하는 뉴클레오타이드 서열에 작동 가능하게 결합된 식물에서 생산된 단백질의 미가공 단백질 추출물에서 상대적인 헤마글루티닌화 역가를 나타낸다. 단백질 가수분해 루프가 결실되고 PDI 신호 펩타이드를 가진 HA B Brisbane/60/08 (구조 번호 1039: CPMV HT; 실시예 5.7 참조 및 구조 번호 1829: CPMV HT+; 실시예 5.12 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고, PDI 신호 펩타이드를 가진 B Brisbane/60/08+H1TM (구조 번호 1067: CPMV HT; 실시예 5.14 참조 및 구조 번호 1875: CPMV HT+; 실시예 5.19 참조), 단백질 가수분해 루프가 결실되고, PDI 신호 펩타이드를 가진 B Massachusetts/2/2012 (구조 번호 2072: CMPV HT; 실시예 5.15 참조 및 구조 번호 2052: CMPV HT+; 실시예 5.20 참조), 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 PDI 신호 펩타이드를 가진 B Massachusetts/2/2012+H1Tm (구조 번호 2074: CMPV HT; 실시예 5.16 참조 및 구조 번호 2062: CMPV HT+; 실시예 5.21 참조), 단백질 가수분해 루프가 결실되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010 (구조 번호 1445: CMPV HT; 실시예 5.17 참조 및 구조 번호 1839: CMPV HT+; 실시예 5.22 참조), 및 단백질 가수분해 루프가 결실되고, 막관통 도메인 및 세포질 꼬리가 H1 A/California/07/2009의 것으로 대체되고 고유한 신호 펩타이드를 가진 B Wisconsin/1/2010+H1Tm (구조 번호 1454: CMPV HT; 실시예 5.18 참조 및 구조 번호 1860: CMPV HT+; 실시예 5.23 참조)의 발현에 대한 데이터가 나타난다.
도 28A는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 H3 Perth 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (2019+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H3 Perth-16-09의 고유한 (야생형) HA의 동시-발현; 레인 2: (2139+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H3 Perth-16-09의 고유한 (야생형) HA의 동시-발현; 레인 3 (2039+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+)의 존재 하에 H3 Perth-16-09의 돌연변이 (변형된) HA의 동시-발현; 레인 4: (2159+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H3 Perth-16-09의 돌연변이 (변형된) HA의 동시-발현.
도 28B는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 B Malaysia 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 2: (2013+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-160+)의 존재 하에 B Malaysia 2506-04의 고유한 (야생형) HA의 동시-발현; 레인 2: (2014+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 B Malaysia 2506-04의 돌연변이 (변형된) HA의 동시-발현.
도 28C는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 H9 Hong Kong 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (1610+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT)의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 2: (1630+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+) 및 증폭 요소 BEYDV의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 3: (2244+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 4: (2226+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현. 레인 6: (2246+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-160+) 및 증폭 요소 BeYDV의 존재 하에 H9 Hong Kong -1037-99의 고유한 (야생형) HA의 동시-발현; 레인 7: (2225+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현; 레인 8: (2245+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+) 및 증폭 요소 BeYDV의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현. 레인 9: (2227+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현. 레인 10: (2247+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+) 및 증폭 요소 BeYDV의 존재 하에 H9 Hong Kong -1037-99의 돌연변이 (변형된) HA의 동시-발현.
도 28D는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 B Massachusetts 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (2070+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT)의 존재 하에 B Massachusetts -2-12의 고유한 (야생형) HA의 동시-발현; 레인 2: (2080+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 B Massachusetts -2-12의 고유한 (야생형) HA의 동시-발현; 레인 3: (2090+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-160+)의 존재 하에 B Massachusetts -2-12의 고유한 (야생형) HA의 동시-발현; 레인 4: (2072+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT)의 존재 하에 B Massachusetts -2-12의 돌연변이 (변형된) HA의 동시-발현; 레인 5: (2052+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+)의 존재 하에 B Massachusetts -2-12의 돌연변이 (변형된) HA의 동시-발현; 레인 6: (2050+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 B Massachusetts -2-12의 돌연변이 (변형된) HA의 동시-발현.
도 28E는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 H2 Sin 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (2220+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H2 Singapore -1-57의 고유한 (야생형) HA의 동시-발현; 레인 2: (2222+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H2 Singapore -1-57의 고유한 (야생형) HA의 동시-발현. 레인 3: (2221+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 H2 Singapore -1-57의 돌연변이 (변형된) HA의 동시-발현; 레인 4: (2223+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV 160+)의 존재 하에 H2 Singapore -1-57의 돌연변이 (변형된) HA의 동시-발현.
도 28F는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 B/Forida 단백질 발현의 웨스턴 블롯 분석을 나타낸다. 레인 1: (1004+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT)의 존재 하에 B/Florida의 고유한 (야생형) HA의 동시-발현; 레인 2: (1003+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT) 및 증폭 요소 BeYDV의 존재 하에 B/Florida의 고유한 (야생형) HA의 동시-발현. 레인 3: (2102+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV-HT+)의 존재 하에 B/Florida의 돌연변이 (변형된) HA의 동시-발현; 레인 4: (2104+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+) 및 증폭 요소 BeYDV의 존재 하에 B/Florida의 돌연변이 (변형된) HA의 동시-발현. 레인 5: (2106+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+)의 존재 하에 B/Florida+H1 California TMCT의 돌연변이 (변형된) HA의 동시-발현. 레인 6: (2108+1261) A/New Caledonia/20/99의 M2와 함께 발현 인핸서 (CPMV HT+) 및 증폭 요소 BeYDV의 존재 하에 B/Florida+H1 California TMCT의 돌연변이 (변형된) HA의 동시-발현.
도 29A는 인핸서 요소 CPMV HT, CPMV HT+또는 CPMV 160+의 존재 하에 발현되는 다양한 인플루엔자 균주의 변형된 HA의 상대적인 HA 역가를 나타낸다. 활성은 같은 인핸서 요소와 함께 발현된 고유한 HA 단백질과 비교된다. H3 A Perth/16/09 (H3 Per1609), H3 Victoria/361/11 (H3 Vic26111), B Brisbane 60/2008 (HB Bris60008), B Malaysia 2506/04 (HB Mal 250604) 및 B Massachusetts 2/12 (Ma212)가 인플루엔자 M2 단백질과 동시-발현되었다.
도 30A는 프라이머 IF-S2+S4-B Bris.c (서열 번호: 86)를 나타낸다. 도 30B는 프라이머 IF-S1a4-B Bris.r (서열 번호: 87)을 나타낸다. 도 30C는 합성된 HA B Brisbane 유전자의 뉴클레오타이드 서열 (Genbank 수납 번호 FJ766840의 nt 34-1791에 해당함) (서열 번호: 88)을 나타낸다. 도 30D는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1029의 뉴클레오타이드 서열을 나타낸다. 인플루엔자 B/Brisbane/60/2008의 PDISP/HA는 밑줄 그어져 있다. (서열 번호: 89). 도 30E는 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 아미노산 서열 (서열 번호: 90)을 나타낸다. 도 30F는 구조 1029의 개략도를 나타낸다. 플라스미드 선형화에 사용된 SacII 및 StuI 제한 효소 부위는 도면에 주석이 달린다.
도 31은 구조 번호 1039 및 1829 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (PrL-) NOS 및 2X35S/CPMV HT+PDISP/HA B Brisbane (PrL-) NOS; 실시예 5.12 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1039는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1829는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 31A는 PDISP/HA B Brisbane (PrL-)의 뉴클레오타이드 서열 (서열 번호: 91)을 나타낸다. 도 31B는 PDISP/HA B Brisbane (PrL-)의 아미노산 서열 (서열 번호: 92)을 나타낸다. 도 31C는 구조 번호 1829 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 32는 구조 번호 1039 및 1937 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (PrL-) NOS 및 2X35S/CPMV160+PDISP/HA B Brisbane (PrL-) NOS; 실시예 5.7 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1039는 선행 업계 CPV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1937은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열을 포함하며 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다) CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 32A는 구조 번호 1937 (2X35S/CPMV160+; CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 33은 구조 번호 1067 및 1977 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (Prl-)+H1 California TMCT NOS 및 2X35S/CPMV160+PDISP/HA B Brisbane (PrL-)+H1 California TMCT NOS; 실시예 5.14 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1067는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1977은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열을 포함하며 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다) CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 33A는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 95)을 나타낸다. 도 33B는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 96)을 나타낸다. 도 33C는 구조 번호 1067 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 33D는 구조 번호 1977 (2X35S/CPMV160+; CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 34는 구조 번호 2072 및 2050 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-) NOS 및 2X35S/CPMV160+PDISP/HA B Massachusetts (PrL-) NOS; 실시예 5.15 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2072는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2050은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 34A는 PDISP/HA B Massachusetts (PrL-)의 뉴클레오타이드 서열 (서열 번호: 97)을 나타낸다. 도 34B는 PDISP/HA B Massachusetts (PrL-)의 아미노산 서열 (서열 번호: 98)을 나타낸다. 도 34C는 구조 번호 2072 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 34D는 구조 번호 2050 (2X35S/CPMV160+; a CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 35는 구조 번호 2074 및 2060 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV160+PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS; 실시예 5.16 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2074는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2060은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 35A는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 99)을 나타낸다. 도 35B는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 100)을 나타낸다. 도 35C는 구조 번호 2074 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 35D는 구조 번호 2060 (2X35S/CPMV160+; a CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 36은 구조 번호 1445, 1820 및 1975 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-) NOS, 2X35S/CPMV160+HA B Wisconsin (PrL-) NOS 및 2X35S/CPMV160 HA B Wisconsin (PrL-) NOS; 실시예 15.17 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1445는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1820은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. 구조 번호 1975는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR를 포함하고, 스터퍼 단편 (다클로닝 부위), 또는 식물 코자크 서열 (이 구조는 또한 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하지 않으며 "CPMV160" (CPMVX) 기반 구조의 예이다. PrL-: 결실된 단백질 가수분해 루프; NOS: 노팔린 신타제 종결자. 도 36A는 HA B Wisconsin (PrL-)의 뉴클레오타이드 서열 (서열 번호: 101)을 나타낸다. 도 36B는 HA B Wisconsin (PrL-)의 아미노산 서열 (서열 번호: 102)을 나타낸다. 도 36C는 구조 번호 1445 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 36D는 구조 번호 1820 (2X35S/CPMV160+; a CPMVX+기반 구조)의 개략도를 나타낸다. 도 36E는 구조 번호 1975 (2X35S/CPMV160; a CPMVX 기반 구조, X=160이면)의 개략도를 나타낸다.
도 37은 구조 번호 1454 및 1893 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV160+HA B Wisconsin (PrL-)+H1 California TMCT NOS; 실시예 5.18 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1454는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1893은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 37A는 HA B Wisconsin (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 103)을 나타낸다. 도 37B는 PDISP/HA B Wisconsin (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 104)을 나타낸다. 도 37C는 구조 번호 1454 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다. 도 37D는 구조 번호 1893 (2X35S/CPMV160+; a CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 38은 구조 번호 1067 및 1875 (각각 2X35S/CPMV HT PDISP/HA B Brisbane (Prl-)+H1 California TMCT NOS 및 2X35S/CPMV HT+PDISP/HA B Brisbane (PrL-)+H1 California TMCT NOS; 실시예 5.19 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1067은 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1875는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 38A는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 105)을 나타낸다. 도 38B는 PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 106)을 나타낸다. 도 38C는 구조 번호 1875 (2X35S/CPMV160+)의 개략도를 나타낸다.
도 39는 구조 번호 2072 및 2052 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-) NOS 및 2X35S/CPMV HT+PDISP/HA B Massachusetts (PrL-) NOS; 실시예 5.20 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2072는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2052는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프. 도 39A는 PDISP/HA B Massachusetts (PrL-)의 뉴클레오타이드 서열 (서열 번호: 107)을 나타낸다. 도 39B는 PDISP/HA B Massachusetts (PrL-)의 아미노산 서열 (서열 번호: 108)을 나타낸다. 도 39C는 구조 번호 2052 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 40은 구조 번호 2074 및 2062 (각각 2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV HT+PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS; 실시예 5.21 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 2074는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 2062는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드; NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 40A는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 109)을 나타낸다. 도 40B는 PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 110)을 나타낸다. 도 40C는 구조 번호 2062 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 41은 구조 번호 1445 및 1839 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-) NOS, 및 2X35S/CPMV HT+HA B Wisconsin (PrL-) NOS; 실시예 5.22 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1445는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1839는 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 및 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. PrL-: 결실된 단백질 가수분해 루프; NOS: 노팔린 신타제 종결자. 도 41A는 HA B Wisconsin (PrL-)의 뉴클레오타이드 서열 (서열 번호: 111)을 나타낸다. 도 41B는 HA B Wisconsin (PrL-)의 아미노산 서열 (서열 번호: 112)을 나타낸다. 도 41C는 구조 번호 1839 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 42는 구조 번호 1454 및 1860 (각각 2X35S/CPMV HT HA B Wisconsin (PrL-)+H1 California TMCT NOS 및 2X35S/CPMV HT+HA B Wisconsin (PrL-)+H1 California TMCT NOS; 실시예 5.23 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1454는 선행 업계 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (HA B Wisconsin (PrL-)+H1 California TMCT) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 구조 번호 1860은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 불완전 M 단백질을 포함하는 스터퍼 단편, 다클로닝 부위, 식물 코자크 서열을 포함하며 CPMV HT+기반 구조의 예이다. NOS: 노팔린 신타제 종결자; PrL-: 결실된 단백질 가수분해 루프; TMCT: 막관통 도메인 세포질 꼬리. 도 42A는 HA B Wisconsin (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 (서열 번호: 113)을 나타낸다. 도 42B는 PDISP/HA B Wisconsin (PrL-)+H1 California TMCT의 아미노산 서열 (서열 번호: 114)을 나타낸다. 도 42C는 구조 번호 1893 (2X35S/CPMV HT+)의 개략도를 나타낸다.
도 43은 구조 번호 489 (2X35S/CPMV HT H5 Indonesia NOS 실시예 5.24 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 489는 CPMV-HT 서열 (불완전 M 단백질을 암호화하는 서열에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고 5'UTR 및 원하는 뉴클레오타이드 서열 (PDISP/H1 California) 사이에서 이종 기원 코자크 서열을 포함하지 않는다. 도 43A는 고유한 H5 Indonesia의 뉴클레오타이드 서열 (서열 번호: 115)을 나타낸다. 도 43B는 고유한 H5 Indonesia의 아미노산 서열 (서열 번호: 116)을 나타낸다. 도 43C는 구조 번호 489 (2X35S/CPMV HT; 참조 구조)의 개략도를 나타낸다.
도 44는 구조 번호 1800 (A-2X35S CPMV160+PDISP H3Victoria NOS; 실시예 5.25 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1800은 160개 뉴클레오타이드를 포함하는 CPMV 5'UTR, 스터퍼 단편 (다클로닝 부위), 및 식물 코자크 서열 (이 구조는 불완전 M 단백질을 암호화하는 서열을 포함하지 않는다)을 포함하며 CPMV160+(CPMVX+, X=160이면) 기반 구조의 예이다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드. NOS: 노팔린 신타제 종결자. 도 44A는 프라이머 서열 IF**(SacII)-PDI.s1+4c (서열 번호: 117)을 나타낸다. 도 44B는 프라이머 서열 IF-H3V36111.s1-4r (서열 번호: 118)을 나타낸다. 도 44C는 PDISP/H3 Victoria의 서열 (서열 번호: 119)을 나타낸다. 도 44D는 구조 2171의 개략도를 나타낸다 (플라스미드 선형화에 사용된 SacII 및 StuI 제한 효소 부위가 표시됨). 도 44E는 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 구조 2171 (밑줄 그어져 있음), 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트, H1 California 막관통 세포질 꼬리, 및 CPMV3'UTR을 가진 2X35S/CPMV160+/NOS (서열 번호: 120)를 나타낸다. 도 44F는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1800을 나타낸다. PDISP/H3 Victoria 뉴클레오타이드 서열은 밑줄 그어져 있다; 5'UTR은 볼드체로 나타난다; 식물 코자크 서열은 이중으로 밑줄 그어져 있다; 16개 염기쌍의 스터퍼 단편 (다클로닝 부위)은 5'UTR 및 식물 코자크 서열 (서열 번호: 121) 사이에 위치한다. 도 44G는 PDISP/H3 Victoria (서열 번호: 122)의 아미노산 서열을 나타낸다. 도 44H는 구조 번호 1800 (CPMVX+기반 구조, X=160이면)의 개략도를 나타낸다.
도 45는 구조 번호 1819 (2X35S CPMV-HT+PDISP H3Victoria NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 구조 번호 1819는 CPMV-HT+서열 (불완전 M 단백질을 암호화하는 스터퍼 단편, 다클로닝 부위에 융합된 위치 161에서 돌연변이된 시작 코돈을 가진 CMPV 5'UTR)을 통합하고, 다클로닝 부위 및 원하는 뉴클레오타이드 서열 (PDISP/H3 Victoria)) 사이에서 식물 코자크 서열을 포함한다. PDISP: 단백질 이황화 이소머라제 신호 펩타이드. NOS: 노팔린 신타제 종결자. 도 45A는 프라이머 서열 IF(SacII)-Kozac_PDI.c (서열 번호: 123)을 나타낸다. 도 45B는 프라이머 서열 IF-H3V36111.s1-4r (서열 번호: 124)을 나타낸다. 도 45C는 구조 2181의 개략도를 나타낸다. 도 45D는 구조 2181에 대한 서열을 나타낸다 (왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지, 밑줄 그어져 있음; 플라스토시아닌-P19-플라스토시아닌 침묵 억제자 발현 카세트가 있는 2X35S/CPMV-HT+/NOS; 서열 번호: 126). 도 45E는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 1819를 나타낸다. PDISP/H3 Victoria 뉴클레오타이드 서열은 밑줄 그어져 있다 (서열 번호: 127). 도 45F는 구조 1819의 개략도를 나타낸다.
도 46A는 고유한 H7 Hangzhou HA 및 M2와 동시-발현될 때 결실된 단백질 가수분해 루프를 가진, 변형된 H7 Hangzhou HA의 상대적인 헤마글루티닌화 활성을 나타낸다. 고유한 및 변형된 H7 Hangzhou HA (구조 #2142 및 2152, 실시예 5.33 및 5.34 참조)는 M2 (구조 #1261 실시예 5.1 참조)의 존재 하에 발현되었고 식물로부터 정제되었다. 도 46B는 고유한 H7 Hangzhou HA (construct #2142) 및 결실된 단백질 가수분해 루프를 가진 변형된 H7 Hangzhou HA (구조 #2152)의 단백질 수율을 나타낸다. 도 46C는 SDS-PAGE를 나타내는데, 레인 2는 단백질 가수분해 루프가 제거된, 정제된 변형된 H7 Hangzhou HA (구조 #2152)를 나타내고 레인 3은 정제된 고유한 H7 Hangzhou HA (구조 #2142)를 나타낸다. 각 레인에 대하여, 총 단백질 2μg이 겔에 로딩되었다. 단백질 프로파일의 순도는 두 구조에서 유사하다.
도 47A는 고유한 HA 단백질과 단백질 가수분해 루프가 GG 링커로 대체된 변형된 HA (prl-), 단백질 가수분해 루프가 TETQ 링커로 대체된 변형된 HA (TETQ) 및 단백질 가수분해 루프가 TETR 링커로 대체된 변형된 HA (TETR) 사이에서 트립신 저항성을 나타낸다. 고유한 (# 489), PRL- (# 928), TETQ (#766) 및 TETR (#676) H5 Indonesia HA VLP 구조가 정제되었다. 각 로트에 대하여, HA VLP의 두 개의 샘플은 pH 7.4에서 150μg/mL의 표적 농도로 버퍼 (100 mM Na/KPO4, 150 mM NaCl, 0.01% TWEEN 80)에서 재현탁되었다. 트립신은 하나의 재현탁된 샘플에 1: 100 단백질 비로 추가되었다. 샘플은 실온에서 30, 60 및 120분 동안 배양되었다. 30μL의 비-소화된 추출물 (대조군) 및 30μL의 소화된 추출물이 SDS-PAGE 겔에 로딩되었으며, 이것은 쿠마시 블루(Coomassie blue)로 염색되었다. 도 47B는 2회 투여 후 마우스에서 고유한 H5 VLP 및 그것의 돌연변이 대응물 (prl-, TETQ 및 TETR)의 면역원성 (HI 역가)을 나타낸다. 막대는 고유한 H5 VLP와 각 H5 돌연변이 LP의 상대적인 (%) HI 역가 비교를 나타낸다.
도 48은 구조 번호 2220 (2X35S/CPMV HT+/PDISP/H2 Singapore/NOS; 실시예 5.27 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 도 48A는 프라이머 IF**-H2S157.s1-6r의 뉴클레오타이드 서열 (서열 번호: 127)을 나타낸다. 도 48B는 PDISP/H2 Singapore의 뉴클레오타이드 서열 (서열 번호: 128)을 나타낸다. 도 48C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2220의 뉴클레오타이드 서열을 나타낸다. PDISP/H2 Singapore 뉴클레오타이드 서열은 밑줄 그어져 있다. 도 48D는 PDISP/H2 Singapore의 아미노산 서열을 나타낸다. 도 48E는 구조 번호 2220의 개략도를 나타낸다.
도 49는 구조 번호 2221 (2X35S/CPMV HT+/단백질 가수분해 루프가 결실된 PDISP/H2 Singapore/NOS; 실시예 5.28 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 도 49A는 프라이머 H2S157(Prl-).r의 뉴클레오타이드 서열 (서열 번호: 131)을 나타낸다. 도 49B는 프라이머 H2S157(Prl-).c의 뉴클레오타이드 서열 (서열 번호: 132)을 나타낸다. 도 49C는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2221의 뉴클레오타이드 서열을 나타낸다. PDISP/H2 Singapore 뉴클레오타이드 서열은 밑줄 그어져 있다 (서열 번호: 133). 도 49D는 결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore의 아미노산 서열 (서열 번호: 134)을 나타낸다. 도 49E는 구조 번호 2221의 개략도를 나타낸다.
도 50은 구조 번호 2222 (2X35S/CPMV 160+/PDISP/H2 Singapore) 및 2223 (2X35S/CPMV 160+/결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore/NOS) 실시예 5.29 참조)을 제조하는데 사용된 서열 구성요소를 나타낸다. 도 50A는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2222의 뉴클레오타이드 서열을 나타낸다. PDISP/H2 Singapore 뉴클레오타이드는 서열 밑줄 그어져 있다 (서열 번호: 135). 도 50B는 2X35S 프로모터에서 NOS 종결자까지의 발현 카세트 번호 2223의 뉴클레오타이드 서열을 나타낸다. 단백질 가수분해 루프 뉴클레오타이드 서열이 결실된 PDISP/H2 Singapore는 밑줄 그어져 있다 (서열 번호: 136). 도 50C는 구조 번호 2222의 개략도를, 도 50D는 구조 번호 2223의 개략도를 나타낸다.
도 51은 구조 번호 2219 (2X35S/CPMV HT+PDISP/H3 Perth) 및 2139 (2X35S/CPMV 160+/PDISP/H3 Perth; 실시예 5.30 참조)를 제조하는데 사용된 서열 구성요소를 나타낸다. 도 51A는 PDISP/H3 Perth의 뉴클레오타이드 서열 (서열 번호: 137)을 나타낸다. 도 51B는 프라이머 IF**-H3P1609.S1-6r의 뉴클레오타이드 서열 (서열 번호: 138)을 나타낸다. 도 51C는 PDISP/H3 Perth (서열 번호: 139)의 아미노산 서열을 나타낸다. 도 51D는 구조 번호 2219의 개략도를 나타낸다. 도 51E는 구조 번호 2139의 개략도를 나타낸다.
도 52는 구조 번호 2039 (2X35S/CPMV HT+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth) 및 2159 (2X35S/CPMV 160+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.31 참조. 도 52A는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth의 뉴클레오타이드 서열 (서열 번호: 140)을 나타낸다. 도 52B는 프라이머 H3P1609(Prl-)#2.r의 뉴클레오타이드 서열 (서열 번호: 141)을 나타낸다. 도 52C는 프라이머 H3P1609(Prl-)#2.c의 뉴클레오타이드 서열 (서열 번호: 142). 도 52D는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth의 아미노산 서열 (서열 번호: 143)을 나타낸다. 도 52E는 구조 번호 2039의 개략도를 나타낸다. 도 52F는 구조 번호 2159의 개략도를 나타낸다.
도 53은 구조 번호 2230 (2X35S/CPMV HT+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria ) 및 2250 (2X35S/CPMV 160+결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria )을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.32 참조. 도 53A는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria의 뉴클레오타이드 서열 (서열 번호: 144)을 나타낸다. 도 53B는 프라이머 H3V36111(Prl-).r의 뉴클레오타이드 서열 (서열 번호: 145)을 나타낸다. 도 53C는 프라이머 H3V36111(Prl-).c의 뉴클레오타이드 서열 (서열 번호: 146)을 나타낸다. 도 53D는 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria의 아미노산 서열 (서열 번호: 147)을 나타낸다. 도 53E는 구조 번호 2230의 개략도를 나타낸다. 도 53F는 구조 번호 2250의 개략도를 나타낸다.
도 54 구조 번호 2142 (2X35S/CPMV HT+/PDISP/H7 Hangzhou/NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.33 참조. 도 54A는 PDISP/H7 Hangzhou의 뉴클레오타이드 서열 (서열 번호: 148)을 나타낸다. 도 54B는 프라이머 IF*-H7H113.s1-6r의 뉴클레오타이드 서열 (서열 번호: 149)을 나타낸다. 도 54C는 PDISP/H7 Hangzhou의 아미노산 서열 (서열 번호: 150)을 나타낸다. 도 53D는 구조 번호 2142의 개략도를 나타낸다.
도 55는 구조 번호 2152 (2X35S/CPMV HT+/결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou/NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.34 참조. 도 55A는 결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou의 뉴클레오타이드 서열 (서열 번호: 151)을 나타낸다. 도 55B는 프라이머 H7H113(PrL-).r의 뉴클레오타이드 서열 (서열 번호: 152)을 나타낸다. 도 55C는 프라이머 H7H113(PrL-).c의 뉴클레오타이드 서열 (서열 번호: 153)을 나타낸다. 도 55D는 결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou의 아미노산 서열 (서열 번호: 154)을 나타낸다. 도 53E는 구조 번호 2152의 개략도를 나타낸다.
도 56은 구조 번호 2224 (2X35S/CPMV HT+PDISP/H9 Hong Kong) 및 2226 (2X35S/CPMV 160+PDISP/H9 Hong Kong)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.35 참조. 도 56A는 PDISP/H9 Hong Kong의 뉴클레오타이드 서열 (서열 번호: 155)을 나타낸다. 도 56B는 프라이머 IF**-H9HK107399.S1-6r의 뉴클레오타이드 서열 (서열 번호: 156)을 나타낸다. 도 56C는 PDISP/H9 Hong Kong의 아미노산 서열 (서열 번호: 157)을 나타낸다. 도 56D는 구조 번호 2224의 개략도를 나타낸다. 도 56E는 구조 번호 2226의 개략도를 나타낸다.
도 57은 구조 번호 2225 (2X35S/CPMV HT+결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong) 및 2227 (2X35S/CPMV 160+결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.36 참조. 도 57A는 결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong의 뉴클레오타이드 서열 (서열 번호: 158)을 나타낸다. 도 57B는 프라이머 H9HK107399(Prl-).r의 뉴클레오타이드 서열 (서열 번호: 159)을 나타낸다. 도 57C는 프라이머 H9HK107399(Prl-).c의 뉴클레오타이드 서열 (서열 번호: 160)을 나타낸다. 도 57D는 결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong의 아미노산 서열 (서열 번호: 161)을 나타낸다. 도 57E는 구조 번호 2225의 개략도를 나타낸다. 도 57F는 구조 번호 2227의 개략도를 나타낸다.
도 58은 구조 번호 2013 (2X35S/CPMV 160+/PDISP/HA B Malaysia/NOS)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.37 참조. 도 58A는 PDISP/HA B Malaysia의 뉴클레오타이드 서열 (서열 번호: 162)을 나타낸다. 도 58B는 프라이머 IF**-HBM250604.S1-6r의 뉴클레오타이드 서열 (서열 번호: 163)을 나타낸다. 도 58C는 PDISP/HA B Malaysia의 아미노산 서열 (서열 번호: 164)을 나타낸다. 도 58D는 구조 번호 2013의 개략도를 나타낸다.
도 59는 구조 번호 2014 (2X35S/CPMV 160+/결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia/NOS)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.38 참조. 도 59A는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia의 뉴클레오타이드 서열 (서열 번호: 165)을 나타낸다. 도 59B는 프라이머 HBM250604(PrL-).r의 뉴클레오타이드 서열 (서열 번호: 166)을 나타낸다. 도 59C는 프라이머 HBM250604(PrL-).c의 뉴클레오타이드 서열 (서열 번호: 167)을 나타낸다. 도 59D는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia의 아미노산 서열 (서열 번호: 168)을 나타낸다. 도 59E는 구조 번호 2014의 개략도를 나타낸다.
도 60은 구조 번호 2070 (2X35S/CPMV HT PDISP/HA B Massachusetts), 2080 (2X35S/CPMV HT+PDISP/HA B Massachusetts) 및 2090 (2X35S/CPMV 160+PDISP/HA B Massachusetts)을 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.39 참조. 도 60A는 PDISP/HA B Massachusetts의 뉴클레오타이드 서열 (서열 번호: 169)을 나타낸다. 도 60B는 PDISP/HA B Massachusetts의 아미노산 서열 (서열 번호: 170)을 나타낸다. 도 60C는 구조 번호 2070의 개략도를 나타낸다. 도 60D는 구조 번호 2080의 개략도를 나타낸다. 도 60E는 구조 번호 2090의 개략도를 나타낸다.
도 61은 구조 번호 2102 (2X35S/CPMV HT 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida) 및 2104 (2X35S/CPMV HT+/BeYDV/결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida)를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.40 참조. 도 61A는 프라이머 HBF406(PrL-).r의 뉴클레오타이드 서열 (서열 번호: 190)을 포함한다. 도 61B는 프라이머 HBF406(PrL-).c의 뉴클레오타이드 서열 (서열 번호: 191)을 포함한다. 도 61C는 프라이머 IF*-HBF406.s1-6r의 뉴클레오타이드 서열 (서열 번호: 192)을 나타낸다. 도 61D는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida의 뉴클레오타이드 서열을 나타낸다. 도 61E는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida의 아미노산 서열을 나타낸다. 도 61F는 발현 카세트 번호 2102의 뉴클레오타이드 서열을 나타낸다. 도 61G는 구조 번호 2102의 개략도를 나타낸다. 도 61H는 발현 카세트 번호 2104의 뉴클레오타이드 서열을 나타낸다. 도 61I는 구조 번호 2104의 개략도를 나타낸다.
도 62는 구조 번호 2106 (2X35S/CPMV HT+/결실된 단백질 가수분해 루프를 가진 PDISP/B Florida+H1 California TMCT/NOS) 및 2108 (2X35S/CPMV HT+/BeYDV/결실된 단백질 가수분해 루프를 가진 PDISP/B Florida+H1 California TMCT/NOS를 제조하는데 사용된 서열 구성요소를 나타낸다. 실시예 5.41 참조. 도 62A는 프라이머 IF-H1cTMCT.S1-4r의 뉴클레오타이드 서열 (서열 번호: 197)을 나타낸다. 도 62B는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida+H1Cal TMCT의 뉴클레오타이드 서열 (서열 번호: 198)을 나타낸다. 도 62C는 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida+H1Cal TMCT의 아미노산 서열을 나타낸다. 도 62D는 발현 카세트 번호 2106의 뉴클레오타이드 서열을 나타낸다. 도 62E는 구조 번호 2106의 개략도를 나타낸다. 도 62F는 발현 카세트 번호 2108의 뉴클레오타이드 서열을 나타낸다. 도 62G는 구조 번호 2108의 개략도를 나타낸다.
하기 기술은 바람직한 구체예의 것이다.
본 발명은 바이러스-유사 입자 (VLP) 및 식물에서 그것을 생산하고 VLP 수율, 축적 및 생산량을 증가시키는 방법에 관한 것이다.
본 발명은, 부분적으로, 식물, 또는 식물의 일부에서 바이러스 유사 입자 (VLP)를 생산하는 방법을 제공한다. 방법은 핵산을 식물 또는 식물의 일부로 도입하는 단계를 수반한다. 핵산은 식물에서 활성이고 인플루엔자 헤마글루티닌 (HA)을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 조절 영역을 포함한다. HA는 변형된 단백질 가수분해 루프 또는 분열 부위를 포함한다. 식물 또는 식물의 일부는 핵산의 발현을 허용하여, 이로 인해 VLP를 생산하는 조건 하에 배양된다. 원하면, 식물 또는 식물의 일부가 수득될 수도 있고 VLP가 정제될 수도 있다.
본 발명은 또한 이 방법에 의해 생산된 VLP를 제공한다. VLP는 식물로부터 유래된 하나 또는 하나 이상의 지질을 포함할 수도 있다.
VLP는 면역 반응을 유도하는 VLP의 유효량, 및 약학적으로 허용 가능한 담체를 포함하는 조성물을 제조하는데 사용될 수도 있다.
또한 본원에서는 변형된 헤마글루티닌이 제공되는데, 단백질 가수분해 루프 또는 분열 부위가 변형되어 있다.
본 발명은 또한 상기 기술된 핵산을 발현시킴으로써 생산된 VLP를 포함하는 식물을 제공한다. 식물은 대상체에서 인프룰엔자 바이러스 감염에 대한 면역력을 유도하는데 사용될 수도 있다. 식물은 또한 식품 보조제로서 혼합될 수도 있다.
본 발명의 VLP는 또한 상기 한정된 핵산을 포함하는 식물 또는 식물의 일부를 제공하고, 핵산의 발현을 허용하여, 이로 인해 VLP를 생산하는 조건 하에 식물 또는 식물의 일부를 배양함으로써 생산될 수도 있다. VLP는 식물로부터 유래된 하나 또는 하나 이상의 지질을 포함할 수도 있다. VLP는 면역 반응을 유도하는 VLP의 유효량, 및 약학적으로 허용 가능한 담체를 포함하는 조성물을 제조하는데 사용될 수도 있다. 본 발명은 또한 제1 및 제2 핵산을 발현시킴으로써 생산된 VLP를 포함하는 식물을 제공한다. 식물은 대상체에서 인플루엔자 바이러스 감염에 대한 면역력을 유도하는데 사용될 수도 있다. 식물은 또한 식품 보조제로서 혼합될 수도 있다.
본 발명의 VLP는 하나 이상의 변형된 인플루엔자 헤마글루티닌 (HA)을 포함할 수도 있다. 변형된 HA는 WO 2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/003235; WO 2011/03522 (이것들은 본원에 참고로 포함됨)에서 기술된 바와 같이 어떤 HA, 예를 들어, H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 또는 타입 B HA로부터 유래될 수도 있다.
본 발명은 인플루엔자 균주의 HA 서열을 포함하는 VLP를 포함하며, HA 서열은, 예를 들어, 본원에서 기술된 변형을 포함하는, 변형된 다염기 분열 부위를 포함한다.
HA 단백질
용어 "헤마글루티닌" 또는 "HA"는 본원에서 사용된 바와 같이 인플루엔자 바이러스 입자 외부에서 발견된 당단백질을 말한다. HA는 호모트라이머 막 타입 I 당단백질이며, 일반적으로 신호 펩타이드, HA1 도메인, 및 C-말단에서 막-스패닝(spanning) 앵커(anchor) 부위 및 작은 세포질 꼬리를 포함하는 HA2 도메인을 포함한다. HA를 암호화하는 뉴클레오타이드 서열은 잘 알려져 있고 이용 가능한데, 예를 들어, 생물방어 공중 보건 베이스(BioDefence Public Health base) (인플루엔자 바이러스; URL: biohealthbase.org 참조) 또는 미국 국립 생물공학 정보센터(National Center for Biotechnology Information) (URL: ncbi.nlm.nih.gov 참조)을 참고하면 되고, 이들 둘 다는 본원에서 참고로 포함된다. HA는 WO 2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/003235; WO 2011/03522에서 기술된 바와 같이 어떤 HA, 예를 들어, H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 또는 타입 B HA도 포함할 수 있고; 이것들은 본원에서 참고로 포함됨). 더 나아가, HA는 하나 이상의 신생 또는 새로 확인된 인플루엔자 바이러스로부터 분리된 헤마글루티닌의 서열을 기반으로 할 수도 있다. 본 발명은 또한 하나 또는 하나 이상의 인플루엔자 서브타입으로부터 얻어진 변형된 HA를 포함하는 VLP를 포함한다.
HA 모노머는 세 개의 기능적 도메인 - 줄기 도메인, 또는 줄기 도메인 다발 (SDC), 구형 머리 도메인, 또는 머리 도메인 다발 (HDC) 및 막관통 도메인 다발 (TDC)으로 세분화될 수도 있다. SDC 및 HDC는 통틀어 '엑토도메인'으로 불릴 수도 있다. Ha et al. 2002의 간행물 (EMBO J. 21: 865-875; 이것은 본원에 참고로 포함됨)은 여러 인플루엔자 서브타입에서 SDC 및 HDC의 다양한 서브도메인의 상대적인 배향을 설명하고, X선 결정학적 구조를 기반으로 한다.
HA 단백질은 약 75 kDa의 전구체 단백질 (HA0)로서 합성되며, 이것은 표면에서 긴 트라이머 단백질로 조립된다. 전구체 단백질은 보존된 활성화 분열 부위에서 이황화 결합에 의해 결합된 2개의 폴리펩타이드 사슬, HA1 및 HA2 (막관통 영역 포함)로 분열된다. 도 15는 여러 HA에 대한 링커 영역의 아미노산 서열의 비제한 예를 제공한다.
용어 "호모트라이머" 또는 "호모트라이머성"은 올리고머가 세 개의 HA 단백질 분자에 의해 형성된다는 것을 나타낸다. 어떤 이론에도 결부되지 않으면서, HA 단백질은 약 75 kDa의 모노머 전구체 단백질 (HAO)로서 합성되며, 이것은 표면에서 긴 트라이머 단백질로 조립된다. 트라이머가 발생하기 전에, 전구체 단백질은 보존된 활성화 분열 부위 (융합 펩타이드로도 불림)에서 이황화 결합에 의해 결합된 2개의 폴리펩타이드 사슬, HA1 및 HA2 (막관통 영역 포함)로 분열된다. HA1 세그먼트는 길이가 328개의 아미노산일 수도 있고, HA2 세그먼트는 길이가 221개의 아미노산일 수도 있다.
이 분열은 바이러스 감염성에 중요할 수도 있지만, 단백질의 트라이머화 또는 면역원성에 필수적인 것은 아닐 수도 있다. 숙주 세포의 소포체 (ER) 막 내 HA 삽입, 신호 펩타이드 분열 및 단백질 글리코실화는 동시-번역 이벤트이다. HA의 올바른 리폴딩(refolding)은 단백질의 글리코실화 및 5-6개의 사슬 내 이황화 결합의 형성을 필요로 한다. HA 트라이머는 씨스- 및 트랜스-골지 복합체, 트라이머화 공정에서 역할을 하는 막관통 도메인 내에서 조립된다. 브로멜라인-처리된 HA 단백질의 결정 구조는, 막관통 도메인이 없으며, 인플루엔자 균주 사이에서 고도로 보존된 구조를 나타내고 있다. 또한 HA가 감염 과정 중에 주요 형태 변화를 거친다는 것이 확립되었으며, 이것은 전구체 HAO이 2개의 폴리펩타이드 사슬 HA1 및 HA2로 분열되는 것을 필요로 한다. HA 단백질은 가공될 수도 있거나 (즉, HA1 및 HA2 도메인을 포함), 또는 가공되지 않을 수도 있다 (즉, HAO 도메인을 포함). HA의 가공되지 않은 전구체 단백질은 약 75 kDa의 전구체 단백질 (HAO)로서 합성되며, 이것은 표면에서 긴 트라이머 단백질로 조립된다. 전구체 단백질은 보존된 분열 부위 (단백질 가수분해 루프로도 알려져 있음)에서 이황화 결합에 의해 결합된 2개의 폴리펩타이드 사슬, HA1 및 HA2 (막관통 영역 포함)로 분열된다.
HA 단백질은 본원에서 기술된 바와 같이 추가로 변형된 HA ("돌연변이 HA"로도 불림) 단백질, 예를 들어, 변형된 전구체 단백질 (HAO)일 수도 있으며, 이것에서 단백질 가수분해 루프 또는 분열 부위가 변형된다.
변형된 HA/분열 부위
HA0의 분열 후에, HA는 H에 민감해지고, 엔도솜의 pH (<pH 6.0)에서 비가역적 형태 변화를 거친다. 전구체 HAO의 형태는 낮은 pH에서 안정하지만, 분열된 HA1-HA2 형태는 준안전적이다 (Bullough PA et. al., 1994, Nature. Vol 371: 37-43). 다른 HA의 형태 변화를 유도하는 pH 한계점은 B 균주에 대해서는 대략 pH 5.8-5.9인 반면에, 타입 A HA에 대해서는 더 산성인, pH 5.1 내지 5.8이다 (Beyer WEP et al, 1986, Archives Virol, vol 90: 173). 분열 후에, HA2의 아미노 말단은 이어서 숙주 세포 막에 걸쳐 스프레이닝하는(spraining) 막관통 도메인이 되는 23개 아미노산의 비극성 서열 (융합 펩타이드로 불림; 도 15)이다. HA의 분열 부위는 HA의 표면에서 돌출된 루프 상에 위치하고, 이 부위는 프로테아제에 의해 접근 가능하다.
난세포에서 백신읫 ODTKS을 최적화하고 활성이지만 약독화된 바이러스를 유지하기 위해, H5의 다염기 분열 부위의 변형 (RERRRKKR↓G)이 연구되어 왔다 (Horimoto T, et. al, 2006, Vaccine, Vol 24: 3669-3676). 원하는 돌연변이는 처음 4개의 하전된 아미노산 (PvEPvPv)의 결실 및 다염기 분열 부위를 비활성화시키는, 아미노산 RKKR의 TETR로의 대체를 함유했지만 TETR 모티프의 아르기닌 잔기를 통해 HAO를 HA1-HA2로 가공할 가능성을 유지한다 (도 19 참조). 약독화된 바이러스를 생산하기 위한 유사한 전략이 난세포를 죽이지 않고 고수율로 A/Turkey/Turkey/1/2005 H5N1 균주의 생산을 허용하는 다염기 부위를 폐지하기 위해 NIBSC에 의해 이용되었다. 다염기 부위 서열 (GERRRKKR↓G)은 그것들의 돌연변이 (NIBSC 05/240 NIBSC 인플루엔자 참조 바이러스 NIBG-23)에서 RETR에 의해 대체된다. H5 HA의 다염기 분열 부위는 또한 난세포에서 발현되는 H6의 일염기 부위에 의해 대체되었다. 이 예에서, 다염기 부위의 처음 4개의 잔기 및 마지막 4개의 아미노산은 IETR에 의해 대체된다 (RERRRKKR↓G의 IETR↓G로의 대체; Hoffman E, et. al., 2002, Vaccine, Vol 20: 3165-3170). 상기 제공된 예 각각에서, 변형은 난세포 내에서 바이러스를 약독화하는 한편 HA의 생산량을 유지하기 위해 수행되었다. 즉, HAO 전구체의 분열은 HA0이 HA1-HA2으로 가공되게 하고 pH 형태 변화를 거쳐서, 숙주 세포에서 바이러스 복제를 허용하기 위해 완전히 비활성화되지 않았다.
본원에서 사용된 바와 같이, 용어 "변형된 헤마글루티닌" 또는 "변형된 HA", "돌연변이된 헤마글루티닌" 또는 "돌연변이된 HA"는 HA가 HA 단백질의 단백질 가수분해 루프 또는 분열 부위에서 변경된 아미노산 서열을 발생시키는, 변형 또는 돌연변이, 예를 들어, 치환, 삽입, 결실, 또는 이것들의 조합을 가진 HA를 말한다.
A/Hong Kong/68의 HA0의 결정 구조가 결정되었다 (Chen, J., 1998. Cell 95: 409-417; 본원에 참고로 포함됨). 용제에 노출된 잔기는 일반적으로 연장된, 고도로 노출된 표면 루프를 형성하는 분열 부위의 일부인 것으로 생각된다. 공통 서열은 이 선택된 영역, 예를 들어, 제한되는 것은 아니지만, 다음에서 결정될 수도 있다:
A/H3/HA0 공통: NVPEKQTR/GIFGAIAGFIE (서열 번호: 66)
A/H1/HAO 공통: NIPSIQSR/GLFGAIAGFIE (서열 번호: 67)
조류 H5 공통 QRESRRKKR/GLFGAIAGFIEG (서열 번호: 1)
B/HA0 공통: PAKLLKER/GFFGAIAGFLE (서열 번호: 68)
여기에서 HA1 및 HA2 사이의 분열은 "/" (Bianchi et al., 2005, Journal of Virology, 79: 7380-7388 참조; 본원에서 참고로 포함됨), 및 또한 도 15 및 18a에 의해 표시된다.
HA 단백질은 단백질 가수분해 루프 영역에서 변형, 예를 들어, 단백질 가수분해 루프 (분열 부위)의 결실, 삽입, 치환 또는 이것들의 조합을 가진 인플루엔자 타입 B 헤마글루티닌 또는 인플루엔자 타입 A 헤마글루티닌 단백질일 수도 있다. 어떤 이론에도 결부되지 않으면서, 단백질 가수분해 루프의 변형은 HA 분자가 HA0 전구체로서 유지된다는 것을 보장할 수도 있다. 이로 인해 HA0 단백질을 포함하는 더 균질하고 일정한 VLP를 생산한다.
"단백질 가수분해 루프" 또는 "분열 부위"는 전구체 HA0 분열에 수반된 단백질 가수분해 부위의 공통 서열을 의미한다. "공통" 또는 "공통 서열"은 본원에서 사용된 바와 같이 다수의 서열, 예를 들어, 특정 인플루엔자 HAO 서열의 서브타입의 정렬의 분석에 기초하여 관련된 서열의 서열 가변성을 포함하는 서열 (아미노산 또는 뉴클레오타이드 서열)을 의미한다. 인플루엔자 HAO 분열 부위의 공통 서열은, 예를 들어, 공통 H1, 공통 H3, 공통 H5, 또는 인플루엔자 B 공통 헤마글루티닌 아미노산 서열, 예를 들어, 제한되는 것은 아니지만, B Florida 및 B Malaysia을 포함하는 인플루엔자 A 공통 헤마글루티닌 아미노산 서열을 포함할 수도 있다. 단백질 가수분해 루프 영역의 서열의 비제한 예는 도 15 및 18B에서 나타난다 (및 Bianchi et al., 2005, Journal of Virology, 79: 7380-7388; 본원에서 참고로 포함됨).
단백질 가수분해 루프 또는 분열 부위에서 잔기는 돌연변이, 예를 들어, 제한되는 것은 아니지만, 점 돌연변이, 치환, 삽입, 또는 결실될 수도 있다. 용어 "아미노산 돌연변이" 또는 "아미노산 변형"은 본원에서 사용된 바와 같이 아미노산 치환, 결실, 삽입, 및 변형을 포함하는 것을 의미한다. 치환, 결실, 삽입의 어떤 조합, 및 변형은, 최종 구조가 원하는 특성, 예를 들어, 프로테아제에 의한 단백질 가수분해 루프 또는 분열 부위의 감소된 또는 폐지된 분열을 가지고 있으면, 최종 구조에 도달하기 위해 이루어질 수 있다.
"변형된 단백질 가수분해 루프"는 단백질 가수분해 루프가 하나 이상의 점 돌연변이를 포함하고, 부분적으로 결실되고, 링커 서열로 부분적으로 대체되고, 링커 서열로 완전히 대체되고, 분열 부위 내 아미노산의 하나 이상의 비-단백질 아미노산, 또는 이것들의 조합으로의 부분적인 또는 완전한 대체를 포함할 수도 있다는 것을 의미한다. 유사하게, "변형된 분열 부위"는 단백질 가수분해 루프 내 분열 부위가 하나 이상의 점 돌연변이를 포함하고, 링커 서열이 부분적으로 결실되고, 링커 서열이 완전히 결실되고, 링커 서열로 부분적으로 대체되고, 링커 서열로 완전히 대체되고, 분열 부위 내 아미노산의 하나 이상의 비-단백질 아미노산, 또는 이것들의 조합으로의 부분적인 또는 완전한 대체를 포함할 수도 있다는 것을 의미한다. 단백질 가수분해 루프, 분열 부위, 또는 둘 다에 대한 변형은 단백질 가수분해 루프 또는 분열 부위 서열 외부에, 또는 인접하게 위치한 하나 이상의 아미노산의 결실, 대체, 또는 치환을 수반할 수도 있다. "링커"는 단백질 가수분해 루프 또는 분열 부위 내로 도입될 수도 있거나, 또는 일부 또는 모든 아미노산을 단백질 가수분해 루프 또는 분열 부위로 대체할 수도 있는 하나 이상의 아미노산을 포함하는 아미노산 서열을 의미한다. 링커는 단백질 가수분해 루프 또는 분열 부위 내 어떤 아미노산 결실도 변형된 HA의 발현 또는 이후의 활성을 방해하지 않는다는 것을 보장하도록 설계될 수도 있다.
단백질 가수분해 루프의 변형 또는 결실에 의해 HA 단백질을 안정화시킴으로써, 식물에서 변형된 HA가 발현될 때, 같은 조건 하에 식물에서 발현된 고유한 HA와 비교하여, 증가된 생성물 또는 단백질 수율이 달성될 수도 있다. 더 나아가, 단백질 가수분해 루프를 변형시키거나 결실시킴으로써, 같은 조건 하에 식물에서 발현된 고유한 HA와 비교하여, 발현된 변형된 HADML 발현의 가변성이 감소되고 생산된 변형된 HA의 일관성이 증가된다.
그러므로, 본 발명은 또한 식물에서 HA 단백질의 생산 수율을 증가시키는 방법을 포함한다. 어떤 이론에도 결부되지 않으면서, HA 단백질에서 단백질 가수분해 루프를 변형시키거나 결실시킴으로써 식물에서 단백질 가수분해에 의한 분해에 대하여 개선된 안정성, 골지체 분비 공정에서 HA의 통과 중, 및 정제 공정 중 안정화가 제공된다고 생각된다.
더 나아가, 본 발명은 또한 식물에서 발현된 HA 단백질의 생성물 품질을 증가시키는 방법을 포함한다. 생성물 품질은 예를 들어, 식물에서 발현된 HA의 증가된 생산 수율, 생성물의 안정성, 예를 들어, 식물에서 발현된 HA의 증가된 안정성, 생성물의 일관성, 예를 들어, 균질한 생성물, 예를 들어, HA0 또는 이것의 조합의 생산을 의미한다.
생성물 또는 단백질 수율의 증가는 제거된 단백질 가수분해 루프를 갖지 않는 같은 HA 단백질의 생성물 또는 단백질 수율과 비교하여, 약 20% 내지 약 100%, 또는 업계의 표준 기술을 사용하여 결정된 그 사이의 어떤 양, 예를 들어, 약 40% 내지 약 70% 또는 그 사이의 어떤 값, 예를 들어, 약 20, 22, 24, 25, 26, 28, 30, 32, 34, 35, 36, 38, 40, 42, 44, 45, 46, 48, 50, 52, 54, 55, 56, 58, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100%, 또는 그 사이의 어떤 값만큼 상대적 단백질 수율의 증가를 의미한다.
도 13A 및 14에서 나타난 바와 같이, B/Brisbane/60/2008의 HA는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 불량하게 발현된다 (레인 1008 참조). 하지만, 단백질 가수분해 루프를 제거하도록 변형된 HA 타입 B의 발현 (레인 1059, 도 13A, 도 14 참조)은 증가된 발현을 초래하였다 (레인"1008+1261"; 및 "1059+1261" 참조). A/Puerto Rico/8/34의 M2읠 I와 함께 단백질, 가수분해 루프에서 결실을 포함하는 HA 타입 B의 동시-발현은 또한 증가된 발현 (1059+859; 도 14)을 초래한다.
도 46B에서 더 나타난 바와 같이, 아그로필트레이션된 니코티아나 벤타미아 나에서 발현된 H7 A/Hangzhou/1/13의 HA 단백질의 단백질 수율은 단백질 가수분해 루프를 결실시키거나변형시키도록 변형된 HA에서 증가된다. H7 A/Hangzhou/1/13 A/New Caledonia/20/99의 M2와 함께 고유한 (야생형) HA의 동시-발현은 100% 상대적 단백질 수율로 이어지는 반면에, A/New Caledonia/20/99의 M2와 함께, 단백질 가수분해 루프에서 결실을 포함하는 HA H7 A/Hangzhou/1/13의 동시-발현은 182% 상대적 단백질 수율로 이어진다 (도 46B). 하지만, 단백질 가수분해 루프에서 결실을 포함하는 HA의 상대적 단백질 수율의 증가는 M2에 의존적이지 않다. 예를 들어, 도 29A에서 나타난 바와 같이, 단백질 가수분해 루프에서 결실을 포함하는 H7 A/Hangzhou/1/13은 고유한 H7 A/Hangzhou/1/13과 비교하여 증가된 발현 (상대적 HA 역가에 의해 측정됨)을 나타냈다.
여러 전략이 A 및 B 균주 둘 다에 대한 HA0의 분열을 비활성화시키기 위해 평가되었다. 프로테아제에 의해 인식된 공통 서열은 연장된 루프 상에서 둘러싸여 있고, 용매에 노출되고, 단백질에 대한 막 원위부에 대하여 폐쇄된다. B 균주에서, 이 루프는 프로테아제에 의해 인식된 2개의 서열 모티프 및 HA2 도메인의 처음 N-말단 아미노산을 함유한다. HA0 전구체의 분열을 비활성화시키기 위한 점 돌연변이 접근법 (예를 들어, 하기 표 2 참조)은 B 균주 VLP의 축적의 증가 없이, HA0 생산을 초래하였다. 2개 프로테아제 분열 모티프 (7개 아미노산)를 포함하는 서열 모티프의 결실은 B HA의 축적을 폐지한다. B 균주의 HA 단백질로부터 전체 18-아미노산 루프의 제거 및 단백질 구조의 구조적 특징 (베타 가닥)을 보존하기 위한 링커의 삽입은 효과적이었다 (하기 참조; 도 13A, 14, 16A, 17B). A 균주의 HA 단백질에서 단백질 가수분해 루프의 제거 또는 대체가 또한 효과적이었다 (도 20, 22 참조).
아미노산 서열 결실 및 삽입은 아미노산 결실 및 아미노산의 삽입을 포함한다. 인플루엔자 B에서 결실의 비제한 예는 인플루엔자 B Florida 및 B Malaysia에 대하여, 예를 들어, 도 18C에서 나타난 바와 같이, 성숙한 HA 단백질의 위치 340 내지 357의 17개 아미노산 (AKLLKERGFFGAIAGFLE)의 결실이다. 이 결실은, 예를 들어, 제한되는 것은 아니지만, 서열 "GG"를 사용하여, 적절한 발현을 위한 폴리펩타이드 사슬에 결합하도록 적절한 링커에 의해 대체될 수도 있으며, 도 21B에서 나타난 바와 같다 (서열 번호: 17; 변형된 B/Brisbane/60/2008; AKLLKERGFFGAIAGFLEG를 GG로 대체; 예를 들어, 구조 1059, 도 5D, 10; 구조 1039, 도 8B, 또는 구조 1467; 도 7D, 7E). 대안의 대체는 "PPAKLLKER"을 "GSSSGSSSG"로 대체하는 것을 포함하며, 도 21C에서 나타난 바와 같다 (서열 번호: 18). 더 나아가, 서열 "RESRRKKR"은 "TETR" 또는 "TETQ"로 대체될 수도 있으며, 인플루엔자 H5/Indonesia에 대하여 도 19에서 나타난 바와 같다.
A 균주의 HA에 대한 대체 아미노산 돌연변이는 아미노산 치환, 삽입 및 결실, 예를 들어, 제한되는 것은 아니지만, 아미노산 서열 "RERRRKRGLFGAIAGFIE"의 H5 Anhui의 단백질 가수분해 루프 영역에서 결실, "RESRRKKRGLFGAIAGFIE"를 포함하는 H5 Indo의 단백질 가수분해 루프 영역의 아미노산 서열의 결실 또는 H5 Vietnam "RERRRKKRGLFGAIAGFIE"의 단백질 가수분해 루프의 아미노산의 결실을 포함한다. H3에 대하여, 서열 "RNVPEKQTRGIF"은 결실되고 적절한 링커 서열, 예를 들어, 제한되는 것은 아니지만, 도 21E에서 나타난 "GS" (서열 번호: 20)에 의해 대체될 수도 있다. 대안으로, H3에서 서열 "RNVPEKQTR"은 도 21F에서 나타난 "GSSGSSGSS" (서열 번호: 21; 변형된 H3 A/Perth/16/2009)에 의해 대체될 수도 있다.
더 나아가, 프로테아제에 의한 단백질 가수분해 루프 또는 분열 부위의 분열을 감소시키거나 폐지하기 위해 HADM1 단백질 가수분해 루프 또는 분열 부위의 변형 또는 변화는 또한 비-보존적 아미노산 치환, 즉, 하나의 아미노산의 다른 구조적 및/또는 화학적 특성을 가진 또 다른 아미노산으로의 대체를 포함할 수도 있다. 비-단백질 아미노산은 또한 치환에 사용될 수도 있다, 예를 들어, 아미노산 치환은 소수성 아미노산의 친수성 아미노산으로의 대체를 포함할 수도 있다. 아미노산 치환은 비-자연 발생한 아미노산 또는 단백질 아미노산의 자연 발생한 아미노산 유도체에 의한 대체를 포함할 수도 있다.
B 균주 및/또는 A 균주의 HA에 대한 아미노산 돌연변이는 아미노산 결실을 포함할 수도 있다. 예를 들어, 프로테아제에 의한 단백질 가수분해 루프 또는 분열 부위의 분열을 감소시키거나 폐지하기 위해서, 하나 이상의 아미노산은 단백질 가수분해 루프 또는 분열 부위 서열 내 결실 또는 제거이다. 결실은 비제한 예는 고유한 HA H5 단백질의 아미노산 323 내지 341, 예를 들어, H5 Anhui (RERRRKRGLFGAIAGFIE), H5 Indo (RESRRKKRGLFGAIAGFIE), 또는 H5 Vietnam (RERRRKKRGLFGAIAGFIE)의 제거를 포함하며, 도 18C에서 나타난 바와 같다. H3에 대하여, 서열 "RNVPEKQTRGIF"는 "GS" (도 21E; 서열 번호: 20)에 의해 대체될 수도 있거나, 또는 H3 서열 "RNVPEKQTR"은 "GSSGSSGSS" (도 21F; 서열 번호: 21)에 의해 대체될 수도 있다. B 균주에 대하여, 서열 "AKLLKERGFFGAIAGFLE"는 결실되고 및/또는 도 21B에서 나타난 바와 같이 (서열 번호: 17), 서열 "GG"에 의해 대체될 수도 있거나, 서열 "AKLLKERGFFGAIAGFLEG"는 "GG"로 대체될 수도 있거나, 또는 서열 "PPAKLLKER"은 "GSSSGSSSG" (도 21 C; 서열 번호: 18)로 대체될 수도 있다.
아미노산 돌연변이는 업계에 알려져 있는 유전학적 또는 화학적 방법을 사용하여 발생될 수 있다. 유전학적 방법은 부위-관련 돌연변이 돌연변이 생성, PCR, 유전자 합성 등을 포함할 수도 있다. 유전학적 조직 외에 방법, 예를 들어, 화학적 변형에 의해 아미노산의 측쇄 기를 변형시키는 방법이 또한 유용할 수도 있다고 고려된다.
그러므로 본 발명의 헤마글루티닌 (HA) 서열은 변형된 단백질 가수분해 루프 서열 또는 분열 부위를 포함하여, 이로 인해 프로테아제에 의한 단백질 가수분해 루프 또는 분열 부위의 분열을 감소시키거나 폐지할 수도 있다. 헤마글루티닌 폴리펩타이드 서열은, 예를 들어, 도 5D, 7D, 8A, 18C, 19, 21B, 21C, 21E, 21F, 24D, 25D, 및 26D에서 제시된 바와 같은 변형된 단백질 가수분해 루프 또는 변형된 분열 부위 서열을 포함할 수도 있다. 어떤 인플루엔자 균주의 어떤 헤마글루티닌 폴리펩타이드 서열의 분열 부위도 서열 정렬을 포함하는, 업계에 알려져 있는 많은 방법을 사용하여 결정되거나 예측될 수 있다 (예를 들어, 도 15 참조).
H1, H3 및 B HA의 서열의 분석은 H1이 융합 펩타이드의 바로 앞에 있는 하나의 일염기 단백질 가수분해 부위 (클라라 타입 일염기: Q/EXR)를 가지고 있는 반면에, H3 및 B HA는 2개의 단백질 가수분해 부위를 가지며, 하나는 클라라-유사 프로테아제 (H1에서 발견됨)에 의해 인식되고, 또 다른 부위는 트립신 및 키모트립신-유사 프로테아제 (P-E/A-K)에 의해 인식된다는 것을 나타낸다. 이 HA 들의 분열을 위한 공통 서열은 표 1에서 나타난다.
H1 | NIPSI QSR ↓GLF | 서열 번호: 47 |
H3 | NVPEK QTR ↓GIF | 서열 번호: 48 |
H5 | TGLRNSPQRESRRKKR↓GLF | 서열 번호: 60 |
B | PAKLL KER ↓GFF | 서열 번호: 59 |
HA의 HA0 전구체의 잠재적 단백질 가수분해 분열을 방지하기 위해, 단 하나의 단백질 가수분해 부위가 H1의 서열로부터 변형되는 것이 필요할 수도 있는 반면에, H3 및 B의 경우에는, 두 개의 일염기 부위가 변형되는 것이 필요할 수도 있다.
예를 들어, B/Florida 및 B/Brisbane의 HA0의 제1 분열 부위는, 예를 들어, Lys 341 (성숙한 단백질 넘버링(numbering))을 Ile로 대체함으로써 제거될 수도 있다 (표 2 참조). 제2 일염기 부위는 융합 펩타이드, KER (344-346) 전 3개의 아미노산을 NIQ로 대체함으로써 폐지될 수도 있다. HA의 여러 변형된 단백질 가수분해 루프의 서열이 표 2에서 제공된다.
균주 | 자연적 서열 | 전구체 분열 부위의 폐지 |
H5/Indo | TGLRNSPQ RESRRKKR ↓GLF 서열 번호: 60 |
TGLRNSPQ TETR GLF 서열 번호: 61 TGLRNSPQ TETQ GLF 서열 번호: 62 |
H1/Brisbane | NIPSIQSR↓GLF 서열 번호: 47 |
NIPSIQS Q GLF 서열 번호: 63 |
H3/Brisbane | NVPEK QTR↓GIF 서열 번호: 48 |
NVPE I QT Q GIF 서열 번호: 64 |
B/Florida, B/Brisbane |
PAKLLKER↓GFF 서열 번호: 59 |
PA I LL NIQ GFF 서열 번호: 65 |
추가의 예에서, HA0에서 단백질 가수분해 루프를 포함하는 서열은 대체되거나 결실될 수도 있다. 예를 들어, HA1의 C-말단에서 서열 RNVPEKQT의 결실, 이에 더하여 HA2의 N-말단 아미노산 GIFGIA의 결실의 결실을 함유하는 H3 변종이 도 21E에서 제공된다. 짧아진 HA1-HA2는 GS 링커에 의해 결합될 수도 있다.
또 다른 예에서, 루프는, 예를 들어, H3에서 단백질 가수분해 분열 부위를 함유하는데, 유연한 링커에 의해 대체될 수도 있고, HA2 일부는 온전하게 남아있을 수도 있다. (GSS)3 링커는 짧아진 HA1 내지 HA2를 수용하기 위해서 설계될 수도 있다. (도 21F 참조).
또 다른 예에서, 인플루엔자 B의 HA는 HA1의 C-말단에서 서열 ALKLLKER의 결실, 이에 더하여 HA2의 N-말단 아미노산 GFFGAIAGFLEG의 결실을 함유할 수도 있다. 짧아진 HA1-HA2는 GG 링커에 의해 결합될 수도 있다 (예를 들어, 도 21B 참조; 구조 1008). 이 구조의 발현은 도 13A 및 B에서 나타난다.
또 다른 예, 인플루엔자 B의 HA에서, 단백질 가수분해 부위를 함유하는 루프는 유연한 링커에 의해 대체될 수도 있고, HA2는 온전하게 남아있다. 더 긴 GSSS 링커는 짧아진 HA1 내지 H2를 수용하기 위해 설계될 수도 있다 (예를 들어, 도 21 C 참조).
도 13A 및 14에서 나타난 바와 같이, B/Brisbane/60/2008의 HA는 아그로필트레이션된 니코티아나 벤타미아나 잎에서 불량하게 발현된다 (레인 1008). 하지만, 단백질 가수분해 루프를 결실시키도록 변형된 HA 타입 B의 발현 (레인 1059, 도 13A, 도 14 참조)은 증가된 발현을 초래하였다.
더 나아가, A/New Caledonia/20/99의 M2와 함께, HA-타입 B의 동시-발현은 HA 발현의 증가를 초래한다 (레인 "1008+1261"; 및 "1059+1261" 참조). A/Puerto Rico/8/34의 M2와 함께, 단백질 가수분해 루프에서 결실을 포함하는 HA 타입 B의 동시-발현은 또한 증가된 발현을 초래하였다 (1059+859; 도 14).
유사한 방식으로, H5/Indo에서 단백질 가수분해 루프의 결실, 및 "GG" (구조 928; 도 46D 참조), "TETR" (구조 676; 또한 도 19, 24D 참조) 또는 "TETQ" (구조 766; 또한 도 19, 25D 참조) 서열로의 대체는 고유한 H5/Indo로 관찰된 발현의 수준과 일치하거나 이보다 증가된 발현 수준을 초래하였다 (구조 489; 도 20 및 23 참조).
도 13B에서 나타난 바와 같이, HA0의 단백질 가수분해 루프 (도 21B에서 나타난 서열)를 결실시킴으로써, 결과의 HA0 단백질은 그것의 제거된 단백질 가수분해 루프를 갖고 있지 않은 HA 단백질과 비교하여, 더 높은 헤마글루티닌화 수용량에 의해 나타난 바와 같이 증가된 활성을 나타낸다.
활성의 증가는 그것의 제거된 단백질 가수분해 루프를 갖고 있지 않은 같은 HA 단배질의 활성과 비교하여, 약 2% 내지 약 100%, 또는 업계의 표준 기술을 사용하여 결정된 그 사이의 어떤 값, 예를 들어, 약 10% 내지 약 50% 또는 그 사이의 어떤 값, 예를 들어, 약 2, 5, 8, 10, 12, 15, 18, 20, 22, 24, 25, 26, 28, 30, 32, 34, 35, 36, 38, 40, 42, 44, 45, 46, 48, 50, 52, 54, 55, 56, 58, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100%, 또는 그 사이의 어떤 값만큼 헤마글루티닌화 수용량의 증가를 의미한다.
본 발명은 또한, 예를 들어, 변형된 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 또는 타입 B HA로부터 변형된 HA를 암호화하는 뉴클레오타이드 서열, 또는 엄중 조건 하에 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 또는 타입 B HA에 잡종화하는 어떤 뉴클레오타이드 서열, 또는 엄중 잡종화 조건 하에 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H1 1, H12, H13, H14, H15, H16 또는 타입 B HA의 보체에 잡종화하는 뉴클레오타이드 서열을 포함하며, 뉴클레오타이드 서열은 발현될 때 VLP를 형성하고, VLP는 항체의 생산을 유도하는 헤마글루티닌 단백질을 암호화한다. 예를 들어, 식물 세포 내에서 뉴클레오타이드 서열의 발현은 VLP를 형성하고, VLP는 B 또는 H3의 성숙한 HA를 포함하는, HA에 결합할 수 있는 항체를 생산하는데 사용될 수도 있다. VLP는, 대상체에 투여될 때, 면역 반응을 유도한다. 바람직하게, VLP는 항체의 생산을 유도하고, VLP는 대상체에 투여될 때, 면역 반응을 유도한다.
예를 들어, 식물 세포 내에서 뉴클레오타이드 서열의 발현은 VLP를 형성하고, VLP는 바이러스 단백질, 예를 들어, 하나 이상의 인플루엔자 타입의 HA0, 결실되거나 변형된 단백질 가수분해 루프를 가진 HA0, 하나 이상의 인플루엔자 타입 또는 서브타입의 HA1 또는 HA2 또는 서브타입, 제한되는 것은 아니지만, 예를 들어, 서브타입 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, 타입 B HA를 포함하지만, 이에 제한되지 않는 HA에 결합할 수 있는 항체를 생산하는데 사용될 수도 있다. VLP는, 대상체에 투여될 때, 면역 반응을 유도한다.
엄중 잡종화 조건 하에 잡종화는 업계에 알려져 있다 (예를 들어, Current Protocols in Molecular Biology, Ausubel et al., eds. 1995 and supplements; Maniatis et al., in Molecular Cloning (A Laboratory Manual), Cold Spring Harbor Laboratory, 1982; Sambrook and Russell, in Molecular Cloning: A Laboratory Manual, 3rd edition 2001 참조; 이것들 각각은 본원에 참고로 포함됨). 이러한 하나의 엄중 잡종화 조건의 예는 65℃에서 4 X SSC에서 약 16-20시간 잡종화 후 이어서, 1시간 동안 65℃에서 0.1 X SSC에서 세척, 또는 각각 20 또는 30분 동안 65℃에서 0.1 X SSC에서 2번 세척일 수도 있다.
대안으로, 예시적 엄중 잡종화 조건은 42℃에서 4 X SSC에서, 50% 포름아미드 중에서 하룻밤 동안 (16-20시간) 후 이어서, 1시간 동안 65℃에서 0.1 X SSC에서 세척, 또는 각각 20 또는 30분, 또는 하룻밤 (16-20시간) 동안 65℃에서 0.1 X SSC에서 2번 세척, 또는 65℃에서 처치 수성 포스페이트 버퍼(Church aqueous phosphate buffer) (7% SDS; 0.5M NaP04 버퍼 pH 7.2; 10 mM EDTA)에서 잡종화 후, 각각 20 또는 30분 동안 0.1 X SSC, 0.1% SDS에서 50℃에서 2번 세척, 또는 각각 20 또는 30분 동안 2 X SSC, 0.1% SDS에서 65℃에서 2번 세척일 수 있다.
추가적으로, 본 발명은 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H1 1, H12, H13, H14, H15, H16 또는 타입 B HA를 암호화하는 뉴클레오티드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% 또는 그 사이의 어떤 값, 서열 동일성, 또는 서열 유사성을 가진 것을 특징으로 하는 뉴클로타이드 서열을 포함하는데, 뉴클레오타이드 서열은 프로테아제에 의한 단백질 가수분해 루프 또는 분열 부위의 분열을 감소시키거나 폐지하는 변형된 단백질 가수분해 루프 서열 또는 분열 부위를 가진 헤마글루티닌 단백질 (변형된 HA)을 암호화한다. 변형된 HA를 암호화하는 뉴클레오타이드 서열이 발현될 때 그것은 VLP를 형성하고, VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포 내에서 뉴클레오타이드 서열의 발현은 VLP를 형성하고, VLP는 미가공된 HA (HA0) 또는 단백질 가수분해 루프가 결실된 미가공된 것을 포함하는, HA에 결합할 수 있는 항체를 생산하는데 사용될 수도 있다. VLP는, 대상체에 투여될 때, 면역 반응을 유도한다.
추가적으로, 본 발명은 서열 번호: 43, 91, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 137, 140, 144, 151, 158, 165의 뉴클레오타이드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% 또는 그 사이의 어떤 값, 서열 동일성, 또는 서열 유사성을 가진 것을 특징으로 하는 뉴클레오타이드 서열을 포함하는데, 뉴클레오타이드 서열은 발현될 때 VLP를 형성하는 변형된 HA 단백질을 암호화하고, 및 미가공된 HA (HAO) 또는 단백질 가수분해 루프가 결실되거나 변형된 미가공된 것을 포함하는 HA에 결합할 수 있는 항체의 생산을 유도한다. VLP는, 대상체에 투여될 때, 면역 반응을 유도한다.
더 나아가, 본 발명은 서열 번호: 17, 18, 20, 21, 41, 58, 77, 81, 85, 92, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 134, 143, 147, 154, 161, 168, 194 및 199의 아미노산 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% 또는 그 사이의 어떤 값, 서열 동일성, 또는 서열 유사성을 가진 것을 특징으로 하는 아미노산 서열을 포함하는데, 아미노산 서열은 발현될 때 VLP를 형성하는 변형된 HA 단백질을 암호화하고, VLP는 단백질 가수분해 루프가 결실되거나 변형된 미가공된 것을 포함하는 HA에 결합할 수 있는 항체의 생산을 유도한다. VLP는, 대상체에 투여될 때, 면역 반응을 유도한다.
서열 동일성 또는 서열 유사성은 뉴클레오타이드 서열 비교 프로그램, 예를 들어, DNASIS (예를 들어, 다음 파라미터를 사용하지만 이에 제한되지 않음: GAP 패널티 5, 상단 대각선의 # 5, 고정된 GAP 패널티 10, k-투플(tuple) 2, 플로팅 갭(floating gap) 10, 및 창 크기 5) 내에서 제공된 것을 사용하여 결정될 수도 있다. 하지만, 비교되는 서열의 정렬의 다른 방법, 예를 들어, Smith & Waterman (1981, Adv. Appl. Math. 2: 482), Needleman & Wunsch (J. Mol. Biol. 48: 443, 1970), Pearson & Lipman (1988, Proc. Nat'l. Acad. Sci. USA 85: 2444)의 알고리즘, 및 이 알고리즘의 컴퓨터화된 실행 (예를 들어, GAP, BESTFIT, FASTA, 및 BLAST)., 또는 수동 정렬 및 육안 검사에 의한 것은 업계에 잘 알려져 있다. 인플루엔자의 다른 균주의 HA의 서열 정렬의 예는 도 24에서 발견될 수 있다.
예를 들어, 다음을 포함하는 뉴클레오타이드 서열에 제한되는 것은 아니다:
- 서열 번호: 17, 서열 번호: 18, 서열 번호: 41, 서열 번호: 43, 서열 번호: 58, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114 및 서열 번호: 168에 의해 한정된 변형된 단백질 가수분해 루프를 가진 타입 B HA, 또는 서열 번호: 65, 서열 번호: 72, 서열 번호: 73, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113 및 서열 번호: 165에서 한정된 변형된 단백질 가수분해 루프를 포함하는 타입 B HA를 암호화하는 유클레오티드 서열.
- 서열 번호: 63에 의해 한정된 변형된 분열 부위를 포함하는 서열을 포함하는 변형된 단백질 가수분해 루프를 가진 H1.
- 서열 번호: 134에 의해 한정된 변형된 분열 부위를 포함하는 서열을 포함하는 변형된 단백질 가수분해 루프를 가진 H2.
- 서열 번호: 20, 서열 번호: 21, 서열 번호 143, 서열 번호: 147에 의해 한정된 서열을 포함하거나 서열 번호: 64에 의해 한정된 변형된 분열 부위를 포함하는 변형된 단백질 가수분해 루프를 가진 H3.
- 서열 번호: 61, 서열 번호: 62, 서열 번호: 69, 서열 번호: 70, 서열 번호: 71에 의해 한정된 변형된 분열 부위를 포함하는 서열을 포함하는 결실된 단백질 가수분해 루프를 가진 H5.
- 서열 번호: 154에 의해 한정된 변형된 분열 부위를 포함하는 서열 또는 서열 번호: 151에서 한정된 변형된 단잭질 가수분해 루프를 포함하는 타입 H7 HA를 암호화하는 뉴클레오타이드 서열을 포함하는 변형된 단백질 가수분해 루프를 가진 H7.
- 서열 번호: 161에 의해 한정된 변형된 분열 부위를 포함하는 서열 또는 서열 번호: 158에 의해 한정된 변형된 단백질 가수분해 루프 영역을 포함하는 타입 H9 HA를 암호화하는 뉴클레오타이드 서열을 포함하는 변형된 단백질 가수분해 루프를 가진 H9.
본 발명은 막관통 도메인을 포함하고 HA1 및 HA2 도메인을 포함하는 HA 단백질의 사용에 적용되며, 예를 들어, HA 단백질은 HA0, 또는 HA1 및 HA2를 포함하는 가공된 HA일 수도 있다. HA 단백질은 식물, 또는 식물 세포, 발현 시스템을 사용하여 VLP의 생산 또는 형성에 사용될 수도 있다.
증폭 요소 및
인핸서
요소/조절 요소
또 다른 예에서, 변형된 HA 단백질은 증폭 요소 및/또는 조절 요소 또는 영역 (본원에서 인핸서 요소로도 불림)을 포함하는 발현 시스템에서 발현될 수도 있다. 예를 들어, 제미니바이러스의 증폭 요소, 예를 들어, 강낭콩 황고병 바이러스 (BeYDV)의 증폭 요소는 변형된 HA를 발현시키는데 사용될 수도 있다. BeYDV는 쌍자엽 식물에 적응된 마스트레바이러스(Mastrevirus) 속에 속한다. BeYDV는 단일 가닥 원형 DNA를 가진 단립형이며 롤링 서클(rolling circle) 메커니즘에 의해 매우 높은 카피 수로 복제할 수 있다. BeYDV-유래 DNA 레플리콘 벡터 시스템은 식물에서 신속한 고수율 단백질 생산에 사용되었다.
본원에서 사용된 바와 같이, 구절 "증폭 요소"는 제미니바이러스 게놈의 하나 이상의 긴 유전자 간 영역 (LIR)의 적어도 일부를 포함하는 핵산 세그먼트를 말한다. 본원에서 사용된 바와 같이, "긴 유전자 간 영역"은 제미니바이러스 Rep 단백질의 절제 및 복제를 중재할 수 있는 rep 결합 부위를 함유하는 긴 유전자 간 영역의 영역을 말한다. 일부 양태에서, 하나 이상의 LIR을 포함하는 핵산 세그먼트는 제미니 바이러스 게놈의 짧은 유전자 간 영역 (SIR)을 더 포함할 수도 있다. 본원에서 사용된 바와 같이, "짧은 유전자 간 영역"은 상보성 가닥 (마스트레바이러스의 짧은 IR (SIR))을 말한다. 어떤 적합한 제미니바이러스-유래 증폭 요소도 본워에서 사용될 수 있다. 예를 들어, WO2000/20557; WO2010/025285; Zhang X. et al. (2005, Biotechnology and Bioengineering, Vol. 93, 271-279), Huang Z. et al. (2009, Biotechnology and Bioengineering, Vol. 103, 706-714), Huang Z. et al.(2009, Biotechnology and Bioengineering, Vol. 106, 9-17)을 참고하면 되고; 이것들은 본원에 참고로 포함된다. 하나 이상의 LIR, 예를 들어, 두 개의 LIR이 구조에 사용되면, 이어서 프로모터, CMPV-HT 영역 및 원하는 핵산 서열과 종결자는 두 개의 LIR 각각에 의해 둘러싸인다.
본원에서 기술된 바와 같이, 니코티아나 벤타미아나 잎의 아그로인필트레이션(agroinfiltration)에 의한 강낭콩 황고병 바이러스 (BeYDV)-유래 벡터 및 Rep/RepA-공급 벡터의 동시-전달은 효율적인 레플리콘 증폭 및 강력한 단백질 생산을 초래한다. 제거된 단백질 가수분해 루프가 있거나 없이 (구조에 대하여 도 17A 참조) 및 증폭 요소 BeYDV (구조 번호 1059 및 1039)의 존재 또는 부재 하에 변형된 인플루엔자 B HA (B/Brisbane/60/2008의 것)의 발현을 구동하는 유전자 구조로 형질전환된 식물의 단백질 추출물의 웨스턴 블롯 분석은 조절 요소가 CPMV-HT일 때, BeYDV의 부재 하에 인플루엔자 B HA의 축적이 검출될 수 없다는 것을 나타냈다 (도 17B).
도 17B에서 나타난 바와 같이, BeYDV의 부재 하에 단백질 가수분해 루프가 제거된 B/Brisbane/60/2008의 HA의 발현은 웨스턴 블롯 분석에 의해 검출 가능한 발현으로 이어지지 않는다 (도 17B의 레인 1039 참조). 하지만, 증폭 요소 BeYDV의 존재 하에 단백질 가수분해 루프가 제고된 HA 타입 B의 발현은 증가된 발현을 초래한다 (레인 1059 참조). 유사하게, BeYDV의 부재 하에, A/New Caledonia/20/99의 M2와 함께, 단백질 가수분해 루프에서 결실을 포함하는 돌연변이 HA-타입 B의 동시-발현은 검출 가능한 HA 발현을 초래하지 않는다 (도 17B에서 레인 "1039+1261"). 반면에, A/New Caledonia/20/99의 M2와 함께, BeYDV의 존재 하에 단백질 가수분해 루프에서 결실을 포함하는 돌연변이 HA 타입 B의 동시-발현은 증가된 발현을 초래하였다 (레인 "1059+1261" 참조; 도 17B).
하지만, BeyDV의 존재는 인핸서 요소가 발현 시스템에 존재할 때 및 인핸서 요소가 CPMV-HT가 아닐 때 필요하지 않다. 예를 들어, 도 29A에서 나타난 바와 같이, 인핸서 요소, 예를 들어, CPMV 160, CPMV 160+또는 CPMV HT+의 제어 하에 다양한 B HA 균주의 발현은 BeYDV의 부재 하에 증가된 헤마글루티닌화 역가 (HMG)를 나타내는 HA 단백질의 생산으로 이어진다.
그러므로, 돌연변이 (변형된) HA 단백질은 제미니바이러스-기반 증폭 요소와 같은 증폭 요소, 예를 들어, BeYDV의 부재 하에, 하지만 인핸서 요소, 예를 들어, CPMV 160, CPMV 160+또는 CPMV HT+의 존재 하에 발현될 수도 있다.
돌연변이 (변형된 HA)는 인핸서 요소, 예를 들어, CPMV 160, CPMV 160+또는 CPMV HT+의 존재 하에, 하지만 증폭 요소, 예를 들어, BeYDV의 부재 또는 존재 하에 발현될 수도 있다. 도 28B, 28C 및 28F에서 나타난 바와 같이 돌연변이 (변형된) HA는 증폭 요소가 있거나 없이, 인핸서 요소의 존재 하에 발현될 수도 있다. 그러므로 본 발명은 또한 인핸서 요소 및 선택적으로 증폭 요소의 존재 하에 돌연변이 (변형된) HA의 발현에 관한 것이다.
인핸서 요소 (CMPV HT+또는 CMPV 160+) 및 GG 링커 (결실된 단백질 가수분해 루프)로 대체된 단백질 가수분해 루프를 포함하는 HA 구조는 야생형 타입 또는 CPMV HT를 포함하는 HA 구조와 비교하여 증가된 발현을 나타낸다 (도 28A, H3 Per; 도 28B, B Malaysia; 도 28C, H9 HK; 도 29D, B Mass; 도 28E, H2 Sin).
도 29A는 결실된 단백질 가수분해 루프 (GG 링커)를 가진 변형된 HA 또는 고유한 HA를 암호화하는 뉴클레오티드 서열과 작동 가능하게 결합된 CPMV HT, CPMV HT+, CPMV 160 또는 CPMV 160+, 기반 인핸서 요소를 포함하는 식물에서 생산된 변형된 HA 단백질의 헤마글루티닌화 역가에 대한 요약 데이터를 제공한다. 대부분의 경우에, 발현 (헤마글루티닌화 역가로서 결정됨)은 CPMV HT+, CPMV 160 또는 CPMV 160+기반 구조가 유의한 발현 수준을 입증하는 동안 더 높았다.
인핸서 요소는 변형된 단백질 가수분해 루프를 가진 돌연변이 (변형된) HA 단백질의 높은 수준의 일과성 발현을 달성하는데 사용될 수도 있다. 인핸서 요소는 동부 모자이크 바이러스와 같은 코모바이러스를 포함하는 RNA 식물 바이러스를 기반으로 할 수도 있다 (CPMV; 예를 들어, WO2007/135480; WO2009/087391; US 2010/0287670, Sainsbury F. et al, 2008, Plant Physiology; 148: 121-1218; Sainsbury F. et al, 2008, Plant Biotechnology Journal; 6: 82-92; Sainsbury F. et al, 2009, Plant Biotechnology Journal; 7: 682-693; Sainsbury F. et al. 2009, Methods in Molecular Biology, Recombinant Proteins From Plants, vol. 483: 25-39 참조).
CPMV
160 (
CPMVX
) 및
CPMV
160+(
CPMVX
+)
한 구체예에서 인핸서 요소는 US 61/925,852에서 기술된 바와 같이 "CPMVX" ("CPMV 160"으로도 불림) 및/또는 "CPMVX+" ("CPMV 160+"로도 불림)이며, 이것은 본원에 참고로 포함된다.
발현 인핸서 "CPMVX"는 코모바이러스 동부 모자이크 바이러스 (CPMV) 5' 비번역 영역 (UTR)을 포함한다. CPMV RNA-2 서열 (서열 번호: 93)의 뉴클레오타이드 1-160의 5'UTR은 전사 시작 부위에서 제1 인 프레임(in frame) 개시 시작 코돈 (위치 161에서)으로 시작하며, 이것은 야생형 코모바이러스 게놈 세그먼트에 의해 암호화된 두 개의 카르복시 양쪽 말단보다 더 긴 것의 생산을 위한 개시 부위의 역할을 한다. 더 나아가 CPMV RNA-2 게놈 서열에서 위치 115에서 (또는 이에 해당하는) '제3' 개시 부위가 또한 돌연변이되거나, 결실되거나 또는 달리 변경될 수도 있다. AUG 115의 제거, 이에 더하여 AUG 161의 제거는 불완전 M 단백질과 결합될 때 발현을 향상시킨다는 것이 나타난다 (Sainsbury and Lomonossoff, 2008, Plant Physiology; 148: 1212-1218; WO 2009/087391; 이것은 본원에서 참고로 포함됨).
CPMVX는 X=서열 번호: 93의 160, 155, 150, 또는 114이면, 서열 번호: 93의 X 뉴클레오타이드, 또는 X=서열 번호: 93의 160, 155, 150, 또는 114이면, CPMVX와 80% 내지 100% 서열 유사성을 포함하는 서열을 포함한다. 이 발현 인핸서는 일반적으로 CPMVX로 불린다 (도 26A 참조).
발현 인핸서 CPMVX는, X=160이면, 서열 번호: 93의 뉴클레오타이드 1-160으로 구성된다:
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca (서열 번호: 93)
CPMVX 인핸서 서열은 스터퍼 서열에 더 융합될 수도 있는데, CMPVX는 X=서열 번호: 93의 160, 155, 150, 또는 114이면, 서열 번호: 1의 X 뉴클레오타이드, 또는 X=서열 번호: 93의 160, 155, 150, 또는 114이면, CPMVX과 80 내지 100% 서열 유사성을 포함하는 서열을 포함하고, 스터퍼 서열은 CMPVX 서열의 3' 끝에 융합된 1-100 뉴클레오타이드를 포함한다. 예를 들어, 스터퍼 서열은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100 뉴클레오타이드, 또는 그 사이의 많은 뉴클레오타이드를 포함할 수도 있다.
CMPVX 서열이 스터퍼 단편을 포함하면, 이어서 이 발현 인핸서는 CPMVX+로도 불릴 수 있거나 (도 26A 참조), X=서열 번호: 93의 160, 155, 150, 114이면, 그것은 또한 스터퍼 서열을 포함하는 CMPVX로도 불릴 수 있거나, 또는 X=160, 155, 150, 또는 114일 때, 그것은 각각 CPMV160+; CPMV155+; CPMV150+; CPMV114+로도 불릴 수 있다. 스터퍼 서열을 포함하지 않는 CPMVX를 포함하는 구조는 서열 번호: 93의 X=160, 155, 150, 114이고, 스터퍼 서열이 길이가 0 뉴클레오타이드이면, CPMVX+로 불릴 수도 있다.
스터퍼 서열은 뉴클레오타이드 160에 대하여 3'에 위치한 고유한 CMPV5'UTR 서열의 절단, 결실, 또는 대체에 의해 변형될 수도 있다. 변형된 스터퍼 서열은 5'UTP와 결합된 초기 또는 변형되지 않은 (즉 고유한) 스터퍼 서열과 비교하여 제거되거나, 대체되거나, 절단되거나 짧아질 수도 있다 (Sainsbury F., and Lomonossoff G.P., 2008, Plant Physiol. 148: pp. 1212-1218에 의해 기술된 바와 같음). 스터퍼 서열은 하나 이상의 제한 부위 (폴리링커, 다클로닝 부위, 하나 이상의 클로닝 부위), 하나 이상의 식물 코자크 서열s, 하나 이상의 링커 서열, 하나 이상의 재조합 부위, 또는 이것들의 조합을 포함할 수도 있다. 예를 들어, 제한하는 것으로 고려되는 것은 아니지만, 스터퍼 서열은 연속적으로, 식물 코자크 서열에 융합된 원하는 길이의 다클로닝 부위를 포함할 수도 있다. 스터퍼 서열은 고유한 CPMV 5'UTR의 뉴클레오타이드 160, 예를 들어, Sainsbury F., 및 Lomonossoff G.P.의 도 1에서 나타난 뉴클레오타이드 161 내지 512 (2008, Plant Physiol. 148: pp. 1212-1218; 이것은 본원에 참고로 포함됨), 또는 서열 번호: 4의 뉴클레오타이드 161-509에 대하여 3'에 위치한 고유한 5'UTR 서열의 뉴클레오타이드 서열을 포함하지 않는다. 즉, 선행 업계 CPMV HT 서열 (도 1; Sainsbury F., and Lomonossoff G.P., 2008)에 존재하는 불완전 M 단백질은 본 발명에서 5'UTR로부터 제거된다.
식물 코자크 공통 서열은 업계에 알려져 있다 (예를 들어, Rangan et al. Mol. Biotechnol., 2008, July 39(3), pp. 207-213 참조). 자연적으로 발생한 및 합성의 코자크 서열 둘 다는 본원에서 기술된 바와 같이 발현 인핸서에서 사용될 수도 있거나 원하는 뉴클레오타이드 서열에 융합될 수도 있다.
식물 코자크 서열은 다음 식물 공통 서열을 포함하지만, 이에 제한되지 않는 어떤 알려져 있는 식물 코자크 서열일 수도 있다 (예를 들어, L. Rangan et. al. Mol. Biotechnol.2008 참조):
caA(A/C)a (서열 번호: 174; 식물계)
aaA(A/C)a (서열 번호: 175; 쌍떡잎식물)
aa(A/G)(A/C)a (서열 번호: 176; 애기장대(arabidopsis)).
식물 코자크 서열은 또한 다음 군으로부터 선택될 수도 있다:
AGAAA (서열 번호: 177)
AGACA (서열 번호: 178)
AGGAA (서열 번호: 179)
AAAAA (서열 번호: 180)
AAACA (서열 번호: 181)
AAGCA (서열 번호: 182)
AAGAA (서열 번호: 183)
AAAGAA (서열 번호: 184)
AAAGAA (서열 번호: 185)
(A/-)A(A/G)(A/G)(A/C)A. (서열 번호: 186; 공통 서열).
발현 인핸서 CPMVX, 또는 CPMVX+는 식물 숙주 내에서 원하는 뉴클레오타이드 서열의 발현을 구동하기 위해서 식물에서 활성이고, 발현 인핸서의 3' 끝에서 원하는 뉴클레오타이드 서열에 작동 가능하게 결합된 조절 영역과 인핸서 서열의 5' 끝에서 작동 가능하게 결합될 수도 있다 (도 26A).
CPMV
HT+,
CPMV
HT+[WT115],
CPMV
HT+[511]
또 다른 구체예에서, 인핸서 요소는 US 61/971,274에서 기술된 "CPMV HT+"이며, 이것은 본원에 참고로 포함된다. 발현 인핸서 "CPMV HT+" (도 27A 참조)는 코모바이러스 5' 비번역 영역 (UTR) 및 변형된, 길어진, 또는 절단된 스터퍼 서열을 포함한다.
조절 영역을 포함하고, 본원에서 기술된 하나 또는 하나 이상의 발현 인핸서에 작동 가능하게 결합된 제1 핵산 서열 (예를 들어, CPMV HT+, CPMV HT+[WT115], CPMV HT+[511]), 및 변형된 HA를 암호화하는 뉴클레오타이드 서열을 포함하는 식물 발현 시스템이 또한 제공된다. 더 나아가, 프로모터 (조절 영역) 서열, 코모바이러스 5'UTR을 포함하는 발현 인핸서 (예를 들어, CPMV HT+또는 CPMV HT+[WT115]) 및 변형된 HA를 암호화하는 하나 이상의 핵산 서열에 융합된 식물 코자크 서열을 가진 스터퍼 서열을 포함하는 핵산이 기술된다. 핵산은 변형된 HA를 암호화하는 뉴클레오타이드 서열이 코모바이러스 3' 비번역 영역 (UTR), 플라스토시아닌 3' UTR, 또는 다른 3'UTR 서열로부터 업스트림에 삽입되도록 코모바이러스 3' 비번역 영역 (UTR), 예를 들어, 플라스토시아닌 3' UTR, 또는 식물에서 활성인 다른 3'UTR, 및 변형된 HA를 암호화하는 뉴클레오타이드 서열의 3' 끝에 작동 가능하게 결합된 종결자 서열, 예를 들어, NOS 종결자를 포함하는 서열 (도 27A에서 원하는 뉴클레오타이드로 불림)을 더 포함할 수도 있다.
서열 번호: 173은 선행 업계에 알려져 있는 "CPMV HT" 발현 인핸서 (예를 들어, Sainsbury and Lomonossoff 2008, Plant Physiol. 148: pp. 1212-1218의 도 1; 이것은 본원에 참고로 포함됨)를 포함한다. CPMV HT는 위치 115 (cgt)에서 변형된 뉴클레오타이드를 가진 서열 번호: 173의 뉴클레오타이드 1-160의 5'UTR, 및 위치 162 (acg)에서 변형된 뉴클레오타이드를 가진 불완전 M 단백질을 포함하고, 식물 코자크 서열 (5'UTR: 뉴클레오타이드 1-160; 밑줄 그어진 불완전 M 단백질, 뉴클레오타이드 161-509)이 없다. 서열 번호: 173은 또한 선행 업계 CPMV HT 서열에 존재하지 않는 다클로닝 부위 (이탤릭체, 뉴클레오타이드 510-528)를 포함한다:
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acg ttttctt tcactgaagc
181 gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatttg t cgggccc 서열 번호: 173.
식물 코자크 공통 서열을 가진 CPMV HT+가 서열 번호: 187에서 제공된다 (뉴클레오타이드 1-160, 5'UTR, 위치 115 (GTG)에서 변형된 ATG를 포함, 소문자 볼드체 및 이탤릭체; 밑줄 그어진 불완전 M 단백질을 포함하는 스터퍼 단편, 뉴클레오타이드 161 - 509, 162 (ACG)에서 변형된 뉴클레오타이드를 가짐; 다클로닝 부위, 이탤릭체, 뉴클레오타이드 510-528; 및 공통 식물 코자크 서열, 대문자 및 볼드체, 뉴클레오타이드 529-534)
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgc gtg agc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acg ttttctt tcactgaagc
181 gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatttg t tcgggcccaa taccgcgg( A/-)A(A/G)
서열 번호: 188 ("CPMV HT+511")은 뉴클레오타이드 1-154의 CPMV RNA 2 게놈의 고유한 서열의 세그먼트를 포함한다. 서열 번호: 188의 뉴클레오타이드 1-511의 5'UTR 서열은 위치 115 ("a" 대신에 "g"; 이탤릭체 볼드체) 및 162 ("t" 대신에 "c"; 이탤릭체 볼드체)에서 변형된 "atg" 서열, 및 뉴클레오타이드 161-511의 불완전 M 단백질 (밑줄 그어져 있음)을 포함한다. CPMV HT+511은 고유한 M 단백질 코자크 공통 서열 (뉴클레오타이드 508-511; 볼드체)을 포함한다:
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgc gtg agc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acg ttttctt tcactgaagc
181 gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatt tga a … 서열 번호: 188
CPMV HT+인핸서 서열의 또 다른 비제한 예는 서열 번호: 189 (CPMV HT+[WT115])의 서열에 의해 제공된다. CPMV HT+를 포함하고 서열 번호: 189의 발현 인핸서 서열과 작동 가능하게 결합된 식물 조절 영역, 및 변형된 HA를 암호화하는 뉴클레오타이드 서열에 융합된 3' 끝에서 전사 시작 부위 (ATG)를 포함하는 발현 카세트 또는 벡터는 또한 본 발명의 일부이다.
서열 번호: 189 (CPMV HT+[WT115]) 뉴클레오타이드 1-160, 5'UTR, 위치 115-117에서 ATG를 가짐, 소문자 볼드체; 밑줄 그어진 불완전 M 단백질, 뉴클레오타이드 161 - 509를 포함하는 스터퍼 단편; 위치 161-153에서 ATG가 변형됨, 소문자 볼드체, 및 밑줄 그어진; 다클로닝 부위, 이탤릭체, 뉴클레오타이드 510-528; 및 식물 코자크 서열, 대문자 및 볼드체, 뉴클레오타이드 529-534).
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgc atg agc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acg ttttctt tcactgaagc
181 gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatttg t tcgggcccaa taccgcgg AG AAAA
(서열 번호: 189)
서열 번호: 189의 식물 코자크 서열은 서열 번호: 174-186의 서열 중 하나를 포함하지만, 이에 제한되지 않는 어떤 식물 코자크 서열일 수도 있다.
"
키메라
단백질"
변형된 HA는 추가로 키메라 단백질일 수도 있다. "키메라 단백질" 또는 "키메라 폴리펩타이드", 또는 "키메라 HA"로도 불리는 "키메라 바이러스 단백질" 또는 "키메라 바이러스 폴리펩타이드"는 단일 폴리펩타이드로서 융합되는 둘 또는 둘 이상의 공급원, 제한되는 것은 아니지만, 예를 들어, 둘 이상의 인플루엔자 타입 또는 서브타입, 또는 다른 기원의 인플루엔자의 아미노산 서열을 포함하는 단백질 또는 폴리펩타이드를 의미한다. 키메라 단백질 또는 폴리펩타이드는 폴리펩타이드 또는 단백질의 나머지와 같거나, 또는 이것들과 이종 기원인 신호 펩타이드를 포함할 수도 있다. 키메라 단백질 또는 키메라 폴리펩타이드는 키메라 뉴클레오타이드 서열의 전사물로서 생산될 수도 있고, 합성 후, 및 필요하면, 멀티머 단백질을 형성하도록 결합할 수도 있다. 그러므로, 키메라 단백질 또는 키메라 폴리펩타이드는 또한 이황화 브릿지를 통해 결합된 서브유닛을 포함하는 단백질 또는 폴리펩타이드 (즉 멀티머 단백질)를 포함한다. 예를 들어, 둘 또는 둘 이상의 공급원의 아미노산 서열을 포함하는 키메라 폴리펩타이드는 서브유닛으로 가공될 수도 있으며, 서브유닛은 이황화 브릿지를 통해 결합되어 키메라 단백질 또는 키메라 폴리펩타이드를 생산한다. 키메라 HA 단백질은 또한 제1 인플루엔자 바이러스의 항원성 단백질 또는 이것의 단편, 및 막관통 도메인 및 세포질 꼬리 도메인 (TM/CT)을 포함하는, 제2 바이러스 인플루엔자 HA의 막관통 도메인 복합체 (TDC)를 포함할 수도 있다. 폴리펩타이드는 변형된 HA일 수도 있고, 폴리펩타이드를 구성하는 둘 또는 둘 이상의 아미노산 서열 각각은 키메라 HA, 키메라 인플루엔자 HA, 키메라 변형된 HA 또는 키메라 변형된 인플루엔자 HA를 생산하기 위해 다른 HA로부터 얻어질 수도 있다. 키메라 HA는 또한 단백질 합성 후에 또는 도중에 분열되는 이종 기원 신호 펩타이드 (키메라 HA 전구단백질)을 포함하는 아미노산 서열을 포함할 수도 있다. 바람직하게, 키메라 폴리펩타이드, 또는 키메라 인플루엔자 HA는 자연적으로 발생하지 않는다. 키메라 폴리펩타이드를 암호화하는 핵산은 "키메라 핵산", 또는 "키메라 뉴클레오타이드 서열"로서 기술될 수도 있다. 예를 들어, 키메라 핵산은, 연속적으로, 변형된 단백질 가수분해 루프를 포함하는 변형된 HA 엑토도메인, 인플루엔자 막관통 도메인, 및 세포질 꼬리를 암호화하는 키메라 뉴클레오타이드 서열을 포함하는 변형된 HA를 암호화하는 뉴클레오타이드 서열을 포함할 수도 있으며, 변형된 HA 엑토도메인은 제1 인플루엔자 균주의 것이고 막관통 도메인 및 세포질 꼬리는 제2 인플루엔자 균주의 것이다. 변형된 HA 엑토도메인은 제1 인플루엔자 균주의 것이고 막관통 도메인 및 세포질 꼬리는 제2 인플루엔자 균주의 것인, 키메라 뉴클레오타이드 산의 예는 실시예 5.14, 5.16, 5.18, 5.19, 5.21 및 5.23에서 제공된다. 키메라 HA로 구성된 바이러스-유사 입자는 "키메라 VLP"로서 기술될 수도 있다.
상기 기술된 바와 같이, 키메라 단백질, 키메라 폴리펩타이드, 또는 키메라 HA는 폴리펩타이드 또는 단백질의 나머지와 같거나, 또는 이종 기원인 신호 펩타이드를 포함할 수도 있다. 용어 "신호 펩타이드"는 업계에 잘 알려져 있으며 일반적으로 짧은 (약 5-30 아미노산) 서열의 아미노산을 말하며, 일반적으로 새로 번역된 폴리펩타이드의 특정 세포 기관으로의 위치 이동을 지시하거나, 또는 서로 폴리펩타이드 사슬의 특이적 도메인의 위치 결정을 도울 수도 있는 폴리펩타이드의 N-말단에서 발견된다. 비제한 예로서, 신호 펩타이드는 성숙한 단백질, 예를 들어, 변형된 HA 또는 키메라 변형된 HA의 분열 및 폴딩을 돕기 위해 초기 폴리펩타이드의 막-앵커 도메인에 관하여 단백질의 소포체로의 위치 이동을 표적화하고 및/또는 소포체 N-말단 근위 도메인의 위치 결정을 도울 수도 있다.
HA는 또한 키메라 HA 또는 키메라 변형된 HA일 수도 있으며, HA 또는 변형된 HA의 고유한 막관통 도메인은 이종 기원 막관통 도메인으로 대체된다. HA 단백질의 막관통 도메인은 고도로 보존된다 (예를 들어, WO 2010/148511의 도 1C 참조; 이것은 본원에 참고로 포함됨). 이종 기원 막관통 도메인은 어떤 HA 막관통 도메인, 제한은 아니지만, 예를 들어, H1 California, B/Florida/4/2006 (GenBank 수납 번호 ACA33493.1), B/Malaysia/2506/2004 (GenBank 수납 번호 ABU99194.1), H1/Bri (GenBank 수납 번호 ADE28750.1), H1 A/Solomon Islands/3/2006 (GenBank 수납 번호 ABU99109.1), H1/NC (GenBank 수납 번호 AAP34324.1), H2 A/Singapore/1/1957 (GenBank 수납 번호 AAA64366.1), H3 A/Brisbane/10/2007 (GenBank 수납 번호 ACI26318.1), H3 A/Wisconsin/67/2005 (GenBank 수납 번호 AB037599.1), H5 A/Anhui/1/2005 (GenBank 수납 번호 ABD28180.1), H5 A/Vietnam/1194/2004 (GenBank 수납 번호 ACR48874.1), H5-Indo (GenBank 수납 번호 ABW06108.1)의 막관통 도메인으로부터 얻어질 수도 있다. 막관통 도메인은 또한 다음 공통 아미노산 서열에 의해 한정될 수도 있다:
iLXiYystvAiSslXlXXmlagXsXwmcs (서열 번호: 94).
이종 기원 막관통 도메인을 가진 키메라 HA를 포함하는 구조의 예는 다음을 포함한다: 구조 번호 1875 (결실된 단백질 가수분해 루프+H1TM을 가진 CPMV-HT+B Brisbane/60/08, H1 A/California/07/2009에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가짐; 실시예 5.19 참조), 구조 번호 1977 (결실된 단백질 가수분해 루프+H1TM를 가진 CPMV-160+B Brisbane/60/08, H1 A/California/07/2009에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가짐; 실시예 5.14 참조), 구조 번호 1067 (결실된 단백질 가수분해 루프+H1TM을 가진 CPMV-HT B Brisbane/60/08, H1 A/California/07/2009에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가짐; 실시예 5.14 참조), 구조 번호 2074 (CPMV HT B Massachusetts/2/2012+H1Tm, H1 A/California/07/2009의 것에 의해 대체된 막관통 도메인 및 세포질 꼬리; 실시예 5.16 참조), 구조 번호 2060 (CPMV HT160+Massachusetts/2/2012+H1Tm, H1 A/California/07/2009의 것에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가짐; 실시예 5.16 참조), 구조 번호 2062 (CPMV 160+B Massachusetts/2/2012+H1Tm, H1 A/California/07/2009의 것에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가짐; 실시예 5.21 참조), 구조 번호 1860 (H1 A/California/07/2009의 것에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가진 CPMV HT+B Wisconsin/1/2010+H1Tm; 실시예 5.23 참조), 구조 번호 1454 (H1 A/California/07/2009의 것에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가진 CPMV HT B Wisconsin/1/2010+H1Tm, 실시예 5.18 참조) 및 구조 번호 1893 (H1 A/California/07/2009의 것에 의해 대체된 막관통 도메인 및 세포질 꼬리를 가진 CPMV 160+B Wisconsin/1/2010+H1Tm; 실시예 5.18 참조). 이 키메라 변형된 HA의 활성은 도 26B 및 27B에서 나타난다.
신호
펩타이드
신호 펩타이드 (SP)는 변형된 HA 또는 키메라 변형된 HA에 고유할 수도 있거나, 또는 신호 펩타이드는 발현되는 변형된 HA의 1차 서열에 관하여 이종 기원일 수도 있다. 변형된 HA는 제1 인플루엔자 타입, 서브타입 또는 하나 또는 하나 이상의 다른 인플루엔자 타입, 서브타입 또는 균주의 HA가 균형잡힌 균주의 신호 펩타이드를 포함할 수도 있다. 예를 들어, HA 서브타입 H1, H2, H3, H5, H6, H7, H9 또는 인플루엔자 타입 B의 고유한 신호 펩타이드는 식물 시스템에서 변형된 HA를 발현시키는데 사용될 수도 있다. 본 발명의 일부 구체예에서, SP는 인플루엔자 타입 B, H1, H3 또는 H5; 또는 서브타입 H1/Bri, H1/NC, H5/Indo, H3/Bri 또는 B/Flo의 것일 수도 있다.
더 나아가, 변형된 HA 또는 키메라 변형된 HA는 고유한, 또는 비-고유한 신호 펩타이드를 포함할 수도 있고; 비-고유한 신호 펩타이드는 식물 기원의 것이거나 동물 또는 박테리아 폴리펩타이드로부터 얻어질 수도 있다. 고유한 신호 펩타이드는 발현되는 HA 또는 변형된 HA의 것과 일치할 수도 있으며, 추가적으로, 신호 펩타이드는 인플루엔자 이외의 바이러스의 구조적 단백질 또는 헤마글루티닌의 것일 수도 있다. 사용될 수도 있는 신호 펩타이드의 비제한 예는 알팔파 단백질 이황화 이소머라제 (PDI SP; 수납 번호 Z11499의 뉴클레오타이드 32-103, 또한 WO 2009/076778; WO 2010/148511, 또는 WO 2010/003235 참조)의 것, 또는 파타틴 신호 펩타이드 (PatA SP; GenBank 수납 번호 A08215의 뉴클레오타이드 1738 - 1806에 위치함)이다. 이 수납 번호에 대한 PatA SP의 뉴클레오타이드 서열은
ATGGCAACTACTAAAACTTTTTTAATTTTATTTTTTATGATATTAGCAACTACTAGTTCAACATGTGCT (서열 번호: 171)
이다.
파타틴 A 신호 펩타이드의 아미노산 서열은
MATTKTFLILFFMILATTSSTCA (서열 번호: 172)
이다.
그러므로 본 발명은 고유한, 또는 비-고유한 신호 펩타이드를 포함하는 변형된 HA 또는 키메라 변형된 HA, 및 이러한 키메라 변형된 HA 단백질을 암호화하는 핵산을 제공한다.
채널 단백질과 동시-발현
돌연변이 (변형된) HA는 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질을 암호화하는 제2 핵산과 함께 변형된 HA를 암호화하는 제1 핵산을 동시-발현시킴으로써 식물에서 생산될 수도 있다. 제1 및 제2 핵산은 같은 단계에서 식물로 도입될 수도 있거나, 또는 그것들은 순차적으로 식물로 도입될 수도 있다. 제1 및 제2 핵산은 일과성 방식으로, 또는 안정한 방식으로 식물에서 도입될 수도 있다.
더 나아가, 변형된 HA를 암호화하는 제1 핵산을 발현하는 식물은, 제1 및 제2 핵산 둘 다가 식물에서 동시-발현되도록, 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질 (제2 핵산)로 형질전환될 수도 있다. 대안으로, 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질 (제2 핵산)을 발현하는 식물은 제1 및 제2 핵산이 식물에서 동시-발현되도록 변형된 HA를 암호화하는 제1 핵산으로 형질전환될 수도 있다. 추가적으로, 변형된 HA를 암호화하는 제1 핵산을 발현하는 제1 식물은 각각 변형된 HA 및 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질을 암호화하는 제1 및 제2 핵산을 동시-발현하는 자손 식물을 생산하기 위해서, 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질을 암호화하는 제2 핵산을 발현하는 제2 식물과 교배될 수도 있다.
어떤 이론에도 결부되지 않으면서, 골지체를 포함하여, 변형된 HA를 포함하는 세포 구획의 pH는 HA의 폴딩, 안정성 및/또는 단백질 가수분해에 중요할 수도 있다. 양성자 채널 단백질, 예를 들어, 인플루엔자 M2 및 BM2 단백질은 세포 구획에서 pH를 조절할 수도 있다. 예를 들어, M2는 인플루엔자 바이러스 복제의 말기 및 초기 단계 둘 다에서 세포 내 구획을 완충시킴으로써 막 융합의 강화 작용을 조절한다.
변형된 HA와 함께, 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질을 동시-발현시킴으로써, 골지체 내 pH가 증가할 수도 있고, 안정성, 분해의 감소, 또는 이것들의 조합의 증가를 초래하며, 변형된 HA 및/또는 VLP의 발현 수준 및 수율을 증가시킨다.
식물에서 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질과 함께 변형된 HA를 동시-발현시킴으로써, 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질의 동시-발현 없이 변형된 것을 발현하는 식물과 비교하여 HA 및/또는 VLP의 증가된 수율이 관찰된다 (도 13A 및 14 참조). 예를 들어, 도 13A에서 나타난 바와 같이, 변형된 인플루엔자 B HA와 함께 M2의 동시-발현은 HA 축적 수준을 증가시켰다 (도 13A, 1059 대 1059+1261).
더 나아가, 변형된 인플루엔자 B HA 및 H3의 축적을 증가시키기 위한 인플루엔자 A/Puerto Rico/8/1934의 M2의 효능은 인플루엔자 A/New Caledonia/20/1999의 M2의 그것과 비교되었다. 변형된 인플루엔자 B HA에 대하여, 비교는 구조 1059, 1059+1261 및 1059+859로 형질전환된 식물의 단백질 추출물의 웨스턴 블롯 분석에 의해 착수되었다. 얻어진 결과는 인플루엔자 A/Puerto Rico/8/1934 (구조 번호 859에 의해 암호화됨)의 M2의 동시-발현이 변형된 인플루엔자 B HA의 축적의 증가에 대하여 인플루엔자 A/New Caledonia/20/1999 (구조 번호 1261에 의해 암호화됨)의 M2의 동시-발현만큼 효율적이었다는 것을 입증하였다 (도 14).
본원에서 사용된 바와 같이, 용어 "M2", "M2 단백질", "M2 서열" 및 "M2 도메인"은 어떤 자연 발생한 또는 인공적으로 생성된 인플루엔자 바이러스 균주 또는 분리물을 기반으로 하거나 또는 이것들에 존재하는 M2 단백질 서열 분리된 형태의 모두 또는 일부를 말한다. 따라서, 용어 M2 등은 바이러스 생활 주기 동안 돌연변이에 의해 생산되거나 선택압 (예를 들어, 약물 치료, 숙주 세포 항성 또는 감염성의 확장, 등)에 반응하여 생산된 자연 발생한 M2 서열 변종, 뿐만 아니라 재조합에 의해 또는 합성에 의해 생산된 M2 서열을 포함한다. 본 발명과 함께 사용될 수도 있는 서열의 비제한 예는 A/Puerto Rico/8/1934의 M2 및 A/New Caledonia/20/1999의 M2를 포함한다.
면역 반응
"면역 반응"은 일반적으로 후천적 면역 시스템의 반응을 말한다. 후천적 면역 시스템은 일반적으로 체액 반응, 및 세포-중재 반응을 포함한다. 체액 반응은 B 림프구 계통의 세포 (B 세포)에서 생산된, 분비된 항체에 의해 중재되는 면역력의 양태이다. 분비된 항체는 미생물 (예를 들어, 바이러스 또는 박테리아)을 침입하는 표면 상에서 항원에 결합하며, 이것은 파괴를 위해 그것들을 플래그(flag) 한다. 체액 면역력은 일반적으로 항체 생산 및 그것을 동반하는 과정, 뿐만 아니라, Th2 세포 활성화 및 시토킨 생산, 기억 세포 발생, 식균 작용의 옵소닌 촉진, 병원체 제거 등을 포함하는, 항체의 반응기 기능을 말하기 위해 사용된다. 용어 "조절하다" 또는 "조절" 등은 일반적으로 알려져 있거나 사용된 여러 검정에 의해 결정된 바와 같이 특정 반응 또는 파라미터의 증가 또는 감소를 말하며, 이것들 중 일부는 본원에서 예시된다.
세포-중재된 반응은 항체를 수반하지 않지만, 대식세포, 자연 살해 세포 (NK), 항원-특이적 세포 독성 T-림프구의 활성화, 및 항원에 반응하여 다양한 시토킨의 방출을 수반하는 면역반응이다. 세포-중재된 면역력은 일반적으로 일부 Th 세포 활성화, Tc 세포 활성화 및 T-세포 중재된 반응을 말하기 위해 사용된다. 세포 중재된 면역력은 바이러스 감염에 반응하는데 있어서 특히 중요하다.
예를 들어, 항원 특이적 CD8 양성 T 림프구의 유도는 ELISPOT 검정을 사용하여 측정될 수도 있고; CD4 양성 T-림프구의 자극은 증식 검정을 사용하여 측정될 수도 있고; 항-인플루엔자 항체 역가는 ELISA 검정을 사용하여 정량화될 수도 있고; 항원-특이적 또는 교차 반응성 항체의 이소타입은 또한 항-이소타입 항체 (예를 들어, 항-IgG, IgA, IgE 또는 IgM)를 사용하여 측정될 수도 있다. 이러한 검정을 수행하기 위한 방법 및 기술은 업계에 잘 알려져 있다.
교차 반응성 HAI 역가는 또한 백신 서브타입에 관련된 바이러스의 다른 균주에 대한 면역 반응의 효능을 입증하기 위해 사용될 수도 있다. 예를 들어, 제1 균주의 백신 조성물 (예를 들어, A/Indonesia 5/05의 VLP)로 면역화된 대상체의 혈청은 전체 바이러스 또는 바이러스 입자의 제2 균주를 이용하여 HAI 검정에서 사용될 수도 있으며, HAI 역가가 결정된다.
시토킨 존재 또는 수준이 또한 정량화될 수도 있다. 예를 들어, T-헬퍼(helper) 세포 반응 (Th1/Th2)은 ELISA를 사용함으로써 IFN-γ 및 IL-4 분비 세포의 측정에 의해 특성화될 것이다 (예를 들어, BD Biosciences OptEIA 키트). 대상체로부터 얻은 말초 혈액 단핵구 세포 (PBMC) 또는 비장 세포가 배양될 수도 있으며, 상층액이 분석된다. T 림프구는 또한 형광-활성화 세포 분류기 (FACS)에 의해 정량화될 수도 있으며, 업계에서 알려져 있는 마커 특이적 형광 라벨 및 방법을 사용한다.
마이크로중화 검정은 또한 대상체에서 면역 반응을 특성화하기 위해 실행될 수도 있으며, 예를 들어, Rowe et al., 1973의 방법을 참고하면 된다. 바이러스 중화 역가는 여러 방법으로 얻어질 수도 있는데, 1) 세포의 크리스탈 바이올렛(crystal violet) 고정/착색 후 용해 플라크(plaque)의 열거 (플라크 검정); 2) 배양물에서 세포 용해의 현미경 관찰; 3) NP 바이러스 단백질의 ELISA 및 분광 광도법적 검출 (숙주 세포의 바이러스 감염과 연관됨)을 포함한다.
용어 "바이러스 유사 입자" (VLP), 또는 "바이러스-유사 입자" 또는 "VLP"는 바이러스 단백질, 예를 들어, 인플루엔자 HA 단백질 또는 변형된 HA 단백질, 예를 들어, HA0 단백질을 자가 조립하고 포함하는 구조를 말하며, 단백질 가수분해 루프가 변형되어 있다. VLP는 일반적으로 감염 시 생산된 비리온과 형태적으로 및 항원에 관하여 유사하지만, 복제하기에 충분한 유전 정보가 없고 따라서 비-감염성이다. 일부 예에서, VLP는 단일 단백질 종, 또는 하나 이상의 단백질 종을 포함할 수도 있다. 하나 이상의 단백질 종을 포함하는 VLP에 대하여, 단백질 종은 바이러스의 같은 종의 것일 수도 있거나, 바이러스의 다른 종, 속, 아과 또는 과 (ICTV 명명법)에 의해 지정됨)의 단백질을 포함할 수도 있다. 다른 예에서, VLP를 포함하는 단백질 종 중 하나 이상은 예를 들어, 본원에서 기술된 변형된 HA와 같이, 자연적으로 발생한 서열로부터 변형될 수도 있다. VLP는 식물 및 곤충 숙주 세포를 포함하는 적합한 숙주 세포에서 생산될 수도 있다. 적합한 조건 하에 숙주 세포로부터 추출 후 및 분리 및 추가의 정제 시, VLP는 온전한 구조로 정제될 수도 있다.
더 나아가, HA 서브타입의 조합을 포함하는 VLP가 생산될 수도 있다. 예를 들어, VLP는 하나 또는 하나 이상의 HA 또는 하나 또는 서브타입 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, 서브타입 B HA 또는 이것들의 조합의 하나 이상의 변형된 HA를 포함할 수도 있다. HA 또는 변형된 HA의 조합의 선택은 VLP로부터 제조된 백신의 의도된 사용에 의해 결정될 수도 있다. 예를 들어, 조류에게 접종하는데 사용되는 백신은 HA 서브타입 또는 변형된 HA 서브타입의 어떤 조합도 포함할 수 있는 한편, 인간에게 접종하는데 유용한 VLP는 서브타입 또는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, 서브타입 B HA의 변형된 서브타입 중 하나 또는 하나 이상의 서브타입을 포함할 수도 있다. 하지만, 다른 HA 서브타입 또는 변형된 HA 서브타입 조합은 VLP의 사용에 따라서 제조될 수도 있다. HA 서브타입 또는 변형된 서브타입의 조합을 포함하는 VLP를 생산하기 위해서, 원하는 HA 서브타입 또는 변형된 HA 서브타입이 같은 세포, 예를 들어, 식물 세포 내에서 동시-발현될 수도 있다.
인플루엔자 유래된 단백질로부터 생산된 VLP는, 본 발명에 따라, M1 단백질을 포함하지 않는다. M1 단백질은 RNA에 결합하는 것으로 알려져 있는데 (Wakefield and Brownlee, 1989) 이것은 VLP 조제물의 오염물질이다. RNA의 존재는 VLP 생성물에 대한 규제 승인을 얻을 때 바람직하지 않으며, 그러므로 RNA가 없는 VLP 조제물이 유익할 수도 있다.
본원에서 기술된 바와 같이 생산된 VLP는 전형적으로 뉴라민다제 (NA)를 포함하지 않는다. 하지만, NA는 HA 및 NA를 포함하는 VLP가 바람직한 경우 HA와 동시-발현될 수도 있다.
본 발명은 VLP 단백질이 발현되는 세포의 원형질막으로부터 지질 외피를 얻는 바이러스 유래된 VLP를 포함하지만, 이에 제한되지 않는다. 예를 들어, VLP가 식물-기반 시스템에서 발현되면, VLP는 세포의 원형질막으로부터 지질 외피를 얻을 수도 있다.
일반적으로, 용어 "지질"은 지방-가용성 (친유성), 자연적으로 발생한 분자를 말한다. 용어는 또한 더 구체적으로 지방산 및 그것들의 유도체 (트리-, 디-, 및 모노글리세리드 및 인지질 포함), 뿐만 아니라 다른 지방-가용성 스테롤-함유 대사산물 또는 스테롤을 말하기 위해 사용된다. 인지질은 당지질, 스테롤 및 단백질과 함께 모든 생물학적 막의 주요 구성요소이다. 인지질의 예는 포스파티딜에탄올아민, 포스프티딜콜린, 포스파티딜이노시톨, 포스파티딜세린, 등을 포함한다. 스테롤의 예는 주스테롤 (예를 들어, 콜레스테롤) 및 피토스테롤을 포함한다. 200개 이상의 피토스테롤이 다양한 식물 종에서 확인되었으며, 가장 일반적인 것은 캄페스테롤, 스티그마스테롤, 에르고테롤, 브라시카스테롤, 델타-7-스티그마스테롤, 델타-7-아베나스테롤, 다우노스테롤, 시토스테롤, 24-메틸콜레스테롤, 콜레스테롤 또는 베타-시토스테롤이다. 당업자가 이해하는 바와 같이, 세포의 원형질막의 지질 조성물은 세포 또는 세포가 얻어지는 유기체의 배양 또는 성장 조건에 따라 다를 수도 있다.
세포 막은 일반적으로 지질 이중층, 뿐만 아니라 다양한 기능을 위한 단백질을 포함한다. 특정 지질의 국소화된 농도는 지질 이중층에서 발견될 수도 있으며, '지질 뗏목(lipid raft)'으로 불린다. 어떤 이론에도 결부되지 않으면서, 지질 뗏목은 세포 내 및 세포 외 유출, 바이러스 또는 다른 감염원의 진입 또는 배출, 세포 간 신호 변환, 세포 내 및 세포 외 매트릭스와 같은 세포 또는 유기체의 다른 구조적 구성요소와의 상호작용에서 중요한 역할을 가질 수도 있다.
식물에서, 원형질막 인플루엔자 VLP는 원형질막으로부터 버딩하며 그러므로 VLP의 지질 조성물은 그것들의 기원을 반영한다. 본 발명에 따라 생성된 VLP는 인플루엔자의 하나 또는 하나 이상의 타입 또는 서브타입의 HA를 포함하며, 식물 유래된 지질과 복합체를 형성하였다. 식물 지질은 특이적 면역 세포를 자극하고 유도된 면역 반응을 향상시킬 수 있다. 식물 막은 지질, 포스프티딜콜린 (PC) 및 포스파티딜에탄올아민 (PE)로 만들어져 있고, 또한 글리코스핑고지질, 사포닌, 및 피토스테롤을 함유한다. 추가적으로, 지질 뗏목은 또한 식물 원형질막에서 발견된다 - 이 마이크로도메인은 스핑고지질 및 스테롤이 풍부하다. 식물에서, 다양한 피토스테롤이 발생하는 것으로 알려져 있으며, 스티그마스테롤, 시토스테롤, 24-메틸콜레스테롤 및 콜레스테롤을 포함한다 (Mongrand et al., 2004).
PC 및 PE, 뿐만 아니라 글리코스핑고지질은 항원-제공 세포 (APC) 유사 수지상세포 및 대식세포와 같은 포유동물 면역 세포 및 흉선 및 간에서 B 및 T 림프구를 포함하는 다른 세포에 의해 발현된 CD1 분자에 결합할 수 있다 (Tsuji M,. 2006). CD1 분자는 등급 I의 주요 조직적합성 복합체 (MHC) 분자와 구조적으로 유사하며 그것들의 역할은 당지질 항원을 NKT 세포 (자연 살해 T 세포)에 제공하는 것이다. 활성화 시, NKT 세포는 NK 세포 및 수지상세포와 같은 선천적 면역 세포를 활성화시키고 또한 항체-생산 B 세포 및 T-세포와 유사한 후천적 면역 세포를 활성화시킨다.
다양한 피토스테롤은 원형질막에서 발견될 수도 있다 - 특이적 보체는 몇 가지 인자를 명명하기 위해서, 종, 성장 조건, 영양소 원천 또는 병원체 상태에 따라 다를 수도 있다. 일반적으로, 베타-시토스테롤은 가장 풍부한 피토스테롤이다.
지질 이중층과 복합체를 형성한 인플루엔자 VLP에 존재하는 피토스테롤, 예를 들어, 원형질막 유래 외피는 유익한 백신 조성물을 제공할 수도 있다. 어떤 이론에도 결부되지 않으면서, 지질 이중층과 복합체를 형성한, 식물에서 만들어진 VLP, 예를 들어, 원형질막 유래 외피는 다른 발현 시스템에서 만들어진 VLP보다 더 강한 면역 반응을 유도할 수도 있고, 살아있는 또는 약독화된 전체 바이러스 백신에 의해 유도된 면역 반응과 유사할 수도 있다.
본원에서 기술된 VLP는 식물-유래 지질 이중층과 복합체를 형성할 수도 있다. 일부 구체예에서, 식물-유래 지질 이중층은 VLP의 외피를 포함할 수도 있다. 식물 유래된 지질은 VLP가 생산되는 식물의 원형질막의 지질 구성요소를 포함할 수도 있으며, 포스프티딜콜린 (PC), 포스파티딜에탄올아민 (PE), 글리코스핑고지질, 피토스테롤 또는 이것들의 조합을 포함하지만, 이에 제한되지 않는다. 식물-유래 지질은 대안으로 '식물 지질'로도 불릴 수 있다. 피토스테롤의 예는 업계에 알려져 있으며, 예를 들어, 스티그마스테롤, 시토스테롤, 24-메틸콜레스테롤 및 콜레스테롤을 포함한다 - 예를 들어, Mongrand et al., 2004 참조.
VLP는 예를 들어, 헤마글루티닌화 검정, 전자 현미경법, 또는 크기 배제 크로마토그래피에 의해 구조 및 크기에 대하여 평가될 수도 있다.
크기 배제 크로마토그래피를 위해서, 전체 가용성 단백질은 추출 버퍼 중에서 동결-파쇄된 식물 재료, 및 원심분리에 의해 제거된 불용성 재료의 샘플을 균질화함으로써 (Polytron) 식물 조직으로부터 추출될 수도 있다. PEG로의 침강이 사용될 수도 있다. 가용성 단백질은 정량화되고, 추출물은 크기 배제 매트릭스, 제한되는 것은 아니지만, 예를 들어, Sephacryl™을 통과하였다. 크로마토그래피 후에, 분획은 분획의 단백질 보체를 결정하기 위해 면역블롯에 의해 더 분석될 수도 있다.
어떤 이론에도 결부되지 않으면서, 다른 동물의 PvBC에 결합하는 HA의 수용량은 시알산 α2,3 또는 α2,3에 대한 HA의 친화도 및 RBC의 표면 상에 이 시알산의 존재에 의해 지시된다. 인플루엔자 바이러스의 말 및 조류 HA는 칠면조, 닭, 오리, 기니피그, 인간, 양, 말 및 소를 포함하는 여러 종 모두의 적혈구를 응집시키는 반면에, 인간 HA는 칠면조, 닭, 오리, 기니피그, 인간 및 양의 적혈구에 결합할 것이다 (또한 Ito T. et al, 1997, Virology, vol 227, p493-499; 및 Medeiros R et al, 2001, Virology, vol 289 p.74-85 참조).
발현된 바이러스 단백질의 올바른 폴딩은 다른 특성들 중에서, 단백질의 안정성, 멀티머의 형성, VLP의 형성, 바이러스 단백질의 기능 및 항체에 의한 바이러스 단백질의 인식에 중요할 수도 있다. 단백질의 폴딩 및 축적은 단백질의 서열, 단백질의 상대적 풍부함, 세포 내 과밀의 정도, 세포 구획의 pH, 폴딩된 것과 결합하거나 일과성으로 결합될 수도 있는 보조인자의 이용 가능성, 부분적으로 폴딩된 또는 언폴딩된(unfolding) 단백질, 하나 이상의 샤페론(chaperone) 단백질의 존재, 등을 포함하지만, 이에 제한되지 않는 하나 이상의 인자에 의해 영향을 받을 수도 있다.
열 충격 단백질 (Hsp) 또는 스트레스 단백질은 샤페론 단백질의 예이며, 이것들은 단백질 합성, 세포 내 트래피킹(intracellular trafficking), 미스폴딩(misfolding)의 방지, 단백질 응집의 방지, 단백질 복합체의 조립 및 분해, 단백질 폴딩, 및 단백질 분해를 포함하는 다양한 세포적 과정에 참여할 수도 있다. 이러한 샤페론 단백질의 예는 Hsp60, Hsp65, Hsp 70, Hsp90, Hsp1OO, Hsp20-30, Hsp1O, Hsp1OO-200, Hsp1OO, Hsp90, Lon, TF55, FKBP, 시클로필린, ClpP, GrpE, 유비퀴틴, 칼넥신, 및 단백질 이황화 이소머라제를 포함하지만, 이에 제한되지 않는다 (예를 들어, Macario, A.J.L., Cold Spring Harbor Laboratory Res. 25: 59-70. 1995; Parsell, D.A. & Lindquist, S. Ann. Rev. Genet. 27: 437-496 (1993); 미국 특허 번호 5,232,833 참조). 본원에서 기술된 바와 같이, 샤페론 단백질, 제한되는 것은 아니지만, 예를 들어, Hsp40 및 Hsp70은 바이러스 단백질의 폴딩을 보장하기 위해 사용될 수도 있다.
Hsp70의 예는 포유동물 세포의 Hsp72 및 Hsc73, 박테리아, 특히 미코박테리아, 예를 들어, 미코박테리움 레프래(Mycobacterium leprae), 미코박테리움 튜버쿨로시스(Mycobacterium tuberculosis), 및 미코박테리움 보비스(Mycobacterium bovis)의 DnaK (예를 들어, 바실-칼메테 구에린(Bacille-Calmette Guerin): 본원에서 Hsp71로 불림), 대장균(Escherichia coli), 이스트 및 다른 원핵생물의 DnaK, 및 진핵생물, 예를 들어, 아라비돕시스 탈리아나(A. thaliana)의 BiP 및 Grp78을 포함한다 (Lin et al. 2001 (Cell Stress and Chaperones 6: 201-208). Hsp70의 특정 예는 아라비돕시스 탈리아나 Hsp70 (Genbank 참조번호: AY120747.1에 의해 암호화됨)이다. Hsp70은 ATP, 뿐만 아니라 언폴딩된 폴리펩타이드 및 펩타이드에 특이적으로 결합하여, 이로 인해 단백질 폴딩 및 언폴딩, 뿐만 아니라 단백질 복합체의 조립 및 분해에도 참여할 수 있다.
Hsp40의 예는 원핵생물, 예를 들어, 대장균 및 미코박테리아의 DnaJ 및 진핵생물, 예를 들어, 알팔파의 HSJ1, HDJ1 및 Hsp40을 포함한다 (Frugis et al., 1999. Plant Molecular Biology 40: 397-408). Hsp40의 특정 예는 메디카고 사티바(M. sativa) MsJ1이다 (Genbank 참조번호: AJ000995.1). Hsp40은 다른 세포 활성 중에, 단백질 폴딩, 열 내성 및 DNA 복제에서 분자 샤페론의 역할을 한다.
Hsps, Hsp70 및 그것의 보조-샤페론 중에서, Hsp40은 번역의 안정화에 수반되고 합성이 완료되기 전에 및 새로 합성된 폴리펩타이드이다. 어떤 이론에도 결부되지 않으면서, Hsp40은 언폴딩된 (초기의 또는 새로 이동된) 폴리펩타이드의 소수성 패치(patch)에 결합하며, 따라서 폴리펩타이드와 Hsp70-ATP 복합체의 상호작용을 용이하게 한다. ATP 가수분해는 폴리펩타이드, Hsp70 및 ADP 사이에서 안정한 복합체의 형성, 및 Hsp40의 방출로 이어진다. 폴리펩타이드의 소수성 패치와 Hsp70-ADP의 결합은 다른 소수성 패치와 그것들의 상호작용을 방지하며, 올바르지 않은 폴딩 및 다른 단백질과의 응집체 형성을 방지한다 (Hartl, FU. 1996. Nature 381: 571-579에서 재검토됨).
고유한 샤페론 단백질은 낮은 수준의 재조합 단백질의 올바른 폴딩을 용이하게 할 수도 있지만, 발현 수준이 증가함에 따라, 고유한 샤페론의 풍부함은 제한 인자가 될 수도 있다. 아그로필트레이션된 잎에서 바이러스 단백질의 높은 수준의 발현은 시토졸에서 바이러스 단백질의 축적으로 이어질 수도 있고, Hsp70, Hsp40 또는 Hsp70 및 Hsp40 둘 다와 같은 하나 또는 하나 이상의 샤페론 단백질의 동시-발현은 미스폴딩된 또는 응집된 단백질의 수준을 감소시킬 수도 있고, 바이러스-유사 입자의 형성을 허용하는 3차 및 4차 구조적 특성을 나타내는 단백질의 수를 증가시킬 수도 있다.
그러므로, 본 발명은 또한 식물에서 바이러스 단백질 VLP를 생산하는 방법을 제공하는데, 바이러스 단백질을 암호화하는 제1 핵산은 채널 단백질, 제한되는 것은 아니지만, 예를 들어, 양성자 채널 단백질을 암호화하는 제2 핵산, 및 샤페론을 암호화하는 제3 핵산과 함께 동시-발현된다. 제1, 제2 및 제3 핵산은 같은 단계에서 식물로 도입될 수도 있거나, 또는 순차적으로 식물로 도입될 수도 있다.
식물 내에서 생산된 VLP는 식물-특이적 N-글리칸을 포함하는 바이러스 단백질을 유도할 수도 있다. 그러므로, 본 발명은 또한 식물 특이적 N-글리칸을 가진 바이러스 단백질을 포함하는 VLP를 제공한다.
더 나아가, 식물에서 N-글리칸의 변형이 알려져 있고 (예를 들어, WO 2008/151440; WO 2010/006452; 또는 U.S. 60/944,344 참조; 이것들은 본원에 참고로 포함됨) 변형된 N-글리칸을 가진 바이러스 단백질이 생산될 수도 있다.
변형된 글리코실화 패턴을 포함하는, 예를 들어, 푸코실화되거나, 자일로실화되거나, 또는 푸코실화 및 자일로실화된 N-글리칸이 감소된 바이러스 단백질이 얻어질 수도 있거나, 또는 변형된 글리코실화 패턴을 가진 바이러스 단백질이 얻어질 수도 있는데, 단백질은 푸코실화, 자일로실화, 또는 둘 다가 없고, 증가된 갈락토실화를 포함한다. 더 나아가, 번역 후 변형, 예를 들어, 말단 갈락토스의 추가의 조절은 바이러스 단백질을 발현하는 야생형 식물과 비교하여 발현된 바이러스 단백질의 푸코실화 및 자일로실화의 감소를 초래할 수도 있다.
예를 들어, 제한하는 것으로 간주되는 것은 아닌, 변형된 글리코실화 패턴을 가진 바이러스 단백질의 합성은 베타-1.4갈락토실트랜스퍼라제 (GalT), 제한되는 것은 아니지만, 예를 들어, 포유동물 GalT, 또는 인간 GalT를 암호화하는 뉴클레오타이드 서열과 함께 원하는 단백질을 동시-발현시킴으로써 달성될 수도 있지만 또 다른 공급원의 GalT가 또한 사용될 수도 있다. GalT의 촉매 도메인은 또한 GNT1 -GalT 하이브리드(hybrid) 효소를 생산하기 위해 N-아세틸글루코사미닐 트랜스퍼라제 (GNT1)의 CTS 도메인 (즉 세포질 꼬리, 막관통 도메인, 줄기 영역)에 융합될 수도 있고, 하이브리드 효소는 바이러스 단백질과 동시-발현될 수도 있다. 바이러스 단백질은 또한 N-아세틸글루코사미닐 트랜스퍼라제 III (GnT-III), 제한되는 것은 아니지만, 예를 들어, 포유동물 GnT-III 또는 인간 GnT-III를 암호화하는 뉴클레오타이드 서열과 함께 동시-발현될 수도 있고, 다른 공급원의 GnT-III도 또한 사용될 수 있다. 추가적으로, GnT-III에 융합된 GNT1의 CTS를 포함하는 GNT1-GnT-III 하이브리드 효소가 또한 사용될 수도 있다.
그러므로 본 발명은 또한 변형된 N-글리칸을 가진 하나 이상의 바이러스 단백질을 포함하는 VLP를 포함한다.
변형된 HA를 생산하기 위해 본 발명과 함께 사용될 수도 있는 서열의 비제한 예는 또한 WO 2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/148511; WO 2010/003235; WO 2010/006452 (이것들은 본원에 참고로 포함되지 않음)에서 기술된 것들, 제한되는 것은 아니지만, 예를 들어, 다음을 포함한다:
예를 들어, A/Brisbane/59/2007 (H1N1), A/New Caledonia/20/99 (H1N1), A/Solomon Islands 3/2006 (H1N1),/PuertoRico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1) 균주의 핵산 분자에 의해 암호화된 H1 단백질;
A/Singapore/1/57 (H2N2) 균주의 것일 수도 있는 핵산 분자에 의해 암호화된 H2 단백질;
A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2) 균주, A/Victoria/361/2011 (H3N2) 또는 A/Perth/16/2009 (H3N2)의 것일 수도 있는 핵산 분자에 의해 암호화된 H3 단백질;
A/Anhui/1/2005 (H5N1), A/Indonesia/5/2005 (H5N1), A/Vietnam/1194/2004 (H5N1)의 것일 수도 있는 핵산 분자에 의해 암호화된 H5 단백질;
A/Teal/HongKong/W312/97 (H6N1) 균주의 것일 수도 있는 핵산 분자에 의해 암호화된 H6 단백질;
A/Hangzhou/1/13 (H7N9), A/Equine/Prague/56 (H7N7) 균주의 것일 수도 있는 핵산 분자에 의해 암호화된 H7 단백질;
A/HongKong/1073/99 (H9N2) 균주의 것일 수도 있는 핵산 분자에 의해 암호화된 H9 단백질;
B/Florida/4/2006, B/Massachusetts/2/12, B/Malaysia/2506/2004, B/Wisconsin/1/2010, 또는 B/Brisbane/60/2008 균주의 것일 수도 있는 핵산에 의해 암호화된 B 서브타입의 HA 단백질.
구조 # | 발현 인핸서 | 증폭 요소 | 설명 | 실시예 |
1261 | CPMV-HT | A/New Caledonia/20/1999 (H1N1) | 실시예 5.1 | |
859 | CPMV-HT | A/Puerto Rico/8/1934 (H1N1) | 실시예 5.2 | |
1008 | CPMV-HT | BeYDV | B/Brisbane/60/2008 | 실시예 5.3 |
1059 | CPMV-HT | BeYDV | 결실된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008 | 실시예 5.4 |
1462 | CPMV-HT | BeYDV | B/Wisconsin/1/2010 | 실시예 5.5 |
1467 | CPMV-HT | BeYDV | 결실된 단백질 가수분해 루프를 가진 B/Wisconsin/1/2010 | 실시예 5.6 |
1039 | CPMV-HT | 결실된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008 | 실시예 5.7 | |
1029 | CPMV-HT | B/Brisbane/60/2008 | 실시예 5.11 | |
1829 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008 | 실시예 5.12 | |
1937 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008 | 실시예 5.13 | |
1067 | CPMV-HT | 결실된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008+H1 California TMCT | 실시예 5.14 | |
1977 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008+H1 California TMCT | 실시예 5.14 | |
1875 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 B/Brisbane/60/2008+H1 California TMCT | 실시예 5.19 | |
676 | CPMV-HT | TETR 분열 부위를 가진 H5 A/Indonesia/5/2005 | 실시예 5.8 | |
766 | CPMV-HT | TETQ 분열 부위를 가진 H5 A/Indonesia/5/2005 | 실시예 5.9 | |
928 | CPMV-HT | 결실된 단백질 가수분해 루프를 가진 H5 A/Indonesia/5/2005 | 실시예 5.10 | |
489 | CPMV-HT | H5 A/Indonesia/5/2005 (고유한) | 실시예 5.24 | |
2220 | CPMV-HT+ | H2 A/Singapore/1/57 (고유한) | 실시예 5.27 | |
2221 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 H2 A/Singapore/1/57 | 실시예 5.28 | |
2222 | CPMV-160+ | H2 A/Singapore/1/57 (고유한) | 실시예5.29 | |
2223 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 H2 A/Singapore/1/57 | 실시예5.29 | |
2019 | CPMV-HT+ | H3 A/Perth/16/09 (고유한) | 실시예 5.30 | |
2039 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 H3 A/Perth/16/09 | 실시예 5.31 | |
2139 | CPMV-160+ | H3 A/Perth/16/09 (고유한) | 실시예 5.30 | |
2159 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 H3 A/Perth/16/09 | 실시예 5.31 | |
1819 | CPMV-HT+ | H3 A/Victoria/361/11 (고유한) | 실시예 5.26 | |
2230 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 H3 A/Victoria/361/11 | 실시예 5.32 | |
1800 | CPMV-160+ | H3 A/Victoria/361/11 (고유한) | 실시예 5.25 | |
2250 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 H3 A/Victoria/361/11 | 실시예 5.32 | |
2142 | CPMV-HT+ | H7 A/Hangzhou/1/13 (고유한) | 실시예 5.33 | |
2152 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 H7 A/Hangzhou/1/13 | 실시예 5.34 | |
2224 | CPMV-HT+ | H9 A/Hong Kong/1073/99 (고유한) | 실시예 5.35 | |
2225 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 H9 A/Hong Kong/1073/99 | 실시예 5.36 | |
2226 | CPMV-160+ | H9 A/Hong Kong/1073/99 (고유한) | 실시예 5.35 | |
2227 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 H9 A/Hong Kong/1073/99 | 실시예 5.36 | |
2013 | CPMV-160+ | B/Malaysia/2506/04 (고유한) | 실시예 5.37 | |
2014 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 B/Malaysia/2506/04 | 실시예 5.38 | |
2070 | CPMV-HT | B/Massachusetts/2/12 (고유한) | 실시예 5.39 | |
2072 | CPMV-HT | 결실된 단백질 가수분해 루프를 가진 B/Massachusetts/2/12 | 실시예 5.15 | |
2080 | CPMV-HT+ | B/Massachusetts/2/12 (고유한) | 실시예 5.39 | |
2052 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 B/Massachusetts/2/12 | 실시예 5.20 | |
2090 | CPMV-160+ | B/Massachusetts/2/12 (고유한) | 실시예 5.39 | |
2050 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 B/Massachusetts/2/12 | 실시예 5.15 | |
2074 | CPMV HT | HA B/Massachusetts/2/12 (PrL-)+H1 California TMCT | 실시예 5.16 | |
2060 | CPMV-160+ | HA B/Massachusetts/2/12 (PrL-)+H1 California TMCT | 실시예 5.16 | |
2062 | CPMV-HT+ | HA B/Massachusetts/2/12 (PrL-)+H1 California TMCT | 실시예 5.21 | |
1445 | CPMV HT | 결실된 단백질 가수분해 루프를 가진 (PrL-) B/Wisconsin/1/2010 | 실시예 5.17 | |
1839 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 (PrL-) B/Wisconsin/1/2010 | 실시예 5.22 | |
1820 | CPMV160+ | 결실된 단백질 가수분해 루프를 가진 (PrL-) B/Wisconsin/1/2010 | 실시예 5.17 | |
1975 | CPMV160 | 결실된 단백질 가수분해 루프를 가진 (PrL-) B/Wisconsin/1/2010 | 실시예 5.17 | |
1454 | CPMV-HT | 결실된 단백질 가수분해 루프를 가진 (PrL-) HA B Wisconsin+H1 California TMCT | 실시예 5.18 | |
1893 | CPMV-160+ | 결실된 단백질 가수분해 루프를 가진 (PrL-) HA B Wisconsin+H1 California TMCT | 실시예 5.18 | |
1860 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 (PrL-) HA B Wisconsin+H1 California TMCT | 실시예 5.23 | |
2102 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 (PrL-) B Florida | 실시예 5.40 | |
2104 | CPMV-HT+ | BeYDV | 결실된 단백질 가수분해 루프를 가진 (PrL-) B Florida | 실시예 5.40 |
2016 | CPMV-HT+ | 결실된 단백질 가수분해 루프를 가진 (PrL-) B Florida+H1 California TMCT | 실시예 5.41 | |
2108 | CPMV-HT+ | BeYDV | 결실된 단백질 가수분해 루프를 가진 (PrL-) B Florida+H1 California TMCT | 실시예 5.41 |
서열 번호: | 설명 |
도면
|
서열 번호: | 설명 |
도면
|
1 | 조류 H5 단백질 가수분해 루프 공통 서열 | 102 | HA B Wisconsin (PrL-)의 아미노산 서열. | 36B | |
2 | IF-H5A-I-05.s1+3c | 1A | 103 | HA B Wisconsin (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 | 37A |
3 | IF-H5dTm.r | 1B | 104 | HA B Wisconsin (PrL-)+H1 California TMC의 아미노산 서열 | 37B |
4 | 구조 1191 | 1D | 105 | PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 | 38A |
5 | 카세트 489 | 1E | 106 | PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열 | 38B |
6 | 아미노산 서열 H5 A/Indonesia/5/2005 (H5N1) | 1F | 107 | PDISP/HA B Massachusetts (PrL-)의 뉴클레오타이드 서열 | 39A |
7 | IF-S1-M1+M2ANC.c | 2A | 108 | PDISP/HA B Massachusetts (PrL-)의 아미노산 서열 | 39B |
8 | IF-S1-4-M2ANC.r | 2B | 109 | PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 | 40A |
9 | 합성 M2 (DQ508860의 715-982에 결합된 nt 1-26) | 2C | 110 | PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열 | 40B |
10 | 카세트 1261 | 2D | 111 | HA B Wisconsin (PrL-)의 뉴클레오타이드 서열 | 41A |
11 | M2 from influenza A/New Caledonia/20/1999 (H1N1) | 2E | 112 | HA B Wisconsin (PrL-)의 아미노산 서열 | 41B |
12 | 합성 M2 (EF467824의 nt 740-1007에 결합된 nt 26-51) | 3A | 113 | HA B Wisconsin (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 | 42A |
13 | 카세트 859 | 3B | 114 | HA B Wisconsin (PrL-)+H1 California TMC의 아미노산 서열 | 42B |
14 | 아미노산 서열 M2 influenza A/Puerto Rico/8/1934 (H1N1) | 3C | 115 | 고유한 H5 Indonesia의 뉴클레오타이드 서열 | 43A |
15 | 카세트 1039 | 8A | 116 | 고유한 H5 Indonesia의 아미노산 서열 | 43B |
16 | B/Brisbane/60/2008 아미노산 서열 | 21A | 117 | IF**(SacII)-PDI.s1+4c | 44A |
17 | 아미노산 서열 타입 B HA (링커 GG를 가짐)의 델타-단백질 가수분해 루프 | 21B | 118 | IF-H3V36111.s1-4r | 44B |
18 | B HA의 분열 부위를 링커로 대체하는 아미노산 서열 | 21C | 119 | PDISP/H3 Victoria의 뉴클레오타이드 서열 | 44C |
19 | 아미노산 서열 H3 A/Perth/16/2009 | 21D | 120 | 구조 2171 | 44E |
20 | 아미노산 서열 델타-단백질 가수분해 루프 H3 (링커 GS를 가짐) | 21E | 121 | 구조 1800 | 44F |
21 | H3의 분열 부위를 링커로 대체하는 아미노산 서열 | 21F | 122 | PDISP/H3 Victoria의 아미노산 서열 | 44G |
22 | H1 New Cal 링커 영역 | 15 | 123 | IF(SacII)-Kozac_PDI.c | 45A |
23 | H1 Brisbane 링커 영역 | 15 | 124 | IF-H3V36111.s1-4r | 45B |
24 | H1 Sol Islands 링커 영역 | 15 | 125 | 구조 2181 | 45D |
25 | H2A Singapore 링커 영역 | 15 | 126 | 구조 1819 | 45E |
26 | H3A Brisbane 링커 영역 | 15 | 127 | IF**-H2S157.s1-6r | 48A |
27 | H3A WCN 링커 영역 | 15 | 128 | PDISP/H2 Singapore의 뉴클레오타이드 서열 | 48B |
28 | H5 Anhui 링커 영역 | 15 | 129 | 발현 카세트 번호 2220 | 48C |
29 | H5 Indo 링커 영역 | 15 | 130 | PDISP/H2 Singapore의 아미노산 서열 | 48D |
30 | H5 Vietnam 링커 영역 | 15 | 131 | H2S157(Prl-).r | 49A |
31 | 구조 1194 | 4B | 132 | H2S157(Prl-).c | 49B |
32 | 카세트 1008 | 4C | 133 | 발현 카세트 번호 2221 | 49C |
33 | H6 Teal HK 링커 영역 | 15 | 134 | 결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore의 아미노산 서열 | 49D |
34 | H7 Eq Prague 링커 영역 | 15 | 135 | 발현 카세트 번호 2222 | 50A |
35 | H9A HK 링커 영역 | 15 | 136 | 발현 카세트 번호 2223 | 50B |
36 | B Florida 링커 영역 | 15 | 137 | PDISP/H3 Perth의 뉴클레오타이드 서열 | 51A |
37 | B Malaysia | 15 | 138 | IF**-H3P1609.S1-6r | 51B |
38 | 1039+1059.r | 5A | 139 | PDISP/H3 Perth의 아미노산 서열 | 51C |
39 | 1039+1059.c | 5B | 140 | 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth의 뉴클레오타이드 서열 | 52A |
40 | 카세트 1059 | 5C | 141 | H3P1609(Prl-)#2.r | 52B |
41 | 아미노산 서열 PDISP/HA influenza B/Brisbane/60/2008 (결실된 단백질 가수분해 루프) | 5D | 142 | H3P1609(Prl-)#2.c | 52C |
42 | 뉴클레오타이드 서열 H5 A/Indonesia/5/2005 (H5N1) | 1G | 143 | 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth의 아미노산 서열 | 52D |
43 | 뉴클레오타이드 서열 PDISP/HA influenza B/Brisbane/60/2008 (결실된 단백질 가수분해 루프) | 5E | 144 | 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria의 뉴클레오타이드 서열 |
53A |
44 | H5/Indo 분열 부위 천연 서열 | 19 | 145 | H3V36111(Prl-).r | 53B |
45 | H5/Indo 변형된 분열 부위 (TETR) | 19 | 146 | H3V36111(Prl-).c | 53C |
46 | H5/Indo 변형된 분열 부위 (TETQ) | 19 | 147 | 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria의 아미노산 서열 | 53D |
47 | H1 분열 부위 | 표 1 | 148 | PDISP/H7 Hangzhou의 뉴클레오타이드 서열 | 54A |
48 | H3 분열 부위 | 표 1 | 149 | IF*-H7H113.s1-6r | 54B |
49 | IF-HAB110.S1+3c | 6A | 150 | PDISP/H7 Hangzhou의 아미노산 서열 | 54C |
50 | IF-HAB110.s1-4r | 6B | 151 | 결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou의 뉴클레오타이드 서열 | 55A |
51 | 합성 HA B Wisconsin | 6C | 152 | H7H113(PrL-).r | 55B |
52 | 구조 193 | 6E | 153 | H7H113(PrL-).c | 55C |
53 | 카세트 1462 | 6F | 154 | 결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou의 아미노산 서열 | 55D |
54 | 아미노산 서열 HA influenza B/Wisconsin/1/2010 | 6G | 155 | PDISP/H9 Hong Kong의 뉴클레오타이드 서열 | 56A |
55 | HAB110(PrL-).r | 7A | 156 | IF**-H9HK107399.S1-6r | 56B |
56 | HAB110(PrL-).c | 7B | 157 | PDISP/H9 Hong Kong의 아미노산 서열 | 56C |
57 | 카세트 1467 | 7C | 158 | 결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong의 뉴클레오타이드 서열 | 57A |
58 | 아미노산 서열 HA influenza B/Wisconsin/1/2010 (결실된 PL) | 7D | 159 | H9HK107399(Prl-).r | 57B |
59 | B 분열 부위 | 표 1 | 160 | H9HK107399(Prl-).c | 57C |
60 | H5/Indo 분열 부위 | 표 2 | 161 | 결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong의 아미노산 서열 | 57D |
61 | H5/Indo 변형된 분열 부위 | 표 2 | 162 | PDISP/HA B Malaysia의 뉴클레오타이드 서열 | 58A |
62 | H5/Indo 변형된 분열 부위 | 표 2 | 163 | IF**-HBM250604.S1-6r | 58B |
63 | H1/Brisbane 변형된 분열 부위 | 표 2 | 164 | PDISP/HA B Malaysia의 아미노산 서열 | 58C |
64 | H3/Brisbane 변형된 분열 부위 | 표 2 | 165 | 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia의 뉴클레오타이드 서열 | 59A |
65 | B/Florida, B/Brisbane 변형된 분열 부위 | 표 2 | 166 | HBM250604(PrL-).r | 59B |
66 | A/H3/HA0 공통 | 167 | HBM250604(PrL-).c | 59C | |
67 | A/H1/HA0 공통 | 168 | 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia의 아미노산 서열 | 59D | |
68 | B/HA0 공통 | 169 | PDISP/HA B Massachusetts의 뉴클레오타이드 서열 | 60A | |
69 | H5 Anhui 단백질 가수분해 루프 결실 | 18C | 170 | PDISP/HA B Massachusetts의 아미노산 서열 | 60B |
70 | H5 Indo 단백질 가수분해 루프 결실 | 18C | 171 | PatA SP의 뉴클레오타이드 서열 | |
71 | H5 Vietnam 단백질 가수분해 루프 결실 | 18C | 172 | 파타틴 A 신포 펩타이드의 아미노산 서열 | |
72 | B Florida 단백질 가수분해 루프 결실 | 18C | 173 | CPMV HT 서열 | |
73 | B Malaysia 단백질 가수분해 루프 결실 | 18C | 174 | 식물 공통 코자크 서열 - 식물계 | |
74 | MutCleavage-H5(Indo).r | 23A | 175 | 식물 공통 코자크 서열- 쌍떡잎식물 | |
75 | MutCleavage-H5(Indo).c | 23B | 176 | 식물 공통 코자크 서열 -애기장대 | |
76 | 카세트 676 | 23C | 177 | 식물 공통 코자크 서열 | |
77 | 아미노산 서열 인플루엔자 A/Indonesia/5/2005 (H5N1) TETR 분열 부위 돌연변이 | 23D | 178 | 식물 공통 코자크 서열 | |
78 | H5I505_TETQ.r | 24A | 179 | 식물 공통 코자크 서열 | |
79 | H5I505_TETQ.c | 24B | 180 | 식물 공통 코자크 서열 | |
80 | 카세트 766 | 25C | 181 | 식물 공통 코자크 서열 | |
81 | 아미노산 서열 인플루엔자 A/Indonesia/5/2005 (H5N1) TETQ 분열 부위 돌연변이 | 25D | 182 | 식물 공통 코자크 서열 | |
82 | H5I505(PrL-).r | 26A | 183 | 식물 공통 코자크 서열 | |
83 | H5I505(PrL-).c | 26B | 184 | 식물 공통 코자크 서열 | |
84 | 카세트 928 | 26C | 185 | 식물 공통 코자크 서열 | |
85 | 아미노산 서열 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Indonesia/5/2005 (H5N1). | 26D | 186 | 코자크 공통 서열 | |
86 | IF-S2+S4-B Bris.c | 30A | 187 | CPMV HT+의 뉴클레오타이드 서열 | |
87 | IF-S1a4-B Bris.r | 30B | 188 | CPMV HT+511의 뉴클레오타이드 서열 | |
88 | 합성된 HA B Brisbane 유전자 | 30C | 189 | CPMV HT+[WT115]의 뉴클레오타이드 서열 | |
89 | 구조 1029 | 30D | 190 | HBF406(PrL-).r | 61A |
90 | 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 아미노산 서열 |
30E | 191 | HBF406(PrL-).c | 61B |
91 | PDISP/HA B Brisbane (PrL-)의 뉴클레오타이드 서열 | 31A | 192 | IF*-HBF406.s1-6r | 61C |
92 | PDISP/HA B Brisbane (PrL-)의 아미노산 서열 | 31B | 193 | 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida의 뉴클레오타이드 서열 | 61D |
93 | CPMVX/CPMVX+의 뉴클레오타이드 서열 | 194 | 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida의 아미노산 서열 | 61E | |
94 | 막관통 도메인의 공통 아미노산 서열 | 195 | 발현 카세트 번호 2102 | 61F | |
95 | PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 | 33A | 196 | 발현 카세트 번호 2104 | 61H |
96 | PDISP/HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열 | 33B | 197 | IF-H1cTMCT.S1-4r | 62A |
97 | PDISP/HA B Massachusetts (PrL-)의 뉴클레오타이드 서열 | 34A | 198 | 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida+H1Cal TMCT의 뉴클레오타이드 서열 | 62B |
98 | PDISP/HA B Massachusetts (PrL-)의 아미노산 서열 | 34B | 199 | 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Florida+H1Cal TMCT의 아미노산 서열 | 62C |
99 | PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 뉴클레오타이드 서열 | 35A | 200 | 발현 카세트 번호 2106 | 62D |
100 | PDISP/HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열 | 35B | 201 | 발현 카세트 번호 2108 | 62F |
101 | HA B Wisconsin (PrL-)의 뉴클레오타이드 서열 | 36A |
실시예
실시예
1
아그로박테리움
트랜스펙션
아그로박테리움 균주 AGL1을 D'Aoust et al 2008 (Plant Biotechnology Journal 6: 930-940)에 의해 기술된 방법을 사용하여 DNA 구조로 전기천공법에 의해 트랜스펙션하였다. 트랜스펙션된 아그로박테리움을 10 mM 2-(N-모폴리노)에탄술폰산 (MES), 20 μM 아세토시린곤, 50 μg/ml 카나마이신 및 25 μg/ml의 카베니실린 pH 5.6으로 보충된 YEB 배지에서 0.6 내지 1.6의 OD600으로 키웠다. 아그로박테리움 현탁액을 사용 전에 원심분리하였고 침윤 배지 (10 mM MgCl2 및 10 mM MES pH 5.6)에서 재현탁하였다.
식물
바이오매스
,
접종원
및
아그로인필트레이션
용어 "바이오매스" 및 "식물"은 본원에서 사용된 바와 같이 식물로부터 유래된 어떤 재료도 반영하는 것을 의미한다. 바이오매스 또는 식물은 전체 식물, 조직, 세포, 또는 이것들의 어떤 분획을 포함할 수도 있다. 이에 더하여, 바이오매스 또는 식물은 세포 내 식물 구성요소, 세포 외 식물 구성요소, 식물의 액체 및 고체 추출물, 또는 이것들의 조합을 포함할 수도 있다. 이에 더하여, 바이오매스 또는 식물은 식물 잎, 줄기, 과실, 뿌리 또는 이것들의 조합의 식물, 식물 세포, 조직, 액체 조성물, 또는 이것들의 조합을 포함할 수도 있다. 식물의 일부는 식물 또는 바이오매스를 포함할 수도 있다.
니코티아나 벤타미아나 식물을 상업적인 피트 모스(peat moss) 기질로 채워진 평판에서 종자로부터 키웠다. 식물을 16/8 광주기 및 25℃ 낮/20℃ 밤의 온도상 하에 온실에서 성장하게 하였다. 파종 후 3주에, 개개의 묘목을 골라서, 화분에 옮겨 심었고 같은 환경 조건 하에 추가적인 3주 동안 온실에서 성장하게 내버려 두었다.
각 구조로 트랜스펙션된 아그로박테리아(agrobacteria)를 그것들이 0.6 내지 1.6의 OD600에 도달할 때까지 10 mM 2-(N-모폴리노)에탄술폰산 (MES), 20 μM 아세토시린곤, 50 μg/ml 카나마이신 및 25 μg/ml의 카베니실린 pH 5.6으로 보충된 YEB 배지에서 키웠다. 아그로박테리움 현탁액을 사용 전에 원심분리하였고 침윤 배지 (10 mM MgCl2 및 10 mM MES pH 5.6)에서 재현탁하였고 4℃에서 하룻밤 동안 저장하였다. 침윤의 날에, 배양 배취(batch)를 2.5 배양 부피로 희석하였고 사용 전에 가온하였다. 니코티아나 벤타미아나(N. benthamiana)의 전체 식물을 2분 동안 20-40 Torr의 진공 하에 밀폐된 스테인레스강 탱크에서 박테리아 현탁액에서 거꾸로 배치하였다. 식물을 수득할 때까지 2-6일 배양 기간 동안 온실로 복귀시켰다.
잎 수득 및 총 단백질 추출
배양 후, 식물의 지상부를 수득하였고, -80℃에서 냉동시켰고 조각으로 파쇄하였다. 총 가용성 단백질을 3배 부피의 차가운 50 mM Tris pH 8.0, 0.5 M NaCl, 0.1% Triton X-100 및 1 mM 페닐메탄술포닐 플루오라이드에서 동결-파쇄된 식물 재료의 각 샘플을 균질화함으로써 (Polytron) 추출하였다. 균질화 후, 슬러리를 4℃에서 10분 동안 10,000 g에서 원심분리하였고 이 정화된 미가공 추출물 (상층액)을 분석을 위해 유지하였다.
단백질 분석 및
면역블롯팅
정화된 미가공 추출물의 총 단백질 함량을 참조 기준으로서 소 혈청 알부민을 사용하여 브래드포드 검정(Bradford assay) (Bio-Rad, Hercules, CA)에 의해 결정하였다. 단백질을 SDS-PAGE로 분리하였고 면역검출을 위해 폴리비닐렌 디플루오라이드 (PVDF) 막 (Roche Diagnostics Corporation, Indianapolis, IN)으로 전기이동시켰다. 면역블롯팅 전에, 막을 4℃에서 16-18시간 동안 Tris-완충된 식염수 (TBS-T) 중의 5% 탈지 분유 및 0.1% Tween-20으로 차단하였다.
면역블롯팅을 TBS-Tween 20 0.1% 중의 2% 탈지 분유에서 2 μg/ml의 1차 항체와 함께 1차 배양으로 수행하였다 (표 5는 각 HA의 검출에 사용된 항체 및 조건을 제공한다). 화학 발광 검출에 사용된 2차 항체는 표 4에서 표시된 바와 같았으며, TBS-Tween 20 0.1% 중의 2% 탈지 분유에서 표시된 바와 같이 희석하였다. 면역반응성 복합체를 기질 (Roche Diagnostics Corporation)로서 루미놀을 사용하는 화학 발광에 의해 검출하였다. 인간 IgG 항체의 홀스래디쉬(horseradish) 퍼옥시다제-효소 컨쥬게이션(conjugation)을 EZ-Link Plus® Activated Peroxidase 컨쥬게이션 키트 (Pierce, Rockford, IL)를 사용함으로써 수행하였다.
HA 서브타입 | 인플루엔자 균주 | 전기영동 조건 | 1차 항체 | 희석 배수 | 2차 항체 | 희석 배수 |
B | B/Brisbane/60/2008 | 비-환원성 | TGA, AS397 | 1:20000 | 토끼 항-양 (JIR 313-035-045) | 1:10 000 |
B | B/Wisconsin/1/2010 | 비-환원성 | NIBSC 07/356 | 1:2000 | 토끼 항-양 (JIR 313-035-045) | 1:10 000 |
B | B/Malaysia/2506/2004 | 비-환원성 | NIBSC 07/184 | 1:2000 | 토끼 항-양 (JIR 313-035-045) | 1:10 000 |
H3 | A/Perth/16/2009 (H3N2) | 비-환원성 | TGA, AS400 | 1:20000 | 토끼 항-양 (JIR 313-035-045) | 1:10 000 |
H3 | A/Victoria/361/2011 | 비-환원성 | TGA, AS400 | 1:20000 | 토끼 항-양 (JIR 313-035-045) | 1:10 000 |
H1 | A/California/07/2009 (H1N1) | 환원성 | Sino, 11055-MMO1 | 1 μg/ml | 염소 항-마우스 (JIR 115-035-146) | 1:7 500 |
H5 | A/Indonesia/05/2005 (H5N1) | 환원성 | CBER, S-7858 | 1:4000 | 토끼 항-양 (JIR 313-035-045) | 1:10 000 |
JIR: Jackson ImmunoResearch, West Grove, PA, USA;
CBER: 생물학적 제제 평가 및 연구센터(Center for Biologies Evaluation and Research), Rockville, MD, USA.
Sino: Sino Biological inc., Beijing, China.
TGA: Therapeutic Goods Administration, Australia.
NIBSC: 영국 국립생물표준통제연구원
헤마글루티닌화
검정
헤마글루티닌화 검정은 Nayak 및 Reichl (2004)에 의해 기술된 방법에 기초하였다. 간략히 말해서, 테스트 샘플 (100 μL)의 단계적 두 배 희석이 100 μL PBS를 함유하는 V-바닥 96-웰 미세역가 플레이트에서 이루어졌으며, 웰 당 100 μL의 희석된 샘플을 남겨두었다. 100 마이크로리터의 0.25% 칠면조 적혈구 세포 현탁액 (Bio Link Inc., Syracuse, NY)을 각 웰에 추가하였고, 플레이트를 실온에서 2시간 동안 배양하였다. 완전한 헤마글루티닌화를 나타내는 가장 높은 희석 배수의 역수를 HA의 활성으로서 기록하였다. 동시에 재조합 HA 기준 (A/Vietnam 1203/2004 H5N1) (Protein Science Corporation, Meriden, CT)을 PBS에서 희석하였고 각 플레이트에서 대조군으로서 실행하였다.
세포벽 분해에 의한
VLP
추출
잎 조직을 니코티아나 벤타미아나 식물로부터 수거하였고 ~1 cm2 조각으로 잘랐다. 잎 조각을 실온 (RT)에서 30분 동안 500 mM 만니톨에 담가두었다. 만니톨 용액을 이어서 제거하였고 원형질체화(protoplasting) 용액 (500 mM 만니톨, 10mM CaCl2 및 5 mM MES/KOH (pH 5.6)) 중의 효소 혼합물 (트리코더마 비리대(Trichoderma viride)의 셀룰라제 (Onozuka R-10; 3 부피%)의 혼합물 및 리조푸스 종(Rhizopus sp.)의 펙티나제 (MACEROZYME™; 0.75 부피%)의 혼합물; 둘 다 Yakult Pharmaceuticals의 것)로 교환하였다. 사용된 비율은 100 mL 용액 당 20 g 잎 조각이었다. 이 조제물을 얕은 용기 (~11x18 cm)에 골고루 분산시켰고 40 rpm 및 26℃에서 회전 쉐이커(rotary shaker) 상에서 16시간 동안 배양하였다.
대안으로, VLP 추출을 다음과 같이 수행할 수도 있다: 식물을 AGL1/#489, 928, 676 및 766으로 아그로필트레이션하였다. 잎 조직을 침윤 후 제7 일에 니코티아나 벤타미아나 식물로부터 수거하였고 ~1 cm2 조각으로 잘랐다. 펙티나제 162L (Biocatalysts), Multifect CX CG 및 Multifect CX B (Genencor)를 200 mM 만니톨, 75 mM 시트레이트, 0.04% 나트륨 비술파이트 pH 6.0 버퍼; 분해 버퍼에 추가하였다. 바이오매스를 오비탈 쉐이커(orbital shaker)에서 실온에서 하룻밤 동안 2배수로 분해시켰다.
효소-지원된 추출 후에, 잎 데브리(debris)를 여과 (250 또는 400 μm 메쉬의 나일론 필터)에 의해 제거하였다. 거칠게 여과된 추출물을 5분 동안 5000 xg에서 원심분리하였다. 상층액을 HA 발현 (헤마글루티닌화 활성)의 검출 (도 20 참조) 및 웨스턴 블롯팅 (도 22 참조)에 제출하였다.
실시예
2:
HA의
축적에 대한 변형된 단백질
가수분해 루프의 효과
도 13A에서 나타난 바와 같이, 고유한 B/Brisbane (구조 번호: 1008)의 발현은 변형된 단백질 가수분해 루프를 포함하는 B/Brisbane (구조 번호: 1059)의 발현보다 더 낮았다. 고유한 B/Brisbane HA (구조 번호: 1008; 도 13B)와 비교하여 증가된 헤마글루티닌화 활성을 또한 변형된 단백질 가수분해 루프를 포함하는 B/Brisbane (구조 번호: 1059)로 관찰하였다.
유사한 결과를 변형된 단백질 가수분해 루프를 포함하는 B/Wisconsin (구조 번호: 1467)의 축적 수준에서 관찰하였는데, 이것은 고유한 B/Wisconsin HA (구조 번호: 1462; 도 16A)에 대하여 관찰된 것보다 더 크다. 고유한 B/Wisconsin HA (구조 번호: 1462; 도 16B)와 비교하여 증가된 헤마글루티닌화 활성을 또한 변형된 단백질 가수분해 루프를 포함하는 B/Wisconsin (구조 번호: 1467)로 관찰하였는데 돌연변이 단백질보다 더 높은 축적을 나타낸다.
변형된 단백질 가수분해 루프를 포함하는 H5/Indo의 발현을 GG 링커 (구조 번호: 928; 서열 번호: 85), TETR 링커 (구조 번호: 676; 서열 번호: 77), 또는 TETQ 링커 (구조 번호: 766; 서열 번호: 8; 도 22)를 포함하는 단백질 가수분해 루프를 포함하는 변형으로 관찰하였다.
HA의 축적 수준에 대한 인플루엔자 M2 동시-발현의 효과
M2의 동시-발현을 변형된 인플루엔자 B HA의 축적 수준에 대한 그것의 영향에 대하여 평가하였다. 구조 번호 1059는 단백질 가수분해 루프가 2개의 아미노산 링커에 의해 대체되는 (aa 341-359 대신에 GG) 인플루엔자 B HA를 암호화한다. 도 13A에서 제공된 웨스턴 블롯 분석의 결과는 단백질 가수분해 루프의 제거가 증가된 인플루엔자 B HA 축적 수준을 발생시켰고 (1008을 1059와 비교함) 변형된 인플루엔자 B HA와 함께 M2의 동시-발현은 또한 HA 축적 수준을 증가시켰다는 것을 나타낸다 (도 13A, 1059 대 1059+1261). 변형이 있거나 없이 및 M2의 동시-발현이 있거나 없이 인플루엔자 B HA로 형질전환된 식물의 미가공 단백질 추출물에 대한 헤마글루티닌화 활성의 분석은 고유한 인플루엔자 B HA (도 13B, 1008 대 1008+1261) 및 변형된 인플루엔자 B HA (도 13B, 1059 대 1059+1261)의 축적 수준에 대한 M2 동시-발현의 긍정적인 효과를 확인하였다.
변형된 단백질 가수분해 루프를 포함하는 타입 A HA과 함께 M2의 동시-발현은 또한 HA 발현을 초래하였다. 예를 들어, M2와 함께 GS 링커 또는 (GSS)3 링커 (도 21E, 21F)로 대체된 단백질 가수분해 루프를 가진 변형된 H3의 동시-발현은 또한 식물에서 HA 축적을 초래할 수도 있다.
변형된 인플루엔자 B HA 및 H3의 축적을 증가시키기 위한 인플루엔자 A/Puerto Rico/8/1934의 M2의 효능을 인플루엔자 A/New Caledonia/20/1999의 M2의 그것과 비교하였다. 변형된 인플루엔자 B HA에 대하여, 비교를 구조 1059, 1059+1261 및 1059+859로 형질전환된 식물의 단백질 추출물의 웨스턴 블롯 분석에 의해 착수하였다. 얻어진 결과는 인플루엔자 A/Puerto Rico/8/1934 (구조 번호 859에 의해 암호화됨)의 M2의 동시-발현이 변형된 인플루엔자 B HA의 축적을 증가시키기 위해 인플루엔자 A/New Caledonia/20/1999 (구조 번호 1261에 의해 암호화됨)의 M2의 동시-발현만큼 효율적이었다는 것을 입증하였다 (도 14).
B HA의 다른 균주의 축적 수준에 대한 인플루엔자 M2 동시-발현의 효과
M2-발현 구조 (구조 번호 1261)의 존재 또는 부재 하에 인플루엔자 B HA (B/Wisconsin/1/2010의 것) (구조 번호 1462)의 발현을 구동하는 유전자 구조로 형질전환된 식물의 단백질 추출물의 웨스턴 블롯 분석은 M2 동시-발현이 인플루엔자 B HA의 증가된 축적을 초래한다는 것을 나타냈다 (도 16A).
M2의 동시-발현을 또한 변형된 인플루엔자 B HA의 축적 수준에 대한 그것의 영향에 대하여 평가하였다. 구조 번호 1467은 단백질 가수분해 루프가 2개의 아미노산 링커에 의해 대체되는 (aa 341-359 대신에 GG) 인플루엔자 B HA를 암호화한다. 도 16A에서 제공된 웨스턴 블롯 분석의 결과는 단백질 가수분해 루프의 제거가 증가된 인플루엔자 B HA 축적 수준을 초래하였고 (1462를 1467과 비교함) 변형된 인플루엔자 B HA와 함께 M2의 동시-발현이 또한 HA 축적 수준을 증가시켰다는 것을 나타낸다 (도 16A, 1467 대 1467+1261).
변형이 있거나 없이 및 M2의 동시-발현이 있거나 없이 인플루엔자 B HA로 형질전환된 식물의 미가공 단백질 추출물에 대한 헤마글루티닌화 활성의 분석은 고유한 인플루엔자 B HA (도 16B, 1462 대 1462+1261) 및 변형된 인플루엔자 B HA (도 16B, 1467 대 1467+1261)의 축적 수준에 대한 M2 동시-발현의 긍정적인 효과를 확인하였다.
HA의
축적에 대한 증폭 요소
BeYDV
및 변형된 단백질 가수분해 루프의 효과
제거된 단백질 가수분해 루프 (구조에 대하여 도 17A 참조)가 있거나 없이 및 증폭 요소 BeYDV (구조 번호 1059 및 1039)의 존재 또는 부재 하에 변형된 인플루엔자 B HA (B/Brisbane/60/2008의 것)의 발현을 구동하는 유전자 구조로 형질전환된 식물의 단백질 추출물의 웨스턴 블롯 분석은 BeYDV의 부재 하에, 조절 요소가 CPMV-HT일 때, 인플루엔자 B HA의 축적이 검출될 수 없다는 것을 나타냈다 (도 17B).
상대적 HA
역가
및
헤마글루티닌화에
대한 변형된 단백질 가수분해 루프의 효과
도 29A에 관하여, 결실된 단백질 가수분해 루프 (GG 링커와 대체됨)를 가진 변형된 HA 또는 고유한 HA를 암호화하는 뉴클레오타이드 서열과 작동 가능하게 결합된 인핸서 요소를 기반으로 한, CPMV HT, CPMV HT+, CPMV 160 또는 CPMV 160+를 포함하는 식물에서 생산된 변형된 HA 단백질의 활성의 비교가 나타난다. 대부분의 경우에, 발현 (헤마글루티닌화 역가 또는 활성으로서 결정됨)은 CPMV HT+, CPMV 160 또는 CPMV 160+기반 구조보다 더 높았다는 것은 상당한 발현 수준을 입증한다.
Fct = 1 | ||||||
wt | PrL- | |||||
설명 (n=) | GM | MD | n= | GM | MD | n= |
H2 Sin157 (HT+) (n = 2) | 1.0 | 0.4 | 2 | 1.2 | 0.1 | 2 |
H2 Sin157 (160+) (n = 2) | 1.0 | 0.3 | 2 | 1.9 | 0.9 | 2 |
H3 Per1609 (HT+) (n = 4) | 1.0 | 0.0 | 4 | 4.9 | 4.2 | 4 |
H3 Per1609 (160+) (n = 4) | 1.0 | 0.3 | 4 | 6.1 | 3.6 | 4 |
H3 Vic36111 (HT+) (n = 6) | 1.0 | 0.3 | 6 | 0.9 | 0.3 | 6 |
H3 Vic36111 (160+) (n = 6) | 1.0 | 0.3 | 6 | 1.2 | 0.4 | 6 |
H5 Indo505 (HT) (n = 3) | 1.0 | 0.1 | 3 | 1.2 | 0.3 | 3 |
H7 Han113 (HT+) (n = 5) | 1.0 | 0.2 | 5 | 1.0 | 0.1 | 5 |
H9 HK107399 (HT+) (n = 2) | 1.0 | 0.4 | 2 | 1.2 | 0.2 | 2 |
H9 HK107399 (160+) (n = 2) | 1.0 | 0.2 | 2 | 0.7 | 0.1 | 2 |
HB Bri6008 (HT) (n = 1) | 1.0 | 0.6 | 1 | 0.6 | 0.1 | 1 |
HB Mal250604 (160+) (n = 2) | 1.0 | 0.3 | 2 | 8.4 | 2.4 | 2 |
HB Mas212 (HT) (n = 3) | 1.0 | 0.1 | 3 | 1.4 | 1.3 | 3 |
HB Mas212 (HT+) (n = 3) | 1.0 | 0.6 | 3 | 6.7 | 3.5 | 3 |
HB Mas212 (160+) (n = 2) | 1.0 | 0.8 | 2 | 11.5 | 4.2 | 2 |
실시예
3
단백질 가수분해 루프가 제거될 때 (
PrL
-) 고유한 구조와 비교하여
증가된
H7
Hangzhou
HA
VLP
수율
니코티아나 벤타미아나 식물을 AGL1/#2142+1261 및 #2152+1261로 침윤시켰고 잎을 7일 배양 기간 후에 수득하였다. 잎 조직을 수거하여 ~1 cm2 조각으로 잘랐다. 펙티나제 162L 및 펙티나제 444L (Biocatalysts), Multifect CX CG 및 Multifect CX B (Genencor)를 200 mM 만니톨, 125 mM 시트레이트, 0.04% 나트륨 비술파이트 pH 6.0 버퍼에 추가하였다. 바이오매스를 오비탈 쉐이커에서 실온에서 하룻밤 동안 분해시켰다.
분해 후에, 아포플라스트성(apoplastic) 분획을 거칠게 분해되지 않은 식물 조직을 제거하기 위해 400 μm 나일론 필터를 통해 여과시켰다 (시작 바이오매스의 <5%). 여과된 추출물을 이어서 5000xg에서 15분 동안 실온에서 원심분리하여 원형질체 및 세포 내 오염물질 (단백질, DNA, 막, 소낭, 색소, 등)을 제거하였다. 그 다음에, 상층액을 크로마토그래피를 받기 전에, 1.2μm 유리 섬유 필터 (Sartopore GF plus/Sartorius Stedim), 및 0.45/0.2μm 필터 (Sartopore 2/Sartorius Stedim)를 사용하여 심층-여과하였다 (정화를 위해).
정화된 아포플라스트성 분획을 평형화/용출 버퍼 (50 mM NaP04, 100 mM NaCl, 0.005% Tween 80 pH 6.0)로 평형화된 양이온 교환 컬럼 (Poros HS Applied Biosystems)에 로딩하였다. UV가 0으로 돌아오면, 추출물을 증가하는 농도의 NaCl을 함유하는 평형화/용출 버퍼 (500 mM)로 단계-용출시켰다. 정제된 VLP를 TFF에 의해 농축시켰고, 제형화 버퍼 (pH 7.4에서 100 mM P04, 150 mM NaCl, 0.01% Tween 80)에 대하여 정용여과시켰고 (diafiltrate) 0.22μm 필터를 통과시켰다.
H7에 대한 헤마글루티닌화 검정을 Nayak and Reichl (2004)에 의해 기술된 방법에 기초하여 수행하였다. 간략히 말하면, 100 μL PBS를 함유하는 V-바닥 96-웰 미세역가 플레이트에서 테스트 샘플 (100 μL)을 연속적으로 이중 여과하였으며, 웰 당 100 μL의 희석된 샘플을 남겨두었다. 100 마이크로리터의 0.25% 칠면조 적혈구 세포 현탁액 (Bio Link Inc., Syracuse, NY)을 각 웰에 추가하였고, 플레이트를 실온에서 2시간 동안 배양하였다. 완전한 헤마글루티닌화를 나타내는 가장 높은 희석 배수의 역수를 헤마글루티닌화 활성으로서 기록하였다.
정화된 미가공 추출물의 총 단백질 함량을 참조 기준으로서 소 혈청 알부민을 사용하여 결정하였다. PrL- 구조를 대조군으로서 사용된 고유한 구조와 비교함으로써 상대적 수율을 얻었다. SDS-PAGE에 의한 분리를 변성 샘플 로딩 버퍼 (0.1M Tris pH 6.8, 0.05% 브로모페놀 블루, 12.5% 글리세롤, 4% SDS 및 5% 베타-메르캅토에탄올)를 이용하여, 환원성 조건 하에 수행하였고 Coomassie Brillant Blue R-250을 단백질 염색에 사용하였다.
도 46A는 식물 추출물에서 헤마글루티닌화 활성이 고유한 구조 (#2142+#1261, 실시예 5.33 참조)와 비교하여 단백질 가수분해 루프가 제거된 H7 Hangzhou 구조 (#2152+#1261, 실시예 5.34 참조)에 대하여 더 크다는 것을 나타낸다.
도 46B는 정제된 VLP에서 상대적인 총 단백질 수율이 고유한 구조 (#2142+#1261)와 비교하여 단백질 가수분해 루프가 제거된 H7 Hangzhou 구조 (#2152+#1261)에 대하여 더 크다는 것을 나타낸다. 이 예는 식물에서 축적된 VLP의 향상 대 완전한 공정을 수행할 때 최종 수율 사이의 양호한 연관성을 입증한다.
도 46C는 SDS-PAGE 분석을 나타내는데, 제거된 단백질 가수분해 루프를 가진 정제된 H7 Hangzhou 구조를 나타내고 레인 3은 정제된 고유한 H7 Hangzhou 구조를 나타낸다. 각 레인에 대하여, 총 단백질 2μg을 겔 상에 로딩하였다. 단백질 프로파일의 순도는 두 구조에 대하여 유사하고 90%보다 더 높다.
실시예
4.1.
단백질 가수분해 루프가 변형되거나 제거된 돌연변이 H5 Indonesia
VLP의
트립신 저항성은 고유한 H5 Indonesia보다 더 크다.
니코티아나 벤타미아나 식물을 실시예 1 (상기)에서 기술된 바와 같이 AGL1/#489, #928, #766 및 #676으로 아그로필트레이션하였다. 잎을 침윤 후 7일에 식물로부터 수거하였고, ~1 cm2 조각으로 잘랐다. 펙티나제 162L (Biocatalysts), Multifect CX CG 및 Multifect CX B (Genencor)를 200 mM 만니톨, 75 mM 시트레이트, 0.04% 나트륨 비술파이트 pH 6.0 버퍼에 추가하였다. 바이오매스를 오비탈 쉐이커에서 실온에서 하룻밤 동안 분해시켰다. 분해된 추출물을 실시예 3에서 기술된 바와 같이 거칠게 여과시켰고, 원심분리하였고, 정화하였고 정제하였다 (H7 Hangzhou).
고유한 (# 489), PRL- (# 928), TETQ (# 766) 및 TETR (# 676) H5 Indonesia HA VLP 추출물 각각에 대하여, HA VLP의 두 개의 샘플을 pH 7.4에서 버퍼 (100 mM Na/KP04, 150 mM NaCl, 0.01% TWEEN 80)에서 재현탁하였다. 트립신을 1: 100 단백질 비로 추가하였다. 샘플을 실온에서 배양 후 30, 60 및 120분 후에 그래빙하였고 (grab), 이어서 반응을 중단시키기 위해 샘플 로딩 버퍼에서 끓였다. 분해되지 않은 추출물 (대조군) 및 트립신-분해된 추출물을 실시예 3에서 기술된 바와 같이 SDS-PAGE 겔에 의해 분석하였다.
도 47A는 트립신-분해된 샘플의 SDS-PAGE 분석을 나타내는데, 분해의 다른 시점 (0, 30, 60, 및 120분)에서 레인 2 내지 5는 고유한 H5 Indonesia VLP (#489)를 나타내고, 레인 6 내지 9는 PrL- H5 Indonesia VLP (#928)를 나타내며, 레인 10 내지 13은 TETQ H5 Indonesia VLP (#766)를 나타내고 레인 14 내지 17은 TETR H5 Indonesia VLP (#676)를 나타낸다. 레인 2의 분해되지 않은 추출물에서 대략 75 kDa에서 검출 가능한 HA0 모노머에 해당하는 밴드를 가진, 고유한 H5 Indonesia VPL를 트립신의 추가를 통해 HA1 및 HA2로 신속하게 가공하였으며, 레인 3 내지 5에서 트립신 분해 중에 각각 대략 50 및 25kDa에서 검출 가능하였다. 단백질 가수분해 부위의 제거 또는 변형에 의해 안정화된 PrL- 및 TETQ H5 Indonesia VLP 둘 다는 HA0 밴드가 HA1 및 HA2 밴드로 분열하지 않은 것으로 트립신 저항성을 나타냈다. TETR H5 Indonesia VLP를 단백질 가수분해 부위의 변형에 의해 부분적으로 안정화시켰고 HA0 모노머를 고유한 H5 Indonesia VLP에서보다 더 느리게 HA1 및 HA2로 분열시켰다.
이 데이터는 단백질 가수분해 루프 (prl-)를 결실시키거나 또는 단백질 가수분해 루프를 링커 서열 (TETQ) 접근으로 대체함으로써 HA1-HA2 내 그것의 단백질 가수분해 부위에서 HA0 단백질의 성공적인 보호를 입증한다.
실시예
4.2. 고유한 H5 Indonesia
VLP의
면역원성은 마우스에서 그것의 돌연변이
대응물
(
PrL
-,
TETQ
및
TETR
)과 유사하다.
고유한, PrL-, TETR 및 TETQ H5 Indonesia VLP 추출물을 실시예 4.1 (상기)에서 기술된 바와 같이 정제하였다.
도 47B는 2회 투여 후 마우스에서 고유한 H5 VLP 및 그것의 돌연변이 대응물 (prl-, TETQ 및 TETR)의 면역원성 (HI 역가)를 나타낸다. BALB/c 마우스 (n=8/군)에 그것의 HA 함량에 기초하여 식물 기반 H5 VLP 백신 (고유한, prl-, TETQ 또는 TETR)의 10ug를 21일 간격으로 근육 내로 두 번 주사하였다. HI 역가 분석을 각 동물의 혈청으로부터, 42 dpv (두 번째 투여 후 21일) 실행하였고 H5 VLP A/Indonesia/5/2005 (H5N1)를 항원으로서 사용하였다. 막대는 고유한 H5 VLP와 각 H5 돌연변이 LP의 상대적인 (%) HI 역가 비교를 나타낸다 (HI 역가 GMT의 log2 및 95% CI로 계산됨). 각 용량에 대한 군 사이의 통계적 차이를 일원 ANOVA 후 이어서 칠면조의 Log2-변환된 데이터에 대한 사후 분석을 사용하여 비교하였다 (그것들의 정상 분포를 가정). * p < 0.05는 유의한 것으로 간주되었다. 각 용량에 대하여 군간의 차이가 관찰되지 않았다.
실시예
5.1: B-
2X35S
/
CPMV
-HT/M2 New Caledonia/NOS (구조 번호 1261)
인플루엔자 A/New Caledonia/20/1999 (H1N1)의 M2를 암호화하는 서열을 하기 PCR-기반 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 클로닝하였다. 완전한 M2 암호화 서열을 함유하는 단편을 주형으로서 합성된 M2 유전자 (GenBank 수납 번호 DQ508860의 nt 715-982에 결합된 nt 1-26에 해당함; 도 2C, 서열 번호: 9)를 사용하여 프라이머 IF-S1-M1+M2ANC.C (도 2A, 서열 번호: 7) 및 IF-S1-4-M2ANC.r (도 2B, 서열 번호: 8)을 사용하여 증폭시켰다. PCR 생성물을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV-HT/NOS 발현에서 클로닝하였다. 구조 1191 (도 1C)를 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 1191은 CPMV HT-기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 1D에서 제공된다 (서열 번호: 4). 결과의 구조는 주어진 번호 1261이다 (도 2D, 서열 번호: 10). 인플루엔자 A/New Caledonia/20/1999 (H1N1)의 M2의 아미노산 서열은 도 2E에서 제공된다 (서열 번호: 11). 플라스미드 1261의 도면은 도 11에서 제공된다.
실시예
5.2: C-
2X35S
/
CPMV
-HT/M2 Puerto Rico/NOS (구조 번호 859)
인플루엔자 A/Puerto Rico/8/1934 (H1N1)의 M2를 암호화하는 서열을 하기 PCR-기반 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 2X35S/CPMV-HT/NOS 발현 세스템으로 클로닝하였다. 완전한 M2 암호화 서열을 함유하는 단편을 프라이머 IF-S1-M1+M2ANC.C (도 2A, 서열 번호: 7) 및 IF-S1-4-M2ANC.r (도 2B, 서열 번호: 8)을 사용하여 증폭시켰으며, 주형으로서 합성된 M2 유전자 (Genbank 수납 번호 EF467824의 nt 740-1007에 결합된 nt 26-51에 해당함) (도 3A, 서열 번호: 12)를 사용하였다. PCR 생성물을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV-HT/NOS 발현 시스템에서 클로닝하였다. 구조 1191 (도 1C)을 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 1191은 CPMV-HT-기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 벡터는 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 1D에서 제공된다 (서열 번호: 4). 결과의 구조는 주어진 번호 859이다 (도 3B, 서열 번호: 13). 인플루엔자 A/Puerto Rico/8/1934 (H1N1)의 M2의 아미노산 서열은 도 3C에서 제공된다 (서열 번호: 14). 플라스미드 859의 도면은 도 17에서 제공된다.
실시예
5.3:
BeYDV
+
레플리카제
증폭 시스템 내 G-
2X35S
/
CPMV
-HT/
PDISP
/HA B Brisbane/NOS (구조 번호 1008)
구조 1008의 조제물은 US 61/541,780에서 기술된다. 간략히 말하면, 인플루엔자 B/Brisbane/60/2008의 HA를 암호화하는 서열을 합성된 HA B Brisbane 유전자 (Genbank 수납 번호 FJ766840의 nt 34- 1791에 해당함)를 사용하는 PCR-기반 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 BeYDV+레플리카제 증폭 시스템을 포함하는 2X35S/CPMV-HT/PDISP/NOS로 클로닝하였다. PCR 생성물을 BeYDV 증폭 시스템 내 2X35S/CPMV-HT/NOS 발현 카세트에서 알팔파 PDI 신호 펩타이드와 함께 인 프레임 클로닝하였다. 구조 1194 (도 4A, 4B 참조)를 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 조립 반응에 사용하여 구조 번호 1008 (도 4C, 도 9; 서열 번호: 32)을 생산하였다.
구조 번호 1194 (도 4A)는 BeYDV 증폭 시스템 내 CPMV-HT-기반 발현 카세트에서 알팔파 PDI 신호 펩타이드와 함께 원하는 유전자의 인 프레임 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이다.
실시예
5.4:
BeYDV
+
레플리카제
증폭 시스템 내 1-
2X35S
/
CPMV
-HT/결실된 단백질 가수분해 루프를 가진
PDISP
-HA B Brisbane (구조 번호 1059)
구조 1059의 조제물은 US 61/541,780에서 기술된다. 간략히 말하면, 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 HA를 암호화하는 서열을 PCR-기반 결찰 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 BeYDV+레플리카제 증폭 시스템을 포함하는 2X35S/CPMV-HT/PDISP/NOS로 클로닝하였다 (Darveau et al., 1995, Methods in Neuroscience 26: 77-85). PCR의 첫 번째 라운드에서, nt 46에서 nt 1065까지의 서열을 암호화하는 HA B Brisbane을 함유하는 단편을 주형으로서 합성된 HA B Brisbane 유전자 (Genebank 수납 번호 FJ766840의 nt 34-1791에 해당함)를 사용하여 증폭시켰다. nt 1123에서 nt 1758까지의 서열을 암호화하는 HA B Brisbane을 함유하는 두 번째 단편을 주형으로서 합성된 HA B Brisbane 유전자 (Genbank 수납 번호 FJ766840의 nt 34-1791에 해당함)를 사용하여 증폭시켰다. 두 번의 증폭으로부터의 PCR 생성물을 이어서 혼합하였고 증폭의 두 번째 라운드에 대한 주형으로서 사용하였다. 결과의 단편 (단편들 사이에서 GG 링커를 가진 HA B/Brisbane/60/2008 Δa.a. 356-374를 암호화; 도 21B 참조)을 BeYDV 증폭 시스템을 포함하는 2X35S/CPMV-HT/NOS 발현 카세트에서 알팔파 PDI 신호 펩타이드와 함께 인-프레임 클로닝하여 구조 1194 (도 4A, 4B)를 생산하였고, SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 조립 반응에 사용하였다. 결과의 구조는 주어진 번호 1059이다 (도 5C; 서열 번호: 40).
결실된 단백질 가수분해 루프를 가진 PDISP-HA B/Brisbane/60/2008의 아미노산 서열은 도 5D에서 제공된다 (서열 번호: 41).
실시예
5.5:
BeYDV
(m)+
레플리카제
증폭 시스템 내 B-
2X35S
/
CPMV
-HT/HA B Wisconsin/NOS (구조 번호 1462)
구조 1462의 조제물은 US 61/541,780에서 기술된다. 간략히 말하면, 인플루엔자 B/Wisconsin/1/2010의 HA를 암호화하는 서열을 PCR-기반 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 BeYDV(m)+레플리카제 증폭 시스템을 포함하는 2X35S/CPMV-HT/NOS로 클로닝하였다. 완전한 HA B Wisconsin 암호화 서열을 함유하는 단편을 주형으로서 합성된 HA B Wisconsin 유전자 (Genbank 수납 번호 JN993010)를 사용하여 증폭시켰다. PCR 생성물을 BeYDV(m) 증폭 시스템 내 2X35S/CPMV-HT/NOS 발현 카세트에서 클로닝하였다. 구조 193 (도 6D)를 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 조립 반응에 사용하였다.
구조 번호 193 (도 6D, 6E)은 BeYDV(m) 증폭 시스템 내 CPMV-HT-기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 6E에서 제공된다 (서열 번호: 52). 결과의 구조는 주어진 번호 1462이다 (도 6F, 서열 번호: 53). 인플루엔자 B/Wisconsin/1/2010의 PDISP/HA의 아미노산 서열은 도 6G에서 제공된다 (서열 번호: 54). 플라스미드 1462의 도면은 도 6H에서 제공된다.
실시예
5.6:
BeYDV
(m)+
레플리카제
증폭 시스템 내 C-
2X35S
/
CPMV
-HT/결실된 단백질 가수분해 루프를 가진 HA B Wisconsin (구조 번호 1467)
구조 1467의 조제물은 US 61/541,780에서 기술된다. 간략히 말하면, 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Wisconsin/1/2010의 HA를 암호화하는 서열을 PCR-기반 결찰 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 BeYDV(m)+레플리카제 증폭 시스템을 포함하는 2X35S/CPMV-HT/NOS로 클로닝하였다 (Darveau et al. 1995, Methods in Neuroscience 26: 77-85). PCR의 첫 번째 라운드에서, nt 1에서 nt 1062까지의 HA B Wisconsin 암호화 서열을 함유하는 단편을 프라이머 IF-HAB110.S1+3c (도 6A, 서열 번호: 49) 및 HAB110(PrL-).r (도 7A, 서열 번호: 55)을 사용하여 증폭시켰으며, 주형으로서 합성된 HA B Wisconsin 유전자 (Genbank 수납 번호 JN993010)를 사용하였다 (도 6C, 서열 번호: 51). nt 1120에서 nt 1755까지의 HA B Wisconsin 암호화 서열을 함유하는 두 번째 단편을 프라이머 HAB110(PrL-).c (도 7B, 서열 번호: 56) 및 IF-HAB110.s1-4r (도 6B, 서열 번호: 50)을 사용하여 증폭시켰으며, 주형으로서 합성된 HA B Wisconsin 유전자 (Genbank 수납 번호 JN993010)를 사용하였다 (도 6C, 서열 번호: 51). 두 번의 증폭으로부터의 PCR 생성물을 이어서 혼합하였고 증폭의 두 번째 라운드에 대한 주형으로서 사용하였으며 프라이머로서 IF-HAB110.S1+3c (도 6A, 서열 번호: 49) 및 IF-HAB110.s1-4r (도 6B, 서열 번호: 50)을 사용하였다. 결과의 단편 (단편들 사이에서 GG 링커를 가진 HA B/Wisconsin/1/2010 Δa.a. 340-358을 암호화)을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 BeYDV(m) 증폭 시스템을 포함하는 2X35S/CPMV-HT/NOS 발현 카세트에서 클로닝하였다. 구조 193 (도 6D)를 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 193은 BeYDV(m) 증폭 시스템 내 CPMV-HT-기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 6E에서 제공된다 (서열 번호: 52). 결과의 구조는 주어진 번호 1467이다 (도 7C, 서열 번호: 57). 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Wisconsin/1/2010의 HA의 아미노산 서열은 도 7D에서 제공된다 (서열 번호: 58). 플라스미드 1467의 도면은 도 7E에서 제공된다.
실시예
5.7: A-
2X35S
/
CPMV
-HT/결실된 단백질 가수분해 루프를 가진
PDISP
-HA B Brisbane (구조 번호 1039)
구조 1192의 조제물은 US 61/541,780에서 기술된다. 간략히 말하면, 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Brisbane/60/2008의 HA를 암호화하는 서열을 하기 PCR-기반 결찰 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 2X35S/CPMV-HT/PDISP/NOS로 클로닝하였다 (Darveau et al., 1995, Methods in Neuroscience 26: 77-85). PCR의 첫 번째 라운드에서, nt 46에서 nt 1065까지의 HA B Brisbane 암호화 서열을 함유하는 단편을 주형으로서 합성된 HA B Brisbane 유전자 (Genebank 수납 번호 FJ766840의 nt 34-1791에 해당함)를 사용하여 증폭시켰다. nt 1123에서 nt 1758까지의 HA B Brisbane 암호화 서열을 함유하는 두 번째 단편을 주형으로서 합성된 HA B Brisbane 유전자 (Genbank 수납 번호 FJ766840의 nt 34-1791에 해당함)를 사용하여 증폭시켰다. 두 번의 증폭으로부터의 PCR 생성물을 이어서 혼합하였고 증폭의 두 번째 라운드에 대한 주형으로서 사용하였다. 결과의 단편 (단편들 사이에서 GG 링커를 가진 HA B/Brisbane/60/2008 Δa.a. 356-374를 암호화)을 2X35S/CPMV-HT/NOS 발현 카세트에서 알팔파 PDI 신호 펩타이드와 함께 인-프레임 클로닝하였다. 구조 1192를 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다.
구조 번호 1192는 CPMV-HT-기반 발현 카세트에서 알팔파 PDI 신호 펩타이드와 함께 원하는 유전자의 인 프레임 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이다. 결과의 구조는 주어진 번호 1039이다 (도 8B). 결실된 단백질 가수분해 루프를 가진 PDISP-HA B/Brisbane/60/2008의 아미노산 서열은 도 5D에서 제공된다 (서열 번호: 41). 플라스미드 1039의 도면은 도 8A에서 제공된다 (서열 번호: 15).
실시예
5.8:
TETR
분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 A-2X35S/CPMV-HT/H5 (구조 번호 676)
TETR 분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 H5를 암호화하는 서열을 하기 PCR-기반 결찰 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 2X35S/CPMV-HT/NOS로 클로닝하였다 (Darveau et al., 1995, Methods in Neuroscience 26: 77-85). PCR의 첫 번째 라운드에서, nt 1에서 nt 1015까지의 A/Indonesia/5/2005 암호화 서열의 H5를 함유하는 단편을 프라이머 IF-H5A-I-05.S1+3c (도 1A, 서열 번호: 2) 및 MutCleavage-H5(Indo).r (도 23A, 서열 번호: 74)을 사용하여 증폭시켰으며, 주형으로서 A/Indonesia/5/2005의 합성된 H5 (도 1G, 서열 번호: 42)를 사용하였다. nt 1038에서 nt 1707까지의 A/Indonesia/5/2005 암호화 서열의 H5를 함유하는 두 번째 단편을 프라이머 MutCleavage- H5(Indo).c (도 23B, 서열 번호: 75) 및 IF-H5dTm.r (도 1B, 서열 번호: 3)을 사용하여 증폭시켰으며, 주형으로서 A/Indonesia/5/2005의 합성된 H5 (도 1G, 서열 번호: 42)를 사용하였다. 두 번의 증폭으로부터의 PCR 생성물을 이어서 혼합하였고 증폭의 두 번째 라운드에 대한 주형으로서 사용하였으며 프라이머로서 IF-H5A-I-05.S1+3c (도 1A, 서열 번호: 2) 및 IF-H5dTm.r (도 1B, 서열 번호: 3)을 사용하였다. 결과의 단편 (단편들 사이에서 TETR 링커를 가진 A/Indonesia/5/2005 Δa.a. 339-346의 H5를 암호화)을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV-HT/NOS 발현 카세트에서 클로닝하였다. 구조 1191 (도 1D)을 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 1191은 CPMV-HT-기반 발현 카세트에서 원하는 유전자의 인 프레임 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 1D (서열 번호: 4)에서 제공된다. 결과의 구조는 주어진 번호 676이다 (도 23C, 서열 번호: 76). A/Indonesia/5/2005 TETR 분열 부위 돌연변이의 H5의 아미노산 서열은 도 23D에서 제공된다 (서열 번호: 77). 플라스미드 676의 개략도는 도 23E에서 제공된다.
실시예
5.9:
TETO
분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 B-2X35S/CPMV-HT/H5 (구조 번호 766)
TETQ 분열 부위 돌연변이를 가진 A/Indonesia/5/2005의 H5의 서열을 하기 PCR-기반 결찰 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 2X35S/CPMV-HT/NOS로 클로닝하였다 (Darveau et al., 1995, Methods in Neuroscience 26: 77-85). PCR의 첫 번째 라운드에서, nt 1에서 nt 1015까지의 A/Indonesia/5/2005 암호화 서열의 H5를 함유하는 단편을 프라이머 IF-H5A-I-05.S1+3c (도 1A, 서열 번호: 2) 및 H5I505_TETQ.r (도 24A, 서열 번호: 78)을 사용하여 증폭시켰으며, 주형으로서 A/Indonesia/5/2005의 합성된 H5 (도 1G, 서열 번호: 42)를 사용하였다. nt 1038에서 nt 1707까지의 A/Indonesia/5/2005 암호화 서열의 H5를 함유하는 두 번째 단편을 프라이머 H5I505_TETQ.c (도 24B, 서열 번호: 79) 및 IF-H5dTm.r (도 1B, 서열 번호: 3)을 사용하여 증폭시켰으며, 주형으로서 A/Indonesia/5/2005의 합성된 H5 (도 1G, 서열 번호: 42)를 사용하였다. 두 번의 증폭으로부터의 PCR 생성물을 이어서 혼합하였고 증폭의 두 번째 라운드에 대한 주형으로서 사용하였으며 프라이머로서 IF-H5A-I-05.S1+3c (도 1A, 서열 번호: 2) 및 IF-H5dTm.r (도 1B, 서열 번호: 3)을 사용하였다. 결과의 단편 (단편들 사이에서 TETQ 링커를 가진 A/Indonesia/5/2005 Δa.a. 339-346의 H5를 암호화)을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV-HT/NOS 발현 카세트에서 클로닝하였다. 구조 1191 (도 1D)은 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 1191은 CPMV- HT-기반 발현 카세트에서 원하는 유전자의 인 프레임 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 1D에서 제공된다 (서열 번호: 4). 결과의 구조는 주어진 번호 766이다 (도 24C, 서열 번호: 80). A/Indonesia/5/2005 TETQ 분열 부위 돌연변이의 H5의 아미노산 서열은 도 24D에서 제공된다 (서열 번호: 81). 플라스미드 766의 개략도는 도 24E에서 제공된다.
실시예
5.10: C-2X35S/CPMV-HT/결실된 단백질 가수분해 루프를 가진 A/Indonesia/5/2005의 H5 (구조 번호 928)
결실된 단백질 가수분해 루프를 가진 A/Indonesia/5/2005의 H5를 암호화하는 서열을 Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))에 의해 제공된 하기 PCR-기반 결찰 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 2X35S/CPMV-HT/NOS로 클로닝하였다. PCR의 첫 번째 라운드에서, nt 1에서 nt 1011까지의 A/Indonesia/5/2005 암호화 서열의 H5를 함유하는 단편을 프라이머 IF-H5A-I-05.S1+3c (도 1A, 서열 번호: 2) 및 H5I505(PrL-).r (도 25 A, 서열 번호: 82)을 사용하여 증폭시켰으며, 주형으로서 A/Indonesia/5/2005의 합성된 H5 (도 1G, 서열 번호: 42)를 사용하였다. nt 1075에서 nt 1707까지의 A/Indonesia/5/2005의 H5를 함유하는 두 번째 단편을 프라이머 H5I505(PrL-).c (도 25B, 서열 번호: 83) 및 IF-H5dTm.r (도 1B, 서열 번호: 3)를 사용하여 증폭시켰으며, 주형으로서 A/Indonesia/5/2005의 합성된 H5 (도 1G, 서열 번호: 42)를 사용하였다. 두 번의 증폭으로부터의 PCR 생성물을 이어서 혼합하였고 증폭의 두 번째 라운드에 대한 주형으로서 사용하였으며 프라이머로서 IF-H5A-I-05.S1+3c (도 1A, 서열 번호: 2) 및 IF-H5dTm.r (도 1B, 서열 번호: 3)을 사용하였다. 결과의 단편 (단편들 사이에서 GG 링커를 가진 A/Indonesia/5/2005 Δa.a. 338-358의 H5를암호화)을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV-HT/NOS 발현 카세트에서 클로닝하였다. 구조 1191 (도 1D) SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 1191은 CPMV-HT-기반 발현 카세트에서 원하는 유전자의 인 프레임 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 1D에서 제공된다 (서열 번호: 4). 결과의 구조는 주어진 번호 928이다 (도 25C, 서열 번호: 84). 결실된 단백질 가수분해 루프를 가진 A/Indonesia/5/2005의 H5의 아미노산 서열은 도 25D에서 제공된다 (서열 번호: 85). 플라스미드 928의 도면은 도 25E에서 제공된다.
실시예
5.11 - F-
2X35S
/
CPMV
-HT/
PDISP
/HA B Brisbane/NOS (구조 번호 1029)
인플루엔자 B/Brisbane/60/2008의 HA를 암호화하는 서열은 하기 PCR-기반 방법을 사용하여 Plasto_pro/P19/Plasto_ter 발현 카세트를 함유하는 플라스미드에서 2X35S/CPMV-HT/PDISP/NOS 발현 시스템으로 클로닝하였다. his 야생형 신호 펩타이드가 없는 HA B Brisbane 암호화 서열을 함유하는 단편을 프라이머 IF-S2+S4-B Bris.c (도 30A, 서열 번호: 86) 및 IF-Sla4-B Bris.r (도 30B, 서열 번호: 87)을 사용하여 증폭시켰으며, 주형으로서 합성된 HA B Brisbane 유전자 (Genbank 수납 번호 FJ766840의 nt 34-1791에 해당함) (도 30C, 서열 번호: 88)를 사용하였다. PCR 생성물을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV-HT/NOS 발현 시스템에서 알팔파 PDI 신호 펩타이드와 함께 인-프레임 클로닝하였다. 구조 1192를 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 1192는 CPMV-HT-기반 발현 카세트에서 알팔파 PDI 신호 펩타이드와 함께 원하는 유전자의 인 프레임 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드 및 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열이다. 결과의 구조는 주어진 번호 1029이다 (도 30D, 서열 번호: 89). 인플루엔자 B/Brisbane/60/2008의 PDISP/HA의 아미노산 서열은 도 30E에서 제공된다 (서열 번호: 90). 플라스미드 1029의 도면은 도 30F에서 제공된다.
실시예
5.12 -
PDISP
/HA B Brisbane (
PrL
-)에 대한
2X35S
/
CPMV
HT (구조 번호 1039) 및 HT+(구조 번호 1829)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것으로 대체된, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Brisbane/60/2008의 HA에 해당하는 암호화 서열 (PDISP/HA B Brisbane (PrL-); 도 31 A, 서열 번호: 91)을 실시예 5.7 및 5.11에서 기술된 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Brisbane (PrL-)에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT 및 변형된 HT+로 클로닝하였다. PDISP와 융합된 성숙한 HA B Brisbane (PrL-)의 아미노산 서열은 도 31B에서 제공된다 (서열 번호: 92). 플라스미드 1039 및 1829의 도면은 도 8B 및 31D에서 제공된다.
실시예
5.13 -
PDISP
/HA B Brisbane (
PrL
-)에 대한
2X35S
/
CPMV
HT (구조 번호 1039) 및 2X35S/CPMV160+(구조 번호 1937)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것으로 대체된, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Brisbane/60/2008의 HA에 해당하는 암호화 서열 (추가적인 정보 re: HA 서열에서 결실된 단백질 가수분해 루프 영역에 대하여 2013년 3월 28일에 출원된 미국 가출원 번호 61/806,227 참조, 이것은 본원에 참고로 포함됨) (PDISP/HA B Brisbane (PrL-)) (도 32A, 서열 번호: 93)을 원래의 HT 및 변형된 HT+로 클로닝하였다. 실시예 5.7 및 5.11에서 기술된 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Brisbane (PrL-)에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT 및 변형된 HT+로 클로닝하였다. PDISP와 융합된 성숙한 HA B Brisbane (PrL-)의 아미노산 서열은 도 31B에서 제공된다 (서열 번호: 92). 플라스미드 1039 및 1937의 도면은 도 8B 및 32C에서 제공된다.
실시예
15.14 -
PDISP
/HA B Brisbane (
PrL
-)+H1 California
TMCT에
대한 2X35S/CPMV HT (구조 번호 1067) 및 2X35S/CPMV160+(구조 번호 1977)
인플루엔자 A/California/7/2009의 H1의 막관통 도메인 및 세포질 꼬리 (TMCT)에 융합되고 알팔파 단백질 이황화 이소머라제의 신호 펩타이드를 가진, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Brisbane/60/08의 HA의 엑토도메인에 해당하는 키메라 헤마글루티닌 암호화 서열 (추가적인 정보 re: HA 서열에서 결실된 단백질 가수분해 루프 영역에 대하여, 2013년 3월 28일에 출원된 미국 가출원 번호 61/806,227, 이것은 본원에 참고로 포함됨) (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) (도 33A, 서열 번호: 95)을 실시예 5.7 및 5.11에서 기술된 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Brisbane (PrL-)+H1 California TMCT에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 CPMV-HT 및 CPMV160+로 클로닝하였다. PDISP에 융합된 성숙한 HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열은 도 33B에서 제공된다 (서열 번호: 96). 플라스미드 1067 및 1977의 도면은 도 33C 및 도 33D에서 제공된다.
실시예
5.15 -
PDISP
/HA B Massachusetts (
PrL
-)에 대한
2X35S
/
CPMV
HT (구조 번호 2072) 및
2X35S
/
CPMV160+
(구조 번호 2050)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Massachusetts/2/2012의 HA에 해당하는 암호화 서열 (추가적인 정보 re: HA 서열에서 결실된 단백질 가수분해 루프 영역에 대하여 2013년 3월 28일 출원된 미국 가출원 번호 61/806,227 참조, 이것은 본원에 참고로 포함됨) (PDISP/HA B Massachusetts (PrL-)) (도 34A, 서열 번호: 97)을 실시예 5.7 및 5.11에서 기술된 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Massachusetts (PrL-)에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 CPMV-HT 및 CPMV160+로 클로닝하였다. PDISP와 융합된 성숙한 HA B Massachusetts (PrL-)의 아미노산 서열은 도 34B에서 제공된다 (서열 번호: 98). 플라스미드 2072 및 2050의 도면은 도 34C 및 도 34D에서 제공된다.
실시예
5.16 -
PDISP
/HA B Massachusetts (
PrL
-)+H1 California
TMCT에
대한 2X35S/CPMV HT (구조 번호 2074) 및 2X35S/CPMV160+(구조 번호 2060)
인플루엔자 A/California/7/2009의 H1의 막관통 도메인 및 세포질 꼬리 (TMCT)에 융합되고 알팔파 단백질 이황화 이소머라제의 신호 펩타이드를 가진, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Massachusetts/2/2012의 HA의 엑토도메인에 해당하는 키메라 헤마글루티닌 암호화 서열 (추가적인 정보 re: HA 서열에서 결실된 단백질 가수분해 루프 영역에 대하여 2013년 3월 28일에 출원된 미국 가출원 번호 61/806,227 참조, 이것은 본원에 참고로 포함됨) (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT) (도 35A, 서열 번호: 99)을 실시예 5.7 및 5.11에서 기술된 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Massachusetts (PrL-)+H1 California TMCT에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 CPMV-HT 및 CPMV160+로 클로닝하였다. PDISP와 융합된 성숙한 HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열은 도 35B에서 제공된다 (서열 번호: 100). 플라스미드 2074 및 2060의 도면은 도 35C 및 35D에서 제공된다.
실시예
5.17 - HA B Wisconsin (
PrL
-)에 대한
2X35S
/
CPMV
HT (구조 번호 1445), 2X35S/CPMVHT+(구조 번호 1820) 및 CPMV160+(구조 번호 1975)
his 고유한 신호 펩타이드를 가진, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Wisconsin/1/2010의 HA에 해당하는 암호화 서열 (추가적인 정보 re: HA 서열에서 결실된 단백질 가수분해 루프 영역에 대하여 2013년 3월 28일에 출원된 미국 가출원 번호 61/806,227 참조, 이것은 본원에 참고로 포함됨) (HA B Wisconsin (PrL-)) (도 36AA, 서열 번호: 101)을 실시예 5.7 및 5.11에서 기술된 같은 PCR-기반 방법을 사용하지만, HA B Wisconsin (PrL-)에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 CPMV-HT, CPMVHT+, 및 CPMV160으로 클로닝하였다. his 고유한 신호 펩타이드를 가진 HA B Wisconsin (PrL-)의 아미노산 서열은 도 36B에서 제공된다 (서열 번호: 102). 플라스미드 1445, 1820 및 1975의 도면은 각각 도 36C, 36D 및 36E에서 제공된다.
실시예
5.18 - HA B Wisconsin (
PrL
-)+H1 California
TMCT에
대한 2X35S/CPMV HT (구조 번호 1454) 및
2X35S
/
CPMV160+
(구조 번호 1893)
인플루엔자 A/California/7/2009의 H1의 막관통 도메인 및 세포질 꼬리 (TMCT)에 융합되고 HA B Wisconsin의 고유한 신호 펩타이드를 가진, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Wisconsin/2/2012의 HA의 엑토도메인에 해당하는 키메라 헤마글루티닌 암호화 서열 (추가적인 정보 re: HA 서열에서 결실된 단백질 가수분해 루프 영역에 대하여 2013년 3월 28일에 출원된 미국 가출원 번호 61/806,227 참조, 이것은 본원에 참고로 포함됨) (HA B Wisconsin (PrL-)+H1 California TMCT) (도 37A, 서열 번호: 103)을 실시예 5.7 및 5.11에서 기술된 같은 PCR-기반 방법을 사용하지만, HA B Wisconsin (PrL-)+H1 California TMCT에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 CPMV-HT 및 CPMV160+로 클로닝하였다. HA B Wisconsin (PrL-)+H1 California TMCT의 아미노산 서열은 도 37에서 제공된다 (서열 번호: 104). 플라스미드 1454 및 1893의 도면은 도 37C 및 37D에서 제공된다.
실시예
5.19:
PDISP
/HA B Brisbane (
PrL
-)+H1 California
TMCT에
대한 2X35S/CPMV HT (구조 번호 1067) 및 HT+(구조 번호 1875)
인플루엔자 A/California/7/2009의 H1의 막관통 도메인 및 세포질 꼬리 (TMCT)에 융합되고 알팔파 단백질 이황화 이소머라제의 신호 펩타이드를 가진, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Brisbane/60/08의 HA의 엑토도메인에 해당하는 키메라 헤마글루티닌 암호화 서열 (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) (도 38A, 서열 번호: 105)을 실시예 5.26에서 기술된 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Brisbane (PrL-)+H1 California TMCT에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT 및 변형된 HT+로 클로닝하였다. PDISP와 융합된 성숙한 HA B Brisbane (PrL-)+H1 California TMCT의 아미노산 서열은 도 38B에서 제공된다 (서열 번호: 106). 플라스미드 1067 및 1875의 도면은 도 33C 및 39C에서 제공된다.
실시예
5.20:
PDISP
/HA B Massachusetts (
PrL
-)에 대한
2X35S
/
CPMV
HT (구조 번호 2072) 및 HT+(구조 번호 2052)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Massachusetts/2/2012의 HA에 해당하는 암호화 서열 (PDISP/HA B Massachusetts (PrL-)) (도 39A, 서열 번호: 107)을 실시예 5.26에서 기술된 바와 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Massachusetts (PrL-)에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT 및 변형된 HT+로 클로닝하였다. PDISP와 융합된 성숙한 HA B Massachusetts (PrL-)의 아미노산 서열은 도 39B에서 제공된다 (서열 번호: 108). 플라스미드 2072 및 2052의 도면은 도 34C 및 도 39C에서 제공된다.
실시예
5.21:
PDISP
/HA B Massachusetts (
PrL
-)+H1 California
TMCT에
대한 2X35S/CPMV HT (구조 번호 2074) 및 HT+(구조 번호 2062)
인플루엔자 A/California/7/2009의 H1의 막관통 도메인 및 세포질 꼬리 (TMCT)에 융합되고 알팔파 단백질 이황화 이소머라제의 신호 펩타이드를 가진, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Massachusetts/2/2012의 HA의 엑토도메인에 해당하는 키메라 헤마글루티닌 암호화 서열 (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT) (도 40A, 서열 번호: 109)을 실시예 5.26에서 기술된 바와 같은 PCR-기반 방법을 사용하지만, PDISP/HA B Massachusetts (PrL-)+H1 California TMCT에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT 및 변형된 HT+로 클로닝하였다. PDISP와 융합된 성숙한 HA B Massachusetts (PrL-)+H1 California TMCT의 아미노산 서열은 도 40B에서 제공된다 (서열 번호: 110). 플라스미드 2074 및 2062의 도면은 도 35C 및 도 40C에서 제공된다.
실시예
5.22: HA B Wisconsin (
PrL
-)에 대한
2X35S
/
CPMV
HT (구조 번호 1445) 및 HT+(구조 번호 1839)
his 고유한 신호 펩타이드를 가지며, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Wisconsin/1/2010의 HA에 해당하는 암호화 서열 (HA B Wisconsin (PrL-)) (도 41 A, 서열 번호: 111)을 실시예 5.26에서 기술된 바와 같은 PCR-기반 방법을 사용하지만, HA B Wisconsin (PrL-)에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT 및 변형된 HT+로 클로닝하였다. his 고유한 신호 펩타이드를 가진 HA B Wisconsin (PrL-)의 아미노산 서열은 도 41B에서 제공된다 (서열 번호: 112). 플라스미드 1445 및 1839의 도면은 도 36C 및 41C에서 제공된다.
실시예
5.23: HA B Wisconsin (
PrL
-)+H1 California
TMCT에
대한
2X35S
/
CPMV
HT (구조 번호 1454) 및 HT+(구조 번호 1860)
HA B Wisconsin의 고유한 신호 펩타이드를 가진 인플루엔자 A/California/7/2009의 H1의 막관통 도메인 및 세포질 꼬리 (TMCT)에 융합된, 결실된 단백질 가수분해 루프를 가진 (PrL-) 인플루엔자 B/Wisconsin/2/2012의 HA의 엑토도메인에 해당하는 키메라 헤마글루티닌 암호화 서열 (HA B Wisconsin (PrL-)+H1 California TMCT) (도 42A, 서열 번호: 113)을 실시예 5.26에서 기술된 바와 같은 PCR-기반 방법을 사용하지만 HA B Wisconsin (PrL-)+H1 California TMCT에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT 및 변형된 HT+로 클로닝하였다. HA B Wisconsin (PrL-)+H1 California TMCT의 아미노산 서열은 도 42B에서 제공된다 (서열 번호: 114). 플라스미드 1454 및 1860의 도면은 도 37C 및 42C에서 제공된다.
실시예
5.24 - H5 Indonesia에 대한
2X35S
/
CPMV
HT (구조 번호 489). 2X35S/CPMV160+(구조 번호 1880) 및
2X35S
/
CPMV160
(구조 번호 1885)
인플루엔자 A/Indonesia/5/2005의 고유한 H5에 해당하는 암호화 서열 (도 43A, 서열 번호: 115)을 실시예 5.25에서 기술된 바와 같은 PCR-기반 방법을 사용하지만 H5 Indonesia에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 CPMV-HT, CPMV160+및 CPMV160으로 클로닝하였다. 인플루엔자 A/Indonesia/5/2005의 고유한 H5의 아미노산 서열은 도 43B에서 제공된다 (서열 번호: 116). 플라스미드 489의 도면은 도 43C에서 제공된다.
실시예
5.25 -
2X35S
/
CPMV160
+/
PDISP
/H3 Victoria/NOS (구조 번호 1800)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 A/Victoria/361/2011의 H3을 암호화하는 서열 (PDISP/H3 Victoria)을 하기 PCR-기반 방법을 사용하여 2X35S/CPMV160+/NOS 발현 시스템으로 클로닝하였다 (CPMV160+). PDISP/H3 Victoria 암호화 서열을 함유하는 단편을 프라이머 IF**(SacII)-PDI.s1+4c (도 44A, 서열 번호: 117) 및 IF-H3V3611 1.s1-4r (도 44B, 서열 번호: 118)를 사용하여 증폭시켰으며, 주형으로서 PDISP/H3 Victoria 서열 (도 44C, 서열 번호: 119)을 사용한다. PCR 생성물을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV160+/NOS 발현 시스템에서 클로닝하였다. 구조 번호 2171 (도 44D)은 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 2171은 CPMV160+기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 44E에서 제공된다 (서열 번호: 120). 결과의 구조는 주어진 번호 1800이다 (도 44F, 서열 번호: 121). PDISP와 융합된 인플루엔자 A/Victoria/361/2011의 성숙한 H3의 아미노산 서열은 도 44G에서 제공된다 (서열 번호: 122). 플라스미드 1800의 도면은 도 44H에서 제공된다.
실시예
5.26:
2X35S
/
CPMV
-HT+/
PDISP
/H3 Victoria/NOS (구조 번호 1819)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 A/Victoria/361/2011의 H3을 암호화하는 서열 (PDISP/H3 Victoria)을 하기 PCR-기반 방법을 사용하여 2X35S-CPMV-HT+/NOS 발현 시스템으로 클로닝하였다. PDISP/H3 Victoria 암호화 서열을 함유하는 단편을 프라이머 IF(SacII)-Kozac_PDI.c (도 45A, 서열 번호: 123) 및 IF-H3V36111.s1-4r (도 45B, 서열 번호: 124)을 사용하여 증폭시켰으며, 주형으로서 PDISP/H3 Victoria 서열 (도 44C, 서열 번호: 119)을 사용하였다. PCR 생성물을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV-HT+/NOS 발현 시스템에서 클로닝하였다. 구조 번호 2181 (도 45D)은 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 2181은 CPMV-HT+기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 45E에서 제공된다 (서열 번호: 125). 결과의 구조는 주어진 번호 1819이다 (도 45E, 서열 번호: 126). PDISP와 융합된 인플루엔자 A/Victoria/361/2011의 성숙한 H3의 아미노산 서열은 도 44G에서 제공된다 (서열 번호: 122). 플라스미드 1819의 도면은 도 45F에서 제공된다.
실시예
5.27
2X35S
/
CPMV
HT+/
PDISP
/H2 Singapore/NOS (구조 번호 2220)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 A/Singapore/1/1957의 H2를 암호화하는 서열 (PDISP/H2 Singapore)을 하기 PCR-기반 방법을 사용하여 2X35S/CPMV HT+/NOS 발현 시스템으로 클로닝하였다. PDISP/H2 Singapore 암호화 서열을 함유하는 단편을 프라이머 IF(SacII)-Kozac PDI.c (실시예 5.26에서 구조 1819에 대하여 기술됨) 및 IF**-H2S157.s1-6r (도 48A, 서열 번호: 127)을 사용하여 증폭시켰으며, 주형으로서 PDISP/H2 Singapore 서열 (도 48B, 서열 번호: 128)을 사용하였다. PCR 생성물을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV HT+/NOS 발현 시스템으로 클로닝하였다. 구조 번호 2181 (실시예 5.26에서 구조 1819에 대하여 기술됨)은 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 2181은 CPMV HT+기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 45D에서 제공된다. 결과의 구조는 주어진 번호 2220이다 (도 48C, 서열 번호: 129). PDISP에 융합된 인플루엔자 A/Singapore/1/1957의 성숙한 H2의 아미노산 서열은 도 48D에서 제공된다 (서열 번호: 130). 플라스미드 2220의 도면은 도 48E에서 제공된다.
실시예
5.28
2X35S
/
CPMV
HT+/결실된 단백질 가수분해 루프를 가진
PDISP
/H2 Singapore/NOS (구조 번호 2221)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Singapore/1/1957의 H2를 암호화하는 서열 (결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore)을 Darveau et al.에 의해 제공된 하기 PCR-기반 결찰 방법을 사용하여 2X35S/CPMV HT+/NOS 발현 시스템으로 클로닝하였다 (Methods in Neuroscience 26: 77-85 (1995)). PCR의 첫 번째 라운드에서, nt 1에서 nt 1032까지의 인플루엔자 A/Singapore/1/1957 암호화 서열의 H2를 함유하는 단편을 프라이머 IF(SacII)-Kozac_PDI.c (실시예 5.26에서 구조 1819에 대하여 기술됨) 및 H2S157(Prl-).r (도 49A, 서열 번호: 131)로 증폭시켰으며, 주형으로서 PDISP/H2 Singapore 서열 (도 48B, 서열 번호: 128)을 사용하였다. nt 1084에서 nt 1716까지의 인플루엔자 A/Singapore/1/1957 암호화 서열의 H2를 암호화하는 두 번째 단편을 프라이머 H2S157(Prl-).c (도 49B, 서열 번호: 132) 및 IF**-H2S157.s1-6r (도 48A, 서열 번호: 127)로 증폭시켰으며 주형으로서 PDISP/H2 Singapore 서열 (도 48B, 서열 번호: 128)을 사용하였다. 두 번의 증폭으로부터의 PCR 생성물을 이어서 혼합하였고 증폭의 두 번째 라운드에 대한 주형으로서 사용하였으며 프라이머로서 IF(SacII)-Kozac_PDI.c (실시예 5.26에서 구조 1819에 대하여 기술됨) 및 IF**-H2S157.s1-6r (도 48A, 서열 번호: 127)을 사용하였다. PCR 생성물 (GG 링커에 의해 대체된 aa 321 내지 337을 가진 PDISP/H2 Singapore 암호화 서열 포함)을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV HT+/NOS 발현 시스템에서 클로닝하였다. 구조 번호 2181 (실시예 5.26에서 구조 1819에 대하여 기술됨)을 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 2181은 CPMV HT+기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열은 도 45D에서 제공된다 (실시예 5.26에서 구조 1819에 대하여 기술됨). 결과의 구조는 주어진 번호 2221이다 (도 49C, 서열 번호: 133). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Singapore/1/1957의 성숙한 H2의 아미노산 서열은 도 49D에서 제공된다 (서열 번호: 134). 플라스미드 2221의 도면은 도 49E에서 제공된다.
실시예
5.29
2X35S
/
CPMV
160+/NOS 발현 시스템에서
PDISP
/H2 Singapore (구조 번호 2222) 및 결실된 단백질 가수분해 루프를 가진
PDISP
/H2
Singapore (구조
번호 2223)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 단백질 가수분해 루프가 있거나 없는 인플루엔자 A/Singapore/1/1957의 H2를 암호화하는 서열 (PDISP/H2 Singapore 및 결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore)을 각각 구조 2220 및 2221과 같은 PCR-기반 방법을 사용하지만, 증폭을 위해 변형된 정방향 프라이머 IF**(SacII)-PDI.s1+4c (실시예 5.25에서 구조 1800에 대하여 기술됨) 및 다른 수령체 플라스미드를 사용하여 2X35S/CPMV 160+/NOS 발현 시스템으로 클로닝하였다. 결과의 PCR 생성물을 In-Fusion 클로닝 시스템 (Clontech, Mountain View, CA)을 사용하여 2X35S/CPMV 160+/NOS 발현 시스템에서 클로닝하였다. 구조 번호 2171 (실시예 5.25에서 구조 1800에 대하여 기술됨)은 SacII 및 StuI 제한 효소로 분해하였고 선형화된 플라스미드를 In-Fusion 조립 반응에 사용하였다. 구조 번호 2171은 CPMV 160+기반 발현 카세트에서 원하는 유전자의 "In Fusion" 클로닝을 위해 의도된 수령체 플라스미드이다. 그것은 또한 알팔파 플라스토시아닌 유전자 프로모터 및 종결자 하에 침묵의 TBSV P19 억제자의 동시-발현을 위한 유전자 구조를 포함한다. 백본은 pCAMBIA 2분열 플라스미드이고 왼쪽 t-DNA 보더에서 오른쪽 t-DNA 보더까지의 서열이 제공된다 (실시예 5.25에서 구조 1800에 대하여 기술됨). 결과의 구조에 PDISP/H2 Singapore에 대하여 주어진 번호 2222이고 (도 5 OA, 서열 번호: 135) 결실된 단백질 가수분해 루프를 가진 PDISP/H2 Singapore에 대하여 2223이다 (도 50B, 서열 번호: 136). 플라스미드 2222 및 2223의 도면은 각각 도 50C 및 50D에서 제공된다.
실시예
5.30
PDISP
/H3 Perth에 대한
2X35S
/
CPMV
HT+(구조 번호 2019) 및 160+(구조 번호 2139)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 A/Perth/16/2009 의 H3에 해당하는 암호화 서열 (PDISP/H3 Perth) (도 51 A, 서열 번호: 137)을 각각 구조 2220 및 2222와 같은 In Fusion-기반 접근법을 사용하지만, PDISP/H3 Perth에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV HT+및 160+로 클로닝하였다 (도 51B, 서열 번호: 138). PDISP와 융합된 인플루엔자 A/Perth/16/2009의 성숙한 H3의 아미노산 서열은 도 51C에서 제공된다 (서열 번호: 139). 플라스미드 2019 및 2139의 도면은 도 51D 및 도 51E에서 제공된다.
실시예
5.31 결실된 단백질 가수분해 루프를 가진
PDISP
/H3 Perth에 대한 2X35S/CPMV HT+(구조 번호 2039) 및 160+(구조 번호 2159)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Perth/16/2009의 H3에 해당하는 암호화 서열 (결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth) (도 52, 서열 번호: 140)을 각각 구조 2221 및 2223과 같은 In Fusion-기반 접근법을 사용하지만, 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Perth에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV HT+및 160+로 클로닝하였다 (도 51B (서열 번호: 138), 52B (서열 번호: 141) 및 53C (서열 번호: 142). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Perth/16/2009의 성숙한 H3의 아미노산 서열은 도 52D에서 제공된다 (서열 번호: 143). 플라스미드 2039 및 2159의 도면은 도 52E 및 도 52F에서 제공된다.
실시예
5.32 결실된 단백질 가수분해 루프를 가진
PDISP
/H3 Victoria에 대한 2X35S/CPMV HT+(구조 번호 2230) 및 160+(구조 번호 2250)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Victoria/361/2011의 H3에 해당하는 암호화 서열 (결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria) (도 53, 서열 번호: 144)을 구조 2221 및 2223 와 같은 In Fusion-기반 접근법을 사용하지만 (실시예 5.28 및 5.29 참조), 결실된 단백질 가수분해 루프를 가진 PDISP/H3 Victoria에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV HT+및 160+로 클로닝하였다 (도 53B (서열 번호: 145) 및 53C (서열 번호: 146). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Victoria/361/2011의 성숙한 H3의 아미노산 서열은 도 53D에서 제공된다 (서열 번호: 147). 플라스미드 2230 및 2250의 도면은 도 53E 및 도 53F에서 제공된다.
실시예
5.33
2X35S
/
CPMV
HT+/
PDISP
/H7
Hangzhou
/NOS (구조 번호 2142)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 A/Hangzhou/1/2013의 H7에 해당하는 암호화 서열 (PDISP/H7 Hangzhou) (도 54A, 서열 번호: 148)을 구조 2220과 같은 In Fusion-기반 접근법을 사용하지만 PDISP/H7 Hangzhou에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV HT+로 클로닝하였다 (도 54B, 서열 번호: 149). PDISP와 융합된 인플루엔자 A/Hangzhou/1/2013의 성숙한 H7의 아미노산 서열은 도 54C에서 제공된다 (서열 번호: 150). 플라스미드 2142의 도면은 도 54E에서 제공된다.
실시예
5.34
2X35S
/
CPMV
HT+/결실된 단백질 가수분해 루프를 가진
PDISP
/H7 Hangzhou/NOS (구조 번호 2152)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Hangzhou/1/2013의 H7에 해당하는 암호화 서열 (결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou) (도 55A, 서열 번호: 151)을 구조 2221과 같은 In Fusion-기반 접근법을 사용하지만 결실된 단백질 가수분해 루프를 가진 PDISP/H7 Hangzhou에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV HT+로 클로닝하였다 (도 54B (서열 번호: 149), 도 55B (서열 번호: 152) 및 도 55C (서열 번호: 153)). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Hangzhou/1/2013의 성숙한 H7의 아미노산 서열은 도 55D에서 제공된다 (서열 번호: 154). 플라스미드 2152의 도면은 도 55E에서 제공된다.
실시예
5.35
PDISP
/H9 Hong Kong에 대한
2X35S
/
CPMV
HT+(구조 번호 2224) 및 160+(구조 번호 2226)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 A/Hong Kong/1073/1999의 H9에 해당하는 암호화 서열 (PDISP/H9 Hong Kong) (도 56A, 서열 번호: 155)을 각각 구조 2220 및 2222와 같은 In Fusion-기반 접근법을 사용하지만, PDISP/H9 Hong Kong에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV HT+및 160+로 클로닝하였다 (도 56B, 서열 번호: 156). PDISP와 융합된 인플루엔자 A/Hong Kong/1073/1999의 성숙한 H9의 아미노산 서열은 도 56C에서 제공된다 (서열 번호: 157). 플라스미드 2224 및 2226의 도면은 도 56D 및 도 56E에서 제공된다.
실시예
5.36 결실된 단백질 가수분해 루프를 가진
PDISP
/H9 Hong Kong에 대한
2X35S
/
CPMV
HT+(구조 번호 2225) 및 160+(구조 번호 2227)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Hong Kong/1073/1999의 H9에 해당하는 암호화 서열 (결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong) (도 57A, 서열 번호: 158)을 각각 구조 2221 및 2223과 같은 In Fusion-기반 접근법을 사용하지만, 결실된 단백질 가수분해 루프를 가진 PDISP/H9 Hong Kong에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV HT+및 160+로 클로닝하였다 (도 56B (서열 번호: 156), 도 57B (서열 번호: 159) 및 도 57C (서열 번호: 160)). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 A/Hong Kong/1073/1999의 성숙한 H9의 아미노산 서열은 도 57D에서 제공된다 (서열 번호: 161). 플라스미드 2225 및 2227의 도면은 도 57E 및 도 57F에서 제공된다.
실시예
5.37
2X35S
/
CPMV
160+/
PDISP
/HA B Malaysia/NOS (구조 번호 2013)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 B/Malaysia/2506/2004의 HA에 해당하는 암호화 서열 (PDISP/HA B Malaysia) (도 58A, 서열 번호: 162)를 구조 2222와 같은 In Fusion-기반 접근법을 사용하지만 PDISP/HA B Malaysia에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV 160+로 클로닝하였다 (도 58B, 서열 번호: 163). PDISP와 융합된 인플루엔자 B/Malaysia/2506/2004의 성숙한 HA의 아미노산 서열은 도 58C에서 제공된다 (서열 번호: 164). 플라스미드 2013의 도면은 도 58D에서 제공된다.
실시예
5.38
2X35S
/
CPMV
160+/결실된 단백질 가수분해 루프를 가진
PDISP
/HA B Malaysia/NOS (구조 번호 2014)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Malaysia/2506/2004의 HA에 해당하는 암호화 서열 (결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia) (도 59A, 서열 번호: 165)을 구조 2223과 같은 In Fusion-기반 접근법을 사용하지만 결실된 단백질 가수분해 루프를 가진 PDISP/HA B Malaysia에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 CPMV 160+로 클로닝하였다 (도 58B (서열 번호: 163), 도 59B (서열 번호: 166), 도 59C (서열 번호: 167). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Malaysia/2506/2004의 성숙한 HA의 아미노산 서열은 도 59D에서 제공된다 (서열 번호: 168). 플라스미드 2014의 도면은 도 59E에서 제공된다.
실시예
5.39
PDISP
/HA B Massachusetts에 대한
2X35S
/
CPMV
HT (구조 번호 2070), HT+(구조 번호 2080) 및 160+(-
Mprot
) (구조 번호 2090)
고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 B/Massachusetts/2/2012의 HA에 해당하는 암호화 서열 (PDISP/HA B Massachusetts) (도 60A, 서열 번호: 169)을 각각 구조 2072, 2220 및 2222와 같은 In Fusion-기반 접근법을 사용하지만, PDISP/HA B Massachusetts에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 원래의 HT, 변형된 HT+및 160+으로 클로닝하였다. PDISP와 융합된 인플루엔자 B/Massachusetts/2/2012의 성숙한 HA의 아미노산 서열은 도 60B에서 제공된다 (서열 번호: 170). 플라스미드 2070, 2080 및 2090의 도면은 도 60C, 도 60D 및 도 60E에서 제공된다.
실시예
5.40 결실된 단백질 가수분해 루프를 가진
PDISP
/HA B Florida에 대한 2X35S/CPMV HT+(구조 번호 2102), BeYDV가 있는 HT+(구조 번호 2104)
단백질 가수분해 루프 결실되고 고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 B/Florida의 HA에 해당하는 암호화 서열 (PDISP/HA B Florida) (도 61D, 서열 번호: 193)을 상기 기술된 바와 같은 In Fusion-기반 접근법을 사용하지만, PDISP/HA B/Florida에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 HT+로 클로닝하였다 (도면 참조 도 61A (서열 번호: 190), 도 61B (서열 번호: 191) 및 도 61C (서열 번호: 192). 결과의 발현 카세트 2102의 뉴클레오타이드 서열은 도 61F에서 주어진다 (서열 번호: 195). 유사하게, 결실된 단백질 가수분해 루프 가지고 고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 B/Florida의 HA에 해당하는 암호화 서열을 증폭 요소 BeYDV와 함께 변형된 HT+로 클로닝하였다. 결과의 발현 카세트 2104의 뉴클레오타이드 서열은 도 61F에서 주어진다 (서열 번호: 196). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Florida의 성숙한 HA의 아미노산 서열은 도 61E에서 제공된다 (서열 번호: 194). 플라스미드 2102 및 2104의 도면은 도 61G 및 61I에서 제공된다.
실시예
5.41 결실된 단백질 가수분해 루프를 가진
PDISP
/HA B Florida+H1 California
TMCT에
대한
2X35S
/
CPMV
HT+(구조 번호 2106),
BeYDV가
있는
HT+(구
조 번호 2108)
결실된 단백질 가수분해 루프를 가지고 고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 B/Florida+H1 California TMCT의 HA에 해당하는 암호화 서열 (PDISP/HA B Florida+H1 California TMCT) (도 62B, 서열 번호: 198)을 상기 기술된 바와 같은 In Fusion-기반 접근법을 사용하지만, PDISP/HA B/Florida+H1 California TMCT에 대하여 특이적으로 설계된 변형된 PCR 프라이머를 가지고 변형된 HT+로 클로닝하였다 (도면 참조 도 61A (서열 번호: 197). 결과의 발현 카세트 2106의 뉴클레오타이드 서열은 도 62D에서 주어진다 (서열 번호: 200). 유사하게, 결실된 단백질 가수분해 루프를 가지고 고유한 신호 펩타이드가 알팔파 단백질 이황화 이소머라제의 그것에 의해 대체된 인플루엔자 B/Florida+H1 California TMCT의 HA에 해당하는 암호화 서열을 증폭 요소 BeYDV와 함께 변형된 HT+로 클로닝하였다. 결과의 발현 카세트 2108의 뉴클레오타이드 서열은 도 62F에서 주어진다 (서열 번호: 201). PDISP와 융합된, 결실된 단백질 가수분해 루프를 가진 인플루엔자 B/Florida+H1 California TMCT의 성숙한 HA의 아미노산 서열은 도 62C에서 제공된다 (서열 번호: 199). 플라스미드 2106 및 2108의 도면은 도 62E 및 62G에서 제공된다.
모든 인용문은 본원에서 참고로 포함된다.
본 발명은 하나 이상의 구체예에 관하여 기술되었다. 하지만, 청구범위에서 한정된 본 발명의 범위로부터 벗어나지 않으면서 많은 변화 및 변형이 이루어질 수 있다는 것은 당업자에게 명백할 것이다.
SEQUENCE LISTING
<110> MEDICAGO INC.
<120> INFLUENZA VIRUS-LIKE PARTICLE PRODUCTION IN PLANTS
<130> V85680WO
<140> PCT/CA2014/050326
<141> 2014-03-28
<150> US 61/806,227
<151> 2013-03-28
<150> US 61/971,274
<151> 2014-03-27
<150> US 61/925,852
<151> 2014-01-10
<160> 201
<170> PatentIn version 3.5
<210> 1
<211> 21
<212> PRT
<213> Artificial sequence
<220>
<223> Avian H5 proteolytic loop consensus sequence
<400> 1
Gln Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala
1 5 10 15
Gly Phe Ile Glu Gly
20
<210> 2
<211> 41
<212> DNA
<213> Artificial sequence
<220>
<223> Primer IF-H5A-I-05.s1+3c
<400> 2
aaatttgtcg ggcccatgga gaaaatagtg cttcttcttg c 41
<210> 3
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> Primer IF-H5dTm.r
<400> 3
actaaagaaa ataggccttt aaatgcaaat tctgcattgt aacgatccat 50
<210> 4
<211> 4903
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1191
<400> 4
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120
aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180
aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240
ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300
gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360
aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420
aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480
taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540
aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600
atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660
taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720
tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780
gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840
acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900
ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960
accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020
gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080
aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 1140
gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200
actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260
aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320
gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380
tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 1440
agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500
tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560
tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620
ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 1680
tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 1740
ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800
cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 1860
gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920
tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980
ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040
ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100
cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca 2160
cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 2220
tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 2280
ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 2340
cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 2400
cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 2460
ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga 2520
tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa 2580
cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga 2640
aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc 2700
tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 2760
cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga 2820
tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 2880
tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa 2940
ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc 3000
ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt 3060
tcactgaagc gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg 3120
tgtacttgtc ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct 3180
gttcagcccc atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct 3240
acttctgctt gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt 3300
tctataagaa atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga 3360
gaaagattgt taagcttctg tatattctgc ccaaatttgt cgggcccgcg gatggcgaaa 3420
aacgttgcga ttttcggctt attgttttct cttcttgtgt tggttccttc tcagatcttc 3480
gcctgcaggc tcctcagcca aaacgacacc cccatctgtc tatccactgg cccctggatc 3540
tgctgcccaa actaactcca tggtgaccct gggatgcctg gtcaagggct atttccctga 3600
gccagtgaca gtgacctgga actctggatc cctgtccagc ggtgtgcaca ccttcccagc 3660
tgtcctgcag tctgacctct acactctgag cagctcagtg actgtcccct ccagcacctg 3720
gcccagcgag accgtcacct gcaacgttgc ccacccggcc agcagcacca aggtggacaa 3780
gaaaattgtg cccagggatt gtggttgtaa gccttgcata tgtacagtcc cagaagtatc 3840
atctgtcttc atcttccccc caaagcccaa ggatgtgctc accattactc tgactcctaa 3900
ggtcacgtgt gttgtggtag acatcagcaa ggatgatccc gaggtccagt tcagctggtt 3960
tgtagatgat gtggaggtgc acacagctca gacgcaaccc cgggaggagc agttcaacag 4020
cactttccgc tcagtcagtg aacttcccat catgcaccag gactggctca atggcaagga 4080
gcgatcgctc accatcacca tcaccatcac catcaccatt aaaggcctat tttctttagt 4140
ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt ctgtgctcag 4200
agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca ggtcgtccct 4260
tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa agaccgggaa 4320
ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa agtttcttaa 4380
gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg aattacgtta 4440
agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt tttatgatta 4500
gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc gcaaactagg 4560
ataaattatc gcgcgcggtg tcatctatgt tactagatct ctagagtctc aagcttggcg 4620
cgcccacgtg actagtggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg 4680
gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg 4740
aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatgctaga 4800
gcagcttgag cttggatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 4860
acaggatata ttggcgggta aacctaagag aaaagagcgt tta 4903
<210> 5
<211> 3447
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 489
<400> 5
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggag aaaatagtgc ttcttcttgc aatagtcagt cttgttaaaa gtgatcagat 1320
ttgcattggt taccatgcaa acaattcaac agagcaggtt gacacaatca tggaaaagaa 1380
cgttactgtt acacatgccc aagacatact ggaaaagaca cacaacggga agctctgcga 1440
tctagatgga gtgaagcctc taattttaag agattgtagt gtagctggat ggctcctcgg 1500
gaacccaatg tgtgacgaat tcatcaatgt accggaatgg tcttacatag tggagaaggc 1560
caatccaacc aatgacctct gttacccagg gagtttcaac gactatgaag aactgaaaca 1620
cctattgagc agaataaacc attttgagaa aattcaaatc atccccaaaa gttcttggtc 1680
cgatcatgaa gcctcatcag gagttagctc agcatgtcca tacctgggaa gtccctcctt 1740
ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca tacccaacaa taaagaaaag 1800
ctacaataat accaaccaag aggatctttt ggtactgtgg ggaattcacc atcctaatga 1860
tgcggcagag cagacaaggc tatatcaaaa cccaaccacc tatatttcca ttgggacatc 1920
aacactaaac cagagattgg taccaaaaat agctactaga tccaaagtaa acgggcaaag 1980
tggaaggatg gagttcttct ggacaatttt aaaacctaat gatgcaatca acttcgagag 2040
taatggaaat ttcattgctc cagaatatgc atacaaaatt gtcaagaaag gggactcagc 2100
aattatgaaa agtgaattgg aatatggtaa ctgcaacacc aagtgtcaaa ctccaatggg 2160
ggcgataaac tctagtatgc cattccacaa catacaccct ctcaccatcg gggaatgccc 2220
caaatatgtg aaatcaaaca gattagtcct tgcaacaggg ctcagaaata gccctcaaag 2280
agagagcaga agaaaaaaga gaggactatt tggagctata gcaggtttta tagagggagg 2340
atggcaggga atggtagatg gttggtatgg gtaccaccat agcaatgagc aggggagtgg 2400
gtacgctgca gacaaagaat ccactcaaaa ggcaatagat ggagtcacca ataaggtcaa 2460
ctcaatcatt gacaaaatga acactcagtt tgaggccgtt ggaagggaat ttaataactt 2520
agaaaggaga atagagaatt taaacaagaa gatggaagac gggtttctag atgtctggac 2580
ttataatgcc gaacttctgg ttctcatgga aaatgagaga actctagact ttcatgactc 2640
aaatgttaag aacctctacg acaaggtccg actacagctt agggataatg caaaggagct 2700
gggtaacggt tgtttcgagt tctatcacaa atgtgataat gaatgtatgg aaagtataag 2760
aaacggaacg tacaactatc cgcagtattc agaagaagca agattaaaaa gagaggaaat 2820
aagtggggta aaattggaat caataggaac ttaccaaata ctgtcaattt attcaacagt 2880
ggcgagttcc ctagcactgg caatcatgat ggctggtcta tctttatgga tgtgctccaa 2940
tggatcgtta caatgcagaa tttgcattta aaggcctatt ttctttagtt tgaatttact 3000
gttattcggt gtgcatttct atgtttggtg agcggttttc tgtgctcaga gtgtgtttat 3060
tttatgtaat ttaatttctt tgtgagctcc tgtttagcag gtcgtccctt cagcaaggac 3120
acaaaaagat tttaatttta ttaaaaaaaa aaaaaaaaaa gaccgggaat tcgatatcaa 3180
gcttatcgac ctgcagatcg ttcaaacatt tggcaataaa gtttcttaag attgaatcct 3240
gttgccggtc ttgcgatgat tatcatataa tttctgttga attacgttaa gcatgtaata 3300
attaacatgt aatgcatgac gttatttatg agatgggttt ttatgattag agtcccgcaa 3360
ttatacattt aatacgcgat agaaaacaaa atatagcgcg caaactagga taaattatcg 3420
cgcgcggtgt catctatgtt actagat 3447
<210> 6
<211> 568
<212> PRT
<213> Influenza H5 A/Indonesia/5/2005 (H5N1)
<400> 6
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile
340 345 350
Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr
355 360 365
Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys
370 375 380
Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser
385 390 395 400
Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe
405 410 415
Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp
420 425 430
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met
435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu
450 455 460
Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly
465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu
485 490 495
Ser Ile Arg Asn Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala
500 505 510
Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly
515 520 525
Thr Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala
530 535 540
Leu Ala Ile Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly
545 550 555 560
Ser Leu Gln Cys Arg Ile Cys Ile
565
<210> 7
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> Primer IF-S1-M1+M2ANC.c
<400> 7
aaatttgtcg ggcccatgag tcttctaacc gaggtcgaaa cg 42
<210> 8
<211> 43
<212> DNA
<213> Artificial sequence
<220>
<223> Primer IF-S1-4-M2ANC.r
<400> 8
actaaagaaa ataggccttt actccagctc tatgctgaca aaa 43
<210> 9
<211> 294
<212> DNA
<213> Artificial sequence
<220>
<223> Synthesized M2 gene
<400> 9
atgagtcttc taaccgaggt cgaaacgcct atcagaaacg aatgggggtg cagatgcaac 60
gattcaagtg atcctcttgt tgttgccgca agtataattg ggattgtgca cctgatattg 120
tggattattg atcgcctttt ttccaaaagc atttatcgta tctttaaaca cggtttaaaa 180
agagggcctt ctacggaagg agtaccagag tctatgaggg aagaatatcg agaggaacag 240
cagaatgctg tggatgctga cgatggtcat tttgtcagca tagagctgga gtaa 294
<210> 10
<211> 2034
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 1261
<400> 10
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatgagt cttctaaccg aggtcgaaac gcctatcaga aacgaatggg ggtgcagatg 1320
caacgattca agtgatcctc ttgttgttgc cgcaagtata attgggattg tgcacctgat 1380
attgtggatt attgatcgcc ttttttccaa aagcatttat cgtatcttta aacacggttt 1440
aaaaagaggg ccttctacgg aaggagtacc agagtctatg agggaagaat atcgagagga 1500
acagcagaat gctgtggatg ctgacgatgg tcattttgtc agcatagagc tggagtaaag 1560
gcctattttc tttagtttga atttactgtt attcggtgtg catttctatg tttggtgagc 1620
ggttttctgt gctcagagtg tgtttatttt atgtaattta atttctttgt gagctcctgt 1680
ttagcaggtc gtcccttcag caaggacaca aaaagatttt aattttatta aaaaaaaaaa 1740
aaaaaaagac cgggaattcg atatcaagct tatcgacctg cagatcgttc aaacatttgg 1800
caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt 1860
ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga 1920
tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata 1980
tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact agat 2034
<210> 11
<211> 97
<212> PRT
<213> Influenza M2 New Caledonia/20/1999 (H1N1)
<400> 11
Met Ser Leu Leu Thr Glu Val Glu Thr Pro Ile Arg Asn Glu Trp Gly
1 5 10 15
Cys Arg Cys Asn Asp Ser Ser Asp Pro Leu Val Val Ala Ala Ser Ile
20 25 30
Ile Gly Ile Val His Leu Ile Leu Trp Ile Ile Asp Arg Leu Phe Ser
35 40 45
Lys Ser Ile Tyr Arg Ile Phe Lys His Gly Leu Lys Arg Gly Pro Ser
50 55 60
Thr Glu Gly Val Pro Glu Ser Met Arg Glu Glu Tyr Arg Glu Glu Gln
65 70 75 80
Gln Asn Ala Val Asp Ala Asp Asp Gly His Phe Val Ser Ile Glu Leu
85 90 95
Glu
<210> 12
<211> 294
<212> DNA
<213> Artificial sequence
<220>
<223> Synthesized M2 gene
<400> 12
atgagtcttc taaccgaggt cgaaacgcct atcagaaacg aatgggggtg cagatgcaac 60
ggttcaagtg atcctctcac tattgccgca aatatcattg ggatcttgca cttgacattg 120
tggattcttg atcgtctttt tttcaaatgc atttaccgtc gctttaaata cggactgaaa 180
ggagggcctt ctacggaagg agtgccaaag tctatgaggg aagaatatcg aaaggaacag 240
cagagtgctg tggatgctga cgatggtcat tttgtcagca tagagctgga gtaa 294
<210> 13
<211> 2034
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 859
<400> 13
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatgagt cttctaaccg aggtcgaaac gcctatcaga aacgaatggg ggtgcagatg 1320
caacggttca agtgatcctc tcactattgc cgcaaatatc attgggatct tgcacttgac 1380
attgtggatt cttgatcgtc tttttttcaa atgcatttac cgtcgcttta aatacggact 1440
gaaaggaggg ccttctacgg aaggagtgcc aaagtctatg agggaagaat atcgaaagga 1500
acagcagagt gctgtggatg ctgacgatgg tcattttgtc agcatagagc tggagtaaag 1560
gcctattttc tttagtttga atttactgtt attcggtgtg catttctatg tttggtgagc 1620
ggttttctgt gctcagagtg tgtttatttt atgtaattta atttctttgt gagctcctgt 1680
ttagcaggtc gtcccttcag caaggacaca aaaagatttt aattttatta aaaaaaaaaa 1740
aaaaaaagac cgggaattcg atatcaagct tatcgacctg cagatcgttc aaacatttgg 1800
caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt 1860
ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga 1920
tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata 1980
tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact agat 2034
<210> 14
<211> 97
<212> PRT
<213> Influenza M2 A/Puerto Rico/8/1934 (H1N1)
<400> 14
Met Ser Leu Leu Thr Glu Val Glu Thr Pro Ile Arg Asn Glu Trp Gly
1 5 10 15
Cys Arg Cys Asn Gly Ser Ser Asp Pro Leu Thr Ile Ala Ala Asn Ile
20 25 30
Ile Gly Ile Leu His Leu Thr Leu Trp Ile Leu Asp Arg Leu Phe Phe
35 40 45
Lys Cys Ile Tyr Arg Arg Phe Lys Tyr Gly Leu Lys Gly Gly Pro Ser
50 55 60
Thr Glu Gly Val Pro Lys Ser Met Arg Glu Glu Tyr Arg Lys Glu Gln
65 70 75 80
Gln Ser Ala Val Asp Ala Asp Asp Gly His Phe Val Ser Ile Glu Leu
85 90 95
Glu
<210> 15
<211> 3474
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 1039
<400> 15
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggcg aaaaacgttg cgattttcgg cttattgttt tctcttcttg tgttggttcc 1320
ttctcagatc ttcgccgatc gaatctgcac tggaataaca tcgtcaaact caccacatgt 1380
cgtcaaaact gctactcaag gggaggtcaa tgtgactggt gtaataccac tgacaacaac 1440
acccaccaaa tctcattttg caaatctcaa aggaacagaa accaggggga aactatgccc 1500
aaaatgcctc aactgcacag atctggacgt agccttgggc agaccaaaat gcacggggaa 1560
aataccctcg gcaagagttt caatactcca tgaagtcaga cctgttacat ctgggtgctt 1620
tcctataatg cacgacagaa caaaaattag acagctgcct aaccttctcc gaggatacga 1680
acatatcagg ttatcaaccc ataacgttat caatgcagaa aatgcaccag gaggacccta 1740
caaaattgga acctcagggt cttgccctaa cattaccaat ggaaacggat ttttcgcaac 1800
aatggcttgg gccgtcccaa aaaacgacaa aaacaaaaca gcaacaaatc cattaacaat 1860
agaagtacca tacatttgta cagaaggaga agaccaaatt accgtttggg ggttccactc 1920
tgacaacgag acccaaatgg caaagctcta tggggactca aagccccaga agttcacctc 1980
atctgccaac ggagtgacca cacattacgt ttcacagatt ggtggcttcc caaatcaaac 2040
agaagacgga ggactaccac aaagtggtag aattgttgtt gattacatgg tgcaaaaatc 2100
tgggaaaaca ggaacaatta cctatcaaag gggtatttta ttgcctcaaa aggtgtggtg 2160
cgcaagtggc aggagcaagg taataaaagg atccttgcct ttaattggag aagcagattg 2220
cctccacgaa aaatacggtg gattaaacaa aagcaagcct tactacacag gggaacatgc 2280
aaaggccata ggaaattgcc caatatgggt gaaaacaccc ttgaagctgg ccaatggaac 2340
caaatataga cctcctggtg gaggatggga aggaatgatt gcaggttggc acggatacac 2400
atcccatggg gcacatggag tagcggtggc agcagacctt aagagcactc aagaggccat 2460
aaacaagata acaaaaaatc tcaactcttt gagtgagctg gaagtaaaga atcttcaaag 2520
actaagcggt gccatggatg aactccacaa cgaaatacta gaactagatg agaaagtgga 2580
tgatctcaga gctgatacaa taagctcaca aatagaactc gcagtcctgc tttccaatga 2640
aggaataata aacagtgaag atgaacatct cttggcgctt gaaagaaagc tgaagaaaat 2700
gctgggcccc tctgctgtag agatagggaa tggatgcttt gaaaccaaac acaagtgcaa 2760
ccagacctgt ctcgacagaa tagctgctgg tacctttgat gcaggagaat tttctctccc 2820
cacctttgat tcactgaata ttactgctgc atctttaaat gacgatggat tggataatca 2880
tactatactg ctttactact caactgctgc ctccagtttg gctgtaacac tgatgatagc 2940
tatctttgtt gtttatatgg tctccagaga caatgtttct tgctccatct gtctataaag 3000
gcctattttc tttagtttga atttactgtt attcggtgtg catttctatg tttggtgagc 3060
ggttttctgt gctcagagtg tgtttatttt atgtaattta atttctttgt gagctcctgt 3120
ttagcaggtc gtcccttcag caaggacaca aaaagatttt aattttatta aaaaaaaaaa 3180
aaaaaaagac cgggaattcg atatcaagct tatcgacctg cagatcgttc aaacatttgg 3240
caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt 3300
ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga 3360
tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata 3420
tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact agat 3474
<210> 16
<211> 570
<212> PRT
<213> Influenza B/Brisbane/60/2008
<400> 16
Asp Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val
1 5 10 15
Lys Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu
20 25 30
Thr Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu
35 40 45
Thr Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp
50 55 60
Val Ala Leu Gly Arg Pro Lys Cys Thr Gly Lys Ile Pro Ser Ala Arg
65 70 75 80
Val Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro
85 90 95
Ile Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg
100 105 110
Gly Tyr Glu His Ile Arg Leu Ser Thr His Asn Val Ile Asn Ala Glu
115 120 125
Asn Ala Pro Gly Gly Pro Tyr Lys Ile Gly Thr Ser Gly Ser Cys Pro
130 135 140
Asn Ile Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val
145 150 155 160
Pro Lys Asn Asp Lys Asn Lys Thr Ala Thr Asn Pro Leu Thr Ile Glu
165 170 175
Val Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly
180 185 190
Phe His Ser Asp Asn Glu Thr Gln Met Ala Lys Leu Tyr Gly Asp Ser
195 200 205
Lys Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr
210 215 220
Val Ser Gln Ile Gly Gly Phe Pro Asn Gln Thr Glu Asp Gly Gly Leu
225 230 235 240
Pro Gln Ser Gly Arg Ile Val Val Asp Tyr Met Val Gln Lys Ser Gly
245 250 255
Lys Thr Gly Thr Ile Thr Tyr Gln Arg Gly Ile Leu Leu Pro Gln Lys
260 265 270
Val Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro
275 280 285
Leu Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn
290 295 300
Lys Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn
305 310 315 320
Cys Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys
325 330 335
Tyr Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala
340 345 350
Ile Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp
355 360 365
His Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp
370 375 380
Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn
385 390 395 400
Ser Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala
405 410 415
Met Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp
420 425 430
Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu
435 440 445
Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala
450 455 460
Leu Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile
465 470 475 480
Gly Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu
485 490 495
Asp Arg Ile Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro
500 505 510
Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly
515 520 525
Leu Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser
530 535 540
Leu Ala Val Thr Leu Met Ile Ala Ile Phe Val Val Tyr Met Val Ser
545 550 555 560
Arg Asp Asn Val Ser Cys Ser Ile Cys Leu
565 570
<210> 17
<211> 554
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence delta-proteolytic loop of type B HA (with
linker GG)
<400> 17
Asp Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val
1 5 10 15
Lys Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu
20 25 30
Thr Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu
35 40 45
Thr Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp
50 55 60
Val Ala Leu Gly Arg Pro Lys Cys Thr Gly Lys Ile Pro Ser Ala Arg
65 70 75 80
Val Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro
85 90 95
Ile Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg
100 105 110
Gly Tyr Glu His Ile Arg Leu Ser Thr His Asn Val Ile Asn Ala Glu
115 120 125
Asn Ala Pro Gly Gly Pro Tyr Lys Ile Gly Thr Ser Gly Ser Cys Pro
130 135 140
Asn Ile Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val
145 150 155 160
Pro Lys Asn Asp Lys Asn Lys Thr Ala Thr Asn Pro Leu Thr Ile Glu
165 170 175
Val Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly
180 185 190
Phe His Ser Asp Asn Glu Thr Gln Met Ala Lys Leu Tyr Gly Asp Ser
195 200 205
Lys Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr
210 215 220
Val Ser Gln Ile Gly Gly Phe Pro Asn Gln Thr Glu Asp Gly Gly Leu
225 230 235 240
Pro Gln Ser Gly Arg Ile Val Val Asp Tyr Met Val Gln Lys Ser Gly
245 250 255
Lys Thr Gly Thr Ile Thr Tyr Gln Arg Gly Ile Leu Leu Pro Gln Lys
260 265 270
Val Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro
275 280 285
Leu Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn
290 295 300
Lys Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn
305 310 315 320
Cys Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys
325 330 335
Tyr Arg Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His
340 345 350
Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu
355 360 365
Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser
370 375 380
Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met
385 390 395 400
Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp
405 410 415
Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu
420 425 430
Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu
435 440 445
Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly
450 455 460
Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp
465 470 475 480
Arg Ile Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro Thr
485 490 495
Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu
500 505 510
Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu
515 520 525
Ala Val Thr Leu Met Ile Ala Ile Phe Val Val Tyr Met Val Ser Arg
530 535 540
Asp Asn Val Ser Cys Ser Ile Cys Leu Pro
545 550
<210> 18
<211> 570
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence replacing cleavage site of B HA with linker
<400> 18
Asp Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val
1 5 10 15
Lys Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu
20 25 30
Thr Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu
35 40 45
Thr Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp
50 55 60
Val Ala Leu Gly Arg Pro Lys Cys Thr Gly Lys Ile Pro Ser Ala Arg
65 70 75 80
Val Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro
85 90 95
Ile Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg
100 105 110
Gly Tyr Glu His Ile Arg Leu Ser Thr His Asn Val Ile Asn Ala Glu
115 120 125
Asn Ala Pro Gly Gly Pro Tyr Lys Ile Gly Thr Ser Gly Ser Cys Pro
130 135 140
Asn Ile Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val
145 150 155 160
Pro Lys Asn Asp Lys Asn Lys Thr Ala Thr Asn Pro Leu Thr Ile Glu
165 170 175
Val Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly
180 185 190
Phe His Ser Asp Asn Glu Thr Gln Met Ala Lys Leu Tyr Gly Asp Ser
195 200 205
Lys Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr
210 215 220
Val Ser Gln Ile Gly Gly Phe Pro Asn Gln Thr Glu Asp Gly Gly Leu
225 230 235 240
Pro Gln Ser Gly Arg Ile Val Val Asp Tyr Met Val Gln Lys Ser Gly
245 250 255
Lys Thr Gly Thr Ile Thr Tyr Gln Arg Gly Ile Leu Leu Pro Gln Lys
260 265 270
Val Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro
275 280 285
Leu Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn
290 295 300
Lys Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn
305 310 315 320
Cys Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys
325 330 335
Tyr Arg Gly Ser Ser Ser Gly Ser Ser Ser Gly Gly Phe Phe Gly Ala
340 345 350
Ile Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp
355 360 365
His Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp
370 375 380
Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn
385 390 395 400
Ser Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala
405 410 415
Met Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp
420 425 430
Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu
435 440 445
Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala
450 455 460
Leu Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile
465 470 475 480
Gly Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu
485 490 495
Asp Arg Ile Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro
500 505 510
Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly
515 520 525
Leu Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser
530 535 540
Leu Ala Val Thr Leu Met Ile Ala Ile Phe Val Val Tyr Met Val Ser
545 550 555 560
Arg Asp Asn Val Ser Cys Ser Ile Cys Leu
565 570
<210> 19
<211> 550
<212> PRT
<213> Influenza H3 A/Perth/16/2009
<400> 19
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
1 5 10 15
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
20 25 30
Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr
35 40 45
Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Lys Asn Cys
50 55 60
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
65 70 75 80
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
85 90 95
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
100 105 110
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr
115 120 125
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Lys
130 135 140
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Phe Lys
145 150 155 160
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys
165 170 175
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile
180 185 190
Phe Leu Tyr Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
195 200 205
Ser Gln Gln Thr Val Ser Pro Asn Ile Gly Ser Arg Pro Arg Val Arg
210 215 220
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
225 230 235 240
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
245 250 255
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
260 265 270
Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
275 280 285
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
290 295 300
Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met
305 310 315 320
Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala
325 330 335
Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly
340 345 350
Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys
355 360 365
Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu
370 375 380
Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser
385 390 395 400
Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr
405 410 415
Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu
420 425 430
Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe
435 440 445
Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn
450 455 460
Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser
465 470 475 480
Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu
485 490 495
Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys
500 505 510
Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys
515 520 525
Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile
530 535 540
Arg Cys Asn Ile Cys Ile
545 550
<210> 20
<211> 540
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence delta-proteolytic loop H3 (with linker GS)
<400> 20
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
1 5 10 15
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
20 25 30
Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr
35 40 45
Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Lys Asn Cys
50 55 60
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
65 70 75 80
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
85 90 95
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
100 105 110
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr
115 120 125
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Lys
130 135 140
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Phe Lys
145 150 155 160
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys
165 170 175
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile
180 185 190
Phe Leu Tyr Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
195 200 205
Ser Gln Gln Thr Val Ser Pro Asn Ile Gly Ser Arg Pro Arg Val Arg
210 215 220
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
225 230 235 240
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
245 250 255
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
260 265 270
Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
275 280 285
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
290 295 300
Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met
305 310 315 320
Gly Ser Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu Gly Met
325 330 335
Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly Arg Gly
340 345 350
Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn
355 360 365
Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe His Gln
370 375 380
Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp Leu Glu
385 390 395 400
Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu
405 410 415
Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr Asp Ser
420 425 430
Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn
435 440 445
Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys Cys Asp
450 455 460
Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His Asp Val
465 470 475 480
Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly Val Glu
485 490 495
Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile
500 505 510
Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met Trp Ala
515 520 525
Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile
530 535 540
<210> 21
<211> 550
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence Replacing cleavage site of H3 with linker
<400> 21
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
1 5 10 15
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
20 25 30
Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr
35 40 45
Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Lys Asn Cys
50 55 60
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
65 70 75 80
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
85 90 95
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
100 105 110
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr
115 120 125
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Lys
130 135 140
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Phe Lys
145 150 155 160
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys
165 170 175
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile
180 185 190
Phe Leu Tyr Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
195 200 205
Ser Gln Gln Thr Val Ser Pro Asn Ile Gly Ser Arg Pro Arg Val Arg
210 215 220
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
225 230 235 240
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
245 250 255
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
260 265 270
Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
275 280 285
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
290 295 300
Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met
305 310 315 320
Gly Ser Ser Gly Ser Ser Gly Ser Ser Gly Ile Phe Gly Ala Ile Ala
325 330 335
Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly
340 345 350
Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys
355 360 365
Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu
370 375 380
Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser
385 390 395 400
Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr
405 410 415
Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu
420 425 430
Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe
435 440 445
Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn
450 455 460
Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser
465 470 475 480
Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu
485 490 495
Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys
500 505 510
Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys
515 520 525
Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile
530 535 540
Arg Cys Asn Ile Cys Ile
545 550
<210> 22
<211> 31
<212> PRT
<213> Influenza H1 New Cal
<400> 22
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr
20 25 30
<210> 23
<211> 31
<212> PRT
<213> Influenza H1 Brisbane
<400> 23
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr
20 25 30
<210> 24
<211> 31
<212> PRT
<213> Influenza H1 Sol Islands
<400> 24
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr
20 25 30
<210> 25
<211> 31
<212> PRT
<213> Influenza H2A Singapore
<400> 25
Val Pro Gln Ile Glu Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr
20 25 30
<210> 26
<211> 31
<212> PRT
<213> Influenza H3A Brisbane
<400> 26
Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
20 25 30
<210> 27
<211> 31
<212> PRT
<213> Influenza H3A WCN
<400> 27
Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly Phe
20 25 30
<210> 28
<211> 34
<212> PRT
<213> Influenza H5 Anhui
<400> 28
Ser Pro Leu Arg Glu Arg Arg Arg Lys Arg Gly Leu Phe Gly Ala Ile
1 5 10 15
Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr
20 25 30
Gly Tyr
<210> 29
<211> 35
<212> PRT
<213> Influenza H5 Indo
<400> 29
Ser Pro Gln Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala
1 5 10 15
Ile Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp
20 25 30
Tyr Gly Tyr
35
<210> 30
<211> 35
<212> PRT
<213> Influenza H5 Vietnam
<400> 30
Ser Pro Gln Arg Glu Arg Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala
1 5 10 15
Ile Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp
20 25 30
Tyr Gly Tyr
35
<210> 31
<211> 6861
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1194
<400> 31
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120
aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180
aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240
ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300
gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360
aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420
aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480
taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540
aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600
atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660
taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720
tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780
gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840
acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900
ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960
accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020
gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080
aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 1140
gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200
actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260
aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320
gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380
tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 1440
agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500
tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560
tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620
ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 1680
tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 1740
ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800
cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 1860
gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920
tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980
ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040
ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100
cgcgttggga attactagcg cgtgtcgaca cgcgtggcgc gccctagcag aaggcatgtt 2160
gttgtgactc cgaggggttg cctcaaactc tatcttataa ccggcgtgga ggcatggagg 2220
caagggcatt ttggtaattt aagtagttag tggaaaatga cgtcatttac ttaaagacga 2280
agtcttgcga caaggggggc ccacgccgaa ttttaatatt accggcgtgg ccccacctta 2340
tcgcgagtgc tttagcacga gcggtccaga tttaaagtag aaaagttccc gcccactagg 2400
gttaaaggtg ttcacactat aaaagcatat acgatgtgat ggtatttgat aaagcgtata 2460
ttgtatcagg tatttccgtc ggatacgaat tattcgtaca agcttcttaa gccggtcaac 2520
atggtggagc acgacacact tgtctactcc aaaaatatca aagatacagt ctcagaagac 2580
caaagggcaa ttgagacttt tcaacaaagg gtaatatccg gaaacctcct cggattccat 2640
tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa 2700
tgccatcatt gcgataaagg aaaggccatc gttgaagatg cctctgccga cagtggtccc 2760
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 2820
tcaaagcaag tggattgatg tgataacatg gtggagcacg acacacttgt ctactccaaa 2880
aatatcaaag atacagtctc agaagaccaa agggcaattg agacttttca acaaagggta 2940
atatccggaa acctcctcgg attccattgc ccagctatct gtcactttat tgtgaagata 3000
gtggaaaagg aaggtggctc ctacaaatgc catcattgcg ataaaggaaa ggccatcgtt 3060
gaagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag gagcatcgtg 3120
gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga tatctccact 3180
gacgtaaggg atgacgcaca atcccactat ccttcgcaag acccttcctc tatataagga 3240
agttcatttc atttggagag gtattaaaat cttaataggt tttgataaaa gcgaacgtgg 3300
ggaaacccga accaaacctt cttctaaact ctctctcatc tctcttaaag caaacttctc 3360
tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga tcgtgcttcg gcaccagtac 3420
aacgttttct ttcactgaag cgaaatcaaa gatctctttg tggacacgta gtgcggcgcc 3480
attaaataac gtgtacttgt cctattcttg tcggtgtggt cttgggaaaa gaaagcttgc 3540
tggaggctgc tgttcagccc catacattac ttgttacgat tctgctgact ttcggcgggt 3600
gcaatatctc tacttctgct tgacgaggta ttgttgcctg tacttctttc ttcttcttct 3660
tgctgattgg ttctataaga aatctagtat tttctttgaa acagagtttt cccgtggttt 3720
tcgaacttgg agaaagattg ttaagcttct gtatattctg cccaaatttg tcgggcccat 3780
ggcgaaaaac gttgcgattt tcggcttatt gttttctctt cttgtgttgg ttccttctca 3840
gatcttcgcc gcggctcctc agccaaaacg acacccccat ctgtctatcc actggcccct 3900
ggatctgctg cccaaactaa ctccatggtg accctgggat gcctggtcaa gggctatttc 3960
cctgagccag tgacagtgac ctggaactct ggatccctgt ccagcggtgt gcacaccttc 4020
ccagctgtcc tgcagtctga cctctacact ctgagcagct cagtgactgt cccctccagc 4080
acctggccca gcgagaccgt cacctgcaac gttgcccacc cggccagcag caccaaggtg 4140
gacaagaaaa ttgtgcccag ggattgtggt tgtaagcctt gcatatgtac agtcccagaa 4200
gtatcatctg tcttcatctt ccccccaaag cccaaggatg tgctcaccat tactctgact 4260
cctaaggtca cgtgtgttgt ggtagacatc agcaaggatg atcccgaggt ccagttcagc 4320
tggtttgtag atgatgtgga ggtgcacaca gctcagacgc aaccccggga ggagcagttc 4380
aacagcactt tccgctcagt cagtgaactt cccatcatgc accaggactg gctcaatggc 4440
aaggaaggcc tattttcttt agtttgaatt tactgttatt cggtgtgcat ttctatgttt 4500
ggtgagcggt tttctgtgct cagagtgtgt ttattttatg taatttaatt tctttgtgag 4560
ctcctgttta gcaggtcgtc ccttcagcaa ggacacaaaa agattttaat tttattaaaa 4620
aaaaaaaaaa aaaagaccgg gaattcgata tcaagcttat cgacctgcag atcgttcaaa 4680
catttggcaa taaagtttct taagattgaa tcctgttgcc ggtcttgcga tgattatcat 4740
ataatttctg ttgaattacg ttaagcatgt aataattaac atgtaatgca tgacgttatt 4800
tatgagatgg gtttttatga ttagagtccc gcaattatac atttaatacg cgatagaaaa 4860
caaaatatag cgcgcaaact aggataaatt atcgcgcgcg gtgtcatcta tgttactaga 4920
tctctagagt ctcaagcttg gcgcggggta ccgagctcga attccgagtg tacttcaagt 4980
cagttggaaa tcaataaaat gattatttta tgaatatatt tcattgtgca agtagataga 5040
aattacatat gttacataac acacgaaata aacaaaaaaa cacaatccaa aacaaacacc 5100
ccaaacaaaa taacactata tatatcctcg tatgaggaga ggcacgttca gtgactcgac 5160
gattcccgag caaaaaaagt ctccccgtca cacatatagt gggtgacgca attatcttca 5220
aagtaatcct tctgttgact tgtcattgat aacatccagt cttcgtcagg attgcaaaga 5280
attatagaag ggatcccacc ttttattttc ttcttttttc catatttagg gttgacagtg 5340
aaatcagact ggcaacctat taattgcttc cacaatggga cgaacttgaa ggggatgtcg 5400
tcgatgatat tataggtggc gtgttcatcg tagttggtga agtcgatggt cccgttccag 5460
tagttgtgtc gcccgagact tctagcccag gtggtctttc cggtacgagt tggtccgcag 5520
atgtagaggc tggggtgtct gaccccagtc cttccctcat cctggttaga tcggccatcc 5580
actcaaggtc agattgtgct tgatcgtagg agacaggatg tatgaaagtg taggcatcga 5640
tgcttacatg atataggtgc gtctctctcc agttgtgcag atcttcgtgg cagcggagat 5700
ctgattctgt gaagggcgac acgtactgct caggttgtgg aggaaataat ttgttggctg 5760
aatattccag ccattgaagc tttgttgccc attcatgagg gaattcttct ttgatcatgt 5820
caagatactc ctccttagac gttgcagtct ggataatagt tcgccatcgt gcgtcagatt 5880
tgcgaggaga gaccttatga tctcggaaat ctcctctggt tttaatatct ccgtcctttg 5940
atatgtaatc aaggacttgt ttagagtttc tagctggctg gatattaggg tgatttcctt 6000
caaaatcgaa aaaagaagga tccctaatac aaggtttttt atcaagctgg ataagagcat 6060
gatagtgggt agtgccatct tgatgaagct cagaagcaac accaaggaag aaaataagaa 6120
aaggtgtgag tttctcccag agaaactgga ataaatcatc tctttgagat gagcacttgg 6180
ggtaggtaag gaaaacatat ttagattgga gtctgaagtt cttgctagca gaaggcatgt 6240
tgttgtgact ccgaggggtt gcctcaaact ctatcttata accggcgtgg aggcatggag 6300
gcaagggcat tttggtaatt taagtagtta gtggaaaatg acgtcattta cttaaagacg 6360
aagtcttgcg acaagggggg cccacgccga attttaatat taccggcgtg gccccacctt 6420
atcgcgagtg ctttagcacg agcggtccag atttaaagta gaaaagttcc cgcccactag 6480
ggttaaaggt gttcacacta taaaagcata tacgatgtga tggtatttga tggagcgtat 6540
attgtatcag gtatttccgt cggatacgaa ttattcgtac ggccggccac tagtggcact 6600
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 6660
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 6720
ttcccaacag ttgcgcagcc tgaatggcga atgctagagc agcttgagct tggatcagat 6780
tgtcgtttcc cgccttcagt ttaaactatc agtgtttgac aggatatatt ggcgggtaaa 6840
cctaagagaa aagagcgttt a 6861
<210> 32
<211> 5555
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 1008
<400> 32
ctagcagaag gcatgttgtt gtgactccga ggggttgcct caaactctat cttataaccg 60
gcgtggaggc atggaggcaa gggcattttg gtaatttaag tagttagtgg aaaatgacgt 120
catttactta aagacgaagt cttgcgacaa ggggggccca cgccgaattt taatattacc 180
ggcgtggccc caccttatcg cgagtgcttt agcacgagcg gtccagattt aaagtagaaa 240
agttcccgcc cactagggtt aaaggtgttc acactataaa agcatatacg atgtgatggt 300
atttgataaa gcgtatattg tatcaggtat ttccgtcgga tacgaattat tcgtacaagc 360
ttcttaagcc ggtcaacatg gtggagcacg acacacttgt ctactccaaa aatatcaaag 420
atacagtctc agaagaccaa agggcaattg agacttttca acaaagggta atatccggaa 480
acctcctcgg attccattgc ccagctatct gtcactttat tgtgaagata gtggaaaagg 540
aaggtggctc ctacaaatgc catcattgcg ataaaggaaa ggccatcgtt gaagatgcct 600
ctgccgacag tggtcccaaa gatggacccc cacccacgag gagcatcgtg gaaaaagaag 660
acgttccaac cacgtcttca aagcaagtgg attgatgtga taacatggtg gagcacgaca 720
cacttgtcta ctccaaaaat atcaaagata cagtctcaga agaccaaagg gcaattgaga 780
cttttcaaca aagggtaata tccggaaacc tcctcggatt ccattgccca gctatctgtc 840
actttattgt gaagatagtg gaaaaggaag gtggctccta caaatgccat cattgcgata 900
aaggaaaggc catcgttgaa gatgcctctg ccgacagtgg tcccaaagat ggacccccac 960
ccacgaggag catcgtggaa aaagaagacg ttccaaccac gtcttcaaag caagtggatt 1020
gatgtgatat ctccactgac gtaagggatg acgcacaatc ccactatcct tcgcaagacc 1080
cttcctctat ataaggaagt tcatttcatt tggagaggta ttaaaatctt aataggtttt 1140
gataaaagcg aacgtgggga aacccgaacc aaaccttctt ctaaactctc tctcatctct 1200
cttaaagcaa acttctctct tgtctttctt gcgtgagcga tcttcaacgt tgtcagatcg 1260
tgcttcggca ccagtacaac gttttctttc actgaagcga aatcaaagat ctctttgtgg 1320
acacgtagtg cggcgccatt aaataacgtg tacttgtcct attcttgtcg gtgtggtctt 1380
gggaaaagaa agcttgctgg aggctgctgt tcagccccat acattacttg ttacgattct 1440
gctgactttc ggcgggtgca atatctctac ttctgcttga cgaggtattg ttgcctgtac 1500
ttctttcttc ttcttcttgc tgattggttc tataagaaat ctagtatttt ctttgaaaca 1560
gagttttccc gtggttttcg aacttggaga aagattgtta agcttctgta tattctgccc 1620
aaatttgtcg ggcccatggc gaaaaacgtt gcgattttcg gcttattgtt ttctcttctt 1680
gtgttggttc cttctcagat cttcgccgat cgaatctgca ctggaataac atcgtcaaac 1740
tcaccacatg tcgtcaaaac tgctactcaa ggggaggtca atgtgactgg tgtaatacca 1800
ctgacaacaa cacccaccaa atctcatttt gcaaatctca aaggaacaga aaccaggggg 1860
aaactatgcc caaaatgcct caactgcaca gatctggacg tagccttggg cagaccaaaa 1920
tgcacgggga aaataccctc ggcaagagtt tcaatactcc atgaagtcag acctgttaca 1980
tctgggtgct ttcctataat gcacgacaga acaaaaatta gacagctgcc taaccttctc 2040
cgaggatacg aacatatcag gttatcaacc cataacgtta tcaatgcaga aaatgcacca 2100
ggaggaccct acaaaattgg aacctcaggg tcttgcccta acattaccaa tggaaacgga 2160
tttttcgcaa caatggcttg ggccgtccca aaaaacgaca aaaacaaaac agcaacaaat 2220
ccattaacaa tagaagtacc atacatttgt acagaaggag aagaccaaat taccgtttgg 2280
gggttccact ctgacaacga gacccaaatg gcaaagctct atggggactc aaagccccag 2340
aagttcacct catctgccaa cggagtgacc acacattacg tttcacagat tggtggcttc 2400
ccaaatcaaa cagaagacgg aggactacca caaagtggta gaattgttgt tgattacatg 2460
gtgcaaaaat ctgggaaaac aggaacaatt acctatcaaa ggggtatttt attgcctcaa 2520
aaggtgtggt gcgcaagtgg caggagcaag gtaataaaag gatccttgcc tttaattgga 2580
gaagcagatt gcctccacga aaaatacggt ggattaaaca aaagcaagcc ttactacaca 2640
ggggaacatg caaaggccat aggaaattgc ccaatatggg tgaaaacacc cttgaagctg 2700
gccaatggaa ccaaatatag acctcctgca aaactattaa aggaaagggg tttcttcgga 2760
gctattgctg gtttcttaga aggaggatgg gaaggaatga ttgcaggttg gcacggatac 2820
acatcccatg gggcacatgg agtagcggtg gcagcagacc ttaagagcac tcaagaggcc 2880
ataaacaaga taacaaaaaa tctcaactct ttgagtgagc tggaagtaaa gaatcttcaa 2940
agactaagcg gtgccatgga tgaactccac aacgaaatac tagaactaga tgagaaagtg 3000
gatgatctca gagctgatac aataagctca caaatagaac tcgcagtcct gctttccaat 3060
gaaggaataa taaacagtga agatgaacat ctcttggcgc ttgaaagaaa gctgaagaaa 3120
atgctgggcc cctctgctgt agagataggg aatggatgct ttgaaaccaa acacaagtgc 3180
aaccagacct gtctcgacag aatagctgct ggtacctttg atgcaggaga attttctctc 3240
cccacctttg attcactgaa tattactgct gcatctttaa atgacgatgg attggataat 3300
catactatac tgctttacta ctcaactgct gcctccagtt tggctgtaac actgatgata 3360
gctatctttg ttgtttatat ggtctccaga gacaatgttt cttgctccat ctgtctataa 3420
aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta tgtttggtga 3480
gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt gtgagctcct 3540
gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat taaaaaaaaa 3600
aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt tcaaacattt 3660
ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 3720
ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 3780
gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 3840
tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatctct 3900
agagtctcaa gcttggcgcg gggtaccgag ctcgaattcc gagtgtactt caagtcagtt 3960
ggaaatcaat aaaatgatta ttttatgaat atatttcatt gtgcaagtag atagaaatta 4020
catatgttac ataacacacg aaataaacaa aaaaacacaa tccaaaacaa acaccccaaa 4080
caaaataaca ctatatatat cctcgtatga ggagaggcac gttcagtgac tcgacgattc 4140
ccgagcaaaa aaagtctccc cgtcacacat atagtgggtg acgcaattat cttcaaagta 4200
atccttctgt tgacttgtca ttgataacat ccagtcttcg tcaggattgc aaagaattat 4260
agaagggatc ccacctttta ttttcttctt ttttccatat ttagggttga cagtgaaatc 4320
agactggcaa cctattaatt gcttccacaa tgggacgaac ttgaagggga tgtcgtcgat 4380
gatattatag gtggcgtgtt catcgtagtt ggtgaagtcg atggtcccgt tccagtagtt 4440
gtgtcgcccg agacttctag cccaggtggt ctttccggta cgagttggtc cgcagatgta 4500
gaggctgggg tgtctgaccc cagtccttcc ctcatcctgg ttagatcggc catccactca 4560
aggtcagatt gtgcttgatc gtaggagaca ggatgtatga aagtgtaggc atcgatgctt 4620
acatgatata ggtgcgtctc tctccagttg tgcagatctt cgtggcagcg gagatctgat 4680
tctgtgaagg gcgacacgta ctgctcaggt tgtggaggaa ataatttgtt ggctgaatat 4740
tccagccatt gaagctttgt tgcccattca tgagggaatt cttctttgat catgtcaaga 4800
tactcctcct tagacgttgc agtctggata atagttcgcc atcgtgcgtc agatttgcga 4860
ggagagacct tatgatctcg gaaatctcct ctggttttaa tatctccgtc ctttgatatg 4920
taatcaagga cttgtttaga gtttctagct ggctggatat tagggtgatt tccttcaaaa 4980
tcgaaaaaag aaggatccct aatacaaggt tttttatcaa gctggataag agcatgatag 5040
tgggtagtgc catcttgatg aagctcagaa gcaacaccaa ggaagaaaat aagaaaaggt 5100
gtgagtttct cccagagaaa ctggaataaa tcatctcttt gagatgagca cttggggtag 5160
gtaaggaaaa catatttaga ttggagtctg aagttcttgc tagcagaagg catgttgttg 5220
tgactccgag gggttgcctc aaactctatc ttataaccgg cgtggaggca tggaggcaag 5280
ggcattttgg taatttaagt agttagtgga aaatgacgtc atttacttaa agacgaagtc 5340
ttgcgacaag gggggcccac gccgaatttt aatattaccg gcgtggcccc accttatcgc 5400
gagtgcttta gcacgagcgg tccagattta aagtagaaaa gttcccgccc actagggtta 5460
aaggtgttca cactataaaa gcatatacga tgtgatggta tttgatggag cgtatattgt 5520
atcaggtatt tccgtcggat acgaattatt cgtac 5555
<210> 33
<211> 31
<212> PRT
<213> Influenza H6 Teal HK
<400> 33
Val Pro Gln Ile Glu Thr Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Gly Gly Trp Thr Gly Met Ile Asp Gly Trp Tyr Gly Tyr
20 25 30
<210> 34
<211> 42
<212> PRT
<213> Influenza H7 Eq Prague
<400> 34
Val Pro Glu Ala Pro Ala His Lys Gln Leu Thr His His Met Arg Lys
1 5 10 15
Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp
20 25 30
Glu Gly Leu Ile Asp Gly Trp Tyr Gly Tyr
35 40
<210> 35
<211> 31
<212> PRT
<213> Influenza H9A HK
<400> 35
Val Pro Ala Arg Ser Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
1 5 10 15
Ile Glu Gly Gly Trp Pro Gly Leu Val Ala Gly Trp Tyr Gly Phe
20 25 30
<210> 36
<211> 43
<212> PRT
<213> Influenza B Florida
<400> 36
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Ala Lys Leu Leu
1 5 10 15
Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala Gly Phe Leu Glu Gly Gly
20 25 30
Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
35 40
<210> 37
<211> 43
<212> PRT
<213> Influenza B Malaysia
<400> 37
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Ala Lys Leu Leu
1 5 10 15
Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala Gly Phe Leu Glu Gly Gly
20 25 30
Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
35 40
<210> 38
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1059 1039 plus 1059.r
<400> 38
cttcccatcc tccaccagga ggtctatatt tggttccatt ggccagcttc aa 52
<210> 39
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1039 plus 1059.c
<400> 39
caaatataga cctcctggtg gaggatggga aggaatgatt gcaggttggc ac 52
<210> 40
<211> 5504
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 1059
<400> 40
ctagcagaag gcatgttgtt gtgactccga ggggttgcct caaactctat cttataaccg 60
gcgtggaggc atggaggcaa gggcattttg gtaatttaag tagttagtgg aaaatgacgt 120
catttactta aagacgaagt cttgcgacaa ggggggccca cgccgaattt taatattacc 180
ggcgtggccc caccttatcg cgagtgcttt agcacgagcg gtccagattt aaagtagaaa 240
agttcccgcc cactagggtt aaaggtgttc acactataaa agcatatacg atgtgatggt 300
atttgataaa gcgtatattg tatcaggtat ttccgtcgga tacgaattat tcgtacaagc 360
ttcttaagcc ggtcaacatg gtggagcacg acacacttgt ctactccaaa aatatcaaag 420
atacagtctc agaagaccaa agggcaattg agacttttca acaaagggta atatccggaa 480
acctcctcgg attccattgc ccagctatct gtcactttat tgtgaagata gtggaaaagg 540
aaggtggctc ctacaaatgc catcattgcg ataaaggaaa ggccatcgtt gaagatgcct 600
ctgccgacag tggtcccaaa gatggacccc cacccacgag gagcatcgtg gaaaaagaag 660
acgttccaac cacgtcttca aagcaagtgg attgatgtga taacatggtg gagcacgaca 720
cacttgtcta ctccaaaaat atcaaagata cagtctcaga agaccaaagg gcaattgaga 780
cttttcaaca aagggtaata tccggaaacc tcctcggatt ccattgccca gctatctgtc 840
actttattgt gaagatagtg gaaaaggaag gtggctccta caaatgccat cattgcgata 900
aaggaaaggc catcgttgaa gatgcctctg ccgacagtgg tcccaaagat ggacccccac 960
ccacgaggag catcgtggaa aaagaagacg ttccaaccac gtcttcaaag caagtggatt 1020
gatgtgatat ctccactgac gtaagggatg acgcacaatc ccactatcct tcgcaagacc 1080
cttcctctat ataaggaagt tcatttcatt tggagaggta ttaaaatctt aataggtttt 1140
gataaaagcg aacgtgggga aacccgaacc aaaccttctt ctaaactctc tctcatctct 1200
cttaaagcaa acttctctct tgtctttctt gcgtgagcga tcttcaacgt tgtcagatcg 1260
tgcttcggca ccagtacaac gttttctttc actgaagcga aatcaaagat ctctttgtgg 1320
acacgtagtg cggcgccatt aaataacgtg tacttgtcct attcttgtcg gtgtggtctt 1380
gggaaaagaa agcttgctgg aggctgctgt tcagccccat acattacttg ttacgattct 1440
gctgactttc ggcgggtgca atatctctac ttctgcttga cgaggtattg ttgcctgtac 1500
ttctttcttc ttcttcttgc tgattggttc tataagaaat ctagtatttt ctttgaaaca 1560
gagttttccc gtggttttcg aacttggaga aagattgtta agcttctgta tattctgccc 1620
aaatttgtcg ggcccatggc gaaaaacgtt gcgattttcg gcttattgtt ttctcttctt 1680
gtgttggttc cttctcagat cttcgccgat cgaatctgca ctggaataac atcgtcaaac 1740
tcaccacatg tcgtcaaaac tgctactcaa ggggaggtca atgtgactgg tgtaatacca 1800
ctgacaacaa cacccaccaa atctcatttt gcaaatctca aaggaacaga aaccaggggg 1860
aaactatgcc caaaatgcct caactgcaca gatctggacg tagccttggg cagaccaaaa 1920
tgcacgggga aaataccctc ggcaagagtt tcaatactcc atgaagtcag acctgttaca 1980
tctgggtgct ttcctataat gcacgacaga acaaaaatta gacagctgcc taaccttctc 2040
cgaggatacg aacatatcag gttatcaacc cataacgtta tcaatgcaga aaatgcacca 2100
ggaggaccct acaaaattgg aacctcaggg tcttgcccta acattaccaa tggaaacgga 2160
tttttcgcaa caatggcttg ggccgtccca aaaaacgaca aaaacaaaac agcaacaaat 2220
ccattaacaa tagaagtacc atacatttgt acagaaggag aagaccaaat taccgtttgg 2280
gggttccact ctgacaacga gacccaaatg gcaaagctct atggggactc aaagccccag 2340
aagttcacct catctgccaa cggagtgacc acacattacg tttcacagat tggtggcttc 2400
ccaaatcaaa cagaagacgg aggactacca caaagtggta gaattgttgt tgattacatg 2460
gtgcaaaaat ctgggaaaac aggaacaatt acctatcaaa ggggtatttt attgcctcaa 2520
aaggtgtggt gcgcaagtgg caggagcaag gtaataaaag gatccttgcc tttaattgga 2580
gaagcagatt gcctccacga aaaatacggt ggattaaaca aaagcaagcc ttactacaca 2640
ggggaacatg caaaggccat aggaaattgc ccaatatggg tgaaaacacc cttgaagctg 2700
gccaatggaa ccaaatatag acctcctggt ggaggatggg aaggaatgat tgcaggttgg 2760
cacggataca catcccatgg ggcacatgga gtagcggtgg cagcagacct taagagcact 2820
caagaggcca taaacaagat aacaaaaaat ctcaactctt tgagtgagct ggaagtaaag 2880
aatcttcaaa gactaagcgg tgccatggat gaactccaca acgaaatact agaactagat 2940
gagaaagtgg atgatctcag agctgataca ataagctcac aaatagaact cgcagtcctg 3000
ctttccaatg aaggaataat aaacagtgaa gatgaacatc tcttggcgct tgaaagaaag 3060
ctgaagaaaa tgctgggccc ctctgctgta gagataggga atggatgctt tgaaaccaaa 3120
cacaagtgca accagacctg tctcgacaga atagctgctg gtacctttga tgcaggagaa 3180
ttttctctcc ccacctttga ttcactgaat attactgctg catctttaaa tgacgatgga 3240
ttggataatc atactatact gctttactac tcaactgctg cctccagttt ggctgtaaca 3300
ctgatgatag ctatctttgt tgtttatatg gtctccagag acaatgtttc ttgctccatc 3360
tgtctataaa ggcctatttt ctttagtttg aatttactgt tattcggtgt gcatttctat 3420
gtttggtgag cggttttctg tgctcagagt gtgtttattt tatgtaattt aatttctttg 3480
tgagctcctg tttagcaggt cgtcccttca gcaaggacac aaaaagattt taattttatt 3540
aaaaaaaaaa aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct gcagatcgtt 3600
caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 3660
tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 3720
tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 3780
aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 3840
tagatctcta gagtctcaag cttggcgcgg ggtaccgagc tcgaattccg agtgtacttc 3900
aagtcagttg gaaatcaata aaatgattat tttatgaata tatttcattg tgcaagtaga 3960
tagaaattac atatgttaca taacacacga aataaacaaa aaaacacaat ccaaaacaaa 4020
caccccaaac aaaataacac tatatatatc ctcgtatgag gagaggcacg ttcagtgact 4080
cgacgattcc cgagcaaaaa aagtctcccc gtcacacata tagtgggtga cgcaattatc 4140
ttcaaagtaa tccttctgtt gacttgtcat tgataacatc cagtcttcgt caggattgca 4200
aagaattata gaagggatcc caccttttat tttcttcttt tttccatatt tagggttgac 4260
agtgaaatca gactggcaac ctattaattg cttccacaat gggacgaact tgaaggggat 4320
gtcgtcgatg atattatagg tggcgtgttc atcgtagttg gtgaagtcga tggtcccgtt 4380
ccagtagttg tgtcgcccga gacttctagc ccaggtggtc tttccggtac gagttggtcc 4440
gcagatgtag aggctggggt gtctgacccc agtccttccc tcatcctggt tagatcggcc 4500
atccactcaa ggtcagattg tgcttgatcg taggagacag gatgtatgaa agtgtaggca 4560
tcgatgctta catgatatag gtgcgtctct ctccagttgt gcagatcttc gtggcagcgg 4620
agatctgatt ctgtgaaggg cgacacgtac tgctcaggtt gtggaggaaa taatttgttg 4680
gctgaatatt ccagccattg aagctttgtt gcccattcat gagggaattc ttctttgatc 4740
atgtcaagat actcctcctt agacgttgca gtctggataa tagttcgcca tcgtgcgtca 4800
gatttgcgag gagagacctt atgatctcgg aaatctcctc tggttttaat atctccgtcc 4860
tttgatatgt aatcaaggac ttgtttagag tttctagctg gctggatatt agggtgattt 4920
ccttcaaaat cgaaaaaaga aggatcccta atacaaggtt ttttatcaag ctggataaga 4980
gcatgatagt gggtagtgcc atcttgatga agctcagaag caacaccaag gaagaaaata 5040
agaaaaggtg tgagtttctc ccagagaaac tggaataaat catctctttg agatgagcac 5100
ttggggtagg taaggaaaac atatttagat tggagtctga agttcttgct agcagaaggc 5160
atgttgttgt gactccgagg ggttgcctca aactctatct tataaccggc gtggaggcat 5220
ggaggcaagg gcattttggt aatttaagta gttagtggaa aatgacgtca tttacttaaa 5280
gacgaagtct tgcgacaagg ggggcccacg ccgaatttta atattaccgg cgtggcccca 5340
ccttatcgcg agtgctttag cacgagcggt ccagatttaa agtagaaaag ttcccgccca 5400
ctagggttaa aggtgttcac actataaaag catatacgat gtgatggtat ttgatggagc 5460
gtatattgta tcaggtattt ccgtcggata cgaattattc gtac 5504
<210> 41
<211> 577
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence PDISP/HA influenza B/Brisbane/60/2008
(deleted proteolytic loop)
<400> 41
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Lys Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Ile Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Lys Asn Lys Thr
180 185 190
Ala Thr Asn Pro Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp
355 360 365
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
370 375 380
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
385 390 395 400
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
405 410 415
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
420 425 430
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
435 440 445
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
450 455 460
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
465 470 475 480
Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His
485 490 495
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asp
500 505 510
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
515 520 525
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr
530 535 540
Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Ile Ala Ile
545 550 555 560
Phe Val Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys
565 570 575
Leu
<210> 42
<211> 1707
<212> DNA
<213> Influenza H5 A/Indonesia/5/2005 (H5N1)
<400> 42
atggagaaaa tagtgcttct tcttgcaata gtcagtcttg ttaaaagtga tcagatttgc 60
attggttacc atgcaaacaa ttcaacagag caggttgaca caatcatgga aaagaacgtt 120
actgttacac atgcccaaga catactggaa aagacacaca acgggaagct ctgcgatcta 180
gatggagtga agcctctaat tttaagagat tgtagtgtag ctggatggct cctcgggaac 240
ccaatgtgtg acgaattcat caatgtaccg gaatggtctt acatagtgga gaaggccaat 300
ccaaccaatg acctctgtta cccagggagt ttcaacgact atgaagaact gaaacaccta 360
ttgagcagaa taaaccattt tgagaaaatt caaatcatcc ccaaaagttc ttggtccgat 420
catgaagcct catcaggagt tagctcagca tgtccatacc tgggaagtcc ctcctttttt 480
agaaatgtgg tatggcttat caaaaagaac agtacatacc caacaataaa gaaaagctac 540
aataatacca accaagagga tcttttggta ctgtggggaa ttcaccatcc taatgatgcg 600
gcagagcaga caaggctata tcaaaaccca accacctata tttccattgg gacatcaaca 660
ctaaaccaga gattggtacc aaaaatagct actagatcca aagtaaacgg gcaaagtgga 720
aggatggagt tcttctggac aattttaaaa cctaatgatg caatcaactt cgagagtaat 780
ggaaatttca ttgctccaga atatgcatac aaaattgtca agaaagggga ctcagcaatt 840
atgaaaagtg aattggaata tggtaactgc aacaccaagt gtcaaactcc aatgggggcg 900
ataaactcta gtatgccatt ccacaacata caccctctca ccatcgggga atgccccaaa 960
tatgtgaaat caaacagatt agtccttgca acagggctca gaaatagccc tcaaagagag 1020
agcagaagaa aaaagagagg actatttgga gctatagcag gttttataga gggaggatgg 1080
cagggaatgg tagatggttg gtatgggtac caccatagca atgagcaggg gagtgggtac 1140
gctgcagaca aagaatccac tcaaaaggca atagatggag tcaccaataa ggtcaactca 1200
atcattgaca aaatgaacac tcagtttgag gccgttggaa gggaatttaa taacttagaa 1260
aggagaatag agaatttaaa caagaagatg gaagacgggt ttctagatgt ctggacttat 1320
aatgccgaac ttctggttct catggaaaat gagagaactc tagactttca tgactcaaat 1380
gttaagaacc tctacgacaa ggtccgacta cagcttaggg ataatgcaaa ggagctgggt 1440
aacggttgtt tcgagttcta tcacaaatgt gataatgaat gtatggaaag tataagaaac 1500
ggaacgtaca actatccgca gtattcagaa gaagcaagat taaaaagaga ggaaataagt 1560
ggggtaaaat tggaatcaat aggaacttac caaatactgt caatttattc aacagtggcg 1620
agttccctag cactggcaat catgatggct ggtctatctt tatggatgtg ctccaatgga 1680
tcgttacaat gcagaatttg catttaa 1707
<210> 43
<211> 1734
<212> DNA
<213> Artificial sequence
<220>
<223> nucleotide sequence PDISP/HA influenza B/Brisbane/60/2008
(deleted proteolytic loop)
<400> 43
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactgga ataacatcgt caaactcacc acatgtcgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gggggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtagcc ttgggcagac caaaatgcac ggggaaaata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaacc ttctccgagg atacgaacat 420
atcaggttat caacccataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacatt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaaaaac aaaacagcaa caaatccatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgac 660
aacgagaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag tggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaaggggt attttattgc ctcaaaaggt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcc ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctggtggagg atgggaagga atgattgcag gttggcacgg atacacatcc 1140
catggggcac atggagtagc ggtggcagca gaccttaaga gcactcaaga ggccataaac 1200
aagataacaa aaaatctcaa ctctttgagt gagctggaag taaagaatct tcaaagacta 1260
agcggtgcca tggatgaact ccacaacgaa atactagaac tagatgagaa agtggatgat 1320
ctcagagctg atacaataag ctcacaaata gaactcgcag tcctgctttc caatgaagga 1380
ataataaaca gtgaagatga acatctcttg gcgcttgaaa gaaagctgaa gaaaatgctg 1440
ggcccctctg ctgtagagat agggaatgga tgctttgaaa ccaaacacaa gtgcaaccag 1500
acctgtctcg acagaatagc tgctggtacc tttgatgcag gagaattttc tctccccacc 1560
tttgattcac tgaatattac tgctgcatct ttaaatgacg atggattgga taatcatact 1620
atactgcttt actactcaac tgctgcctcc agtttggctg taacactgat gatagctatc 1680
tttgttgttt atatggtctc cagagacaat gtttcttgct ccatctgtct ataa 1734
<210> 44
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> H5/Indo cleavage site natural sequence
<400> 44
Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg Lys Lys Arg
1 5 10 15
Gly Leu Phe
<210> 45
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> H5/Indo modified cleavage site (TETR)
<400> 45
Thr Gly Leu Arg Asn Ser Pro Gln Thr Glu Thr Arg Gly Leu Phe
1 5 10 15
<210> 46
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> H5/Indo modified cleavage site (TETQ)
<400> 46
Thr Gly Leu Arg Asn Ser Pro Gln Thr Glu Thr Gln Gly Leu Phe
1 5 10 15
<210> 47
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> H1 cleavage site
<400> 47
Asn Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe
1 5 10
<210> 48
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> H3 cleavage site
<400> 48
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe
1 5 10
<210> 49
<211> 46
<212> PRT
<213> Artificial sequence
<220>
<223> Construct 1462 IF-HAB110.S1+3c
<400> 49
Ala Ala Ala Thr Thr Thr Gly Thr Cys Gly Gly Gly Cys Cys Cys Ala
1 5 10 15
Thr Gly Ala Ala Gly Gly Cys Ala Ala Thr Ala Ala Thr Thr Gly Thr
20 25 30
Ala Cys Thr Ala Cys Thr Cys Ala Thr Gly Gly Thr Ala Gly
35 40 45
<210> 50
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> Construct No. 1462 IF-HAB110.s1-4r
<400> 50
actaaagaaa ataggccttt atagacagat ggagcatgaa acgttgtctc tg 52
<210> 51
<211> 1755
<212> DNA
<213> Influenza HA B wisconsin
<400> 51
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccac 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcagg 360
caactaccca atcttctcag aggatatgaa aatatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaatcggatt ttttgcaaca atggcttggg ctgtcccaaa ggacaactac 540
aaaaatgcaa cgaacccact aacagtagaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcagat aacaaaaccc aaatgaagag cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag taaccacaca ttatgtttct 720
cagattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatgatgca aaaacctggg aaaacaggaa caattgtcta tcaaagaggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaaaaat acggtggatt aaacaaaagc 960
aagccttact acacaggaga acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctgcaaaact attgaaggaa 1080
aggggtttct tcggagctat tgctggtttc ctagaaggag gatgggaagg aatgattgca 1140
ggttggcacg gatacacatc tcacggagca catggagtgg cagtggcggc agaccttaag 1200
agtacacaag aagctataaa taagataaca aaaaatctca attctttgag tgagctagaa 1260
gtaaagaacc ttcaaagact aagtggtgcc atggatgaac tccacaacga aatactcgag 1320
ctggatgaga aagtggatga tctcagagct gacactataa gctcacaaat agaacttgca 1380
gtcttgcttt ccaacgaagg aataataaac agtgaagacg agcatctatt ggcacttgag 1440
agaaaactaa agaaaatgct gggtccctct gctgtagaca taggaaacgg atgcttcgaa 1500
accaaacaca aatgcaacca gacctgctta gacaggatag ctgctggcac ctttaatgca 1560
ggagaatttt ctctccccac ttttgattca ttgaacatta ctgctgcatc tttaaatgat 1620
gatggattgg ataaccatac tatactgctc tattactcaa ctgctgcttc tagtttggct 1680
gtaacattaa tgctagctat ttttattgtt tatatggtct ccagagacaa cgtttcatgc 1740
tccatctgtc tataa 1755
<210> 52
<211> 6745
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 193
<400> 52
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120
aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180
aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240
ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300
gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360
aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420
aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480
taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540
aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600
atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660
taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720
tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780
gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840
acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900
ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960
accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020
gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080
aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 1140
gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200
actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260
aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320
gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380
tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 1440
agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500
tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560
tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620
ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 1680
tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 1740
ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800
cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 1860
gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920
tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980
ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040
ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100
cgcgttggga attactagcg cgtgtcgaga cgcgttgttg ttgtgactcc gaggggttgc 2160
ctcaaactct atcttataac cggcgtggag gcatggaggc aggggtattt tggtcatttt 2220
aatagatagt ggaaaatgac gtggaattta cttaaagacg aagtctttgc gacaaggggg 2280
ggcccacgcc gaatttaata ttaccggcgt ggccccccct tatcgcgagt gctttagcac 2340
gagcggtcca gatttaaagt agaaaatttc ccgcccacta gggttaaagg tgttcacact 2400
ataaaagcat atacgatgtg atggtatttg gtcgacaagc ttgcatgccg gtcaacatgg 2460
tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca gaagaccaaa 2520
gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga ttccattgcc 2580
cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc tacaaatgcc 2640
atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt ggtcccaaag 2700
atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa 2760
agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac tccaaaaata 2820
tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa agggtaatat 2880
ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg aagatagtgg 2940
aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc atcgttgaag 3000
atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 3060
aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc tccactgacg 3120
taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata taaggaagtt 3180
catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga acgtggggaa 3240
acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa cttctctctt 3300
gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac cagtacaacg 3360
ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc ggcgccatta 3420
aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa gcttgctgga 3480
ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg gcgggtgcaa 3540
tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct tcttcttgct 3600
gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg tggttttcga 3660
acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg gcccgcggat 3720
ggcgaaaaac gttgcgattt tcggcttatt gttttctctt cttgtgttgg ttccttctca 3780
gatcttcgcc tgcaggctcc tcagccaaaa cgacaccccc atctgtctat ccactggccc 3840
ctggatctgc tgcccaaact aactccatgg tgaccctggg atgcctggtc aagggctatt 3900
tccctgagcc agtgacagtg acctggaact ctggatccct gtccagcggt gtgcacacct 3960
tcccagctgt cctgcagtct gacctctaca ctctgagcag ctcagtgact gtcccctcca 4020
gcacctggcc cagcgagacc gtcacctgca acgttgccca cccggccagc agcaccaagg 4080
tggacaagaa aattgtgccc agggattgtg gttgtaagcc ttgcatatgt acagtcccag 4140
aagtatcatc tgtcttcatc ttccccccaa agcccaagga tgtgctcacc attactctga 4200
ctcctaaggt cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag gtccagttca 4260
gctggtttgt agatgatgtg gaggtgcaca cagctcagac gcaaccccgg gaggagcagt 4320
tcaacagcac tttccgctca gtcagtgaac ttcccatcat gcaccaggac tggctcaatg 4380
gcaaggagcg atcgctcacc atcaccatca ccatcaccat caccattaaa ggcctatttt 4440
ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 4500
tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt 4560
cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga 4620
ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 4680
ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 4740
tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 4800
atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 4860
aactaggata aattatcgcg cgcggtgtca tctatgttac tagatctcta gagtctcaag 4920
cttggcgcgc cataaaatga ttattttatg aatatatttc attgtgcaag tagatagaaa 4980
ttacatatgt tacataacac acgaaataaa caaaaaaaga caatccaaaa acaaacaccc 5040
caaaaaaaat aatcacttta gataaactcg tatgaggaga ggcacgttca gtgactcgac 5100
gattcccgag caaaaaaagt ctccccgtca cacatatagt gggtgacgca attatcttta 5160
aagtaatcct tctgttgact tgtcattgat aacatccagt cttcgtcagg attgcaaaga 5220
attatagaag ggatcccacc ttttattttc ttcttttttc catatttagg gttgacagtg 5280
aaatcagact ggcaacctat taattgcttc cacaatggga cgaacttgaa ggggatgtcg 5340
tcgatgatat tataggtggc gtgttcatcg tagttggtga aatcgatggt accgttccaa 5400
tagttgtgtc gtccgagact tctagcccag gtggtctttc cggtacgagt tggtccgcag 5460
atgtagaggc tggggtgtcg gattccattc cttccattgt cctggttaaa tcggccatcc 5520
attcaaggtc agattgagct tgttggtatg agacaggatg tatgtaagta taagcgtcta 5580
tgcttacatg gtatagatgg gtttccctcc aggagtgtag atcttcgtgg cagcgaagat 5640
ctgattctgt gaagggcgac acatacggtt caggttgtgg agggaataat ttgttggctg 5700
aatattccag ccattgaagt tttgttgccc attcatgagg gaattcttcc ttgatcatgt 5760
caagatattc ctccttagac gttgcagtct ggataatagt tctccatcgt gcgtcagatt 5820
tgcgaggaga gaccttatga tctcggaaat ctcctctggt tttaatatct ccgtcctttg 5880
atatgtaatc aaggacttgt ttagagtttc tagctggctg gatattaggg tgatttcctt 5940
caaaatcgaa aaaagaagga tccctaatac aaggtttttt atcaagctgg agaagagcat 6000
gatagtgggt agtgccatct tgatgaagct cagaagcaac accaaggaag aaaataagaa 6060
aaggtgtgag tttctcccag agaaactgga ataaatcatc tctttgagat gagcacttgg 6120
gataggtaag gaaaacatat ttagattgga gtctgaagtt cttactagca gaaggcatgt 6180
tgttgtgact ccgaggggtt gcctcaaact ctatcttata accggcgtgg aggcatggag 6240
gcaggggtat tttggtcatt ttaatagata gtggaaaatg acgtggaatt tacttaaaga 6300
cgaagtcttt gcgacaaggg ggggcccacg ccgaatttaa tattaccggc gtggcccccc 6360
cttatcgcga gtgctttagc acgagcggtc cagatttaaa gtagaaaatt tcccgcccac 6420
tagggttaaa ggtgttcaca ctataaaagc atatacgatg tgatggtatt tgactagtgg 6480
cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc 6540
gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc 6600
gcccttccca acagttgcgc agcctgaatg gcgaatgcta gagcagcttg agcttggatc 6660
agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt tgacaggata tattggcggg 6720
taaacctaag agaaaagagc gttta 6745
<210> 53
<211> 3495
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 1462
<400> 53
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatgaag gcaataattg tactactcat ggtagtaaca tccaatgcag atcgaatctg 1320
cactgggata acatcttcaa actcacctca tgtggtcaaa acagctactc aaggggaggt 1380
caatgtgact ggcgtgatac cactgacaac aacaccaaca aaatcttatt ttgcaaatct 1440
caaaggaaca aggaccagag ggaaactatg cccggactgt ctcaactgta cagatctgga 1500
tgtggccttg ggcaggccaa tgtgtgtggg gaccacacct tctgctaaag cttcaatact 1560
ccacgaggtc agacctgtta catccgggtg ctttcctata atgcacgaca gaacaaaaat 1620
caggcaacta cccaatcttc tcagaggata tgaaaatatc aggttatcaa cccaaaacgt 1680
tatcgatgca gaaaaagcac caggaggacc ctacagactt ggaacctcag gatcttgccc 1740
taacgctacc agtaaaatcg gattttttgc aacaatggct tgggctgtcc caaaggacaa 1800
ctacaaaaat gcaacgaacc cactaacagt agaagtacca tacatttgta cagaagggga 1860
agaccaaatt actgtttggg ggttccattc agataacaaa acccaaatga agagcctcta 1920
tggagactca aatcctcaaa agttcacctc atctgctaat ggagtaacca cacattatgt 1980
ttctcagatt ggcgacttcc cagatcaaac agaagacgga ggactaccac aaagcggcag 2040
aattgttgtt gattacatga tgcaaaaacc tgggaaaaca ggaacaattg tctatcaaag 2100
aggtgttttg ttgcctcaaa aggtgtggtg cgcgagtggc aggagcaaag taataaaagg 2160
gtcattgcct ttaattggtg aagcagattg ccttcatgaa aaatacggtg gattaaacaa 2220
aagcaagcct tactacacag gagaacatgc aaaagccata ggaaattgcc caatatgggt 2280
aaaaacacct ttgaagcttg ccaatggaac caaatataga cctcctgcaa aactattgaa 2340
ggaaaggggt ttcttcggag ctattgctgg tttcctagaa ggaggatggg aaggaatgat 2400
tgcaggttgg cacggataca catctcacgg agcacatgga gtggcagtgg cggcagacct 2460
taagagtaca caagaagcta taaataagat aacaaaaaat ctcaattctt tgagtgagct 2520
agaagtaaag aaccttcaaa gactaagtgg tgccatggat gaactccaca acgaaatact 2580
cgagctggat gagaaagtgg atgatctcag agctgacact ataagctcac aaatagaact 2640
tgcagtcttg ctttccaacg aaggaataat aaacagtgaa gacgagcatc tattggcact 2700
tgagagaaaa ctaaagaaaa tgctgggtcc ctctgctgta gacataggaa acggatgctt 2760
cgaaaccaaa cacaaatgca accagacctg cttagacagg atagctgctg gcacctttaa 2820
tgcaggagaa ttttctctcc ccacttttga ttcattgaac attactgctg catctttaaa 2880
tgatgatgga ttggataacc atactatact gctctattac tcaactgctg cttctagttt 2940
ggctgtaaca ttaatgctag ctatttttat tgtttatatg gtctccagag acaacgtttc 3000
atgctccatc tgtctataaa ggcctatttt ctttagtttg aatttactgt tattcggtgt 3060
gcatttctat gtttggtgag cggttttctg tgctcagagt gtgtttattt tatgtaattt 3120
aatttctttg tgagctcctg tttagcaggt cgtcccttca gcaaggacac aaaaagattt 3180
taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct 3240
gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 3300
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 3360
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 3420
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 3480
tctatgttac tagat 3495
<210> 54
<211> 584
<212> PRT
<213> Influenza B/Wisconsin/1/2010
<400> 54
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala
355 360 365
Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly
370 375 380
Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys
385 390 395 400
Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu
405 410 415
Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp
420 425 430
Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu
435 440 445
Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser
450 455 460
Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu
465 470 475 480
Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn
485 490 495
Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg
500 505 510
Ile Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe
515 520 525
Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp
530 535 540
Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala
545 550 555 560
Val Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp
565 570 575
Asn Val Ser Cys Ser Ile Cys Leu
580
<210> 55
<211> 56
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1467 HAB110(PrL-).r
<400> 55
tccttcccat cctccaccag gaggtctata tttggttcca ttggcaagct tcaaag 56
<210> 56
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1467 HAB110(PrL-).c
<400> 56
atatagacct cctggtggag gatgggaagg aatgattgca ggttggcacg ga 52
<210> 57
<211> 3444
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1467
<400> 57
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatgaag gcaataattg tactactcat ggtagtaaca tccaatgcag atcgaatctg 1320
cactgggata acatcttcaa actcacctca tgtggtcaaa acagctactc aaggggaggt 1380
caatgtgact ggcgtgatac cactgacaac aacaccaaca aaatcttatt ttgcaaatct 1440
caaaggaaca aggaccagag ggaaactatg cccggactgt ctcaactgta cagatctgga 1500
tgtggccttg ggcaggccaa tgtgtgtggg gaccacacct tctgctaaag cttcaatact 1560
ccacgaggtc agacctgtta catccgggtg ctttcctata atgcacgaca gaacaaaaat 1620
caggcaacta cccaatcttc tcagaggata tgaaaatatc aggttatcaa cccaaaacgt 1680
tatcgatgca gaaaaagcac caggaggacc ctacagactt ggaacctcag gatcttgccc 1740
taacgctacc agtaaaatcg gattttttgc aacaatggct tgggctgtcc caaaggacaa 1800
ctacaaaaat gcaacgaacc cactaacagt agaagtacca tacatttgta cagaagggga 1860
agaccaaatt actgtttggg ggttccattc agataacaaa acccaaatga agagcctcta 1920
tggagactca aatcctcaaa agttcacctc atctgctaat ggagtaacca cacattatgt 1980
ttctcagatt ggcgacttcc cagatcaaac agaagacgga ggactaccac aaagcggcag 2040
aattgttgtt gattacatga tgcaaaaacc tgggaaaaca ggaacaattg tctatcaaag 2100
aggtgttttg ttgcctcaaa aggtgtggtg cgcgagtggc aggagcaaag taataaaagg 2160
gtcattgcct ttaattggtg aagcagattg ccttcatgaa aaatacggtg gattaaacaa 2220
aagcaagcct tactacacag gagaacatgc aaaagccata ggaaattgcc caatatgggt 2280
aaaaacacct ttgaagcttg ccaatggaac caaatataga cctcctggtg gaggatggga 2340
aggaatgatt gcaggttggc acggatacac atctcacgga gcacatggag tggcagtggc 2400
ggcagacctt aagagtacac aagaagctat aaataagata acaaaaaatc tcaattcttt 2460
gagtgagcta gaagtaaaga accttcaaag actaagtggt gccatggatg aactccacaa 2520
cgaaatactc gagctggatg agaaagtgga tgatctcaga gctgacacta taagctcaca 2580
aatagaactt gcagtcttgc tttccaacga aggaataata aacagtgaag acgagcatct 2640
attggcactt gagagaaaac taaagaaaat gctgggtccc tctgctgtag acataggaaa 2700
cggatgcttc gaaaccaaac acaaatgcaa ccagacctgc ttagacagga tagctgctgg 2760
cacctttaat gcaggagaat tttctctccc cacttttgat tcattgaaca ttactgctgc 2820
atctttaaat gatgatggat tggataacca tactatactg ctctattact caactgctgc 2880
ttctagtttg gctgtaacat taatgctagc tatttttatt gtttatatgg tctccagaga 2940
caacgtttca tgctccatct gtctataaag gcctattttc tttagtttga atttactgtt 3000
attcggtgtg catttctatg tttggtgagc ggttttctgt gctcagagtg tgtttatttt 3060
atgtaattta atttctttgt gagctcctgt ttagcaggtc gtcccttcag caaggacaca 3120
aaaagatttt aattttatta aaaaaaaaaa aaaaaaagac cgggaattcg atatcaagct 3180
tatcgacctg cagatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt 3240
gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt 3300
aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta 3360
tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc 3420
gcggtgtcat ctatgttact agat 3444
<210> 58
<211> 567
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence HA influenza B/Wisconsin/1/2010 (deleted PL)
<400> 58
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
355 360 365
Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser
385 390 395 400
Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu
405 410 415
Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg
420 425 430
Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn
435 440 445
Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg
450 455 460
Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile
485 490 495
Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp
500 505 510
Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn
515 520 525
His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val
530 535 540
Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp Asn
545 550 555 560
Val Ser Cys Ser Ile Cys Leu
565
<210> 59
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> B cleavage site
<400> 59
Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe
1 5 10
<210> 60
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> H5/Indo natural cleavage site
<400> 60
Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg Lys Lys Arg
1 5 10 15
Gly Leu Phe
<210> 61
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> H5/Indo modified cleavage site
<400> 61
Thr Gly Leu Arg Asn Ser Pro Gln Thr Glu Thr Arg Gly Leu Phe
1 5 10 15
<210> 62
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> H5/Indo modified cleavage site
<400> 62
Thr Gly Leu Arg Asn Ser Pro Gln Thr Glu Thr Gln Gly Leu Phe
1 5 10 15
<210> 63
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> H1/Brisbane modified cleavage site
<400> 63
Asn Ile Pro Ser Ile Gln Ser Gln Gly Leu Phe
1 5 10
<210> 64
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> H3/Brisbane modified cleavage site
<400> 64
Asn Val Pro Glu Ile Gln Thr Gln Gly Ile Phe
1 5 10
<210> 65
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> B/Florida, B/Brisbane modified cleavage site
<400> 65
Pro Ala Ile Leu Leu Asn Ile Gln Gly Phe Phe
1 5 10
<210> 66
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> A/H3/HA0 Consensus
<400> 66
Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala Gly
1 5 10 15
Phe Ile Glu
<210> 67
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> A/H1/HA0 Consensus
<400> 67
Asn Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly
1 5 10 15
Phe Ile Glu
<210> 68
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> B/HA0 Consensus
<400> 68
Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala Gly
1 5 10 15
Phe Leu Glu
<210> 69
<211> 16
<212> PRT
<213> Artificial sequence
<220>
<223> H5 Anhui proteolytic loop deletion
<400> 69
Ser Pro Leu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr
1 5 10 15
<210> 70
<211> 16
<212> PRT
<213> Artificial sequence
<220>
<223> H5 Indo proteolytic loop deletion
<400> 70
Ser Pro Gln Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr
1 5 10 15
<210> 71
<211> 16
<212> PRT
<213> Artificial sequence
<220>
<223> H5 Vietnam proteolytic loop deletion
<400> 71
Ser Pro Gln Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr
1 5 10 15
<210> 72
<211> 25
<212> PRT
<213> Artificial sequence
<220>
<223> B Florida proteolytic loop deletion
<400> 72
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Trp Glu
1 5 10 15
Gly Met Ile Ala Gly Trp His Gly Tyr
20 25
<210> 73
<211> 25
<212> PRT
<213> Artificial sequence
<220>
<223> B Malaysia proteolytic loop deletion
<400> 73
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Trp Glu
1 5 10 15
Gly Met Ile Ala Gly Trp His Gly Tyr
20 25
<210> 74
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> Primer MutCleavage-H5(Indo).r
<400> 74
tagtcctctt gtctctgttt gagggctatt tctgagccct gttgc 45
<210> 75
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> Primer MutCleavage-H5(Indo).c
<400> 75
tagccctcaa acagagacaa gaggactatt tggagctata gcagg 45
<210> 76
<211> 3435
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 676
<400> 76
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggag aaaatagtgc ttcttcttgc aatagtcagt cttgttaaaa gtgatcagat 1320
ttgcattggt taccatgcaa acaattcaac agagcaggtt gacacaatca tggaaaagaa 1380
cgttactgtt acacatgccc aagacatact ggaaaagaca cacaacggga agctctgcga 1440
tctagatgga gtgaagcctc taattttaag agattgtagt gtagctggat ggctcctcgg 1500
gaacccaatg tgtgacgaat tcatcaatgt accggaatgg tcttacatag tggagaaggc 1560
caatccaacc aatgacctct gttacccagg gagtttcaac gactatgaag aactgaaaca 1620
cctattgagc agaataaacc attttgagaa aattcaaatc atccccaaaa gttcttggtc 1680
cgatcatgaa gcctcatcag gagttagctc agcatgtcca tacctgggaa gtccctcctt 1740
ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca tacccaacaa taaagaaaag 1800
ctacaataat accaaccaag aggatctttt ggtactgtgg ggaattcacc atcctaatga 1860
tgcggcagag cagacaaggc tatatcaaaa cccaaccacc tatatttcca ttgggacatc 1920
aacactaaac cagagattgg taccaaaaat agctactaga tccaaagtaa acgggcaaag 1980
tggaaggatg gagttcttct ggacaatttt aaaacctaat gatgcaatca acttcgagag 2040
taatggaaat ttcattgctc cagaatatgc atacaaaatt gtcaagaaag gggactcagc 2100
aattatgaaa agtgaattgg aatatggtaa ctgcaacacc aagtgtcaaa ctccaatggg 2160
ggcgataaac tctagtatgc cattccacaa catacaccct ctcaccatcg gggaatgccc 2220
caaatatgtg aaatcaaaca gattagtcct tgcaacaggg ctcagaaata gccctcaaac 2280
agagacaaga ggactatttg gagctatagc aggttttata gagggaggat ggcagggaat 2340
ggtagatggt tggtatgggt accaccatag caatgagcag gggagtgggt acgctgcaga 2400
caaagaatcc actcaaaagg caatagatgg agtcaccaat aaggtcaact caatcattga 2460
caaaatgaac actcagtttg aggccgttgg aagggaattt aataacttag aaaggagaat 2520
agagaattta aacaagaaga tggaagacgg gtttctagat gtctggactt ataatgccga 2580
acttctggtt ctcatggaaa atgagagaac tctagacttt catgactcaa atgttaagaa 2640
cctctacgac aaggtccgac tacagcttag ggataatgca aaggagctgg gtaacggttg 2700
tttcgagttc tatcacaaat gtgataatga atgtatggaa agtataagaa acggaacgta 2760
caactatccg cagtattcag aagaagcaag attaaaaaga gaggaaataa gtggggtaaa 2820
attggaatca ataggaactt accaaatact gtcaatttat tcaacagtgg cgagttccct 2880
agcactggca atcatgatgg ctggtctatc tttatggatg tgctccaatg gatcgttaca 2940
atgcagaatt tgcatttaaa ggcctatttt ctttagtttg aatttactgt tattcggtgt 3000
gcatttctat gtttggtgag cggttttctg tgctcagagt gtgtttattt tatgtaattt 3060
aatttctttg tgagctcctg tttagcaggt cgtcccttca gcaaggacac aaaaagattt 3120
taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct 3180
gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 3240
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 3300
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 3360
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 3420
tctatgttac tagat 3435
<210> 77
<211> 564
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence influenza A/Indonesia/5/2005 (H5N1) TETR
cleavage site mutant.
<400> 77
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Thr Glu Thr Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile
340 345 350
Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His
355 360 365
Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln
370 375 380
Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys
385 390 395 400
Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu
405 410 415
Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp
420 425 430
Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg
435 440 445
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val
450 455 460
Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe
465 470 475 480
Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn
485 490 495
Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg
500 505 510
Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile
515 520 525
Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met
530 535 540
Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys
545 550 555 560
Arg Ile Cys Ile
<210> 78
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> Primer H5I505_TETQ.r
<400> 78
tccaaatagt ccttgtgtct ctgtttgagg gctatttctg agccctgt 48
<210> 79
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> Primer H5I505_TETQ.c
<400> 79
aaatagccct caaacagaga cacaaggact atttggagct atagcagg 48
<210> 80
<211> 3435
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 766
<400> 80
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggag aaaatagtgc ttcttcttgc aatagtcagt cttgttaaaa gtgatcagat 1320
ttgcattggt taccatgcaa acaattcaac agagcaggtt gacacaatca tggaaaagaa 1380
cgttactgtt acacatgccc aagacatact ggaaaagaca cacaacggga agctctgcga 1440
tctagatgga gtgaagcctc taattttaag agattgtagt gtagctggat ggctcctcgg 1500
gaacccaatg tgtgacgaat tcatcaatgt accggaatgg tcttacatag tggagaaggc 1560
caatccaacc aatgacctct gttacccagg gagtttcaac gactatgaag aactgaaaca 1620
cctattgagc agaataaacc attttgagaa aattcaaatc atccccaaaa gttcttggtc 1680
cgatcatgaa gcctcatcag gagttagctc agcatgtcca tacctgggaa gtccctcctt 1740
ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca tacccaacaa taaagaaaag 1800
ctacaataat accaaccaag aggatctttt ggtactgtgg ggaattcacc atcctaatga 1860
tgcggcagag cagacaaggc tatatcaaaa cccaaccacc tatatttcca ttgggacatc 1920
aacactaaac cagagattgg taccaaaaat agctactaga tccaaagtaa acgggcaaag 1980
tggaaggatg gagttcttct ggacaatttt aaaacctaat gatgcaatca acttcgagag 2040
taatggaaat ttcattgctc cagaatatgc atacaaaatt gtcaagaaag gggactcagc 2100
aattatgaaa agtgaattgg aatatggtaa ctgcaacacc aagtgtcaaa ctccaatggg 2160
ggcgataaac tctagtatgc cattccacaa catacaccct ctcaccatcg gggaatgccc 2220
caaatatgtg aaatcaaaca gattagtcct tgcaacaggg ctcagaaata gccctcaaac 2280
agagacacaa ggactatttg gagctatagc aggttttata gagggaggat ggcagggaat 2340
ggtagatggt tggtatgggt accaccatag caatgagcag gggagtgggt acgctgcaga 2400
caaagaatcc actcaaaagg caatagatgg agtcaccaat aaggtcaact caatcattga 2460
caaaatgaac actcagtttg aggccgttgg aagggaattt aataacttag aaaggagaat 2520
agagaattta aacaagaaga tggaagacgg gtttctagat gtctggactt ataatgccga 2580
acttctggtt ctcatggaaa atgagagaac tctagacttt catgactcaa atgttaagaa 2640
cctctacgac aaggtccgac tacagcttag ggataatgca aaggagctgg gtaacggttg 2700
tttcgagttc tatcacaaat gtgataatga atgtatggaa agtataagaa acggaacgta 2760
caactatccg cagtattcag aagaagcaag attaaaaaga gaggaaataa gtggggtaaa 2820
attggaatca ataggaactt accaaatact gtcaatttat tcaacagtgg cgagttccct 2880
agcactggca atcatgatgg ctggtctatc tttatggatg tgctccaatg gatcgttaca 2940
atgcagaatt tgcatttaaa ggcctatttt ctttagtttg aatttactgt tattcggtgt 3000
gcatttctat gtttggtgag cggttttctg tgctcagagt gtgtttattt tatgtaattt 3060
aatttctttg tgagctcctg tttagcaggt cgtcccttca gcaaggacac aaaaagattt 3120
taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct 3180
gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 3240
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 3300
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 3360
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 3420
tctatgttac tagat 3435
<210> 81
<211> 564
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence influenza A/Indonesia/5/2005 (H5N1) TETQ
cleavage site mutant
<400> 81
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Thr Glu Thr Gln Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile
340 345 350
Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His
355 360 365
Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln
370 375 380
Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys
385 390 395 400
Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu
405 410 415
Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp
420 425 430
Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg
435 440 445
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val
450 455 460
Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe
465 470 475 480
Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn
485 490 495
Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg
500 505 510
Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile
515 520 525
Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met
530 535 540
Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys
545 550 555 560
Arg Ile Cys Ile
<210> 82
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> Primer H5I505(PrL-).r
<400> 82
ctgccatcct ccgccagggc tatttctgag ccctgttgca aggactaatc 50
<210> 83
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> Primer H5I505(PrL-).c
<400> 83
gaaatagccc tggcggagga tggcagggaa tggtagatgg ttggtatggg ta 52
<210> 84
<211> 3390
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 928
<400> 84
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggag aaaatagtgc ttcttcttgc aatagtcagt cttgttaaaa gtgatcagat 1320
ttgcattggt taccatgcaa acaattcaac agagcaggtt gacacaatca tggaaaagaa 1380
cgttactgtt acacatgccc aagacatact ggaaaagaca cacaacggga agctctgcga 1440
tctagatgga gtgaagcctc taattttaag agattgtagt gtagctggat ggctcctcgg 1500
gaacccaatg tgtgacgaat tcatcaatgt accggaatgg tcttacatag tggagaaggc 1560
caatccaacc aatgacctct gttacccagg gagtttcaac gactatgaag aactgaaaca 1620
cctattgagc agaataaacc attttgagaa aattcaaatc atccccaaaa gttcttggtc 1680
cgatcatgaa gcctcatcag gagttagctc agcatgtcca tacctgggaa gtccctcctt 1740
ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca tacccaacaa taaagaaaag 1800
ctacaataat accaaccaag aggatctttt ggtactgtgg ggaattcacc atcctaatga 1860
tgcggcagag cagacaaggc tatatcaaaa cccaaccacc tatatttcca ttgggacatc 1920
aacactaaac cagagattgg taccaaaaat agctactaga tccaaagtaa acgggcaaag 1980
tggaaggatg gagttcttct ggacaatttt aaaacctaat gatgcaatca acttcgagag 2040
taatggaaat ttcattgctc cagaatatgc atacaaaatt gtcaagaaag gggactcagc 2100
aattatgaaa agtgaattgg aatatggtaa ctgcaacacc aagtgtcaaa ctccaatggg 2160
ggcgataaac tctagtatgc cattccacaa catacaccct ctcaccatcg gggaatgccc 2220
caaatatgtg aaatcaaaca gattagtcct tgcaacaggg ctcagaaata gccctggcgg 2280
aggatggcag ggaatggtag atggttggta tgggtaccac catagcaatg agcaggggag 2340
tgggtacgct gcagacaaag aatccactca aaaggcaata gatggagtca ccaataaggt 2400
caactcaatc attgacaaaa tgaacactca gtttgaggcc gttggaaggg aatttaataa 2460
cttagaaagg agaatagaga atttaaacaa gaagatggaa gacgggtttc tagatgtctg 2520
gacttataat gccgaacttc tggttctcat ggaaaatgag agaactctag actttcatga 2580
ctcaaatgtt aagaacctct acgacaaggt ccgactacag cttagggata atgcaaagga 2640
gctgggtaac ggttgtttcg agttctatca caaatgtgat aatgaatgta tggaaagtat 2700
aagaaacgga acgtacaact atccgcagta ttcagaagaa gcaagattaa aaagagagga 2760
aataagtggg gtaaaattgg aatcaatagg aacttaccaa atactgtcaa tttattcaac 2820
agtggcgagt tccctagcac tggcaatcat gatggctggt ctatctttat ggatgtgctc 2880
caatggatcg ttacaatgca gaatttgcat ttaaaggcct attttcttta gtttgaattt 2940
actgttattc ggtgtgcatt tctatgtttg gtgagcggtt ttctgtgctc agagtgtgtt 3000
tattttatgt aatttaattt ctttgtgagc tcctgtttag caggtcgtcc cttcagcaag 3060
gacacaaaaa gattttaatt ttattaaaaa aaaaaaaaaa aaagaccggg aattcgatat 3120
caagcttatc gacctgcaga tcgttcaaac atttggcaat aaagtttctt aagattgaat 3180
cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta 3240
ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 3300
caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 3360
tcgcgcgcgg tgtcatctat gttactagat 3390
<210> 85
<211> 549
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence influenza A/Indonesia/5/2005 (H5N1) with
deleted proteolytic loop.
<400> 85
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gly Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His
340 345 350
His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr
355 360 365
Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp
370 375 380
Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu
385 390 395 400
Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu
405 410 415
Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu
420 425 430
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys
435 440 445
Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys
450 455 460
Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg
465 470 475 480
Asn Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys
485 490 495
Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln
500 505 510
Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile
515 520 525
Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln
530 535 540
Cys Arg Ile Cys Ile
545
<210> 86
<211> 40
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1029 IF-S2+S4-B Bris.c
<400> 86
tctcagatct tcgccgatcg aatctgcact ggaataacat 40
<210> 87
<211> 43
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1029 IF-S1a4-B Bris.r
<400> 87
actaaagaaa ataggccttt atagacagat ggagcaagaa aca 43
<210> 88
<211> 1758
<212> DNA
<213> Artificial sequence
<220>
<223> Synthesized HA B Brisbane gene
<400> 88
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
ggaataacat cgtcaaactc accacatgtc gtcaaaactg ctactcaagg ggaggtcaat 120
gtgactggtg taataccact gacaacaaca cccaccaaat ctcattttgc aaatctcaaa 180
ggaacagaaa ccagggggaa actatgccca aaatgcctca actgcacaga tctggacgta 240
gccttgggca gaccaaaatg cacggggaaa ataccctcgg caagagtttc aatactccat 300
gaagtcagac ctgttacatc tgggtgcttt cctataatgc acgacagaac aaaaattaga 360
cagctgccta accttctccg aggatacgaa catatcaggt tatcaaccca taacgttatc 420
aatgcagaaa atgcaccagg aggaccctac aaaattggaa cctcagggtc ttgccctaac 480
attaccaatg gaaacggatt tttcgcaaca atggcttggg ccgtcccaaa aaacgacaaa 540
aacaaaacag caacaaatcc attaacaata gaagtaccat acatttgtac agaaggagaa 600
gaccaaatta ccgtttgggg gttccactct gacaacgaga cccaaatggc aaagctctat 660
ggggactcaa agccccagaa gttcacctca tctgccaacg gagtgaccac acattacgtt 720
tcacagattg gtggcttccc aaatcaaaca gaagacggag gactaccaca aagtggtaga 780
attgttgttg attacatggt gcaaaaatct gggaaaacag gaacaattac ctatcaaagg 840
ggtattttat tgcctcaaaa ggtgtggtgc gcaagtggca ggagcaaggt aataaaagga 900
tccttgcctt taattggaga agcagattgc ctccacgaaa aatacggtgg attaaacaaa 960
agcaagcctt actacacagg ggaacatgca aaggccatag gaaattgccc aatatgggtg 1020
aaaacaccct tgaagctggc caatggaacc aaatatagac ctcctgcaaa actattaaag 1080
gaaaggggtt tcttcggagc tattgctggt ttcttagaag gaggatggga aggaatgatt 1140
gcaggttggc acggatacac atcccatggg gcacatggag tagcggtggc agcagacctt 1200
aagagcactc aagaggccat aaacaagata acaaaaaatc tcaactcttt gagtgagctg 1260
gaagtaaaga atcttcaaag actaagcggt gccatggatg aactccacaa cgaaatacta 1320
gaactagatg agaaagtgga tgatctcaga gctgatacaa taagctcaca aatagaactc 1380
gcagtcctgc tttccaatga aggaataata aacagtgaag atgaacatct cttggcgctt 1440
gaaagaaagc tgaagaaaat gctgggcccc tctgctgtag agatagggaa tggatgcttt 1500
gaaaccaaac acaagtgcaa ccagacctgt ctcgacagaa tagctgctgg tacctttgat 1560
gcaggagaat tttctctccc cacctttgat tcactgaata ttactgctgc atctttaaat 1620
gacgatggat tggataatca tactatactg ctttactact caactgctgc ctccagtttg 1680
gctgtaacac tgatgatagc tatctttgtt gtttatatgg tctccagaga caatgtttct 1740
tgctccatct gtctataa 1758
<210> 89
<211> 3525
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 1029
<400> 89
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggcg aaaaacgttg cgattttcgg cttattgttt tctcttcttg tgttggttcc 1320
ttctcagatc ttcgccgatc gaatctgcac tggaataaca tcgtcaaact caccacatgt 1380
cgtcaaaact gctactcaag gggaggtcaa tgtgactggt gtaataccac tgacaacaac 1440
acccaccaaa tctcattttg caaatctcaa aggaacagaa accaggggga aactatgccc 1500
aaaatgcctc aactgcacag atctggacgt agccttgggc agaccaaaat gcacggggaa 1560
aataccctcg gcaagagttt caatactcca tgaagtcaga cctgttacat ctgggtgctt 1620
tcctataatg cacgacagaa caaaaattag acagctgcct aaccttctcc gaggatacga 1680
acatatcagg ttatcaaccc ataacgttat caatgcagaa aatgcaccag gaggacccta 1740
caaaattgga acctcagggt cttgccctaa cattaccaat ggaaacggat ttttcgcaac 1800
aatggcttgg gccgtcccaa aaaacgacaa aaacaaaaca gcaacaaatc cattaacaat 1860
agaagtacca tacatttgta cagaaggaga agaccaaatt accgtttggg ggttccactc 1920
tgacaacgag acccaaatgg caaagctcta tggggactca aagccccaga agttcacctc 1980
atctgccaac ggagtgacca cacattacgt ttcacagatt ggtggcttcc caaatcaaac 2040
agaagacgga ggactaccac aaagtggtag aattgttgtt gattacatgg tgcaaaaatc 2100
tgggaaaaca ggaacaatta cctatcaaag gggtatttta ttgcctcaaa aggtgtggtg 2160
cgcaagtggc aggagcaagg taataaaagg atccttgcct ttaattggag aagcagattg 2220
cctccacgaa aaatacggtg gattaaacaa aagcaagcct tactacacag gggaacatgc 2280
aaaggccata ggaaattgcc caatatgggt gaaaacaccc ttgaagctgg ccaatggaac 2340
caaatataga cctcctgcaa aactattaaa ggaaaggggt ttcttcggag ctattgctgg 2400
tttcttagaa ggaggatggg aaggaatgat tgcaggttgg cacggataca catcccatgg 2460
ggcacatgga gtagcggtgg cagcagacct taagagcact caagaggcca taaacaagat 2520
aacaaaaaat ctcaactctt tgagtgagct ggaagtaaag aatcttcaaa gactaagcgg 2580
tgccatggat gaactccaca acgaaatact agaactagat gagaaagtgg atgatctcag 2640
agctgataca ataagctcac aaatagaact cgcagtcctg ctttccaatg aaggaataat 2700
aaacagtgaa gatgaacatc tcttggcgct tgaaagaaag ctgaagaaaa tgctgggccc 2760
ctctgctgta gagataggga atggatgctt tgaaaccaaa cacaagtgca accagacctg 2820
tctcgacaga atagctgctg gtacctttga tgcaggagaa ttttctctcc ccacctttga 2880
ttcactgaat attactgctg catctttaaa tgacgatgga ttggataatc atactatact 2940
gctttactac tcaactgctg cctccagttt ggctgtaaca ctgatgatag ctatctttgt 3000
tgtttatatg gtctccagag acaatgtttc ttgctccatc tgtctataaa ggcctatttt 3060
ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 3120
tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt 3180
cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga 3240
ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 3300
ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 3360
tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 3420
atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3480
aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3525
<210> 90
<211> 594
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA from influenza B/Brisbane/60/2008
<400> 90
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Lys Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Ile Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Lys Asn Lys Thr
180 185 190
Ala Thr Asn Pro Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Ala Lys Leu Leu
355 360 365
Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala Gly Phe Leu Glu Gly Gly
370 375 380
Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala
385 390 395 400
His Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile
405 410 415
Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys
420 425 430
Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile
435 440 445
Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser
450 455 460
Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn
465 470 475 480
Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met
485 490 495
Leu Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys
500 505 510
His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe
515 520 525
Asp Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr
530 535 540
Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu
545 550 555 560
Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Ile Ala
565 570 575
Ile Phe Val Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile
580 585 590
Cys Leu
<210> 91
<211> 1734
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Brisbane (PrL-).
<400> 91
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactgga ataacatcgt caaactcacc acatgtcgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gggggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtagcc ttgggcagac caaaatgcac ggggaaaata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaacc ttctccgagg atacgaacat 420
atcaggttat caacccataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacatt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaaaaac aaaacagcaa caaatccatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgac 660
aacgagaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag tggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaaggggt attttattgc ctcaaaaggt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcc ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctggtggagg atgggaagga atgattgcag gttggcacgg atacacatcc 1140
catggggcac atggagtagc ggtggcagca gaccttaaga gcactcaaga ggccataaac 1200
aagataacaa aaaatctcaa ctctttgagt gagctggaag taaagaatct tcaaagacta 1260
agcggtgcca tggatgaact ccacaacgaa atactagaac tagatgagaa agtggatgat 1320
ctcagagctg atacaataag ctcacaaata gaactcgcag tcctgctttc caatgaagga 1380
ataataaaca gtgaagatga acatctcttg gcgcttgaaa gaaagctgaa gaaaatgctg 1440
ggcccctctg ctgtagagat agggaatgga tgctttgaaa ccaaacacaa gtgcaaccag 1500
acctgtctcg acagaatagc tgctggtacc tttgatgcag gagaattttc tctccccacc 1560
tttgattcac tgaatattac tgctgcatct ttaaatgacg atggattgga taatcatact 1620
atactgcttt actactcaac tgctgcctcc agtttggctg taacactgat gatagctatc 1680
tttgttgttt atatggtctc cagagacaat gtttcttgct ccatctgtct ataa 1734
<210> 92
<211> 577
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Brisbane (PrL-)
<400> 92
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Lys Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Ile Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Lys Asn Lys Thr
180 185 190
Ala Thr Asn Pro Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp
355 360 365
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
370 375 380
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
385 390 395 400
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
405 410 415
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
420 425 430
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
435 440 445
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
450 455 460
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
465 470 475 480
Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His
485 490 495
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asp
500 505 510
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
515 520 525
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr
530 535 540
Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Ile Ala Ile
545 550 555 560
Phe Val Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys
565 570 575
Leu
<210> 93
<211> 160
<212> DNA
<213> Artificial sequence
<220>
<223> Expression enhancer CPMVX
<400> 93
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca 160
<210> 94
<211> 29
<212> PRT
<213> Artificial sequence
<220>
<223> Consensus amino acid sequence of transadomain membrane
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (15)..(15)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (17)..(18)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (23)..(23)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (25)..(25)
<223> Xaa can be any naturally occurring amino acid
<400> 94
Ile Leu Xaa Ile Tyr Tyr Ser Thr Val Ala Ile Ser Ser Leu Xaa Leu
1 5 10 15
Xaa Xaa Met Leu Ala Gly Xaa Ser Xaa Trp Met Cys Ser
20 25
<210> 95
<211> 1734
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Brisbane (PrL-)+H1 California
TMCT.
<400> 95
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactgga ataacatcgt caaactcacc acatgtcgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gggggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtagcc ttgggcagac caaaatgcac ggggaaaata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaacc ttctccgagg atacgaacat 420
atcaggttat caacccataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacatt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaaaaac aaaacagcaa caaatccatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgac 660
aacgagaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag tggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaaggggt attttattgc ctcaaaaggt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcc ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctggtggagg atgggaagga atgattgcag gttggcacgg atacacatcc 1140
catggggcac atggagtagc ggtggcagca gaccttaaga gcactcaaga ggccataaac 1200
aagataacaa aaaatctcaa ctctttgagt gagctggaag taaagaatct tcaaagacta 1260
agcggtgcca tggatgaact ccacaacgaa atactagaac tagatgagaa agtggatgat 1320
ctcagagctg atacaataag ctcacaaata gaactcgcag tcctgctttc caatgaagga 1380
ataataaaca gtgaagatga acatctcttg gcgcttgaaa gaaagctgaa gaaaatgctg 1440
ggcccctctg ctgtagagat agggaatgga tgctttgaaa ccaaacacaa gtgcaaccag 1500
acctgtctcg acagaatagc tgctggtacc tttgatgcag gagaattttc tctccccacc 1560
tttgattcac tgaatattac tgctgcatct ttaaatgacg atggattgga taattaccag 1620
attttggcga tctattcaac tgtcgccagt tcattggtac tggtagtctc cctgggggca 1680
atcagtttct ggatgtgctc taatgggtct ctacagtgta gaatatgtat ttaa 1734
<210> 96
<211> 577
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Brisbane (PrL-)+H1 California
TMCT
<400> 96
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Lys Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Ile Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Lys Asn Lys Thr
180 185 190
Ala Thr Asn Pro Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp
355 360 365
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
370 375 380
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
385 390 395 400
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
405 410 415
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
420 425 430
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
435 440 445
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
450 455 460
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
465 470 475 480
Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His
485 490 495
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asp
500 505 510
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
515 520 525
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gln Ile Leu Ala Ile
530 535 540
Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala
545 550 555 560
Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys
565 570 575
Ile
<210> 97
<211> 1731
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Massachussetts (PrL-)
<400> 97
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactggg ataacatctt caaactcacc tcatgtggtc 120
aaaacagcta ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaagacca gagggaaact atgcccagac 240
tgtctcaact gtacagatct ggatgtggcc ctgggcaggc caatgtgtgt gggaactaca 300
ccttctgcga aagcttcaat acttcacgaa gtcagacctg ttacatccgg gtgcttccct 360
ataatgcacg acagaacaaa aatcaggcaa ctagccaatc ttctcagagg atatgaaaat 420
atcaggttat caacccaaaa cgttatcgat gcagaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaaa gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccattaac agtagaagta 600
ccatacattt gtgcagaagg ggaagaccaa attactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacatta tgtttctcag attggcggct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg cagaattgtc gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctatca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc ttgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggtt ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt tgctgcagac cttaagagca cacaagaagc tataaacaag 1200
ataacaaaaa atctcaactc tttgagtgag ctagaagtaa agaatcttca aaggctaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgacctc 1320
agagctgaca ctataagttc acaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagacgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagacatagg aaatggatgc ttcgaaacca aacacaaatg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag agttttctct ccccactttt 1560
gattcattga acattactgc tgcatcttta aatgatgatg gattggataa ccatactata 1620
ctgctctatt actcaactgc tgcttctagt ttggctgtaa cattgatgct agctattttt 1680
attgtttata tggtctccag agacaacgtt tcatgctcca tctgtctata a 1731
<210> 98
<211> 576
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Massachussetts (PrL-)
<400> 98
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Lys Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Ala Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Ala Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Asp Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr Tyr
530 535 540
Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Leu Ala Ile Phe
545 550 555 560
Ile Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys Leu
565 570 575
<210> 99
<211> 1731
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Massachussetts (PrL-)+H1
California TMCT
<400> 99
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactggg ataacatctt caaactcacc tcatgtggtc 120
aaaacagcta ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaagacca gagggaaact atgcccagac 240
tgtctcaact gtacagatct ggatgtggcc ctgggcaggc caatgtgtgt gggaactaca 300
ccttctgcga aagcttcaat acttcacgaa gtcagacctg ttacatccgg gtgcttccct 360
ataatgcacg acagaacaaa aatcaggcaa ctagccaatc ttctcagagg atatgaaaat 420
atcaggttat caacccaaaa cgttatcgat gcagaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaaa gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccattaac agtagaagta 600
ccatacattt gtgcagaagg ggaagaccaa attactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacatta tgtttctcag attggcggct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg cagaattgtc gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctatca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc ttgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggtt ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt tgctgcagac cttaagagca cacaagaagc tataaacaag 1200
ataacaaaaa atctcaactc tttgagtgag ctagaagtaa agaatcttca aaggctaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgacctc 1320
agagctgaca ctataagttc acaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagacgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagacatagg aaatggatgc ttcgaaacca aacacaaatg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag agttttctct ccccactttt 1560
gattcattga acattactgc tgcatcttta aatgatgatg gattggataa ctaccagatt 1620
ttggcgatct attcaactgt cgccagttca ttggtactgg tagtctccct gggggcaatc 1680
agtttctgga tgtgctctaa tgggtctcta cagtgtagaa tatgtattta a 1731
<210> 100
<211> 576
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Massachussetts (PrL-)+H1
California TMCT
<400> 100
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Lys Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Ala Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Ala Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Asp Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gln Ile Leu Ala Ile Tyr
530 535 540
Ser Thr Val Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala Ile
545 550 555 560
Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570 575
<210> 101
<211> 1704
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of HA B Wisconsin (PrL-).
<400> 101
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccac 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcagg 360
caactaccca atcttctcag aggatatgaa aatatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaatcggatt ttttgcaaca atggcttggg ctgtcccaaa ggacaactac 540
aaaaatgcaa cgaacccact aacagtagaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcagat aacaaaaccc aaatgaagag cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag taaccacaca ttatgtttct 720
cagattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatgatgca aaaacctggg aaaacaggaa caattgtcta tcaaagaggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaaaaat acggtggatt aaacaaaagc 960
aagccttact acacaggaga acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctggtggagg atgggaagga 1080
atgattgcag gttggcacgg atacacatct cacggagcac atggagtggc agtggcggca 1140
gaccttaaga gtacacaaga agctataaat aagataacaa aaaatctcaa ttctttgagt 1200
gagctagaag taaagaacct tcaaagacta agtggtgcca tggatgaact ccacaacgaa 1260
atactcgagc tggatgagaa agtggatgat ctcagagctg acactataag ctcacaaata 1320
gaacttgcag tcttgctttc caacgaagga ataataaaca gtgaagacga gcatctattg 1380
gcacttgaga gaaaactaaa gaaaatgctg ggtccctctg ctgtagacat aggaaacgga 1440
tgcttcgaaa ccaaacacaa atgcaaccag acctgcttag acaggatagc tgctggcacc 1500
tttaatgcag gagaattttc tctccccact tttgattcat tgaacattac tgctgcatct 1560
ttaaatgatg atggattgga taaccatact atactgctct attactcaac tgctgcttct 1620
agtttggctg taacattaat gctagctatt tttattgttt atatggtctc cagagacaac 1680
gtttcatgct ccatctgtct ataa 1704
<210> 102
<211> 567
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of HA B Wisconsin (PrL-)
<400> 102
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
355 360 365
Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser
385 390 395 400
Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu
405 410 415
Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg
420 425 430
Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn
435 440 445
Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg
450 455 460
Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile
485 490 495
Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp
500 505 510
Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn
515 520 525
His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val
530 535 540
Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp Asn
545 550 555 560
Val Ser Cys Ser Ile Cys Leu
565
<210> 103
<211> 1704
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of HA B Wisconsin (PrL-)+H1 California TMCT
<400> 103
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccac 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcagg 360
caactaccca atcttctcag aggatatgaa aatatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaatcggatt ttttgcaaca atggcttggg ctgtcccaaa ggacaactac 540
aaaaatgcaa cgaacccact aacagtagaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcagat aacaaaaccc aaatgaagag cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag taaccacaca ttatgtttct 720
cagattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatgatgca aaaacctggg aaaacaggaa caattgtcta tcaaagaggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaaaaat acggtggatt aaacaaaagc 960
aagccttact acacaggaga acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctggtggagg atgggaagga 1080
atgattgcag gttggcacgg atacacatct cacggagcac atggagtggc agtggcggca 1140
gaccttaaga gtacacaaga agctataaat aagataacaa aaaatctcaa ttctttgagt 1200
gagctagaag taaagaacct tcaaagacta agtggtgcca tggatgaact ccacaacgaa 1260
atactcgagc tggatgagaa agtggatgat ctcagagctg acactataag ctcacaaata 1320
gaacttgcag tcttgctttc caacgaagga ataataaaca gtgaagacga gcatctattg 1380
gcacttgaga gaaaactaaa gaaaatgctg ggtccctctg ctgtagacat aggaaacgga 1440
tgcttcgaaa ccaaacacaa atgcaaccag acctgcttag acaggatagc tgctggcacc 1500
tttaatgcag gagaattttc tctccccact tttgattcat tgaacattac tgctgcatct 1560
ttaaatgatg atggattgga taactaccag attttggcga tctattcaac tgtcgccagt 1620
tcattggtac tggtagtctc cctgggggca atcagtttct ggatgtgctc taatgggtct 1680
ctacagtgta gaatatgtat ttaa 1704
<210> 104
<211> 567
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of HA B Wisconsin (PrL-)+H1 California TMC
<400> 104
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
355 360 365
Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser
385 390 395 400
Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu
405 410 415
Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg
420 425 430
Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn
435 440 445
Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg
450 455 460
Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile
485 490 495
Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp
500 505 510
Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn
515 520 525
Tyr Gln Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu
530 535 540
Val Val Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser
545 550 555 560
Leu Gln Cys Arg Ile Cys Ile
565
<210> 105
<211> 1734
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Brisbane (PrL-)+H1 California
TMCT
<400> 105
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactgga ataacatcgt caaactcacc acatgtcgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gggggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtagcc ttgggcagac caaaatgcac ggggaaaata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaacc ttctccgagg atacgaacat 420
atcaggttat caacccataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacatt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaaaaac aaaacagcaa caaatccatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgac 660
aacgagaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag tggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaaggggt attttattgc ctcaaaaggt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcc ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctggtggagg atgggaagga atgattgcag gttggcacgg atacacatcc 1140
catggggcac atggagtagc ggtggcagca gaccttaaga gcactcaaga ggccataaac 1200
aagataacaa aaaatctcaa ctctttgagt gagctggaag taaagaatct tcaaagacta 1260
agcggtgcca tggatgaact ccacaacgaa atactagaac tagatgagaa agtggatgat 1320
ctcagagctg atacaataag ctcacaaata gaactcgcag tcctgctttc caatgaagga 1380
ataataaaca gtgaagatga acatctcttg gcgcttgaaa gaaagctgaa gaaaatgctg 1440
ggcccctctg ctgtagagat agggaatgga tgctttgaaa ccaaacacaa gtgcaaccag 1500
acctgtctcg acagaatagc tgctggtacc tttgatgcag gagaattttc tctccccacc 1560
tttgattcac tgaatattac tgctgcatct ttaaatgacg atggattgga taattaccag 1620
attttggcga tctattcaac tgtcgccagt tcattggtac tggtagtctc cctgggggca 1680
atcagtttct ggatgtgctc taatgggtct ctacagtgta gaatatgtat ttaa 1734
<210> 106
<211> 577
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Brisbane (PrL-)+H1 California
TMCT
<400> 106
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Lys Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Ile Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Lys Asn Lys Thr
180 185 190
Ala Thr Asn Pro Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp
355 360 365
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
370 375 380
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
385 390 395 400
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
405 410 415
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
420 425 430
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
435 440 445
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
450 455 460
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
465 470 475 480
Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His
485 490 495
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asp
500 505 510
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
515 520 525
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gln Ile Leu Ala Ile
530 535 540
Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala
545 550 555 560
Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys
565 570 575
Ile
<210> 107
<211> 1731
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Massachussetts (PrL-)
<400> 107
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactggg ataacatctt caaactcacc tcatgtggtc 120
aaaacagcta ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaagacca gagggaaact atgcccagac 240
tgtctcaact gtacagatct ggatgtggcc ctgggcaggc caatgtgtgt gggaactaca 300
ccttctgcga aagcttcaat acttcacgaa gtcagacctg ttacatccgg gtgcttccct 360
ataatgcacg acagaacaaa aatcaggcaa ctagccaatc ttctcagagg atatgaaaat 420
atcaggttat caacccaaaa cgttatcgat gcagaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaaa gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccattaac agtagaagta 600
ccatacattt gtgcagaagg ggaagaccaa attactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacatta tgtttctcag attggcggct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg cagaattgtc gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctatca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc ttgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggtt ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt tgctgcagac cttaagagca cacaagaagc tataaacaag 1200
ataacaaaaa atctcaactc tttgagtgag ctagaagtaa agaatcttca aaggctaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgacctc 1320
agagctgaca ctataagttc acaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagacgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagacatagg aaatggatgc ttcgaaacca aacacaaatg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag agttttctct ccccactttt 1560
gattcattga acattactgc tgcatcttta aatgatgatg gattggataa ccatactata 1620
ctgctctatt actcaactgc tgcttctagt ttggctgtaa cattgatgct agctattttt 1680
attgtttata tggtctccag agacaacgtt tcatgctcca tctgtctata a 1731
<210> 108
<211> 576
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Massachussetts (PrL-)
<400> 108
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Lys Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Ala Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Ala Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Asp Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr Tyr
530 535 540
Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Leu Ala Ile Phe
545 550 555 560
Ile Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys Leu
565 570 575
<210> 109
<211> 1731
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Massachussetts (PrL-)+H1
California TMCT
<400> 109
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactggg ataacatctt caaactcacc tcatgtggtc 120
aaaacagcta ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaagacca gagggaaact atgcccagac 240
tgtctcaact gtacagatct ggatgtggcc ctgggcaggc caatgtgtgt gggaactaca 300
ccttctgcga aagcttcaat acttcacgaa gtcagacctg ttacatccgg gtgcttccct 360
ataatgcacg acagaacaaa aatcaggcaa ctagccaatc ttctcagagg atatgaaaat 420
atcaggttat caacccaaaa cgttatcgat gcagaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaaa gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccattaac agtagaagta 600
ccatacattt gtgcagaagg ggaagaccaa attactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacatta tgtttctcag attggcggct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg cagaattgtc gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctatca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc ttgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggtt ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt tgctgcagac cttaagagca cacaagaagc tataaacaag 1200
ataacaaaaa atctcaactc tttgagtgag ctagaagtaa agaatcttca aaggctaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgacctc 1320
agagctgaca ctataagttc acaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagacgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagacatagg aaatggatgc ttcgaaacca aacacaaatg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag agttttctct ccccactttt 1560
gattcattga acattactgc tgcatcttta aatgatgatg gattggataa ctaccagatt 1620
ttggcgatct attcaactgt cgccagttca ttggtactgg tagtctccct gggggcaatc 1680
agtttctgga tgtgctctaa tgggtctcta cagtgtagaa tatgtattta a 1731
<210> 110
<211> 576
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Massachussetts (PrL-)+H1
California TMCT
<400> 110
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Lys Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Ala Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Ala Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Asp Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gln Ile Leu Ala Ile Tyr
530 535 540
Ser Thr Val Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala Ile
545 550 555 560
Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570 575
<210> 111
<211> 1704
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of HA B Wisconsin (PrL-)
<400> 111
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccac 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcagg 360
caactaccca atcttctcag aggatatgaa aatatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaatcggatt ttttgcaaca atggcttggg ctgtcccaaa ggacaactac 540
aaaaatgcaa cgaacccact aacagtagaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcagat aacaaaaccc aaatgaagag cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag taaccacaca ttatgtttct 720
cagattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatgatgca aaaacctggg aaaacaggaa caattgtcta tcaaagaggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaaaaat acggtggatt aaacaaaagc 960
aagccttact acacaggaga acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctggtggagg atgggaagga 1080
atgattgcag gttggcacgg atacacatct cacggagcac atggagtggc agtggcggca 1140
gaccttaaga gtacacaaga agctataaat aagataacaa aaaatctcaa ttctttgagt 1200
gagctagaag taaagaacct tcaaagacta agtggtgcca tggatgaact ccacaacgaa 1260
atactcgagc tggatgagaa agtggatgat ctcagagctg acactataag ctcacaaata 1320
gaacttgcag tcttgctttc caacgaagga ataataaaca gtgaagacga gcatctattg 1380
gcacttgaga gaaaactaaa gaaaatgctg ggtccctctg ctgtagacat aggaaacgga 1440
tgcttcgaaa ccaaacacaa atgcaaccag acctgcttag acaggatagc tgctggcacc 1500
tttaatgcag gagaattttc tctccccact tttgattcat tgaacattac tgctgcatct 1560
ttaaatgatg atggattgga taaccatact atactgctct attactcaac tgctgcttct 1620
agtttggctg taacattaat gctagctatt tttattgttt atatggtctc cagagacaac 1680
gtttcatgct ccatctgtct ataa 1704
<210> 112
<211> 567
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of HA B Wisconsin (PrL-)
<400> 112
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
355 360 365
Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser
385 390 395 400
Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu
405 410 415
Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg
420 425 430
Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn
435 440 445
Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg
450 455 460
Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile
485 490 495
Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp
500 505 510
Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn
515 520 525
His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val
530 535 540
Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp Asn
545 550 555 560
Val Ser Cys Ser Ile Cys Leu
565
<210> 113
<211> 1704
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of HA B Wisconsin (PrL-)+H1 California TMCT
<400> 113
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccac 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcagg 360
caactaccca atcttctcag aggatatgaa aatatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaatcggatt ttttgcaaca atggcttggg ctgtcccaaa ggacaactac 540
aaaaatgcaa cgaacccact aacagtagaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcagat aacaaaaccc aaatgaagag cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag taaccacaca ttatgtttct 720
cagattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatgatgca aaaacctggg aaaacaggaa caattgtcta tcaaagaggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaaaaat acggtggatt aaacaaaagc 960
aagccttact acacaggaga acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctggtggagg atgggaagga 1080
atgattgcag gttggcacgg atacacatct cacggagcac atggagtggc agtggcggca 1140
gaccttaaga gtacacaaga agctataaat aagataacaa aaaatctcaa ttctttgagt 1200
gagctagaag taaagaacct tcaaagacta agtggtgcca tggatgaact ccacaacgaa 1260
atactcgagc tggatgagaa agtggatgat ctcagagctg acactataag ctcacaaata 1320
gaacttgcag tcttgctttc caacgaagga ataataaaca gtgaagacga gcatctattg 1380
gcacttgaga gaaaactaaa gaaaatgctg ggtccctctg ctgtagacat aggaaacgga 1440
tgcttcgaaa ccaaacacaa atgcaaccag acctgcttag acaggatagc tgctggcacc 1500
tttaatgcag gagaattttc tctccccact tttgattcat tgaacattac tgctgcatct 1560
ttaaatgatg atggattgga taactaccag attttggcga tctattcaac tgtcgccagt 1620
tcattggtac tggtagtctc cctgggggca atcagtttct ggatgtgctc taatgggtct 1680
ctacagtgta gaatatgtat ttaa 1704
<210> 114
<211> 567
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of HA B Wisconsin (PrL-)+H1 California TMC.
<400> 114
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ile Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Tyr Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Ser Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Asp Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Gly Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr
355 360 365
Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser
385 390 395 400
Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu
405 410 415
Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg
420 425 430
Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn
435 440 445
Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg
450 455 460
Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Asp Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile
485 490 495
Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp
500 505 510
Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn
515 520 525
Tyr Gln Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu
530 535 540
Val Val Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser
545 550 555 560
Leu Gln Cys Arg Ile Cys Ile
565
<210> 115
<211> 1707
<212> DNA
<213> Influenza H5 Indonesia
<400> 115
atggagaaaa tagtgcttct tcttgcaata gtcagtcttg ttaaaagtga tcagatttgc 60
attggttacc atgcaaacaa ttcaacagag caggttgaca caatcatgga aaagaacgtt 120
actgttacac atgcccaaga catactggaa aagacacaca acgggaagct ctgcgatcta 180
gatggagtga agcctctaat tttaagagat tgtagtgtag ctggatggct cctcgggaac 240
ccaatgtgtg acgaattcat caatgtaccg gaatggtctt acatagtgga gaaggccaat 300
ccaaccaatg acctctgtta cccagggagt ttcaacgact atgaagaact gaaacaccta 360
ttgagcagaa taaaccattt tgagaaaatt caaatcatcc ccaaaagttc ttggtccgat 420
catgaagcct catcaggagt tagctcagca tgtccatacc tgggaagtcc ctcctttttt 480
agaaatgtgg tatggcttat caaaaagaac agtacatacc caacaataaa gaaaagctac 540
aataatacca accaagagga tcttttggta ctgtggggaa ttcaccatcc taatgatgcg 600
gcagagcaga caaggctata tcaaaaccca accacctata tttccattgg gacatcaaca 660
ctaaaccaga gattggtacc aaaaatagct actagatcca aagtaaacgg gcaaagtgga 720
aggatggagt tcttctggac aattttaaaa cctaatgatg caatcaactt cgagagtaat 780
ggaaatttca ttgctccaga atatgcatac aaaattgtca agaaagggga ctcagcaatt 840
atgaaaagtg aattggaata tggtaactgc aacaccaagt gtcaaactcc aatgggggcg 900
ataaactcta gtatgccatt ccacaacata caccctctca ccatcgggga atgccccaaa 960
tatgtgaaat caaacagatt agtccttgca acagggctca gaaatagccc tcaaagagag 1020
agcagaagaa aaaagagagg actatttgga gctatagcag gttttataga gggaggatgg 1080
cagggaatgg tagatggttg gtatgggtac caccatagca atgagcaggg gagtgggtac 1140
gctgcagaca aagaatccac tcaaaaggca atagatggag tcaccaataa ggtcaactca 1200
atcattgaca aaatgaacac tcagtttgag gccgttggaa gggaatttaa taacttagaa 1260
aggagaatag agaatttaaa caagaagatg gaagacgggt ttctagatgt ctggacttat 1320
aatgccgaac ttctggttct catggaaaat gagagaactc tagactttca tgactcaaat 1380
gttaagaacc tctacgacaa ggtccgacta cagcttaggg ataatgcaaa ggagctgggt 1440
aacggttgtt tcgagttcta tcacaaatgt gataatgaat gtatggaaag tataagaaac 1500
ggaacgtaca actatccgca gtattcagaa gaagcaagat taaaaagaga ggaaataagt 1560
ggggtaaaat tggaatcaat aggaacttac caaatactgt caatttattc aacagtggcg 1620
agttccctag cactggcaat catgatggct ggtctatctt tatggatgtg ctccaatgga 1680
tcgttacaat gcagaatttg catttaa 1707
<210> 116
<211> 568
<212> PRT
<213> Influenza H5 Indonesia
<400> 116
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile
340 345 350
Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr
355 360 365
Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys
370 375 380
Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser
385 390 395 400
Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe
405 410 415
Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp
420 425 430
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met
435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu
450 455 460
Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly
465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu
485 490 495
Ser Ile Arg Asn Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala
500 505 510
Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly
515 520 525
Thr Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala
530 535 540
Leu Ala Ile Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly
545 550 555 560
Ser Leu Gln Cys Arg Ile Cys Ile
565
<210> 117
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1800 IF**(SacII)-PDI.s1+4c
<400> 117
acagggccca ataccgcgga gaaaatggcg aaaaacgttg cgattttcgg ct 52
<210> 118
<211> 51
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1800 IF-H3V36111.s1-4r
<400> 118
actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgccct t 51
<210> 119
<211> 1725
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H3 Victoria.
<400> 119
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cccaaaaact tcctggaaat gacaacagca cggcaacgct gtgccttggg 120
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 180
actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240
cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300
gatggcttcc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420
acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480
tctgcttgca taaggagatc taataatagt ttctttagta gattaaattg gttgacccac 540
ttaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600
ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660
caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720
atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900
tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960
gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020
gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080
ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140
aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200
atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260
aaagaattct cagaagtcga agggagaatt caggaccttg agaaatatgt tgaggacact 1320
aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380
attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactaagg 1440
gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500
tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta 1560
aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620
tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680
tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725
<210> 120
<211> 4644
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 2171
<400> 120
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120
aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180
aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240
ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300
gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360
aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420
aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480
taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540
aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600
atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660
taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720
tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780
gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840
acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900
ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960
accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020
gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080
aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 1140
gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200
actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260
aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320
gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380
tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 1440
agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500
tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560
tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620
ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 1680
tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 1740
ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800
cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 1860
gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920
tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980
ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040
ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100
cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca 2160
cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 2220
tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 2280
ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 2340
cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 2400
cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 2460
ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga 2520
tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa 2580
cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga 2640
aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc 2700
tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 2760
cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga 2820
tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 2880
tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa 2940
ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc 3000
ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccagtaca gggcccaata 3060
ccgcggagaa aatggcgaaa aacgttgcga ttttcggctt attgttttct cttcttgtgt 3120
tggttccttc tcagatcttc gcgacgtcac tcctcagcca aaacgacacc cccatctgtc 3180
tatccactgg cccctggatc tgctgcccaa actaactcca tggtgaccct gggatgcctg 3240
gtcaagggct atttccctga gccagtgaca gtgacctgga actctggatc cctgtccagc 3300
ggtgtgcaca ccttcccagc tgtcctgcag tctgacctct acactctgag cagctcagtg 3360
actgtcccct ccagcacctg gcccagcgag accgtcacct gcaacgttgc ccacccggcc 3420
agcagcacca aggtggacaa gaaaattgtg cccagggatt gtggttgtaa gccttgcata 3480
tgtacagtcc cagaagtatc atctgtcttc atcttccccc caaagcccaa ggatgtgctc 3540
accattactc tgactcctaa ggtcacgtgt gttgtggtag acatcagcaa ggatgatccc 3600
gaggtccagt tcagctggtt tgtagatgat gtggaggtgc acacagctca gacgcaaccc 3660
cgggaggagc agttcaacag cactttccgc tcagtcagtg aacttcccat catgcaccag 3720
gactggctca atggcaagga gacgtccaga ttttggcgat ctattcaact gtcgccagtt 3780
cattggtact ggtagtctcc ctgggggcaa tcagtttctg gatgtgctct aatgggtctc 3840
tacagtgtag aatatgtatt taaaggccta ttttctttag tttgaattta ctgttattcg 3900
gtgtgcattt ctatgtttgg tgagcggttt tctgtgctca gagtgtgttt attttatgta 3960
atttaatttc tttgtgagct cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag 4020
attttaattt tattaaaaaa aaaaaaaaaa aagaccggga attcgatatc aagcttatcg 4080
acctgcagat cgttcaaaca tttggcaata aagtttctta agattgaatc ctgttgccgg 4140
tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa taattaacat 4200
gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc aattatacat 4260
ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat cgcgcgcggt 4320
gtcatctatg ttactagatc tctagagtct caagcttggc gcgcccacgt gactagtggc 4380
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 4440
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 4500
cccttcccaa cagttgcgca gcctgaatgg cgaatgctag agcagcttga gcttggatca 4560
gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt 4620
aaacctaaga gaaaagagcg ttta 4644
<210> 121
<211> 3129
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1800
<400> 121
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaggg cccaataccg cggagaaaat ggcgaaaaac gttgcgattt tcggcttatt 960
gttttctctt cttgtgttgg ttccttctca gatcttcgcc caaaaacttc ctggaaatga 1020
caacagcacg gcaacgctgt gccttgggca ccatgcagta ccaaacggaa cgatagtgaa 1080
aacaatcacg aatgaccaaa ttgaagttac taatgctact gagctggttc agaattcctc 1140
aataggtgaa atatgcgaca gtcctcatca gatccttgat ggagaaaact gcacactaat 1200
agatgctcta ttgggagacc ctcagtgtga tggcttccaa aataagaaat gggacctttt 1260
tgttgaacga agcaaagcct acagcaactg ttacccttat gatgtgccgg attatgcctc 1320
ccttaggtca ctagttgcct catccggcac actggagttt aacaatgaaa gcttcaattg 1380
gactggagtc actcaaaacg gaacaagttc tgcttgcata aggagatcta ataatagttt 1440
ctttagtaga ttaaattggt tgacccactt aaacttcaaa tacccagcat tgaacgtgac 1500
tatgccaaac aatgaacaat ttgacaaatt gtacatttgg ggggttcacc acccgggtac 1560
ggacaaggac caaatcttcc tgtatgctca atcatcagga agaatcacag tatctaccaa 1620
aagaagccaa caagctgtaa tcccgaatat cggatctaga cccagaataa ggaatatccc 1680
tagcagaata agcatctatt ggacaatagt aaaaccggga gacatacttt tgattaacag 1740
cacagggaat ctaattgctc ctaggggtta cttcaaaata cgaagtggga aaagctcaat 1800
aatgagatca gatgcaccca ttggcaaatg caattctgaa tgcatcactc caaatggaag 1860
cattcccaat gacaaaccat tccaaaatgt aaacaggatc acatacgggg cctgtcccag 1920
atatgttaag caaagcactc tgaaattggc aacaggaatg cgaaatgtac cagagaaaca 1980
aactagaggc atatttggcg caatagcggg tttcatagaa aatggttggg agggaatggt 2040
ggatggttgg tacggtttca ggcatcaaaa ttctgaggga agaggacaag cagcagatct 2100
caaaagcact caagcagcaa tcgatcaaat caatgggaag ctgaatcgat tgatcgggaa 2160
aaccaacgag aaattccatc agattgaaaa agaattctca gaagtcgaag ggagaattca 2220
ggaccttgag aaatatgttg aggacactaa aatagatctc tggtcataca acgcggagct 2280
tcttgttgcc ctggagaacc aacatacaat tgatctaact gactcagaaa tgaacaaact 2340
gtttgaaaaa acaaagaagc aactaaggga aaatgctgag gatatgggca atggttgttt 2400
caaaatatac cacaaatgtg acaatgcctg cataggatca atcagaaatg gaacttatga 2460
ccacgatgta tacagagatg aagcattaaa caaccggttc cagatcaagg gagttgagct 2520
gaagtcaggg tacaaagatt ggatcctatg gatttccttt gccatatcat gttttttgct 2580
ttgtgttgct ttgttggggt tcatcatgtg ggcctgccaa aagggcaaca ttaggtgcaa 2640
catttgcatt tgaaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt 2700
ctatgtttgg tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc 2760
tttgtgagct cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt 2820
tattaaaaaa aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat 2880
cgttcaaaca tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg 2940
attatcatat aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg 3000
acgttattta tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg 3060
atagaaaaca aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg 3120
ttactagat 3129
<210> 122
<211> 574
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H3 Victoria
<400> 122
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn
20 25 30
Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr
35 40 45
Ile Val Lys Thr Ile Thr Asn Asp Gln Ile Glu Val Thr Asn Ala Thr
50 55 60
Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His
65 70 75 80
Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly
85 90 95
Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val
100 105 110
Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp
115 120 125
Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe
130 135 140
Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser
145 150 155 160
Ser Ala Cys Ile Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu Asn
165 170 175
Trp Leu Thr His Leu Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met
180 185 190
Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His
195 200 205
Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly
210 215 220
Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn
225 230 235 240
Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile
245 250 255
Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr
260 265 270
Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys
275 280 285
Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Asn Ser Glu
290 295 300
Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn
305 310 315 320
Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser
325 330 335
Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr
340 345 350
Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu
355 360 365
Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly
370 375 380
Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln
385 390 395 400
Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe
405 410 415
His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp
420 425 430
Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn
435 440 445
Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr
450 455 460
Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg
465 470 475 480
Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys
485 490 495
Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His
500 505 510
Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly
515 520 525
Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe
530 535 540
Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met
545 550 555 560
Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile
565 570
<210> 123
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1819 IF(SacII)-Kozac_PDI.c
<400> 123
gtcgggccca ataccgcgga gaaaatggcg aaaaacgttg cgattttc 48
<210> 124
<211> 51
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1819 IF-H3V36111.s1-4r
<400> 124
actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgccct t 51
<210> 125
<211> 4914
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 2181
<400> 125
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120
aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180
aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240
ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300
gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360
aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420
aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480
taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540
aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600
atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660
taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720
tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780
gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840
acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900
ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960
accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020
gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080
aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 1140
gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200
actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260
aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320
gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380
tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 1440
agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500
tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560
tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620
ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 1680
tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 1740
ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800
cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 1860
gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920
tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980
ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040
ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100
cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca 2160
cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 2220
tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 2280
ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 2340
cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 2400
cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 2460
ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga 2520
tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa 2580
cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga 2640
aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc 2700
tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 2760
cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga 2820
tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 2880
tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa 2940
ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc 3000
ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt 3060
tcactgaagc gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg 3120
tgtacttgtc ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct 3180
gttcagcccc atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct 3240
acttctgctt gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt 3300
tctataagaa atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga 3360
gaaagattgt taagcttctg tatattctgc ccaaatttgt cgggcccaat accgcggaga 3420
aaatggcgaa aaacgttgcg attttcggct tattgttttc tcttcttgtg ttggttcctt 3480
ctcagatctt cgcgacgtca ctcctcagcc aaaacgacac ccccatctgt ctatccactg 3540
gcccctggat ctgctgccca aactaactcc atggtgaccc tgggatgcct ggtcaagggc 3600
tatttccctg agccagtgac agtgacctgg aactctggat ccctgtccag cggtgtgcac 3660
accttcccag ctgtcctgca gtctgacctc tacactctga gcagctcagt gactgtcccc 3720
tccagcacct ggcccagcga gaccgtcacc tgcaacgttg cccacccggc cagcagcacc 3780
aaggtggaca agaaaattgt gcccagggat tgtggttgta agccttgcat atgtacagtc 3840
ccagaagtat catctgtctt catcttcccc ccaaagccca aggatgtgct caccattact 3900
ctgactccta aggtcacgtg tgttgtggta gacatcagca aggatgatcc cgaggtccag 3960
ttcagctggt ttgtagatga tgtggaggtg cacacagctc agacgcaacc ccgggaggag 4020
cagttcaaca gcactttccg ctcagtcagt gaacttccca tcatgcacca ggactggctc 4080
aatggcaagg agcgatcgct caccatcacc atcaccatca ccatcaccat taaaggccta 4140
ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg tgagcggttt 4200
tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct cctgtttagc 4260
aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa aaaaaaaaaa 4320
aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca tttggcaata 4380
aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt 4440
gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt 4500
ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg 4560
cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatc tctagagtct 4620
caagcttggc gcgcccacgt gactagtggc actggccgtc gttttacaac gtcgtgactg 4680
ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 4740
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 4800
cgaatgctag agcagcttga gcttggatca gattgtcgtt tcccgccttc agtttaaact 4860
atcagtgttt gacaggatat attggcgggt aaacctaaga gaaaagagcg ttta 4914
<210> 126
<211> 3480
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 1819
<400> 126
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccaatacc gcggagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1320
tcttgtgttg gttccttctc agatcttcgc ccaaaaactt cctggaaatg acaacagcac 1380
ggcaacgctg tgccttgggc accatgcagt accaaacgga acgatagtga aaacaatcac 1440
gaatgaccaa attgaagtta ctaatgctac tgagctggtt cagaattcct caataggtga 1500
aatatgcgac agtcctcatc agatccttga tggagaaaac tgcacactaa tagatgctct 1560
attgggagac cctcagtgtg atggcttcca aaataagaaa tgggaccttt ttgttgaacg 1620
aagcaaagcc tacagcaact gttaccctta tgatgtgccg gattatgcct cccttaggtc 1680
actagttgcc tcatccggca cactggagtt taacaatgaa agcttcaatt ggactggagt 1740
cactcaaaac ggaacaagtt ctgcttgcat aaggagatct aataatagtt tctttagtag 1800
attaaattgg ttgacccact taaacttcaa atacccagca ttgaacgtga ctatgccaaa 1860
caatgaacaa tttgacaaat tgtacatttg gggggttcac cacccgggta cggacaagga 1920
ccaaatcttc ctgtatgctc aatcatcagg aagaatcaca gtatctacca aaagaagcca 1980
acaagctgta atcccgaata tcggatctag acccagaata aggaatatcc ctagcagaat 2040
aagcatctat tggacaatag taaaaccggg agacatactt ttgattaaca gcacagggaa 2100
tctaattgct cctaggggtt acttcaaaat acgaagtggg aaaagctcaa taatgagatc 2160
agatgcaccc attggcaaat gcaattctga atgcatcact ccaaatggaa gcattcccaa 2220
tgacaaacca ttccaaaatg taaacaggat cacatacggg gcctgtccca gatatgttaa 2280
gcaaagcact ctgaaattgg caacaggaat gcgaaatgta ccagagaaac aaactagagg 2340
catatttggc gcaatagcgg gtttcataga aaatggttgg gagggaatgg tggatggttg 2400
gtacggtttc aggcatcaaa attctgaggg aagaggacaa gcagcagatc tcaaaagcac 2460
tcaagcagca atcgatcaaa tcaatgggaa gctgaatcga ttgatcggga aaaccaacga 2520
gaaattccat cagattgaaa aagaattctc agaagtcgaa gggagaattc aggaccttga 2580
gaaatatgtt gaggacacta aaatagatct ctggtcatac aacgcggagc ttcttgttgc 2640
cctggagaac caacatacaa ttgatctaac tgactcagaa atgaacaaac tgtttgaaaa 2700
aacaaagaag caactaaggg aaaatgctga ggatatgggc aatggttgtt tcaaaatata 2760
ccacaaatgt gacaatgcct gcataggatc aatcagaaat ggaacttatg accacgatgt 2820
atacagagat gaagcattaa acaaccggtt ccagatcaag ggagttgagc tgaagtcagg 2880
gtacaaagat tggatcctat ggatttcctt tgccatatca tgttttttgc tttgtgttgc 2940
tttgttgggg ttcatcatgt gggcctgcca aaagggcaac attaggtgca acatttgcat 3000
ttgaaggcct attttcttta gtttgaattt actgttattc ggtgtgcatt tctatgtttg 3060
gtgagcggtt ttctgtgctc agagtgtgtt tattttatgt aatttaattt ctttgtgagc 3120
tcctgtttag caggtcgtcc cttcagcaag gacacaaaaa gattttaatt ttattaaaaa 3180
aaaaaaaaaa aaagaccggg aattcgatat caagcttatc gacctgcaga tcgttcaaac 3240
atttggcaat aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata 3300
taatttctgt tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt 3360
atgagatggg tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac 3420
aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat 3480
<210> 127
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> IF**-H2S157.sl-6r
<400> 127
actaaagaaa ataggccttc atatgcagat cctgcactgc agagacccgt 50
<210> 128
<211> 1716
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H2 Singapore.
<400> 128
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggaccaaat atgcattgga taccatgcca ataattccac agagaaggtc 120
gacacaattc tagagcggaa cgtcactgtg actcatgcca aggacattct tgagaagacc 180
cataacggaa agttatgcaa actaaacgga atccctccac ttgaactagg ggactgtagc 240
attgccggat ggctccttgg aaatccagaa tgtgataggc ttctaagtgt gccagaatgg 300
tcctatataa tggagaaaga aaacccgaga gacggtttgt gttatccagg cagcttcaat 360
gattatgaag aattgaaaca tctcctcagc agcgtgaaac atttcgagaa agtaaagatt 420
ctgcccaaag atagatggac acagcataca acaactggag gttcacgggc ctgcgcggtg 480
tctggtaatc catcattctt caggaacatg gtctggctga caaagaaaga atcaaattat 540
ccggttgcca aaggatcgta caacaataca agcggagaac aaatgctaat aatttggggg 600
gtgcaccatc ccaatgatga gacagaacaa agaacattgt accagaatgt gggaacctat 660
gtttccgtag gcacatcaac attgaacaaa aggtcaaccc cagacatagc aacaaggcct 720
aaagtgaatg gactaggaag tagaatggag ttctcttgga ccctattgga tatgtgggac 780
accataaatt ttgagagtac tggtaatcta attgcaccag agtatggatt caaaatatcg 840
aaaagaggta gttcagggat catgaaaaca gaaggaacac ttgagaactg tgagaccaaa 900
tgccaaactc ctttgggagc aataaataca acattgcctt ttcacaatgt ccacccactg 960
acaataggtg agtgccccaa atatgtaaaa tcggagaagt tggtcttagc aacaggacta 1020
aggaatgttc cccagattga atcaagagga ttgtttgggg caatagctgg ttttatagaa 1080
ggaggatggc aaggaatggt tgatggttgg tatggatacc atcacagcaa tgaccaggga 1140
tcagggtatg cagcagacaa agaatccact caaaaggcat ttgatggaat caccaacaag 1200
gtaaattctg tgattgaaaa gatgaacacc caatttgaag ctgttgggaa agagttcagt 1260
aacttagaga gaagactgga gaacttgaac aaaaagatgg aagacgggtt tctagatgtg 1320
tggacataca atgctgagct tctagttctg atggaaaatg agaggacact tgactttcat 1380
gattctaatg tcaagaatct gtatgataaa gtcagaatgc agctgagaga caacgtcaaa 1440
gaactaggaa atggatgttt tgaattttat cacaaatgtg atgatgaatg catgaatagt 1500
gtgaaaaacg ggacgtatga ttatcccaag tatgaagaag agtctaaact aaatagaaat 1560
gaaatcaaag gggtaaaatt gagcagcatg ggggtttatc aaatccttgc catttatgct 1620
acagtagcag gttctctgtc actggcaatc atgatggctg ggatctcttt ctggatgtgc 1680
tccaacgggt ctctgcagtg caggatctgc atatga 1716
<210> 129
<211> 3471
<212> DNA
<213> Artificial sequence
<220>
<223> Expression cassette number 2220
<400> 129
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccaatacc gcggagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1320
tcttgtgttg gttccttctc agatcttcgc ggaccaaata tgcattggat accatgccaa 1380
taattccaca gagaaggtcg acacaattct agagcggaac gtcactgtga ctcatgccaa 1440
ggacattctt gagaagaccc ataacggaaa gttatgcaaa ctaaacggaa tccctccact 1500
tgaactaggg gactgtagca ttgccggatg gctccttgga aatccagaat gtgataggct 1560
tctaagtgtg ccagaatggt cctatataat ggagaaagaa aacccgagag acggtttgtg 1620
ttatccaggc agcttcaatg attatgaaga attgaaacat ctcctcagca gcgtgaaaca 1680
tttcgagaaa gtaaagattc tgcccaaaga tagatggaca cagcatacaa caactggagg 1740
ttcacgggcc tgcgcggtgt ctggtaatcc atcattcttc aggaacatgg tctggctgac 1800
aaagaaagaa tcaaattatc cggttgccaa aggatcgtac aacaatacaa gcggagaaca 1860
aatgctaata atttgggggg tgcaccatcc caatgatgag acagaacaaa gaacattgta 1920
ccagaatgtg ggaacctatg tttccgtagg cacatcaaca ttgaacaaaa ggtcaacccc 1980
agacatagca acaaggccta aagtgaatgg actaggaagt agaatggagt tctcttggac 2040
cctattggat atgtgggaca ccataaattt tgagagtact ggtaatctaa ttgcaccaga 2100
gtatggattc aaaatatcga aaagaggtag ttcagggatc atgaaaacag aaggaacact 2160
tgagaactgt gagaccaaat gccaaactcc tttgggagca ataaatacaa cattgccttt 2220
tcacaatgtc cacccactga caataggtga gtgccccaaa tatgtaaaat cggagaagtt 2280
ggtcttagca acaggactaa ggaatgttcc ccagattgaa tcaagaggat tgtttggggc 2340
aatagctggt tttatagaag gaggatggca aggaatggtt gatggttggt atggatacca 2400
tcacagcaat gaccagggat cagggtatgc agcagacaaa gaatccactc aaaaggcatt 2460
tgatggaatc accaacaagg taaattctgt gattgaaaag atgaacaccc aatttgaagc 2520
tgttgggaaa gagttcagta acttagagag aagactggag aacttgaaca aaaagatgga 2580
agacgggttt ctagatgtgt ggacatacaa tgctgagctt ctagttctga tggaaaatga 2640
gaggacactt gactttcatg attctaatgt caagaatctg tatgataaag tcagaatgca 2700
gctgagagac aacgtcaaag aactaggaaa tggatgtttt gaattttatc acaaatgtga 2760
tgatgaatgc atgaatagtg tgaaaaacgg gacgtatgat tatcccaagt atgaagaaga 2820
gtctaaacta aatagaaatg aaatcaaagg ggtaaaattg agcagcatgg gggtttatca 2880
aatccttgcc atttatgcta cagtagcagg ttctctgtca ctggcaatca tgatggctgg 2940
gatctctttc tggatgtgct ccaacgggtc tctgcagtgc aggatctgca tatgaaggcc 3000
tattttcttt agtttgaatt tactgttatt cggtgtgcat ttctatgttt ggtgagcggt 3060
tttctgtgct cagagtgtgt ttattttatg taatttaatt tctttgtgag ctcctgttta 3120
gcaggtcgtc ccttcagcaa ggacacaaaa agattttaat tttattaaaa aaaaaaaaaa 3180
aaaagaccgg gaattcgata tcaagcttat cgacctgcag atcgttcaaa catttggcaa 3240
taaagtttct taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg 3300
ttgaattacg ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg 3360
gtttttatga ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag 3420
cgcgcaaact aggataaatt atcgcgcgcg gtgtcatcta tgttactaga t 3471
<210> 130
<211> 571
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H2 Singapore
<400> 130
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His
20 25 30
Ala Asn Asn Ser Thr Glu Lys Val Asp Thr Ile Leu Glu Arg Asn Val
35 40 45
Thr Val Thr His Ala Lys Asp Ile Leu Glu Lys Thr His Asn Gly Lys
50 55 60
Leu Cys Lys Leu Asn Gly Ile Pro Pro Leu Glu Leu Gly Asp Cys Ser
65 70 75 80
Ile Ala Gly Trp Leu Leu Gly Asn Pro Glu Cys Asp Arg Leu Leu Ser
85 90 95
Val Pro Glu Trp Ser Tyr Ile Met Glu Lys Glu Asn Pro Arg Asp Gly
100 105 110
Leu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu
115 120 125
Leu Ser Ser Val Lys His Phe Glu Lys Val Lys Ile Leu Pro Lys Asp
130 135 140
Arg Trp Thr Gln His Thr Thr Thr Gly Gly Ser Arg Ala Cys Ala Val
145 150 155 160
Ser Gly Asn Pro Ser Phe Phe Arg Asn Met Val Trp Leu Thr Lys Lys
165 170 175
Glu Ser Asn Tyr Pro Val Ala Lys Gly Ser Tyr Asn Asn Thr Ser Gly
180 185 190
Glu Gln Met Leu Ile Ile Trp Gly Val His His Pro Asn Asp Glu Thr
195 200 205
Glu Gln Arg Thr Leu Tyr Gln Asn Val Gly Thr Tyr Val Ser Val Gly
210 215 220
Thr Ser Thr Leu Asn Lys Arg Ser Thr Pro Asp Ile Ala Thr Arg Pro
225 230 235 240
Lys Val Asn Gly Leu Gly Ser Arg Met Glu Phe Ser Trp Thr Leu Leu
245 250 255
Asp Met Trp Asp Thr Ile Asn Phe Glu Ser Thr Gly Asn Leu Ile Ala
260 265 270
Pro Glu Tyr Gly Phe Lys Ile Ser Lys Arg Gly Ser Ser Gly Ile Met
275 280 285
Lys Thr Glu Gly Thr Leu Glu Asn Cys Glu Thr Lys Cys Gln Thr Pro
290 295 300
Leu Gly Ala Ile Asn Thr Thr Leu Pro Phe His Asn Val His Pro Leu
305 310 315 320
Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Glu Lys Leu Val Leu
325 330 335
Ala Thr Gly Leu Arg Asn Val Pro Gln Ile Glu Ser Arg Gly Leu Phe
340 345 350
Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp
355 360 365
Gly Trp Tyr Gly Tyr His His Ser Asn Asp Gln Gly Ser Gly Tyr Ala
370 375 380
Ala Asp Lys Glu Ser Thr Gln Lys Ala Phe Asp Gly Ile Thr Asn Lys
385 390 395 400
Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Glu Ala Val Gly
405 410 415
Lys Glu Phe Ser Asn Leu Glu Arg Arg Leu Glu Asn Leu Asn Lys Lys
420 425 430
Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu
435 440 445
Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val
450 455 460
Lys Asn Leu Tyr Asp Lys Val Arg Met Gln Leu Arg Asp Asn Val Lys
465 470 475 480
Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asp Glu
485 490 495
Cys Met Asn Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Glu
500 505 510
Glu Glu Ser Lys Leu Asn Arg Asn Glu Ile Lys Gly Val Lys Leu Ser
515 520 525
Ser Met Gly Val Tyr Gln Ile Leu Ala Ile Tyr Ala Thr Val Ala Gly
530 535 540
Ser Leu Ser Leu Ala Ile Met Met Ala Gly Ile Ser Phe Trp Met Cys
545 550 555 560
Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570
<210> 131
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H2S157(Prl-).r
<400> 131
tgccatcctc cgccgggaac attccttagt cctgttgcta agaccaac 48
<210> 132
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> H2S157(Prl-).c
<400> 132
aggaatgttc ccggcggagg atggcaagga atggttgatg gttggtatgg 50
<210> 133
<211> 3426
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 2221
<400> 133
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccaatacc gcggagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1320
tcttgtgttg gttccttctc agatcttcgc ggaccaaata tgcattggat accatgccaa 1380
taattccaca gagaaggtcg acacaattct agagcggaac gtcactgtga ctcatgccaa 1440
ggacattctt gagaagaccc ataacggaaa gttatgcaaa ctaaacggaa tccctccact 1500
tgaactaggg gactgtagca ttgccggatg gctccttgga aatccagaat gtgataggct 1560
tctaagtgtg ccagaatggt cctatataat ggagaaagaa aacccgagag acggtttgtg 1620
ttatccaggc agcttcaatg attatgaaga attgaaacat ctcctcagca gcgtgaaaca 1680
tttcgagaaa gtaaagattc tgcccaaaga tagatggaca cagcatacaa caactggagg 1740
ttcacgggcc tgcgcggtgt ctggtaatcc atcattcttc aggaacatgg tctggctgac 1800
aaagaaagaa tcaaattatc cggttgccaa aggatcgtac aacaatacaa gcggagaaca 1860
aatgctaata atttgggggg tgcaccatcc caatgatgag acagaacaaa gaacattgta 1920
ccagaatgtg ggaacctatg tttccgtagg cacatcaaca ttgaacaaaa ggtcaacccc 1980
agacatagca acaaggccta aagtgaatgg actaggaagt agaatggagt tctcttggac 2040
cctattggat atgtgggaca ccataaattt tgagagtact ggtaatctaa ttgcaccaga 2100
gtatggattc aaaatatcga aaagaggtag ttcagggatc atgaaaacag aaggaacact 2160
tgagaactgt gagaccaaat gccaaactcc tttgggagca ataaatacaa cattgccttt 2220
tcacaatgtc cacccactga caataggtga gtgccccaaa tatgtaaaat cggagaagtt 2280
ggtcttagca acaggactaa ggaatgttcc cggcggagga tggcaaggaa tggttgatgg 2340
ttggtatgga taccatcaca gcaatgacca gggatcaggg tatgcagcag acaaagaatc 2400
cactcaaaag gcatttgatg gaatcaccaa caaggtaaat tctgtgattg aaaagatgaa 2460
cacccaattt gaagctgttg ggaaagagtt cagtaactta gagagaagac tggagaactt 2520
gaacaaaaag atggaagacg ggtttctaga tgtgtggaca tacaatgctg agcttctagt 2580
tctgatggaa aatgagagga cacttgactt tcatgattct aatgtcaaga atctgtatga 2640
taaagtcaga atgcagctga gagacaacgt caaagaacta ggaaatggat gttttgaatt 2700
ttatcacaaa tgtgatgatg aatgcatgaa tagtgtgaaa aacgggacgt atgattatcc 2760
caagtatgaa gaagagtcta aactaaatag aaatgaaatc aaaggggtaa aattgagcag 2820
catgggggtt tatcaaatcc ttgccattta tgctacagta gcaggttctc tgtcactggc 2880
aatcatgatg gctgggatct ctttctggat gtgctccaac gggtctctgc agtgcaggat 2940
ctgcatatga aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta 3000
tgtttggtga gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt 3060
gtgagctcct gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat 3120
taaaaaaaaa aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt 3180
tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 3240
atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 3300
ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 3360
gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 3420
ctagat 3426
<210> 134
<211> 556
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H2 Singapore with deleted
proteolytic loop
<400> 134
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His
20 25 30
Ala Asn Asn Ser Thr Glu Lys Val Asp Thr Ile Leu Glu Arg Asn Val
35 40 45
Thr Val Thr His Ala Lys Asp Ile Leu Glu Lys Thr His Asn Gly Lys
50 55 60
Leu Cys Lys Leu Asn Gly Ile Pro Pro Leu Glu Leu Gly Asp Cys Ser
65 70 75 80
Ile Ala Gly Trp Leu Leu Gly Asn Pro Glu Cys Asp Arg Leu Leu Ser
85 90 95
Val Pro Glu Trp Ser Tyr Ile Met Glu Lys Glu Asn Pro Arg Asp Gly
100 105 110
Leu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu
115 120 125
Leu Ser Ser Val Lys His Phe Glu Lys Val Lys Ile Leu Pro Lys Asp
130 135 140
Arg Trp Thr Gln His Thr Thr Thr Gly Gly Ser Arg Ala Cys Ala Val
145 150 155 160
Ser Gly Asn Pro Ser Phe Phe Arg Asn Met Val Trp Leu Thr Lys Lys
165 170 175
Glu Ser Asn Tyr Pro Val Ala Lys Gly Ser Tyr Asn Asn Thr Ser Gly
180 185 190
Glu Gln Met Leu Ile Ile Trp Gly Val His His Pro Asn Asp Glu Thr
195 200 205
Glu Gln Arg Thr Leu Tyr Gln Asn Val Gly Thr Tyr Val Ser Val Gly
210 215 220
Thr Ser Thr Leu Asn Lys Arg Ser Thr Pro Asp Ile Ala Thr Arg Pro
225 230 235 240
Lys Val Asn Gly Leu Gly Ser Arg Met Glu Phe Ser Trp Thr Leu Leu
245 250 255
Asp Met Trp Asp Thr Ile Asn Phe Glu Ser Thr Gly Asn Leu Ile Ala
260 265 270
Pro Glu Tyr Gly Phe Lys Ile Ser Lys Arg Gly Ser Ser Gly Ile Met
275 280 285
Lys Thr Glu Gly Thr Leu Glu Asn Cys Glu Thr Lys Cys Gln Thr Pro
290 295 300
Leu Gly Ala Ile Asn Thr Thr Leu Pro Phe His Asn Val His Pro Leu
305 310 315 320
Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Glu Lys Leu Val Leu
325 330 335
Ala Thr Gly Leu Arg Asn Val Pro Gly Gly Gly Trp Gln Gly Met Val
340 345 350
Asp Gly Trp Tyr Gly Tyr His His Ser Asn Asp Gln Gly Ser Gly Tyr
355 360 365
Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Phe Asp Gly Ile Thr Asn
370 375 380
Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Glu Ala Val
385 390 395 400
Gly Lys Glu Phe Ser Asn Leu Glu Arg Arg Leu Glu Asn Leu Asn Lys
405 410 415
Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu
420 425 430
Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn
435 440 445
Val Lys Asn Leu Tyr Asp Lys Val Arg Met Gln Leu Arg Asp Asn Val
450 455 460
Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asp
465 470 475 480
Glu Cys Met Asn Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr
485 490 495
Glu Glu Glu Ser Lys Leu Asn Arg Asn Glu Ile Lys Gly Val Lys Leu
500 505 510
Ser Ser Met Gly Val Tyr Gln Ile Leu Ala Ile Tyr Ala Thr Val Ala
515 520 525
Gly Ser Leu Ser Leu Ala Ile Met Met Ala Gly Ile Ser Phe Trp Met
530 535 540
Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
545 550 555
<210> 135
<211> 3120
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 2222
<400> 135
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaggg cccaataccg cggagaaaat ggcgaaaaac gttgcgattt tcggcttatt 960
gttttctctt cttgtgttgg ttccttctca gatcttcgcg gaccaaatat gcattggata 1020
ccatgccaat aattccacag agaaggtcga cacaattcta gagcggaacg tcactgtgac 1080
tcatgccaag gacattcttg agaagaccca taacggaaag ttatgcaaac taaacggaat 1140
ccctccactt gaactagggg actgtagcat tgccggatgg ctccttggaa atccagaatg 1200
tgataggctt ctaagtgtgc cagaatggtc ctatataatg gagaaagaaa acccgagaga 1260
cggtttgtgt tatccaggca gcttcaatga ttatgaagaa ttgaaacatc tcctcagcag 1320
cgtgaaacat ttcgagaaag taaagattct gcccaaagat agatggacac agcatacaac 1380
aactggaggt tcacgggcct gcgcggtgtc tggtaatcca tcattcttca ggaacatggt 1440
ctggctgaca aagaaagaat caaattatcc ggttgccaaa ggatcgtaca acaatacaag 1500
cggagaacaa atgctaataa tttggggggt gcaccatccc aatgatgaga cagaacaaag 1560
aacattgtac cagaatgtgg gaacctatgt ttccgtaggc acatcaacat tgaacaaaag 1620
gtcaacccca gacatagcaa caaggcctaa agtgaatgga ctaggaagta gaatggagtt 1680
ctcttggacc ctattggata tgtgggacac cataaatttt gagagtactg gtaatctaat 1740
tgcaccagag tatggattca aaatatcgaa aagaggtagt tcagggatca tgaaaacaga 1800
aggaacactt gagaactgtg agaccaaatg ccaaactcct ttgggagcaa taaatacaac 1860
attgcctttt cacaatgtcc acccactgac aataggtgag tgccccaaat atgtaaaatc 1920
ggagaagttg gtcttagcaa caggactaag gaatgttccc cagattgaat caagaggatt 1980
gtttggggca atagctggtt ttatagaagg aggatggcaa ggaatggttg atggttggta 2040
tggataccat cacagcaatg accagggatc agggtatgca gcagacaaag aatccactca 2100
aaaggcattt gatggaatca ccaacaaggt aaattctgtg attgaaaaga tgaacaccca 2160
atttgaagct gttgggaaag agttcagtaa cttagagaga agactggaga acttgaacaa 2220
aaagatggaa gacgggtttc tagatgtgtg gacatacaat gctgagcttc tagttctgat 2280
ggaaaatgag aggacacttg actttcatga ttctaatgtc aagaatctgt atgataaagt 2340
cagaatgcag ctgagagaca acgtcaaaga actaggaaat ggatgttttg aattttatca 2400
caaatgtgat gatgaatgca tgaatagtgt gaaaaacggg acgtatgatt atcccaagta 2460
tgaagaagag tctaaactaa atagaaatga aatcaaaggg gtaaaattga gcagcatggg 2520
ggtttatcaa atccttgcca tttatgctac agtagcaggt tctctgtcac tggcaatcat 2580
gatggctggg atctctttct ggatgtgctc caacgggtct ctgcagtgca ggatctgcat 2640
atgaaggcct attttcttta gtttgaattt actgttattc ggtgtgcatt tctatgtttg 2700
gtgagcggtt ttctgtgctc agagtgtgtt tattttatgt aatttaattt ctttgtgagc 2760
tcctgtttag caggtcgtcc cttcagcaag gacacaaaaa gattttaatt ttattaaaaa 2820
aaaaaaaaaa aaagaccggg aattcgatat caagcttatc gacctgcaga tcgttcaaac 2880
atttggcaat aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata 2940
taatttctgt tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt 3000
atgagatggg tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac 3060
aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat 3120
<210> 136
<211> 3075
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 2223
<400> 136
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaggg cccaataccg cggagaaaat ggcgaaaaac gttgcgattt tcggcttatt 960
gttttctctt cttgtgttgg ttccttctca gatcttcgcg gaccaaatat gcattggata 1020
ccatgccaat aattccacag agaaggtcga cacaattcta gagcggaacg tcactgtgac 1080
tcatgccaag gacattcttg agaagaccca taacggaaag ttatgcaaac taaacggaat 1140
ccctccactt gaactagggg actgtagcat tgccggatgg ctccttggaa atccagaatg 1200
tgataggctt ctaagtgtgc cagaatggtc ctatataatg gagaaagaaa acccgagaga 1260
cggtttgtgt tatccaggca gcttcaatga ttatgaagaa ttgaaacatc tcctcagcag 1320
cgtgaaacat ttcgagaaag taaagattct gcccaaagat agatggacac agcatacaac 1380
aactggaggt tcacgggcct gcgcggtgtc tggtaatcca tcattcttca ggaacatggt 1440
ctggctgaca aagaaagaat caaattatcc ggttgccaaa ggatcgtaca acaatacaag 1500
cggagaacaa atgctaataa tttggggggt gcaccatccc aatgatgaga cagaacaaag 1560
aacattgtac cagaatgtgg gaacctatgt ttccgtaggc acatcaacat tgaacaaaag 1620
gtcaacccca gacatagcaa caaggcctaa agtgaatgga ctaggaagta gaatggagtt 1680
ctcttggacc ctattggata tgtgggacac cataaatttt gagagtactg gtaatctaat 1740
tgcaccagag tatggattca aaatatcgaa aagaggtagt tcagggatca tgaaaacaga 1800
aggaacactt gagaactgtg agaccaaatg ccaaactcct ttgggagcaa taaatacaac 1860
attgcctttt cacaatgtcc acccactgac aataggtgag tgccccaaat atgtaaaatc 1920
ggagaagttg gtcttagcaa caggactaag gaatgttccc ggcggaggat ggcaaggaat 1980
ggttgatggt tggtatggat accatcacag caatgaccag ggatcagggt atgcagcaga 2040
caaagaatcc actcaaaagg catttgatgg aatcaccaac aaggtaaatt ctgtgattga 2100
aaagatgaac acccaatttg aagctgttgg gaaagagttc agtaacttag agagaagact 2160
ggagaacttg aacaaaaaga tggaagacgg gtttctagat gtgtggacat acaatgctga 2220
gcttctagtt ctgatggaaa atgagaggac acttgacttt catgattcta atgtcaagaa 2280
tctgtatgat aaagtcagaa tgcagctgag agacaacgtc aaagaactag gaaatggatg 2340
ttttgaattt tatcacaaat gtgatgatga atgcatgaat agtgtgaaaa acgggacgta 2400
tgattatccc aagtatgaag aagagtctaa actaaataga aatgaaatca aaggggtaaa 2460
attgagcagc atgggggttt atcaaatcct tgccatttat gctacagtag caggttctct 2520
gtcactggca atcatgatgg ctgggatctc tttctggatg tgctccaacg ggtctctgca 2580
gtgcaggatc tgcatatgaa ggcctatttt ctttagtttg aatttactgt tattcggtgt 2640
gcatttctat gtttggtgag cggttttctg tgctcagagt gtgtttattt tatgtaattt 2700
aatttctttg tgagctcctg tttagcaggt cgtcccttca gcaaggacac aaaaagattt 2760
taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct 2820
gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 2880
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 2940
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 3000
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 3060
tctatgttac tagat 3075
<210> 137
<211> 1725
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H3 Perth
<400> 137
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cgcaaaaact tcctggaaat gacaacagca cggcaacgct gtgccttggg 120
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 180
actaatgcta ctgagctggt tcagagttcc tcaacaggtg aaatatgcga cagtcctcat 240
cagatccttg atggaaaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300
gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 360
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420
acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagc 480
tctgcttgca taaggagatc taaaaacagt ttctttagta gattgaattg gttgacccac 540
ttaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600
ttgtacattt ggggggttca ccacccgggt acggacaaag accaaatctt cctgtatgct 660
caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaaccgt aagcccgaat 720
atcggatcta gacccagagt aaggaatatc cctagcagaa taagcatcta ttggacaata 780
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900
tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960
gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1020
gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1080
ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140
aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200
atcaatggga agctgaatag attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260
aaagaattct cagaagtcga agggagaatt caggaccttg agaaatatgt tgaggacact 1320
aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380
attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440
gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500
tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta 1560
aacaaccggt ttcagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620
tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680
tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttga 1725
<210> 138
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> IF**-H3P1609.S1-6r
<400> 138
actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgcctt 50
<210> 139
<211> 574
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H3 Perth
<400> 139
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn
20 25 30
Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr
35 40 45
Ile Val Lys Thr Ile Thr Asn Asp Gln Ile Glu Val Thr Asn Ala Thr
50 55 60
Glu Leu Val Gln Ser Ser Ser Thr Gly Glu Ile Cys Asp Ser Pro His
65 70 75 80
Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly
85 90 95
Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val
100 105 110
Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp
115 120 125
Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe
130 135 140
Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser
145 150 155 160
Ser Ala Cys Ile Arg Arg Ser Lys Asn Ser Phe Phe Ser Arg Leu Asn
165 170 175
Trp Leu Thr His Leu Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met
180 185 190
Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His
195 200 205
Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ala Ser Gly
210 215 220
Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Thr Val Ser Pro Asn
225 230 235 240
Ile Gly Ser Arg Pro Arg Val Arg Asn Ile Pro Ser Arg Ile Ser Ile
245 250 255
Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr
260 265 270
Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys
275 280 285
Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Asn Ser Glu
290 295 300
Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn
305 310 315 320
Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Asn
325 330 335
Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr
340 345 350
Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu
355 360 365
Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly
370 375 380
Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln
385 390 395 400
Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe
405 410 415
His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp
420 425 430
Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn
435 440 445
Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr
450 455 460
Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg
465 470 475 480
Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys
485 490 495
Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His
500 505 510
Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly
515 520 525
Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe
530 535 540
Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met
545 550 555 560
Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile
565 570
<210> 140
<211> 1680
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H3 Perth with deleted proteolytic
loop
<400> 140
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cgcaaaaact tcctggaaat gacaacagca cggcaacgct gtgccttggg 120
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 180
actaatgcta ctgagctggt tcagagttcc tcaacaggtg aaatatgcga cagtcctcat 240
cagatccttg atggaaaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300
gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 360
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420
acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagc 480
tctgcttgca taaggagatc taaaaacagt ttctttagta gattgaattg gttgacccac 540
ttaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600
ttgtacattt ggggggttca ccacccgggt acggacaaag accaaatctt cctgtatgct 660
caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaaccgt aagcccgaat 720
atcggatcta gacccagagt aaggaatatc cctagcagaa taagcatcta ttggacaata 780
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900
tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960
gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1020
gcaacaggga tgcgaaatgt accaggcgga ggttgggagg gaatggtgga tggttggtac 1080
ggtttcaggc atcaaaattc tgagggaaga ggacaagcag cagatctcaa aagcactcaa 1140
gcagcaatcg atcaaatcaa tgggaagctg aatagattga tcgggaaaac caacgagaaa 1200
ttccatcaga ttgaaaaaga attctcagaa gtcgaaggga gaattcagga ccttgagaaa 1260
tatgttgagg acactaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 1320
gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaaaaaca 1380
aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 1440
aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca cgatgtatac 1500
agagatgaag cattaaacaa ccggtttcag atcaagggag ttgagctgaa gtcagggtac 1560
aaagattgga tcctatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 1620
ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga 1680
<210> 141
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H3P1609(Prl-)#2.r
<400> 141
ccctcccaac ctccgcctgg tacatttcgc atccctgttg ccaatttc 48
<210> 142
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H3P1609(Prl-)#2.c
<400> 142
aatgtaccag gcggaggttg ggagggaatg gtggatggtt ggtacggt 48
<210> 143
<211> 559
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H3 Perth with deleted proteolytic
loop
<400> 143
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn
20 25 30
Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr
35 40 45
Ile Val Lys Thr Ile Thr Asn Asp Gln Ile Glu Val Thr Asn Ala Thr
50 55 60
Glu Leu Val Gln Ser Ser Ser Thr Gly Glu Ile Cys Asp Ser Pro His
65 70 75 80
Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly
85 90 95
Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val
100 105 110
Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp
115 120 125
Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe
130 135 140
Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser
145 150 155 160
Ser Ala Cys Ile Arg Arg Ser Lys Asn Ser Phe Phe Ser Arg Leu Asn
165 170 175
Trp Leu Thr His Leu Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met
180 185 190
Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His
195 200 205
Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ala Ser Gly
210 215 220
Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Thr Val Ser Pro Asn
225 230 235 240
Ile Gly Ser Arg Pro Arg Val Arg Asn Ile Pro Ser Arg Ile Ser Ile
245 250 255
Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr
260 265 270
Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys
275 280 285
Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Asn Ser Glu
290 295 300
Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn
305 310 315 320
Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Asn
325 330 335
Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Gly Gly Gly Trp
340 345 350
Glu Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu
355 360 365
Gly Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp
370 375 380
Gln Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys
385 390 395 400
Phe His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln
405 410 415
Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr
420 425 430
Asn Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu
435 440 445
Thr Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu
450 455 460
Arg Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His
465 470 475 480
Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp
485 490 495
His Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys
500 505 510
Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser
515 520 525
Phe Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile
530 535 540
Met Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile
545 550 555
<210> 144
<211> 1680
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H3 Victoria with deleted proteolytic
loop
<400> 144
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cgcaaaaact tcctggaaat gacaacagca cggcaacgct gtgccttggg 120
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 180
actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240
cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300
gatggcttcc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420
acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480
tctgcttgca taaggagatc taataatagt ttctttagta gattaaattg gttgacccac 540
ttaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600
ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660
caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720
atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900
tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960
gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020
gcaacaggaa tgcgaaatgt accaggcgga ggttgggagg gaatggtgga tggttggtac 1080
ggtttcaggc atcaaaattc tgagggaaga ggacaagcag cagatctcaa aagcactcaa 1140
gcagcaatcg atcaaatcaa tgggaagctg aatcgattga tcgggaaaac caacgagaaa 1200
ttccatcaga ttgaaaaaga attctcagaa gtcgaaggga gaattcagga ccttgagaaa 1260
tatgttgagg acactaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 1320
gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaaaaaca 1380
aagaagcaac taagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 1440
aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca cgatgtatac 1500
agagatgaag cattaaacaa ccggttccag atcaagggag ttgagctgaa gtcagggtac 1560
aaagattgga tcctatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 1620
ttggggttca tcatgtgggc ctgccaaaag ggcaacatta ggtgcaacat ttgcatttga 1680
<210> 145
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H3V36111(Prl-).r
<400> 145
ccctcccaac ctccgcctgg tacatttcgc attcctgttg ccaatttc 48
<210> 146
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H3V36111(Prl-).c
<400> 146
aatgtaccag gcggaggttg ggagggaatg gtggatggtt ggtacggt 48
<210> 147
<211> 559
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H3 Victoria with deleted proteolytic
loop
<400> 147
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn
20 25 30
Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr
35 40 45
Ile Val Lys Thr Ile Thr Asn Asp Gln Ile Glu Val Thr Asn Ala Thr
50 55 60
Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His
65 70 75 80
Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly
85 90 95
Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val
100 105 110
Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp
115 120 125
Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe
130 135 140
Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser
145 150 155 160
Ser Ala Cys Ile Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu Asn
165 170 175
Trp Leu Thr His Leu Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met
180 185 190
Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His
195 200 205
Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly
210 215 220
Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn
225 230 235 240
Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile
245 250 255
Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr
260 265 270
Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys
275 280 285
Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Asn Ser Glu
290 295 300
Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn
305 310 315 320
Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser
325 330 335
Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Gly Gly Gly Trp
340 345 350
Glu Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu
355 360 365
Gly Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp
370 375 380
Gln Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys
385 390 395 400
Phe His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln
405 410 415
Asp Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr
420 425 430
Asn Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu
435 440 445
Thr Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu
450 455 460
Arg Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His
465 470 475 480
Lys Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp
485 490 495
His Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys
500 505 510
Gly Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser
515 520 525
Phe Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile
530 535 540
Met Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile
545 550 555
<210> 148
<211> 1701
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H7 Hangzhou
<400> 148
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggacaaaat ctgcctcgga catcatgccg tgtcaaacgg aaccaaagta 120
aacacattaa ctgaaagagg agtggaagtc gtcaatgcaa ctgaaacagt ggaacgaaca 180
aacatcccca ggatctgctc aaaagggaaa aggacagttg acctcggtca atgtggactc 240
ctggggacaa tcactggacc acctcaatgt gaccaattcc tagaattttc agccgattta 300
attattgaga ggcgagaagg aagtgatgtc tgttatcctg ggaaattcgt gaatgaagaa 360
gctctgaggc aaattctcag agaatcaggc ggaattgaca aggaagcaat gggattcaca 420
tacagtggaa taagaactaa tggagcaacc agtgcatgta ggagatcagg atcttcattc 480
tatgcagaaa tgaaatggct cctgtcaaac acagataatg ctgcattccc gcagatgact 540
aagtcatata aaaatacaag aaaaagccca gctctaatag tatgggggat ccatcattcc 600
gtatcaactg cagagcaaac caagctatat gggagtggaa acaaactggt gacagttggg 660
agttctaatt atcaacaatc ttttgtaccg agtccaggag cgagaccaca agttaatggt 720
atatctggaa gaattgactt tcattggcta atgctaaatc ccaatgatac agtcactttc 780
agtttcaatg gggctttcat agctccagac cgtgcaagct tcctgagagg aaaatctatg 840
ggaatccaga gtggagtaca ggttgatgcc aattgtgaag gggactgcta tcatagtgga 900
gggacaataa taagtaactt gccatttcag aacatagata gcagggcagt tggaaaatgt 960
ccgagatatg ttaagcaaag gagtctgctg ctagcaacag ggatgaagaa tgttcctgag 1020
attccaaagg gaagaggcct atttggtgct atagcgggtt tcattgaaaa tggatgggaa 1080
ggcctaattg atggttggta tggtttcaga caccagaatg cacagggaga gggaactgct 1140
gcagattaca aaagcactca atcggcaatt gatcaaataa caggaaaatt aaaccggctt 1200
atagaaaaaa ccaaccaaca atttgagttg atcgacaatg aattcaatga ggtagagaag 1260
caaatcggta atgtgataaa ttggaccaga gattctataa cagaagtgtg gtcatacaat 1320
gctgaactct tggtagcaat ggagaaccag catacaattg atctggctga ttcagaaatg 1380
gacaaactgt acgaacgagt gaaaagacag ctgagagaga atgctgaaga agatggcact 1440
ggttgctttg aaatatttca caagtgtgat gatgactgta tggccagtat tagaaataac 1500
acctatgatc acagcaaata cagggaagag gcaatgcaaa atagaataca gattgaccca 1560
gtcaaactaa gcagcggcta caaagatgtg atactttggt ttagcttcgg ggcatcatgt 1620
ttcatacttc tagccattgt aatgggcctt gtcttcatat gtgtaaagaa tggaaacatg 1680
cggtgcacta tttgtatata a 1701
<210> 149
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> IF*-H7H113.s1-6r
<400> 149
actaaagaaa ataggccttt atatacaaat agtgcaccgc atgtttccat 50
<210> 150
<211> 566
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H7 Hangzhou
<400> 150
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Lys Ile Cys Leu Gly His His
20 25 30
Ala Val Ser Asn Gly Thr Lys Val Asn Thr Leu Thr Glu Arg Gly Val
35 40 45
Glu Val Val Asn Ala Thr Glu Thr Val Glu Arg Thr Asn Ile Pro Arg
50 55 60
Ile Cys Ser Lys Gly Lys Arg Thr Val Asp Leu Gly Gln Cys Gly Leu
65 70 75 80
Leu Gly Thr Ile Thr Gly Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe
85 90 95
Ser Ala Asp Leu Ile Ile Glu Arg Arg Glu Gly Ser Asp Val Cys Tyr
100 105 110
Pro Gly Lys Phe Val Asn Glu Glu Ala Leu Arg Gln Ile Leu Arg Glu
115 120 125
Ser Gly Gly Ile Asp Lys Glu Ala Met Gly Phe Thr Tyr Ser Gly Ile
130 135 140
Arg Thr Asn Gly Ala Thr Ser Ala Cys Arg Arg Ser Gly Ser Ser Phe
145 150 155 160
Tyr Ala Glu Met Lys Trp Leu Leu Ser Asn Thr Asp Asn Ala Ala Phe
165 170 175
Pro Gln Met Thr Lys Ser Tyr Lys Asn Thr Arg Lys Ser Pro Ala Leu
180 185 190
Ile Val Trp Gly Ile His His Ser Val Ser Thr Ala Glu Gln Thr Lys
195 200 205
Leu Tyr Gly Ser Gly Asn Lys Leu Val Thr Val Gly Ser Ser Asn Tyr
210 215 220
Gln Gln Ser Phe Val Pro Ser Pro Gly Ala Arg Pro Gln Val Asn Gly
225 230 235 240
Ile Ser Gly Arg Ile Asp Phe His Trp Leu Met Leu Asn Pro Asn Asp
245 250 255
Thr Val Thr Phe Ser Phe Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala
260 265 270
Ser Phe Leu Arg Gly Lys Ser Met Gly Ile Gln Ser Gly Val Gln Val
275 280 285
Asp Ala Asn Cys Glu Gly Asp Cys Tyr His Ser Gly Gly Thr Ile Ile
290 295 300
Ser Asn Leu Pro Phe Gln Asn Ile Asp Ser Arg Ala Val Gly Lys Cys
305 310 315 320
Pro Arg Tyr Val Lys Gln Arg Ser Leu Leu Leu Ala Thr Gly Met Lys
325 330 335
Asn Val Pro Glu Ile Pro Lys Gly Arg Gly Leu Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Asn Gly Trp Glu Gly Leu Ile Asp Gly Trp Tyr Gly
355 360 365
Phe Arg His Gln Asn Ala Gln Gly Glu Gly Thr Ala Ala Asp Tyr Lys
370 375 380
Ser Thr Gln Ser Ala Ile Asp Gln Ile Thr Gly Lys Leu Asn Arg Leu
385 390 395 400
Ile Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp Asn Glu Phe Asn
405 410 415
Glu Val Glu Lys Gln Ile Gly Asn Val Ile Asn Trp Thr Arg Asp Ser
420 425 430
Ile Thr Glu Val Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Met Glu
435 440 445
Asn Gln His Thr Ile Asp Leu Ala Asp Ser Glu Met Asp Lys Leu Tyr
450 455 460
Glu Arg Val Lys Arg Gln Leu Arg Glu Asn Ala Glu Glu Asp Gly Thr
465 470 475 480
Gly Cys Phe Glu Ile Phe His Lys Cys Asp Asp Asp Cys Met Ala Ser
485 490 495
Ile Arg Asn Asn Thr Tyr Asp His Ser Lys Tyr Arg Glu Glu Ala Met
500 505 510
Gln Asn Arg Ile Gln Ile Asp Pro Val Lys Leu Ser Ser Gly Tyr Lys
515 520 525
Asp Val Ile Leu Trp Phe Ser Phe Gly Ala Ser Cys Phe Ile Leu Leu
530 535 540
Ala Ile Val Met Gly Leu Val Phe Ile Cys Val Lys Asn Gly Asn Met
545 550 555 560
Arg Cys Thr Ile Cys Ile
565
<210> 151
<211> 1650
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H7 Hangzhou with deleted proteolytic
loop
<400> 151
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggacaaaat ctgcctcgga catcatgccg tgtcaaacgg aaccaaagta 120
aacacattaa ctgaaagagg agtggaagtc gtcaatgcaa ctgaaacagt ggaacgaaca 180
aacatcccca ggatctgctc aaaagggaaa aggacagttg acctcggtca atgtggactc 240
ctggggacaa tcactggacc acctcaatgt gaccaattcc tagaattttc agccgattta 300
attattgaga ggcgagaagg aagtgatgtc tgttatcctg ggaaattcgt gaatgaagaa 360
gctctgaggc aaattctcag agaatcaggc ggaattgaca aggaagcaat gggattcaca 420
tacagtggaa taagaactaa tggagcaacc agtgcatgta ggagatcagg atcttcattc 480
tatgcagaaa tgaaatggct cctgtcaaac acagataatg ctgcattccc gcagatgact 540
aagtcatata aaaatacaag aaaaagccca gctctaatag tatgggggat ccatcattcc 600
gtatcaactg cagagcaaac caagctatat gggagtggaa acaaactggt gacagttggg 660
agttctaatt atcaacaatc ttttgtaccg agtccaggag cgagaccaca agttaatggt 720
atatctggaa gaattgactt tcattggcta atgctaaatc ccaatgatac agtcactttc 780
agtttcaatg gggctttcat agctccagac cgtgcaagct tcctgagagg aaaatctatg 840
ggaatccaga gtggagtaca ggttgatgcc aattgtgaag gggactgcta tcatagtgga 900
gggacaataa taagtaactt gccatttcag aacatagata gcagggcagt tggaaaatgt 960
ccgagatatg ttaagcaaag gagtctgctg ctagcaacag ggatgaagaa tgttcctggc 1020
ggatgggaag gcctaattga tggttggtat ggtttcagac accagaatgc acagggagag 1080
ggaactgctg cagattacaa aagcactcaa tcggcaattg atcaaataac aggaaaatta 1140
aaccggctta tagaaaaaac caaccaacaa tttgagttga tcgacaatga attcaatgag 1200
gtagagaagc aaatcggtaa tgtgataaat tggaccagag attctataac agaagtgtgg 1260
tcatacaatg ctgaactctt ggtagcaatg gagaaccagc atacaattga tctggctgat 1320
tcagaaatgg acaaactgta cgaacgagtg aaaagacagc tgagagagaa tgctgaagaa 1380
gatggcactg gttgctttga aatatttcac aagtgtgatg atgactgtat ggccagtatt 1440
agaaataaca cctatgatca cagcaaatac agggaagagg caatgcaaaa tagaatacag 1500
attgacccag tcaaactaag cagcggctac aaagatgtga tactttggtt tagcttcggg 1560
gcatcatgtt tcatacttct agccattgta atgggccttg tcttcatatg tgtaaagaat 1620
ggaaacatgc ggtgcactat ttgtatataa 1650
<210> 152
<211> 49
<212> DNA
<213> Artificial sequence
<220>
<223> H7H113(PrL-).r
<400> 152
ccttcccatc cgccaggaac attcttcatc cctgttgcta gcagcagac 49
<210> 153
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H7H113(PrL-).c
<400> 153
agaatgttcc tggcggatgg gaaggcctaa ttgatggttg gtatggtt 48
<210> 154
<211> 549
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H7 Hangzhou with deleted proteolytic
loop
<400> 154
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Lys Ile Cys Leu Gly His His
20 25 30
Ala Val Ser Asn Gly Thr Lys Val Asn Thr Leu Thr Glu Arg Gly Val
35 40 45
Glu Val Val Asn Ala Thr Glu Thr Val Glu Arg Thr Asn Ile Pro Arg
50 55 60
Ile Cys Ser Lys Gly Lys Arg Thr Val Asp Leu Gly Gln Cys Gly Leu
65 70 75 80
Leu Gly Thr Ile Thr Gly Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe
85 90 95
Ser Ala Asp Leu Ile Ile Glu Arg Arg Glu Gly Ser Asp Val Cys Tyr
100 105 110
Pro Gly Lys Phe Val Asn Glu Glu Ala Leu Arg Gln Ile Leu Arg Glu
115 120 125
Ser Gly Gly Ile Asp Lys Glu Ala Met Gly Phe Thr Tyr Ser Gly Ile
130 135 140
Arg Thr Asn Gly Ala Thr Ser Ala Cys Arg Arg Ser Gly Ser Ser Phe
145 150 155 160
Tyr Ala Glu Met Lys Trp Leu Leu Ser Asn Thr Asp Asn Ala Ala Phe
165 170 175
Pro Gln Met Thr Lys Ser Tyr Lys Asn Thr Arg Lys Ser Pro Ala Leu
180 185 190
Ile Val Trp Gly Ile His His Ser Val Ser Thr Ala Glu Gln Thr Lys
195 200 205
Leu Tyr Gly Ser Gly Asn Lys Leu Val Thr Val Gly Ser Ser Asn Tyr
210 215 220
Gln Gln Ser Phe Val Pro Ser Pro Gly Ala Arg Pro Gln Val Asn Gly
225 230 235 240
Ile Ser Gly Arg Ile Asp Phe His Trp Leu Met Leu Asn Pro Asn Asp
245 250 255
Thr Val Thr Phe Ser Phe Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala
260 265 270
Ser Phe Leu Arg Gly Lys Ser Met Gly Ile Gln Ser Gly Val Gln Val
275 280 285
Asp Ala Asn Cys Glu Gly Asp Cys Tyr His Ser Gly Gly Thr Ile Ile
290 295 300
Ser Asn Leu Pro Phe Gln Asn Ile Asp Ser Arg Ala Val Gly Lys Cys
305 310 315 320
Pro Arg Tyr Val Lys Gln Arg Ser Leu Leu Leu Ala Thr Gly Met Lys
325 330 335
Asn Val Pro Gly Gly Trp Glu Gly Leu Ile Asp Gly Trp Tyr Gly Phe
340 345 350
Arg His Gln Asn Ala Gln Gly Glu Gly Thr Ala Ala Asp Tyr Lys Ser
355 360 365
Thr Gln Ser Ala Ile Asp Gln Ile Thr Gly Lys Leu Asn Arg Leu Ile
370 375 380
Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp Asn Glu Phe Asn Glu
385 390 395 400
Val Glu Lys Gln Ile Gly Asn Val Ile Asn Trp Thr Arg Asp Ser Ile
405 410 415
Thr Glu Val Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Met Glu Asn
420 425 430
Gln His Thr Ile Asp Leu Ala Asp Ser Glu Met Asp Lys Leu Tyr Glu
435 440 445
Arg Val Lys Arg Gln Leu Arg Glu Asn Ala Glu Glu Asp Gly Thr Gly
450 455 460
Cys Phe Glu Ile Phe His Lys Cys Asp Asp Asp Cys Met Ala Ser Ile
465 470 475 480
Arg Asn Asn Thr Tyr Asp His Ser Lys Tyr Arg Glu Glu Ala Met Gln
485 490 495
Asn Arg Ile Gln Ile Asp Pro Val Lys Leu Ser Ser Gly Tyr Lys Asp
500 505 510
Val Ile Leu Trp Phe Ser Phe Gly Ala Ser Cys Phe Ile Leu Leu Ala
515 520 525
Ile Val Met Gly Leu Val Phe Ile Cys Val Lys Asn Gly Asn Met Arg
530 535 540
Cys Thr Ile Cys Ile
545
<210> 155
<211> 1701
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H9 Hong Kong
<400> 155
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggataaaat ctgcatcggc caccagtcaa caaactccac agaaactgtg 120
gacacgctaa cagaaaccaa tgttcctgtg acacatgcca aagaattgct ccacacagag 180
cataatggaa tgctgtgtgc aacaagcctg ggacatcccc tcattctaga cacatgcact 240
attgaaggac tagtctatgg caacccttct tgtgacctgc tgttgggagg aagagaatgg 300
tcctacatcg tcgaaagatc atcagctgta aatggaacgt gttaccctgg gaatgtagaa 360
aacctagagg aactcaggac actttttagt tccgctagtt cctaccaaag aatccaaatc 420
ttcccagaca caacctggaa tgtgacttac actggaacaa gcagagcatg ttcaggttca 480
ttctacagga gtatgagatg gctgactcaa aagagcggtt tttaccctgt tcaagacgcc 540
caatacacaa ataacagggg aaagagcatt cttttcgtgt ggggcataca tcacccaccc 600
acctataccg agcaaacaaa tttgtacata agaaacgaca caacaacaag cgtgacaaca 660
gaagatttga ataggacctt caaaccagtg atagggccaa ggccccttgt caatggtctg 720
cagggaagaa ttgattatta ttggtcggta ctaaaaccag gccaaacatt gcgagtacga 780
tccaatggga atctaattgc tccatggtat ggacacgttc tttcaggagg gagccatgga 840
agaatcctga agactgattt aaaaggtggt aattgtgtag tgcaatgtca gactgaaaaa 900
ggtggcttaa acagtacatt gccattccac aatatcagta aatatgcatt tggaacctgc 960
cccaaatatg taagagttaa tagtctcaaa ctggcagtcg gtctgaggaa cgtgcctgct 1020
agatcaagta gaggactatt tggagccata gctggattca tagaaggagg ttggccagga 1080
ctagtcgctg gctggtatgg tttccagcat tcaaatgatc aaggggttgg tatggctgca 1140
gatagggatt caactcaaaa ggcaattgat aaaataacat ccaaggtgaa taatatagtc 1200
gacaagatga acaagcaata tgaaataatt gatcatgaat ttagtgaggt tgaaactaga 1260
ctcaatatga tcaataataa gattgatgac caaatacaag acgtatgggc atataatgca 1320
gaattgctag tactacttga aaatcaaaaa acactcgatg agcatgatgc gaacgtgaac 1380
aatctatata acaaggtgaa gagggcactg ggctccaatg ctatggaaga tgggaaaggc 1440
tgtttcgagc tataccataa atgtgatgat cagtgcatgg aaacaattcg gaacgggacc 1500
tataatagga gaaagtatag agaggaatca agactagaaa ggcagaaaat agagggggtt 1560
aagctggaat ctgagggaac ttacaaaatc ctcaccattt attcgactgt cgcctcatct 1620
cttgtgcttg caatggggtt tgctgccttc ctgttctggg ccatgtccaa tggatcttgc 1680
agatgcaaca tttgtatata a 1701
<210> 156
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> IF**-H9HK107399.S1-6r
<400> 156
actaaagaaa ataggccttt atatacaaat gttgcatctg caagatccat 50
<210> 157
<211> 566
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H9 Hong Kong
<400> 157
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Lys Ile Cys Ile Gly His Gln
20 25 30
Ser Thr Asn Ser Thr Glu Thr Val Asp Thr Leu Thr Glu Thr Asn Val
35 40 45
Pro Val Thr His Ala Lys Glu Leu Leu His Thr Glu His Asn Gly Met
50 55 60
Leu Cys Ala Thr Ser Leu Gly His Pro Leu Ile Leu Asp Thr Cys Thr
65 70 75 80
Ile Glu Gly Leu Val Tyr Gly Asn Pro Ser Cys Asp Leu Leu Leu Gly
85 90 95
Gly Arg Glu Trp Ser Tyr Ile Val Glu Arg Ser Ser Ala Val Asn Gly
100 105 110
Thr Cys Tyr Pro Gly Asn Val Glu Asn Leu Glu Glu Leu Arg Thr Leu
115 120 125
Phe Ser Ser Ala Ser Ser Tyr Gln Arg Ile Gln Ile Phe Pro Asp Thr
130 135 140
Thr Trp Asn Val Thr Tyr Thr Gly Thr Ser Arg Ala Cys Ser Gly Ser
145 150 155 160
Phe Tyr Arg Ser Met Arg Trp Leu Thr Gln Lys Ser Gly Phe Tyr Pro
165 170 175
Val Gln Asp Ala Gln Tyr Thr Asn Asn Arg Gly Lys Ser Ile Leu Phe
180 185 190
Val Trp Gly Ile His His Pro Pro Thr Tyr Thr Glu Gln Thr Asn Leu
195 200 205
Tyr Ile Arg Asn Asp Thr Thr Thr Ser Val Thr Thr Glu Asp Leu Asn
210 215 220
Arg Thr Phe Lys Pro Val Ile Gly Pro Arg Pro Leu Val Asn Gly Leu
225 230 235 240
Gln Gly Arg Ile Asp Tyr Tyr Trp Ser Val Leu Lys Pro Gly Gln Thr
245 250 255
Leu Arg Val Arg Ser Asn Gly Asn Leu Ile Ala Pro Trp Tyr Gly His
260 265 270
Val Leu Ser Gly Gly Ser His Gly Arg Ile Leu Lys Thr Asp Leu Lys
275 280 285
Gly Gly Asn Cys Val Val Gln Cys Gln Thr Glu Lys Gly Gly Leu Asn
290 295 300
Ser Thr Leu Pro Phe His Asn Ile Ser Lys Tyr Ala Phe Gly Thr Cys
305 310 315 320
Pro Lys Tyr Val Arg Val Asn Ser Leu Lys Leu Ala Val Gly Leu Arg
325 330 335
Asn Val Pro Ala Arg Ser Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Gly Gly Trp Pro Gly Leu Val Ala Gly Trp Tyr Gly Phe
355 360 365
Gln His Ser Asn Asp Gln Gly Val Gly Met Ala Ala Asp Arg Asp Ser
370 375 380
Thr Gln Lys Ala Ile Asp Lys Ile Thr Ser Lys Val Asn Asn Ile Val
385 390 395 400
Asp Lys Met Asn Lys Gln Tyr Glu Ile Ile Asp His Glu Phe Ser Glu
405 410 415
Val Glu Thr Arg Leu Asn Met Ile Asn Asn Lys Ile Asp Asp Gln Ile
420 425 430
Gln Asp Val Trp Ala Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn
435 440 445
Gln Lys Thr Leu Asp Glu His Asp Ala Asn Val Asn Asn Leu Tyr Asn
450 455 460
Lys Val Lys Arg Ala Leu Gly Ser Asn Ala Met Glu Asp Gly Lys Gly
465 470 475 480
Cys Phe Glu Leu Tyr His Lys Cys Asp Asp Gln Cys Met Glu Thr Ile
485 490 495
Arg Asn Gly Thr Tyr Asn Arg Arg Lys Tyr Arg Glu Glu Ser Arg Leu
500 505 510
Glu Arg Gln Lys Ile Glu Gly Val Lys Leu Glu Ser Glu Gly Thr Tyr
515 520 525
Lys Ile Leu Thr Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Ala
530 535 540
Met Gly Phe Ala Ala Phe Leu Phe Trp Ala Met Ser Asn Gly Ser Cys
545 550 555 560
Arg Cys Asn Ile Cys Ile
565
<210> 158
<211> 1656
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/H9 Hong Kong with deleted
proteolytic loop
<400> 158
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggataaaat ctgcatcggc caccagtcaa caaactccac agaaactgtg 120
gacacgctaa cagaaaccaa tgttcctgtg acacatgcca aagaattgct ccacacagag 180
cataatggaa tgctgtgtgc aacaagcctg ggacatcccc tcattctaga cacatgcact 240
attgaaggac tagtctatgg caacccttct tgtgacctgc tgttgggagg aagagaatgg 300
tcctacatcg tcgaaagatc atcagctgta aatggaacgt gttaccctgg gaatgtagaa 360
aacctagagg aactcaggac actttttagt tccgctagtt cctaccaaag aatccaaatc 420
ttcccagaca caacctggaa tgtgacttac actggaacaa gcagagcatg ttcaggttca 480
ttctacagga gtatgagatg gctgactcaa aagagcggtt tttaccctgt tcaagacgcc 540
caatacacaa ataacagggg aaagagcatt cttttcgtgt ggggcataca tcacccaccc 600
acctataccg agcaaacaaa tttgtacata agaaacgaca caacaacaag cgtgacaaca 660
gaagatttga ataggacctt caaaccagtg atagggccaa ggccccttgt caatggtctg 720
cagggaagaa ttgattatta ttggtcggta ctaaaaccag gccaaacatt gcgagtacga 780
tccaatggga atctaattgc tccatggtat ggacacgttc tttcaggagg gagccatgga 840
agaatcctga agactgattt aaaaggtggt aattgtgtag tgcaatgtca gactgaaaaa 900
ggtggcttaa acagtacatt gccattccac aatatcagta aatatgcatt tggaacctgc 960
cccaaatatg taagagttaa tagtctcaaa ctggcagtcg gtctgaggaa cgtgcctggc 1020
ggaggttggc caggactagt cgctggctgg tatggtttcc agcattcaaa tgatcaaggg 1080
gttggtatgg ctgcagatag ggattcaact caaaaggcaa ttgataaaat aacatccaag 1140
gtgaataata tagtcgacaa gatgaacaag caatatgaaa taattgatca tgaatttagt 1200
gaggttgaaa ctagactcaa tatgatcaat aataagattg atgaccaaat acaagacgta 1260
tgggcatata atgcagaatt gctagtacta cttgaaaatc aaaaaacact cgatgagcat 1320
gatgcgaacg tgaacaatct atataacaag gtgaagaggg cactgggctc caatgctatg 1380
gaagatggga aaggctgttt cgagctatac cataaatgtg atgatcagtg catggaaaca 1440
attcggaacg ggacctataa taggagaaag tatagagagg aatcaagact agaaaggcag 1500
aaaatagagg gggttaagct ggaatctgag ggaacttaca aaatcctcac catttattcg 1560
actgtcgcct catctcttgt gcttgcaatg gggtttgctg ccttcctgtt ctgggccatg 1620
tccaatggat cttgcagatg caacatttgt atataa 1656
<210> 159
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H9HK107399(Prl-).r
<400> 159
gtcctggcca acctccgcca ggcacgttcc tcagaccgac tgccagtt 48
<210> 160
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> H9HK107399(Prl-).c
<400> 160
ggaacgtgcc tggcggaggt tggccaggac tagtcgctgg ctggtatg 48
<210> 161
<211> 551
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/H9 Hong Kong with deleted
proteolytic loop
<400> 161
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Lys Ile Cys Ile Gly His Gln
20 25 30
Ser Thr Asn Ser Thr Glu Thr Val Asp Thr Leu Thr Glu Thr Asn Val
35 40 45
Pro Val Thr His Ala Lys Glu Leu Leu His Thr Glu His Asn Gly Met
50 55 60
Leu Cys Ala Thr Ser Leu Gly His Pro Leu Ile Leu Asp Thr Cys Thr
65 70 75 80
Ile Glu Gly Leu Val Tyr Gly Asn Pro Ser Cys Asp Leu Leu Leu Gly
85 90 95
Gly Arg Glu Trp Ser Tyr Ile Val Glu Arg Ser Ser Ala Val Asn Gly
100 105 110
Thr Cys Tyr Pro Gly Asn Val Glu Asn Leu Glu Glu Leu Arg Thr Leu
115 120 125
Phe Ser Ser Ala Ser Ser Tyr Gln Arg Ile Gln Ile Phe Pro Asp Thr
130 135 140
Thr Trp Asn Val Thr Tyr Thr Gly Thr Ser Arg Ala Cys Ser Gly Ser
145 150 155 160
Phe Tyr Arg Ser Met Arg Trp Leu Thr Gln Lys Ser Gly Phe Tyr Pro
165 170 175
Val Gln Asp Ala Gln Tyr Thr Asn Asn Arg Gly Lys Ser Ile Leu Phe
180 185 190
Val Trp Gly Ile His His Pro Pro Thr Tyr Thr Glu Gln Thr Asn Leu
195 200 205
Tyr Ile Arg Asn Asp Thr Thr Thr Ser Val Thr Thr Glu Asp Leu Asn
210 215 220
Arg Thr Phe Lys Pro Val Ile Gly Pro Arg Pro Leu Val Asn Gly Leu
225 230 235 240
Gln Gly Arg Ile Asp Tyr Tyr Trp Ser Val Leu Lys Pro Gly Gln Thr
245 250 255
Leu Arg Val Arg Ser Asn Gly Asn Leu Ile Ala Pro Trp Tyr Gly His
260 265 270
Val Leu Ser Gly Gly Ser His Gly Arg Ile Leu Lys Thr Asp Leu Lys
275 280 285
Gly Gly Asn Cys Val Val Gln Cys Gln Thr Glu Lys Gly Gly Leu Asn
290 295 300
Ser Thr Leu Pro Phe His Asn Ile Ser Lys Tyr Ala Phe Gly Thr Cys
305 310 315 320
Pro Lys Tyr Val Arg Val Asn Ser Leu Lys Leu Ala Val Gly Leu Arg
325 330 335
Asn Val Pro Gly Gly Gly Trp Pro Gly Leu Val Ala Gly Trp Tyr Gly
340 345 350
Phe Gln His Ser Asn Asp Gln Gly Val Gly Met Ala Ala Asp Arg Asp
355 360 365
Ser Thr Gln Lys Ala Ile Asp Lys Ile Thr Ser Lys Val Asn Asn Ile
370 375 380
Val Asp Lys Met Asn Lys Gln Tyr Glu Ile Ile Asp His Glu Phe Ser
385 390 395 400
Glu Val Glu Thr Arg Leu Asn Met Ile Asn Asn Lys Ile Asp Asp Gln
405 410 415
Ile Gln Asp Val Trp Ala Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu
420 425 430
Asn Gln Lys Thr Leu Asp Glu His Asp Ala Asn Val Asn Asn Leu Tyr
435 440 445
Asn Lys Val Lys Arg Ala Leu Gly Ser Asn Ala Met Glu Asp Gly Lys
450 455 460
Gly Cys Phe Glu Leu Tyr His Lys Cys Asp Asp Gln Cys Met Glu Thr
465 470 475 480
Ile Arg Asn Gly Thr Tyr Asn Arg Arg Lys Tyr Arg Glu Glu Ser Arg
485 490 495
Leu Glu Arg Gln Lys Ile Glu Gly Val Lys Leu Glu Ser Glu Gly Thr
500 505 510
Tyr Lys Ile Leu Thr Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu
515 520 525
Ala Met Gly Phe Ala Ala Phe Leu Phe Trp Ala Met Ser Asn Gly Ser
530 535 540
Cys Arg Cys Asn Ile Cys Ile
545 550
<210> 162
<211> 1785
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Malaysia
<400> 162
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggatcgaat ctgcactggg ataacatcgt caaactcacc acatgttgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gagggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtggcc ttgggcagac caaaatgcac ggggaacata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaaac ttctcagagg atacgaacat 420
atcaggttat caactcataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacgtt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaacaac aaaacagcaa caaattcatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgat 660
aacgaaaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag cggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaagaggt attttattgc ctcaaaaagt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcg ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctgcaaaact attaaaggaa aggggtttct tcggagctat tgctggtttc 1140
ttagaaggag gatgggaagg aatgattgca ggttggcacg gatacacatc ccatggggca 1200
catggagtag cggtggcagc agaccttaag agcactcaag aggccataaa caagataaca 1260
aaaaatctca actctttgag tgagctggaa gtaaagaatc ttcaaagact aagcggtgcc 1320
atggatgaac tccacaacga aatactagaa ctagacgaga aagtggatga tctcagagct 1380
gatacaataa gctcacaaat agaactcgca gtcctgcttt ccaatgaagg aataataaac 1440
agtgaagatg agcatctctt ggcgcttgaa agaaagctga agaaaatgct gggcccctct 1500
gctgtagaga tagggaatgg atgctttgaa accaaacaca agtgcaacca gacctgtctc 1560
gacagaatag ctgctggtac ctttgatgca ggagaatttt ctctccccac ttttgattca 1620
ctgaatatta ctgctgcatc tttaaatgac gatggattgg ataatcatac tatactgctt 1680
tactactcaa ctgctgcctc cagtttggct gtaacattga tgatagctat ctttgttgtt 1740
tatatggtct ccagagacaa tgtttcttgc tccatctgtc tataa 1785
<210> 163
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> IF**-HBM250604.S1-6r
<400> 163
actaaagaaa ataggccttt atagacagat ggagcaagaa acattgtctc 50
<210> 164
<211> 594
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Malaysia
<400> 164
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Asn Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Lys Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Val Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Asn Asn Lys Thr
180 185 190
Ala Thr Asn Ser Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Ala Lys Leu Leu
355 360 365
Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala Gly Phe Leu Glu Gly Gly
370 375 380
Trp Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala
385 390 395 400
His Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile
405 410 415
Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys
420 425 430
Asn Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile
435 440 445
Leu Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser
450 455 460
Ser Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn
465 470 475 480
Ser Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met
485 490 495
Leu Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys
500 505 510
His Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe
515 520 525
Asp Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr
530 535 540
Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu
545 550 555 560
Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Ile Ala
565 570 575
Ile Phe Val Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile
580 585 590
Cys Leu
<210> 165
<211> 1734
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Malaysia with deleted
proteolytic loop
<400> 165
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggatcgaat ctgcactggg ataacatcgt caaactcacc acatgttgtc 120
aaaactgcta ctcaagggga ggtcaatgtg actggtgtaa taccactgac aacaacaccc 180
accaaatctc attttgcaaa tctcaaagga acagaaacca gagggaaact atgcccaaaa 240
tgcctcaact gcacagatct ggacgtggcc ttgggcagac caaaatgcac ggggaacata 300
ccctcggcaa gagtttcaat actccatgaa gtcagacctg ttacatctgg gtgctttcct 360
ataatgcacg acagaacaaa aattagacag ctgcctaaac ttctcagagg atacgaacat 420
atcaggttat caactcataa cgttatcaat gcagaaaatg caccaggagg accctacaaa 480
attggaacct cagggtcttg ccctaacgtt accaatggaa acggattttt cgcaacaatg 540
gcttgggccg tcccaaaaaa cgacaacaac aaaacagcaa caaattcatt aacaatagaa 600
gtaccataca tttgtacaga aggagaagac caaattaccg tttgggggtt ccactctgat 660
aacgaaaccc aaatggcaaa gctctatggg gactcaaagc cccagaagtt cacctcatct 720
gccaacggag tgaccacaca ttacgtttca cagattggtg gcttcccaaa tcaaacagaa 780
gacggaggac taccacaaag cggtagaatt gttgttgatt acatggtgca aaaatctggg 840
aaaacaggaa caattaccta tcaaagaggt attttattgc ctcaaaaagt gtggtgcgca 900
agtggcagga gcaaggtaat aaaaggatcg ttgcctttaa ttggagaagc agattgcctc 960
cacgaaaaat acggtggatt aaacaaaagc aagccttact acacagggga acatgcaaag 1020
gccataggaa attgcccaat atgggtgaaa acacccttga agctggccaa tggaaccaaa 1080
tatagacctc ctggtggagg atgggaagga atgattgcag gttggcacgg atacacatcc 1140
catggggcac atggagtagc ggtggcagca gaccttaaga gcactcaaga ggccataaac 1200
aagataacaa aaaatctcaa ctctttgagt gagctggaag taaagaatct tcaaagacta 1260
agcggtgcca tggatgaact ccacaacgaa atactagaac tagacgagaa agtggatgat 1320
ctcagagctg atacaataag ctcacaaata gaactcgcag tcctgctttc caatgaagga 1380
ataataaaca gtgaagatga gcatctcttg gcgcttgaaa gaaagctgaa gaaaatgctg 1440
ggcccctctg ctgtagagat agggaatgga tgctttgaaa ccaaacacaa gtgcaaccag 1500
acctgtctcg acagaatagc tgctggtacc tttgatgcag gagaattttc tctccccact 1560
tttgattcac tgaatattac tgctgcatct ttaaatgacg atggattgga taatcatact 1620
atactgcttt actactcaac tgctgcctcc agtttggctg taacattgat gatagctatc 1680
tttgttgttt atatggtctc cagagacaat gtttcttgct ccatctgtct ataa 1734
<210> 166
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> HBM250604(PrL-).r
<400> 166
cattccttcc catcctccac caggaggtct atatttggtt ccattggc 48
<210> 167
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> HBM250604(PrL-).c
<400> 167
agacctcctg gtggaggatg ggaaggaatg attgcaggtt ggcacgga 48
<210> 168
<211> 577
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Malaysia with deleted
proteolytic loop
<400> 168
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser His
50 55 60
Phe Ala Asn Leu Lys Gly Thr Glu Thr Arg Gly Lys Leu Cys Pro Lys
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Lys Cys
85 90 95
Thr Gly Asn Ile Pro Ser Ala Arg Val Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Lys Leu Leu Arg Gly Tyr Glu His Ile Arg Leu Ser
130 135 140
Thr His Asn Val Ile Asn Ala Glu Asn Ala Pro Gly Gly Pro Tyr Lys
145 150 155 160
Ile Gly Thr Ser Gly Ser Cys Pro Asn Val Thr Asn Gly Asn Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asn Asp Asn Asn Lys Thr
180 185 190
Ala Thr Asn Ser Leu Thr Ile Glu Val Pro Tyr Ile Cys Thr Glu Gly
195 200 205
Glu Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Glu Thr Gln
210 215 220
Met Ala Lys Leu Tyr Gly Asp Ser Lys Pro Gln Lys Phe Thr Ser Ser
225 230 235 240
Ala Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro
245 250 255
Asn Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val
260 265 270
Asp Tyr Met Val Gln Lys Ser Gly Lys Thr Gly Thr Ile Thr Tyr Gln
275 280 285
Arg Gly Ile Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser
290 295 300
Lys Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu
305 310 315 320
His Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly
325 330 335
Glu His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro
340 345 350
Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp
355 360 365
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
370 375 380
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
385 390 395 400
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
405 410 415
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
420 425 430
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
435 440 445
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
450 455 460
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
465 470 475 480
Gly Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His
485 490 495
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asp
500 505 510
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
515 520 525
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr
530 535 540
Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Ile Ala Ile
545 550 555 560
Phe Val Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys
565 570 575
Leu
<210> 169
<211> 1782
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Massachusetts
<400> 169
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg ccgatcgaat ctgcactggg ataacatctt caaactcacc tcatgtggtc 120
aaaacagcta ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaagacca gagggaaact atgcccagac 240
tgtctcaact gtacagatct ggatgtggcc ctgggcaggc caatgtgtgt gggaactaca 300
ccttctgcga aagcttcaat acttcacgaa gtcagacctg ttacatccgg gtgcttccct 360
ataatgcacg acagaacaaa aatcaggcaa ctagccaatc ttctcagagg atatgaaaat 420
atcaggttat caacccaaaa cgttatcgat gcagaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaaa gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccattaac agtagaagta 600
ccatacattt gtgcagaagg ggaagaccaa attactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacatta tgtttctcag attggcggct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg cagaattgtc gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctatca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc ttgccaatgg aaccaaatat 1080
agacctcctg caaaactatt aaaggaaagg ggtttcttcg gagctattgc tggtttccta 1140
gaaggaggat gggaaggaat gattgcaggt tggcacggat acacatctca cggagcacat 1200
ggagtggcag ttgctgcaga ccttaagagc acacaagaag ctataaacaa gataacaaaa 1260
aatctcaact ctttgagtga gctagaagta aagaatcttc aaaggctaag tggtgccatg 1320
gatgaactcc acaacgaaat actcgagctg gatgagaaag tggatgacct cagagctgac 1380
actataagtt cacaaataga acttgcagtc ttgctttcca acgaaggaat aataaacagt 1440
gaagacgagc atctattggc acttgagaga aaactaaaga aaatgctggg tccctctgct 1500
gtagacatag gaaatggatg cttcgaaacc aaacacaaat gcaaccagac ctgcttagac 1560
aggatagctg ctggcacctt taatgcagga gagttttctc tccccacttt tgattcattg 1620
aacattactg ctgcatcttt aaatgatgat ggattggata accatactat actgctctat 1680
tactcaactg ctgcttctag tttggctgta acattgatgc tagctatttt tattgtttat 1740
atggtctcca gagacaacgt ttcatgctcc atctgtctat aa 1782
<210> 170
<211> 593
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Massachusetts
<400> 170
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Lys Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Arg
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Ala Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Ala Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Gly Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Ala Lys Leu Leu Lys
355 360 365
Glu Arg Gly Phe Phe Gly Ala Ile Ala Gly Phe Leu Glu Gly Gly Trp
370 375 380
Glu Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His
385 390 395 400
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn
405 410 415
Lys Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn
420 425 430
Leu Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu
435 440 445
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser
450 455 460
Gln Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser
465 470 475 480
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu
485 490 495
Gly Pro Ser Ala Val Asp Ile Gly Asn Gly Cys Phe Glu Thr Lys His
500 505 510
Lys Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn
515 520 525
Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala
530 535 540
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr
545 550 555 560
Tyr Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Leu Ala Ile
565 570 575
Phe Ile Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys
580 585 590
Leu
<210> 171
<211> 63
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of patatin A signal peptide
<400> 171
atggcaacta ctaaaacttt tttaatttta ttttttatga tattagcaac tactagttca 60
aca 63
<210> 172
<211> 23
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of patatin A signal peptide
<400> 172
Met Ala Thr Thr Lys Thr Phe Leu Ile Leu Phe Phe Met Ile Leu Ala
1 5 10 15
Thr Thr Ser Ser Thr Cys Ala
20
<210> 173
<211> 517
<212> DNA
<213> Artificial sequence
<220>
<223> CMPV HT sequence
<400> 173
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttgt cgggccc 517
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<400> 185
000
<210> 186
<400> 186
000
<210> 187
<211> 528
<212> DNA
<213> Artificial sequence
<220>
<223> [00173] CPMV HT+ with a plant kozak consensus sequence
<400> 187
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcgg 528
<210> 188
<211> 511
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of CPMV HT+ 511
<400> 188
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttga a 511
<210> 189
<211> 534
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of CPMV HT+ [WT115]
<400> 189
tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 60
ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc 120
gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc 180
gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc 240
ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc 300
atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt 360
gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa 420
atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt 480
taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcggag aaaa 534
<210> 190
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> HBF406(PrL-).r (construct 2102 and 2104)
<400> 190
tccttcccat cctccaccag gaggtctata tttggttcca ttggcgagct tcaaag 56
<210> 191
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> HBF406(PrL-).c (construct 2102 and 2104)
<400> 191
atatagacct cctggtggag gatgggaagg aatgattgca ggctggcacg ga 52
<210> 192
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> IF*-HBF406.s1-6r (construct 2102 and 2104)
<400> 192
actaaagaaa ataggccttt atagacagat ggagcatgaa acgttgtctc 50
<210> 193
<211> 1731
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Florida with deleted
proteolytic loop (construct 2102 and 2104)
<400> 193
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggatcgaat ctgcactgga ataacatctt caaactcacc tcatgtggtc 120
aaaacagcca ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaggacca gagggaaact atgcccagac 240
tgtctcaact gcacagatct ggatgtggct ttgggcagac caatgtgtgt ggggaccaca 300
ccttcggcga aggcttcaat actccacgaa gtcaaacctg ttacatccgg gtgctttcct 360
ataatgcacg acagaacaaa aatcaggcaa ctacccaatc ttctcagagg atatgaaaat 420
atcaggctat caacccaaaa cgtcatcgat gcggaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaga gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccactaac agtagaagta 600
ccatacattt gtacagaagg ggaagaccaa atcactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacacta tgtttctcag attggcagct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg caggattgtt gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctacca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc tcgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggct ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt ggcggcggac cttaagagta cgcaagaagc tataaacaag 1200
ataacaaaaa atctcaattc tttgagtgag ctagaagtaa agaatcttca aagactaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgatctc 1320
agagctgaca ctataagctc gcaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagatgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagagatagg aaatggatgc ttcgaaacca aacacaagtg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag aattttctct ccccactttt 1560
gattcactga acattactgc tgcatcttta aatgatgatg gattggataa ccatactata 1620
ctgctctatt actcaactgc tgcttctagt ttggctgtaa cattgatgct agctattttt 1680
attgtttata tggtctccag agacaacgtt tcatgctcca tctgtctata a 1731
<210> 194
<211> 576
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Florida with deleted
proteolytic loop (construct 2102 and 2104)
<400> 194
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Arg Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Lys
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Thr Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Ser Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn His Thr Ile Leu Leu Tyr Tyr
530 535 540
Ser Thr Ala Ala Ser Ser Leu Ala Val Thr Leu Met Leu Ala Ile Phe
545 550 555 560
Ile Val Tyr Met Val Ser Arg Asp Asn Val Ser Cys Ser Ile Cys Leu
565 570 575
<210> 195
<211> 3486
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 2102
<400> 195
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccaatacc gcggagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1320
tcttgtgttg gttccttctc agatcttcgc ggatcgaatc tgcactggaa taacatcttc 1380
aaactcacct catgtggtca aaacagccac tcaaggggag gtcaatgtga ctggtgtgat 1440
accactaaca acaacaccaa caaaatctta ttttgcaaat ctcaaaggaa caaggaccag 1500
agggaaacta tgcccagact gtctcaactg cacagatctg gatgtggctt tgggcagacc 1560
aatgtgtgtg gggaccacac cttcggcgaa ggcttcaata ctccacgaag tcaaacctgt 1620
tacatccggg tgctttccta taatgcacga cagaacaaaa atcaggcaac tacccaatct 1680
tctcagagga tatgaaaata tcaggctatc aacccaaaac gtcatcgatg cggaaaaggc 1740
accaggagga ccctacagac ttggaacctc aggatcttgc cctaacgcta ccagtaagag 1800
cggatttttc gcaacaatgg cttgggctgt cccaaaggac aacaacaaaa atgcaacgaa 1860
cccactaaca gtagaagtac catacatttg tacagaaggg gaagaccaaa tcactgtttg 1920
ggggttccat tcagataaca aaacccaaat gaagaacctc tatggagact caaatcctca 1980
aaagttcacc tcatctgcta atggagtaac cacacactat gtttctcaga ttggcagctt 2040
cccagatcaa acagaagacg gaggactacc acaaagcggc aggattgttg ttgattacat 2100
gatgcaaaaa cctgggaaaa caggaacaat tgtctaccaa agaggtgttt tgttgcctca 2160
aaaggtgtgg tgcgcgagtg gcaggagcaa agtaataaaa gggtccttgc ctttaattgg 2220
tgaagcagat tgccttcatg aaaaatacgg tggattaaac aaaagcaagc cttactacac 2280
aggagaacat gcaaaagcca taggaaattg cccaatatgg gtgaaaacac ctttgaagct 2340
cgccaatgga accaaatata gacctcctgg tggaggatgg gaaggaatga ttgcaggctg 2400
gcacggatac acatctcacg gagcacatgg agtggcagtg gcggcggacc ttaagagtac 2460
gcaagaagct ataaacaaga taacaaaaaa tctcaattct ttgagtgagc tagaagtaaa 2520
gaatcttcaa agactaagtg gtgccatgga tgaactccac aacgaaatac tcgagctgga 2580
tgagaaagtg gatgatctca gagctgacac tataagctcg caaatagaac ttgcagtctt 2640
gctttccaac gaaggaataa taaacagtga agatgagcat ctattggcac ttgagagaaa 2700
actaaagaaa atgctgggtc cctctgctgt agagatagga aatggatgct tcgaaaccaa 2760
acacaagtgc aaccagacct gcttagacag gatagctgct ggcaccttta atgcaggaga 2820
attttctctc cccacttttg attcactgaa cattactgct gcatctttaa atgatgatgg 2880
attggataac catactatac tgctctatta ctcaactgct gcttctagtt tggctgtaac 2940
attgatgcta gctattttta ttgtttatat ggtctccaga gacaacgttt catgctccat 3000
ctgtctataa aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta 3060
tgtttggtga gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt 3120
gtgagctcct gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat 3180
taaaaaaaaa aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt 3240
tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 3300
atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 3360
ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 3420
gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 3480
ctagat 3486
<210> 196
<211> 5368
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 2104
<400> 196
tgttgttgtg actccgaggg gttgcctcaa actctatctt ataaccggcg tggaggcatg 60
gaggcagggg tattttggtc attttaatag atagtggaaa atgacgtgga atttacttaa 120
agacgaagtc tttgcgacaa gggggggccc acgccgaatt taatattacc ggcgtggccc 180
ccccttatcg cgagtgcttt agcacgagcg gtccagattt aaagtagaaa atttcccgcc 240
cactagggtt aaaggtgttc acactataaa agcatatacg atgtgatggt atttggtcga 300
caagcttgca tgccggtcaa catggtggag cacgacacac ttgtctactc caaaaatatc 360
aaagatacag tctcagaaga ccaaagggca attgagactt ttcaacaaag ggtaatatcc 420
ggaaacctcc tcggattcca ttgcccagct atctgtcact ttattgtgaa gatagtggaa 480
aaggaaggtg gctcctacaa atgccatcat tgcgataaag gaaaggccat cgttgaagat 540
gcctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa 600
gaagacgttc caaccacgtc ttcaaagcaa gtggattgat gtgataacat ggtggagcac 660
gacacacttg tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt 720
gagacttttc aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc 780
tgtcacttta ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc 840
gataaaggaa aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc 900
ccacccacga ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg 960
gattgatgtg atatctccac tgacgtaagg gatgacgcac aatcccacta tccttcgcaa 1020
gacccttcct ctatataagg aagttcattt catttggaga ggtattaaaa tcttaatagg 1080
ttttgataaa agcgaacgtg gggaaacccg aaccaaacct tcttctaaac tctctctcat 1140
ctctcttaaa gcaaacttct ctcttgtctt tcttgcgtga gcgatcttca acgttgtcag 1200
atcgtgcttc ggcaccagta caacgttttc tttcactgaa gcgaaatcaa agatctcttt 1260
gtggacacgt agtgcggcgc cattaaataa cgtgtacttg tcctattctt gtcggtgtgg 1320
tcttgggaaa agaaagcttg ctggaggctg ctgttcagcc ccatacatta cttgttacga 1380
ttctgctgac tttcggcggg tgcaatatct ctacttctgc ttgacgaggt attgttgcct 1440
gtacttcttt cttcttcttc ttgctgattg gttctataag aaatctagta ttttctttga 1500
aacagagttt tcccgtggtt ttcgaacttg gagaaagatt gttaagcttc tgtatattct 1560
gcccaaattt gtcgggccca ataccgcgga gaaaatggcg aaaaacgttg cgattttcgg 1620
cttattgttt tctcttcttg tgttggttcc ttctcagatc ttcgcggatc gaatctgcac 1680
tggaataaca tcttcaaact cacctcatgt ggtcaaaaca gccactcaag gggaggtcaa 1740
tgtgactggt gtgataccac taacaacaac accaacaaaa tcttattttg caaatctcaa 1800
aggaacaagg accagaggga aactatgccc agactgtctc aactgcacag atctggatgt 1860
ggctttgggc agaccaatgt gtgtggggac cacaccttcg gcgaaggctt caatactcca 1920
cgaagtcaaa cctgttacat ccgggtgctt tcctataatg cacgacagaa caaaaatcag 1980
gcaactaccc aatcttctca gaggatatga aaatatcagg ctatcaaccc aaaacgtcat 2040
cgatgcggaa aaggcaccag gaggacccta cagacttgga acctcaggat cttgccctaa 2100
cgctaccagt aagagcggat ttttcgcaac aatggcttgg gctgtcccaa aggacaacaa 2160
caaaaatgca acgaacccac taacagtaga agtaccatac atttgtacag aaggggaaga 2220
ccaaatcact gtttgggggt tccattcaga taacaaaacc caaatgaaga acctctatgg 2280
agactcaaat cctcaaaagt tcacctcatc tgctaatgga gtaaccacac actatgtttc 2340
tcagattggc agcttcccag atcaaacaga agacggagga ctaccacaaa gcggcaggat 2400
tgttgttgat tacatgatgc aaaaacctgg gaaaacagga acaattgtct accaaagagg 2460
tgttttgttg cctcaaaagg tgtggtgcgc gagtggcagg agcaaagtaa taaaagggtc 2520
cttgccttta attggtgaag cagattgcct tcatgaaaaa tacggtggat taaacaaaag 2580
caagccttac tacacaggag aacatgcaaa agccatagga aattgcccaa tatgggtgaa 2640
aacacctttg aagctcgcca atggaaccaa atatagacct cctggtggag gatgggaagg 2700
aatgattgca ggctggcacg gatacacatc tcacggagca catggagtgg cagtggcggc 2760
ggaccttaag agtacgcaag aagctataaa caagataaca aaaaatctca attctttgag 2820
tgagctagaa gtaaagaatc ttcaaagact aagtggtgcc atggatgaac tccacaacga 2880
aatactcgag ctggatgaga aagtggatga tctcagagct gacactataa gctcgcaaat 2940
agaacttgca gtcttgcttt ccaacgaagg aataataaac agtgaagatg agcatctatt 3000
ggcacttgag agaaaactaa agaaaatgct gggtccctct gctgtagaga taggaaatgg 3060
atgcttcgaa accaaacaca agtgcaacca gacctgctta gacaggatag ctgctggcac 3120
ctttaatgca ggagaatttt ctctccccac ttttgattca ctgaacatta ctgctgcatc 3180
tttaaatgat gatggattgg ataaccatac tatactgctc tattactcaa ctgctgcttc 3240
tagtttggct gtaacattga tgctagctat ttttattgtt tatatggtct ccagagacaa 3300
cgtttcatgc tccatctgtc tataaaggcc tattttcttt agtttgaatt tactgttatt 3360
cggtgtgcat ttctatgttt ggtgagcggt tttctgtgct cagagtgtgt ttattttatg 3420
taatttaatt tctttgtgag ctcctgttta gcaggtcgtc ccttcagcaa ggacacaaaa 3480
agattttaat tttattaaaa aaaaaaaaaa aaaagaccgg gaattcgata tcaagcttat 3540
cgacctgcag atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc 3600
ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt aataattaac 3660
atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac 3720
atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg 3780
gtgtcatcta tgttactaga tctctagagt ctcaagcttg gcgcgccata aaatgattat 3840
tttatgaata tatttcattg tgcaagtaga tagaaattac atatgttaca taacacacga 3900
aataaacaaa aaaagacaat ccaaaaacaa acaccccaaa aaaaataatc actttagata 3960
aactcgtatg aggagaggca cgttcagtga ctcgacgatt cccgagcaaa aaaagtctcc 4020
ccgtcacaca tatagtgggt gacgcaatta tctttaaagt aatccttctg ttgacttgtc 4080
attgataaca tccagtcttc gtcaggattg caaagaatta tagaagggat cccacctttt 4140
attttcttct tttttccata tttagggttg acagtgaaat cagactggca acctattaat 4200
tgcttccaca atgggacgaa cttgaagggg atgtcgtcga tgatattata ggtggcgtgt 4260
tcatcgtagt tggtgaaatc gatggtaccg ttccaatagt tgtgtcgtcc gagacttcta 4320
gcccaggtgg tctttccggt acgagttggt ccgcagatgt agaggctggg gtgtcggatt 4380
ccattccttc cattgtcctg gttaaatcgg ccatccattc aaggtcagat tgagcttgtt 4440
ggtatgagac aggatgtatg taagtataag cgtctatgct tacatggtat agatgggttt 4500
ccctccagga gtgtagatct tcgtggcagc gaagatctga ttctgtgaag ggcgacacat 4560
acggttcagg ttgtggaggg aataatttgt tggctgaata ttccagccat tgaagttttg 4620
ttgcccattc atgagggaat tcttccttga tcatgtcaag atattcctcc ttagacgttg 4680
cagtctggat aatagttctc catcgtgcgt cagatttgcg aggagagacc ttatgatctc 4740
ggaaatctcc tctggtttta atatctccgt cctttgatat gtaatcaagg acttgtttag 4800
agtttctagc tggctggata ttagggtgat ttccttcaaa atcgaaaaaa gaaggatccc 4860
taatacaagg ttttttatca agctggagaa gagcatgata gtgggtagtg ccatcttgat 4920
gaagctcaga agcaacacca aggaagaaaa taagaaaagg tgtgagtttc tcccagagaa 4980
actggaataa atcatctctt tgagatgagc acttgggata ggtaaggaaa acatatttag 5040
attggagtct gaagttctta ctagcagaag gcatgttgtt gtgactccga ggggttgcct 5100
caaactctat cttataaccg gcgtggaggc atggaggcag gggtattttg gtcattttaa 5160
tagatagtgg aaaatgacgt ggaatttact taaagacgaa gtctttgcga caaggggggg 5220
cccacgccga atttaatatt accggcgtgg ccccccctta tcgcgagtgc tttagcacga 5280
gcggtccaga tttaaagtag aaaatttccc gcccactagg gttaaaggtg ttcacactat 5340
aaaagcatat acgatgtgat ggtatttg 5368
<210> 197
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> IF-H1cTMCT.S1-4r
<400> 197
actaaagaaa ataggccttt aaatacatat tctacactgt agagac 46
<210> 198
<211> 1731
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence of PDISP/HA B Florida+H1Cal TMCT with deleted
proteolytic loop (construct 2106 and 2108)
<400> 198
atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60
cagatcttcg cggatcgaat ctgcactgga ataacatctt caaactcacc tcatgtggtc 120
aaaacagcca ctcaagggga ggtcaatgtg actggtgtga taccactaac aacaacacca 180
acaaaatctt attttgcaaa tctcaaagga acaaggacca gagggaaact atgcccagac 240
tgtctcaact gcacagatct ggatgtggct ttgggcagac caatgtgtgt ggggaccaca 300
ccttcggcga aggcttcaat actccacgaa gtcaaacctg ttacatccgg gtgctttcct 360
ataatgcacg acagaacaaa aatcaggcaa ctacccaatc ttctcagagg atatgaaaat 420
atcaggctat caacccaaaa cgtcatcgat gcggaaaagg caccaggagg accctacaga 480
cttggaacct caggatcttg ccctaacgct accagtaaga gcggattttt cgcaacaatg 540
gcttgggctg tcccaaagga caacaacaaa aatgcaacga acccactaac agtagaagta 600
ccatacattt gtacagaagg ggaagaccaa atcactgttt gggggttcca ttcagataac 660
aaaacccaaa tgaagaacct ctatggagac tcaaatcctc aaaagttcac ctcatctgct 720
aatggagtaa ccacacacta tgtttctcag attggcagct tcccagatca aacagaagac 780
ggaggactac cacaaagcgg caggattgtt gttgattaca tgatgcaaaa acctgggaaa 840
acaggaacaa ttgtctacca aagaggtgtt ttgttgcctc aaaaggtgtg gtgcgcgagt 900
ggcaggagca aagtaataaa agggtccttg cctttaattg gtgaagcaga ttgccttcat 960
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggagaaca tgcaaaagcc 1020
ataggaaatt gcccaatatg ggtgaaaaca cctttgaagc tcgccaatgg aaccaaatat 1080
agacctcctg gtggaggatg ggaaggaatg attgcaggct ggcacggata cacatctcac 1140
ggagcacatg gagtggcagt ggcggcggac cttaagagta cgcaagaagc tataaacaag 1200
ataacaaaaa atctcaattc tttgagtgag ctagaagtaa agaatcttca aagactaagt 1260
ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt ggatgatctc 1320
agagctgaca ctataagctc gcaaatagaa cttgcagtct tgctttccaa cgaaggaata 1380
ataaacagtg aagatgagca tctattggca cttgagagaa aactaaagaa aatgctgggt 1440
ccctctgctg tagagatagg aaatggatgc ttcgaaacca aacacaagtg caaccagacc 1500
tgcttagaca ggatagctgc tggcaccttt aatgcaggag aattttctct ccccactttt 1560
gattcactga acattactgc tgcatcttta aatgatgatg gattggataa ctaccagatt 1620
ttggcgatct attcaactgt cgccagttca ttggtactgg tagtctccct gggggcaatc 1680
agtttctgga tgtgctctaa tgggtctcta cagtgtagaa tatgtattta a 1731
<210> 199
<211> 576
<212> PRT
<213> Artificial sequence
<220>
<223> Amino acid sequence of PDISP/HA B Florida+H1Cal TMCT with deleted
proteolytic loop (construct 2106 and 2108)
<400> 199
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Arg Ile Cys Thr Gly Ile Thr
20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gln Gly Glu Val
35 40 45
Asn Val Thr Gly Val Ile Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr
50 55 60
Phe Ala Asn Leu Lys Gly Thr Arg Thr Arg Gly Lys Leu Cys Pro Asp
65 70 75 80
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys
85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser Ile Leu His Glu Val Lys
100 105 110
Pro Val Thr Ser Gly Cys Phe Pro Ile Met His Asp Arg Thr Lys Ile
115 120 125
Arg Gln Leu Pro Asn Leu Leu Arg Gly Tyr Glu Asn Ile Arg Leu Ser
130 135 140
Thr Gln Asn Val Ile Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg
145 150 155 160
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe
165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala
180 185 190
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr Ile Cys Thr Glu Gly Glu
195 200 205
Asp Gln Ile Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gln Met
210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gln Lys Phe Thr Ser Ser Ala
225 230 235 240
Asn Gly Val Thr Thr His Tyr Val Ser Gln Ile Gly Ser Phe Pro Asp
245 250 255
Gln Thr Glu Asp Gly Gly Leu Pro Gln Ser Gly Arg Ile Val Val Asp
260 265 270
Tyr Met Met Gln Lys Pro Gly Lys Thr Gly Thr Ile Val Tyr Gln Arg
275 280 285
Gly Val Leu Leu Pro Gln Lys Val Trp Cys Ala Ser Gly Arg Ser Lys
290 295 300
Val Ile Lys Gly Ser Leu Pro Leu Ile Gly Glu Ala Asp Cys Leu His
305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu
325 330 335
His Ala Lys Ala Ile Gly Asn Cys Pro Ile Trp Val Lys Thr Pro Leu
340 345 350
Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Gly Gly Gly Trp Glu
355 360 365
Gly Met Ile Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His Gly
370 375 380
Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gln Glu Ala Ile Asn Lys
385 390 395 400
Ile Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn Leu
405 410 415
Gln Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu Ile Leu Glu
420 425 430
Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr Ile Ser Ser Gln
435 440 445
Ile Glu Leu Ala Val Leu Leu Ser Asn Glu Gly Ile Ile Asn Ser Glu
450 455 460
Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu Gly
465 470 475 480
Pro Ser Ala Val Glu Ile Gly Asn Gly Cys Phe Glu Thr Lys His Lys
485 490 495
Cys Asn Gln Thr Cys Leu Asp Arg Ile Ala Ala Gly Thr Phe Asn Ala
500 505 510
Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn Ile Thr Ala Ala
515 520 525
Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gln Ile Leu Ala Ile Tyr
530 535 540
Ser Thr Val Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala Ile
545 550 555 560
Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570 575
<210> 200
<211> 3486
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 2106
<400> 200
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccaatacc gcggagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1320
tcttgtgttg gttccttctc agatcttcgc ggatcgaatc tgcactggaa taacatcttc 1380
aaactcacct catgtggtca aaacagccac tcaaggggag gtcaatgtga ctggtgtgat 1440
accactaaca acaacaccaa caaaatctta ttttgcaaat ctcaaaggaa caaggaccag 1500
agggaaacta tgcccagact gtctcaactg cacagatctg gatgtggctt tgggcagacc 1560
aatgtgtgtg gggaccacac cttcggcgaa ggcttcaata ctccacgaag tcaaacctgt 1620
tacatccggg tgctttccta taatgcacga cagaacaaaa atcaggcaac tacccaatct 1680
tctcagagga tatgaaaata tcaggctatc aacccaaaac gtcatcgatg cggaaaaggc 1740
accaggagga ccctacagac ttggaacctc aggatcttgc cctaacgcta ccagtaagag 1800
cggatttttc gcaacaatgg cttgggctgt cccaaaggac aacaacaaaa atgcaacgaa 1860
cccactaaca gtagaagtac catacatttg tacagaaggg gaagaccaaa tcactgtttg 1920
ggggttccat tcagataaca aaacccaaat gaagaacctc tatggagact caaatcctca 1980
aaagttcacc tcatctgcta atggagtaac cacacactat gtttctcaga ttggcagctt 2040
cccagatcaa acagaagacg gaggactacc acaaagcggc aggattgttg ttgattacat 2100
gatgcaaaaa cctgggaaaa caggaacaat tgtctaccaa agaggtgttt tgttgcctca 2160
aaaggtgtgg tgcgcgagtg gcaggagcaa agtaataaaa gggtccttgc ctttaattgg 2220
tgaagcagat tgccttcatg aaaaatacgg tggattaaac aaaagcaagc cttactacac 2280
aggagaacat gcaaaagcca taggaaattg cccaatatgg gtgaaaacac ctttgaagct 2340
cgccaatgga accaaatata gacctcctgg tggaggatgg gaaggaatga ttgcaggctg 2400
gcacggatac acatctcacg gagcacatgg agtggcagtg gcggcggacc ttaagagtac 2460
gcaagaagct ataaacaaga taacaaaaaa tctcaattct ttgagtgagc tagaagtaaa 2520
gaatcttcaa agactaagtg gtgccatgga tgaactccac aacgaaatac tcgagctgga 2580
tgagaaagtg gatgatctca gagctgacac tataagctcg caaatagaac ttgcagtctt 2640
gctttccaac gaaggaataa taaacagtga agatgagcat ctattggcac ttgagagaaa 2700
actaaagaaa atgctgggtc cctctgctgt agagatagga aatggatgct tcgaaaccaa 2760
acacaagtgc aaccagacct gcttagacag gatagctgct ggcaccttta atgcaggaga 2820
attttctctc cccacttttg attcactgaa cattactgct gcatctttaa atgatgatgg 2880
attggataac taccagattt tggcgatcta ttcaactgtc gccagttcat tggtactggt 2940
agtctccctg ggggcaatca gtttctggat gtgctctaat gggtctctac agtgtagaat 3000
atgtatttaa aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta 3060
tgtttggtga gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt 3120
gtgagctcct gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat 3180
taaaaaaaaa aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt 3240
tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 3300
atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 3360
ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 3420
gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 3480
ctagat 3486
<210> 201
<211> 5368
<212> DNA
<213> Artificial sequence
<220>
<223> Cassette 2108
<400> 201
tgttgttgtg actccgaggg gttgcctcaa actctatctt ataaccggcg tggaggcatg 60
gaggcagggg tattttggtc attttaatag atagtggaaa atgacgtgga atttacttaa 120
agacgaagtc tttgcgacaa gggggggccc acgccgaatt taatattacc ggcgtggccc 180
ccccttatcg cgagtgcttt agcacgagcg gtccagattt aaagtagaaa atttcccgcc 240
cactagggtt aaaggtgttc acactataaa agcatatacg atgtgatggt atttggtcga 300
caagcttgca tgccggtcaa catggtggag cacgacacac ttgtctactc caaaaatatc 360
aaagatacag tctcagaaga ccaaagggca attgagactt ttcaacaaag ggtaatatcc 420
ggaaacctcc tcggattcca ttgcccagct atctgtcact ttattgtgaa gatagtggaa 480
aaggaaggtg gctcctacaa atgccatcat tgcgataaag gaaaggccat cgttgaagat 540
gcctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa 600
gaagacgttc caaccacgtc ttcaaagcaa gtggattgat gtgataacat ggtggagcac 660
gacacacttg tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt 720
gagacttttc aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc 780
tgtcacttta ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc 840
gataaaggaa aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc 900
ccacccacga ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg 960
gattgatgtg atatctccac tgacgtaagg gatgacgcac aatcccacta tccttcgcaa 1020
gacccttcct ctatataagg aagttcattt catttggaga ggtattaaaa tcttaatagg 1080
ttttgataaa agcgaacgtg gggaaacccg aaccaaacct tcttctaaac tctctctcat 1140
ctctcttaaa gcaaacttct ctcttgtctt tcttgcgtga gcgatcttca acgttgtcag 1200
atcgtgcttc ggcaccagta caacgttttc tttcactgaa gcgaaatcaa agatctcttt 1260
gtggacacgt agtgcggcgc cattaaataa cgtgtacttg tcctattctt gtcggtgtgg 1320
tcttgggaaa agaaagcttg ctggaggctg ctgttcagcc ccatacatta cttgttacga 1380
ttctgctgac tttcggcggg tgcaatatct ctacttctgc ttgacgaggt attgttgcct 1440
gtacttcttt cttcttcttc ttgctgattg gttctataag aaatctagta ttttctttga 1500
aacagagttt tcccgtggtt ttcgaacttg gagaaagatt gttaagcttc tgtatattct 1560
gcccaaattt gtcgggccca ataccgcgga gaaaatggcg aaaaacgttg cgattttcgg 1620
cttattgttt tctcttcttg tgttggttcc ttctcagatc ttcgcggatc gaatctgcac 1680
tggaataaca tcttcaaact cacctcatgt ggtcaaaaca gccactcaag gggaggtcaa 1740
tgtgactggt gtgataccac taacaacaac accaacaaaa tcttattttg caaatctcaa 1800
aggaacaagg accagaggga aactatgccc agactgtctc aactgcacag atctggatgt 1860
ggctttgggc agaccaatgt gtgtggggac cacaccttcg gcgaaggctt caatactcca 1920
cgaagtcaaa cctgttacat ccgggtgctt tcctataatg cacgacagaa caaaaatcag 1980
gcaactaccc aatcttctca gaggatatga aaatatcagg ctatcaaccc aaaacgtcat 2040
cgatgcggaa aaggcaccag gaggacccta cagacttgga acctcaggat cttgccctaa 2100
cgctaccagt aagagcggat ttttcgcaac aatggcttgg gctgtcccaa aggacaacaa 2160
caaaaatgca acgaacccac taacagtaga agtaccatac atttgtacag aaggggaaga 2220
ccaaatcact gtttgggggt tccattcaga taacaaaacc caaatgaaga acctctatgg 2280
agactcaaat cctcaaaagt tcacctcatc tgctaatgga gtaaccacac actatgtttc 2340
tcagattggc agcttcccag atcaaacaga agacggagga ctaccacaaa gcggcaggat 2400
tgttgttgat tacatgatgc aaaaacctgg gaaaacagga acaattgtct accaaagagg 2460
tgttttgttg cctcaaaagg tgtggtgcgc gagtggcagg agcaaagtaa taaaagggtc 2520
cttgccttta attggtgaag cagattgcct tcatgaaaaa tacggtggat taaacaaaag 2580
caagccttac tacacaggag aacatgcaaa agccatagga aattgcccaa tatgggtgaa 2640
aacacctttg aagctcgcca atggaaccaa atatagacct cctggtggag gatgggaagg 2700
aatgattgca ggctggcacg gatacacatc tcacggagca catggagtgg cagtggcggc 2760
ggaccttaag agtacgcaag aagctataaa caagataaca aaaaatctca attctttgag 2820
tgagctagaa gtaaagaatc ttcaaagact aagtggtgcc atggatgaac tccacaacga 2880
aatactcgag ctggatgaga aagtggatga tctcagagct gacactataa gctcgcaaat 2940
agaacttgca gtcttgcttt ccaacgaagg aataataaac agtgaagatg agcatctatt 3000
ggcacttgag agaaaactaa agaaaatgct gggtccctct gctgtagaga taggaaatgg 3060
atgcttcgaa accaaacaca agtgcaacca gacctgctta gacaggatag ctgctggcac 3120
ctttaatgca ggagaatttt ctctccccac ttttgattca ctgaacatta ctgctgcatc 3180
tttaaatgat gatggattgg ataactacca gattttggcg atctattcaa ctgtcgccag 3240
ttcattggta ctggtagtct ccctgggggc aatcagtttc tggatgtgct ctaatgggtc 3300
tctacagtgt agaatatgta tttaaaggcc tattttcttt agtttgaatt tactgttatt 3360
cggtgtgcat ttctatgttt ggtgagcggt tttctgtgct cagagtgtgt ttattttatg 3420
taatttaatt tctttgtgag ctcctgttta gcaggtcgtc ccttcagcaa ggacacaaaa 3480
agattttaat tttattaaaa aaaaaaaaaa aaaagaccgg gaattcgata tcaagcttat 3540
cgacctgcag atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc 3600
ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt aataattaac 3660
atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac 3720
atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg 3780
gtgtcatcta tgttactaga tctctagagt ctcaagcttg gcgcgccata aaatgattat 3840
tttatgaata tatttcattg tgcaagtaga tagaaattac atatgttaca taacacacga 3900
aataaacaaa aaaagacaat ccaaaaacaa acaccccaaa aaaaataatc actttagata 3960
aactcgtatg aggagaggca cgttcagtga ctcgacgatt cccgagcaaa aaaagtctcc 4020
ccgtcacaca tatagtgggt gacgcaatta tctttaaagt aatccttctg ttgacttgtc 4080
attgataaca tccagtcttc gtcaggattg caaagaatta tagaagggat cccacctttt 4140
attttcttct tttttccata tttagggttg acagtgaaat cagactggca acctattaat 4200
tgcttccaca atgggacgaa cttgaagggg atgtcgtcga tgatattata ggtggcgtgt 4260
tcatcgtagt tggtgaaatc gatggtaccg ttccaatagt tgtgtcgtcc gagacttcta 4320
gcccaggtgg tctttccggt acgagttggt ccgcagatgt agaggctggg gtgtcggatt 4380
ccattccttc cattgtcctg gttaaatcgg ccatccattc aaggtcagat tgagcttgtt 4440
ggtatgagac aggatgtatg taagtataag cgtctatgct tacatggtat agatgggttt 4500
ccctccagga gtgtagatct tcgtggcagc gaagatctga ttctgtgaag ggcgacacat 4560
acggttcagg ttgtggaggg aataatttgt tggctgaata ttccagccat tgaagttttg 4620
ttgcccattc atgagggaat tcttccttga tcatgtcaag atattcctcc ttagacgttg 4680
cagtctggat aatagttctc catcgtgcgt cagatttgcg aggagagacc ttatgatctc 4740
ggaaatctcc tctggtttta atatctccgt cctttgatat gtaatcaagg acttgtttag 4800
agtttctagc tggctggata ttagggtgat ttccttcaaa atcgaaaaaa gaaggatccc 4860
taatacaagg ttttttatca agctggagaa gagcatgata gtgggtagtg ccatcttgat 4920
gaagctcaga agcaacacca aggaagaaaa taagaaaagg tgtgagtttc tcccagagaa 4980
actggaataa atcatctctt tgagatgagc acttgggata ggtaaggaaa acatatttag 5040
attggagtct gaagttctta ctagcagaag gcatgttgtt gtgactccga ggggttgcct 5100
caaactctat cttataaccg gcgtggaggc atggaggcag gggtattttg gtcattttaa 5160
tagatagtgg aaaatgacgt ggaatttact taaagacgaa gtctttgcga caaggggggg 5220
cccacgccga atttaatatt accggcgtgg ccccccctta tcgcgagtgc tttagcacga 5280
gcggtccaga tttaaagtag aaaatttccc gcccactagg gttaaaggtg ttcacactat 5340
aaaagcatat acgatgtgat ggtatttg 5368
Claims (37)
- 식물에서 활성인 조절 영역 및 식물에서 활성인 발현 인핸서를 포함하는 핵산으로서, 조절 영역 및 발현 인핸서는 인플루엔자 타입 B HA(헤마글루티닌)와 인플루엔자 타입 A 서브타입 H3 및 H7 HA로부터 선택된 변형된 인플루엔자 헤마글루티닌(HA)을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합되고, 인플루엔자 타입 B HA는 B/Brisbane/60/2008 균주(strain)를 포함하지 않고, 변형된 HA는 서브유닛 HA1 및 HA2 사이에 완전히 결실된 단백질 가수분해 루프를 포함하고, 완전히 결실된 단백질 가수분해 루프는 일염기(monobasic) 또는 다염기(multi-basic) 분열 부위를 포함하고, 핵산은 강낭콩 황고병 바이러스(Bean Yellow Dwarf virus: BeYDV) 증폭 요소를 포함하지 않는, 핵산.
- 제1 항에 있어서, 발현 인핸서는 CPMVX, CPMVX+, CPMV-HT+, CPMV HT+[WT115] 및 CPMV HT+[511]로 구성된 군으로부터 선택되고,
CPMVX는 서열 번호: 93의 X 뉴클레오타이드(여기서 X = 서열 번호: 93의 160, 155, 150 또는 114) 또는 CPMVX(여기서 X = 서열 번호: 93의 160, 155, 150 또는 114)와 80% 내지 100% 서열 유사성을 포함하는 서열을 포함하고,
CPMVX+는 서열 번호: 93의 X 뉴클레오타이드(여기서 X = 서열 번호: 93의 160, 155, 150 또는 114) 또는 CPMVX(여기서 X = 서열 번호: 93의 160, 155, 150 또는 114)와 80% 내지 100% 서열 유사성을 포함하는 서열을 포함하고, 스터퍼(stuffer) 서열은 CMPVX 서열의 3' 끝에 융합된 1 내지 100 뉴클레오타이드를 포함하고,
CPMV-HT+는 코모바이러스 5' 비번역 영역(UTR), 및 변형되거나 길어지거나 또는 절단된 스터퍼 서열을 포함하고,
CPMV HT+[WT115]는 서열 번호: 189의 서열을 포함하고, 및
CPMV HT+ [511]은 서열 번호: 188의 서열을 포함하는
것을 특징으로 하는 핵산. - 제1 항에 있어서, 발현 인핸서는 CPMV HT가 아닌 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 변형된 HA는 HA0 전구체로서 유지되는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 단백질 가수분해 루프는 링커 서열에 의해 완전히 대체되는 것을 특징으로 하는 핵산.
- 제5 항에 있어서, 링커 서열은 아미노산 서열 GG, TETQ 또는 TETR을 갖는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 뉴클레오타이드 서열은, 서열 번호: 98 및 100의 아미노산 25 내지 576; 서열 번호: 143의 아미노산 25 내지 559; 서열 번호: 147의 아미노산 25 내지 559; 서열 번호 154의 아미노산 25 내지 549; 서열 번호: 168의 아미노산 25 내지 577; 및 서열 번호: 194 및 199의 아미노산 25 내지 576으로 구성된 군으로부터 선택된 아미노산 서열에 대하여 적어도 80% 서열 동일성을 갖는 인플루엔자 헤마글루티닌(HA) 단백질을 암호화하는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 변형된 HA는 고유한 HA 신호 펩타이드 또는 비-고유한 HA 신호 펩타이드를 포함하는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 변형된 HA를 암호화하는 뉴클레오타이드 서열은, 연속적으로, 완전히 결실된 단백질 가수분해 루프를 포함하는 변형된 HA 엑토도메인, 인플루엔자 막관통 도메인, 및 세포질 꼬리를 암호화하는 키메라 뉴클레오타이드 서열을 포함하며, 변형된 HA 엑토도메인은 제1 인플루엔자 균주의 것이고 막관통 도메인 및 세포질 꼬리는 제2 인플루엔자 균주의 것임을 특징으로 하는 핵산.
- 제1 항에 있어서, 변형된 HA는 인플루엔자 타입 A 서브타입 H3이고, 완전히 결실된 단백질 가수분해 루프는 서열 번호: 48의 서열을 포함하는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 변형된 HA는 인플루엔자 타입 B이고, 완전히 결실된 단백질 가수분해 루프는 서열 번호: 59의 서열을 포함하는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 변형된 HA는 인플루엔자 타입 A 서브타입 H7이고, 완전히 결실된 단백질 가수분해 루프는 서열 번호: 150의 아미노산 340 내지 357의 서열을 포함하는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 일염기 분열 부위는 트립타제 클라라(Clara) 또는 트립신/키모트립신에 의해 인식되는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 다염기 분열 부위는 퓨린(Furin)에 의해 인식되는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 분열 부위는 인플루엔자 타입 B HA에 대한 아미노산 서열 KER, PAK 또는 이것들의 조합을 포함하는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 분열 부위는 인플루엔자 타입 A 서브타입 H3 HA에 대한 아미노산 서열 Q/E-X-R, PEK 또는 이것들의 조합을 포함하는 것을 특징으로 하는 핵산.
- 제1 항에 있어서, 분열 부위는 인플루엔자 타입 A 서브타입 H7 HA에 대한 아미노산 서열 R-X-R/K-R, RKKR 또는 이것들의 조합을 포함하는 것을 특징으로 하는 핵산.
- 식물에서 인플루엔자 바이러스 유사 입자(VLP)를 생산하는 방법으로서,
a) 핵산을 식물 또는 식물의 일부로 도입하거나 상기 핵산을 포함하는 식물 또는 식물의 일부를 제공하는 단계로서, 상기 핵산은 식물 내에서 활성인 조절 영역 및 식물 내에서 활성인 발현 인핸서를 포함하고, 조절 영역 및 발현 인핸서는 변형된 인플루엔자 타입 A 서브타입 H3 또는 H7 헤마글루티닌(HA)을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합되고, 변형된 HA는 서브유닛 HA1 및 HA2 사이에 완전히 결실된 단백질 가수분해 루프를 포함하고, 완전히 결실된 단백질 가수분해 루프는 일염기(monobasic) 또는 다염기(multi-basic) 분열 부위를 포함하고, 상기 핵산은 강낭콩 황고병 바이러스(Bean Yellow Dwarf virus: BeYDV) 증폭 요소를 포함하지 않는, 단계; 및
b) 핵산의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 VLP를 생산하는 단계
를 포함하는, 식물에서 인플루엔자 바이러스 유사 입자 (VLP)를 생산하는 방법. - 제18 항에 있어서, 단계 a)에서 제2 핵산이 식물 또는 식물의 일부로 도입되며, 제2 핵산은 식물에서 활성이고 양성자 채널 단백질을 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합된 제2 조절 영역을 포함하는 것을 특징으로 하는 방법.
- 제19 항에 있어서, 양성자 채널 단백질은 인플루엔자 M2 또는 BM2로부터 선택되는 것을 특징으로 하는 방법.
- 제18 항에 있어서,
c) 식물을 수득하는 단계, 및
d) VLP를 정제하는 단계로서, VLP는 크기가 80-300 nm의 범위에 있는 단계
를 더 포함하는 것을 특징으로 하는 방법. - 제18 항에 있어서, 핵산은 식물에서 일과성(一過性)으로 발현되거나, 핵산은 식물에서 안정하게 발현되는 것을 특징으로 하는 방법.
- 서브유닛 H1 및 H2 사이에 완전히 결실된 단백질 가수분해 루프를 포함하는 변형된 HA 단백질을 생산하는 방법으로서, 단백질 가수분해 루프는 식물에서 감소되거나 폐지된 분열을 나타내는 하나 이상의 일염기(monobasic) 또는 다염기(multi-basic) 분열 부위를 포함하고, 상기 방법은
a) 핵산을 식물 또는 식물의 일부에 도입하는 단계로서, 상기 핵산은 식물 내에서 활성인 조절 영역 및 식물 내에서 활성인 발현 인핸서를 포함하고, 조절 영역 및 발현 인핸서는 변형된 인플루엔자 타입 A 서브타입 H3 또는 H7 HA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 결합되고, 변형된 HA는 서브유닛 HA1 및 HA2 사이에 완전히 결실된 단백질 가수분해 루프를 포함하고, 완전히 결실된 단백질 가수분해 루프는 일염기 또는 다염기 분열 부위를 포함하고, 상기 핵산은 강낭콩 황고병 바이러스(Bean Yellow Dwarf virus: BeYDV) 증폭 요소를 포함하지 않는, 단계;
b) HA 단백질의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 변형된 HA 단백질을 생산하는 단계, 및
c) 식물 또는 식물의 일부를 수득하고 변형된 HA 단백질을 정제하는 단계
를 포함하는, 변형된 HA 단백질을 생산하는 방법. - 제1 항의 핵산을 포함하는 식물.
- 서브유닛 HA1 및 HA2 사이에 완전히 결실된 단백질 가수분해 루프를 포함하는 변형된 인플루엔자 타입 B 또는 인플루엔자 타입 A 서브타입 H3 또는 H7 헤마글루티닌(HA)으로서, 완전히 결실된 단백질 가수분해 루프는 일염기(monobasic) 또는 다염기(multi-basic) 분열 부위를 포함하고, 변형된 인플루엔자 타입 B HA는 B/Brisbane/60/2008 균주(strain) 또는 B/Wisconsin/1/2010 균주를 포함하지 않는, 변형된 인플루엔자 HA.
- 제25 항에 있어서, 변형된 인플루엔자 HA는 서열 번호: 37의 서열과 90-100% 서열 동일성을 포함하는 변형되지 않은 인플루엔자 타입 B HA로부터 유래되는 것을 특징으로 하는 변형된 인플루엔자 HA.
- 제25 항에 있어서, 변형된 인플루엔자 HA는 서열 번호: 19; 서열 번호: 122의 아미노산 25 내지 574; 또는 서열 번호: 139의 아미노산 25 내지 274의 서열과 90-100% 서열 동일성을 포함하는 변형되지 않은 인플루엔자 타입 A 서브타입 H7 HA로부터 유래되는 것을 특징으로 하는 변형된 인플루엔자 HA.
- 제25 항에 있어서, 변형된 인플루엔자 HA는 서열 번호: 150의 아미노산 25 내지 566의 서열과 90-100% 서열 동일성을 포함하는 변형되지 않은 인플루엔자 타입 A 서브타입 H7 HA로부터 유래되는 것을 특징으로 하는 변형된 인플루엔자 HA.
- 제25 항에 따른 변형된 인플루엔자 HA를 포함하는 VLP.
- 제29 항에 있어서, 식물에서 유래된 하나 이상의 지질을 더 포함하는 것을 특징으로 하는 VLP.
- 제30 항에 있어서, 변형된 인플루엔자 HA는 식물-특이적 N-글리칸 또는 변형된 N-글리칸을 포함하는 것을 특징으로 하는 VLP.
- 면역 반응을 유도하기 위한 제29 항의 VLP의 유효량, 및 약학적으로 허용 가능한 담체를 포함하는 조성물.
- 면역 반응을 유도하기 위한 제29 항의 VLP의 유효량을 포함하는 백신.
- 대상체에서 인플루엔자 바이러스 감염에 대한 면역력을 유도하기 위한, 제30 항의 VLP를 포함하는 면역원성 조성물.
- 제34 항에 있어서, 면역원성 조성물은 대상체에게 경구로, 피내로, 비강 내로, 근육 내로, 복강 내로, 정맥 내로, 또는 피하로 투여하기 위한 것을 특징으로 하는 면역원성 조성물.
- 식물에서 발현된 HA 단백질의 생성물 품질을 증가시키는 방법으로서,
a) 제1 항의 핵산을 식물로 도입하는 단계;
b) HA 단백질의 발현을 허용하는 조건 하에 식물 또는 식물의 일부를 배양하여, 이로 인해 변형된 HA 단백질을 생산하는 단계, 및
c) 식물을 수득하고 변형된 HA 단백질을 정제하는 단계로서, 변형된 HA 단백질은 고유한 HA와 비교하여 생성물 품질을 증가시키는 단계를 포함하는 방법. - 제36 항에 있어서, 품질은 증가된 생산 수율, 생성물의 안정성, 생성물의 일관성 또는 이것들의 조합을 포함하는 것을 특징으로 하는 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361806227P | 2013-03-28 | 2013-03-28 | |
US61/806,227 | 2013-03-28 | ||
US201461925852P | 2014-01-10 | 2014-01-10 | |
US61/925,852 | 2014-01-10 | ||
US201461971274P | 2014-03-27 | 2014-03-27 | |
US61/971,274 | 2014-03-27 | ||
PCT/CA2014/050326 WO2014153674A1 (en) | 2013-03-28 | 2014-03-28 | Influenza virus-like particle production in plants |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150134423A KR20150134423A (ko) | 2015-12-01 |
KR102199018B1 true KR102199018B1 (ko) | 2021-01-07 |
Family
ID=51622327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157030865A KR102199018B1 (ko) | 2013-03-28 | 2014-03-28 | 식물에서 인플루엔자 바이러스-유사 입자 생산 |
Country Status (16)
Country | Link |
---|---|
US (2) | US10358652B2 (ko) |
EP (2) | EP2978848B1 (ko) |
JP (2) | JP2016516415A (ko) |
KR (1) | KR102199018B1 (ko) |
CN (2) | CN105247059B (ko) |
AU (1) | AU2014245779B2 (ko) |
CA (1) | CA2907591A1 (ko) |
ES (1) | ES2803508T3 (ko) |
HK (1) | HK1220729A1 (ko) |
IL (2) | IL241692B2 (ko) |
MX (1) | MX2015013700A (ko) |
PH (1) | PH12015502217A1 (ko) |
RU (2) | RU2742607C1 (ko) |
SG (1) | SG11201507928QA (ko) |
WO (1) | WO2014153674A1 (ko) |
ZA (1) | ZA201508327B (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11390878B2 (en) | 2011-09-30 | 2022-07-19 | Medicago Inc. | Increasing protein yield in plants |
RU2682752C2 (ru) | 2011-09-30 | 2019-03-21 | Медикаго Инк. | Повышение выхода вирусоподобных частиц в растениях |
CN105247059B (zh) * | 2013-03-28 | 2021-07-06 | 莫迪卡戈公司 | 植物中流感样病毒颗粒的产生 |
EP3092309B1 (en) | 2014-01-10 | 2021-02-24 | Medicago Inc. | Cpmv enhancer elements |
EP3122883B1 (en) | 2014-03-27 | 2022-03-02 | Medicago Inc. | Modified cpmv enhancer elements |
LT3134131T (lt) | 2014-04-23 | 2022-02-10 | Modernatx, Inc. | Nukleorūgšties vakcinos |
FR3054547B1 (fr) | 2016-07-29 | 2020-06-05 | Angany Inc. | Particules pseudo-virales et leurs utilisations |
GB201614485D0 (en) | 2016-08-25 | 2016-10-12 | Univ Oxford Innovation Ltd | Immunogenic composition |
CN106822887A (zh) * | 2017-01-26 | 2017-06-13 | 中国科学院微生物研究所 | 一种流感病毒四价亚单位疫苗及其应用 |
RU2020132255A (ru) * | 2018-03-14 | 2022-04-15 | Медикаго Инк. | Энхансер экспрессии в растениях |
WO2020000100A1 (en) * | 2018-06-27 | 2020-01-02 | Medicago Inc. | Influenza virus hemagglutinin mutants |
AU2019434270A1 (en) * | 2019-03-14 | 2021-09-30 | Aramis Biotechnologies Inc. | Endogenous plant expression enhancer |
CN113249399B (zh) * | 2021-05-27 | 2022-08-02 | 长沙诺合松生物科技合伙企业(有限合伙) | pAM基因及其植物表达载体和应用 |
EP4456915A1 (en) * | 2021-12-31 | 2024-11-06 | Mynvax Private Limited | Polypeptide fragments, immunogenic composition against influenza virus, and implementations thereof |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010003225A1 (en) * | 2008-07-11 | 2010-01-14 | Medicago, Inc. | Influenza virus-like particles (vlps) comprising hemagglutinin |
WO2011035422A1 (en) * | 2009-09-22 | 2011-03-31 | Medicago Inc. | Method of preparing plant-derived vlps |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5232833A (en) | 1988-09-14 | 1993-08-03 | Stressgen Biotechnologies Corporation | Accumulation of heat shock proteins for evaluating biological damage due to chronic exposure of an organism to sublethal levels of pollutants |
US6392121B1 (en) | 1998-10-07 | 2002-05-21 | Boyce Thompson Institute For Plant Research | Gemini virus vectors for gene expression in plants |
US20020169306A1 (en) * | 1999-05-18 | 2002-11-14 | Kaio Kitazato | Envelope gene-deficient paramyxovirus vector |
MX340559B (es) | 1999-12-06 | 2016-07-14 | Board Of Trustees Of The Univ Of Illinois | Proteinas de tcr de alta afinidad y metodos. |
DE10109354A1 (de) | 2001-02-27 | 2002-09-05 | Icon Genetics Ag | Rekombinante virale Schaltersysteme |
US20030180756A1 (en) * | 2002-03-21 | 2003-09-25 | Yang Shi | Compositions and methods for suppressing eukaryotic gene expression |
US8784335B2 (en) | 2002-04-19 | 2014-07-22 | Sanofi-Aventis Deutschland Gmbh | Body fluid sampling device with a capacitive sensor |
WO2004098533A2 (en) | 2003-05-05 | 2004-11-18 | Boyce Thompson Institute For Plant Research | Vectors and cells for preparing immunoprotective compositions derived from transgenic plants |
EP1635772A4 (en) * | 2003-05-05 | 2008-02-13 | Dow Agrosciences Llc | STERILE IMMUNOPROPHYLACTIC AND THERAPEUTIC COMPOSITIONS DERIVED FROM TRANSGENIC VEGETABLE CELLS AND METHODS OF PRODUCTION THEREOF |
US8080255B2 (en) | 2003-07-11 | 2011-12-20 | Novavax Inc. | Functional influenza virus like particles (VLPs) |
CN101166827B (zh) | 2005-04-29 | 2013-09-04 | 开普敦大学 | 在植物中表达蛋白质 |
DK1937301T3 (en) * | 2005-10-18 | 2015-07-20 | Novavax Inc | FUNCTIONAL INFLUENZA-like particles (VLPs) |
CA2642644A1 (en) | 2006-02-16 | 2007-09-07 | The Government Of The United States Of America, As Represented By The Se Cretary, Department Of Health And Human Services | Antiviral agents and vaccines against influenza |
EP1991264B1 (en) * | 2006-03-07 | 2015-01-07 | Vaxinnate Corporation | Compositions that include hemagglutinin, methods of making and methods of use thereof |
US7618815B2 (en) | 2006-03-08 | 2009-11-17 | University Of Kentucky Research Foundation | Viral vectors useful in soybean and methods of use |
CA2651907C (en) | 2006-05-22 | 2016-12-20 | Plant Bioscience Limited | Bipartite system, method and composition for the constitutive and inducible expression of high levels of foreign proteins in plants |
KR101586971B1 (ko) | 2006-08-09 | 2016-02-22 | 메디뮨 엘엘씨 | 인플루엔자 헤마글루티닌 및 뉴라미니다제 변이체 |
WO2008148104A1 (en) | 2007-05-25 | 2008-12-04 | Novavax, Inc. | Novel vlps derived from cells that do not express a viral matrix or core protein |
BRPI0812538B1 (pt) | 2007-06-15 | 2021-03-16 | Medicago Inc. | processo para a síntese de uma proteína de interesse com fucosilação e xilosilação reduzidas, ácido nucleico, e proteína híbrida gnt1-galt |
CA2615372A1 (en) * | 2007-07-13 | 2009-01-13 | Marc-Andre D'aoust | Influenza virus-like particles (vlps) comprising hemagglutinin |
CN101978066A (zh) * | 2007-11-27 | 2011-02-16 | 麦迪卡格公司 | 表达血凝素之转基因植物中生产的重组流感病毒样颗粒(vlp) |
GB0800272D0 (en) | 2008-01-08 | 2008-02-13 | Plant Bioscience Ltd | Protein expression systems |
CA2730171C (en) | 2008-07-08 | 2016-10-11 | Medicago Inc. | Soluble recombinant influenza antigens |
CA2730668C (en) | 2008-07-18 | 2020-04-28 | Medicago Inc. | New influenza virus immunizing epitope |
WO2010025285A1 (en) | 2008-08-27 | 2010-03-04 | Arizona Board Of Regents For And On Behalf Of Arizona State University | A dna replicon system for high-level rapid production of vaccines and monoclonal antibody therapeutics in plants |
JP2012521786A (ja) * | 2009-03-30 | 2012-09-20 | モウント シナイ スクール オフ メディシネ | インフルエンザウイルスワクチン及びその使用 |
HUE039100T2 (hu) | 2009-06-24 | 2018-12-28 | Medicago Inc | Hemagglutinint tartalmazó kimer influenzavírus-jellegû részecskék |
FR2947875B1 (fr) | 2009-07-10 | 2011-07-08 | Raymond A & Cie | Dispositif de fixation a elements de fixation multiples dont l'un est flottant |
WO2011011390A1 (en) | 2009-07-20 | 2011-01-27 | Novavax, Inc. | Purified recombinant influenza virus ha proteins |
WO2011028914A1 (en) | 2009-09-04 | 2011-03-10 | Syngenta Participations Ag | Stacking of translational enhancer elements to increase polypeptide expression in plants |
JP2013520167A (ja) | 2010-02-18 | 2013-06-06 | テクノヴァックス,インコーポレイテッド | 万能ウイルス様粒子(vlp)インフルエンザワクチン |
JP6029586B2 (ja) * | 2010-10-04 | 2016-11-24 | マサチューセッツ インスティテュート オブ テクノロジー | 血球凝集素ポリペプチド、ならびにそれに関連する試薬および方法 |
CA2815887C (en) | 2010-11-04 | 2013-12-10 | Medicago Inc. | Plant expression system |
TWI526539B (zh) | 2010-12-22 | 2016-03-21 | 苜蓿股份有限公司 | 植物中生產類病毒顆粒(vlp)的方法及以該方法生產之vlp |
TWI620816B (zh) | 2011-03-23 | 2018-04-11 | 苜蓿股份有限公司 | 植物衍生蛋白回收方法 |
US20140227322A1 (en) | 2011-06-13 | 2014-08-14 | Medicago Inc. | Rabies virus like particle production in plants |
PL220281B1 (pl) | 2011-09-23 | 2015-09-30 | Inst Biochemii I Biofizyki Polskiej Akademii Nauk | Szczepionka DNA, sposób indukowania odpowiedzi immunologicznej, przeciwciała specyficznie rozpoznające białko hemaglutyniny H5 wirusa grypy i zastosowanie szczepionki DNA |
RU2682752C2 (ru) * | 2011-09-30 | 2019-03-21 | Медикаго Инк. | Повышение выхода вирусоподобных частиц в растениях |
US11390878B2 (en) * | 2011-09-30 | 2022-07-19 | Medicago Inc. | Increasing protein yield in plants |
WO2013068593A1 (en) | 2011-11-11 | 2013-05-16 | Philip Morris Products S.A. | Influenza virus -like particles (vlps) comprising hemagglutinin produced nicotiana tabacum |
US9555094B2 (en) | 2012-07-23 | 2017-01-31 | The Institute Of Biological Resources | Isolated nucleic acid for the production of a vaccine against virus |
CN105247059B (zh) * | 2013-03-28 | 2021-07-06 | 莫迪卡戈公司 | 植物中流感样病毒颗粒的产生 |
-
2014
- 2014-03-28 CN CN201480029001.7A patent/CN105247059B/zh active Active
- 2014-03-28 MX MX2015013700A patent/MX2015013700A/es active IP Right Grant
- 2014-03-28 ES ES14773061T patent/ES2803508T3/es active Active
- 2014-03-28 JP JP2016504431A patent/JP2016516415A/ja active Pending
- 2014-03-28 WO PCT/CA2014/050326 patent/WO2014153674A1/en active Application Filing
- 2014-03-28 EP EP14773061.8A patent/EP2978848B1/en active Active
- 2014-03-28 EP EP19206629.8A patent/EP3626827A1/en active Pending
- 2014-03-28 IL IL241692A patent/IL241692B2/en unknown
- 2014-03-28 RU RU2019135043A patent/RU2742607C1/ru active
- 2014-03-28 US US14/779,423 patent/US10358652B2/en active Active
- 2014-03-28 KR KR1020157030865A patent/KR102199018B1/ko active IP Right Grant
- 2014-03-28 CN CN202011519705.6A patent/CN112592389A/zh active Pending
- 2014-03-28 AU AU2014245779A patent/AU2014245779B2/en active Active
- 2014-03-28 CA CA2907591A patent/CA2907591A1/en active Pending
- 2014-03-28 RU RU2015146097A patent/RU2705555C2/ru active
- 2014-03-28 SG SG11201507928QA patent/SG11201507928QA/en unknown
- 2014-03-28 IL IL295155A patent/IL295155A/en unknown
-
2015
- 2015-09-23 PH PH12015502217A patent/PH12015502217A1/en unknown
- 2015-10-26 ZA ZA2015/08327A patent/ZA201508327B/en unknown
-
2016
- 2016-07-25 HK HK16108877.3A patent/HK1220729A1/zh not_active IP Right Cessation
-
2019
- 2019-03-29 JP JP2019067570A patent/JP7065803B2/ja active Active
- 2019-07-19 US US16/516,802 patent/US11085049B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010003225A1 (en) * | 2008-07-11 | 2010-01-14 | Medicago, Inc. | Influenza virus-like particles (vlps) comprising hemagglutinin |
WO2011035422A1 (en) * | 2009-09-22 | 2011-03-31 | Medicago Inc. | Method of preparing plant-derived vlps |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102199018B1 (ko) | 식물에서 인플루엔자 바이러스-유사 입자 생산 | |
KR101956910B1 (ko) | 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs) | |
DK2610345T3 (en) | RECOMBINANT INFLUENZA VIRUS SIMULAR PARTICULARS (VLPS) MADE IN TRANSGENE PLANTS THAT EXPRESS HEMAGGLUTININ | |
KR101541330B1 (ko) | 식물에서 생산된 헤마글루티닌을 포함하는 인플루엔자 바이러스-유사 입자(VLPs) | |
DK2445928T3 (en) | CHEMICAL INFLUENZA VIRUS-LIKE PARTICLES INCLUDING HEMAGGLUTIN | |
KR101974017B1 (ko) | 식물에서 바이러스-유사 입자 수득율을 증가시키는 방법 | |
KR101963792B1 (ko) | 식물에서 광견병 바이러스 유사 입자 생성 | |
IL263643B (en) | Air intake system for engines | |
TW201233804A (en) | Virus-like particle production in plants | |
JP2024050651A (ja) | インフルエンザウイルスヘマグルチニン変異体 | |
JP2023539356A (ja) | 改変コロナウイルス構造タンパク質 | |
US20220145317A1 (en) | Influenza virus-like particle production in plants | |
RU2809237C2 (ru) | Мутанты гемагглютинина вируса гриппа | |
RU2801708C2 (ru) | Мутанты гемагглютинина вируса гриппа | |
CN116457008A (zh) | 经修饰的冠状病毒结构蛋白 | |
NZ712752B2 (en) | Influenza virus-like particle production in plants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |