KR102709778B1 - 미세부수체 불안정성(msi) 암의 예방 및 치료를 위한 공유된 종양 신생항원을 기반으로 한 범용 백신 - Google Patents
미세부수체 불안정성(msi) 암의 예방 및 치료를 위한 공유된 종양 신생항원을 기반으로 한 범용 백신 Download PDFInfo
- Publication number
- KR102709778B1 KR102709778B1 KR1020207000642A KR20207000642A KR102709778B1 KR 102709778 B1 KR102709778 B1 KR 102709778B1 KR 1020207000642 A KR1020207000642 A KR 1020207000642A KR 20207000642 A KR20207000642 A KR 20207000642A KR 102709778 B1 KR102709778 B1 KR 102709778B1
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- leu
- arg
- pro
- thr
- Prior art date
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 239
- 208000032818 Microsatellite Instability Diseases 0.000 title claims abstract description 108
- 238000011282 treatment Methods 0.000 title claims abstract description 33
- 230000002265 prevention Effects 0.000 title claims abstract description 29
- 229960005486 vaccine Drugs 0.000 title abstract description 37
- 150000001413 amino acids Chemical class 0.000 claims abstract description 247
- 230000037433 frameshift Effects 0.000 claims abstract description 209
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 151
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 135
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 123
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 123
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 108
- 239000013598 vector Substances 0.000 claims abstract description 77
- 238000009566 cancer vaccine Methods 0.000 claims abstract description 11
- 229940022399 cancer vaccine Drugs 0.000 claims abstract description 11
- 238000004519 manufacturing process Methods 0.000 claims abstract description 11
- 201000011510 cancer Diseases 0.000 claims description 162
- 108090000623 proteins and genes Proteins 0.000 claims description 124
- 230000035772 mutation Effects 0.000 claims description 93
- 239000012634 fragment Substances 0.000 claims description 82
- 229920001184 polypeptide Polymers 0.000 claims description 64
- 241000701161 unidentified adenovirus Species 0.000 claims description 64
- 239000013604 expression vector Substances 0.000 claims description 61
- 210000004027 cell Anatomy 0.000 claims description 51
- 239000002773 nucleotide Substances 0.000 claims description 51
- 125000003729 nucleotide group Chemical group 0.000 claims description 51
- 108020004999 messenger RNA Proteins 0.000 claims description 46
- 102000004169 proteins and genes Human genes 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 40
- 206010009944 Colon cancer Diseases 0.000 claims description 35
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 31
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 31
- 206010014759 Endometrial neoplasm Diseases 0.000 claims description 30
- 230000005847 immunogenicity Effects 0.000 claims description 30
- 230000027455 binding Effects 0.000 claims description 28
- 206010017758 gastric cancer Diseases 0.000 claims description 28
- 201000011549 stomach cancer Diseases 0.000 claims description 28
- 206010014733 Endometrial cancer Diseases 0.000 claims description 26
- 239000000203 mixture Substances 0.000 claims description 26
- 108020004705 Codon Proteins 0.000 claims description 25
- 239000002671 adjuvant Substances 0.000 claims description 24
- 238000012217 deletion Methods 0.000 claims description 19
- 230000037430 deletion Effects 0.000 claims description 19
- 238000013519 translation Methods 0.000 claims description 19
- 238000009826 distribution Methods 0.000 claims description 16
- 238000002255 vaccination Methods 0.000 claims description 16
- 239000008194 pharmaceutical composition Substances 0.000 claims description 14
- 241000700605 Viruses Species 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 230000033607 mismatch repair Effects 0.000 claims description 12
- 230000001186 cumulative effect Effects 0.000 claims description 10
- 108700028369 Alleles Proteins 0.000 claims description 8
- 108090000144 Human Proteins Proteins 0.000 claims description 8
- 102000003839 Human Proteins Human genes 0.000 claims description 8
- 241000282577 Pan troglodytes Species 0.000 claims description 8
- 210000004602 germ cell Anatomy 0.000 claims description 7
- 230000010076 replication Effects 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000011144 upstream manufacturing Methods 0.000 claims description 7
- 208000003174 Brain Neoplasms Diseases 0.000 claims description 6
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 6
- 101150084967 EPCAM gene Proteins 0.000 claims description 6
- 206010033128 Ovarian cancer Diseases 0.000 claims description 6
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 6
- 208000000453 Skin Neoplasms Diseases 0.000 claims description 6
- 101150057140 TACSTD1 gene Proteins 0.000 claims description 6
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 claims description 6
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 claims description 6
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 6
- 201000010881 cervical cancer Diseases 0.000 claims description 6
- 230000001965 increasing effect Effects 0.000 claims description 6
- 201000007270 liver cancer Diseases 0.000 claims description 6
- 208000014018 liver neoplasm Diseases 0.000 claims description 6
- 201000002120 neuroendocrine carcinoma Diseases 0.000 claims description 6
- 239000002245 particle Substances 0.000 claims description 6
- 201000000849 skin cancer Diseases 0.000 claims description 6
- 208000037965 uterine sarcoma Diseases 0.000 claims description 6
- 108010065805 Interleukin-12 Proteins 0.000 claims description 5
- 102000013462 Interleukin-12 Human genes 0.000 claims description 5
- 108010002350 Interleukin-2 Proteins 0.000 claims description 5
- 102000000588 Interleukin-2 Human genes 0.000 claims description 5
- 208000005016 Intestinal Neoplasms Diseases 0.000 claims description 5
- 201000002313 intestinal cancer Diseases 0.000 claims description 5
- 230000034512 ubiquitination Effects 0.000 claims description 5
- 238000010798 ubiquitination Methods 0.000 claims description 5
- 108050006400 Cyclin Proteins 0.000 claims description 4
- 102000016736 Cyclin Human genes 0.000 claims description 4
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 claims description 4
- 206010014611 Encephalitis venezuelan equine Diseases 0.000 claims description 4
- 241000282575 Gorilla Species 0.000 claims description 4
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 claims description 4
- 102000003812 Interleukin-15 Human genes 0.000 claims description 4
- 108090000172 Interleukin-15 Proteins 0.000 claims description 4
- 102000015696 Interleukins Human genes 0.000 claims description 4
- 108010063738 Interleukins Proteins 0.000 claims description 4
- 241000710961 Semliki Forest virus Species 0.000 claims description 4
- 208000002687 Venezuelan Equine Encephalomyelitis Diseases 0.000 claims description 4
- 201000009145 Venezuelan equine encephalitis Diseases 0.000 claims description 4
- 241000607479 Yersinia pestis Species 0.000 claims description 4
- 230000006378 damage Effects 0.000 claims description 4
- 238000003745 diagnosis Methods 0.000 claims description 4
- 229940117681 interleukin-12 Drugs 0.000 claims description 4
- 108010028930 invariant chain Proteins 0.000 claims description 4
- 239000003446 ligand Substances 0.000 claims description 4
- 230000010741 sumoylation Effects 0.000 claims description 4
- 102100028843 DNA mismatch repair protein Mlh1 Human genes 0.000 claims description 3
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 claims description 3
- 238000001712 DNA sequencing Methods 0.000 claims description 3
- 102000012804 EPCAM Human genes 0.000 claims description 3
- 102100031940 Epithelial cell adhesion molecule Human genes 0.000 claims description 3
- 101000577853 Homo sapiens DNA mismatch repair protein Mlh1 Proteins 0.000 claims description 3
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 claims description 3
- 108010074346 Mismatch Repair Endonuclease PMS2 Proteins 0.000 claims description 3
- 102100037480 Mismatch repair endonuclease PMS2 Human genes 0.000 claims description 3
- 206010046865 Vaccinia virus infection Diseases 0.000 claims description 3
- 239000002502 liposome Substances 0.000 claims description 3
- 239000013612 plasmid Substances 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 208000007089 vaccinia Diseases 0.000 claims description 3
- 239000013603 viral vector Substances 0.000 claims description 3
- 241000710929 Alphavirus Species 0.000 claims description 2
- 241000701022 Cytomegalovirus Species 0.000 claims description 2
- 241000701024 Human betaherpesvirus 5 Species 0.000 claims description 2
- 241000713666 Lentivirus Species 0.000 claims description 2
- 241000701033 Simian cytomegalovirus Species 0.000 claims description 2
- 241000700618 Vaccinia virus Species 0.000 claims description 2
- 210000004698 lymphocyte Anatomy 0.000 claims description 2
- 241001430294 unidentified retrovirus Species 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 4
- 102100040678 Programmed cell death protein 1 Human genes 0.000 claims 2
- 241000282414 Homo sapiens Species 0.000 description 285
- 235000001014 amino acid Nutrition 0.000 description 180
- 229940024606 amino acid Drugs 0.000 description 168
- 231100000221 frame shift mutation induction Toxicity 0.000 description 53
- 235000018102 proteins Nutrition 0.000 description 43
- 108010054155 lysyllysine Proteins 0.000 description 35
- 239000000523 sample Substances 0.000 description 35
- 230000000890 antigenic effect Effects 0.000 description 33
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 31
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 26
- 210000001744 T-lymphocyte Anatomy 0.000 description 26
- 108010026333 seryl-proline Proteins 0.000 description 26
- 230000028993 immune response Effects 0.000 description 24
- 230000002163 immunogen Effects 0.000 description 23
- 239000000427 antigen Substances 0.000 description 22
- 108091007433 antigens Proteins 0.000 description 22
- 102000036639 antigens Human genes 0.000 description 22
- 108091034131 VA RNA Proteins 0.000 description 21
- 238000006467 substitution reaction Methods 0.000 description 21
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 18
- 108010062796 arginyllysine Proteins 0.000 description 17
- 241000880493 Leptailurus serval Species 0.000 description 16
- 108010025306 histidylleucine Proteins 0.000 description 16
- -1 glycosylation Chemical class 0.000 description 15
- 108010057821 leucylproline Proteins 0.000 description 15
- 108010031719 prolyl-serine Proteins 0.000 description 15
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 14
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 14
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 229920002477 rna polymer Polymers 0.000 description 14
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 108010074328 Interferon-gamma Proteins 0.000 description 12
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 12
- 108010087924 alanylproline Proteins 0.000 description 12
- 108010050848 glycylleucine Proteins 0.000 description 12
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 11
- 101710094396 Hexon protein Proteins 0.000 description 11
- NTIZESTWPVYFNL-UHFFFAOYSA-N Methyl isobutyl ketone Chemical compound CC(C)CC(C)=O NTIZESTWPVYFNL-UHFFFAOYSA-N 0.000 description 11
- 108010068380 arginylarginine Proteins 0.000 description 11
- 108010064235 lysylglycine Proteins 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- CXURGFRDGROIKG-UHFFFAOYSA-N 3,3-bis(chloromethyl)oxetane Chemical compound ClCC1(CCl)COC1 CXURGFRDGROIKG-UHFFFAOYSA-N 0.000 description 10
- 241000699670 Mus sp. Species 0.000 description 10
- 108010060199 cysteinylproline Proteins 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- 108010004914 prolylarginine Proteins 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- 108010004073 cysteinylcysteine Proteins 0.000 description 9
- 108010016616 cysteinylglycine Proteins 0.000 description 9
- 208000035475 disorder Diseases 0.000 description 9
- 108010018006 histidylserine Proteins 0.000 description 9
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 9
- 108010077112 prolyl-proline Proteins 0.000 description 9
- 108010053725 prolylvaline Proteins 0.000 description 9
- 108010071207 serylmethionine Proteins 0.000 description 9
- 108010061238 threonyl-glycine Proteins 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 101710145505 Fiber protein Proteins 0.000 description 8
- 102100037850 Interferon gamma Human genes 0.000 description 8
- 108091008874 T cell receptors Proteins 0.000 description 8
- 230000005867 T cell response Effects 0.000 description 8
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 8
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 8
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 8
- 238000010212 intracellular staining Methods 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 239000000546 pharmaceutical excipient Substances 0.000 description 8
- 108010090894 prolylleucine Proteins 0.000 description 8
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 7
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 7
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 7
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 7
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 7
- 108091092878 Microsatellite Proteins 0.000 description 7
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 7
- 101150006914 TRP1 gene Proteins 0.000 description 7
- 239000004480 active ingredient Substances 0.000 description 7
- 108010044940 alanylglutamine Proteins 0.000 description 7
- 239000000969 carrier Substances 0.000 description 7
- 239000000835 fiber Substances 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 239000003826 tablet Substances 0.000 description 7
- 108010038745 tryptophylglycine Proteins 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 6
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 6
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 6
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 6
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 6
- 101710087110 ORF6 protein Proteins 0.000 description 6
- 101710173835 Penton protein Proteins 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 6
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 6
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 6
- 101710095001 Uncharacterized protein in nifU 5'region Proteins 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 6
- 108010060035 arginylproline Proteins 0.000 description 6
- 238000001574 biopsy Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 108010028295 histidylhistidine Proteins 0.000 description 6
- 108010085325 histidylproline Proteins 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 108010038320 lysylphenylalanine Proteins 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 239000000843 powder Substances 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 108010048818 seryl-histidine Proteins 0.000 description 6
- 108010080629 tryptophan-leucine Proteins 0.000 description 6
- 108010084932 tryptophyl-proline Proteins 0.000 description 6
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 5
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 5
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 5
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 5
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 5
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 5
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 5
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 5
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 5
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 5
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 5
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 5
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 5
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 5
- 108010070944 alanylhistidine Proteins 0.000 description 5
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 5
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 5
- 239000002775 capsule Substances 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 5
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 230000009870 specific binding Effects 0.000 description 5
- 210000004988 splenocyte Anatomy 0.000 description 5
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- 101000621943 Acholeplasma phage L2 Probable integrase/recombinase Proteins 0.000 description 4
- 101000768957 Acholeplasma phage L2 Uncharacterized 37.2 kDa protein Proteins 0.000 description 4
- 101000823746 Acidianus ambivalens Uncharacterized 17.7 kDa protein in bps2 3'region Proteins 0.000 description 4
- 101000916369 Acidianus ambivalens Uncharacterized protein in sor 5'region Proteins 0.000 description 4
- 101000769342 Acinetobacter guillouiae Uncharacterized protein in rpoN-murA intergenic region Proteins 0.000 description 4
- 101000823696 Actinobacillus pleuropneumoniae Uncharacterized glycosyltransferase in aroQ 3'region Proteins 0.000 description 4
- 108700026758 Adenovirus hexon capsid Proteins 0.000 description 4
- 101000786513 Agrobacterium tumefaciens (strain 15955) Uncharacterized protein outside the virF region Proteins 0.000 description 4
- 101000618005 Alkalihalobacillus pseudofirmus (strain ATCC BAA-2126 / JCM 17055 / OF4) Uncharacterized protein BpOF4_00885 Proteins 0.000 description 4
- 101000618348 Allochromatium vinosum (strain ATCC 17899 / DSM 180 / NBRC 103801 / NCIMB 10441 / D) Uncharacterized protein Alvin_0065 Proteins 0.000 description 4
- 102100020724 Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Human genes 0.000 description 4
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 4
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 4
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 4
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 4
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 4
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 4
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 4
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 4
- 101000781117 Autographa californica nuclear polyhedrosis virus Uncharacterized 12.4 kDa protein in CTL-LEF2 intergenic region Proteins 0.000 description 4
- 101000967489 Azorhizobium caulinodans (strain ATCC 43989 / DSM 5975 / JCM 20966 / LMG 6465 / NBRC 14845 / NCIMB 13405 / ORS 571) Uncharacterized protein AZC_3924 Proteins 0.000 description 4
- 101000708323 Azospirillum brasilense Uncharacterized 28.8 kDa protein in nifR3-like 5'region Proteins 0.000 description 4
- 101000770311 Azotobacter chroococcum mcd 1 Uncharacterized 19.8 kDa protein in nifW 5'region Proteins 0.000 description 4
- 101000823761 Bacillus licheniformis Uncharacterized 9.4 kDa protein in flaL 3'region Proteins 0.000 description 4
- 101000819719 Bacillus methanolicus Uncharacterized N-acetyltransferase in lysA 3'region Proteins 0.000 description 4
- 101000789586 Bacillus subtilis (strain 168) UPF0702 transmembrane protein YkjA Proteins 0.000 description 4
- 101000748761 Bacillus subtilis (strain 168) Uncharacterized MFS-type transporter YcxA Proteins 0.000 description 4
- 101000792624 Bacillus subtilis (strain 168) Uncharacterized protein YbxH Proteins 0.000 description 4
- 101000790792 Bacillus subtilis (strain 168) Uncharacterized protein YckC Proteins 0.000 description 4
- 101000765620 Bacillus subtilis (strain 168) Uncharacterized protein YlxP Proteins 0.000 description 4
- 101000819705 Bacillus subtilis (strain 168) Uncharacterized protein YlxR Proteins 0.000 description 4
- 101000916134 Bacillus subtilis (strain 168) Uncharacterized protein YqxJ Proteins 0.000 description 4
- 101000948218 Bacillus subtilis (strain 168) Uncharacterized protein YtxJ Proteins 0.000 description 4
- 101000718627 Bacillus thuringiensis subsp. kurstaki Putative RNA polymerase sigma-G factor Proteins 0.000 description 4
- 101000641200 Bombyx mori densovirus Putative non-structural protein Proteins 0.000 description 4
- 101000754349 Bordetella pertussis (strain Tohama I / ATCC BAA-589 / NCTC 13251) UPF0065 protein BP0148 Proteins 0.000 description 4
- 101000827633 Caldicellulosiruptor sp. (strain Rt8B.4) Uncharacterized 23.9 kDa protein in xynA 3'region Proteins 0.000 description 4
- 101000947628 Claviceps purpurea Uncharacterized 11.8 kDa protein Proteins 0.000 description 4
- 101000947633 Claviceps purpurea Uncharacterized 13.8 kDa protein Proteins 0.000 description 4
- 101000686796 Clostridium perfringens Replication protein Proteins 0.000 description 4
- 101000948901 Enterobacteria phage T4 Uncharacterized 16.0 kDa protein in segB-ipI intergenic region Proteins 0.000 description 4
- 101000805958 Equine herpesvirus 4 (strain 1942) Virion protein US10 homolog Proteins 0.000 description 4
- 101000790442 Escherichia coli Insertion element IS2 uncharacterized 11.1 kDa protein Proteins 0.000 description 4
- 101000788129 Escherichia coli Uncharacterized protein in sul1 3'region Proteins 0.000 description 4
- 101000788370 Escherichia phage P2 Uncharacterized 12.9 kDa protein in GpA 3'region Proteins 0.000 description 4
- 101000788354 Escherichia phage P2 Uncharacterized 8.2 kDa protein in gpA 5'region Proteins 0.000 description 4
- 101000770304 Frankia alni UPF0460 protein in nifX-nifW intergenic region Proteins 0.000 description 4
- 101000797344 Geobacillus stearothermophilus Putative tRNA (cytidine(34)-2'-O)-methyltransferase Proteins 0.000 description 4
- 101000748410 Geobacillus stearothermophilus Uncharacterized protein in fumA 3'region Proteins 0.000 description 4
- 101000787096 Geobacillus stearothermophilus Uncharacterized protein in gldA 3'region Proteins 0.000 description 4
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 4
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 4
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 4
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 4
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical group C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 4
- 101000772675 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) UPF0438 protein HI_0847 Proteins 0.000 description 4
- 101000631019 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) Uncharacterized protein HI_0350 Proteins 0.000 description 4
- 101000976889 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 19.2 kDa protein in cox-rep intergenic region Proteins 0.000 description 4
- 101000768938 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 8.9 kDa protein in int-C1 intergenic region Proteins 0.000 description 4
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 4
- 206010051922 Hereditary non-polyposis colorectal cancer syndrome Diseases 0.000 description 4
- 102000008949 Histocompatibility Antigens Class I Human genes 0.000 description 4
- 101000785414 Homo sapiens Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Proteins 0.000 description 4
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 4
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 description 4
- 101000666856 Homo sapiens Vasoactive intestinal polypeptide receptor 1 Proteins 0.000 description 4
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 4
- 102000008070 Interferon-gamma Human genes 0.000 description 4
- 102100024407 Jouberin Human genes 0.000 description 4
- 101000782488 Junonia coenia densovirus (isolate pBRJ/1990) Putative non-structural protein NS2 Proteins 0.000 description 4
- 101000827627 Klebsiella pneumoniae Putative low molecular weight protein-tyrosine-phosphatase Proteins 0.000 description 4
- 101000811523 Klebsiella pneumoniae Uncharacterized 55.8 kDa protein in cps region Proteins 0.000 description 4
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 4
- 101000818409 Lactococcus lactis subsp. lactis Uncharacterized HTH-type transcriptional regulator in lacX 3'region Proteins 0.000 description 4
- 101000878851 Leptolyngbya boryana Putative Fe(2+) transport protein A Proteins 0.000 description 4
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 4
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 4
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 4
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 4
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- 201000005027 Lynch syndrome Diseases 0.000 description 4
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 4
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 4
- 108091054437 MHC class I family Proteins 0.000 description 4
- 101000758828 Methanosarcina barkeri (strain Fusaro / DSM 804) Uncharacterized protein Mbar_A1602 Proteins 0.000 description 4
- 101001122401 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF3 Proteins 0.000 description 4
- 101001130841 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF5 Proteins 0.000 description 4
- 241000699660 Mus musculus Species 0.000 description 4
- 101001055788 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) Pentapeptide repeat protein MfpA Proteins 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 101000740670 Orgyia pseudotsugata multicapsid polyhedrosis virus Protein C42 Proteins 0.000 description 4
- 101000769182 Photorhabdus luminescens Uncharacterized protein in pnp 3'region Proteins 0.000 description 4
- 101710159752 Poly(3-hydroxyalkanoate) polymerase subunit PhaE Proteins 0.000 description 4
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 4
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 4
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 4
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 4
- 101710130262 Probable Vpr-like protein Proteins 0.000 description 4
- 108010029485 Protein Isoforms Proteins 0.000 description 4
- 102000001708 Protein Isoforms Human genes 0.000 description 4
- 101000961392 Pseudescherichia vulneris Uncharacterized 29.9 kDa protein in crtE 3'region Proteins 0.000 description 4
- 101000731030 Pseudomonas oleovorans Poly(3-hydroxyalkanoate) polymerase 2 Proteins 0.000 description 4
- 101001065485 Pseudomonas putida Probable fatty acid methyltransferase Proteins 0.000 description 4
- 101000711023 Rhizobium leguminosarum bv. trifolii Uncharacterized protein in tfuA 3'region Proteins 0.000 description 4
- 101000974028 Rhizobium leguminosarum bv. viciae (strain 3841) Putative cystathionine beta-lyase Proteins 0.000 description 4
- 101000756519 Rhodobacter capsulatus (strain ATCC BAA-309 / NBRC 16581 / SB1003) Uncharacterized protein RCAP_rcc00048 Proteins 0.000 description 4
- 101000948219 Rhodococcus erythropolis Uncharacterized 11.5 kDa protein in thcD 3'region Proteins 0.000 description 4
- 101000948156 Rhodococcus erythropolis Uncharacterized 47.3 kDa protein in thcA 5'region Proteins 0.000 description 4
- 101000917565 Rhodococcus fascians Uncharacterized 33.6 kDa protein in fasciation locus Proteins 0.000 description 4
- 101000790284 Saimiriine herpesvirus 2 (strain 488) Uncharacterized 9.5 kDa protein in DHFR 3'region Proteins 0.000 description 4
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 4
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 4
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 4
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 4
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 4
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 4
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 4
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 4
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- 101000936719 Streptococcus gordonii Accessory Sec system protein Asp3 Proteins 0.000 description 4
- 101000936711 Streptococcus gordonii Accessory secretory protein Asp4 Proteins 0.000 description 4
- 101000929863 Streptomyces cinnamonensis Monensin polyketide synthase putative ketoacyl reductase Proteins 0.000 description 4
- 101000788499 Streptomyces coelicolor Uncharacterized oxidoreductase in mprA 5'region Proteins 0.000 description 4
- 101000788468 Streptomyces coelicolor Uncharacterized protein in mprR 3'region Proteins 0.000 description 4
- 101001102841 Streptomyces griseus Purine nucleoside phosphorylase ORF3 Proteins 0.000 description 4
- 101000708557 Streptomyces lincolnensis Uncharacterized 17.2 kDa protein in melC2-rnhH intergenic region Proteins 0.000 description 4
- 101000845085 Streptomyces violaceoruber Granaticin polyketide synthase putative ketoacyl reductase 1 Proteins 0.000 description 4
- 101000649826 Thermotoga neapolitana Putative anti-sigma factor antagonist TM1081 homolog Proteins 0.000 description 4
- 101000711771 Thiocystis violacea Uncharacterized 76.5 kDa protein in phbC 3'region Proteins 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 4
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 4
- 102100038388 Vasoactive intestinal polypeptide receptor 1 Human genes 0.000 description 4
- 101000711318 Vibrio alginolyticus Uncharacterized 11.6 kDa protein in scrR 3'region Proteins 0.000 description 4
- 101000827562 Vibrio alginolyticus Uncharacterized protein in proC 3'region Proteins 0.000 description 4
- 101000778915 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) Uncharacterized membrane protein VP2115 Proteins 0.000 description 4
- 108700025771 adenovirus penton Proteins 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 210000003719 b-lymphocyte Anatomy 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 239000003937 drug carrier Substances 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 230000013595 glycosylation Effects 0.000 description 4
- 238000006206 glycosylation reaction Methods 0.000 description 4
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 210000000987 immune system Anatomy 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 229960003130 interferon gamma Drugs 0.000 description 4
- 108010027338 isoleucylcysteine Proteins 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 108010085203 methionylmethionine Proteins 0.000 description 4
- 230000037452 priming Effects 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 238000011830 transgenic mouse model Methods 0.000 description 4
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 3
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 3
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 3
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 3
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 3
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 3
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 3
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 3
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 3
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 3
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 3
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 3
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 3
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 3
- POZKLUIXMHIULG-FDARSICLSA-N Arg-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N POZKLUIXMHIULG-FDARSICLSA-N 0.000 description 3
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 3
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 3
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 3
- OSZBYGVKAFZWKC-FXQIFTODSA-N Asn-Pro-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O OSZBYGVKAFZWKC-FXQIFTODSA-N 0.000 description 3
- 108091008875 B cell receptors Proteins 0.000 description 3
- 102100021277 Beta-secretase 2 Human genes 0.000 description 3
- 101710150190 Beta-secretase 2 Proteins 0.000 description 3
- 108090000565 Capsid Proteins Proteins 0.000 description 3
- 102100023321 Ceruloplasmin Human genes 0.000 description 3
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 3
- WTNLLMQAFPOCTJ-GARJFASQSA-N Cys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N)C(=O)O WTNLLMQAFPOCTJ-GARJFASQSA-N 0.000 description 3
- SRZZZTMJARUVPI-JBDRJPRFSA-N Cys-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N SRZZZTMJARUVPI-JBDRJPRFSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 3
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 3
- FYAULIGIFPPOAA-ZPFDUUQYSA-N Gln-Ile-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O FYAULIGIFPPOAA-ZPFDUUQYSA-N 0.000 description 3
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 3
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 3
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 3
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 3
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 3
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 3
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 3
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 3
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 3
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 3
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 3
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 3
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 3
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 3
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 3
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 3
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 3
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 3
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 3
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 3
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 3
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 3
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 3
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 3
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 3
- 102000043131 MHC class II family Human genes 0.000 description 3
- 108091054438 MHC class II family Proteins 0.000 description 3
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 3
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 3
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 3
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 3
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 3
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 3
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 3
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 3
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 3
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 3
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 3
- XNJVJEHDZPDPQL-BZSNNMDCSA-N Pro-Trp-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H]1CCCN1)C(O)=O XNJVJEHDZPDPQL-BZSNNMDCSA-N 0.000 description 3
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 3
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 3
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 3
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 3
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 3
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 3
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 3
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 3
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 3
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 3
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 3
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 3
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 3
- JOHPFOKBAAOQDI-UBHSHLNASA-N Ser-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JOHPFOKBAAOQDI-UBHSHLNASA-N 0.000 description 3
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 3
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 3
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 3
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 3
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 3
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 3
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 3
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 3
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 3
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 3
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 3
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 3
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 3
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000002552 dosage form Substances 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 239000007937 lozenge Substances 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000006187 pill Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000000829 suppository Substances 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 3
- 108010045269 tryptophyltryptophan Proteins 0.000 description 3
- 230000005924 vaccine-induced immune response Effects 0.000 description 3
- 210000002845 virion Anatomy 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- 108010036211 5-HT-moduline Proteins 0.000 description 2
- 101000787132 Acidithiobacillus ferridurans Uncharacterized 8.2 kDa protein in mobL 3'region Proteins 0.000 description 2
- 101000827262 Acidithiobacillus ferrooxidans Uncharacterized 18.9 kDa protein in mobE 3'region Proteins 0.000 description 2
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- 108010076441 Ala-His-His Proteins 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 2
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 2
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 102100026882 Alpha-synuclein Human genes 0.000 description 2
- 101000811747 Antithamnion sp. UPF0051 protein in atpA 3'region Proteins 0.000 description 2
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 2
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 2
- YWENWUYXQUWRHQ-LPEHRKFASA-N Arg-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O YWENWUYXQUWRHQ-LPEHRKFASA-N 0.000 description 2
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 2
- BJNUAWGXPSHQMJ-DCAQKATOSA-N Arg-Gln-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O BJNUAWGXPSHQMJ-DCAQKATOSA-N 0.000 description 2
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 2
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 2
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 2
- XFXZKCRBBOVJKS-BVSLBCMMSA-N Arg-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XFXZKCRBBOVJKS-BVSLBCMMSA-N 0.000 description 2
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 2
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 2
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 2
- FXGMURPOWCKNAZ-JYJNAYRXSA-N Arg-Val-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FXGMURPOWCKNAZ-JYJNAYRXSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 2
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 2
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 2
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 2
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 2
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 2
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 2
- 101000827607 Bacillus phage SPP1 Uncharacterized 8.5 kDa protein in GP2-GP6 intergenic region Proteins 0.000 description 2
- 101000961975 Bacillus thuringiensis Uncharacterized 13.4 kDa protein Proteins 0.000 description 2
- 101000964407 Caldicellulosiruptor saccharolyticus Uncharacterized 10.7 kDa protein in xynB 3'region Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 102100031725 Cortactin-binding protein 2 Human genes 0.000 description 2
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 2
- SURTWIXUHQNUGN-GUBZILKMSA-N Cys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N SURTWIXUHQNUGN-GUBZILKMSA-N 0.000 description 2
- BYALSSDCQYHKMY-XGEHTFHBSA-N Cys-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O BYALSSDCQYHKMY-XGEHTFHBSA-N 0.000 description 2
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 2
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 2
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 2
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 2
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 2
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 2
- SWJYSDXMTPMBHO-FXQIFTODSA-N Cys-Pro-Ser Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SWJYSDXMTPMBHO-FXQIFTODSA-N 0.000 description 2
- BCWIFCLVCRAIQK-ZLUOBGJFSA-N Cys-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O BCWIFCLVCRAIQK-ZLUOBGJFSA-N 0.000 description 2
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 2
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 2
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 2
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 2
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 2
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 2
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 2
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 2
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 2
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 2
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 2
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 2
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 2
- GJLXZITZLUUXMJ-NHCYSSNCSA-N Gln-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GJLXZITZLUUXMJ-NHCYSSNCSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- GHHAMXVMWXMGSV-STQMWFEESA-N Gly-Cys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O)=CNC2=C1 GHHAMXVMWXMGSV-STQMWFEESA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 2
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 2
- ZWRDOVYMQAAISL-UWVGGRQHSA-N Gly-Met-Lys Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCCN ZWRDOVYMQAAISL-UWVGGRQHSA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 101000768777 Haloferax lucentense (strain DSM 14919 / JCM 9276 / NCIMB 13854 / Aa 2.2) Uncharacterized 50.6 kDa protein in the 5'region of gyrA and gyrB Proteins 0.000 description 2
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 2
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 2
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 2
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 2
- PFOUFRJYHWZJKW-NKIYYHGXSA-N His-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O PFOUFRJYHWZJKW-NKIYYHGXSA-N 0.000 description 2
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 2
- 108010088652 Histocompatibility Antigens Class I Proteins 0.000 description 2
- 241001272567 Hominoidea Species 0.000 description 2
- 241001135569 Human adenovirus 5 Species 0.000 description 2
- 101001082397 Human adenovirus B serotype 3 Hexon-associated protein Proteins 0.000 description 2
- 241000193096 Human adenovirus B3 Species 0.000 description 2
- 101000908757 Human adenovirus C serotype 2 Early 4 ORF4 protein Proteins 0.000 description 2
- 241000598171 Human adenovirus sp. Species 0.000 description 2
- 101150032643 IVa2 gene Proteins 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 2
- JHCVYQKVKOLAIU-NAKRPEOUSA-N Ile-Cys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N JHCVYQKVKOLAIU-NAKRPEOUSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- 229940125581 ImmunityBio COVID-19 vaccine Drugs 0.000 description 2
- 101000607404 Infectious laryngotracheitis virus (strain Thorne V882) Protein UL24 homolog Proteins 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 101000735632 Klebsiella pneumoniae Uncharacterized 8.8 kDa protein in aacA4 3'region Proteins 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 2
- QKIBIXAQKAFZGL-GUBZILKMSA-N Leu-Cys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QKIBIXAQKAFZGL-GUBZILKMSA-N 0.000 description 2
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 2
- PIHFVNPEAHFNLN-KKUMJFAQSA-N Leu-Cys-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N PIHFVNPEAHFNLN-KKUMJFAQSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- DXYBNWJZJVSZAE-GUBZILKMSA-N Leu-Gln-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DXYBNWJZJVSZAE-GUBZILKMSA-N 0.000 description 2
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 2
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 2
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 2
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 2
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 2
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 2
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 2
- GOVDTWNJCBRRBJ-DCAQKATOSA-N Lys-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N GOVDTWNJCBRRBJ-DCAQKATOSA-N 0.000 description 2
- KVNLHIXLLZBAFQ-RWMBFGLXSA-N Lys-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N KVNLHIXLLZBAFQ-RWMBFGLXSA-N 0.000 description 2
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 2
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 2
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 2
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 2
- 102000043129 MHC class I family Human genes 0.000 description 2
- QRHWTCJBCLGYRB-FXQIFTODSA-N Met-Ala-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O QRHWTCJBCLGYRB-FXQIFTODSA-N 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 2
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 2
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 2
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 2
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 2
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 2
- SPXWRYVHOZVYBU-ULQDDVLXSA-N Phe-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N SPXWRYVHOZVYBU-ULQDDVLXSA-N 0.000 description 2
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- ILGCZYGFYQLSDZ-KKUMJFAQSA-N Phe-Ser-His Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ILGCZYGFYQLSDZ-KKUMJFAQSA-N 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- XZGWNSIRZIUHHP-SRVKXCTJSA-N Pro-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 XZGWNSIRZIUHHP-SRVKXCTJSA-N 0.000 description 2
- FKKHDBFNOLCYQM-FXQIFTODSA-N Pro-Cys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O FKKHDBFNOLCYQM-FXQIFTODSA-N 0.000 description 2
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 2
- PTLOFJZJADCNCD-DCAQKATOSA-N Pro-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 PTLOFJZJADCNCD-DCAQKATOSA-N 0.000 description 2
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 2
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 2
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 2
- XSXABUHLKPUVLX-JYJNAYRXSA-N Pro-Ser-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O XSXABUHLKPUVLX-JYJNAYRXSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 2
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 2
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- 101710197985 Probable protein Rev Proteins 0.000 description 2
- 102100040307 Protein FAM3B Human genes 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 101001120093 Pseudoalteromonas phage PM2 Protein P8 Proteins 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 108010025216 RVF peptide Proteins 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 2
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 2
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 2
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 2
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 2
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 2
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 2
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 2
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 2
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 2
- FRPNVPKQVFHSQY-BPUTZDHNSA-N Ser-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FRPNVPKQVFHSQY-BPUTZDHNSA-N 0.000 description 2
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 2
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- 101000818100 Spirochaeta aurantia Uncharacterized 12.7 kDa protein in trpE 5'region Proteins 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 101001037658 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) Glucokinase Proteins 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 230000024932 T cell mediated immunity Effects 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- UXUAZXWKIGPUCH-RCWTZXSCSA-N Thr-Met-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O UXUAZXWKIGPUCH-RCWTZXSCSA-N 0.000 description 2
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 2
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 2
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 2
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 2
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 2
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 2
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 2
- FBGDDUKYOBNZJL-WDSOQIARSA-N Trp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FBGDDUKYOBNZJL-WDSOQIARSA-N 0.000 description 2
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 2
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 2
- JEYRCNVVYHTZMY-SZMVWBNQSA-N Trp-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JEYRCNVVYHTZMY-SZMVWBNQSA-N 0.000 description 2
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 2
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 2
- NJNCVQYFNKZMAH-JYBASQMISA-N Trp-Thr-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 NJNCVQYFNKZMAH-JYBASQMISA-N 0.000 description 2
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 2
- SUGLEXVWEJOCGN-ONUFPDRFSA-N Trp-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)O SUGLEXVWEJOCGN-ONUFPDRFSA-N 0.000 description 2
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 2
- 101710198378 Uncharacterized 10.8 kDa protein in cox-rep intergenic region Proteins 0.000 description 2
- 101710110895 Uncharacterized 7.3 kDa protein in cox-rep intergenic region Proteins 0.000 description 2
- 101710134973 Uncharacterized 9.7 kDa protein in cox-rep intergenic region Proteins 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 2
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 2
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- BZOSBRIDWSSTFN-AVGNSLFASA-N Val-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N BZOSBRIDWSSTFN-AVGNSLFASA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 230000005784 autoimmunity Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000011260 co-administration Methods 0.000 description 2
- 229940110456 cocoa butter Drugs 0.000 description 2
- 235000019868 cocoa butter Nutrition 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000008121 dextrose Substances 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 230000002357 endometrial effect Effects 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 102000054766 genetic haplotypes Human genes 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 230000009851 immunogenic response Effects 0.000 description 2
- 230000003308 immunostimulating effect Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 108010034507 methionyltryptophan Proteins 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 239000000454 talc Substances 0.000 description 2
- 229910052623 talc Inorganic materials 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108010036387 trimethionine Proteins 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 241000990167 unclassified Simian adenoviruses Species 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 239000000277 virosome Substances 0.000 description 2
- 239000001993 wax Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 1
- WDVIDPRACNGFPP-QWRGUYRKSA-N (2s)-2-[[(2s)-6-amino-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCC(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WDVIDPRACNGFPP-QWRGUYRKSA-N 0.000 description 1
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- CWUAAQVTCQLNTH-UHFFFAOYSA-N 1-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OS(=O)(=O)C(C)N1CCN(CCO)CC1 CWUAAQVTCQLNTH-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- PPINMSZPTPRQQB-NHCYSSNCSA-N 2-[[(2s)-1-[(2s)-2-[[(2s)-2-amino-3-methylbutanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]acetic acid Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PPINMSZPTPRQQB-NHCYSSNCSA-N 0.000 description 1
- ONEGZXHXCLCVRF-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-3-methylbutanoyl)pyrrolidine-2-carbonyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(C(C)C)NC(=O)C1CCCN1C(=O)C(N)C(C)C ONEGZXHXCLCVRF-UHFFFAOYSA-N 0.000 description 1
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 1
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 108010057856 Adenovirus E2 Proteins Proteins 0.000 description 1
- 108010027410 Adenovirus E3 Proteins Proteins 0.000 description 1
- 108010056962 Adenovirus E4 Proteins Proteins 0.000 description 1
- 101710134784 Agnoprotein Proteins 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 1
- YBPLKDWJFYCZSV-ZLUOBGJFSA-N Ala-Asn-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N YBPLKDWJFYCZSV-ZLUOBGJFSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 1
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- QJABSQFUHKHTNP-SYWGBEHUSA-N Ala-Ile-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QJABSQFUHKHTNP-SYWGBEHUSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- XIWKVCDQMCNKOZ-UVBJJODRSA-N Ala-Met-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XIWKVCDQMCNKOZ-UVBJJODRSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- IEAUDUOCWNPZBR-LKTVYLICSA-N Ala-Trp-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IEAUDUOCWNPZBR-LKTVYLICSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 1
- CKIBTNMWVMKAHB-RWGOJESNSA-N Ala-Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 CKIBTNMWVMKAHB-RWGOJESNSA-N 0.000 description 1
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 102000006306 Antigen Receptors Human genes 0.000 description 1
- 108010083359 Antigen Receptors Proteins 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 1
- AHPWQERCDZTTNB-FXQIFTODSA-N Arg-Cys-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N AHPWQERCDZTTNB-FXQIFTODSA-N 0.000 description 1
- BBYTXXRNSFUOOX-IHRRRGAJSA-N Arg-Cys-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BBYTXXRNSFUOOX-IHRRRGAJSA-N 0.000 description 1
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 1
- DGFGDPVSDQPANQ-XGEHTFHBSA-N Arg-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)O DGFGDPVSDQPANQ-XGEHTFHBSA-N 0.000 description 1
- RWDVGVPHEWOZMO-GUBZILKMSA-N Arg-Cys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCNC(N)=N)C(O)=O RWDVGVPHEWOZMO-GUBZILKMSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- NYZGVTGOMPHSJW-CIUDSAMLSA-N Arg-Glu-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N NYZGVTGOMPHSJW-CIUDSAMLSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- PSOPJDUQUVFSLS-GUBZILKMSA-N Arg-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PSOPJDUQUVFSLS-GUBZILKMSA-N 0.000 description 1
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 1
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 1
- STHNZYKCJHWULY-AVGNSLFASA-N Arg-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O STHNZYKCJHWULY-AVGNSLFASA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- JJIBHAOBNIFUEL-SRVKXCTJSA-N Arg-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)N JJIBHAOBNIFUEL-SRVKXCTJSA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- AUIJUTGLPVHIRT-FXQIFTODSA-N Arg-Ser-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N AUIJUTGLPVHIRT-FXQIFTODSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 1
- JKRPBTQDPJSQIT-RCWTZXSCSA-N Arg-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O JKRPBTQDPJSQIT-RCWTZXSCSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 1
- XMGVWQWEWWULNS-BPUTZDHNSA-N Arg-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XMGVWQWEWWULNS-BPUTZDHNSA-N 0.000 description 1
- AZHXYLJRGVMQKW-UMPQAUOISA-N Arg-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N)O AZHXYLJRGVMQKW-UMPQAUOISA-N 0.000 description 1
- WAEWODAAWLGLMK-OYDLWJJNSA-N Arg-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WAEWODAAWLGLMK-OYDLWJJNSA-N 0.000 description 1
- BFDDUDQCPJWQRQ-IHRRRGAJSA-N Arg-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O BFDDUDQCPJWQRQ-IHRRRGAJSA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 1
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- LUVODTFFSXVOAG-ACZMJKKPSA-N Asn-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N LUVODTFFSXVOAG-ACZMJKKPSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 1
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 1
- SGAUXNZEFIEAAI-GARJFASQSA-N Asn-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)C(=O)O SGAUXNZEFIEAAI-GARJFASQSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- KMCRKVOLRCOMBG-DJFWLOJKSA-N Asn-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KMCRKVOLRCOMBG-DJFWLOJKSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- HGGIYWURFPGLIU-FXQIFTODSA-N Asn-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(N)=O HGGIYWURFPGLIU-FXQIFTODSA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 1
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 1
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- XHTUGJCAEYOZOR-UBHSHLNASA-N Asn-Ser-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XHTUGJCAEYOZOR-UBHSHLNASA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- QTKYFZCMSQLYHI-UBHSHLNASA-N Asn-Trp-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O QTKYFZCMSQLYHI-UBHSHLNASA-N 0.000 description 1
- FHCRKXCTKSHNOE-QEJZJMRPSA-N Asn-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FHCRKXCTKSHNOE-QEJZJMRPSA-N 0.000 description 1
- ATHZHGQSAIJHQU-XIRDDKMYSA-N Asn-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ATHZHGQSAIJHQU-XIRDDKMYSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 1
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- CMCIMCAQIULNDJ-CIUDSAMLSA-N Asp-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N CMCIMCAQIULNDJ-CIUDSAMLSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- CZECQDPEMSVPDH-MNXVOIDGSA-N Asp-Leu-Val-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CZECQDPEMSVPDH-MNXVOIDGSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- AKKUDRZKFZWPBH-SRVKXCTJSA-N Asp-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N AKKUDRZKFZWPBH-SRVKXCTJSA-N 0.000 description 1
- DYDKXJWQCIVTMR-WDSKDSINSA-N Asp-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O DYDKXJWQCIVTMR-WDSKDSINSA-N 0.000 description 1
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- LEYKQPDPZJIRTA-AQZXSJQPSA-N Asp-Trp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LEYKQPDPZJIRTA-AQZXSJQPSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000011748 CB6F1 mouse Methods 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 101100314454 Caenorhabditis elegans tra-1 gene Proteins 0.000 description 1
- 101800003171 Casoparan Proteins 0.000 description 1
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 1
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 1
- OCEHKDFAWQIBHH-FXQIFTODSA-N Cys-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N OCEHKDFAWQIBHH-FXQIFTODSA-N 0.000 description 1
- BUIYOWKUSCTBRE-CIUDSAMLSA-N Cys-Arg-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O BUIYOWKUSCTBRE-CIUDSAMLSA-N 0.000 description 1
- CLDCTNHPILWQCW-CIUDSAMLSA-N Cys-Arg-Glu Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N CLDCTNHPILWQCW-CIUDSAMLSA-N 0.000 description 1
- CEZSLNCYQUFOSL-BQBZGAKWSA-N Cys-Arg-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O CEZSLNCYQUFOSL-BQBZGAKWSA-N 0.000 description 1
- LRZPRGJXAZFXCR-DCAQKATOSA-N Cys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N LRZPRGJXAZFXCR-DCAQKATOSA-N 0.000 description 1
- BNRHLRWCERLRTQ-BPUTZDHNSA-N Cys-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N BNRHLRWCERLRTQ-BPUTZDHNSA-N 0.000 description 1
- XGIAHEUULGOZHH-GUBZILKMSA-N Cys-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N XGIAHEUULGOZHH-GUBZILKMSA-N 0.000 description 1
- QDFBJJABJKOLTD-FXQIFTODSA-N Cys-Asn-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QDFBJJABJKOLTD-FXQIFTODSA-N 0.000 description 1
- HIPHJNWPLMUBQQ-ACZMJKKPSA-N Cys-Cys-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O HIPHJNWPLMUBQQ-ACZMJKKPSA-N 0.000 description 1
- ISWAQPWFWKGCAL-ACZMJKKPSA-N Cys-Cys-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISWAQPWFWKGCAL-ACZMJKKPSA-N 0.000 description 1
- ATPDEYTYWVMINF-ZLUOBGJFSA-N Cys-Cys-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ATPDEYTYWVMINF-ZLUOBGJFSA-N 0.000 description 1
- HNNGTYHNYDOSKV-FXQIFTODSA-N Cys-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N HNNGTYHNYDOSKV-FXQIFTODSA-N 0.000 description 1
- VKAWJBQTFCBHQY-GUBZILKMSA-N Cys-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N VKAWJBQTFCBHQY-GUBZILKMSA-N 0.000 description 1
- UCMIKRLLIOVDRJ-XKBZYTNZSA-N Cys-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)O UCMIKRLLIOVDRJ-XKBZYTNZSA-N 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 1
- JDHMXPSXWMPYQZ-AAEUAGOBSA-N Cys-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N JDHMXPSXWMPYQZ-AAEUAGOBSA-N 0.000 description 1
- OWAFTBLVZNSIFO-SRVKXCTJSA-N Cys-His-His Chemical compound N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OWAFTBLVZNSIFO-SRVKXCTJSA-N 0.000 description 1
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 1
- PJWIPBIMSKJTIE-DCAQKATOSA-N Cys-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N PJWIPBIMSKJTIE-DCAQKATOSA-N 0.000 description 1
- LYSHSHHDBVKJRN-JBDRJPRFSA-N Cys-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N LYSHSHHDBVKJRN-JBDRJPRFSA-N 0.000 description 1
- MRVSLWQRNWEROS-SVSWQMSJSA-N Cys-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CS)N MRVSLWQRNWEROS-SVSWQMSJSA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- DYBIDOHFRRUMLW-CIUDSAMLSA-N Cys-Leu-Cys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O DYBIDOHFRRUMLW-CIUDSAMLSA-N 0.000 description 1
- HKALUUKHYNEDRS-GUBZILKMSA-N Cys-Leu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HKALUUKHYNEDRS-GUBZILKMSA-N 0.000 description 1
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- VTBGVPWSWJBERH-DCAQKATOSA-N Cys-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N VTBGVPWSWJBERH-DCAQKATOSA-N 0.000 description 1
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 1
- KGIHMGPYGXBYJJ-SRVKXCTJSA-N Cys-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CS KGIHMGPYGXBYJJ-SRVKXCTJSA-N 0.000 description 1
- IDZDFWJNPOOOHE-KKUMJFAQSA-N Cys-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N IDZDFWJNPOOOHE-KKUMJFAQSA-N 0.000 description 1
- RAGIABZNLPZBGS-FXQIFTODSA-N Cys-Pro-Cys Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O RAGIABZNLPZBGS-FXQIFTODSA-N 0.000 description 1
- TXCCRYAZQBUCOV-CIUDSAMLSA-N Cys-Pro-Gln Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O TXCCRYAZQBUCOV-CIUDSAMLSA-N 0.000 description 1
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 1
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 1
- DTFJUSWYECELTM-BPUTZDHNSA-N Cys-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O DTFJUSWYECELTM-BPUTZDHNSA-N 0.000 description 1
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 1
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 1
- UEHCDNYDBBCQEL-CIUDSAMLSA-N Cys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N UEHCDNYDBBCQEL-CIUDSAMLSA-N 0.000 description 1
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 1
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 1
- JIVJQYNNAYFXDG-LKXGYXEUSA-N Cys-Thr-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JIVJQYNNAYFXDG-LKXGYXEUSA-N 0.000 description 1
- MWVDDZUTWXFYHL-XKBZYTNZSA-N Cys-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O MWVDDZUTWXFYHL-XKBZYTNZSA-N 0.000 description 1
- GFAPBMCRSMSGDZ-XGEHTFHBSA-N Cys-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N)O GFAPBMCRSMSGDZ-XGEHTFHBSA-N 0.000 description 1
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 1
- KARBMKZDLYMMOW-JYBASQMISA-N Cys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CS)N)O KARBMKZDLYMMOW-JYBASQMISA-N 0.000 description 1
- IWVNIQXKTIQXCT-SRVKXCTJSA-N Cys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O IWVNIQXKTIQXCT-SRVKXCTJSA-N 0.000 description 1
- IRDBEBCCTCNXGZ-AVGNSLFASA-N Cys-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O IRDBEBCCTCNXGZ-AVGNSLFASA-N 0.000 description 1
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 1
- ZOMMHASZJQRLFS-IHRRRGAJSA-N Cys-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N ZOMMHASZJQRLFS-IHRRRGAJSA-N 0.000 description 1
- IOLWXFWVYYCVTJ-NRPADANISA-N Cys-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N IOLWXFWVYYCVTJ-NRPADANISA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 238000011510 Elispot assay Methods 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- KYFSMWLWHYZRNW-ACZMJKKPSA-N Gln-Asp-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KYFSMWLWHYZRNW-ACZMJKKPSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- ATTWDCRXQNKRII-GUBZILKMSA-N Gln-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ATTWDCRXQNKRII-GUBZILKMSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 1
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 1
- QENSHQJGWGRPQS-QEJZJMRPSA-N Gln-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)N)C(O)=O)=CNC2=C1 QENSHQJGWGRPQS-QEJZJMRPSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- BETSEXMYBWCDAE-SZMVWBNQSA-N Gln-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BETSEXMYBWCDAE-SZMVWBNQSA-N 0.000 description 1
- SAHTWBLTLJWAQA-XIRDDKMYSA-N Gln-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N SAHTWBLTLJWAQA-XIRDDKMYSA-N 0.000 description 1
- YJCZUTXLPXBNIO-BHYGNILZSA-N Gln-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)N)N)C(=O)O YJCZUTXLPXBNIO-BHYGNILZSA-N 0.000 description 1
- CVRUVYDNRPSKBM-QEJZJMRPSA-N Gln-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CVRUVYDNRPSKBM-QEJZJMRPSA-N 0.000 description 1
- NVHJGTGTUGEWCG-ZVZYQTTQSA-N Gln-Trp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O NVHJGTGTUGEWCG-ZVZYQTTQSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- IYAUFWMUCGBFMQ-CIUDSAMLSA-N Glu-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N IYAUFWMUCGBFMQ-CIUDSAMLSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- BUVMZWZNWMKASN-QEJZJMRPSA-N Glu-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 BUVMZWZNWMKASN-QEJZJMRPSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- MXPBQDFWIMBACQ-ACZMJKKPSA-N Glu-Cys-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O MXPBQDFWIMBACQ-ACZMJKKPSA-N 0.000 description 1
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 1
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 1
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 1
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 1
- YZACQYVWLCQWBT-BQBZGAKWSA-N Gly-Cys-Arg Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YZACQYVWLCQWBT-BQBZGAKWSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 1
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- VOCMRCVMAPSSAL-IUCAKERBSA-N Gly-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN VOCMRCVMAPSSAL-IUCAKERBSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- BIRKKBCSAIHDDF-WDSKDSINSA-N Gly-Glu-Cys Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BIRKKBCSAIHDDF-WDSKDSINSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 1
- UUWOBINZFGTFMS-UWVGGRQHSA-N Gly-His-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O UUWOBINZFGTFMS-UWVGGRQHSA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- RUDRIZRGOLQSMX-IUCAKERBSA-N Gly-Met-Met Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O RUDRIZRGOLQSMX-IUCAKERBSA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- GULGDABMYTYMJZ-STQMWFEESA-N Gly-Trp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O GULGDABMYTYMJZ-STQMWFEESA-N 0.000 description 1
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 1
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 101710155188 Hexon-interlacing protein Proteins 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- MJICNEVRDVQXJH-WDSOQIARSA-N His-Arg-Trp Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O MJICNEVRDVQXJH-WDSOQIARSA-N 0.000 description 1
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 1
- QNILDNVBIARMRK-XVYDVKMFSA-N His-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CN=CN1)N QNILDNVBIARMRK-XVYDVKMFSA-N 0.000 description 1
- QQJMARNOLHSJCQ-DCAQKATOSA-N His-Cys-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N QQJMARNOLHSJCQ-DCAQKATOSA-N 0.000 description 1
- IDQKGZWUPVOGPZ-GUBZILKMSA-N His-Cys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IDQKGZWUPVOGPZ-GUBZILKMSA-N 0.000 description 1
- CMQOGWZUKPHLHL-DCAQKATOSA-N His-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CN=CN1)N CMQOGWZUKPHLHL-DCAQKATOSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 1
- LPZUKJALYGXBIE-SRVKXCTJSA-N His-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N LPZUKJALYGXBIE-SRVKXCTJSA-N 0.000 description 1
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 1
- UVDDTHLDZBMBAV-SRVKXCTJSA-N His-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N UVDDTHLDZBMBAV-SRVKXCTJSA-N 0.000 description 1
- JIUYRPFQJJRSJB-QWRGUYRKSA-N His-His-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JIUYRPFQJJRSJB-QWRGUYRKSA-N 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- UQTKYYNHMVAOAA-HJPIBITLSA-N His-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N UQTKYYNHMVAOAA-HJPIBITLSA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 1
- BCZFOHDMCDXPDA-BZSNNMDCSA-N His-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)O BCZFOHDMCDXPDA-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 1
- PBVQWNDMFFCPIZ-ULQDDVLXSA-N His-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 PBVQWNDMFFCPIZ-ULQDDVLXSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 1
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 1
- FONIDUOGWNWEAX-XIRDDKMYSA-N His-Trp-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O FONIDUOGWNWEAX-XIRDDKMYSA-N 0.000 description 1
- YKUAGFAXQRYUQW-KKUMJFAQSA-N His-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O YKUAGFAXQRYUQW-KKUMJFAQSA-N 0.000 description 1
- WYKXJGWSJUULSL-AVGNSLFASA-N His-Val-Arg Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O WYKXJGWSJUULSL-AVGNSLFASA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 1
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- SYVMEYAPXRRXAN-MXAVVETBSA-N Ile-Cys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SYVMEYAPXRRXAN-MXAVVETBSA-N 0.000 description 1
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 1
- ZIPOVLBRVPXWJQ-SPOWBLRKSA-N Ile-Cys-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N ZIPOVLBRVPXWJQ-SPOWBLRKSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- AFERFBZLVUFWRA-HTFCKZLJSA-N Ile-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)O)N AFERFBZLVUFWRA-HTFCKZLJSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- UWBDLNOCIDGPQE-GUBZILKMSA-N Ile-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN UWBDLNOCIDGPQE-GUBZILKMSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- CEPIAEUVRKGPGP-DSYPUSFNSA-N Ile-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 CEPIAEUVRKGPGP-DSYPUSFNSA-N 0.000 description 1
- AYLAAGNJNVZDPY-CYDGBPFRSA-N Ile-Met-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N AYLAAGNJNVZDPY-CYDGBPFRSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- RENBRDSDKPSRIH-HJWJTTGWSA-N Ile-Phe-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O RENBRDSDKPSRIH-HJWJTTGWSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- VISRCHQHQCLODA-NAKRPEOUSA-N Ile-Pro-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N VISRCHQHQCLODA-NAKRPEOUSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- SHVFUCSSACPBTF-VGDYDELISA-N Ile-Ser-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SHVFUCSSACPBTF-VGDYDELISA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- JJQQGCMKLOEGAV-OSUNSFLBSA-N Ile-Thr-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)O)N JJQQGCMKLOEGAV-OSUNSFLBSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- VBGCPJBKUXRYDA-DSYPUSFNSA-N Ile-Trp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N VBGCPJBKUXRYDA-DSYPUSFNSA-N 0.000 description 1
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 102000003810 Interleukin-18 Human genes 0.000 description 1
- 108090000171 Interleukin-18 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 102000000704 Interleukin-7 Human genes 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- DUBAVOVZNZKEQQ-AVGNSLFASA-N Leu-Arg-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCN=C(N)N DUBAVOVZNZKEQQ-AVGNSLFASA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 1
- JYOAXOMPIXKMKK-YUMQZZPRSA-N Leu-Gln Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCC(N)=O JYOAXOMPIXKMKK-YUMQZZPRSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- GSSMYQHXZNERFX-WDSOQIARSA-N Leu-Met-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N GSSMYQHXZNERFX-WDSOQIARSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- BCUVPZLLSRMPJL-XIRDDKMYSA-N Leu-Trp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N BCUVPZLLSRMPJL-XIRDDKMYSA-N 0.000 description 1
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 1
- YLMIDMSLKLRNHX-HSCHXYMDSA-N Leu-Trp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YLMIDMSLKLRNHX-HSCHXYMDSA-N 0.000 description 1
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 1
- UIIMIKFNIYPDJF-WDSOQIARSA-N Leu-Trp-Met Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)[C@@H](N)CC(C)C)=CNC2=C1 UIIMIKFNIYPDJF-WDSOQIARSA-N 0.000 description 1
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 1
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 1
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 1
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- ZTPWXNOOKAXPPE-DCAQKATOSA-N Lys-Arg-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N ZTPWXNOOKAXPPE-DCAQKATOSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- JBRWKVANRYPCAF-XIRDDKMYSA-N Lys-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N JBRWKVANRYPCAF-XIRDDKMYSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 1
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 1
- VSJXPNCQYGOLFM-XIRDDKMYSA-N Lys-Cys-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VSJXPNCQYGOLFM-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- GUYHHBZCBQZLFW-GUBZILKMSA-N Lys-Gln-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N GUYHHBZCBQZLFW-GUBZILKMSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 1
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- ZCWWVXAXWUAEPZ-SRVKXCTJSA-N Lys-Met-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZCWWVXAXWUAEPZ-SRVKXCTJSA-N 0.000 description 1
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- CENKQZWVYMLRAX-ULQDDVLXSA-N Lys-Phe-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CENKQZWVYMLRAX-ULQDDVLXSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- JCVOHUKUYSYBAD-DCAQKATOSA-N Lys-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CS)C(=O)O JCVOHUKUYSYBAD-DCAQKATOSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 229910015837 MSH2 Inorganic materials 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 1
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 1
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 1
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- IVCPHARVJUYDPA-FXQIFTODSA-N Met-Asn-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IVCPHARVJUYDPA-FXQIFTODSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 1
- NCFZHKMKRCYQBJ-CIUDSAMLSA-N Met-Cys-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NCFZHKMKRCYQBJ-CIUDSAMLSA-N 0.000 description 1
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 1
- IZLCDZDNZFEDHB-DCAQKATOSA-N Met-Cys-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N IZLCDZDNZFEDHB-DCAQKATOSA-N 0.000 description 1
- RMHHNLKYPOOKQN-FXQIFTODSA-N Met-Cys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O RMHHNLKYPOOKQN-FXQIFTODSA-N 0.000 description 1
- CEGVMWAVGBRVFS-XGEHTFHBSA-N Met-Cys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CEGVMWAVGBRVFS-XGEHTFHBSA-N 0.000 description 1
- MYKLINMAGAIRPJ-CIUDSAMLSA-N Met-Gln-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MYKLINMAGAIRPJ-CIUDSAMLSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- IECZNARPMKQGJC-XIRDDKMYSA-N Met-Gln-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N IECZNARPMKQGJC-XIRDDKMYSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- UKUMISIRZAVYOG-CIUDSAMLSA-N Met-Glu-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O UKUMISIRZAVYOG-CIUDSAMLSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 1
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- WRLYTJVPSUBYST-AVGNSLFASA-N Met-His-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N WRLYTJVPSUBYST-AVGNSLFASA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 1
- RSOMVHWMIAZNLE-HJWJTTGWSA-N Met-Phe-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSOMVHWMIAZNLE-HJWJTTGWSA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- CAEZLMGDJMEBKP-AVGNSLFASA-N Met-Pro-His Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC=N1 CAEZLMGDJMEBKP-AVGNSLFASA-N 0.000 description 1
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 1
- FDGAMQVRGORBDV-GUBZILKMSA-N Met-Ser-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCSC FDGAMQVRGORBDV-GUBZILKMSA-N 0.000 description 1
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- MNGBICITWAPGAS-BPUTZDHNSA-N Met-Ser-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MNGBICITWAPGAS-BPUTZDHNSA-N 0.000 description 1
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- KLGIQJRMFHIGCQ-ZFWWWQNUSA-N Met-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)NCC(O)=O)=CNC2=C1 KLGIQJRMFHIGCQ-ZFWWWQNUSA-N 0.000 description 1
- CULGJGUDIJATIP-STQMWFEESA-N Met-Tyr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 CULGJGUDIJATIP-STQMWFEESA-N 0.000 description 1
- VEKRTVRZDMUOQN-AVGNSLFASA-N Met-Val-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 VEKRTVRZDMUOQN-AVGNSLFASA-N 0.000 description 1
- CKAVKDJBSNTJDB-SRVKXCTJSA-N Met-Val-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCSC CKAVKDJBSNTJDB-SRVKXCTJSA-N 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000282576 Pan paniscus Species 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 1
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- NRKNYPRRWXVELC-NQCBNZPSSA-N Phe-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NRKNYPRRWXVELC-NQCBNZPSSA-N 0.000 description 1
- XMQSOOJRRVEHRO-ULQDDVLXSA-N Phe-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMQSOOJRRVEHRO-ULQDDVLXSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 1
- FQUUYTNBMIBOHS-IHRRRGAJSA-N Phe-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FQUUYTNBMIBOHS-IHRRRGAJSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 1
- CBENHWCORLVGEQ-HJOGWXRNSA-N Phe-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CBENHWCORLVGEQ-HJOGWXRNSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- ZTVSVSFBHUVYIN-UFYCRDLUSA-N Phe-Tyr-Met Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=C(O)C=C1 ZTVSVSFBHUVYIN-UFYCRDLUSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 229920001219 Polysorbate 40 Polymers 0.000 description 1
- 229920001214 Polysorbate 60 Polymers 0.000 description 1
- 229920002642 Polysorbate 65 Polymers 0.000 description 1
- 241000282569 Pongo Species 0.000 description 1
- 241000282405 Pongo abelii Species 0.000 description 1
- 101710101995 Pre-hexon-linking protein IIIa Proteins 0.000 description 1
- ALJGSKMBIUEJOB-FXQIFTODSA-N Pro-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 ALJGSKMBIUEJOB-FXQIFTODSA-N 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 1
- WECYCNFPGZLOOU-FXQIFTODSA-N Pro-Asn-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O WECYCNFPGZLOOU-FXQIFTODSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 1
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 1
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- CMOIIANLNNYUTP-SRVKXCTJSA-N Pro-Gln-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CMOIIANLNNYUTP-SRVKXCTJSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 1
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 1
- BFXZQMWKTYWGCF-PYJNHQTQSA-N Pro-His-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BFXZQMWKTYWGCF-PYJNHQTQSA-N 0.000 description 1
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 1
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 1
- GSPPWVHVBBSPSY-FHWLQOOXSA-N Pro-His-Trp Chemical compound OC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@H](Cc1cnc[nH]1)NC(=O)[C@@H]1CCCN1 GSPPWVHVBBSPSY-FHWLQOOXSA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- BWCZJGJKOFUUCN-ZPFDUUQYSA-N Pro-Ile-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O BWCZJGJKOFUUCN-ZPFDUUQYSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- BARPGRUZBKFJMA-SRVKXCTJSA-N Pro-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BARPGRUZBKFJMA-SRVKXCTJSA-N 0.000 description 1
- FRVUYKWGPCQRBL-GUBZILKMSA-N Pro-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 FRVUYKWGPCQRBL-GUBZILKMSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- FYXCBXDAMPEHIQ-FHWLQOOXSA-N Pro-Trp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O FYXCBXDAMPEHIQ-FHWLQOOXSA-N 0.000 description 1
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 1
- UIUWGMRJTWHIJZ-ULQDDVLXSA-N Pro-Tyr-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O UIUWGMRJTWHIJZ-ULQDDVLXSA-N 0.000 description 1
- OABLKWMLPUGEQK-JYJNAYRXSA-N Pro-Tyr-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O OABLKWMLPUGEQK-JYJNAYRXSA-N 0.000 description 1
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 101710124584 Probable DNA-binding protein Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 101000584831 Pseudoalteromonas phage PM2 Protein P6 Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- DFPOZTRSOAQFIK-UHFFFAOYSA-N S,S-dimethyl-beta-propiothetin Chemical compound C[S+](C)CCC([O-])=O DFPOZTRSOAQFIK-UHFFFAOYSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 1
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 1
- KMWFXJCGRXBQAC-CIUDSAMLSA-N Ser-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N KMWFXJCGRXBQAC-CIUDSAMLSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- MAWSJXHRLWVJEZ-ACZMJKKPSA-N Ser-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N MAWSJXHRLWVJEZ-ACZMJKKPSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- SVWQEIRZHHNBIO-WHFBIAKZSA-N Ser-Gly-Cys Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CS)C(O)=O SVWQEIRZHHNBIO-WHFBIAKZSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- LOKXAXAESFYFAX-CIUDSAMLSA-N Ser-His-Cys Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CN=CN1 LOKXAXAESFYFAX-CIUDSAMLSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 1
- NBUKGEFVZJMSIS-XIRDDKMYSA-N Ser-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CO)N NBUKGEFVZJMSIS-XIRDDKMYSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- LPSKHZWBQONOQJ-XIRDDKMYSA-N Ser-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N LPSKHZWBQONOQJ-XIRDDKMYSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- AXVNLRQLPLSIPQ-FXQIFTODSA-N Ser-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N AXVNLRQLPLSIPQ-FXQIFTODSA-N 0.000 description 1
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- MHVXPTAMDHLTHB-IHPCNDPISA-N Ser-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MHVXPTAMDHLTHB-IHPCNDPISA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 1
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 101100289792 Squirrel monkey polyomavirus large T gene Proteins 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- VASYSJHSMSBTDU-LKXGYXEUSA-N Thr-Asn-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O VASYSJHSMSBTDU-LKXGYXEUSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 1
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 1
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- DXNUZQGVOMCGNS-SWRJLBSHSA-N Thr-Gln-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O DXNUZQGVOMCGNS-SWRJLBSHSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- HEJJDUDEHLPDAW-CUJWVEQBSA-N Thr-His-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N)O HEJJDUDEHLPDAW-CUJWVEQBSA-N 0.000 description 1
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- DCRHJDRLCFMEBI-RHYQMDGZSA-N Thr-Lys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O DCRHJDRLCFMEBI-RHYQMDGZSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 1
- SIEZEMFJLYRUMK-YTWAJWBKSA-N Thr-Met-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N)O SIEZEMFJLYRUMK-YTWAJWBKSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- GUHLYMZJVXUIPO-RCWTZXSCSA-N Thr-Met-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GUHLYMZJVXUIPO-RCWTZXSCSA-N 0.000 description 1
- GYUUYCIXELGTJS-MEYUZBJRSA-N Thr-Phe-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O GYUUYCIXELGTJS-MEYUZBJRSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- XGUAUKUYQHBUNY-SWRJLBSHSA-N Thr-Trp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O XGUAUKUYQHBUNY-SWRJLBSHSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 1
- VGNKUXWYFFDWDH-BEMMVCDISA-N Thr-Trp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N)O VGNKUXWYFFDWDH-BEMMVCDISA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 1
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- WFZYXGSAPWKTHR-XEGUGMAKSA-N Trp-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WFZYXGSAPWKTHR-XEGUGMAKSA-N 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 1
- MVHHTXAUJCIOMZ-WDSOQIARSA-N Trp-Arg-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N MVHHTXAUJCIOMZ-WDSOQIARSA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- NBHGNEJMBNQQKZ-UBHSHLNASA-N Trp-Asp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NBHGNEJMBNQQKZ-UBHSHLNASA-N 0.000 description 1
- LTLBNCDNXQCOLB-UBHSHLNASA-N Trp-Asp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 LTLBNCDNXQCOLB-UBHSHLNASA-N 0.000 description 1
- GZTKZDGIEBKZAH-XIRDDKMYSA-N Trp-Cys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N GZTKZDGIEBKZAH-XIRDDKMYSA-N 0.000 description 1
- PFCQMGDEHBTIIM-JYBASQMISA-N Trp-Cys-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 PFCQMGDEHBTIIM-JYBASQMISA-N 0.000 description 1
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- LGEPIBQBGZTBHL-SXNHZJKMSA-N Trp-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LGEPIBQBGZTBHL-SXNHZJKMSA-N 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- DVWAIHZOPSYMSJ-ZVZYQTTQSA-N Trp-Glu-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 DVWAIHZOPSYMSJ-ZVZYQTTQSA-N 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 1
- OGXQLUCMJZSJPW-LYSGOOTNSA-N Trp-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O OGXQLUCMJZSJPW-LYSGOOTNSA-N 0.000 description 1
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 1
- BYSKNUASOAGJSS-NQCBNZPSSA-N Trp-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BYSKNUASOAGJSS-NQCBNZPSSA-N 0.000 description 1
- RRXPAFGTFQIEMD-IVJVFBROSA-N Trp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RRXPAFGTFQIEMD-IVJVFBROSA-N 0.000 description 1
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- WKCFCVBOFKEVKY-HSCHXYMDSA-N Trp-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WKCFCVBOFKEVKY-HSCHXYMDSA-N 0.000 description 1
- YLGQHMHKAASRGJ-WDSOQIARSA-N Trp-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YLGQHMHKAASRGJ-WDSOQIARSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- YTZYHKOSHOXTHA-TUSQITKMSA-N Trp-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=3C4=CC=CC=C4NC=3)CC(C)C)C(O)=O)=CNC2=C1 YTZYHKOSHOXTHA-TUSQITKMSA-N 0.000 description 1
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 1
- YPBYQWFZAAQMGW-XIRDDKMYSA-N Trp-Lys-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N YPBYQWFZAAQMGW-XIRDDKMYSA-N 0.000 description 1
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 1
- FXHOCONKLLUOCF-WDSOQIARSA-N Trp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FXHOCONKLLUOCF-WDSOQIARSA-N 0.000 description 1
- ULHASJWZGUEUNN-XIRDDKMYSA-N Trp-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O ULHASJWZGUEUNN-XIRDDKMYSA-N 0.000 description 1
- SNWIAPVRCNYFNI-SZMVWBNQSA-N Trp-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SNWIAPVRCNYFNI-SZMVWBNQSA-N 0.000 description 1
- KYWBVMKEYAEDIX-BPUTZDHNSA-N Trp-Met-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 KYWBVMKEYAEDIX-BPUTZDHNSA-N 0.000 description 1
- HJWLQSFTGDQSRX-BPUTZDHNSA-N Trp-Met-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HJWLQSFTGDQSRX-BPUTZDHNSA-N 0.000 description 1
- NFVQCNMGJILYMI-SZMVWBNQSA-N Trp-Met-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NFVQCNMGJILYMI-SZMVWBNQSA-N 0.000 description 1
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 1
- QUIXRGCMQOXUSV-SZMVWBNQSA-N Trp-Pro-Pro Chemical compound O=C([C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O QUIXRGCMQOXUSV-SZMVWBNQSA-N 0.000 description 1
- JGLXHHQUSIULAK-OYDLWJJNSA-N Trp-Pro-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC=3C4=CC=CC=C4NC=3)N)C(O)=O)=CNC2=C1 JGLXHHQUSIULAK-OYDLWJJNSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 1
- UJGDFQRPYGJBEH-AAEUAGOBSA-N Trp-Ser-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N UJGDFQRPYGJBEH-AAEUAGOBSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 1
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 1
- JTMZSIRTZKLBOA-NWLDYVSISA-N Trp-Thr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTMZSIRTZKLBOA-NWLDYVSISA-N 0.000 description 1
- DYIXEGROAOVQPK-VFAJRCTISA-N Trp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DYIXEGROAOVQPK-VFAJRCTISA-N 0.000 description 1
- AGSYHLPWNXGVSG-NYVOZVTQSA-N Trp-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CS)C(=O)O)N AGSYHLPWNXGVSG-NYVOZVTQSA-N 0.000 description 1
- ONPLDNBGWODKKK-TUSQITKMSA-N Trp-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CC5=CN=CN5)C(=O)O)N ONPLDNBGWODKKK-TUSQITKMSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 1
- WTXQBCCKXIKKHB-JYJNAYRXSA-N Tyr-Arg-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WTXQBCCKXIKKHB-JYJNAYRXSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- KLGFILUOTCBNLJ-IHRRRGAJSA-N Tyr-Cys-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O KLGFILUOTCBNLJ-IHRRRGAJSA-N 0.000 description 1
- YWXMGBUGMLJMIP-IHPCNDPISA-N Tyr-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC3=CC=C(C=C3)O)N YWXMGBUGMLJMIP-IHPCNDPISA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- RIJPHPUJRLEOAK-JYJNAYRXSA-N Tyr-Gln-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O RIJPHPUJRLEOAK-JYJNAYRXSA-N 0.000 description 1
- IJUTXXAXQODRMW-KBPBESRZSA-N Tyr-Gly-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O IJUTXXAXQODRMW-KBPBESRZSA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 1
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 1
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 1
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 1
- YOTRXXBHTZHKLU-BVSLBCMMSA-N Tyr-Trp-Met Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C1=CC=C(O)C=C1 YOTRXXBHTZHKLU-BVSLBCMMSA-N 0.000 description 1
- QRCBQDPRKMYTMB-IHPCNDPISA-N Tyr-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N QRCBQDPRKMYTMB-IHPCNDPISA-N 0.000 description 1
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- 102100039094 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- VDPRBUOZLIFUIM-GUBZILKMSA-N Val-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N VDPRBUOZLIFUIM-GUBZILKMSA-N 0.000 description 1
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- SRWWRLKBEJZFPW-IHRRRGAJSA-N Val-Cys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SRWWRLKBEJZFPW-IHRRRGAJSA-N 0.000 description 1
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 1
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 1
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- BCBFMJYTNKDALA-UFYCRDLUSA-N Val-Phe-Phe Chemical compound N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O BCBFMJYTNKDALA-UFYCRDLUSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- POFQRHFHYPSCOI-FHWLQOOXSA-N Val-Trp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N POFQRHFHYPSCOI-FHWLQOOXSA-N 0.000 description 1
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 1
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 1
- OEVFFOBAXHBXKM-HSHDSVGOSA-N Val-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N)O OEVFFOBAXHBXKM-HSHDSVGOSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 1
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 101710086987 X protein Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010031014 alanyl-histidyl-leucyl-leucine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 239000003945 anionic surfactant Substances 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000006472 autoimmune response Effects 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 239000003093 cationic surfactant Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 201000010989 colorectal carcinoma Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 229960003964 deoxycholic acid Drugs 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 210000002980 germ line cell Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N glycerine monostearate Natural products CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- SVUQHVRAGMNPLW-UHFFFAOYSA-N glycerol monostearate Natural products CCCCCCCCCCCCCCCCC(=O)OCC(O)CO SVUQHVRAGMNPLW-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000008240 homogeneous mixture Substances 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 239000003978 infusion fluid Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 108010043612 kentsin Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010053062 lysyl-arginyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 235000010981 methylcellulose Nutrition 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 238000007474 nonparametric Mann- Whitney U test Methods 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 239000000249 polyoxyethylene sorbitan monopalmitate Substances 0.000 description 1
- 235000010483 polyoxyethylene sorbitan monopalmitate Nutrition 0.000 description 1
- 239000001818 polyoxyethylene sorbitan monostearate Substances 0.000 description 1
- 235000010989 polyoxyethylene sorbitan monostearate Nutrition 0.000 description 1
- 239000001816 polyoxyethylene sorbitan tristearate Substances 0.000 description 1
- 235000010988 polyoxyethylene sorbitan tristearate Nutrition 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229940068977 polysorbate 20 Drugs 0.000 description 1
- 229940101027 polysorbate 40 Drugs 0.000 description 1
- 229940113124 polysorbate 60 Drugs 0.000 description 1
- 229940099511 polysorbate 65 Drugs 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 229940068968 polysorbate 80 Drugs 0.000 description 1
- 229940068965 polysorbates Drugs 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- QQONPFPTGQHPMA-UHFFFAOYSA-N propylene Natural products CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 1
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- FHHPUSMSKHSNKW-SMOYURAASA-M sodium deoxycholate Chemical compound [Na+].C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC([O-])=O)C)[C@@]2(C)[C@@H](O)C1 FHHPUSMSKHSNKW-SMOYURAASA-M 0.000 description 1
- RYYKJJJTJZKILX-UHFFFAOYSA-M sodium octadecanoate Chemical compound [Na+].CCCCCCCCCCCCCCCCCC([O-])=O RYYKJJJTJZKILX-UHFFFAOYSA-M 0.000 description 1
- 239000007909 solid dosage form Substances 0.000 description 1
- 239000012439 solid excipient Substances 0.000 description 1
- 239000008247 solid mixture Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 238000005829 trimerization reaction Methods 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010012050 valyl-aspartyl-prolyl-proline Proteins 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 238000003158 yeast two-hybrid assay Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4748—Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/04—Peptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/04—Peptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
- A61K38/08—Peptides having 5 to 11 amino acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/04—Peptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
- A61K38/10—Peptides having 12 to 20 amino acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/0005—Vertebrate antigens
- A61K39/0011—Cancer antigens
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/515—Animal cells
- A61K2039/5152—Tumor cells
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biotechnology (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Toxicology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Oncology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Plant Pathology (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 프레임-쉬프트 펩타이드의 수집물(CFSP)을 선택하여 유전성 및 산발성 미세부수체 불안정성(MSI) 종양을 갖는 환자의 예방 및 치료를 위한 범용 암 백신 펩타이드 수집물(CVP)을 생산하는 방법에 관한 것이다. 본 발명은 또한 CFSP로부터 프레임-쉬프트 펩타이드(FSP)의 서브세트를 선택하고 FSP의 아미노산(aa) 서열을 임의로 변형시켜 변형된 FSP(mFSP)를 생성함으로써 CVP를 생산하는 방법에 관한 것이다. 본 발명은 또한 동시에 사용될 수도 있는 하나 이상의 백신 벡터 속에서 FSP의 CVP를 암호화하는 핵산 수집물에 관한 것이다. 이러한 CVP, 핵산 및 벡터는 MSI 암의 예방 또는 치료에 사용된다.
Description
본 발명은 프레임-쉬프트 펩타이드의 수집물(collection of frame-shift peptide: CFSP)을 선택하여 유전성 및 산발성 미세부수체 불안정성(micro-satellite instability: MSI) 종양을 지닌 환자의 예방 및 치료용의 범용 암 백신 펩타이드 수집물(CVP)을 생산하는 방법에 관한 것이다. 본 발명은 또한 CFSP로부터 프레임-쉬프트 펩타이드(FSP)의 서브세트(subset)를 선택하고 임의로 FSP의 아미노산(aa) 서열을 변형시킴으로써 변형된 FSP(mFSP)를 생성하는 CVP의 생산 방법에 관한 것이다. 본 발명은 또한 동시에 사용될 수도 있는 하나 이상의 백신 벡터 내에서 FSP 및/또는 mFSP의 CVP를 암호화하는 핵산 수집물에 관한 것이다. 이러한 CVP, 핵산 및 벡터는 MSI 암의 예방 또는 치료를 위해 사용된다.
발명의 배경
암 백신의 분야는 종양-관련된 및, 보다 최근에는 종양-특이적인 항원을 표적화하는데 장기간 집중되어 왔다. 후자는 정상 세포에는 존재하지 않으므로 자체로 정의된, 종양 신생 항원의 생산을 야기하는 암호화 유전자내 종양원성 바이러스 단백질 또는 체세포 돌연변이로부터 암 세포내에서 발생할 수 있다. 자가-내성 및 자가면역성의 보다 낮은 위험성에 있어서 보다 매력적이지만, 종양 신생항원은 정해진 환자의 암 세포 중에서 및 사람 집단에 걸쳐 유의적으로 변하므로, 공유된 종양 신생항원을 기반으로 한 효과적인 범용 암 백신의 발달을 방해한다.
그러나 이의 근본적인 생물학으로 인하여 이러한 일반적인 역할을 따르지 않는 암의 그룹이 존재한다: DNA 미스매치 복구 유전자(mismatch repair 유전자: MMR)내 돌연변이에 의해 흔히 유발된 미세부수체 불안정성(MSI) 종양. 결함이 있는 MMR 시스템은 미세부수체로 불리는 반복된 뉴클레오타이드 서열의 영역내에 돌연변이의 축적을 야기한다. 암호화 유전자의 미세부수체내 돌연변이는 이의 C-말단이 신규의 비-자가 펩타이드, 소위 프레임 쉬프트 펩타이드(frame shift peptide: FSP)로 구성된 키메라 단백질을 생성하는 번역 판독 프레임의 쉬프트를 초래할 수 있다. 대부분의 암과는 달리, MSI 종양내 돌연변이는 모노뉴클레오타이드 반복체(MNR)로 이루어진 미세부수체에서 우선적으로 발생한다. 암호화 영역내에서, 이러한 돌연변이는 대부분 1개의 뉴클레오타이드 결실로 이루어지며 제한된 수의 유전자에 영향을 미치므로, 환자 중에서 공유되어 있다(Kim, T.M., et al. (2013) Cell 155(4): 858-868).
그러나 이의 근본적인 생물학으로 인하여 이러한 일반적인 역할을 따르지 않는 암의 그룹이 존재한다: DNA 미스매치 복구 유전자(mismatch repair 유전자: MMR)내 돌연변이에 의해 흔히 유발된 미세부수체 불안정성(MSI) 종양. 결함이 있는 MMR 시스템은 미세부수체로 불리는 반복된 뉴클레오타이드 서열의 영역내에 돌연변이의 축적을 야기한다. 암호화 유전자의 미세부수체내 돌연변이는 이의 C-말단이 신규의 비-자가 펩타이드, 소위 프레임 쉬프트 펩타이드(frame shift peptide: FSP)로 구성된 키메라 단백질을 생성하는 번역 판독 프레임의 쉬프트를 초래할 수 있다. 대부분의 암과는 달리, MSI 종양내 돌연변이는 모노뉴클레오타이드 반복체(MNR)로 이루어진 미세부수체에서 우선적으로 발생한다. 암호화 영역내에서, 이러한 돌연변이는 대부분 1개의 뉴클레오타이드 결실로 이루어지며 제한된 수의 유전자에 영향을 미치므로, 환자 중에서 공유되어 있다(Kim, T.M., et al. (2013) Cell 155(4): 858-868).
삭제
따라서, MSI-관련된 암은 공유된 종양 신생항원을 기반으로 한 범용 백신을 설계하는 유일한 기회를 제공한다. MSI-종양은 MMR 유전자내에서 체세포 및 배선 돌연변이 각각에 의해 유발된 산발성 암 및 유전된 암 둘 다를 포함한다. 린치 증후군(Lynch syndrome: LS)은 제2 그룹 속에 속하는 희귀 질환(ORPHA144)이다. 특히, MMR 경로(유전성 LS 담체의 ~90%)의 MSH2 또는 MLH1 유전자내 이형접합성 배선 돌연변이를 지닌 개인은 암 발달에 대해 보다 높은 위험에 처해 있다. 구체적으로, 이들은 이들의 수명 동안 >50%의 경우에 결장 또는 자궁내막 암으로 발달하는 성향이 있다(Boland, C.R. and A. Goel (2010) Gastroenterology 138(6): p. 2073-2087 e3).
삭제
요약하면, 본원에 기술된 발명은 MSI 종양에 걸쳐 공유된 FSP 신생항원(shared FSP neoantigen)의 확인 및 특히 LS 보인자에서, MSI 암의 치료 및 이들의 예방을 위해 CFSP로부터 유래된 FSP 및 변형된 FSP(CVP로 정의됨)의 서브세트를 기반으로 한 범용 백신의 개발에 관한 것이다. 이러한 CVP는 특히 다음의 장점을 제공할 수 있다: (i) 다양한 MSI 암에 대한 우수한 치료학적 및/또는 예방학적 면역 반응; (ii) 이것이 공유된 FSP의 큰 세트를 암호화하므로 사용하기 용이하고 환자의 큰 집단(cohort)에서 효과적인 기성 백신(off-the-shelf vaccine); (iii) 예방학적 세팅에서 특히 유용한, 임의의 MSI 암의 치료 및 예방에 적합한 방식으로 선택될 수 있는 특정 CVP; (iv) 잠재적인 자가-에피토프의 배제로 인한 자가면역 반응의 위험의 부재.
본 발명자들이 아는 한, 본 발명의 방법은 다음을 포함하는, 기존에 알려지지 않은 다양한 특징에 의해 특성화된다:
본 발명자들이 아는 한, 본 발명의 방법은 다음을 포함하는, 기존에 알려지지 않은 다양한 특징에 의해 특성화된다:
(i) 보호 수단의 다양성, 예를 들면,
a) 평균적으로, 선택된 종양형에서 역치(threshold) 초과로 표시되는, 유전자로부터의 프레임쉬프트 펩타이드의 선택,
b) 건강한 대상체의 조직 내에 부재하거나 매우 드문 프레임쉬프트 펩타이드의 선택,
c) 정상의 사람 단백질에서 8개 아미노산 이상의 길이를 지닌 분절(segment)과 동일한 프레임쉬프트 펩타이드로부터의 분절의 배제, 및
c) 다수의 암 샘플의 사용.
(ii) 최소의 추정된 CD8+ T 세포 에피토프(8mer)의 것보다 더 짧은 길이를 지닌 프레임쉬프트 펩타이드의 혼입. 이는 4개 이하의 야생형 아미노산을 첨가하여 적어도 8개의 아미노산의 펩타이드를 생성함으로써 달성된다.
(iii) 각각의 개개 암 샘플(암 샘플은 백신에 의해 표적화된 집단을 나타낸다)이 백신에 의해 암호화된 프레임쉬프트 펩타이드의 일부를 함유하고 이러한 부분에 나타낸 프레임쉬프트 펩타이드의 총 길이가 적어도 400개 아미노산이 되도록 백신 내에 포함될 프레임쉬프트 펩타이드의 최적의 수집물의 선택. 바이러스 항원을 표적화하는 백신에서의 임상 시험은 평균적으로, 400개 아미노산의 바이러스 항원, 즉, 프레임쉬프트 펩타이드와 같은 비-자가 항원이 각각의 환자에서 적어도 하나의 면역원성 T 세포 반응을 생성하는데 필요함을 나타내었다. 각각의 암 샘플의 경우 커버되는 프레임쉬프트 펩타이드의 부분이 상이할 것이지만(즉, 각각의 암 샘플은 프레임쉬프트 돌연변이의 상이한 서브세트를 함유하며, 그 결과, 최적의 수집물로부터의 프레임쉬프트 펩타이드의 상이한 서브세트가 존재할 것이다), 최적의 수집물은 각각의 종양 샘플에 커버되는 프레임쉬프트 펩타이드의 분획이 총 길이가 적어도 400개의 아미노산을 갖도록 선택된다. 이러한 400개 아미노산의 규칙(400 amino acid rule)을 개시된 선택 방법에 포함함으로써 백신 표적 집단의 종양 속에 존재하는 FSP에 대한 T 세포의 유도를 보증한다.
(iii) 각각의 개개 암 샘플(암 샘플은 백신에 의해 표적화된 집단을 나타낸다)이 백신에 의해 암호화된 프레임쉬프트 펩타이드의 일부를 함유하고 이러한 부분에 나타낸 프레임쉬프트 펩타이드의 총 길이가 적어도 400개 아미노산이 되도록 백신 내에 포함될 프레임쉬프트 펩타이드의 최적의 수집물의 선택. 바이러스 항원을 표적화하는 백신에서의 임상 시험은 평균적으로, 400개 아미노산의 바이러스 항원, 즉, 프레임쉬프트 펩타이드와 같은 비-자가 항원이 각각의 환자에서 적어도 하나의 면역원성 T 세포 반응을 생성하는데 필요함을 나타내었다. 각각의 암 샘플의 경우 커버되는 프레임쉬프트 펩타이드의 부분이 상이할 것이지만(즉, 각각의 암 샘플은 프레임쉬프트 돌연변이의 상이한 서브세트를 함유하며, 그 결과, 최적의 수집물로부터의 프레임쉬프트 펩타이드의 상이한 서브세트가 존재할 것이다), 최적의 수집물은 각각의 종양 샘플에 커버되는 프레임쉬프트 펩타이드의 분획이 총 길이가 적어도 400개의 아미노산을 갖도록 선택된다. 이러한 400개 아미노산의 규칙(400 amino acid rule)을 개시된 선택 방법에 포함함으로써 백신 표적 집단의 종양 속에 존재하는 FSP에 대한 T 세포의 유도를 보증한다.
삭제
발명의 요약
제1 양태에서, 본 발명은 다음의 단계 (i) 및 (ii)를 포함하는, 유전성 및 산발성 미세-부수체 불안정성(micro-satellite instability: MSI) 암을 포함하는 암을 지니거나, 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료를 위한 범용 MSI 암 백신 펩타이드 수집물(CVP)을 생산하기 위한 프레임-쉬프트 펩타이드의 수집물(CFSP)을 선택하는 방법 에 관한 것이다:
(i) 각각이 프레임-쉬프트 돌연변이(FSM)를 포함하는 핵산의 수집물 (CFSM)을 선택하는 단계로서, 각각의 FSM은 각각의 상이한 환자의 적어도 M개의 암 샘플(CS) 중 하나 이상에 존재하며, 여기서 환자의 암은 MSI 표현형을 지닌 암 세포를 포함하고;
여기서 선택된 FSM의 적어도 50%는 기준 (a), (b), (c) 및/또는 (d)를 충족하는 단계:
(a) FSM은 6개 이상의 뉴클레오타이드의 길이를 지닌 암호화 유전자(coding gene)의 모노뉴클레오타이드 반복체(MNR) 속에 존재함;
(b) FSM은 1개의 뉴클레오타이드의 결실에 해당함;
(c) FSM을 포함한 DNA 서열분석 판독물(DNA sequencing read)의 수는, 매치된 정상 샘플(matched normal sample)과 비교하여 종양 샘플 속에서 유의적으로 더 높음(0.05 이하의 FDR-교정된 피셔 시험(Fisher test) p-값);
(d) FSM은, 매치된 정상 샘플 속에 25% 미만의 대립유전자 빈도(allele frequency)로 존재함,
(ii) X개의 상이한 프레임-쉬프트 펩타이드(FSP)를 선택하는 단계로서, 여기서 각각의 선택된 FSP가, FSM이 없는 상응하는 야생형(wt) 핵산의 번역 생성물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈(codon)으로부터 시작되는, 적어도 4개의 아미노산 길이의 CFSM의 FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물인 단계,
여기서 X는 적어도 20개, 보다 바람직하게는 적어도 35개이고 M은 적어도 5개이다.
제2 양태에서, 본 발명은 다음의 단계를 포함하는, CVP에 포함된 펩타이드의 아미노산 서열 또는 CVP에 포함된 펩타이드를 암호화하는 핵산 서열을 결정하는 방법에 관한 것이다:
(a) 제1 양태에 따라 선택된 CFSP로부터 적어도 Y개의 FSP 또는 이의 적어도 8개의 아미노산 길이의 단편을 선택하는 단계;
(b) 다음의 기준:
(i) FSP는 길이가 4 내지 9개 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속된 스트레치(stretch)를 함유함, 및/또는
(iii) FSP가 야생형(wt) 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열을 변형시키는 단계로서,
여기서 (i)에 따른 FSP의 아미노산 서열은 FSP의 바로 상부(immediately upstream)에 존재하는 야생형(wt) 아미노산 서열의 1 내지 4개의 아미노산을 FSP의 N-말단에 첨가함으로써 변형되고 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 아미노산 서열은, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 4개 미만의 아미노산 길이를 지닌 FSP는 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 아미노산 서열은 이러한 스트레치를 제거함으로써 변형되고; 연속된 스트레치의 제거 후 4개 미만의 아미노산의 길이를 지닌 변형된 FSP는 CVP로부터 배제되는, 단계;
여기서 CVP의 아미노산 서열은, 단계 a)에서 선택되고/되거나 단계 (b)에서 변형된 FSP 또는 이의 단편의 아미노산 서열을 포함하고;
여기서 Y는 적어도 20, 보다 바람직하게는 적어도 35이다.
제3 양태에서, 본 발명은
(i) 본 발명의 제2 양태의 방법에서 결정된 아미노산 또는 핵산 서열 정보를 수득하는 단계; 및
(ii) 하나 이상의 폴리펩타이드 중의 CVP의 아미노산 서열 또는 이러한 서열을 지닌 핵산의 수집물을 합성하고 임의로 핵산의 수집물을 하나 이상의 발현 카세트 및/또는 발현 벡터의 수집물 내로 삽입하는 단계를 포함하는, CVP 또는 CVP를 암호화하는 핵산의 수집물을 생산하는 방법에 관한 것이다.
제4 양태에서, 본 발명은 CVP 또는 본 발명의 제3 양태의 방법에 의해 생산가능한 상기 CVP의 펩타이드를 암호화하는 핵산의 수집물에 관한 것이다.
제5 양태에서, Y개의 상이한 FSP 및/또는 mFSP를 포함하거나 이로 이루어진 CVP로서,
여기서 각각의 FSP 또는 mFSP로 변형되는 FSP는, 길이가 적어도 4개 아미노산인 경우에서의 FSM이 없는 상응하는 wt 핵산의 번역물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈으로부터 시작되는 핵산을 함유하는 FSM의 단백질-암호화 분절의 단편 또는 완전한 번역 생성물이고,
여기서 FSP 또는 mFSP로 변형되는 FSP의 적어도 50%는 다음의 기준:
(a) FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트(subset)에 대해 관찰된 암 유형-특이적인 빈도(CF)로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나에 대해 적어도 5%임; 및/또는
(b) FSP를 암호화하는 FSM을 지닌 유전자의 평균 mRNA 발현 수준은, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 80번째 백분위수 이내임; 및/또는
(c) FSP를 생성하는 FSM은 암이 없는 대상체의 집단(cohort)내의 정상 조직내에서 2% 미만으로 관찰됨
중 하나 이상을 충족하고,
여기서 다음의 기준:
(i) FSP는 길이가 4 내지 9개의 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속적인 스트레치를 함유함, 및/또는
(iii) FSP가 wt 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열은, (i)에 따른 FSP의 경우에는, FSP의 바로 상부에 존재하는 야생형(wt) 아미노산 서열의 1 내지 4개 아미노산을 FSP의 N-말단에 첨가함으로써 변형되며 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 경우에는, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 FSP가 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 경우에는, 이러한 스트레치를 제거함으로써 변형되며; 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 변형된 FSP는 CVP로부터 배제되며;
여기서 Y는 적어도 20이고 보다 바람직하게는 적어도 35이며 M은 적어도 5인, CVP.
제6 양태에서, 본 발명은 본 발명의 제5 양태의 CVP를 암호화하는 핵산 수집물에 관한 것이다.
제7 양태에서, 본 발명은 본 발명의 제4 또는 제6 양태의 핵산 수집물의 모두 또는 일부분을 각각 포함하는, 하나 이상의 발현 벡터의 수집물에 관한 것이며, 여기서 발현 벡터의 수집물의 전체는 본 발명의 제4 또는 제6 양태의 핵산 수집물 모두를 포함한다.
제8 양태에서, 본 발명은 MSI 표현형을 지닌 암 세포를 포함하는 암을 갖거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료에 사용하기 위한, 본 발명의 제4 또는 제5 양태의 CVP, 본 발명의 제4 또는 제6 양태의 핵산 수집물, 본 발명의 제7 양태의 발현 벡터 수집물에 관한 것이며, 여기서 암은 결장직장암(colorectal cancer), 위암(gastric cancer), 자궁내막암(endometrial cancer), 소장암(small intestine cancer), 간담즙성 관 암(hepatobiliary tract cancer), 간암(liver cancer), 신경내분비암(neuroendocrine cancers), 자궁경부암(cervical cancer), 난소암(ovarian cancer), 자궁육종(uterine sarcomas), 뇌암(brain cancer) 및 피부 암(skin cancer)으로 이루어진 그룹으로부터 바람직하게 선택된다.
제8 양태에서, 본 발명은 MSI 표현형을 지닌 암 세포를 포함하는 암을 갖거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료에 사용하기 위한, 본 발명의 제4 또는 제6 양태의 핵산 수집물 및/또는 본 발명의 제7 양태의 발현 벡터 수집물에 관한 것이며, 여기서 핵산 수집물 및/또는 발현 벡터 수집물은 이종 프라임-부스트 백신접종 계획(heterologous prime-boost vaccination scheme)으로 투여되며, 바람직하게는 프라임은 아데노바이러스 벡터와 함께 존재하고 하나 이상의 부스트는 MVA 벡터와 함께 존재한다.
제1 양태에서, 본 발명은 다음의 단계 (i) 및 (ii)를 포함하는, 유전성 및 산발성 미세-부수체 불안정성(micro-satellite instability: MSI) 암을 포함하는 암을 지니거나, 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료를 위한 범용 MSI 암 백신 펩타이드 수집물(CVP)을 생산하기 위한 프레임-쉬프트 펩타이드의 수집물(CFSP)을 선택하는 방법 에 관한 것이다:
(i) 각각이 프레임-쉬프트 돌연변이(FSM)를 포함하는 핵산의 수집물 (CFSM)을 선택하는 단계로서, 각각의 FSM은 각각의 상이한 환자의 적어도 M개의 암 샘플(CS) 중 하나 이상에 존재하며, 여기서 환자의 암은 MSI 표현형을 지닌 암 세포를 포함하고;
여기서 선택된 FSM의 적어도 50%는 기준 (a), (b), (c) 및/또는 (d)를 충족하는 단계:
(a) FSM은 6개 이상의 뉴클레오타이드의 길이를 지닌 암호화 유전자(coding gene)의 모노뉴클레오타이드 반복체(MNR) 속에 존재함;
(b) FSM은 1개의 뉴클레오타이드의 결실에 해당함;
(c) FSM을 포함한 DNA 서열분석 판독물(DNA sequencing read)의 수는, 매치된 정상 샘플(matched normal sample)과 비교하여 종양 샘플 속에서 유의적으로 더 높음(0.05 이하의 FDR-교정된 피셔 시험(Fisher test) p-값);
(d) FSM은, 매치된 정상 샘플 속에 25% 미만의 대립유전자 빈도(allele frequency)로 존재함,
(ii) X개의 상이한 프레임-쉬프트 펩타이드(FSP)를 선택하는 단계로서, 여기서 각각의 선택된 FSP가, FSM이 없는 상응하는 야생형(wt) 핵산의 번역 생성물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈(codon)으로부터 시작되는, 적어도 4개의 아미노산 길이의 CFSM의 FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물인 단계,
여기서 X는 적어도 20개, 보다 바람직하게는 적어도 35개이고 M은 적어도 5개이다.
제2 양태에서, 본 발명은 다음의 단계를 포함하는, CVP에 포함된 펩타이드의 아미노산 서열 또는 CVP에 포함된 펩타이드를 암호화하는 핵산 서열을 결정하는 방법에 관한 것이다:
(a) 제1 양태에 따라 선택된 CFSP로부터 적어도 Y개의 FSP 또는 이의 적어도 8개의 아미노산 길이의 단편을 선택하는 단계;
(b) 다음의 기준:
(i) FSP는 길이가 4 내지 9개 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속된 스트레치(stretch)를 함유함, 및/또는
(iii) FSP가 야생형(wt) 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열을 변형시키는 단계로서,
여기서 (i)에 따른 FSP의 아미노산 서열은 FSP의 바로 상부(immediately upstream)에 존재하는 야생형(wt) 아미노산 서열의 1 내지 4개의 아미노산을 FSP의 N-말단에 첨가함으로써 변형되고 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 아미노산 서열은, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 4개 미만의 아미노산 길이를 지닌 FSP는 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 아미노산 서열은 이러한 스트레치를 제거함으로써 변형되고; 연속된 스트레치의 제거 후 4개 미만의 아미노산의 길이를 지닌 변형된 FSP는 CVP로부터 배제되는, 단계;
여기서 CVP의 아미노산 서열은, 단계 a)에서 선택되고/되거나 단계 (b)에서 변형된 FSP 또는 이의 단편의 아미노산 서열을 포함하고;
여기서 Y는 적어도 20, 보다 바람직하게는 적어도 35이다.
제3 양태에서, 본 발명은
(i) 본 발명의 제2 양태의 방법에서 결정된 아미노산 또는 핵산 서열 정보를 수득하는 단계; 및
(ii) 하나 이상의 폴리펩타이드 중의 CVP의 아미노산 서열 또는 이러한 서열을 지닌 핵산의 수집물을 합성하고 임의로 핵산의 수집물을 하나 이상의 발현 카세트 및/또는 발현 벡터의 수집물 내로 삽입하는 단계를 포함하는, CVP 또는 CVP를 암호화하는 핵산의 수집물을 생산하는 방법에 관한 것이다.
제4 양태에서, 본 발명은 CVP 또는 본 발명의 제3 양태의 방법에 의해 생산가능한 상기 CVP의 펩타이드를 암호화하는 핵산의 수집물에 관한 것이다.
제5 양태에서, Y개의 상이한 FSP 및/또는 mFSP를 포함하거나 이로 이루어진 CVP로서,
여기서 각각의 FSP 또는 mFSP로 변형되는 FSP는, 길이가 적어도 4개 아미노산인 경우에서의 FSM이 없는 상응하는 wt 핵산의 번역물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈으로부터 시작되는 핵산을 함유하는 FSM의 단백질-암호화 분절의 단편 또는 완전한 번역 생성물이고,
여기서 FSP 또는 mFSP로 변형되는 FSP의 적어도 50%는 다음의 기준:
(a) FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트(subset)에 대해 관찰된 암 유형-특이적인 빈도(CF)로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나에 대해 적어도 5%임; 및/또는
(b) FSP를 암호화하는 FSM을 지닌 유전자의 평균 mRNA 발현 수준은, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 80번째 백분위수 이내임; 및/또는
(c) FSP를 생성하는 FSM은 암이 없는 대상체의 집단(cohort)내의 정상 조직내에서 2% 미만으로 관찰됨
중 하나 이상을 충족하고,
여기서 다음의 기준:
(i) FSP는 길이가 4 내지 9개의 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속적인 스트레치를 함유함, 및/또는
(iii) FSP가 wt 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열은, (i)에 따른 FSP의 경우에는, FSP의 바로 상부에 존재하는 야생형(wt) 아미노산 서열의 1 내지 4개 아미노산을 FSP의 N-말단에 첨가함으로써 변형되며 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 경우에는, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 FSP가 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 경우에는, 이러한 스트레치를 제거함으로써 변형되며; 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 변형된 FSP는 CVP로부터 배제되며;
여기서 Y는 적어도 20이고 보다 바람직하게는 적어도 35이며 M은 적어도 5인, CVP.
제6 양태에서, 본 발명은 본 발명의 제5 양태의 CVP를 암호화하는 핵산 수집물에 관한 것이다.
제7 양태에서, 본 발명은 본 발명의 제4 또는 제6 양태의 핵산 수집물의 모두 또는 일부분을 각각 포함하는, 하나 이상의 발현 벡터의 수집물에 관한 것이며, 여기서 발현 벡터의 수집물의 전체는 본 발명의 제4 또는 제6 양태의 핵산 수집물 모두를 포함한다.
제8 양태에서, 본 발명은 MSI 표현형을 지닌 암 세포를 포함하는 암을 갖거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료에 사용하기 위한, 본 발명의 제4 또는 제5 양태의 CVP, 본 발명의 제4 또는 제6 양태의 핵산 수집물, 본 발명의 제7 양태의 발현 벡터 수집물에 관한 것이며, 여기서 암은 결장직장암(colorectal cancer), 위암(gastric cancer), 자궁내막암(endometrial cancer), 소장암(small intestine cancer), 간담즙성 관 암(hepatobiliary tract cancer), 간암(liver cancer), 신경내분비암(neuroendocrine cancers), 자궁경부암(cervical cancer), 난소암(ovarian cancer), 자궁육종(uterine sarcomas), 뇌암(brain cancer) 및 피부 암(skin cancer)으로 이루어진 그룹으로부터 바람직하게 선택된다.
제8 양태에서, 본 발명은 MSI 표현형을 지닌 암 세포를 포함하는 암을 갖거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료에 사용하기 위한, 본 발명의 제4 또는 제6 양태의 핵산 수집물 및/또는 본 발명의 제7 양태의 발현 벡터 수집물에 관한 것이며, 여기서 핵산 수집물 및/또는 발현 벡터 수집물은 이종 프라임-부스트 백신접종 계획(heterologous prime-boost vaccination scheme)으로 투여되며, 바람직하게는 프라임은 아데노바이러스 벡터와 함께 존재하고 하나 이상의 부스트는 MVA 벡터와 함께 존재한다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
도면 범례
도 1: 항원 길이는 백신-유도된 면역원성 에피토프의 수를 결정한다.
도 2: MSI 세포주내에서 Nous-209의 면역원성 적용범위(coverage).
도 3: MSI CRC 생검에서 Nous-209의 면역원성 적용범위.
도 4: MSI 환자의 생검에서 Nous-209로부터 발생하는 예측된 MHC-I 결합 에피토프의 수.
도 5: Nous-209에 포함된 서열 번호 123에 상응하는 FSP는 HLA.A02 유전자도입 마우스내에서 생체내(in vivo)에서 면역원성이다. 인터페론 γ(IFN-γ)에 대한 세포내 염색(ICS)에 의해 측정된 바와 같은, FSP 서열 번호 123에 나타낸 HLA-A02 9량체(nonamer)에 대한 5마리의 동물에서의 대표적인 CD8 T 세포 반응(패널 A). FSP-반응성 T 세포의 유의적인 백분율(percentage)(5.6%)을 나타내는 이들 마우스 중 하나로부터 IFN-γ+ CD8 T 세포에 대한 게이팅 전략(gating strategy)의 FACS 플롯(패널 B).
도 6: 레이아웃 A 및 B에서 Nous-209 FSP를 함유하는 8개의 인공 폴리펩타이드에 대해 IUPRED로 예측한 무질서 프로파일(disorder profile).
도 7: 발현 카세트의 개략도.
도 8: 마우스에서 GAd20-209-FSPs/MVA-209-FSPs 프라임/부스트 요법의 면역원성. IFNγ ELISpot 반응을 GAd20-209-FSPs 프라임(GAd) 후 2주째 및 MVA-209-FSPs 부스트(GAd/MVA) 후 1주째에 측정한다. 백신에 의해 암호화된 209개의 FSP의 폴리펩타이드 서열을 포함하는 합성 펩타이드(P1-P16)의 16개의 혼주물에 대한 반응(수백만개의 비장세포당 IFNγ를 생산하는 T 세포의 수)이 나타나 있다.
도 9: 209 FSP 서열을 포함하는 16개의 혼주물(pool) 각각에 대한 면역 반응의 측정. GAd20-209-FSPs/MVA-209-FSPs로 백신접종된 마우스의 비장세포에서 부스트 후 측정된 IFNγ ELISpot 반응. 백신에 의해 암호화된 209 FSP의 폴리펩타이드 서열을 포함하는 합성 펩타이드(P1 내지 P16)의 16개의 혼주물 각각에 대한 반응(수백만개의 비장세포당 IFNγ를 생산하는 T 세포의 수)이 나타나 있다.
도 10: 단일 벡터에 의해 암호화된 FSP에 대한 백신-유도된 면역 반응은 벡터 공동-투여에 의해 영향받지 않는다. IFNγ ELISpot 반응은 벡터 혼합물 또는 단일 벡터로 면역화시킨 마우스내에서 프라임 후(2주째, 회색 바아(gray bar)) 및 부스트 후(3주째, 검정색 바아) 측정한다. 벡터 FSPA1에 의해 암호화된 FSP의 서열을 포함하는 합성 펩타이드의 4개의 혼주물(P1-P4) (A)에 대한 및 벡터 FSPA2에 의해 암호화된 FSP의 서열을 포함하는 합성 펩타이드의 4개의 혼주물(P5-P8)(B)에 대한 반응(수백만개의 비장세포당 IFNγ를 생산하는 T 세포의 수)이 나타나 있다. 통계자료(통계학)는 비-매개변수 만-휘트니 U 시험(Mann-Whitney U test)(ns = p>0.05)으로 계산한다.
도 11: Nous-209에 포함된 서열 번호 123(FSP-펩타이드)에 상응하는 FSP는 HLA.A02 유전자도입 마우스에서 생체 내에서 면역원성이다. A) IFNγ+ CD8+ FSP-특이적인 T 세포 반응의 백분율 및 DMSP 대조군에 대해 관찰된 반응. B) DMSO 대조군(상부) 및 FSP 펩타이드(하부)에 대한 하나의 대표적인 마우스 샘플로부터의 IFN-γ+ CD8 T 세포에 대한 게이팅 전략의 FACS 플롯.
도 1: 항원 길이는 백신-유도된 면역원성 에피토프의 수를 결정한다.
도 2: MSI 세포주내에서 Nous-209의 면역원성 적용범위(coverage).
도 3: MSI CRC 생검에서 Nous-209의 면역원성 적용범위.
도 4: MSI 환자의 생검에서 Nous-209로부터 발생하는 예측된 MHC-I 결합 에피토프의 수.
도 5: Nous-209에 포함된 서열 번호 123에 상응하는 FSP는 HLA.A02 유전자도입 마우스내에서 생체내(in vivo)에서 면역원성이다. 인터페론 γ(IFN-γ)에 대한 세포내 염색(ICS)에 의해 측정된 바와 같은, FSP 서열 번호 123에 나타낸 HLA-A02 9량체(nonamer)에 대한 5마리의 동물에서의 대표적인 CD8 T 세포 반응(패널 A). FSP-반응성 T 세포의 유의적인 백분율(percentage)(5.6%)을 나타내는 이들 마우스 중 하나로부터 IFN-γ+ CD8 T 세포에 대한 게이팅 전략(gating strategy)의 FACS 플롯(패널 B).
도 6: 레이아웃 A 및 B에서 Nous-209 FSP를 함유하는 8개의 인공 폴리펩타이드에 대해 IUPRED로 예측한 무질서 프로파일(disorder profile).
도 7: 발현 카세트의 개략도.
도 8: 마우스에서 GAd20-209-FSPs/MVA-209-FSPs 프라임/부스트 요법의 면역원성. IFNγ ELISpot 반응을 GAd20-209-FSPs 프라임(GAd) 후 2주째 및 MVA-209-FSPs 부스트(GAd/MVA) 후 1주째에 측정한다. 백신에 의해 암호화된 209개의 FSP의 폴리펩타이드 서열을 포함하는 합성 펩타이드(P1-P16)의 16개의 혼주물에 대한 반응(수백만개의 비장세포당 IFNγ를 생산하는 T 세포의 수)이 나타나 있다.
도 9: 209 FSP 서열을 포함하는 16개의 혼주물(pool) 각각에 대한 면역 반응의 측정. GAd20-209-FSPs/MVA-209-FSPs로 백신접종된 마우스의 비장세포에서 부스트 후 측정된 IFNγ ELISpot 반응. 백신에 의해 암호화된 209 FSP의 폴리펩타이드 서열을 포함하는 합성 펩타이드(P1 내지 P16)의 16개의 혼주물 각각에 대한 반응(수백만개의 비장세포당 IFNγ를 생산하는 T 세포의 수)이 나타나 있다.
도 10: 단일 벡터에 의해 암호화된 FSP에 대한 백신-유도된 면역 반응은 벡터 공동-투여에 의해 영향받지 않는다. IFNγ ELISpot 반응은 벡터 혼합물 또는 단일 벡터로 면역화시킨 마우스내에서 프라임 후(2주째, 회색 바아(gray bar)) 및 부스트 후(3주째, 검정색 바아) 측정한다. 벡터 FSPA1에 의해 암호화된 FSP의 서열을 포함하는 합성 펩타이드의 4개의 혼주물(P1-P4) (A)에 대한 및 벡터 FSPA2에 의해 암호화된 FSP의 서열을 포함하는 합성 펩타이드의 4개의 혼주물(P5-P8)(B)에 대한 반응(수백만개의 비장세포당 IFNγ를 생산하는 T 세포의 수)이 나타나 있다. 통계자료(통계학)는 비-매개변수 만-휘트니 U 시험(Mann-Whitney U test)(ns = p>0.05)으로 계산한다.
도 11: Nous-209에 포함된 서열 번호 123(FSP-펩타이드)에 상응하는 FSP는 HLA.A02 유전자도입 마우스에서 생체 내에서 면역원성이다. A) IFNγ+ CD8+ FSP-특이적인 T 세포 반응의 백분율 및 DMSP 대조군에 대해 관찰된 반응. B) DMSO 대조군(상부) 및 FSP 펩타이드(하부)에 대한 하나의 대표적인 마우스 샘플로부터의 IFN-γ+ CD8 T 세포에 대한 게이팅 전략의 FACS 플롯.
본 발명을 하기에 상세히 기술하기 전에, 본 발명은 본원에 기술된 특수한 방법론, 프로토콜 및 시약에 한정되지 않는데, 이는 이들이 변할 수 있기 때문임을 이해하여야 한다. 또한 본원에 사용된 전문용어는 특수한 구현예 만을 기술할 목적을 위한 것이며 첨부된 청구범위에 의해서만 제한될 본 발명의 영역을 제한하는 것으로 의도되지 않음이 이해되어야 한다. 달리 정의하지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 당해 분야의 통상의 기술자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다.
바람직하게는, 본원에 사용된 용어는 "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", Leuenberger, H.G.W, Nagel, B. and Klbl, H. eds. (1995), Helvetica Chimica Acta, CH-4010 Basel, Switzerland)에 기술된 바와 같이 및 악셀 클리만(Axel Kleemann) 및 위르겐 엔젤(Jurgen Engel)에 의한 "Pharmaceutical Substances: Syntheses, Patents, Applications", Thieme Medical Publishing, 1999; 수잔 부다바리(Susan Budavari) 등에 의해 편집된 "Merck Index: An Encyclopedia of Chemicals, Drugs, and Biologicals", CRC Press, 1996, 및 2001년에 메릴랜드주 록빌(Rockville) 소재의 United States Pharmcopeial Convention, Inc.에 의해 발표된, 미국 약전-25/국가 의약품집-20에 기술된 바와 같이 정의된다.
내용이 달리 필요로 하지 않는 한, 다음의 본 명세서 및 청구범위 전체에서, 용어 "포함하다(comprise)", 및 "포함하다(comprises)" 및 "포함하는(comprising)"과 같은 변형은 기술된 특징, 정수 또는 단계 또는 특징들, 정수들 또는 단계들의 그룹의 혼입을 내포하나 임의의 다른 특징, 정수 또는 단계 또는 정수들 또는 단계들의 그룹의 배제하지 않는 것으로 이해될 것이다. 다음의 구절에서 본 발명의 상이한 양태가 보다 상세히 정의된다. 이렇게 정의된 각각의 양태는 달리 명확하게 나타내지 않는 한 임의의 다른 양태 또는 양태들과 조합될 수 있다. 특히, 바람직하거나 유리한 것으로 나타낸 임의의 특징은 바람직하거나 유리한 것으로 나타낸 임의의 다른 특징 또는 특징들과 조합될 수 있다.
몇가지 문서가 본 명세서 내용 전체에서 인용된다. 본원에 인용된 문서 각각(모든 특허, 특허원, 과학 공보, 제조업자의 명세서, 설명서 등을 포함)은 상기 또는 하기에 상관없이 이의 전문이 본원에 참고로 포함된다. 본원의 어느 것도 본 발명이 선행 발명으로 인하여 이러한 개시내용을 선행하는 자격이 없는 것으로 인정하는 것으로 해석되지 않아야 한다.
정의
다음에, 본 명세서에서 흔히 사용된 용어의 일부 정의가 제공된다. 이러한 용어는 명세서의 나머지 부분에서, 이의 용도의 각각의 예에서, 각각의 정의된 의미 및 바람직한 의미를 가질 것이다.
본원에 사용된 바와 같이, 용어 "단리된"은 이와 천연적으로 결합된 다른 분자가 실질적으로 없는 분자를 지칭한다. 특히, '단리된'은 분자가 동물 신체 또는 동물 신체 샘플 속에 존재하지 않음을 의미한다. 따라서, 단리된 분자는 동물내에서 직면하거나 접촉할 수 있는 다른 분자가 없음을 의미한다. 단리된은 본원에 기술된 바와 같이 결합된 다른 성분으로부터 단리됨을, 예컨대, 분자가 포함된 조성물의 다른 성분으로부터 단리됨을, 또는 이것이 포함된 벡터 또는 세포로부터 단리됨을 의미하지 않는다.
용어 "폴리뉴클레오타이드" 및 "핵산"은 본원에서 상호교환적으로 사용되며 뉴클레오타이드 단량체로 제조된 중합체성 또는 올리고머성 거대분자로서 이해된다. 뉴클레오타이드 단량체는 핵염기, 5탄당(예를 들면, 이에 한정되지 않는 리보스 또는 2'-데옥시리보스), 및 1 내지 3개의 포스페이트 그룹으로 구성된다. 전형적으로, 핵산은 개개의 뉴클레오타이드 단량체 사이의 포스포디에스테르 결합을 통해 형성된다. 본 발명의 맥락에서 바람직한 핵산 분자는 리보핵산(RNA), 변형된 RNA, 데옥시리보핵산(DNA), 및 예컨대, RNA-DNA 하이브리드와 같은 이의 혼합물을 포함하나, 이에 한정되지 않는다. 핵산은 예컨대, 포스포디에스테르 방법(참고: 예를 들면, Uhlmann, E. & Peyman, A. (1990) Chemical Reviews, 90, 543-584)에 따라서, 예컨대, 화학적으로 합성될 수 있다.
용어 "ORF"로 약칭된 "개방 판독 프레임"은 본 발명의 맥락에서 아미노산의 연속된 스트링(string)으로 번역될 수 있는 뉴클레오타이드의 서열을 지칭하기 위해 사용된다. 전형적으로, ORF는 출발 코돈, 일반적으로 다수의 3개 뉴클레오타이드이지만, 제공된 판독 프레임내에 정지 코돈(TAG, TAA, TGA, UAG, UAA, 또는 UGA)을 함유하지 않는 길이를 갖는 후속된 영역을 함유한다. ORF는 단백질을 암호화하며 여기서 이것이 번역될 수 있는 아미노산은 펩타이드-연결된 쇄를 형성한다.
용어 "ORF"로 약칭된 "개방 판독 프레임"은 본 발명의 맥락에서 아미노산의 연속된 스트링(string)으로 번역될 수 있는 뉴클레오타이드의 서열을 지칭하기 위해 사용된다. 전형적으로, ORF는 출발 코돈, 일반적으로 다수의 3개 뉴클레오타이드이지만, 제공된 판독 프레임내에 정지 코돈(TAG, TAA, TGA, UAG, UAA, 또는 UGA)을 함유하지 않는 길이를 갖는 후속된 영역을 함유한다. ORF는 단백질을 암호화하며 여기서 이것이 번역될 수 있는 아미노산은 펩타이드-연결된 쇄를 형성한다.
삭제
본원에 사용된 바와 같은, 용어 "단백질", "펩타이드", "폴리펩타이드", "펩타이드" 및 "폴리펩타이드"는 전반에 걸쳐서 상호교환적으로 사용된다. 이러한 용어는 본 발명의 맥락에서 천연적으로 존재하는 펩타이드, 예컨대, 천연적으로 존재하는 단백질 및 천연적으로 또는 비-천연적으로 존재하는 아미노산을 포함할 수 있는 합성된 펩타이드를 지칭하기 위해 사용된다. 펩타이드는 또한 천연적으로 또는 비-천연적으로 존재하는 아미노산의 측쇄 또는 유리 아미노 또는 카복시-말단을 변형시킴으로써 화학적으로 변형시킬 수 있다. 이러한 화학적 변형은 추가의 화학적 모이어티 뿐만 아니라 글리코실화와 같은, 아미노산의 측쇄내 작용 그룹의 변형을 포함한다. 펩타이드는 바람직하게는 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 적어도 100개의 아미노산, 가장 바람직하게는 적어도 8개 또는 적어도 30개의 아미노산을 갖는 중합체이다.
"FSM"으로 약칭된 용어 "프레임-쉬프트 돌연변이(frame-shift mutation)"는 본 발명의 맥락에서 단백질을 암호화하는 OFR내 핵산 서열의 변경을 지칭하기 위해 사용되며, 이는 돌연변이의 하부의 개방 프레임의 변경을 야기하므로, 야생형 단백질과 비교하여 변경된 서열을 지닌 단백질을 야기한다. 프레임-쉬프트 돌연변이는, 다수의 뉴클레오타이드가 삽입되거나 결실되는 경우, 3으로 나누어질 수 없는 ORF를 생산한다. 전형적으로, 1 또는 2개의 뉴클레오타이드가 결실되거나 삽입되는 경우 FSM이 생성된다. 결실은 삽입보다 더 흔하다. 1개 또는 2개의 뉴클레오타이드가 ORF의 코돈내에서 결실되는 경우, 변경된 코돈은 영향받은 코돈의 3'의 1개 또는 2개의 뉴클레오타이드로 형성될 것이다. 이러한 변경된 코돈이 정지 코돈이 아닌 경우 ORF의 번역 생성물은 변경된 코돈 및 다음 정지 코돈까지 변경된 코돈의 대안적 ORF 3'에 의해 결정될 것이다. 1개 또는 2개의 뉴클레오타이드가 코돈내로 삽입된 경우 앞서의 뉴클레오타이드의 2개 또는 1개의 뉴클레오타이드 및 1개 또는 2개의 삽입된 뉴클레오타이드를 포함할 새로운 코돈이 생성된다. 이러한 신규한 코돈이 정지 코돈이 아닌 경우, ORF의 번역 생성물은 다음의 정지 코돈까지 신규한 코돈 및 신규한 코돈의 대안적 ORF 3'에 의해 결정될 것이다.
"FC"로 약칭된 용어 "프레임-쉬프트 코돈"은 본 발명의 맥락에서 야생형 서열과 비교하여 상이한 아미노산을 암호화하는 FSM의 3'에서 첫번째 코돈을 지칭하기 위해 사용된다.
"CFSM"으로 약칭된 용어 "FSM을 포함하는 핵산의 수집물"은 본 발명의 맥락에서 특정 MSI 암 유형, 예컨대, 결장직장, 자궁내막 또는 위암 또는 2개 이상의 MSI 암 또는 하기에 상세히 요약된 하나 이상의 기준에 따라 선택된 FSM의 소그룹에서 관찰된 모든 FSM을 나타낼 수 있는 FSM을 각각 포함하는 별개의 뉴클레오타이드 서열의 목록을 지칭하기 위해 사용된다.
"FSP"로 약칭된 용어 "프레임-쉬프트 펩타이드"는 본 발명의 맥락에서 FC로부터 출발하여 CFSM의 FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물을 지칭하기 위해 사용된다.
"CFSP"로 약칭된 용어 "프레임-쉬프트 펩타이드의 수집물"은 본 발명의 맥락에서 특히 MSI 암 유형, 예컨대, 결장직장, 자궁내막 또는 위암 또는 2개 이상의 MSI 암 또는 하기 상세히 요약된 하나 이상의 기준에 따라 선택된 FSP의 소그룹에서 관찰된 모든 FSP를 나타낼 수 있는 FSP의 아미노산 서열의 목록을 지칭하기 위해 사용된다.
"mFSP"로서 약칭된 용어 "변형된 FSP"는 본 발명의 맥락에서 FSP를 기반으로 하지만 특정 FSP가 암 백신 펩타이드 수집물을 형성하는 펩타이드의 수집물내로 포함시키기에 보다 적합하도록 하는 아미노산의 첨가 또는 결실에 의해 FSP와 비교하여 변형된 아미노산 서열을 갖는 펩타이드를 지칭하기 위해 사용된다. 변형 및 특정 변형으로부터 유리할 수 있는 FSP를 선택하기 위한 기준은 하기 상세히 요약되어 있다.
"CVP"로 약칭된 용어 "암 백신 펩타이드 수집물"은 본 발명의 맥락에서 개개 펩타이드의 형태로 또는 서로 연결된 것으로서, FSP 및/또는 mFSP를 지칭하기 위해 사용된다. 바람직하게는 2개 이상의 상이한 FSP 및/또는 mFSP는 폴리펩타이드를 형성하는 펩타이드 결합에 의해 서로 연결된다. 연결은 직접적으로 또는 하나 이상의 링커 아미노산, 예컨대, Gly, Ser, 또는 Ala와 같은 작은 굴곡성 아미노산을 통할 수 있다. 추가의 항원의 생성을 피하기 위해, 폴리펩타이드가 서로 직접 연결되는 것이 바람직하다. FSP 및/또는 mFSP를 함께 연결시켜 폴리펩타이드를 형성하는 것이 바람직하다. 매우 긴 mRNA의 번역 효능이 감소됨은 공지되어 있으므로, 전체 길이가 1,000개 아미노산 이상, 보다 바람직하게는 1,500개 아미노산 이상인 FSP 및 mFSP를 포함하는 CVP가 별도의 폴리펩타이드로 분할되는 것이 바람직하다. 예컨대, CVP가 약 6,000개 아미노산의 FSP 및/또는 mFSP를 포함하는 경우, FSP 및/또는 mFSP가 연결되어 총 길이가 약 1,500개 아미노산인 FSP 및/또는 mFSP를 각각 포함하는 4개의 별도의 폴리펩타이드를 형성하는 것이 바람직하다.
"MSI"로 약칭된 용어 "미세부수체 불안정성"은 미세부수체 영역 내 하나 이상의 반복 단위의 결실 또는 삽입으로 인하여 미세부수체의 길이 내 변경으로서 정의된다. 이는 동일한 개인으로부터의 정상/배선(germline) 세포 내 게놈 DNA와 비교하는 경우 종양 세포의 게놈 DNA 내 변경된 전체 길이와 신규의 미세부수체 대립유전자를 생성한다. 유전적 초돌연변이성(genetic hypermutability)의 이러한 조건은 손상된 DNA 미스매치 복구(mismatch repair: MMR)로부터 생성된다. MMR은 DNA 복제 동안 게놈성 DNA 내에서 발생하는 자발적 돌연변이를 수정하는 메커니즘이다. 전형적으로, 돌연변이는 짧은 뉴클레오타이드 삽입 또는 결실의 단일 염기 미스매치이다. 후자의 2개는 ORF내에 발생하는 경우 및 삽입되거나 결실된 뉴클레오타이드 서열의 길이가 3으로 나누어지지 않는 경우 프레임쉬프트 돌연변이를 생성할 수 있다(참고: FSM의 상기 정의).
용어 "MSI 표현형"은 가장 흔히 GT/CA 반복체인, 반복된 뉴클레오타이드의 길이 내 변화의 진단을 지칭한다. 이러한 반복체는 건강한 대상체의 게놈 DNA 전체에서 발생하며 사람 게놈의 약 3%를 구성한다. 기술자는 샘플내에서 MSI 표현형을 결정하는 방법을 알고 있다. 바람직한 방법은 Promega(위스콘신주 매디슨 소재) MSI 분석 시스템(v 1.2), 미세부수체 불안정성에 있어서 국립 암 협회(National Cancer Institute(NCI) 워크숍 동안 확립된 가이드라인에 따른, 7개 마커의 종합 시험의 사용이다.
용어 "신생-에피토프"는 본 발명의 맥락에서 정상의/배선 세포내에서 존재하지 않지만 특히 MSI 표현형을 갖는 전암성 및/또는, 암성 세포내에서 존재하는 종양에 의해 암호화된 에피토프(epitope)를 지칭한다.
용어 "발현 카세트"는 본 발명의 맥락에서 발현될 적어도 하나의 핵산 서열, 예컨대, 전사 및 번역 조절 서열에 작동적으로 연결된, 본 발명의 CVP를 암호화하는 핵산 또는 이의 부분을 암호화하는 핵산 분자를 지칭하기 위해 사용된다. 바람직하게는, 발현 카세트는 제공된 유전자의 효율적인 발현을 위한 시스-조절되는 성분, 예를 들면, 프로모터, 개시-부위 및/또는 폴리아데닐화-부위를 포함한다. 바람직하게는, 발현 카세트는 환자의 세포내에서 핵산의 발현에 요구되는 추가의 성분 모두를 함유한다. 따라서, 대표적인 발현 카세트는 발현될 핵산 서열에 작동적으로 연결된 프로모터 및 전사체, 리보소옴 결합 부위, 및 번역 종결의 효율적인 폴리아데닐화에 요구되는 신호를 함유한다. 카세트의 추가의 성분은 예를 들면, 인핸서(enhancer)를 포함할 수 있다. 발현 카세트는 바람직하게는 또한 구조 유전자의 하부의 전사 말단 영역을 함유함으로써 효율적인 종결을 제공한다. 종결 영역은 프로모터 서열과 동일한 유전자로부터 수득될 수 있거나 상이한 유전자로부터 수득될 수 있다.
본 발명의 맥락에서 사용된 바와 같이 용어 "작동적으로 연결된"은 성분들의 정렬을 지칭하며, 여기서 이렇게 기술된 구성성분은 이들의 일반적인 기능을 수행하도록 구성된다. 핵산은 다른 핵산 서열과 기능적 관계로 위치하는 경우 "작동적으로 연결된"다. 예를 들면, 프로모터는 이것이 하나 이상의 이식유전자(transgene)의 전사에 영향을 미치는 경우, 하나 이상의 이식유전자에 작동적으로 연결된다. 또한, 암호화 서열에 작동적으로 연결된 조절 성분은 암호화 서열의 발현에 영향을 미칠 수 있다. 대조군 성분은 이의 발현을 지시하도록 기능하지 않는 한, 이들은 암호화 서열과 연속적일 필요가 없다. 따라서, 예를 들어, 개재하는 아직 번역되지 않고 전사된 서열은 프로모터 서열과 암호화 서열 사이에 존재할 수 있으며 프로모터 서열은 여전히 암호화 서열에 "작동적으로 연결된" 것으로 고려될 수 있다.
용어 "발현 벡터"는 본 발명의 핵산 또는 본 발명의 핵산의 수집물의 부분인 하나의 핵산을 세포, 바람직하게는 포유동물 세포내로 도입될 수 있거나 도입할 수 있는 폴리뉴클레오타이드 또는 폴리뉴클레오타이드와 단백질의 혼합물을 지칭한다. 벡터의 예는 플라스미드, 코스미드, 파아지, 바이러스 또는 인공 염색체를 포함하나, 이에 한정되지 않는다. 특히, 벡터는 프로모터 및 핵산 또는 본 발명의 핵산의 수집물의 부분인 하나의 핵산의 수집물을 적합한 숙주 세포내로 수송하는데 사용된다. 발현 벡터는 숙주 세포내에서 발현 벡터의 자가 복제를 촉진하는 "레플리콘(replicon)" 폴리뉴클레오타이드 서열을 함유할 수 있다. 일단 숙주 세포내에 있는 경우, 발현 벡터는 숙주 염색체 DNA와는 별도로 또는 이와 동시에 복제할 수 있으며, 수개 카피의 벡터 및 이의 삽입된 DNA가 생성될 수 있다. 복제가 불가능한 발현 벡터가 사용되는 경우에 - 이는 흔히 안전성 이유를 위한 경우이다 - 벡터는 복제할 수 없지만 핵산의 단지 직접적인 발현을 지시할 수 있다. 발현 벡터의 유형에 따라서 발현 벡터는 세포로부터 손실될 수 있거나, 즉, 핵산에 의해 암호화된 CVP를 단지 일시적으로 발현하거나 또는, 세포내에서 안정해질 수 있다. 발현 벡터는 전형적으로 발현 카세트, 즉, mRNA 분자내로 핵산의 전사를 허용하는 필수 성분을 함유한다.
용어 "항원"은 본 발명의 맥락에서 면역 반응의 분자에 의해 인식된 임의의 구조, 예컨대, 항체, T 세포 수용체(TCR) 등을 지칭하기 위해 사용된다. 바람직한 항원은 특정 질환과 관련된 세포 단백질이다. 항원은 조정된 면역계의 고 가변성 항원 수용체(B-세포 수용체 또는 T-세포 수용체)에 의해 인식되며 체액 또는 세포 면역 반응을 유발할 수 있다. 이러한 반응을 유발하는 항원은 또한 면역원으로 지칭된다. 이들이 외부의 또는 세포성인 것에 상관없이, 세포내 단백질의 분획은 보다 작은 펩타이드로 가공되며 주요 조직 적합성 복합체(MHC)에 의해 나타난다. 작은 펩타이드 단편이 T-세포 수용체에 의해 결합되는 경우, 세포 면역 반응이 유발된다.
항원 결정인자로서 또한 공지된 용어 "에피토프"는 본 발명의 맥락에서 항원의 분절, 바람직하게는 면역계의 분자에 의해 결합된 펩타이드, 예컨대, B-세포 수용체, T-세포 수용체 또는 항체를 지칭하는데 사용된다. 항체 또는 B 세포에 의해 결합된 에피토프는 "B-세포 에피토프"로 지칭되며, T 세포에 의해 결합된 에피토프는 "T 세포 에피토프"로 지칭된다. 이러한 맥락에서, 용어 "결합"은 바람직하게는 특이적인 결합에 관한 것이며, 이는 항체 또는 T 세포 수용체(TCR)와 1 x 105 M-1 이상, 바람직하게는 1 x 106 M-1, 1 x 107 M-1, 1 x 108 M-1 이상의 각각의 에피토프사이에 결합 상수를 지닌 결합으로서 정의된다. 기술자는 결합 상수를 결정하는 방법을 잘 인식하고 있다(참고: 예컨대, Caoili, S.E. (2012) Advances in Bioinformatics Vol. 2012). 바람직하게는, 에피토프에 대한 항체의 특이적인 결합은 항체의 Fab(단편, 항원 결합) 영역에 의해 매개되며, B-세포의 특이적인 결합은 B-세포 수용체에 의해 포함된 항체의 Fab 영역에 의해 매개되고 T-세포의 특이적인 결합은 T-세포 수용체의 가변(V) 영역에 의해 매개된다. T 세포 에피토프는 항원 제시 세포(antigen presenting cell)의 표면에 나타나며, 여기서 이들은 주요 조직적합성(Major Histocompatiblilty: MHC) 분자에 결합된다. MHC 부류 I, II 및 III 분자로 각각 명명된 MHC 분자의 적어도 3개의 상이한 부류가 존재한다. MHC-I 경로를 통해 나타난 에피토프는 세포독성 T 림프구(CD8+ 세포)에 의한 반응을 유발하는 반면, MHC-II 경로를 통해 나타난 에피토프는 T-헬퍼 세포(CD4+ 세포)에 의한 반응을 유발한다. MHC 제I 부류 분자에 의해 나타난 T 세포 에피토프는 전형적으로 길이가 8 내지 11개 아미노산인 펩타이드이며, MHC 제II 부류 분자에 의해 나타난 T 세포 에피토프는 전형적으로 길이가 13 내지 17개 아미노산인 펩타이드이다. MHC 제III 부류 분자는 또한 당지질과 같은 비-펩타이드 에피토프를 나타낸다. 따라서, 용어 "T 세포 에피토프"는 바람직하게는 MHC 제I 부류 또는 MHC 제II 부류 분자에 의해 나타날 수 있는 길이가 8 내지 11개 또는 13 내지 17개 아미노산인 펩타이드를 지칭한다. 에피토프는 일반적으로 아미노산의 화학적으로 활성인 표면 그루핑(grouping)으로 이루어지며, 이는 당 측쇄를 수반하거나 수반하지 않을 수 있고 일반적으로 특이적인 3-차원 구조 특성 뿐만 아니라 특이적인 전하 특성도 갖는다. 구조적 및 비-구조적 에피토프는 후자에 대한 결합이 아닌 전자에 대한 결합이 변성 용매의 존재하에서 손실된다는 점에서 구분된다.
본 발명의 맥락에서 사용된 바와 같은 용어 "연결 에피토프"는 주어진 CVP의 단리된 FSP, mFSP 및/또는 이의 항원성 단편 내에 존재하지 않지만 펩타이드 결합에 의한 2개의 펩타이드, 예컨대, 2개의 FSP인 에피토프의 연결시 형성된 아미노산 서열을 포함하는 에피토프를 지칭한다. 예를 들면, 8개의 연속된 아미노산을 지닌 조립된 펩타이드의 모든 잠재적인 연결 에피토프의 목록이 생성될 수 있으며, 여기서 연결 펩타이드 결합을 포함하는 첫번째 펩타이드의 1 내지 7개의 아미노산 및 두번째 펩타이드로부터의 7 내지 1개의 아미노산이 포함된다. 이러한 목록은 이후에 CVP의 모든 FSP 및 mFSP의 아미노산 서열과 비교하여 모든 잠재적인 연결 에피토프를 확인한다.
용어 "비-MSI 암 에피토프"는 암 세포내에서 특이적으로 발현되지만 FSM에 기인하지 않는 단백질의 에피토프를 지칭한다. 이러한 에피토프는 건강한 세포에서보다 암 세포내에서 적어도 10배 이상 풍부한 경우 특이적인 것으로 고려된다. 이러한 에피토프의 예는 이의 발현이 암 세포내에서 상향조절된 단백질, 예컨대, 흑색종내에서 타이로시나제 또는 유방암에서 Her-2 수용체, 또는 특정 암에서 돌연변이된 단백질, 예컨대, p53이다.
용어 "면역원성 적용범위(coverage)"는 백신이 환자에서 유발시키는 경향이 있는 예측된 수의 면역원성 에피토프를 지칭한다. 400개 아미노산의 누적된 길이에 대한 환자의 종양 속에 존재하는 FSP의 세트를 암호화하는 백신은 평균 3개의 면역원성 에피토프를 유발하는 것으로 예측되며 양호한 면역원성 적용범위를 제공한다.
본 발명의 맥락에서 사용된 바와 같은 용어 "이의 항원성 단편"은 항원, 바람직하게는 FSP 또는 mFSP의 단편을 지칭하며, 여기서 단편은 또한 항원성인데, 즉, 포유동물내에서 B 및/또는 T 세포 면역 반응을 유발할 수 있다. 바람직하게는 항원성의 "FSP 및/또는 mFSP의 단편"은 상기 및 하기에 보다 상세히 정의된 바와 같은 FSP 및 mFSP의 적어도 8개의 아미노산 길이의 연속된 스트레치이다. mFSP의 단편은 mFSP를 기반으로 하는 FSP의 적어도 4개의 아미노산을 포함한다.
용어 "CVP를 암호화하는 핵산의 수집물"은 본 발명의 맥락에서 CVP의 모든 FSP 및/또는 mFSP 또는 이의 항원성 단편을 포함하는 폴리펩타이드를 암호화하고, CVP의 모든 FSP 및/또는 mFSP를 포함하는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상, 바람직하게는 4개의 폴리펩타이드를 암호화하는, 하나 이상의 연속된(consecutive) 핵산 서열을 지칭하기 위해 사용된다. 따라서, 용어는 일 구현예에서 CVP를 암호화하는 단일 핵산을 포함하며 다른 대부분의 극도의 구현예에서 핵산의 수집물은 각각의 FSP 및/또는 mFSP에 대한 별개의 핵산 또는 이의 항원성 단편을 포함한다.
본 발명의 맥락에 사용된 바와 같은 용어 "제조" 및 "조성물"은 활성 성분, 예컨대, 본 발명의 VLP와 담체 및/또는 부형제의 제형을 포함하는 것으로 의도된다.
본 발명의 맥락에서 사용된 바와 같은 "약제학적으로 허용되는"은 동물, 및 보다 특히 사람에서 사용하기 위해 연방 또는 주 정부의 규제기관에 의해 승인되거나 미국 약전 또는 다른 일반적으로 인식된 약전에 나열됨을 의미한다.
본원에 사용된 바와 같은, 용어 "담체"는 이와 함께 치료학적으로 활성인 성분이 투여되는 희석제, 부형제, 계면활성제, 안정화제, 생리학적 완충 용액 또는 비히클과 같은 그러나 이에 한정되지 않는 약리학적으로 불활성인 물질을 지칭한다. 이러한 약제학적 담체는 액체 또는 고체일 수 있다. 액체 담체는 멸균 액체, 예를 들면, 물 및 오일 속의 염수 용액, 예를 들면, 석유, 동물성, 식물성 또는 합성 기원, 예를 들면, 땅콩 오일, 대두 오일, 광 오일, 참깨 오일 등의 것을 포함하나, 이에 한정되지 않는다. 염수 용액 및 수성 덱스트로즈 및 글리세롤 용액은 또한 특히 주사가능한 용액에 대한 액체 담체로서 사용될 수 있다. 염수 용액은 약제학적 조성물이 정맥내 투여되는 경우 바람직한 담체이다. 적합한 약제학적 담체의 예는 이. 엠. 마틴(E. W. Martin)에 의한 "Remington's Pharmaceutical Sciences"에 기술되어 있다.
적합한 약제학적 "부형제"는 전분, 글루코즈, 락토즈, 슈크로즈, 젤라틴, 맥아, 쌀, 밀가루, 백악, 실리카 겔, 스테아르산나트륨, 글리세롤 모노스테아레이트, 활석, 염화나트륨, 탈지 분유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등을 포함한다.
"계면활성제"는 음이온성, 양이온성, 및 비-이온성 표면활성제, 예를 들면, 그러나 이에 한정되지 않는 나트륨 데옥시콜레이트, 나트륨 도데실설페이트, 트리톤 X-100, 및 폴리소르베이트, 예를 들면, 폴리소르베이트 20, 폴리소르베이트 40, 폴리소르베이트 60, 폴리소르베이트 65 및 폴리소르베이트 80을 포함한다.
"안정화제"는 만니톨, 슈크로즈, 트레할로즈, 알부민뿐만 아니라, 프로테아제 및/또는 뉴클레아제 길항제를 포함하나, 이에 한정되지 않는다.
본 발명의 내용에서 사용될 수 있는 "생리학적 완충제 용액"은 염화나트륨 용액, 탈염수 뿐만 아니라 적합한 유기 또는 무기 완충제 용액, 예를 들면, 그러나 이에 한정되지 않는 포스페이트 완충제, 시트레이트 완충제, 트리스 완충제 (트리스(하이드록시메틸)아미노메탄), HEPES 완충제 ([4 (2 하이드록시에틸)피페라지노]에탄설폰산) 또는 MOPS 완충제 (3 모르폴리노-1 프로판설폰산)을 포함하나, 이에 한정되지 않는다. 일반적으로 각각의 완충제의 선택은 바람직한 완충제 몰 농도에 의존한다. 포스페이트 완충제는 예를 들면, 주사 및 주입 용액용으로 적합하다.
용어 "보조제(adjuvant)"는 세포성 또는 체액성 수준에서 조성물의 활성 성분에 대한 면역 반응을 증강시키거나, 자극하거나, 활성화시키거나, 강화시키거나, 조절하는 제제를 지칭하는데, 예컨대, 면역원성 보조제는 실제 항원에 대한 면역계의 반응을 자극하지만 면역학적 효과 자체를 가지지 않는다. 이러한 보조제의 예는 무기 보조제(예컨대, 인산알루미늄 또는 수산화알루미늄과 같은 무기 금속염), 유기 보조제(예컨대, 사포닌 또는 스쿠알렌), 오일-기반 보조제(예컨대, 프루언트 완전 보조제(Freund's complete adjuvant) 및 프루언트 불완전 보조제), 사이토킨(예컨대, IL-1β, IL-2, IL-7, IL-12, IL-18, GM-CFS, 및 INF-γ), 입자화된 보조제(예컨대, 면역-자극성 복합체(ISCOMS), 리포좀, 또는 생분해가능한 미세구), 비로좀(virosome), 세균 보조제(예컨대, 모노포스포릴 지질 A, 또는 무라밀 펩타이드), 합성 보조제(예컨대, 비-이온성 공중합체, 무라밀 펩타이드 유사체, 또는 합성 지질 A), 또는 합성 폴리뉴클레오타이드 보조제(예컨대, 폴리아르기닌 또는 폴리라이신)을 포함하나, 이에 한정되지 않는다.
"유효량" 또는 "치료학적 유효량"은 의도된 목적을 달성하기에 충분한 치료제의 양이다. 제공된 치료제의 유효량은 제제의 특성, 투여 경로, 치료제를 제공받는 동물의 크기 및 종, 및 투여 목적과 같은 인자에 따라 변할 수 있다. 각각의 개개 경우에서 유효량은 당해 분야에 확립된 방법에 따라 기술자에 의해 실험적으로 결정될 수 있다.
본원에 사용된 바와 같은, 질병 또는 장애의 "치료하다", "치료하는", "치료" 또는 "요법(therapy)"은 다음 중 하나 이상을 달성함을 의미한다: (a) 장애의 중증도의 감소; (b) 치료되는 장애(들)의 증상적 특성의 발달의 제한 또는 방지; (c) 치료되는 장애(들)의 증상적 특징의 악화 억제; (d) 이미 장애(들)가 있는 개인에서 장애(들)의 재발의 제한 또는 방지; 및 (e) 이미 장애(들)에 대한 증상이 있던 개인에서 증상의 재발의 제한 또는 방지.
발명의 양태 및 바람직한 구현예
제1 양태에서, 본 발명은 다음의 단계 (i) 및 (ii)를 포함하는, 유전성 및 산발성 미세-부수체 불안정성(MSI) 암을 포함하는 암을 지니거나, 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료를 위한 범용 MSI 암 백신 펩타이드 수집물(CVP)을 생산하기 위한 프레임-쉬프트 펩타이드의 수집물(CFSP)을 선택하는 방법에 관한 것이다:
(i) 각각이 프레임-쉬프트 돌연변이(FSM)를 포함하는 핵산의 수집물 (CFSM)을 선택하는 단계로서, 각각의 FSM은 각각의 상이한 환자의 적어도 M개의 암 샘플(CS) 중 하나 이상에 존재하며, 여기서 환자의 암은 MSI 표현형을 지닌 암 세포를 포함하고;
여기서 선택된 FSM의 적어도 50%는 기준 (a), (b), (c) 및/또는 (d)를 충족하는 단계:
(a) FSM은 6개 이상의 뉴클레오타이드의 길이를 지닌 암호화 유전자(coding gene)의 모노뉴클레오타이드 반복체(MNR) 속에 존재함;
(b) FSM은 1개의 뉴클레오타이드의 결실에 해당함;
(c) FSM을 포함한 DNA 서열분석 판독물(DNA sequencing read)의 수는, 매치된 정상 샘플(matched normal sample)과 비교하여 종양 샘플 속에서 유의적으로 더 높음(0.05 이하의 FDR-교정된 피셔 시험(Fisher test) p-값);
(d) FSM은, 매치된 정상 샘플 속에 25% 미만의 대립유전자 빈도로 존재함,
(ii) X개의 상이한 프레임-쉬프트 펩타이드(FSP)를 선택하는 단계로서, 여기서 각각의 선택된 FSP가, FSM이 없는 상응하는 야생형(wt) 핵산의 번역 생성물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈(codon)으로부터 시작되는, 적어도 4개의 아미노산 길이의 CFSM의 FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물인 단계,
여기서 X는 적어도 20개, 보다 바람직하게는 적어도 35개이고 M은 적어도 5개이다.
제1 양태의 방법에 따른 FSP의 특정 수 및 유형을 선택함으로써, 다수의 FSP에 대한 T 세포의 유도는 백신접종(vaccination)에 의해 보증된다. 400개 aa 규칙에 기반하여 예측되는 T 세포 면역원성 에피토프 수는 400aa마다 적어도 하나의 면역원성 에피토프이며, 따라서 6021aa의 총 길이를 암호화하는 백신의 경우 적어도 16개이다. 본 발명자들은 실제로 마우스 모델에서 6021aa의 총 길이에 대한 209개 FSP를 사용한 백신접종이 376aa 마다 적어도 1개에 상응하는, 적어도 16개의 상이한 FSP에 대해 T 세포 반응을 유도할 수 있었음을 입증하였으며(도 9), 이는 면역원성 규칙을 확인한다. 펩타이드 백신접종과는 상이한, 유전 벡터를 기반으로 하는 선택된 백신접종 플랫폼은 개개 FSP의 면역원성이 백신 내에 존재하는 다른 FSP에 의해 억제되지 않음을 보증하였다. 본 발명자들은 마우스 모델에서 4개의 백신 벡터의 혼합물의 투여와 비교하여 4개의 백신 벡터 중 하나 만의 투여가 실질적으로 동일한 반응을 생성함을 나타냄으로써, 경쟁이 일어나지 않음을 입증하였다.
제1 양태에서, 본 발명은 다음의 단계 (i) 및 (ii)를 포함하는, 유전성 및 산발성 미세-부수체 불안정성(MSI) 암을 포함하는 암을 지니거나, 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료를 위한 범용 MSI 암 백신 펩타이드 수집물(CVP)을 생산하기 위한 프레임-쉬프트 펩타이드의 수집물(CFSP)을 선택하는 방법에 관한 것이다:
(i) 각각이 프레임-쉬프트 돌연변이(FSM)를 포함하는 핵산의 수집물 (CFSM)을 선택하는 단계로서, 각각의 FSM은 각각의 상이한 환자의 적어도 M개의 암 샘플(CS) 중 하나 이상에 존재하며, 여기서 환자의 암은 MSI 표현형을 지닌 암 세포를 포함하고;
여기서 선택된 FSM의 적어도 50%는 기준 (a), (b), (c) 및/또는 (d)를 충족하는 단계:
(a) FSM은 6개 이상의 뉴클레오타이드의 길이를 지닌 암호화 유전자(coding gene)의 모노뉴클레오타이드 반복체(MNR) 속에 존재함;
(b) FSM은 1개의 뉴클레오타이드의 결실에 해당함;
(c) FSM을 포함한 DNA 서열분석 판독물(DNA sequencing read)의 수는, 매치된 정상 샘플(matched normal sample)과 비교하여 종양 샘플 속에서 유의적으로 더 높음(0.05 이하의 FDR-교정된 피셔 시험(Fisher test) p-값);
(d) FSM은, 매치된 정상 샘플 속에 25% 미만의 대립유전자 빈도로 존재함,
(ii) X개의 상이한 프레임-쉬프트 펩타이드(FSP)를 선택하는 단계로서, 여기서 각각의 선택된 FSP가, FSM이 없는 상응하는 야생형(wt) 핵산의 번역 생성물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈(codon)으로부터 시작되는, 적어도 4개의 아미노산 길이의 CFSM의 FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물인 단계,
여기서 X는 적어도 20개, 보다 바람직하게는 적어도 35개이고 M은 적어도 5개이다.
제1 양태의 방법에 따른 FSP의 특정 수 및 유형을 선택함으로써, 다수의 FSP에 대한 T 세포의 유도는 백신접종(vaccination)에 의해 보증된다. 400개 aa 규칙에 기반하여 예측되는 T 세포 면역원성 에피토프 수는 400aa마다 적어도 하나의 면역원성 에피토프이며, 따라서 6021aa의 총 길이를 암호화하는 백신의 경우 적어도 16개이다. 본 발명자들은 실제로 마우스 모델에서 6021aa의 총 길이에 대한 209개 FSP를 사용한 백신접종이 376aa 마다 적어도 1개에 상응하는, 적어도 16개의 상이한 FSP에 대해 T 세포 반응을 유도할 수 있었음을 입증하였으며(도 9), 이는 면역원성 규칙을 확인한다. 펩타이드 백신접종과는 상이한, 유전 벡터를 기반으로 하는 선택된 백신접종 플랫폼은 개개 FSP의 면역원성이 백신 내에 존재하는 다른 FSP에 의해 억제되지 않음을 보증하였다. 본 발명자들은 마우스 모델에서 4개의 백신 벡터의 혼합물의 투여와 비교하여 4개의 백신 벡터 중 하나 만의 투여가 실질적으로 동일한 반응을 생성함을 나타냄으로써, 경쟁이 일어나지 않음을 입증하였다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
일 구현예에서, 단계 (ii)에서 선택된 FSP는 유전성 및 산발성 MSI 암을 포함하거나 이러한 암으로 진행될 위험이 있는 암을 지닌 환자의 예방 또는 치료를 위한 범용의 MSI CVP를 생산하기 위한 후보물 FSP로서 기술될 수 있다. "후보물"은 FSP가 잠재적으로 예방 또는 치료 효과를 가짐을 의미한다. 이는 선택 공정 및 이들의 구조를 기반으로 예측할 수 있다.
선택 기준 (c)는 주어진 FSM의 출현율(prevalence)이 건강한 대상체 또는 건강한 대상체들의 매치된 정상 샘플(matched normal sample)에서보다 하나 이상의 종양 샘플의 게놈 DNA에서 유의적으로 더 높음을, 즉, 더 우세함을 필요로 한다. 이러한 맥락에서 용어 "유의적으로 더 높은"은 야생형의 돌연변이되지 않은 MNR의 출현율과 비교하여 주어진 FSM의 출현율이, 0.1 이하, 보다 바람직하게는 0.05 이하, 보다 바람직하게는 0.01 이하 및 심지어 보다 바람직하게는 0.005 이하의 거짓-발견-율(false-discovery-rate: FDR) 교정된 피셔-시험 p-값에 따라, 정상 샘플과 비교하여 종양 샘플에서 유의적으로 더 높음을 의미한다. 건강한 조직에 대한 원치 않는 면역 반응의 자극의 경향성은 감소하므로 이러한 값이 낮을 수록 FSM이 CFSM 내에 포함시키기에 보다 적합하게 된다. 이러한 기준은 샘플로부터의 게놈 DNA 또는 cDNA를 서열분석함으로써 평가한다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (c)를 충족하는 것이 바람직하다.
기준 (c)는 주어진 FSM의 상대적인 출현율에 관한 것이지만, 기준 (d)는 정상 샘플의 대립유전자(allele)에서 주어진 FSM의 절대 출현율에 관한 것이다. CFSM에 대해 선택된 FSM이 정상 샘플의 대립유전자에서 낮은 전체 출현율을 갖는 것이 바람직하다. 바람직하게는, 정상 샘플에서의 대립유전자 빈도는 40% 미만, 보다 바람직하게는 35% 미만, 보다 바람직하게는 30% 미만, 보다 바람직하게는 25% 미만, 보다 바람직하게는 20% 미만 및 심지어 보다 바람직하게는 10% 미만이다. CFSM에 대해 선택된 FSM의 50%, 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (d)를 충족하는 것이 바람직하다.
선택 기준 (c)는 주어진 FSM의 출현율(prevalence)이 건강한 대상체 또는 건강한 대상체들의 매치된 정상 샘플(matched normal sample)에서보다 하나 이상의 종양 샘플의 게놈 DNA에서 유의적으로 더 높음을, 즉, 더 우세함을 필요로 한다. 이러한 맥락에서 용어 "유의적으로 더 높은"은 야생형의 돌연변이되지 않은 MNR의 출현율과 비교하여 주어진 FSM의 출현율이, 0.1 이하, 보다 바람직하게는 0.05 이하, 보다 바람직하게는 0.01 이하 및 심지어 보다 바람직하게는 0.005 이하의 거짓-발견-율(false-discovery-rate: FDR) 교정된 피셔-시험 p-값에 따라, 정상 샘플과 비교하여 종양 샘플에서 유의적으로 더 높음을 의미한다. 건강한 조직에 대한 원치 않는 면역 반응의 자극의 경향성은 감소하므로 이러한 값이 낮을 수록 FSM이 CFSM 내에 포함시키기에 보다 적합하게 된다. 이러한 기준은 샘플로부터의 게놈 DNA 또는 cDNA를 서열분석함으로써 평가한다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (c)를 충족하는 것이 바람직하다.
기준 (c)는 주어진 FSM의 상대적인 출현율에 관한 것이지만, 기준 (d)는 정상 샘플의 대립유전자(allele)에서 주어진 FSM의 절대 출현율에 관한 것이다. CFSM에 대해 선택된 FSM이 정상 샘플의 대립유전자에서 낮은 전체 출현율을 갖는 것이 바람직하다. 바람직하게는, 정상 샘플에서의 대립유전자 빈도는 40% 미만, 보다 바람직하게는 35% 미만, 보다 바람직하게는 30% 미만, 보다 바람직하게는 25% 미만, 보다 바람직하게는 20% 미만 및 심지어 보다 바람직하게는 10% 미만이다. CFSM에 대해 선택된 FSM의 50%, 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (d)를 충족하는 것이 바람직하다.
삭제
삭제
CFSM에 대해 선택된 FSM이 기준 (c) 및 (d) 둘 다를 충족하는 것이 바람직하다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (c) 및 (d)를 충족하는 것이 바람직하다. 바람직하게는, 적어도 50%가 또한 기준 (a) 및/또는 (b)를 충족하는 것이 바람직하다.
다른 바람직한 구현예에서, CFSM에 대해 선택된 FSM은 기준 (a)를 충족한다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (a)를 충족하는 것이 바람직하다.
다른 바람직한 구현예에서, CFSM에 대해 선택된 FSM은 기준 (b)를 충족한다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (b)를 충족하는 것이 바람직하다.
다른 바람직한 구현예에서, CFSM에 대해 선택된 FSM은 기준 (a), (c) 및 (d)를 충족한다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (a), (c) 및 (d)를 충족하는 것이 바람직하다.
다른 바람직한 구현예에서 CFSM에 대해 선택된 FSM은 기준 (b), (c) 및 (d)를 충족한다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (b), (c) 및 (d)를 충족하는 것이 바람직하다.
다른 바람직한 구현예에서 CFSM에 대해 선택된 FSM은 기준 (a), (b), (c) 및 (d)를 충족한다. CFSM에 대해 선택된 FSM의 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95% 및 가장 바람직하게는 적어도 100%가 기준 (a), (b), (c) 및 (d)를 충족하는 것이 바람직하다.
본 발명의 방법은 특정 환자 뿐만 아니라 MSI 암을 지닌 많은 상이한 환자의 MSI 암을 치료하기에 적합한, 즉, MSI 암의 치료를 위한 범용 CVP인 CVP를 제공한다. 동일한 이유로, MSI 암의 발달에 대해 예방 효과를 갖는 것이 또한 적합할 것이다. 따라서, 본 발명의 방법에서 FSM의 선택은 단지 1명의 환자로부터의 암 샘플의 분석을 기반으로 하는 것이 아니라 상이한 환자로부터의 수개의 암 샘플의 정보를 사용한다. 적절한 다양성을 수득하기 위하여 상이한 환자의 적어도 5개의 암 샘플(CS)을 분석하여 FSM을 결정한다. 상기 요약한 바와 같이, 이는 바람직하게는 전체 게놈 서열분석에 의해, 진유전체(exome) 서열분석에 의해 또는 샘플로부터 단리된 mRNA로부터 생성된 cDNA의 서열분석에 의해 수행된다. 암 샘플은 MSI 암을 가진 환자로부터의 것이 사용된다. 이는 암 샘플 속에 포함된 세포 내 MSI 표현형을 검출함으로써 확인할 수 있다. CS는 동일한 MSI 암일 수 있는데, 즉, 동일한 조직으로부터 기원할 수 있거나 2개 이상의 상이한 MSI 암으로부터 기원할 수 있다. 이는 2개 이상의 상이한 MSI 암의 MIS 암의 CS를 선택 공정에서 사용하는 경우 특히 바람직하고 특히 광범위하게 이용가능한 CVP를 제공한다. 이로부터 샘플이 유래되는 바람직한 MSI 암은 결장직장암 및 위암, 결장직장암 및 자궁내막암, 위암 및 자궁내막암 및 위암, 결장직장암 및 자궁내막암이다.
FSM을 기반으로 요약된 선택 공정은 또한 FSM을 포함하는 특정 핵산에 의해 암호화된 FSP를 기반으로 수행할 수 있는데, 즉, 기준 (c) 및 (d)는 또한 핵산 서열보다는 각각의 암호화된 아미노산 서열을 비교함으로써 평가할 수 있다. 암 또는 정상 샘플내에서 FSM의 존재를 또한 야생형 단백질 서열의 C-말단보다는 C-말단에서 FSP를 포함하는 암호화된 단백질 아미노산 서열의 수를 결정함으로써 평가할 수 있음이 통상의 기술자에게 바로 명백하다.
본 발명자들은 또한 다음의 기준 중 하나 이상을 사용함으로써 CFSP 내에 포함되는 FSP를 선택하는 것을 고려한다:
(a) FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트(subset)에 대해 관찰된 암 유형-특이적인 빈도(CF)로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나에 대해 적어도 5%임; 및/또는
(b) FSP를 암호화하는 FSM을 지닌 유전자의 평균 mRNA 발현 수준은, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 80번째 백분위수 이내임; 및/또는
(c) FSP를 생성하는 FSM은 암이 없는 대상체의 집단(cohort) 내의 정상 조직내에서 2% 미만으로 관찰됨.
(a) FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트(subset)에 대해 관찰된 암 유형-특이적인 빈도(CF)로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나에 대해 적어도 5%임; 및/또는
(b) FSP를 암호화하는 FSM을 지닌 유전자의 평균 mRNA 발현 수준은, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 80번째 백분위수 이내임; 및/또는
(c) FSP를 생성하는 FSM은 암이 없는 대상체의 집단(cohort) 내의 정상 조직내에서 2% 미만으로 관찰됨.
삭제
삭제
삭제
바람직하게는, CFSP내에 포함된 FSP의 적어도 50%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족한다. CFSP에 대해 선택된 FSP의 60%가 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하고, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 70%가 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하며, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 80%가 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하며, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 90%가 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하며, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 95%가 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하고 가장 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 100%가 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족한다.
기준 (a)와 관련하여, FSP는 FSM에 의해 암호화되고, FSM은 M개의 상이한 CS의 수집물 중 일부인 특정 암 유형의 CS의 서브세트에 대해 관찰되는 CF로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 적어도 5%, CS 내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 바람직하게는 적어도 10%, 바람직하게는 적어도 15%, 바람직하게는 적어도 20%, 바람직하게는 적어도 25%, 바람직하게는 적어도 30%, 보다 바람직하게는 적어도 35%, 보다 바람직하게는 적어도 40%인 것이 바람직하다.
기준 (b)와 관련하여, FSP를 암호화하는 FSM를 지닌 유전자의 평균 mRNA 발현 수준이, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수(percentile), 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내인 것이 바람직하다. FSP의 상대적인 풍부성이 더 높을 수록 면역 반응의 유도가 MSI 암의 치료 또는 예방에 있어서 더 효과적일 경향이 있다. 단지 명확성을 위하여 어구 "상위 80번째 백분위수"는 최대로 발현된 mRNA를 포함하는 수준 이내의 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 19% 만을 배제한다. 따라서, "상위 30번째 백분위"는 최대 발현된 mRNA를 포함하는 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 69%는 배제한다.
기준 (a) 및 (b)의 바람직한 조합은 적어도 5%의 CF이며, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 10%의 CF이고 FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 15%의 CF이고 FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의, 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 20%의 CF이고 FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다.
기준 (c)와 관련하여, FSP를 생성하는 FSM가 암이 없는 대상체의 집단에서의 정상 조직 내에서 2% 미만, 보다 바람직하게는 1.9% 미만, 1.8% 미만, 1.7% 미만, 1.6% 미만, 1.5% 미만, 1.4% 미만, 1.3% 미만, 1.2% 미만, 1.1% 미만, 1.0% 미만으로 관찰된다.
기준 (a)와 관련하여, FSP는 FSM에 의해 암호화되고, FSM은 M개의 상이한 CS의 수집물 중 일부인 특정 암 유형의 CS의 서브세트에 대해 관찰되는 CF로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 적어도 5%, CS 내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 바람직하게는 적어도 10%, 바람직하게는 적어도 15%, 바람직하게는 적어도 20%, 바람직하게는 적어도 25%, 바람직하게는 적어도 30%, 보다 바람직하게는 적어도 35%, 보다 바람직하게는 적어도 40%인 것이 바람직하다.
기준 (b)와 관련하여, FSP를 암호화하는 FSM를 지닌 유전자의 평균 mRNA 발현 수준이, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수(percentile), 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내인 것이 바람직하다. FSP의 상대적인 풍부성이 더 높을 수록 면역 반응의 유도가 MSI 암의 치료 또는 예방에 있어서 더 효과적일 경향이 있다. 단지 명확성을 위하여 어구 "상위 80번째 백분위수"는 최대로 발현된 mRNA를 포함하는 수준 이내의 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 19% 만을 배제한다. 따라서, "상위 30번째 백분위"는 최대 발현된 mRNA를 포함하는 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 69%는 배제한다.
기준 (a) 및 (b)의 바람직한 조합은 적어도 5%의 CF이며, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 10%의 CF이고 FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 15%의 CF이고 FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의, 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 20%의 CF이고 FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다.
기준 (c)와 관련하여, FSP를 생성하는 FSM가 암이 없는 대상체의 집단에서의 정상 조직 내에서 2% 미만, 보다 바람직하게는 1.9% 미만, 1.8% 미만, 1.7% 미만, 1.6% 미만, 1.5% 미만, 1.4% 미만, 1.3% 미만, 1.2% 미만, 1.1% 미만, 1.0% 미만으로 관찰된다.
삭제
삭제
삭제
삭제
본 발명의 제1 양태의 방법의 바람직한 구현예에서:
(i) CS는 MSI 종양, 바람직하게는 결장직장 암 및/또는 위암 및/또는 자궁내막 암, 보다 바람직하게는 결장직장 암, 위암 및 자궁내막 암을 가진 환자로부터 유래되고/되거나;
(ii) M은 적어도 30, 바람직하게는 적어도 50, 보다 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 가장 바람직하게는 적어도 300이고/이거나;
(iii) X는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이다.
바람직하게는, M은 적어도 30이고 X는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 보다 바람직하게는 적어도 300이고, 바람직하게는, M은 적어도 50이며 X는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이고, M은 적어도 100이며 X는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이고, M은 적어도 200이며 X는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이고, 심지어 보다 바람직하게는 M은 적어도 300이며 X는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이다.
샘플 수 M의 증가는 CVP의 보다 광범위한, 즉, 보다 범용인 적용능을 확인한다. 그러나, FSM의 통계적 분포로 인하여, 특정 MSI 암 유형에서 발생하는 모든 FSM의 결정의 완성도는 주어진 수의 샘플에 대해 점근적으로 최대에 이를 것이다. 따라서, 특정 MSI 암 유형의 400개 초과의 샘플을 포함해도, 어떠한 유의적인 개선도 수득되지 않는다. MSI 암 유형에 존재하는 FSM의 광범위한 적용범위를 개선시키기 위하여, 2개 이상의 MSI 암의 CS를 사용하는 것이 바람직하다. 치료 및 예방에 대해 동시에 처리할 수 있는 바람직한 MSI 암은 결장직장 암, 및 위암, 결장직장 암 및 자궁내막 암, 위암 및 자궁내막 암, 및 결장직장 암, 위암 및 자궁내막 암이다.
제2 양태에서, 본 발명은 다음의 단계를 포함하는, CVP에 포함된 펩타이드의 아미노산 서열 또는 CVP에 포함된 펩타이드를 암호화하는 핵산 서열을 결정하는 방법에 관한 것이다:
(a) 본 발명의 제1 양태에 따라 선택된 CFSP로부터 적어도 Y개의 FSP 또는 이의 항원성 단편을 선택하는 단계;
(b) 다음의 기준:
(i) FSP는 길이가 4 내지 9개 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속된 스트레치(stretch)를 함유함, 및/또는
(iii) FSP가 야생형(wt) 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열을 변형시키는 단계로서,
여기서 (i)에 따른 FSP의 아미노산 서열은 FSP의 바로 상부(immediately upstream)에 존재하는 야생형(wt) 아미노산 서열의 1, 2, 3, 또는 4개, 바람직하게는 4개의 아미노산을 FSP의 N-말단에 첨가함으로써 변형되고 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 아미노산 서열은, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 4개 미만의 아미노산 길이를 지닌 FSP는 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 아미노산 서열은 이러한 스트레치를 제거함으로써 변형되고; 연속된 스트레치의 제거 후 4개 미만의 아미노산의 길이를 지닌 변형된 FSP는 CVP로부터 배제되는, 단계;
여기서 CVP의 아미노산 서열은, 단계 a)에서 선택되고/되거나 단계 (b)에서 변형된 FSP 또는 이의 단편의 아미노산 서열을 포함하고;
여기서 Y는 적어도 20, 보다 바람직하게는 적어도 35이다.
제2 양태의 맥락에서, 용어 "결정하는"은 단계 (b)로부터 즉시 명확하므로, 펩타이드의 서열을 (예컨대, 서열분석에 의해) "확인하는(identifying)”의 의미로서가 아니라 "정의하는(defining)", 고정시키는(fixing)", "체계화하는(codifying)" 또는 "변형시키는(modifying)"의 의미로서 사용됨을 주목한다.
샘플 수 M의 증가는 CVP의 보다 광범위한, 즉, 보다 범용인 적용능을 확인한다. 그러나, FSM의 통계적 분포로 인하여, 특정 MSI 암 유형에서 발생하는 모든 FSM의 결정의 완성도는 주어진 수의 샘플에 대해 점근적으로 최대에 이를 것이다. 따라서, 특정 MSI 암 유형의 400개 초과의 샘플을 포함해도, 어떠한 유의적인 개선도 수득되지 않는다. MSI 암 유형에 존재하는 FSM의 광범위한 적용범위를 개선시키기 위하여, 2개 이상의 MSI 암의 CS를 사용하는 것이 바람직하다. 치료 및 예방에 대해 동시에 처리할 수 있는 바람직한 MSI 암은 결장직장 암, 및 위암, 결장직장 암 및 자궁내막 암, 위암 및 자궁내막 암, 및 결장직장 암, 위암 및 자궁내막 암이다.
제2 양태에서, 본 발명은 다음의 단계를 포함하는, CVP에 포함된 펩타이드의 아미노산 서열 또는 CVP에 포함된 펩타이드를 암호화하는 핵산 서열을 결정하는 방법에 관한 것이다:
(a) 본 발명의 제1 양태에 따라 선택된 CFSP로부터 적어도 Y개의 FSP 또는 이의 항원성 단편을 선택하는 단계;
(b) 다음의 기준:
(i) FSP는 길이가 4 내지 9개 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속된 스트레치(stretch)를 함유함, 및/또는
(iii) FSP가 야생형(wt) 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열을 변형시키는 단계로서,
여기서 (i)에 따른 FSP의 아미노산 서열은 FSP의 바로 상부(immediately upstream)에 존재하는 야생형(wt) 아미노산 서열의 1, 2, 3, 또는 4개, 바람직하게는 4개의 아미노산을 FSP의 N-말단에 첨가함으로써 변형되고 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 아미노산 서열은, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 4개 미만의 아미노산 길이를 지닌 FSP는 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 아미노산 서열은 이러한 스트레치를 제거함으로써 변형되고; 연속된 스트레치의 제거 후 4개 미만의 아미노산의 길이를 지닌 변형된 FSP는 CVP로부터 배제되는, 단계;
여기서 CVP의 아미노산 서열은, 단계 a)에서 선택되고/되거나 단계 (b)에서 변형된 FSP 또는 이의 단편의 아미노산 서열을 포함하고;
여기서 Y는 적어도 20, 보다 바람직하게는 적어도 35이다.
제2 양태의 맥락에서, 용어 "결정하는"은 단계 (b)로부터 즉시 명확하므로, 펩타이드의 서열을 (예컨대, 서열분석에 의해) "확인하는(identifying)”의 의미로서가 아니라 "정의하는(defining)", 고정시키는(fixing)", "체계화하는(codifying)" 또는 "변형시키는(modifying)"의 의미로서 사용됨을 주목한다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
일 구현예에서, 단계 (b)에서 변형된 FSP의 적어도 하나는 i) 면역원성이거나 면역원성인 것으로 예측되고 ii) 환자 종양에 존재하거나 존재하는 것으로 예측된다. 바람직하게는, 이러한 FSP의 면역원성은 선택되거나 변형된 다른 FSP에 의해 억제되지 않는다.
추가의 구현예에서, 단계 (b)에서 변형된 FSP는 유전성 및 산발성 MSI 암을 포함하는 암을 갖거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료를 위한 범용 MSI CVP를 생산하기 위한 후보물 FSP이다.
단계 (b)에 따른 FSP의 변형은 FSP의 항원성을 개선시키기 위한 목적으로 제공된다. 기준 (i), (ii), (iii), (i)+(ii), (i)+(iii), (ii)+(iii), 또는 (i)+(ii)+(iii)을 충족하는 FSP의 적어도 50%가 변형되고, 보다 바람직하게는 기준 (i), (ii), (iii), (i)+(ii), (i)+(iii), (ii)+(iii), 또는 (i)+(ii)+(iii)을 충족하는 FSP의 적어도 60%가 변형되며, 기준 (i), (ii), (iii), (i)+(ii), (i)+(iii), (ii)+(iii), 또는 (i)+(ii)+(iii)을 충족하는 FSP의 적어도 70%가 변형되고, 보다 바람직하게는 기준 (i), (ii), (iii), (i)+(ii), (i)+(iii), (ii)+(iii), 또는 (i)+(ii)+(iii)을 충족하는 FSP의 적어도 80%가 변형되며, 보다 바람직하게는 기준 (i), (ii), (iii), (i)+(ii), (i)+(iii), (ii)+(iii), 또는 (i)+(ii)+(iii)을 충족하는 FSP의 적어도 90%가 변형되고, 보다 바람직하게는 기준 (i), (ii), (iii), (i)+(ii), (i)+(iii), (ii)+(iii), 또는 (i)+(ii)+(iii)을 충족하는 FSP의 적어도 95%가 변형되며, 가장 바람직하게는 기준 (i), (ii), (iii), (i)+(ii), (i)+(iii), (ii)+(iii), 또는 (i)+(ii)+(iii)을 충족하는 FSP의 적어도 100%가 변형되는 것이 바람직하다.
본 발명의 제2 양태의 바람직한 구현예에서, FSP 및 mFSP의 선택은 단계 (a)에서 수행되며, 여기서 FSP는 CFSP로부터 연이어 선택되고 각각의 선택 단계에서, 역치 값 미만인 최대 수의 암 샘플에서 역치 값에 이르도록 총 FSP 아미노산 길이의 누적량(CAFSPL)을 증가시키는 새로운 FSP가 CFSP로부터 선택되고, 임의로, CAFSPL이 여전히 역치 값 미만인 최대 수의 암 샘플에 대한 CAFSPL이 둘 이상의 FSP에 의해 증가할 경우, 최고 점수를 지닌 FSP가 선택된다.
본 발명의 제2 양태의 바람직한 구현예에서:
(i) 각각의 암 샘플에 대한 CAFSPL이, CVP의 이미 일부분인 FSP의 아미노산 길이 및 상응하는 FSM이 상기 암 샘플 속에 존재하는 CFSP로부터의 새로운 FSP의 아미노산 길이를 합함으로써 결정되고/되거나;
(ii) 여기서 역치 값이 특정 암 유형에 속하는 CS로부터의 샘플의 각각의 서브세트에 대해 별도로 정의되고/되거나;
(iii) 여기서 점수는, 임의로 CF가 5% 미만, 보다 바람직하게는 4% 미만, 보다 바람직하게는 3% 미만인 암 유형으로부터의 CS 내 FSM을 계수함이 없이, FSP의 아미노산 길이와, FSP를 생성하는 FSM이 CS 내에서 관찰되는 전체적인 빈도 사이의 곱(product)으로서 정의되고/되거나;
(iv) 여기서 암 샘플의 서브세트는 종양 유형으로부터의 모든 암 샘플을 포함하고 여기서 FSM는 5% 이상, 보다 바람직하게는 10% 이상 또는 15% 이상의 CF로 존재하고/하거나;
(v) 여기서 5% 미만의 전체적인 빈도로 FSM에 의해 생성된 FSP는 선택으로부터 배제되고/되거나;
(vi) 여기서 CVP로의 혼입이 CAFSPL이 여전히 역치 값(TV) 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지 또는 CVP 내에 존재하는 모든 FSP의 누적 길이가 V개 아미노산의 최대 값에 도달할 때까지 새로운 FSP 및/또는 변형된 FSP의 첨가가 진행되고/되거나;
(vii) 여기서 동일한 FSM으로부터 유래된 FSP는 개개의 FSP의 점수의 합으로서 계산된 합해진(combined) 점수를 지닌 하나의 FSP로서 취급된다.
본 발명의 제2 양태의 바람직한 구현예에서, FSP 및 mFSP의 선택은 단계 (a)에서 수행되며, 여기서 FSP는 CFSP로부터 연이어 선택되고 각각의 선택 단계에서, 역치 값 미만인 최대 수의 암 샘플에서 역치 값에 이르도록 총 FSP 아미노산 길이의 누적량(CAFSPL)을 증가시키는 새로운 FSP가 CFSP로부터 선택되고, 임의로, CAFSPL이 여전히 역치 값 미만인 최대 수의 암 샘플에 대한 CAFSPL이 둘 이상의 FSP에 의해 증가할 경우, 최고 점수를 지닌 FSP가 선택된다.
본 발명의 제2 양태의 바람직한 구현예에서:
(i) 각각의 암 샘플에 대한 CAFSPL이, CVP의 이미 일부분인 FSP의 아미노산 길이 및 상응하는 FSM이 상기 암 샘플 속에 존재하는 CFSP로부터의 새로운 FSP의 아미노산 길이를 합함으로써 결정되고/되거나;
(ii) 여기서 역치 값이 특정 암 유형에 속하는 CS로부터의 샘플의 각각의 서브세트에 대해 별도로 정의되고/되거나;
(iii) 여기서 점수는, 임의로 CF가 5% 미만, 보다 바람직하게는 4% 미만, 보다 바람직하게는 3% 미만인 암 유형으로부터의 CS 내 FSM을 계수함이 없이, FSP의 아미노산 길이와, FSP를 생성하는 FSM이 CS 내에서 관찰되는 전체적인 빈도 사이의 곱(product)으로서 정의되고/되거나;
(iv) 여기서 암 샘플의 서브세트는 종양 유형으로부터의 모든 암 샘플을 포함하고 여기서 FSM는 5% 이상, 보다 바람직하게는 10% 이상 또는 15% 이상의 CF로 존재하고/하거나;
(v) 여기서 5% 미만의 전체적인 빈도로 FSM에 의해 생성된 FSP는 선택으로부터 배제되고/되거나;
(vi) 여기서 CVP로의 혼입이 CAFSPL이 여전히 역치 값(TV) 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지 또는 CVP 내에 존재하는 모든 FSP의 누적 길이가 V개 아미노산의 최대 값에 도달할 때까지 새로운 FSP 및/또는 변형된 FSP의 첨가가 진행되고/되거나;
(vii) 여기서 동일한 FSM으로부터 유래된 FSP는 개개의 FSP의 점수의 합으로서 계산된 합해진(combined) 점수를 지닌 하나의 FSP로서 취급된다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
기준 (i) 내지 (vii)은 하나 이상의 유형의 MSI 암을 지닌 환자의 집단에게 고 면역원성 적용범위를 제공함으로써 CVP에 대해 선택된 FSP의 범용성을 개선시킬 목적을 제공한다. 또한, 기준 (vi)은 또한 백신 속에 암호화될 수 있는 항원의 총량을 제한함으로써 실질적으로 실현가능한 CVP를 선택하도록 한다. 점수매김 시스템의 사용은 보다 높은 관찰된 빈도(따라서 다수의 환자 내에 존재하는 것으로 예측됨) 및 보다 긴 총 아미노산 길이(즉, 보다 높은 총 면역원성 잠내능을 지닌 FSP)를 지닌 FSP가 바람직하게는 CVP 내에 포함되는 것을 보증한다.
바람직한 구현예에서, 기준 (i)+(iii)+(vi)는 FSP의 적어도 50%, 보다 바람직하게는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%를 충족한다.
따라서, 적어도 50%의 FSP가 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되며, 보다 바람직하게는 적어도 60%의 FSP는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되며, 보다 바람직하게는 적어도 70%의 FSP는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준(i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준(i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되며, 보다 바람직하게는 적어도 80%의 FSP는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되며, 보다 바람직하게는 적어도 90%의 FSP는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되고, 가장 바람직하게는 100%의 FSP는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택된다.
점수가 또한 예를 들면, FSP를 생성하는 FSM의 전체적인 빈도, FSP의 길이 또는 상호간의 길이(reciprocal length)만을 기반으로, 또는 암-특이적인 점수의 합으로, 또는 점수의 계산으로부터 하나 이상의 암 유형을 배제한 후, 대안적 방식으로 정의될 수 있음이 기술자에게 즉시 명백하다. 대안적 점수는 또한 각각의 FSP 내에 예측된 MHC 제I 및/또는 제II 에피토프의 수를 추가로 포함하거나 전적으로 기반으로 한다. 기준 (vii)은 FSM을 포함하는 특정 mRNA 동형(isoform)의 발현 수준이 공지되어 있는 경우 변형될 수 있음이 기술자에게 또한 즉시 명백하다. 이러한 경우에, 동일한 FSM에 의해 생성된 하나 이상의 FSP는 선택으로부터 배제될 수 있거나 FSM을 포함하는 개개 mRNA 동형으로부터 발생된 FSP의 점수는 동형의 관찰된 상대적인 발현 수준에 따라 가중(weight)될 수 있다.
본 발명의 제2 양태의 바람직한 구현예에서:
(i) CVP 내 혼입이 CAFSPL이 여전히 TV 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용 가능하지 않을 때까지, 새로운 FSP의 첨가가 진행되고/되거나;
(ii) 동일한 FSM으로부터 유래된 FSP가 개개의 FSP의 점수의 합으로서 계산된 합해진 점수를 지닌 하나의 FSP로서 취급된다.
점수가 또한 예를 들면, FSP를 생성하는 FSM의 전체적인 빈도, FSP의 길이 또는 상호간의 길이(reciprocal length)만을 기반으로, 또는 암-특이적인 점수의 합으로, 또는 점수의 계산으로부터 하나 이상의 암 유형을 배제한 후, 대안적 방식으로 정의될 수 있음이 기술자에게 즉시 명백하다. 대안적 점수는 또한 각각의 FSP 내에 예측된 MHC 제I 및/또는 제II 에피토프의 수를 추가로 포함하거나 전적으로 기반으로 한다. 기준 (vii)은 FSM을 포함하는 특정 mRNA 동형(isoform)의 발현 수준이 공지되어 있는 경우 변형될 수 있음이 기술자에게 또한 즉시 명백하다. 이러한 경우에, 동일한 FSM에 의해 생성된 하나 이상의 FSP는 선택으로부터 배제될 수 있거나 FSM을 포함하는 개개 mRNA 동형으로부터 발생된 FSP의 점수는 동형의 관찰된 상대적인 발현 수준에 따라 가중(weight)될 수 있다.
본 발명의 제2 양태의 바람직한 구현예에서:
(i) CVP 내 혼입이 CAFSPL이 여전히 TV 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용 가능하지 않을 때까지, 새로운 FSP의 첨가가 진행되고/되거나;
(ii) 동일한 FSM으로부터 유래된 FSP가 개개의 FSP의 점수의 합으로서 계산된 합해진 점수를 지닌 하나의 FSP로서 취급된다.
삭제
삭제
삭제
삭제
본 발명의 제2 양태의 바람직한 구현예에서
(a) TV는 적어도 400개 아미노산, 바람직하게는 적어도 600개 아미노산, 보다 바람직하게는 적어도 800개 아미노산이거나;
(b) TV는:
(i) 결장직장 암 및 위암의 경우 적어도 400개 아미노산, 바람직하게는 적어도 600개 아미노산, 보다 바람직하게는 적어도 800개 아미노산이고;
(ii) 자궁내막 암의 경우 적어도 200개 아미노산, 바람직하게는 적어도 300개 아미노산, 보다 바람직하게는 적어도 400개 아미노산이다.
TV의 값은 선택이 상이한 유형의 암, 예컨대, 결장직장 암, 위암, 자궁내막 암, 소장 암, 간담즙성 관 암, 간암, 신경내분비 암, 자궁경부 암, 난소 암, 자궁 육종, 뇌 암 및/또는 피부 암으로부터의 샘플의 조합을 포함하는 CS에서 수행되는 임의의 상황으로 연장시킬 수 있음이 당해 분야의 기술자에게 즉시 명확하다.
본 발명의 제2 양태의 바람직한 구현예에서:
(i) CVP는 CFSP로부터 선택된 각각의 FSP의 적어도 4개의 아미노산을 포함하고/하거나;
(ii) Y는 CVP의 일부인 모든 펩타이드의 누적 아미노산 길이 V가 적어도 280개 아미노산, 바람직하게는 적어도 6000개 아미노산이도록 선택되며;
(iii) Y는 적어도 35, 바람직하게는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200이고/이거나
(iv) CVP가, 서열 번호 1 내지 1087에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택되는 FSP 및/또는 mFSP, 바람직하게는 서열 번호 1 내지 209에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택되는 FSP 및/또는 mFSP를 포함한다.
제3 양태에서, 본 발명은
(i) 본 발명의 제2 양태의 방법에서 결정된 아미노산 또는 핵산 서열 정보를 수득하는 단계; 및
(ii) 하나 이상의 폴리펩타이드 중의 CVP의 아미노산 서열 또는 이러한 서열을 지닌 핵산의 수집물을 합성하고 임의로 핵산의 수집물을 하나 이상의 발현 카세트 및/또는 발현 벡터의 수집물내로 삽입시키는 단계를 포함하는, CVP 또는 CVP를 암호화하는 핵산의 수집물을 생산하는 방법에 관한 것이다.
(iv) CVP가, 서열 번호 1 내지 1087에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택되는 FSP 및/또는 mFSP, 바람직하게는 서열 번호 1 내지 209에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택되는 FSP 및/또는 mFSP를 포함한다.
제3 양태에서, 본 발명은
(i) 본 발명의 제2 양태의 방법에서 결정된 아미노산 또는 핵산 서열 정보를 수득하는 단계; 및
(ii) 하나 이상의 폴리펩타이드 중의 CVP의 아미노산 서열 또는 이러한 서열을 지닌 핵산의 수집물을 합성하고 임의로 핵산의 수집물을 하나 이상의 발현 카세트 및/또는 발현 벡터의 수집물내로 삽입시키는 단계를 포함하는, CVP 또는 CVP를 암호화하는 핵산의 수집물을 생산하는 방법에 관한 것이다.
삭제
삭제
삭제
삭제
FSP 및, 변형된 경우 mFSP, 또는 CVP의 이의 항원성 단편은 FSP 및, 변형된 경우 mFSP 또는 이의 항원성 단편을 암호화하는 핵산의 수집물의 재조합 발현에 의해 또는 화학적 합성에 의해 수행될 수 있다. 유사하게, CVP의 펩타이드를 암호화하는 핵산의 수집물의 합성은 고체 상에서 화학적 합성을 포함하는 공지된 방법에 의해 수행될 수 있다.
제4 양태에서, 본 발명은 본 발명의 제2 양태의 방법에 의해 생산가능한 CVP 또는 상기 CVP의 펩타이드를 암호화하는 핵산의 수집물에 관한 것이다.
제5 양태에서, CVP는 Y개의 상이한 FSP 및/또는 mFSP 또는 길이가 적어도 8개의 아미노산인 FSP 및/또는 mFSP의 항원성 단편을 포함하거나 이로 이루어지며,
여기서 각각의 FSP 또는 mFSP로 변형되는 FSP는, 길이가 적어도 4개 아미노산인 경우에서의 FSM이 없는 상응하는 wt 핵산의 번역물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈으로부터 시작되는 핵산을 함유하는 FSM의 단백질-암호화 분절의 단편 또는 완전한 번역 생성물이고,
여기서 FSP 또는 mFSP로 변형되는 FSP의 적어도 50%는 다음의 기준:
(a) FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트(subset)에 대해 관찰된 암 유형-특이적인 빈도(CF)로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나에 대해 적어도 5%임; 및/또는
(b) FSP를 암호화하는 FSM을 지닌 유전자의 평균 mRNA 발현 수준은, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 80번째 백분위수 이내임; 및/또는
(c) FSP를 생성하는 FSM은 암이 없는 대상체의 집단(cohort)내의 정상 조직 내에서 2% 미만으로 관찰됨
중 하나 이상을 충족하고,
여기서 다음의 기준:
(i) FC에 의해 암호화된 아미노산으로부터 시작되는 FSM을 포함하는 핵산에 의해 암호화된 FSP는 길이가 4 내지 9개의 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속적인 스트레치를 함유함, 및/또는
(iii) FSP가 wt 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열은, (i)에 따른 FSP의 경우에는, FSP의 바로 상부에 존재하는 야생형(wt) 아미노산 서열의 1 내지 4개 아미노산을 FSP의 N-말단에 첨가함으로써 변형되며 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 경우에는, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 FSP가 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 경우에는, 이러한 스트레치를 제거함으로써 변형되며; 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 변형된 FSP는 CVP로부터 배제되며;
여기서 Y는 적어도 20이고 보다 바람직하게는 적어도 35이며 M은 적어도 5이다.
제4 양태에서, 본 발명은 본 발명의 제2 양태의 방법에 의해 생산가능한 CVP 또는 상기 CVP의 펩타이드를 암호화하는 핵산의 수집물에 관한 것이다.
제5 양태에서, CVP는 Y개의 상이한 FSP 및/또는 mFSP 또는 길이가 적어도 8개의 아미노산인 FSP 및/또는 mFSP의 항원성 단편을 포함하거나 이로 이루어지며,
여기서 각각의 FSP 또는 mFSP로 변형되는 FSP는, 길이가 적어도 4개 아미노산인 경우에서의 FSM이 없는 상응하는 wt 핵산의 번역물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈으로부터 시작되는 핵산을 함유하는 FSM의 단백질-암호화 분절의 단편 또는 완전한 번역 생성물이고,
여기서 FSP 또는 mFSP로 변형되는 FSP의 적어도 50%는 다음의 기준:
(a) FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트(subset)에 대해 관찰된 암 유형-특이적인 빈도(CF)로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나에 대해 적어도 5%임; 및/또는
(b) FSP를 암호화하는 FSM을 지닌 유전자의 평균 mRNA 발현 수준은, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 80번째 백분위수 이내임; 및/또는
(c) FSP를 생성하는 FSM은 암이 없는 대상체의 집단(cohort)내의 정상 조직 내에서 2% 미만으로 관찰됨
중 하나 이상을 충족하고,
여기서 다음의 기준:
(i) FC에 의해 암호화된 아미노산으로부터 시작되는 FSM을 포함하는 핵산에 의해 암호화된 FSP는 길이가 4 내지 9개의 아미노산임, 및/또는
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속적인 스트레치를 함유함, 및/또는
(iii) FSP가 wt 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열은, (i)에 따른 FSP의 경우에는, FSP의 바로 상부에 존재하는 야생형(wt) 아미노산 서열의 1 내지 4개 아미노산을 FSP의 N-말단에 첨가함으로써 변형되며 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고/이거나; (ii)에 따른 FSP의 경우에는, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 FSP가 CVP로부터 배제되고/되거나; (iii)에 따른 FSP의 경우에는, 이러한 스트레치를 제거함으로써 변형되며; 연속된 스트레치의 제거 후 길이가 4개 미만의 아미노산인 변형된 FSP는 CVP로부터 배제되며;
여기서 Y는 적어도 20이고 보다 바람직하게는 적어도 35이며 M은 적어도 5이다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
바람직하게는, CVP에 포함된 FSP의 적어도 50%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족한다. CFSP에 대해 선택된 FSP의 60%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하고, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 70%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하며, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 80%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하고, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 90%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하며, 보다 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 95%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족하고 가장 바람직하게는 CFSP에 대해 선택된 FSP의 적어도 100%는 기준 (a), (b), (c), (a)+(b), (a)+(c), (b)+(c) 또는 (a)+(b)+(c)를 충족한다.
기준 (a)와 관련하여 FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트에 대해 관찰되는 CF로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 적어도 10%, CS내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 바람직하게는 적어도 15%, 바람직하게는 적어도 20%, 바람직하게는 적어도 25%, 바람직하게는 적어도 30%, 보다 바람직하게는 적어도 35%, 보다 바람직하게는 적어도 40%인 것이 바람직하다.
기준 (b)와 관련하여, FSP를 암호화하는 FSM를 지닌 유전자의 평균 mRNA 발현 수준이, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내인 것이 바람직하다. FSP의 상대적인 풍부성이 더 높을 수록, 면역 반응의 유도가 MSI 암의 치료 또는 예방에 있어서 더 효과적일 경향이 있다. 단지 명확성을 위하여, 어구 "상위 80번째 백분위수"는 최대로 발현된 mRNA를 포함하는 수준 이내의 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 19% 만을 배제한다. 따라서, "상위 30번째 백분위수"는 최대 발현된 mRNA를 포함하는 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 69%는 배제한다.
기준 (a) 및 (b)의 바람직한 조합은 적어도 5%의 CF이며, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 10%의 CF이고, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 15%의 CF이고, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 20%의 CF이고, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 수준을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다.
기준 (a)와 관련하여 FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트에 대해 관찰되는 CF로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 적어도 10%, CS내에 존재하는 암 유형 중 적어도 하나 또는 모두에 대해 바람직하게는 적어도 15%, 바람직하게는 적어도 20%, 바람직하게는 적어도 25%, 바람직하게는 적어도 30%, 보다 바람직하게는 적어도 35%, 보다 바람직하게는 적어도 40%인 것이 바람직하다.
기준 (b)와 관련하여, FSP를 암호화하는 FSM를 지닌 유전자의 평균 mRNA 발현 수준이, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내인 것이 바람직하다. FSP의 상대적인 풍부성이 더 높을 수록, 면역 반응의 유도가 MSI 암의 치료 또는 예방에 있어서 더 효과적일 경향이 있다. 단지 명확성을 위하여, 어구 "상위 80번째 백분위수"는 최대로 발현된 mRNA를 포함하는 수준 이내의 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 19% 만을 배제한다. 따라서, "상위 30번째 백분위수"는 최대 발현된 mRNA를 포함하는 발현 수준을 갖는 모든 FSM을 지칭하며 mRNA의 최저로 발현된 69%는 배제한다.
기준 (a) 및 (b)의 바람직한 조합은 적어도 5%의 CF이며, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 10%의 CF이고, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 15%의 CF이고, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다. 기준 (a) 및 (b)의 다른 바람직한 조합은 적어도 20%의 CF이고, FSM을 지닌 유전자의 mRNA 발현 수준은, 바람직하게는 특정 유형의 암의, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 수준을 설명하는 분포의 상위 75번째 백분위수, 바람직하게는 상위 70번째 백분위수, 바람직하게는 상위 65번째 백분위수, 바람직하게는 상위 60번째 백분위수, 바람직하게는 상위 55번째 백분위수, 보다 바람직하게는 상위 50번째 백분위수, 보다 바람직하게는 상위 40번째 백분위수, 보다 바람직하게는 상위 30번째 백분위수 이내이다.
삭제
삭제
삭제
기준 (c)와 관련하여, FSP를 생성하는 FSM가 암이 없는 대상체의 집단에서의 정상 조직내에서 2% 미만, 보다 바람직하게는 1.9% 미만, 1.8% 미만, 1.7% 미만, 1.6% 미만, 1.5% 미만, 1.4% 미만, 1.3% 미만, 1.2% 미만, 1.1% 미만, 1.0% 미만으로 관찰된다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서:
(i) CS는 MSI 종양, 바람직하게는 결장직장 암 및/또는 위암 및/또는 자궁내막 암, 보다 바람직하게는 결장직장 암, 위암 및 자궁내막 암을 가진 환자로부터 유래되고/되거나;
(ii) M은 적어도 10, 바람직하게는 적어도 20, 바람직하게는 적어도 30, 바람직하게는 적어도 50, 보다 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 가장 바람직하게는 적어도 300이고/이거나;
(iii) Y는 적어도 35, 바람직하게는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200이고/이거나;
(iv) CVP는 각각의 FSP의 적어도 4개, 바람직하게는 적어도 6개, 보다 바람직하게는 적어도 8개의 아미노산을 포함하고/하거나;
(v) Y는 모든 FSP 및/또는 mFSP 또는 CVP의 일부인 이의 항원성 단편의 누적 아미노산 길이 V가 적어도 280개 아미노산, 바람직하게는 적어도 500개 아미노산, 바람직하게는 적어도 1,000개 아미노산, 바람직하게는 적어도 1,500개 아미노산, 바람직하게는 적어도 2,000개 아미노산, 바람직하게는 적어도 2,500개 아미노산, 바람직하게는 적어도 3,000개 아미노산, 바람직하게는 적어도 3,500개 아미노산, 바람직하게는 적어도 4,000개 아미노산, 바람직하게는 적어도 4,500개 아미노산, 바람직하게는 적어도 5,000개 아미노산, 바람직하게는 적어도 5,500개 아미노산, 바람직하게는 적어도 6,000개 아미노산이도록 선택되고/되거나;
(vi) CVP의 FSP 및/또는 mFSP는, 서열 번호 1 내지 1087에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택되고, 바람직하게는 서열 번호 1 내지 209에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택된다.
바람직하게는, M은 적어도 30이고 Y는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 보다 바람직하게는 적어도 300이고, 바람직하게는, M은 적어도 50이며 Y는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이고, M은 적어도 100이며 Y는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이고, M은 적어도 200이며 Y는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이고, 심지어 보다 바람직하게는 M은 적어도 300이며 Y는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 및 보다 바람직하게는 적어도 300이다.
본 발명의 일 구현예에서, 본 발명의 제5 양태의 CVP는 하나 이상의 비-MSI 암 특이적인 항원을 추가로 포함한다. 바람직하게는, 이러한 항원은 치료될 하나 이상의 암 유형에 대해 또한 특이적이다.
바람직한 구현예에서, CVP의 FSP 및/또는 mFSP 또는 이의 항원성 단편의 적어도 35, 바람직하게는 적어도 50, 바람직하게는 적어도 100, 보다 바람직하게는 적어도 200, 보다 바람직하게는 적어도 209개는 서열 번호 1 내지 1087에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택되고, 바람직하게는 서열 번호 1 내지 209에 따른 FSP 및/또는 mFSP의 그룹으로부터 선택된다.
서열 번호 1 내지 1087에 따른 FSP 및 mFSP는 MSI 종양, 특히 결장직장 암종, 위암 및 자궁내막 암의 예방 또는 치료를 위한 관련성의 감소되는 순서로 1 내지 1087로 배열되어 있다. 특히 적합한 서브세트는 서열 번호 1 내지 50, 1 내지 75, 1 내지 100, 1 내지 125, 1 내지 150, 1 내지 175, 1 내지 200, 특히 바람직하게는 1 내지 209, 1 내지 225, 1 내지 250, 1 내지 275, 1 내지 300, 1 내지 325, 1 내지 350 1 내지 375, 1 내지 400, 1 내지 450, 1 내지 500, 1 내지 550, 1 내지 600, 1 내지 650, 1 내지 700, 1 내지 750, 1 내지 800, 1 내지 850, 1 내지 900, 1 내지 950, 1 내지 1000, 1 내지 1050 또는 1 내지 1087의 아미노산 서열을 지닌 FSP 및 mFSP를 포함하거나 이로 이루어진다. 서브세트가 정확하게 각각 나타낸 FSP 및/또는 mFSP를 포함하거나 이로 이루어진 것이 바람직하지만, 이러한 FSP 및/또는 mFSP의 1 내지 10%는 이의 활성에 있어서 임의의 실질적인 손실없이 세트로부터 빠질 수 있음이 기술자에 의해 이해된다. 유사하게, 및 "포함하는" 언어가 내포하는 바와 같이, 예컨대, 서열 번호 1 내지 200의 아미노산 서열을 포함하는 서브세트는 또한 1 내지 100개 이상의 서열 번호 201 내지 1087의 FSP 또는 mFSP 및/또는 하나 이상의 다른 FSP 또는 mFSP 또는 비-MSI 암 특이적인 항원을 추가로 포함할 수 있다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서, CVP의 FSP는 CFSP로부터 연이어 선택되었고 여기서 각각의 선택 단계에서, 역치 값 미만인 최대 수의 암 샘플에서 역치 값에 이르도록 CAFSPL을 증가시키는 새로운 FSP 또는 이의 항원성 단편이 CFSP로부터 선택되고, 임의로, CAFSPL이 여전히 역치 값 미만인 최대 수의 암 샘플에 대한 CAFSPL이 둘 이상의 FSP에 의해 증가할 경우, 최고 점수를 지닌 FSP가 선택된다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서:
(i) 각각의 암 샘플에 대한 CAFSPL은, CVP의 이미 부분인 FSP의 아미노산 길이 및 상응하는 FSM이 상기 암 샘플 속에 존재하는 CFSP로부터의 새로운 FSP의 아미노산 길이를 합함으로써 결정되고/되거나;
(ii) 역치 값은 특정 암 유형에 속하는 CS로부터의 샘플의 각각의 서브세트에 대해 별도로 정의되고/되거나;
(iii) 점수는 FSP의 아미노산 길이와 FSP를 생성하는 FSM이 CS내에서 관찰된 전체 빈도 사이의 곱으로서 정의되고/되거나;
(iv) CFP로의 혼입이 CAFSPL이 여전히 역치 값(TV) 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지 새로운 FSP의 첨가가 진행되고/진행되거나;
(v) 여기서 동일한 FSM으로부터 기원하는 FSP는 개개 FSP의 점수의 합으로 계산된 합해진 점수를 지닌 하나의 FSP로서 취급된다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서,
(i) 각각의 암 샘플에 대한 CAFSPL은 CVP의 이미 일부인 FSP의 아미노산 길이 및 암 샘플 속에 존재하는 상응하는 FSM에 대한 CFSP로부터의 새로운 FSP의 아미노산 길이를 합함으로써 결정되고/되거나;
(ii) 여기서 역치 값은 특정 암 유형에 속하는 CS로부터의 샘플의 각각의 서브세트에 대해 별도로 정의되고/되거나;
(iii) 여기서 점수는 CF가 5% 미만, 보다 바람직하게는 4% 미만 및 보다 바람직하게는 3% 미만인 암 유형으로부터의 암 샘플 내 FSM을 계수함이 없이, FSP의 아미노산 길이와 FSP를 생성하는 FSM의 전체 빈도 사이의 곱으로서 정의되고/되거나;
(iv) 여기서 암 샘플의 서브세트는 종양 유형으로부터의 모든 암 샘플을 포함하고 여기서 FSM은 5% 이상, 보다 바람직하게는 10% 이상 또는 15% 이상의 CF로 존재하고/하거나;
(v) 여기서 5% 미만, 보다 바람직하게는 4% 미만 및 보다 바람직하게는 3% 미만의 전체적인 빈도로 FSM에 의해 생성된 FSP가 선택으로부터 배제되고/되거나;
(vi) 여기서 CVP로의 혼입이 CAFSPL이 여전히 TV 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지 또는 CVP 내에 존재하는 모든 FSP의 누적 길이가 V개 아미노산의 최대 값에 도달할 때까지 새로운 FSP의 첨가가 진행되고/되거나;
(vii) 여기서 동일한 FSM으로부터 유래되는 FSP는 개개의 FSP의 점수의 합으로서 계산된 합해진 점수를 지닌 하나의 FSP로서 취급된다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서, CVP의 FSP는 CFSP로부터 연이어 선택되었고 여기서 각각의 선택 단계에서, 역치 값 미만인 최대 수의 암 샘플에서 역치 값에 이르도록 CAFSPL을 증가시키는 새로운 FSP 또는 이의 항원성 단편이 CFSP로부터 선택되고, 임의로, CAFSPL이 여전히 역치 값 미만인 최대 수의 암 샘플에 대한 CAFSPL이 둘 이상의 FSP에 의해 증가할 경우, 최고 점수를 지닌 FSP가 선택된다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서:
(i) 각각의 암 샘플에 대한 CAFSPL은, CVP의 이미 부분인 FSP의 아미노산 길이 및 상응하는 FSM이 상기 암 샘플 속에 존재하는 CFSP로부터의 새로운 FSP의 아미노산 길이를 합함으로써 결정되고/되거나;
(ii) 역치 값은 특정 암 유형에 속하는 CS로부터의 샘플의 각각의 서브세트에 대해 별도로 정의되고/되거나;
(iii) 점수는 FSP의 아미노산 길이와 FSP를 생성하는 FSM이 CS내에서 관찰된 전체 빈도 사이의 곱으로서 정의되고/되거나;
(iv) CFP로의 혼입이 CAFSPL이 여전히 역치 값(TV) 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지 새로운 FSP의 첨가가 진행되고/진행되거나;
(v) 여기서 동일한 FSM으로부터 기원하는 FSP는 개개 FSP의 점수의 합으로 계산된 합해진 점수를 지닌 하나의 FSP로서 취급된다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서,
(i) 각각의 암 샘플에 대한 CAFSPL은 CVP의 이미 일부인 FSP의 아미노산 길이 및 암 샘플 속에 존재하는 상응하는 FSM에 대한 CFSP로부터의 새로운 FSP의 아미노산 길이를 합함으로써 결정되고/되거나;
(ii) 여기서 역치 값은 특정 암 유형에 속하는 CS로부터의 샘플의 각각의 서브세트에 대해 별도로 정의되고/되거나;
(iii) 여기서 점수는 CF가 5% 미만, 보다 바람직하게는 4% 미만 및 보다 바람직하게는 3% 미만인 암 유형으로부터의 암 샘플 내 FSM을 계수함이 없이, FSP의 아미노산 길이와 FSP를 생성하는 FSM의 전체 빈도 사이의 곱으로서 정의되고/되거나;
(iv) 여기서 암 샘플의 서브세트는 종양 유형으로부터의 모든 암 샘플을 포함하고 여기서 FSM은 5% 이상, 보다 바람직하게는 10% 이상 또는 15% 이상의 CF로 존재하고/하거나;
(v) 여기서 5% 미만, 보다 바람직하게는 4% 미만 및 보다 바람직하게는 3% 미만의 전체적인 빈도로 FSM에 의해 생성된 FSP가 선택으로부터 배제되고/되거나;
(vi) 여기서 CVP로의 혼입이 CAFSPL이 여전히 TV 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지 또는 CVP 내에 존재하는 모든 FSP의 누적 길이가 V개 아미노산의 최대 값에 도달할 때까지 새로운 FSP의 첨가가 진행되고/되거나;
(vii) 여기서 동일한 FSM으로부터 유래되는 FSP는 개개의 FSP의 점수의 합으로서 계산된 합해진 점수를 지닌 하나의 FSP로서 취급된다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
제5 양태에 따른 CVP는 제1 및 제2의 양태의 방법에 의해 설계될 수 있으며 따라서 선택 단계 및 제1 및 제2 양태에 관해 요약된 기준은 동일하게 사용되어 제5 양태의 CVP를 특징화시킬 수 있다. 따라서, 바람직한 구현예에서 기준 (i)+(iii)+(vi)은 FSP의 적어도 50%, 보다 바람직하게는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%를 충족한다.
따라서, FSP의 적어도 50%는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택됨이 바람직하며, 보다 바람직하게는 FSP의 적어도 60%는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되며, 보다 바람직하게는 FSP의 적어도 70%는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되며, 보다 바람직하게는 FSP의 적어도 80%는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되고, 보다 바람직하게는 FSP의 적어도 90%는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택되며,가장 바람직하게는 FSP의 100%는 바람직하게는 기준 (i)+(iii)+(vi)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(vi), (i)+(iii)+(iv)+(vi), (i)+(iii)+(v)+(vi) 또는 (i)+(iii)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(vi), (i)+(ii)+(iii)+(v)+(vi), (i)+(ii)+(iii)+(vi)+(vii), (i)+(iii)+(iv)+(v)+(vi), (i)+(iii)+(iv)+(vi)+(vii) 또는 (i)+(iii)+(v)+(vi)+(vii)을 기반으로, 보다 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi), (i)+(ii)+(iii)+(iv)+(vi)+(vii), (i)+(ii)+(iii)+(v)+(vi)+(vii) 또는 (i)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로, 가장 바람직하게는 기준 (i)+(ii)+(iii)+(iv)+(v)+(vi)+(vii)을 기반으로 선택된다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서, TV는:
(a) TV는 적어도 400개 아미노산, 바람직하게는 적어도 600개 아미노산, 보다 바람직하게는 적어도 800개 아미노산이거나;
(b) TV는:
(i) 결장직장 암 및 위암의 경우 적어도 400개 아미노산, 바람직하게는 적어도 600개 아미노산, 보다 바람직하게는 적어도 800개 아미노산이고;
(ii) 자궁내막 암의 경우 적어도 200개 아미노산, 바람직하게는 적어도 300개 아미노산, 보다 바람직하게는 적어도 400개 아미노산이다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서, CVP의 펩타이드는 별개이거나 적어도 2개의 FSP 및/또는 mFSP는 하나 이상의 폴리펩타이드 내에 포함된다. 2개 이상의 FSP 및/또는 mFSP가 폴리펩타이드에 연결되는 경우 펩타이드 결합과 직접, 즉 아미노산 링커의 부재 하에 이루어지는 것이 바람직하다.
또한, 수득되는 접합 서열(junction sequence)이 wt 사람 단백질 속에 또한 존재하는 8개 이상의 아미노산의 하나 이상의 연속된 스트레치를 함유하는 지를, 폴리펩타이드내에 2개의 FSP 및/또는 mFSP를 연결시키기 전에 평가하는 것이 바람직하다. 그렇다면 이러한 2개의 펩타이드는 이러한 방식으로 연결되지 않는다. 따라서, 연결된 FSP 및/또는 mFSP의 수득되는 폴리펩타이드는 wt 사람 단백질 속에 또한 존재하는 8개 이상의 아미노산의 하나 이상의 연속된 스트레치를 함유하지 않을 것이다. CVP 속에 포함된 FSP 및/또는 mFSP의 총 길이에 따라서, FSP 및/또는 mFSP는 2, 3, 4, 5, 또는 6개 이상의 폴리펩타이드 속에 포함될 수 있다.
본 발명자들은 서열 번호 1 내지 209의 209개 FSP 및 mFSP, 또는 이의 항원성 단편을 4개의 폴리펩타이드에 조립하였고 이것이 이러한 항원을 제공하는 특히 적합한 방식임을 발견하였다. 4개의 폴리펩타이드 내 서열 번호 1 내지 209의 FSP 및 mFSP의 바람직한 정렬은 서열 번호 1088 내지 1091(레이아웃 A), 서열 번호 1092 내지 1095(레이아웃 B), 서열 번호 1155 내지 1158(레이아웃 C) 또는 서열 번호 1159 내지 1162(레이아웃 D)에 따른 아미노산 서열을 가지는 이하의 4개의 폴리펩타이드로 이루어지거나 이를 포함한다.
동일한 CVP, 즉 동일한 FSP 및 mFSP를 포함하는 CVP의 투여의 후속 라운드에서, 예컨대, 서열 번호 1 내지 209에 따른 FSP 및 mFSP를 포함하는 폴리펩타이드는 상이한 순서로 정렬되는 것이 바람직하다. 이는 접합 에피토프(junctional epitope)에 대한 원치 않은 면역 반응을 최소화시킨다. 예를 들면, 폴리펩타이드 레이아웃 A와 폴리펩타이드 레이아웃 B, 레이아웃 A와 레이아웃 C, 레이아웃 A와 레이아웃 D, 레이아웃 B와 레이아웃 C, 레이아웃 B와 레이아웃 D, 레이아웃 C와 레이아웃 D, 레이아웃 A와 레이아웃 B 및 레이아웃 C, 레이아웃 A와 레이아웃 B 및 레이아웃 D, 레이아웃 B와 레이아웃 C 및 레이아웃 D, 레이아웃 A와 레이아웃 B, 레이아웃 C 및 레이아웃 D에서 CVP의 투여를 조합하는 것이 바람직하다.
따라서, 본 발명은 또한 폴리펩타이드의 2, 3, 4, 5, 6개 이상의 상이한 레이아웃을 포함하며, 여기서 각각의 세트는 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의, 동일한 FSP 및 mFSP 또는 이의 항원성 단편으로 이루어지거나 이를 포함하는, 즉 동일한 CVP인 폴리펩타이드를 포함한다. 따라서, 각각의 세트 사이의 차이는 FSP, mFSP 또는 이의 항원성 단편의 아미노산 서열이 아니라, 각각의 수의 폴리펩타이드 내 FSP, mFSP 또는 이의 항원성 단편의 정렬(arrangement)이다. 이는 특히 주어진 CVP가, 2개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하고; 3개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하고; 4개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하고; 5개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하는 것이 바람직하다. 바람직하게는, 각각의 상이한 레이아웃은 다른 레이아웃으로부터 상이한 접합 서열에 의해 구별되는데, 즉, 2개의 레이아웃은 다음 FSP 또는 mFSP까지 하나의 FSP 또는 mFSP의 동일한 N- 내지 C-말단 연결 사이에 연결을 포함하지 않는다.
본 발명자들은 서열 번호 1 내지 209의 209개 FSP 및 mFSP, 또는 이의 항원성 단편을 4개의 폴리펩타이드에 조립하였고 이것이 이러한 항원을 제공하는 특히 적합한 방식임을 발견하였다. 4개의 폴리펩타이드 내 서열 번호 1 내지 209의 FSP 및 mFSP의 바람직한 정렬은 서열 번호 1088 내지 1091(레이아웃 A), 서열 번호 1092 내지 1095(레이아웃 B), 서열 번호 1155 내지 1158(레이아웃 C) 또는 서열 번호 1159 내지 1162(레이아웃 D)에 따른 아미노산 서열을 가지는 이하의 4개의 폴리펩타이드로 이루어지거나 이를 포함한다.
동일한 CVP, 즉 동일한 FSP 및 mFSP를 포함하는 CVP의 투여의 후속 라운드에서, 예컨대, 서열 번호 1 내지 209에 따른 FSP 및 mFSP를 포함하는 폴리펩타이드는 상이한 순서로 정렬되는 것이 바람직하다. 이는 접합 에피토프(junctional epitope)에 대한 원치 않은 면역 반응을 최소화시킨다. 예를 들면, 폴리펩타이드 레이아웃 A와 폴리펩타이드 레이아웃 B, 레이아웃 A와 레이아웃 C, 레이아웃 A와 레이아웃 D, 레이아웃 B와 레이아웃 C, 레이아웃 B와 레이아웃 D, 레이아웃 C와 레이아웃 D, 레이아웃 A와 레이아웃 B 및 레이아웃 C, 레이아웃 A와 레이아웃 B 및 레이아웃 D, 레이아웃 B와 레이아웃 C 및 레이아웃 D, 레이아웃 A와 레이아웃 B, 레이아웃 C 및 레이아웃 D에서 CVP의 투여를 조합하는 것이 바람직하다.
따라서, 본 발명은 또한 폴리펩타이드의 2, 3, 4, 5, 6개 이상의 상이한 레이아웃을 포함하며, 여기서 각각의 세트는 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의, 동일한 FSP 및 mFSP 또는 이의 항원성 단편으로 이루어지거나 이를 포함하는, 즉 동일한 CVP인 폴리펩타이드를 포함한다. 따라서, 각각의 세트 사이의 차이는 FSP, mFSP 또는 이의 항원성 단편의 아미노산 서열이 아니라, 각각의 수의 폴리펩타이드 내 FSP, mFSP 또는 이의 항원성 단편의 정렬(arrangement)이다. 이는 특히 주어진 CVP가, 2개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하고; 3개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하고; 4개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하고; 5개의 상이한 레이아웃으로 제공되고, 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드, 가장 바람직하게는 4개의 폴리펩타이드를 포함하는 것이 바람직하다. 바람직하게는, 각각의 상이한 레이아웃은 다른 레이아웃으로부터 상이한 접합 서열에 의해 구별되는데, 즉, 2개의 레이아웃은 다음 FSP 또는 mFSP까지 하나의 FSP 또는 mFSP의 동일한 N- 내지 C-말단 연결 사이에 연결을 포함하지 않는다.
삭제
삭제
삭제
각각의 레이아웃은 전형적으로 환자에게 별도로 투여될 것이므로, 상이한 레이아웃은 또한 동일한 CVP의 별도의 조성물로서 간주될 수 있다.
본 발명의 제5 양태의 CVP의 바람직한 구현예에서 CVP의 하나 이상 FSP 및/또는 mFSP 또는 2개 이상의 FSP 및/또는 mFSP를 포함하는 폴리펩타이드는 바람직하게는 펩타이드 결합에 의해 CVP의 면역원성을 향상시키는 다음의 성분 중 하나 이상에 연결된다: 불변 쇄 서열 또는 이의 단편; 조직형 플라스미노겐 활성인자; PEST 서열; 사이클린 파괴 박스; 유비퀴틴화 신호; 수모일화 신호(SUMOylation signal); 인터루킨, 바람직하게는 인터루킨 2, 인터루킨 12, 또는 인터루킨 15; 체크포인트 단백질(checkpoint 단백질) 특이적인 리간드, 바람직하게는 항-PD1 항체 또는 이의 PD1-결합 단편, 항-CTLA4 항체 또는 이의 항-CTLA4-결합 단편, 항-LAG3 항체 또는 항-LAG3-결합 단편, 항-TIM3 항체 또는 이의 항-TIM3-결합 단편.
바람직한 구현예에서, 분류 신호(사람 조직 플라스미노겐 활성인자 신호 펩타이드(hTPA; 서열 번호 1104 또는 hTPA로서 분류된 이의 작용성 단편) 또는 사람 불변 쇄(hINV; 서열 번호 1105 또는 hINV로서 분류된 이의 작용성 단편)는 서열 번호 1088 내지 1091(레이아웃 A), 서열 번호 1092 내지 1095(레이아웃 B), 서열 번호 1155 내지 1158(레이아웃 C) 또는 서열 번호 1159 내지 1162(레이아웃 D)의 폴리펩타이드의 N-말단에 가해지며, 임의로 인플루엔자 HA-tag 서열(서열 번호 1106)은 상기 폴리펩타이드의 C-말단에서 가해진다.
이렇게 작제된 폴리펩타이드의 바람직한 아미노산 서열은 hTPA의 경우 서열 번호 1107 내지 1110(레이아웃 A), 서열 번호 1111 내지 1114(레이아웃 B), 서열 번호 1171 내지 1174(레이아웃 C) 및 서열 번호 1179 내지 1182(레이아웃 D)에 의해 및 hINV의 경우 서열 번호 1115 내지 1118(레이아웃 A), 서열 번호 1119 내지 1122(레이아웃 B), 서열 번호 1175 내지 1178(레이아웃 C) 및 서열 번호 1183 내지 1186(레이아웃 D)로서 제공된다.
제6 양태에서, 본 발명은 본 발명의 제5 양태의 CVP를 암호화하는 핵산의 수집물에 관한 것이다. 핵산은 바람직하게는 DNA, RNA 또는 이의 혈청 반감기를 증가시키도록 변형된 RNA일 수 있다.
CVP에 관한 상기 나타낸 이유로, FSP, mFPS 또는 이의 항원성 단편을 포함하는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 폴리펩타이드의 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상, 바람직하게는 4개의 상이한 레이아웃을 사용하는 것이 바람직하다. 지속적으로 각각의 수의 폴리펩타이드를 암호화하는 핵산의 수집물은 상이한 레이아웃을 갖는다. 바람직한 구현예에서 FSB 및/또는 mFSB를 암호화하는 핵산의 수집물은 서열 번호 1088 내지 1091(레이아웃 A), 서열 번호 1092 내지 1095(레이아웃 B), 서열 번호 1155 내지 1158(레이아웃 C) 또는 서열 번호 1159 내지 1162(레이아웃 D)에 따른 4개의 폴리펩타이드를 암호화하며 사람 코돈 용도를 기반으로 코돈-최적화된다.
CVP를 주어진 CVP를 암호화하는 핵산의 수집물의 형태로 투여하는 경우 핵산의 2, 3, 4, 5, 6개 또는 그 이상의 상이한 레이아웃을 사용하는 것이 바람직하며, 여기서 각각의 레이아웃은 동일한 FSP 및 mFSP 또는 이의 항원성 단편을 포함하거나 이로 이루어진 폴리펩타이드를 암호화하는 하나 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 핵산을 포함하는데, 즉, 동일한 CVP를 암호화한다. 이는 특히, 본 발명의 제4 또는 제5 양태의 CVP를 암호화하는 핵산의 주어진 수집물이 2개의 상이한 레이아웃으로 제공되고 하나 이상, 바람직하게는 폴리펩타이드를 암호화하는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 핵산, 가장 바람직하게는 동일한 FSP 및 mFSP를 포함하거나 이로 이루어진 폴리펩타이드를 암호화하는 4개의 핵산 또는 이의 항원성 단편을 포함하고, 3개의 상이한 레이아웃으로 제공되고 하나 이상, 바람직하게는 폴리펩타이드를 암호화하는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 핵산, 가장 바람직하게는 동일한 FSP 및 mFSP를 포함하거나 이로 이루어진 폴리펩타이드를 암호화하는 4개의 핵산 또는 이의 항원성 단편을 포함하고, 4개의 상이한 레이아웃으로 제공되고 하나 이상, 바람직하게는 폴리펩타이드를 암호화하는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 핵산, 가장 바람직하게는 동일한 FSP 및 mFSP를 포함하거나 이로 이루어진 폴리펩타이드를 암호화하는 4개의 핵산 또는 이의 항원성 단편을 포함하고, 5개의 상이한 레이아웃으로 제공되고 하나 이상, 바람직하게는 폴리펩타이드를 암호화하는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 핵산, 가장 바람직하게는 동일한 FSP 및 mFSP를 포함하거나 이로 이루어진 폴리펩타이드를 암호화하는 4개의 핵산 또는 이의 항원성 단편을 포함하는 것이 바람직하다.
동일한 CVP를 암호화하는 서열 번호 1 내지 209의 FSP 및 mFSP를 암호화하지만, 상이한 레이아웃을 지닌 이러한 핵산 수집물의 추가의 예가 레이아웃 A의 경우 서열 번호 1123 내지 1126에 및 hTPA를 지닌 레이아웃 C의 경우에 서열 번호 1187 내지 1190; 레이아웃 B의 경우에 서열 번호 1127 내지 1130 및 hTPA를 지닌 레이아웃 D의 경우에 서열 번호 1191 내지 1194; 레이아웃 A의 경우에 서열 번호 1131 내지 1134 및 hINV를 지닌 레이아웃 C의 경우에 서열 번호 1195 내지 1198 및 레이아웃 B의 경우에 서열 번호 1135 내지 1138 및 hINV를 지닌 레이아웃 D의 경우에 서열 번호 1199 내지 1202에 제공된다.
바람직한 구현예에서, 코작 서열(Kozak sequence)(CGCGACTTCGCCGCC)을 본 발명의 제4 또는 제6 양태에 따라 핵산 수집물의 출발 코돈의 바로 상부에 위치시킴으로써 번역의 효율적인 개시를 허용할 수 있으며 TAA 출발 코돈은 HA tag의 하부에 위치시켰다. 최종적으로, 핵산의 수집물이 유일한 제한 부위를 포함하는 2개의 플랭킹 분절을 포함함으로써 뉴클레오타이드 서열의 5'- 및 3'-말단 각각에 첨가된 카세트의 아-클로닝(sub-cloning)을 촉진시키는 것이 바람직하다(도 7).
본 발명의 제4 및 제6 양태의 핵산의 수집물은 또한 발현 카세트 내에 포함될 수 있다.
제7 양태에서 본 발명은 본 발명의 제4 또는 제6 양태의 핵산의 수집물의 모두 또는 일부를 각각 포함하는 하나 이상의 발현 벡터의 수집물에 관한 것이며, 여기서 발현 벡터의 수집물의 전체는 본 발명의 제4 또는 제6 양태의 핵산의 수집물 모두를 포함하는데, 즉, 여기서 발현의 수집물은 주어진 CVP의 모든 FSP, mFSP 또는 이의 항원성 단편을 암호화하는 핵산을 포함한다.
발현 벡터의 수집물이 발현 벡터의 면역원성을 향상시키는 하나 이상의 성분을 포함하는 것이 바람직하다. 바람직하게는 이러한 성분은 FSP, mFSP 또는 이의 항원성 단편에 대한 융합물로서 발현되거나 벡터, 바람직하게는 발현 카세트 내에 포함된 다른 핵산에 의해 암호화된다.
바람직한 구현예에서 CVP의 면역원성을 향상시키는 성분은 불변 쇄 서열 또는 이의 면역 자극성 단편; 조직-유형 플라스미노겐 활성인자; PEST 서열; 사이클린 파괴 박스; 유비퀴틴화 신호(ubiquitination signal); 수모일화 신호; 인터루킨, 바람직하게는 인터루킨 2, 인터루킨 12, 또는 인터루킨 15; 체크포인트 단백질 특이적인 리간드, 바람직하게는 항-PD1 항체 또는 이의 PD1-결합 단편, 항-CTLA4 항체 또는 이의 항-CTLA4-결합 단편, 항-LAG3 항체 또는 항-LAG3-결합 단편, 항-TIM3 항체 또는 이의 항-TIM3-결합 단편으로 이루어진 그룹으로부터 선택된다.
제7 양태의 발현 벡터의 수집물의 바람직한 구현예에서, 수집물의 각각의 발현 벡터는 플라스미드; 코스미드; RNA; 보조제(adjuvant)와 함께 제형화된 RNA; 리포좀 입자 중에 제형화된 RNA; 자가-증폭하는 RNA(SAM); 보조제와 함께 제형화된 SAM; 리포좀 입자 중에 제형화된 SAM; 바이러스 벡터; 바람직하게는 알파바이러스 벡터, 베네주엘라 말 뇌염(VEE) 바이러스 벡터, 신드비스(SIN) 바이러스 벡터, 셈리키 포레스트 바이러스(semliki forest virus: SFV) 바이러스 벡터, 또한 바람직하게는 침팬지 또는 난쟁이 침팬지 또는 고릴라로부터 유래된 복제가능하거나 불가능한 아데노바이러스 벡터, 폭스바이러스 벡터, 박시니아 바이러스 벡터 또는 변형된 박시니아 안카라(modified vaccinia ankara: MVA) 벡터, 시미안 또는 사람 사이토메갈로바이러스(CMV) 벡터, 림프구 맥락수막염 바이러스(Lymphocyte choriomeningitis virus: LCMV) 벡터, 레트로바이러스 또는 렌티바이러스 벡터로 이루어진 그룹으로부터 독립적으로 선택된다. 하나의 수집물에 사용된 모든 발현 벡터는 동일한 유형, 예컨대, 복제 불가능한 아데노바이러스 벡터의 것이 바람직하다.
제7 양태의 발현 벡터의 수집물의 바람직한 구현예에서, 수집물의 각각의 발현 벡터는 플라스미드; 코스미드; RNA; 보조제(adjuvant)와 함께 제형화된 RNA; 리포좀 입자 중에 제형화된 RNA; 자가-증폭하는 RNA(SAM); 보조제와 함께 제형화된 SAM; 리포좀 입자 중에 제형화된 SAM; 바이러스 벡터; 바람직하게는 알파바이러스 벡터, 베네주엘라 말 뇌염(VEE) 바이러스 벡터, 신드비스(SIN) 바이러스 벡터, 셈리키 포레스트 바이러스(semliki forest virus: SFV) 바이러스 벡터, 또한 바람직하게는 침팬지 또는 난쟁이 침팬지 또는 고릴라로부터 유래된 복제가능하거나 불가능한 아데노바이러스 벡터, 폭스바이러스 벡터, 박시니아 바이러스 벡터 또는 변형된 박시니아 안카라(modified vaccinia ankara: MVA) 벡터, 시미안 또는 사람 사이토메갈로바이러스(CMV) 벡터, 림프구 맥락수막염 바이러스(Lymphocyte choriomeningitis virus: LCMV) 벡터, 레트로바이러스 또는 렌티바이러스 벡터로 이루어진 그룹으로부터 독립적으로 선택된다. 하나의 수집물에 사용된 모든 발현 벡터는 동일한 유형, 예컨대, 복제 불가능한 아데노바이러스 벡터의 것이 바람직하다.
삭제
가장 바람직한 발현 벡터는 아데노바이러스 벡터, 특히 사람 또는 비-사람 영장류로부터 유래된 아데노바이러스 벡터이다. 아데노바이러스가 유래되는 바람직한 유인원은 침팬지(Pan), 고릴라(Gorilla) 및 오랑우탄(Pongo), 바람직하게는 난쟁이 침팬지(판 파니스쿠스(Pan paniscus)) 및 일반적인 침팬지(판 트로글로디테스(Pan troglodytes))이다. 전형적으로, 천연적으로 존재하는 비-사람 유인원 아데노바이러스는 각각의 유인원의 대변 샘플로부터 단리된다. 가장 바람직한 벡터는 hAd5, hAd11, hAd26, hAd35, hAd49, ChAd3, ChAd4, ChAd5, ChAd6, ChAd7, ChAd8, ChAd9, ChAd10, ChAd11, ChAd16, ChAd17, ChAd19, ChAd20, ChAd22, ChAd24, ChAd26, ChAd30, ChAd31, ChAd37, ChAd38, ChAd44, ChAd55, ChAd63, ChAd73, ChAd82, ChAd83, ChAd146, ChAd147, PanAd1, PanAd2, 및 PanAd3 벡터를 기반으로 한 복제하지 않는 아데노바이러스 벡터 또는 복제-가능한 Ad4 및 Ad7 벡터이다. 사람 아데노바이러스 hAd4, hAd5, hAd7, hAd11, hAd26, hAd35 및 hAd49는 당해 분야에 잘 공지되어 있다. 천연적으로 존재하는 ChAd3, ChAd4, ChAd5, ChAd6, ChAd7, ChAd8, ChAd9, ChAd10, ChAd11, ChAd16, ChAd17, ChAd19, ChAd20, ChAd22, ChAd24, ChAd26, ChAd30, ChAd31, ChAd37, ChAd38, ChAd44, ChAd63 및 ChAd82를 기반으로 하는 벡터는 제WO 2005/071093호에 상세히 기술되어 있다. 천연적으로 존재하는 PanAd1, PanAd2, PanAd3, ChAd55, ChAd73, ChAd83, ChAd146, 및 ChAd147를 기반으로 하는 벡터는 제WO 2010/086189호에 상세히 기술되어 있다.
특수한 구현예에서, 아데노벡터는 Gad20(또한 GADNOU20로 명명됨, 서열 번호 1219)이거나 이로부터 유래된다. 일 구현예에서, '이로부터 유래된'은 아데노벡터가 서열 번호 1219에 대해 적어도 85%, 및 바람직하게는 적어도 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 가짐을 의미한다. 그러나, 바람직한 구현예에서, 이는 다음을 의미한다:
아데노벡터는 다음을 포함하는 아데노바이러스 헥손(hexon) 단백질을 암호화한다:
(i) 서열 번호 1219의 뉴클레오타이드 19386 내지 19472에 의해 암호화된 아미노산 (aa) 서열을 포함하는 제1의 초가변 영역 HVR1, 또는 적어도 85% aa 서열 동일성을 가지고 27번 aa 위치에서 A가 없고 바람직하게는 V를 지닌 이의 변이체,
(ii) 서열 번호 1219의 뉴클레오타이드 19527 내지 19571에 의해 암호화된 aa 서열을 포함하는 제2의 초가변 영역 HVR2, 또는 적어도 85% aa 서열 동일성을 가지고 1번 aa 위치에서 L이 없고 바람직하게는 I를 지닌 이의 변이체,
(iii) 서열 번호 1219의 뉴클레오타이드 19623 내지 19643에 의해 암호화된 aa 서열을 포함하는 제3의 초가변 영역 HVR3, 또는 적어도 85% aa 서열 동일성을 가지고 7번 aa 위치에서 V가 없고 바람직하게는 A를 지닌 이의 변이체,
(iv) 서열 번호 1219의 뉴클레오타이드 19737 내지 19772에 의해 암호화된 aa 서열을 포함하는 제4의 초가변 영역 HVR4, 또는 적어도 85% aa 서열 동일성을 갖는 이의 변이체,
(v) 서열 번호 1219의 뉴클레오타이드 19794 내지 19838에 의해 암호화된 aa 서열을 포함하는 제5의 초가변 영역 HVR5, 또는 적어도 85% aa 서열 동일성을 갖는 이의 변이체,
(vi) 서열 번호 1219의 뉴클레오타이드 19908 내지 19934에 의해 암호화된 aa 서열을 포함하는 제6의 초가변 영역 HVR6, 또는 적어도 85% aa 서열 동일성을 갖는 이의 변이체, 및
(vii) 서열 번호 1219의 뉴클레오타이드 20259 내지 20336에 의해 암호화된 aa 서열을 포함하는 제7의 초가변 영역 HVR7, 또는 1번 aa 위치에서 I가 없고 바람직하게는 V를 지닌 적어도 85% aa 서열 동일성을 갖는 이의 변이체.
바람직한 구현예에서, HVR 변이체는 적어도 90%, 및 보다 바람직하게는 적어도 95% 서열 동일성을 갖는다. 서열 동일성의 백분율 수준에 의한 정의의 대안으로서, HVR 변이체는 암호화된 서열과 비교하여 특정 수의 아미노산 변형을 갖는 것으로 정의된다. 이후에 돌연변이의 수는 다음과 같다: 적어도 85%의 서열 동일성 대신에, HVR1 내에서 4개 이하의 돌연변이, HVR2 내에서 2개 이하의 돌연변이, HVR3 내에서 1개 이하의 돌연변이, HVR4 내에서 1개 이하의 돌연변이, HVR5 내에서 2개 이하의 돌연변이, HVR6 내에서 1개 이하의 돌연변이, 및 HVR7 내에서 3개 이하의 돌연변이; 적어도 90% 서열 동일성 대신에, HVR1 내에서 2개 이하의 돌연변이, HVR2 내에서 1개 이하의 돌연변이, HVR3 내에서 1개 이하의 돌연변이 및 바람직하게는 돌연변이 없음, HVR4 내에서 1개 이하의 돌연변이, HVR5 내에서 1개 이하의 돌연변이, HVR6 내에서 1개 이하의 돌연변이 및 바람직하게는 돌연변이 없음, 및 HVR7내에서 2개 이하의 돌연변이; 적어도 95% 서열 동일성 대신에, HVR1 내에서 1개 이하의 돌연변이, HVR2 내에서 1개 이하의 돌연변이 및 바람직하게는 돌연변이 없음, HVR3 내에서 1개 이하의 돌연변이 및 바람직하게는 돌연변이 없음, HVR4 내에서 1개 이하의 돌연변이 및 바람직하게는 돌연변이 없음, HVR5 내에서 1개 이하의 돌연변이 및 바람직하게는 돌연변이 없음, HVR6 내에서 1개 이하의 돌연변이 및 바람직하게는 돌연변이 없음, 및 HVR7 내에서 1개 이하의 돌연변이.
당해 분야에 공지된 바와 같이, 예컨대, 브래들리(Bradley) 등(J Virol., 2012 Jan;86(2):1267-72)으로부터, 아데노바이러스 중화 항체는 헥손 초가변 영역을 표적화하며, 아데노바이러스의 HVR 영역을 혈청출현율(serumprevalence)로 대체함으로써, 이러한 아데노바이러스는 면역 숙주내에서 면역계를 회피할 수 있다. 따라서, 상기 HVR은 하기 정의된 각각의 헥손 단백질과 함께 사용될 수 있지만, 이들은 즉, 다른 헥손, 펜톤 및/또는 섬유 단백질을 가진 상이한 아데노바이러스내에서 헥손 HVR을 대체함으로써, 이러한 헥손 단백질로부터 및 또한 하기 펜톤 및 섬유 단백질과 독립적인 유용성을 가진다.
바람직한 구현예에서, 헥손 단백질은 서열 번호 1219의 뉴클레오타이드 18981 내지 21845에 의해 암호화된 아미노산 서열, 또는 적어도 85% 서열 동일성을 갖는 이의 변이체를 포함한다.
바람직한 구현예에서, 헥손 변이체는 적어도 90%, 및 바람직하게는 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는다. 서열 동일성의 퍼센트 수준에 의한 정의의 대안으로서, 헥손 변이체는 암호화된 서열과 비교하여 특정한 수의 아미노산 돌연변이를 갖는 것으로 정의될 수 있다. 이후에, 돌연변이의 수는 다음과 같다: 적어도 85% 서열 동일성 대신에, 143개 이하의 돌연변이; 적어도 90% 서열 동일성 대신에, 95개 이하의 돌연변이; 적어도 95% 서열 동일성 대신에, 47개 이하의 돌연변이; 적어도 96% 서열 동일성 대신에, 38개 이하의 돌연변이; 적어도 97% 서열 동일성 대신에, 28개 이하의 돌연변이; 적어도 98% 서열 동일성 대신에, 19개 이하의 돌연변이; 적어도 99% 서열 동일성 대신에, 9개 이하의 돌연변이. 헥손 변이체는 상기 각각의 HVR에 대해 정의된 것보다 이들의 HVR에서 서열 동일성을 더 적게 가지지 않거나 더 많은 돌연변이를 가지지 않는다.
일 구현예에서, 아데노벡터는 또한 서열 번호 1219의 뉴클레오타이드 14021 내지 15973에 의해 암호화된 아미노산 서열, 또는 적어도 85% 서열 동일성을 갖는 이의 변이체를 포함하는 아데노바이러스 펜톤 단백질을 추가로 암호화한다. 바람직한 구현예에서, 펜톤 변이체는 암호화된 서열과 비교하여 적어도 90%, 및 바람직하게는 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는다. 서열 동일성의 백분율 수준에 의한 정의의 대안으로서, 펜톤 변이체는 특정한 수의 아미노산 돌연변이를 갖는 것으로 정의될 수 있다. 이후에 돌연변이의 수는 다음과 같다: 적어도 85% 서열 동일성 대신에, 97개 이하의 돌연변이; 적어도 90% 서열 동일성 대신에, 65개 이하의 돌연변이; 적어도 95% 서열 동일성 대신에, 32개 이하의 돌연변이; 적어도 96% 서열 동일성 대신에, 26개 이하의 돌연변이; 적어도 97% 서열 동일성 대신에, 19개 이하의 돌연변이; 적어도 98% 서열 동일성 대신에, 13개 이하의 돌연변이; 적어도 99% 서열 동일성 대신에, 6개 이하의 돌연변이.
바람직하게는, 펜톤 변이체는 289번 아미노산 위치에서 D를 가지지 않고 바람직하게는 G를 가지며 341번 아미노산 위치에서 D를 가지지 않고 바람직하게는 N을 가진다.
다른 구현예에서, 아데노벡터는 또한(즉, 헥손 및 가능하게는 펜톤 단백질 다음에) 서열 번호 1219의 뉴클레오타이드 32163 내지 33956에 의해 암호화된 아미노산 서열, 또는 적어도 85% 서열 동일성을 가진 이의 변이체를 포함하는 아데노바이러스 섬유 단백질을 암호화한다. 바람직한 구현예에서, 섬유 변이체는 적어도 90%, 및 바람직하게는 적어도 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는다. 서열 동일성의 백분율 수준에 의한 정의의 대안으로서, 섬유 변이체는 암호화된 서열과 비교하여 특정 수의 아미노산 돌연변이를 갖는 것으로 정의될 수 있다. 이후에 돌연변이의 수는 다음과 같다: 적어도 85% 서열 동일성 대신에, 89개 이하의 돌연변이; 적어도 90% 서열 동일성 대신에, 59개 이하의 돌연변이; 적어도 95%의 서열 동일성 대신에, 29개 이하의 돌연변이; 적어도 96% 서열 동일성 대신에, 23개 이하의 돌연변이; 적어도 97% 서열 동일성 대신에, 17개 이하의 돌연변이; 적어도 98% 서열 동일성 대신에, 11개 이하의 돌연변이; 적어도 99% 서열 동일성 대신에, 5개 이하의 돌연변이.
바람직하게는, 섬유 변이체는 181번 아미노산 위치에서 A를 가지지 않고 바람직하게는 P를 가지고/가지거나, 474번 아미노산 위치에서 V를 가지지 않고 바람직하게는 I를 가지고/가지거나 4 및 5번 아미노산 위치 사이에 S가 삽입되지 않고 바람직하게는 아미노산 삽입을 가지지 않는다.
다른 구현예에서, 아데노벡터는 또한(즉, 헥손 및 가능하게는 펜톤 및/또는 섬유 단백질 다음에) 서열 번호 1219의 뉴클레오타이드 10724 내지 10897에 따른 뉴클레오타이드 서열을 포함하는 VA RNA II 비-암호화 RNA, 또는 적어도 85% 서열 동일성을 갖는 뉴클레오타이드 서열의 변이체를 암호화한다. 대안적으로 또는 추가로, 이는 서열 번호 1219의 뉴클레오타이드 10492 내지 10659에 따른 뉴클레오타이드 서열, 또는 적어도 85% 서열 동일성을 갖는 뉴클레오타이드 서열의 변이체를 포함하는 VA RNA I 비-암호화 RNA를 암호화할 수 있다. 바람직한 구현예에서, VA RNA 변이체는 적어도 90%, 및 바람직하게는 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는다. 서열 동일성의 백분율 수준에 의한 정의의 대안으로서, VA RNA 변이체는 특정 수의 뉴클레오타이드 돌연변이를 갖는 것으로 정의될 수 있다. 이후 돌연변이의 수는 다음과 같다: 적어도 85% 서열 동일성 대신에, VA RNA I내 25개 이하의 돌연변이 및 VA RNA II내 26개 이하의 돌연변이; 적어도 90% 서열 동일성 대신에, VA RNA I내 16개 이하의 돌연변이 및 VA RNA II내 17개 이하의 돌연변이; 적어도 95% 서열 동일성 대신에, 임의의 VA RNA내 8개 이하의 돌연변이; 적어도 96% 서열 동일성 대신에, 임의의 VA RNA내 6개 이하의 돌연변이; 적어도 97% 서열 동일성 대신에, 임의의 VA RNA내 5개 이하의 돌연변이; 적어도 98% 서열 동일성 대신에, 임의의 VA RNA내 3개 이하의 돌연변이; 적어도 99% 서열 동일성 대신에, 임의의 VA RNA내 1개 이하의 돌연변이.
바람직하게는, VA RNA II 변이체는 (a) 79번 위치에서 C를 가지지 않고/않거나 80번 위치에서 A를 가지지 않고, 바람직하게는 79번 위치에서 T를 가지고/가지거나 80번 위치에서 G를 가지며, (b) 81번 위치에서 A를 가지지 않고, 바람직하게는 81번 위치에서 G를 가진다. VA RNA I 변이체는 바람직하게는 80번 위치에서 G를 가지지 않고 바람직하게는 80번 위치에서 A를 갖는다.
본 발명에 따른 VA RNA는 개선된 아데노바이러스 생산을 야기한다.
아데노벡터가 다른 아데노바이러스 유전자 및 뉴클레오타이드 분절을 추가로 포함하는 것이 바람직하며, 이는 참고로서 서열 번호 1219를 사용한 아데노바이러스 게놈내 헥손, 펜톤 및/또는 섬유 유전자와 인접한다. 아데노벡터는 또한 폴리뉴클레오타이드를 아데노바이러스 입자내로 패키징(packaging)하는데 필요한 서열을 포함하는 것이 특히 바람직하다.
일반적으로, 아데노벡터는 다음 중 적어도 하나를 포함한다:
(a) 아데노바이러스 5'-말단, 바람직하게는 아데노바이러스 5' 역위된 말단 반복체;
(b) 아데노바이러스 Ela 영역, 또는 13S, 12S 및 9S 영역 중에서 선택된 이의 단편;
(c) 아데노바이러스 Elb 영역, 또는 작은(small) T, 큰(large) T 및 IX 영역으로 이루어진 그룹 중에서 선택된 이의 단편;
(d) 아데노바이러스 VA RNA 영역; 또는 VA RNA I 및 VA RNA II 영역으로 이루어진 그룹 중에서 선택된 이의 단편;
(e) 아데노바이러스 E2b 영역; 또는 작은 pTP, 폴리머라제 및 IVa2 영역으로 이루어진 그룹 중에서 선택된 이의 단편;
(f) 아데노바이러스 L1 영역, 또는 이의 단편으로서, 상기 단편은 28.1 kD 단백질, 폴리머라제, 아그노단백질(agnoprotein), 52/55 kDa 단백질, 및 IIIa 단백질로 이루어진 그룹으로부터 선택된 아데노바이러스 단백질을 암호화하는 단편;
(g) 아데노바이러스 L2 영역, 또는 이의 단편으로서, 상기 단편은 상기 정의한 바와 같은 펜톤 단백질, VII, V, 및 X 단백질로 이루어진 그룹으로부터 선택된 아데노바이러스 단백질을 암호화하는 단편;
(h) 아데노바이러스 L3 영역, 또는 이의 단편으로서, 상기 단편은 VI 단백질, 상기 정의한 바와 같은 헥손 단백질, 및 엔도프로테아제로 이루어진 그룹으로부터 선택된 아데노바이러스 단백질을 암호화하는 단편;
(i) 아데노바이러스 E2a 영역, 또는 이의 단편으로서, 상기 단편은 DBP 단백질로 이루어진 아데노바이러스 단백질을 암호화하는 단편;
(j) 아데노바이러스 L4 영역, 또는 이의 단편으로서, 상기 단편은 100 kD 단백질, 22 kD 동족체, 33 kD 동족체, 및 단백질 VIII로 이루어진 그룹으로부터 선택된 아데노바이러스 단백질을 암호화하는 단편;
(k) 아데노바이러스 E3 영역, 또는 E3 ORF1, E3 ORF2, E3 ORF3, E3 ORF4, E3 ORF5, E3 ORF6, E3 ORF7, E3 ORF8 및 E3 ORF9로 이루어진 그룹으로부터 선택된 이의 단편;
(l) 아데노바이러스 L5 영역, 또는 이의 단편으로서, 상기 단편은 상기 정의된 바와 같은 섬유 단백질을 암호화하는 단편;
(m) 아데노바이러스 E4 영역, 또는 E4 ORF6/7, E4 ORF6, E4 ORF5, E4 ORF4, E4 ORF3, E4 ORF2, 및 E4 ORF1로 이루어진 그룹으로부터 선택된 이의 단편;
(n) 아데노바이러스 3'-말단, 바람직하게는 아데노바이러스 3' 역위된 말단 반복체; 및/또는
(o) 아데노바이러스 E1 영역.
이러한 성분은 서열 번호 1219에 따른 동일한 아데노바이러스로부터, 또는 상이한 아데노바이러스로부터, 특히 상이한 종 중 하나, 예컨대, 사람 아데노바이러스로부터 유래되어 키메라 아데노바이러스를 형성할 수 있다.
아데노벡터의 일부 구현예에서, 이것이 상기 요약한 바와 같이((a) 내지 (m)에서와 같이) 하나 이상의 게놈성 영역을 포함하지 않는 것이 바람직할 수 있다. 특히, 이는 E1, E3 및/또는 E4 영역을 포함하지 않을 수 있고/있거나 적어도 하나의 유전자가 비-작용성이 되도록 하는 결실 및/또는 돌연변이를 포함하는 아데노바이러스 유전자를 포함한다. 이러한 바람직한 구현예에서, 적합한 아데노바이러스 영역은 변형되어 전술한 영역(들)/유전자(들)을 포함하지 않거나 선택된 영역(들)/유전자(들)이 비-작용성이도록 한다. 이들을 비-작용성이 되도록 하는 한가지 가능성은 하나 이상의 인공 정지-코돈(예컨대, TAA)을 이러한 유전자의 개방 판독 프레임 내로 도입시키는 것이다. 바이러스가 복제-결함성이 되도록 하는 방법은 당해 분야에 잘 알려져 있다(참고: 예컨대, Brody et al, 1994 Ann NY Acad Sci., 716: 90-101). 결실은 바람직하게는 발현 카세트 내에, 예를 들면, 미니유전자 카세트(minigene cassette)내에 전이유전자를 삽입시킬 공간을 만들 수 있다. 또한, 결실을 사용하여 당해 분야에 잘 공지된 바와 같은 패키징 세포주 또는 헬퍼 바이러스를 사용하지 않고 복제할 수 없는 아데노바이러스 벡터를 생성할 수 있다. 하나 이상의 규정된 유전자/영역 결실 또는 기능의 손실(loss-of-function) 돌연변이를 포함하는 이러한 재조합체 아데노바이러스는 예컨대, 유전자 치료요법 또는 백신접종을 위한 보다 안전한 재조합 아데노바이러스를 제공할 수 있다.
아데노벡터는 본원에 요약된 바와 같은 적어도 하나의 게놈성 영역/유전자(예를 들면, 영역 E1, E3 및/또는 E4과 같은), 구체적으로 E1A, E1B, E2A, E2B, E3 ORF1, E3 ORF2, E3 ORF3, E3 ORF4, E3 ORF5, E3 ORF6, E3 ORF7, E3 ORF8, E3 ORF9, E4 ORF6/7, E4 ORF6, E4 ORF5, E4 ORF4, E4 ORF3, E4 ORF2 및/또는 E4 ORF1, 바람직하게는 E1A, E1B, E2A, E2B, E3 및/또는 E4를 포함하지 않을 수 있고/있거나 적어도 하나의 유전자가 비-작용성이도록 하는 결실 및/또는 돌연변이를 포함하는 아데노바이러스 유전자를 포함하지만, 완전한 Ela 및/또는 Elb 영역을 보유하는 것이 바람직하다. 이러한 완전한 El 영역은 아데노바이러스 게놈내에서 이의 천연 위치에 위치할 수 있거나 천연의 아데노바이러스 게놈내(예컨대, E3 영역내)에서 결실 부위에 위치할 수 있다.
바람직한 구현예에서, 아데노벡터는 다음의 아데노바이러스 단백질 중 하나 이상, 바람직하게는 모두를 추가로 암호화한다: 단백질 VI, 단백질 VIII, 단백질 IX, 단백질 IIIa 및 단백질 IVa2.
아데노바이러스의 분야에서 평균 기술자는 상술한 아데노바이러스 단백질을 암호화하는 개방 판독 프레임을 결정하기 위한 방법을 잘 알고 있다. 기술자는 또한 아데노바이러스 게놈의 구조를 알고 있으며 과도한 부담없이 본원에 요약된 개개의 아데노바이러스 영역 및 ORF를 임의의 아데노바이러스 게놈으로 맵핑할 수 있다.
용어 "헥손 단백질"은 아데노바이러스내에 포함된 헥손(II) 단백질을 지칭한다. 본 발명에 따른 헥손 단백질 또는 이의 변이체는 감염성 아데노바이러스 비리온내에서 헥손 단백질 또는 이의 단편과 동일한 작용을 갖는다. 따라서, 바람직하게는 캡시드 단백질로서 상기 헥손 또는 이의 변이체를 포함하는 아데노바이러스는 숙주 세포로 도입될 수 있다. 헥손 단백질의 변이체를 생성하기에 적합한 방법은 미국 특허 제5,922,315호에 기술되어 있다. 이러한 방법에서, 아데노바이러스의 적어도 하나의 루프 영역은 다른 아데노바이러스 혈청형의 적어도 하나의 루프 영역으로 변화된다. 이는 재조합 아데노바이러스가 숙주 세포내로 도입되는 경우 용이하게 결정될 수 있다. 예를 들면, 숙주 세포를 아데노바이러스와 접촉시킨 후, 재조합체 숙주 세포를 세척하고 분해하며 아데노바이러스 RNA 및/또는 DNA가 예컨대, 아데노바이러스 RNA 및/또는 DNA에 대해 특이적인 적절한 하이브리드화 프로브를 사용함에 의해 숙주 세포내에서 발견되는지의 여부를 결정할 수 있다. 대안적으로 또는 추가로, 재조합체 아데노바이러스와 접촉된 후 세포를 세척하고, 분해하며 아데노바이러스 특이적인 항체, 예컨대 웨스턴 블롯(Western blot)을 사용하여 프로브(probing)할 수 있다. 여전히 또 다른 대안에서, 예컨대, 생체내에서 숙주 세포가 숙주 세포내에서 유전자 생성물을 발현하는데 적합한 발현 카세트를 포함하는 재조합체 아데노바이러스를 사용한 감염시 유전자 생성물, 예를 들면, 형광성 단백질을 발현하는지의 여부가 관찰된다.
용어 "초가변 영역"(HVR)은 바이러스 캡시드 밖에 노출되므로, 헥손 단백질의 용매-노출된 표면에 위치한, 고 서열 변이를 지닌 도메인을 지칭한다. 이들은 중화 항체의 주요 결정인자이다. HVR은 예를 들면, 다른 헥손 단백질과의 서열 정렬에 의해 확인될 수 있다.
"아데노바이러스 펜톤 단백질"은 아데노바이러스내에 포함된 펜톤 염기(III) 단백질을 지칭한다. 아데노바이러스 펜톤 단백질은 이것이 캡시드의 정20면체 대칭의 모서리에 위치함을 특징으로 한다. 본 발명에 따른 펜톤 단백질 또는 이의 변이체는 감염성 아데노바이러스 비리온내에서 펜톤 단백질과 동일한 작용을 갖는다. 따라서, 바람직하게는 캡시드 단백질로서 상기 펜톤 또는 이의 변이체를 포함하는 아데노바이러스는 숙주 세포를 도입시킬 수 있으며, 이는 상술한 바와 같이 시험할 수 있다. 또한, 작용성 펜톤은 아데노바이러스 섬유 단백질에 대한 친화성을 갖는다. 평균적인 기술자는 단백질-단백질 친화성을 시험하는 방법을 잘 알고 있다. 제1의 단백질이 제2 단백질을 결합시킬 수 있는지를 결정하기 위하여, 기술자는 예를 들면, 유전적 효모 2개의 하이브리드 검정 또는 생화학적 검정, 예를 들면, 풀-다운(pull-down), 효소-연결된 면역흡수성 검정(ELISA), 형광성-활성화된 세포 분류(FACS)-기반한 검정 또는 플라스몬 공명 검정을 사용할 수 있다. 풀-다운 또는 플라스몬 공명 검정을 사용하는 경우, 적어도 하나의 단백질을 생화학 분야에 잘 알려져 있는 바와 같이, 친화성 tag, 예를 들면, HIS-tag, GST-tag 또는 기타에 융합시키는데 유용하다.
용어 "섬유 단백질"은 아데노바이러스에 포함된 놉베드 섬유(knobbed fiber) (IV) 단백질을 지칭한다. 본 발명에 따른 섬유 단백질 또는 이의 변이체는 감염성 아데노바이러스 비리온내에서 섬유 단백질 또는 이의 단편과 동일한 작용을 갖는다. 따라서, 바람직하게는 캡시드 단백질로서 상기 섬유 또는 섬유 변이체를 포함하는 아데노바이러스는 숙주 세포로 도입할 수 있으며, 이는 상술한 바와 같이 시험할 수 있다. 또한, 작용성 섬유 단백질은 아데노바이러스 펜톤 단백질에 대한 친화성을 갖는다. 또한, 이의 글리코실화된 형태에서 작용성 아데노바이러스 섬유 단백질은 삼량체화(trimerizing)될 수 있다. 따라서, 변이체는 글리코실화되고/되거나 삼량체를 형성할 수 있음이 바람직하다. 친화성, 예를 들면, 삼량체화는 상술한 바와 같이 시험할 수 있으며, 글리코실화 검정은 또한 당해 분야에 잘 공지되어 있다.
"VA(바이러스 관련된) RNA"는 아데노바이러스에서 발견된 비-암호화 유형이다. 이는 번역을 조절하는 데 있어 역할을 담당한다. VAI 또는 VA RNA I 및 VAII 또는 VA RNA II로 불리는 이러한 RNA의 2개의 카피가 존재한다. 2개의 VA RNA 유전자는 아데노바이러스 게놈내에 명백한 유전자이다. VA RNA I은 보다 낮은 수준으로 발현된 VA RN AII를 지닌 주요 종이다. 전사체는 폴리아데닐화되지 않으며 둘 다 PolIII에 의해 전사된다.
폴리뉴클레오타이드, 폴리펩타이드 또는 단백질 서열의 맥락에서 용어 "동일성" 또는 "동일한"은 최대의 상응성으로 정렬되는 경우 동일한 2개의 서열내에 다수의 잔기를 지칭한다. 구체적으로, 2개의 서열의 서열 동일성 퍼센트는 핵산 또는 아미노산 서열에 상관없이, 보다 짧은 서열의 길이로 나누고 100을 곱한 2개이 정렬된 서열 사이의 정확한 매치의 수이다. 2개의 서열을 정렬하는데 사용될 수 있는 정렬 도구는 당해 분야의 기술자에게 잘 공지되어 있으며 예를 들면, World Wide Web, 예컨대, 폴리펩타이드 정렬의 경우 Clustal Omega(http://www.ebi.ac.uk/Tools/msa/clustalo/) 또는 폴리뉴클레오타이드 정렬의 경우 MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) 또는 MAFFT (http://www.ebi.ac.uk/Tools/msa/ mafft/) 또는 폴리뉴클레오타이드 및 폴리펩타이드 정렬의 경우 WATER (http://www.ebi.ac.uk/Tools/psa/ emboss_water/)에서 수득할 수 있다. 2개의 서열 사이의 정렬은 디폴트 매개변수 설정(default parameters setting)을 사용하여 수행할 수 있는데, 예컨대, 예컨대, MAFFT의 경우 바람직하게는: Matrix: Blosum62, Gap Open 1.53, Gap Extend 0.123, WATER 폴리뉴클레오타이드의 경우 바람직하게는: MATRIX: DNAFULL, Gap Open: 10.0, Gap Extend 0.5 및 WATER 폴리펩타이드의 경우 바람직하게는 MATRIX: BLOSUM62, Gap Open: 10.0, Gap Extend: 0.5을 사용하여 수행할 수 있다. 당해 분야의 기술자는 만족스러운 정렬을 생산하기 위해 서열내에 갭을 도입하는데 필수적일 수 있음을 이해한다. "가장 우수한 서열 정렬"은 최소의 수의 갭을 가지지만 최대 수의 정렬된 동일한 잔기를 생산하는 정렬로서 정의된다. 바람직하게는, 이는 포괄정인 정렬이며, 이는 정렬내에 모든 서열내에 모든 잔기를 포함한다.
용어 "변이체"는 폴리펩타이드와 관련하여, 일반적으로 폴리펩타이드의 변형된 버젼, 예컨대, 돌연변이를 지칭하므로, 폴리펩타이드의 하나 이상 아미노산은 결실되고/되거나, 삽입되고/되거나, 변형되고/되거나 치환된다. 일반적으로, 변이체는 작용성이며, 이는 작용성 변이체를 포함하는 아데노바이러스가 숙주 세포를 감염시킬 수 있음을 의미한다. 보다 구체적인 작용이 본원에 정의되어 있으며 일반적인 정의에 우선한다. "돌연변이" 또는 "아미노산 돌연변이"는 아미노산 치환, 결실 및/또는 삽입일 수 있다("및" 하나 이상의 돌연변이가 존재할 경우 적용할 수 있다). 바람직하게는, 이는 치환(즉, 보존적 또는 비-보존적 아미노산 치환), 보다 바람직하게는 보존적 아미노산 치환이다. 일부 구현예에서, 치환은 또한 천연적으로 존재하는 아미노산의 천연적으로 존재하지 않는 아미노산으로의 교환을 포함한다. 보존적인 치환은 아미노산의 치환된 아미노산과 유사한 화학적 특성을 갖는 다른 아미노산으로의 치환을 포함한다. 바람직하게는, 보존적 치환은 다음으로 이루어진 그룹으로부터 선택된 치환이다:
(i) 염기성 아미노산의 다른, 상이한 염기성 아미노산으로의 치환;
(ii) 산성 아미노산의 다른, 상이한 산성 아미노산으로의 치환;
(iii) 방향족 아미노산의 다른, 상이한 방향족 아미노산으로의 치환;
(iv) 비-극성의, 지방족 아미노산의 다른, 상이한 비-극성의, 지방족 아미노산으로의 치환; 및
(v) 극성의 하전되지 않은 아미노산의 다른, 상이한 극성의, 하전되지 않은 아미노산으로의 치환.
염기성 아미노산은 바람직하게는 아르기닌, 히스티딘, 및 라이신으로 이루어진 그룹으로부터 선택된다. 산성 아미노산은 바람직하게는 아스파르테이트 또는 글루타메이트이다. 방향족 아미노산은 바람직하게는 페닐알라닌, 타이로신 및 트립토판으로 이루어진 그룹으로부터 선택된다. 비-극성의, 지방족 아미노산은 바람직하게는 글리신, 알라닌, 발린, 루이신, 메티오닌 및 이소루이신으로 이루어진 그룹으로부터 선택된다. 극성의 하전되지 않은 아미노산은 바람직하게는 세린, 트레오닌, 시스테인, 프롤린, 아스파라긴 및 글루타민으로 이루어진 그룹으로부터 선택된다. 보존적 아미노산 치환과는 대조적으로, 비-보존적 아미노산 치환은 하나의 아미노산의 위에 요약한 보존적 아미노산 (i) 내지 (v)에 속하지 않는 임의의 아미노산으로의 치환이다.
서열 동일성을 결정하기 위한 수단은 상기에 기술되어 있다.
단백질의 아미노산은 또한 변형될 수 있는데, 예컨대, 화학적으로 변형될 수 있다. 예를 들면, 단백질 또는 폴리펩타이드의 아미노산의 측쇄 또는 유리 아미노 또는 카복시-말단은 예컨대, 글리코실화, 아미드화, 포스포릴호, 유비퀴틴화(ubiquitination) 등에 의해 변형될 수 있다. 화학적 변형은 또한 당해 분야에 잘 공지된 바와 같이, 생체내, 예컨대, 숙주-세포내에서 일어날 수 있다. 예를 들면, 적합한 화학적 변형 모티프, 예컨대, 단백질의 아미노산 서열내에 존재하는 글리코실화 서열 모티프는 단백질을 글리코실화시킬 수 있을 것이다. 변형이 변형된 아미노산의 동일성내에서 변화(예컨대, 치환 또는 결실)를 유발하지 않는 한, 변형된 폴리펩타이드는 언급된 폴리펩타이드의 영역내에 있는데, 즉, 이는 본원에 정의된 바와 같은 변이체가 아니다.
용어 "변이체"는 폴리뉴클레오타이드와 관련하여, 일반적으로 폴리뉴클레오타이드의 변형된 버젼, 예컨대, 돌연변이를 지칭하므로, 폴리뉴클레오타이드의 하나 이상의 뉴클레오타이드는 결실되고/되거나, 삽입되고/되거나, 변형되고/되거나 치환된다. 일반적으로, 변이체는 작용성이며, 이는 작용성 변이체를 포함하는 아데노바이러스가 숙주 세포를 감염시킬 수 있음을 의미한다. 보다 구체적인 작용이 본원에 정의되어 있으며 일반적인 정의에 걸쳐 우선한다. "돌연변이"는 뉴클레오타이드 치환, 결실 및/또는 삽입("및" 하나 이상의 돌연변이가 존재하는 경우 적용할 수 있다)일 수 있다. 바람직하게는, 이는 치환이며, 보다 바람직하게는 이는 아미노산 치환, 가장 바람직하게는 보존적 아미노산 치환을 유발한다.
일반적으로, 발현 벡터의 수집의 모든 발현 벡터, 즉, 각각의 CVP의 모든 FSP, mFSP 및 이의 항원성 단편을 암호화하는 핵산을 포함하는 발현 벡터의 수집물은 하나의 유형, 예컨대, 복제 가능한 아데노바이러스인 것이 바람직하다. 동일한 CVP 또는 이를 암호화하는 핵산의 상이한 레이아웃이 사용되는 본 발명의 구현예에서, 각각의 레이아웃은 발현 벡터의 별도의 수집물 속에 포함될 것이다. 따라서, 각각의 레이아웃은 동일한 발현 벡터 또는 상이한 발현 벡터 내에 포함될 수 있다. 후자는 발현 벡터 자체가 환자에서 항원성인 예에서 바람직하다. 따라서, 바람직하게는 상이한 레이아웃에서, 동일한 CVP의 2회 이상의 반복된 투여 사이에 발현 벡터의 유형의 변화는 환자내에서 CVP가 발현되는 기회를 증가시킨다.
본 발명은 또한 의약으로 사용하기 위한 본 발명의 제4 또는 제5 양태의 CVP, 본 발명의 제4 또는 제6 양태의 핵산의 수집물, 또는 본 발명의 제7 양태의 발현 벡터 수집물에 관한 것이다.
본 발명은 또한 본 발명의 제4 또는 제5 양태의 CVP, 본 발명의 제4 또는 제6 양태의 핵산의 수집물, 또는 본 발명의 제7 양태의 발현 벡터 수집물을 포함하는 약제학적 조성물에 관한 것이다.
동일한 CVP의 상이한 레이아웃, 동일한 CVP의 이러한 상이한 레이아웃을 암호화하는 핵산 또는 상이한 레이아웃을 지닌 이러한 핵산을 포함하는 발현 벡터를 동종 또는 이종 프라임-부스트 투여 요법에서 사용하는 경우에(하기 참고) 용어 "약제학적 조성물"은 또한 동일한 CVP, 동일한 CVP의 이러한 상이한 레이아웃을 암호화하는 핵산 또는 상이한 레이아웃을 지닌 이러한 핵산을 포함하는 발현 벡터의 별도의 투여를 허용하는 2개의 물리적으로 분리된 조성물을 포함한다.
바람직한 구현예에서 약제학적 조성물은 약제학적으로 허용되는 담체 및/또는 부형제 및 임의로 하나 이상의 추가의 활성 물질을 추가로 포함한다. 바람직하게는, 제5 양태의 조성물은 바람직하게는 정제된 형태의 치료학적 유효량의 화합물과 함께, 적합한 양의 담체 및/또는 부형제를 함유함으로서 환자에게 적절한 투여를 제공한다. 제형은 투여 방식에 적합하여야 한다.
약제학적 조성물은 액체, 현탁제, 유제, 정제, 환제, 캅셀제, 산제, 지속-방출 제형 등의 형태를 취할 수 있다. 약제학적 조성물은 전통적인 결합제 및 담체, 예를 들면 트리글리세라이드와 함께, 좌제로서 제형화될 수 있다.
본 발명의 약제학적 조성물을 제조하기 위하여, 약제학적으로 허용되는 담체는 고체 또는 액체일 수 있다. 고체형 조성물은 산제, 정제, 환제, 캅셀제, 로젠지제, 좌제, 및 분산성 과립제를 포함한다. 고체 부형제는 하나 이상의 물질일 수 있으며, 이는 또한 희석제, 풍미제, 결합제, 방부제, 정제 붕해제, 또는 캅셀화 물질로서 작용할 수 있다. 산제에서, 부형제는 바람직하게는 미분 고체이며, 이는 본 발명의 미분된 억제제와의 혼합물로 존재한다. 정제에서, 활성 성분은 필수 결합 특성을 갖는 담체와 적합한 비율로 혼합되어 목적한 형태 및 크기로 압축될 수 있다. 적합한 부형제는 탄산마그네슘, 스테아르산마그네슘, 활석, 당, 락토즈, 펙틴, 덱스트린, 전분, 젤라틴, 트라가칸트, 메틸셀룰로즈, 나트륨 카복시메틸셀룰로즈, 저 융점 왁스, 코코아 버터 등이다. 좌제를 제조하기 위하여, 저 융점 왁스, 예를 들면, 지방산 글리세라이드 또는 코코아 버터의 혼합물을 우선 용융시키고 활성 성분을 이에 교반에 의해서 균질하게 분산시킨다. 용융된 균질 혼합물을 이후 편리한 크기의 주형에 부어서, 냉각되도록 함으로써, 고화시킨다. 정제, 산제, 캅셀제, 환제, 카쉐제(cachet), 및 로젠지제(lozenge)를 경구 투여에 적합한 고체 용량형으로 사용할 수 있다.
액체형 조성물은 액제, 현탁제 및 유제, 예를 들면, 물, 염수 용액, 수성 덱스트로즈, 글리세롤 용액 또는 물/프로필렌 글리콜 용액을 포함한다. 비경구 주사(예컨대, 피내, 동맥내, 골내 주입, 근육내, 피하, 경피내, 피내, 및 척추강내 주사)의 경우, 액제 제제는 예컨대, 수성 프로필렌 글리콜 용액 속에 용액으로 제형화될 수 있다. 염수 용액은 약제학적 조성물이 정맥내 투여되는 경우 바람직한 담체이다.
바람직하게는, 약제학적 조성물은 단위 투여량 향태이다. 이러한 형태에서 조성물은 활성 구성성분의 적절한 양을 함유하는 단위 투여량으로 소분될 수 있다. 단위 투여량 형태는 포장된 조성물일 수 있으며, 포장은 별개의 양의 조성물, 예를 들면, 포장된 정제, 캅셀제, 및 산제를 바이알 또는 앰플 속에 함유한다. 또한, 단위 투여형은 캅셀제, 주사 바이알, 정제, 카쉐제, 또는 로젠지제 자체일 수 있거나, 이는 포장된 형태의 이들 중 임의의 적절한 수일 수 있다.
조성물은, 경우에 따라, 또한 소량의 습윤제 또는 유화제, 또는 pH 완충제를 함유할 수 있다.
또한, 이러한 약제학적 조성물은 또한 부형제 및/또는 추가의 할성 성분과 같은 그러나 이에 한정되지 않는 다른 약리학적으로 활성인 물질을 포함할 수 있다. 본 발명의 문맥에서 보조제는 무기 보조제, 유기 보조제, 오일계 보조제, 사이토킨, 입자화된 보조제, 비로솜, 세균 보조제, 합성 보조제, 또는 합성 폴리뉴클레오타이드 보조제를 포함하나, 이에 한정되지 않는다.
제8 국면에서, 본 발명은 MSI 표현형을 지닌 암 세포를 포함하거나 이러한 암으로 진행될 위험이 있는 환자의 치료 또는 예방에 사용하기 위한 제4 또는 제5 양태의 CVP, 본 발명의 제4 또는 제6 양태의 핵산의 수집물, 또는 본 발명의 제7 양태의 발현 벡터 수집물에 관한 것이며, 여기서 암은 바람직하게는 결장직장 암, 위암, 자궁내막 암, 소장 암, 간담즙성 관 암, 간 암, 신경내분비 암, 자궁경부 암, 난소 암, 자궁 육종, 뇌 암 및 피부 암으로 이루어진 그룹으로부터 바람직하게 선택된다.
상기 요약한 바와 같이 본 발명의 범용 백신의 하나의 특수한 장점은 이것이 단지 하나 이상의 암 유형의 예방 또는 치료요법을 제공한다는 사실이다. 따라서, 제8 양태에 따라서 2개 유형의 MSI 암, 보다 바람직하게는 적어도 3개 유형의 MSI 암에 대한 예방 또는 치료요법을 제공하는 것이 바람직하다. 바람직하게는, 결장직장 암, 위암, 자궁내막 암, 소장 암, 간담즙성 관 암, 간 암, 신경내분비 암, 자궁경부 암, 난소 암, 자궁 육종, 뇌 암 및 피부 암.
예방은 본 발명의 문맥에서 바람직하게는 미스매치 복구 시스템(MMR), 예를 들면, MLH-1, MSH-2, MSH-6, PMS2 및 TACSTD1/EPCAM에 관여하는 유전자에 배선 돌연변이를 지닌 환자를 포함하는, 임상 가이드라인에 따른 MSI 암 발생 위험이 있는 것으로 알려진 환자를 위한 것이다. 치료는 가장 최근의 임상 가이드라인에 따른 MSI 상태의 진단 후 임의의 조직내에서 발생하는, 모든 단계(I 내지 IV)에서의 암을 지닌 환자를 위한 것이다. 이러한 백신의 용도는 자발적으로 또는 약리학적으로 유도될 수 있는 MSI 상태를 지닌 암의 치료를 위해 의도된다.
많은 경우에, CVP의 단일 투여는 종양 질환의 효과적인 보호 또는 종양 질환을 치료학적으로 치료하는 데 필요한 다수의 장기-지속하는 면역 세포를 생성하는 데 충분하지 않다. 결과적으로, 특수한 질환에 특이적인 생물학적 제제를 사용한 반복된 챌린지(challenge)는 상기 질환에 대한 지속된 및 보호 면역성을 확립하거나 주어진 질환을 치유하기 위해 요구된다. CVP, 이러한 CVP를 암호화하는 핵산의 수집물 또는 이러한 핵산을 포함하는 발현 벡터의 수집물의 반복된 투여를 포함하는 투여 요법은 "프라임-부스트 백신접종 요법"으로서 현재 지칭된다. 바람직하게는, 프라임-부스트 백신접종 요법은 CVP의 적어도 2회 투여, 이러한 CVP를 암호화하는 핵산의 수집물 또는 이러한 핵산을 포함하는 발현 벡터의 수집물을 포함한다. CVP, 이러한 CVP를 암호화하는 핵산의 수집물 또는 이러한 핵산을 포함하는 발현 벡터의 수집물의 제1 투여는 "프라이밍(priming)"으로 지칭되며 동일한 CVP, 이러한 CVP를 암호화하는 핵산의 수집물 또는 이러한 핵산을 포함하는 발현 벡터의 수집물의 투여는 "부스팅(boosting)"으로 지칭된다. 상기 설명으로부터 동일한 CVP가 그럼에도 불구하고 CVP, 이러한 CVP를 암호화하는 핵산의 수집물 또는 이러한 핵산을 포함하는 발현 벡터의 수집물의 각각의 후속적인 투여시 상이한 레이아웃으로 투여될 수 있음이 이해된다.
따라서, 본 발명의 바람직한 구현예에서, 프라임-부스팅 백신접종 요법은 면역 반응을 프라이밍하기 이러한 CVP, 이러한 CVP를 암호화하는 핵산의 수집물 또는 이러한 핵산을 포함하는 발현 벡터의 수집물의 1회 투여 및 면역 반응을 부스팅하기 위한 적어도 하나의 후속적인 투여를 포함한다. 면역 반응을 부스팅하기 위한 2, 3, 4 또는 심지어 5회 투여가 본 발명에 의해 고려됨이 이해되어야 한다.
프라임과 부스트 사이의 기간은 바람직하게는, 1주, 2주, 4주, 6주 또는 8주이다. 보다 바람직하게는, 이는 4주 또는 8주이다. 1회 이상의 부스트를 수행하는 경우, 후속적인 부스트는 바람직하게는, 이전 부스트 후 1주, 2주, 4주, 6주 또는 8주째에 투여된다. 보다 바람직하게는, 임의의 2개의 부스트 사이의 간격은 4주 또는 8주이다.
본 발명의 프라임-부스트 백신접종 요법은 동종 또는 이종일 수 있다. 동종 프라임-부스트 요법에서 프라이밍 및 적어도 하나의 부스팅 둘 다는 CVP, 이러한 CVP를 암호화하는 핵산의 수집물 또는 이러한 핵산을 포함하는 발현 벡터의 수집물의 투여의 동일한 수단을 사용하여 수행된다. 이종 프라임-부스팅 요법에서 이종 프라임-부스팅 요법은 예를 들면, 면역 반응의 프라이밍을 위한 폭스바이러스 벡터 및 면역 반응의 부스팅을 위한 상이한 발현 벡터 또는 CPV를 포함한다.
본 발명의 하나의 바람직한 구현예에서, 프라임-부스팅 백신접종 요법은 동종이며 본 발명의 다른 바람직한 구현예에서 프라임-부스팅 백신접종 요법은 이종이다.
따라서, 일 양태에서, 본 발명은 MSI 표현형을 지닌 암 세포를 포함하는 암을 지니거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료에 사용하기 위한 본 발명의 제4 또는 제6 양태의 핵산의 수집물 및/또는 본 발명의 제7 양태의 발현 벡터 수집물에 관한 것이며, 여기서 핵산의 수집물 및/또는 발현 벡터 수집물은 이종 프라임-부스트 백신접종 계획에서 투여되며, 바람직하게는 프라임은 아데노바이러스 벡터를 사용하고 하나 이상의 부스트는 폭스바이러스 벡터, 바람직하게는 MVA 벡터를 사용한다.
실시예
실시예 1: MSI 종양 샘플의 단백질-암호화 유전자내 모노뉴클레오타이드 반복체(MNR) 돌연변이의 선택
전체 진유전체 서열 데이터(발표일: 2016년 10월 4일)를 기반으로 하며 TCGA 데이터 포탈(https://gdc-portal.nci.nih.gov/)로부터 이용가능한 돌연변이 주석 양식(Mutation Annotation Format: MAF) 파일을, 단백질-암호화 유전자의 진유전체(exome)의 단백질-암호화 분절 내에 위치한 6개 이상의 뉴클레오타이드의 MNR 내의 프레임쉬프트 돌연변이(FSM)의 존재에 대해 분석하였다. TCGA 샘플 주석 데이터에 정의된 바와 같은 MSI 표현형을 지닌 종양만을 분석 시 고려했다. 이러한 그룹은 69개의 MSI-높은(MSI-H) 결장직장암(CRC), 85개의 MSI 위암 및 166개의 MSI 자궁내막암(EC)에 해당하는, 총 320개의 종양 샘플 및 정상 대조군 샘플을 포함하였다. 제2의 필터링(filtering) 단계에서, 1개의 뉴클레오타이드 결실로부터 유래된 FSM 만을 허용하였는데, 이는 이러한 유형의 FSM이 CRC 및 EC 종양에서 가장 흔히 관찰되기 때문이다(1). 수득되는 목록은 다음의 기준을 충족하는 FSM 만을 허용함으로써 추가로 개선하였다: (i) 돌연변이를 지닌 판독물(read)의 수는 매치된 정상 샘플과 비교하여 종양에서 유의적으로 더 높았다(FDR-교정된 피셔-시험 p-값 ≤ 0.05); (ii) 매치된 정상 샘플에서 FSM의 대립유전자 빈도는 ≤ 25%이었다. 3개의 분석된 종양 유형(CRC, 위암, EC) 중 하나에서 종양 샘플 중 적어도 5%에서 존재하는 FSM 만을 보유함으로써 나머지 FSM를 추가로 필터링했다. 최종 선택 단계에서, 다음의 범주에 속하는 FSM는 백신에 부적절한 것으로 고려되어 배제시켰다: (i) 정상 샘플의 수집물로부터의 샘플 중 ≥ 2% 내에서의 FSM의 존재(EXAC 데이터베이스 http://exac.broadinstitute.org/) 및/또는 (ii) FSM-운반 유전자의 mRNA 발현(RSEM log2 발현 값)이, 모든 3개의 종양 형(CRC, EC 및 위암)을 고려하여, 모든 발현된 단백질-암호화 유전자(TCGA 유전자-수준 mRNA 발현 데이터)의 20 백분위수(percentile) 미만 값 내에 있었음. 이렇게 수득된 목록은 1283개의 FSM을 포함하였으며 이들 종양에 대한 CFSM을 나타낸다.
전체 진유전체 서열 데이터(발표일: 2016년 10월 4일)를 기반으로 하며 TCGA 데이터 포탈(https://gdc-portal.nci.nih.gov/)로부터 이용가능한 돌연변이 주석 양식(Mutation Annotation Format: MAF) 파일을, 단백질-암호화 유전자의 진유전체(exome)의 단백질-암호화 분절 내에 위치한 6개 이상의 뉴클레오타이드의 MNR 내의 프레임쉬프트 돌연변이(FSM)의 존재에 대해 분석하였다. TCGA 샘플 주석 데이터에 정의된 바와 같은 MSI 표현형을 지닌 종양만을 분석 시 고려했다. 이러한 그룹은 69개의 MSI-높은(MSI-H) 결장직장암(CRC), 85개의 MSI 위암 및 166개의 MSI 자궁내막암(EC)에 해당하는, 총 320개의 종양 샘플 및 정상 대조군 샘플을 포함하였다. 제2의 필터링(filtering) 단계에서, 1개의 뉴클레오타이드 결실로부터 유래된 FSM 만을 허용하였는데, 이는 이러한 유형의 FSM이 CRC 및 EC 종양에서 가장 흔히 관찰되기 때문이다(1). 수득되는 목록은 다음의 기준을 충족하는 FSM 만을 허용함으로써 추가로 개선하였다: (i) 돌연변이를 지닌 판독물(read)의 수는 매치된 정상 샘플과 비교하여 종양에서 유의적으로 더 높았다(FDR-교정된 피셔-시험 p-값 ≤ 0.05); (ii) 매치된 정상 샘플에서 FSM의 대립유전자 빈도는 ≤ 25%이었다. 3개의 분석된 종양 유형(CRC, 위암, EC) 중 하나에서 종양 샘플 중 적어도 5%에서 존재하는 FSM 만을 보유함으로써 나머지 FSM를 추가로 필터링했다. 최종 선택 단계에서, 다음의 범주에 속하는 FSM는 백신에 부적절한 것으로 고려되어 배제시켰다: (i) 정상 샘플의 수집물로부터의 샘플 중 ≥ 2% 내에서의 FSM의 존재(EXAC 데이터베이스 http://exac.broadinstitute.org/) 및/또는 (ii) FSM-운반 유전자의 mRNA 발현(RSEM log2 발현 값)이, 모든 3개의 종양 형(CRC, EC 및 위암)을 고려하여, 모든 발현된 단백질-암호화 유전자(TCGA 유전자-수준 mRNA 발현 데이터)의 20 백분위수(percentile) 미만 값 내에 있었음. 이렇게 수득된 목록은 1283개의 FSM을 포함하였으며 이들 종양에 대한 CFSM을 나타낸다.
삭제
실시예 2: 허용되는 특성을 지닌 프레임쉬프트 펩타이드의 목록의 선택
이어서 실시예 1에서 선택된 CFSM의 FSM 각각을, NCBI REFSEQ 데이터베이스로부터의 상응하는 mRNA 서열(또는 서열들) 위에 ANNOVAR(Wang K, et al. (2010) NAR, 38:e164)을 사용하여 맵핑하고, 야생형(wt) 및 수득되는 돌연변이된 mRNA 둘 다를 단백질로 번역시켰다. wt 및 돌연변이된 단백질의 비교에 의해 상응하는 프레임 쉬프트 펩타이드(FSP)의 아미노산(aa) 서열을 결정하였다. FSM이 다수의 mRNA 동형의 존재로 인하여, 상이한 길이 및/또는 aa 서열을 지닌 다수의 FSP를 생성한 경우, 모든 수득되는 FSP가 보유되었다. 수득되는 목록을 필터링하여 잠재적인 CD8 T 신생-에피토프를 수득할 수 없다는 점에서 4개의 aa보다 더 짧은 모든 FSP를 배제시켰다.
또한, CVP에 포함될 FSP의 아미노산 서열은 이들이 특정의 기준을 충족하는 경우 아미노산의 첨가 또는 결실에 의해 변형시켰다(또는 특정 기준을 충족하지 않는 FSP는 변형 후 배제시켰다): (i) FSP가 10개의 aa보다 더 짧은 경우, FC에 의해 암호화된 아미노산의 바로(immediately) N-말단 측에 자연 발생하는 4개의 wt aa을 FSP의 N-말단에 가하여 추정의 CD8 T 세포 신생-에피토프(8 내지 10mer)의 최소 길이에 이르는 펩타이드(이는, FSM이 없는 상응하는 야생형(wt) 핵산의 번역 생성물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈으로부터 시작되는, FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물이라고 본 발명의 문맥에서 정의되는 FSP와는 상이하므로 mFSP로서 지칭된다)를 보증한다. 동일한 FSM으로부터 유래되는 다수의 FSP 사이에 공유된 아미노산 스트레치(amino acid stretch)는 가장 긴 FSP에서만 보유되었는데, 즉, 보다 짧은 FSP에서 이러한 아미노산 스트레치가 결실되었다. 최종 단계에서, wt 사람 프로테옴(proteome)(NCBI REFSEQ 데이터베이스)내에 또한 존재하는 8개 이상의 연속된 아미노산(continuous amino acid)의 임의의 분절을 FSP로부터 제거하여 자가면역성을 유도할 위험성을 최소화하였다. wt 분절의 배제 후, 수득되는 FSP가 4개의 aa보다 짧은 경우, 이는 목록에서 제거하였다. 이렇게 수득된 FSP의 최종 그룹은 1059개의 FSM에 의해 암호화된 1087개의 아미노산 서열(서열 번호 1 내지 1087)을 포함하며(표 1) CVP로 지칭된다.
이어서 실시예 1에서 선택된 CFSM의 FSM 각각을, NCBI REFSEQ 데이터베이스로부터의 상응하는 mRNA 서열(또는 서열들) 위에 ANNOVAR(Wang K, et al. (2010) NAR, 38:e164)을 사용하여 맵핑하고, 야생형(wt) 및 수득되는 돌연변이된 mRNA 둘 다를 단백질로 번역시켰다. wt 및 돌연변이된 단백질의 비교에 의해 상응하는 프레임 쉬프트 펩타이드(FSP)의 아미노산(aa) 서열을 결정하였다. FSM이 다수의 mRNA 동형의 존재로 인하여, 상이한 길이 및/또는 aa 서열을 지닌 다수의 FSP를 생성한 경우, 모든 수득되는 FSP가 보유되었다. 수득되는 목록을 필터링하여 잠재적인 CD8 T 신생-에피토프를 수득할 수 없다는 점에서 4개의 aa보다 더 짧은 모든 FSP를 배제시켰다.
또한, CVP에 포함될 FSP의 아미노산 서열은 이들이 특정의 기준을 충족하는 경우 아미노산의 첨가 또는 결실에 의해 변형시켰다(또는 특정 기준을 충족하지 않는 FSP는 변형 후 배제시켰다): (i) FSP가 10개의 aa보다 더 짧은 경우, FC에 의해 암호화된 아미노산의 바로(immediately) N-말단 측에 자연 발생하는 4개의 wt aa을 FSP의 N-말단에 가하여 추정의 CD8 T 세포 신생-에피토프(8 내지 10mer)의 최소 길이에 이르는 펩타이드(이는, FSM이 없는 상응하는 야생형(wt) 핵산의 번역 생성물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈으로부터 시작되는, FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물이라고 본 발명의 문맥에서 정의되는 FSP와는 상이하므로 mFSP로서 지칭된다)를 보증한다. 동일한 FSM으로부터 유래되는 다수의 FSP 사이에 공유된 아미노산 스트레치(amino acid stretch)는 가장 긴 FSP에서만 보유되었는데, 즉, 보다 짧은 FSP에서 이러한 아미노산 스트레치가 결실되었다. 최종 단계에서, wt 사람 프로테옴(proteome)(NCBI REFSEQ 데이터베이스)내에 또한 존재하는 8개 이상의 연속된 아미노산(continuous amino acid)의 임의의 분절을 FSP로부터 제거하여 자가면역성을 유도할 위험성을 최소화하였다. wt 분절의 배제 후, 수득되는 FSP가 4개의 aa보다 짧은 경우, 이는 목록에서 제거하였다. 이렇게 수득된 FSP의 최종 그룹은 1059개의 FSM에 의해 암호화된 1087개의 아미노산 서열(서열 번호 1 내지 1087)을 포함하며(표 1) CVP로 지칭된다.
삭제
삭제
실시예 3: 높은 "면역원성 적용범위"를 지닌 MSI 백신에 대한 FSP의 최적의 서브세트의 선택
서열 번호 1 내지 1087은 본 발명의 CVP에 포함될 수 있는 FSP 및 mFSP의 아미노산 서열을 나타낸다. 이러한 예시적인 CFSP는 1087개의 FSP 및 mFSP를 포함한다. 실시예 1 및 2에 요약된 기준이 변경되는 경우, CFSP는 추가의 또는 보다 적은 FSP를 포함할 것이며, 따라서 CVP는 추가의 또는 보다 적은 FSP 및 mFSP를 포함할 것이다. CVP, 예컨대, 바이러스 벡터, 네이크드 DNA/RNA의 투여 방법에 따라서, 이러한 다수의 FSP 및 mFSP의 CVP를 생성하는 것은 실제적이거나 경제적이지 않을 수 있다. 따라서, 본 발명자들은, 특정 MSI 암으로 고통 받는 환자의 대부분의 최적의 면역화 또는 MSI 암의 발병 가능성이 있는 환자에서 최적의 예방을 달성하기 위해, 실시예 1 및 2에 요약된 바와 같이 생성된 CFSP로부터, CVP에 포함되는 CFSP의 FSP로부터 유래된 FSP 또는 mFSP의 적합한 수를 선택하는 추가의 선택 기준을 개발하였다. 다음에서 본 발명자들이 바람직한 CVP에 포함되는 FSP 및 mFSP의 서브세트를 결정하는 데 사용된, 이러한 추가의 선택 기준을 기술한다.
상이한 바이러스 항원으로 백신접종된 사람 대상체에서의 앞서의 연구는 약 400 aa의 항원성 서열이 평균 3개의 면역원성 에피토프(최소 1, 최대 12)를 함유함을 나타냈다(도 1)(Borthwick, N., et al. (2017) PLoS One 12(4), Swadling, L., et al. (2014) Sci Transl Med 6(261)). 따라서, 본원에서 3개의 면역원성 에피토프의 예측된 평균으로서 의도되는, 양호한 "면역원성 적용범위(immunogenic coverage)"을 수득하기 위해서는, 백신에 대해 선택된 FSP가, 각각의 환자의 종양에 있어서 적어도 400 aa의 총 길이를 나타내는 것이 바람직할 수 있다. 따라서, 본 발명자들은 400 aa의 실험적으로 확립된 최소의 면역원성 적용범위 역치가 실험한 MSI 종양의 최대 수에 이르도록 하는 방식으로 CFSP로부터 FSP를 선택하기 위한 알고리즘을 개발하였다. 실현가능한 경우, 본 발명자들은, FSP의 일부가 종양 세포에서 번역되지 않거나 제시되지 않을 가능성을 상쇄하고자, 800 aa의 표적 면역원성 적용범위에 도달하는 것을 목표로 하였다. 이러한 기준은 다음을 보증한다: (i) 환자의 큰 집단(large cohort)에서 효과적인 면역 반응을 유도할 높은 가능성; 및 (ii) 주어진 환자 내에서 다수의 암 세포는 백신-유도된 면역성에 의해 표적화될 것임.
추가의 제한을 알고리즘에 도입하여 최종의 백신 세트에서 모든 FSP에 대해 최대 6000 aa의 총 길이를 달성하였다. 이러한 길이 컷오프(cutoff)는, 연속적으로 결합된(continuous joined) FSP 및/또는 mFSP의 약 ~1500 aa를 암호화하는 벡터당 약 4,500개 뉴클레오타이드의 최대 삽입 크기를 고려하여 백신 벡터(n = 4)의 바람직한 총 수를 반영하였다.
CVSP 수집물에서 FSP를 생성하는 각각의 1059개의 FSM의 경우, 320개의 TCGA MSI 종양 (69개 MSI-H 결장직장 암, 85개 MSI 위암 및 166개 MSI 자궁내막 암) 각각에서, 1 또는 0의 값을 각각 FSM의 존재 또는 부재를 기반으로 부여하였다. 각각의 종양 유형의 경우, 빈도가 < 5%인 FSM에 0의 값을 지정하여, 각각의 종양 그룹 내에서 보다 공유된 이러한 FSM의 백신 목록으로의 포함이 유리하도록 했다.
제1 단계로서, 알고리즘은 각각의 FSM에 의해 생성된 모든 FSP의 총 길이와 320개의 MSI 종양에 걸쳐 FSM의 관찰된 빈도 사이의 곱인 점수에 따라 1059개의 FSM을 순위를 매겼다(aa 길이 × FSM을 함유하는 샘플의 수/총 샘플).
백신 목록에 포함된 제1의 FSM은 최고 점수를 지닌 것이었다. 후속적으로, 각각의 라운드에서 종양의 최대 수를 가능하게 하는 FSM을 선택하여 이들의 면역원성 적용범위를 증가시킴으로써, 주기적인 방식으로 알고리즘을 진행시켰다. 하나 초과의 FSM가 이러한 조건을 충족하는 경우, 최고 점수를 가진 FSM을 선택하였다. FSM이 선택되면, FSM에 의해 암호화된 모든 FSP를 백신 목록에 추가하고, 상응하는 FSP의 총 aa 길이를 가함으로써, 선택된 FSM을 수반하는 샘플의 면역원성 적용범위를 그에 따라 업데이트하였다. 일단 샘플이 표적 면역원성 적용범위 역치(본 경우에서 결장직장암 및 위암의 경우 800 aa, 자궁내막 암의 경우 400 aa이 되도록 선택함)에 도달하면, 알고리즘은 표적 적용범위에 아직 도달하지 않은 이러한 샘플 만을 고려하면서, 후속적인 FSM의 선택을 위해 이를 중지한다.
서열 번호 1 내지 1087은 본 발명의 CVP에 포함될 수 있는 FSP 및 mFSP의 아미노산 서열을 나타낸다. 이러한 예시적인 CFSP는 1087개의 FSP 및 mFSP를 포함한다. 실시예 1 및 2에 요약된 기준이 변경되는 경우, CFSP는 추가의 또는 보다 적은 FSP를 포함할 것이며, 따라서 CVP는 추가의 또는 보다 적은 FSP 및 mFSP를 포함할 것이다. CVP, 예컨대, 바이러스 벡터, 네이크드 DNA/RNA의 투여 방법에 따라서, 이러한 다수의 FSP 및 mFSP의 CVP를 생성하는 것은 실제적이거나 경제적이지 않을 수 있다. 따라서, 본 발명자들은, 특정 MSI 암으로 고통 받는 환자의 대부분의 최적의 면역화 또는 MSI 암의 발병 가능성이 있는 환자에서 최적의 예방을 달성하기 위해, 실시예 1 및 2에 요약된 바와 같이 생성된 CFSP로부터, CVP에 포함되는 CFSP의 FSP로부터 유래된 FSP 또는 mFSP의 적합한 수를 선택하는 추가의 선택 기준을 개발하였다. 다음에서 본 발명자들이 바람직한 CVP에 포함되는 FSP 및 mFSP의 서브세트를 결정하는 데 사용된, 이러한 추가의 선택 기준을 기술한다.
상이한 바이러스 항원으로 백신접종된 사람 대상체에서의 앞서의 연구는 약 400 aa의 항원성 서열이 평균 3개의 면역원성 에피토프(최소 1, 최대 12)를 함유함을 나타냈다(도 1)(Borthwick, N., et al. (2017) PLoS One 12(4), Swadling, L., et al. (2014) Sci Transl Med 6(261)). 따라서, 본원에서 3개의 면역원성 에피토프의 예측된 평균으로서 의도되는, 양호한 "면역원성 적용범위(immunogenic coverage)"을 수득하기 위해서는, 백신에 대해 선택된 FSP가, 각각의 환자의 종양에 있어서 적어도 400 aa의 총 길이를 나타내는 것이 바람직할 수 있다. 따라서, 본 발명자들은 400 aa의 실험적으로 확립된 최소의 면역원성 적용범위 역치가 실험한 MSI 종양의 최대 수에 이르도록 하는 방식으로 CFSP로부터 FSP를 선택하기 위한 알고리즘을 개발하였다. 실현가능한 경우, 본 발명자들은, FSP의 일부가 종양 세포에서 번역되지 않거나 제시되지 않을 가능성을 상쇄하고자, 800 aa의 표적 면역원성 적용범위에 도달하는 것을 목표로 하였다. 이러한 기준은 다음을 보증한다: (i) 환자의 큰 집단(large cohort)에서 효과적인 면역 반응을 유도할 높은 가능성; 및 (ii) 주어진 환자 내에서 다수의 암 세포는 백신-유도된 면역성에 의해 표적화될 것임.
추가의 제한을 알고리즘에 도입하여 최종의 백신 세트에서 모든 FSP에 대해 최대 6000 aa의 총 길이를 달성하였다. 이러한 길이 컷오프(cutoff)는, 연속적으로 결합된(continuous joined) FSP 및/또는 mFSP의 약 ~1500 aa를 암호화하는 벡터당 약 4,500개 뉴클레오타이드의 최대 삽입 크기를 고려하여 백신 벡터(n = 4)의 바람직한 총 수를 반영하였다.
CVSP 수집물에서 FSP를 생성하는 각각의 1059개의 FSM의 경우, 320개의 TCGA MSI 종양 (69개 MSI-H 결장직장 암, 85개 MSI 위암 및 166개 MSI 자궁내막 암) 각각에서, 1 또는 0의 값을 각각 FSM의 존재 또는 부재를 기반으로 부여하였다. 각각의 종양 유형의 경우, 빈도가 < 5%인 FSM에 0의 값을 지정하여, 각각의 종양 그룹 내에서 보다 공유된 이러한 FSM의 백신 목록으로의 포함이 유리하도록 했다.
제1 단계로서, 알고리즘은 각각의 FSM에 의해 생성된 모든 FSP의 총 길이와 320개의 MSI 종양에 걸쳐 FSM의 관찰된 빈도 사이의 곱인 점수에 따라 1059개의 FSM을 순위를 매겼다(aa 길이 × FSM을 함유하는 샘플의 수/총 샘플).
백신 목록에 포함된 제1의 FSM은 최고 점수를 지닌 것이었다. 후속적으로, 각각의 라운드에서 종양의 최대 수를 가능하게 하는 FSM을 선택하여 이들의 면역원성 적용범위를 증가시킴으로써, 주기적인 방식으로 알고리즘을 진행시켰다. 하나 초과의 FSM가 이러한 조건을 충족하는 경우, 최고 점수를 가진 FSM을 선택하였다. FSM이 선택되면, FSM에 의해 암호화된 모든 FSP를 백신 목록에 추가하고, 상응하는 FSP의 총 aa 길이를 가함으로써, 선택된 FSM을 수반하는 샘플의 면역원성 적용범위를 그에 따라 업데이트하였다. 일단 샘플이 표적 면역원성 적용범위 역치(본 경우에서 결장직장암 및 위암의 경우 800 aa, 자궁내막 암의 경우 400 aa이 되도록 선택함)에 도달하면, 알고리즘은 표적 적용범위에 아직 도달하지 않은 이러한 샘플 만을 고려하면서, 후속적인 FSM의 선택을 위해 이를 중지한다.
삭제
삭제
삭제
삭제
삭제
삭제
알고리즘을 지속함으로써 FSP 또는 mFSP를 백신 목록, 즉, CVP를 형성하는 아미노산 서열에, 다음 3개의 조건 중 하나가 충족될 때까지 추가하였다: (i) 선택된 FSM에 의해 암호화되는 모든 선택된 FSP의 총 aa 길이를 6000aa로 대체함; (ii) 모든 암 샘플은 면역원성 적용범위 ≥ 표적 역치를 가짐; 또는 (iii) 역치 이하의 샘플의 면역원성 적용범위를 증가시키는 더 이상의 FSM이 존재하지 않았음.
기술된 알고리즘을 사용하여 선택된 FSP의 최종 서브세트는 6021 aa의 총 길이에 대한 204개의 FSM으로부터 발생한 209개의 FSP(서열 번호 1 내지 209)를 포함하고 Nous-209로 지칭된다. FSP의 이러한 서브세트는 TCGA 결장직장 암 샘플의 98%에 대해 면역원성 적용범위 ≥400 aa를 제공하며 중앙값(median number)이 샘플당 50개 FSP이고 면역원성 적용범위의 중앙값(median immunogenic coverage)가 1322 aa이다. 유사하게, Nous-209 내 FSP는 위암 샘플의 95%에서 면역원성 적용범위 ≥400 aa를 제공하며 중앙값이 샘플당 46개 FSP, 적용범위 중앙값이 1178 aa이다. 최종적으로, 면역원성 적용범위 ≥400 aa는, 샘플당 21개의 FSP의 중앙값 및 512 aa의 적용범위 중앙값과 함께, 70%의 TCGA 자궁내막 암에 의해 도달된다. 면역원성 적용범위는 800 aa의 표적 값에 대해 계산한 경우 결장직장 암 및 위암에 대해 매우 높게 남는다(각각 93% 및 83%).
실시예 4: 높은 면역원성 적용범위를 지닌 후보물 MSI 암 백신으로서 Nous-209의 확인(validation)
Nous-209에 포함된 FSP 및 mFSP의 목록에 대한 제1의 확인 단계로서, 본 발명자들은 MSI 세포주(7개의 CRC 및 1개의 EC)의 패널에서 차세대 서열분석(NGS)을 수행하였다. 게놈 수준(진유전체-서열분석)에서, Nous-209에 또한 포함된 각각의 세포주에서 검출된 FSM의 수는, 모든 세포주가 2037 aa의 평균 적용범위(FSP 누적 길이)와 함께, 400 aa의 최소의 면역원성 적용범위 역치를 크게 극복할 정도였다(도 2의 A).
둘째로, 본 발명자들은 RNA-seq에 의한 동일한 세포주를 분석함으로써 진유전체 서열분석에 의해 검출된 Nous-209 내 FSM이 전사 수준에서도 얼마나 많이 발현되는지를 확인했다. 특히, 400aa 초과의 면역원성 적용범위를 모든 세포주에 대해 RNA-seq 수준에서 또한 유지시켰다(도 2의 B).
MSI 세포주에 대해 수득된 것에 대한 유사한 결과를 6개의 신선한 동결된 MSI 결장직장 암 매치된 생검(종양 및 정상 조직)의 진유전체 서열분석에 의해 수득하였다. 분석된 모든 환자의 경우, 면역원성 적용범위는 400 aa의 최소의 역치보다 더 높았으며, 평균 적용범위는 926 aa이었다. 6개 샘플 중 4개는 800 aa의 표적 역치를 초과하였다(도 3).
더욱이, Nous-209의 면역원성 잠재능을 평가하기 위하여, 본 발명자들은 MSI CRC 생검에서 백신-암호화된 FSP 중 얼마나 많은 것이 MHC-I 분자에 대해 양호한 결합 프로파일(IC50 ≤ 500 nM)을 지닌 에피토프를 생성할 것으로 예측되었는지를 계산하였다. 이러한 목표를 위해, 본 발명자는 우선 6명의 환자의 생검의 서열분석 데이터로부터 이들의 HLA 일배체형(haplotype)을 유도시켰다. 후속적으로, 본 발명자는 IEDB 소프트웨어 (http://www.iedb.org/)를 사용하여 각각의 환자에 존재하는 백신-암호화된 FSP의 서브세트에 있어서 HLA-I-매치된 환자-특이적인 결합 예측을 수행하였다. 각각의 MSI 환자는 이들 자체의 HLA-I 일배체형을 결합시키는 것으로 예측된 평균 67개의 에피토프(최소 29, 최대 141)를 가졌다(도 4).
이와 함께, 이러한 결과는 높은 면역원성 적용범위가 MSI 세포주 및 원발성 종양 생검 둘 다에서, Nous-209에 포함된 서브세트와 같이, FSP의 서브세트를 통해 달성될 수 있음을 입증한다.
이후에, 본 발명자들은 Nous-209 내 FSP에 대한 면역원성 반응이 생체 내에서 측정될 수 있는지의 여부를 입증하였다. 이러한 목표를 위해, 본 발명자들은 HLA-A02+ 형질도입 마우스를 Nous-209 FSP의 서브세트로 면역화시켰다. 백신-유도된 면역 반응을, HLA-A02에 대한 결합 예측을 기반으로 이러한 FSP로부터 선택된 9량체를 사용하여 세포형광측정기(cytofluorimetry: FACS)로 평가하였다. 인터페론 γ(IFN-γ)에 대한 세포내 염색(ICS)에 의해 측정된 바와 같이, 도 5는 5마리의 동물에서 서열 번호 123에 상응하는 FSP로부터 유래된 HLA-A02 9량체에 대한 대표적인 CD8 T 세포 반응을 나타낸다(패널 A). 이러한 마우스 중 하나로부터 IFN-γ+ CD8 T 세포에 대한 게이팅 전략의 FACS 플롯을 패널 B에 나타내며, 이는 FSP-반응성 T 세포의 유의적인 퍼센트(5.6%)를 나타낸다.
실시예 5: Nous-209에 대한 핵산 카세트의 작제
Nous-209에서 FSP를 4개의 서브세트로 분할하여 약 4500개 뉴클레오타이드의 길이의 인공 유전자를 생성하였으며, 각각은 다음의 바이러스 골격으로 클로닝하기에 적합한 약 1500 aa을 암호화한다: 유인원 아데노바이러스(GAd) 및 변형된 박시니아 안카라(Modified Vaccinia Ankara: MVA). 각각의 유전자를 임의의 링커의 부재하에 하나 그 뒤에 또 다른 것에 FSP 서열을 결합시킴으로써 조립하였다. 각각의 유전자가 실시예 3에 기술된 알고리즘에 따라 유사한 순위를 지닌 대략 동일한 수의 FSP를 함유할 수 있고 FSP를 함유할 수 있도록 보증하는 방식으로, 209개의 FSP를 4개의 유전자에 걸쳐 분포시켰으며 여기서 상응하는 FSM은 3개의 암 유형에 걸쳐 관찰된 빈도의 유사한 전체 분포를 갖는다. 이러한 과정은 다음을 생성하였다:
유전자 1 = 1507aa (46 FSPs)
유전자 2 = 1501aa (54 FSPs)
유전자 3 = 1506aa (59 FSPs)
유전자 4 = 1507aa (51 FSPs).
각각의 인공 유전자를 FSP의 상이한 순서에 상응하는 4개의 상이한 레이아웃(A, B, C 및 D)에서 조립하였다(표 2). 이종 프라임-부스트 백신접종 전략을 기반으로 하여, 레이아웃 A 및 C 내 유전자를 사용하여 GAd 벡터를 작제하였으며, 레이아웃 B 및 D 내 유전자는 MVA 골격에서 클로닝하였다. 레이아웃 A와 B 사이 및 레이아웃 C와 D 사이의 FSP의 스크램블링(scrambling)을 설계하여 인접한 FSP 사이에 동일한 접합 aa 서열을 암호화하는 GAd 및 MVA 둘다를 갖지 않도록 하였으며, 이는 접합 에피토프에 대해 면역 반응을 부스트할 수 있었다. 2개의 레이아웃 내 각각의 유전자에 대한 FSP의 순서를 선택하기 위하여, 본 발명자는 50,000개의 상이한 폴리펩타이드를 생성하는 과정을 사용하였으며 여기서 FSP는 무작위 순서로 결합된다. 이들 중에서, 본 발명자는 상이한 접합(junction)을 가지며, IUPRED 소프트웨어(Dosztαnyi Z., et al. (2005) Bioinformatics 21, 3433)에 의해 평가된 바와 같이, 처음 50 aa 내에 무질서 서열(disordered sequence) (평균 무질서 경향성 >0.50) 을 지닌 2개를 선택하였다(도 6). 후자의 선택은, 무질서한 N-말단이 프로테아좀에 의한 가공을 선호하므로, 따라서 MHC-I 분자에서 FSP-유래된 에피토프의 제시의 기회를 증가시켜야 한다는 개념을 기반으로 하였다. 후속적으로, 인공 폴리펩타이드를 사람 참고 단백질에 대한 유사성에 대해 가상환경(in silico)에서 스크리닝하여 사람 프로테옴과 교차-반응성인 영역이 생성을 피하였다. 레이아웃 A, B, C 및 D에서 4개의 폴리-FSP 스트링의 aa 서열을, FSP의 상이한 순서에 상응하는 서열 번호 1088 내지 1091(레이아웃 A), 서열 번호 1092 내지 1095(레이아웃 B), 서열 번호 1155 내지 1158(레이아웃 C) 및 서열 번호 1159 내지 1162(레이아웃 D)로서 나열하였다(표 2). 이종 프라임-부스트 백신접종 전략을 기반으로, 레이아웃 A 및 C 내 유전자를 사용하여 GAd 벡터를 작제하였고, 레이아웃 B 및 D 내 유전자는 MVA 골격내에서 클로닝하였다. 레이아웃 A와 B 사이 및 레이아웃 C와 D 사이의 FSP의 스크램블링을 각각 설계하였다. 이들의 상응하는 nt 서열은 서열 번호 1096 내지 1099(레이아웃 A), 서열 번호 1100 내지 1103(레이아웃 B), 서열 번호 1163 내지 1166(레이아웃 C) 및 서열 번호 1167 내지 1170(레이아웃 D)이다.
발현 카세트를 작제하기 위하여, 분류 신호(사람 조직 플라스미노겐 활성인자 신호 펩타이드(hTPA; 서열 번호 1104) 또는 사람 불변 쇄(hINV; 서열 번호 1105)를 N-말단에 가하고, 각각의 폴리펩타이드 서열의 C-말단에 인플루엔자 HA-tag 서열(서열 번호 1106)을 가하였다(도 7). 이렇게 작제된 폴리펩타이드의 연장된 서열을 hTPA의 경우 서열 번호 1107 내지 1110(레이아웃 A), 서열 번호 1111 내지 1114(레이아웃 B), 서열 번호 1171 내지 1174(레이아웃 C) 및 서열 번호 1179 내지 1182(레이아웃 D)로, 및 hINV의 경우 서열 번호 1115 내지 1118(레이아웃 A), 서열 번호 1119 내지 1122(레이아웃 B), 서열 번호 1175 내지 1178(레이아웃 C) 및 서열 번호 1183 내지 1186(레이아웃 D)로 제공한다. 나타낸 폴리-FSP 스트링을 생성하기 위한 상응하는 nt 서열을 사람 코돈 용도를 기반으로 코돈-최적화하였다(레이아웃 A의 경우 서열 번호 1123 내지 1126, 레이아웃 B의 경우 서열 번호 1127 내지 1130, 레이아웃 C의 경우 서열 번호 1187 내지 1190 및 hTPA를 지닌 레이아웃 D의 경우 서열 번호 1191 내지 1194; 레이아웃 A의 경우 서열 번호 1131 내지 1134, 레이아웃 B의 경우 서열 번호 1135 내지 1138, 레이아웃 C의 경우 서열 번호 1195 내지 1198 및 hINV를 지닌 레이아웃 D의 경우 서열 번호 1199 내지 1202). 또한, 코작 서열(CGCGACTTCGCCGCC)을 출발 코돈의 바로 상부에 위치시켜 효과적인 번역 개시를 허용하고 TAA 정지 코돈을 HA tag의 하부에 위치시켰다. 최종적으로, 카세트의 아-클로닝을 촉진시키는 고유의 제한 부위(unique restriction site)를 포함하는 2개의 플랭킹 분절을 뉴클레오타이드 서열의 5'- 및 3'-말단에 각각 가하였다(도 7). 인공 유전자를 나타내는 nt 서열(hTPA를 지닌, 레이아웃 A의 경우 서열 번호 1139 내지 1142, 레이아웃 B의 경우 서열 번호 1143 내지 1146, 레이아웃 C의 경우 서열 번호 1203 내지 1206 및 레이아웃 D의 경우 서열 번호 1207 내지 1210; hINV를 지닌, 레이아웃 A의 경우 서열 번호 1147 내지 1150, 레이아웃 B의 경우 서열 번호 1151 내지 1154, 레이아웃 C의 경우 서열 번호 1211 내지 1214 및 레이아웃 D의 경우 서열 번호 1215 내지 1218)을 표준 올리고뉴클레오타이드 합성 방법에 의해 생성시키고 TetO-CMV 프로모터(Tet 리프레서에 대한 결합 부위를 지닌 hCMV 프로모터)와 BGH(소 성장 호르몬) 폴리A 사이에 아-클로닝하였다.
실시예 6: 면역원성의 확인
레이아웃 A(폴리펩타이드 서열 서열 번호 1107 내지 1110, 뉴클레오타이드 서열 서열 번호 1139 내지 1142) 내에 4개의 유전자를 함유하는 4개의 GAd 벡터(GAd20-209-FSP) 및 레이아웃 B (폴리펩타이드 서열 서열 번호 1111 내지 1114, 뉴클레오타이드 서열 서열 번호 1143 내지 1146) 내 4개의 유전자를 함유하는 4개의 MVA 벡터(MVA-209-FSPs)의 면역원성을 마우스(CB6F1 마우스 균주)에서 평가하였다. GAd20-209-FSP를, 영역 E3가 결실되고 영역 E1이 유전자에 의해 치환된 GAd20(서열 번호 1219)으로부터 작제하였다. 마우스를 GAd20-209-FSP의 단일 근육내 면역화에 의해 각각의 벡터에 대해 108개의 바이러스 입자(vp)의 용량에서 면역화하고 2주 후 MVA-209-FSP에 의해 107 플라크 형성 단위(pfu)의 용량에서 부스트하였다. 백신 암호화된 FSP에 대한 T-세포 반응의 유도를, ELIspot 검정에 의해 209개의 FSP 서열을 커버하는 합성 펩타이드를 사용하여 측정하였다. 합성 펩타이드를 DMSO 속에 희석시키고 혼합하여 16개의 혼주물(pool)을 형성시켰다. 면역 반응(백만개의 비장세포당 인터페론-감마(IFN-γ)를 생산하는 T 세포의 수)을 프라임 2주 후 및 부스트 1주 후 분석하였다. 데이터는, GAd20-209-FSP를 사용한 프라이밍 후 T-세포 매개된 면역 반응의 유도 및 MVA-209-FSP의 투여 후 수득된 면역 반응의 강력한 부스트를 나타낸다(도 8). 이들이 16개의 펩타이드 혼주물 각각에 대해 검출되므로, 반응은 백신 작제물에 걸쳐 분포된 다수의 FSP에 대한 것이었다(도 9). 중요하게도, 벡터 공-투여는 단일 벡터에 의해 암호화된 FSP에 대해 면역 반응에 영향을 미치지 않았고, 따라서 FSP의 백신 혼합물의 존재 하에서의 면역 간섭을 배제시켰다(도 10). 최종적으로, T 세포 반응의 품질을 2개의 펩타이드 혼주물(혼주물 1 및 혼주물3)를 사용하고 FSP-특이적인 CD4 및 CD8 IFN 감마+ T 세포의 유도를 나타냄으로써 세포내 염색(ICS)으로 평가하였다(도 11).
실시예 4에 나타낸 바와 같이, Nous-209 내에서 FSP에 대한 면역원성 반응이 또한 생체 내에서 측정될 수 있는지를 입증하였다. HLA-A02+ 형질도입 마우스를 Nous-209 FSP의 서브세트(30개의 FSP) 또는 DMSO 음성 대조군으로 면역화하였다. 백신-유도된 면역 반응을, HLA-A02에 대한 결합 예측을 기반으로 30개의 FSP로부터 선택된 9량체를 사용하여 세포플루오로측정법(FACS)으로 평가하였다. 도 11은 인터페론 γ(IFN-γ)에 대한 세포내 염색(ICS)에 의해 측정된 바와 같이(패널 A), FSP 서열 번호 123에 존재하는 HLA-A02 9량체에 대한 5마리의 동물에서 대표적인 CD8 T 세포 반응을 나타낸다. 이러한 마우스 중 하나로부터의 IFN-γ+ CD8 T 세포에 대한 게이팅 전략의 FACS 플롯을 패널 B에 묘사하며, 이는 FSP-반응성 T 세포의 유의적인 퍼센트(5.6%)를 나타낸다.
이와 함께, 이러한 결과는 다음을 입증한다:
i) 작제물이 고도로 면역원성이며 CD4 및 CD8 면역 반응을 유도한다. ii) 면역 반응은 16개의 상이한 펩타이드 혼주물에 대해 지시되므로 적어도 16개의 상이한 에피토프(각각의 혼주물에 대해 1개)를 인식한다. 근친교배된 마우스(실제로 유전적으로 동일한 마우스)에서조차, 400개 aa에서의 적어도 하나의 에피토프의 규칙이 확인됨을 나타내는데, 이는 백신의 6000개 aa에 걸쳐 16개의 에피토프를 가지는 것이 평균적으로 375개 aa내에서 적어도 하나의 면역원성 에피토프에 상응하기 때문이다.
iii) 벡터 1이 단독으로 사용되거나 다른 3개의 벡터와 조합된 것에 상관없이, 벡터 1 암호화된 항원에 대한 비교할만한 면역 반응이 측정되므로 명백한 간섭 효과, 특히 개개 벡터 사이에 억제가 존재하지 않는다. 유사하게, 벡터 2가 단독으로 사용되거나 다른 3개와 조합되는 것에 상관없이, 벡터 2 암호화된 항원에 대한 비교할만한 면역 반응이 측정되었다.
SEQUENCE LISTING
<110> NOUSCOM AG
<120> A UNIVERSAL VACCINE BASED ON SHARED TUMOR NEOANTIGENS FOR
PREVENTION AND TREATMENT OF MICRO SATELLITE INSTABLE (MSI) CANCERS
<130> IPA191630-DE
<150> EP 17181026.0
<151> 2017-07-12
<160> 1219
<170> PatentIn version 3.5
<210> 1
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1
Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys Val Pro Val Ala Glu
1 5 10 15
Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly Ala Ala Gly Thr Arg Cys
20 25 30
Arg Ala Ser Arg Ala Pro Cys Arg Gln Leu Pro Ala Ser Ser Pro Thr
35 40 45
Lys Cys Glu Ile Cys Val Lys Arg Arg Arg Arg Arg Lys Arg Ser Ser
50 55 60
Gln Ser Arg Ser Pro Val Pro Lys Lys Arg Glu Arg Met Met Leu Pro
65 70 75 80
Val Arg Ala Arg Thr Ala Arg Ser Ala Leu Pro Gln Gly Arg Ala Pro
85 90 95
Leu Glu Gly Met Leu Leu Pro Arg Ala Leu Pro Ser Leu Leu Ser Arg
100 105 110
Met Pro Ala Arg Arg Glu Ser Arg Phe Trp Leu Ala Leu Gln Ala Leu
115 120 125
Gly Leu Arg Pro Pro His Leu Pro Ser Cys His Pro Leu Pro Gln Leu
130 135 140
Leu Gly Pro Pro Pro Pro His Gln Ala Pro
145 150
<210> 2
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 2
Thr Lys Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile Thr
1 5 10 15
Leu Ile Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys His Pro His
20 25 30
Arg Arg Pro Gly Trp Lys Gly His His Arg Val Val Phe Ser His His
35 40 45
Pro Ser Gly Ser Thr Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly
50 55 60
Gly Arg Arg Glu Lys Lys Gly Cys Arg Glu
65 70
<210> 3
<211> 8
<212> PRT
<213> Homo sapiens
<400> 3
Gly Gly Lys Lys Arg Ser Lys Phe
1 5
<210> 4
<211> 8
<212> PRT
<213> Homo sapiens
<400> 4
Val His Lys Lys Arg Gly Leu Phe
1 5
<210> 5
<211> 40
<212> PRT
<213> Homo sapiens
<400> 5
Val Pro Pro Ser Pro Pro Leu Ala Leu Gly Pro Arg Met Gln Leu Cys
1 5 10 15
Thr Gln Leu Ala Arg Phe Phe Pro Ile Thr Pro Pro Val Trp His Ile
20 25 30
Leu Gly Pro Gln Arg His Thr Pro
35 40
<210> 6
<211> 44
<212> PRT
<213> Homo sapiens
<400> 6
Gln Pro Ser Leu Pro Gly Pro Cys Ala Ser Leu Leu Ser Thr Leu Ser
1 5 10 15
Gln Pro Pro Pro Gln Ala Pro Ser Gln Val Trp Thr Ala Ala Thr Leu
20 25 30
Arg Cys Pro Ala Val Pro Ala Ala Ala Cys Pro Pro
35 40
<210> 7
<211> 31
<212> PRT
<213> Homo sapiens
<400> 7
Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro Gln Ala
1 5 10 15
Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu Leu Val Gln Ser
20 25 30
<210> 8
<211> 21
<212> PRT
<213> Homo sapiens
<400> 8
Arg Asn Ser Arg Arg Ala Thr Pro Thr Ser Lys Gly Ser Leu Arg Arg
1 5 10 15
Lys Tyr Leu Arg Val
20
<210> 9
<211> 8
<212> PRT
<213> Homo sapiens
<400> 9
Val Leu Lys Lys Asn Arg Lys Gln
1 5
<210> 10
<211> 10
<212> PRT
<213> Homo sapiens
<400> 10
Thr Ala Phe Phe Leu Leu Asp Ile Ile Leu
1 5 10
<210> 11
<211> 12
<212> PRT
<213> Homo sapiens
<400> 11
Arg Gln Ile Asn Arg Arg Lys Leu Gln Arg Lys Lys
1 5 10
<210> 12
<211> 32
<212> PRT
<213> Homo sapiens
<400> 12
Arg Gly Pro Arg Arg Lys Val Leu Met Val Leu Trp Leu Pro Ala Asn
1 5 10 15
Gln Ser Leu Gln Lys Ser Gln Val Phe Gln Trp Val Leu Arg Thr Glu
20 25 30
<210> 13
<211> 11
<212> PRT
<213> Homo sapiens
<400> 13
Cys Arg Cys Arg Arg Glu Tyr Arg Val Thr Met
1 5 10
<210> 14
<211> 38
<212> PRT
<213> Homo sapiens
<400> 14
Gly Glu Lys Asn Asp Leu Gln Leu Phe Val Met Ser Asp Thr Thr Tyr
1 5 10 15
Lys Ile Tyr Trp Thr Val Ile Leu Leu Asn Pro Cys Gly Asn Leu His
20 25 30
Leu Lys Thr Thr Ser Leu
35
<210> 15
<211> 25
<212> PRT
<213> Homo sapiens
<400> 15
Arg Asn Lys Lys Thr Lys Leu Trp Phe Ser Leu Ile Asn Ile His His
1 5 10 15
Arg Lys Asn Pro Leu Leu Pro Met Arg
20 25
<210> 16
<211> 26
<212> PRT
<213> Homo sapiens
<400> 16
Thr Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala Arg
1 5 10 15
Gly Gly Thr Thr Ile Gly Glu Val Thr Ser
20 25
<210> 17
<211> 27
<212> PRT
<213> Homo sapiens
<400> 17
Asn Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn Arg Asn Lys Ser
1 5 10 15
Arg Gln Met Glu Ser Leu Gly Met Lys Leu Gln
20 25
<210> 18
<211> 11
<212> PRT
<213> Homo sapiens
<400> 18
Met Pro Ser Ser Trp Ser Ser Ser Gly Arg Thr
1 5 10
<210> 19
<211> 10
<212> PRT
<213> Homo sapiens
<400> 19
Pro Gly Thr Ser Leu Gln Cys Tyr Leu Asn
1 5 10
<210> 20
<211> 27
<212> PRT
<213> Homo sapiens
<400> 20
Lys Gly Lys Asn Ser Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn
1 5 10 15
Gln Gly His Leu Leu Met Ile Leu Leu His Asn
20 25
<210> 21
<211> 17
<212> PRT
<213> Homo sapiens
<400> 21
Asn Ile Leu Asn Ser Leu Pro Ser Ser Met Glu Ile Ala Val Leu Gln
1 5 10 15
Glu
<210> 22
<211> 11
<212> PRT
<213> Homo sapiens
<400> 22
Asn Met Gly Gly Asn Arg Ser Ile Cys Leu Thr
1 5 10
<210> 23
<211> 17
<212> PRT
<213> Homo sapiens
<400> 23
Glu Leu Ser Leu Glu Pro Trp Ile Pro Tyr Leu His Gln Gln Lys Thr
1 5 10 15
Gln
<210> 24
<211> 73
<212> PRT
<213> Homo sapiens
<400> 24
Phe Leu Ile His Leu Arg Lys Val Asp Thr His His Leu Gln Val Val
1 5 10 15
Thr Lys Thr Val Thr Ala Thr Thr Ala Asp Gly Gln Arg Met Arg Arg
20 25 30
Leu Lys Cys Lys Ala Cys Arg Leu Arg Trp Ala Arg Pro Glu Pro Ala
35 40 45
Ala Gln Ala Pro Pro Lys Ser His Phe Pro Pro His Pro Ser Gly Pro
50 55 60
Ser Arg Thr Ser Ser Leu Gln Leu Arg
65 70
<210> 25
<211> 11
<212> PRT
<213> Homo sapiens
<400> 25
Glu Trp Gly Gly Gln Ala His Arg Gln Arg Asn
1 5 10
<210> 26
<211> 10
<212> PRT
<213> Homo sapiens
<400> 26
Ile Val Phe Phe Leu Ala Pro Tyr Phe Pro
1 5 10
<210> 27
<211> 9
<212> PRT
<213> Homo sapiens
<400> 27
Pro Lys Phe Phe Leu Thr Phe Ser Gln
1 5
<210> 28
<211> 77
<212> PRT
<213> Homo sapiens
<400> 28
Ala Arg Gln Pro Ser Arg Pro Thr Gly Arg Thr Pro Thr Thr Arg Leu
1 5 10 15
Met Ala Pro Val Gly Ser Val Met Ser Cys Ser Leu Leu Thr Gln Pro
20 25 30
Ser Pro Ala Ser Ala Cys Thr Met Pro Pro Leu Leu His Pro Gln Trp
35 40 45
Ala Pro His Ser Ala Gly Leu Ser Pro Gly Ala Cys Arg Pro Ala Cys
50 55 60
Thr Cys Ile Ser Met Thr Thr Ile Ser Arg Ala Thr Trp
65 70 75
<210> 29
<211> 11
<212> PRT
<213> Homo sapiens
<400> 29
Thr Ala Lys Lys Ser Pro Thr Ser Phe Cys Cys
1 5 10
<210> 30
<211> 38
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 30
Arg Lys Arg Lys Arg Glu Lys Arg Ser Gln Lys Ser Arg Gln Asn His
1 5 10 15
Leu Gln Leu Lys Ser Cys Arg Arg Lys Ile Ser Asn Trp Ser Lys Leu
20 25 30
Arg Ser Pro Trp Ile Phe
35
<210> 31
<211> 18
<212> PRT
<213> Homo sapiens
<400> 31
Arg His Pro Ser Trp Pro Trp Thr Arg Cys Leu Arg Met Arg Pro Pro
1 5 10 15
Arg Ser
<210> 32
<211> 16
<212> PRT
<213> Homo sapiens
<400> 32
Ser Asn Gly Met Glu Ala Cys Gly Thr His Pro Thr Pro Arg Leu Ser
1 5 10 15
<210> 33
<211> 30
<212> PRT
<213> Homo sapiens
<400> 33
Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro Thr Thr Gly Val Arg
1 5 10 15
Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp Pro Pro Arg
20 25 30
<210> 34
<211> 53
<212> PRT
<213> Homo sapiens
<400> 34
Ala Leu Arg Ser Met Pro Lys Ser Arg Asn Gln Val Leu Phe Arg Arg
1 5 10 15
Asn Leu Thr Pro Ser Gln Leu Arg Thr Leu Ala Pro Pro Tyr Met Leu
20 25 30
Leu Pro Gln Ser Leu Ser Gln Ser Leu Ser Arg Lys Gln Ile Pro Ser
35 40 45
Gln Ser Met Leu Val
50
<210> 35
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 35
Leu Gln Ala His Pro Gln Val Pro Ala Leu Ala Pro Gln Ala Trp Trp
1 5 10 15
Pro Ala Arg Arg Gly Pro Leu Thr Ser Ala Pro Ser Ala Gln Gln Ser
20 25 30
Leu Thr
<210> 36
<211> 27
<212> PRT
<213> Homo sapiens
<400> 36
Cys Thr Asn Leu Ser Val Pro Met Met Leu Thr Ile Leu Ile Trp Lys
1 5 10 15
Arg Val Phe Ile Leu Leu Leu Ser Asp Lys Lys
20 25
<210> 37
<211> 9
<212> PRT
<213> Homo sapiens
<400> 37
Pro Leu Phe Phe His Gly Asp Leu Cys
1 5
<210> 38
<211> 9
<212> PRT
<213> Homo sapiens
<400> 38
Val Ser Lys Lys Arg Leu Pro Lys Leu
1 5
<210> 39
<211> 11
<212> PRT
<213> Homo sapiens
<400> 39
Arg Arg Lys Lys Arg Glu Asp His Cys Gly Leu
1 5 10
<210> 40
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 40
Cys Leu Arg Val Arg Cys Gly Gly Trp Leu Cys Gly Trp Thr Pro Arg
1 5 10 15
Gly
<210> 41
<211> 16
<212> PRT
<213> Homo sapiens
<400> 41
Arg Glu Ser Thr Leu Gly Asn Phe Trp Met Lys Leu Leu Gln Leu Pro
1 5 10 15
<210> 42
<211> 10
<212> PRT
<213> Homo sapiens
<400> 42
Ala Ser Ser Pro Gly His Pro Leu Gly Pro
1 5 10
<210> 43
<211> 56
<212> PRT
<213> Homo sapiens
<400> 43
Gln Trp Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln Glu Arg Gly
1 5 10 15
Cys Ser Ser Trp Leu Met Lys Gln Thr Trp Met Lys Ser Trp Ser Leu
20 25 30
Arg Asp Pro Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser Thr Arg Val
35 40 45
Leu Trp Met Pro Thr Ser Thr Val
50 55
<210> 44
<211> 31
<212> PRT
<213> Homo sapiens
<400> 44
Asn Ile Arg Lys Leu Ile Trp Thr Lys Gln Arg Ser Phe Leu Ser Leu
1 5 10 15
Phe Pro Lys Leu Arg Ala Thr Glu Gln Met Thr Asn Val Gly Cys
20 25 30
<210> 45
<211> 11
<212> PRT
<213> Homo sapiens
<400> 45
Val Val Ile Asn Leu Lys Arg Leu Gln Lys Phe
1 5 10
<210> 46
<211> 39
<212> PRT
<213> Homo sapiens
<400> 46
Asn Gly Ile Trp Glu Val Met Pro Arg Thr Leu Glu Gly Cys Ile Ser
1 5 10 15
Val Lys Asp His Arg Thr Ser Gln Asn His Ser Lys Cys Ile Thr Glu
20 25 30
Cys Val Arg Thr Ala Leu Asn
35
<210> 47
<211> 13
<212> PRT
<213> Homo sapiens
<400> 47
Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys Asn Leu
1 5 10
<210> 48
<211> 18
<212> PRT
<213> Homo sapiens
<400> 48
His Gln Met Lys Cys Leu Thr Ala Val Asp Cys Leu Gln Ala Phe Trp
1 5 10 15
Asp Met
<210> 49
<211> 11
<212> PRT
<213> Homo sapiens
<400> 49
Lys Asn Lys Lys Arg Arg Lys Leu Arg Pro Lys
1 5 10
<210> 50
<211> 28
<212> PRT
<213> Homo sapiens
<400> 50
Thr Gly Met Glu Ile Leu Leu Trp Ile Leu Leu Lys Met Glu Ile Gln
1 5 10 15
Ile Phe Lys Ile Cys Leu Gly Glu Met Gln Leu Cys
20 25
<210> 51
<211> 43
<212> PRT
<213> Homo sapiens
<400> 51
Gln Arg Lys Val Val Lys Asn Pro Ser Gln Pro Val Pro Leu Arg Asn
1 5 10 15
Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr Arg Ser Cys Ser Ile Ser
20 25 30
Leu Lys Lys Ser Leu Glu Lys Met Pro Leu Met
35 40
<210> 52
<211> 20
<212> PRT
<213> Homo sapiens
<400> 52
Arg Glu Lys Ile Ile Asn Pro Thr Ile Ser Cys Pro Phe Gln Ser Pro
1 5 10 15
Thr Lys Arg Leu
20
<210> 53
<211> 62
<212> PRT
<213> Homo sapiens
<400> 53
Arg Glu Trp Glu Lys Arg Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr
1 5 10 15
Lys Glu Tyr Phe Leu Lys Arg Ile Leu Ile Arg Lys Ala Met Thr Val
20 25 30
Leu Ala Gly Asp Lys Lys Gly Leu Gly Arg Phe Met Arg Cys Val Gln
35 40 45
Ser Glu Thr Lys Ala Val Ser Leu Gln Leu Pro Leu Gly Arg
50 55 60
<210> 54
<211> 8
<212> PRT
<213> Homo sapiens
<400> 54
Asn Ala Lys Lys Met Pro Phe Gln
1 5
<210> 55
<211> 8
<212> PRT
<213> Homo sapiens
<400> 55
Ala Asp Lys Lys Asn Val Arg Ser
1 5
<210> 56
<211> 12
<212> PRT
<213> Homo sapiens
<400> 56
Gln Glu Lys Lys Ser Arg Lys Leu Met Ser Ser Cys
1 5 10
<210> 57
<211> 8
<212> PRT
<213> Homo sapiens
<400> 57
Ile Gln Lys Lys Lys Gln Lys Ser
1 5
<210> 58
<211> 43
<212> PRT
<213> Homo sapiens
<400> 58
Thr Glu Ile Gln Leu Thr Met Asn Asp Ser Lys His Lys Leu Glu Ser
1 5 10 15
Pro Ala Leu Lys Gln Val Ser Pro Ala Ser Pro Pro Thr Gln Gln Pro
20 25 30
Gln Thr Pro Gln Asp Ser Arg Gln Val Leu Ala
35 40
<210> 59
<211> 46
<212> PRT
<213> Homo sapiens
<400> 59
His Trp Asn Ser Ala Tyr Leu Gly Arg Thr Leu Leu Val Thr Cys Ile
1 5 10 15
Leu Tyr His Arg Trp Ile Val Thr Ser Met Cys Gln Ser Gln Arg Trp
20 25 30
Leu Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu Met Trp Thr
35 40 45
<210> 60
<211> 13
<212> PRT
<213> Homo sapiens
<400> 60
Arg Lys Ser Gly Val Met Lys Cys Trp Asp Leu Cys Pro
1 5 10
<210> 61
<211> 13
<212> PRT
<213> Homo sapiens
<400> 61
Cys Gln Lys Lys Val Pro Ser Ala Ser Pro Trp Gly Leu
1 5 10
<210> 62
<211> 10
<212> PRT
<213> Homo sapiens
<400> 62
Arg Leu Pro Cys Lys Val Thr Glu Ser Ser
1 5 10
<210> 63
<211> 15
<212> PRT
<213> Homo sapiens
<400> 63
Asn Gln Gln Leu Lys Trp Thr Pro His Ile Leu Lys Ser Ala Ser
1 5 10 15
<210> 64
<211> 22
<212> PRT
<213> Homo sapiens
<400> 64
Asn Met Glu His Arg Leu Thr Met Asp Ser Ala Leu Ser Leu Thr Lys
1 5 10 15
Arg Glu Gly Pro Glu Thr
20
<210> 65
<211> 22
<212> PRT
<213> Homo sapiens
<400> 65
Pro Ala Cys Thr Ser Lys Ala Trp Thr Pro Arg Lys Leu Val Gly Arg
1 5 10 15
Ala Val Arg Arg Lys Gly
20
<210> 66
<211> 12
<212> PRT
<213> Homo sapiens
<400> 66
Phe Lys Lys Lys Lys Pro Leu Thr Phe Ser Pro Ser
1 5 10
<210> 67
<211> 8
<212> PRT
<213> Homo sapiens
<400> 67
Gln Arg Pro Pro Leu Gln Pro Val
1 5
<210> 68
<211> 8
<212> PRT
<213> Homo sapiens
<400> 68
Leu Lys Lys Lys Tyr Leu Val Gln
1 5
<210> 69
<211> 50
<212> PRT
<213> Homo sapiens
<400> 69
Thr Ser Arg Ile Leu Asn Leu Gln Val Leu Lys Lys Ile Leu Arg Ser
1 5 10 15
Phe Met Lys Leu Tyr His Ser Leu Val Met Cys Leu Arg Leu Arg Thr
20 25 30
Lys Leu Glu Lys Ala Leu Ser Ala Leu Phe Ile Trp Pro Gln His Ser
35 40 45
Tyr Lys
50
<210> 70
<211> 40
<212> PRT
<213> Homo sapiens
<400> 70
Ser Thr Arg Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly
1 5 10 15
Pro Trp Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys
20 25 30
Leu Arg Leu Arg Asn Thr Ser Pro
35 40
<210> 71
<211> 16
<212> PRT
<213> Homo sapiens
<400> 71
Asn Ser Arg Lys Lys Leu Leu Glu Asp Met Lys Gln Asn Gly Phe Thr
1 5 10 15
<210> 72
<211> 10
<212> PRT
<213> Homo sapiens
<400> 72
Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu
1 5 10
<210> 73
<211> 11
<212> PRT
<213> Homo sapiens
<400> 73
Asp Lys Lys Lys Lys Ser Thr Glu Lys Thr Lys
1 5 10
<210> 74
<211> 32
<212> PRT
<213> Homo sapiens
<400> 74
Thr Pro Leu Ser Ile Ser Arg Pro Thr Ser Arg Ala Arg Gln Ser Cys
1 5 10 15
Cys Leu Pro Gly Leu Thr His Pro Ala His Gln Pro Leu Gly Ser Met
20 25 30
<210> 75
<211> 11
<212> PRT
<213> Homo sapiens
<400> 75
Arg Tyr Lys Lys Arg Gly Val Ile Ala Trp Arg
1 5 10
<210> 76
<211> 8
<212> PRT
<213> Homo sapiens
<400> 76
His Leu Lys Lys Thr Ser Ala Lys
1 5
<210> 77
<211> 15
<212> PRT
<213> Homo sapiens
<400> 77
Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp Phe Ser Ala Pro Gln
1 5 10 15
<210> 78
<211> 31
<212> PRT
<213> Homo sapiens
<400> 78
Gly Gln Ala Phe Gly Ser Leu Cys Gln Leu Val Ser Ala Asp Phe Ser
1 5 10 15
Ala Pro Gln Val Thr Arg Leu Arg Ser Leu Asn His Leu Leu Ile
20 25 30
<210> 79
<211> 19
<212> PRT
<213> Homo sapiens
<400> 79
Gly His Arg Glu Gly Ser Glu Ser Asp Asn Leu Gly Leu Leu Tyr Ser
1 5 10 15
Phe Pro Pro
<210> 80
<211> 8
<212> PRT
<213> Homo sapiens
<400> 80
Ser Glu Lys Lys Arg Lys Leu Pro
1 5
<210> 81
<211> 62
<212> PRT
<213> Homo sapiens
<400> 81
Thr Tyr Met Glu Met His Tyr Gly His Gln Ala Pro Gln Val Ala Met
1 5 10 15
Leu Pro Lys Leu Leu Cys Arg Gln Met Leu Pro Thr Leu Ser Thr Leu
20 25 30
Gln Gln Arg His Pro Gln Gly Pro Cys Pro Pro Pro Val Thr Pro Leu
35 40 45
Arg Val Gln Ser Val Leu Leu Leu Gly Val Pro Gln Thr Ala
50 55 60
<210> 82
<211> 62
<212> PRT
<213> Homo sapiens
<400> 82
Met Cys Ser Ser Leu Ala Leu Pro Thr Gly Leu Thr Ser Leu Ile Leu
1 5 10 15
Pro Ser Ser Asp Leu Ala Val Leu Ile Ser Ser Ser Thr Ser His Phe
20 25 30
Leu Met Arg Ser Pro Val Leu Pro Ser Ser Arg Leu Thr Cys Ala Ser
35 40 45
Pro Gln Leu Pro Arg Met Trp Thr Trp Ser Ser Trp Leu Lys
50 55 60
<210> 83
<211> 14
<212> PRT
<213> Homo sapiens
<400> 83
Trp Leu Lys Asn Trp Lys Arg Phe Lys Leu Lys Lys Lys Tyr
1 5 10
<210> 84
<211> 11
<212> PRT
<213> Homo sapiens
<400> 84
Arg Arg Asn Leu Gln Arg Asn Leu Lys Val Leu
1 5 10
<210> 85
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 85
Tyr Pro Arg Leu Lys Thr Phe Gly Val Pro Leu Gly Ser Ile Leu Cys
1 5 10 15
Leu Ala Gly Ser Leu Ser Thr Met Met Ile Ile Ser Thr Thr Arg Gln
20 25 30
Glu Cys Gly Arg Arg Ala Ser Val Pro Cys Arg Pro Met Ile Gly Ser
35 40 45
Ala Arg Pro Gly Pro Trp Arg Thr Ser Ala Met Pro Ser Ala Met Gly
50 55 60
Val Ala Leu Pro Thr Ser Cys Glu Ser Gly Arg Ser Pro Pro Ala Thr
65 70 75 80
Gly Gly Arg Met Pro Gly Ser Gln Ser Ile Met Met Ser Trp Met Pro
85 90 95
Pro Leu Ala Pro Cys Ala Ala Cys Pro Cys Ser Pro Ala Pro Thr Leu
100 105 110
Cys Pro Ala His Pro Ala Arg Ala Pro Thr Ala Val Pro Ala Phe Thr
115 120 125
Pro Leu Ser Ala His Pro Val Pro Val Leu Ser Gly Cys His Leu Ala
130 135 140
Val Arg Thr Ser Met Leu Thr Leu Leu Pro Met
145 150 155
<210> 86
<211> 15
<212> PRT
<213> Homo sapiens
<400> 86
Val Leu Phe Lys Ala Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly
1 5 10 15
<210> 87
<211> 13
<212> PRT
<213> Homo sapiens
<400> 87
Arg Arg Ser Lys Ile Glu Ala Ser Pro Ile Gly Ser Ile
1 5 10
<210> 88
<211> 10
<212> PRT
<213> Homo sapiens
<400> 88
Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe
1 5 10
<210> 89
<211> 19
<212> PRT
<213> Homo sapiens
<400> 89
Gln Ala Pro Leu Arg Leu Trp Ser Trp Cys Gly Thr Ser Gln Thr Tyr
1 5 10 15
Phe Gly Ser
<210> 90
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 90
Gly Lys Gly Leu Thr His Pro Val Pro Leu Lys Arg Thr Leu Gln Asn
1 5 10 15
Lys Arg Asn Lys Asn Ile Lys Arg Val Asn Gln Lys Lys Gly Asn Ile
20 25 30
Lys Arg Lys Ser Ile Leu Leu His Leu Ile Val Leu Asn Ser Pro Glu
35 40 45
Ser Asn
50
<210> 91
<211> 13
<212> PRT
<213> Homo sapiens
<400> 91
Thr Pro Pro Pro Leu Ile Leu Trp Pro Gln Ala Ala Pro
1 5 10
<210> 92
<211> 10
<212> PRT
<213> Homo sapiens
<400> 92
Met Ser Arg Thr Pro Pro Arg Arg Val Cys
1 5 10
<210> 93
<211> 8
<212> PRT
<213> Homo sapiens
<400> 93
Leu Ala Lys Lys Thr Leu Thr Asn
1 5
<210> 94
<211> 32
<212> PRT
<213> Homo sapiens
<400> 94
Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr Ser Pro Leu Trp Lys Ile
1 5 10 15
Thr Met Val Leu Thr Tyr Pro Asn Cys Val Val His Val Leu Met Phe
20 25 30
<210> 95
<211> 30
<212> PRT
<213> Homo sapiens
<400> 95
Val Ser Val Ile Thr Met Lys Leu Trp Glu Lys His Phe Lys Gly Leu
1 5 10 15
Asn Trp Asn Leu Val Val Trp Ile Leu Asn Leu Lys Met Met
20 25 30
<210> 96
<211> 23
<212> PRT
<213> Homo sapiens
<400> 96
Ile Ile Cys Ile Lys Asn Met Phe Leu Gln Arg Lys Gly Phe Leu Asn
1 5 10 15
Leu Ser His Val Glu Lys Phe
20
<210> 97
<211> 12
<212> PRT
<213> Homo sapiens
<400> 97
Leu Lys Lys Lys Pro Arg Asp Ile Cys Arg Ile Ser
1 5 10
<210> 98
<211> 12
<212> PRT
<213> Homo sapiens
<400> 98
Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln
1 5 10
<210> 99
<211> 30
<212> PRT
<213> Homo sapiens
<400> 99
Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp Ser Arg Ser Phe Phe Thr
1 5 10 15
Ser Ala His Pro Ser Arg Pro Cys Arg Met Arg Leu Tyr Gln
20 25 30
<210> 100
<211> 24
<212> PRT
<213> Homo sapiens
<400> 100
Asn Pro Arg Arg Lys Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln Lys
1 5 10 15
Pro Ser Gln Lys Asn His Leu Tyr
20
<210> 101
<211> 11
<212> PRT
<213> Homo sapiens
<400> 101
Ile Ala Lys Lys Arg Ile Lys Leu Arg Arg Asn
1 5 10
<210> 102
<211> 10
<212> PRT
<213> Homo sapiens
<400> 102
Phe Asp Lys Lys Gly Phe Val Ile Leu Ser
1 5 10
<210> 103
<211> 12
<212> PRT
<213> Homo sapiens
<400> 103
Gly Ser Pro Pro Leu His Leu Cys Gln Pro Leu Arg
1 5 10
<210> 104
<211> 9
<212> PRT
<213> Homo sapiens
<400> 104
Glu Leu Lys Lys Asn Leu Leu Leu Pro
1 5
<210> 105
<211> 77
<212> PRT
<213> Homo sapiens
<400> 105
Arg His Pro His Arg Ser Pro Pro Thr Ser Cys Pro Pro Leu Leu Glu
1 5 10 15
Ala Phe Pro Leu Pro Arg Ala Ser Leu Arg Ala Thr Val Pro Arg His
20 25 30
Ser Ser Val Leu Ala Thr Gly Leu His Leu His Arg Gln Ile Ser Leu
35 40 45
Pro Leu Arg Gly Phe Leu Leu His Gln Pro Leu Pro Gly Gln His Leu
50 55 60
Trp Leu Ser His Arg Leu Arg Leu Arg Leu Pro Arg Thr
65 70 75
<210> 106
<211> 13
<212> PRT
<213> Homo sapiens
<400> 106
Ala Ala Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp
1 5 10
<210> 107
<211> 14
<212> PRT
<213> Homo sapiens
<400> 107
Leu Pro Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser Arg His
1 5 10
<210> 108
<211> 25
<212> PRT
<213> Homo sapiens
<400> 108
Ile Thr His Pro Phe Ala Ser Gln Pro Leu Gly Gln Glu Met Pro Asn
1 5 10 15
Asn Thr Gln Ile Arg Leu Leu Lys Pro
20 25
<210> 109
<211> 20
<212> PRT
<213> Homo sapiens
<400> 109
Arg Ala Phe Ile His Thr Pro Arg Ser Pro Gly Cys Ser Val Tyr Ala
1 5 10 15
Asn Met Cys Trp
20
<210> 110
<211> 18
<212> PRT
<213> Homo sapiens
<400> 110
Met Thr Leu Lys Ala Leu Val Lys Thr Trp Thr Gln Phe Arg Asn Tyr
1 5 10 15
Pro Arg
<210> 111
<211> 19
<212> PRT
<213> Homo sapiens
<400> 111
Ala Phe Trp Lys Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr
1 5 10 15
Gly Cys Trp
<210> 112
<211> 10
<212> PRT
<213> Homo sapiens
<400> 112
Phe Glu Lys Lys Arg Pro Glu Trp Leu Ser
1 5 10
<210> 113
<211> 9
<212> PRT
<213> Homo sapiens
<400> 113
Met Ala Lys Lys Ser Gln Gln Pro Leu
1 5
<210> 114
<211> 9
<212> PRT
<213> Homo sapiens
<400> 114
Glu Ala Lys Lys Ser Met Lys Arg Ser
1 5
<210> 115
<211> 125
<212> PRT
<213> Homo sapiens
<400> 115
Arg Lys Arg Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile Gln
1 5 10 15
Glu Lys Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe Glu Ala
20 25 30
Cys Arg Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile Thr Leu Phe
35 40 45
Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn Val Leu Cys Val Arg
50 55 60
Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys Arg Lys Met Lys Arg
65 70 75 80
Asn Gln Val Ala Ser Pro Gln Ile Met Gln Arg Leu Phe Ile Lys Gly
85 90 95
Tyr Gln Asn Asn His Phe Thr Phe His Leu Gln Asn Phe Ala Phe Phe
100 105 110
Ser Ser Phe Gly Asn Asn Lys Tyr Ile Asn Ile Leu Thr
115 120 125
<210> 116
<211> 17
<212> PRT
<213> Homo sapiens
<400> 116
Ala Ser Pro Gln Ile Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr
1 5 10 15
Ile
<210> 117
<211> 35
<212> PRT
<213> Homo sapiens
<400> 117
Ala Ser Pro Gln Ile Met Gln Arg Thr Ser Ala Asp Arg Phe Arg Met
1 5 10 15
Lys Arg Arg Met Gln Asn Leu Asp Asn Leu Gly Val Pro Trp Pro Leu
20 25 30
Leu Pro Gly
35
<210> 118
<211> 45
<212> PRT
<213> Homo sapiens
<400> 118
Gly Asp Cys Pro Arg Thr Met Ala Gly Pro Ser Ala Ser Leu His Pro
1 5 10 15
Ala Ser Gly Arg Ala Ser Arg Lys Thr Trp Gln Arg Arg Leu Arg Ala
20 25 30
Cys Arg Ala Gly Gly Pro Ala Gly Trp Ala Arg Gln Ala
35 40 45
<210> 119
<211> 12
<212> PRT
<213> Homo sapiens
<400> 119
Gly Glu Lys Leu Lys His Cys Phe Lys Ala Trp Gly
1 5 10
<210> 120
<211> 10
<212> PRT
<213> Homo sapiens
<400> 120
Met Leu Asn Gln Lys Cys Leu Ala Pro Phe
1 5 10
<210> 121
<211> 10
<212> PRT
<213> Homo sapiens
<400> 121
Ser Leu Ile Leu Ser Phe Gln Arg Val Lys
1 5 10
<210> 122
<211> 8
<212> PRT
<213> Homo sapiens
<400> 122
Gly Ala Lys Lys Ile Thr Phe Leu
1 5
<210> 123
<211> 43
<212> PRT
<213> Homo sapiens
<400> 123
Trp Trp Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys Lys
1 5 10 15
Val Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys Gly
20 25 30
Ile Cys Trp Lys Trp Pro Val Thr Val Ala Ala
35 40
<210> 124
<211> 16
<212> PRT
<213> Homo sapiens
<400> 124
Arg Thr Leu Glu Ser Ala Gly Leu Phe Pro Trp Leu His Thr Gln Cys
1 5 10 15
<210> 125
<211> 12
<212> PRT
<213> Homo sapiens
<400> 125
Ser Gln Lys Lys Asp Pro Ala Gly Lys Leu Lys Lys
1 5 10
<210> 126
<211> 12
<212> PRT
<213> Homo sapiens
<400> 126
Pro Ile Pro Pro His Leu Arg His Pro Leu Leu Leu
1 5 10
<210> 127
<211> 30
<212> PRT
<213> Homo sapiens
<400> 127
Val Pro Met Ser Leu Ala Cys Ser Ile Thr Val Ser Phe Val Gly Gln
1 5 10 15
Ile Ser Thr Leu Val Leu Asp Val Ser Ser Ile Ser His Trp
20 25 30
<210> 128
<211> 8
<212> PRT
<213> Homo sapiens
<400> 128
Asp Ser Lys Lys Met Thr Gln Lys
1 5
<210> 129
<211> 64
<212> PRT
<213> Homo sapiens
<400> 129
Arg Ser Leu Leu Tyr Ser Arg Met Cys Leu Val Gln Ile Pro Thr His
1 5 10 15
Thr Trp Glu Pro Asp Tyr Phe Val Ser Leu Pro Met Met Phe Ser Trp
20 25 30
Ala Thr Gln Ser Phe Pro Val Gly Ala Val Phe Leu Thr Arg Pro Ala
35 40 45
Ile Pro Cys Cys Ser Cys Thr Ser His Ser Asn Pro Trp Ser Gln Ser
50 55 60
<210> 130
<211> 29
<212> PRT
<213> Homo sapiens
<400> 130
Arg Arg Arg Asn Ser Arg Lys Gln Ser Gln Val Gln Leu Ala Ile Gln
1 5 10 15
Val Leu Leu Val Asp Lys His Lys Tyr Phe Leu Phe Gly
20 25
<210> 131
<211> 11
<212> PRT
<213> Homo sapiens
<400> 131
Arg Leu Asp Phe His Pro Arg Ser Ser Ser Gly
1 5 10
<210> 132
<211> 10
<212> PRT
<213> Homo sapiens
<400> 132
Ile Leu Ala Met Thr Leu Thr Leu Asn Gly
1 5 10
<210> 133
<211> 10
<212> PRT
<213> Homo sapiens
<400> 133
Gln Arg Pro Pro Arg Ser Ile Leu Ser Leu
1 5 10
<210> 134
<211> 11
<212> PRT
<213> Homo sapiens
<400> 134
Leu Glu Lys Lys Ala Thr Trp Met Arg Arg Thr
1 5 10
<210> 135
<211> 44
<212> PRT
<213> Homo sapiens
<400> 135
Gly Ala Ala Ala Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr
1 5 10 15
Thr Pro Ser Ser Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln
20 25 30
Ser Lys Lys Thr Met Thr Ala Ala Gly Leu Thr Pro
35 40
<210> 136
<211> 28
<212> PRT
<213> Homo sapiens
<400> 136
Ile Glu Ala Leu Thr Ala Leu Phe Thr Cys Arg Thr Ala Ser Ile Ser
1 5 10 15
Val Asn Ile Ser Thr Leu Met Ser Ile Leu Glu Ala
20 25
<210> 137
<211> 30
<212> PRT
<213> Homo sapiens
<400> 137
Ala Phe Ser Gly Arg Ile Leu His Gln Pro Glu Met Ala Ala Met Arg
1 5 10 15
Leu Met Pro Lys Phe Leu Asn Ser Thr Asn Ser Trp Trp Thr
20 25 30
<210> 138
<211> 17
<212> PRT
<213> Homo sapiens
<400> 138
Ile Leu Phe His Val Arg Asn Ile Val Tyr Gly Ile Gln Val Met Leu
1 5 10 15
Cys
<210> 139
<211> 25
<212> PRT
<213> Homo sapiens
<400> 139
Gln Asn Thr Arg Ser Thr Asn Leu Glu Lys Asn Pro Ser Leu Lys Lys
1 5 10 15
Gln Ser Gln Arg Arg Gly Lys Leu Ser
20 25
<210> 140
<211> 30
<212> PRT
<213> Homo sapiens
<400> 140
Arg Pro Ser Pro Cys Leu Ser Trp Ser Ser Arg Ile Val Ala Pro Gly
1 5 10 15
His Ala Leu Ser Cys Arg Thr Arg Arg Arg Trp Ser Ser Lys
20 25 30
<210> 141
<211> 10
<212> PRT
<213> Homo sapiens
<400> 141
Asn Lys Val Arg Gln Asn Phe Lys Arg Asn
1 5 10
<210> 142
<211> 13
<212> PRT
<213> Homo sapiens
<400> 142
Ile Tyr Pro Pro Ser Thr Cys Ser Leu Pro Cys Arg Gly
1 5 10
<210> 143
<211> 12
<212> PRT
<213> Homo sapiens
<400> 143
Val Asp Pro Pro Gly Ser Val Trp Ile Leu Pro Cys
1 5 10
<210> 144
<211> 12
<212> PRT
<213> Homo sapiens
<400> 144
Ile Ile Lys Lys Met Lys Lys Arg Ile Met Val His
1 5 10
<210> 145
<211> 9
<212> PRT
<213> Homo sapiens
<400> 145
Lys Gly Lys Lys Arg Arg Lys Glu Ile
1 5
<210> 146
<211> 11
<212> PRT
<213> Homo sapiens
<400> 146
Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile Phe
1 5 10
<210> 147
<211> 8
<212> PRT
<213> Homo sapiens
<400> 147
Arg Gly Pro Pro Leu His Thr Arg
1 5
<210> 148
<211> 170
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 148
Asn Glu Gly Asn Asn His Trp Pro Arg Val Glu Met Pro Thr Gly Trp
1 5 10 15
Leu Leu Val Gly Tyr Asn Thr Arg Asn Thr Ala Gln Asn Pro Arg Leu
20 25 30
Gln Gln His Leu Lys His Trp Gln Gln Cys Thr Arg Ala Arg Trp Cys
35 40 45
Gln Glu Pro Cys Gln Thr Leu Thr Phe Phe His Phe Phe Phe Phe Phe
50 55 60
Lys Thr Val Ser Leu Cys Cys Pro Gly Trp Ser Lys Gly Gln Pro Pro
65 70 75 80
Pro Pro Gly Leu Lys Pro Ser Ser Leu Ala Ser Gln Val Ala Arg Thr
85 90 95
Thr Gly Val Tyr Gln His Val Trp Leu Ile Cys Phe Val Phe Phe Val
100 105 110
Cys Val Glu Thr Gly Phe Cys His Val Ala Gln Val Gly Leu Glu Arg
115 120 125
Leu Val Ser Leu Ser Gly Ile Thr Asp Val Asn His Trp Ala Gln Pro
130 135 140
Lys Pro Ser Pro Ser Lys Gly Thr Gly Met Asn Arg Pro Ile Gly Leu
145 150 155 160
Arg Val Gly Lys Gly Val Trp Ala Arg Leu
165 170
<210> 149
<211> 78
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 149
Arg Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys Met Met Met Met
1 5 10 15
Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg Arg Met Thr Met Met
20 25 30
Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr Cys Leu Thr Pro Arg Thr
35 40 45
Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln Thr Ile Ser Gln Arg Arg
50 55 60
Pro Ile Gln Thr Pro Pro Gly Thr Ser Leu Ala Ile Trp Gly
65 70 75
<210> 150
<211> 40
<212> PRT
<213> Homo sapiens
<400> 150
Arg Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser His Leu Ile Ala
1 5 10 15
His Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe His Pro Arg Leu
20 25 30
Leu Thr Arg Lys Lys Pro Gly Lys
35 40
<210> 151
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 151
Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr Cys Arg Met Trp Trp
1 5 10 15
<210> 152
<211> 25
<212> PRT
<213> Homo sapiens
<400> 152
Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe Ser Arg Arg Gly
1 5 10 15
Met Lys Ser Ser Val Arg Leu Lys Asn
20 25
<210> 153
<211> 27
<212> PRT
<213> Homo sapiens
<400> 153
Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro Phe Phe Arg Gly Ser
1 5 10 15
Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys
20 25
<210> 154
<211> 30
<212> PRT
<213> Homo sapiens
<400> 154
Trp Leu Pro Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly Phe Gln
1 5 10 15
Trp Gly Glu Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly
20 25 30
<210> 155
<211> 10
<212> PRT
<213> Homo sapiens
<400> 155
Glu Glu Lys Lys Asn Gly Arg Ile Ser Ser
1 5 10
<210> 156
<211> 13
<212> PRT
<213> Homo sapiens
<400> 156
Thr Met Ser Leu Ser Asn Ile Leu Met Lys Phe Arg Leu
1 5 10
<210> 157
<211> 16
<212> PRT
<213> Homo sapiens
<400> 157
Arg Trp Ile Phe Ser Asn Gln Leu Thr Val Gln Met Leu Cys Leu Pro
1 5 10 15
<210> 158
<211> 114
<212> PRT
<213> Homo sapiens
<400> 158
Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe Ser Asn Gln Leu Gln Thr
1 5 10 15
Val Gln Met Leu Cys Leu Pro Pro Leu Lys Gln Gly Glu Arg Ile Ile
20 25 30
Trp Pro Leu Gly Gly Phe Gln Ile Pro Asn Phe Phe Trp Ser Leu Gly
35 40 45
Ile Gly His Thr Gly Ala Trp Trp His Thr Gly Arg Arg Arg Arg Glu
50 55 60
Trp Gly Gly Ser Thr Val Ser Arg Ser Pro Leu Trp Ile Ser Ser Met
65 70 75 80
Ile Tyr Leu Arg Gly Met Ala Phe Ala Ser Asp Ser Ser Ile Arg Thr
85 90 95
Thr Arg Val Ser Trp Cys Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala
100 105 110
Ser Ser
<210> 159
<211> 13
<212> PRT
<213> Homo sapiens
<400> 159
Ile Pro Ser Leu Asn Ala Gln Trp Met Phe Leu Arg Ile
1 5 10
<210> 160
<211> 20
<212> PRT
<213> Homo sapiens
<400> 160
Ser Arg Arg Asn Arg Arg Tyr Arg Lys Ile Tyr Gly Glu Leu Lys Met
1 5 10 15
Ser Leu Gln Ala
20
<210> 161
<211> 16
<212> PRT
<213> Homo sapiens
<400> 161
Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr Asp
1 5 10 15
<210> 162
<211> 13
<212> PRT
<213> Homo sapiens
<400> 162
Phe Leu Pro Ser Arg Phe Pro Trp Gly Pro Pro Pro Leu
1 5 10
<210> 163
<211> 45
<212> PRT
<213> Homo sapiens
<400> 163
Asn Ser Val Ile Val His Lys Ile Val Leu Val Phe Leu Lys Ser Leu
1 5 10 15
Ser Ser Tyr Asn Cys Glu Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala
20 25 30
Ile Glu Phe Ala Val Leu Lys Leu Leu Asn Met Asp Leu
35 40 45
<210> 164
<211> 61
<212> PRT
<213> Homo sapiens
<400> 164
Val Ala Pro Arg Cys Pro Arg Ser Ala Val Asp Ile Ser Pro Gly Pro
1 5 10 15
Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser Val Ala Ile Gly Lys Leu
20 25 30
Ala Leu Leu Gly Ala Ser Ala Pro Cys Gly Ala Ala Gly Ala Arg Glu
35 40 45
Ala Gly Arg Phe Ala Val Leu Gly Thr Met Val Met Lys
50 55 60
<210> 165
<211> 27
<212> PRT
<213> Homo sapiens
<400> 165
Ser Pro Leu Trp Asp Cys Ser Thr Thr Thr Gly Thr His His Gly Cys
1 5 10 15
Leu Trp Glu Ile Pro Ser Val Thr Leu Leu Ala
20 25
<210> 166
<211> 26
<212> PRT
<213> Homo sapiens
<400> 166
Thr Leu Ala Ile Arg Phe Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr
1 5 10 15
Val Thr Ala Ala Pro Ser Gly Gln Tyr Phe
20 25
<210> 167
<211> 46
<212> PRT
<213> Homo sapiens
<400> 167
Leu Leu Leu Ala His Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys
1 5 10 15
Gly Glu Cys Val Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile
20 25 30
Leu Lys Gln Pro Leu Asp Leu Lys Ile Ser Lys Thr Phe Met
35 40 45
<210> 168
<211> 9
<212> PRT
<213> Homo sapiens
<400> 168
Ser Leu Phe Phe Ser His Cys Leu Cys
1 5
<210> 169
<211> 9
<212> PRT
<213> Homo sapiens
<400> 169
Leu Lys Lys Lys Val Asn Ala Cys Ser
1 5
<210> 170
<211> 12
<212> PRT
<213> Homo sapiens
<400> 170
Asn Ala Lys Lys Met Glu Asp Met Ile Trp Glu Ser
1 5 10
<210> 171
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 171
Gly Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly Thr Pro
1 5 10 15
Arg Gly Asp Trp Lys Arg His Pro Pro Arg Arg
20 25
<210> 172
<211> 14
<212> PRT
<213> Homo sapiens
<400> 172
Met Ile Arg Lys Ile Gln Lys Arg Arg Arg Thr Ala Asn Arg
1 5 10
<210> 173
<211> 10
<212> PRT
<213> Homo sapiens
<400> 173
Thr Tyr Thr Pro His Ile Cys Arg His Thr
1 5 10
<210> 174
<211> 10
<212> PRT
<213> Homo sapiens
<400> 174
Met Lys Lys Lys Asp Ser Thr Ile Phe Ile
1 5 10
<210> 175
<211> 8
<212> PRT
<213> Homo sapiens
<400> 175
Leu Cys Phe Phe Tyr Leu Leu Tyr
1 5
<210> 176
<211> 11
<212> PRT
<213> Homo sapiens
<400> 176
Leu Thr Thr Leu Ser Phe Val Leu Ile Glu Glu
1 5 10
<210> 177
<211> 75
<212> PRT
<213> Homo sapiens
<400> 177
Asn Leu Asp Leu Gln His Gln Arg Arg Arg Lys Lys Lys Lys Asp Lys
1 5 10 15
Val Glu Ile Arg Asn Arg Ser Pro Lys Ala Asn Ser Thr Glu Cys Gln
20 25 30
Gly Glu His Ser Arg Glu Gln Asn Leu Leu Asn Leu Val Gln Leu Asn
35 40 45
Pro His Ser Pro His His Arg Lys Asp Glu Glu Asp His Gln Lys Arg
50 55 60
His His His His Asn Gln Lys Lys Met Ser Val
65 70 75
<210> 178
<211> 55
<212> PRT
<213> Homo sapiens
<400> 178
Ala Ser Arg Ala Gly Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly
1 5 10 15
Met Ser Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg Cys
20 25 30
Pro Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn Gly Trp His
35 40 45
Arg Ser Gly Leu Arg Ala Gln
50 55
<210> 179
<211> 68
<212> PRT
<213> Homo sapiens
<400> 179
Pro Tyr Pro Ile Ser Glu Gly Leu Thr Met Thr Thr Gly Arg Asn Ile
1 5 10 15
Asn Ser Asn Ser Leu Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu
20 25 30
Cys His His Ala Ile Met His Arg Lys Met Thr Ser Pro His Phe Arg
35 40 45
Leu Phe Ser Ser Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala
50 55 60
Leu Cys Lys Phe
65
<210> 180
<211> 24
<212> PRT
<213> Homo sapiens
<400> 180
Leu Lys Leu Ala Pro Leu Gln Val Thr Thr Thr Leu Lys Leu Ile Leu
1 5 10 15
Val Met Leu Glu Ile Val Thr Glu
20
<210> 181
<211> 42
<212> PRT
<213> Homo sapiens
<400> 181
Cys Arg Val Asn Ala Val Glu Glu Leu His Ser Arg Arg Met Ser Val
1 5 10 15
Arg Ile Val Lys Asn Trp Val Ser Cys Cys Tyr Val Arg Leu Ser Ala
20 25 30
Val Gly Leu Ser Thr Trp Ser Ala Leu Asp
35 40
<210> 182
<211> 27
<212> PRT
<213> Homo sapiens
<400> 182
Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro Leu His Arg Trp
1 5 10 15
Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg
20 25
<210> 183
<211> 14
<212> PRT
<213> Homo sapiens
<400> 183
Arg Lys Met Gln Ser Leu Asn His Pro Ser Arg Leu Thr Asn
1 5 10
<210> 184
<211> 19
<212> PRT
<213> Homo sapiens
<400> 184
Ser Arg Lys Lys Gly His Thr Lys Asn Arg Arg Lys Ala Lys Arg Lys
1 5 10 15
Pro Gln Ile
<210> 185
<211> 11
<212> PRT
<213> Homo sapiens
<400> 185
Asn Lys Ile Ile Cys Lys Gly His Arg Ile Thr
1 5 10
<210> 186
<211> 9
<212> PRT
<213> Homo sapiens
<400> 186
Ser Ser Phe Phe Tyr Thr Ser Asp Arg
1 5
<210> 187
<211> 9
<212> PRT
<213> Homo sapiens
<400> 187
Gln Lys Lys Gly His Met Ile Phe Ser
1 5
<210> 188
<211> 66
<212> PRT
<213> Homo sapiens
<400> 188
Met Leu Gln Lys Gln Cys Cys Tyr Asn Leu Val Ile Lys His Pro Leu
1 5 10 15
Ile Phe Arg Ile Asn Leu Arg Arg Gln Gly Lys Thr Lys Asp Gly Val
20 25 30
Val Gln Ser Leu Gly Phe Leu Asn Gln Gln Ile Ile Leu Gln Lys Glu
35 40 45
Phe Phe Ile Cys Leu Leu Met Phe Ile Lys Arg Trp Lys Pro Ala Ala
50 55 60
Thr Lys
65
<210> 189
<211> 146
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 189
His Pro Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser Leu Lys Gly
1 5 10 15
Ser Arg Thr Ser Cys Cys Pro Arg Ser His Pro Arg Leu Pro Arg Thr
20 25 30
Lys Trp Pro Leu Gln Cys Leu Leu His Ser Leu Gly Thr Thr Gly Thr
35 40 45
Leu Val Trp Glu Arg Gly Val Leu Gln Met Arg Ser Leu Glu Ala His
50 55 60
Cys Pro Leu Gln Thr Phe His Leu His His Cys Arg Thr Gln Pro Ser
65 70 75 80
Ser Cys Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp Ser Gly Ala
85 90 95
Val Val Gly Leu Arg Pro Val Ala His His Leu Pro Arg Pro Ile Gln
100 105 110
Gly Leu His Cys Pro Gln Ala Pro His Gln Pro Ala Leu Ser Trp Gly
115 120 125
Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys Arg Trp Pro
130 135 140
Arg Arg
145
<210> 190
<211> 78
<212> PRT
<213> Homo sapiens
<400> 190
Arg Thr Arg Leu Thr Leu Thr Gly Thr Arg Ser Ser Gly Thr Arg Ala
1 5 10 15
Ser Pro Ser Ala Val Cys Leu Cys Cys Trp Thr Cys Pro Ser Arg Ser
20 25 30
Phe Pro Ala Ala Ser Pro Ser Gly Leu Arg Ala Pro Val Gly Ala Gln
35 40 45
Ala Pro Pro Glu Val Thr Leu Arg Ala Ser Cys Ala Ser Ser Ala Ser
50 55 60
Lys Ala Cys Ala Gly Leu Trp Pro Trp Gly Ala Gln Val Arg
65 70 75
<210> 191
<211> 52
<212> PRT
<213> Homo sapiens
<400> 191
Cys His Pro Ala Trp Leu Ser Pro Ile Ser Ala Cys Pro Arg Leu Leu
1 5 10 15
Pro Tyr Pro Phe His Val Leu Ala Leu Glu Val Thr Phe Pro Pro Gly
20 25 30
Thr Ala Met Pro Gln Met Gln Leu Gln Ala Leu Ala Met Trp Glu Lys
35 40 45
Gly Trp Asp Lys
50
<210> 192
<211> 44
<212> PRT
<213> Homo sapiens
<400> 192
Met Asp Leu Asp Gly Met Leu Thr Val Ile Gly Gln Gly Leu Val Gly
1 5 10 15
Met Thr Pro Arg Asp Leu Gly Thr Val Ala Gly Ala Thr Ala Gln Ile
20 25 30
Gln Arg Pro Ile Gln Val Gln Thr Gly Gly Arg Leu
35 40
<210> 193
<211> 33
<212> PRT
<213> Homo sapiens
<400> 193
Ser Gln Lys Ser Gln His His Cys Ala Leu Arg Lys Ile Glu Trp Ala
1 5 10 15
Thr Lys Leu Ser Leu Gly Gly Lys Ala Gly Pro Gln Ala Gln Glu Lys
20 25 30
Ala
<210> 194
<211> 29
<212> PRT
<213> Homo sapiens
<400> 194
Ile Arg Met Cys Ala Leu Ser His Pro Ser Phe Tyr Ile Ser Ser Thr
1 5 10 15
Val Cys Phe Leu Ser Lys His Cys Met Thr Ala Cys Thr
20 25
<210> 195
<211> 13
<212> PRT
<213> Homo sapiens
<400> 195
Arg Cys Ser Leu Met Glu Gln Ile Pro His Leu Lys Ser
1 5 10
<210> 196
<211> 19
<212> PRT
<213> Homo sapiens
<400> 196
Leu Leu Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg Asn Val Ser
1 5 10 15
Arg Ile Ser
<210> 197
<211> 19
<212> PRT
<213> Homo sapiens
<400> 197
Ser Ile Pro His Val Pro Lys Ala Thr Ala Ala His Ser Val Thr Val
1 5 10 15
Lys Leu Gln
<210> 198
<211> 11
<212> PRT
<213> Homo sapiens
<400> 198
Thr His Pro Cys Thr Met Leu Leu Pro Gln Gly
1 5 10
<210> 199
<211> 16
<212> PRT
<213> Homo sapiens
<400> 199
Ser Arg Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys Lys Val Lys
1 5 10 15
<210> 200
<211> 9
<212> PRT
<213> Homo sapiens
<400> 200
Trp Leu Lys Lys Ser Thr Lys Ser Arg
1 5
<210> 201
<211> 8
<212> PRT
<213> Homo sapiens
<400> 201
Asp Arg Val Phe Leu Val Lys Ile
1 5
<210> 202
<211> 11
<212> PRT
<213> Homo sapiens
<400> 202
Asn Ile Glu Ile Thr Pro Gln Arg Ser Lys Ala
1 5 10
<210> 203
<211> 106
<212> PRT
<213> Homo sapiens
<400> 203
Gly Ala Leu Arg Ala Thr Ala Pro Ala Thr Ala Ala Pro Gln Ala Gln
1 5 10 15
Thr Pro His Trp Arg Ala Ala Thr Thr Ser Ser Met Ser Ser Ser Pro
20 25 30
Arg Ala Glu Pro Thr Ser Ser Ser Ser Trp Ala Thr Cys Trp Pro Arg
35 40 45
Cys Cys Ser Ser Ser Cys Tyr Trp Ser Leu Ser Ser Trp Pro Pro Ala
50 55 60
Gly Ala Ala Glu Ala Thr Asn Thr Arg Thr Arg Ser Arg Glu Ser Gln
65 70 75 80
Arg Gly Arg Met Leu Thr Trp Arg Ser Ser Leu Trp Leu Gln Gly Thr
85 90 95
Arg Cys Phe Thr Gly Val Arg Thr Ser Ser
100 105
<210> 204
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 204
Gln Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn Thr Met Gln Trp Asn
1 5 10 15
Asn Lys Lys Met Ala Met Thr Val Ile Ala Gly Ala His His Cys Gln
20 25 30
Tyr Lys Leu Thr Tyr Thr Lys Val Trp Lys Met Asn Trp Lys Lys Met
35 40 45
Met Ile Gly Ser Gln His Leu Leu Phe Ser Pro Leu Asp Ser Ser Pro
50 55 60
Leu Gln Leu Leu Leu His Pro His Gly Lys Arg Cys Asn Pro Cys Cys
65 70 75 80
Arg Leu Thr Trp Met Ser
85
<210> 205
<211> 135
<212> PRT
<213> Homo sapiens
<400> 205
Cys Arg Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys Ser Cys Ser Pro
1 5 10 15
Ser Gly Phe Ser Ala Gly Arg Gly Arg Cys Pro Val Gln Gly Cys Leu
20 25 30
Arg Pro His Arg Val Gln Leu Leu Arg Arg Trp Gly Pro Gly Ser Pro
35 40 45
Ala Gly Gln Arg Leu Ser Lys Gly Phe Gln Leu Leu Arg Trp Trp Gly
50 55 60
Pro Gly Ser Pro Ala Pro Glu Pro Arg Lys Gly Pro Phe Pro Pro Pro
65 70 75 80
Asp Pro Pro Trp Pro Val Thr Ala Val Thr Val Met Ala Gly Ser Val
85 90 95
Pro Ser Ala Gln Ser Val Asp Ala Leu Glu Ser Pro Gly Pro Leu Ala
100 105 110
Leu Glu Gly Pro Ser Ser Pro Arg Asn Leu Leu Trp Arg Glu Met Ser
115 120 125
Ile Phe Leu Pro Gly Ile Phe
130 135
<210> 206
<211> 87
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 206
His Leu Asn Arg Lys Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu
1 5 10 15
Thr Met Met Met Ser Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile
20 25 30
Pro Leu Pro Ser Pro Arg Gln His Leu Leu Pro Gln Tyr Pro Leu His
35 40 45
Pro Pro Pro Pro Cys Leu Leu Leu Leu His His Arg His His Leu Ala
50 55 60
Phe Leu Glu Met Ala Cys Ser Ser Gln His Thr His Ser Ile Lys Ile
65 70 75 80
Trp Ile Ser Phe Ser His Glu
85
<210> 207
<211> 89
<212> PRT
<213> Homo sapiens
<400> 207
Leu Ile Leu Ile Gln His Gly Gly Ile Phe Thr Phe Arg Phe Trp Val
1 5 10 15
Glu Lys Leu Ser Trp Asn Ile Cys Lys Asn Leu Ser Leu Tyr Leu Asp
20 25 30
Lys Phe Val Gln Arg Leu Leu Tyr Val Tyr Ile Ile Glu Thr Asn Val
35 40 45
Phe Val Leu Asn Leu Phe His Val Pro Val Asn Gln Ile Phe Met Met
50 55 60
Ala Phe Tyr Leu Lys Tyr Thr Glu Lys Ala Trp Val Met Glu Leu Glu
65 70 75 80
Trp Leu Ile Gln Gln Gln Cys Tyr Gln
85
<210> 208
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 208
Gly Pro Val Tyr Tyr Val Cys Asn Arg Met Asn Val Ser Ser Val Leu
1 5 10 15
Lys Pro Phe Leu Phe Thr Val Pro Ile Glu Asp Met Arg Glu Cys Thr
20 25 30
Leu Gly Arg Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Cys Leu
35 40 45
Ile Pro Val Pro Ile
50
<210> 209
<211> 43
<212> PRT
<213> Homo sapiens
<400> 209
Asp Leu Pro Arg Met Leu Pro Ile Ser Ser Pro Leu His Arg Pro Gln
1 5 10 15
Met Pro Phe Trp Thr Cys Thr Phe Pro Ala Thr Thr Trp Gly Thr Trp
20 25 30
Glu Thr Pro Ser Thr Trp Gly Trp Arg Thr Phe
35 40
<210> 210
<211> 58
<212> PRT
<213> Homo sapiens
<400> 210
Val Ile Ala Ile Leu Ser Ser Met Cys Gln Glu Ile Leu Asn Arg His
1 5 10 15
His Arg Arg Lys Glu Val Arg Lys Leu Lys Gln Ile Leu Phe Gln Val
20 25 30
Glu Glu Thr Lys Ser Gly Arg Phe Trp Ile Lys His Asp Leu Val Ser
35 40 45
Cys Leu Gln Ser Tyr Leu Val Met Glu Ala
50 55
<210> 211
<211> 9
<212> PRT
<213> Homo sapiens
<400> 211
Trp Leu Gly Met Ala Leu Ile Phe Gly
1 5
<210> 212
<211> 87
<212> PRT
<213> Homo sapiens
<400> 212
Ala Asn Met Asp Ala Gln Pro Met Met Pro Thr Pro Asn Ile Ile Ala
1 5 10 15
Glu Leu Pro Arg Cys Thr Gly Arg Arg Ser Gly Ser Trp Gly Val Arg
20 25 30
Pro Trp Leu Gly Met Ala Leu Ile Pro Leu Pro Gly Met Arg Gln Pro
35 40 45
Leu Ser Leu Gln Gly Pro Ser Ser Gln Pro Arg Leu Gln Arg Ala Val
50 55 60
Ala Trp His Ser Arg Ser Met Ala Pro Thr Gln Thr Cys Leu Ala Pro
65 70 75 80
His Pro Lys Pro His Trp Asn
85
<210> 213
<211> 53
<212> PRT
<213> Homo sapiens
<400> 213
Thr Ala Leu Lys Tyr Ile Phe Val Ala Val Arg Ala Ile Cys Val Met
1 5 10 15
Lys Ser Phe Leu Ile Phe Arg Arg Trp Lys Ser His Ser Pro Leu Gln
20 25 30
Ile Gln Leu His Leu Ser His Pro Ile Thr Thr Ser Cys Ser Ile Pro
35 40 45
Trp Cys His Leu Cys
50
<210> 214
<211> 61
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 214
His Arg Pro Ala Ser Ser Thr Gly Ser Ala Ala Trp Thr Trp Thr Gly
1 5 10 15
Thr Ala Pro Cys Pro Cys Ser Ser Ala Glu Gly Trp Thr Ala Trp Pro
20 25 30
Ser Arg Pro Cys Pro Ser Arg Thr Ala Ser Ala Arg Cys Trp Thr Trp
35 40 45
Ser Ser Arg Gly Leu Lys Gly Arg Ser Arg Cys Arg Thr
50 55 60
<210> 215
<211> 35
<212> PRT
<213> Homo sapiens
<400> 215
Asn Asp Leu Gln Leu Phe Val Met Ser Asp Thr Thr Tyr Lys Ile Tyr
1 5 10 15
Trp Thr Val Ile Leu Leu Asn Pro Cys Gly Asn Leu His Leu Lys Thr
20 25 30
Thr Ser Leu
35
<210> 216
<211> 33
<212> PRT
<213> Homo sapiens
<400> 216
Val Ser Trp Tyr Ser His Gln Lys Lys Leu Thr Val Pro His Ser Leu
1 5 10 15
Leu Phe Arg His Lys Ser Arg Arg Leu Arg Leu Cys Tyr Met Ala Asn
20 25 30
Trp
<210> 217
<211> 12
<212> PRT
<213> Homo sapiens
<400> 217
Val Asn Leu Ser Ser Pro Lys Ala Ser Leu Leu Arg
1 5 10
<210> 218
<211> 22
<212> PRT
<213> Homo sapiens
<400> 218
Met Asn Ser Val Asn Leu Ser Ser Pro Lys Ala Arg Asp Trp Thr Val
1 5 10 15
Ser Glu Leu Leu Lys Asn
20
<210> 219
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 219
Asn Pro Asp Asn Gly Gly Gly Ser Phe Trp Gln Glu Ala Leu Leu Val
1 5 10 15
Leu Trp Thr Val
20
<210> 220
<211> 17
<212> PRT
<213> Homo sapiens
<400> 220
Gln Arg Lys Pro Lys Arg Ala Asn Cys Val Ile Gln Arg Arg Ala Lys
1 5 10 15
Met
<210> 221
<211> 11
<212> PRT
<213> Homo sapiens
<400> 221
Met Gln Lys Lys Trp Pro Ile Thr Tyr Val Ala
1 5 10
<210> 222
<211> 11
<212> PRT
<213> Homo sapiens
<400> 222
Gly Gly Gly Gly Ser Trp Ser Ser Pro Ser Gly
1 5 10
<210> 223
<211> 16
<212> PRT
<213> Homo sapiens
<400> 223
Gly Lys Asp Arg Tyr Cys Ser Asn Ile Asp Lys His Trp Leu Asn Ser
1 5 10 15
<210> 224
<211> 8
<212> PRT
<213> Homo sapiens
<400> 224
Arg Ala Asp Pro Gln Arg His Thr
1 5
<210> 225
<211> 8
<212> PRT
<213> Homo sapiens
<400> 225
Arg Ala Phe Phe Gly Gly Leu Leu
1 5
<210> 226
<211> 117
<212> PRT
<213> Homo sapiens
<400> 226
Thr Ser Leu Trp Ser Ser Met Pro His Gly Val Val Thr Ala Asn Ser
1 5 10 15
Trp Leu Pro Phe Gly Ile Asn Trp Glu Arg Arg Thr Arg Thr Met Arg
20 25 30
Thr Ser Ser Ser Pro Arg Trp Thr Arg Leu Pro Thr Arg Trp Arg Pro
35 40 45
Ser Lys Cys Thr Ala Ser Pro His Ser Ser Ser Phe Leu Pro Val Pro
50 55 60
Thr Gly Arg Ser Leu Ile Thr Thr Gly Asn Ala Arg Trp Met Val Leu
65 70 75 80
Arg Asn Ser Trp Arg Ala Val Ala Arg Met Gly Gln Gly Met Met Thr
85 90 95
Ile Ser Arg Thr Trp Lys Lys Gln Arg Ser Gln Thr Trp Arg Lys Thr
100 105 110
Met Ile Arg Lys Leu
115
<210> 227
<211> 117
<212> PRT
<213> Homo sapiens
<400> 227
Cys Arg Thr Arg Pro Arg Lys Ala Ala Ser Ala Gln Ser Ser Arg Ser
1 5 10 15
Gly Gly Glu Gly Gly Ser Val Leu Val Gly Met Glu Arg Thr Ala Ser
20 25 30
Thr Gly Glu Thr Val Glu Met Arg Arg Trp Trp Thr Leu Val Met Glu
35 40 45
Trp Lys Ser Ser Tyr Arg Ala Ala Thr Pro Cys Pro Ala Pro Pro Arg
50 55 60
Pro Ala Arg Val Pro Ala His Ala Ser Thr Ser Leu Ser Ser His Ile
65 70 75 80
Thr Leu Lys Pro Val Thr Pro Gln Glu Arg Lys Thr Gln Asp Val Gly
85 90 95
Met Ala Val Ser Met Asp Thr Ile Ser Ile Val Thr Met Trp Gly Glu
100 105 110
Gly Gly Gly Val Gly
115
<210> 228
<211> 57
<212> PRT
<213> Homo sapiens
<400> 228
Val Ala Arg Val Glu Val Ala Ala Gly Pro Pro Met Arg Glu Val Ala
1 5 10 15
Glu Ala Ala Ala Val Val Met Val Val Arg Pro Val Ala Thr Leu Ser
20 25 30
Pro Gly Glu Ala Arg Ala Pro Leu Glu Ser Val Arg Gln Ile Tyr Ser
35 40 45
Glu His Asn Tyr Cys Arg Leu Ile Leu
50 55
<210> 229
<211> 38
<212> PRT
<213> Homo sapiens
<400> 229
Arg Leu Pro Gly Leu Thr Cys Lys Val Arg Arg Thr Leu His Gln Leu
1 5 10 15
Lys Leu Cys Gln Arg Val Met Ile Leu Ser Val Val Phe Gln Ile Leu
20 25 30
Met Thr Cys Gln Trp Pro
35
<210> 230
<211> 26
<212> PRT
<213> Homo sapiens
<400> 230
Cys Leu Glu Ser Gly Thr Asp His Ile Leu Thr Glu Ile Leu Ser Ile
1 5 10 15
Ser Cys Lys Lys Met Asn Gln Met Glu Leu
20 25
<210> 231
<211> 27
<212> PRT
<213> Homo sapiens
<400> 231
Arg Gly Gly Ala Pro Leu Pro Ser Trp Ser Pro Pro Cys Gln Ser Leu
1 5 10 15
Arg Gln Ala Val Thr Ser Ser Arg Thr Ser Gly
20 25
<210> 232
<211> 13
<212> PRT
<213> Homo sapiens
<400> 232
Ile Ala Ser Thr Phe Tyr Leu Asp Gly Asn Val Ser Ser
1 5 10
<210> 233
<211> 11
<212> PRT
<213> Homo sapiens
<400> 233
Glu Cys Cys Ser Ser Trp Leu Arg Arg Ile Glu
1 5 10
<210> 234
<211> 24
<212> PRT
<213> Homo sapiens
<400> 234
Met Glu Cys Ser Lys Leu Lys Leu Phe Asn Leu Phe Trp Thr Trp Gln
1 5 10 15
Arg Glu Pro Val Met Gln Pro Gln
20
<210> 235
<211> 13
<212> PRT
<213> Homo sapiens
<400> 235
Leu Gln Lys Lys Asn Ser Arg Lys Arg Lys Gln Lys Gly
1 5 10
<210> 236
<211> 12
<212> PRT
<213> Homo sapiens
<400> 236
Leu Val Val Cys Leu Ser Arg Arg Met Lys Arg Cys
1 5 10
<210> 237
<211> 20
<212> PRT
<213> Homo sapiens
<400> 237
Val Asp Ser Ser Ser Tyr His Pro Phe Lys Ile Asn Gln Asn Ile Arg
1 5 10 15
Phe Gln Lys Phe
20
<210> 238
<211> 12
<212> PRT
<213> Homo sapiens
<400> 238
Arg Lys Arg Arg Arg Arg Lys Arg Lys Arg Ala Asn
1 5 10
<210> 239
<211> 20
<212> PRT
<213> Homo sapiens
<400> 239
Pro Tyr Lys Phe Ser Glu Tyr Arg Arg Ala Phe Ser Trp Ser Ala Asp
1 5 10 15
Ile Thr Gly Thr
20
<210> 240
<211> 10
<212> PRT
<213> Homo sapiens
<400> 240
Ile Leu Phe Phe Tyr Met Ala Tyr Leu Trp
1 5 10
<210> 241
<211> 14
<212> PRT
<213> Homo sapiens
<400> 241
Asn Gly Leu Pro Glu Thr Glu Lys Met Pro Gln Leu Met Pro
1 5 10
<210> 242
<211> 12
<212> PRT
<213> Homo sapiens
<400> 242
Tyr Tyr Gln Lys Thr Trp Arg Val Ile Leu Pro Asp
1 5 10
<210> 243
<211> 97
<212> PRT
<213> Homo sapiens
<400> 243
Ser Thr Trp Phe His Val Thr Ser Gly Thr Ser Leu Ser Cys Ala Leu
1 5 10 15
Pro Ser Val Leu Ala Arg Trp Asn Leu Pro Met Cys Ser Gly Pro Gly
20 25 30
Asn Thr Ser Lys Ser Trp Arg Pro Thr Cys Cys Glu Gln Arg Gly Ser
35 40 45
Arg Ser Glu Ala Ser Cys Arg Asn Gln Lys Leu Lys Arg Asp Ile Ser
50 55 60
Glu Asn Trp Asn Lys Lys Gln Ile Asn Ile Ile Leu Pro Ser Trp Asn
65 70 75 80
Ser Ala Val Cys Gly Phe Pro Cys Leu Ser Pro Lys Leu Ser Arg Gly
85 90 95
Leu
<210> 244
<211> 58
<212> PRT
<213> Homo sapiens
<400> 244
Ser Ala Ala Trp Arg Ser Cys Ile Ala Leu Trp Cys Ala Ser Ser Val
1 5 10 15
Thr Glu Arg Thr Arg Cys Ala Gly Arg Trp Leu Trp Tyr Cys Trp Pro
20 25 30
Thr Trp Leu Arg Gly Thr Ala Trp Gln Leu Val Pro Leu Gln Cys Arg
35 40 45
Arg Ala Val Ser Ala Thr Ser Trp Ala Ser
50 55
<210> 245
<211> 60
<212> PRT
<213> Homo sapiens
<400> 245
Ala Val Thr Arg Ala Ser Ala Pro Arg Ala Thr Ala Ala Ala Gly Ala
1 5 10 15
Trp Arg Gly Arg Arg Pro Pro Thr Ala Arg Ser Ser Ala Thr Thr Arg
20 25 30
Gly Pro Pro Ser Ser Thr Ser Arg Ala Val Gly Arg Pro Pro Cys Trp
35 40 45
Arg Gly Pro Gly Ser Thr Thr His Thr Ser Arg Pro
50 55 60
<210> 246
<211> 25
<212> PRT
<213> Homo sapiens
<400> 246
Thr Ile Lys Ile Ser Gln Ile Gln Asn Gln Ser Val Asn Lys Asn Phe
1 5 10 15
His Ile His Leu Lys Arg Thr Tyr Gln
20 25
<210> 247
<211> 77
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 247
Ala Glu Thr Ile Thr Gln Leu Tyr Gly Lys His Tyr Ala Ser Gly Trp
1 5 10 15
Met Met Leu Met Ser Lys Thr Pro Arg Thr Tyr Arg Met Cys Thr Val
20 25 30
Gly Met Pro Arg Ser Val Cys Gly Trp Pro Ser Cys Phe Pro Gly Leu
35 40 45
Ala Gly Ser Ser Gln Gly Pro Thr Leu Arg Ser Gly Ser His Cys Pro
50 55 60
Gln Asp Cys Arg Arg Asn Val Asn Arg Glu Lys Thr Glu
65 70 75
<210> 248
<211> 63
<212> PRT
<213> Homo sapiens
<400> 248
Ala Ala Leu Gln Thr Gly Pro Gly Ser Cys Pro Pro Ser Arg Ala Ala
1 5 10 15
Ser Leu Leu Phe Ser Ile Arg Arg Trp Ser Thr Ile Ser Cys Pro Arg
20 25 30
Pro Ser Ala Thr Ser Gln Thr Pro Gly Arg Gly Val Pro Pro Arg Ala
35 40 45
Pro Ala Ser Pro Gly Arg Arg Pro Leu Lys Lys Trp Pro Thr Pro
50 55 60
<210> 249
<211> 67
<212> PRT
<213> Homo sapiens
<400> 249
Ala Ser Pro Leu Lys Arg Asp Pro Gln Gln Gly Gln Phe Ile Pro Ser
1 5 10 15
Gln Pro Pro Thr Leu Pro Trp Thr Leu Arg Lys Gln Pro Gln Gly Pro
20 25 30
Ser Cys Ser Arg Gly Ser Gln Arg Ala Val Arg Gly Thr Ser Pro Ser
35 40 45
Gln Gly Ile Leu Gly Ser Thr Gly Cys Ser Leu Gly Ser Arg Leu His
50 55 60
Ser Trp Cys
65
<210> 250
<211> 58
<212> PRT
<213> Homo sapiens
<400> 250
Asn Gly Lys Leu Ser Pro Arg Thr Ala Val Gly Ala Ala Arg Asn Ile
1 5 10 15
Arg Ser Ser Ser Phe Arg Ser Pro His Thr Ser Pro Phe Phe Gly Pro
20 25 30
Thr Ser Gly Cys Leu Gly Phe Thr Gln Glu Pro Pro Leu Pro Gln Phe
35 40 45
Pro Arg Thr Cys His Phe Met Phe Leu Phe
50 55
<210> 251
<211> 15
<212> PRT
<213> Homo sapiens
<400> 251
Met Lys Ala Leu Ile Ser Gln Glu Met Phe Ser Gln Ala Leu Leu
1 5 10 15
<210> 252
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 252
Asp Thr Thr Phe Gln Arg Ala Pro Leu Lys Phe Lys Leu Ala Leu Lys
1 5 10 15
Arg Val Cys Arg Lys Ser Val Leu Gly Ser Gly Gly Gln Arg Thr Ser
20 25 30
Trp
<210> 253
<211> 28
<212> PRT
<213> Homo sapiens
<400> 253
Ser Phe Leu Val Leu Arg Phe Met Ser Gln Ile Ile Leu Ser Glu Phe
1 5 10 15
Trp Met Cys Cys Gly Leu Val Pro Thr Ser Ser Pro
20 25
<210> 254
<211> 39
<212> PRT
<213> Homo sapiens
<400> 254
Thr Arg Gly Thr Gly Trp Pro Leu Ala Gly Gln Gln Pro Gly Ser Cys
1 5 10 15
Pro Ser Gln His Gln Gly Leu Pro Gly Arg Leu Pro Pro Pro Arg Pro
20 25 30
Leu Gln Arg Val Arg His Thr
35
<210> 255
<211> 44
<212> PRT
<213> Homo sapiens
<400> 255
Cys Arg Arg Leu Val Ser Thr Leu Asn Phe Ser Ala His Leu Leu Met
1 5 10 15
Trp Thr Pro Cys Thr Val Thr Trp Pro Ile Cys Thr Leu Ser Ser Ser
20 25 30
Lys Thr His Ser Thr Ser Met His Met Gln Gln Ser
35 40
<210> 256
<211> 25
<212> PRT
<213> Homo sapiens
<400> 256
Leu Glu Arg Phe Glu Thr Leu Lys Ile Lys Ser Ser Lys Asn Ile Cys
1 5 10 15
Phe Leu His Val Ser Val Cys Pro Ser
20 25
<210> 257
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 257
Thr Leu Met Met Ser Asn Gly Cys Trp Gly Trp Gln Gln Ser Trp Glu
1 5 10 15
<210> 258
<211> 45
<212> PRT
<213> Homo sapiens
<400> 258
Ser Leu Leu Lys Arg Asn Met Lys Ser Ser Trp Met Phe Ala Lys Ile
1 5 10 15
Phe Asn Gln Phe Ser Val Thr Ser Ala Trp Lys Asn Ser Trp Ile Gln
20 25 30
Leu Phe Gly Leu Arg Ser Asp Trp Leu Ile Arg Ala Val
35 40 45
<210> 259
<211> 27
<212> PRT
<213> Homo sapiens
<400> 259
Ala Gly Ser Thr Gly Ala Ser Arg Pro Leu Arg Thr Arg Arg Thr Arg
1 5 10 15
Ser Gln Cys Arg Arg Ser Trp Ser Pro Ala Arg
20 25
<210> 260
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 260
His Pro Ala Ala Arg Ser Ser Ser Cys Cys Pro Ala Pro Met Ser Leu
1 5 10 15
Ser Trp Gly Thr Ala Leu Met Thr Ser Pro Arg
20 25
<210> 261
<211> 16
<212> PRT
<213> Homo sapiens
<400> 261
Arg Ser Gln Asn His Gln Lys Ser Pro Gln Ala Leu Ala Met Pro Trp
1 5 10 15
<210> 262
<211> 30
<212> PRT
<213> Homo sapiens
<400> 262
Arg Ser Gln Asn His Gln Lys Arg Lys Val Leu Gly Thr Ile Leu Val
1 5 10 15
His Asn His Ile Ile Asp Tyr Ala Trp Val Ile Cys His Leu
20 25 30
<210> 263
<211> 25
<212> PRT
<213> Homo sapiens
<400> 263
Ile Ser Phe Gly Tyr Pro Arg Trp Thr Leu Lys Ala Leu Val Tyr Ser
1 5 10 15
Gln Asn Gly Val Leu Ile Trp Leu Met
20 25
<210> 264
<211> 8
<212> PRT
<213> Homo sapiens
<400> 264
Lys Glu Lys Lys Gly Gly Ser Glu
1 5
<210> 265
<211> 12
<212> PRT
<213> Homo sapiens
<400> 265
Glu Leu Leu His Pro Ser Gln Arg Leu Leu Val Pro
1 5 10
<210> 266
<211> 17
<212> PRT
<213> Homo sapiens
<400> 266
Val Ile Phe Phe Ser Lys Pro Lys Arg Ile Lys Asn Leu Ser Leu Lys
1 5 10 15
Thr
<210> 267
<211> 26
<212> PRT
<213> Homo sapiens
<400> 267
Lys Ser Ala Arg Thr Ala Leu Asn Ser Glu Leu Asp Val Gln Asn Ala
1 5 10 15
Val His Glu Asn Gln Lys Glu Arg Val Phe
20 25
<210> 268
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 268
Ile Ile Leu Asp Thr Ala Lys Leu Leu Thr Ser Pro Gln Ser Leu Leu
1 5 10 15
Pro Ile Arg
<210> 269
<211> 11
<212> PRT
<213> Homo sapiens
<400> 269
Arg Ile Leu Leu Gly Thr Phe Leu Ala Ile Pro
1 5 10
<210> 270
<211> 24
<212> PRT
<213> Homo sapiens
<400> 270
Gly Cys Cys Arg Leu Leu Thr Glu Met Gly Lys Arg Lys Arg Lys Arg
1 5 10 15
Arg Ser His Trp Met Lys Ala Gln
20
<210> 271
<211> 11
<212> PRT
<213> Homo sapiens
<400> 271
Leu Ile Asn Pro Asp Lys Lys Ile Lys Met Ile
1 5 10
<210> 272
<211> 8
<212> PRT
<213> Homo sapiens
<400> 272
Asn Lys Lys Lys Val Asn Lys Asn
1 5
<210> 273
<211> 12
<212> PRT
<213> Homo sapiens
<400> 273
Phe Ile Phe Phe Leu Ile Leu Trp Ser Ser Arg Gln
1 5 10
<210> 274
<211> 12
<212> PRT
<213> Homo sapiens
<400> 274
Met Lys Lys Glu Asn Lys Ile Lys Trp Lys Leu Asn
1 5 10
<210> 275
<211> 13
<212> PRT
<213> Homo sapiens
<400> 275
Lys Glu Ser Pro Gly Arg Glu Lys Gly Met Glu Lys Met
1 5 10
<210> 276
<211> 18
<212> PRT
<213> Homo sapiens
<400> 276
Leu Ala Phe Ser Ser Leu Leu Trp Pro Ser His Leu Asp Met Ser Met
1 5 10 15
Leu Gln
<210> 277
<211> 17
<212> PRT
<213> Homo sapiens
<400> 277
Lys Pro Asn Lys Asn Thr Gln Ile Thr Phe Ser Leu Met Ser Phe Thr
1 5 10 15
Leu
<210> 278
<211> 12
<212> PRT
<213> Homo sapiens
<400> 278
Arg Phe Phe Pro Ser Ile Leu Ile Lys Ser Tyr Ile
1 5 10
<210> 279
<211> 12
<212> PRT
<213> Homo sapiens
<400> 279
Gly Ser Pro Pro Gly Gly Pro Arg Pro Cys Trp Thr
1 5 10
<210> 280
<211> 13
<212> PRT
<213> Homo sapiens
<400> 280
Ser Ile Gly Tyr Leu Thr Gly Phe Cys Ser Pro Asn Ala
1 5 10
<210> 281
<211> 13
<212> PRT
<213> Homo sapiens
<400> 281
Glu Glu Pro Pro Ser Cys Arg Pro Thr Ala His Ile Pro
1 5 10
<210> 282
<211> 13
<212> PRT
<213> Homo sapiens
<400> 282
Glu Gln Lys Thr Glu Trp Glu Trp Lys Leu Gln Ile Glu
1 5 10
<210> 283
<211> 12
<212> PRT
<213> Homo sapiens
<400> 283
Lys Val Ala Phe Leu Cys Glu Lys Glu Gln Ile Val
1 5 10
<210> 284
<211> 8
<212> PRT
<213> Homo sapiens
<400> 284
Gln Leu Lys Lys Ala Val Lys Val
1 5
<210> 285
<211> 12
<212> PRT
<213> Homo sapiens
<400> 285
Leu Gln Arg Met Ser Ser Asp Lys Arg Asn Thr Gly
1 5 10
<210> 286
<211> 9
<212> PRT
<213> Homo sapiens
<400> 286
Ile Asn Lys Lys Ile Gln Ala Thr Lys
1 5
<210> 287
<211> 93
<212> PRT
<213> Homo sapiens
<400> 287
Thr Ser Ser Pro Arg Thr Met Ser Trp Leu Cys Cys Leu Gly Gln Ile
1 5 10 15
Met Ala Ser Ala Val Glu Ala Ser Gln Pro Pro Thr Trp Pro Ser Met
20 25 30
Pro Arg Arg Thr Pro Val Gly Pro Val Ser Ser Pro Ala Arg Gln Glu
35 40 45
Gly Val Arg Val Cys Ser Gly Cys Val Thr Cys Gly Glu Thr Ala Pro
50 55 60
Met Ala Ala Met Thr Thr Ala Ala Ala Pro Cys Ser His Pro Gln Ser
65 70 75 80
Trp Pro Val Ser Leu Ser Arg Trp Arg Cys Ala Ser Val
85 90
<210> 288
<211> 112
<212> PRT
<213> Homo sapiens
<400> 288
Val Gly Lys Pro Leu Pro Arg Ser His Thr Ala Gln Asn Ile Arg Glu
1 5 10 15
His Thr Gln Glu Arg Asp Pro Leu Ser Ala Val Asn Ala Gly Asn Arg
20 25 30
Leu Val Arg Ser His Thr Ser Met Tyr Ile Glu Lys Cys Thr Gln Glu
35 40 45
Lys Asp Arg Ile Val Ala Glu Asn Val Glu Asn Pro Ser Ala Arg Ser
50 55 60
His Ala Ser Ile Asn Ile Gly Glu Leu Thr Gln Glu Arg Ser Pro Met
65 70 75 80
Gly Ala Met Asn Val Gly Lys Leu Ser Thr Arg Ser Gln Thr Ser Ala
85 90 95
Asp Ile Arg Lys Phe Met Leu Gly Arg Met Pro Thr Gly Met Lys Thr
100 105 110
<210> 289
<211> 59
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 289
Cys Arg Ala Ser Leu Arg Thr Asp Cys Leu Leu Ala Val Val Ile Gln
1 5 10 15
Phe Gln Ile Ser Thr Tyr Gln Ala Gln Leu Arg Ile Ser Leu Arg Lys
20 25 30
Lys Lys Thr Lys Gln Asp Ile Leu Thr His Ile Ile Glu Cys Leu Lys
35 40 45
Lys Met Lys Thr Ser Thr Ser Leu Gly Met Ile
50 55
<210> 290
<211> 94
<212> PRT
<213> Homo sapiens
<400> 290
Val Ala Pro Cys Pro Trp Ser Trp Gly Ser Leu Arg Met Leu Val Gln
1 5 10 15
Pro Glu Met Arg Ala Pro Tyr Gly Ser Val Leu Thr His Cys Gln Arg
20 25 30
Leu Met Thr His Tyr Cys Ala Met Leu Gly Gln Leu Ser Ala Glu Ala
35 40 45
Lys Leu Arg Gly Arg Arg Gly Gly Gly Ala Ala Pro Gln Pro Val Pro
50 55 60
Ala Ser Asn Arg Val Ala Ala Ala Val Ser Gln Glu Asp Ala Gly Leu
65 70 75 80
Val Glu Glu Pro Met Glu Asp Val Val Glu Asp Gly Pro Gly
85 90
<210> 291
<211> 82
<212> PRT
<213> Homo sapiens
<400> 291
Asn Thr His Leu Gln Leu Thr His Cys Phe Leu Glu Ile Lys Pro Tyr
1 5 10 15
Ser Thr Lys Lys Met Lys Met Ala Cys Gly Lys Arg Ser Leu Leu Gln
20 25 30
Glu Val Lys Lys His Glu Leu Pro Lys Lys Ala Pro Ser Trp Pro Asp
35 40 45
Arg Pro Leu Val Gly Leu Ala Arg Ile Gln Ile Trp Ile Leu His Leu
50 55 60
Leu Gly Leu Arg Pro Pro Ser Leu Leu Ser Val Phe Gln Met Thr Phe
65 70 75 80
Ile Lys
<210> 292
<211> 88
<212> PRT
<213> Homo sapiens
<400> 292
Gly Gly Phe Arg Gln Trp Trp Cys Thr Cys Arg Met Ser Gly Pro Ser
1 5 10 15
Cys Leu Leu Trp Arg Ser Gly Arg Pro Cys Ala Ser Arg Lys Leu Gln
20 25 30
Arg Gln Leu Pro Gln Pro Arg Arg His Lys Gly Lys Arg Ser Leu Leu
35 40 45
Asn Arg His Leu Met Pro Trp Ser Lys Gln Gln Thr Leu Leu Asp Gly
50 55 60
Thr Gln Lys Leu Gln Arg Pro Pro His Ser Arg Lys Arg Thr Leu Ile
65 70 75 80
Ser Gln Arg Pro Leu His Pro Pro
85
<210> 293
<211> 62
<212> PRT
<213> Homo sapiens
<400> 293
Leu Ala Gly Leu Leu Cys Pro Ala Leu His Leu Val Lys Pro Arg Val
1 5 10 15
Leu His Gln Asn Leu Asp Pro Thr Ser Ser Ser Phe Ser Lys Trp Cys
20 25 30
Arg Pro Trp Leu Glu Gln Met Leu His Ser Cys Arg Ile Gln Lys Ser
35 40 45
Asp Phe Ser Asn Asn Trp Asn Ser Ser Thr Gln Trp Gly Ser
50 55 60
<210> 294
<211> 127
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 294
Asn Val His Arg Gln Pro Val Gln Ile Ile Lys Asn Met Glu Thr Thr
1 5 10 15
Val Thr Tyr Arg Lys Lys Gln Ile Gln Ser Gln Ser Ser Thr Ser Ile
20 25 30
Leu Ser Ala Leu Arg Val Ser Pro Val Arg Asn Ser Pro Cys Ser Met
35 40 45
Cys Cys Val Ile Ile Pro Pro Gly Ser Ser His Ala Cys Val Gln Lys
50 55 60
Val Thr Ser Ser Leu Gly Ile Arg Ala Gln Gly Thr Arg Arg Ser Ser
65 70 75 80
Asn Lys Pro Leu Arg Gly Asp Pro Gly Val Ile Val Pro Cys Leu Cys
85 90 95
Leu Glu Glu Pro Arg Lys Gly Leu Trp Glu Arg Ser Pro Gly His Pro
100 105 110
Arg Gly Ser Gln Ser Ala Leu Gly Thr Ala Ser Glu Gly Trp Ser
115 120 125
<210> 295
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 295
Asn Val His Arg Gln Pro Val Gln Gln Ile Gln Ser Gln Ser Ser Thr
1 5 10 15
<210> 296
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 296
Val His Arg Gln Pro Val Gln Ile Gln Ser Gln Ser Ser Thr
1 5 10
<210> 297
<211> 30
<212> PRT
<213> Homo sapiens
<400> 297
Ser Arg Pro Gly Trp Lys Arg Thr Gln Gln Arg Pro Pro Trp Arg Thr
1 5 10 15
Ser Arg Gly Gln Ala Gln Asp Thr Ser Gly His Arg Gly Ser
20 25 30
<210> 298
<211> 53
<212> PRT
<213> Homo sapiens
<400> 298
Ala Ala Ala Leu Gly Leu Arg Ile Leu Pro Pro Pro Leu Thr Ser Pro
1 5 10 15
Ser Arg Ser Thr Thr Ala Pro Val Gly Ser Gln Cys Val Pro Ser Trp
20 25 30
Thr Ala Arg Arg Trp Ser Thr Thr Ala Ser Gly Trp Arg Arg Trp Thr
35 40 45
Thr Ala Arg Pro Pro
50
<210> 299
<211> 37
<212> PRT
<213> Homo sapiens
<400> 299
Leu Ser Ala Ile Arg Lys Met Thr Tyr Phe Thr Ser Trp Ile Leu Asp
1 5 10 15
Ser Asp Ser Thr His Tyr Ile Pro Ser Cys Asn Arg Lys Ser Cys Tyr
20 25 30
Lys Arg Met Trp Ser
35
<210> 300
<211> 54
<212> PRT
<213> Homo sapiens
<400> 300
Trp Glu Thr Leu Ser Thr Trp Arg Pro Ser Glu Arg Trp Ser Cys Arg
1 5 10 15
Ser Pro Ala Ser Leu Pro Arg Met Trp Cys Trp Cys His Gln Ala Ser
20 25 30
Met Pro Trp Arg Ala Thr Pro Pro Leu Leu Gly Ala Thr Thr Ser Pro
35 40 45
Pro Asp Ala Ser Gly Thr
50
<210> 301
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 301
Tyr Lys Gly Arg Lys Glu Arg Lys Thr Ser Val Gln Gly Ile Thr Thr
1 5 10 15
Val Ile Leu Lys Arg Arg Thr Ser Leu Arg Arg Glu Ser Phe Met Lys
20 25 30
Asn Phe Leu Ala Val Thr Ile Thr Gly Ser
35 40
<210> 302
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 302
Arg Pro Pro Met Thr Thr Trp Pro Arg Met Arg Met Thr Leu Arg Trp
1 5 10 15
Ala Arg Gly Ser Leu Pro Gly Pro Ala Arg Ala Arg Pro Thr Thr Pro
20 25 30
Leu Leu Pro Trp Arg Thr Thr Cys Ser Ser Arg Pro Arg Val Gly Ala
35 40 45
Ser Arg Pro Ala Pro His Arg Pro Gln Arg Ser Ser Arg Arg Tyr Ser
50 55 60
Arg Ser Ala
65
<210> 303
<211> 71
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 303
Arg Ser Thr Gly Leu Thr Gly Glu Gln Thr His Trp Leu Arg Pro Thr
1 5 10 15
Ser Gly Pro Ala Thr Met Ser Pro Trp Tyr Arg Gly Pro Thr Pro Ser
20 25 30
Pro Leu Thr Cys Arg Cys Thr Thr Pro Pro Ala Ser Pro Trp Leu Pro
35 40 45
Ile Pro Val Arg Pro Met Gly Ala Arg Ala Pro Ala Pro Thr Cys Val
50 55 60
Ser Ser Thr Thr Thr Gly Ser
65 70
<210> 304
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 304
Arg Ser Leu Pro Ala Gly Pro Ser Ser Arg Arg Arg Ala Pro Pro Arg
1 5 10 15
Ser Gly Arg Gly Ser Leu Arg Lys Trp Arg Pro Gly Ala Ser Arg Arg
20 25 30
Trp Arg Met Ser Thr Trp Pro Ser
35 40
<210> 305
<211> 43
<212> PRT
<213> Homo sapiens
<400> 305
Val Ser Thr Ser Trp Gly Pro Thr Ala Gly Ala Ala Arg Ala Arg Thr
1 5 10 15
Cys Ser Pro Cys Ser Pro Thr Thr Pro Ser Pro Ala Ser Gly Ser Thr
20 25 30
Ser Arg Arg Thr Arg Pro Asn Arg Val Leu Thr
35 40
<210> 306
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 306
Thr Trp Pro Ala Ala Cys Trp Ala Thr Trp Thr Ser Pro Gly Ala Ala
1 5 10 15
Val Pro Val Ala Leu Arg Pro Ser Ala Ser Trp Ser Arg Cys Thr Cys
20 25 30
Ser Ser Ser Ala Thr Met Trp Arg Ser Thr Thr Pro Arg
35 40 45
<210> 307
<211> 32
<212> PRT
<213> Homo sapiens
<400> 307
Arg Arg Ser Arg Ala Glu Cys Gly Ser Thr Arg Ser Leu Thr Ala Arg
1 5 10 15
Arg Glu Thr Pro Thr Ala Thr Met Cys Ala Ala Pro Arg Val Ser Pro
20 25 30
<210> 308
<211> 57
<212> PRT
<213> Homo sapiens
<400> 308
Met Val Lys Arg Lys Asn Pro Lys Arg Arg Lys Leu Gln Glu Leu Leu
1 5 10 15
Lys Arg Arg Lys Leu Arg Lys Asn Ser Asn Leu Ser His Met Met Ile
20 25 30
Arg Phe Phe Trp Met Glu Met Arg Cys Met Tyr Gly Ser Met Thr Gln
35 40 45
Phe Thr Leu Lys His Leu Ser Trp Asp
50 55
<210> 309
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 309
Arg Glu Pro Leu Val Leu Ser Val Gly Asn Leu Ile Gly Leu Pro Ile
1 5 10 15
Met Pro Ser Arg Cys Glu Asn Ser Ser Leu Gly Gly Met Leu Glu Met
20 25 30
Ser Met His
35
<210> 310
<211> 28
<212> PRT
<213> Homo sapiens
<400> 310
Leu Pro Gly Gly Ile Ala Ser Arg Phe Pro Ala Ser Trp Pro Arg Thr
1 5 10 15
Pro Ala Ala Cys His Pro Ser Leu Arg Thr Gly Thr
20 25
<210> 311
<211> 66
<212> PRT
<213> Homo sapiens
<400> 311
Gly Met Thr Ser Thr Cys Pro Ser Ala Met Thr Trp Ala Thr Ser Ser
1 5 10 15
Pro Cys Ser Ala Thr Glu Arg Ala Thr Ser Ala Gly Val Trp Thr Lys
20 25 30
Met Ala Glu Arg Cys Arg Ala Pro Ala Pro Ser Gln Ala Pro Pro Leu
35 40 45
Arg Val Tyr Pro Pro Ser Leu His Pro Trp Ser Gly Pro Arg Pro Gly
50 55 60
Gln Met
65
<210> 312
<211> 38
<212> PRT
<213> Homo sapiens
<400> 312
Gly Gly Arg Met Leu Leu Glu Met Met Lys Arg Leu Val Arg Lys Asn
1 5 10 15
Leu Lys Lys Thr Met Met Ile Leu Lys Thr Ser Leu Lys Met Ser Phe
20 25 30
Gln Lys Met Arg Lys Arg
35
<210> 313
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 313
Ser His Ile Trp Pro Lys Gly Phe Glu Ala Gln Arg Ala Gln Glu His
1 5 10 15
Arg Ala Gln Leu Val Cys Ser Ala Leu Leu Pro Glu Gly Ile Arg Cys
20 25 30
Arg Pro Gly Ala Pro Ala Ala Val Ser Pro Pro Arg Gly Ser Gln
35 40 45
<210> 314
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 314
Gln Thr Ser His Trp Cys Pro Thr Gln Pro Arg Arg Val Ala Ser Arg
1 5 10 15
Val Trp Pro Ser Thr Thr Thr Leu Ser Cys Pro Pro Arg Ser Ser Thr
20 25 30
Ser Cys Ser Thr Ala Ala Thr Ala Pro Ser Pro Cys Thr Pro Arg Ala
35 40 45
Ala Glu
50
<210> 315
<211> 22
<212> PRT
<213> Homo sapiens
<400> 315
Ser Asn Cys Gln Leu Val Thr Ala Val Pro Asn Trp Asn Leu Phe Ser
1 5 10 15
Thr Val Leu Leu His Leu
20
<210> 316
<211> 36
<212> PRT
<213> Homo sapiens
<400> 316
Asn Asp Gly Gly Gly Ser Arg Ser Trp His Leu Pro Ser His Pro Met
1 5 10 15
Gln Gln Thr Pro Thr Thr Ala Arg Pro Ser Thr Gln Thr Ser Trp Pro
20 25 30
Ser Trp Pro Ser
35
<210> 317
<211> 30
<212> PRT
<213> Homo sapiens
<400> 317
Leu Ile Leu Glu Lys Ser Pro Ile Asn Val Lys Lys Cys Lys Gly Phe
1 5 10 15
Asn His Tyr Ser Phe Cys Gln Lys His Glu Gln Ser His Thr
20 25 30
<210> 318
<211> 26
<212> PRT
<213> Homo sapiens
<400> 318
Asn Pro Pro Val Lys Glu Ser Gln Val Ala Arg Arg Lys Cys Leu Lys
1 5 10 15
Glu Met Ala Arg Arg Lys Lys Thr Glu Glu
20 25
<210> 319
<211> 17
<212> PRT
<213> Homo sapiens
<400> 319
Leu Ala Met Thr Asp Asp Gln Arg Met Val Lys Asn Lys Gln Leu Leu
1 5 10 15
Met
<210> 320
<211> 21
<212> PRT
<213> Homo sapiens
<400> 320
Met Leu Thr Gln Thr Asp Ser Ala Trp Asp Leu Glu Ile Ala Glu Val
1 5 10 15
Leu Phe His Ile Gln
20
<210> 321
<211> 34
<212> PRT
<213> Homo sapiens
<400> 321
Ala Phe Arg Asp Arg Asn Thr Arg Ile Leu Gly Arg Val Ser Ala Pro
1 5 10 15
Glu Ala Ser His Asp Thr Val Thr Phe Arg Thr Ala Arg Lys Gly Glu
20 25 30
Lys Phe
<210> 322
<211> 54
<212> PRT
<213> Homo sapiens
<400> 322
Gly Lys Leu Phe Arg Arg Ser Lys Phe Glu Ala Lys Pro Thr Ser Gly
1 5 10 15
Pro Trp Gln Pro Gly Arg Asn Ile Thr Thr Lys Leu Ile Gln Arg Pro
20 25 30
Leu Arg Ser Ser Leu Gly Ser Arg Lys Thr Pro Pro Ser Leu Pro Phe
35 40 45
Leu Gly Glu Glu Glu Leu
50
<210> 323
<211> 26
<212> PRT
<213> Homo sapiens
<400> 323
Ser Ser His Met His Asn Thr Ser Pro Cys Gln Met Met Ser His Leu
1 5 10 15
Asn His Val Gln Phe Val Leu Tyr Lys Leu
20 25
<210> 324
<211> 32
<212> PRT
<213> Homo sapiens
<400> 324
Cys Tyr Leu Ala Gly Ser Lys Met Thr Ser Leu Thr Ser Gly Trp Asn
1 5 10 15
Gly Lys Arg Gln Ser Cys Ser Gln Leu Cys Leu Leu Pro Cys Thr Ile
20 25 30
<210> 325
<211> 73
<212> PRT
<213> Homo sapiens
<400> 325
Arg Arg Gly Thr Ser Gln Arg Ala Gln Ser Gly Pro Leu Ser Phe Val
1 5 10 15
Leu His Phe Leu Ala Lys Asp Pro His Pro Met Phe Leu Cys Thr Pro
20 25 30
Arg Ala His Pro Leu Ala Arg Pro Gln Gly His Leu Leu Ala His Pro
35 40 45
Gly Pro Ser Pro Thr Trp Pro Gly Pro Leu Pro Leu Pro Gln Thr Arg
50 55 60
Leu Asp Leu Ser Ala Gly Pro Thr Ala
65 70
<210> 326
<211> 24
<212> PRT
<213> Homo sapiens
<400> 326
Ser Ser Ile His Ile Val Glu Lys Gln Leu Lys Leu Arg Glu Arg Pro
1 5 10 15
Thr Asn Lys Lys Lys Arg Lys Asn
20
<210> 327
<211> 25
<212> PRT
<213> Homo sapiens
<400> 327
Leu Gln Lys Lys Ala Pro Gln Lys Arg Ile Lys Leu Leu Arg Met Leu
1 5 10 15
Pro Ala Leu Tyr Leu Met Ala Cys Gln
20 25
<210> 328
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 328
Ala Ala Gln Met Ser Trp Ser Leu Pro Cys Pro Pro Gly Gly Ala Glu
1 5 10 15
Glu Arg Met Glu Ala Pro Ser Val Gly Val Ala Arg Arg Arg Arg Arg
20 25 30
Ser Lys Gly Ser Ser Met Arg Cys
35 40
<210> 329
<211> 24
<212> PRT
<213> Homo sapiens
<400> 329
Met Thr Pro Gly Pro Gly Ala Gly Pro Ala Ala Cys Ser Ser Cys Ala
1 5 10 15
Pro Ala Leu Cys Ala Ala Ala Ala
20
<210> 330
<211> 34
<212> PRT
<213> Homo sapiens
<400> 330
Thr Ser Arg Gly Ser Ser Leu Gln Ala Ser Ser Trp Lys Met Ala Ala
1 5 10 15
Leu Phe Leu Thr Thr Thr Ser Arg Lys Ser Arg Pro Cys Thr Trp Ser
20 25 30
Cys Ala
<210> 331
<211> 10
<212> PRT
<213> Homo sapiens
<400> 331
Phe Glu Phe Phe Leu Gln Cys Pro Ala Lys
1 5 10
<210> 332
<211> 24
<212> PRT
<213> Homo sapiens
<400> 332
Leu Cys Thr Ile Cys Thr Ser Tyr Val Ser Pro Trp Ile Ile Phe Thr
1 5 10 15
Glu Met Glu Tyr Phe Thr Glu Met
20
<210> 333
<211> 33
<212> PRT
<213> Homo sapiens
<400> 333
Cys Gly Lys Ser Ile Trp Trp Leu Lys Glu Leu Arg Val Leu Met Phe
1 5 10 15
Leu His Leu Trp Asp Ser Met Lys Gln Val Ala Leu His Gln Ser Asn
20 25 30
Arg
<210> 334
<211> 23
<212> PRT
<213> Homo sapiens
<400> 334
Ala Ser Pro Ser Pro Ser Arg Asn Lys Ser Glu Leu Leu Thr Ser Pro
1 5 10 15
Arg Pro Leu Thr Leu Gln Ser
20
<210> 335
<211> 15
<212> PRT
<213> Homo sapiens
<400> 335
Leu Lys Asp Cys Ile Ser Thr Lys Pro Ile Ser Gly Ile Val Pro
1 5 10 15
<210> 336
<211> 25
<212> PRT
<213> Homo sapiens
<400> 336
Val Ser Glu Asp Gly Lys Val Ala Ser Asp Thr Cys Val Thr Leu His
1 5 10 15
Trp Pro Leu Gly Lys Phe Arg Phe Arg
20 25
<210> 337
<211> 35
<212> PRT
<213> Homo sapiens
<400> 337
Lys Phe Cys Asn Phe Ile Leu Leu Phe Ser Leu Ile Leu Ser Ile Lys
1 5 10 15
His Ile Ser Val Phe Phe His Ile Phe Ser Ala Val Ile Leu Thr Gln
20 25 30
Tyr Arg Ser
35
<210> 338
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 338
Gly Arg Cys Tyr Gln Leu Pro Gln Leu Gln Gly Phe Leu
1 5 10
<210> 339
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 339
Ser Lys Leu Tyr Gly Asp His Phe Leu Leu Leu
1 5 10
<210> 340
<211> 21
<212> PRT
<213> Homo sapiens
<400> 340
Ala Arg Ala Ile Ala Thr Arg Pro Gly Gly Trp Asn Arg Met Gly Glu
1 5 10 15
Pro Arg Gly Phe Cys
20
<210> 341
<211> 13
<212> PRT
<213> Homo sapiens
<400> 341
Glu Glu Leu Phe Leu Leu Val Ser Leu Ala Met Phe Arg
1 5 10
<210> 342
<211> 22
<212> PRT
<213> Homo sapiens
<400> 342
Ile Pro Ser Arg His Met Phe Ser Val Thr Lys Ile Met Leu Lys Glu
1 5 10 15
Thr Phe Lys Arg Arg Lys
20
<210> 343
<211> 22
<212> PRT
<213> Homo sapiens
<400> 343
Arg Arg Lys Ile Ile Pro Asn Cys Phe Trp Gly Lys Thr Glu Ser Pro
1 5 10 15
Ser Ile Phe Thr Thr Cys
20
<210> 344
<211> 41
<212> PRT
<213> Homo sapiens
<400> 344
Arg Thr Thr Thr Thr Ser Leu Lys Glu Glu Glu Gly Ile Ile Leu Ile
1 5 10 15
Thr Glu Ser Arg Ser Leu Ala Leu Leu Phe Gln Ser Leu Met Ile Leu
20 25 30
Ile Cys Ala Gly Thr Lys Glu Pro Phe
35 40
<210> 345
<211> 33
<212> PRT
<213> Homo sapiens
<400> 345
Ser Ser Gly Gly Gly Leu Gly Leu Ile Met Leu Pro Trp Ser Gly Val
1 5 10 15
Glu Ile Ile Ile Cys Leu Lys Arg Ile Val Lys Arg Arg Lys Arg Lys
20 25 30
Asn
<210> 346
<211> 11
<212> PRT
<213> Homo sapiens
<400> 346
Thr Thr Lys Lys Ser Met Ile Glu Trp Lys Ile
1 5 10
<210> 347
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 347
Ala Gly Ser Ala Thr Lys Met Ser Thr Asn Ala Ala Arg Arg Thr Gly
1 5 10 15
Ala Ala Ser Arg Ser Ala Thr Thr Ser Arg Val Ala Ser Thr Val Pro
20 25 30
Ala Met Ala Gly Pro Ala Lys Thr
35 40
<210> 348
<211> 9
<212> PRT
<213> Homo sapiens
<400> 348
Gly Ser Lys Lys Thr Gly Ile Met Trp
1 5
<210> 349
<211> 16
<212> PRT
<213> Homo sapiens
<400> 349
Arg Glu Lys Arg Gln Ala Val Asn Met Met Cys Gln His Thr Met Ile
1 5 10 15
<210> 350
<211> 27
<212> PRT
<213> Homo sapiens
<400> 350
Gly Leu Ser Leu Ser Tyr Gly Pro Val Ser Pro Ile Ile Arg Arg Leu
1 5 10 15
Trp Asn Ile Phe Val Arg Asn Gln Glu Lys Ile
20 25
<210> 351
<211> 17
<212> PRT
<213> Homo sapiens
<400> 351
Ser Ser Cys Phe Gln Arg Arg Lys Arg Arg Ile Tyr Gln His Leu Arg
1 5 10 15
Tyr
<210> 352
<211> 68
<212> PRT
<213> Homo sapiens
<400> 352
Ala Leu Pro His His Pro Ser Pro Ile Ala Arg Ala Ser Trp Gly Leu
1 5 10 15
Arg Pro Pro Ala Phe Leu Trp Ala Leu Arg Ile Leu Thr Pro Leu Pro
20 25 30
Leu Pro Gln Pro Gln Pro Pro Ala Val Ala Thr Ala Thr Val Ala Ala
35 40 45
Thr Ala Ala Ala Leu Leu Gly Leu Cys Pro Phe Pro His His Pro Ile
50 55 60
Trp Pro Glu Val
65
<210> 353
<211> 13
<212> PRT
<213> Homo sapiens
<400> 353
Ser Pro Ser Leu Gln Thr Gln Trp Arg Leu Lys Arg Ser
1 5 10
<210> 354
<211> 12
<212> PRT
<213> Homo sapiens
<400> 354
Thr Leu Val Met Val Ala Thr Val Lys Leu Phe Leu
1 5 10
<210> 355
<211> 23
<212> PRT
<213> Homo sapiens
<400> 355
Leu Val Cys Ser Ala Leu Ile Ser Leu Thr Leu Lys Gly Asn Leu Phe
1 5 10 15
Thr Leu Leu Thr Leu Leu Met
20
<210> 356
<211> 40
<212> PRT
<213> Homo sapiens
<400> 356
Val Ala Phe His Pro Ser Gln Pro Gly Pro Cys Gly Arg Pro Thr Pro
1 5 10 15
Lys Leu Pro Ser Pro Met Arg Arg Gln Pro Ser Trp Gln Trp Ala Ala
20 25 30
Ser Pro Ser Thr Ala Thr Thr Ser
35 40
<210> 357
<211> 26
<212> PRT
<213> Homo sapiens
<400> 357
Leu Val Ile Pro Lys Leu Ile Ile Leu Met Glu Lys Thr Leu Thr Gly
1 5 10 15
Cys Leu Arg Ala Leu Lys Met Asn Arg Phe
20 25
<210> 358
<211> 14
<212> PRT
<213> Homo sapiens
<400> 358
Thr Lys Ser Gly Lys Lys Gln Glu Leu Thr Phe Leu Leu Leu
1 5 10
<210> 359
<211> 11
<212> PRT
<213> Homo sapiens
<400> 359
Glu Ser Pro Pro Ala Pro Ser Met Pro Arg Cys
1 5 10
<210> 360
<211> 17
<212> PRT
<213> Homo sapiens
<400> 360
Arg Gln Thr Leu Arg Thr Leu Ser Leu Arg Gly Met Val Pro Arg Thr
1 5 10 15
Leu
<210> 361
<211> 10
<212> PRT
<213> Homo sapiens
<400> 361
Thr Thr Ser Gln Ser Gln Leu Ser Ser Glu
1 5 10
<210> 362
<211> 9
<212> PRT
<213> Homo sapiens
<400> 362
Glu Met Lys Lys Thr Thr Phe Ile Ser
1 5
<210> 363
<211> 25
<212> PRT
<213> Homo sapiens
<400> 363
Arg Phe Gln Met Gln Pro Leu Ser Leu Met Pro Ala His Trp Ser Ile
1 5 10 15
Cys Leu Leu Arg Asp Ser Met Ile Trp
20 25
<210> 364
<211> 13
<212> PRT
<213> Homo sapiens
<400> 364
Val Trp Lys Lys Met Lys Ser Lys Thr Ser Cys Val Val
1 5 10
<210> 365
<211> 10
<212> PRT
<213> Homo sapiens
<400> 365
Ser Gly Arg Asn Leu Pro Thr Ala Pro Cys
1 5 10
<210> 366
<211> 18
<212> PRT
<213> Homo sapiens
<400> 366
Thr Trp Pro Thr Gln Thr Trp Thr Arg Leu Pro Arg Arg Ser Cys Cys
1 5 10 15
Ser Arg
<210> 367
<211> 13
<212> PRT
<213> Homo sapiens
<400> 367
His Thr Ser Thr Leu Gly Lys Lys Ser Ile Leu Leu Leu
1 5 10
<210> 368
<211> 26
<212> PRT
<213> Homo sapiens
<400> 368
Gly Ile Tyr Phe Met Leu Gln Thr Pro Thr Ile Thr Arg Leu Lys Leu
1 5 10 15
Trp Ile Gln Lys Gln Lys Thr Val Gln His
20 25
<210> 369
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 369
Leu Ala Ser Ser Tyr Ser Gly Ile Gln Gln Arg Lys Leu
1 5 10
<210> 370
<211> 31
<212> PRT
<213> Homo sapiens
<400> 370
Ile His His Leu Pro Gly Thr Ile Pro Leu Ser Ser Gly Ala Arg Met
1 5 10 15
Cys Leu Leu Ser Gln Ala Pro Pro Ala Gly Ser Gly Gly Arg Arg
20 25 30
<210> 371
<211> 55
<212> PRT
<213> Homo sapiens
<400> 371
Gly Ser Pro Ser Arg Ser Ala Ala Cys Gly Gly Arg Glu Arg Arg Asp
1 5 10 15
Arg Arg Pro Gly Pro Ser Arg Ala His Cys Pro Ala Asn Gly Ala Gly
20 25 30
Trp Pro Cys Pro Ala Val Pro Leu Gly Pro Ala Arg Thr Gly Leu Leu
35 40 45
Pro Gly Glu Ala Ala Pro Ser
50 55
<210> 372
<211> 15
<212> PRT
<213> Homo sapiens
<400> 372
Cys Trp Thr Ser His Leu Met Gln Met Thr Arg Pro Trp Leu Asn
1 5 10 15
<210> 373
<211> 12
<212> PRT
<213> Homo sapiens
<400> 373
Gln Arg Lys Lys Ser Leu Lys Pro Ser Gly Ser Leu
1 5 10
<210> 374
<211> 8
<212> PRT
<213> Homo sapiens
<400> 374
Arg Thr Pro Pro Gly Gly Gly Arg
1 5
<210> 375
<211> 8
<212> PRT
<213> Homo sapiens
<400> 375
Glu Glu Lys Lys Lys Ala His Leu
1 5
<210> 376
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 376
Ala Thr Val Pro Thr Cys Ser Pro Arg Thr Leu Arg Cys Leu Pro
1 5 10 15
<210> 377
<211> 11
<212> PRT
<213> Homo sapiens
<400> 377
Ile Gly Asp Arg Glu Gln Val Lys Lys Thr Met
1 5 10
<210> 378
<211> 9
<212> PRT
<213> Homo sapiens
<400> 378
Leu Ser Lys Lys Glu Lys Met Thr Arg
1 5
<210> 379
<211> 28
<212> PRT
<213> Homo sapiens
<400> 379
Leu Ser Ile Asn Asn Tyr Arg Phe Gln Met Lys Phe Tyr Phe Arg Phe
1 5 10 15
Thr Ser His Gly Ser Pro Phe Thr Ser Ala Asn Phe
20 25
<210> 380
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 380
Ala Pro Phe Ser Pro Lys Val Trp Arg Thr Ala Arg Gly Ala Ser Leu
1 5 10 15
Ser Cys Gln Thr Thr Pro Pro Ile Thr Leu Ser Ser Thr Pro Arg
20 25 30
<210> 381
<211> 8
<212> PRT
<213> Homo sapiens
<400> 381
Asp Tyr Lys Lys Asn Thr Gly Ile
1 5
<210> 382
<211> 10
<212> PRT
<213> Homo sapiens
<400> 382
Ile Val Ala Leu Met Ser Ser Thr Ile Ile
1 5 10
<210> 383
<211> 12
<212> PRT
<213> Homo sapiens
<400> 383
Ile Pro Phe Phe Thr Gly Leu Thr Arg Met Met Arg
1 5 10
<210> 384
<211> 25
<212> PRT
<213> Homo sapiens
<400> 384
Glu Gly Arg Ser Ser Thr Asn Ala Arg Ser Ala Thr Val Cys Leu Thr
1 5 10 15
Ala Gly Thr Ser Ser Lys Ile Thr Trp
20 25
<210> 385
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 385
Ser Phe Ile Ala Leu Ile Gly Arg Leu Met Phe Gln Ala Cys
1 5 10
<210> 386
<211> 17
<212> PRT
<213> Homo sapiens
<400> 386
Asn Thr Met Lys Trp Trp Glu Leu Tyr Leu Val Ile Leu Ser His Ile
1 5 10 15
Ala
<210> 387
<211> 13
<212> PRT
<213> Homo sapiens
<400> 387
Ser Lys Pro Lys Arg Ile Lys Asn Leu Ser Leu Lys Thr
1 5 10
<210> 388
<211> 14
<212> PRT
<213> Homo sapiens
<400> 388
Ser Leu Asn Gln Arg Ser Tyr Ala Arg Pro Ser Cys Gln Pro
1 5 10
<210> 389
<211> 16
<212> PRT
<213> Homo sapiens
<400> 389
Met Ser Pro Pro Phe Met Pro Ser Arg Val Leu Phe Met Ser Arg Arg
1 5 10 15
<210> 390
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 390
Ile Arg Val Ile Glu Val Ala Arg His Lys Pro Leu Leu Arg Asn Leu
1 5 10 15
Lys Lys Lys Lys Ala Arg Ile Leu Arg Lys
20 25
<210> 391
<211> 13
<212> PRT
<213> Homo sapiens
<400> 391
Pro Ala Gly Trp Pro Gln Ala Ala Pro Arg Pro Ser Ala
1 5 10
<210> 392
<211> 16
<212> PRT
<213> Homo sapiens
<400> 392
Met Ala Thr Ser Ser His Arg Phe Leu Glu Asp Met Leu Pro Ala Lys
1 5 10 15
<210> 393
<211> 9
<212> PRT
<213> Homo sapiens
<400> 393
Glu Ser Pro Pro Ala Ser Leu Lys Asn
1 5
<210> 394
<211> 12
<212> PRT
<213> Homo sapiens
<400> 394
Gly Pro Pro Pro Ala Pro Pro Ile Ser Leu Ala Ser
1 5 10
<210> 395
<211> 10
<212> PRT
<213> Homo sapiens
<400> 395
Thr Gln Lys Lys Ser Tyr Pro Ile Lys Thr
1 5 10
<210> 396
<211> 11
<212> PRT
<213> Homo sapiens
<400> 396
Asn Trp Ile Ser Lys Lys Leu Asn Leu Thr Met
1 5 10
<210> 397
<211> 9
<212> PRT
<213> Homo sapiens
<400> 397
Leu Tyr Lys Lys Asn Ser Arg Arg Leu
1 5
<210> 398
<211> 14
<212> PRT
<213> Homo sapiens
<400> 398
Ser Ile Phe Leu Ala Lys Glu Ser Ser Gly Arg Ala Tyr Val
1 5 10
<210> 399
<211> 13
<212> PRT
<213> Homo sapiens
<400> 399
His Gln Arg Cys Ala Ala Ser Gln Gln Ser Ala Ser Phe
1 5 10
<210> 400
<211> 9
<212> PRT
<213> Homo sapiens
<400> 400
Asp Leu Lys Lys Arg Arg Ser Ala Val
1 5
<210> 401
<211> 17
<212> PRT
<213> Homo sapiens
<400> 401
Gln Leu Arg Leu Met Leu Pro Ser Ser Ala Arg Pro Trp Gly Pro Asp
1 5 10 15
Gly
<210> 402
<211> 14
<212> PRT
<213> Homo sapiens
<400> 402
Asn Tyr Asn Lys Glu Phe Leu His Gln Gly Gln Leu Glu Asn
1 5 10
<210> 403
<211> 15
<212> PRT
<213> Homo sapiens
<400> 403
Leu Gln Thr Trp Lys Lys Asn His Leu Thr Gln Thr Thr Leu Lys
1 5 10 15
<210> 404
<211> 10
<212> PRT
<213> Homo sapiens
<400> 404
His Ile Thr Gly Gly Thr Gly Leu Leu Leu
1 5 10
<210> 405
<211> 10
<212> PRT
<213> Homo sapiens
<400> 405
Glu Glu Gly Gly Cys Ala Ser Gly Thr Trp
1 5 10
<210> 406
<211> 29
<212> PRT
<213> Homo sapiens
<400> 406
Asn Gln Glu Arg Ser Pro Asp Pro Ser Pro Asp Leu His Thr Gly Leu
1 5 10 15
Ile Lys Ser Gln Arg Lys Thr Asn Thr Asp Val Asn Phe
20 25
<210> 407
<211> 12
<212> PRT
<213> Homo sapiens
<400> 407
Ala His Gln Lys Arg Lys Gln Ser Cys Arg Cys Ser
1 5 10
<210> 408
<211> 9
<212> PRT
<213> Homo sapiens
<400> 408
Cys His Lys Lys Thr Ser Gln Leu Asp
1 5
<210> 409
<211> 16
<212> PRT
<213> Homo sapiens
<400> 409
Arg Glu Phe Ile Asn Leu Lys Met Ile Lys Trp Thr Leu Leu Lys Ser
1 5 10 15
<210> 410
<211> 12
<212> PRT
<213> Homo sapiens
<400> 410
Ile Phe Tyr Thr Trp Thr Asn Gln Tyr Leu Gln Asn
1 5 10
<210> 411
<211> 13
<212> PRT
<213> Homo sapiens
<400> 411
Ser Leu Ser Pro Gly Pro Lys Arg Thr Gln Ile Trp Ser
1 5 10
<210> 412
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 412
Asn Trp Met Thr Met Gln Thr Ile Ile Lys Asn Arg Thr Glu Ala Met
1 5 10 15
Pro Arg Glu His Leu Leu
20
<210> 413
<211> 11
<212> PRT
<213> Homo sapiens
<400> 413
Glu Phe Phe Phe Thr Ile Gly Ile Thr Trp Ile
1 5 10
<210> 414
<211> 11
<212> PRT
<213> Homo sapiens
<400> 414
Phe Pro Phe Phe Ser Ser Leu Glu Gln Cys Pro
1 5 10
<210> 415
<211> 8
<212> PRT
<213> Homo sapiens
<400> 415
Leu Tyr Lys Lys Ile Glu Lys Asn
1 5
<210> 416
<211> 21
<212> PRT
<213> Homo sapiens
<400> 416
His Pro Ser Ser Thr Asp Gly Gly Leu Cys Glu Ala Pro Gly Leu Pro
1 5 10 15
Thr Ser Ser Ser Leu
20
<210> 417
<211> 12
<212> PRT
<213> Homo sapiens
<400> 417
Leu Pro Leu Gln Pro Tyr Leu Leu Pro Cys Leu Leu
1 5 10
<210> 418
<211> 11
<212> PRT
<213> Homo sapiens
<400> 418
Leu Ile Glu Gln Asn Leu Ile Gly Lys Lys Asn
1 5 10
<210> 419
<211> 11
<212> PRT
<213> Homo sapiens
<400> 419
Glu His Gly Gly Pro Pro Ser Ser Met Pro Leu
1 5 10
<210> 420
<211> 11
<212> PRT
<213> Homo sapiens
<400> 420
Thr His Trp Lys Arg Asn Pro Lys Ala Ile Trp
1 5 10
<210> 421
<211> 13
<212> PRT
<213> Homo sapiens
<400> 421
Gly Tyr Thr Pro Gln Met Glu Ala Gly Ala Gly Gln Trp
1 5 10
<210> 422
<211> 11
<212> PRT
<213> Homo sapiens
<400> 422
Leu Thr Lys Lys Ile Arg Asn Ser Cys Leu Ile
1 5 10
<210> 423
<211> 10
<212> PRT
<213> Homo sapiens
<400> 423
Gln Pro Pro Arg Arg Pro Ser Thr Ala Asn
1 5 10
<210> 424
<211> 10
<212> PRT
<213> Homo sapiens
<400> 424
Ala Pro Lys Lys Thr Leu Leu Lys Cys Trp
1 5 10
<210> 425
<211> 9
<212> PRT
<213> Homo sapiens
<400> 425
Asp Met Lys Lys Asn Cys Gly Ser Leu
1 5
<210> 426
<211> 9
<212> PRT
<213> Homo sapiens
<400> 426
Trp Thr Thr Gly Val Pro Pro Ser Ser
1 5
<210> 427
<211> 11
<212> PRT
<213> Homo sapiens
<400> 427
Asp Ser Leu Lys Met Val Lys Asn Phe Leu Ser
1 5 10
<210> 428
<211> 9
<212> PRT
<213> Homo sapiens
<400> 428
Phe Leu Asn Pro Arg Lys Leu Gly Pro
1 5
<210> 429
<211> 9
<212> PRT
<213> Homo sapiens
<400> 429
Lys Thr Pro Pro Gly Gly Tyr Pro Leu
1 5
<210> 430
<211> 14
<212> PRT
<213> Homo sapiens
<400> 430
Ser Pro Cys Trp Ala Trp Thr Pro Gly Gly Trp Ala Ala Ser
1 5 10
<210> 431
<211> 8
<212> PRT
<213> Homo sapiens
<400> 431
Gln Val Pro Pro Ser Ile Leu His
1 5
<210> 432
<211> 11
<212> PRT
<213> Homo sapiens
<400> 432
Val Lys Pro Thr Leu Trp Glu Glu Gly Thr Ser
1 5 10
<210> 433
<211> 8
<212> PRT
<213> Homo sapiens
<400> 433
Tyr Trp Ala Pro His Val Thr Pro
1 5
<210> 434
<211> 11
<212> PRT
<213> Homo sapiens
<400> 434
Leu Leu His Phe Leu Val Met Leu Arg Ile Ile
1 5 10
<210> 435
<211> 11
<212> PRT
<213> Homo sapiens
<400> 435
Asn Thr Leu Lys Asn Ser Phe Leu Leu Trp Pro
1 5 10
<210> 436
<211> 11
<212> PRT
<213> Homo sapiens
<400> 436
Glu Arg Gln Lys Ile Lys Lys Lys Pro Lys Arg
1 5 10
<210> 437
<211> 42
<212> PRT
<213> Homo sapiens
<400> 437
Gly Arg Arg Lys Arg Ser Glu Gly Gly Val Lys Arg Lys Lys Glu Asn
1 5 10 15
Val Cys Lys Arg Arg Lys Arg Asn Val Gly Glu Lys Lys Arg Lys Gly
20 25 30
Phe Asp Gly Arg Lys Arg Lys Gly Asp Gly
35 40
<210> 438
<211> 24
<212> PRT
<213> Homo sapiens
<400> 438
Tyr Met Lys Lys Asn Leu Thr Pro Ser Phe Ala Met Lys Tyr Leu Pro
1 5 10 15
Pro Ile Cys Thr Leu Gly Asp Gln
20
<210> 439
<211> 13
<212> PRT
<213> Homo sapiens
<400> 439
Tyr Ser Ala Ser Gly His Gly Val Arg Ile Thr Lys Ser
1 5 10
<210> 440
<211> 19
<212> PRT
<213> Homo sapiens
<400> 440
Glu Met Phe Val Leu Asn Pro Cys Leu Pro Ser Ile Met Leu Thr Ser
1 5 10 15
His Asn Met
<210> 441
<211> 14
<212> PRT
<213> Homo sapiens
<400> 441
Val Pro Ala Leu Lys Lys Leu Arg Ser Pro Leu Trp Ile Phe
1 5 10
<210> 442
<211> 55
<212> PRT
<213> Homo sapiens
<400> 442
Arg Gln Pro Glu Ala Ala Thr Lys Ser Cys Val Arg Ser Ser Cys Gly
1 5 10 15
Gly Pro Ser Gly Asp Glu Pro Pro Pro Cys Leu Gln Gln Pro Asp Pro
20 25 30
Arg Ala Leu Ser Gln Ala Phe Ser Arg Ser Phe Pro Leu Phe Pro Ser
35 40 45
Leu Ala Gly Lys Ser Met Ile
50 55
<210> 443
<211> 48
<212> PRT
<213> Homo sapiens
<400> 443
Arg Thr Pro Thr Ser Pro Ala Ala Thr Lys Ser His Ser Leu Arg Val
1 5 10 15
Phe Gly Trp Ala Asp Ala Leu Leu Asn Leu Val Ala Arg Val Pro Ser
20 25 30
Asn Leu Gly Asp Leu Phe Lys Ser Lys Val Asn Pro Ala Thr Met Leu
35 40 45
<210> 444
<211> 32
<212> PRT
<213> Homo sapiens
<400> 444
Arg Glu Pro Arg Glu Arg Leu Tyr Gln Asp Thr Ser Leu Met Met Ile
1 5 10 15
Val Leu Thr Ile Gln Asn Ala Ala Phe Leu Ser Asn Ile Arg Met Ala
20 25 30
<210> 445
<211> 29
<212> PRT
<213> Homo sapiens
<400> 445
Ser Lys Thr Gln Arg Arg Tyr Lys Leu Ser Ser Leu Lys Glu Asp Leu
1 5 10 15
Leu Gln Arg Ser Ala Phe Thr Ser Gln Ala Pro Leu Tyr
20 25
<210> 446
<211> 45
<212> PRT
<213> Homo sapiens
<400> 446
Pro Gly Leu Arg Pro Ser Gln His Leu Leu Leu Tyr Ile Thr Leu Arg
1 5 10 15
Val Val Lys Trp Ile Pro Ala Leu Ala Thr Ala Ser Ala Trp Pro Ala
20 25 30
Pro Ser Ala Lys Thr Val Trp His Pro Thr Leu Leu Ile
35 40 45
<210> 447
<211> 28
<212> PRT
<213> Homo sapiens
<400> 447
Cys His Leu Ala Ser Cys Pro Gln Cys Phe His Gln Trp Gly Arg His
1 5 10 15
His His Ser His Arg Tyr Gln Glu Trp Tyr Leu Arg
20 25
<210> 448
<211> 11
<212> PRT
<213> Homo sapiens
<400> 448
Gly Ala Thr Pro Gln Ala Ala Pro Thr Thr Ser
1 5 10
<210> 449
<211> 10
<212> PRT
<213> Homo sapiens
<400> 449
Val Leu Thr Lys Gln Lys Val Leu Tyr Lys
1 5 10
<210> 450
<211> 10
<212> PRT
<213> Homo sapiens
<400> 450
Ile Lys Ala Leu Leu Thr Leu Asn Ser Leu
1 5 10
<210> 451
<211> 9
<212> PRT
<213> Homo sapiens
<400> 451
Gly Thr Pro Pro Trp Met Pro Phe Arg
1 5
<210> 452
<211> 49
<212> PRT
<213> Homo sapiens
<400> 452
His Arg Pro Pro His Ser Gln Gln Pro Phe His Ser His Cys Pro Ser
1 5 10 15
Arg Ser Pro Gln Pro Ser Leu Arg Pro His Pro His Pro Leu Arg Ala
20 25 30
Gln Gly Cys Asn Pro Ser Leu Ser Thr Thr His Arg Trp Tyr Ser Trp
35 40 45
Gly
<210> 453
<211> 64
<212> PRT
<213> Homo sapiens
<400> 453
Asn Tyr Gly His Cys Asn Ser Pro Leu Ala Phe Leu Thr Gln Leu Leu
1 5 10 15
Pro Arg Pro Thr Ser Asn Pro Trp Trp Met Thr Arg Arg Asp Pro Phe
20 25 30
Cys Gly Gly Asn Leu Ile Ser Thr Lys Leu Glu Asn Phe Val Ser Gly
35 40 45
Ile Ser Ala Gly Thr Glu Arg Arg Gln Met Asn Leu Cys Phe Leu Tyr
50 55 60
<210> 454
<211> 51
<212> PRT
<213> Homo sapiens
<400> 454
Arg Lys His Cys Cys Lys Arg Ile Thr Leu Arg Ser Ser Cys Ser Leu
1 5 10 15
Gly Arg Asp Leu Tyr Leu Trp Asn Pro Arg Ile Leu Lys Gly Ser Gly
20 25 30
Gly Tyr Thr Asp Val Ile Met Met Asp Ala Thr Lys Cys Thr Leu Lys
35 40 45
Ala Pro Thr
50
<210> 455
<211> 47
<212> PRT
<213> Homo sapiens
<400> 455
Asn Ser Gly Ser Gln Ser Gly Thr Lys Met Lys Ala Thr His Ser Gly
1 5 10 15
Gly Leu Lys Lys Lys Ser Phe Thr Val Pro Lys Leu Leu Phe Pro Thr
20 25 30
Gln Lys Phe Asn Leu Asp Leu Lys Ala Cys Ser Ile Pro Glu Asp
35 40 45
<210> 456
<211> 28
<212> PRT
<213> Homo sapiens
<400> 456
Arg Asp Gln Cys Phe Gln Met Met Glu Gly Lys Ala Phe Leu Pro Glu
1 5 10 15
Arg Lys Cys Phe Pro Gly Asn Gln His Pro Leu Gly
20 25
<210> 457
<211> 43
<212> PRT
<213> Homo sapiens
<400> 457
Ala Met Arg Arg Pro Ser Ser Arg His Ala Ala His Arg Pro Leu Cys
1 5 10 15
Gln Arg Phe Pro Thr Leu Thr Val Ser Arg Trp Met Thr Ser Leu Ile
20 25 30
Ser Ser Leu Arg Val Glu Arg Ser Pro Ser Pro
35 40
<210> 458
<211> 25
<212> PRT
<213> Homo sapiens
<400> 458
Cys Ile Trp Gln Pro Val Met Asp Thr Val Ile Leu Tyr Arg Ser Tyr
1 5 10 15
Cys Ser Thr Arg Gln Thr Ser Met Gln
20 25
<210> 459
<211> 17
<212> PRT
<213> Homo sapiens
<400> 459
Asn Ser Leu Ala Leu Cys Trp Val Pro Ala Cys Trp Val Thr Cys Leu
1 5 10 15
His
<210> 460
<211> 21
<212> PRT
<213> Homo sapiens
<400> 460
Leu Leu Gln Pro Cys Leu Lys Ala Leu Ser Val Pro Leu Trp Lys Met
1 5 10 15
Pro Ser Arg Ala Ser
20
<210> 461
<211> 13
<212> PRT
<213> Homo sapiens
<400> 461
Asn Pro Pro Leu Arg Phe Asn Leu Ile Leu Met Met Tyr
1 5 10
<210> 462
<211> 19
<212> PRT
<213> Homo sapiens
<400> 462
Thr Ala Leu Gly Ala Thr Ile Pro Ser Arg Pro Arg Ser Ala Ala Ala
1 5 10 15
Leu Arg Thr
<210> 463
<211> 12
<212> PRT
<213> Homo sapiens
<400> 463
Asp Ala Lys Lys Leu Val Leu Leu Asn Trp Leu Pro
1 5 10
<210> 464
<211> 14
<212> PRT
<213> Homo sapiens
<400> 464
Gly Gly Arg Met Arg Asn Ile Phe Thr Pro Ala Gly His Lys
1 5 10
<210> 465
<211> 10
<212> PRT
<213> Homo sapiens
<400> 465
Leu Cys Arg Asn Met Lys Gln Gln Ile Tyr
1 5 10
<210> 466
<211> 20
<212> PRT
<213> Homo sapiens
<400> 466
Gly Glu Trp Ala Ala Leu Gly Pro Cys Trp Lys Ser Ala Cys Arg Ala
1 5 10 15
Ser Arg Ser Ala
20
<210> 467
<211> 8
<212> PRT
<213> Homo sapiens
<400> 467
Cys Pro Gly Gly Ala Leu Gln Trp
1 5
<210> 468
<211> 10
<212> PRT
<213> Homo sapiens
<400> 468
Glu Ala Lys Lys Arg Ile Met Trp Leu Leu
1 5 10
<210> 469
<211> 13
<212> PRT
<213> Homo sapiens
<400> 469
His Thr Ser Trp Asn Phe Arg Pro Leu Asn Trp Arg Ser
1 5 10
<210> 470
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 470
Val Gly Ala Gln Leu Met Leu Thr Ser Thr Ser Cys Ser Thr Met Ser
1 5 10 15
Cys Leu Ser Arg Pro Gly Trp Ala Ala Leu Gln Arg Leu Thr Trp Val
20 25 30
Cys Arg Arg Pro
35
<210> 471
<211> 87
<212> PRT
<213> Homo sapiens
<400> 471
Arg Ala Pro Pro Lys Thr Ala Pro Glu Thr Ala Ala Lys Phe Leu Lys
1 5 10 15
Glu Gly Thr Glu Arg Asn Thr Ala Glu Ser Leu Gln Glu Lys Leu Gly
20 25 30
Val Thr Pro Gly Ser Trp Trp Met His Leu Arg Ser Arg Phe Leu Ser
35 40 45
Ala Asn Ala Ala Cys Glu Cys Val Arg Arg Leu Pro Cys Asp Gly Asn
50 55 60
Thr Leu Pro Arg Arg Thr Ser Asn Phe Tyr Val Asp Val His Glu Ala
65 70 75 80
Leu Val Phe Asp Val Cys Leu
85
<210> 472
<211> 29
<212> PRT
<213> Homo sapiens
<400> 472
Gln Leu Leu Ser Gln Thr Pro Arg Leu Pro Pro Cys Leu His Thr Glu
1 5 10 15
Glu Pro Ser His Trp Thr Gly Gly Pro Arg Ser Pro Pro
20 25
<210> 473
<211> 29
<212> PRT
<213> Homo sapiens
<400> 473
Ile Ala Phe His Ile Lys Ser Ile Ala Ala Ala Leu Lys Arg His Phe
1 5 10 15
Thr Val Asn Met Ser Lys Val Glu Thr Gly Leu His Val
20 25
<210> 474
<211> 31
<212> PRT
<213> Homo sapiens
<400> 474
Trp Lys Lys Thr Gln Ala Asp Cys Phe Phe Gly Leu Leu Lys Lys Ile
1 5 10 15
Gly Leu Pro Gln Cys Gly Asp Ser Phe Leu Lys Arg Pro Leu Thr
20 25 30
<210> 475
<211> 23
<212> PRT
<213> Homo sapiens
<400> 475
Ala Val Phe Ala Ser Ser Arg Pro Thr Ser Pro Ala Ser Cys Arg Arg
1 5 10 15
Pro Pro Ser Ser Trp Trp Arg
20
<210> 476
<211> 24
<212> PRT
<213> Homo sapiens
<400> 476
Thr Gln Arg Arg Leu Lys Asn Trp Lys Glu Lys Lys Cys Ile Glu Leu
1 5 10 15
Asn Ile Leu Ile Ser Trp Arg Ile
20
<210> 477
<211> 38
<212> PRT
<213> Homo sapiens
<400> 477
Arg His Asn Asp Gly Lys Asn Glu Lys Asn Trp Pro Asn Ser Met Lys
1 5 10 15
Pro Ser Tyr Gly Ser Val Ala Thr Ala Ala Ser Ser Gly His Cys Ile
20 25 30
Leu Cys Leu Val Trp Arg
35
<210> 478
<211> 46
<212> PRT
<213> Homo sapiens
<400> 478
Thr Arg Glu Lys Ile Lys Gln Pro Val Ala Gln Trp Val Met Ile Thr
1 5 10 15
Lys Arg Pro Lys Glu Asn His Gln Arg Lys Arg Arg Asn Val Asn Ile
20 25 30
Lys Lys Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln
35 40 45
<210> 479
<211> 50
<212> PRT
<213> Homo sapiens
<400> 479
Leu Pro Thr Pro Phe Cys Thr Thr Leu Arg Asn Phe Phe Leu Ser Ser
1 5 10 15
Leu Ile Leu Ala Val Leu Cys Thr Asn Cys Ile Phe Arg Tyr Thr Ala
20 25 30
Ser Phe Leu Gln Ala Phe Met Leu Pro Gly Phe Leu Lys His Thr Lys
35 40 45
Arg Lys
50
<210> 480
<211> 33
<212> PRT
<213> Homo sapiens
<400> 480
Leu Pro Ile Leu Met Met Pro Ser Lys Lys Leu Ile Leu Tyr Leu Phe
1 5 10 15
Leu Cys Cys Pro Thr Leu Ser Phe Trp Gln Arg Glu Gln Pro Ser Arg
20 25 30
Thr
<210> 481
<211> 29
<212> PRT
<213> Homo sapiens
<400> 481
Leu Ser Met Ile Met Tyr Ser Leu Pro Leu Thr Tyr Ser Asn Leu His
1 5 10 15
Thr Leu Thr Ile Leu Lys Lys Tyr Met Leu Ser Gln Asn
20 25
<210> 482
<211> 28
<212> PRT
<213> Homo sapiens
<400> 482
Cys Thr Pro Phe Cys Thr Leu Ser Ala Lys His Val Pro Leu Ser Ile
1 5 10 15
Ser Gly Ser Pro Ala Leu Glu Leu Leu Gly Pro Trp
20 25
<210> 483
<211> 11
<212> PRT
<213> Homo sapiens
<400> 483
Leu Asn Gln Lys Asn Ile Pro Asp Leu Ser Ile
1 5 10
<210> 484
<211> 15
<212> PRT
<213> Homo sapiens
<400> 484
Val Ser Pro Leu Ala Pro Cys Pro Pro Leu Glu Val His Leu His
1 5 10 15
<210> 485
<211> 14
<212> PRT
<213> Homo sapiens
<400> 485
Ser Thr Gly Arg Leu Thr Ala Arg Arg Met Pro Pro Cys Leu
1 5 10
<210> 486
<211> 8
<212> PRT
<213> Homo sapiens
<400> 486
Arg Pro Lys Lys Arg Thr Val Leu
1 5
<210> 487
<211> 21
<212> PRT
<213> Homo sapiens
<400> 487
Val Val Lys Val Trp Met Arg Val Lys Tyr Thr Lys Glu Val Ile Met
1 5 10 15
Asp Leu Thr Asn Val
20
<210> 488
<211> 13
<212> PRT
<213> Homo sapiens
<400> 488
Phe Arg Phe Phe Arg Met Arg Lys Trp Arg Asp Gln Ile
1 5 10
<210> 489
<211> 18
<212> PRT
<213> Homo sapiens
<400> 489
His Phe Trp Asn Ser Thr Lys Lys Arg Leu Arg Thr Met Lys Ile Lys
1 5 10 15
Cys Ser
<210> 490
<211> 13
<212> PRT
<213> Homo sapiens
<400> 490
Leu Pro Val Leu Ala Pro Ile Met Ser Arg Gly Arg Ala
1 5 10
<210> 491
<211> 13
<212> PRT
<213> Homo sapiens
<400> 491
Met Thr Lys Lys Glu Asn Ala Asn Met Ile Phe Lys Lys
1 5 10
<210> 492
<211> 12
<212> PRT
<213> Homo sapiens
<400> 492
Ala Leu Lys Lys Pro Leu Arg Lys Val Arg Arg Leu
1 5 10
<210> 493
<211> 10
<212> PRT
<213> Homo sapiens
<400> 493
Asp Gln Phe Phe Trp Lys Met Gln Leu Leu
1 5 10
<210> 494
<211> 196
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 494
Ala Pro Thr Val Leu Gly Gly Pro Arg Trp Leu Cys Cys Thr Gln Asn
1 5 10 15
Val Ala Ser Gly Asn Gly Pro Leu Leu Ala Arg Pro Ala Gly Lys Pro
20 25 30
Arg Ala Ala Ser Leu Ser Ser Trp Lys Ala Leu Gly Pro Ser Ala Ala
35 40 45
Ser Leu Arg Pro Ser Leu Arg Ala Pro Gly Arg Pro Val Gly Ala Ser
50 55 60
Arg Pro Ala Gln Thr Gln Gly Ser Leu Pro Arg Arg Leu Leu Pro Pro
65 70 75 80
Phe Cys Gly Gln Thr Trp Pro Gly Ser Trp Gly Ser Gln Glu Ser Phe
85 90 95
Ile Cys Cys Ala Asp Ile Ser Thr Ala Leu Pro Leu Gly Ser Ser Arg
100 105 110
Pro Ala Pro Ala Pro Arg His Arg Glu His Glu His Gly His Gln Ala
115 120 125
Arg Pro Pro Arg Leu Leu Phe Thr Ser Leu Met Gln Leu Leu Trp Thr
130 135 140
Gln Leu Thr Arg His Ser Pro Pro Thr Leu His Thr Gly Pro His Pro
145 150 155 160
Ser Leu His Val Ala Ala Leu Ser Leu Leu Arg Met Asp Ser Thr Leu
165 170 175
Arg Gln Gly Ala Ser Leu Phe Ser Leu Thr Leu Gly Gly Pro Gly Pro
180 185 190
Trp Lys Asp Pro
195
<210> 495
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 495
Arg Ser Val Cys Ser Tyr Ala Gly Ser Trp Gly Thr Ala Leu Gly Arg
1 5 10 15
Gly Gln Ser Leu Trp Arg Arg Arg Lys Arg Trp Leu Cys Ala Gln Thr
20 25 30
Val Arg Ala Ala Thr Ile Leu Leu Ala Arg Arg Arg Arg Arg Ser Leu
35 40 45
Asp Leu Arg Lys Arg Arg Arg Ala Asn Arg Arg Met Met Met Met Ile
50 55 60
Gln Arg Ser Leu Asn His Leu Leu Ser Ser Trp Lys Thr Gly Ala Trp
65 70 75 80
Lys Thr Leu Thr Thr Cys Ser Gln Arg Arg Ile Ile Glu Pro Ser Pro
85 90 95
Thr Thr Arg Pro Ser Ala Ser Leu Ser Asp Pro Ser Leu Leu Pro Lys
100 105 110
Ile Pro Arg Leu Leu Ser Pro Arg
115 120
<210> 496
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 496
Arg Ser Trp Gly Thr Ala Leu Gly Arg
1 5
<210> 497
<211> 104
<212> PRT
<213> Homo sapiens
<400> 497
Ser Gly Pro Thr Arg Arg His Ser Trp Ala Pro Lys Thr Ser Ser Leu
1 5 10 15
Thr Arg Asn Pro Arg Arg Ser Leu Ala Ser Pro Thr Arg Gly Lys Gly
20 25 30
Ser Ala Arg Gly Cys Gly Arg Ser Arg Thr Thr Leu Leu Ser Arg Leu
35 40 45
Pro Ala Ile Ser Pro Pro Arg Lys Arg Ala Val Trp Lys Ser Leu Asn
50 55 60
Gln Ser Pro Lys Leu Gln Arg Val Thr Val Ile Arg Arg Gly Met Gln
65 70 75 80
Arg Ala Ala Ala Thr Arg Lys Gly Ser Trp Ser Leu Met Ser Gln Pro
85 90 95
Arg Arg Arg Thr Arg Lys Glu Arg
100
<210> 498
<211> 57
<212> PRT
<213> Homo sapiens
<400> 498
His Leu Thr Thr Lys Gly Glu Gly Trp Val His Gln Trp Gly Val Thr
1 5 10 15
Val Gly Ala Gln Val Ala Thr Ala Pro Ser Met Gly Thr Pro His Pro
20 25 30
Leu Pro His His Pro Ser Met Ala Leu Thr Pro Thr Ala Leu Cys Ser
35 40 45
Trp Ser Met Ala Trp Ile Asn Leu Arg
50 55
<210> 499
<211> 64
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 499
Thr Cys Arg Ala Ile Val Thr Met Thr Ser Cys Leu Tyr Leu Arg Thr
1 5 10 15
Thr Glu Gly His Pro Val Gly Ala Ile Pro Pro His Ser Ala Ser Tyr
20 25 30
Pro Thr Tyr Pro Thr His Phe Ser Thr Trp Glu Pro Val Pro Ser Asp
35 40 45
Arg Pro Ala Gly Ala Leu Pro Arg Cys Ser Pro Leu Arg Thr Glu Gly
50 55 60
<210> 500
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 500
Arg Arg Arg Lys Arg Arg Asp Ile Gln Glu Asn Gln Arg Thr Leu Leu
1 5 10 15
Lys Ile Gln Asn Cys Thr Tyr Pro Gly Ser Pro Ala Trp Arg Leu Val
20 25 30
Ala Phe Leu Ser Leu Val Ala Arg Leu Trp Lys Ala Ser Asp Leu Ser
35 40 45
Val Arg Lys Arg Asn Thr Tyr Gly Trp Lys Leu Ser Met Ala Arg Val
50 55 60
Ile Glu Asn Ser Ala Ser Lys Gln Lys Ile His
65 70 75
<210> 501
<211> 60
<212> PRT
<213> Homo sapiens
<400> 501
Gly Cys Phe Trp Pro Cys Leu Trp Asn Ser Leu Leu Arg Phe Cys Pro
1 5 10 15
Ala Ser Cys Ser Gly Cys Tyr Ser Trp Thr Ile Pro Pro Thr Gly Ser
20 25 30
Pro Phe Ser Cys Thr Thr Thr Arg Ser Ser Met Asn Pro Thr Ser Leu
35 40 45
Thr Pro Gly Arg Ser Ser Arg Thr Thr Ser Gln Leu
50 55 60
<210> 502
<211> 52
<212> PRT
<213> Homo sapiens
<400> 502
Cys Thr Thr Ser Arg Gly His Cys Thr Gly Ser Pro Arg Pro Cys Thr
1 5 10 15
Pro Phe Ala Ile Ser Cys Thr Ala His Lys Trp Asn Gly Lys Thr Pro
20 25 30
Thr Trp Ser Leu Pro Lys Ser Thr Ser Arg Trp Lys Gly Pro Ser Ser
35 40 45
Cys Cys Arg Arg
50
<210> 503
<211> 33
<212> PRT
<213> Homo sapiens
<400> 503
Lys Gln Thr Arg Arg Arg Lys Leu Leu Leu Leu Cys Lys Lys Asn Gln
1 5 10 15
Ile Leu Lys Lys Lys Gly Glu Lys Leu Lys His Cys Phe Lys Ala Trp
20 25 30
Gly
<210> 504
<211> 33
<212> PRT
<213> Homo sapiens
<400> 504
Cys Pro Leu Leu Leu Val Tyr Ile Met Ser Thr Thr Gly Trp Leu Glu
1 5 10 15
Arg Ala Tyr Gly Arg Leu Trp Arg Pro Thr Ala Ile Arg Gln Thr Leu
20 25 30
Tyr
<210> 505
<211> 52
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 505
Ser Leu Leu Val Pro Arg Arg Leu Leu Pro Tyr Thr Leu Pro His Ser
1 5 10 15
Ala His Gly Ser Arg Arg Thr Ser Thr Cys Gln His Pro Thr Thr Thr
20 25 30
Asn Thr Ser Ser Ser Ser Ser Ser Gln Met Trp Cys Arg Pro Arg Ser
35 40 45
Ser Cys Ile Arg
50
<210> 506
<211> 45
<212> PRT
<213> Homo sapiens
<400> 506
Ser Leu Pro Pro Leu Met Ser Ala Val Ala Thr Leu Cys Gln Asn Thr
1 5 10 15
Pro Met Val Ser Pro Leu Gly Ala Pro Leu Ala Arg Asn Cys Thr Gln
20 25 30
His Pro Ser Pro Leu Trp Leu Gly Thr Leu Arg Asp Thr
35 40 45
<210> 507
<211> 71
<212> PRT
<213> Homo sapiens
<400> 507
Gln Arg Lys Ile Met Asp Thr Arg Gln Gly Lys Val His Thr Ser Thr
1 5 10 15
Asp Ser Ser Trp Arg Ala Pro Ala Gly Thr Pro Lys Gln Glu Pro Leu
20 25 30
Leu Lys Pro Val Ser Arg Ser Trp His Ala Leu Cys Arg Ser Ser Leu
35 40 45
Gln Lys Pro Pro Pro Trp Thr Asp Lys Lys Pro Asn Arg Pro Thr Ser
50 55 60
Ala Leu Cys Ile Glu Pro Asn
65 70
<210> 508
<211> 41
<212> PRT
<213> Homo sapiens
<400> 508
Met Lys Leu Thr Leu Ala Val Leu Pro Thr Leu Arg Asn Leu His Cys
1 5 10 15
Tyr Pro Gln Leu Cys Leu Gln Gly Arg Leu Ala Ala Arg Asn Ala Asn
20 25 30
Met Asn Leu Glu Ile Leu Leu Gly Val
35 40
<210> 509
<211> 27
<212> PRT
<213> Homo sapiens
<400> 509
Cys Ser Ile Lys Pro Pro Leu Pro Arg Arg Trp Thr Thr Val Leu Arg
1 5 10 15
Glu Pro Trp His Gly Met Gln Glu Ile Arg Pro
20 25
<210> 510
<211> 15
<212> PRT
<213> Homo sapiens
<400> 510
Arg Thr Gly Pro Trp Thr Pro Leu Leu Pro Pro Ser Cys Pro Trp
1 5 10 15
<210> 511
<211> 32
<212> PRT
<213> Homo sapiens
<400> 511
Asn Met Glu Thr Phe Gln Ser Met Ser Trp Pro Ile Leu Thr Ile Phe
1 5 10 15
Leu Thr Ser Met Arg Thr Ile Ile Pro Glu Phe Cys Leu Asn Glu Phe
20 25 30
<210> 512
<211> 16
<212> PRT
<213> Homo sapiens
<400> 512
Leu Gly Gln Ile Ile Met Lys Lys Met Arg Arg Pro Val Cys Tyr Lys
1 5 10 15
<210> 513
<211> 37
<212> PRT
<213> Homo sapiens
<400> 513
Leu Pro Pro Pro Ser His Arg Ala Pro His Ser Pro Pro Pro Ser Gln
1 5 10 15
His Arg Arg Ala Gln Asp Gln Pro His Ser Cys Leu Cys Pro Arg Arg
20 25 30
Thr Gly Cys Cys Val
35
<210> 514
<211> 22
<212> PRT
<213> Homo sapiens
<400> 514
Ser Val Ser Arg Pro Glu Ala Cys Gly Ile Arg Thr Ser Leu Leu Val
1 5 10 15
Arg Arg Met Arg Arg Gln
20
<210> 515
<211> 15
<212> PRT
<213> Homo sapiens
<400> 515
Leu Gln Lys Lys Glu Ile Ala Lys Asn Val Phe Val Gln Asn Ile
1 5 10 15
<210> 516
<211> 11
<212> PRT
<213> Homo sapiens
<400> 516
Ile Ile Lys Lys Asn Pro Ala Leu Pro Lys His
1 5 10
<210> 517
<211> 14
<212> PRT
<213> Homo sapiens
<400> 517
Gly Phe Lys Met Gln Ser Arg Arg Arg Lys Trp Ala Gly Asn
1 5 10
<210> 518
<211> 19
<212> PRT
<213> Homo sapiens
<400> 518
Ser Ala Thr Thr Thr Thr Val Ile Leu Glu Ile Ile Ile Met Asp Arg
1 5 10 15
Val Ile Pro
<210> 519
<211> 12
<212> PRT
<213> Homo sapiens
<400> 519
Ala Ala Ser Gly Ala Ala Glu Ala Ala Glu Leu Leu
1 5 10
<210> 520
<211> 12
<212> PRT
<213> Homo sapiens
<400> 520
Ile Thr Lys Lys Arg Asn Trp Leu Arg Ser Trp Leu
1 5 10
<210> 521
<211> 14
<212> PRT
<213> Homo sapiens
<400> 521
Arg Arg Lys Asn Lys Lys Gln Pro Thr Phe Phe Leu Trp Gln
1 5 10
<210> 522
<211> 16
<212> PRT
<213> Homo sapiens
<400> 522
Val Thr Ile Arg Ile Gln Lys Gln Lys Phe Arg Ile Leu Lys Arg Ile
1 5 10 15
<210> 523
<211> 14
<212> PRT
<213> Homo sapiens
<400> 523
Arg Lys Glu Asn Thr Val Lys Arg Pro Asn Leu Pro His Leu
1 5 10
<210> 524
<211> 9
<212> PRT
<213> Homo sapiens
<400> 524
Ile Glu Lys Lys Glu Arg Lys Asn Leu
1 5
<210> 525
<211> 10
<212> PRT
<213> Homo sapiens
<400> 525
Leu Thr Leu Phe Ser Leu Lys Val Trp Glu
1 5 10
<210> 526
<211> 11
<212> PRT
<213> Homo sapiens
<400> 526
Ile Leu Ile Val Cys Arg Lys Ser Phe Tyr Ser
1 5 10
<210> 527
<211> 11
<212> PRT
<213> Homo sapiens
<400> 527
Leu Ile Ser His Leu Met Lys Trp Ala His Pro
1 5 10
<210> 528
<211> 8
<212> PRT
<213> Homo sapiens
<400> 528
Ser Leu Phe Phe Ser Tyr Cys Phe
1 5
<210> 529
<211> 11
<212> PRT
<213> Homo sapiens
<400> 529
Thr Leu Asn Trp Lys Arg Asn Leu Leu Phe Gly
1 5 10
<210> 530
<211> 13
<212> PRT
<213> Homo sapiens
<400> 530
Thr Leu Asn Trp Lys Arg Gly Pro Ser Val Val Pro Trp
1 5 10
<210> 531
<211> 48
<212> PRT
<213> Homo sapiens
<400> 531
Thr Leu Asn Trp Lys Arg Glu Pro Arg Leu Ser Tyr Leu Lys Thr Met
1 5 10 15
Tyr Ser Ser Leu Phe Trp Ser Gln Phe Pro Phe Leu Gln Cys Cys His
20 25 30
His His His Leu His His His Tyr His His Val Leu Asn Lys Tyr Ile
35 40 45
<210> 532
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 532
Gln Thr Gln Leu Pro Lys Val Trp Asp Pro Val Phe Phe Gly Ala Ala
1 5 10 15
Ser Pro Pro Ser Cys Thr Trp Ala Asp Trp Leu Cys Gly Ala Trp Ala
20 25 30
Cys Ala Ala Thr Cys Ser Gln Pro Ser Ser Ser Arg Gln His Arg Ser
35 40 45
Ala Leu Met Thr Phe Leu Leu Ala Ser Trp Cys Val Pro Lys Val Ser
50 55 60
Cys Gln Gly Val Arg Arg Pro Trp Asn Ser Leu Pro Arg Ser Thr Trp
65 70 75 80
His Ser Val Leu Met Cys His Gln Leu Cys Ser Asp Thr Ser Ser Ile
85 90 95
Val Ala Gly Gln Ala Thr His Gln Trp Pro Gly Ser Cys Pro Arg Cys
100 105 110
Ala Ser Arg Pro Arg Arg Glu Arg Thr Ala Ala Trp Gln Leu Cys Cys
115 120 125
Arg Arg Pro Ser Arg Thr Thr Phe Arg Ser Gln Gln Pro Ser Trp Gln
130 135 140
Gly Cys Cys Pro Gly Ser Thr Gly Ala Cys Trp Leu Ser Ala Arg His
145 150 155 160
Leu Arg Arg Pro Cys Ser Gly Ala Arg Pro Val Pro Ala Gly Val Trp
165 170 175
Pro Ala Ala Ser Ala Ser Thr Ser Thr Pro Ser Arg Gln Leu His Arg
180 185 190
Val Arg Pro Arg Ala Cys Met Pro Cys Pro Gly Ser Ser Gly Ser Ser
195 200 205
Gly Ala Cys Thr Arg Cys Arg Arg Ser Gly Trp Leu Gly Arg Leu His
210 215 220
Val Ala
225
<210> 533
<211> 88
<212> PRT
<213> Homo sapiens
<400> 533
His His Leu Val Pro Leu Phe Ile Trp Thr Pro Trp Arg Lys Ser Gly
1 5 10 15
Ser Gly Ser Gly Leu Asn Ala Trp Asn Gly Phe Ser Asn Leu Val Arg
20 25 30
Leu Met Gly Pro Trp His Leu Cys Met Gly Leu Lys Ser Trp Ile Ser
35 40 45
Val Pro Cys Pro Asn Leu Leu Pro Ala Pro Ser Ala Leu Val Leu Leu
50 55 60
Ala Pro Ala Thr Pro Pro Phe Gly Leu Ile Pro Arg Leu Pro Thr Gly
65 70 75 80
Leu Tyr Cys Phe Pro Ser Ser Asp
85
<210> 534
<211> 66
<212> PRT
<213> Homo sapiens
<400> 534
Leu Lys Arg Gln Met Gly Ser Ser Leu Leu Val Ser Met Lys Asn Pro
1 5 10 15
Tyr His Leu Leu Gly Pro His Ser Leu Met Val Thr Ile Lys Trp Ser
20 25 30
Ser Arg Lys Arg Tyr Cys Ile Leu Gln Val Ser His Tyr Met Met Lys
35 40 45
Lys Gly Lys Arg Asp Lys Leu Pro Phe Leu Leu Leu Ile Asn Phe His
50 55 60
Ser Ala
65
<210> 535
<211> 63
<212> PRT
<213> Homo sapiens
<400> 535
Ile Phe His Ser Gly Met Leu Pro Leu Glu Ile Ala Leu Thr Ile Ser
1 5 10 15
Pro Phe Ser Thr Val Cys Arg Glu Ser Glu Arg Asp Tyr Asn Met Asp
20 25 30
Phe Leu Thr Leu Arg His Leu Met Trp Met Asn Met Asn Ile Met Ser
35 40 45
Glu Leu Lys Met Val Thr Ser Thr Gly Leu Phe Gln Glu Asn Phe
50 55 60
<210> 536
<211> 115
<212> PRT
<213> Homo sapiens
<400> 536
Pro Met Phe Tyr Val Gly Pro Leu Met Cys Leu Leu Thr Gly Val Phe
1 5 10 15
Val Ile Ser Gly Ser His Leu Phe Cys Thr Ala Pro Ala Met Ser Asp
20 25 30
Ser Ser Pro Ser Val Thr Cys Cys Arg Val Gln Pro Ser Trp Trp Leu
35 40 45
Ser Pro Thr Ala Gly Phe Trp Arg Pro Trp Pro Ala Pro Cys Thr Leu
50 55 60
Ser Ser Ser Ala Thr Cys Cys Ser Leu Met Trp Leu Leu Ser Ser His
65 70 75 80
Phe Gly Ser Cys Cys Ile Ser Ser Phe Thr Met Gly Leu Ser Val Lys
85 90 95
Cys Arg Tyr Thr Pro Gly Leu Cys Leu Ser Gln Pro Phe Ser Ser Leu
100 105 110
Phe Ser Pro
115
<210> 537
<211> 105
<212> PRT
<213> Homo sapiens
<400> 537
Gly Ser Leu Leu Ser Pro Pro Glu Arg Arg Cys Gly Ser Arg Leu Trp
1 5 10 15
Arg Ala Trp Arg Arg Phe Pro Leu Leu Met Met Trp Arg Thr Pro Met
20 25 30
Thr Thr Arg Leu Arg Thr Gln Ala Cys Arg Arg Asn Ser Ser Arg Pro
35 40 45
Arg Pro Ala Gly Arg Ala Pro Arg Ser Leu Ala Thr Arg Pro Trp Pro
50 55 60
Arg Arg Thr Gly Gly Cys Leu Leu Trp Arg Gly Arg Cys Ser His Arg
65 70 75 80
Arg Gly Gly Cys Pro Trp Cys Pro Arg Lys Pro Arg Ser Trp Pro Arg
85 90 95
Ser Ala Cys Glu Pro Gly Arg Ser Pro
100 105
<210> 538
<211> 140
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 538
Ser Arg Ala Ser Trp Val Pro Pro Gln Pro Cys Arg Cys Ser Met Gly
1 5 10 15
Gln Pro Cys Pro Arg Arg Cys Cys Ser Ser Pro Cys Arg Pro Arg Ala
20 25 30
Arg Arg Ser Pro Ala Ser Trp Glu Thr His Pro Trp Ala Pro Ser Ser
35 40 45
Leu Gly Pro Ser Gln Pro Thr Pro Ser Ser Gly Ser Cys Leu Gln Glu
50 55 60
Gly Ala Cys Pro Arg Ser Cys Arg Pro Gly Glu Gly Ser His His Pro
65 70 75 80
Cys Cys His Pro Cys Leu Ala Leu Leu Gly Val Thr Gly Arg Pro Trp
85 90 95
Ala Trp Val Pro Gln Arg Leu Trp Gly Ser Glu Ala Leu Ala Ser Glu
100 105 110
Ala Ser Arg Lys Thr Val Gly Leu Cys Arg Arg Pro Leu Gly Ser His
115 120 125
Cys Trp Gly Ser Pro Pro Arg Thr Thr Gly Phe Pro
130 135 140
<210> 539
<211> 48
<212> PRT
<213> Homo sapiens
<400> 539
Ala Ala Leu Thr Ser Ser Ala Ile Ser Gly Pro Gly Trp Thr Pro Arg
1 5 10 15
Pro Pro Thr Phe Leu Ser Pro Trp Pro Ser Pro Ala Ile Pro Leu Leu
20 25 30
Thr Pro Arg Met Ser Trp Cys Ser Ser Leu Thr Thr Trp Pro Asn Ser
35 40 45
<210> 540
<211> 80
<212> PRT
<213> Homo sapiens
<400> 540
Leu Cys Ser Pro Pro Ser Pro Gln Asn Arg Ser Arg Thr Asn Gly Ser
1 5 10 15
Val Thr Thr Ser Ala Thr Glu Ala Trp Cys Arg Thr Thr Leu Pro Ala
20 25 30
Ser Gln Arg Ser Ser Ala Cys Thr Arg Ser Thr Leu Met Ser Cys Thr
35 40 45
Glu Ala Ser Arg Asp Pro Ala Lys Met Arg Arg Arg Ser Trp Gln Arg
50 55 60
Arg Arg Leu Pro Ser Val Ile Pro Thr Arg Thr Ala Arg Trp Pro Arg
65 70 75 80
<210> 541
<211> 98
<212> PRT
<213> Homo sapiens
<400> 541
Leu Val Asn Leu Lys Lys Leu Trp Glu Arg Lys Lys Asn Gln Ser Gln
1 5 10 15
Leu Leu Pro His Ala Leu Leu Glu Glu Glu Val Val Ala Val Glu Asn
20 25 30
Glu Val Ala Arg Lys Met Ile Leu Thr Gly Gly Pro Gly Phe Arg Arg
35 40 45
Val Thr Phe His Gly Thr Thr Arg Ile Ser Gly Cys Ser Ser Ser Gly
50 55 60
Leu Leu Cys Ser Gly Val Glu Ser Cys Phe Thr Cys Cys Ser Arg Asp
65 70 75 80
Pro Gly Glu Lys Ser Leu Gly Arg Thr Leu Ser Ile Thr Ile Phe Gln
85 90 95
Lys Glu
<210> 542
<211> 102
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 542
Val Ser Gly Ser Pro Pro Ala Gly Ser Ser Thr Gln Ala His Ala Ser
1 5 10 15
Val Asp Ser Arg Arg Glu Arg Val Lys Ala Val Pro Ala Leu Ala His
20 25 30
Leu Val Gly Trp Gly Val Leu Ile Ser Leu Trp Arg Thr Asn Asp Arg
35 40 45
Arg Val His Ile Asn Ser Ile Leu Thr Gln Ser Cys Phe Leu Asp Phe
50 55 60
Gly Val Glu Ala Phe Tyr Arg Lys Glu Ser Ser Asp Val Ile Leu Ala
65 70 75 80
Phe Leu Glu Ala Lys Asp Ser Gly Ser Pro Glu Val Arg Gly Ser Arg
85 90 95
Pro Ala Trp Pro Thr Trp
100
<210> 543
<211> 87
<212> PRT
<213> Homo sapiens
<400> 543
Tyr Ile Gln Val Lys Lys Leu Ile Ser Val Lys Asn Val Glu Asn Val
1 5 10 15
Leu Val Val Gly Ile Ile Ser Leu Phe Ile Thr Lys Ala Tyr Thr Leu
20 25 30
Glu Arg Lys Cys Gly Lys Asn Ile Lys Gln His Phe Ile Asn Val Met
35 40 45
Phe Val Arg Lys Phe Leu Lys Ala Asn Gln Val Trp Lys Cys Ile Phe
50 55 60
Glu Arg Ile Gln Val Lys Asn His Thr Ser Val Lys Phe Ala Ile Ser
65 70 75 80
Leu Leu Glu Leu Arg Lys His
85
<210> 544
<211> 50
<212> PRT
<213> Homo sapiens
<400> 544
Gln Gly Gln Ala Arg Asp Leu Arg Cys Pro Leu Thr Ala Pro Leu Ala
1 5 10 15
Cys Leu His Leu Pro Ser Pro Pro Val Arg Ser Thr Val Cys Ala Met
20 25 30
Asp Ser Leu Arg Pro Val Arg Leu Gln Lys Tyr Pro Gln Ala Ala Ala
35 40 45
Val Pro
50
<210> 545
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 545
Ala Ser Leu Leu Ser Arg Ser Ser Met Ser Leu Val Arg Thr Trp Ser
1 5 10 15
Ser Lys Leu Asn Arg His Gln Ser Leu Ala Leu Pro Val Pro Gln Gly
20 25 30
Pro Ser Gly Ala Leu Trp Lys Asn Leu Arg Lys Pro Pro Gly Val Thr
35 40 45
Lys Gly Pro Gly Lys Val Lys Val Ser Pro Leu Gly Asp Ser Cys Ser
50 55 60
Pro Arg Gly Gln Gln Glu Pro Gly Gly Pro Ala Val Trp Lys Ile Leu
65 70 75 80
Phe Trp Ser Ala Arg Arg Ser Leu Val Ser Pro Gly Trp
85 90
<210> 546
<211> 45
<212> PRT
<213> Homo sapiens
<400> 546
Arg Arg Trp Pro Arg Pro Arg Arg Ser Ala Val Ser Cys Phe Arg Ile
1 5 10 15
Thr Arg Gly Pro Arg Ala Ala Ser Pro Glu Thr Ser Thr Arg Pro Pro
20 25 30
Val Leu Pro Ala Ser Pro Arg Thr Ser Pro Trp Ser Pro
35 40 45
<210> 547
<211> 60
<212> PRT
<213> Homo sapiens
<400> 547
Ser Arg Ser Ser Ala Thr Leu Pro Gly Arg Arg Arg Arg Arg Trp Leu
1 5 10 15
Arg Arg Arg Arg Gln Pro Ile Ser Val Ala Pro Ala Gly Pro Pro Arg
20 25 30
Arg Pro Asn Gln Lys Pro Asn Pro Pro Gly Gly Ala Arg Cys Val Ile
35 40 45
Met Arg Pro Thr Trp Pro Gly Thr Ser Ala Phe Thr
50 55 60
<210> 548
<211> 30
<212> PRT
<213> Homo sapiens
<400> 548
Arg Glu Ser Arg Ala Met Ile Ser Leu Gly Ala Leu Arg Glu Asp Trp
1 5 10 15
Asn Gln Lys Arg Ser Leu Gly Gln Gln Ile Pro Val Val Ile
20 25 30
<210> 549
<211> 57
<212> PRT
<213> Homo sapiens
<400> 549
Arg Ser Ile Asn Thr Glu Val Asn Ile Arg Asn Ile Asn Ile Pro Gln
1 5 10 15
Lys Lys Thr Arg Ile Lys Asn Ile Asn Ile Ser Ile Asn Ile Arg Asn
20 25 30
Thr Lys Glu Lys Arg Leu Leu Met Leu Leu Ile Lys Arg Val Cys Leu
35 40 45
Gln Gln Lys Glu Leu Asn Leu Met Ile
50 55
<210> 550
<211> 94
<212> PRT
<213> Homo sapiens
<400> 550
Ala Ser Val Pro Gly Ser Gly Pro Ser Thr Gln Thr Pro Leu Thr Phe
1 5 10 15
Thr Pro Ala Leu Cys Ser Leu Arg Arg Leu Arg Pro Ser Met Ser Ser
20 25 30
Thr Gly Arg His Thr Pro Cys Glu His Arg Thr Gln Ala Thr Leu Ala
35 40 45
Cys Pro Gly Ala Arg Arg Gln Leu Pro Arg Asn Phe Leu Gly Glu Arg
50 55 60
Ala Leu Gly Leu Pro Ser Pro Leu Arg Val Ser Lys Trp Asp Asp Ser
65 70 75 80
Arg Pro Arg Lys Thr Arg Gly Ser Leu Gly Leu Pro Glu Leu
85 90
<210> 551
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 551
Trp Ser Pro Pro Gln Pro Arg Pro Pro Arg Asp Ala Ala Gly Phe Ser
1 5 10 15
Val Ser Val Arg Asp Ser Arg Glu Glu Pro Gly Gly Ser Ser Pro Arg
20 25 30
Gly Ala Met Leu Arg Ala Gly Leu Ser Ser Val Thr Ile Pro Ala Cys
35 40 45
Asn Ile Ser Val Asn Ser Glu Met Asp Leu Gly Pro Leu Thr Pro Arg
50 55 60
Thr Gln Pro Trp Ala Arg Ala Arg Gly Arg Arg Lys
65 70 75
<210> 552
<211> 39
<212> PRT
<213> Homo sapiens
<400> 552
Gln Pro Pro Lys Ala Leu Gln Pro Pro Arg Ala Pro Gln Leu Pro Asn
1 5 10 15
Ala Pro Gln Pro Pro Ser Ile Pro Gln Pro Pro Arg Ala Pro Gln Pro
20 25 30
Leu Lys Leu Leu Gln Cys Leu
35
<210> 553
<211> 29
<212> PRT
<213> Homo sapiens
<400> 553
Gly Leu Thr Met Ser Pro Leu Trp Pro Ser Cys Pro Trp Thr Gly Cys
1 5 10 15
Arg Cys Trp Lys Pro Cys Ala Gly Thr Gly Leu Ala Pro
20 25
<210> 554
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 554
Thr Leu Glu Ser Ala Leu Glu Lys Gly Phe Met Asn Leu Ala Asn Val
1 5 10 15
Gly Lys Pro Ala Ala Val Ser Ala Pro Leu Phe Ser Cys Lys Glu Ser
20 25 30
Ala Val Asn Val Gly Asn Leu Leu Ala Lys Pro Leu Ile
35 40 45
<210> 555
<211> 38
<212> PRT
<213> Homo sapiens
<400> 555
Leu Leu Lys Asn Ser Leu Gln Arg Leu Phe Val Leu Glu Leu Gly Val
1 5 10 15
Ser Leu Ile Gln Met Thr Cys Arg Gly Trp His Thr Phe Trp Ser Thr
20 25 30
Trp Tyr Ser Trp Val Val
35
<210> 556
<211> 16
<212> PRT
<213> Homo sapiens
<400> 556
Leu Leu Lys Asn Ser Asn Cys Arg Ala Cys Phe Cys Cys Gly Gln Ser
1 5 10 15
<210> 557
<211> 18
<212> PRT
<213> Homo sapiens
<400> 557
His Leu Leu Leu Ser Leu His Pro Ser Leu Pro Lys Leu Pro Gln Asn
1 5 10 15
Pro Leu
<210> 558
<211> 51
<212> PRT
<213> Homo sapiens
<400> 558
Arg Glu Ile Arg Cys Val Gln Ala Val Val Ile Leu Cys Ser Glu Leu
1 5 10 15
Ser Ser Val His Glu Val Leu Ser Ser Cys Val Ala Leu Phe Lys Gly
20 25 30
Ala Arg Glu His Ile Cys Leu Arg Glu Thr Tyr Arg Leu Ile Ser Thr
35 40 45
Ile Ala Ile
50
<210> 559
<211> 30
<212> PRT
<213> Homo sapiens
<400> 559
Asn Val Lys Asn Pro Lys Val Ile Leu Ile Phe Leu Met Lys Lys Gln
1 5 10 15
Pro Ser Lys Val Arg Arg Lys Glu Ala His Gly Leu Pro Leu
20 25 30
<210> 560
<211> 32
<212> PRT
<213> Homo sapiens
<400> 560
Thr Arg Thr Arg Glu Val Ser Pro Arg His Ser Thr Leu Thr Ala Ser
1 5 10 15
Arg Arg Ser Ser Thr Ala Ser Thr Ser Trp Glu Gly Trp Pro Pro Gly
20 25 30
<210> 561
<211> 48
<212> PRT
<213> Homo sapiens
<400> 561
Ile Cys Pro Trp Lys Arg Gln Pro Gly Ala Val Ala Gln Arg Ile Gly
1 5 10 15
Ser His Leu Val Pro Thr Ala Thr Leu Phe Leu Leu Asn Gln His Leu
20 25 30
Gly Lys Thr Val Arg Arg Thr Val Leu Glu Trp Arg Leu Thr Cys Trp
35 40 45
<210> 562
<211> 36
<212> PRT
<213> Homo sapiens
<400> 562
Gln Thr Leu Arg Pro Trp Leu Trp Leu Thr Ala Trp Ala Ala Ser Thr
1 5 10 15
Gly Ala Cys Gly Arg Arg Gln Leu Gly Ala Asn Ala Arg Cys Ser Ser
20 25 30
Gly Met Arg Cys
35
<210> 563
<211> 33
<212> PRT
<213> Homo sapiens
<400> 563
Arg Arg Thr Lys Pro Ala Ala Leu Ser Pro Val Met Val Pro Arg Gln
1 5 10 15
Lys Tyr Gln Gln Arg Val Lys Arg Ser Ser Ala Asp Pro Leu Pro Leu
20 25 30
Cys
<210> 564
<211> 17
<212> PRT
<213> Homo sapiens
<400> 564
Arg Leu Val Arg Gly Arg Arg Leu Arg Thr Ala Glu Asn Val Lys Asn
1 5 10 15
Asn
<210> 565
<211> 17
<212> PRT
<213> Homo sapiens
<400> 565
Leu Asp Pro Met Ala Pro His Arg Ser Pro Thr Asn Lys Leu Leu Pro
1 5 10 15
Gln
<210> 566
<211> 25
<212> PRT
<213> Homo sapiens
<400> 566
Asn Ser Lys Lys Pro Pro Gln Ser Lys Arg Thr Asn Gly Met Lys Met
1 5 10 15
Asn Met Lys Gly Pro Glu Gly Arg Arg
20 25
<210> 567
<211> 56
<212> PRT
<213> Homo sapiens
<400> 567
Leu Pro Val Asn Val His Leu Val Ser His Ser Ile Thr Leu Leu Val
1 5 10 15
Ser Thr Thr Thr Asn Val Gly Leu Asn Leu Arg Phe Val Glu Gln Arg
20 25 30
Glu Ser Val Lys Thr Leu Gln Ala Val Ser Ala Val Asn Ala Lys Glu
35 40 45
Gly Ser Leu Leu Met Pro Pro Asp
50 55
<210> 568
<211> 24
<212> PRT
<213> Homo sapiens
<400> 568
Ser Arg Gly Gln Arg Ser Leu Val Ser Ala Asp Glu Ser Thr Thr His
1 5 10 15
Leu Arg Asn Ala Arg Lys Thr Lys
20
<210> 569
<211> 16
<212> PRT
<213> Homo sapiens
<400> 569
Phe Val Lys Trp Leu Lys Lys Glu Glu Lys Glu Val Gln Leu Gln Asp
1 5 10 15
<210> 570
<211> 33
<212> PRT
<213> Homo sapiens
<400> 570
Gly Leu Gln Thr Lys Arg Thr Leu Arg Ile Arg Lys Pro Arg Val Leu
1 5 10 15
Lys Pro Leu Gln Phe Arg Leu Ala Ser Gln Ile Leu Pro Thr Leu Ser
20 25 30
Lys
<210> 571
<211> 12
<212> PRT
<213> Homo sapiens
<400> 571
Gln Thr Glu Ile Val Ser Gly Ile Leu Ala Tyr Cys
1 5 10
<210> 572
<211> 22
<212> PRT
<213> Homo sapiens
<400> 572
Val Ala Thr Pro Gly Arg Pro Trp Pro Pro Ser Phe Ser Ala Pro Cys
1 5 10 15
Cys Trp Arg Leu Trp Pro
20
<210> 573
<211> 33
<212> PRT
<213> Homo sapiens
<400> 573
Ala Ser Ser Pro Ser Leu Leu Val Gly Ala Asn Arg Ser Ser Ala Met
1 5 10 15
Gly Arg Thr Gly Gly Gly Cys Gln Trp Trp His His Phe Trp Val Pro
20 25 30
Ile
<210> 574
<211> 11
<212> PRT
<213> Homo sapiens
<400> 574
Ser Tyr Ala Leu Ser Asn Lys Asn Leu Leu Ile
1 5 10
<210> 575
<211> 62
<212> PRT
<213> Homo sapiens
<400> 575
Met Ala Leu His Gly Val Gln Leu Arg Lys Ser Lys Asp Leu His Phe
1 5 10 15
Leu Leu Gln Gly Cys Cys Leu Met Leu Lys Arg Val Trp Ile Pro Met
20 25 30
Gln Leu Ile Ala Ala Leu Met Thr Ile Trp Met Asn Ile Pro Leu Glu
35 40 45
Lys Met Trp Gln Leu Thr Val Val Leu Asn Gly Ser Gly Leu
50 55 60
<210> 576
<211> 18
<212> PRT
<213> Homo sapiens
<400> 576
Leu Lys Pro Ala Ala Pro Arg Gly Pro Ile Arg Ala Lys Thr Ala Ser
1 5 10 15
Ile Phe
<210> 577
<211> 12
<212> PRT
<213> Homo sapiens
<400> 577
Lys Met Leu Lys Arg Thr Lys Cys Phe Thr Phe Gly
1 5 10
<210> 578
<211> 21
<212> PRT
<213> Homo sapiens
<400> 578
Arg Glu Arg Thr Arg Ile Asn Arg Lys Glu Leu Arg Leu Tyr His Pro
1 5 10 15
Asp Thr His His Ala
20
<210> 579
<211> 13
<212> PRT
<213> Homo sapiens
<400> 579
Arg Ile Pro Pro His His Pro Arg Cys Leu Arg Asp Ala
1 5 10
<210> 580
<211> 19
<212> PRT
<213> Homo sapiens
<400> 580
His His His Gln Cys Gln Pro Trp Ser Pro Thr Leu Pro Arg Thr Pro
1 5 10 15
Leu Leu Pro
<210> 581
<211> 21
<212> PRT
<213> Homo sapiens
<400> 581
Met Gln Lys Lys Lys Ser Ser Arg Glu Ile Arg Lys Arg Arg Arg Met
1 5 10 15
Met Met Met Arg Arg
20
<210> 582
<211> 13
<212> PRT
<213> Homo sapiens
<400> 582
Trp Met Arg Arg Leu Glu Glu Arg Trp Glu Asn Lys Leu
1 5 10
<210> 583
<211> 8
<212> PRT
<213> Homo sapiens
<400> 583
Ala Gln Lys Lys Asn Arg Arg His
1 5
<210> 584
<211> 20
<212> PRT
<213> Homo sapiens
<400> 584
Arg Ser Glu Arg Lys Trp Ser Trp Met Thr Leu Pro Gly Ser Trp Ser
1 5 10 15
Met Arg Arg Thr
20
<210> 585
<211> 8
<212> PRT
<213> Homo sapiens
<400> 585
Ser Leu Lys Lys Gln Tyr Pro Lys
1 5
<210> 586
<211> 21
<212> PRT
<213> Homo sapiens
<400> 586
Lys Leu Phe Leu Val Arg Glu Val Gln Arg Gly Glu Lys Gln Glu Leu
1 5 10 15
Arg Arg Ile Lys Gln
20
<210> 587
<211> 18
<212> PRT
<213> Homo sapiens
<400> 587
Leu Val Ala Ile Ser Phe Lys Thr Val Phe Lys Ala Ser His Ala Ala
1 5 10 15
Lys Thr
<210> 588
<211> 22
<212> PRT
<213> Homo sapiens
<400> 588
Glu Leu Val Ser Thr Gly Ile Met Thr Phe His Leu Leu Ser Val Asp
1 5 10 15
Ile Tyr Gln Glu Ala Thr
20
<210> 589
<211> 18
<212> PRT
<213> Homo sapiens
<400> 589
Asn Ser Asp Gln Asn Leu Phe Thr Glu Ile Ile Leu Asn Pro Pro Lys
1 5 10 15
His Gln
<210> 590
<211> 10
<212> PRT
<213> Homo sapiens
<400> 590
Ser Arg Lys Arg Ala Val Ser Asn Ser Arg
1 5 10
<210> 591
<211> 18
<212> PRT
<213> Homo sapiens
<400> 591
Met Ala Pro Ser Ser Ala Ala Ala Asp Gln Asp Ser Gly Cys Trp Met
1 5 10 15
Thr Trp
<210> 592
<211> 18
<212> PRT
<213> Homo sapiens
<400> 592
His Asn Gly Tyr Val Leu Gln Lys Lys Leu His Phe Thr Phe Tyr Thr
1 5 10 15
Cys Leu
<210> 593
<211> 13
<212> PRT
<213> Homo sapiens
<400> 593
Gln Pro Pro Pro Arg Ser Glu Val Leu Ser Cys Pro Leu
1 5 10
<210> 594
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 594
Arg Ala Leu Ala Ala Leu Pro Ser Ser Ser Thr Leu Arg
1 5 10
<210> 595
<211> 11
<212> PRT
<213> Homo sapiens
<400> 595
Asp His Lys Lys Met Tyr Ser Ala His Ser Cys
1 5 10
<210> 596
<211> 11
<212> PRT
<213> Homo sapiens
<400> 596
Ser Ser Lys Lys Ile Ser Lys Met Ile Phe Val
1 5 10
<210> 597
<211> 18
<212> PRT
<213> Homo sapiens
<400> 597
Gln Ser His Arg Pro Pro Arg Ala Ser Ser Ala Gly Asp Leu Gln Cys
1 5 10 15
Gln Ala
<210> 598
<211> 23
<212> PRT
<213> Homo sapiens
<400> 598
Ser Val Gly Cys Leu Gly Cys Pro Gly Ser Arg Leu Pro Arg Ser Ala
1 5 10 15
Pro Ser Pro Met Ser Met Arg
20
<210> 599
<211> 20
<212> PRT
<213> Homo sapiens
<400> 599
Ser Thr Val Arg Glu Ala Leu Ser Pro Val Gln His Gly Lys Cys Arg
1 5 10 15
Lys Arg Arg Asn
20
<210> 600
<211> 26
<212> PRT
<213> Homo sapiens
<400> 600
Ala Ala Lys Phe Ala Arg Cys Ala Thr Ala Leu Glu His Val Ser Ser
1 5 10 15
Ser Leu Arg Leu Arg Thr Arg Thr Arg Thr
20 25
<210> 601
<211> 30
<212> PRT
<213> Homo sapiens
<400> 601
Thr Ser Ala Leu Asp Val Ser Ala Pro Ala Ala Met Ile Ala Ala Cys
1 5 10 15
Ser Ala Ala Leu Leu Ser Ala Trp Ala Arg Trp Asn Val Cys
20 25 30
<210> 602
<211> 11
<212> PRT
<213> Homo sapiens
<400> 602
Gln Asp Arg Ile Phe Arg Val Phe Gln Asn His
1 5 10
<210> 603
<211> 20
<212> PRT
<213> Homo sapiens
<400> 603
Glu Thr Asp Thr Ser Ser Ala Phe Ser Ser Leu Leu Pro Leu Arg Asn
1 5 10 15
Leu Ser Gln Leu
20
<210> 604
<211> 15
<212> PRT
<213> Homo sapiens
<400> 604
Met Glu Lys Thr Gln Gln Met Gly Arg Arg Met Glu His Ile Leu
1 5 10 15
<210> 605
<211> 12
<212> PRT
<213> Homo sapiens
<400> 605
Arg Lys Leu Phe Ser Ser Lys Arg Lys Lys Lys Lys
1 5 10
<210> 606
<211> 13
<212> PRT
<213> Homo sapiens
<400> 606
Ala Asp Lys Lys His Val Gln Ser Val Thr Ser Val Pro
1 5 10
<210> 607
<211> 14
<212> PRT
<213> Homo sapiens
<400> 607
Arg Arg Lys Asn Gln Arg Cys Leu Thr Phe Gln Pro Phe Thr
1 5 10
<210> 608
<211> 11
<212> PRT
<213> Homo sapiens
<400> 608
Lys Thr Val Phe Leu Asn His Trp Arg Gly Ser
1 5 10
<210> 609
<211> 12
<212> PRT
<213> Homo sapiens
<400> 609
Lys Lys Lys Lys Asn Met Lys Pro Ser Leu Leu Leu
1 5 10
<210> 610
<211> 9
<212> PRT
<213> Homo sapiens
<400> 610
Cys Gly Pro Pro Ala Trp Ala Leu Cys
1 5
<210> 611
<211> 10
<212> PRT
<213> Homo sapiens
<400> 611
Arg Arg Tyr Phe Trp Lys Arg Gln Glu Met
1 5 10
<210> 612
<211> 11
<212> PRT
<213> Homo sapiens
<400> 612
Asp Gly Trp Gly Ala Thr Ala Pro Thr Arg Gly
1 5 10
<210> 613
<211> 10
<212> PRT
<213> Homo sapiens
<400> 613
Arg Gly Gly Ile Leu Leu Ser Met Phe Leu
1 5 10
<210> 614
<211> 9
<212> PRT
<213> Homo sapiens
<400> 614
Gln Glu Ser Pro Arg Ser Pro Leu Leu
1 5
<210> 615
<211> 10
<212> PRT
<213> Homo sapiens
<400> 615
Lys Arg Lys Lys Ala Ala Arg Lys Leu Thr
1 5 10
<210> 616
<211> 9
<212> PRT
<213> Homo sapiens
<400> 616
Thr His Phe Phe Thr Phe Phe Asn Leu
1 5
<210> 617
<211> 11
<212> PRT
<213> Homo sapiens
<400> 617
Glu Val Val Phe Trp Met Thr Ser Gly Leu Ile
1 5 10
<210> 618
<211> 12
<212> PRT
<213> Homo sapiens
<400> 618
Met Arg Lys Leu Ala Phe Pro Gln Phe Ser Ser Cys
1 5 10
<210> 619
<211> 8
<212> PRT
<213> Homo sapiens
<400> 619
Val Ser Lys Lys Asp Leu Ser Pro
1 5
<210> 620
<211> 9
<212> PRT
<213> Homo sapiens
<400> 620
Ser Ile Gly Phe Leu Leu Gln Asn Leu
1 5
<210> 621
<211> 10
<212> PRT
<213> Homo sapiens
<400> 621
Glu Val Lys Lys Pro Pro Val Cys Ser Arg
1 5 10
<210> 622
<211> 21
<212> PRT
<213> Homo sapiens
<400> 622
Leu Leu Phe Ile Pro Thr Gly Ile Ser Leu Val Glu Thr Ala Arg Glu
1 5 10 15
Gln Leu Phe Arg Gly
20
<210> 623
<211> 13
<212> PRT
<213> Homo sapiens
<400> 623
Ala Val Pro Pro His Val Lys Arg His Ala Val Asn Leu
1 5 10
<210> 624
<211> 38
<212> PRT
<213> Homo sapiens
<400> 624
Thr Cys Ser Pro Gln Ser Leu Leu Ser Ser Trp Arg Ser Thr Gln Pro
1 5 10 15
His Val Pro Pro Ser Thr Leu Trp Gly Val Arg Met Thr Ser Leu Ser
20 25 30
Ala Ser Thr Ser Leu Trp
35
<210> 625
<211> 11
<212> PRT
<213> Homo sapiens
<400> 625
Val Asn Leu Phe Leu Thr Lys Met Met Arg Met
1 5 10
<210> 626
<211> 12
<212> PRT
<213> Homo sapiens
<400> 626
Ala Leu Lys Lys Arg Arg Met Val Leu Leu Lys Ser
1 5 10
<210> 627
<211> 233
<212> PRT
<213> Homo sapiens
<400> 627
Trp Leu Ala Pro Pro Glu Ala Gly Ala Ala Arg Gly Ala Glu Ala Ala
1 5 10 15
Ala Val Val Thr Ala Ala Phe Thr Lys Glu Ala Ser Lys Lys Ala Met
20 25 30
Gly Pro Leu Asp Glu Ala Pro Gly Lys Ser Ser Ala Ala Arg Ala Gly
35 40 45
Met Thr Glu Ala Arg Gly Gly Leu Arg Ser Gln Gln Gly Gly Met Glu
50 55 60
His Asp Val Ala Leu Arg Arg Glu Gly Leu Ala Gln Gly Arg Ser Thr
65 70 75 80
Pro Ala Gln Thr Ala Arg Thr Gly Ala Pro Tyr Gly Arg Asn Arg Arg
85 90 95
Arg Arg Arg Arg Ala Ala Gly Gly Ser Glu Gln Gly Pro Gly Glu Thr
100 105 110
Ala Thr Ala Gly Ala Pro Pro Ala Leu Met Val Val Pro Ala Leu Leu
115 120 125
Ala Gly Gly Asn Met Gly Asn Gly Gly Ala Ser Leu Asn Leu Ile Cys
130 135 140
Glu Gly Ile Glu Glu Gly Val Val Lys Arg Arg Gly Gly Glu Gly Glu
145 150 155 160
Ala Ala Leu Thr Cys Gly Gly Ala Glu Arg Leu Lys Ala Leu Arg Arg
165 170 175
Thr Arg Met Gly Ser Gln Ser Gly Ala Trp Thr Met Arg Met Lys Lys
180 185 190
Trp Ala Pro Leu Met Pro Leu Gly Pro Ser Cys Leu Ser Arg Arg Ala
195 200 205
Pro Arg Ser Pro Phe Leu Arg Ser Arg Ser Trp Thr Ser Lys Gly Trp
210 215 220
Arg Arg Arg Arg Asn Leu Pro Lys Gly
225 230
<210> 628
<211> 70
<212> PRT
<213> Homo sapiens
<400> 628
Asn Asp Leu Arg Lys Asn Lys Glu Gln Pro Ala Lys Thr Gly Pro Ser
1 5 10 15
Gln Lys Arg Thr Gly Arg Arg Gly Gly Ser Ile Lys Val Leu Ile Pro
20 25 30
Thr Met Glu His Arg Thr Gly Phe Thr Leu Ala Ala Thr Gly Thr Glu
35 40 45
Ile Thr Ser Ile Cys Leu Thr Phe Ile Lys Met His Thr Ser Gln Gly
50 55 60
Val Trp Leu Ile Tyr Lys
65 70
<210> 629
<211> 78
<212> PRT
<213> Homo sapiens
<400> 629
Tyr Cys His Leu Arg Leu Pro Ser Gln Ala Pro Leu Lys Gly Lys Arg
1 5 10 15
Ala Gln Asn Gln Ala Gln Pro Asn Leu Leu Pro Gln Asn Gln His His
20 25 30
Leu Leu Arg Gln Trp Thr Gln Thr Val Gln Ala Pro Arg Phe Pro Leu
35 40 45
Leu Lys Ser Arg Ser Ser Trp Ile Gln Pro Leu Trp Ser Gln Glu Leu
50 55 60
Trp Met Pro Ser Gln Trp Arg Val Leu Glu Ile Leu Thr Asn
65 70 75
<210> 630
<211> 38
<212> PRT
<213> Homo sapiens
<400> 630
His Asn Pro Arg His Gln Thr Ser Val Leu Ser Phe Thr Thr Ala Asn
1 5 10 15
Thr Val Pro Thr Ala Ile Gly Gln Leu Trp Glu Cys Leu Ser Thr Thr
20 25 30
Arg Lys Asp Thr Gln Lys
35
<210> 631
<211> 23
<212> PRT
<213> Homo sapiens
<400> 631
Met Phe Leu Ile Gln Arg Glu Leu Leu Lys Thr Leu Asn Met Ile Gln
1 5 10 15
Val Leu Met Ser Val Val His
20
<210> 632
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 632
Thr Thr Ser Ser Leu Val Ala Ser Ser Gln Asn Trp Gly Gln Pro
1 5 10 15
<210> 633
<211> 11
<212> PRT
<213> Homo sapiens
<400> 633
Met Gly Glu Lys Asn Gln Ser Leu Trp Thr Ser
1 5 10
<210> 634
<211> 24
<212> PRT
<213> Homo sapiens
<400> 634
Leu Pro Val Tyr Arg Gln Thr His Trp Arg Leu Tyr Pro Lys Pro Phe
1 5 10 15
Ala Gly Leu Phe Pro Leu Lys Pro
20
<210> 635
<211> 97
<212> PRT
<213> Homo sapiens
<400> 635
Gln Pro Ala Arg Gln Ala Arg Ala Gln Asp Arg Trp Arg Thr Gln Arg
1 5 10 15
Pro Gly Pro Ala Ser Ser Pro Gly Ser Arg Ser Pro Ser His Val Arg
20 25 30
His Leu His His Gly Trp Ala Ser Val Pro Gly Leu Pro Lys Val Ala
35 40 45
Met Ala Pro Gly Thr Pro Gly Ile Arg Gly Pro His Ala Pro Pro Thr
50 55 60
Trp Leu Pro Ala Arg Pro Ser Arg Leu Pro Gly Ser Ala Ala Ala Pro
65 70 75 80
Thr Leu Pro Arg Ala Leu Ala Arg Leu Pro Pro Ala Val Gly Gly Cys
85 90 95
Val
<210> 636
<211> 24
<212> PRT
<213> Homo sapiens
<400> 636
Arg Ser Val Lys Arg Cys Lys Arg Ser Leu Pro Lys Gly Ile Val Lys
1 5 10 15
Leu Thr Leu Gln Ile Tyr Asn Ile
20
<210> 637
<211> 14
<212> PRT
<213> Homo sapiens
<400> 637
Gly Asn Phe Gln Arg Thr Thr Cys His Ser Ile Leu Ser Ser
1 5 10
<210> 638
<211> 15
<212> PRT
<213> Homo sapiens
<400> 638
Leu Lys Pro Tyr Arg Ser Val Leu Val Leu Ile Lys Met Phe Phe
1 5 10 15
<210> 639
<211> 8
<212> PRT
<213> Homo sapiens
<400> 639
Asp Glu Lys Lys Arg Lys Gln Lys
1 5
<210> 640
<211> 23
<212> PRT
<213> Homo sapiens
<400> 640
Phe Gly Arg Ser Leu Asn Leu Thr Val Lys Trp Leu Val Thr Ser Gly
1 5 10 15
Lys Arg Val Thr Ser Ile Arg
20
<210> 641
<211> 19
<212> PRT
<213> Homo sapiens
<400> 641
Ser Trp Cys Leu Cys Cys Arg Leu Ile Ala Met Lys Glu Met Thr Trp
1 5 10 15
Thr Lys Ile
<210> 642
<211> 12
<212> PRT
<213> Homo sapiens
<400> 642
Lys Pro Pro Pro Thr His Pro Asp Arg Gly Val Glu
1 5 10
<210> 643
<211> 82
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 643
Val Thr Pro Pro Val Ala Arg Met Gly Arg Ser Pro Thr Ser Lys Pro
1 5 10 15
Trp Gly Met Arg Arg Ala Glu Thr Gln Thr Ala Ala Pro Arg His Leu
20 25 30
Pro Lys Gln Ser Pro Asp Ala Ser Pro Pro Val Ala Pro Pro Ala Trp
35 40 45
Thr Arg Pro Gly Ser Thr Ala Val Ser His Pro Gly Ser Thr Pro Gly
50 55 60
Ala Pro Ser Leu Ala Thr Ala Val Pro Ser Pro Leu Asp Ser Ser Ala
65 70 75 80
Met Ser
<210> 644
<211> 48
<212> PRT
<213> Homo sapiens
<400> 644
Ala Asn Pro Gln Leu Leu Cys Gln Asn Pro Glu Lys Leu Ala Leu Lys
1 5 10 15
Glu Asp Leu Leu Tyr Leu Arg Thr Ser Gly Glu Pro Trp Asp Thr Glu
20 25 30
Arg Asn Leu Arg Pro Leu Ser Leu Gln Cys Gln Ser Leu Ala Leu Pro
35 40 45
<210> 645
<211> 40
<212> PRT
<213> Homo sapiens
<400> 645
Asn Pro His Phe Arg Pro Pro Arg Thr Trp Arg Ala Thr Thr Ser Ala
1 5 10 15
Gln Leu Ala Arg Cys Ser Pro Trp Ala Thr Leu Pro His Met Pro Arg
20 25 30
Ala Arg Ser Ser Thr Ala Ala Ala
35 40
<210> 646
<211> 37
<212> PRT
<213> Homo sapiens
<400> 646
Thr Thr Ala Gln Thr Ala Pro Pro Ser Thr Arg Met Met Ala Thr Cys
1 5 10 15
Pro Cys Pro Gln Gly Trp Pro Gln Cys Pro Val Ala Glu Arg Ala Val
20 25 30
Glu Thr Ile Cys Pro
35
<210> 647
<211> 41
<212> PRT
<213> Homo sapiens
<400> 647
His Pro Leu Pro Thr Leu Thr Cys Pro Thr Met Pro Gly Arg Thr Pro
1 5 10 15
Thr Ala Asn Pro Pro Thr Pro Ser Ala Ala Ser Tyr Leu Trp Pro Ser
20 25 30
Arg Thr Leu Gln Pro Ser Ala Cys Gln
35 40
<210> 648
<211> 29
<212> PRT
<213> Homo sapiens
<400> 648
Glu Ala Thr Ser Asn Gln Asp Leu Leu Gln Met Val Pro Cys Ser Met
1 5 10 15
Gln Asp Pro Leu Leu Ser Leu Trp Thr Leu Phe Thr Glu
20 25
<210> 649
<211> 38
<212> PRT
<213> Homo sapiens
<400> 649
Asn Val Asn Val Cys Ser Pro Lys Ile Leu Ile Leu Lys His Gln Lys
1 5 10 15
Met Ile Arg Asp Phe Arg Arg Asn Leu Arg Lys Trp Leu Lys Ser Tyr
20 25 30
Lys Gly Lys Lys Gln Ile
35
<210> 650
<211> 36
<212> PRT
<213> Homo sapiens
<400> 650
Ala Asn Gln Glu Ile Ser Ile Val Lys Thr Ile Val Val Cys Leu Lys
1 5 10 15
Val Gly Cys Val Ile Leu Lys Met Thr Val Val Met Ala Ala Met Lys
20 25 30
Lys Ile Ala Gln
35
<210> 651
<211> 16
<212> PRT
<213> Homo sapiens
<400> 651
Ala Ala Pro Met Met Ser Ser Met Ala Cys Gly Ser Ala Glu Ser Ser
1 5 10 15
<210> 652
<211> 24
<212> PRT
<213> Homo sapiens
<400> 652
Arg Leu Phe Trp Met Arg Arg Leu Trp Cys Phe Arg Gln Leu Ser Gly
1 5 10 15
Asp Ile Ser Arg Gly Gln Ser Ser
20
<210> 653
<211> 13
<212> PRT
<213> Homo sapiens
<400> 653
Glu Gln Lys Lys Ile Ser Pro Phe Ile Tyr Phe Phe Leu
1 5 10
<210> 654
<211> 11
<212> PRT
<213> Homo sapiens
<400> 654
Lys Leu Lys Lys Ala Ser Val Leu Leu Phe Ser
1 5 10
<210> 655
<211> 11
<212> PRT
<213> Homo sapiens
<400> 655
Asp Thr Gln Ile Pro Arg Thr Ser Arg Trp Cys
1 5 10
<210> 656
<211> 9
<212> PRT
<213> Homo sapiens
<400> 656
Ser Val Lys Lys Arg Met Ile Ile Phe
1 5
<210> 657
<211> 10
<212> PRT
<213> Homo sapiens
<400> 657
Arg Val Pro Phe Leu Phe Val Val Gln Val
1 5 10
<210> 658
<211> 8
<212> PRT
<213> Homo sapiens
<400> 658
Leu Glu Val Gly Ala Thr Ser Ser
1 5
<210> 659
<211> 94
<212> PRT
<213> Homo sapiens
<400> 659
Ser Arg Ser Pro Lys Ser Met Ser Pro Pro Gly Arg Thr Gln Leu Pro
1 5 10 15
Pro Ser Gln Leu Pro Gln Pro His Arg His Arg Lys Thr Cys Ser Arg
20 25 30
Arg Ala Thr Pro Leu Ser Ser Leu Ala Ala Ala Pro Gly Ala Arg Ala
35 40 45
Gly Ala Arg His Pro Pro Pro Thr Arg Arg Gln Arg Ser Leu Cys Ser
50 55 60
Ser Gln Pro Ser Gln Pro Arg Pro Arg Ser Cys Leu Gly Thr Pro Leu
65 70 75 80
Ala Gly Leu Pro Ala Cys Pro Ser Pro Cys Pro Pro Val Arg
85 90
<210> 660
<211> 16
<212> PRT
<213> Homo sapiens
<400> 660
Arg His Pro Pro Pro Thr Arg Arg Pro Ser Gln Pro Arg Pro Arg Ser
1 5 10 15
<210> 661
<211> 70
<212> PRT
<213> Homo sapiens
<400> 661
Pro Leu Ser Gly Thr Trp Gly Thr Leu Arg Ala Pro Ser Ser Phe His
1 5 10 15
Pro Leu Val Ala Thr Gln Ala Leu Leu Ser Gln Arg Gly His Pro Arg
20 25 30
Thr Ala Leu Gly Gly Ser Gln Pro Leu Ser Pro Arg Arg Ala Ala Ala
35 40 45
Pro Thr Gln Gln Leu Pro His Ala Leu Leu Ala Pro Ser Leu Gln Asp
50 55 60
Leu Ala Lys Arg Pro Pro
65 70
<210> 662
<211> 17
<212> PRT
<213> Homo sapiens
<400> 662
Arg Ala Trp Ala Pro Ala Pro Pro Thr Arg Cys Val Trp Gln Gln Pro
1 5 10 15
Ser
<210> 663
<211> 30
<212> PRT
<213> Homo sapiens
<400> 663
Thr Arg Lys Ala Ser Ala Ala Ser Cys Ala Ser Gly Val Thr Thr Ser
1 5 10 15
Thr His Arg Pro Ala Ser Ala Trp Thr Ser Met His Gln Thr
20 25 30
<210> 664
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 664
Val Leu Thr Val Ala Cys Arg Ser Ala Gln Pro Pro Arg Pro Trp Asp
1 5 10 15
His Ala Ala Pro Val Thr Cys Thr Cys Gly Arg Thr Arg Gly Leu Gly
20 25 30
Gly Gly Thr Thr
35
<210> 665
<211> 44
<212> PRT
<213> Homo sapiens
<400> 665
Lys Thr Lys Asn Leu Pro Leu Lys Thr Lys Leu Lys Lys Lys Glu Asn
1 5 10 15
Lys Thr Thr Leu Asn Leu Gln Met Ala Glu His His Leu Leu Cys Pro
20 25 30
Arg Ile Met Asn Lys Ala Gln Pro Tyr Gly Ile Cys
35 40
<210> 666
<211> 43
<212> PRT
<213> Homo sapiens
<400> 666
His Pro Ile His Ile Gly Cys Thr Gln Thr Met Val Met Gly Ile Ile
1 5 10 15
Phe Met Cys Leu Arg Leu Cys Pro His Ile Leu Asp Arg Leu Gln Arg
20 25 30
Gly Leu Pro Gly Asn Trp Glu Leu Lys Leu Glu
35 40
<210> 667
<211> 35
<212> PRT
<213> Homo sapiens
<400> 667
Val Ser Ser Thr His Ser Thr Thr Thr Gly Ser His Trp Lys Gln Pro
1 5 10 15
Thr Asp Gly Ala Val Cys Thr Arg Thr Ser Met Arg Ser Phe Pro Thr
20 25 30
Arg Ser Thr
35
<210> 668
<211> 27
<212> PRT
<213> Homo sapiens
<400> 668
His Thr Trp Asn Gly Pro Arg Ile Gly Val Asn Val Gly Phe Ser Gly
1 5 10 15
Gln Thr Phe Glu Leu Leu Leu Met Leu Met Tyr
20 25
<210> 669
<211> 21
<212> PRT
<213> Homo sapiens
<400> 669
Arg Ile Lys Pro Phe Ser Thr Asn Ser Val Leu Arg Arg Thr Gly Ser
1 5 10 15
Ser Ile Glu Glu Leu
20
<210> 670
<211> 21
<212> PRT
<213> Homo sapiens
<400> 670
Val Thr Trp Met Lys Arg Arg Arg Arg Asn Leu Ile Leu Arg Lys Pro
1 5 10 15
Glu Trp Ile Phe Lys
20
<210> 671
<211> 10
<212> PRT
<213> Homo sapiens
<400> 671
Leu Glu Lys Lys Glu Ser Glu Lys Trp Met
1 5 10
<210> 672
<211> 18
<212> PRT
<213> Homo sapiens
<400> 672
Val Ser Asn Trp Arg Val Lys Ser Leu Pro Cys Leu Pro Phe Phe Ser
1 5 10 15
Val Leu
<210> 673
<211> 9
<212> PRT
<213> Homo sapiens
<400> 673
Gly Cys Thr Pro Gln Leu Cys Trp Thr
1 5
<210> 674
<211> 20
<212> PRT
<213> Homo sapiens
<400> 674
Thr Phe Leu Leu Trp Lys Asn Trp Lys Arg Ala Leu Ser Thr Arg Lys
1 5 10 15
Ile Cys Ser Lys
20
<210> 675
<211> 10
<212> PRT
<213> Homo sapiens
<400> 675
Glu Glu Lys Lys Thr Glu His Tyr Ala Tyr
1 5 10
<210> 676
<211> 12
<212> PRT
<213> Homo sapiens
<400> 676
Phe Leu Gln Gly Val Ala Leu Ala Val Gln Ala Ser
1 5 10
<210> 677
<211> 9
<212> PRT
<213> Homo sapiens
<400> 677
Leu Met Phe Phe Cys Gly His Gln Asn
1 5
<210> 678
<211> 10
<212> PRT
<213> Homo sapiens
<400> 678
Ile Arg Lys Lys Ala Asp Leu His Thr Gln
1 5 10
<210> 679
<211> 48
<212> PRT
<213> Homo sapiens
<400> 679
Gly Ala Pro Arg Ser Pro Ser Ser Val Ala Gly Ser Ser Ser Ala Thr
1 5 10 15
Trp Gln Ser Gly Ala Met Trp Val Gln Pro Pro Trp Glu Gln Leu Pro
20 25 30
Gly Gly Ser Cys Thr Leu Arg Met Gly Leu Met Ser Thr Thr Ala Ser
35 40 45
<210> 680
<211> 126
<212> PRT
<213> Homo sapiens
<400> 680
Ile Arg Thr Pro Gly His Gly Ser Pro Pro Ala Arg Trp Glu Ser Pro
1 5 10 15
Trp Pro Val His Thr Arg Pro Arg Ser Ser Pro Gly Met Asn Ser Glu
20 25 30
His Ser Gly Ser Ala Gly Val Val Ala Leu Ser Arg Leu Ala Met Val
35 40 45
Gln Ser His Pro Met Ser Leu Ser Leu Trp Pro Gly Pro Ser Arg Gly
50 55 60
His Gln Arg Ser Ser Ser Leu Ala Phe Pro Pro Ala Gly Ala Pro Trp
65 70 75 80
Val Asn Ser Glu Ser Gly Gly Arg Trp Arg Trp Thr Arg Ala Thr Ala
85 90 95
Arg Pro Ser Pro Trp Gly Ser His Thr Ala Pro Ser Leu Gly Leu Ser
100 105 110
Glu Pro Pro Pro Pro Ser Ser Gly Thr Ser Trp Gly Gln Pro
115 120 125
<210> 681
<211> 56
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 681
Thr Leu Trp Thr Leu Cys Ser Ser Thr Pro Thr Cys Leu Arg Thr Cys
1 5 10 15
His Leu Met Arg Ser Leu Trp Pro Pro Gln Arg Pro Ser Asn Ser Arg
20 25 30
Lys Phe Gly Trp Gln Met Arg Ala Ser Thr Pro Ala Pro Cys Leu Thr
35 40 45
His Cys Thr Phe Trp Thr Arg Leu
50 55
<210> 682
<211> 27
<212> PRT
<213> Homo sapiens
<400> 682
Pro Pro Pro Gly Trp Leu Pro Arg Leu Thr Arg Glu Arg Ala Ala Ala
1 5 10 15
Ala Leu Arg Ala Val Gly Thr Gln Ile Ser Ile
20 25
<210> 683
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 683
Ser Ile Lys Lys Lys Lys Asn Lys Glu Gly Val Gly Arg Glu Val Leu
1 5 10 15
Val Val Val Val Pro Val Ala Ile Ala Glu Leu Val Val Leu Val Val
20 25 30
Leu Ser Leu Ala Leu His Thr Val Leu Ala Gln Val Val Leu Leu Lys
35 40 45
Gly Lys Arg Asp Thr Val Gly Val Asp Leu Gln Gln Ser Lys Leu Asp
50 55 60
Val Ala Gly Val Glu Ala Ile Leu Ala Glu Leu Lys
65 70 75
<210> 684
<211> 20
<212> PRT
<213> Homo sapiens
<400> 684
Leu Gln Asp Gly Ser Leu Asp Arg Asn Leu Gly Ser Pro Leu Met Ser
1 5 10 15
Glu Phe Arg Lys
20
<210> 685
<211> 30
<212> PRT
<213> Homo sapiens
<400> 685
Arg Asn Ser Tyr Arg Met Asp Gln Thr Phe Lys Ile Leu Tyr Leu Val
1 5 10 15
Ile Leu Gln Thr Gly Ala Pro Gly Met Asn Ile Lys Glu Thr
20 25 30
<210> 686
<211> 43
<212> PRT
<213> Homo sapiens
<400> 686
Thr Leu Ser His Gln Ile Lys Ser Ser Phe Gly Gln Lys Met Gly Lys
1 5 10 15
Val Ile Phe Thr Asn Tyr Leu Pro Val Ala Phe Gln Leu Val Ile His
20 25 30
Ser Ala Val Met Trp Gly Arg Gln Leu Lys Ile
35 40
<210> 687
<211> 21
<212> PRT
<213> Homo sapiens
<400> 687
Leu His Tyr Leu Met Arg Trp Pro Ile Asn Leu Ile Arg Arg Trp Thr
1 5 10 15
Ser Phe Trp Glu Ile
20
<210> 688
<211> 28
<212> PRT
<213> Homo sapiens
<400> 688
Thr Gly Thr Lys His Glu Ser Gly Leu Leu Lys Thr Ser Gln Lys Leu
1 5 10 15
Ser Leu Lys Lys Met Thr Gln Gly Pro Cys Leu Gly
20 25
<210> 689
<211> 24
<212> PRT
<213> Homo sapiens
<400> 689
Arg His Pro Pro Gly Ser Thr Arg Tyr Pro Ser Phe Pro Leu Arg Leu
1 5 10 15
Val Pro Leu Ser Leu Ile Gly Pro
20
<210> 690
<211> 35
<212> PRT
<213> Homo sapiens
<400> 690
Lys Arg Ser Ser Arg Leu Gly Trp Ala Ser Gly Arg Ile Thr Tyr Ser
1 5 10 15
His Ser Pro Pro Arg Gly Trp Cys Ser Ala Ala Trp Pro Pro Arg His
20 25 30
Gly Trp Cys
35
<210> 691
<211> 44
<212> PRT
<213> Homo sapiens
<400> 691
Thr Ser Arg Pro Cys Thr Ser Thr Ser Thr Thr Ser Leu Leu Pro Met
1 5 10 15
Ala Leu Leu Cys Val Lys Arg Gly Arg Arg Cys Thr Lys Ala Lys Ala
20 25 30
Thr Ala Val Ser Ala Ala Val Ser Thr Glu Gln Ile
35 40
<210> 692
<211> 13
<212> PRT
<213> Homo sapiens
<400> 692
Trp Phe Ala Phe Leu Ser Ile Lys Lys Arg Ala Ala Arg
1 5 10
<210> 693
<211> 25
<212> PRT
<213> Homo sapiens
<400> 693
Leu Arg Met Ser Leu Ile Leu Ser Val Ile Cys Ser Cys Ser Trp Glu
1 5 10 15
Leu Trp Gly Tyr Met Ile Cys His Ile
20 25
<210> 694
<211> 26
<212> PRT
<213> Homo sapiens
<400> 694
Thr Pro Ser Ser Asp Pro Glu Ser Pro Gly Met Leu Ala Arg Ser Thr
1 5 10 15
Pro Ser Thr Thr Gly Arg Trp Cys Ala Leu
20 25
<210> 695
<211> 13
<212> PRT
<213> Homo sapiens
<400> 695
Tyr Ile Thr Leu Leu Tyr Leu Arg Lys Ile Phe Lys Val
1 5 10
<210> 696
<211> 19
<212> PRT
<213> Homo sapiens
<400> 696
Gln Asp Thr Leu Arg Asn Leu Leu Leu Gln Thr Thr Leu Thr Cys Trp
1 5 10 15
Trp Ile His
<210> 697
<211> 20
<212> PRT
<213> Homo sapiens
<400> 697
Asn Thr His Pro Leu Leu Gln Ala Cys Ser Pro Ser Ala Cys Arg Cys
1 5 10 15
Pro Cys His Gln
20
<210> 698
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 698
Asn Leu Gln Ile Arg Arg Leu Pro Arg Gln Arg Leu Leu Ser
1 5 10
<210> 699
<211> 26
<212> PRT
<213> Homo sapiens
<400> 699
Cys Ile His Ile Thr Gly Met Ser Leu Leu Gly Leu His Gly Thr Met
1 5 10 15
Glu Lys Ser Glu Gly Met Lys Ser Phe His
20 25
<210> 700
<211> 20
<212> PRT
<213> Homo sapiens
<400> 700
Gly Asn Thr Ala Asn Gly Pro Gly Ile Gly Arg Lys Ser Leu Met Pro
1 5 10 15
Met Gln Val Thr
20
<210> 701
<211> 36
<212> PRT
<213> Homo sapiens
<400> 701
Glu Ala Phe Thr Leu Thr Met Val Gly Phe Ser Lys Leu Ile Ser His
1 5 10 15
Val Leu Leu Ser Tyr Lys Pro Phe Ser Lys Gly Lys Glu His Glu Arg
20 25 30
Ile Pro Glu Ser
35
<210> 702
<211> 11
<212> PRT
<213> Homo sapiens
<400> 702
Gly Ser Trp Gly Val Pro Trp Met Thr Ser Met
1 5 10
<210> 703
<211> 13
<212> PRT
<213> Homo sapiens
<400> 703
Thr Ser Gly Thr Lys Ser Ser Arg Lys Ser Met Asn Ser
1 5 10
<210> 704
<211> 13
<212> PRT
<213> Homo sapiens
<400> 704
Ser Ser Lys Lys Arg Lys Lys Gly Asn Met Trp Thr Thr
1 5 10
<210> 705
<211> 19
<212> PRT
<213> Homo sapiens
<400> 705
Asp Val Ala Gly Glu Glu Asn Glu Gly Pro Pro Arg Pro Ser Leu Met
1 5 10 15
Cys Pro Arg
<210> 706
<211> 12
<212> PRT
<213> Homo sapiens
<400> 706
Pro Glu Ile Phe Leu Arg Met Asn Trp Cys Val Ser
1 5 10
<210> 707
<211> 22
<212> PRT
<213> Homo sapiens
<400> 707
His Leu His Arg Met Leu Tyr Met Asn Arg Leu Gln Pro Ser Thr Gln
1 5 10 15
Trp Tyr Lys Ile Thr Ala
20
<210> 708
<211> 12
<212> PRT
<213> Homo sapiens
<400> 708
Gly Leu Pro Gln Lys Glu Leu Lys Gly Ile Gln Leu
1 5 10
<210> 709
<211> 11
<212> PRT
<213> Homo sapiens
<400> 709
Lys Lys Lys Lys Ser Asn Ile Pro Lys Thr Pro
1 5 10
<210> 710
<211> 21
<212> PRT
<213> Homo sapiens
<400> 710
Val Ser Pro Ala Phe Leu Asn Phe Met Asp Leu Leu Leu Thr Ile Lys
1 5 10 15
Leu Glu Leu Cys Val
20
<210> 711
<211> 9
<212> PRT
<213> Homo sapiens
<400> 711
Asn Ile Ile Phe Leu Ser Asp Pro Gly
1 5
<210> 712
<211> 14
<212> PRT
<213> Homo sapiens
<400> 712
Ser Pro Ser Arg Ala His Leu Trp Pro Thr Arg Arg Ser Ser
1 5 10
<210> 713
<211> 12
<212> PRT
<213> Homo sapiens
<400> 713
Asn Met Val Lys Met Leu Val Phe Ile Leu Lys Leu
1 5 10
<210> 714
<211> 10
<212> PRT
<213> Homo sapiens
<400> 714
Ile Ala Met Thr Met Asp Gln Tyr Pro Phe
1 5 10
<210> 715
<211> 13
<212> PRT
<213> Homo sapiens
<400> 715
Pro Pro Phe Phe Thr Ile Asp Leu Val Thr Thr Cys Ile
1 5 10
<210> 716
<211> 8
<212> PRT
<213> Homo sapiens
<400> 716
Cys Lys Lys Lys Asn Asp Gly Thr
1 5
<210> 717
<211> 10
<212> PRT
<213> Homo sapiens
<400> 717
Met Thr Gly Phe Leu Thr Pro Arg Asp Phe
1 5 10
<210> 718
<211> 13
<212> PRT
<213> Homo sapiens
<400> 718
Leu Pro Pro Pro Trp Thr Ala Gln Leu Pro Cys Ile Ser
1 5 10
<210> 719
<211> 11
<212> PRT
<213> Homo sapiens
<400> 719
Arg Leu Ile Glu Ile Lys Val Pro Ser Gln Lys
1 5 10
<210> 720
<211> 11
<212> PRT
<213> Homo sapiens
<400> 720
Gly Glu Lys Lys Tyr Asn Val Phe His Met Lys
1 5 10
<210> 721
<211> 8
<212> PRT
<213> Homo sapiens
<400> 721
Lys Ala Phe Phe Leu Pro Val Arg
1 5
<210> 722
<211> 109
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 722
Ala His Pro Arg Pro Pro Ala Leu Ser Leu Arg Ser Leu Gln Arg Ser
1 5 10 15
Pro Ala Leu Arg Ala Arg Trp Ser Thr Ser Phe Cys Leu Ala Pro Lys
20 25 30
Arg Pro Leu Leu Leu Thr Pro Arg Glu Gln Thr Trp Leu Asp Pro Asp
35 40 45
Pro Ala Asn Ala Pro Cys Arg Cys Ser Ala Pro Ala Asn Gln Pro Arg
50 55 60
Thr Glu Ser Pro Pro Pro Leu Pro Ala Asp Leu Pro His Ser Ser Gly
65 70 75 80
Leu Ala Leu Cys Gly Ile Val Ser Thr Ser Ser His Leu Ile Leu Leu
85 90 95
Trp Leu Leu Gly Ser Arg Met Ala His Pro Arg Leu Pro
100 105
<210> 723
<211> 131
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 723
Ser Thr Ala Thr Ala Pro Trp Thr Ser Ala Ser Ser Thr Arg Ser Ala
1 5 10 15
Lys Trp Ala Thr Ser Thr Gly Ala Arg Cys Leu Thr Ser Gly Ala Ala
20 25 30
Ala Ala Cys Trp Arg Arg Cys Ser Ala Thr Ser Arg Gly Arg Ala Arg
35 40 45
Ser Pro Arg Val Arg Ser Arg Thr Leu Pro Lys Leu Cys Leu Trp Trp
50 55 60
Met Thr Asn Leu Thr Thr Arg Arg Ser Thr Arg Arg Ser Cys Trp Thr
65 70 75 80
Ser Pro Gly Met His Thr Gln Thr Ser Arg Ala Pro Gln Pro Ser Arg
85 90 95
Ala Gln Thr Trp Arg Thr Ser Pro His Cys Gly Ile Asp Thr Pro Val
100 105 110
Trp Leu Ser Gln Asn Cys Leu Arg Ala Pro Leu Thr Arg Thr Gly Arg
115 120 125
Gly Leu Cys
130
<210> 724
<211> 70
<212> PRT
<213> Homo sapiens
<400> 724
Val Lys Thr Gly Ser Ser Trp Thr Gly Ser Cys Arg Gln Gly Trp Arg
1 5 10 15
Trp Ser Gly Ser Asp Cys Gly Ile Ser Ile Thr Thr Thr Thr Pro Arg
20 25 30
Gly Ala Cys Gly Ala Ser Ala Ala Gly Arg Ala Leu Ala Arg Gly Arg
35 40 45
Leu Glu Asp Gly Gln Pro Leu Pro Ala Pro Val Gly Val Pro Arg Gln
50 55 60
Leu Leu Gly Ala Gly Leu
65 70
<210> 725
<211> 13
<212> PRT
<213> Homo sapiens
<400> 725
Ser Ala Thr Arg Met Pro Gly Pro Val Pro Ala Pro Ser
1 5 10
<210> 726
<211> 40
<212> PRT
<213> Homo sapiens
<400> 726
Gly Pro Pro Thr Ala Gln Cys Gln His Pro Pro Glu Pro Leu Phe Leu
1 5 10 15
Gln Ala Asp Gln Ala Thr Cys Leu Arg Gly Phe Ala Arg Ile Ala Ser
20 25 30
Ser Cys His Pro His His Gln Phe
35 40
<210> 727
<211> 57
<212> PRT
<213> Homo sapiens
<400> 727
Gly Pro Pro Thr Val Thr Arg Pro Pro Thr Pro Thr Thr Glu Pro Ser
1 5 10 15
Pro Pro Thr Ser Thr Thr Leu Trp Ser Ser Ala Phe Ser Ala Thr Arg
20 25 30
Met Pro Gly Ile Pro Ala Gly Leu Gly Leu Gly Phe Gly Arg Ala Glu
35 40 45
Gly Ala Gln Glu Gly Lys Ala Arg Val
50 55
<210> 728
<211> 81
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 728
Thr Gly Gly Arg Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys Met
1 5 10 15
Met Met Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg Arg Met
20 25 30
Thr Met Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr Cys Leu Thr
35 40 45
Pro Arg Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln Thr Ile Ser
50 55 60
Gln Arg Arg Pro Ile Gln Thr Pro Pro Gly Thr Ser Leu Ala Ile Trp
65 70 75 80
Gly
<210> 729
<211> 68
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 729
Val Pro Gly Leu Arg Ala Lys Val Trp Arg Gly Ser Pro Glu Trp Asp
1 5 10 15
Pro Glu Arg Arg Cys Leu Leu Pro Leu Pro Ser Cys Ala Gly Pro Gly
20 25 30
Asp Gln Ala Arg Met Arg Thr Ser Ala Val Ser Cys Cys Arg Ser Pro
35 40 45
Trp Thr Pro Cys Glu His Phe Pro Arg Pro Arg Ser Cys Gly Trp Arg
50 55 60
Trp Trp Arg Glu
65
<210> 730
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 730
Thr Tyr Gly Ala Trp Ala Ser Arg Trp Trp Ser Trp Gln Gln Asp Ser
1 5 10 15
<210> 731
<211> 117
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 731
Gln Thr Pro Pro Ser Arg Thr Met Thr Ser Gly Pro Thr Tyr Gly Ala
1 5 10 15
Trp Ala Ser Arg Cys Pro Ala Arg Leu Pro Pro Arg Trp Ser Trp Gln
20 25 30
Gln Asp Ser Phe Pro Thr Arg Thr Ala Arg Arg Thr Leu Arg Ser Ser
35 40 45
Pro Lys Ser Tyr Arg Lys Ser Pro Arg Phe Cys Pro Asp Thr Trp Ala
50 55 60
Ser Arg Gly Thr Ser Ser Pro Ser Ser Lys Thr Ala Leu Leu Lys Ile
65 70 75 80
Thr Gly Arg Asp Gln Ser Ile Ile Ser Tyr Leu Asn Thr Trp Arg Trp
85 90 95
Thr Trp Arg Pro Gly Ser Arg Met Ser Trp Arg Arg Leu Ser His Arg
100 105 110
Gly Leu Ala Ala Ser
115
<210> 732
<211> 32
<212> PRT
<213> Homo sapiens
<400> 732
Trp Val Leu Ile Cys Leu Asp Leu Phe Arg Gln Lys Phe Arg Lys Pro
1 5 10 15
Leu Met Leu Gln Glu Ser Leu Phe Gln Met Ile Phe Ser Ser Ile Phe
20 25 30
<210> 733
<211> 95
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 733
Leu Pro Met Pro Pro Pro Pro Arg Arg Pro Leu Pro Pro Pro Pro Arg
1 5 10 15
Ala Ala Gln Arg Thr Val Thr Arg Gly Lys Arg Leu Asn Asn Arg Ala
20 25 30
Pro Leu Gly Glu Ala Thr Gly Ser Arg Arg Gln Gly Glu Gln Asn Thr
35 40 45
Glu Asp Ser Arg Lys Ala Lys Pro Asp Phe Trp Lys Val Gln Asn Ser
50 55 60
Phe Gly Ser Leu Val Pro Glu Arg Glu Lys Met Leu Val Pro Gly Gly
65 70 75 80
Thr Arg Val Cys Gln His Ala Lys Ile Gly Pro Cys Tyr Met Lys
85 90 95
<210> 734
<211> 64
<212> PRT
<213> Homo sapiens
<400> 734
Asn Arg Phe Arg Leu Cys Ile Thr Ile Leu Pro Gly Met Lys Met Ser
1 5 10 15
Trp Ser Ser Glu Lys Val Met Ser Leu Met Ser Trp Lys Ser Val Met
20 25 30
Thr Ala Gly Leu Trp Gly Pro Gln Glu Glu Pro Asn Ser Leu Val Leu
35 40 45
Ser Pro Glu Thr Thr Ser Arg Gly Cys Glu Leu Arg Ser Leu Leu Leu
50 55 60
<210> 735
<211> 66
<212> PRT
<213> Homo sapiens
<400> 735
Leu Leu Leu Arg Ile Leu Arg Leu Arg Arg His Leu Pro Pro Ala Ala
1 5 10 15
Gly Leu Pro Val Thr Gly Ser Pro Arg Ser Phe Thr Asp Thr Ile Thr
20 25 30
Tyr Arg Asp Ser Arg Phe Leu Arg Pro Ser Lys Arg Pro Ser Trp Tyr
35 40 45
Asn Ile Leu Thr Val Asn Arg Pro Val Val Ile Leu Ala Arg Thr Gln
50 55 60
Thr Thr
65
<210> 736
<211> 81
<212> PRT
<213> Homo sapiens
<400> 736
Leu Pro Leu Pro Pro Val Pro Phe Leu Asp Cys Leu Ser Cys Pro Gly
1 5 10 15
Arg Asn Ala Trp Trp Leu Gln Val Pro Gly Glu Leu Gly Thr Leu Ala
20 25 30
Asp Arg Glu Arg Gly Pro Trp Ser Pro Thr His Ser Ala Gln Ser Pro
35 40 45
Val Pro Leu Arg Ile His Phe Cys Pro Val His Arg Pro Pro Trp His
50 55 60
Gly Leu Met Ala Ala Asp Arg Ala Trp Gly Leu Phe Thr Pro Ala Pro
65 70 75 80
Thr
<210> 737
<211> 42
<212> PRT
<213> Homo sapiens
<400> 737
Asp Gln Trp Cys Pro Asp Gly Ser His Leu Gly Gln Pro Arg Gln Leu
1 5 10 15
Pro Arg Asp Arg Arg Pro Arg Thr Ser His Ile Ser Ala Leu Ile Ala
20 25 30
Ala Arg Gly Leu Cys Ser Ala Ala Ala Ser
35 40
<210> 738
<211> 23
<212> PRT
<213> Homo sapiens
<400> 738
Asn Leu Ala Ile Val Glu Glu Glu Met Phe Leu Val Met Gly Glu Leu
1 5 10 15
Asn Tyr Val Pro Leu Ala Leu
20
<210> 739
<211> 52
<212> PRT
<213> Homo sapiens
<400> 739
Pro Tyr Phe Trp Arg Thr Leu Gln Pro Met Glu Met His Phe Phe Phe
1 5 10 15
Cys Gln His Phe Pro Ser Gly Pro Thr Arg Val Pro Leu Ser Lys Tyr
20 25 30
Thr Thr Arg Ser Lys Ser Leu Lys Gln Asp Lys Arg Phe Tyr Phe Ser
35 40 45
Ile Pro Ser Thr
50
<210> 740
<211> 44
<212> PRT
<213> Homo sapiens
<400> 740
Arg Arg Cys Glu Val Gln His Ser Ser Val Thr Arg Glu Lys Thr Gly
1 5 10 15
Cys Gly Phe Ser Ala Val Asn Lys Thr Gln Glu Val Phe Trp Trp Lys
20 25 30
Asn Thr Leu Tyr Leu Ile Lys Ile His Tyr Met Lys
35 40
<210> 741
<211> 22
<212> PRT
<213> Homo sapiens
<400> 741
Pro Gln Pro Gly Asn Gln Arg Ser Asn Arg Ser Leu Pro Gly Thr Thr
1 5 10 15
Arg Met Arg His Arg Val
20
<210> 742
<211> 52
<212> PRT
<213> Homo sapiens
<400> 742
Thr Arg Thr Ser Leu His Gln Ala Thr Arg Lys His Ile Ile Ile Pro
1 5 10 15
Leu Glu Arg Arg Ser Pro Gln Ala His Lys Leu Trp Met Ile Val Ile
20 25 30
Ile Lys Asp Ile Phe Leu Met Lys Arg Phe Leu Thr Leu Ala Ser Ala
35 40 45
His Val Gly Val
50
<210> 743
<211> 42
<212> PRT
<213> Homo sapiens
<400> 743
Gly Ser Leu Leu Gly Leu Ser Leu Ala Gln Pro Glu Ala Leu Lys Val
1 5 10 15
Ala Ala Arg Leu Arg Cys Gln His Pro Gln His His His Arg Arg Arg
20 25 30
Val Gln Cys Ser Leu Ser Arg Val Arg Arg
35 40
<210> 744
<211> 30
<212> PRT
<213> Homo sapiens
<400> 744
Gly Ser Asn Ser Asn Leu Gly Met Lys Cys Gly Ile Gln Asn Gln Met
1 5 10 15
Leu Val Ile Gln Gln Glu Ala Gly Phe Gly Ile Leu His Thr
20 25 30
<210> 745
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 745
Gln Ser Gln Gly Gly Gly Ala Gly Gly Glu Ser Gln Arg Ala Asn Ser
1 5 10 15
Ala Arg Arg Pro Leu Gly Arg Ile Gln Gly Arg Cys Arg Ala Ala Gly
20 25 30
Pro Ala Cys Gly Arg Gly Arg Ala
35 40
<210> 746
<211> 31
<212> PRT
<213> Homo sapiens
<400> 746
Pro Glu Gln Leu Thr Leu Pro Ile Ser Gln Gln Lys Pro Ser Pro Val
1 5 10 15
Leu Gly Lys Leu Glu Met Val Lys Ala Val Gln Leu Arg Val Ala
20 25 30
<210> 747
<211> 58
<212> PRT
<213> Homo sapiens
<400> 747
Phe Met Arg Asn Phe Leu Asn Met Leu Cys Phe Glu Asn Ile Leu Leu
1 5 10 15
His Leu His Gln Ile Met Lys Phe Leu Leu Arg Gln Pro Gly Gln Gly
20 25 30
Ile Trp Lys Leu Arg Leu Ile Gln Pro Ser Leu Trp Leu Ser Leu Trp
35 40 45
Ile Arg Pro Asn Leu Leu Leu Phe His Ile
50 55
<210> 748
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 748
His Pro Gln Ser His Leu His Pro Leu Gly Leu Pro His Leu Pro His
1 5 10 15
Pro His Cys Gln Thr Thr Arg Ala Pro Cys Gln Asp Trp Pro Leu Pro
20 25 30
<210> 749
<211> 62
<212> PRT
<213> Homo sapiens
<400> 749
Pro Pro Ala Gly Lys Asn Leu Met Lys Ser Pro Gln Trp Trp Gly Ser
1 5 10 15
Ser Val His Leu Ala Trp Ser Ser Gln Ser Leu Ser Leu His Gly Ser
20 25 30
Ala Val Arg Glu Asn His Pro Ser Leu Thr Arg Leu Leu His Thr Ser
35 40 45
Leu Cys Met Cys Leu Arg Glu Leu Ile Phe Thr Leu Lys Thr
50 55 60
<210> 750
<211> 53
<212> PRT
<213> Homo sapiens
<400> 750
Met Glu Tyr Cys Pro Pro Leu Asn Ser Cys Ala Ser Val Cys Ala Ser
1 5 10 15
Trp Ser Leu Asp Gly Cys His Pro Leu Trp Ser Trp His Ser Ser Arg
20 25 30
Ala Gly Arg Ala Gly Gly Gln Gly Ala Gln Asp Cys Pro Cys Ile Ala
35 40 45
Glu Leu Trp Gln Cys
50
<210> 751
<211> 44
<212> PRT
<213> Homo sapiens
<400> 751
Leu Trp Leu Trp Ala Gly Trp Thr Val Trp Trp Ser Cys Gly Pro Gly
1 5 10 15
Glu Lys Gly His Gly Trp Leu Pro Ser Leu Pro Thr Met Ala Leu Leu
20 25 30
Leu Leu Arg Phe Ser Cys Met Arg Val Ala Ser Tyr
35 40
<210> 752
<211> 44
<212> PRT
<213> Homo sapiens
<400> 752
Val Met Pro Leu His His Gly Leu Thr Gln Lys Met Ile Ser Glu Thr
1 5 10 15
Cys Ser Val Arg Ser Phe Met Asp Leu Lys Ile Lys Leu Ala Met Lys
20 25 30
Ile Gly Gly Val Ser Leu Thr Ser Phe Leu Phe Pro
35 40
<210> 753
<211> 29
<212> PRT
<213> Homo sapiens
<400> 753
Ala Ala Ala Thr Thr Leu Thr Ser Ala Ala Ser Ser Ala Gly Ser Ser
1 5 10 15
Trp Thr Pro Gly Arg Arg Gly Gly Thr Cys Ala Ser Ser
20 25
<210> 754
<211> 22
<212> PRT
<213> Homo sapiens
<400> 754
Asn Leu Leu Val Ser Thr Gln Leu Gly Thr Ala Ala Ser Pro Thr Gln
1 5 10 15
His Gln Gln Leu Pro Arg
20
<210> 755
<211> 27
<212> PRT
<213> Homo sapiens
<400> 755
Trp Arg Glu Ala Trp Arg Arg Ser Ser Trp Pro Arg Trp Thr Met Ala
1 5 10 15
Trp Ala Gln His Gly Ser Pro Ala Ile Gly Gly
20 25
<210> 756
<211> 54
<212> PRT
<213> Homo sapiens
<400> 756
Ser Val Ser Arg Lys Ala Gly Leu Val Ser Ser Thr Lys Pro Leu Val
1 5 10 15
Gln Leu Gly Phe Thr Leu Lys Arg Tyr Arg Ser Phe Leu Asn Ile Glu
20 25 30
Phe Leu Gln Thr Pro Lys Leu Thr Arg Lys Leu Ser Glu Trp Ser Arg
35 40 45
Arg Lys Leu Leu Thr Cys
50
<210> 757
<211> 32
<212> PRT
<213> Homo sapiens
<400> 757
Val Val Lys Thr Val Ala Leu Gly His Leu Thr Ile Arg Asn Val Ala
1 5 10 15
Ser Val Asp Pro Gly Gln Thr Val Leu Trp Met Glu Ser Leu Cys Leu
20 25 30
<210> 758
<211> 9
<212> PRT
<213> Homo sapiens
<400> 758
Cys His Trp Gly Ala Ala Pro Gly Ser
1 5
<210> 759
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 759
Gly Pro Val Tyr Tyr Val Cys Asn His Met Asn Val Ser Ser Val Leu
1 5 10 15
Lys Pro Ser Leu Phe Thr Val Pro Ile
20 25
<210> 760
<211> 30
<212> PRT
<213> Homo sapiens
<400> 760
Thr Ser Gln Arg Ile Pro Cys Ser Leu Gln Lys Lys Met His Leu Lys
1 5 10 15
Tyr Gly Leu Phe Ser Thr Phe Tyr Leu Arg Thr Ser Ile His
20 25 30
<210> 761
<211> 27
<212> PRT
<213> Homo sapiens
<400> 761
Ala Leu Gln Val Phe Ser Ser Thr Gly Leu Lys Arg Thr Leu Ile Glu
1 5 10 15
Arg Val Ser Met Asp Thr Ala Phe Arg Glu Ser
20 25
<210> 762
<211> 12
<212> PRT
<213> Homo sapiens
<400> 762
Pro Ala Pro Ala Thr Gln Ala Pro Cys Met Met Thr
1 5 10
<210> 763
<211> 31
<212> PRT
<213> Homo sapiens
<400> 763
Lys Thr Ala Lys Thr Leu Cys Gly His Arg Met Asp Pro Gln Pro Arg
1 5 10 15
Ser Cys Ser Ser Leu Trp Ser Trp Gln Leu Lys Pro Cys Pro Cys
20 25 30
<210> 764
<211> 34
<212> PRT
<213> Homo sapiens
<400> 764
Leu Val Lys Val Gln Thr His Ile Ser Val Ile Pro Ser Leu Glu Ser
1 5 10 15
Ser Pro Leu Gly Val Gln Asp Trp Gly Asn Pro Ser Ala Leu Ile Gln
20 25 30
Asn Ser
<210> 765
<211> 32
<212> PRT
<213> Homo sapiens
<400> 765
Leu Leu Trp Glu Asp Arg Ala Lys Asn Thr Gln Ala Leu Pro Leu Pro
1 5 10 15
Leu Ser Gly Glu Ala Leu Ser Ile Gly Pro Ala Leu Gln Leu Lys Val
20 25 30
<210> 766
<211> 28
<212> PRT
<213> Homo sapiens
<400> 766
Arg Lys Ser Leu Ile Leu Cys Lys Thr Asn Leu Leu Val Phe Ile Asn
1 5 10 15
Asp Ser Arg Arg His Leu Asp Ser Met Glu Lys Phe
20 25
<210> 767
<211> 22
<212> PRT
<213> Homo sapiens
<400> 767
Trp Thr Arg Ser Gln Lys Gly Lys Ala Ser Leu Thr Ile Gly Gly Trp
1 5 10 15
Arg Ile Cys Cys Ser Leu
20
<210> 768
<211> 24
<212> PRT
<213> Homo sapiens
<400> 768
Arg His Pro Leu Gln Ser Leu His His Pro Pro Cys Ser Leu Ser Ala
1 5 10 15
Ala Thr Gln Ala Ile Pro Pro Arg
20
<210> 769
<211> 40
<212> PRT
<213> Homo sapiens
<400> 769
Val Arg Ile Leu Glu Ile Ser Ser His Phe Leu His Ile Leu Arg Ser
1 5 10 15
Gln Lys Met Ile Gln Leu Asn Leu Thr Val Met Lys Lys Ile Leu Leu
20 25 30
Leu Phe Phe His His His Leu Val
35 40
<210> 770
<211> 38
<212> PRT
<213> Homo sapiens
<400> 770
Asn Leu Arg Asn Gln Ser Val Ala Met Ala Asp Trp Arg Glu Met Lys
1 5 10 15
Ser Val Ile Val Val Leu Arg Leu Asn Val Asp Leu Gln Ala Val Val
20 25 30
Ile Phe Glu Leu Val Tyr
35
<210> 771
<211> 25
<212> PRT
<213> Homo sapiens
<400> 771
Arg Ile Lys Ala Ser Ser Met Pro Gln Thr Pro Glu Arg Gln Thr Leu
1 5 10 15
Pro His Leu Thr Ser Leu Pro Ser Arg
20 25
<210> 772
<211> 20
<212> PRT
<213> Homo sapiens
<400> 772
Leu Arg Thr Lys Leu Cys Phe Ala Pro Cys Thr Asn Gln Arg Glu Phe
1 5 10 15
Met Ser Lys Asn
20
<210> 773
<211> 44
<212> PRT
<213> Homo sapiens
<400> 773
Arg Lys Ser Pro Val Thr Gly Asn Met Arg His Trp Pro Cys Leu Lys
1 5 10 15
Asp Arg Lys Gln Ala Glu Arg Pro Gly Leu Ile Cys Arg Asn Pro Ser
20 25 30
Leu Leu Trp Ala Trp Met Met Lys Leu His Asn Tyr
35 40
<210> 774
<211> 13
<212> PRT
<213> Homo sapiens
<400> 774
Val Ile Pro Pro Ile Gln Cys Phe Ile Leu Met Tyr Phe
1 5 10
<210> 775
<211> 13
<212> PRT
<213> Homo sapiens
<400> 775
Lys Glu Lys Lys Ser Arg Thr Leu Met Lys Met Ile Ser
1 5 10
<210> 776
<211> 24
<212> PRT
<213> Homo sapiens
<400> 776
His Pro Leu Pro Lys Met Asn Thr Thr Arg Met Gly Ile Trp Ile Ser
1 5 10 15
Pro Gly Ala Gly Pro Gly Leu His
20
<210> 777
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 777
Asn Lys Trp Asn Ala Met Val Val Leu Asn Lys Gly
1 5 10
<210> 778
<211> 19
<212> PRT
<213> Homo sapiens
<400> 778
Gln Arg Pro Leu Pro Gly Asn Gly Val Arg Lys Ala Gln Asn Gly Trp
1 5 10 15
Cys Arg His
<210> 779
<211> 21
<212> PRT
<213> Homo sapiens
<400> 779
Leu Trp Ser Ser Arg His Thr Ser Leu Arg Ile Thr His Lys Arg His
1 5 10 15
Gly Ser Ile Pro Leu
20
<210> 780
<211> 13
<212> PRT
<213> Homo sapiens
<400> 780
Ser Gln Glu Ile Leu Val Ile Ala Leu Leu Leu Lys Arg
1 5 10
<210> 781
<211> 15
<212> PRT
<213> Homo sapiens
<400> 781
Thr Trp Arg Lys Leu Ala Asp Ser Leu Val Cys Ser Trp Ile Thr
1 5 10 15
<210> 782
<211> 12
<212> PRT
<213> Homo sapiens
<400> 782
Cys His Leu Val Ser Thr Cys Gln Thr Ile Pro Ser
1 5 10
<210> 783
<211> 11
<212> PRT
<213> Homo sapiens
<400> 783
Leu Glu Ile Leu Arg Arg Ser Ser Leu Gly Arg
1 5 10
<210> 784
<211> 27
<212> PRT
<213> Homo sapiens
<400> 784
Leu Glu Asn Leu Asp Ser Arg Gln Lys Phe Pro Phe Asp Leu Ile Ile
1 5 10 15
Met Ala Asn Met Tyr Gln Trp Ile Arg Val Arg
20 25
<210> 785
<211> 16
<212> PRT
<213> Homo sapiens
<400> 785
Leu Pro Ile Met Pro Cys Trp Ser Pro Cys Leu Ala Gly Ser Leu Trp
1 5 10 15
<210> 786
<211> 11
<212> PRT
<213> Homo sapiens
<400> 786
Met Ser Leu Leu Gln Arg Thr Val Ser Gln Gln
1 5 10
<210> 787
<211> 8
<212> PRT
<213> Homo sapiens
<400> 787
Lys Gln Lys Lys Asn Trp Gln Ser
1 5
<210> 788
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 788
Met Leu Lys Asn Val Arg Gly Asn Asn Ser Lys Leu Lys Tyr Arg Arg
1 5 10 15
Lys Arg Lys
<210> 789
<211> 22
<212> PRT
<213> Homo sapiens
<400> 789
Ser Ala Ile Lys Gln Arg Lys Gln Arg Thr Met Trp Ser Gly Lys Pro
1 5 10 15
Ser Leu Trp Ser Ser Gly
20
<210> 790
<211> 13
<212> PRT
<213> Homo sapiens
<400> 790
Lys Glu Lys Lys Leu Arg Leu Ala Val Leu Val Asn Asn
1 5 10
<210> 791
<211> 14
<212> PRT
<213> Homo sapiens
<400> 791
Gly Leu Ala Ser Pro Leu Ala Ala Cys Arg Leu Thr Ser Pro
1 5 10
<210> 792
<211> 11
<212> PRT
<213> Homo sapiens
<400> 792
Ile Ser Lys Lys Gln Asn Ala Leu Ala Glu His
1 5 10
<210> 793
<211> 13
<212> PRT
<213> Homo sapiens
<400> 793
Gly Gln Lys Lys Ile Arg Lys Thr Ser Gln Val Leu Thr
1 5 10
<210> 794
<211> 11
<212> PRT
<213> Homo sapiens
<400> 794
Ser Glu Lys Cys Arg Ser Ser Leu Asp Trp Arg
1 5 10
<210> 795
<211> 10
<212> PRT
<213> Homo sapiens
<400> 795
Glu Lys Met Cys Trp Phe Arg Thr Gly Met
1 5 10
<210> 796
<211> 13
<212> PRT
<213> Homo sapiens
<400> 796
Ala His Lys Lys Ala Met Lys Lys Ala Thr Lys Ser Ser
1 5 10
<210> 797
<211> 10
<212> PRT
<213> Homo sapiens
<400> 797
Phe Thr Pro Phe Leu Val His Lys Met Phe
1 5 10
<210> 798
<211> 20
<212> PRT
<213> Homo sapiens
<400> 798
Ala Gly Arg Ala Ala Pro Ala Pro Ser Pro Arg Thr Ala Ala Ala Cys
1 5 10 15
Pro Thr Pro Val
20
<210> 799
<211> 9
<212> PRT
<213> Homo sapiens
<400> 799
Val Arg Tyr Pro Arg Ala Arg Pro Arg
1 5
<210> 800
<211> 9
<212> PRT
<213> Homo sapiens
<400> 800
Gln Leu Leu Lys Met Arg Ser Trp Asn
1 5
<210> 801
<211> 11
<212> PRT
<213> Homo sapiens
<400> 801
Val Ile His Phe Lys Lys Ser Lys Ile Ile Trp
1 5 10
<210> 802
<211> 12
<212> PRT
<213> Homo sapiens
<400> 802
Gly Pro Thr Pro Leu Leu Leu Ser Ser Gly Phe Tyr
1 5 10
<210> 803
<211> 10
<212> PRT
<213> Homo sapiens
<400> 803
Asn Gln Leu Thr Arg Asp Trp Lys Ala Ser
1 5 10
<210> 804
<211> 11
<212> PRT
<213> Homo sapiens
<400> 804
Leu Ile Glu Glu Phe Thr His Leu Cys Ser Leu
1 5 10
<210> 805
<211> 12
<212> PRT
<213> Homo sapiens
<400> 805
Ala Val Glu Lys Ser Pro His Leu Arg Trp Leu Ile
1 5 10
<210> 806
<211> 12
<212> PRT
<213> Homo sapiens
<400> 806
Ser Leu Pro Asn Leu Lys His Cys Leu Met Met Ser
1 5 10
<210> 807
<211> 10
<212> PRT
<213> Homo sapiens
<400> 807
Ala Gly Ser Gly Ser Asp Thr Gln Arg Asp
1 5 10
<210> 808
<211> 8
<212> PRT
<213> Homo sapiens
<400> 808
Thr Asp Lys Lys Val Trp Leu Met
1 5
<210> 809
<211> 11
<212> PRT
<213> Homo sapiens
<400> 809
Ile Val Lys Lys Gly Glu Glu Gly Gly Arg Met
1 5 10
<210> 810
<211> 15
<212> PRT
<213> Homo sapiens
<400> 810
Thr Ser Met Thr Ser Thr Trp Thr Gly Leu Leu Arg Ser Arg Cys
1 5 10 15
<210> 811
<211> 8
<212> PRT
<213> Homo sapiens
<400> 811
Asp Cys Gln Lys Ser His Ser Ser
1 5
<210> 812
<211> 9
<212> PRT
<213> Homo sapiens
<400> 812
Arg Ala Phe Phe Ile Ser His Ser Leu
1 5
<210> 813
<211> 8
<212> PRT
<213> Homo sapiens
<400> 813
Leu Asn Gln Lys Asn Ser Val Ile
1 5
<210> 814
<211> 11
<212> PRT
<213> Homo sapiens
<400> 814
Gln Leu Gln Lys Thr Ala Pro Gly Leu Asn Ile
1 5 10
<210> 815
<211> 12
<212> PRT
<213> Homo sapiens
<400> 815
Lys Gly Lys Lys Asn Val Leu Arg Leu Thr Ser Cys
1 5 10
<210> 816
<211> 10
<212> PRT
<213> Homo sapiens
<400> 816
Leu Lys Lys Ile Leu Gln Asp Tyr Gln Ser
1 5 10
<210> 817
<211> 10
<212> PRT
<213> Homo sapiens
<400> 817
Phe Phe Thr Thr Cys Gly Asn Arg Arg Ser
1 5 10
<210> 818
<211> 11
<212> PRT
<213> Homo sapiens
<400> 818
Leu Ala Gln Trp Ala Pro Ala Ala Ser Pro Ala
1 5 10
<210> 819
<211> 10
<212> PRT
<213> Homo sapiens
<400> 819
Leu Ala Gly Arg Ala Met Gly Arg Ala Pro
1 5 10
<210> 820
<211> 8
<212> PRT
<213> Homo sapiens
<400> 820
Thr Gly Lys Lys Asn Cys Ser Ile
1 5
<210> 821
<211> 10
<212> PRT
<213> Homo sapiens
<400> 821
Lys Asp Leu Phe Cys Arg Gly Ile Ser Leu
1 5 10
<210> 822
<211> 8
<212> PRT
<213> Homo sapiens
<400> 822
Gly Thr Pro Pro Ser Pro Val Ser
1 5
<210> 823
<211> 36
<212> PRT
<213> Homo sapiens
<400> 823
Trp Gln Cys Leu Glu Pro Ser Arg Phe Tyr Val Pro Trp Glu Ala Ser
1 5 10 15
Val Val Thr Phe Phe Ala Ala Gly Ser Ala Lys Met Ser Cys Gln Ser
20 25 30
Trp Leu Ala Pro
35
<210> 824
<211> 23
<212> PRT
<213> Homo sapiens
<400> 824
Ser Thr Ser Ala Ser Cys Ser Ser Ser Phe Ser Leu Val Met Thr Leu
1 5 10 15
Thr Leu Asp Thr Trp Arg Leu
20
<210> 825
<211> 15
<212> PRT
<213> Homo sapiens
<400> 825
Arg Pro Glu Asn Ser Gln Ile Asn Ser Ser Leu Cys Asn Glu Ala
1 5 10 15
<210> 826
<211> 8
<212> PRT
<213> Homo sapiens
<400> 826
Ile Arg Lys Lys Arg Cys Val Tyr
1 5
<210> 827
<211> 58
<212> PRT
<213> Homo sapiens
<400> 827
Thr Thr Leu Ala Phe Gln Lys Ser Leu Pro Trp Pro Lys Leu Leu Pro
1 5 10 15
Lys Thr Arg Ser Met Thr His Leu Thr Glu Lys Pro Arg Lys Lys Ser
20 25 30
Leu Leu Gly Pro Leu Thr Gln Ile His Gln Ile Leu Leu Ser Lys Phe
35 40 45
Ser Phe Phe Gln Leu Leu Cys Thr Arg Asp
50 55
<210> 828
<211> 11
<212> PRT
<213> Homo sapiens
<400> 828
Met Asn Leu Pro Phe Gly Ser Phe Met Ser Gln
1 5 10
<210> 829
<211> 8
<212> PRT
<213> Homo sapiens
<400> 829
Pro Asp Pro Pro Thr Gly Ile Gly
1 5
<210> 830
<211> 11
<212> PRT
<213> Homo sapiens
<400> 830
Leu Cys Lys Lys Ile Met Met Arg Ser Ile Gln
1 5 10
<210> 831
<211> 10
<212> PRT
<213> Homo sapiens
<400> 831
Thr Pro Arg Thr Gly Gly Pro Arg Cys Trp
1 5 10
<210> 832
<211> 11
<212> PRT
<213> Homo sapiens
<400> 832
Pro Thr Phe Phe Ile Ser Pro Asn Lys Thr His
1 5 10
<210> 833
<211> 18
<212> PRT
<213> Homo sapiens
<400> 833
His Lys Trp Leu Lys Phe Cys Leu Leu Arg Val Val Lys Glu Ser Phe
1 5 10 15
His Glu
<210> 834
<211> 214
<212> PRT
<213> Homo sapiens
<400> 834
Val Ala Ala Pro Ser Pro Gly Cys Thr Leu Ala Arg Ala Pro Ser Thr
1 5 10 15
Pro Val Lys Thr Val Trp Ala Thr His Arg Ala Arg Val Pro Pro Ala
20 25 30
Cys Leu Leu His Ser Trp Ile Ser Leu Lys Ser Ser Cys Gln Phe Asn
35 40 45
Lys Met Ala Ser Thr His Tyr His Thr Ser Glu Gly Gln Gln Gly Gln
50 55 60
Gly Pro Gly Gln Arg Gln Gly Arg Ala Leu Pro Gln Ser Pro Ala Val
65 70 75 80
Arg Ala Leu Ala Ala Ser Gly Thr Trp Phe Ile Leu Cys Arg Ser Ser
85 90 95
Leu Pro Ser Pro Thr Leu Trp Arg Arg Arg Gly Ser Gly Thr Ile Met
100 105 110
Gly Pro Arg Leu Arg Glu Glu Val Ala Leu Glu Glu Thr Ala Thr Pro
115 120 125
Ala Arg Ala Leu Glu Ala Pro Thr Pro Pro Ile Thr Thr Ile Thr Thr
130 135 140
Thr Ile Thr Thr Thr Thr Ser Pro Gly Thr Ala Arg Gly Ala Arg Ala
145 150 155 160
Arg Thr Ala Arg Gly Met Gly Gly Thr Arg Pro Ser Pro Gln Ala Gly
165 170 175
Gly Val Pro Met Thr Thr Trp Thr Val Ile Ala Ala Ser Trp Arg Val
180 185 190
Gly Gly Pro Leu Gly Ser Leu Val Val Pro Ser Ala Trp Arg Val Gln
195 200 205
Met Gly Pro Thr Gly Thr
210
<210> 835
<211> 140
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 835
Ser Leu Arg Lys Lys Arg Arg Lys Ser Pro Ile Thr Arg Asn Leu Arg
1 5 10 15
His Trp Pro Cys Leu Lys Asp His Lys Trp Ala Val Arg Leu Gly Leu
20 25 30
Ile Cys Arg Asn Pro Gly Leu Leu Trp Ala Cys Met Val Lys Leu Gln
35 40 45
Glu Tyr Gln His Leu Leu Ile Lys Thr Ser Leu Arg Lys Lys Arg Lys
50 55 60
Ser Pro Ile Thr Arg Asn Leu Arg Gln Trp Pro Cys Leu Arg Ala Ser
65 70 75 80
Arg Val His Thr Leu Lys Asp His Arg Trp Ala Val Arg Leu Gly Leu
85 90 95
Trp Lys Ala Val Gln Leu Leu Lys Gly Ser Arg Asn Pro Thr Val Gln
100 105 110
Arg Arg Ser Ser Lys Gly His Glu Cys Leu Val Met Ile Phe Gln Cys
115 120 125
Pro Val Arg Thr Leu Arg Ala His Ser Leu Ile Gln
130 135 140
<210> 836
<211> 90
<212> PRT
<213> Homo sapiens
<400> 836
Gln His Cys Pro Pro Val Pro Gly Ser Ala Ser Leu Phe His Arg Arg
1 5 10 15
Arg Thr Gln Gly His Pro Ala Leu His Gln Cys Leu Ser Leu Thr Met
20 25 30
Ser Ser Ala Trp Pro Pro Thr Val Thr Ile Trp Met Cys Arg His Pro
35 40 45
Arg Pro Gln Leu Ser Leu Thr Leu Pro Gln Leu Ser Leu Thr Gln Pro
50 55 60
Gln Pro Pro Val Lys Val Arg Thr Lys Ala Ala Gly Gly Pro Cys Leu
65 70 75 80
Pro Arg Arg Ala Pro Gln Gly Val Asn Pro
85 90
<210> 837
<211> 39
<212> PRT
<213> Homo sapiens
<400> 837
Leu Gly Ser Ile Arg Gly Leu Asn Gly Asn Gln Met Arg Met Glu Ser
1 5 10 15
Leu Pro Ser Thr Ala Gly Thr Glu Asn Gly Thr Ser Arg Gln Gln Leu
20 25 30
Leu Arg Lys Thr Trp Ser Phe
35
<210> 838
<211> 14
<212> PRT
<213> Homo sapiens
<400> 838
Thr Val Leu Ser Leu Val Thr Ile Ser Arg Phe Val Leu Ser
1 5 10
<210> 839
<211> 19
<212> PRT
<213> Homo sapiens
<400> 839
Asn Ser Asn Ile Gln Leu Met Thr Thr Arg Asn Phe Trp Pro Met Ala
1 5 10 15
Ser Ala Ile
<210> 840
<211> 13
<212> PRT
<213> Homo sapiens
<400> 840
Trp Glu Lys Lys Arg Gly Thr Lys Ser Met Lys Val Thr
1 5 10
<210> 841
<211> 12
<212> PRT
<213> Homo sapiens
<400> 841
Ser Thr Phe Phe His Glu Asp Leu Val Arg Ile Pro
1 5 10
<210> 842
<211> 8
<212> PRT
<213> Homo sapiens
<400> 842
Trp Glu Lys Lys Trp Val Arg Ser
1 5
<210> 843
<211> 11
<212> PRT
<213> Homo sapiens
<400> 843
Asn Val Pro Leu Thr Lys Leu Ser Glu Val Phe
1 5 10
<210> 844
<211> 17
<212> PRT
<213> Homo sapiens
<400> 844
Leu Trp Asp Pro Ser Arg Arg Arg Thr Thr Thr Val Pro Ile Ser Thr
1 5 10 15
Ser
<210> 845
<211> 11
<212> PRT
<213> Homo sapiens
<400> 845
Leu Gln Lys Lys Ile Ser Trp Asn Leu Ser Leu
1 5 10
<210> 846
<211> 9
<212> PRT
<213> Homo sapiens
<400> 846
Lys Glu Lys Lys Gln Trp Lys Lys Asn
1 5
<210> 847
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 847
Val Pro Leu Pro Arg Ser Leu Leu Arg Gln Pro Val Gln Leu Arg Thr
1 5 10 15
Glu Pro Ala Arg Ser Ser Cys Ile Ser Thr Ala Ser Thr Thr Glu Ser
20 25 30
Thr Pro Thr Ala Ser Ser Ala Met Ala Val Thr Arg Ser Ser Arg Gly
35 40 45
Cys Trp Pro Ala Pro Ser Arg Pro Thr Ala Ser Thr Pro Ala Gly Arg
50 55 60
Gly Ala Phe Pro Pro Lys Cys Cys Ser Gly Met Cys Thr Ser His His
65 70 75 80
Ala Pro Trp Pro Ser Gly Pro Arg Thr Ser Thr Ala Val Pro Gly Ser
85 90 95
Ala Cys Gln Gly Ala Val Thr Pro Thr Ser Ala Glu Ile Trp Phe Leu
100 105 110
Pro Ser Pro Asp Ala Leu Ser Met Gly Ser Ser Ser Pro Gln Trp Leu
115 120 125
Gly Thr Leu Leu Trp Thr Phe Cys Gly Leu Arg Trp Gly Cys Pro Trp
130 135 140
Pro Pro Cys Ser Ser Trp Arg Gln Pro Gln
145 150
<210> 848
<211> 29
<212> PRT
<213> Homo sapiens
<400> 848
Gln Glu Leu Lys Glu Ala Val Lys Phe Ser Ile Val Lys Asn Asn Ser
1 5 10 15
Asn Asn Lys Cys Gly Ile Gln Pro Gly Leu Pro Ile Leu
20 25
<210> 849
<211> 16
<212> PRT
<213> Homo sapiens
<400> 849
Val Ser Gly Ser Trp Ser Leu Gly His Pro Trp Cys Cys Leu Gly Leu
1 5 10 15
<210> 850
<211> 22
<212> PRT
<213> Homo sapiens
<400> 850
Leu Thr Leu Asn Ser Leu Arg Trp Pro Leu Gln Leu Ser Asn Leu Ala
1 5 10 15
Gly Ser Gln Ile Ser Trp
20
<210> 851
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 851
Ser Glu Arg Cys Leu Leu Val Cys Leu Leu Ser Leu Cys Lys Met Gly
1 5 10 15
Pro Thr Ile Leu Leu Thr Phe Gly Val His Gln Met Gly
20 25
<210> 852
<211> 12
<212> PRT
<213> Homo sapiens
<400> 852
Arg Pro Cys Trp Ser Arg Cys Ser Leu Arg Gln Met
1 5 10
<210> 853
<211> 34
<212> PRT
<213> Homo sapiens
<400> 853
Cys Val Gly Cys Gln Phe Ile Val Pro Thr Arg Gly Ala Pro Leu Met
1 5 10 15
Ala Arg Val His Thr Glu His Ser Arg Val Leu Leu Ser Pro Ser Phe
20 25 30
Thr Cys
<210> 854
<211> 19
<212> PRT
<213> Homo sapiens
<400> 854
Asn Tyr Arg Lys Leu Tyr Gln Lys Gln Leu Glu Lys Arg Ile Lys His
1 5 10 15
Leu Cys Ser
<210> 855
<211> 11
<212> PRT
<213> Homo sapiens
<400> 855
Ser Ala Thr Pro Leu Pro His Tyr Leu Ala His
1 5 10
<210> 856
<211> 11
<212> PRT
<213> Homo sapiens
<400> 856
Thr Ser Ser Leu Thr Met Glu Ser Ser Gly His
1 5 10
<210> 857
<211> 12
<212> PRT
<213> Homo sapiens
<400> 857
Leu Met Phe Phe Gly Asn Gln Ser Ile Ile Thr Leu
1 5 10
<210> 858
<211> 11
<212> PRT
<213> Homo sapiens
<400> 858
Leu Asn His Gln Lys Gly Lys Phe Met Asn Phe
1 5 10
<210> 859
<211> 160
<212> PRT
<213> Homo sapiens
<400> 859
Ala Ile Arg Gly Leu Thr Val Ala Ser Ser Leu Pro Trp Thr Thr Pro
1 5 10 15
Ala Ser Gly Gly Val Ser Arg Tyr Ile Ser Arg Cys Ala Pro Pro Ala
20 25 30
Thr Ala Trp Thr Ser Trp Pro Thr Ala Thr Trp Trp Ala Cys Ala Thr
35 40 45
Arg Arg Met Lys Leu Arg Ser Trp Leu Arg Arg Trp Arg Phe Lys Thr
50 55 60
Ala Pro Met Lys Met Gly Arg Cys Ser Cys Gly Gln Gly Ser Cys Ser
65 70 75 80
Thr Ile Ser Gln Asn His Thr Pro Thr Val Arg Leu Leu Glu Leu Pro
85 90 95
Thr Thr Glu His Cys Pro Leu Thr Ser Ala Thr Ser Cys Glu Leu Gly
100 105 110
Met Val Val Arg Thr Thr Ser Ser Pro Cys Ser Arg Ala Thr Ala Ser
115 120 125
His Pro Pro Gly Cys His Cys Gly Lys Val Ser Thr Ser Thr Pro Thr
130 135 140
Phe Leu Ala Arg Pro Leu Pro Trp Pro Leu Pro Ser Thr Gln Met Ser
145 150 155 160
<210> 860
<211> 85
<212> PRT
<213> Homo sapiens
<400> 860
Arg Gly Arg Thr Ser Gly Arg Ser Leu Ser Cys Cys Pro Arg Pro Arg
1 5 10 15
Cys Arg Pro Ala Val Ala Ser Arg Ser Thr Ala Pro Ser Pro Arg Ala
20 25 30
Gly Ser Arg Arg Cys Cys Leu Arg Thr Ser Cys Gly Ala Ala Arg Pro
35 40 45
Arg Arg Thr Arg Ser Ala Trp Gly Asp Trp Val Ala Ser Pro Pro Thr
50 55 60
Arg Ser Ser Ser Arg Thr Ala Cys Gly Ala Ala Ser Pro Pro Ala Arg
65 70 75 80
Ser Trp Ser Ala Pro
85
<210> 861
<211> 60
<212> PRT
<213> Homo sapiens
<400> 861
Leu His Leu Tyr Leu Gln Asp Leu Asp Phe Ile Phe Ile Asn Lys Gly
1 5 10 15
Leu His Leu Lys His Ser Ile Gln Asp Val Gln Phe Met Lys Ile Thr
20 25 30
Met Ala Lys Gln Leu Leu Lys Ile Pro Cys Met Thr Pro Thr Gln Ser
35 40 45
Gln Trp Lys Gly Arg Arg Tyr Asp Leu Ile Pro Thr
50 55 60
<210> 862
<211> 105
<212> PRT
<213> Homo sapiens
<400> 862
His Thr Ala Thr Lys Ala Tyr Thr Ser Pro His Ala Glu Gly Glu Phe
1 5 10 15
Cys Pro Gly Glu Thr Asp Thr Pro Asp Met Gly Glu Gly Leu Ser Gly
20 25 30
Asn Thr Glu Thr Lys Arg Glu Arg Gly Phe Arg Thr Ser Pro Pro Phe
35 40 45
Ile Ser Lys Pro Gln Arg Ala Leu Trp Ser Pro Pro Cys Pro Ser Pro
50 55 60
Gly Pro Pro Ser Leu Thr Ser Gly Leu Ser Cys Ser Trp Cys Ala Pro
65 70 75 80
Cys Thr Gly Ala Gly Trp Val Gly Lys Trp Ala Gly Leu Gln Leu Pro
85 90 95
Phe Tyr Pro Gln Trp Gln Leu Pro Pro
100 105
<210> 863
<211> 63
<212> PRT
<213> Homo sapiens
<400> 863
Glu Lys Ala Cys Gly His Pro Pro Thr Asp Arg Ala Glu Thr Leu Leu
1 5 10 15
Lys Phe Leu Leu Lys Gly Ile Leu Ala Leu Ala Ile Gly Pro Ala Gly
20 25 30
Ala Leu Ala Gly Pro Val Leu Thr Thr Leu Gly Thr Gln Arg Pro Leu
35 40 45
Pro Trp Ala Ala Pro Cys Pro Ala Thr Ala Ser Pro Ser Pro Leu
50 55 60
<210> 864
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 864
Ala Ala Ala Arg Trp Lys Ala Cys Leu Trp Pro Val Ala Pro Arg Cys
1 5 10 15
Ser Arg Trp Pro Pro Ala Ile Leu Pro Ala Ser Thr Pro Pro Ser Ala
20 25 30
Pro Pro Thr
35
<210> 865
<211> 31
<212> PRT
<213> Homo sapiens
<400> 865
Thr Ala Leu Pro Arg Ser Ser Ser Gln Gly Ser Val Trp Gln Leu Pro
1 5 10 15
Gly Asn Gly Leu Gln Ser Gln Ala Gly Ala Leu Arg Met Ile Ser
20 25 30
<210> 866
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 866
Gln Gln Val Pro Gly Leu Met Lys Thr Gly Pro Ser Trp Met Glu Ala
1 5 10 15
Trp Asn Gln Met Gly Pro Thr
20
<210> 867
<211> 25
<212> PRT
<213> Homo sapiens
<400> 867
Ala Ser Arg Trp Asn Pro Leu Arg Arg Thr Arg Ala Leu Arg Gly Pro
1 5 10 15
Pro Arg Gln Arg Ala Ala Ala Pro His
20 25
<210> 868
<211> 21
<212> PRT
<213> Homo sapiens
<400> 868
Tyr Ser Tyr Pro Ser Ser Leu Ser Val Phe Ser Val Pro Gly Tyr His
1 5 10 15
Leu Tyr Tyr Phe Arg
20
<210> 869
<211> 21
<212> PRT
<213> Homo sapiens
<400> 869
Ile Phe Tyr Ile Phe Ser Trp Ile Cys Pro Pro Thr Lys Lys Gln Arg
1 5 10 15
His Lys Ile Gln Leu
20
<210> 870
<211> 19
<212> PRT
<213> Homo sapiens
<400> 870
Ser Ile Gln His Leu Gln Ala Pro Ser Pro Ser Leu Trp Pro Trp Asn
1 5 10 15
Met Leu Cys
<210> 871
<211> 12
<212> PRT
<213> Homo sapiens
<400> 871
Ser Ala Ser Lys Asn Gly Asn Lys Lys Asn Ser Arg
1 5 10
<210> 872
<211> 9
<212> PRT
<213> Homo sapiens
<400> 872
Glu Ser Leu Lys Asn Thr Leu Asn Gln
1 5
<210> 873
<211> 12
<212> PRT
<213> Homo sapiens
<400> 873
Asn Thr Leu Asn Gln Ser Pro Glu His Ala Thr Arg
1 5 10
<210> 874
<211> 19
<212> PRT
<213> Homo sapiens
<400> 874
Leu Thr Asp Phe Phe Val Leu Trp Lys Ala Ser Gly Thr Ile Gln Phe
1 5 10 15
Asn Cys Lys
<210> 875
<211> 10
<212> PRT
<213> Homo sapiens
<400> 875
Leu Ala Ala Phe Leu Asn Phe Val Met His
1 5 10
<210> 876
<211> 12
<212> PRT
<213> Homo sapiens
<400> 876
Pro Pro Lys Lys Phe Ser Ile Leu Pro Ser Ser Arg
1 5 10
<210> 877
<211> 22
<212> PRT
<213> Homo sapiens
<400> 877
Trp Asp Gln Arg Lys Arg Lys Met Gly Lys Val Ile Ser Lys Gly Asn
1 5 10 15
Asp Leu Ser Lys Thr Gly
20
<210> 878
<211> 10
<212> PRT
<213> Homo sapiens
<400> 878
Trp Ala Ser Thr Ile Arg Asp Arg Cys Val
1 5 10
<210> 879
<211> 11
<212> PRT
<213> Homo sapiens
<400> 879
Cys Gln Leu Ile Glu Asn Val Pro Leu Leu Leu
1 5 10
<210> 880
<211> 12
<212> PRT
<213> Homo sapiens
<400> 880
Lys Thr Pro Pro Gly Leu Leu Arg Asn Thr Gln Gln
1 5 10
<210> 881
<211> 10
<212> PRT
<213> Homo sapiens
<400> 881
Ala Gly Ala Arg Gly Glu Ile Ala Val Met
1 5 10
<210> 882
<211> 10
<212> PRT
<213> Homo sapiens
<400> 882
Glu Lys Ile Pro Arg Gly Pro Ser Ala Ser
1 5 10
<210> 883
<211> 10
<212> PRT
<213> Homo sapiens
<400> 883
Gln Leu Pro Lys Met Ala Pro Phe Met Met
1 5 10
<210> 884
<211> 9
<212> PRT
<213> Homo sapiens
<400> 884
Lys Asp Lys Lys Gln Ile Met Lys Cys
1 5
<210> 885
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 885
Thr Asn Ala Leu Thr Leu Ala Gln Trp Ser Pro Val Ile Ala Ala Ser
1 5 10 15
Pro Ser Ala Ser Thr Gln Ala Arg Cys Ala Thr Ser Ala Ala Ala Thr
20 25 30
Thr Ser Pro Pro Thr Ser Ala Pro Thr Gln Ala Lys Ser Pro Ser Pro
35 40 45
Ala Thr Ser Val Glu Glu Ser Leu Pro Gly Ala Met Asn Ala Arg Gly
50 55 60
Ile Pro Arg Ser Thr Cys Gly Arg Arg Thr Arg Lys Gln Thr Lys Val
65 70 75 80
Leu Trp Pro Leu Arg Pro Pro Pro Leu Ser Leu Pro Thr Arg Pro Arg
85 90 95
Leu Leu Pro Leu Thr Arg Pro Arg Leu Leu Pro Leu Ile His Pro Arg
100 105 110
Pro Pro Pro His Thr His Leu Pro Ala Pro Arg Pro Thr His Pro Leu
115 120 125
Cys Thr Val Ala Ser Pro Pro Arg Arg Trp Pro Pro Arg Thr Pro Leu
130 135 140
Phe Pro Leu Leu Ser Arg Pro Arg Ser Ala Ala Ser Leu Ala Pro Pro
145 150 155 160
Gln Gly Phe Arg Thr
165
<210> 886
<211> 49
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 886
Gly Ala Trp Glu Leu Gly Gly Leu Ala Arg Trp Gly Pro Leu Cys Thr
1 5 10 15
His Pro Gln Cys Gln Val Leu Leu Leu Val Glu Asp Val Leu Cys Ala
20 25 30
Lys Trp Phe Ile Cys Pro Ala Ser Phe Asn Pro Gln Asn Asp Ser Met
35 40 45
Arg
<210> 887
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 887
Arg Asn Leu Ile Leu Met Ile Lys Val His Lys Phe Leu His Asn Leu
1 5 10 15
Ser Lys Tyr Thr Asp Lys Leu Gln Lys Ala Arg Met Leu Leu Pro Pro
20 25 30
Lys Ala
<210> 888
<211> 80
<212> PRT
<213> Homo sapiens
<400> 888
Arg Lys Gln Leu Tyr Ile Gln Asn Ala Leu Asn Leu Ser Arg Pro His
1 5 10 15
Ser Ala Arg Leu Thr Ala Ser Asp Thr Thr Arg Thr Arg Thr Cys Arg
20 25 30
Thr Trp Arg Arg Ser Ser Ala Ser Ala Ala Ser Ala Trp Arg Arg Ser
35 40 45
Phe Ala Ala Ser Cys Thr Arg Gly Thr Ser Cys Thr Pro Trp Arg Ala
50 55 60
Lys Ile Ser Thr Met Ser Thr Tyr Arg Glu Lys Leu Ser Gly Phe Pro
65 70 75 80
<210> 889
<211> 100
<212> PRT
<213> Homo sapiens
<400> 889
Leu Pro Trp Met Val Pro Trp Gly Met Glu Ala Leu Gly Ser Trp Gly
1 5 10 15
Gln Thr Asp Leu Thr Val Leu Gly Gln Pro Gly Val Arg Ala Leu Gly
20 25 30
Lys Trp Leu Gln Trp Pro His Pro Asp Pro Ala Gly Ser Pro Arg Pro
35 40 45
Gly Pro Arg Gly Gly His Pro Gln Pro Arg Pro Ser Thr Pro Ala Ser
50 55 60
Pro Gly Asn Arg Gly Leu Pro Leu Pro Pro Pro Val Trp Ala Val Leu
65 70 75 80
Ala Trp Ala Arg Ala His Leu Ala Val Glu Ala Cys Leu Arg Thr His
85 90 95
Gly Cys Ser Gly
100
<210> 890
<211> 35
<212> PRT
<213> Homo sapiens
<400> 890
Ser Arg Pro Arg His Arg Val Arg Lys Arg Arg Cys Pro His Cys Arg
1 5 10 15
Ser Ser Leu Pro Gly Arg His Arg Leu Gln Ser Cys Arg Pro Ser Pro
20 25 30
Asp Pro Arg
35
<210> 891
<211> 40
<212> PRT
<213> Homo sapiens
<400> 891
Ala Pro Ala Cys His Trp Leu Ala Arg Leu Gly Trp Arg Val Ser Glu
1 5 10 15
Glu Pro Val Leu Ser Ser Leu Thr Ser Leu Arg Ile Glu Leu Leu Leu
20 25 30
Ser Ser Cys Ser Ser Arg Trp Gly
35 40
<210> 892
<211> 62
<212> PRT
<213> Homo sapiens
<400> 892
Met Lys Met Ala Cys Gly Lys Arg Ser Leu Leu Gln Glu Val Lys Lys
1 5 10 15
His Glu Leu Pro Lys Lys Ala Pro Ser Trp Pro Asp Arg Pro Leu Val
20 25 30
Gly Leu Ala Arg Ile Gln Ile Trp Ile Leu His Leu Leu Gly Leu Arg
35 40 45
Pro Pro Ser Leu Leu Ser Val Phe Gln Met Thr Phe Ile Lys
50 55 60
<210> 893
<211> 42
<212> PRT
<213> Homo sapiens
<400> 893
Ala Ala Ala Pro Arg Ser Thr Pro Arg Ala Thr Arg Pro Ser Cys Ala
1 5 10 15
Gly Pro Ser Arg Arg Ala Ala Arg Ala Ser Thr Ala Lys Ser Ala Ser
20 25 30
Ser Arg Met Ala Ser Thr Ser Cys Ala Ala
35 40
<210> 894
<211> 38
<212> PRT
<213> Homo sapiens
<400> 894
Arg Ala Gly Asn Phe Ala Ile Met Glu Ile Gln Cys Pro Ala Leu Arg
1 5 10 15
Lys Thr Leu Pro Ile Leu Phe Gly Ser Leu Arg Arg Gln Asn Met Ser
20 25 30
Leu Glu Met Trp Cys Arg
35
<210> 895
<211> 38
<212> PRT
<213> Homo sapiens
<400> 895
Arg Val Trp Ser Phe Leu Phe Leu Arg Gln Arg Ala Thr Ser Thr Ile
1 5 10 15
Thr Ile Ala Cys Thr Lys Glu Ser Leu Asn Ser Gln Asn Ser Ser Phe
20 25 30
Ile Phe Ser Leu Leu Ile
35
<210> 896
<211> 17
<212> PRT
<213> Homo sapiens
<400> 896
Lys Asp Gln Arg Ile Ile Lys Val Ala Pro Leu Val Glu Asp Lys Met
1 5 10 15
Ile
<210> 897
<211> 34
<212> PRT
<213> Homo sapiens
<400> 897
Ile Ala Gln Leu Met Lys Asp Gln Arg Ile Ile Lys Val Pro Gln Ile
1 5 10 15
Val Cys Gly Leu Arg Ile Val Leu Arg Lys Lys Arg Thr Val Phe Leu
20 25 30
Arg Gln
<210> 898
<211> 31
<212> PRT
<213> Homo sapiens
<400> 898
Ile Gln Asp Gln Asp Gln Glu Leu Ala Thr Val Leu Leu Gln Ser Ala
1 5 10 15
Leu Asp Cys Ile Phe Gly Val Glu Glu Met Ala Thr Lys Lys His
20 25 30
<210> 899
<211> 58
<212> PRT
<213> Homo sapiens
<400> 899
Pro Ser Leu Asn Leu Ile Ser His Gln Ser Ser Val Gly Cys Ser Lys
1 5 10 15
Gly Ile Trp Arg Ala Pro Glu Met Thr Leu Phe Ser Thr Pro Thr Phe
20 25 30
Ala Ala Ser Ser Pro Trp Ala Ser Met Ser Trp Val Ser Ser Gly Cys
35 40 45
Ser Leu Pro Leu Trp Ser Ser Ser Cys Cys
50 55
<210> 900
<211> 42
<212> PRT
<213> Homo sapiens
<400> 900
Cys Thr Leu Gly Gly Ser Val Thr Gln Lys Leu Lys Met Thr Ala Thr
1 5 10 15
Gly Val Pro Val Ile Pro Pro Leu Val Ile Ser Trp Trp Ala Gly Thr
20 25 30
Arg Ser Leu Trp Leu Leu Leu Pro Val Gly
35 40
<210> 901
<211> 40
<212> PRT
<213> Homo sapiens
<400> 901
Gly Gly Thr Gly Thr Asp Met Thr Thr Gln Lys Leu Met Met Val Pro
1 5 10 15
Asn Gln Cys Lys Leu Glu Leu Glu Leu Ser Leu Arg Asn Tyr Ala Leu
20 25 30
Glu Ser Ser Gln Val Pro Met Lys
35 40
<210> 902
<211> 28
<212> PRT
<213> Homo sapiens
<400> 902
Asn Leu Leu Gln Lys Glu Ile Pro Leu Leu Gln Leu Ser Leu Leu Thr
1 5 10 15
Asp Ser Lys Arg Asn His Gly His Pro Gln Leu Thr
20 25
<210> 903
<211> 23
<212> PRT
<213> Homo sapiens
<400> 903
Asn Val Leu Cys Lys Gln Gln Asn Gly Leu Pro Ala Pro Glu His Val
1 5 10 15
Gly Trp Glu Tyr Leu Thr Gly
20
<210> 904
<211> 17
<212> PRT
<213> Homo sapiens
<400> 904
Gly Lys Gly Met Lys Lys Ile Lys Lys Cys Leu His Ala Asn Gln Gln
1 5 10 15
Glu
<210> 905
<211> 18
<212> PRT
<213> Homo sapiens
<400> 905
Asn Asn Leu Cys Gln Arg Leu His Trp Arg Leu Arg His Val Ile Val
1 5 10 15
Leu Ile
<210> 906
<211> 13
<212> PRT
<213> Homo sapiens
<400> 906
Glu Gln Leu Phe Leu Lys Leu Gln Glu Ala Asn Gly Ile
1 5 10
<210> 907
<211> 27
<212> PRT
<213> Homo sapiens
<400> 907
Met Leu Thr Ala Leu Pro Pro Ala Met Thr Ala Met Cys Gly Tyr Gly
1 5 10 15
Ile Arg Gly Asn Pro Val Gln Gln Trp Asn Ile
20 25
<210> 908
<211> 19
<212> PRT
<213> Homo sapiens
<400> 908
Leu Asn Val Thr Cys Phe Val Ile Phe Arg Arg Val Arg Asn Glu Leu
1 5 10 15
Gln Lys Trp
<210> 909
<211> 28
<212> PRT
<213> Homo sapiens
<400> 909
Val Ile Met Ser Ile Thr Gly Lys Lys Glu Glu Ser Asn Arg Ser Lys
1 5 10 15
Ala Leu Ser Glu Ala Thr Pro Phe His Trp Ile Thr
20 25
<210> 910
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 910
Leu Ala Val Ser Ala Val Thr Gly Arg Ala Arg Ser Leu Gly Leu Ser
1 5 10 15
Lys Val Ser Ser Glu Pro Gly Leu Met Ser Thr
20 25
<210> 911
<211> 16
<212> PRT
<213> Homo sapiens
<400> 911
Leu Lys Thr Phe His Met Lys Cys Phe Leu Asn Leu Ser Gln Met Glu
1 5 10 15
<210> 912
<211> 8
<212> PRT
<213> Homo sapiens
<400> 912
Pro Asp Lys Lys Ser Arg Asn Cys
1 5
<210> 913
<211> 9
<212> PRT
<213> Homo sapiens
<400> 913
Asn Ile Arg Ala Arg Gln Glu Gly Asn
1 5
<210> 914
<211> 13
<212> PRT
<213> Homo sapiens
<400> 914
Leu Ser Asn Ile Arg Ala Arg Gln Glu Gly Lys Ser Gly
1 5 10
<210> 915
<211> 21
<212> PRT
<213> Homo sapiens
<400> 915
Ala Arg Gly Thr Ser Pro Ile Arg His Cys Ser His Ser Ser Ser Cys
1 5 10 15
Ser Gly Pro Ser Ser
20
<210> 916
<211> 20
<212> PRT
<213> Homo sapiens
<400> 916
Phe Arg Glu Lys Arg Asn Tyr Val Lys Lys Lys Ser Lys Leu Lys Lys
1 5 10 15
Lys Glu Lys Lys
20
<210> 917
<211> 22
<212> PRT
<213> Homo sapiens
<400> 917
Ser Arg Thr Ala Leu Ile Thr His Thr Leu Cys Cys Trp Leu Thr Trp
1 5 10 15
Ala Gln Val Ser Ala Phe
20
<210> 918
<211> 21
<212> PRT
<213> Homo sapiens
<400> 918
Arg Arg Arg Ser Leu Pro Cys Gly Trp Thr Leu Leu Tyr Leu Ser Ser
1 5 10 15
Ala Trp Arg Met Lys
20
<210> 919
<211> 9
<212> PRT
<213> Homo sapiens
<400> 919
Leu Arg Pro Pro Trp Pro Ser Trp Ser
1 5
<210> 920
<211> 18
<212> PRT
<213> Homo sapiens
<400> 920
Ile Gln Ala Ser Thr Ser Pro Ser Ser Gln His Gly Cys Met Arg Asp
1 5 10 15
Leu Pro
<210> 921
<211> 10
<212> PRT
<213> Homo sapiens
<400> 921
Glu Val Thr Arg Cys Cys Phe Phe His Lys
1 5 10
<210> 922
<211> 20
<212> PRT
<213> Homo sapiens
<400> 922
Ala Pro Ser Leu Thr Phe Ser Pro Ser Gly Leu Met Glu Ile Trp Ile
1 5 10 15
Ser Ala Ser Val
20
<210> 923
<211> 15
<212> PRT
<213> Homo sapiens
<400> 923
Val Ile Leu Gln Val Arg Ser Thr Ala Cys Glu Asn Ser Pro Lys
1 5 10 15
<210> 924
<211> 12
<212> PRT
<213> Homo sapiens
<400> 924
Ile Ser Lys Lys Cys Ser Leu Ser His Gln Glu Lys
1 5 10
<210> 925
<211> 18
<212> PRT
<213> Homo sapiens
<400> 925
Leu Arg Phe Leu Arg Thr Met Lys Gln Trp Pro Lys Phe Cys Ser Ala
1 5 10 15
Gly Ile
<210> 926
<211> 11
<212> PRT
<213> Homo sapiens
<400> 926
Thr Pro Leu Lys Asn Glu Asp Phe Ile Ser Cys
1 5 10
<210> 927
<211> 10
<212> PRT
<213> Homo sapiens
<400> 927
Trp Thr Cys Leu Lys Met Ser Ile Gly Ala
1 5 10
<210> 928
<211> 11
<212> PRT
<213> Homo sapiens
<400> 928
Asp Gly Trp Gly Ala Met Ala Leu Thr Arg Gly
1 5 10
<210> 929
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 929
Ala Trp Lys Ala Val Leu Val Glu Arg Gly Pro
1 5 10
<210> 930
<211> 16
<212> PRT
<213> Homo sapiens
<400> 930
Asn Ser Leu Gly Ile Ile Trp Pro Lys Ser Gly Leu Ile Leu Thr Ala
1 5 10 15
<210> 931
<211> 14
<212> PRT
<213> Homo sapiens
<400> 931
Pro Trp Lys Asn Ser Glu Ser Met Lys Lys Val Lys Cys Ile
1 5 10
<210> 932
<211> 12
<212> PRT
<213> Homo sapiens
<400> 932
Ile Tyr Ile Phe Cys Leu His Tyr Gly Thr Gln Leu
1 5 10
<210> 933
<211> 9
<212> PRT
<213> Homo sapiens
<400> 933
Phe Ser Lys Lys Ala Arg Lys Gln Ser
1 5
<210> 934
<211> 12
<212> PRT
<213> Homo sapiens
<400> 934
Gln Asn Lys Lys Val Met Ser Met Glu Met Ile Leu
1 5 10
<210> 935
<211> 10
<212> PRT
<213> Homo sapiens
<400> 935
Ser Gln Lys Thr Val Ser Ser Gly Lys Val
1 5 10
<210> 936
<211> 10
<212> PRT
<213> Homo sapiens
<400> 936
Tyr Ser Lys Lys Ala Lys Glu Arg Gln Asn
1 5 10
<210> 937
<211> 11
<212> PRT
<213> Homo sapiens
<400> 937
Ile Asn Lys Lys Thr Ser Arg Ile Phe Pro Ala
1 5 10
<210> 938
<211> 11
<212> PRT
<213> Homo sapiens
<400> 938
Leu Asn Lys Met Asn Ser Gly Trp Ser Leu Lys
1 5 10
<210> 939
<211> 9
<212> PRT
<213> Homo sapiens
<400> 939
Leu Ala Phe Phe Thr Thr Tyr Met Ala
1 5
<210> 940
<211> 10
<212> PRT
<213> Homo sapiens
<400> 940
Arg Ser Gln Gly Ala Gly Pro Val Ala Thr
1 5 10
<210> 941
<211> 11
<212> PRT
<213> Homo sapiens
<400> 941
Lys Val Lys Lys Gln Asp Pro Lys Pro Ile Asn
1 5 10
<210> 942
<211> 10
<212> PRT
<213> Homo sapiens
<400> 942
Leu Val Gly Gly Ala Gly His Gly Arg Trp
1 5 10
<210> 943
<211> 193
<212> PRT
<213> Homo sapiens
<400> 943
Ser Val Ser Cys Gly Ser Asn Thr Thr Thr Cys Ile Trp Leu Pro His
1 5 10 15
Pro Arg Arg Thr Arg Ala Cys Arg Trp Ser Phe Leu Ser Ser Ile Arg
20 25 30
Trp Cys Arg Cys Phe Pro Ser Thr Ser Arg Ser Trp Arg Arg Arg Ala
35 40 45
Ser Gly Thr Thr Leu Leu Ser Ser Thr Ser Cys Trp Thr Ser Ser Trp
50 55 60
Thr Ser Ala Thr Pro Arg Pro Pro Thr Ala Arg Ser Cys Arg Ser Thr
65 70 75 80
Ser Leu Arg Lys Ala Thr Ser Trp Lys Gln Gly Pro Arg Gly His Gln
85 90 95
Pro Pro Ser Pro Thr Arg Cys Pro Gly Gly Pro Lys Ala Ser Ser Ile
100 105 110
Gly Arg Met Arg Cys Ser Trp Thr Ser Ser Ser Leu Ser Thr Ser Trp
115 120 125
Val Asn Thr Gln Glu Trp Asp Gly Trp Val Thr Arg Ser Ala Pro Thr
130 135 140
Ala Met Ser Cys Ala Ala Arg Ser Trp Ala Pro Ser Arg Cys Glu Ser
145 150 155 160
Ser Ser Arg Ala Cys Pro Ser Cys Ala Trp Ala Ser Thr Thr Arg Ser
165 170 175
Ser Leu Thr Thr Arg Ala Ala Ala Lys Ala Asn Pro Trp Ser Trp Arg
180 185 190
Met
<210> 944
<211> 16
<212> PRT
<213> Homo sapiens
<400> 944
Ser Ser Ser Leu Ser Thr Ser Trp Ser Ala Pro Thr Ala Met Ser Cys
1 5 10 15
<210> 945
<211> 82
<212> PRT
<213> Homo sapiens
<400> 945
Arg Thr Pro Ala Ser Cys Val Arg Thr Leu Thr Trp Thr Trp Gln Trp
1 5 10 15
Ser Val Pro Ile Arg Glu Cys Ser Ser Thr Lys Ala Ser Val Ala Arg
20 25 30
Gln Pro Pro Gly Cys Ser Trp Arg Ser Arg Ser Thr Leu Ser Leu Ser
35 40 45
Gly Gly Ala Trp Ser Met Pro Arg Asn Gly Pro Trp Glu Thr Pro Ser
50 55 60
Met Ser Lys Gln Asn Arg Gly Leu Arg Leu Ile Lys Ser Ser Ser Thr
65 70 75 80
Lys Ser
<210> 946
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 946
Ser Ser Ser Arg Thr Pro Arg Arg Gln Arg Ser Ser Thr Thr Pro Pro
1 5 10 15
Ala Ser Ser Gly Thr Ser Ala Gln Pro Leu Arg Pro Leu Ala Arg Arg
20 25 30
Cys Gly Ser Ala Thr Gly Trp Trp Thr Pro Trp Ser Pro Leu Ser Thr
35 40 45
Thr Pro Trp Thr Arg Ala Asn Ala Arg Thr Arg Ala Trp Arg Thr Arg
50 55 60
Cys Ala Ser Cys Gly Thr Cys Pro Thr Ala Ser Thr Thr Arg Cys Arg
65 70 75 80
Arg Pro Arg Cys Ser Gly Trp Arg Val Ala Ala Ala Gly Thr Trp Arg
85 90 95
Gly Arg Arg Arg Glu Arg Ser Trp Ala Ala Ser Arg Arg Arg Ala Gly
100 105 110
Gly Cys Ala Ser Cys Pro Ser Pro Pro Met Arg Ser Pro Ser Arg Arg
115 120 125
Cys Pro Arg Thr Pro Arg Ala Ser Ser Gly Cys Gly Ala Pro Arg Ser
130 135 140
Trp Gly Cys Thr Thr Gly Cys Cys Ser Ala Ala Arg Pro Pro Gly Arg
145 150 155 160
Cys Arg Thr Ser Arg Gln Ala Thr Ala Gly Gly Arg Gly Cys
165 170
<210> 947
<211> 60
<212> PRT
<213> Homo sapiens
<400> 947
Gly Pro Ser Trp Thr Trp Gly Arg Ala Pro Arg Thr Glu Ser Ser Gln
1 5 10 15
Pro Arg Gly Ser Ser Ser Cys Ser Ala Arg Trp Cys Leu Gly Arg Cys
20 25 30
Cys Cys Ser Gly Asn Asp Gly Arg Thr Arg Ser Ser Gly Trp Met Pro
35 40 45
Gly Met Asn Met Lys Met Lys Thr Phe Met Lys Ala
50 55 60
<210> 948
<211> 163
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 948
Ser Leu Leu Val Trp Pro Val Gly Arg Asn Trp Gln Leu Ala Gly Pro
1 5 10 15
Leu Thr Pro Thr Arg Gly Leu Thr Arg Thr Thr His Pro Gly Val Pro
20 25 30
Arg Gly Ser Leu Met Thr Trp Pro Leu Thr Gly His Gln Arg Gly Ala
35 40 45
Trp Pro Pro Gly Leu Pro Pro Glu Pro Glu Val Pro Pro Ala Leu Glu
50 55 60
Cys Trp Asp Pro Thr Pro Gln Ser Pro Ser Trp Pro Leu Gln Phe Leu
65 70 75 80
Gly Pro Leu Ala Pro Ala His His Ser Gly Ser His Ser Glu Tyr Pro
85 90 95
Met Ser Ser Ser Gly Leu Pro Cys Ser Trp Trp Trp Thr Gln Ala Thr
100 105 110
Pro Ala Pro Thr Trp Thr Thr Ser Ser Arg Leu Ala Arg Ala Pro Arg
115 120 125
Ala Ser Cys Ala Ser Pro Pro Cys Ala Ala Arg Ala Ser Trp Trp Pro
130 135 140
Ser Arg Arg Trp Thr Cys Ala Ser Ser Arg Gly Ala Ser Cys Ser Ser
145 150 155 160
Thr Arg Trp
<210> 949
<211> 74
<212> PRT
<213> Homo sapiens
<400> 949
Met Asp Thr Leu Ala Leu His Asp Pro His Pro Met Ala Thr Ser Gly
1 5 10 15
Gly Leu Ser Leu His Pro Asp Pro Leu Pro Gly His Gln Phe Pro Leu
20 25 30
Glu Ala His Phe Glu Ala Leu Ser Leu Ser Lys Phe Thr Phe Ser Phe
35 40 45
Leu Leu Leu His Phe Pro Asn Ile Phe Ser Ile Pro Trp Thr Asn Gln
50 55 60
Arg Cys Cys Ser Ser Leu Gly Gln Arg Tyr
65 70
<210> 950
<211> 52
<212> PRT
<213> Homo sapiens
<400> 950
Asn Lys Glu Thr Phe Trp Cys Glu Arg Val Met Gly Asn Leu Val Asn
1 5 10 15
Met Ser Phe Leu Tyr Ile Leu Met Asp Arg Gly Asp Ile Leu Ser Tyr
20 25 30
Asn Met Leu Ile Thr Cys Ile Asp Ser Arg Ala Leu Gly Phe Gln Thr
35 40 45
Phe Leu Asn Leu
50
<210> 951
<211> 38
<212> PRT
<213> Homo sapiens
<400> 951
Cys His Pro Leu Trp Glu Gln Leu Asp Thr Glu Pro Thr Pro Arg Leu
1 5 10 15
Cys Ser Ala Arg Lys Glu Asn Gln Arg Trp Ser Leu Arg Pro Ala Ala
20 25 30
Arg Arg Pro Trp Arg Ser
35
<210> 952
<211> 58
<212> PRT
<213> Homo sapiens
<400> 952
Cys Tyr Leu His His Trp Asn Tyr Leu Ser Phe Leu Lys Gly Gln Ile
1 5 10 15
Ile Arg Glu Met Ser Phe His Leu Leu Asn Tyr Arg Thr Ser Asn Ile
20 25 30
Ser His Gln Trp Ile Arg Leu His Phe Gln Lys Ala Leu Glu Ile Lys
35 40 45
His Ile Ser Lys Gly Val His Arg Val Gly
50 55
<210> 953
<211> 103
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 953
Trp Cys Ser Pro Asp Ser Ser Ser Ser Pro Arg Thr Arg Ser Ser Gly
1 5 10 15
Cys Pro Ser Tyr Ala Gly Arg Arg Pro Thr Gln Ser Leu Ser Gln Pro
20 25 30
Gly Trp Cys Pro Leu Ser Arg Pro Ser Trp Pro Pro Leu Pro Ala Thr
35 40 45
Ser Ser Pro Pro Pro Ala Ser Thr Ser Leu Met Thr Asn Thr Gly Cys
50 55 60
Pro Leu Pro Thr Arg Asn Leu Leu Cys Pro Cys Ser Ser Val Thr Gly
65 70 75 80
Thr Ser Thr Arg Ser Lys Gly Met Glu Gly Thr Thr Glu Arg Pro Glu
85 90 95
Pro Arg Ala Ala Arg Gly Pro
100
<210> 954
<211> 64
<212> PRT
<213> Homo sapiens
<400> 954
His Leu Leu Pro Cys Leu Glu Lys Gln Glu Cys His Leu Leu Leu Pro
1 5 10 15
Leu Phe Leu Val Val Leu Glu Ser Leu His Leu Leu His Phe Pro Glu
20 25 30
Ala Leu Ala Phe Leu His Leu His Pro Glu Trp Val Cys Leu His Leu
35 40 45
Pro His Leu Asp Leu Glu Phe Leu Gln Pro Gln Phe Cys His Leu Asp
50 55 60
<210> 955
<211> 45
<212> PRT
<213> Homo sapiens
<400> 955
His Ala Gly Ala Cys Thr Glu Glu Ile Ala Ile Leu Met Arg Leu Thr
1 5 10 15
Ser Pro Asn Ala Ser Val Leu Ala Ala Thr Pro Glu Asn Ile Val Lys
20 25 30
Trp Arg Phe Gln Lys Ala Ser Leu Gln Glu Gln Pro Gln
35 40 45
<210> 956
<211> 41
<212> PRT
<213> Homo sapiens
<400> 956
Trp Ile Gln Leu Asp Phe Asp Phe Arg Leu Met Arg Lys Glu Asn Pro
1 5 10 15
Lys Leu His Thr Trp Cys Ser Trp Arg Ser Leu Lys Lys Lys Asp Ser
20 25 30
Trp His His Ile Glu Gly Gly Phe Gln
35 40
<210> 957
<211> 14
<212> PRT
<213> Homo sapiens
<400> 957
Ile Gln Leu Asp Phe Asp Phe Arg Glu Trp Leu Met Cys Cys
1 5 10
<210> 958
<211> 78
<212> PRT
<213> Homo sapiens
<400> 958
Ala Asp Phe Thr Glu Pro Gly Gln Ala Ile Ser Pro His Pro Thr Leu
1 5 10 15
Glu Leu Ser Pro Ala Thr Ser Asn Pro His Pro Leu Gly Pro Gln Ile
20 25 30
Trp Pro Pro Gly Leu Pro Pro Ser His Met Leu Pro Ser Pro His Leu
35 40 45
Ala Thr Arg Val Ser Arg Leu Thr Cys Asp Ile Phe Pro Met Glu Glu
50 55 60
Ser Trp Asp Leu Gln Leu Ala Ile Met Asp Cys Ser Asp Phe
65 70 75
<210> 959
<211> 74
<212> PRT
<213> Homo sapiens
<400> 959
Arg Trp Leu Pro Gly Gly Gly Ser Pro Trp Thr Ser Arg Arg Gly Pro
1 5 10 15
Pro Trp Ser Ser Thr Thr Pro Cys Thr Gln Gly Val Arg Glu Gly Thr
20 25 30
Ala Ser Gly Lys Thr Arg Gly Glu Ala Met Gly Ser Gly Gln Ala Thr
35 40 45
Val Thr Ser Met Ser Pro Gly Pro Pro Cys Arg Gly Ser Gly Ala Ser
50 55 60
Ser Phe Ile Arg His Thr Gly Asn Pro Pro
65 70
<210> 960
<211> 49
<212> PRT
<213> Homo sapiens
<400> 960
Pro Gln Gln Arg Ala Pro Leu Val Glu Leu Lys Ile Leu Ala Arg Gly
1 5 10 15
Ser His Ser Ser Arg Pro Gly Ser His Pro Arg Arg His Ile Gln Ser
20 25 30
Gln Leu Ser Gln Ala Leu Glu Leu Gly Gln Pro Ser Thr Asp Phe Ile
35 40 45
Leu
<210> 961
<211> 45
<212> PRT
<213> Homo sapiens
<400> 961
Val Gly Pro Lys Lys Gly Ala Arg His Arg Trp Pro Val Pro Ala Pro
1 5 10 15
Leu Leu Ser Ala Ser Ala Ser Thr Ser Leu Pro Ser Pro Ser Ser Cys
20 25 30
Pro His Thr Leu Phe Arg Lys Asn Pro Leu Trp Arg Cys
35 40 45
<210> 962
<211> 56
<212> PRT
<213> Homo sapiens
<400> 962
Ala Thr Met Thr His Pro Arg Thr Ala Thr Ser Leu Asp Ile Met Thr
1 5 10 15
Cys Leu Gln Tyr Gly Ile Pro His His Leu His Phe Asp Ala Arg Thr
20 25 30
Val Glu Glu Pro Gly Trp Tyr Gly Arg Gly Gln His Thr Trp Leu Leu
35 40 45
Leu Leu Lys Ala Gly Asp Arg Ala
50 55
<210> 963
<211> 78
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 963
Ala Gln Gly Ser Val Met Ile Ser Ser Pro Ala Ser Ser Gln Arg Trp
1 5 10 15
Pro Pro Pro Arg Trp Met Ser Ser Glu Val Thr Arg Leu Trp Ser Ser
20 25 30
Ser Gly Ala Gly Lys Ser Glu Thr Cys Gly Ser Cys Ala Arg Ser Ile
35 40 45
Ser Gly Arg Gln Ser Pro Ser Pro Ala Ala Cys Trp Met Ala Trp Leu
50 55 60
Arg His Arg Leu Arg Ala Gly Ala Gly Cys Gly Gln Val Pro
65 70 75
<210> 964
<211> 59
<212> PRT
<213> Homo sapiens
<400> 964
Asn Met Arg Glu Phe Ile Leu Gly Arg Asn Arg Thr Asp Val Met Asn
1 5 10 15
Val Val Arg Thr Ser Leu Glu Ile Gln Thr Trp Gln Ile Ile Thr Glu
20 25 30
Ser Ile Leu Glu Arg Asn Arg Thr Asp Glu Met Cys Val Val Arg Ser
35 40 45
Leu Val Ile Ile His Thr Leu His Ser Met Arg
50 55
<210> 965
<211> 34
<212> PRT
<213> Homo sapiens
<400> 965
Leu Glu Ile Arg Gln Leu Ser Ser Lys Ser Leu Trp Arg Val Gly Pro
1 5 10 15
Lys Thr Arg Val Leu Asn Ser Ser Lys Pro Pro Leu Ser Gln Ile Pro
20 25 30
Leu Arg
<210> 966
<211> 24
<212> PRT
<213> Homo sapiens
<400> 966
Leu Trp Thr Ile Arg Asn Tyr Leu Leu His Lys Leu Leu Lys Leu Phe
1 5 10 15
Arg Ile Tyr Asn Ser Gly Asp Phe
20
<210> 967
<211> 23
<212> PRT
<213> Homo sapiens
<400> 967
Ser Gln Gly Ser Gln Asn Phe Ala Leu Thr Lys His His Trp Leu Ile
1 5 10 15
Leu Glu Ser Ile Cys Ala Lys
20
<210> 968
<211> 59
<212> PRT
<213> Homo sapiens
<400> 968
His Pro Thr Thr Trp Asn Ala Cys Pro Trp Gly Gln Leu Pro Thr Gly
1 5 10 15
Glu Gln Ile Arg Pro Gly Arg His Pro Pro Leu Arg Pro Gln Arg Pro
20 25 30
Ser Pro Arg Pro Arg Leu Leu Thr Met Pro Thr Gly Leu Gln Ser Arg
35 40 45
Leu Phe Ser Ala Glu Lys Thr Pro Leu Pro Leu
50 55
<210> 969
<211> 24
<212> PRT
<213> Homo sapiens
<400> 969
Asn Ser Pro Phe Gly Ser Ser Cys Leu Gln Thr Ser Asn Asn Asn Met
1 5 10 15
Glu Lys Val Thr Leu Lys Lys Val
20
<210> 970
<211> 34
<212> PRT
<213> Homo sapiens
<400> 970
Ile Ser Phe Arg Val Leu Ala Ser Ser Trp Tyr Ala Ser Leu Pro Ser
1 5 10 15
Pro Ser Cys Asn Leu Trp Met Pro Ser Thr Lys Ile Arg Leu Phe Thr
20 25 30
Ala Ile
<210> 971
<211> 27
<212> PRT
<213> Homo sapiens
<400> 971
Ser Leu Phe Leu Pro Gly Ser Thr Pro Ser Leu His Phe Leu Cys Trp
1 5 10 15
Ser Leu Arg Ser Ser Gly Gly Cys Arg Ser Ala
20 25
<210> 972
<211> 30
<212> PRT
<213> Homo sapiens
<400> 972
Leu Glu Ser Leu Pro Ala Phe Leu Arg Cys His Leu Lys Thr Glu Val
1 5 10 15
Pro Cys Gly Leu Trp Leu Arg Ser Met Gly Glu Ile Ala Ser
20 25 30
<210> 973
<211> 38
<212> PRT
<213> Homo sapiens
<400> 973
Val Gly Glu Leu Cys Gly Gly Ser Glu Pro Gln Thr Gln Ser Trp Cys
1 5 10 15
Val Gln Leu Gly Val Gly Met Gly Leu Lys Lys Pro Ser Cys Trp Cys
20 25 30
Trp Thr Leu Met Trp Thr
35
<210> 974
<211> 35
<212> PRT
<213> Homo sapiens
<400> 974
Arg Arg Arg Thr Pro Thr Ala Met Gly Arg Asn His Ser Cys Thr Ser
1 5 10 15
Arg Ser Pro Ser Ser Ser Trp Met Ser Ser Glu Ser Trp Arg Ser Arg
20 25 30
Thr Cys Arg
35
<210> 975
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 975
His Trp Ser Pro Ser Pro Leu His His His Ala His Cys Leu Pro Thr
1 5 10 15
Pro Glu Trp Pro Arg Ala Trp Val Leu Gln Gln Tyr Pro His
20 25 30
<210> 976
<211> 20
<212> PRT
<213> Homo sapiens
<400> 976
His His His Arg Arg Ala Pro Gly Gln Gly Ser Ala Thr Ala Ser Pro
1 5 10 15
Ala Arg Cys Thr
20
<210> 977
<211> 29
<212> PRT
<213> Homo sapiens
<400> 977
Trp Ser Arg Ser Trp Arg Ser Ser Arg Cys Pro Cys Cys Gly Trp Ser
1 5 10 15
Thr Thr Ala Arg Pro Ala Cys Ser Met Arg Leu Thr Ser
20 25
<210> 978
<211> 19
<212> PRT
<213> Homo sapiens
<400> 978
Asn Gly Asn Pro Val Gln Glu Ser Pro Gln His Gln Met Ile Gln Asp
1 5 10 15
Ala Gln Gly
<210> 979
<211> 22
<212> PRT
<213> Homo sapiens
<400> 979
Cys Pro Met Met Asn Phe Leu Arg Tyr Tyr Leu Arg Leu Lys Ile Pro
1 5 10 15
Leu Gly Cys Asn Leu Thr
20
<210> 980
<211> 26
<212> PRT
<213> Homo sapiens
<400> 980
Leu Thr Lys Leu Met Val Trp Leu Gln Tyr Gly Gln Ala Gly Lys Ile
1 5 10 15
Arg Phe Thr Val Leu Leu Phe Pro Pro Cys
20 25
<210> 981
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 981
Ala Ser Thr Ser Ser Val Thr Ala Ser Cys Ala Ser Thr Thr Ser Arg
1 5 10 15
Gly Met Trp Asn
20
<210> 982
<211> 27
<212> PRT
<213> Homo sapiens
<400> 982
Leu Ala Arg Ser Ser Leu Ser Leu Glu Ala Asn Ser Pro Tyr Leu Gly
1 5 10 15
Val Trp Arg Pro Pro Leu Arg Met Gly Leu Trp
20 25
<210> 983
<211> 27
<212> PRT
<213> Homo sapiens
<400> 983
Leu Gly Gly Gly Cys Ile Thr Leu Ala His Val Cys Gln Ala Trp Pro
1 5 10 15
Val Tyr Gly Leu His Leu Thr Asp Leu Phe Val
20 25
<210> 984
<211> 18
<212> PRT
<213> Homo sapiens
<400> 984
Leu Ser Arg Asn Ser Thr Leu Leu Ile Glu Glu Asn Leu His His Ser
1 5 10 15
Lys Asn
<210> 985
<211> 14
<212> PRT
<213> Homo sapiens
<400> 985
Asn Thr Gly Pro Arg Lys Asn Arg Ser Gly Lys Lys Trp Lys
1 5 10
<210> 986
<211> 11
<212> PRT
<213> Homo sapiens
<400> 986
Pro Pro Val Trp Ser Arg Cys Gly Arg Arg Cys
1 5 10
<210> 987
<211> 15
<212> PRT
<213> Homo sapiens
<400> 987
Leu Ser Leu Pro Glu Thr Ala Leu Lys Gln Tyr Ala Cys Thr Val
1 5 10 15
<210> 988
<211> 21
<212> PRT
<213> Homo sapiens
<400> 988
Gln Leu Asp Leu Leu Leu Pro Ser Glu Tyr Tyr Met Phe Pro Ala Trp
1 5 10 15
Gly Ser Val Phe Trp
20
<210> 989
<211> 13
<212> PRT
<213> Homo sapiens
<400> 989
Ser Met Lys Lys Ile Glu Ser Trp Thr Ser Leu His Pro
1 5 10
<210> 990
<211> 10
<212> PRT
<213> Homo sapiens
<400> 990
Ser Leu Phe Arg Glu Thr Gln Ser Asn Arg
1 5 10
<210> 991
<211> 21
<212> PRT
<213> Homo sapiens
<400> 991
Leu Thr Ser Ser Cys Gly Ser Trp Ile Ala Tyr Cys Cys Cys Phe Lys
1 5 10 15
Gly Lys Ser Val Leu
20
<210> 992
<211> 13
<212> PRT
<213> Homo sapiens
<400> 992
Pro Phe Leu Pro Ile Gln Lys Ala Ala Ser Gly Arg Gly
1 5 10
<210> 993
<211> 13
<212> PRT
<213> Homo sapiens
<400> 993
Ser Asp Ala Pro Leu Glu Ala Leu Thr Gly Gln Gly Met
1 5 10
<210> 994
<211> 10
<212> PRT
<213> Homo sapiens
<400> 994
Lys Lys Lys Lys Arg Thr Arg Ile Ile Met
1 5 10
<210> 995
<211> 10
<212> PRT
<213> Homo sapiens
<400> 995
Arg Met Lys Lys Val Ile Ile Lys Trp Ala
1 5 10
<210> 996
<211> 11
<212> PRT
<213> Homo sapiens
<400> 996
Ile Asn Glu Lys Arg Leu Thr Cys Ser Ile Leu
1 5 10
<210> 997
<211> 19
<212> PRT
<213> Homo sapiens
<400> 997
Ala Thr Ser Thr Pro Gly Arg Leu Ser Ser Ser Pro Arg Cys Pro Gly
1 5 10 15
Asn Gly Gly
<210> 998
<211> 15
<212> PRT
<213> Homo sapiens
<400> 998
Asn Val Gly Arg Pro Leu Asp Thr Val Gln Pro Leu Lys Cys Ile
1 5 10 15
<210> 999
<211> 10
<212> PRT
<213> Homo sapiens
<400> 999
Asp Glu Lys Lys Arg Glu Lys Val Ile Ser
1 5 10
<210> 1000
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1000
Ser Asn Lys Lys Trp Lys Lys Met Lys Arg Ser
1 5 10
<210> 1001
<211> 8
<212> PRT
<213> Homo sapiens
<400> 1001
Thr Met Lys Lys Ile Val Met Tyr
1 5
<210> 1002
<211> 21
<212> PRT
<213> Homo sapiens
<400> 1002
Gly Gly Gly Thr Gln Asp Ser Val Trp Gln Ala Cys Arg Lys Ser Gln
1 5 10 15
Val Pro Leu Leu Ser
20
<210> 1003
<211> 12
<212> PRT
<213> Homo sapiens
<400> 1003
Phe Ser Pro Pro Pro Ala Ala Cys Ser Pro Ala Lys
1 5 10
<210> 1004
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1004
Thr Val Gln Lys Met Gln Asn Thr Cys Val
1 5 10
<210> 1005
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1005
Asn Pro Lys Lys Asp Gln Leu Leu Lys Asp Phe
1 5 10
<210> 1006
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1006
Arg Met Gly Gly Ser Gln Leu Ser Arg Ile
1 5 10
<210> 1007
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1007
Thr Asn Lys Lys Gln Leu Met Arg Lys Lys Ser
1 5 10
<210> 1008
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1008
Glu Leu Lys Lys Ile Thr Val Asn Tyr Leu Gln
1 5 10
<210> 1009
<211> 13
<212> PRT
<213> Homo sapiens
<400> 1009
Phe Ile Glu Lys Asn Ser Lys Met Thr Gln Ile Ile Gln
1 5 10
<210> 1010
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1010
Glu Ala Lys Glu Val Phe Pro Lys Met Leu
1 5 10
<210> 1011
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1011
Arg Val Leu Ala Thr His Pro Gln Ala Thr
1 5 10
<210> 1012
<211> 8
<212> PRT
<213> Homo sapiens
<400> 1012
Ala Ala Gly Gly Thr Gly Arg Arg
1 5
<210> 1013
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1013
Ala Gln Pro Gly Ser Gly Leu Glu Thr Cys
1 5 10
<210> 1014
<211> 13
<212> PRT
<213> Homo sapiens
<400> 1014
Lys Gly Lys Lys Ala Ile Gln Arg Gln Ser Gln Met Arg
1 5 10
<210> 1015
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1015
Cys Trp Ser Pro Leu Gln Pro Arg Ala Arg Gln Arg Gln Thr Arg Cys
1 5 10 15
Gln Val Arg Pro Pro Pro Gly Pro Pro Cys Leu Pro Leu Ala Lys Arg
20 25 30
Ser Arg Ser Pro Arg
35
<210> 1016
<211> 34
<212> PRT
<213> Homo sapiens
<400> 1016
Arg Arg Ser Cys Leu Pro His Gln Leu His Pro Trp Gly Pro Ser Cys
1 5 10 15
Leu Leu Cys Leu Gly Thr Ile Val Pro Leu Pro Cys Ala Pro Ser Ser
20 25 30
Pro Gly
<210> 1017
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1017
Pro Gly Ala Leu Leu Asn Pro Ser Arg Gly
1 5 10
<210> 1018
<211> 13
<212> PRT
<213> Homo sapiens
<400> 1018
Cys His Pro His His Pro Gln Val Pro His His Pro Leu
1 5 10
<210> 1019
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1019
Leu Gly Leu Asn Met Lys Arg Asn Ser Lys Pro
1 5 10
<210> 1020
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1020
Glu Pro Lys Lys Ser Leu Ile Pro Leu Ser Gly
1 5 10
<210> 1021
<211> 9
<212> PRT
<213> Homo sapiens
<400> 1021
Gly Trp His Trp Ala Phe Arg Lys Glu
1 5
<210> 1022
<211> 49
<212> PRT
<213> Homo sapiens
<400> 1022
Gly Lys Thr Ser Thr Pro Leu Thr Ser Ile Ser Pro Arg Trp Pro Ser
1 5 10 15
Leu Leu Thr Cys Ser Trp Leu Gly Trp His Trp Ala Phe Arg Lys Gly
20 25 30
Ser Pro Arg Arg Cys Trp Ala Cys Val Gln Ala Gln Arg Trp Cys Gly
35 40 45
Trp
<210> 1023
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1023
Val Asn Phe Val Lys Ile Leu Met Ile Gln
1 5 10
<210> 1024
<211> 38
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1024
Gly Ser Gly Ser Ala Pro Cys Arg Arg Val Arg Gly Pro Ala Ser Pro
1 5 10 15
Met Gly Met Arg Arg Arg Ala Gln Pro Ser Ala Ser Thr Arg Arg Cys
20 25 30
Ser Ala Cys Ser Thr Ser
35
<210> 1025
<211> 42
<212> PRT
<213> Homo sapiens
<400> 1025
Ala Leu Ser Val Tyr Gln Phe Phe Ile Pro Gln Arg Glu Val Lys Ile
1 5 10 15
Ser Thr Ile Ile Leu Pro Ser Asn Lys Pro Phe Lys Pro Leu Thr Lys
20 25 30
Arg Ile Leu Val Leu Leu Gly Ser Ile Lys
35 40
<210> 1026
<211> 34
<212> PRT
<213> Homo sapiens
<400> 1026
Ala Arg Pro Ala Arg Pro Cys Pro Thr Gly His Ser Leu Val Gln Met
1 5 10 15
Glu Pro Leu Thr Thr Ala Arg Pro Thr Ser Ser Ser Thr Thr Cys Pro
20 25 30
Arg Thr
<210> 1027
<211> 18
<212> PRT
<213> Homo sapiens
<400> 1027
Ala Thr Arg Met Pro Glu Pro His Arg Ala Leu Pro Thr Arg Val Pro
1 5 10 15
Phe Pro
<210> 1028
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1028
Ser Leu Val Met Lys Gly Gln Ile Pro Val Arg
1 5 10
<210> 1029
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1029
Tyr Tyr Lys Tyr Val Thr Asn Ala Cys Leu
1 5 10
<210> 1030
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1030
Ser Leu Pro Pro Ala Pro Leu Leu His Glu
1 5 10
<210> 1031
<211> 24
<212> PRT
<213> Homo sapiens
<400> 1031
Ile Leu Thr Met Arg Gln Trp Leu Lys Asn Arg Ser Leu Glu Arg Thr
1 5 10 15
His Leu Leu Ile Ile Gln Asn Ile
20
<210> 1032
<211> 14
<212> PRT
<213> Homo sapiens
<400> 1032
Thr Pro Trp Ser Thr Thr Arg Pro Thr Thr Pro Trp Leu Thr
1 5 10
<210> 1033
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1033
Leu Thr Ile Lys Ile Thr Ser Thr Phe Ile Ser
1 5 10
<210> 1034
<211> 15
<212> PRT
<213> Homo sapiens
<400> 1034
Arg Arg Pro Cys Thr His Ser Gly Ser Thr Thr Arg Ser His Ser
1 5 10 15
<210> 1035
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1035
Val Ile Glu Lys Asn Leu Met Val Gly Gly
1 5 10
<210> 1036
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1036
Thr Ala Glu Lys Arg Ile Lys Met Ser Thr
1 5 10
<210> 1037
<211> 55
<212> PRT
<213> Homo sapiens
<400> 1037
Thr Pro Met Asp Ser His Arg Ser Ser Gln Asp Lys Thr Leu Thr His
1 5 10 15
Pro Ser Met Glu Thr Thr Arg Arg Arg Val Pro His Pro Thr Met Thr
20 25 30
Thr Arg Thr Ser Leu Pro Pro Thr Gly Met Thr Arg Ala Ser Asp Arg
35 40 45
Pro Ser Ser Ala Arg Cys Ser
50 55
<210> 1038
<211> 42
<212> PRT
<213> Homo sapiens
<400> 1038
Leu Ser Thr Val Thr Thr His Trp Ser Ser Gly Trp Thr Leu Cys Trp
1 5 10 15
Ala Leu Pro Lys Arg Ala Ser Asn Trp Thr Ser Arg Thr Ser Arg Gln
20 25 30
Trp Ala Pro Pro Trp Thr Ser Cys Gly Ser
35 40
<210> 1039
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1039
Leu Pro Gln Pro Cys Gly Pro Ala Ser Cys Ser Thr Pro Ser Trp Pro
1 5 10 15
Met Ala Val Pro Thr Ser Arg Ser Cys Met Ala Arg Ser Pro Arg Pro
20 25 30
Ser Ala Cys Gln Leu Pro Arg
35
<210> 1040
<211> 28
<212> PRT
<213> Homo sapiens
<400> 1040
Val Val Asn Leu Gly His Ser Cys Cys Leu Asp Pro Glu Thr Arg Leu
1 5 10 15
Leu Arg Cys Gly Met Ser Val Leu Ala Cys Ala Leu
20 25
<210> 1041
<211> 23
<212> PRT
<213> Homo sapiens
<400> 1041
Leu Leu His Phe Leu Glu Lys Ser Pro Leu Glu Glu Trp Asn Gln Trp
1 5 10 15
Val Met His Leu Cys Trp His
20
<210> 1042
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1042
Arg Ile Ser Leu Phe Leu Gly Ser His Pro Phe Arg Ala Arg Ile Leu
1 5 10 15
Cys Leu Thr Pro Cys Lys Pro Arg Ser Ser
20 25
<210> 1043
<211> 17
<212> PRT
<213> Homo sapiens
<400> 1043
Asn Leu Trp Leu Ile Val Leu Thr Gln Leu Val Leu Asn Leu Val Gln
1 5 10 15
Glu
<210> 1044
<211> 16
<212> PRT
<213> Homo sapiens
<400> 1044
Pro Thr Thr Gln His Met Thr Thr Ser Ala Gly Ser Leu Ser Pro Thr
1 5 10 15
<210> 1045
<211> 16
<212> PRT
<213> Homo sapiens
<400> 1045
Leu Leu Lys Arg Thr Ile Gln Met Pro Pro Ala Ser Pro Ala Ser Ser
1 5 10 15
<210> 1046
<211> 13
<212> PRT
<213> Homo sapiens
<400> 1046
Arg Glu Arg Phe Leu Ser Asn Arg Met Lys Trp Lys Tyr
1 5 10
<210> 1047
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1047
Lys Pro Ile Phe Leu Asn Arg Tyr Leu Leu Gln
1 5 10
<210> 1048
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1048
His Asn Pro Phe Leu Ala Ser Cys Arg Trp
1 5 10
<210> 1049
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1049
Gln Cys Pro Ser Cys Met Pro Ser Gly Thr
1 5 10
<210> 1050
<211> 9
<212> PRT
<213> Homo sapiens
<400> 1050
Glu Thr Ala Pro His Leu His Leu Leu
1 5
<210> 1051
<211> 58
<212> PRT
<213> Homo sapiens
<400> 1051
Pro Gln Trp Cys Gly Trp Val Arg Tyr Glu Gly Pro Arg Ala Glu Pro
1 5 10 15
Trp Ala Lys Glu His Pro Leu Val Leu Thr Leu Gln Pro Gln Ala Gly
20 25 30
Thr Leu Tyr Ile Phe Thr Asp Lys Ser Lys Asn Leu Tyr Ser Leu Cys
35 40 45
Gly Ser Thr Leu Val Ser Leu Gln Val Ser
50 55
<210> 1052
<211> 74
<212> PRT
<213> Homo sapiens
<400> 1052
Cys Ser Gln Arg Arg Trp Ile His Leu Met Arg Tyr Ala Thr Ala Phe
1 5 10 15
Leu Cys Asn Ser Val Asp Asn Met Ile Ser Gln Cys Leu Gln Phe Glu
20 25 30
Cys Phe Leu Lys Cys Arg Lys Leu Val Leu Thr Pro Met Pro Leu Leu
35 40 45
Met Val Ile Ile Ile Arg Leu Phe Trp Lys Val Pro Gly Leu Gln Glu
50 55 60
Val Val Val Ala Ile Phe Phe Gly Gln Lys
65 70
<210> 1053
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1053
Arg Gly Ala Ala Leu Ala Ile Ser Met Gly Val Arg Val Met Trp Ala
1 5 10 15
Ser Phe Lys His Ser Thr Leu Ala Leu Ala Val Cys His Ile Ile Ser
20 25 30
Arg Ile Thr Leu Gly Leu Ser Leu Gln Gly Val Leu Ser Thr Asn Ser
35 40 45
Ser Lys Ser Ser Ser
50
<210> 1054
<211> 84
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1054
Arg Arg Ser Cys Pro Thr Leu Arg Ala Cys Ala Asn Ser Trp Ser Thr
1 5 10 15
Trp Leu Ser Leu Trp Ser His Arg Pro Pro Pro Gly Ala Ser Ser Gly
20 25 30
Trp Ala Gly Pro Ala Ala Thr Ser Ser Leu Glu Ala Ser Gly Met Pro
35 40 45
Pro Ser Ser Pro Ser Met Ala Ser Leu Cys Trp Ser Thr Val Ala Gln
50 55 60
Thr Pro Ser Pro Val Ser Gly Ser Trp Cys Gly Thr Trp Thr Ala Trp
65 70 75 80
Met Pro Cys Trp
<210> 1055
<211> 54
<212> PRT
<213> Homo sapiens
<400> 1055
Glu Lys Ser Val Lys Glu Ile Lys Cys Phe Leu Thr Met Asn Leu Asn
1 5 10 15
Ile Ala Lys Val Leu Leu Lys Thr Lys Val Tyr Phe Met Tyr Leu Thr
20 25 30
Ser Leu Ser Lys Asn Pro Lys Ile Phe Met His Arg Asn Leu Lys Gln
35 40 45
Lys Trp His Leu Gly Ile
50
<210> 1056
<211> 51
<212> PRT
<213> Homo sapiens
<400> 1056
Arg Arg Lys Ser Trp Lys Met Lys Ser Pro Val Asp Thr Val Leu Ser
1 5 10 15
Lys Glu Asn Gln Ile Cys Lys Val Lys Thr Ile Leu Ala Pro Ala Pro
20 25 30
His Ala Leu Ser Leu Pro Arg Pro Gln Pro Phe Phe Arg Ala Ile Asp
35 40 45
Lys Asp Arg
50
<210> 1057
<211> 41
<212> PRT
<213> Homo sapiens
<400> 1057
Ser Arg Leu Ser Pro Pro Glu Ala Ala Phe Gln Arg Met Leu Ala Met
1 5 10 15
Glu Leu Arg Ser Pro Asp His Pro Arg Ala Glu Tyr Pro Asp Phe Ser
20 25 30
Pro Ser Pro Gly Pro Val Ala Gly Leu
35 40
<210> 1058
<211> 38
<212> PRT
<213> Homo sapiens
<400> 1058
Pro Arg Pro Leu Pro Gly Leu Pro Ala Pro Pro Gln Arg Ser Ser Trp
1 5 10 15
Met Gly Ser Ser Cys Ser Ser Cys Gly Thr Arg Pro Met Ser Ser Trp
20 25 30
Leu Cys Ala Trp Gly Glu
35
<210> 1059
<211> 15
<212> PRT
<213> Homo sapiens
<400> 1059
Ser Trp Met Gly Ser Ser Cys Ser Cys Gly Thr Arg Pro Met Ser
1 5 10 15
<210> 1060
<211> 34
<212> PRT
<213> Homo sapiens
<400> 1060
Asn Trp Ile Leu Val Asn Leu Phe Ser Gly Thr Ser Lys Ala Pro Phe
1 5 10 15
Leu Cys Gly Gly Ile Asp Gln Thr Ser Gln Pro Ser Ala Gly Pro Arg
20 25 30
Gly Thr
<210> 1061
<211> 28
<212> PRT
<213> Homo sapiens
<400> 1061
Val Gly Arg Ser Gly Trp Gly Val Pro Ala Ser Cys Thr Ala Ala Pro
1 5 10 15
Pro Thr Ser Arg Trp Met Ser Trp Gln Asp Cys Ser
20 25
<210> 1062
<211> 30
<212> PRT
<213> Homo sapiens
<400> 1062
Ser Ala Gly Val Leu Arg Gly Ser Lys Arg Thr Gly Pro Ala Cys Met
1 5 10 15
Pro Thr Lys Arg Arg Thr Val Met Lys Ser Thr Trp Arg Ser
20 25 30
<210> 1063
<211> 25
<212> PRT
<213> Homo sapiens
<400> 1063
Ile Trp Trp Ile Val Gln Asn Ser Phe Leu Leu Pro Phe Arg Met Ser
1 5 10 15
Ser Phe Pro Lys Lys Phe Phe Phe Leu
20 25
<210> 1064
<211> 24
<212> PRT
<213> Homo sapiens
<400> 1064
Ala Asn Ser Lys Leu Ser Ser Ser Leu Leu Leu Arg Lys His Ser Cys
1 5 10 15
Gly Gln Lys His Leu Thr Ser Cys
20
<210> 1065
<211> 21
<212> PRT
<213> Homo sapiens
<400> 1065
Ile Ser Ser Trp Gln Val Leu Phe Met Asn Ile Gln Glu Asp Ile Leu
1 5 10 15
Ser Leu Leu Ser Gln
20
<210> 1066
<211> 17
<212> PRT
<213> Homo sapiens
<400> 1066
Leu Glu Trp Gln Ala Leu Asp Tyr Ser Arg Ser Trp Leu Trp Thr Asp
1 5 10 15
Thr
<210> 1067
<211> 12
<212> PRT
<213> Homo sapiens
<400> 1067
Leu Leu Arg Gln Gly Lys Cys Gln Ser Ala Trp Ser
1 5 10
<210> 1068
<211> 83
<212> PRT
<213> Homo sapiens
<400> 1068
Pro Arg Ser Tyr Met Pro Thr Leu Cys Ala Ala Ser Thr Met Pro Trp
1 5 10 15
Gln Lys Thr Phe Pro Ser Asn His Trp Cys Arg Trp Gln Pro Gly Ala
20 25 30
Leu Gly Ser Met Gly Thr Ser Cys Trp Gln Gly Thr Ala Arg Arg Leu
35 40 45
Ser Pro Phe Arg Trp Thr Lys Arg Lys Cys Trp His Cys Trp Lys Arg
50 55 60
Cys Cys Ser Pro Thr Cys Pro Cys Gln Pro Leu Glu Asp Met Pro Ser
65 70 75 80
Gln Pro Ser
<210> 1069
<211> 46
<212> PRT
<213> Homo sapiens
<400> 1069
Gln Leu Ala Leu Lys His Gln Leu Arg His Pro Leu His Pro Pro His
1 5 10 15
Leu Val Pro Lys Leu Gln Arg Arg Gln Phe Leu Ala Lys Gln Gly Gln
20 25 30
Trp Gly Pro Pro Arg Ala Arg Glu Lys Leu Thr Ser Ser Gln
35 40 45
<210> 1070
<211> 61
<212> PRT
<213> Homo sapiens
<400> 1070
His Pro Val Arg Pro Pro Pro Pro Asn Val Arg Ala Trp Val Gly Gln
1 5 10 15
Gln Pro Pro Met Pro Leu Gly Arg Pro Leu Gly Leu Glu Gly Gln Gly
20 25 30
Ala Arg Leu Ile Pro Pro Val Ser Leu Lys Gly Phe Trp Asp Pro Arg
35 40 45
Pro Thr Gly Lys Gly Leu Glu Gly Gly Arg His Arg Thr
50 55 60
<210> 1071
<211> 42
<212> PRT
<213> Homo sapiens
<400> 1071
Ala Ser Pro Arg Arg Pro Arg Arg Ala Leu Arg Gly Pro Val Arg Ala
1 5 10 15
Arg Thr Pro Arg Gly Ser Ser Ser Met Arg Ser Leu Ser Met Thr Ser
20 25 30
Leu His Ser Ala Leu Thr Gln Ser Leu Ser
35 40
<210> 1072
<211> 57
<212> PRT
<213> Homo sapiens
<400> 1072
Glu Ala Pro Ser Thr Arg Ala Ala Pro Pro Ser Leu Arg Ala Ala Arg
1 5 10 15
Ala His Gln Arg Thr Gly Arg Gln His Pro Pro Pro Ala Lys His Ser
20 25 30
Ser Ser Gln Cys Thr Gln Gly Arg Arg Trp Gly Ala Trp His Pro Gly
35 40 45
Ser Trp Pro Val Ala Gln Arg Met Gly
50 55
<210> 1073
<211> 30
<212> PRT
<213> Homo sapiens
<400> 1073
Arg Pro Trp Asn Ser Ser Thr Arg Gly Cys Cys Arg Pro Val Gly Arg
1 5 10 15
Pro Arg Pro Arg Gly Gly Trp Val Trp Trp Ala Pro Arg Ala
20 25 30
<210> 1074
<211> 25
<212> PRT
<213> Homo sapiens
<400> 1074
Leu Thr Pro Val Glu Lys Leu Arg Arg Lys Ile Ser Glu Leu Leu Leu
1 5 10 15
Gly Asn Asn Met Gln Pro Asn Ser Ile
20 25
<210> 1075
<211> 22
<212> PRT
<213> Homo sapiens
<400> 1075
Leu Ala Pro Pro Asp Trp Pro Gly Ile Trp Met Asp Ser Cys Arg Arg
1 5 10 15
Pro Ala Pro Gln Asp Cys
20
<210> 1076
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> modified Homo sapiens FSP
<400> 1076
Arg Pro Cys Ser Ser Cys Trp Gly Leu Val Leu Pro Thr Cys Leu Leu
1 5 10 15
Ala Ser Trp Gln Pro Gly Gly Cys Arg
20 25
<210> 1077
<211> 24
<212> PRT
<213> Homo sapiens
<400> 1077
Ala Thr Pro Val Ala Asn Val Ser Ala Gly Ala Pro Thr Ser Ile Ala
1 5 10 15
Thr Ser Leu Phe Thr Ile Pro Ser
20
<210> 1078
<211> 17
<212> PRT
<213> Homo sapiens
<400> 1078
Arg Pro Ala Ser Ser Trp Cys Ser Pro Ser Arg Ser Val Pro Ser Ala
1 5 10 15
Ser
<210> 1079
<211> 19
<212> PRT
<213> Homo sapiens
<400> 1079
Arg Ser Ile Phe Arg Gly His Arg Ser Trp Asp Leu Pro Ile Ile Val
1 5 10 15
Asn Leu Ser
<210> 1080
<211> 10
<212> PRT
<213> Homo sapiens
<400> 1080
Glu Ser Glu Lys Asn Trp Trp Lys Asn Leu
1 5 10
<210> 1081
<211> 14
<212> PRT
<213> Homo sapiens
<400> 1081
Asp Ile Thr Ile Thr Leu Glu Leu Arg Thr Ile Trp Ile Val
1 5 10
<210> 1082
<211> 11
<212> PRT
<213> Homo sapiens
<400> 1082
Pro Gln Pro Pro Gly Cys Cys Pro Trp Pro Ala
1 5 10
<210> 1083
<211> 13
<212> PRT
<213> Homo sapiens
<400> 1083
Arg Ser Phe Phe Pro Lys Ser Ser Pro Leu Phe Arg Met
1 5 10
<210> 1084
<211> 13
<212> PRT
<213> Homo sapiens
<400> 1084
Leu Leu Gly Gly Cys Ser Gly Leu Pro Trp Pro Arg Arg
1 5 10
<210> 1085
<211> 9
<212> PRT
<213> Homo sapiens
<400> 1085
Arg Cys Pro Pro Arg Trp Ser Pro Cys
1 5
<210> 1086
<211> 8
<212> PRT
<213> Homo sapiens
<400> 1086
Thr Leu Arg Phe Leu His Leu Ser
1 5
<210> 1087
<211> 83
<212> PRT
<213> Homo sapiens
<400> 1087
His Pro Gln Val Cys Pro Leu Arg Gly Ser Gln Leu Gln Arg Thr Glu
1 5 10 15
Gln Gly Glu Asp His Pro Leu His Pro Leu Ser Arg Gln His Arg Ala
20 25 30
Leu Val Val Gly Glu Leu Gly Pro Gln Ala Trp Pro Gln Leu Leu Leu
35 40 45
Glu Pro Asn Ser Gly Lys Ser Ala Ser Arg Arg Arg Pro Gln Gly Gly
50 55 60
Pro Gln Pro Pro Lys Leu Arg Val Val Glu Ala Glu Val Gly Asp Ser
65 70 75 80
Trp Lys Arg
<210> 1088
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 1A
<400> 1088
Thr Glu Ile Gln Leu Thr Met Asn Asp Ser Lys His Lys Leu Glu Ser
1 5 10 15
Pro Ala Leu Lys Gln Val Ser Pro Ala Ser Pro Pro Thr Gln Gln Pro
20 25 30
Gln Thr Pro Gln Asp Ser Arg Gln Val Leu Ala Leu Ala Lys Lys Thr
35 40 45
Leu Thr Asn Ala Ser Arg Ala Gly Gln Phe Pro Val Trp Arg Arg Thr
50 55 60
Ser Arg Gly Met Ser Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro
65 70 75 80
Leu Arg Cys Pro Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn
85 90 95
Gly Trp His Arg Ser Gly Leu Arg Ala Gln Met Pro Ser Ser Trp Ser
100 105 110
Ser Ser Gly Arg Thr Leu Lys Leu Ala Pro Leu Gln Val Thr Thr Thr
115 120 125
Leu Lys Leu Ile Leu Val Met Leu Glu Ile Val Thr Glu Arg Ser Leu
130 135 140
Leu Tyr Ser Arg Met Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu
145 150 155 160
Pro Asp Tyr Phe Val Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln
165 170 175
Ser Phe Pro Val Gly Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys
180 185 190
Cys Ser Cys Thr Ser His Ser Asn Pro Trp Ser Gln Ser Asn Gln Gln
195 200 205
Leu Lys Trp Thr Pro His Ile Leu Lys Ser Ala Ser Phe Asp Lys Lys
210 215 220
Gly Phe Val Ile Leu Ser Arg Arg Ser Lys Ile Glu Ala Ser Pro Ile
225 230 235 240
Gly Ser Ile Ala Ser Ser Pro Gly His Pro Leu Gly Pro Thr Leu Ala
245 250 255
Ile Arg Phe Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val Thr Ala
260 265 270
Ala Pro Ser Gly Gln Tyr Phe Ile Ala Lys Lys Arg Ile Lys Leu Arg
275 280 285
Arg Asn Asn Met Gly Gly Asn Arg Ser Ile Cys Leu Thr Arg Lys Arg
290 295 300
Lys Arg Glu Lys Arg Ser Gln Lys Ser Arg Gln Asn His Leu Gln Leu
305 310 315 320
Lys Ser Cys Arg Arg Lys Ile Ser Asn Trp Ser Lys Leu Arg Ser Pro
325 330 335
Trp Ile Phe Thr Lys Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu
340 345 350
Ala Ile Thr Leu Ile Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys
355 360 365
His Pro His Arg Arg Pro Gly Trp Lys Gly His His Arg Val Val Phe
370 375 380
Ser His His Pro Ser Gly Ser Thr Lys Ser His Trp Gln Gln Arg Glu
385 390 395 400
Arg Gly Gly Gly Arg Arg Glu Lys Lys Gly Cys Arg Glu Gln Arg Lys
405 410 415
Val Val Lys Asn Pro Ser Gln Pro Val Pro Leu Arg Asn Asp Gly Ile
420 425 430
Thr Asn Gly Asn Asp Ser Thr Arg Ser Cys Ser Ile Ser Leu Lys Lys
435 440 445
Ser Leu Glu Lys Met Pro Leu Met Arg Arg Ala Arg Pro Thr Ser Cys
450 455 460
Ser Thr Cys Arg Met Trp Trp Lys Gly Lys Lys Arg Arg Lys Glu Ile
465 470 475 480
Val Pro Met Ser Leu Ala Cys Ser Ile Thr Val Ser Phe Val Gly Gln
485 490 495
Ile Ser Thr Leu Val Leu Asp Val Ser Ser Ile Ser His Trp Arg Leu
500 505 510
Pro Cys Lys Val Thr Glu Ser Ser Ser Ser Phe Phe Tyr Thr Ser Asp
515 520 525
Arg Thr Pro Leu Ser Ile Ser Arg Pro Thr Ser Arg Ala Arg Gln Ser
530 535 540
Cys Cys Leu Pro Gly Leu Thr His Pro Ala His Gln Pro Leu Gly Ser
545 550 555 560
Met Ser Thr Arg Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro
565 570 575
Gly Pro Trp Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser
580 585 590
Lys Leu Arg Leu Arg Asn Thr Ser Pro Gly Glu Lys Asn Asp Leu Gln
595 600 605
Leu Phe Val Met Ser Asp Thr Thr Tyr Lys Ile Tyr Trp Thr Val Ile
610 615 620
Leu Leu Asn Pro Cys Gly Asn Leu His Leu Lys Thr Thr Ser Leu Gln
625 630 635 640
Arg Pro Pro Arg Ser Ile Leu Ser Leu Asn Gly Ile Trp Glu Val Met
645 650 655
Pro Arg Thr Leu Glu Gly Cys Ile Ser Val Lys Asp His Arg Thr Ser
660 665 670
Gln Asn His Ser Lys Cys Ile Thr Glu Cys Val Arg Thr Ala Leu Asn
675 680 685
Val Ser Lys Lys Arg Leu Pro Lys Leu Met Lys Lys Lys Asp Ser Thr
690 695 700
Ile Phe Ile Asn Lys Val Arg Gln Asn Phe Lys Arg Asn Phe Lys Lys
705 710 715 720
Lys Lys Pro Leu Thr Phe Ser Pro Ser Arg Arg Met Thr Arg Arg Thr
725 730 735
Met Thr Thr Thr Lys Met Met Met Met Arg Arg Thr Lys Arg Arg Arg
740 745 750
Arg Lys Arg Arg Arg Met Thr Met Met Thr Arg Arg Thr Leu Leu Thr
755 760 765
Lys Lys Thr Cys Leu Thr Pro Arg Thr Ser Ala Ala Thr Lys Ala Leu
770 775 780
Pro Arg Gln Thr Ile Ser Gln Arg Arg Pro Ile Gln Thr Pro Pro Gly
785 790 795 800
Thr Ser Leu Ala Ile Trp Gly Arg Thr Arg Leu Thr Leu Thr Gly Thr
805 810 815
Arg Ser Ser Gly Thr Arg Ala Ser Pro Ser Ala Val Cys Leu Cys Cys
820 825 830
Trp Thr Cys Pro Ser Arg Ser Phe Pro Ala Ala Ser Pro Ser Gly Leu
835 840 845
Arg Ala Pro Val Gly Ala Gln Ala Pro Pro Glu Val Thr Leu Arg Ala
850 855 860
Ser Cys Ala Ser Ser Ala Ser Lys Ala Cys Ala Gly Leu Trp Pro Trp
865 870 875 880
Gly Ala Gln Val Arg Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys
885 890 895
Val Pro Val Ala Glu Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly Ala
900 905 910
Ala Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro Cys Arg Gln Leu Pro
915 920 925
Ala Ser Ser Pro Thr Lys Cys Glu Ile Cys Val Lys Arg Arg Arg Arg
930 935 940
Arg Lys Arg Ser Ser Gln Ser Arg Ser Pro Val Pro Lys Lys Arg Glu
945 950 955 960
Arg Met Met Leu Pro Val Arg Ala Arg Thr Ala Arg Ser Ala Leu Pro
965 970 975
Gln Gly Arg Ala Pro Leu Glu Gly Met Leu Leu Pro Arg Ala Leu Pro
980 985 990
Ser Leu Leu Ser Arg Met Pro Ala Arg Arg Glu Ser Arg Phe Trp Leu
995 1000 1005
Ala Leu Gln Ala Leu Gly Leu Arg Pro Pro His Leu Pro Ser Cys
1010 1015 1020
His Pro Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro His Gln Ala
1025 1030 1035
Pro Met Thr Leu Lys Ala Leu Val Lys Thr Trp Thr Gln Phe Arg
1040 1045 1050
Asn Tyr Pro Arg Ala Asp Lys Lys Asn Val Arg Ser Thr Ala Phe
1055 1060 1065
Phe Leu Leu Asp Ile Ile Leu Gly Asp Cys Pro Arg Thr Met Ala
1070 1075 1080
Gly Pro Ser Ala Ser Leu His Pro Ala Ser Gly Arg Ala Ser Arg
1085 1090 1095
Lys Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg Ala Gly Gly Pro
1100 1105 1110
Ala Gly Trp Ala Arg Gln Ala Tyr Pro Arg Leu Lys Thr Phe Gly
1115 1120 1125
Val Pro Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser Leu Ser Thr
1130 1135 1140
Met Met Ile Ile Ser Thr Thr Arg Gln Glu Cys Gly Arg Arg Ala
1145 1150 1155
Ser Val Pro Cys Arg Pro Met Ile Gly Ser Ala Arg Pro Gly Pro
1160 1165 1170
Trp Arg Thr Ser Ala Met Pro Ser Ala Met Gly Val Ala Leu Pro
1175 1180 1185
Thr Ser Cys Glu Ser Gly Arg Ser Pro Pro Ala Thr Gly Gly Arg
1190 1195 1200
Met Pro Gly Ser Gln Ser Ile Met Met Ser Trp Met Pro Pro Leu
1205 1210 1215
Ala Pro Cys Ala Ala Cys Pro Cys Ser Pro Ala Pro Thr Leu Cys
1220 1225 1230
Pro Ala His Pro Ala Arg Ala Pro Thr Ala Val Pro Ala Phe Thr
1235 1240 1245
Pro Leu Ser Ala His Pro Val Pro Val Leu Ser Gly Cys His Leu
1250 1255 1260
Ala Val Arg Thr Ser Met Leu Thr Leu Leu Pro Met Glu Ala Lys
1265 1270 1275
Lys Ser Met Lys Arg Ser Asn Ala Lys Lys Met Glu Asp Met Ile
1280 1285 1290
Trp Glu Ser Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro
1295 1300 1305
Leu His Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg
1310 1315 1320
Ile Val Phe Phe Leu Ala Pro Tyr Phe Pro Arg His Pro His Arg
1325 1330 1335
Ser Pro Pro Thr Ser Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu
1340 1345 1350
Pro Arg Ala Ser Leu Arg Ala Thr Val Pro Arg His Ser Ser Val
1355 1360 1365
Leu Ala Thr Gly Leu His Leu His Arg Gln Ile Ser Leu Pro Leu
1370 1375 1380
Arg Gly Phe Leu Leu His Gln Pro Leu Pro Gly Gln His Leu Trp
1385 1390 1395
Leu Ser His Arg Leu Arg Leu Arg Leu Pro Arg Thr Gln Pro Ser
1400 1405 1410
Leu Pro Gly Pro Cys Ala Ser Leu Leu Ser Thr Leu Ser Gln Pro
1415 1420 1425
Pro Pro Gln Ala Pro Ser Gln Val Trp Thr Ala Ala Thr Leu Arg
1430 1435 1440
Cys Pro Ala Val Pro Ala Ala Ala Cys Pro Pro Ala Leu Arg Ser
1445 1450 1455
Met Pro Lys Ser Arg Asn Gln Val Leu Phe Arg Arg Asn Leu Thr
1460 1465 1470
Pro Ser Gln Leu Arg Thr Leu Ala Pro Pro Tyr Met Leu Leu Pro
1475 1480 1485
Gln Ser Leu Ser Gln Ser Leu Ser Arg Lys Gln Ile Pro Ser Gln
1490 1495 1500
Ser Met Leu Val
1505
<210> 1089
<211> 1501
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 2A
<400> 1089
Arg Lys Met Gln Ser Leu Asn His Pro Ser Arg Leu Thr Asn Gly Ser
1 5 10 15
Pro Pro Leu His Leu Cys Gln Pro Leu Arg Met Ser Arg Thr Pro Pro
20 25 30
Arg Arg Val Cys Ala Ala Pro Pro His Arg Leu Leu Gly Pro Ser Arg
35 40 45
Trp Asn Pro Arg Arg Lys Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln
50 55 60
Lys Pro Ser Gln Lys Asn His Leu Tyr Gly Gly Lys Lys Arg Ser Lys
65 70 75 80
Phe Ser Arg Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys Lys Val
85 90 95
Lys Val Leu Phe Lys Ala Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly
100 105 110
Arg Cys Ser Leu Met Glu Gln Ile Pro His Leu Lys Ser Arg Arg Lys
115 120 125
Trp Gln Ile Arg His Val Leu Lys Asn Leu Trp Leu Pro Met Arg Ser
130 135 140
Leu Gly Glu Pro Trp Arg Ala Gly Phe Gln Trp Gly Glu Ser Pro Trp
145 150 155 160
Gln Val Met Ala Ser Leu Thr Gly Arg Ala Thr Phe Leu Leu Ala Leu
165 170 175
Trp Glu Cys Ser Leu Pro Gln Ala Arg Leu Cys Leu Ile Val Ser Arg
180 185 190
Thr Leu Leu Leu Val Gln Ser Arg Asn Lys Lys Thr Lys Leu Trp Phe
195 200 205
Ser Leu Ile Asn Ile His His Arg Lys Asn Pro Leu Leu Pro Met Arg
210 215 220
Trp Trp Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys Lys
225 230 235 240
Val Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys Gly
245 250 255
Ile Cys Trp Lys Trp Pro Val Thr Val Ala Ala Ile Arg Met Cys Ala
260 265 270
Leu Ser His Pro Ser Phe Tyr Ile Ser Ser Thr Val Cys Phe Leu Ser
275 280 285
Lys His Cys Met Thr Ala Cys Thr Arg Lys Arg Met Lys Thr Gly Ala
290 295 300
Ile Gln Glu Lys Gly Ala Ile Gln Glu Lys Gly Ala Met Thr Lys Arg
305 310 315 320
Ile Cys Val Val Asn Phe Glu Ala Cys Arg Glu Met Glu Ser Leu Ser
325 330 335
Ala Pro Glu Lys Ile Thr Leu Phe Glu Ala His Met Ala Arg Cys Thr
340 345 350
Ser Ile Asn Val Leu Cys Val Arg Ala Ser Leu Ile Glu Lys Leu Met
355 360 365
Lys Glu Lys Arg Lys Met Lys Arg Asn Gln Val Ala Ser Pro Gln Ile
370 375 380
Met Gln Arg Leu Phe Ile Lys Gly Tyr Gln Asn Asn His Phe Thr Phe
385 390 395 400
His Leu Gln Asn Phe Ala Phe Phe Ser Ser Phe Gly Asn Asn Lys Tyr
405 410 415
Ile Asn Ile Leu Thr Ile Leu Phe His Val Arg Asn Ile Val Tyr Gly
420 425 430
Ile Gln Val Met Leu Cys Ala Ser Pro Gln Ile Met Gln Arg Thr Ser
435 440 445
Ala Asp Arg Phe Arg Met Lys Arg Arg Met Gln Asn Leu Asp Asn Leu
450 455 460
Gly Val Pro Trp Pro Leu Leu Pro Gly Ile Pro Ser Leu Asn Ala Gln
465 470 475 480
Trp Met Phe Leu Arg Ile Ala Ser Pro Gln Ile Met Gln Arg Met Ser
485 490 495
Ala Val Asn Phe Glu Thr Ile Arg Ala Arg Asn Arg Asn Met Lys Lys
500 505 510
Thr Met Ser His Leu Ile Ala His Gln Ala Leu Lys Met Ser Gly Leu
515 520 525
Arg Leu Phe His Pro Arg Leu Leu Thr Arg Lys Lys Pro Gly Lys Leu
530 535 540
Leu Leu Ala His Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys Gly
545 550 555 560
Glu Cys Val Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile Leu
565 570 575
Lys Gln Pro Leu Asp Leu Lys Ile Ser Lys Thr Phe Met Gly His Arg
580 585 590
Glu Gly Ser Glu Ser Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro
595 600 605
Pro Tyr Pro Ile Ser Glu Gly Leu Thr Met Thr Thr Gly Arg Asn Ile
610 615 620
Asn Ser Asn Ser Leu Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu
625 630 635 640
Cys His His Ala Ile Met His Arg Lys Met Thr Ser Pro His Phe Arg
645 650 655
Leu Phe Ser Ser Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala
660 665 670
Leu Cys Lys Phe Arg Ala Phe Ile His Thr Pro Arg Ser Pro Gly Cys
675 680 685
Ser Val Tyr Ala Asn Met Cys Trp Pro Lys Phe Phe Leu Thr Phe Ser
690 695 700
Gln Gln Trp Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln Glu Arg
705 710 715 720
Gly Cys Ser Ser Trp Leu Met Lys Gln Thr Trp Met Lys Ser Trp Ser
725 730 735
Leu Arg Asp Pro Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser Thr Arg
740 745 750
Val Leu Trp Met Pro Thr Ser Thr Val Leu Gln Ala His Pro Gln Val
755 760 765
Pro Ala Leu Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg Gly Pro Leu
770 775 780
Thr Ser Ala Pro Ser Ala Gln Gln Ser Leu Thr Arg Glu Lys Ile Ile
785 790 795 800
Asn Pro Thr Ile Ser Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Ile
805 810 815
Tyr Pro Pro Ser Thr Cys Ser Leu Pro Cys Arg Gly Phe Leu Pro Ser
820 825 830
Arg Phe Pro Trp Gly Pro Pro Pro Leu Asn Ser Val Ile Val His Lys
835 840 845
Ile Val Leu Val Phe Leu Lys Ser Leu Ser Ser Tyr Asn Cys Glu Arg
850 855 860
Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile Glu Phe Ala Val Leu Lys
865 870 875 880
Leu Leu Asn Met Asp Leu Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr
885 890 895
Ser Pro Leu Trp Lys Ile Thr Met Val Leu Thr Tyr Pro Asn Cys Val
900 905 910
Val His Val Leu Met Phe Gly Ala Leu Arg Ala Thr Ala Pro Ala Thr
915 920 925
Ala Ala Pro Gln Ala Gln Thr Pro His Trp Arg Ala Ala Thr Thr Ser
930 935 940
Ser Met Ser Ser Ser Pro Arg Ala Glu Pro Thr Ser Ser Ser Ser Trp
945 950 955 960
Ala Thr Cys Trp Pro Arg Cys Cys Ser Ser Ser Cys Tyr Trp Ser Leu
965 970 975
Ser Ser Trp Pro Pro Ala Gly Ala Ala Glu Ala Thr Asn Thr Arg Thr
980 985 990
Arg Ser Arg Glu Ser Gln Arg Gly Arg Met Leu Thr Trp Arg Ser Ser
995 1000 1005
Leu Trp Leu Gln Gly Thr Arg Cys Phe Thr Gly Val Arg Thr Ser
1010 1015 1020
Ser Arg Tyr Lys Lys Arg Gly Val Ile Ala Trp Arg Arg Gln Ile
1025 1030 1035
Asn Arg Arg Lys Leu Gln Arg Lys Lys His Trp Asn Ser Ala Tyr
1040 1045 1050
Leu Gly Arg Thr Leu Leu Val Thr Cys Ile Leu Tyr His Arg Trp
1055 1060 1065
Ile Val Thr Ser Met Cys Gln Ser Gln Arg Trp Leu Thr Ser Thr
1070 1075 1080
Thr Ser Arg Ser Ser Ala Leu Met Trp Thr Glu Leu Ser Leu Glu
1085 1090 1095
Pro Trp Ile Pro Tyr Leu His Gln Gln Lys Thr Gln Arg Thr Leu
1100 1105 1110
Glu Ser Ala Gly Leu Phe Pro Trp Leu His Thr Gln Cys Gln Glu
1115 1120 1125
Lys Lys Ser Arg Lys Leu Met Ser Ser Cys Thr His Pro Cys Thr
1130 1135 1140
Met Leu Leu Pro Gln Gly Cys His Pro Ala Trp Leu Ser Pro Ile
1145 1150 1155
Ser Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe His Val Leu Ala
1160 1165 1170
Leu Glu Val Thr Phe Pro Pro Gly Thr Ala Met Pro Gln Met Gln
1175 1180 1185
Leu Gln Ala Leu Ala Met Trp Glu Lys Gly Trp Asp Lys Pro Gly
1190 1195 1200
Thr Ser Leu Gln Cys Tyr Leu Asn Arg Arg Arg Asn Ser Arg Lys
1205 1210 1215
Gln Ser Gln Val Gln Leu Ala Ile Gln Val Leu Leu Val Asp Lys
1220 1225 1230
His Lys Tyr Phe Leu Phe Gly Gln Lys Lys Gly His Met Ile Phe
1235 1240 1245
Ser Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile Phe Asn Ser Arg
1250 1255 1260
Lys Lys Leu Leu Glu Asp Met Lys Gln Asn Gly Phe Thr Gly Lys
1265 1270 1275
Gly Leu Thr His Pro Val Pro Leu Lys Arg Thr Leu Gln Asn Lys
1280 1285 1290
Arg Asn Lys Asn Ile Lys Arg Val Asn Gln Lys Lys Gly Asn Ile
1295 1300 1305
Lys Arg Lys Ser Ile Leu Leu His Leu Ile Val Leu Asn Ser Pro
1310 1315 1320
Glu Ser Asn Leu Ile Leu Ile Gln His Gly Gly Ile Phe Thr Phe
1325 1330 1335
Arg Phe Trp Val Glu Lys Leu Ser Trp Asn Ile Cys Lys Asn Leu
1340 1345 1350
Ser Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu Leu Tyr Val Tyr
1355 1360 1365
Ile Ile Glu Thr Asn Val Phe Val Leu Asn Leu Phe His Val Pro
1370 1375 1380
Val Asn Gln Ile Phe Met Met Ala Phe Tyr Leu Lys Tyr Thr Glu
1385 1390 1395
Lys Ala Trp Val Met Glu Leu Glu Trp Leu Ile Gln Gln Gln Cys
1400 1405 1410
Tyr Gln Gly Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys
1415 1420 1425
Gly Thr Pro Arg Gly Asp Trp Lys Arg His Pro Pro Arg Arg Ala
1430 1435 1440
Phe Trp Lys Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr
1445 1450 1455
Gly Cys Trp Leu Glu Lys Lys Ala Thr Trp Met Arg Arg Thr Arg
1460 1465 1470
Arg Lys Lys Arg Glu Asp His Cys Gly Leu Arg His Pro Ser Trp
1475 1480 1485
Pro Trp Thr Arg Cys Leu Arg Met Arg Pro Pro Arg Ser
1490 1495 1500
<210> 1090
<211> 1506
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 3A
<400> 1090
Gly Ala Ala Ala Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr
1 5 10 15
Thr Pro Ser Ser Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln
20 25 30
Ser Lys Lys Thr Met Thr Ala Ala Gly Leu Thr Pro Met Ile Arg Lys
35 40 45
Ile Gln Lys Arg Arg Arg Thr Ala Asn Arg Cys Leu Arg Val Arg Cys
50 55 60
Gly Gly Trp Leu Cys Gly Trp Thr Pro Arg Gly Gln Asn Thr Arg Ser
65 70 75 80
Thr Asn Leu Glu Lys Asn Pro Ser Leu Lys Lys Gln Ser Gln Arg Arg
85 90 95
Gly Lys Leu Ser Ser Leu Phe Phe Ser His Cys Leu Cys Arg Asn Ser
100 105 110
Arg Arg Ala Thr Pro Thr Ser Lys Gly Ser Leu Arg Arg Lys Tyr Leu
115 120 125
Arg Val Pro Ile Pro Pro His Leu Arg His Pro Leu Leu Leu Met Asp
130 135 140
Leu Asp Gly Met Leu Thr Val Ile Gly Gln Gly Leu Val Gly Met Thr
145 150 155 160
Pro Arg Asp Leu Gly Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg
165 170 175
Pro Ile Gln Val Gln Thr Gly Gly Arg Leu Thr Pro Pro Pro Leu Ile
180 185 190
Leu Trp Pro Gln Ala Ala Pro Val Asp Pro Pro Gly Ser Val Trp Ile
195 200 205
Leu Pro Cys Lys Asn Lys Lys Arg Arg Lys Leu Arg Pro Lys Arg Leu
210 215 220
Asp Phe His Pro Arg Ser Ser Ser Gly Val Ser Val Ile Thr Met Lys
225 230 235 240
Leu Trp Glu Lys His Phe Lys Gly Leu Asn Trp Asn Leu Val Val Trp
245 250 255
Ile Leu Asn Leu Lys Met Met Asn Ile Glu Ile Thr Pro Gln Arg Ser
260 265 270
Lys Ala Arg Lys Ser Gly Val Met Lys Cys Trp Asp Leu Cys Pro Ser
275 280 285
Glu Lys Lys Arg Lys Leu Pro Leu Pro Leu Thr Phe Ser Thr Leu Leu
290 295 300
Trp Asp Ser Arg His Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp Ser
305 310 315 320
Arg Ser Phe Phe Thr Ser Ala His Pro Ser Arg Pro Cys Arg Met Arg
325 330 335
Leu Tyr Gln Phe Leu Ile His Leu Arg Lys Val Asp Thr His His Leu
340 345 350
Gln Val Val Thr Lys Thr Val Thr Ala Thr Thr Ala Asp Gly Gln Arg
355 360 365
Met Arg Arg Leu Lys Cys Lys Ala Cys Arg Leu Arg Trp Ala Arg Pro
370 375 380
Glu Pro Ala Ala Gln Ala Pro Pro Lys Ser His Phe Pro Pro His Pro
385 390 395 400
Ser Gly Pro Ser Arg Thr Ser Ser Leu Gln Leu Arg Ser Ile Pro His
405 410 415
Val Pro Lys Ala Thr Ala Ala His Ser Val Thr Val Lys Leu Gln Lys
420 425 430
Gly Lys Asn Ser Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn Gln
435 440 445
Gly His Leu Leu Met Ile Leu Leu His Asn Thr Tyr Met Glu Met His
450 455 460
Tyr Gly His Gln Ala Pro Gln Val Ala Met Leu Pro Lys Leu Leu Cys
465 470 475 480
Arg Gln Met Leu Pro Thr Leu Ser Thr Leu Gln Gln Arg His Pro Gln
485 490 495
Gly Pro Cys Pro Pro Pro Val Thr Pro Leu Arg Val Gln Ser Val Leu
500 505 510
Leu Leu Gly Val Pro Gln Thr Ala Ala Arg Gln Pro Ser Arg Pro Thr
515 520 525
Gly Arg Thr Pro Thr Thr Arg Leu Met Ala Pro Val Gly Ser Val Met
530 535 540
Ser Cys Ser Leu Leu Thr Gln Pro Ser Pro Ala Ser Ala Cys Thr Met
545 550 555 560
Pro Pro Leu Leu His Pro Gln Trp Ala Pro His Ser Ala Gly Leu Ser
565 570 575
Pro Gly Ala Cys Arg Pro Ala Cys Thr Cys Ile Ser Met Thr Thr Ile
580 585 590
Ser Arg Ala Thr Trp Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser
595 600 605
Phe Ser Arg Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn Ser Arg
610 615 620
Arg Asn Arg Arg Tyr Arg Lys Ile Tyr Gly Glu Leu Lys Met Ser Leu
625 630 635 640
Gln Ala Val Ala Pro Arg Cys Pro Arg Ser Ala Val Asp Ile Ser Pro
645 650 655
Gly Pro Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser Val Ala Ile Gly
660 665 670
Lys Leu Ala Leu Leu Gly Ala Ser Ala Pro Cys Gly Ala Ala Gly Ala
675 680 685
Arg Glu Ala Gly Arg Phe Ala Val Leu Gly Thr Met Val Met Lys His
690 695 700
Leu Asn Arg Lys Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu Thr
705 710 715 720
Met Met Met Ser Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile Pro
725 730 735
Leu Pro Ser Pro Arg Gln His Leu Leu Pro Gln Tyr Pro Leu His Pro
740 745 750
Pro Pro Pro Cys Leu Leu Leu Leu His His Arg His His Leu Ala Phe
755 760 765
Leu Glu Met Ala Cys Ser Ser Gln His Thr His Ser Ile Lys Ile Trp
770 775 780
Ile Ser Phe Ser His Glu Gln Ser Ser Pro Phe Leu Ala Arg Ser Trp
785 790 795 800
Asn Thr Met Gln Trp Asn Asn Lys Lys Met Ala Met Thr Val Ile Ala
805 810 815
Gly Ala His His Cys Gln Tyr Lys Leu Thr Tyr Thr Lys Val Trp Lys
820 825 830
Met Asn Trp Lys Lys Met Met Ile Gly Ser Gln His Leu Leu Phe Ser
835 840 845
Pro Leu Asp Ser Ser Pro Leu Gln Leu Leu Leu His Pro His Gly Lys
850 855 860
Arg Cys Asn Pro Cys Cys Arg Leu Thr Trp Met Ser Met Leu Gln Lys
865 870 875 880
Gln Cys Cys Tyr Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile
885 890 895
Asn Leu Arg Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser Leu
900 905 910
Gly Phe Leu Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys
915 920 925
Leu Leu Met Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr Lys Arg Glu
930 935 940
Trp Glu Lys Arg Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr Lys Glu
945 950 955 960
Tyr Phe Leu Lys Arg Ile Leu Ile Arg Lys Ala Met Thr Val Leu Ala
965 970 975
Gly Asp Lys Lys Gly Leu Gly Arg Phe Met Arg Cys Val Gln Ser Glu
980 985 990
Thr Lys Ala Val Ser Leu Gln Leu Pro Leu Gly Arg Gly Pro Val Tyr
995 1000 1005
Tyr Val Cys Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Phe
1010 1015 1020
Leu Phe Thr Val Pro Ile Glu Asp Met Arg Glu Cys Thr Leu Gly
1025 1030 1035
Arg Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Cys Leu Ile
1040 1045 1050
Pro Val Pro Ile Asp Leu Pro Arg Met Leu Pro Ile Ser Ser Pro
1055 1060 1065
Leu His Arg Pro Gln Met Pro Phe Trp Thr Cys Thr Phe Pro Ala
1070 1075 1080
Thr Thr Trp Gly Thr Trp Glu Thr Pro Ser Thr Trp Gly Trp Arg
1085 1090 1095
Thr Phe Arg Gly Pro Arg Arg Lys Val Leu Met Val Leu Trp Leu
1100 1105 1110
Pro Ala Asn Gln Ser Leu Gln Lys Ser Gln Val Phe Gln Trp Val
1115 1120 1125
Leu Arg Thr Glu Asn Ile Arg Lys Leu Ile Trp Thr Lys Gln Arg
1130 1135 1140
Ser Phe Leu Ser Leu Phe Pro Lys Leu Arg Ala Thr Glu Gln Met
1145 1150 1155
Thr Asn Val Gly Cys Ala Phe Ser Gly Arg Ile Leu His Gln Pro
1160 1165 1170
Glu Met Ala Ala Met Arg Leu Met Pro Lys Phe Leu Asn Ser Thr
1175 1180 1185
Asn Ser Trp Trp Thr Cys Thr Asn Leu Ser Val Pro Met Met Leu
1190 1195 1200
Thr Ile Leu Ile Trp Lys Arg Val Phe Ile Leu Leu Leu Ser Asp
1205 1210 1215
Lys Lys Leu Leu Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg
1220 1225 1230
Asn Val Ser Arg Ile Ser His Gln Met Lys Cys Leu Thr Ala Val
1235 1240 1245
Asp Cys Leu Gln Ala Phe Trp Asp Met Asn Met Glu His Arg Leu
1250 1255 1260
Thr Met Asp Ser Ala Leu Ser Leu Thr Lys Arg Glu Gly Pro Glu
1265 1270 1275
Thr Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu Thr Met Ser Leu
1280 1285 1290
Ser Asn Ile Leu Met Lys Phe Arg Leu Arg Leu Arg Ile Pro Ser
1295 1300 1305
Leu Arg Lys Tyr Arg Gln His Leu Lys Lys Thr Ser Ala Lys Gly
1310 1315 1320
Glu Lys Leu Lys His Cys Phe Lys Ala Trp Gly Arg Gly Pro Pro
1325 1330 1335
Leu His Thr Arg Ser Gln Lys Lys Asp Pro Ala Gly Lys Leu Lys
1340 1345 1350
Lys Leu Thr Thr Leu Ser Phe Val Leu Ile Glu Glu Arg Arg Asn
1355 1360 1365
Leu Gln Arg Asn Leu Lys Val Leu Trp Leu Lys Lys Ser Thr Lys
1370 1375 1380
Ser Arg Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe Phe Glu Lys
1385 1390 1395
Lys Arg Pro Glu Trp Leu Ser Ser Arg Lys Lys Gly His Thr Lys
1400 1405 1410
Asn Arg Arg Lys Ala Lys Arg Lys Pro Gln Ile Val His Lys Lys
1415 1420 1425
Arg Gly Leu Phe Leu Lys Lys Lys Tyr Leu Val Gln Gly Ala Lys
1430 1435 1440
Lys Ile Thr Phe Leu Ser Asn Gly Met Glu Ala Cys Gly Thr His
1445 1450 1455
Pro Thr Pro Arg Leu Ser Asp Arg Val Phe Leu Val Lys Ile Thr
1460 1465 1470
Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala Arg
1475 1480 1485
Gly Gly Thr Thr Ile Gly Glu Val Thr Ser Leu Cys Phe Phe Tyr
1490 1495 1500
Leu Leu Tyr
1505
<210> 1091
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 4A
<400> 1091
Ile Gln Lys Lys Lys Gln Lys Ser Met Ala Lys Lys Ser Gln Gln Pro
1 5 10 15
Leu Val Leu Lys Lys Asn Arg Lys Gln Glu Trp Gly Gly Gln Ala His
20 25 30
Arg Gln Arg Asn Asn Ala Lys Lys Met Pro Phe Gln Glu Glu Lys Lys
35 40 45
Asn Gly Arg Ile Ser Ser Ser Leu Ile Leu Ser Phe Gln Arg Val Lys
50 55 60
Asp Ser Lys Lys Met Thr Gln Lys Met Cys Ser Ser Leu Ala Leu Pro
65 70 75 80
Thr Gly Leu Thr Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala Val Leu
85 90 95
Ile Ser Ser Ser Thr Ser His Phe Leu Met Arg Ser Pro Val Leu Pro
100 105 110
Ser Ser Arg Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met Trp Thr
115 120 125
Trp Ser Ser Trp Leu Lys His Pro Arg Thr Ala Ser Ile Thr Leu Pro
130 135 140
Thr Thr Ser Leu Lys Gly Ser Arg Thr Ser Cys Cys Pro Arg Ser His
145 150 155 160
Pro Arg Leu Pro Arg Thr Lys Trp Pro Leu Gln Cys Leu Leu His Ser
165 170 175
Leu Gly Thr Thr Gly Thr Leu Val Trp Glu Arg Gly Val Leu Gln Met
180 185 190
Arg Ser Leu Glu Ala His Cys Pro Leu Gln Thr Phe His Leu His His
195 200 205
Cys Arg Thr Gln Pro Ser Ser Cys Pro Pro Ala Trp Ile Leu Tyr Gln
210 215 220
Gly Gln Trp Ser Gly Ala Val Val Gly Leu Arg Pro Val Ala His His
225 230 235 240
Leu Pro Arg Pro Ile Gln Gly Leu His Cys Pro Gln Ala Pro His Gln
245 250 255
Pro Ala Leu Ser Trp Gly Lys Trp Pro Val Gly Met Thr Gly Pro Ala
260 265 270
Arg Cys Cys Arg Trp Pro Arg Arg Ser Gln Lys Ser Gln His His Cys
275 280 285
Ala Leu Arg Lys Ile Glu Trp Ala Thr Lys Leu Ser Leu Gly Gly Lys
290 295 300
Ala Gly Pro Gln Ala Gln Glu Lys Ala Arg Pro Ser Pro Cys Leu Ser
305 310 315 320
Trp Ser Ser Arg Ile Val Ala Pro Gly His Ala Leu Ser Cys Arg Thr
325 330 335
Arg Arg Arg Trp Ser Ser Lys Cys Arg Gly Gly Pro Ser Ala Ser Asp
340 345 350
Arg Cys Cys Ser Cys Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly Arg
355 360 365
Cys Pro Val Gln Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu Arg
370 375 380
Arg Trp Gly Pro Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly Phe
385 390 395 400
Gln Leu Leu Arg Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro Arg
405 410 415
Lys Gly Pro Phe Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala Val
420 425 430
Thr Val Met Ala Gly Ser Val Pro Ser Ala Gln Ser Val Asp Ala Leu
435 440 445
Glu Ser Pro Gly Pro Leu Ala Leu Glu Gly Pro Ser Ser Pro Arg Asn
450 455 460
Leu Leu Trp Arg Glu Met Ser Ile Phe Leu Pro Gly Ile Phe Cys Gln
465 470 475 480
Lys Lys Val Pro Ser Ala Ser Pro Trp Gly Leu Val Pro Pro Ser Pro
485 490 495
Pro Leu Ala Leu Gly Pro Arg Met Gln Leu Cys Thr Gln Leu Ala Arg
500 505 510
Phe Phe Pro Ile Thr Pro Pro Val Trp His Ile Leu Gly Pro Gln Arg
515 520 525
His Thr Pro Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro Phe Phe
530 535 540
Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys Asn Glu
545 550 555 560
Gly Asn Asn His Trp Pro Arg Val Glu Met Pro Thr Gly Trp Leu Leu
565 570 575
Val Gly Tyr Asn Thr Arg Asn Thr Ala Gln Asn Pro Arg Leu Gln Gln
580 585 590
His Leu Lys His Trp Gln Gln Cys Thr Arg Ala Arg Trp Cys Gln Glu
595 600 605
Pro Cys Gln Thr Leu Thr Phe Phe His Phe Phe Phe Phe Phe Lys Thr
610 615 620
Val Ser Leu Cys Cys Pro Gly Trp Ser Lys Gly Gln Pro Pro Pro Pro
625 630 635 640
Gly Leu Lys Pro Ser Ser Leu Ala Ser Gln Val Ala Arg Thr Thr Gly
645 650 655
Val Tyr Gln His Val Trp Leu Ile Cys Phe Val Phe Phe Val Cys Val
660 665 670
Glu Thr Gly Phe Cys His Val Ala Gln Val Gly Leu Glu Arg Leu Val
675 680 685
Ser Leu Ser Gly Ile Thr Asp Val Asn His Trp Ala Gln Pro Lys Pro
690 695 700
Ser Pro Ser Lys Gly Thr Gly Met Asn Arg Pro Ile Gly Leu Arg Val
705 710 715 720
Gly Lys Gly Val Trp Ala Arg Leu Leu Lys Lys Lys Pro Arg Asp Ile
725 730 735
Cys Arg Ile Ser Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys His
740 745 750
Arg Lys Thr Asp Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro Thr
755 760 765
Thr Gly Val Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp Pro
770 775 780
Pro Arg Cys Arg Cys Arg Arg Glu Tyr Arg Val Thr Met Asn Ile Leu
785 790 795 800
Asn Ser Leu Pro Ser Ser Met Glu Ile Ala Val Leu Gln Glu Thr Ala
805 810 815
Lys Lys Ser Pro Thr Ser Phe Cys Cys Asn Leu Asp Leu Gln His Gln
820 825 830
Arg Arg Arg Lys Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser
835 840 845
Pro Lys Ala Asn Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln
850 855 860
Asn Leu Leu Asn Leu Val Gln Leu Asn Pro His Ser Pro His His Arg
865 870 875 880
Lys Asp Glu Glu Asp His Gln Lys Arg His His His His Asn Gln Lys
885 890 895
Lys Met Ser Val Pro Leu Phe Phe His Gly Asp Leu Cys Arg Glu Ser
900 905 910
Thr Leu Gly Asn Phe Trp Met Lys Leu Leu Gln Leu Pro Gln Arg Pro
915 920 925
Pro Leu Gln Pro Val Thr Gly Met Glu Ile Leu Leu Trp Ile Leu Leu
930 935 940
Lys Met Glu Ile Gln Ile Phe Lys Ile Cys Leu Gly Glu Met Gln Leu
945 950 955 960
Cys Thr Ser Arg Ile Leu Asn Leu Gln Val Leu Lys Lys Ile Leu Arg
965 970 975
Ser Phe Met Lys Leu Tyr His Ser Leu Val Met Cys Leu Arg Leu Arg
980 985 990
Thr Lys Leu Glu Lys Ala Leu Ser Ala Leu Phe Ile Trp Pro Gln His
995 1000 1005
Ser Tyr Lys Ile Thr His Pro Phe Ala Ser Gln Pro Leu Gly Gln
1010 1015 1020
Glu Met Pro Asn Asn Thr Gln Ile Arg Leu Leu Lys Pro Asp Lys
1025 1030 1035
Lys Lys Lys Ser Thr Glu Lys Thr Lys Gly Gln Ala Phe Gly Ser
1040 1045 1050
Phe Ser Ala Asp Phe Ser Ala Pro Gln Gly Gln Ala Phe Gly Ser
1055 1060 1065
Leu Cys Gln Leu Val Ser Ala Asp Phe Ser Ala Pro Gln Val Thr
1070 1075 1080
Arg Leu Arg Ser Leu Asn His Leu Leu Ile Trp Leu Lys Asn Trp
1085 1090 1095
Lys Arg Phe Lys Leu Lys Lys Lys Tyr Gln Ala Pro Leu Arg Leu
1100 1105 1110
Trp Ser Trp Cys Gly Thr Ser Gln Thr Tyr Phe Gly Ser Ile Ile
1115 1120 1125
Cys Ile Lys Asn Met Phe Leu Gln Arg Lys Gly Phe Leu Asn Leu
1130 1135 1140
Ser His Val Glu Lys Phe Glu Leu Lys Lys Asn Leu Leu Leu Pro
1145 1150 1155
Val Val Ile Asn Leu Lys Arg Leu Gln Lys Phe Met Leu Asn Gln
1160 1165 1170
Lys Cys Leu Ala Pro Phe Pro Ala Cys Thr Ser Lys Ala Trp Thr
1175 1180 1185
Pro Arg Lys Leu Val Gly Arg Ala Val Arg Arg Lys Gly Ile Leu
1190 1195 1200
Ala Met Thr Leu Thr Leu Asn Gly Ile Glu Ala Leu Thr Ala Leu
1205 1210 1215
Phe Thr Cys Arg Thr Ala Ser Ile Ser Val Asn Ile Ser Thr Leu
1220 1225 1230
Met Ser Ile Leu Glu Ala Ile Ile Lys Lys Met Lys Lys Arg Ile
1235 1240 1245
Met Val His Arg Trp Ile Phe Ser Asn Gln Leu Thr Val Gln Met
1250 1255 1260
Leu Cys Leu Pro Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe Ser
1265 1270 1275
Asn Gln Leu Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu Lys
1280 1285 1290
Gln Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile Pro
1295 1300 1305
Asn Phe Phe Trp Ser Leu Gly Ile Gly His Thr Gly Ala Trp Trp
1310 1315 1320
His Thr Gly Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr Val Ser
1325 1330 1335
Arg Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly Met
1340 1345 1350
Ala Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg Val Ser Trp
1355 1360 1365
Cys Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser Ser Pro
1370 1375 1380
Leu Trp Asp Cys Ser Thr Thr Thr Gly Thr His His Gly Cys Leu
1385 1390 1395
Trp Glu Ile Pro Ser Val Thr Leu Leu Ala Asn Leu His Leu Cys
1400 1405 1410
Tyr Tyr His Ser Gln Ser Asn Arg Asn Lys Ser Arg Gln Met Glu
1415 1420 1425
Ser Leu Gly Met Lys Leu Gln Leu Lys Lys Lys Val Asn Ala Cys
1430 1435 1440
Ser Thr Tyr Thr Pro His Ile Cys Arg His Thr Cys Arg Val Asn
1445 1450 1455
Ala Val Glu Glu Leu His Ser Arg Arg Met Ser Val Arg Ile Val
1460 1465 1470
Lys Asn Trp Val Ser Cys Cys Tyr Val Arg Leu Ser Ala Val Gly
1475 1480 1485
Leu Ser Thr Trp Ser Ala Leu Asp Asn Lys Ile Ile Cys Lys Gly
1490 1495 1500
His Arg Ile Thr
1505
<210> 1092
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 1B
<400> 1092
Thr Glu Ile Gln Leu Thr Met Asn Asp Ser Lys His Lys Leu Glu Ser
1 5 10 15
Pro Ala Leu Lys Gln Val Ser Pro Ala Ser Pro Pro Thr Gln Gln Pro
20 25 30
Gln Thr Pro Gln Asp Ser Arg Gln Val Leu Ala Met Pro Ser Ser Trp
35 40 45
Ser Ser Ser Gly Arg Thr Gln Arg Lys Val Val Lys Asn Pro Ser Gln
50 55 60
Pro Val Pro Leu Arg Asn Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr
65 70 75 80
Arg Ser Cys Ser Ile Ser Leu Lys Lys Ser Leu Glu Lys Met Pro Leu
85 90 95
Met Met Lys Lys Lys Asp Ser Thr Ile Phe Ile Val Pro Met Ser Leu
100 105 110
Ala Cys Ser Ile Thr Val Ser Phe Val Gly Gln Ile Ser Thr Leu Val
115 120 125
Leu Asp Val Ser Ser Ile Ser His Trp Asn Lys Val Arg Gln Asn Phe
130 135 140
Lys Arg Asn Ala Asp Lys Lys Asn Val Arg Ser Gly Glu Lys Asn Asp
145 150 155 160
Leu Gln Leu Phe Val Met Ser Asp Thr Thr Tyr Lys Ile Tyr Trp Thr
165 170 175
Val Ile Leu Leu Asn Pro Cys Gly Asn Leu His Leu Lys Thr Thr Ser
180 185 190
Leu Gly Asp Cys Pro Arg Thr Met Ala Gly Pro Ser Ala Ser Leu His
195 200 205
Pro Ala Ser Gly Arg Ala Ser Arg Lys Thr Trp Gln Arg Arg Leu Arg
210 215 220
Ala Cys Arg Ala Gly Gly Pro Ala Gly Trp Ala Arg Gln Ala Phe Asp
225 230 235 240
Lys Lys Gly Phe Val Ile Leu Ser Val Gly Ala Gly Thr Gly Gly Gly
245 250 255
Pro Ala Cys Val Pro Val Ala Glu Ala Ser Thr Gly Ala Trp Thr Ala
260 265 270
Glu Gly Ala Ala Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro Cys Arg
275 280 285
Gln Leu Pro Ala Ser Ser Pro Thr Lys Cys Glu Ile Cys Val Lys Arg
290 295 300
Arg Arg Arg Arg Lys Arg Ser Ser Gln Ser Arg Ser Pro Val Pro Lys
305 310 315 320
Lys Arg Glu Arg Met Met Leu Pro Val Arg Ala Arg Thr Ala Arg Ser
325 330 335
Ala Leu Pro Gln Gly Arg Ala Pro Leu Glu Gly Met Leu Leu Pro Arg
340 345 350
Ala Leu Pro Ser Leu Leu Ser Arg Met Pro Ala Arg Arg Glu Ser Arg
355 360 365
Phe Trp Leu Ala Leu Gln Ala Leu Gly Leu Arg Pro Pro His Leu Pro
370 375 380
Ser Cys His Pro Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro His Gln
385 390 395 400
Ala Pro Thr Ala Phe Phe Leu Leu Asp Ile Ile Leu Arg Leu Pro Cys
405 410 415
Lys Val Thr Glu Ser Ser Asn Met Gly Gly Asn Arg Ser Ile Cys Leu
420 425 430
Thr Asn Ala Lys Lys Met Glu Asp Met Ile Trp Glu Ser Thr Pro Leu
435 440 445
Ser Ile Ser Arg Pro Thr Ser Arg Ala Arg Gln Ser Cys Cys Leu Pro
450 455 460
Gly Leu Thr His Pro Ala His Gln Pro Leu Gly Ser Met Thr Leu Ala
465 470 475 480
Ile Arg Phe Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val Thr Ala
485 490 495
Ala Pro Ser Gly Gln Tyr Phe Lys Gly Lys Lys Arg Arg Lys Glu Ile
500 505 510
Phe Lys Lys Lys Lys Pro Leu Thr Phe Ser Pro Ser Leu Ala Lys Lys
515 520 525
Thr Leu Thr Asn Ser Ser Phe Phe Tyr Thr Ser Asp Arg Glu Ala Lys
530 535 540
Lys Ser Met Lys Arg Ser Met Thr Leu Lys Ala Leu Val Lys Thr Trp
545 550 555 560
Thr Gln Phe Arg Asn Tyr Pro Arg Ala Ser Ser Pro Gly His Pro Leu
565 570 575
Gly Pro Asn Gly Ile Trp Glu Val Met Pro Arg Thr Leu Glu Gly Cys
580 585 590
Ile Ser Val Lys Asp His Arg Thr Ser Gln Asn His Ser Lys Cys Ile
595 600 605
Thr Glu Cys Val Arg Thr Ala Leu Asn Arg Arg Ser Lys Ile Glu Ala
610 615 620
Ser Pro Ile Gly Ser Ile Ala Leu Arg Ser Met Pro Lys Ser Arg Asn
625 630 635 640
Gln Val Leu Phe Arg Arg Asn Leu Thr Pro Ser Gln Leu Arg Thr Leu
645 650 655
Ala Pro Pro Tyr Met Leu Leu Pro Gln Ser Leu Ser Gln Ser Leu Ser
660 665 670
Arg Lys Gln Ile Pro Ser Gln Ser Met Leu Val Ala Ser Arg Ala Gly
675 680 685
Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly Met Ser Leu Gln Trp
690 695 700
Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg Cys Pro Ser Arg Ser Pro
705 710 715 720
Ala Thr Phe Leu Thr Ala Leu Asn Gly Trp His Arg Ser Gly Leu Arg
725 730 735
Ala Gln Arg Lys Arg Lys Arg Glu Lys Arg Ser Gln Lys Ser Arg Gln
740 745 750
Asn His Leu Gln Leu Lys Ser Cys Arg Arg Lys Ile Ser Asn Trp Ser
755 760 765
Lys Leu Arg Ser Pro Trp Ile Phe Val Ser Lys Lys Arg Leu Pro Lys
770 775 780
Leu Thr Lys Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile
785 790 795 800
Thr Leu Ile Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys His Pro
805 810 815
His Arg Arg Pro Gly Trp Lys Gly His His Arg Val Val Phe Ser His
820 825 830
His Pro Ser Gly Ser Thr Lys Ser His Trp Gln Gln Arg Glu Arg Gly
835 840 845
Gly Gly Arg Arg Glu Lys Lys Gly Cys Arg Glu Arg Ser Leu Leu Tyr
850 855 860
Ser Arg Met Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro Asp
865 870 875 880
Tyr Phe Val Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser Phe
885 890 895
Pro Val Gly Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys Ser
900 905 910
Cys Thr Ser His Ser Asn Pro Trp Ser Gln Ser Arg His Pro His Arg
915 920 925
Ser Pro Pro Thr Ser Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu Pro
930 935 940
Arg Ala Ser Leu Arg Ala Thr Val Pro Arg His Ser Ser Val Leu Ala
945 950 955 960
Thr Gly Leu His Leu His Arg Gln Ile Ser Leu Pro Leu Arg Gly Phe
965 970 975
Leu Leu His Gln Pro Leu Pro Gly Gln His Leu Trp Leu Ser His Arg
980 985 990
Leu Arg Leu Arg Leu Pro Arg Thr Gln Arg Pro Pro Arg Ser Ile Leu
995 1000 1005
Ser Leu Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro Leu
1010 1015 1020
His Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg Tyr
1025 1030 1035
Pro Arg Leu Lys Thr Phe Gly Val Pro Leu Gly Ser Ile Leu Cys
1040 1045 1050
Leu Ala Gly Ser Leu Ser Thr Met Met Ile Ile Ser Thr Thr Arg
1055 1060 1065
Gln Glu Cys Gly Arg Arg Ala Ser Val Pro Cys Arg Pro Met Ile
1070 1075 1080
Gly Ser Ala Arg Pro Gly Pro Trp Arg Thr Ser Ala Met Pro Ser
1085 1090 1095
Ala Met Gly Val Ala Leu Pro Thr Ser Cys Glu Ser Gly Arg Ser
1100 1105 1110
Pro Pro Ala Thr Gly Gly Arg Met Pro Gly Ser Gln Ser Ile Met
1115 1120 1125
Met Ser Trp Met Pro Pro Leu Ala Pro Cys Ala Ala Cys Pro Cys
1130 1135 1140
Ser Pro Ala Pro Thr Leu Cys Pro Ala His Pro Ala Arg Ala Pro
1145 1150 1155
Thr Ala Val Pro Ala Phe Thr Pro Leu Ser Ala His Pro Val Pro
1160 1165 1170
Val Leu Ser Gly Cys His Leu Ala Val Arg Thr Ser Met Leu Thr
1175 1180 1185
Leu Leu Pro Met Leu Lys Leu Ala Pro Leu Gln Val Thr Thr Thr
1190 1195 1200
Leu Lys Leu Ile Leu Val Met Leu Glu Ile Val Thr Glu Ser Thr
1205 1210 1215
Arg Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly Pro
1220 1225 1230
Trp Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys
1235 1240 1245
Leu Arg Leu Arg Asn Thr Ser Pro Ile Val Phe Phe Leu Ala Pro
1250 1255 1260
Tyr Phe Pro Arg Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys
1265 1270 1275
Met Met Met Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg
1280 1285 1290
Arg Met Thr Met Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr
1295 1300 1305
Cys Leu Thr Pro Arg Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg
1310 1315 1320
Gln Thr Ile Ser Gln Arg Arg Pro Ile Gln Thr Pro Pro Gly Thr
1325 1330 1335
Ser Leu Ala Ile Trp Gly Asn Gln Gln Leu Lys Trp Thr Pro His
1340 1345 1350
Ile Leu Lys Ser Ala Ser Arg Arg Ala Arg Pro Thr Ser Cys Ser
1355 1360 1365
Thr Cys Arg Met Trp Trp Ile Ala Lys Lys Arg Ile Lys Leu Arg
1370 1375 1380
Arg Asn Arg Thr Arg Leu Thr Leu Thr Gly Thr Arg Ser Ser Gly
1385 1390 1395
Thr Arg Ala Ser Pro Ser Ala Val Cys Leu Cys Cys Trp Thr Cys
1400 1405 1410
Pro Ser Arg Ser Phe Pro Ala Ala Ser Pro Ser Gly Leu Arg Ala
1415 1420 1425
Pro Val Gly Ala Gln Ala Pro Pro Glu Val Thr Leu Arg Ala Ser
1430 1435 1440
Cys Ala Ser Ser Ala Ser Lys Ala Cys Ala Gly Leu Trp Pro Trp
1445 1450 1455
Gly Ala Gln Val Arg Gln Pro Ser Leu Pro Gly Pro Cys Ala Ser
1460 1465 1470
Leu Leu Ser Thr Leu Ser Gln Pro Pro Pro Gln Ala Pro Ser Gln
1475 1480 1485
Val Trp Thr Ala Ala Thr Leu Arg Cys Pro Ala Val Pro Ala Ala
1490 1495 1500
Ala Cys Pro Pro
1505
<210> 1093
<211> 1501
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 2B
<400> 1093
Arg Lys Met Gln Ser Leu Asn His Pro Ser Arg Leu Thr Asn Met Ser
1 5 10 15
Arg Thr Pro Pro Arg Arg Val Cys Asn Pro Arg Arg Lys Thr Trp Lys
20 25 30
Met Arg Lys Lys Tyr Ala Gln Lys Pro Ser Gln Lys Asn His Leu Tyr
35 40 45
Asn Ser Arg Lys Lys Leu Leu Glu Asp Met Lys Gln Asn Gly Phe Thr
50 55 60
Gly His Arg Glu Gly Ser Glu Ser Asp Asn Leu Gly Leu Leu Tyr Ser
65 70 75 80
Phe Pro Pro Ile Arg Met Cys Ala Leu Ser His Pro Ser Phe Tyr Ile
85 90 95
Ser Ser Thr Val Cys Phe Leu Ser Lys His Cys Met Thr Ala Cys Thr
100 105 110
Gln Lys Lys Gly His Met Ile Phe Ser Arg Glu Lys Ile Ile Asn Pro
115 120 125
Thr Ile Ser Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Glu Leu Ser
130 135 140
Leu Glu Pro Trp Ile Pro Tyr Leu His Gln Gln Lys Thr Gln Gly Gly
145 150 155 160
Lys Lys Arg Ser Lys Phe Pro Gly Thr Ser Leu Gln Cys Tyr Leu Asn
165 170 175
Arg Cys Ser Leu Met Glu Gln Ile Pro His Leu Lys Ser Ala Ser Pro
180 185 190
Gln Ile Met Gln Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg Arg
195 200 205
Met Gln Asn Leu Asp Asn Leu Gly Val Pro Trp Pro Leu Leu Pro Gly
210 215 220
Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr Ser Pro Leu Trp Lys Ile
225 230 235 240
Thr Met Val Leu Thr Tyr Pro Asn Cys Val Val His Val Leu Met Phe
245 250 255
Trp Leu Pro Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly Phe Gln
260 265 270
Trp Gly Glu Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly Pro Tyr
275 280 285
Pro Ile Ser Glu Gly Leu Thr Met Thr Thr Gly Arg Asn Ile Asn Ser
290 295 300
Asn Ser Leu Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu Cys His
305 310 315 320
His Ala Ile Met His Arg Lys Met Thr Ser Pro His Phe Arg Leu Phe
325 330 335
Ser Ser Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala Leu Cys
340 345 350
Lys Phe Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro
355 360 365
Gln Ala Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu Leu Val Gln
370 375 380
Ser Ala Ala Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp Ser Arg
385 390 395 400
Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys Lys Val Lys Leu Ala
405 410 415
Asn Gly Leu Trp Phe Asn Leu Ile Phe Val Leu Phe Lys Ala Asp Gln
420 425 430
Ser Glu Ser Ser Leu Ser Ser Gly Arg Asn Lys Lys Thr Lys Leu Trp
435 440 445
Phe Ser Leu Ile Asn Ile His His Arg Lys Asn Pro Leu Leu Pro Met
450 455 460
Arg Ile Pro Ser Leu Asn Ala Gln Trp Met Phe Leu Arg Ile Leu Leu
465 470 475 480
Leu Ala His Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys Gly Glu
485 490 495
Cys Val Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile Leu Lys
500 505 510
Gln Pro Leu Asp Leu Lys Ile Ser Lys Thr Phe Met Leu Gln Ala His
515 520 525
Pro Gln Val Pro Ala Leu Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg
530 535 540
Gly Pro Leu Thr Ser Ala Pro Ser Ala Gln Gln Ser Leu Thr Ala Ser
545 550 555 560
Pro Gln Ile Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr Ile Ile
565 570 575
Tyr Pro Pro Ser Thr Cys Ser Leu Pro Cys Arg Gly Arg Thr Leu Glu
580 585 590
Ser Ala Gly Leu Phe Pro Trp Leu His Thr Gln Cys Thr His Pro Cys
595 600 605
Thr Met Leu Leu Pro Gln Gly Trp Trp Cys Thr Arg Gly Gly Gly Lys
610 615 620
Arg Lys Lys Lys Met Cys Lys Val Ser Gly Gly Cys Thr Ala Cys Val
625 630 635 640
Glu Arg Cys Pro Trp Lys Gly Ile Cys Trp Lys Trp Pro Val Thr Val
645 650 655
Ala Ala Gln Trp Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln Glu
660 665 670
Arg Gly Cys Ser Ser Trp Leu Met Lys Gln Thr Trp Met Lys Ser Trp
675 680 685
Ser Leu Arg Asp Pro Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser Thr
690 695 700
Arg Val Leu Trp Met Pro Thr Ser Thr Val Arg Arg Arg Asn Ser Arg
705 710 715 720
Lys Gln Ser Gln Val Gln Leu Ala Ile Gln Val Leu Leu Val Asp Lys
725 730 735
His Lys Tyr Phe Leu Phe Gly Arg Ala Arg Asn Arg Asn Met Lys Lys
740 745 750
Thr Met Ser His Leu Ile Ala His Gln Ala Leu Lys Met Ser Gly Leu
755 760 765
Arg Leu Phe His Pro Arg Leu Leu Thr Arg Lys Lys Pro Gly Lys Phe
770 775 780
Leu Pro Ser Arg Phe Pro Trp Gly Pro Pro Pro Leu Cys His Pro Ala
785 790 795 800
Trp Leu Ser Pro Ile Ser Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe
805 810 815
His Val Leu Ala Leu Glu Val Thr Phe Pro Pro Gly Thr Ala Met Pro
820 825 830
Gln Met Gln Leu Gln Ala Leu Ala Met Trp Glu Lys Gly Trp Asp Lys
835 840 845
Arg Lys Arg Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile Gln
850 855 860
Glu Lys Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe Glu Ala
865 870 875 880
Cys Arg Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile Thr Leu Phe
885 890 895
Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn Val Leu Cys Val Arg
900 905 910
Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys Arg Lys Met Lys Arg
915 920 925
Asn Gln Val Ala Ser Pro Gln Ile Met Gln Arg Leu Phe Ile Lys Gly
930 935 940
Tyr Gln Asn Asn His Phe Thr Phe His Leu Gln Asn Phe Ala Phe Phe
945 950 955 960
Ser Ser Phe Gly Asn Asn Lys Tyr Ile Asn Ile Leu Thr Arg Arg Lys
965 970 975
Lys Arg Glu Asp His Cys Gly Leu Leu Ile Leu Ile Gln His Gly Gly
980 985 990
Ile Phe Thr Phe Arg Phe Trp Val Glu Lys Leu Ser Trp Asn Ile Cys
995 1000 1005
Lys Asn Leu Ser Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu Leu
1010 1015 1020
Tyr Val Tyr Ile Ile Glu Thr Asn Val Phe Val Leu Asn Leu Phe
1025 1030 1035
His Val Pro Val Asn Gln Ile Phe Met Met Ala Phe Tyr Leu Lys
1040 1045 1050
Tyr Thr Glu Lys Ala Trp Val Met Glu Leu Glu Trp Leu Ile Gln
1055 1060 1065
Gln Gln Cys Tyr Gln Gln Glu Lys Lys Ser Arg Lys Leu Met Ser
1070 1075 1080
Ser Cys Arg Ala Phe Ile His Thr Pro Arg Ser Pro Gly Cys Ser
1085 1090 1095
Val Tyr Ala Asn Met Cys Trp Ala Phe Trp Lys Pro Pro Ser Gln
1100 1105 1110
Gly Ile Ser Ser Cys Leu Met Thr Gly Cys Trp Gly Ser Pro Pro
1115 1120 1125
Leu His Leu Cys Gln Pro Leu Arg Arg Tyr Lys Lys Arg Gly Val
1130 1135 1140
Ile Ala Trp Arg Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys
1145 1150 1155
Asn Leu Ile Leu Phe His Val Arg Asn Ile Val Tyr Gly Ile Gln
1160 1165 1170
Val Met Leu Cys Gly Lys Gly Leu Thr His Pro Val Pro Leu Lys
1175 1180 1185
Arg Thr Leu Gln Asn Lys Arg Asn Lys Asn Ile Lys Arg Val Asn
1190 1195 1200
Gln Lys Lys Gly Asn Ile Lys Arg Lys Ser Ile Leu Leu His Leu
1205 1210 1215
Ile Val Leu Asn Ser Pro Glu Ser Asn Pro Lys Phe Phe Leu Thr
1220 1225 1230
Phe Ser Gln Leu Glu Lys Lys Ala Thr Trp Met Arg Arg Thr Gly
1235 1240 1245
Ala Leu Arg Ala Thr Ala Pro Ala Thr Ala Ala Pro Gln Ala Gln
1250 1255 1260
Thr Pro His Trp Arg Ala Ala Thr Thr Ser Ser Met Ser Ser Ser
1265 1270 1275
Pro Arg Ala Glu Pro Thr Ser Ser Ser Ser Trp Ala Thr Cys Trp
1280 1285 1290
Pro Arg Cys Cys Ser Ser Ser Cys Tyr Trp Ser Leu Ser Ser Trp
1295 1300 1305
Pro Pro Ala Gly Ala Ala Glu Ala Thr Asn Thr Arg Thr Arg Ser
1310 1315 1320
Arg Glu Ser Gln Arg Gly Arg Met Leu Thr Trp Arg Ser Ser Leu
1325 1330 1335
Trp Leu Gln Gly Thr Arg Cys Phe Thr Gly Val Arg Thr Ser Ser
1340 1345 1350
Gly Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly Thr
1355 1360 1365
Pro Arg Gly Asp Trp Lys Arg His Pro Pro Arg Arg Asn Ser Val
1370 1375 1380
Ile Val His Lys Ile Val Leu Val Phe Leu Lys Ser Leu Ser Ser
1385 1390 1395
Tyr Asn Cys Glu Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile
1400 1405 1410
Glu Phe Ala Val Leu Lys Leu Leu Asn Met Asp Leu His Trp Asn
1415 1420 1425
Ser Ala Tyr Leu Gly Arg Thr Leu Leu Val Thr Cys Ile Leu Tyr
1430 1435 1440
His Arg Trp Ile Val Thr Ser Met Cys Gln Ser Gln Arg Trp Leu
1445 1450 1455
Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu Met Trp Thr Arg Gln
1460 1465 1470
Ile Asn Arg Arg Lys Leu Gln Arg Lys Lys Arg His Pro Ser Trp
1475 1480 1485
Pro Trp Thr Arg Cys Leu Arg Met Arg Pro Pro Arg Ser
1490 1495 1500
<210> 1094
<211> 1506
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 3B
<400> 1094
Gly Ala Ala Ala Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr
1 5 10 15
Thr Pro Ser Ser Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln
20 25 30
Ser Lys Lys Thr Met Thr Ala Ala Gly Leu Thr Pro Lys Asn Lys Lys
35 40 45
Arg Arg Lys Leu Arg Pro Lys Met Ile Arg Lys Ile Gln Lys Arg Arg
50 55 60
Arg Thr Ala Asn Arg Arg Asn Ser Arg Arg Ala Thr Pro Thr Ser Lys
65 70 75 80
Gly Ser Leu Arg Arg Lys Tyr Leu Arg Val Arg Gly Pro Pro Leu His
85 90 95
Thr Arg Asn Ile Arg Lys Leu Ile Trp Thr Lys Gln Arg Ser Phe Leu
100 105 110
Ser Leu Phe Pro Lys Leu Arg Ala Thr Glu Gln Met Thr Asn Val Gly
115 120 125
Cys Ser Ile Pro His Val Pro Lys Ala Thr Ala Ala His Ser Val Thr
130 135 140
Val Lys Leu Gln Leu Pro Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser
145 150 155 160
Arg His Thr Met Ser Leu Ser Asn Ile Leu Met Lys Phe Arg Leu Gln
165 170 175
Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn Thr Met Gln Trp Asn Asn
180 185 190
Lys Lys Met Ala Met Thr Val Ile Ala Gly Ala His His Cys Gln Tyr
195 200 205
Lys Leu Thr Tyr Thr Lys Val Trp Lys Met Asn Trp Lys Lys Met Met
210 215 220
Ile Gly Ser Gln His Leu Leu Phe Ser Pro Leu Asp Ser Ser Pro Leu
225 230 235 240
Gln Leu Leu Leu His Pro His Gly Lys Arg Cys Asn Pro Cys Cys Arg
245 250 255
Leu Thr Trp Met Ser Gln Asn Thr Arg Ser Thr Asn Leu Glu Lys Asn
260 265 270
Pro Ser Leu Lys Lys Gln Ser Gln Arg Arg Gly Lys Leu Ser Ala Phe
275 280 285
Ser Gly Arg Ile Leu His Gln Pro Glu Met Ala Ala Met Arg Leu Met
290 295 300
Pro Lys Phe Leu Asn Ser Thr Asn Ser Trp Trp Thr Leu Thr Thr Leu
305 310 315 320
Ser Phe Val Leu Ile Glu Glu Ala Arg Gln Pro Ser Arg Pro Thr Gly
325 330 335
Arg Thr Pro Thr Thr Arg Leu Met Ala Pro Val Gly Ser Val Met Ser
340 345 350
Cys Ser Leu Leu Thr Gln Pro Ser Pro Ala Ser Ala Cys Thr Met Pro
355 360 365
Pro Leu Leu His Pro Gln Trp Ala Pro His Ser Ala Gly Leu Ser Pro
370 375 380
Gly Ala Cys Arg Pro Ala Cys Thr Cys Ile Ser Met Thr Thr Ile Ser
385 390 395 400
Arg Ala Thr Trp Gly Pro Val Tyr Tyr Val Cys Asn Arg Met Asn Val
405 410 415
Ser Ser Val Leu Lys Pro Phe Leu Phe Thr Val Pro Ile Glu Asp Met
420 425 430
Arg Glu Cys Thr Leu Gly Arg Asn Arg Met Asn Val Ser Ser Val Leu
435 440 445
Lys Pro Cys Leu Ile Pro Val Pro Ile Ser Glu Lys Lys Arg Lys Leu
450 455 460
Pro Asn Ile Glu Ile Thr Pro Gln Arg Ser Lys Ala Met Leu Gln Lys
465 470 475 480
Gln Cys Cys Tyr Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile
485 490 495
Asn Leu Arg Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser Leu
500 505 510
Gly Phe Leu Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys
515 520 525
Leu Leu Met Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr Lys Ser Arg
530 535 540
Lys Lys Gly His Thr Lys Asn Arg Arg Lys Ala Lys Arg Lys Pro Gln
545 550 555 560
Ile Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe His Leu Lys Lys Thr
565 570 575
Ser Ala Lys Trp Leu Lys Lys Ser Thr Lys Ser Arg Ser Asn Gly Met
580 585 590
Glu Ala Cys Gly Thr His Pro Thr Pro Arg Leu Ser Cys Leu Arg Val
595 600 605
Arg Cys Gly Gly Trp Leu Cys Gly Trp Thr Pro Arg Gly Arg Lys Ser
610 615 620
Gly Val Met Lys Cys Trp Asp Leu Cys Pro Val His Lys Lys Arg Gly
625 630 635 640
Leu Phe Arg Leu Asp Phe His Pro Arg Ser Ser Ser Gly Lys Gly Lys
645 650 655
Asn Ser Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn Gln Gly His
660 665 670
Leu Leu Met Ile Leu Leu His Asn Asp Arg Val Phe Leu Val Lys Ile
675 680 685
Gly Glu Lys Leu Lys His Cys Phe Lys Ala Trp Gly Ser Arg Arg Asn
690 695 700
Arg Arg Tyr Arg Lys Ile Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala
705 710 715 720
Phe Leu Ile His Leu Arg Lys Val Asp Thr His His Leu Gln Val Val
725 730 735
Thr Lys Thr Val Thr Ala Thr Thr Ala Asp Gly Gln Arg Met Arg Arg
740 745 750
Leu Lys Cys Lys Ala Cys Arg Leu Arg Trp Ala Arg Pro Glu Pro Ala
755 760 765
Ala Gln Ala Pro Pro Lys Ser His Phe Pro Pro His Pro Ser Gly Pro
770 775 780
Ser Arg Thr Ser Ser Leu Gln Leu Arg Ser Leu Phe Phe Ser His Cys
785 790 795 800
Leu Cys Ser Gln Lys Lys Asp Pro Ala Gly Lys Leu Lys Lys Leu Leu
805 810 815
Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg Asn Val Ser Arg Ile
820 825 830
Ser Thr Pro Pro Pro Leu Ile Leu Trp Pro Gln Ala Ala Pro Val Ser
835 840 845
Val Ile Thr Met Lys Leu Trp Glu Lys His Phe Lys Gly Leu Asn Trp
850 855 860
Asn Leu Val Val Trp Ile Leu Asn Leu Lys Met Met Thr Tyr Met Glu
865 870 875 880
Met His Tyr Gly His Gln Ala Pro Gln Val Ala Met Leu Pro Lys Leu
885 890 895
Leu Cys Arg Gln Met Leu Pro Thr Leu Ser Thr Leu Gln Gln Arg His
900 905 910
Pro Gln Gly Pro Cys Pro Pro Pro Val Thr Pro Leu Arg Val Gln Ser
915 920 925
Val Leu Leu Leu Gly Val Pro Gln Thr Ala Arg Gly Pro Arg Arg Lys
930 935 940
Val Leu Met Val Leu Trp Leu Pro Ala Asn Gln Ser Leu Gln Lys Ser
945 950 955 960
Gln Val Phe Gln Trp Val Leu Arg Thr Glu Val Ala Pro Arg Cys Pro
965 970 975
Arg Ser Ala Val Asp Ile Ser Pro Gly Pro Thr Ser Pro Ser Leu Ala
980 985 990
Ser Cys Ala Ser Val Ala Ile Gly Lys Leu Ala Leu Leu Gly Ala Ser
995 1000 1005
Ala Pro Cys Gly Ala Ala Gly Ala Arg Glu Ala Gly Arg Phe Ala
1010 1015 1020
Val Leu Gly Thr Met Val Met Lys Leu Cys Phe Phe Tyr Leu Leu
1025 1030 1035
Tyr Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln His Leu
1040 1045 1050
Asn Arg Lys Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu Thr
1055 1060 1065
Met Met Met Ser Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile
1070 1075 1080
Pro Leu Pro Ser Pro Arg Gln His Leu Leu Pro Gln Tyr Pro Leu
1085 1090 1095
His Pro Pro Pro Pro Cys Leu Leu Leu Leu His His Arg His His
1100 1105 1110
Leu Ala Phe Leu Glu Met Ala Cys Ser Ser Gln His Thr His Ser
1115 1120 1125
Ile Lys Ile Trp Ile Ser Phe Ser His Glu Val Asp Pro Pro Gly
1130 1135 1140
Ser Val Trp Ile Leu Pro Cys Asp Leu Pro Arg Met Leu Pro Ile
1145 1150 1155
Ser Ser Pro Leu His Arg Pro Gln Met Pro Phe Trp Thr Cys Thr
1160 1165 1170
Phe Pro Ala Thr Thr Trp Gly Thr Trp Glu Thr Pro Ser Thr Trp
1175 1180 1185
Gly Trp Arg Thr Phe Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp
1190 1195 1200
Ser Arg Ser Phe Phe Thr Ser Ala His Pro Ser Arg Pro Cys Arg
1205 1210 1215
Met Arg Leu Tyr Gln Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu
1220 1225 1230
Thr Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala
1235 1240 1245
Arg Gly Gly Thr Thr Ile Gly Glu Val Thr Ser Cys Thr Asn Leu
1250 1255 1260
Ser Val Pro Met Met Leu Thr Ile Leu Ile Trp Lys Arg Val Phe
1265 1270 1275
Ile Leu Leu Leu Ser Asp Lys Lys Gly Ala Lys Lys Ile Thr Phe
1280 1285 1290
Leu Pro Ile Pro Pro His Leu Arg His Pro Leu Leu Leu Phe Glu
1295 1300 1305
Lys Lys Arg Pro Glu Trp Leu Ser Met Asp Leu Asp Gly Met Leu
1310 1315 1320
Thr Val Ile Gly Gln Gly Leu Val Gly Met Thr Pro Arg Asp Leu
1325 1330 1335
Gly Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg Pro Ile Gln
1340 1345 1350
Val Gln Thr Gly Gly Arg Leu Arg Arg Asn Leu Gln Arg Asn Leu
1355 1360 1365
Lys Val Leu Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe
1370 1375 1380
Ser Arg Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn Arg Glu
1385 1390 1395
Trp Glu Lys Arg Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr Lys
1400 1405 1410
Glu Tyr Phe Leu Lys Arg Ile Leu Ile Arg Lys Ala Met Thr Val
1415 1420 1425
Leu Ala Gly Asp Lys Lys Gly Leu Gly Arg Phe Met Arg Cys Val
1430 1435 1440
Gln Ser Glu Thr Lys Ala Val Ser Leu Gln Leu Pro Leu Gly Arg
1445 1450 1455
Asn Met Glu His Arg Leu Thr Met Asp Ser Ala Leu Ser Leu Thr
1460 1465 1470
Lys Arg Glu Gly Pro Glu Thr Leu Lys Lys Lys Tyr Leu Val Gln
1475 1480 1485
His Gln Met Lys Cys Leu Thr Ala Val Asp Cys Leu Gln Ala Phe
1490 1495 1500
Trp Asp Met
1505
<210> 1095
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 4B
<400> 1095
Ile Gln Lys Lys Lys Gln Lys Ser Asn Leu Asp Leu Gln His Gln Arg
1 5 10 15
Arg Arg Lys Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro
20 25 30
Lys Ala Asn Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn
35 40 45
Leu Leu Asn Leu Val Gln Leu Asn Pro His Ser Pro His His Arg Lys
50 55 60
Asp Glu Glu Asp His Gln Lys Arg His His His His Asn Gln Lys Lys
65 70 75 80
Met Ser Val Met Ala Lys Lys Ser Gln Gln Pro Leu Gly Gln Ala Phe
85 90 95
Gly Ser Leu Cys Gln Leu Val Ser Ala Asp Phe Ser Ala Pro Gln Val
100 105 110
Thr Arg Leu Arg Ser Leu Asn His Leu Leu Ile Asn Glu Gly Asn Asn
115 120 125
His Trp Pro Arg Val Glu Met Pro Thr Gly Trp Leu Leu Val Gly Tyr
130 135 140
Asn Thr Arg Asn Thr Ala Gln Asn Pro Arg Leu Gln Gln His Leu Lys
145 150 155 160
His Trp Gln Gln Cys Thr Arg Ala Arg Trp Cys Gln Glu Pro Cys Gln
165 170 175
Thr Leu Thr Phe Phe His Phe Phe Phe Phe Phe Lys Thr Val Ser Leu
180 185 190
Cys Cys Pro Gly Trp Ser Lys Gly Gln Pro Pro Pro Pro Gly Leu Lys
195 200 205
Pro Ser Ser Leu Ala Ser Gln Val Ala Arg Thr Thr Gly Val Tyr Gln
210 215 220
His Val Trp Leu Ile Cys Phe Val Phe Phe Val Cys Val Glu Thr Gly
225 230 235 240
Phe Cys His Val Ala Gln Val Gly Leu Glu Arg Leu Val Ser Leu Ser
245 250 255
Gly Ile Thr Asp Val Asn His Trp Ala Gln Pro Lys Pro Ser Pro Ser
260 265 270
Lys Gly Thr Gly Met Asn Arg Pro Ile Gly Leu Arg Val Gly Lys Gly
275 280 285
Val Trp Ala Arg Leu Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro
290 295 300
Thr Thr Gly Val Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp
305 310 315 320
Pro Pro Arg Asn Ile Leu Asn Ser Leu Pro Ser Ser Met Glu Ile Ala
325 330 335
Val Leu Gln Glu Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys His
340 345 350
Arg Lys Thr Asp Asn Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn
355 360 365
Arg Asn Lys Ser Arg Gln Met Glu Ser Leu Gly Met Lys Leu Gln Ser
370 375 380
Pro Leu Trp Asp Cys Ser Thr Thr Thr Gly Thr His His Gly Cys Leu
385 390 395 400
Trp Glu Ile Pro Ser Val Thr Leu Leu Ala Cys Arg Val Asn Ala Val
405 410 415
Glu Glu Leu His Ser Arg Arg Met Ser Val Arg Ile Val Lys Asn Trp
420 425 430
Val Ser Cys Cys Tyr Val Arg Leu Ser Ala Val Gly Leu Ser Thr Trp
435 440 445
Ser Ala Leu Asp Val Val Ile Asn Leu Lys Arg Leu Gln Lys Phe Ser
450 455 460
Gln Lys Ser Gln His His Cys Ala Leu Arg Lys Ile Glu Trp Ala Thr
465 470 475 480
Lys Leu Ser Leu Gly Gly Lys Ala Gly Pro Gln Ala Gln Glu Lys Ala
485 490 495
Asn Ala Lys Lys Met Pro Phe Gln Arg Trp Ile Phe Ser Asn Gln Leu
500 505 510
Thr Val Gln Met Leu Cys Leu Pro Ile Glu Ala Leu Thr Ala Leu Phe
515 520 525
Thr Cys Arg Thr Ala Ser Ile Ser Val Asn Ile Ser Thr Leu Met Ser
530 535 540
Ile Leu Glu Ala Pro Leu Phe Phe His Gly Asp Leu Cys Glu Glu Lys
545 550 555 560
Lys Asn Gly Arg Ile Ser Ser Gln Ala Pro Leu Arg Leu Trp Ser Trp
565 570 575
Cys Gly Thr Ser Gln Thr Tyr Phe Gly Ser Thr Ala Lys Lys Ser Pro
580 585 590
Thr Ser Phe Cys Cys Glu Trp Gly Gly Gln Ala His Arg Gln Arg Asn
595 600 605
Thr Gly Met Glu Ile Leu Leu Trp Ile Leu Leu Lys Met Glu Ile Gln
610 615 620
Ile Phe Lys Ile Cys Leu Gly Glu Met Gln Leu Cys Thr Tyr Thr Pro
625 630 635 640
His Ile Cys Arg His Thr Cys Arg Gly Gly Pro Ser Ala Ser Asp Arg
645 650 655
Cys Cys Ser Cys Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly Arg Cys
660 665 670
Pro Val Gln Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu Arg Arg
675 680 685
Trp Gly Pro Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly Phe Gln
690 695 700
Leu Leu Arg Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro Arg Lys
705 710 715 720
Gly Pro Phe Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala Val Thr
725 730 735
Val Met Ala Gly Ser Val Pro Ser Ala Gln Ser Val Asp Ala Leu Glu
740 745 750
Ser Pro Gly Pro Leu Ala Leu Glu Gly Pro Ser Ser Pro Arg Asn Leu
755 760 765
Leu Trp Arg Glu Met Ser Ile Phe Leu Pro Gly Ile Phe Thr Ser Arg
770 775 780
Ile Leu Asn Leu Gln Val Leu Lys Lys Ile Leu Arg Ser Phe Met Lys
785 790 795 800
Leu Tyr His Ser Leu Val Met Cys Leu Arg Leu Arg Thr Lys Leu Glu
805 810 815
Lys Ala Leu Ser Ala Leu Phe Ile Trp Pro Gln His Ser Tyr Lys Gln
820 825 830
Arg Pro Pro Leu Gln Pro Val Gln Val Val Leu Arg Leu Gly Asn Leu
835 840 845
Pro Pro Phe Phe Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg
850 855 860
Thr Lys Met Leu Asn Gln Lys Cys Leu Ala Pro Phe Ile Thr His Pro
865 870 875 880
Phe Ala Ser Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln Ile
885 890 895
Arg Leu Leu Lys Pro Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe Ser
900 905 910
Asn Gln Leu Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu Lys Gln
915 920 925
Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile Pro Asn Phe
930 935 940
Phe Trp Ser Leu Gly Ile Gly His Thr Gly Ala Trp Trp His Thr Gly
945 950 955 960
Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr Val Ser Arg Ser Pro Leu
965 970 975
Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly Met Ala Phe Ala Ser Asp
980 985 990
Ser Ser Ile Arg Thr Thr Arg Val Ser Trp Cys Arg Arg Cys Gly Ala
995 1000 1005
Lys Ser Ala Ala Ala Ser Ser Leu Lys Lys Lys Pro Arg Asp Ile
1010 1015 1020
Cys Arg Ile Ser Asp Ser Lys Lys Met Thr Gln Lys Arg Glu Ser
1025 1030 1035
Thr Leu Gly Asn Phe Trp Met Lys Leu Leu Gln Leu Pro Asp Lys
1040 1045 1050
Lys Lys Lys Ser Thr Glu Lys Thr Lys Ile Ile Lys Lys Met Lys
1055 1060 1065
Lys Arg Ile Met Val His Met Cys Ser Ser Leu Ala Leu Pro Thr
1070 1075 1080
Gly Leu Thr Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala Val Leu
1085 1090 1095
Ile Ser Ser Ser Thr Ser His Phe Leu Met Arg Ser Pro Val Leu
1100 1105 1110
Pro Ser Ser Arg Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met
1115 1120 1125
Trp Thr Trp Ser Ser Trp Leu Lys Trp Leu Lys Asn Trp Lys Arg
1130 1135 1140
Phe Lys Leu Lys Lys Lys Tyr Ile Leu Ala Met Thr Leu Thr Leu
1145 1150 1155
Asn Gly His Pro Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser
1160 1165 1170
Leu Lys Gly Ser Arg Thr Ser Cys Cys Pro Arg Ser His Pro Arg
1175 1180 1185
Leu Pro Arg Thr Lys Trp Pro Leu Gln Cys Leu Leu His Ser Leu
1190 1195 1200
Gly Thr Thr Gly Thr Leu Val Trp Glu Arg Gly Val Leu Gln Met
1205 1210 1215
Arg Ser Leu Glu Ala His Cys Pro Leu Gln Thr Phe His Leu His
1220 1225 1230
His Cys Arg Thr Gln Pro Ser Ser Cys Pro Pro Ala Trp Ile Leu
1235 1240 1245
Tyr Gln Gly Gln Trp Ser Gly Ala Val Val Gly Leu Arg Pro Val
1250 1255 1260
Ala His His Leu Pro Arg Pro Ile Gln Gly Leu His Cys Pro Gln
1265 1270 1275
Ala Pro His Gln Pro Ala Leu Ser Trp Gly Lys Trp Pro Val Gly
1280 1285 1290
Met Thr Gly Pro Ala Arg Cys Cys Arg Trp Pro Arg Arg Glu Leu
1295 1300 1305
Lys Lys Asn Leu Leu Leu Pro Cys Arg Cys Arg Arg Glu Tyr Arg
1310 1315 1320
Val Thr Met Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp Phe Ser
1325 1330 1335
Ala Pro Gln Val Leu Lys Lys Asn Arg Lys Gln Asn Lys Ile Ile
1340 1345 1350
Cys Lys Gly His Arg Ile Thr Ser Leu Ile Leu Ser Phe Gln Arg
1355 1360 1365
Val Lys Leu Lys Lys Lys Val Asn Ala Cys Ser Pro Ala Cys Thr
1370 1375 1380
Ser Lys Ala Trp Thr Pro Arg Lys Leu Val Gly Arg Ala Val Arg
1385 1390 1395
Arg Lys Gly Ile Ile Cys Ile Lys Asn Met Phe Leu Gln Arg Lys
1400 1405 1410
Gly Phe Leu Asn Leu Ser His Val Glu Lys Phe Val Pro Pro Ser
1415 1420 1425
Pro Pro Leu Ala Leu Gly Pro Arg Met Gln Leu Cys Thr Gln Leu
1430 1435 1440
Ala Arg Phe Phe Pro Ile Thr Pro Pro Val Trp His Ile Leu Gly
1445 1450 1455
Pro Gln Arg His Thr Pro Cys Gln Lys Lys Val Pro Ser Ala Ser
1460 1465 1470
Pro Trp Gly Leu Arg Pro Ser Pro Cys Leu Ser Trp Ser Ser Arg
1475 1480 1485
Ile Val Ala Pro Gly His Ala Leu Ser Cys Arg Thr Arg Arg Arg
1490 1495 1500
Trp Ser Ser Lys
1505
<210> 1096
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 1A
<400> 1096
accgagatcc agctgaccat gaacgacagc aagcacaagc tggaaagccc cgctctgaaa 60
caggtgtcac cagcctctcc acctactcag cagcctcaga cacctcagga ttctagacag 120
gtgctggccc tggccaagaa aaccctgaca aatgcctcca gagccggaca gtttcctgtg 180
tggcggagaa caagcagagg catgagcctg cagtggaagt ccggcaatgc ctgcacacct 240
ctgagatgcc ctagcagaag ccctgccaca ttcctgacag ccctgaatgg ctggcacaga 300
tctggcctga gagcccagat gcctagctct tggtctagca gcggcagaac actgaagctg 360
gcccctctgc aagtgaccac cactctgaag ctgatcctgg tcatgctgga aatcgtgacc 420
gagcgctccc tgctgtactc cagaatgtgt ctggtgcaga tccccacaca cacctgggag 480
cccgattact tcgtgtccct gcctatgatg ttcagctggg ccacacagtc ttttcccgtg 540
ggcgccgtgt ttctgaccag acctgccatt ccttgctgca gctgtaccag ccacagcaac 600
ccttggagcc agagcaatca gcagctgaag tggacccctc acatcctgaa gtccgccagc 660
ttcgacaaga aaggcttcgt gatcctgagc cggcggagca agattgaggc ctctcctatc 720
ggctctatcg ccagctctcc tggacatcct ctgggaccta cactggccat cagattcatc 780
agcgcccctc agcctagcag ctctacagtg acagctgccc ctagcggcca gtactttatc 840
gccaagaagc ggatcaagct gcggcggaac aatatgggcg gcaacagatc catctgcctg 900
accagaaagc gcaagagaga gaagcggagc cagaagtcca ggcagaacca tctgcagctg 960
aaaagctgca gacggaagat cagcaactgg tccaagctga gaagcccctg gatcttcacc 1020
aagtgcgaga tctgcgtgaa gaacaccgcc atcctggcta tcaccctgat cacccctcag 1080
gaccctcatc tggaccctgt gtgtcaccct catagaaggc ctggatggaa gggccaccat 1140
agagtggtgt tctctcacca tcctagcggc agcacaaaga gccactggca gcaaagagaa 1200
cgcggaggcg gcagacgcga gaagaaggga tgtagagaac agcggaaggt ggtcaagaac 1260
ccctctcagc ccgtgcctct gagaaacgat ggcatcacca acggcaacga ctccaccaga 1320
agctgctcca tcagcctgaa gaaaagcctg gaaaagatgc ccctgatgcg gagagccaga 1380
cctaccagct gtagcacctg tagaatgtgg tggaagggca agaaacggcg gaaagaaatc 1440
gtgcctatga gcctggcctg cagcatcacc gtgtcttttg tgggacagat cagcaccctg 1500
gtgctggatg tgtctagcat cagccattgg cggctgccct gtaaagtgac cgagagcagc 1560
tccagcttct tctacaccag cgacaggacc cctctgagca tcagcagacc aaccagcaga 1620
gctagacaga gctgttgtct gcccggactg acacaccctg ctcaccaacc tctgggcagc 1680
atgagcacta gaagagagat gccaagccag gccacacctt ctccacctgg accttggaga 1740
gccgctctgg gcaaagaagt gaagagatcc cagagcaagc tgcgcctgag aaacacaagc 1800
cctggggaga agaacgatct ccagctgttc gtgatgagcg acaccaccta caagatctac 1860
tggacagtga tcctgctgaa cccctgcggc aacctgcacc tgaaaacaac atcactgcag 1920
cggccacctc ggagcatcct gtctctgaat ggaatctggg aagtgatgcc ccggacactg 1980
gaaggctgca tcagcgtgaa ggatcacaga accagccaga accacagcaa gtgcatcacc 2040
gaatgtgtgc ggactgccct gaacgtgtcc aagaagagac tgcctaagct gatgaagaag 2100
aaggacagca ccatcttcat caacaaagtg cgccagaact tcaagcgcaa cttcaagaag 2160
aagaaacccc tcactttcag ccccagcaga cggatgactc ggagaaccat gacaaccacc 2220
aaaatgatga tgatgcggcg gaccaagcgg agaaggcgca aaaggcggag aatgaccatg 2280
atgaccagac ggaccctgct gacaaagaaa acctgtctga cccctagaac cagcgccgcc 2340
acaaaagctc tgcctagaca gaccatcagc cagcggaggc ctattcagac cccacctgga 2400
acatctctgg ccatctgggg cagaacaaga ctgaccctga caggcaccag atccagcgga 2460
acaagagcct ctccttccgc cgtgtgcctg tgttgttgga cctgtccaag cagaagcttc 2520
ccagccgctt ctcctagtgg actgagagca cctgttggag cccaggctcc tcctgaagtg 2580
acactgagag cctcttgtgc ctctagcgcc tctaaagcct gtgctggact ttggccttgg 2640
ggagcccaag ttcgagttgg agctggaaca ggcggaggac ctgcttgtgt tcctgtggct 2700
gaagcttcta caggcgcatg gacagctgaa ggcgccgctg gaacaagatg tagagcctct 2760
agagcccctt gccgccaact tcctgctagc tcccctacca agtgtgaaat ttgtgtgaag 2820
cgcagacggc ggagaaagag aagcagccag tctagaagcc ccgtgcctaa aaagcgcgag 2880
aggatgatgc tgcctgtgcg ggccagaaca gctagatctg cacttcctca gggcagagca 2940
cctctggaag ggatgctgct tcctagagca ctgcctagcc tgctgagcag aatgcctgcc 3000
agaagagagt cccggttttg gctggctctg caggcacttg gactcagacc tccacatctg 3060
cctagctgtc atcctctgcc tcaactgttg ggccctccac ctcctcatca ggccccaatg 3120
acactgaagg ccctggttaa gacctggaca cagttccgca actaccccag agccgacaag 3180
aagaatgtcc ggtctaccgc cttcttcctg ctggacatca tcctgggcga ttgcccaaga 3240
acaatggccg gaccttctgc ctctctgcat cctgcatctg gcagagcctc cagaaagacc 3300
tggcagagaa ggctgagagc ttgtagagca ggcggacctg ctggatgggc tagacaggcc 3360
tatcctagac tgaaaacctt cggcgtgccc ctgggctcta ttctgtgtct ggccggcagc 3420
ctgtccacaa tgatgatcat tagcaccacc agacaagagt gcggcaggcg ggcttctgtg 3480
ccttgtagac ctatgatcgg aagcgccaga ccaggacctt ggcggacatc tgctatgcct 3540
agtgccatgg gagtcgccct gcctacctct tgtgaaagcg gaagatctcc tcctgccacc 3600
ggcggaagaa tgccaggatc tcagtctatc atgatgagct ggatgcctcc actggctcca 3660
tgtgccgctt gtccatgttc tcccgctcct acactgtgcc cagcacatcc tgctagagca 3720
ccaacagccg tgcctgcctt tacacctctg tctgctcatc ctgtgccagt gctgtctgga 3780
tgtcacctgg ccgtcagaac ctccatgctg acactgctgc ccatggaagc caaaaagagc 3840
atgaagcggt ccaacgctaa gaaaatggaa gatatgatct gggagagccg gctgccactg 3900
aggccacaaa gaggacctag acctctgcac agatggctgc agcagacaac cggctgtagc 3960
cagaggcgga tcgtgttctt tctggcccca tacttccctc ggcaccctca cagatctcca 4020
ccaacatctt gcccacctct gctggaagct ttcccactgc caagagcttc tctgagggcc 4080
acagtgccaa gacatagctc tgttctcgcc accggtctgc acctccacag acagatttct 4140
ctgcccctga gaggattcct cctgcaccaa ccactgccag gacagcatct gtggctgtct 4200
cacagactga ggctgagact gcccaggaca cagccatctt tgcctggacc atgtgcaagc 4260
ctgctgtcca cactgtctca gccaccacct caggctccat ctcaagtgtg gactgccgct 4320
acactgagat gtcctgctgt tcctgcagct gcctgtcctc ctgctctgag atccatgcct 4380
aagagccgga accaggtgct gttcagacgg aatctgaccc caagccagct gagaacactg 4440
gccccacctt atatgctgct gccccagtct ctgtcccaga gcctgagtag aaagcagatc 4500
cctagccagt ccatgctcgt g 4521
<210> 1097
<211> 4503
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 2A
<400> 1097
agaaagatgc agagcctgaa tcaccccagc agactgacca atggctctcc tccactgcac 60
ctgtgccagc ctctgagaat gagcagaacc cctcctagaa gagtgtgcgc cgctcctcca 120
catagactgc tgggcccttc cagatggaac cctcggagaa agacctggaa gatgcggaag 180
aagtacgccc agaagcctag ccagaagaac cacctgtacg gcggcaagaa gcgctctaag 240
ttcagcagaa gccacctgga cttcagcccc tactggatga agaaagtgaa ggtgctgttc 300
aaggccgacc agagcgagtc tagcctgagc agcggaagat gcagcctgat ggaacagatc 360
cctcacctga agtctcggcg gaagtggcag atcagacacg tgctgaagaa cctgtggctg 420
cccatgagaa gcctgggaga accttggaga gccggctttc agtggggaga gtctccttgg 480
caagtgatgg cctctctgac cggcagagcc acatttctgc tggccctttg ggaatgtagc 540
ctgcctcagg caagactgtg cctgatcgtg tctagaaccc tgctgctggt gcagagccgg 600
aacaagaaaa caaagctgtg gttcagcctg atcaacatcc accaccggaa gaacccactg 660
ctgcctatga gatggtggtg taccagaggc ggcggaaagc ggaaaaagaa aatgtgcaag 720
gtgtccggcg gctgcaccgc ctgtgttgag agatgtcctt ggaagggcat ctgctggaag 780
tggcctgtga cagtggccgc cattagaatg tgtgccctgt ctcaccctag cttctacatc 840
agcagcaccg tgtgctttct gagcaagcac tgcatgaccg cctgcaccag aaagagaatg 900
aagaccggcg ccatccaaga gaagggcgct attcaagaga aaggggccat gaccaagcgg 960
atctgcgtgg tcaatttcga ggcctgcaga gagatggaaa gcctgagcgc ccctgagaag 1020
atcaccctgt ttgaagccca catggcccgg tgcacctcca tcaatgtgct gtgtgtgcgg 1080
gccagcctga ttgagaagct gatgaaagaa aagcgcaaga tgaagcggaa ccaggtggcc 1140
tctccacaga tcatgcagcg gctgttcatc aagggctacc agaacaacca cttcaccttc 1200
catctgcaaa acttcgcctt cttcagctcc ttcggcaaca acaagtacat caatatcctg 1260
accatcctgt tccacgtgcg gaacatcgtg tacggcatcc aagtgatgct gtgcgctagc 1320
cctcagatta tgcagagaac cagcgccgac cggttccgga tgaagagaag aatgcagaat 1380
ctggacaacc tgggcgtgcc atggcctctg ttgcctggaa tcccatctct gaacgcccag 1440
tggatgttcc tgagaatcgc atccccgcaa atcatgcaga ggatgagcgc cgtgaacttc 1500
gagacaatcc gggccagaaa ccggaacatg aagaaaacca tgagccacct gatcgcccat 1560
caggccctga agatgagcgg cctgagactg tttcacccca gactgctgac acggaagaag 1620
cccggaaaac tgctgctcgc ccatatgtac ggcttcagca cctacggcac ccagaaaggc 1680
gagtgcgttt gtctgcagtg tctgagcggc agcagcctgt tcattctgaa gcagcccctg 1740
gacctgaaga tcagcaagac cttcatgggc cacagagagg gcagcgagtc tgataatctg 1800
ggcctgctgt atagcttccc tccaccttat cctatcagcg agggcctgac catgaccacc 1860
ggcagaaaca tcaacagcaa ctccctgatg accaactgcc tgttcagccc catcttcctg 1920
tgccaccacg ccatcatgca cagaaagatg acaagccctc acttcaggct gttcagcagc 1980
aagatcccac atcctcaggt gccatctgtg gtggccctgt gcaagttccg ggccttcatc 2040
cacacaccta gaagccctgg ctgcagcgtg tacgccaata tgtgctggcc caagttcttc 2100
ctgaccttca gccagcagtg gtccagcgtg acatctctgg aatggacagc ccaagagaga 2160
ggctgcagca gctggctgat gaagcagaca tggatgaagt cttggagcct gcgggacccc 2220
agctacagat ccatcctgga atacgtgtcc accagagtgc tgtggatgcc tacctctacc 2280
gtgctgcagg ctcatccaca agttccagct ctggctcctc aagcctggtg gcctgctaga 2340
agaggacctc tgacatctgc cccatccgct cagcagtccc tgaccagaga gaagattatc 2400
aaccccacca tcagctgccc ctttcagagc cccaccaaga gactgatcta ccctcctagc 2460
acctgttctc tgccctgcag aggcttcctg cctagcagat ttccttgggg cccacctcct 2520
ctgaacagcg tgatcgtgca caagatcgtg ctggtgttcc tgaagtccct gtccagctac 2580
aactgcgagc ggagaatcag cggcatccag aagagagcca tcgagttcgc cgtgctgaaa 2640
ctgctgaata tggacctgcc tctcgagaac acacagatcc ccagaacaag cccactgtgg 2700
aagatcacaa tggtgctgac ataccccaac tgcgtggtgc atgtgctgat gtttggcgcc 2760
ctgagagcca cagctcctgc tacagctgca cctcaggctc agacccctca ttggagagct 2820
gccacaacaa gcagcatgag cagcagccct agagccgagc ctacatcttc tagctcttgg 2880
gccacctgtt ggcccagatg ctgctccagc tcttgttact ggtcactgtc tagctggcct 2940
ccagctggcg ccgctgaagc tacaaatacc agaaccagaa gccgcgagag ccagaggggt 3000
agaatgctga cttggagaag ctccctgtgg ttgcagggca ccagatgttt tacaggcgtg 3060
cggaccagct ccagatacaa gaaaagaggc gtgatcgcct ggcggagaca gatcaataga 3120
cggaagctgc agagaaagaa gcactggaac agcgcctacc tgggcagaac actgctggtc 3180
acctgtatcc tgtatcaccg gtggatcgtg acctccatgt gtcagtccca gagatggctg 3240
accagcacca caagtagatc tagcgccctg atgtggaccg agctgagcct ggaaccatgg 3300
attccctacc tgcatcagca gaaaacccag cggacactgg aatccgccgg actgtttcct 3360
tggctgcaca cccagtgcca agagaagaaa agcagaaagc tgatgtccag ctgcacacac 3420
ccctgcacaa tgctgctgcc acagggatgt catcctgcct ggctgagccc tatctctgcc 3480
tgtccaagac tgctgccata tccttttcac gtgctggctc tggaagtgac ctttcctcct 3540
ggaaccgcca tgcctcagat gcagttgcag gctctggcta tgtgggagaa aggctgggat 3600
aagcctggca ccagcctgca gtgctacctg aacagaagaa gaaacagccg gaagcagagc 3660
caggtgcaac tggccattca ggtgctgctc gtggacaagc acaagtactt tctgttcggc 3720
caaaagaaag gccacatgat ctttagcctg gccaacggcc tgtggtttaa cctgattttc 3780
aactcccgga agaaactgct cgaggacatg aagcaaaatg gcttcaccgg caaaggcctg 3840
acacaccccg tgcctctgaa gcggactctg cagaacaaaa gaaacaagaa tatcaaacgc 3900
gtcaaccaga agaagggcaa catcaagcgg aagtccatcc tgctgcacct gattgtgctg 3960
aatagccccg agagcaacct gatcctgatc cagcatggcg gcatcttcac ctttcggttc 4020
tgggtcgaga agctgtcctg gaacatctgc aagaacctga gcctgtacct ggacaagttc 4080
gtgcagagac tgctgtacgt gtacatcatc gagacaaacg tgttcgtgct gaacctgttt 4140
catgtgcccg tgaaccagat cttcatgatg gccttctacc tgaagtacac cgagaaggcc 4200
tgggtcatgg aactggaatg gctgatccaa cagcagtgct atcagggcag ctgcggcaga 4260
gcttgttctt gtggaagagg ctgtggcacc cctagaggcg attggaagag acatcctcct 4320
cggagagcct tctggaagcc tcctagccag ggcatctcta gctgtctgat gaccggctgt 4380
tggctcgaga agaaagctac ctggatgcgg cggacccgcc ggaagaagag ggaagatcat 4440
tgcggactga gacaccccag ctggccttgg acaagatgtc tgaggatgag gcctccaaga 4500
agc 4503
<210> 1098
<211> 4518
<212> PRT
<213> Artificial Sequence
<220>
<223> polynucleotide 3A
<400> 1098
Gly Gly Ala Gly Cys Thr Gly Cys Thr Gly Cys Thr Gly Cys Cys Thr
1 5 10 15
Cys Thr Thr Gly Thr Cys Ala Gly Thr Cys Thr Cys Cys Thr Cys Cys
20 25 30
Thr Thr Cys Thr Cys Cys Thr Cys Gly Gly Gly Ala Ala Ala Cys Cys
35 40 45
Ala Cys Ala Cys Cys Thr Ala Gly Cys Thr Cys Cys Gly Ala Cys Gly
50 55 60
Cys Cys Ala Cys Cys Ala Gly Ala Cys Gly Gly Ala Cys Ala Ala Gly
65 70 75 80
Ala Cys Cys Thr Ala Thr Thr Gly Cys Cys Gly Cys Thr Cys Ala Gly
85 90 95
Ala Gly Cys Ala Ala Gly Ala Ala Ala Ala Cys Cys Ala Thr Gly Ala
100 105 110
Cys Ala Gly Cys Cys Gly Cys Cys Gly Gly Ala Cys Thr Gly Ala Cys
115 120 125
Cys Cys Cys Thr Ala Thr Gly Ala Thr Cys Cys Gly Gly Ala Ala Gly
130 135 140
Ala Thr Cys Cys Ala Gly Ala Ala Gly Cys Gly Gly Cys Gly Gly Ala
145 150 155 160
Gly Ala Ala Cys Cys Gly Cys Cys Ala Ala Cys Cys Gly Gly Thr Gly
165 170 175
Thr Cys Thr Gly Ala Gly Ala Gly Thr Thr Ala Gly Ala Thr Gly Thr
180 185 190
Gly Gly Cys Gly Gly Cys Thr Gly Gly Cys Thr Gly Thr Gly Thr Gly
195 200 205
Gly Cys Thr Gly Gly Ala Cys Ala Cys Cys Thr Ala Gly Ala Gly Gly
210 215 220
Ala Cys Ala Gly Ala Ala Cys Ala Cys Cys Ala Gly Ala Ala Gly Cys
225 230 235 240
Ala Cys Cys Ala Ala Cys Cys Thr Gly Gly Ala Ala Ala Ala Gly Ala
245 250 255
Ala Cys Cys Cys Cys Ala Gly Cys Cys Thr Gly Ala Ala Gly Ala Ala
260 265 270
Gly Cys Ala Gly Ala Gly Cys Cys Ala Gly Cys Gly Gly Ala Gly Ala
275 280 285
Gly Gly Ala Ala Ala Gly Cys Thr Gly Ala Gly Cys Ala Gly Cys Cys
290 295 300
Thr Gly Thr Thr Cys Thr Thr Cys Ala Gly Cys Cys Ala Cys Thr Gly
305 310 315 320
Cys Cys Thr Gly Thr Gly Cys Cys Gly Gly Ala Ala Cys Ala Gly Cys
325 330 335
Ala Gly Ala Ala Gly Gly Gly Cys Cys Ala Cys Ala Cys Cys Thr Ala
340 345 350
Cys Ala Thr Cys Thr Ala Ala Gly Gly Gly Cys Ala Gly Cys Cys Thr
355 360 365
Gly Cys Gly Gly Cys Gly Gly Ala Ala Gly Thr Ala Cys Cys Thr Gly
370 375 380
Ala Gly Ala Gly Thr Gly Cys Cys Thr Ala Thr Thr Cys Cys Thr Cys
385 390 395 400
Cys Ala Cys Ala Cys Cys Thr Gly Ala Gly Ala Cys Ala Cys Cys Cys
405 410 415
Thr Cys Thr Gly Cys Thr Gly Cys Thr Gly Ala Thr Gly Gly Ala Cys
420 425 430
Cys Thr Gly Gly Ala Cys Gly Gly Ala Ala Thr Gly Cys Thr Gly Ala
435 440 445
Cys Cys Gly Thr Gly Ala Thr Cys Gly Gly Ala Cys Ala Gly Gly Gly
450 455 460
Ala Cys Thr Cys Gly Thr Gly Gly Gly Cys Ala Thr Gly Ala Cys Cys
465 470 475 480
Cys Cys Thr Ala Gly Ala Gly Ala Thr Cys Thr Gly Gly Gly Ala Ala
485 490 495
Cys Ala Gly Thr Gly Gly Cys Thr Gly Gly Cys Gly Cys Cys Ala Cys
500 505 510
Cys Gly Cys Thr Cys Ala Gly Ala Thr Thr Cys Ala Gly Ala Gly Gly
515 520 525
Cys Cys Thr Ala Thr Thr Cys Ala Gly Gly Thr Gly Cys Ala Gly Ala
530 535 540
Cys Cys Gly Gly Cys Gly Gly Cys Ala Gly Ala Cys Thr Thr Ala Cys
545 550 555 560
Ala Cys Cys Thr Cys Cys Thr Cys Cys Thr Cys Thr Gly Ala Thr Thr
565 570 575
Cys Thr Gly Thr Gly Gly Cys Cys Thr Cys Ala Gly Gly Cys Cys Gly
580 585 590
Cys Thr Cys Cys Thr Gly Thr Thr Gly Ala Thr Cys Cys Thr Cys Cys
595 600 605
Thr Gly Gly Cys Thr Cys Thr Gly Thr Gly Thr Gly Gly Ala Thr Thr
610 615 620
Cys Thr Gly Cys Cys Cys Thr Gly Cys Ala Ala Gly Ala Ala Cys Ala
625 630 635 640
Ala Gly Ala Ala Gly Cys Gly Gly Ala Gly Ala Ala Ala Gly Cys Thr
645 650 655
Gly Cys Gly Gly Cys Cys Cys Ala Ala Gly Cys Gly Gly Cys Thr Gly
660 665 670
Gly Ala Cys Thr Thr Thr Cys Ala Cys Cys Cys Thr Ala Gly Ala Thr
675 680 685
Cys Thr Thr Cys Thr Ala Gly Cys Gly Gly Cys Gly Thr Gly Thr Cys
690 695 700
Cys Gly Thr Gly Ala Thr Cys Ala Cys Cys Ala Thr Gly Ala Ala Gly
705 710 715 720
Cys Thr Gly Thr Gly Gly Gly Ala Gly Ala Ala Gly Cys Ala Cys Thr
725 730 735
Thr Cys Ala Ala Gly Gly Gly Cys Cys Thr Gly Ala Ala Cys Thr Gly
740 745 750
Gly Ala Ala Cys Cys Thr Gly Gly Thr Cys Gly Thr Cys Thr Gly Gly
755 760 765
Ala Thr Thr Cys Thr Gly Ala Ala Cys Cys Thr Gly Ala Ala Gly Ala
770 775 780
Thr Gly Ala Thr Gly Ala Ala Cys Ala Thr Cys Gly Ala Gly Ala Thr
785 790 795 800
Cys Ala Cys Cys Cys Cys Thr Cys Ala Gly Cys Gly Gly Ala Gly Cys
805 810 815
Ala Ala Gly Gly Cys Cys Ala Gly Ala Ala Ala Gly Thr Cys Cys Gly
820 825 830
Gly Cys Gly Thr Gly Ala Thr Gly Ala Ala Gly Thr Gly Cys Thr Gly
835 840 845
Gly Gly Ala Thr Cys Thr Gly Thr Gly Cys Cys Cys Cys Ala Gly Cys
850 855 860
Gly Ala Gly Ala Ala Gly Ala Ala Gly Ala Gly Gly Ala Ala Gly Cys
865 870 875 880
Thr Gly Cys Cys Thr Cys Thr Gly Cys Cys Thr Cys Thr Gly Ala Cys
885 890 895
Cys Thr Thr Cys Ala Gly Cys Ala Cys Cys Cys Thr Gly Cys Thr Gly
900 905 910
Thr Gly Gly Gly Ala Cys Thr Cys Thr Ala Gly Ala Cys Ala Thr Ala
915 920 925
Gly Ala Gly Gly Cys Gly Cys Cys Ala Gly Cys Thr Cys Cys Ala Gly
930 935 940
Cys Ala Cys Cys Ala Gly Cys Ala Gly Ala Gly Ala Cys Thr Cys Cys
945 950 955 960
Ala Gly Ala Ala Gly Cys Thr Thr Thr Thr Thr Cys Ala Cys Cys Ala
965 970 975
Gly Cys Gly Cys Thr Cys Ala Cys Cys Cys Cys Ala Gly Cys Ala Gly
980 985 990
Ala Cys Cys Cys Thr Gly Cys Ala Gly Ala Ala Thr Gly Ala Gly Ala
995 1000 1005
Cys Thr Gly Thr Ala Cys Cys Ala Gly Thr Thr Cys Cys Thr Gly
1010 1015 1020
Ala Thr Cys Cys Ala Cys Cys Thr Gly Ala Gly Ala Ala Ala Gly
1025 1030 1035
Gly Thr Gly Gly Ala Cys Ala Cys Cys Cys Ala Cys Cys Ala Thr
1040 1045 1050
Cys Thr Gly Cys Ala Gly Gly Thr Cys Gly Thr Gly Ala Cys Cys
1055 1060 1065
Ala Ala Gly Ala Cys Cys Gly Thr Gly Ala Cys Ala Gly Cys Cys
1070 1075 1080
Ala Cys Ala Ala Cys Ala Gly Cys Thr Gly Ala Cys Gly Gly Cys
1085 1090 1095
Cys Ala Gly Ala Gly Ala Ala Thr Gly Cys Gly Gly Ala Gly Ala
1100 1105 1110
Cys Thr Gly Ala Ala Gly Thr Gly Cys Ala Ala Gly Gly Cys Cys
1115 1120 1125
Thr Gly Cys Cys Gly Gly Cys Thr Gly Ala Gly Ala Thr Gly Gly
1130 1135 1140
Gly Cys Thr Ala Gly Ala Cys Cys Thr Gly Ala Ala Cys Cys Thr
1145 1150 1155
Gly Cys Thr Gly Cys Thr Cys Ala Gly Gly Cys Cys Cys Cys Thr
1160 1165 1170
Cys Cys Ala Ala Ala Gly Ala Gly Cys Cys Ala Cys Thr Thr Thr
1175 1180 1185
Cys Cys Ala Cys Cys Thr Cys Ala Thr Cys Cys Thr Ala Gly Cys
1190 1195 1200
Gly Gly Cys Cys Cys Thr Ala Gly Cys Ala Gly Ala Ala Cys Cys
1205 1210 1215
Ala Gly Thr Thr Cys Thr Cys Thr Gly Cys Ala Gly Cys Thr Gly
1220 1225 1230
Cys Gly Gly Ala Gly Cys Ala Thr Cys Cys Cys Thr Cys Ala Cys
1235 1240 1245
Gly Thr Gly Cys Cys Ala Ala Ala Ala Gly Cys Cys Ala Cys Ala
1250 1255 1260
Gly Cys Cys Gly Cys Thr Cys Ala Cys Ala Gly Cys Gly Thr Gly
1265 1270 1275
Ala Cys Ala Gly Thr Gly Ala Ala Gly Cys Thr Gly Cys Ala Gly
1280 1285 1290
Ala Ala Gly Gly Gly Ala Ala Ala Gly Ala Ala Cys Ala Gly Cys
1295 1300 1305
Cys Cys Cys Thr Gly Cys Thr Gly Cys Cys Ala Ala Ala Ala Gly
1310 1315 1320
Ala Ala Ala Cys Thr Gly Cys Gly Gly Gly Thr Gly Cys Ala Gly
1325 1330 1335
Ala Ala Thr Cys Ala Gly Gly Gly Cys Cys Ala Thr Cys Thr Gly
1340 1345 1350
Cys Thr Gly Ala Thr Gly Ala Thr Cys Cys Thr Gly Cys Thr Gly
1355 1360 1365
Cys Ala Cys Ala Ala Thr Ala Cys Cys Thr Ala Cys Ala Thr Gly
1370 1375 1380
Gly Ala Ala Ala Thr Gly Cys Ala Cys Thr Ala Cys Gly Gly Cys
1385 1390 1395
Cys Ala Thr Cys Ala Gly Gly Cys Cys Cys Cys Ala Cys Ala Gly
1400 1405 1410
Gly Thr Gly Gly Cys Cys Ala Thr Gly Cys Thr Gly Cys Cys Thr
1415 1420 1425
Ala Ala Gly Cys Thr Gly Cys Thr Gly Thr Gly Cys Ala Gly Ala
1430 1435 1440
Cys Ala Gly Ala Thr Gly Cys Thr Gly Cys Cys Cys Ala Cys Thr
1445 1450 1455
Cys Thr Gly Ala Gly Cys Ala Cys Ala Cys Thr Gly Cys Ala Gly
1460 1465 1470
Cys Ala Ala Ala Gly Ala Cys Ala Cys Cys Cys Ala Cys Ala Gly
1475 1480 1485
Gly Gly Cys Cys Cys Thr Thr Gly Thr Cys Cys Thr Cys Cys Ala
1490 1495 1500
Cys Cys Thr Gly Thr Gly Ala Cys Ala Cys Cys Ala Cys Thr Gly
1505 1510 1515
Ala Gly Ala Gly Thr Cys Cys Ala Gly Thr Cys Thr Gly Thr Cys
1520 1525 1530
Cys Thr Gly Cys Thr Gly Cys Thr Gly Gly Gly Ala Gly Thr Gly
1535 1540 1545
Cys Cys Thr Cys Ala Gly Ala Cys Ala Gly Cys Thr Gly Cys Thr
1550 1555 1560
Ala Gly Ala Cys Ala Gly Cys Cys Thr Ala Gly Cys Ala Gly Ala
1565 1570 1575
Cys Cys Cys Ala Cys Cys Gly Gly Cys Ala Gly Ala Ala Cys Cys
1580 1585 1590
Cys Cys Thr Ala Cys Cys Ala Cys Ala Ala Gly Ala Cys Thr Gly
1595 1600 1605
Ala Thr Gly Gly Cys Cys Cys Cys Thr Gly Thr Cys Gly Gly Cys
1610 1615 1620
Ala Gly Cys Gly Thr Gly Ala Thr Gly Ala Gly Cys Thr Gly Thr
1625 1630 1635
Thr Cys Thr Cys Thr Gly Cys Thr Gly Ala Cys Cys Cys Ala Gly
1640 1645 1650
Cys Cys Thr Thr Cys Thr Cys Cys Ala Gly Cys Cys Ala Gly Cys
1655 1660 1665
Gly Cys Cys Thr Gly Thr Ala Cys Ala Ala Thr Gly Cys Cys Thr
1670 1675 1680
Cys Cys Ala Cys Thr Gly Cys Thr Gly Cys Ala Thr Cys Cys Thr
1685 1690 1695
Cys Ala Gly Thr Gly Gly Gly Cys Cys Cys Cys Ala Cys Ala Thr
1700 1705 1710
Thr Cys Thr Gly Cys Thr Gly Gly Ala Thr Thr Gly Thr Cys Thr
1715 1720 1725
Cys Cys Cys Gly Gly Cys Gly Cys Thr Thr Gly Cys Ala Gly Ala
1730 1735 1740
Cys Cys Thr Gly Cys Cys Thr Gly Thr Ala Cys Cys Thr Gly Thr
1745 1750 1755
Ala Thr Cys Ala Gly Cys Ala Thr Gly Ala Cys Cys Ala Cys Cys
1760 1765 1770
Ala Thr Cys Thr Cys Cys Ala Gly Ala Gly Cys Cys Ala Cys Cys
1775 1780 1785
Thr Gly Gly Cys Ala Gly Gly Thr Thr Thr Cys Cys Gly Thr Gly
1790 1795 1800
Thr Ala Cys Ala Gly Cys Gly Gly Cys Ala Ala Thr Cys Thr Gly
1805 1810 1815
Cys Thr Gly Ala Gly Cys Thr Thr Cys Thr Cys Cys Ala Gly Ala
1820 1825 1830
Cys Gly Gly Gly Gly Cys Ala Thr Gly Ala Ala Gly Ala Gly Thr
1835 1840 1845
Ala Gly Cys Gly Thr Gly Cys Gly Gly Cys Thr Gly Ala Ala Ala
1850 1855 1860
Ala Ala Cys Ala Gly Cys Cys Gly Gly Cys Gly Gly Ala Ala Cys
1865 1870 1875
Ala Gly Ala Cys Gly Gly Thr Ala Cys Ala Gly Ala Ala Ala Gly
1880 1885 1890
Ala Thr Cys Thr Ala Cys Gly Gly Cys Gly Ala Gly Cys Thr Gly
1895 1900 1905
Ala Ala Gly Ala Thr Gly Thr Cys Cys Cys Thr Gly Cys Ala Gly
1910 1915 1920
Gly Cys Cys Gly Thr Gly Gly Cys Thr Cys Cys Thr Ala Gly Ala
1925 1930 1935
Thr Gly Thr Cys Cys Thr Ala Gly Ala Thr Cys Thr Gly Cys Cys
1940 1945 1950
Gly Thr Gly Gly Ala Cys Ala Thr Cys Ala Gly Cys Cys Cys Cys
1955 1960 1965
Gly Gly Ala Cys Cys Thr Ala Cys Cys Thr Cys Thr Cys Cys Thr
1970 1975 1980
Ala Gly Cys Cys Thr Gly Gly Cys Cys Thr Cys Thr Thr Gly Thr
1985 1990 1995
Gly Cys Cys Thr Cys Thr Gly Thr Gly Gly Cys Cys Ala Thr Thr
2000 2005 2010
Gly Gly Ala Ala Ala Ala Cys Thr Gly Gly Cys Cys Cys Thr Gly
2015 2020 2025
Cys Thr Thr Gly Gly Cys Gly Cys Thr Thr Cys Thr Gly Cys Cys
2030 2035 2040
Cys Cys Thr Thr Gly Thr Gly Gly Thr Gly Cys Thr Gly Cys Thr
2045 2050 2055
Gly Gly Cys Gly Cys Thr Ala Gly Ala Gly Ala Gly Gly Cys Thr
2060 2065 2070
Gly Gly Ala Ala Gly Ala Thr Thr Thr Gly Cys Cys Gly Thr Gly
2075 2080 2085
Cys Thr Gly Gly Gly Cys Ala Cys Cys Ala Thr Gly Gly Thr Cys
2090 2095 2100
Ala Thr Gly Ala Ala Gly Cys Ala Cys Cys Thr Gly Ala Ala Cys
2105 2110 2115
Cys Gly Cys Ala Ala Gly Cys Thr Gly Cys Ala Thr Cys Thr Gly
2120 2125 2130
Ala Cys Cys Cys Gly Gly Thr Cys Cys Thr Gly Cys Cys Thr Gly
2135 2140 2145
Ala Thr Cys Gly Ala Thr Cys Thr Gly Ala Cys Cys Ala Thr Gly
2150 2155 2160
Ala Thr Gly Ala Thr Gly Ala Gly Cys Cys Ala Gly Ala Ala Gly
2165 2170 2175
Cys Thr Cys Thr Gly Gly Ala Ala Gly Ala Ala Cys Cys Ala Gly
2180 2185 2190
Cys Gly Gly Ala Ala Gly Ala Gly Ala Ala Thr Cys Cys Cys Thr
2195 2200 2205
Cys Thr Gly Cys Cys Ala Thr Cys Thr Cys Cys Thr Ala Gly Ala
2210 2215 2220
Cys Ala Gly Cys Ala Thr Cys Thr Gly Cys Thr Cys Cys Cys Thr
2225 2230 2235
Cys Ala Gly Thr Ala Cys Cys Cys Thr Cys Thr Gly Cys Ala Cys
2240 2245 2250
Cys Cys Thr Cys Cys Thr Cys Cys Ala Cys Cys Thr Thr Gly Thr
2255 2260 2265
Cys Thr Gly Cys Thr Gly Cys Thr Gly Cys Thr Cys Cys Ala Cys
2270 2275 2280
Cys Ala Cys Ala Gly Ala Cys Ala Cys Cys Ala Cys Cys Thr Gly
2285 2290 2295
Gly Cys Cys Thr Thr Thr Cys Thr Gly Gly Ala Ala Ala Thr Gly
2300 2305 2310
Gly Cys Cys Thr Gly Cys Ala Gly Cys Ala Gly Cys Cys Ala Gly
2315 2320 2325
Cys Ala Cys Ala Cys Cys Cys Ala Cys Thr Cys Cys Ala Thr Cys
2330 2335 2340
Ala Ala Gly Ala Thr Cys Thr Gly Gly Ala Thr Cys Ala Gly Cys
2345 2350 2355
Thr Thr Thr Ala Gly Cys Cys Ala Cys Gly Ala Gly Cys Ala Gly
2360 2365 2370
Ala Gly Cys Ala Gly Cys Cys Cys Ala Thr Thr Cys Cys Thr Gly
2375 2380 2385
Gly Cys Cys Ala Gly Ala Thr Cys Cys Thr Gly Gly Ala Ala Cys
2390 2395 2400
Ala Cys Cys Ala Thr Gly Cys Ala Gly Thr Gly Gly Ala Ala Cys
2405 2410 2415
Ala Ala Cys Ala Ala Gly Ala Ala Ala Ala Thr Gly Gly Cys Cys
2420 2425 2430
Ala Thr Gly Ala Cys Ala Gly Thr Gly Ala Thr Cys Gly Cys Thr
2435 2440 2445
Gly Gly Cys Gly Cys Cys Cys Ala Cys Cys Ala Cys Thr Gly Thr
2450 2455 2460
Cys Ala Gly Thr Ala Cys Ala Ala Gly Cys Thr Gly Ala Cys Cys
2465 2470 2475
Thr Ala Cys Ala Cys Cys Ala Ala Ala Gly Thr Gly Thr Gly Gly
2480 2485 2490
Ala Ala Gly Ala Thr Gly Ala Ala Thr Thr Gly Gly Ala Ala Gly
2495 2500 2505
Ala Ala Ala Ala Thr Gly Ala Thr Gly Ala Thr Cys Gly Gly Cys
2510 2515 2520
Thr Cys Cys Cys Ala Gly Cys Ala Cys Cys Thr Cys Cys Thr Gly
2525 2530 2535
Thr Thr Cys Ala Gly Cys Cys Cys Thr Cys Thr Gly Gly Ala Thr
2540 2545 2550
Ala Gly Cys Thr Cys Thr Cys Cys Ala Cys Thr Gly Cys Ala Ala
2555 2560 2565
Cys Thr Gly Cys Thr Gly Cys Thr Thr Cys Ala Cys Cys Cys Thr
2570 2575 2580
Cys Ala Cys Gly Gly Cys Ala Ala Gly Ala Gly Ala Thr Gly Cys
2585 2590 2595
Ala Ala Cys Cys Cys Thr Thr Gly Cys Thr Gly Cys Ala Gly Ala
2600 2605 2610
Cys Thr Gly Ala Cys Ala Thr Gly Gly Ala Thr Gly Thr Cys Cys
2615 2620 2625
Ala Thr Gly Cys Thr Gly Cys Ala Gly Ala Ala Ala Cys Ala Gly
2630 2635 2640
Thr Gly Cys Thr Gly Cys Thr Ala Cys Ala Ala Cys Cys Thr Cys
2645 2650 2655
Gly Thr Gly Ala Thr Cys Ala Ala Gly Cys Ala Cys Cys Cys Ala
2660 2665 2670
Cys Thr Gly Ala Thr Cys Thr Thr Cys Ala Gly Ala Ala Thr Cys
2675 2680 2685
Ala Ala Cys Cys Thr Gly Cys Gly Gly Ala Gly Ala Cys Ala Gly
2690 2695 2700
Gly Gly Cys Ala Ala Gly Ala Cys Cys Ala Ala Gly Gly Ala Thr
2705 2710 2715
Gly Gly Cys Gly Thr Thr Gly Thr Gly Cys Ala Gly Ala Gly Cys
2720 2725 2730
Cys Thr Gly Gly Gly Cys Thr Thr Cys Cys Thr Gly Ala Ala Cys
2735 2740 2745
Cys Ala Gly Cys Ala Gly Ala Thr Cys Ala Thr Cys Cys Thr Gly
2750 2755 2760
Cys Ala Gly Ala Ala Ala Gly Ala Gly Thr Thr Cys Thr Thr Cys
2765 2770 2775
Ala Thr Cys Thr Gly Cys Cys Thr Gly Cys Thr Cys Ala Thr Gly
2780 2785 2790
Thr Thr Thr Ala Thr Cys Ala Ala Gly Cys Gly Gly Thr Gly Gly
2795 2800 2805
Ala Ala Gly Cys Cys Thr Gly Cys Cys Gly Cys Cys Ala Cys Cys
2810 2815 2820
Ala Ala Gly Ala Gly Ala Gly Ala Gly Thr Gly Gly Gly Ala Gly
2825 2830 2835
Ala Ala Ala Cys Gly Cys Ala Ala Gly Cys Ala Gly Ala Thr Cys
2840 2845 2850
Cys Thr Cys Gly Gly Cys Gly Gly Ala Gly Gly Cys Gly Gly Cys
2855 2860 2865
Ala Ala Gly Thr Ala Cys Ala Ala Ala Gly Ala Gly Thr Ala Cys
2870 2875 2880
Thr Thr Cys Cys Thr Gly Ala Ala Gly Cys Gly Cys Ala Thr Cys
2885 2890 2895
Cys Thr Gly Ala Thr Thr Cys Gly Gly Ala Ala Gly Gly Cys Cys
2900 2905 2910
Ala Thr Gly Ala Cys Thr Gly Thr Gly Cys Thr Gly Gly Cys Cys
2915 2920 2925
Gly Gly Cys Gly Ala Cys Ala Ala Gly Ala Ala Ala Gly Gly Cys
2930 2935 2940
Cys Thr Gly Gly Gly Cys Ala Gly Ala Thr Thr Cys Ala Thr Gly
2945 2950 2955
Ala Gly Ala Thr Gly Cys Gly Thr Gly Cys Ala Gly Ala Gly Cys
2960 2965 2970
Gly Ala Gly Ala Cys Ala Ala Ala Gly Gly Cys Cys Gly Thr Thr
2975 2980 2985
Ala Gly Cys Cys Thr Gly Cys Ala Gly Cys Thr Cys Cys Cys Ala
2990 2995 3000
Cys Thr Cys Gly Gly Ala Ala Gly Ala Gly Gly Cys Cys Cys Thr
3005 3010 3015
Gly Thr Gly Thr Ala Cys Thr Ala Cys Gly Thr Gly Thr Gly Cys
3020 3025 3030
Ala Ala Cys Cys Gly Gly Ala Thr Gly Ala Ala Cys Gly Thr Gly
3035 3040 3045
Thr Cys Cys Ala Gly Cys Gly Thr Gly Cys Thr Gly Ala Ala Gly
3050 3055 3060
Cys Cys Cys Thr Thr Cys Cys Thr Gly Thr Thr Cys Ala Cys Cys
3065 3070 3075
Gly Thr Gly Cys Cys Thr Ala Thr Cys Gly Ala Gly Gly Ala Cys
3080 3085 3090
Ala Thr Gly Ala Gly Ala Gly Ala Gly Thr Gly Cys Ala Cys Ala
3095 3100 3105
Cys Thr Gly Gly Gly Cys Cys Gly Cys Ala Ala Cys Ala Gly Ala
3110 3115 3120
Ala Thr Gly Ala Ala Thr Gly Thr Gly Thr Cys Cys Thr Cys Thr
3125 3130 3135
Gly Thr Gly Cys Thr Gly Ala Ala Ala Cys Cys Cys Thr Gly Thr
3140 3145 3150
Cys Thr Gly Ala Thr Cys Cys Cys Thr Gly Thr Gly Cys Cys Ala
3155 3160 3165
Ala Thr Cys Gly Ala Cys Cys Thr Gly Cys Cys Thr Cys Gly Gly
3170 3175 3180
Ala Thr Gly Cys Thr Gly Cys Cys Ala Ala Thr Cys Ala Gly Cys
3185 3190 3195
Ala Gly Cys Cys Cys Ala Cys Thr Gly Cys Ala Cys Ala Gly Ala
3200 3205 3210
Cys Cys Cys Cys Ala Gly Ala Thr Gly Cys Cys Ala Thr Thr Cys
3215 3220 3225
Thr Gly Gly Ala Cys Cys Thr Gly Cys Ala Cys Cys Thr Thr Thr
3230 3235 3240
Cys Cys Thr Gly Cys Cys Ala Cys Ala Ala Cys Ala Thr Gly Gly
3245 3250 3255
Gly Gly Cys Ala Cys Cys Thr Gly Gly Gly Ala Gly Ala Cys Ala
3260 3265 3270
Cys Cys Thr Thr Cys Thr Ala Cys Ala Thr Gly Gly Gly Gly Cys
3275 3280 3285
Thr Gly Gly Cys Gly Gly Ala Cys Cys Thr Thr Thr Cys Gly Gly
3290 3295 3300
Gly Gly Cys Cys Cys Thr Ala Gly Ala Ala Gly Ala Ala Ala Ala
3305 3310 3315
Gly Thr Gly Cys Thr Gly Ala Thr Gly Gly Thr Gly Cys Thr Gly
3320 3325 3330
Thr Gly Gly Cys Thr Gly Cys Cys Cys Gly Cys Cys Ala Ala Cys
3335 3340 3345
Cys Ala Gly Ala Gly Thr Cys Thr Gly Cys Ala Gly Ala Ala Ala
3350 3355 3360
Ala Gly Cys Cys Ala Ala Gly Thr Gly Thr Thr Cys Cys Ala Gly
3365 3370 3375
Thr Gly Gly Gly Thr Cys Cys Thr Gly Cys Gly Gly Ala Cys Cys
3380 3385 3390
Gly Ala Gly Ala Ala Cys Ala Thr Cys Cys Gly Gly Ala Ala Gly
3395 3400 3405
Cys Thr Gly Ala Thr Cys Thr Gly Gly Ala Cys Cys Ala Ala Gly
3410 3415 3420
Cys Ala Gly Cys Gly Gly Ala Gly Cys Thr Thr Cys Cys Thr Gly
3425 3430 3435
Thr Cys Thr Cys Thr Gly Thr Thr Cys Cys Cys Cys Ala Ala Gly
3440 3445 3450
Cys Thr Gly Ala Gly Ala Gly Cys Cys Ala Cys Cys Gly Ala Ala
3455 3460 3465
Cys Ala Gly Ala Thr Gly Ala Cys Cys Ala Ala Thr Gly Thr Gly
3470 3475 3480
Gly Gly Cys Thr Gly Cys Gly Cys Cys Thr Thr Cys Ala Gly Cys
3485 3490 3495
Gly Gly Cys Cys Gly Gly Ala Thr Thr Cys Thr Gly Cys Ala Thr
3500 3505 3510
Cys Ala Ala Cys Cys Thr Gly Ala Ala Ala Thr Gly Gly Cys Cys
3515 3520 3525
Gly Cys Cys Ala Thr Gly Cys Gly Gly Cys Thr Gly Ala Thr Gly
3530 3535 3540
Cys Cys Cys Ala Ala Gly Thr Thr Cys Cys Thr Gly Ala Ala Thr
3545 3550 3555
Ala Gly Cys Ala Cys Cys Ala Ala Cys Ala Gly Cys Thr Gly Gly
3560 3565 3570
Thr Gly Gly Ala Cys Cys Thr Gly Thr Ala Cys Cys Ala Ala Cys
3575 3580 3585
Cys Thr Gly Ala Gly Cys Gly Thr Gly Cys Cys Cys Ala Thr Gly
3590 3595 3600
Ala Thr Gly Cys Thr Gly Ala Cys Cys Ala Thr Thr Cys Thr Gly
3605 3610 3615
Ala Thr Thr Thr Gly Gly Ala Ala Gly Cys Gly Gly Gly Thr Gly
3620 3625 3630
Thr Thr Cys Ala Thr Thr Cys Thr Cys Cys Thr Gly Cys Thr Gly
3635 3640 3645
Thr Cys Cys Gly Ala Cys Ala Ala Gly Ala Ala Gly Cys Thr Gly
3650 3655 3660
Cys Thr Gly Ala Ala Gly Ala Ala Gly Thr Cys Thr Ala Gly Cys
3665 3670 3675
Cys Ala Gly Cys Thr Gly Ala Gly Gly Cys Gly Gly Thr Cys Thr
3680 3685 3690
Thr Gly Gly Ala Gly Ala Ala Ala Cys Gly Thr Gly Thr Cys Cys
3695 3700 3705
Cys Gly Gly Ala Thr Cys Ala Gly Cys Cys Ala Cys Cys Ala Gly
3710 3715 3720
Ala Thr Gly Ala Ala Gly Thr Gly Thr Cys Thr Gly Ala Cys Cys
3725 3730 3735
Gly Cys Cys Gly Thr Gly Gly Ala Cys Thr Gly Thr Cys Thr Gly
3740 3745 3750
Cys Ala Gly Gly Cys Cys Thr Thr Cys Thr Gly Gly Gly Ala Cys
3755 3760 3765
Ala Thr Gly Ala Ala Cys Ala Thr Gly Gly Ala Ala Cys Ala Cys
3770 3775 3780
Cys Gly Gly Cys Thr Gly Ala Cys Cys Ala Thr Gly Gly Ala Cys
3785 3790 3795
Ala Gly Cys Gly Cys Cys Cys Thr Gly Ala Gly Cys Cys Thr Gly
3800 3805 3810
Ala Cys Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Gly Ala
3815 3820 3825
Cys Cys Cys Gly Ala Gly Ala Cys Thr Thr Gly Cys Ala Ala Gly
3830 3835 3840
Ala Ala Gly Ala Ala Gly Cys Thr Cys Cys Thr Gly Cys Thr Gly
3845 3850 3855
Ala Ala Ala Cys Thr Gly Cys Thr Gly Ala Cys Ala Ala Thr Gly
3860 3865 3870
Ala Gly Cys Cys Thr Gly Ala Gly Cys Ala Ala Cys Ala Thr Cys
3875 3880 3885
Cys Thr Gly Ala Thr Gly Ala Ala Gly Thr Thr Cys Cys Gly Gly
3890 3895 3900
Cys Thr Gly Cys Gly Gly Cys Thr Gly Ala Gly Ala Ala Thr Cys
3905 3910 3915
Cys Cys Ala Ala Gly Cys Cys Thr Gly Ala Gly Gly Ala Ala Gly
3920 3925 3930
Thr Ala Thr Cys Gly Cys Cys Ala Gly Cys Ala Thr Cys Thr Gly
3935 3940 3945
Ala Ala Ala Ala Ala Gly Ala Cys Cys Ala Gly Cys Gly Cys Cys
3950 3955 3960
Ala Ala Gly Gly Gly Cys Gly Ala Gly Ala Ala Gly Cys Thr Gly
3965 3970 3975
Ala Ala Gly Cys Ala Cys Thr Gly Cys Thr Thr Thr Ala Ala Gly
3980 3985 3990
Gly Cys Thr Thr Gly Gly Gly Gly Cys Ala Gly Ala Gly Gly Cys
3995 4000 4005
Cys Cys Ala Cys Cys Thr Cys Thr Gly Cys Ala Cys Ala Cys Ala
4010 4015 4020
Ala Gly Ala Ala Gly Cys Cys Ala Gly Ala Ala Gly Ala Ala Ala
4025 4030 4035
Gly Ala Cys Cys Cys Thr Gly Cys Cys Gly Gly Cys Ala Ala Gly
4040 4045 4050
Cys Thr Gly Ala Ala Ala Ala Ala Ala Cys Thr Gly Ala Cys Cys
4055 4060 4065
Ala Cys Ala Cys Thr Gly Ala Gly Cys Thr Thr Cys Gly Thr Gly
4070 4075 4080
Cys Thr Gly Ala Thr Cys Gly Ala Gly Gly Ala Ala Cys Gly Gly
4085 4090 4095
Cys Gly Gly Ala Ala Cys Cys Thr Gly Cys Ala Gly Cys Gly Gly
4100 4105 4110
Ala Ala Thr Cys Thr Gly Ala Ala Ala Gly Thr Cys Cys Thr Gly
4115 4120 4125
Thr Gly Gly Cys Thr Cys Ala Ala Gly Ala Ala Ala Ala Gly Cys
4130 4135 4140
Ala Cys Cys Ala Ala Gly Ala Gly Cys Cys Gly Gly Thr Ala Thr
4145 4150 4155
Cys Thr Gly Thr Thr Cys Thr Thr Cys Cys Thr Gly Ala Cys Cys
4160 4165 4170
Gly Thr Gly Thr Gly Cys Gly Gly Cys Thr Thr Cys Thr Thr Cys
4175 4180 4185
Gly Ala Gly Ala Ala Gly Ala Ala Ala Cys Gly Gly Cys Cys Thr
4190 4195 4200
Gly Ala Gly Thr Gly Gly Cys Thr Gly Thr Cys Cys Thr Cys Cys
4205 4210 4215
Ala Gly Ala Ala Ala Gly Ala Ala Gly Gly Gly Ala Cys Ala Cys
4220 4225 4230
Ala Cys Ala Ala Ala Gly Ala Ala Thr Cys Gly Gly Ala Gly Gly
4235 4240 4245
Ala Ala Gly Gly Cys Cys Ala Ala Gly Cys Gly Gly Ala Ala Gly
4250 4255 4260
Cys Cys Cys Cys Ala Gly Ala Thr Cys Gly Thr Gly Cys Ala Cys
4265 4270 4275
Ala Ala Gly Ala Ala Gly Ala Gly Ala Gly Gly Cys Cys Thr Gly
4280 4285 4290
Thr Thr Cys Cys Thr Cys Ala Ala Ala Ala Ala Gly Ala Ala Ala
4295 4300 4305
Thr Ala Cys Cys Thr Gly Gly Thr Gly Cys Ala Gly Gly Gly Cys
4310 4315 4320
Gly Cys Cys Ala Ala Gly Ala Ala Gly Ala Thr Cys Ala Cys Cys
4325 4330 4335
Thr Thr Cys Cys Thr Gly Thr Cys Cys Ala Ala Cys Gly Gly Cys
4340 4345 4350
Ala Thr Gly Gly Ala Ala Gly Cys Thr Thr Gly Cys Gly Gly Cys
4355 4360 4365
Ala Cys Ala Cys Ala Cys Cys Cys Cys Ala Cys Ala Cys Cys Ala
4370 4375 4380
Ala Gly Ala Cys Thr Gly Ala Gly Cys Gly Ala Cys Ala Gly Ala
4385 4390 4395
Gly Thr Gly Thr Thr Cys Cys Thr Gly Gly Thr Cys Ala Ala Gly
4400 4405 4410
Ala Thr Cys Ala Cys Cys Ala Cys Cys Ala Cys Cys Ala Cys Ala
4415 4420 4425
Ala Gly Cys Ala Gly Cys Cys Cys Cys Ala Gly Ala Ala Gly Ala
4430 4435 4440
Ala Gly Cys Cys Cys Ala Gly Cys Ala Cys Thr Gly Ala Gly Ala
4445 4450 4455
Gly Cys Thr Ala Gly Ala Gly Gly Cys Gly Gly Cys Ala Cys Cys
4460 4465 4470
Ala Cys Ala Ala Thr Thr Gly Gly Cys Gly Ala Ala Gly Thr Gly
4475 4480 4485
Ala Cys Cys Ala Gly Cys Cys Thr Gly Thr Gly Cys Thr Thr Cys
4490 4495 4500
Thr Thr Cys Thr Ala Cys Cys Thr Gly Cys Thr Gly Thr Ala Cys
4505 4510 4515
<210> 1099
<211> 4521
<212> PRT
<213> Artificial Sequence
<220>
<223> polynucleotide 4A
<400> 1099
Ala Thr Cys Cys Ala Gly Ala Ala Gly Ala Ala Gly Ala Ala Ala Cys
1 5 10 15
Ala Gly Ala Ala Ala Thr Cys Cys Ala Thr Gly Gly Cys Cys Ala Ala
20 25 30
Gly Ala Ala Gly Thr Cys Cys Cys Ala Gly Cys Ala Gly Cys Cys Thr
35 40 45
Cys Thr Gly Gly Thr Gly Cys Thr Gly Ala Ala Gly Ala Ala Gly Ala
50 55 60
Ala Cys Cys Gly Gly Ala Ala Gly Cys Ala Ala Gly Ala Gly Thr Gly
65 70 75 80
Gly Gly Gly Ala Gly Gly Ala Cys Ala Gly Gly Cys Cys Cys Ala Cys
85 90 95
Ala Gly Ala Cys Ala Gly Ala Gly Ala Ala Ala Cys Ala Ala Cys Gly
100 105 110
Cys Cys Ala Ala Gly Ala Ala Gly Ala Thr Gly Cys Cys Cys Thr Thr
115 120 125
Cys Cys Ala Ala Gly Ala Gly Gly Ala Ala Ala Ala Gly Ala Ala Gly
130 135 140
Ala Ala Cys Gly Gly Cys Cys Gly Gly Ala Thr Cys Ala Gly Cys Ala
145 150 155 160
Gly Cys Ala Gly Cys Cys Thr Gly Ala Thr Cys Cys Thr Gly Ala Gly
165 170 175
Cys Thr Thr Cys Cys Ala Gly Ala Gly Ala Gly Thr Gly Ala Ala Gly
180 185 190
Gly Ala Cys Ala Gly Cys Ala Ala Gly Ala Ala Ala Ala Thr Gly Ala
195 200 205
Cys Cys Cys Ala Gly Ala Ala Gly Ala Thr Gly Thr Gly Cys Ala Gly
210 215 220
Cys Thr Cys Thr Cys Thr Gly Gly Cys Cys Cys Thr Gly Cys Cys Thr
225 230 235 240
Ala Cys Ala Gly Gly Cys Cys Thr Gly Ala Cys Ala Thr Cys Thr Cys
245 250 255
Thr Gly Ala Thr Cys Cys Thr Gly Cys Cys Thr Ala Gly Cys Ala Gly
260 265 270
Cys Gly Ala Thr Cys Thr Gly Gly Cys Cys Gly Thr Gly Cys Thr Gly
275 280 285
Ala Thr Cys Thr Cys Thr Ala Gly Cys Ala Gly Cys Ala Cys Cys Ala
290 295 300
Gly Cys Cys Ala Cys Thr Thr Thr Cys Thr Gly Ala Thr Gly Cys Gly
305 310 315 320
Gly Ala Gly Cys Cys Cys Thr Gly Thr Gly Cys Thr Gly Cys Cys Ala
325 330 335
Ala Gly Cys Thr Cys Cys Ala Gly Ala Cys Thr Gly Ala Cys Ala Thr
340 345 350
Gly Thr Gly Cys Cys Thr Cys Thr Cys Cys Ala Cys Ala Gly Cys Thr
355 360 365
Gly Cys Cys Cys Cys Gly Gly Ala Thr Gly Thr Gly Gly Ala Cys Ala
370 375 380
Thr Gly Gly Thr Cys Thr Ala Gly Cys Thr Gly Gly Cys Thr Gly Ala
385 390 395 400
Ala Gly Cys Ala Cys Cys Cys Cys Ala Gly Ala Ala Cys Cys Gly Cys
405 410 415
Thr Ala Gly Cys Ala Thr Cys Ala Cys Ala Cys Thr Gly Cys Cys Thr
420 425 430
Ala Cys Cys Ala Cys Ala Ala Gly Cys Cys Thr Gly Ala Ala Gly Gly
435 440 445
Gly Cys Ala Gly Cys Ala Gly Ala Ala Cys Cys Ala Gly Cys Thr Gly
450 455 460
Cys Thr Gly Cys Cys Cys Ala Ala Gly Ala Thr Cys Thr Cys Ala Cys
465 470 475 480
Cys Cys Cys Ala Gly Ala Cys Thr Gly Cys Cys Thr Ala Gly Gly Ala
485 490 495
Cys Cys Ala Ala Gly Thr Gly Gly Cys Cys Thr Cys Thr Gly Cys Ala
500 505 510
Gly Thr Gly Thr Cys Thr Gly Cys Thr Gly Cys Ala Cys Ala Gly Cys
515 520 525
Cys Thr Gly Gly Gly Ala Ala Cys Ala Ala Cys Ala Gly Gly Cys Ala
530 535 540
Cys Ala Cys Thr Cys Gly Thr Thr Thr Gly Gly Gly Ala Ala Ala Gly
545 550 555 560
Gly Gly Gly Cys Gly Thr Gly Cys Thr Gly Cys Ala Gly Ala Thr Gly
565 570 575
Ala Gly Ala Ala Gly Cys Cys Thr Cys Gly Ala Ala Gly Cys Cys Cys
580 585 590
Ala Thr Thr Gly Thr Cys Cys Thr Cys Thr Gly Cys Ala Gly Ala Cys
595 600 605
Cys Thr Thr Cys Cys Ala Thr Cys Thr Gly Cys Ala Cys Cys Ala Cys
610 615 620
Thr Gly Cys Ala Gly Ala Ala Cys Cys Cys Ala Gly Cys Cys Ala Ala
625 630 635 640
Gly Cys Thr Cys Thr Thr Gly Thr Cys Cys Thr Cys Cys Thr Gly Cys
645 650 655
Cys Thr Gly Gly Ala Thr Thr Cys Thr Gly Thr Ala Cys Cys Ala Ala
660 665 670
Gly Gly Cys Cys Ala Gly Thr Gly Gly Ala Gly Cys Gly Gly Ala Gly
675 680 685
Cys Cys Gly Thr Cys Gly Thr Thr Gly Gly Ala Cys Thr Thr Ala Gly
690 695 700
Ala Cys Cys Cys Gly Thr Gly Gly Cys Thr Cys Ala Cys Cys Ala Thr
705 710 715 720
Cys Thr Gly Cys Cys Thr Ala Gly Ala Cys Cys Thr Ala Thr Cys Cys
725 730 735
Ala Gly Gly Gly Cys Cys Thr Gly Cys Ala Cys Thr Gly Thr Cys Cys
740 745 750
Thr Cys Ala Gly Gly Cys Thr Cys Cys Thr Cys Ala Thr Cys Ala Ala
755 760 765
Cys Cys Thr Gly Cys Thr Cys Thr Gly Ala Gly Cys Thr Gly Gly Gly
770 775 780
Gly Ala Ala Ala Gly Thr Gly Gly Cys Cys Cys Gly Thr Gly Gly Gly
785 790 795 800
Ala Ala Thr Gly Ala Cys Ala Gly Gly Ala Cys Cys Thr Gly Cys Cys
805 810 815
Ala Gly Ala Thr Gly Cys Thr Gly Thr Cys Gly Gly Thr Gly Gly Cys
820 825 830
Cys Cys Cys Gly Cys Ala Gly Ala Thr Cys Thr Cys Ala Gly Ala Ala
835 840 845
Gly Thr Cys Thr Cys Ala Gly Cys Ala Thr Cys Ala Cys Thr Gly Cys
850 855 860
Gly Cys Cys Cys Thr Gly Cys Gly Gly Ala Ala Gly Ala Thr Cys Gly
865 870 875 880
Ala Gly Thr Gly Gly Gly Cys Cys Ala Cys Ala Ala Ala Ala Cys Thr
885 890 895
Gly Thr Cys Thr Cys Thr Cys Gly Gly Cys Gly Gly Ala Ala Ala Ala
900 905 910
Gly Cys Cys Gly Gly Ala Cys Cys Ala Cys Ala Gly Gly Cys Thr Cys
915 920 925
Ala Ala Gly Ala Gly Ala Ala Gly Gly Cys Cys Ala Gly Ala Cys Cys
930 935 940
Thr Thr Cys Thr Cys Cys Thr Thr Gly Cys Cys Thr Gly Thr Cys Cys
945 950 955 960
Thr Gly Gly Thr Cys Cys Ala Gly Cys Ala Gly Ala Ala Thr Thr Gly
965 970 975
Thr Gly Gly Cys Cys Cys Cys Thr Gly Gly Ala Cys Ala Cys Gly Cys
980 985 990
Cys Cys Thr Gly Ala Gly Cys Thr Gly Thr Cys Gly Gly Ala Cys Thr
995 1000 1005
Cys Gly Thr Ala Gly Ala Ala Gly Ala Thr Gly Gly Thr Cys Cys
1010 1015 1020
Thr Cys Cys Ala Ala Gly Thr Gly Cys Ala Gly Ala Gly Gly Cys
1025 1030 1035
Gly Gly Cys Cys Cys Thr Ala Gly Cys Gly Cys Cys Ala Gly Cys
1040 1045 1050
Gly Ala Thr Ala Gly Ala Thr Gly Thr Thr Gly Thr Ala Gly Cys
1055 1060 1065
Thr Gly Thr Ala Gly Cys Cys Cys Cys Ala Gly Cys Gly Gly Cys
1070 1075 1080
Thr Thr Cys Ala Gly Cys Gly Cys Cys Gly Gly Ala Ala Gly Ala
1085 1090 1095
Gly Gly Cys Ala Gly Ala Thr Gly Thr Cys Cys Thr Gly Thr Gly
1100 1105 1110
Cys Ala Gly Gly Gly Ala Thr Gly Thr Cys Thr Gly Ala Gly Gly
1115 1120 1125
Cys Cys Ala Cys Ala Cys Ala Gly Ala Gly Thr Thr Cys Ala Gly
1130 1135 1140
Cys Thr Gly Cys Thr Gly Ala Gly Ala Ala Gly Ala Thr Gly Gly
1145 1150 1155
Gly Gly Cys Cys Cys Ala Gly Gly Ala Thr Cys Thr Cys Cys Thr
1160 1165 1170
Gly Cys Thr Gly Gly Cys Cys Ala Gly Ala Gly Ala Cys Thr Gly
1175 1180 1185
Thr Cys Thr Ala Ala Gly Gly Gly Cys Thr Thr Cys Cys Ala Ala
1190 1195 1200
Cys Thr Gly Cys Thr Gly Cys Gly Thr Thr Gly Gly Thr Gly Gly
1205 1210 1215
Gly Gly Ala Cys Cys Thr Gly Gly Ala Thr Cys Thr Cys Cys Ala
1220 1225 1230
Gly Cys Thr Cys Cys Thr Gly Ala Gly Cys Cys Thr Ala Gly Ala
1235 1240 1245
Ala Ala Gly Gly Gly Cys Cys Cys Ala Thr Thr Thr Cys Cys Thr
1250 1255 1260
Cys Cys Ala Cys Cys Thr Gly Ala Thr Cys Cys Thr Cys Cys Ala
1265 1270 1275
Thr Gly Gly Cys Cys Thr Gly Thr Gly Ala Cys Cys Gly Cys Thr
1280 1285 1290
Gly Thr Gly Ala Cys Ala Gly Thr Gly Ala Thr Gly Gly Cys Thr
1295 1300 1305
Gly Gly Cys Thr Cys Thr Gly Thr Gly Cys Cys Thr Ala Gly Cys
1310 1315 1320
Gly Cys Ala Cys Ala Gly Thr Cys Thr Gly Thr Gly Gly Ala Thr
1325 1330 1335
Gly Cys Cys Cys Thr Gly Gly Ala Ala Thr Cys Thr Cys Cys Thr
1340 1345 1350
Gly Gly Ala Cys Cys Thr Cys Thr Gly Gly Cys Thr Cys Thr Gly
1355 1360 1365
Gly Ala Ala Gly Gly Cys Cys Cys Thr Ala Gly Cys Ala Gly Cys
1370 1375 1380
Cys Cys Thr Ala Gly Ala Ala Ala Cys Cys Thr Gly Cys Thr Gly
1385 1390 1395
Thr Gly Gly Cys Gly Gly Gly Ala Ala Ala Thr Gly Ala Gly Cys
1400 1405 1410
Ala Thr Cys Thr Thr Thr Cys Thr Gly Cys Cys Cys Gly Gly Cys
1415 1420 1425
Ala Thr Cys Thr Thr Cys Thr Gly Cys Cys Ala Ala Ala Ala Gly
1430 1435 1440
Ala Ala Gly Gly Thr Gly Cys Cys Ala Thr Cys Thr Gly Cys Cys
1445 1450 1455
Ala Gly Cys Cys Cys Cys Thr Gly Gly Gly Gly Ala Cys Thr Thr
1460 1465 1470
Gly Thr Thr Cys Cys Thr Cys Cys Thr Thr Cys Thr Cys Cys Ala
1475 1480 1485
Cys Cys Ala Cys Thr Cys Gly Cys Thr Cys Thr Gly Gly Gly Cys
1490 1495 1500
Cys Cys Thr Ala Gly Ala Ala Thr Gly Cys Ala Gly Cys Thr Gly
1505 1510 1515
Thr Gly Thr Ala Cys Cys Cys Ala Gly Cys Thr Cys Gly Cys Cys
1520 1525 1530
Ala Gly Ala Thr Thr Cys Thr Thr Cys Cys Cys Cys Ala Thr Cys
1535 1540 1545
Ala Cys Ala Cys Cys Thr Cys Cys Ala Gly Thr Gly Thr Gly Gly
1550 1555 1560
Cys Ala Cys Ala Thr Cys Cys Thr Gly Gly Gly Ala Cys Cys Thr
1565 1570 1575
Cys Ala Gly Ala Gly Ala Cys Ala Cys Ala Cys Ala Cys Cys Thr
1580 1585 1590
Cys Ala Gly Gly Thr Gly Gly Thr Cys Cys Thr Gly Ala Gly Ala
1595 1600 1605
Cys Thr Gly Gly Gly Cys Ala Ala Cys Cys Thr Gly Cys Cys Thr
1610 1615 1620
Cys Cys Ala Thr Thr Cys Thr Thr Cys Ala Gly Ala Gly Gly Cys
1625 1630 1635
Ala Gly Cys Gly Ala Gly Gly Thr Gly Cys Cys Cys Thr Thr Thr
1640 1645 1650
Cys Cys Thr Ala Gly Ala Cys Cys Thr Thr Gly Cys Cys Gly Gly
1655 1660 1665
Ala Cys Cys Ala Ala Gly Ala Ala Cys Gly Ala Gly Gly Gly Cys
1670 1675 1680
Ala Ala Cys Ala Ala Thr Cys Ala Cys Thr Gly Gly Cys Cys Cys
1685 1690 1695
Ala Gly Ala Gly Thr Gly Gly Ala Ala Ala Thr Gly Cys Cys Thr
1700 1705 1710
Ala Cys Cys Gly Gly Cys Thr Gly Gly Cys Thr Gly Cys Thr Cys
1715 1720 1725
Gly Thr Gly Gly Gly Cys Thr Ala Cys Ala Ala Cys Ala Cys Cys
1730 1735 1740
Ala Gly Ala Ala Ala Cys Ala Cys Ala Gly Cys Cys Cys Ala Gly
1745 1750 1755
Ala Ala Thr Cys Cys Thr Cys Gly Gly Cys Thr Gly Cys Ala Gly
1760 1765 1770
Cys Ala Gly Cys Ala Thr Cys Thr Gly Ala Ala Ala Cys Ala Cys
1775 1780 1785
Thr Gly Gly Cys Ala Gly Cys Ala Gly Thr Gly Cys Ala Cys Ala
1790 1795 1800
Cys Gly Gly Gly Cys Cys Ala Gly Ala Thr Gly Gly Thr Gly Thr
1805 1810 1815
Cys Ala Ala Gly Ala Gly Cys Cys Thr Thr Gly Thr Cys Ala Gly
1820 1825 1830
Ala Cys Cys Cys Thr Gly Ala Cys Cys Thr Thr Cys Thr Thr Cys
1835 1840 1845
Cys Ala Cys Thr Thr Cys Thr Thr Cys Thr Thr Cys Thr Thr Thr
1850 1855 1860
Thr Thr Cys Ala Ala Ala Ala Cys Gly Gly Thr Gly Thr Cys Cys
1865 1870 1875
Cys Thr Gly Thr Gly Thr Thr Gly Thr Cys Cys Cys Gly Gly Cys
1880 1885 1890
Thr Gly Gly Thr Cys Cys Ala Ala Ala Gly Gly Ala Cys Ala Ala
1895 1900 1905
Cys Cys Thr Cys Cys Ala Cys Cys Thr Cys Cys Thr Gly Gly Cys
1910 1915 1920
Cys Thr Gly Ala Ala Gly Cys Cys Thr Thr Cys Thr Ala Gly Cys
1925 1930 1935
Cys Thr Gly Gly Cys Thr Thr Cys Thr Cys Ala Gly Gly Thr Gly
1940 1945 1950
Gly Cys Cys Ala Gly Ala Ala Cys Cys Ala Cys Ala Gly Gly Cys
1955 1960 1965
Gly Thr Gly Thr Ala Cys Cys Ala Gly Cys Ala Cys Gly Thr Gly
1970 1975 1980
Thr Gly Gly Cys Thr Gly Ala Thr Cys Thr Gly Cys Thr Thr Cys
1985 1990 1995
Gly Thr Gly Thr Thr Cys Thr Thr Cys Gly Thr Gly Thr Gly Cys
2000 2005 2010
Gly Thr Gly Gly Ala Ala Ala Cys Cys Gly Gly Cys Thr Thr Cys
2015 2020 2025
Thr Gly Thr Cys Ala Cys Gly Thr Gly Gly Cys Ala Cys Ala Ala
2030 2035 2040
Gly Thr Gly Gly Gly Cys Cys Thr Cys Gly Ala Gly Ala Gly Ala
2045 2050 2055
Cys Thr Gly Gly Thr Thr Thr Cys Thr Cys Thr Gly Ala Gly Cys
2060 2065 2070
Gly Gly Cys Ala Thr Cys Ala Cys Cys Gly Ala Cys Gly Thr Gly
2075 2080 2085
Ala Ala Cys Cys Ala Thr Thr Gly Gly Gly Cys Cys Cys Ala Gly
2090 2095 2100
Cys Cys Thr Ala Ala Gly Cys Cys Ala Thr Cys Thr Cys Cys Thr
2105 2110 2115
Ala Gly Cys Ala Ala Ala Gly Gly Cys Ala Cys Cys Gly Gly Cys
2120 2125 2130
Ala Thr Gly Ala Ala Cys Ala Gly Ala Cys Cys Cys Ala Thr Cys
2135 2140 2145
Gly Gly Cys Cys Thr Gly Ala Gly Ala Gly Thr Thr Gly Gly Cys
2150 2155 2160
Ala Ala Ala Gly Gly Cys Gly Thr Gly Thr Gly Gly Gly Cys Cys
2165 2170 2175
Ala Gly Ala Cys Thr Gly Cys Thr Cys Ala Ala Gly Ala Ala Gly
2180 2185 2190
Ala Ala Gly Cys Cys Thr Ala Gly Ala Gly Ala Cys Ala Thr Cys
2195 2200 2205
Thr Gly Thr Cys Gly Gly Ala Thr Cys Thr Cys Cys Ala Ala Cys
2210 2215 2220
Ala Gly Ala Ala Ala Gly Ala Cys Cys Cys Gly Gly Ala Ala Gly
2225 2230 2235
Gly Cys Cys Gly Cys Cys Ala Gly Ala Gly Ala Gly Ala Ala Gly
2240 2245 2250
Cys Ala Cys Cys Gly Cys Ala Ala Ala Ala Cys Ala Gly Ala Thr
2255 2260 2265
Ala Gly Ala Gly Cys Cys Ala Gly Cys Gly Thr Gly Thr Cys Cys
2270 2275 2280
Thr Thr Cys Thr Gly Gly Ala Cys Thr Cys Thr Gly Cys Thr Gly
2285 2290 2295
Cys Cys Thr Ala Cys Ala Ala Cys Ala Gly Gly Cys Gly Thr Gly
2300 2305 2310
Cys Gly Gly Ala Cys Ala Ala Gly Ala Gly Gly Ala Ala Gly Cys
2315 2320 2325
Cys Cys Thr Cys Thr Gly Ala Gly Ala Cys Thr Gly Ala Cys Thr
2330 2335 2340
Cys Thr Gly Thr Gly Gly Cys Cys Thr Cys Cys Thr Ala Gly Ala
2345 2350 2355
Thr Gly Cys Ala Gly Ala Thr Gly Cys Ala Gly Ala Cys Gly Cys
2360 2365 2370
Gly Ala Gly Thr Ala Cys Ala Gly Ala Gly Thr Gly Ala Cys Cys
2375 2380 2385
Ala Thr Gly Ala Ala Cys Ala Thr Cys Cys Thr Gly Ala Ala Cys
2390 2395 2400
Ala Gly Cys Cys Thr Gly Cys Cys Ala Ala Gly Cys Ala Gly Cys
2405 2410 2415
Ala Thr Gly Gly Ala Ala Ala Thr Cys Gly Cys Cys Gly Thr Gly
2420 2425 2430
Cys Thr Gly Cys Ala Ala Gly Ala Ala Ala Cys Cys Gly Cys Cys
2435 2440 2445
Ala Ala Gly Ala Ala Ala Ala Gly Cys Cys Cys Thr Ala Cys Cys
2450 2455 2460
Ala Gly Cys Thr Thr Cys Thr Gly Cys Thr Gly Cys Ala Ala Cys
2465 2470 2475
Cys Thr Gly Gly Ala Cys Cys Thr Gly Cys Ala Gly Cys Ala Thr
2480 2485 2490
Cys Ala Gly Cys Gly Cys Ala Gly Ala Cys Gly Cys Ala Ala Ala
2495 2500 2505
Ala Ala Gly Ala Ala Gly Ala Ala Ala Gly Ala Cys Ala Ala Gly
2510 2515 2520
Gly Thr Cys Gly Ala Gly Ala Thr Cys Cys Gly Gly Ala Ala Thr
2525 2530 2535
Cys Gly Gly Ala Gly Cys Cys Cys Cys Ala Ala Gly Gly Cys Cys
2540 2545 2550
Ala Ala Thr Ala Gly Cys Ala Cys Ala Gly Ala Gly Thr Gly Thr
2555 2560 2565
Cys Ala Gly Gly Gly Cys Gly Ala Gly Cys Ala Cys Ala Gly Cys
2570 2575 2580
Ala Gly Ala Gly Ala Gly Cys Ala Gly Ala Ala Thr Cys Thr Gly
2585 2590 2595
Cys Thr Gly Ala Ala Thr Cys Thr Gly Gly Thr Gly Cys Ala Gly
2600 2605 2610
Cys Thr Gly Ala Ala Thr Cys Cys Thr Cys Ala Cys Ala Gly Cys
2615 2620 2625
Cys Cys Thr Cys Ala Cys Cys Ala Cys Cys Gly Gly Ala Ala Gly
2630 2635 2640
Gly Ala Cys Gly Ala Ala Gly Ala Gly Gly Ala Cys Cys Ala Cys
2645 2650 2655
Cys Ala Gly Ala Ala Gly Ala Gly Ala Cys Ala Cys Cys Ala Cys
2660 2665 2670
Cys Ala Cys Cys Ala Cys Ala Ala Thr Cys Ala Ala Ala Ala Gly
2675 2680 2685
Ala Ala Gly Ala Thr Gly Ala Gly Cys Gly Thr Cys Cys Cys Ala
2690 2695 2700
Cys Thr Gly Thr Thr Cys Thr Thr Cys Cys Ala Cys Gly Gly Cys
2705 2710 2715
Gly Ala Cys Cys Thr Gly Thr Gly Thr Ala Gly Ala Gly Ala Gly
2720 2725 2730
Ala Gly Cys Ala Cys Cys Cys Thr Gly Gly Gly Cys Ala Ala Thr
2735 2740 2745
Thr Thr Cys Thr Gly Gly Ala Thr Gly Ala Ala Gly Cys Thr Gly
2750 2755 2760
Cys Thr Cys Cys Ala Gly Cys Thr Gly Cys Cys Thr Cys Ala Gly
2765 2770 2775
Ala Gly Gly Cys Cys Thr Cys Cys Ala Cys Thr Gly Cys Ala Ala
2780 2785 2790
Cys Cys Ala Gly Thr Gly Ala Cys Cys Gly Gly Ala Ala Thr Gly
2795 2800 2805
Gly Ala Ala Ala Thr Cys Cys Thr Gly Cys Thr Thr Thr Gly Gly
2810 2815 2820
Ala Thr Thr Cys Thr Gly Cys Thr Gly Ala Ala Gly Ala Thr Gly
2825 2830 2835
Gly Ala Ala Ala Thr Thr Cys Ala Gly Ala Thr Cys Thr Thr Cys
2840 2845 2850
Ala Ala Gly Ala Thr Thr Thr Gly Cys Cys Thr Gly Gly Gly Cys
2855 2860 2865
Gly Ala Gly Ala Thr Gly Cys Ala Gly Cys Thr Cys Thr Gly Cys
2870 2875 2880
Ala Cys Cys Thr Cys Thr Cys Gly Gly Ala Thr Thr Cys Thr Gly
2885 2890 2895
Ala Ala Cys Cys Thr Gly Cys Ala Ala Gly Thr Gly Cys Thr Gly
2900 2905 2910
Ala Ala Ala Ala Ala Gly Ala Thr Cys Cys Thr Gly Cys Gly Gly
2915 2920 2925
Ala Gly Cys Thr Thr Thr Ala Thr Gly Ala Ala Gly Cys Thr Gly
2930 2935 2940
Thr Ala Cys Cys Ala Cys Ala Gly Cys Cys Thr Cys Gly Thr Gly
2945 2950 2955
Ala Thr Gly Thr Gly Cys Cys Thr Gly Cys Gly Gly Cys Thr Gly
2960 2965 2970
Ala Gly Gly Ala Cys Cys Ala Ala Gly Cys Thr Gly Gly Ala Ala
2975 2980 2985
Ala Ala Gly Gly Cys Thr Cys Thr Gly Ala Gly Cys Gly Cys Cys
2990 2995 3000
Cys Thr Gly Thr Thr Cys Ala Thr Cys Thr Gly Gly Cys Cys Thr
3005 3010 3015
Cys Ala Gly Cys Ala Cys Thr Cys Cys Thr Ala Cys Ala Ala Gly
3020 3025 3030
Ala Thr Cys Ala Cys Ala Cys Ala Cys Cys Cys Ala Thr Thr Cys
3035 3040 3045
Gly Cys Cys Ala Gly Cys Cys Ala Gly Cys Cys Ala Cys Thr Gly
3050 3055 3060
Gly Gly Ala Cys Ala Ala Gly Ala Gly Ala Thr Gly Cys Cys Cys
3065 3070 3075
Ala Ala Cys Ala Ala Cys Ala Cys Cys Cys Ala Gly Ala Thr Cys
3080 3085 3090
Cys Gly Gly Cys Thr Gly Cys Thr Gly Ala Ala Gly Cys Cys Cys
3095 3100 3105
Gly Ala Cys Ala Ala Gly Ala Ala Gly Ala Ala Gly Ala Ala Ala
3110 3115 3120
Ala Gly Cys Ala Cys Cys Gly Ala Ala Ala Ala Gly Ala Cys Cys
3125 3130 3135
Ala Ala Ala Gly Gly Cys Cys Ala Gly Gly Cys Thr Thr Thr Cys
3140 3145 3150
Gly Gly Cys Ala Gly Cys Thr Thr Cys Thr Cys Cys Gly Cys Cys
3155 3160 3165
Gly Ala Thr Thr Thr Thr Thr Cys Ala Gly Cys Cys Cys Cys Thr
3170 3175 3180
Cys Ala Ala Gly Gly Ala Cys Ala Gly Gly Cys Thr Thr Thr Thr
3185 3190 3195
Gly Gly Cys Thr Cys Cys Cys Thr Gly Thr Gly Thr Cys Ala Gly
3200 3205 3210
Cys Thr Gly Gly Thr Gly Thr Cys Cys Gly Cys Cys Gly Ala Cys
3215 3220 3225
Thr Thr Thr Ala Gly Cys Gly Cys Cys Cys Cys Ala Cys Ala Ala
3230 3235 3240
Gly Thr Gly Ala Cys Cys Ala Gly Ala Cys Thr Gly Cys Gly Gly
3245 3250 3255
Ala Gly Cys Cys Thr Gly Ala Ala Cys Cys Ala Thr Cys Thr Gly
3260 3265 3270
Cys Thr Gly Ala Thr Thr Thr Gly Gly Cys Thr Gly Ala Ala Gly
3275 3280 3285
Ala Ala Thr Thr Gly Gly Ala Ala Gly Cys Gly Gly Thr Thr Cys
3290 3295 3300
Ala Ala Gly Cys Thr Cys Ala Ala Ala Ala Ala Gly Ala Ala Ala
3305 3310 3315
Thr Ala Thr Cys Ala Gly Gly Cys Cys Cys Cys Thr Cys Thr Gly
3320 3325 3330
Cys Gly Gly Cys Thr Gly Thr Gly Gly Thr Cys Thr Thr Gly Gly
3335 3340 3345
Thr Gly Cys Gly Gly Ala Ala Cys Ala Ala Gly Cys Cys Ala Gly
3350 3355 3360
Ala Cys Cys Thr Ala Cys Thr Thr Cys Gly Gly Cys Ala Gly Cys
3365 3370 3375
Ala Thr Cys Ala Thr Cys Thr Gly Thr Ala Thr Cys Ala Ala Gly
3380 3385 3390
Ala Ala Thr Ala Thr Gly Thr Thr Cys Cys Thr Gly Cys Ala Gly
3395 3400 3405
Cys Gly Gly Ala Ala Gly Gly Gly Thr Thr Thr Cys Cys Thr Gly
3410 3415 3420
Ala Ala Cys Cys Thr Gly Ala Gly Cys Cys Ala Cys Gly Thr Gly
3425 3430 3435
Gly Ala Ala Ala Ala Gly Thr Thr Cys Gly Ala Gly Cys Thr Thr
3440 3445 3450
Ala Ala Gly Ala Ala Gly Ala Ala Thr Cys Thr Thr Cys Thr Gly
3455 3460 3465
Cys Thr Cys Cys Cys Cys Gly Thr Cys Gly Thr Gly Ala Thr Cys
3470 3475 3480
Ala Ala Cys Cys Thr Gly Ala Ala Gly Ala Gly Ala Cys Thr Gly
3485 3490 3495
Cys Ala Gly Ala Ala Ala Thr Thr Cys Ala Thr Gly Cys Thr Gly
3500 3505 3510
Ala Ala Cys Cys Ala Gly Ala Ala Gly Thr Gly Cys Cys Thr Gly
3515 3520 3525
Gly Cys Thr Cys Cys Ala Thr Thr Thr Cys Cys Thr Gly Cys Cys
3530 3535 3540
Thr Gly Cys Ala Cys Cys Ala Gly Cys Ala Ala Ala Gly Cys Cys
3545 3550 3555
Thr Gly Gly Ala Cys Ala Cys Cys Cys Ala Gly Ala Ala Ala Ala
3560 3565 3570
Cys Thr Cys Gly Thr Gly Gly Gly Cys Ala Gly Ala Gly Cys Cys
3575 3580 3585
Gly Thr Gly Cys Gly Gly Ala Gly Ala Ala Ala Gly Gly Gly Cys
3590 3595 3600
Ala Thr Thr Cys Thr Gly Gly Cys Cys Ala Thr Gly Ala Cys Ala
3605 3610 3615
Cys Thr Gly Ala Cys Cys Cys Thr Gly Ala Ala Cys Gly Gly Ala
3620 3625 3630
Ala Thr Cys Gly Ala Gly Gly Cys Cys Cys Thr Gly Ala Cys Ala
3635 3640 3645
Gly Cys Cys Cys Thr Gly Thr Thr Thr Ala Cys Cys Thr Gly Thr
3650 3655 3660
Ala Gly Ala Ala Cys Cys Gly Cys Cys Thr Cys Cys Ala Thr Cys
3665 3670 3675
Ala Gly Cys Gly Thr Gly Ala Ala Cys Ala Thr Cys Ala Gly Cys
3680 3685 3690
Ala Cys Cys Cys Thr Gly Ala Thr Gly Ala Gly Cys Ala Thr Cys
3695 3700 3705
Cys Thr Gly Gly Ala Ala Gly Cys Cys Ala Thr Cys Ala Thr Cys
3710 3715 3720
Ala Ala Gly Ala Ala Gly Ala Thr Gly Ala Ala Gly Ala Ala Ala
3725 3730 3735
Cys Gly Gly Ala Thr Cys Ala Thr Gly Gly Thr Gly Cys Ala Cys
3740 3745 3750
Cys Gly Gly Thr Gly Gly Ala Thr Cys Thr Thr Cys Thr Cys Cys
3755 3760 3765
Ala Ala Thr Cys Ala Gly Cys Thr Gly Ala Cys Cys Gly Thr Gly
3770 3775 3780
Cys Ala Gly Ala Thr Gly Cys Thr Cys Thr Gly Cys Cys Thr Gly
3785 3790 3795
Cys Cys Thr Cys Thr Gly Cys Thr Gly Ala Cys Cys Cys Cys Thr
3800 3805 3810
Gly Ala Cys Ala Cys Cys Ala Gly Ala Thr Gly Gly Ala Thr Cys
3815 3820 3825
Thr Thr Thr Ala Gly Thr Ala Ala Thr Cys Ala Gly Cys Thr Gly
3830 3835 3840
Cys Ala Gly Ala Cys Ala Gly Thr Gly Cys Ala Ala Ala Thr Gly
3845 3850 3855
Cys Thr Gly Thr Gly Thr Cys Thr Gly Cys Cys Ala Cys Cys Thr
3860 3865 3870
Cys Thr Gly Ala Ala Gly Cys Ala Gly Gly Gly Cys Gly Ala Gly
3875 3880 3885
Ala Gly Ala Ala Thr Cys Ala Thr Thr Thr Gly Gly Cys Cys Ala
3890 3895 3900
Cys Thr Cys Gly Gly Cys Gly Gly Cys Thr Thr Thr Cys Ala Gly
3905 3910 3915
Ala Thr Cys Cys Cys Cys Ala Ala Thr Thr Thr Cys Thr Thr Cys
3920 3925 3930
Thr Gly Gly Thr Cys Cys Cys Thr Cys Gly Gly Cys Ala Thr Cys
3935 3940 3945
Gly Gly Ala Cys Ala Cys Ala Cys Thr Gly Gly Cys Gly Cys Ala
3950 3955 3960
Thr Gly Gly Thr Gly Gly Cys Ala Thr Ala Cys Thr Gly Gly Thr
3965 3970 3975
Ala Gly Ala Ala Gly Gly Cys Gly Gly Ala Gly Ala Gly Ala Gly
3980 3985 3990
Thr Gly Gly Gly Gly Cys Gly Gly Cys Thr Cys Thr Ala Cys Cys
3995 4000 4005
Gly Thr Gly Thr Cys Thr Ala Gly Ala Ala Gly Cys Cys Cys Ala
4010 4015 4020
Cys Thr Gly Thr Gly Gly Ala Thr Cys Ala Gly Cys Thr Cys Cys
4025 4030 4035
Ala Thr Gly Ala Thr Cys Thr Ala Cys Cys Thr Gly Ala Gly Ala
4040 4045 4050
Gly Gly Cys Ala Thr Gly Gly Cys Cys Thr Thr Cys Gly Cys Cys
4055 4060 4065
Ala Gly Cys Gly Ala Cys Ala Gly Cys Thr Cys Cys Ala Thr Cys
4070 4075 4080
Ala Gly Ala Ala Cys Cys Ala Cys Cys Ala Gly Ala Gly Thr Gly
4085 4090 4095
Thr Cys Cys Thr Gly Gly Thr Gly Thr Cys Gly Gly Ala Gly Ala
4100 4105 4110
Thr Gly Thr Gly Gly Cys Gly Cys Cys Ala Ala Gly Thr Cys Thr
4115 4120 4125
Gly Cys Cys Gly Cys Ala Gly Cys Cys Thr Cys Thr Thr Cys Thr
4130 4135 4140
Thr Cys Thr Cys Cys Ala Cys Thr Gly Thr Gly Gly Gly Ala Thr
4145 4150 4155
Thr Gly Cys Ala Gly Cys Ala Cys Cys Ala Cys Ala Ala Cys Cys
4160 4165 4170
Gly Gly Cys Ala Cys Ala Cys Ala Cys Cys Ala Cys Gly Gly Ala
4175 4180 4185
Thr Gly Cys Cys Thr Gly Thr Gly Gly Gly Ala Gly Ala Thr Cys
4190 4195 4200
Cys Cys Thr Ala Gly Cys Gly Thr Thr Ala Cys Cys Cys Thr Gly
4205 4210 4215
Cys Thr Gly Gly Cys Thr Ala Ala Cys Cys Thr Gly Cys Ala Cys
4220 4225 4230
Cys Thr Gly Thr Gly Cys Thr Ala Cys Thr Ala Cys Cys Ala Cys
4235 4240 4245
Thr Cys Thr Cys Ala Gly Ala Gly Cys Ala Ala Cys Ala Gly Ala
4250 4255 4260
Ala Ala Cys Ala Ala Gly Ala Gly Cys Cys Gly Cys Cys Ala Gly
4265 4270 4275
Ala Thr Gly Gly Ala Ala Thr Cys Cys Cys Thr Gly Gly Gly Cys
4280 4285 4290
Ala Thr Gly Ala Ala Gly Cys Thr Cys Cys Ala Ala Cys Thr Thr
4295 4300 4305
Ala Ala Ala Ala Ala Gly Ala Ala Ala Gly Thr Gly Ala Ala Cys
4310 4315 4320
Gly Cys Cys Thr Gly Cys Ala Gly Cys Ala Cys Cys Thr Ala Cys
4325 4330 4335
Ala Cys Ala Cys Cys Cys Cys Ala Cys Ala Thr Cys Thr Gly Cys
4340 4345 4350
Ala Gly Ala Cys Ala Cys Ala Cys Cys Thr Gly Thr Cys Gly Cys
4355 4360 4365
Gly Thr Gly Ala Ala Cys Gly Cys Cys Gly Thr Cys Gly Ala Gly
4370 4375 4380
Gly Ala Ala Cys Thr Gly Cys Ala Cys Thr Cys Thr Ala Gly Ala
4385 4390 4395
Ala Gly Gly Ala Thr Gly Thr Cys Cys Gly Thr Gly Cys Gly Gly
4400 4405 4410
Ala Thr Cys Gly Thr Gly Ala Ala Ala Ala Ala Thr Thr Gly Gly
4415 4420 4425
Gly Thr Gly Thr Cys Cys Thr Gly Cys Thr Gly Cys Thr Ala Cys
4430 4435 4440
Gly Thr Gly Cys Gly Gly Cys Thr Gly Thr Cys Ala Gly Cys Thr
4445 4450 4455
Gly Thr Gly Gly Gly Ala Cys Thr Gly Thr Cys Thr Ala Cys Thr
4460 4465 4470
Thr Gly Gly Ala Gly Cys Gly Cys Thr Cys Thr Gly Gly Ala Cys
4475 4480 4485
Ala Ala Cys Ala Ala Gly Ala Thr Cys Ala Thr Cys Thr Gly Cys
4490 4495 4500
Ala Ala Gly Gly Gly Cys Cys Ala Cys Ala Gly Ala Ala Thr Cys
4505 4510 4515
Ala Cys Cys
4520
<210> 1100
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 1B
<400> 1100
accgagatcc aattgaccat gaacgacagc aagcacaagc tggaaagccc cgctctgaaa 60
caggtgtcac cagcctctcc acctactcag cagcctcaga cacctcagga tagcagacag 120
gtgctggcca tgcctagcag ctggtctagc tctggcagaa cccagcggaa ggtggtcaag 180
aatcctagcc agcctgtgcc tctgagaaac gacggcatca ccaacggcaa cgactccacc 240
agaagctgca gcatcagcct gaagaaaagc ctggaaaaga tgcccctcat gatgaagaag 300
aaggacagca ccatcttcat cgtgcccatg agcctggcct gtagcatcac cgtgtctttc 360
gtgggccaga tcagcacact ggtgctggat gtgtccagca tctcccactg gaacaaagtg 420
cggcagaact tcaagcggaa cgccgacaag aagaacgttc ggagcggcga gaagaacgac 480
ctgcagctgt ttgtgatgag cgacaccacc tacaagatct actggaccgt gatcctgctg 540
aacccctgcg gcaatctgca cctgaaaacc accagcctgg gcgactgtcc tagaacaatg 600
gccggacctt ctgcctctct gcaccctgca tctggcagag cctctagaaa gacctggcag 660
agaaggctga gagcctgtag agctggtgga cctgctggat gggccagaca ggccttcgat 720
aagaaaggct ttgtgatcct gagcgtcgga gccggaacag gcggaggacc tgcttgtgtt 780
cctgtggctg aagcttctac aggcgcttgg acagctgaag gcgccgctgg aacaagatgt 840
agagcttcta gagccccttg cagacagctg cctgccagct ctcctaccaa gtgcgagatc 900
tgcgtgaagc gcagacggcg gagaaagaga agcagccagt ctagaagccc cgtgcctaag 960
aaacgcgaga gaatgatgct gcccgtgcgg gccagaacag ctagatctgc acttcctcag 1020
gggagagccc ctcttgaggg aatgctgctt cctagagcac tgcccagcct gctgtctaga 1080
atgccagcca gaagagagag ccggttttgg ctggctctgc aggcacttgg actcagacct 1140
ccacatctgc ctagctgtca tcctctgcct caactgcttg gccctccacc tcctcatcag 1200
gcccctacag ctttcttcct gctggacatc attctgcggc tgccctgcaa agtgaccgag 1260
tctagcaata tgggcggcaa cagatccatc tgcctgacca acgccaagaa aatggaagat 1320
atgatctggg agagcacgcc cctgagcatc agcagaccta catctagagc caggcagagc 1380
tgttgtctgc ccggactgac acatcctgct caccagccac tgggatctat gaccctggcc 1440
atcagattca tcagcgctcc tcagcctagc tccagcacag tgacagctgc tcctagcggc 1500
cagtacttca agggcaagaa gcggcggaaa gagatcttca agaagaagaa acccctgaca 1560
ttcagcccca gcctggccaa aaagaccctg accaatagca gcttcttcta caccagcgac 1620
cgcgaggcca agaaatctat gaagcggagc atgaccctga aggccctggt caagacctgg 1680
acacagttca gaaactaccc cagagcctcc tctcctggac accctctggg acctaatggc 1740
atctgggaag tgatgcccag aacactggaa ggctgcatct ccgtgaagga ccacagaaca 1800
agccagaacc acagcaagtg catcaccgag tgtgtgcgga cagccctgaa cagaagaagc 1860
aagatcgagg cctctcctat cggctctatc gccctgagat ccatgcctaa gagcagaaac 1920
caggtgctgt tcagacggaa tctgacccca agccagctga gaactctggc ccctccttat 1980
atgctgctgc cccagtctct gagccagagc ctgagcagaa agcagatccc tagccagtcc 2040
atgctggtgg cctctagagc aggacagttt cctgtgtggc ggagaaccag cagaggaatg 2100
agcctgcagt ggaagtccgg caatgcctgc acacctctga gatgccctag cagaagccct 2160
gccacattcc tgacagctct gaacggctgg cacagatctg gactgagagc ccagagaaag 2220
cgcaagcgcg agaagagaag ccagaagtcc aggcagaacc atctgcagct gaagtcctgc 2280
cggcgcaaga tctccaactg gtccaagctg agaagcccct ggatcttcgt gtccaagaag 2340
agactgccca agctgaccaa gtgtgaaatc tgtgtcaaga acaccgccat cctggctatc 2400
accctgatca cccctcagga ccctcatctg gaccctgtgt gtcaccctca tagaaggcct 2460
ggatggaagg gccaccacag agtggtgttt tctcatcacc ctagcggcag caccaagagc 2520
cactggcagc aaagagaacg cggaggcggc agacgggaaa agaagggctg tagagagaga 2580
tccctgctgt actccagaat gtgcctggtg cagatcccca cacacacctg ggagcccgat 2640
tacttcgtgt ctctgcccat gatgttcagc tgggccacac agtcattccc cgtgggagcc 2700
gtgtttctga ccagacctgc cattccttgc tgtagctgca caagccacag caacccttgg 2760
agtcagagca gacacccaca cagaagccca cctacctctt gtcctccgct gctggaagcc 2820
tttccactgc ctagagcatc cctgagagcc accgtgccaa gacatagctc tgtgctggca 2880
accggactgc atctgcacag acagatttct ctgcccctga gaggattcct gctgcatcaa 2940
ccactgccag gccagcatct gtggctgtct catagactgc ggctgagact gccaagaact 3000
cagcggcctc ctagatccat cctgagcctt agactgccac tgaggccaca gagaggaccc 3060
agacctctgc atagatggct gcagcagacc acaggctgta gccagagaag ataccccaga 3120
ctgaaaacct tcggcgtgcc actgggctcc attctgtgtc tggctggatc tctgagcacc 3180
atgatgatca ttagcaccac cagacaagag tgtggcaggc gggcatctgt gccctgtaga 3240
cctatgatcg gaagcgccag accaggacct tggagaacat ctgctatgcc tagcgccatg 3300
ggcgtcgcac tgcctacaag ctgtgaatcc ggaagatctc ctcctgccac cggcggaaga 3360
atgcctggaa gccagagcat tatgatgagc tggatgcctc ctctggctcc ttgtgccgct 3420
tgtccttgtt ctcccgctcc tacactgtgt cccgctcatc ctgctagagc acctacagcc 3480
gtgcctgcct ttacacctct gtctgcacat cctgtgcctg tgctgtctgg atgtcacctg 3540
gccgtcagaa cctccatgct gacactgctg cctatgctga agctggcccc actgcaagtg 3600
accaccacac tgaagctgat cctggtcatg ctggaaatcg tgaccgagag cactcggaga 3660
gagatgcctt ctcaggccac accttctcca cctggacctt ggcgagccgc tctgggcaaa 3720
gaagtgaaga gatcccagag caagctgcgc ctgagaaaca caagccccat cgtgttcttt 3780
ctggccccat acttccccag acggatgacc agacggacca tgacaaccac caaaatgatg 3840
atgatgcggc ggaccaagcg gagaaggcgc aaaaggcgga gaatgacaat gatgacaagg 3900
cggaccctgc tgacaaagaa aacctgtctg acccctagaa ccagcgccgc taccaaagct 3960
ctgccaaggc agacaatctc ccagcggagg cctattcaga cccctcctgg aacatctctg 4020
gccatctggg gcaaccagca gctgaaatgg acccctcaca tcctgaagtc cgccagcaga 4080
agggccagac ctaccagctg tagcacctgt agaatgtggt ggatcgccaa aaagcggatc 4140
aagctgcggc ggaacagaac cagactgaca ctgacaggca caagaagcag cggcaccaga 4200
gcttctccat ccgccgtttg cctgtgttgc tggacctgtc cttccagaag cttcccagcc 4260
gcttctccaa gcggattgag agcacctgtt ggagcacagg cccctccaga agttacactg 4320
agagctagct gtgcctccag cgcctctaag gcttgtgctg gactttggcc ttggggagca 4380
caagttcggc aaccatcttt gcctggacca tgcgcttctc tgctgagcac actgtctcag 4440
ccacctccac aggctccatc tcaagtgtgg acagccgcaa cactgagatg tcctgctgtt 4500
ccagctgctg cctgtcctcc t 4521
<210> 1101
<211> 4053
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 2B
<400> 1101
agaaagatgc agagcctgaa tcaccccagc agactgacca acatgagcag aacacctcca 60
agacgcgtgt gcaaccctcg gagaaagacc tggaagatgc ggaagaagta cgcccagaag 120
cctagccaga agaaccacct gtacaacagc cggaagaaac tgctcgagga catgaagcag 180
aatggcttca caggccacag agagggcagc gagtctgata atctgggcct gctgtactcc 240
tttcctccta tccggatgtg cgccctgtct caccctagct tctacatcag cagcaccgtg 300
tgctttctga gcaagcactg catgaccgcc tgcacacaaa agaaaggcca catgatcttc 360
agccgcgaga agatcatcaa ccccaccatc agctgcccct ttcagagccc cacaaagcgg 420
ctggaactga gcctggaacc ttggattccc tacctgcacc agcagaaaac ccaaggcggc 480
aagaagagaa gcaagttccc tggcaccagc ctgcagtgct acctgaacag atgcagcctg 540
atggaacaga tccctcacct gaagtccgcc tctccacaga tcatgcagag aaccagcgcc 600
gaccggttcc ggatgaagcg gagaatgcag aacctggaca atctgggcgt tccatggcca 660
ctgctgcctg gacctctgga aaacacacag atccccagaa caagccctct gtggaagatc 720
acaatggtgc tgacataccc caactgcgtg gtgcacgtgc tgatgttctg gctgcctatg 780
agatctctgg gcgagccttg gagagctggc tttcagtggg gagagtcccc ttggcaagtg 840
atggctagcc tgacaggccc ctatcctatc agcgagggcc tgaccatgac caccggcaga 900
aacatcaaca gcaactccct gatgaccaac tgcctgttca gccccatctt cctgtgccac 960
cacgccatca tgcaccggaa gatgacaagc ccacacttca gactgttcag cagcaagatc 1020
ccacatcctc aggtgccatc tgtggtggcc ctgtgcaagt tcagagccac atttctgctc 1080
gccctgtggg agtgtagtct gcctcaagcc agactgtgcc tgatcgtgtc tagaaccctg 1140
ctgctggttc agtctgccgc tcctccacat agactgctgg gcccttctag atggtccaga 1200
agccacctgg acttcagccc ctactggatg aagaaagtga agctggccaa cggcctgtgg 1260
ttcaacctga tcttcgtgct gttcaaggcc gaccagagcg agtctagcct gtctagcggc 1320
cggaacaaga aaacaaagct gtggttctcc ctcatcaaca tccaccaccg caagaatcct 1380
ctgctgccca tgagaatccc cagcctgaat gcccagtgga tgttcctgag aatcctgctt 1440
ctggcccata tgtacggctt cagcacctac ggcacccaga aaggcgagtg cgtttgtctg 1500
cagtgtctga gcggcagcag cctgttcatt ctgaagcagc ccctggacct gaagatctcc 1560
aagaccttca tgctgcaagc tcacccacag gtgccagctc ttgctcctca agcttggtgg 1620
cctgctagaa gaggccctct gacatctgct ccatccgctc agcagtctct gacagctagc 1680
cctcagatta tgcagcggat gagcgccgtg aacttcgaga caatcatcta ccctccaagc 1740
acctgtagcc tgccttgtag aggcagaaca ctggaaagcg ccggactgtt tccttggctg 1800
cacacccagt gtacacaccc ctgtaccatg ctgctgccac aaggctggtg gtgtacaaga 1860
ggcggcggaa agcggaaaaa gaaaatgtgc aaggtgtccg gcggctgcac cgcctgtgtt 1920
gagagatgtc cttggaaggg catctgctgg aagtggccag tgacagtggc tgctcagtgg 1980
tctagcgtga cctctctgga atggacagcc caagagagag gctgcagcag ctggctgatg 2040
aagcaaacat ggatgaagtc ttggtccctg cgggacccca gctacagatc catcctggaa 2100
tacgtgtcca ccagagtgct gtggatgccc acaagcaccg tgcggagaag aaacagcaga 2160
aagcagtctc aggtgcagct ggccattcag gtgctgctcg tggacaagca caagtacttt 2220
ctgttcggca gagcccgcaa ccggaacatg aagaaaacca tgagccacct gatcgcccat 2280
caggccctga agatgagcgg cctgaggctg tttcatcctc ggctgctgac aagaaagaag 2340
cccggcaagt tcctgcctag cagatttcct tggggccctc ctcctctgtg tcatcctgct 2400
tggctgagcc ctatctccgc ctgtccaaga ctgctgccat atccttttca cgtgctggcc 2460
ctggaagtga cctttccacc tggaacagcc atgcctcaga tgcaactgca ggccctggcc 2520
atgtgggaga aaggctggga taagcggaag agaatgaaga ccggcgccat ccaagagaag 2580
ggcgctattc aagagaaagg ggccatgacc aagcggatct gcgtggtcaa tttcgaggcc 2640
tgcagagaga tggaaagcct gagcgcccct gagaagatta ccctgtttga agcccatatg 2700
gcccggtgca cctccatcaa tgtgctgtgt gtcagagcct ctctgatcga gaagctgatg 2760
aaagaaaagc gcaagatgaa gcgcaaccag gtggcatccc cacaaattat gcagaggctg 2820
ttcattaagg gctaccagaa caaccacttc accttccatc tgcaaaactt cgccttcttc 2880
agcagcttcg gcaacaacaa gtacatcaat atcctgacgc ggcgcaagaa aagagaggac 2940
cactgcggac tgctgatcct gatccagcac ggcggcatct tcacctttcg gttctgggtc 3000
gaaaagctga gctggaacat ctgcaagaac ctgagcctgt acctggataa gttcgtgcag 3060
cggctgctgt acgtgtacat catcgagaca aacgtgttcg tgctgaacct gttccacgtg 3120
ccagtgaacc agatcttcat gatggccttc tacctgaagt acaccgagaa ggcctgggtc 3180
atggaactgg aatggctgat ccaacagcag tgttaccagc aagagaagaa aagccggaaa 3240
ctgatgagca gctgccgggc cttcatccac acacctagaa gccctggctg cagcgtgtac 3300
gccaatatgt gctgggcctt ttggaagcct cctagccagg gcatcagctc ttgtctgatg 3360
acaggctgtt ggggcagccc tcctctgcac ctgtgtcagc ctctgaggcg gtataagaaa 3420
aggggcgtga tcgcctggcg gcggagaaag tggcagatcc ggcatgtgct gaaaaacctg 3480
atcctgtttc atgtgcggaa catcgtgtac ggcatccaag tgatgctgtg cggcaaggga 3540
ctgacacacc ctgtgcctct gaaacggacc ctgcagaaca agaggaacaa gaacatcaag 3600
cgggtcaacc agaagaaggg caacatcaag aggaagtcca tcctgctgca cctcattgtg 3660
ctgaatagcc ccgagagcaa ccccaagttc ttcctgacct ttagccagct cgagaagaaa 3720
gctacctgga tgagaagaac aggcgccctg agagccacag ctcctgctac agcagctcct 3780
caggctcaga ctcctcattg gagagccgcc acaacaagca gcatgagcag cagccctaga 3840
gccgagccta catcttctag ctcttgggcc acctgttggc ccagatgctg tagctccagc 3900
tgttactggt ccctgagttc ttggcctcct gctggcgccg ctgaggctac aaacaccaga 3960
actagaagca gagagtccca gcggggcaga atgctgactt ggagaagtag tctgtggctg 4020
cagggcacca gatgttttac aggcgtgcgg aca 4053
<210> 1102
<211> 4518
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 3B
<400> 1102
ggagctgctg ctgcctcttg tcagtctcct ccttctcctc gggaaaccac acctagctcc 60
gacgccacca gacggacaag accaattgcc gctcagagca agaaaaccat gacagccgcc 120
ggactgaccc ctaagaacaa gaagcggaga aagctgcggc ccaagatgat ccggaagatc 180
cagaagagaa ggcggaccgc caaccggcgg aatagcagaa gggctacccc tacaagcaag 240
ggcagcctga gaagaaagta cctgagagtg cggggacctc ctctgcacac ccggaacatc 300
agaaagctga tctggaccaa gcagcggagc ttcctgtctc tgttccccaa gctgagagcc 360
accgagcaga tgaccaatgt gggctgctct atccctcacg tgcccaaagc cacagccgct 420
cactctgtga cagtgaaact gcagctgccc ctgaccttca gcaccctgct gtgggatagc 480
agacacacca tgagcctgag caacatcctg atgaagttcc ggctgcagtc tagcccattc 540
ctggccagat cctggaacac catgcagtgg aacaacaaga aaatggccat gaccgtgatc 600
gctggcgccc accactgtca gtacaagctg acctacacca aagtgtggaa gatgaactgg 660
aagaaaatga tgatcggcag ccagcatctg ctgttcagcc ctctggatag cagtcccctg 720
cagctcctgc tgcaccctca cggcaagaga tgcaaccctt gctgcagact gacctggatg 780
agccagaaca ccagaagcac caacctggaa aagaacccca gcctgaagaa gcagagccag 840
cggagaggaa agctgagcgc ctttagcggc agaatcctgc accagccaga aatggccgcc 900
atgagactga tgcccaagtt cctgaactcc accaacagct ggtggaccct gaccacactg 960
agcttcgtgc tgatcgagga agccagacag cccagcagac ctaccggcag aacacctacc 1020
accagactga tggcccctgt gggcagcgtg atgagctgtt ctctgctgac ccagccttct 1080
ccagccagcg cctgtacaat gcctccactg ctgcatccac agtgggcccc tcatagtgct 1140
ggactttctc caggcgcttg cagacctgcc tgcacctgta tcagcatgac caccatcagc 1200
agggccacat ggggcccagt gtactacgtg tgcaaccgga tgaacgtgtc cagcgtgctg 1260
aagcccttcc tgttcaccgt gcctatcgag gacatgagag agtgcaccct gggcagaaac 1320
agaatgaatg tgtcctctgt gctgaaaccc tgtctgatcc ctgtgccaat cagcgagaag 1380
aagaggaagc tgcccaacat cgagatcacc cctcagcggt ctaaggccat gctgcagaag 1440
cagtgctgct acaacctcgt gatcaagcac cctctgatct tcagaatcaa cctgcggcgg 1500
cagggcaaga ccaaagatgg cgttgtgcag agcctgggct tcctcaacca gcagatcatc 1560
ctgcagaaag agttcttcat ctgcctgctc atgttcatca agcggtggaa gcctgccgcc 1620
accaagagca gaaagaaggg ccacaccaag aacagacgga aggccaagag aaagccccag 1680
atctacctgt tcttcctgac cgtgtgcggc tttcacctga aaaagaccag cgccaagtgg 1740
ctgaagaagt ccaccaagtc cagatccaac ggcatggaag cttgcggcac acaccccact 1800
cctagactga gctgcctgag agttagatgc ggcggctggc tgtgtggctg gacacctaga 1860
ggtagaaagt ccggcgtgat gaagtgctgg gatctgtgcc ccgtgcacaa gaagagaggc 1920
ctgttcagac tggattttca ccccagaagc agctccggca agggaaagaa cagcccctgc 1980
tgccaaaaga aactgcgggt gcagaaccag ggccatctgc tgatgattct gctgcacaat 2040
gaccgggtgt tcctcgtgaa gatcggcgag aagctgaagc actgtttcaa ggcctggggc 2100
tccagacgga accggcggta cagaaagatc tacggcgagc tgaagatgtc cctgcaggcc 2160
ttcctgatcc acctgagaaa ggtggacacc caccacctcc aggtggtcac caaaacagtg 2220
accgccacaa cagccgacgg ccagagaatg cggagactga agtgcaaggc ctgccggctg 2280
agatgggcca gacctgaacc tgctgctcag gcccctccta agagccactt tccacctcat 2340
cctagcggcc ccagcagaac aagtagcctg cagctgagaa gcctgttctt tagccactgc 2400
ctgtgcagcc agaagaagga ccctgccggc aagctgaaaa agctgctgaa gaaaagcagc 2460
cagctgcgga gaagctggcg caatgtgtcc agaatcagca cccctcctcc actgatcctg 2520
tggcctcaag ctgctcctgt gtccgtgatc accatgaagc tgtgggagaa gcacttcaag 2580
ggcctgaatt ggaacctggt cgtgtggatt ctgaacctga agatgatgac ctacatggaa 2640
atgcactacg gccatcaggc cccacaggtg gcaatgctgc ctaagctgct gtgcagacag 2700
atgctgccca ctctgagcac actgcagcag agacatcctc agggcccttg tcctcctcct 2760
gtgacacctc tgagagtcca gtctgtcctg ctgctgggag tgcctcagac agccagagga 2820
cctagaagaa aggtcctgat ggtgctgtgg ctgcccgcca atcagtctct gcagaaaagc 2880
caggttttcc agtgggtgct gcggacagag gtggccccta gatgtcctag atctgccgtg 2940
gacatcagcc ccggacctac atctcctagc ctggcctctt gtgcctctgt ggccattgga 3000
aagctggcac tgcttggcgc ctctgctcct tgtggtgctg ctggcgctag agaggccgga 3060
agatttgctg tgctgggcac catggtcatg aagctttgtt tcttctacct gctgtaccgg 3120
ctgcgcatcc caagcctgag gaagtacaga cagcacctga accggaagct gcacctgaca 3180
agatcctgcc tgatcgatct gaccatgatg atgtcccaga agctctggaa gaaccagcgg 3240
aagagaatcc ctctgccatc tccacggcaa catctgctgc cacagtaccc tctgcaccca 3300
cctccacctt gtctgctgtt gctgcaccat agacaccacc tggcctttct cgagatggcc 3360
tgtagctctc agcacaccca cagcatcaag atctggatca gcttcagcca tgaagtggac 3420
cctccaggca gcgtgtggat actgccttgc gatctgcctc ggatgctgcc aatctcttca 3480
cccctgcaca gaccccagat gcctttctgg acctgcacct ttcctgccac aacctggggc 3540
acatgggaga caccttctac atggggctgg cggactttca gaggcgctag cagcagcaca 3600
tcccgggaca gcagatcctt cttcacctct gctcacccta gcaggccctg cagaatgaga 3660
ctgtaccagt gcaagaagaa gctcctcctg aaactgctga ccaccaccac aagcagcccc 3720
agaagatccc ctgctctgag agcaagaggc ggcaccacaa tcggcgaagt gaccagctgt 3780
accaacctga gcgtgcccat gatgctgacc atcctgattt ggaagcgggt gttcatcctc 3840
ctgctgagcg ataagaaggg cgccaagaag atcaccttcc tgcctattcc tccacacctg 3900
agacaccctc tgctgctgtt cgagaagaaa cggcctgagt ggctgagcat ggacctggac 3960
ggaatgctga cagtgatcgg ccagggactc gtgggcatga cccctagaga tctgggaaca 4020
gtggcaggcg ccaccgctca gattcagcga cctatccagg tgcagactgg cggcagactc 4080
agaagaaacc tgcagagaaa cctgaaggtg ctccaggtgt ccgtgtacag cggcaacctg 4140
ctgtccttta gcagacgggg catgaagtct agcgtgcggc tgaaaaaccg cgagtgggag 4200
aaacggaagc agattctcgg aggcggcgga aagtacaaag agtacttcct gaagcgcatc 4260
ctcatccgga aggctatgac agtgctggcc ggcgacaaga aaggactggg cagattcatg 4320
agatgcgtgc agagcgagac aaaggccgtg tctctgcaac tgcctctggg aagaaacatg 4380
gaacaccggt tgaccatgga cagcgccctg agcctgacaa agagagaggg acccgagaca 4440
ctcaaaaaga aatacctggt ccagcaccag atgaagtgtc tgaccgccgt ggattgtctg 4500
caggcttttt gggacatg 4518
<210> 1103
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 4B
<400> 1103
atccagaaga agaagcagaa gtccaacctg gacctgcagc accagcgcag acgcaaaaag 60
aagaaggaca aggtcgagat ccggaatcgg agccccaagg ccaatagcac agagtgtcag 120
ggcgagcaca gcagagagca gaacctgctg aatctggtgc agctgaaccc tcacagccct 180
caccacagaa aggacgaaga ggaccaccag aagcggcacc accaccacaa tcaaaagaaa 240
atgagcgtga tggccaagaa gtcccagcag cctctcggac aggcctttgg ctctctgtgt 300
cagctggtgt ccgccgattt cagcgcccct caagtgacca gactgcggag cctgaaccat 360
ctgctgatca acgagggcaa caaccactgg cctagagtgg aaatgcctac cggttggctg 420
ctcgtgggct acaacaccag aaacacagcc cagaatcctc ggctgcagca gcacctgaaa 480
cactggcagc agtgcaccag agccagatgg tgccaagagc cttgtcagac cctgaccttc 540
ttccatttct tcttcttttt caaaacggtg tccctgtgct gccccggctg gtctaaagga 600
caacctcctc cacctggcct gaagccttct agcctggctt ctcaggtggc cagaaccaca 660
ggcgtgtacc agcacgtgtg gctgatctgc ttcgtgttct tcgtgtgcgt ggaaaccggc 720
ttctgtcacg tggcccaagt gggactcgag agactggtgt ctctgagcgg catcaccgac 780
gtgaaccatt gggcccagcc taagccatct cctagcaaag gcaccggcat gaacagaccc 840
atcggcctga gagttggcaa aggcgtgtgg gccagactga gagcctccgt gtctttctgg 900
accctgctgc ctacaacagg cgtgcggaca agaggaagcc ctctgagact gacactgtgg 960
cctccacgga acatcctgaa cagcctgcct agcagcatgg aaatcgccgt gctgcaagag 1020
aaccgcaaga ccagaaaggc cgccagagag aagcacagaa agaccgacaa cctgcacctg 1080
tgctactacc acagccagag caaccggaac aagagccggc agatggaaag cctgggcatg 1140
aagctgcaga gccctctgtg ggattgctcc accacaacag gcacacacca cggctgtctg 1200
tgggagatcc ctagcgttac actgctggcc tgcagagtga acgccgtgga agaactgcac 1260
agcaggcgga tgtctgtgcg gatcgtgaag aactgggtgt cctgctgtta cgtgcgcctg 1320
tctgctgtgg gcctgtctac ttggagcgcc ctggacgtgg tcatcaacct gaagcggctg 1380
cagaagttca gccagaagtc tcagcaccac tgcgccctga gaaagatcga gtgggccaca 1440
aagctgagcc tcggcggaaa agctggaccc caggctcaag agaaggccaa cgccaagaag 1500
atgcccttcc agcggtggat cttcagcaat cagctgaccg tgcagatgct gtgcctgcct 1560
attgaagccc tgactgccct gttcacctgt cggacagcca gcatcagcgt gaacatcagc 1620
accctgatga gcatcctgga agcccctctg ttttttcacg gcgacctgtg cgaggaaaag 1680
aagaacggcc ggatcagcag ccaggctcct ctcagacttt ggtcttggtg cggcacaagc 1740
cagacctact ttggcagcac cgccaagaaa agccccacca gcttttgctg cgagtgggga 1800
ggacaggctc accggcagag aaataccgga atggaaatcc tgctgtggat tctgctcaag 1860
atggaaattc agatcttcaa gatttgcctg ggcgagatgc agctgtgcac ctacacaccc 1920
cacatctgca gacacacctg tagaggcgga cctagcgcca gcgatagatg ctgtagctgt 1980
agccctagcg gcttcagcgc cggaagaggc agatgtccag ttcagggatg tctgcggcct 2040
cacagagtgc agctgctgag aagatggggc cctggatctc ctgctggcca gagactgtct 2100
aagggctttc agctgctccg ttggtgggga ccaggatctc cagctcctga gcctagaaag 2160
ggcccatttc caccacctga tcctccatgg cctgtgaccg ctgtgacagt gatggctggc 2220
tctgtgccta gcgctcagtc tgtggatgct ctggaaagcc ctggacctct ggcactggaa 2280
ggacctagca gccccagaaa cctgctctgg cgggaaatga gcatcttcct gcctggcatc 2340
ttcacctctc ggattctgaa cctgcaagtg ctgaagaaga tcctgcggag ctttatgaag 2400
ctgtaccact ctctggtcat gtgcctgcgg ctgcggacca agctggaaaa agctctgagc 2460
gctctgttca tctggcccca gcacagctac aagcagaggc ctcctctgca gcctgtgcag 2520
gtcgtgctca gactgggaaa cctgcctcca ttcttcagag gcagcgaggt gccctttcct 2580
agaccttgcc ggaccaagat gctgaaccag aagtgtctgg cccctttcat cacacaccca 2640
ttcgcctctc agcccctggg acaagagatg cccaacaaca cccagatcag actgctgaag 2700
cccctgctga cccctgacac cagatggatc ttctccaacc agctgcagac agtccagatg 2760
ctctgtctgc cacctctgaa gcagggcgag agaatcattt ggcccctcgg cggctttcag 2820
atccccaact tcttttggag cctcggaatc ggccacactg gcgcctggtg gcatactgga 2880
aggcggagaa gagaatgggg cggctccacc gtgtctagaa gcccactgtg gatcagctcc 2940
atgatctacc tgagaggcat ggccttcgcc agcgacagct ccatcagaac caccagagtg 3000
tcctggtgca gaagatgcgg cgccaaatct gccgctgcct ccagcctcaa gaagaaaccc 3060
cgggacatct gtcggatcag cgactctaag aagatgaccc agaagcgcga gagcaccctg 3120
ggcaatttct ggatgaagct cctccagctg ccagacaaga agaagaagtc taccgaaaag 3180
accaagatca tcaagaagat gaagaaacgg atcatggtcc acatgtgcag ctccctggct 3240
ctgccaacag gcctgacatc tctgatcctg ccaagcagcg atctggccgt gctgatctct 3300
agctccacca gccactttct gatgcggagc ccagtgctgc ctagctccag actgacttgt 3360
gcctctccac agctgcccag aatgtggacc tggtccagct ggctgaagtg gctgaaaaac 3420
tggaagcggt tcaagcttaa aaagaagtac atcctggcca tgacgctgac cctgaacggg 3480
catccaagaa ccgcctctat caccctgcct accaccagcc tgaagggctc tagaaccagc 3540
tgttgcccca gatctcaccc cagactgcct aggacaaagt ggcctctgca gtgcctgctg 3600
cacagcctgg gaacaactgg aacactcgtg tgggaaaggg gcgtgctgca gatgagaagt 3660
ctggaagctc actgccctct gcagaccttc cacctccacc actgtagaac tcagcccagc 3720
tcttgccctc ctgcatggat tctgtaccaa ggacagtgga gcggagccgt cgtgggactt 3780
agacctgtgg ctcaccatct gccaagacct attcagggcc tgcactgccc acaggctcca 3840
catcaaccag ctctgtcttg gggcaagtgg cccgtgggaa tgacaggacc tgccagatgt 3900
tgccggtggc ctagacggga actcaaaaag aatctgctgc tcccctgccg gtgcagacgc 3960
gagtatagag tgacaatggg ccaagccttc ggcagcttta gcgccgactt tagcgctccc 4020
caggtgttga agaagaatcg gaagcagaac aagattatct gcaagggcca ccgcatcaca 4080
agcctgatcc tgagctttca gcgcgtgaaa cttaagaaga aagtcaacgc ctgctctccc 4140
gcctgcacct ctaaagcctg gactcccaga aagctcgtgg ggagagccgt cagaagaaag 4200
ggcatcatct gtatcaagaa tatgttcctg cagcggaagg gtttcctgaa cctgagccac 4260
gtggaaaagt tcgtgcctcc ttctcctcct ctggctctcg gccctagaat gcagctctgt 4320
acccagctgg cccggttctt ccctatcaca cctcctgtgt ggcacatcct gggacctcag 4380
aggcacaccc cttgtcaaaa gaaggtgccc tccgctagcc catggggcct tagaccatct 4440
ccttgcctga gctggtcctc cagaattgtg gcccctggac acgccctgag ctgtcggact 4500
agaagaagat ggtccagcaa g 4521
<210> 1104
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA amino acid sequence
<400> 1104
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg
20 25
<210> 1105
<211> 232
<212> PRT
<213> Artificial Sequence
<220>
<223> Human Invariant chain (hINV) amino acid sequence
<400> 1105
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met
225 230
<210> 1106
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> HA tag amino acid sequence
<400> 1106
Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1 5 10
<210> 1107
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 1A
<400> 1107
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Thr Glu Ile
20 25 30
Gln Leu Thr Met Asn Asp Ser Lys His Lys Leu Glu Ser Pro Ala Leu
35 40 45
Lys Gln Val Ser Pro Ala Ser Pro Pro Thr Gln Gln Pro Gln Thr Pro
50 55 60
Gln Asp Ser Arg Gln Val Leu Ala Leu Ala Lys Lys Thr Leu Thr Asn
65 70 75 80
Ala Ser Arg Ala Gly Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly
85 90 95
Met Ser Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg Cys
100 105 110
Pro Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn Gly Trp His
115 120 125
Arg Ser Gly Leu Arg Ala Gln Met Pro Ser Ser Trp Ser Ser Ser Gly
130 135 140
Arg Thr Leu Lys Leu Ala Pro Leu Gln Val Thr Thr Thr Leu Lys Leu
145 150 155 160
Ile Leu Val Met Leu Glu Ile Val Thr Glu Arg Ser Leu Leu Tyr Ser
165 170 175
Arg Met Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro Asp Tyr
180 185 190
Phe Val Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser Phe Pro
195 200 205
Val Gly Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys Ser Cys
210 215 220
Thr Ser His Ser Asn Pro Trp Ser Gln Ser Asn Gln Gln Leu Lys Trp
225 230 235 240
Thr Pro His Ile Leu Lys Ser Ala Ser Phe Asp Lys Lys Gly Phe Val
245 250 255
Ile Leu Ser Arg Arg Ser Lys Ile Glu Ala Ser Pro Ile Gly Ser Ile
260 265 270
Ala Ser Ser Pro Gly His Pro Leu Gly Pro Thr Leu Ala Ile Arg Phe
275 280 285
Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val Thr Ala Ala Pro Ser
290 295 300
Gly Gln Tyr Phe Ile Ala Lys Lys Arg Ile Lys Leu Arg Arg Asn Asn
305 310 315 320
Met Gly Gly Asn Arg Ser Ile Cys Leu Thr Arg Lys Arg Lys Arg Glu
325 330 335
Lys Arg Ser Gln Lys Ser Arg Gln Asn His Leu Gln Leu Lys Ser Cys
340 345 350
Arg Arg Lys Ile Ser Asn Trp Ser Lys Leu Arg Ser Pro Trp Ile Phe
355 360 365
Thr Lys Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile Thr
370 375 380
Leu Ile Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys His Pro His
385 390 395 400
Arg Arg Pro Gly Trp Lys Gly His His Arg Val Val Phe Ser His His
405 410 415
Pro Ser Gly Ser Thr Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly
420 425 430
Gly Arg Arg Glu Lys Lys Gly Cys Arg Glu Gln Arg Lys Val Val Lys
435 440 445
Asn Pro Ser Gln Pro Val Pro Leu Arg Asn Asp Gly Ile Thr Asn Gly
450 455 460
Asn Asp Ser Thr Arg Ser Cys Ser Ile Ser Leu Lys Lys Ser Leu Glu
465 470 475 480
Lys Met Pro Leu Met Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr Cys
485 490 495
Arg Met Trp Trp Lys Gly Lys Lys Arg Arg Lys Glu Ile Val Pro Met
500 505 510
Ser Leu Ala Cys Ser Ile Thr Val Ser Phe Val Gly Gln Ile Ser Thr
515 520 525
Leu Val Leu Asp Val Ser Ser Ile Ser His Trp Arg Leu Pro Cys Lys
530 535 540
Val Thr Glu Ser Ser Ser Ser Phe Phe Tyr Thr Ser Asp Arg Thr Pro
545 550 555 560
Leu Ser Ile Ser Arg Pro Thr Ser Arg Ala Arg Gln Ser Cys Cys Leu
565 570 575
Pro Gly Leu Thr His Pro Ala His Gln Pro Leu Gly Ser Met Ser Thr
580 585 590
Arg Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly Pro Trp
595 600 605
Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys Leu Arg
610 615 620
Leu Arg Asn Thr Ser Pro Gly Glu Lys Asn Asp Leu Gln Leu Phe Val
625 630 635 640
Met Ser Asp Thr Thr Tyr Lys Ile Tyr Trp Thr Val Ile Leu Leu Asn
645 650 655
Pro Cys Gly Asn Leu His Leu Lys Thr Thr Ser Leu Gln Arg Pro Pro
660 665 670
Arg Ser Ile Leu Ser Leu Asn Gly Ile Trp Glu Val Met Pro Arg Thr
675 680 685
Leu Glu Gly Cys Ile Ser Val Lys Asp His Arg Thr Ser Gln Asn His
690 695 700
Ser Lys Cys Ile Thr Glu Cys Val Arg Thr Ala Leu Asn Val Ser Lys
705 710 715 720
Lys Arg Leu Pro Lys Leu Met Lys Lys Lys Asp Ser Thr Ile Phe Ile
725 730 735
Asn Lys Val Arg Gln Asn Phe Lys Arg Asn Phe Lys Lys Lys Lys Pro
740 745 750
Leu Thr Phe Ser Pro Ser Arg Arg Met Thr Arg Arg Thr Met Thr Thr
755 760 765
Thr Lys Met Met Met Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg
770 775 780
Arg Arg Met Thr Met Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr
785 790 795 800
Cys Leu Thr Pro Arg Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln
805 810 815
Thr Ile Ser Gln Arg Arg Pro Ile Gln Thr Pro Pro Gly Thr Ser Leu
820 825 830
Ala Ile Trp Gly Arg Thr Arg Leu Thr Leu Thr Gly Thr Arg Ser Ser
835 840 845
Gly Thr Arg Ala Ser Pro Ser Ala Val Cys Leu Cys Cys Trp Thr Cys
850 855 860
Pro Ser Arg Ser Phe Pro Ala Ala Ser Pro Ser Gly Leu Arg Ala Pro
865 870 875 880
Val Gly Ala Gln Ala Pro Pro Glu Val Thr Leu Arg Ala Ser Cys Ala
885 890 895
Ser Ser Ala Ser Lys Ala Cys Ala Gly Leu Trp Pro Trp Gly Ala Gln
900 905 910
Val Arg Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys Val Pro Val
915 920 925
Ala Glu Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly Ala Ala Gly Thr
930 935 940
Arg Cys Arg Ala Ser Arg Ala Pro Cys Arg Gln Leu Pro Ala Ser Ser
945 950 955 960
Pro Thr Lys Cys Glu Ile Cys Val Lys Arg Arg Arg Arg Arg Lys Arg
965 970 975
Ser Ser Gln Ser Arg Ser Pro Val Pro Lys Lys Arg Glu Arg Met Met
980 985 990
Leu Pro Val Arg Ala Arg Thr Ala Arg Ser Ala Leu Pro Gln Gly Arg
995 1000 1005
Ala Pro Leu Glu Gly Met Leu Leu Pro Arg Ala Leu Pro Ser Leu
1010 1015 1020
Leu Ser Arg Met Pro Ala Arg Arg Glu Ser Arg Phe Trp Leu Ala
1025 1030 1035
Leu Gln Ala Leu Gly Leu Arg Pro Pro His Leu Pro Ser Cys His
1040 1045 1050
Pro Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro His Gln Ala Pro
1055 1060 1065
Met Thr Leu Lys Ala Leu Val Lys Thr Trp Thr Gln Phe Arg Asn
1070 1075 1080
Tyr Pro Arg Ala Asp Lys Lys Asn Val Arg Ser Thr Ala Phe Phe
1085 1090 1095
Leu Leu Asp Ile Ile Leu Gly Asp Cys Pro Arg Thr Met Ala Gly
1100 1105 1110
Pro Ser Ala Ser Leu His Pro Ala Ser Gly Arg Ala Ser Arg Lys
1115 1120 1125
Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg Ala Gly Gly Pro Ala
1130 1135 1140
Gly Trp Ala Arg Gln Ala Tyr Pro Arg Leu Lys Thr Phe Gly Val
1145 1150 1155
Pro Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser Leu Ser Thr Met
1160 1165 1170
Met Ile Ile Ser Thr Thr Arg Gln Glu Cys Gly Arg Arg Ala Ser
1175 1180 1185
Val Pro Cys Arg Pro Met Ile Gly Ser Ala Arg Pro Gly Pro Trp
1190 1195 1200
Arg Thr Ser Ala Met Pro Ser Ala Met Gly Val Ala Leu Pro Thr
1205 1210 1215
Ser Cys Glu Ser Gly Arg Ser Pro Pro Ala Thr Gly Gly Arg Met
1220 1225 1230
Pro Gly Ser Gln Ser Ile Met Met Ser Trp Met Pro Pro Leu Ala
1235 1240 1245
Pro Cys Ala Ala Cys Pro Cys Ser Pro Ala Pro Thr Leu Cys Pro
1250 1255 1260
Ala His Pro Ala Arg Ala Pro Thr Ala Val Pro Ala Phe Thr Pro
1265 1270 1275
Leu Ser Ala His Pro Val Pro Val Leu Ser Gly Cys His Leu Ala
1280 1285 1290
Val Arg Thr Ser Met Leu Thr Leu Leu Pro Met Glu Ala Lys Lys
1295 1300 1305
Ser Met Lys Arg Ser Asn Ala Lys Lys Met Glu Asp Met Ile Trp
1310 1315 1320
Glu Ser Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro Leu
1325 1330 1335
His Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg Ile
1340 1345 1350
Val Phe Phe Leu Ala Pro Tyr Phe Pro Arg His Pro His Arg Ser
1355 1360 1365
Pro Pro Thr Ser Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu Pro
1370 1375 1380
Arg Ala Ser Leu Arg Ala Thr Val Pro Arg His Ser Ser Val Leu
1385 1390 1395
Ala Thr Gly Leu His Leu His Arg Gln Ile Ser Leu Pro Leu Arg
1400 1405 1410
Gly Phe Leu Leu His Gln Pro Leu Pro Gly Gln His Leu Trp Leu
1415 1420 1425
Ser His Arg Leu Arg Leu Arg Leu Pro Arg Thr Gln Pro Ser Leu
1430 1435 1440
Pro Gly Pro Cys Ala Ser Leu Leu Ser Thr Leu Ser Gln Pro Pro
1445 1450 1455
Pro Gln Ala Pro Ser Gln Val Trp Thr Ala Ala Thr Leu Arg Cys
1460 1465 1470
Pro Ala Val Pro Ala Ala Ala Cys Pro Pro Ala Leu Arg Ser Met
1475 1480 1485
Pro Lys Ser Arg Asn Gln Val Leu Phe Arg Arg Asn Leu Thr Pro
1490 1495 1500
Ser Gln Leu Arg Thr Leu Ala Pro Pro Tyr Met Leu Leu Pro Gln
1505 1510 1515
Ser Leu Ser Gln Ser Leu Ser Arg Lys Gln Ile Pro Ser Gln Ser
1520 1525 1530
Met Leu Val Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1108
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 2A
<400> 1108
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Arg Lys Met
20 25 30
Gln Ser Leu Asn His Pro Ser Arg Leu Thr Asn Gly Ser Pro Pro Leu
35 40 45
His Leu Cys Gln Pro Leu Arg Met Ser Arg Thr Pro Pro Arg Arg Val
50 55 60
Cys Ala Ala Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp Asn Pro
65 70 75 80
Arg Arg Lys Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln Lys Pro Ser
85 90 95
Gln Lys Asn His Leu Tyr Gly Gly Lys Lys Arg Ser Lys Phe Ser Arg
100 105 110
Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys Lys Val Lys Val Leu
115 120 125
Phe Lys Ala Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly Arg Cys Ser
130 135 140
Leu Met Glu Gln Ile Pro His Leu Lys Ser Arg Arg Lys Trp Gln Ile
145 150 155 160
Arg His Val Leu Lys Asn Leu Trp Leu Pro Met Arg Ser Leu Gly Glu
165 170 175
Pro Trp Arg Ala Gly Phe Gln Trp Gly Glu Ser Pro Trp Gln Val Met
180 185 190
Ala Ser Leu Thr Gly Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys
195 200 205
Ser Leu Pro Gln Ala Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu
210 215 220
Leu Val Gln Ser Arg Asn Lys Lys Thr Lys Leu Trp Phe Ser Leu Ile
225 230 235 240
Asn Ile His His Arg Lys Asn Pro Leu Leu Pro Met Arg Trp Trp Cys
245 250 255
Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys Lys Val Ser Gly
260 265 270
Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys Gly Ile Cys Trp
275 280 285
Lys Trp Pro Val Thr Val Ala Ala Ile Arg Met Cys Ala Leu Ser His
290 295 300
Pro Ser Phe Tyr Ile Ser Ser Thr Val Cys Phe Leu Ser Lys His Cys
305 310 315 320
Met Thr Ala Cys Thr Arg Lys Arg Met Lys Thr Gly Ala Ile Gln Glu
325 330 335
Lys Gly Ala Ile Gln Glu Lys Gly Ala Met Thr Lys Arg Ile Cys Val
340 345 350
Val Asn Phe Glu Ala Cys Arg Glu Met Glu Ser Leu Ser Ala Pro Glu
355 360 365
Lys Ile Thr Leu Phe Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn
370 375 380
Val Leu Cys Val Arg Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys
385 390 395 400
Arg Lys Met Lys Arg Asn Gln Val Ala Ser Pro Gln Ile Met Gln Arg
405 410 415
Leu Phe Ile Lys Gly Tyr Gln Asn Asn His Phe Thr Phe His Leu Gln
420 425 430
Asn Phe Ala Phe Phe Ser Ser Phe Gly Asn Asn Lys Tyr Ile Asn Ile
435 440 445
Leu Thr Ile Leu Phe His Val Arg Asn Ile Val Tyr Gly Ile Gln Val
450 455 460
Met Leu Cys Ala Ser Pro Gln Ile Met Gln Arg Thr Ser Ala Asp Arg
465 470 475 480
Phe Arg Met Lys Arg Arg Met Gln Asn Leu Asp Asn Leu Gly Val Pro
485 490 495
Trp Pro Leu Leu Pro Gly Ile Pro Ser Leu Asn Ala Gln Trp Met Phe
500 505 510
Leu Arg Ile Ala Ser Pro Gln Ile Met Gln Arg Met Ser Ala Val Asn
515 520 525
Phe Glu Thr Ile Arg Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser
530 535 540
His Leu Ile Ala His Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe
545 550 555 560
His Pro Arg Leu Leu Thr Arg Lys Lys Pro Gly Lys Leu Leu Leu Ala
565 570 575
His Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys Gly Glu Cys Val
580 585 590
Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile Leu Lys Gln Pro
595 600 605
Leu Asp Leu Lys Ile Ser Lys Thr Phe Met Gly His Arg Glu Gly Ser
610 615 620
Glu Ser Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro Pro Tyr Pro
625 630 635 640
Ile Ser Glu Gly Leu Thr Met Thr Thr Gly Arg Asn Ile Asn Ser Asn
645 650 655
Ser Leu Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu Cys His His
660 665 670
Ala Ile Met His Arg Lys Met Thr Ser Pro His Phe Arg Leu Phe Ser
675 680 685
Ser Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala Leu Cys Lys
690 695 700
Phe Arg Ala Phe Ile His Thr Pro Arg Ser Pro Gly Cys Ser Val Tyr
705 710 715 720
Ala Asn Met Cys Trp Pro Lys Phe Phe Leu Thr Phe Ser Gln Gln Trp
725 730 735
Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln Glu Arg Gly Cys Ser
740 745 750
Ser Trp Leu Met Lys Gln Thr Trp Met Lys Ser Trp Ser Leu Arg Asp
755 760 765
Pro Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser Thr Arg Val Leu Trp
770 775 780
Met Pro Thr Ser Thr Val Leu Gln Ala His Pro Gln Val Pro Ala Leu
785 790 795 800
Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg Gly Pro Leu Thr Ser Ala
805 810 815
Pro Ser Ala Gln Gln Ser Leu Thr Arg Glu Lys Ile Ile Asn Pro Thr
820 825 830
Ile Ser Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Ile Tyr Pro Pro
835 840 845
Ser Thr Cys Ser Leu Pro Cys Arg Gly Phe Leu Pro Ser Arg Phe Pro
850 855 860
Trp Gly Pro Pro Pro Leu Asn Ser Val Ile Val His Lys Ile Val Leu
865 870 875 880
Val Phe Leu Lys Ser Leu Ser Ser Tyr Asn Cys Glu Arg Arg Ile Ser
885 890 895
Gly Ile Gln Lys Arg Ala Ile Glu Phe Ala Val Leu Lys Leu Leu Asn
900 905 910
Met Asp Leu Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr Ser Pro Leu
915 920 925
Trp Lys Ile Thr Met Val Leu Thr Tyr Pro Asn Cys Val Val His Val
930 935 940
Leu Met Phe Gly Ala Leu Arg Ala Thr Ala Pro Ala Thr Ala Ala Pro
945 950 955 960
Gln Ala Gln Thr Pro His Trp Arg Ala Ala Thr Thr Ser Ser Met Ser
965 970 975
Ser Ser Pro Arg Ala Glu Pro Thr Ser Ser Ser Ser Trp Ala Thr Cys
980 985 990
Trp Pro Arg Cys Cys Ser Ser Ser Cys Tyr Trp Ser Leu Ser Ser Trp
995 1000 1005
Pro Pro Ala Gly Ala Ala Glu Ala Thr Asn Thr Arg Thr Arg Ser
1010 1015 1020
Arg Glu Ser Gln Arg Gly Arg Met Leu Thr Trp Arg Ser Ser Leu
1025 1030 1035
Trp Leu Gln Gly Thr Arg Cys Phe Thr Gly Val Arg Thr Ser Ser
1040 1045 1050
Arg Tyr Lys Lys Arg Gly Val Ile Ala Trp Arg Arg Gln Ile Asn
1055 1060 1065
Arg Arg Lys Leu Gln Arg Lys Lys His Trp Asn Ser Ala Tyr Leu
1070 1075 1080
Gly Arg Thr Leu Leu Val Thr Cys Ile Leu Tyr His Arg Trp Ile
1085 1090 1095
Val Thr Ser Met Cys Gln Ser Gln Arg Trp Leu Thr Ser Thr Thr
1100 1105 1110
Ser Arg Ser Ser Ala Leu Met Trp Thr Glu Leu Ser Leu Glu Pro
1115 1120 1125
Trp Ile Pro Tyr Leu His Gln Gln Lys Thr Gln Arg Thr Leu Glu
1130 1135 1140
Ser Ala Gly Leu Phe Pro Trp Leu His Thr Gln Cys Gln Glu Lys
1145 1150 1155
Lys Ser Arg Lys Leu Met Ser Ser Cys Thr His Pro Cys Thr Met
1160 1165 1170
Leu Leu Pro Gln Gly Cys His Pro Ala Trp Leu Ser Pro Ile Ser
1175 1180 1185
Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe His Val Leu Ala Leu
1190 1195 1200
Glu Val Thr Phe Pro Pro Gly Thr Ala Met Pro Gln Met Gln Leu
1205 1210 1215
Gln Ala Leu Ala Met Trp Glu Lys Gly Trp Asp Lys Pro Gly Thr
1220 1225 1230
Ser Leu Gln Cys Tyr Leu Asn Arg Arg Arg Asn Ser Arg Lys Gln
1235 1240 1245
Ser Gln Val Gln Leu Ala Ile Gln Val Leu Leu Val Asp Lys His
1250 1255 1260
Lys Tyr Phe Leu Phe Gly Gln Lys Lys Gly His Met Ile Phe Ser
1265 1270 1275
Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile Phe Asn Ser Arg Lys
1280 1285 1290
Lys Leu Leu Glu Asp Met Lys Gln Asn Gly Phe Thr Gly Lys Gly
1295 1300 1305
Leu Thr His Pro Val Pro Leu Lys Arg Thr Leu Gln Asn Lys Arg
1310 1315 1320
Asn Lys Asn Ile Lys Arg Val Asn Gln Lys Lys Gly Asn Ile Lys
1325 1330 1335
Arg Lys Ser Ile Leu Leu His Leu Ile Val Leu Asn Ser Pro Glu
1340 1345 1350
Ser Asn Leu Ile Leu Ile Gln His Gly Gly Ile Phe Thr Phe Arg
1355 1360 1365
Phe Trp Val Glu Lys Leu Ser Trp Asn Ile Cys Lys Asn Leu Ser
1370 1375 1380
Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu Leu Tyr Val Tyr Ile
1385 1390 1395
Ile Glu Thr Asn Val Phe Val Leu Asn Leu Phe His Val Pro Val
1400 1405 1410
Asn Gln Ile Phe Met Met Ala Phe Tyr Leu Lys Tyr Thr Glu Lys
1415 1420 1425
Ala Trp Val Met Glu Leu Glu Trp Leu Ile Gln Gln Gln Cys Tyr
1430 1435 1440
Gln Gly Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly
1445 1450 1455
Thr Pro Arg Gly Asp Trp Lys Arg His Pro Pro Arg Arg Ala Phe
1460 1465 1470
Trp Lys Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr Gly
1475 1480 1485
Cys Trp Leu Glu Lys Lys Ala Thr Trp Met Arg Arg Thr Arg Arg
1490 1495 1500
Lys Lys Arg Glu Asp His Cys Gly Leu Arg His Pro Ser Trp Pro
1505 1510 1515
Trp Thr Arg Cys Leu Arg Met Arg Pro Pro Arg Ser Gly Tyr Pro
1520 1525 1530
Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540
<210> 1109
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 3A
<400> 1109
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Gly Ala Ala
20 25 30
Ala Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr Thr Pro Ser
35 40 45
Ser Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln Ser Lys Lys
50 55 60
Thr Met Thr Ala Ala Gly Leu Thr Pro Met Ile Arg Lys Ile Gln Lys
65 70 75 80
Arg Arg Arg Thr Ala Asn Arg Cys Leu Arg Val Arg Cys Gly Gly Trp
85 90 95
Leu Cys Gly Trp Thr Pro Arg Gly Gln Asn Thr Arg Ser Thr Asn Leu
100 105 110
Glu Lys Asn Pro Ser Leu Lys Lys Gln Ser Gln Arg Arg Gly Lys Leu
115 120 125
Ser Ser Leu Phe Phe Ser His Cys Leu Cys Arg Asn Ser Arg Arg Ala
130 135 140
Thr Pro Thr Ser Lys Gly Ser Leu Arg Arg Lys Tyr Leu Arg Val Pro
145 150 155 160
Ile Pro Pro His Leu Arg His Pro Leu Leu Leu Met Asp Leu Asp Gly
165 170 175
Met Leu Thr Val Ile Gly Gln Gly Leu Val Gly Met Thr Pro Arg Asp
180 185 190
Leu Gly Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg Pro Ile Gln
195 200 205
Val Gln Thr Gly Gly Arg Leu Thr Pro Pro Pro Leu Ile Leu Trp Pro
210 215 220
Gln Ala Ala Pro Val Asp Pro Pro Gly Ser Val Trp Ile Leu Pro Cys
225 230 235 240
Lys Asn Lys Lys Arg Arg Lys Leu Arg Pro Lys Arg Leu Asp Phe His
245 250 255
Pro Arg Ser Ser Ser Gly Val Ser Val Ile Thr Met Lys Leu Trp Glu
260 265 270
Lys His Phe Lys Gly Leu Asn Trp Asn Leu Val Val Trp Ile Leu Asn
275 280 285
Leu Lys Met Met Asn Ile Glu Ile Thr Pro Gln Arg Ser Lys Ala Arg
290 295 300
Lys Ser Gly Val Met Lys Cys Trp Asp Leu Cys Pro Ser Glu Lys Lys
305 310 315 320
Arg Lys Leu Pro Leu Pro Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser
325 330 335
Arg His Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp Ser Arg Ser Phe
340 345 350
Phe Thr Ser Ala His Pro Ser Arg Pro Cys Arg Met Arg Leu Tyr Gln
355 360 365
Phe Leu Ile His Leu Arg Lys Val Asp Thr His His Leu Gln Val Val
370 375 380
Thr Lys Thr Val Thr Ala Thr Thr Ala Asp Gly Gln Arg Met Arg Arg
385 390 395 400
Leu Lys Cys Lys Ala Cys Arg Leu Arg Trp Ala Arg Pro Glu Pro Ala
405 410 415
Ala Gln Ala Pro Pro Lys Ser His Phe Pro Pro His Pro Ser Gly Pro
420 425 430
Ser Arg Thr Ser Ser Leu Gln Leu Arg Ser Ile Pro His Val Pro Lys
435 440 445
Ala Thr Ala Ala His Ser Val Thr Val Lys Leu Gln Lys Gly Lys Asn
450 455 460
Ser Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn Gln Gly His Leu
465 470 475 480
Leu Met Ile Leu Leu His Asn Thr Tyr Met Glu Met His Tyr Gly His
485 490 495
Gln Ala Pro Gln Val Ala Met Leu Pro Lys Leu Leu Cys Arg Gln Met
500 505 510
Leu Pro Thr Leu Ser Thr Leu Gln Gln Arg His Pro Gln Gly Pro Cys
515 520 525
Pro Pro Pro Val Thr Pro Leu Arg Val Gln Ser Val Leu Leu Leu Gly
530 535 540
Val Pro Gln Thr Ala Ala Arg Gln Pro Ser Arg Pro Thr Gly Arg Thr
545 550 555 560
Pro Thr Thr Arg Leu Met Ala Pro Val Gly Ser Val Met Ser Cys Ser
565 570 575
Leu Leu Thr Gln Pro Ser Pro Ala Ser Ala Cys Thr Met Pro Pro Leu
580 585 590
Leu His Pro Gln Trp Ala Pro His Ser Ala Gly Leu Ser Pro Gly Ala
595 600 605
Cys Arg Pro Ala Cys Thr Cys Ile Ser Met Thr Thr Ile Ser Arg Ala
610 615 620
Thr Trp Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe Ser Arg
625 630 635 640
Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn Ser Arg Arg Asn Arg
645 650 655
Arg Tyr Arg Lys Ile Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala Val
660 665 670
Ala Pro Arg Cys Pro Arg Ser Ala Val Asp Ile Ser Pro Gly Pro Thr
675 680 685
Ser Pro Ser Leu Ala Ser Cys Ala Ser Val Ala Ile Gly Lys Leu Ala
690 695 700
Leu Leu Gly Ala Ser Ala Pro Cys Gly Ala Ala Gly Ala Arg Glu Ala
705 710 715 720
Gly Arg Phe Ala Val Leu Gly Thr Met Val Met Lys His Leu Asn Arg
725 730 735
Lys Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu Thr Met Met Met
740 745 750
Ser Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile Pro Leu Pro Ser
755 760 765
Pro Arg Gln His Leu Leu Pro Gln Tyr Pro Leu His Pro Pro Pro Pro
770 775 780
Cys Leu Leu Leu Leu His His Arg His His Leu Ala Phe Leu Glu Met
785 790 795 800
Ala Cys Ser Ser Gln His Thr His Ser Ile Lys Ile Trp Ile Ser Phe
805 810 815
Ser His Glu Gln Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn Thr Met
820 825 830
Gln Trp Asn Asn Lys Lys Met Ala Met Thr Val Ile Ala Gly Ala His
835 840 845
His Cys Gln Tyr Lys Leu Thr Tyr Thr Lys Val Trp Lys Met Asn Trp
850 855 860
Lys Lys Met Met Ile Gly Ser Gln His Leu Leu Phe Ser Pro Leu Asp
865 870 875 880
Ser Ser Pro Leu Gln Leu Leu Leu His Pro His Gly Lys Arg Cys Asn
885 890 895
Pro Cys Cys Arg Leu Thr Trp Met Ser Met Leu Gln Lys Gln Cys Cys
900 905 910
Tyr Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile Asn Leu Arg
915 920 925
Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser Leu Gly Phe Leu
930 935 940
Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys Leu Leu Met
945 950 955 960
Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr Lys Arg Glu Trp Glu Lys
965 970 975
Arg Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr Lys Glu Tyr Phe Leu
980 985 990
Lys Arg Ile Leu Ile Arg Lys Ala Met Thr Val Leu Ala Gly Asp Lys
995 1000 1005
Lys Gly Leu Gly Arg Phe Met Arg Cys Val Gln Ser Glu Thr Lys
1010 1015 1020
Ala Val Ser Leu Gln Leu Pro Leu Gly Arg Gly Pro Val Tyr Tyr
1025 1030 1035
Val Cys Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Phe Leu
1040 1045 1050
Phe Thr Val Pro Ile Glu Asp Met Arg Glu Cys Thr Leu Gly Arg
1055 1060 1065
Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Cys Leu Ile Pro
1070 1075 1080
Val Pro Ile Asp Leu Pro Arg Met Leu Pro Ile Ser Ser Pro Leu
1085 1090 1095
His Arg Pro Gln Met Pro Phe Trp Thr Cys Thr Phe Pro Ala Thr
1100 1105 1110
Thr Trp Gly Thr Trp Glu Thr Pro Ser Thr Trp Gly Trp Arg Thr
1115 1120 1125
Phe Arg Gly Pro Arg Arg Lys Val Leu Met Val Leu Trp Leu Pro
1130 1135 1140
Ala Asn Gln Ser Leu Gln Lys Ser Gln Val Phe Gln Trp Val Leu
1145 1150 1155
Arg Thr Glu Asn Ile Arg Lys Leu Ile Trp Thr Lys Gln Arg Ser
1160 1165 1170
Phe Leu Ser Leu Phe Pro Lys Leu Arg Ala Thr Glu Gln Met Thr
1175 1180 1185
Asn Val Gly Cys Ala Phe Ser Gly Arg Ile Leu His Gln Pro Glu
1190 1195 1200
Met Ala Ala Met Arg Leu Met Pro Lys Phe Leu Asn Ser Thr Asn
1205 1210 1215
Ser Trp Trp Thr Cys Thr Asn Leu Ser Val Pro Met Met Leu Thr
1220 1225 1230
Ile Leu Ile Trp Lys Arg Val Phe Ile Leu Leu Leu Ser Asp Lys
1235 1240 1245
Lys Leu Leu Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg Asn
1250 1255 1260
Val Ser Arg Ile Ser His Gln Met Lys Cys Leu Thr Ala Val Asp
1265 1270 1275
Cys Leu Gln Ala Phe Trp Asp Met Asn Met Glu His Arg Leu Thr
1280 1285 1290
Met Asp Ser Ala Leu Ser Leu Thr Lys Arg Glu Gly Pro Glu Thr
1295 1300 1305
Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu Thr Met Ser Leu Ser
1310 1315 1320
Asn Ile Leu Met Lys Phe Arg Leu Arg Leu Arg Ile Pro Ser Leu
1325 1330 1335
Arg Lys Tyr Arg Gln His Leu Lys Lys Thr Ser Ala Lys Gly Glu
1340 1345 1350
Lys Leu Lys His Cys Phe Lys Ala Trp Gly Arg Gly Pro Pro Leu
1355 1360 1365
His Thr Arg Ser Gln Lys Lys Asp Pro Ala Gly Lys Leu Lys Lys
1370 1375 1380
Leu Thr Thr Leu Ser Phe Val Leu Ile Glu Glu Arg Arg Asn Leu
1385 1390 1395
Gln Arg Asn Leu Lys Val Leu Trp Leu Lys Lys Ser Thr Lys Ser
1400 1405 1410
Arg Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe Phe Glu Lys Lys
1415 1420 1425
Arg Pro Glu Trp Leu Ser Ser Arg Lys Lys Gly His Thr Lys Asn
1430 1435 1440
Arg Arg Lys Ala Lys Arg Lys Pro Gln Ile Val His Lys Lys Arg
1445 1450 1455
Gly Leu Phe Leu Lys Lys Lys Tyr Leu Val Gln Gly Ala Lys Lys
1460 1465 1470
Ile Thr Phe Leu Ser Asn Gly Met Glu Ala Cys Gly Thr His Pro
1475 1480 1485
Thr Pro Arg Leu Ser Asp Arg Val Phe Leu Val Lys Ile Thr Thr
1490 1495 1500
Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala Arg Gly
1505 1510 1515
Gly Thr Thr Ile Gly Glu Val Thr Ser Leu Cys Phe Phe Tyr Leu
1520 1525 1530
Leu Tyr Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1110
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> HTPA- AND HA-EXTENDED POLY-FSP POLYPEPTIDE 4A
<400> 1110
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Ile Gln Lys
20 25 30
Lys Lys Gln Lys Ser Met Ala Lys Lys Ser Gln Gln Pro Leu Val Leu
35 40 45
Lys Lys Asn Arg Lys Gln Glu Trp Gly Gly Gln Ala His Arg Gln Arg
50 55 60
Asn Asn Ala Lys Lys Met Pro Phe Gln Glu Glu Lys Lys Asn Gly Arg
65 70 75 80
Ile Ser Ser Ser Leu Ile Leu Ser Phe Gln Arg Val Lys Asp Ser Lys
85 90 95
Lys Met Thr Gln Lys Met Cys Ser Ser Leu Ala Leu Pro Thr Gly Leu
100 105 110
Thr Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala Val Leu Ile Ser Ser
115 120 125
Ser Thr Ser His Phe Leu Met Arg Ser Pro Val Leu Pro Ser Ser Arg
130 135 140
Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met Trp Thr Trp Ser Ser
145 150 155 160
Trp Leu Lys His Pro Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser
165 170 175
Leu Lys Gly Ser Arg Thr Ser Cys Cys Pro Arg Ser His Pro Arg Leu
180 185 190
Pro Arg Thr Lys Trp Pro Leu Gln Cys Leu Leu His Ser Leu Gly Thr
195 200 205
Thr Gly Thr Leu Val Trp Glu Arg Gly Val Leu Gln Met Arg Ser Leu
210 215 220
Glu Ala His Cys Pro Leu Gln Thr Phe His Leu His His Cys Arg Thr
225 230 235 240
Gln Pro Ser Ser Cys Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp
245 250 255
Ser Gly Ala Val Val Gly Leu Arg Pro Val Ala His His Leu Pro Arg
260 265 270
Pro Ile Gln Gly Leu His Cys Pro Gln Ala Pro His Gln Pro Ala Leu
275 280 285
Ser Trp Gly Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys
290 295 300
Arg Trp Pro Arg Arg Ser Gln Lys Ser Gln His His Cys Ala Leu Arg
305 310 315 320
Lys Ile Glu Trp Ala Thr Lys Leu Ser Leu Gly Gly Lys Ala Gly Pro
325 330 335
Gln Ala Gln Glu Lys Ala Arg Pro Ser Pro Cys Leu Ser Trp Ser Ser
340 345 350
Arg Ile Val Ala Pro Gly His Ala Leu Ser Cys Arg Thr Arg Arg Arg
355 360 365
Trp Ser Ser Lys Cys Arg Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys
370 375 380
Ser Cys Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly Arg Cys Pro Val
385 390 395 400
Gln Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu Arg Arg Trp Gly
405 410 415
Pro Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly Phe Gln Leu Leu
420 425 430
Arg Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro Arg Lys Gly Pro
435 440 445
Phe Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala Val Thr Val Met
450 455 460
Ala Gly Ser Val Pro Ser Ala Gln Ser Val Asp Ala Leu Glu Ser Pro
465 470 475 480
Gly Pro Leu Ala Leu Glu Gly Pro Ser Ser Pro Arg Asn Leu Leu Trp
485 490 495
Arg Glu Met Ser Ile Phe Leu Pro Gly Ile Phe Cys Gln Lys Lys Val
500 505 510
Pro Ser Ala Ser Pro Trp Gly Leu Val Pro Pro Ser Pro Pro Leu Ala
515 520 525
Leu Gly Pro Arg Met Gln Leu Cys Thr Gln Leu Ala Arg Phe Phe Pro
530 535 540
Ile Thr Pro Pro Val Trp His Ile Leu Gly Pro Gln Arg His Thr Pro
545 550 555 560
Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro Phe Phe Arg Gly Ser
565 570 575
Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys Asn Glu Gly Asn Asn
580 585 590
His Trp Pro Arg Val Glu Met Pro Thr Gly Trp Leu Leu Val Gly Tyr
595 600 605
Asn Thr Arg Asn Thr Ala Gln Asn Pro Arg Leu Gln Gln His Leu Lys
610 615 620
His Trp Gln Gln Cys Thr Arg Ala Arg Trp Cys Gln Glu Pro Cys Gln
625 630 635 640
Thr Leu Thr Phe Phe His Phe Phe Phe Phe Phe Lys Thr Val Ser Leu
645 650 655
Cys Cys Pro Gly Trp Ser Lys Gly Gln Pro Pro Pro Pro Gly Leu Lys
660 665 670
Pro Ser Ser Leu Ala Ser Gln Val Ala Arg Thr Thr Gly Val Tyr Gln
675 680 685
His Val Trp Leu Ile Cys Phe Val Phe Phe Val Cys Val Glu Thr Gly
690 695 700
Phe Cys His Val Ala Gln Val Gly Leu Glu Arg Leu Val Ser Leu Ser
705 710 715 720
Gly Ile Thr Asp Val Asn His Trp Ala Gln Pro Lys Pro Ser Pro Ser
725 730 735
Lys Gly Thr Gly Met Asn Arg Pro Ile Gly Leu Arg Val Gly Lys Gly
740 745 750
Val Trp Ala Arg Leu Leu Lys Lys Lys Pro Arg Asp Ile Cys Arg Ile
755 760 765
Ser Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr
770 775 780
Asp Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro Thr Thr Gly Val
785 790 795 800
Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp Pro Pro Arg Cys
805 810 815
Arg Cys Arg Arg Glu Tyr Arg Val Thr Met Asn Ile Leu Asn Ser Leu
820 825 830
Pro Ser Ser Met Glu Ile Ala Val Leu Gln Glu Thr Ala Lys Lys Ser
835 840 845
Pro Thr Ser Phe Cys Cys Asn Leu Asp Leu Gln His Gln Arg Arg Arg
850 855 860
Lys Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro Lys Ala
865 870 875 880
Asn Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn Leu Leu
885 890 895
Asn Leu Val Gln Leu Asn Pro His Ser Pro His His Arg Lys Asp Glu
900 905 910
Glu Asp His Gln Lys Arg His His His His Asn Gln Lys Lys Met Ser
915 920 925
Val Pro Leu Phe Phe His Gly Asp Leu Cys Arg Glu Ser Thr Leu Gly
930 935 940
Asn Phe Trp Met Lys Leu Leu Gln Leu Pro Gln Arg Pro Pro Leu Gln
945 950 955 960
Pro Val Thr Gly Met Glu Ile Leu Leu Trp Ile Leu Leu Lys Met Glu
965 970 975
Ile Gln Ile Phe Lys Ile Cys Leu Gly Glu Met Gln Leu Cys Thr Ser
980 985 990
Arg Ile Leu Asn Leu Gln Val Leu Lys Lys Ile Leu Arg Ser Phe Met
995 1000 1005
Lys Leu Tyr His Ser Leu Val Met Cys Leu Arg Leu Arg Thr Lys
1010 1015 1020
Leu Glu Lys Ala Leu Ser Ala Leu Phe Ile Trp Pro Gln His Ser
1025 1030 1035
Tyr Lys Ile Thr His Pro Phe Ala Ser Gln Pro Leu Gly Gln Glu
1040 1045 1050
Met Pro Asn Asn Thr Gln Ile Arg Leu Leu Lys Pro Asp Lys Lys
1055 1060 1065
Lys Lys Ser Thr Glu Lys Thr Lys Gly Gln Ala Phe Gly Ser Phe
1070 1075 1080
Ser Ala Asp Phe Ser Ala Pro Gln Gly Gln Ala Phe Gly Ser Leu
1085 1090 1095
Cys Gln Leu Val Ser Ala Asp Phe Ser Ala Pro Gln Val Thr Arg
1100 1105 1110
Leu Arg Ser Leu Asn His Leu Leu Ile Trp Leu Lys Asn Trp Lys
1115 1120 1125
Arg Phe Lys Leu Lys Lys Lys Tyr Gln Ala Pro Leu Arg Leu Trp
1130 1135 1140
Ser Trp Cys Gly Thr Ser Gln Thr Tyr Phe Gly Ser Ile Ile Cys
1145 1150 1155
Ile Lys Asn Met Phe Leu Gln Arg Lys Gly Phe Leu Asn Leu Ser
1160 1165 1170
His Val Glu Lys Phe Glu Leu Lys Lys Asn Leu Leu Leu Pro Val
1175 1180 1185
Val Ile Asn Leu Lys Arg Leu Gln Lys Phe Met Leu Asn Gln Lys
1190 1195 1200
Cys Leu Ala Pro Phe Pro Ala Cys Thr Ser Lys Ala Trp Thr Pro
1205 1210 1215
Arg Lys Leu Val Gly Arg Ala Val Arg Arg Lys Gly Ile Leu Ala
1220 1225 1230
Met Thr Leu Thr Leu Asn Gly Ile Glu Ala Leu Thr Ala Leu Phe
1235 1240 1245
Thr Cys Arg Thr Ala Ser Ile Ser Val Asn Ile Ser Thr Leu Met
1250 1255 1260
Ser Ile Leu Glu Ala Ile Ile Lys Lys Met Lys Lys Arg Ile Met
1265 1270 1275
Val His Arg Trp Ile Phe Ser Asn Gln Leu Thr Val Gln Met Leu
1280 1285 1290
Cys Leu Pro Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe Ser Asn
1295 1300 1305
Gln Leu Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu Lys Gln
1310 1315 1320
Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile Pro Asn
1325 1330 1335
Phe Phe Trp Ser Leu Gly Ile Gly His Thr Gly Ala Trp Trp His
1340 1345 1350
Thr Gly Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr Val Ser Arg
1355 1360 1365
Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly Met Ala
1370 1375 1380
Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg Val Ser Trp Cys
1385 1390 1395
Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser Ser Pro Leu
1400 1405 1410
Trp Asp Cys Ser Thr Thr Thr Gly Thr His His Gly Cys Leu Trp
1415 1420 1425
Glu Ile Pro Ser Val Thr Leu Leu Ala Asn Leu His Leu Cys Tyr
1430 1435 1440
Tyr His Ser Gln Ser Asn Arg Asn Lys Ser Arg Gln Met Glu Ser
1445 1450 1455
Leu Gly Met Lys Leu Gln Leu Lys Lys Lys Val Asn Ala Cys Ser
1460 1465 1470
Thr Tyr Thr Pro His Ile Cys Arg His Thr Cys Arg Val Asn Ala
1475 1480 1485
Val Glu Glu Leu His Ser Arg Arg Met Ser Val Arg Ile Val Lys
1490 1495 1500
Asn Trp Val Ser Cys Cys Tyr Val Arg Leu Ser Ala Val Gly Leu
1505 1510 1515
Ser Thr Trp Ser Ala Leu Asp Asn Lys Ile Ile Cys Lys Gly His
1520 1525 1530
Arg Ile Thr Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1111
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 1B
<400> 1111
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Thr Glu Ile
20 25 30
Gln Leu Thr Met Asn Asp Ser Lys His Lys Leu Glu Ser Pro Ala Leu
35 40 45
Lys Gln Val Ser Pro Ala Ser Pro Pro Thr Gln Gln Pro Gln Thr Pro
50 55 60
Gln Asp Ser Arg Gln Val Leu Ala Met Pro Ser Ser Trp Ser Ser Ser
65 70 75 80
Gly Arg Thr Gln Arg Lys Val Val Lys Asn Pro Ser Gln Pro Val Pro
85 90 95
Leu Arg Asn Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr Arg Ser Cys
100 105 110
Ser Ile Ser Leu Lys Lys Ser Leu Glu Lys Met Pro Leu Met Met Lys
115 120 125
Lys Lys Asp Ser Thr Ile Phe Ile Val Pro Met Ser Leu Ala Cys Ser
130 135 140
Ile Thr Val Ser Phe Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val
145 150 155 160
Ser Ser Ile Ser His Trp Asn Lys Val Arg Gln Asn Phe Lys Arg Asn
165 170 175
Ala Asp Lys Lys Asn Val Arg Ser Gly Glu Lys Asn Asp Leu Gln Leu
180 185 190
Phe Val Met Ser Asp Thr Thr Tyr Lys Ile Tyr Trp Thr Val Ile Leu
195 200 205
Leu Asn Pro Cys Gly Asn Leu His Leu Lys Thr Thr Ser Leu Gly Asp
210 215 220
Cys Pro Arg Thr Met Ala Gly Pro Ser Ala Ser Leu His Pro Ala Ser
225 230 235 240
Gly Arg Ala Ser Arg Lys Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg
245 250 255
Ala Gly Gly Pro Ala Gly Trp Ala Arg Gln Ala Phe Asp Lys Lys Gly
260 265 270
Phe Val Ile Leu Ser Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys
275 280 285
Val Pro Val Ala Glu Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly Ala
290 295 300
Ala Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro Cys Arg Gln Leu Pro
305 310 315 320
Ala Ser Ser Pro Thr Lys Cys Glu Ile Cys Val Lys Arg Arg Arg Arg
325 330 335
Arg Lys Arg Ser Ser Gln Ser Arg Ser Pro Val Pro Lys Lys Arg Glu
340 345 350
Arg Met Met Leu Pro Val Arg Ala Arg Thr Ala Arg Ser Ala Leu Pro
355 360 365
Gln Gly Arg Ala Pro Leu Glu Gly Met Leu Leu Pro Arg Ala Leu Pro
370 375 380
Ser Leu Leu Ser Arg Met Pro Ala Arg Arg Glu Ser Arg Phe Trp Leu
385 390 395 400
Ala Leu Gln Ala Leu Gly Leu Arg Pro Pro His Leu Pro Ser Cys His
405 410 415
Pro Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro His Gln Ala Pro Thr
420 425 430
Ala Phe Phe Leu Leu Asp Ile Ile Leu Arg Leu Pro Cys Lys Val Thr
435 440 445
Glu Ser Ser Asn Met Gly Gly Asn Arg Ser Ile Cys Leu Thr Asn Ala
450 455 460
Lys Lys Met Glu Asp Met Ile Trp Glu Ser Thr Pro Leu Ser Ile Ser
465 470 475 480
Arg Pro Thr Ser Arg Ala Arg Gln Ser Cys Cys Leu Pro Gly Leu Thr
485 490 495
His Pro Ala His Gln Pro Leu Gly Ser Met Thr Leu Ala Ile Arg Phe
500 505 510
Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val Thr Ala Ala Pro Ser
515 520 525
Gly Gln Tyr Phe Lys Gly Lys Lys Arg Arg Lys Glu Ile Phe Lys Lys
530 535 540
Lys Lys Pro Leu Thr Phe Ser Pro Ser Leu Ala Lys Lys Thr Leu Thr
545 550 555 560
Asn Ser Ser Phe Phe Tyr Thr Ser Asp Arg Glu Ala Lys Lys Ser Met
565 570 575
Lys Arg Ser Met Thr Leu Lys Ala Leu Val Lys Thr Trp Thr Gln Phe
580 585 590
Arg Asn Tyr Pro Arg Ala Ser Ser Pro Gly His Pro Leu Gly Pro Asn
595 600 605
Gly Ile Trp Glu Val Met Pro Arg Thr Leu Glu Gly Cys Ile Ser Val
610 615 620
Lys Asp His Arg Thr Ser Gln Asn His Ser Lys Cys Ile Thr Glu Cys
625 630 635 640
Val Arg Thr Ala Leu Asn Arg Arg Ser Lys Ile Glu Ala Ser Pro Ile
645 650 655
Gly Ser Ile Ala Leu Arg Ser Met Pro Lys Ser Arg Asn Gln Val Leu
660 665 670
Phe Arg Arg Asn Leu Thr Pro Ser Gln Leu Arg Thr Leu Ala Pro Pro
675 680 685
Tyr Met Leu Leu Pro Gln Ser Leu Ser Gln Ser Leu Ser Arg Lys Gln
690 695 700
Ile Pro Ser Gln Ser Met Leu Val Ala Ser Arg Ala Gly Gln Phe Pro
705 710 715 720
Val Trp Arg Arg Thr Ser Arg Gly Met Ser Leu Gln Trp Lys Ser Gly
725 730 735
Asn Ala Cys Thr Pro Leu Arg Cys Pro Ser Arg Ser Pro Ala Thr Phe
740 745 750
Leu Thr Ala Leu Asn Gly Trp His Arg Ser Gly Leu Arg Ala Gln Arg
755 760 765
Lys Arg Lys Arg Glu Lys Arg Ser Gln Lys Ser Arg Gln Asn His Leu
770 775 780
Gln Leu Lys Ser Cys Arg Arg Lys Ile Ser Asn Trp Ser Lys Leu Arg
785 790 795 800
Ser Pro Trp Ile Phe Val Ser Lys Lys Arg Leu Pro Lys Leu Thr Lys
805 810 815
Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile Thr Leu Ile
820 825 830
Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys His Pro His Arg Arg
835 840 845
Pro Gly Trp Lys Gly His His Arg Val Val Phe Ser His His Pro Ser
850 855 860
Gly Ser Thr Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly Gly Arg
865 870 875 880
Arg Glu Lys Lys Gly Cys Arg Glu Arg Ser Leu Leu Tyr Ser Arg Met
885 890 895
Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro Asp Tyr Phe Val
900 905 910
Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser Phe Pro Val Gly
915 920 925
Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys Ser Cys Thr Ser
930 935 940
His Ser Asn Pro Trp Ser Gln Ser Arg His Pro His Arg Ser Pro Pro
945 950 955 960
Thr Ser Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu Pro Arg Ala Ser
965 970 975
Leu Arg Ala Thr Val Pro Arg His Ser Ser Val Leu Ala Thr Gly Leu
980 985 990
His Leu His Arg Gln Ile Ser Leu Pro Leu Arg Gly Phe Leu Leu His
995 1000 1005
Gln Pro Leu Pro Gly Gln His Leu Trp Leu Ser His Arg Leu Arg
1010 1015 1020
Leu Arg Leu Pro Arg Thr Gln Arg Pro Pro Arg Ser Ile Leu Ser
1025 1030 1035
Leu Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro Leu His
1040 1045 1050
Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg Tyr Pro
1055 1060 1065
Arg Leu Lys Thr Phe Gly Val Pro Leu Gly Ser Ile Leu Cys Leu
1070 1075 1080
Ala Gly Ser Leu Ser Thr Met Met Ile Ile Ser Thr Thr Arg Gln
1085 1090 1095
Glu Cys Gly Arg Arg Ala Ser Val Pro Cys Arg Pro Met Ile Gly
1100 1105 1110
Ser Ala Arg Pro Gly Pro Trp Arg Thr Ser Ala Met Pro Ser Ala
1115 1120 1125
Met Gly Val Ala Leu Pro Thr Ser Cys Glu Ser Gly Arg Ser Pro
1130 1135 1140
Pro Ala Thr Gly Gly Arg Met Pro Gly Ser Gln Ser Ile Met Met
1145 1150 1155
Ser Trp Met Pro Pro Leu Ala Pro Cys Ala Ala Cys Pro Cys Ser
1160 1165 1170
Pro Ala Pro Thr Leu Cys Pro Ala His Pro Ala Arg Ala Pro Thr
1175 1180 1185
Ala Val Pro Ala Phe Thr Pro Leu Ser Ala His Pro Val Pro Val
1190 1195 1200
Leu Ser Gly Cys His Leu Ala Val Arg Thr Ser Met Leu Thr Leu
1205 1210 1215
Leu Pro Met Leu Lys Leu Ala Pro Leu Gln Val Thr Thr Thr Leu
1220 1225 1230
Lys Leu Ile Leu Val Met Leu Glu Ile Val Thr Glu Ser Thr Arg
1235 1240 1245
Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly Pro Trp
1250 1255 1260
Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys Leu
1265 1270 1275
Arg Leu Arg Asn Thr Ser Pro Ile Val Phe Phe Leu Ala Pro Tyr
1280 1285 1290
Phe Pro Arg Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys Met
1295 1300 1305
Met Met Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg Arg
1310 1315 1320
Met Thr Met Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr Cys
1325 1330 1335
Leu Thr Pro Arg Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln
1340 1345 1350
Thr Ile Ser Gln Arg Arg Pro Ile Gln Thr Pro Pro Gly Thr Ser
1355 1360 1365
Leu Ala Ile Trp Gly Asn Gln Gln Leu Lys Trp Thr Pro His Ile
1370 1375 1380
Leu Lys Ser Ala Ser Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr
1385 1390 1395
Cys Arg Met Trp Trp Ile Ala Lys Lys Arg Ile Lys Leu Arg Arg
1400 1405 1410
Asn Arg Thr Arg Leu Thr Leu Thr Gly Thr Arg Ser Ser Gly Thr
1415 1420 1425
Arg Ala Ser Pro Ser Ala Val Cys Leu Cys Cys Trp Thr Cys Pro
1430 1435 1440
Ser Arg Ser Phe Pro Ala Ala Ser Pro Ser Gly Leu Arg Ala Pro
1445 1450 1455
Val Gly Ala Gln Ala Pro Pro Glu Val Thr Leu Arg Ala Ser Cys
1460 1465 1470
Ala Ser Ser Ala Ser Lys Ala Cys Ala Gly Leu Trp Pro Trp Gly
1475 1480 1485
Ala Gln Val Arg Gln Pro Ser Leu Pro Gly Pro Cys Ala Ser Leu
1490 1495 1500
Leu Ser Thr Leu Ser Gln Pro Pro Pro Gln Ala Pro Ser Gln Val
1505 1510 1515
Trp Thr Ala Ala Thr Leu Arg Cys Pro Ala Val Pro Ala Ala Ala
1520 1525 1530
Cys Pro Pro Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1112
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 2B
<400> 1112
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Arg Lys Met
20 25 30
Gln Ser Leu Asn His Pro Ser Arg Leu Thr Asn Met Ser Arg Thr Pro
35 40 45
Pro Arg Arg Val Cys Asn Pro Arg Arg Lys Thr Trp Lys Met Arg Lys
50 55 60
Lys Tyr Ala Gln Lys Pro Ser Gln Lys Asn His Leu Tyr Asn Ser Arg
65 70 75 80
Lys Lys Leu Leu Glu Asp Met Lys Gln Asn Gly Phe Thr Gly His Arg
85 90 95
Glu Gly Ser Glu Ser Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro
100 105 110
Ile Arg Met Cys Ala Leu Ser His Pro Ser Phe Tyr Ile Ser Ser Thr
115 120 125
Val Cys Phe Leu Ser Lys His Cys Met Thr Ala Cys Thr Gln Lys Lys
130 135 140
Gly His Met Ile Phe Ser Arg Glu Lys Ile Ile Asn Pro Thr Ile Ser
145 150 155 160
Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Glu Leu Ser Leu Glu Pro
165 170 175
Trp Ile Pro Tyr Leu His Gln Gln Lys Thr Gln Gly Gly Lys Lys Arg
180 185 190
Ser Lys Phe Pro Gly Thr Ser Leu Gln Cys Tyr Leu Asn Arg Cys Ser
195 200 205
Leu Met Glu Gln Ile Pro His Leu Lys Ser Ala Ser Pro Gln Ile Met
210 215 220
Gln Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg Arg Met Gln Asn
225 230 235 240
Leu Asp Asn Leu Gly Val Pro Trp Pro Leu Leu Pro Gly Pro Leu Glu
245 250 255
Asn Thr Gln Ile Pro Arg Thr Ser Pro Leu Trp Lys Ile Thr Met Val
260 265 270
Leu Thr Tyr Pro Asn Cys Val Val His Val Leu Met Phe Trp Leu Pro
275 280 285
Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly Phe Gln Trp Gly Glu
290 295 300
Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly Pro Tyr Pro Ile Ser
305 310 315 320
Glu Gly Leu Thr Met Thr Thr Gly Arg Asn Ile Asn Ser Asn Ser Leu
325 330 335
Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu Cys His His Ala Ile
340 345 350
Met His Arg Lys Met Thr Ser Pro His Phe Arg Leu Phe Ser Ser Lys
355 360 365
Ile Pro His Pro Gln Val Pro Ser Val Val Ala Leu Cys Lys Phe Arg
370 375 380
Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro Gln Ala Arg
385 390 395 400
Leu Cys Leu Ile Val Ser Arg Thr Leu Leu Leu Val Gln Ser Ala Ala
405 410 415
Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp Ser Arg Ser His Leu
420 425 430
Asp Phe Ser Pro Tyr Trp Met Lys Lys Val Lys Leu Ala Asn Gly Leu
435 440 445
Trp Phe Asn Leu Ile Phe Val Leu Phe Lys Ala Asp Gln Ser Glu Ser
450 455 460
Ser Leu Ser Ser Gly Arg Asn Lys Lys Thr Lys Leu Trp Phe Ser Leu
465 470 475 480
Ile Asn Ile His His Arg Lys Asn Pro Leu Leu Pro Met Arg Ile Pro
485 490 495
Ser Leu Asn Ala Gln Trp Met Phe Leu Arg Ile Leu Leu Leu Ala His
500 505 510
Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys Gly Glu Cys Val Cys
515 520 525
Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile Leu Lys Gln Pro Leu
530 535 540
Asp Leu Lys Ile Ser Lys Thr Phe Met Leu Gln Ala His Pro Gln Val
545 550 555 560
Pro Ala Leu Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg Gly Pro Leu
565 570 575
Thr Ser Ala Pro Ser Ala Gln Gln Ser Leu Thr Ala Ser Pro Gln Ile
580 585 590
Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr Ile Ile Tyr Pro Pro
595 600 605
Ser Thr Cys Ser Leu Pro Cys Arg Gly Arg Thr Leu Glu Ser Ala Gly
610 615 620
Leu Phe Pro Trp Leu His Thr Gln Cys Thr His Pro Cys Thr Met Leu
625 630 635 640
Leu Pro Gln Gly Trp Trp Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys
645 650 655
Lys Met Cys Lys Val Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys
660 665 670
Pro Trp Lys Gly Ile Cys Trp Lys Trp Pro Val Thr Val Ala Ala Gln
675 680 685
Trp Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln Glu Arg Gly Cys
690 695 700
Ser Ser Trp Leu Met Lys Gln Thr Trp Met Lys Ser Trp Ser Leu Arg
705 710 715 720
Asp Pro Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser Thr Arg Val Leu
725 730 735
Trp Met Pro Thr Ser Thr Val Arg Arg Arg Asn Ser Arg Lys Gln Ser
740 745 750
Gln Val Gln Leu Ala Ile Gln Val Leu Leu Val Asp Lys His Lys Tyr
755 760 765
Phe Leu Phe Gly Arg Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser
770 775 780
His Leu Ile Ala His Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe
785 790 795 800
His Pro Arg Leu Leu Thr Arg Lys Lys Pro Gly Lys Phe Leu Pro Ser
805 810 815
Arg Phe Pro Trp Gly Pro Pro Pro Leu Cys His Pro Ala Trp Leu Ser
820 825 830
Pro Ile Ser Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe His Val Leu
835 840 845
Ala Leu Glu Val Thr Phe Pro Pro Gly Thr Ala Met Pro Gln Met Gln
850 855 860
Leu Gln Ala Leu Ala Met Trp Glu Lys Gly Trp Asp Lys Arg Lys Arg
865 870 875 880
Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile Gln Glu Lys Gly
885 890 895
Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe Glu Ala Cys Arg Glu
900 905 910
Met Glu Ser Leu Ser Ala Pro Glu Lys Ile Thr Leu Phe Glu Ala His
915 920 925
Met Ala Arg Cys Thr Ser Ile Asn Val Leu Cys Val Arg Ala Ser Leu
930 935 940
Ile Glu Lys Leu Met Lys Glu Lys Arg Lys Met Lys Arg Asn Gln Val
945 950 955 960
Ala Ser Pro Gln Ile Met Gln Arg Leu Phe Ile Lys Gly Tyr Gln Asn
965 970 975
Asn His Phe Thr Phe His Leu Gln Asn Phe Ala Phe Phe Ser Ser Phe
980 985 990
Gly Asn Asn Lys Tyr Ile Asn Ile Leu Thr Arg Arg Lys Lys Arg Glu
995 1000 1005
Asp His Cys Gly Leu Leu Ile Leu Ile Gln His Gly Gly Ile Phe
1010 1015 1020
Thr Phe Arg Phe Trp Val Glu Lys Leu Ser Trp Asn Ile Cys Lys
1025 1030 1035
Asn Leu Ser Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu Leu Tyr
1040 1045 1050
Val Tyr Ile Ile Glu Thr Asn Val Phe Val Leu Asn Leu Phe His
1055 1060 1065
Val Pro Val Asn Gln Ile Phe Met Met Ala Phe Tyr Leu Lys Tyr
1070 1075 1080
Thr Glu Lys Ala Trp Val Met Glu Leu Glu Trp Leu Ile Gln Gln
1085 1090 1095
Gln Cys Tyr Gln Gln Glu Lys Lys Ser Arg Lys Leu Met Ser Ser
1100 1105 1110
Cys Arg Ala Phe Ile His Thr Pro Arg Ser Pro Gly Cys Ser Val
1115 1120 1125
Tyr Ala Asn Met Cys Trp Ala Phe Trp Lys Pro Pro Ser Gln Gly
1130 1135 1140
Ile Ser Ser Cys Leu Met Thr Gly Cys Trp Gly Ser Pro Pro Leu
1145 1150 1155
His Leu Cys Gln Pro Leu Arg Arg Tyr Lys Lys Arg Gly Val Ile
1160 1165 1170
Ala Trp Arg Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys Asn
1175 1180 1185
Leu Ile Leu Phe His Val Arg Asn Ile Val Tyr Gly Ile Gln Val
1190 1195 1200
Met Leu Cys Gly Lys Gly Leu Thr His Pro Val Pro Leu Lys Arg
1205 1210 1215
Thr Leu Gln Asn Lys Arg Asn Lys Asn Ile Lys Arg Val Asn Gln
1220 1225 1230
Lys Lys Gly Asn Ile Lys Arg Lys Ser Ile Leu Leu His Leu Ile
1235 1240 1245
Val Leu Asn Ser Pro Glu Ser Asn Pro Lys Phe Phe Leu Thr Phe
1250 1255 1260
Ser Gln Leu Glu Lys Lys Ala Thr Trp Met Arg Arg Thr Gly Ala
1265 1270 1275
Leu Arg Ala Thr Ala Pro Ala Thr Ala Ala Pro Gln Ala Gln Thr
1280 1285 1290
Pro His Trp Arg Ala Ala Thr Thr Ser Ser Met Ser Ser Ser Pro
1295 1300 1305
Arg Ala Glu Pro Thr Ser Ser Ser Ser Trp Ala Thr Cys Trp Pro
1310 1315 1320
Arg Cys Cys Ser Ser Ser Cys Tyr Trp Ser Leu Ser Ser Trp Pro
1325 1330 1335
Pro Ala Gly Ala Ala Glu Ala Thr Asn Thr Arg Thr Arg Ser Arg
1340 1345 1350
Glu Ser Gln Arg Gly Arg Met Leu Thr Trp Arg Ser Ser Leu Trp
1355 1360 1365
Leu Gln Gly Thr Arg Cys Phe Thr Gly Val Arg Thr Ser Ser Gly
1370 1375 1380
Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly Thr Pro
1385 1390 1395
Arg Gly Asp Trp Lys Arg His Pro Pro Arg Arg Asn Ser Val Ile
1400 1405 1410
Val His Lys Ile Val Leu Val Phe Leu Lys Ser Leu Ser Ser Tyr
1415 1420 1425
Asn Cys Glu Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile Glu
1430 1435 1440
Phe Ala Val Leu Lys Leu Leu Asn Met Asp Leu His Trp Asn Ser
1445 1450 1455
Ala Tyr Leu Gly Arg Thr Leu Leu Val Thr Cys Ile Leu Tyr His
1460 1465 1470
Arg Trp Ile Val Thr Ser Met Cys Gln Ser Gln Arg Trp Leu Thr
1475 1480 1485
Ser Thr Thr Ser Arg Ser Ser Ala Leu Met Trp Thr Arg Gln Ile
1490 1495 1500
Asn Arg Arg Lys Leu Gln Arg Lys Lys Arg His Pro Ser Trp Pro
1505 1510 1515
Trp Thr Arg Cys Leu Arg Met Arg Pro Pro Arg Ser Gly Tyr Pro
1520 1525 1530
Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540
<210> 1113
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 3B
<400> 1113
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Gly Ala Ala
20 25 30
Ala Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr Thr Pro Ser
35 40 45
Ser Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln Ser Lys Lys
50 55 60
Thr Met Thr Ala Ala Gly Leu Thr Pro Lys Asn Lys Lys Arg Arg Lys
65 70 75 80
Leu Arg Pro Lys Met Ile Arg Lys Ile Gln Lys Arg Arg Arg Thr Ala
85 90 95
Asn Arg Arg Asn Ser Arg Arg Ala Thr Pro Thr Ser Lys Gly Ser Leu
100 105 110
Arg Arg Lys Tyr Leu Arg Val Arg Gly Pro Pro Leu His Thr Arg Asn
115 120 125
Ile Arg Lys Leu Ile Trp Thr Lys Gln Arg Ser Phe Leu Ser Leu Phe
130 135 140
Pro Lys Leu Arg Ala Thr Glu Gln Met Thr Asn Val Gly Cys Ser Ile
145 150 155 160
Pro His Val Pro Lys Ala Thr Ala Ala His Ser Val Thr Val Lys Leu
165 170 175
Gln Leu Pro Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser Arg His Thr
180 185 190
Met Ser Leu Ser Asn Ile Leu Met Lys Phe Arg Leu Gln Ser Ser Pro
195 200 205
Phe Leu Ala Arg Ser Trp Asn Thr Met Gln Trp Asn Asn Lys Lys Met
210 215 220
Ala Met Thr Val Ile Ala Gly Ala His His Cys Gln Tyr Lys Leu Thr
225 230 235 240
Tyr Thr Lys Val Trp Lys Met Asn Trp Lys Lys Met Met Ile Gly Ser
245 250 255
Gln His Leu Leu Phe Ser Pro Leu Asp Ser Ser Pro Leu Gln Leu Leu
260 265 270
Leu His Pro His Gly Lys Arg Cys Asn Pro Cys Cys Arg Leu Thr Trp
275 280 285
Met Ser Gln Asn Thr Arg Ser Thr Asn Leu Glu Lys Asn Pro Ser Leu
290 295 300
Lys Lys Gln Ser Gln Arg Arg Gly Lys Leu Ser Ala Phe Ser Gly Arg
305 310 315 320
Ile Leu His Gln Pro Glu Met Ala Ala Met Arg Leu Met Pro Lys Phe
325 330 335
Leu Asn Ser Thr Asn Ser Trp Trp Thr Leu Thr Thr Leu Ser Phe Val
340 345 350
Leu Ile Glu Glu Ala Arg Gln Pro Ser Arg Pro Thr Gly Arg Thr Pro
355 360 365
Thr Thr Arg Leu Met Ala Pro Val Gly Ser Val Met Ser Cys Ser Leu
370 375 380
Leu Thr Gln Pro Ser Pro Ala Ser Ala Cys Thr Met Pro Pro Leu Leu
385 390 395 400
His Pro Gln Trp Ala Pro His Ser Ala Gly Leu Ser Pro Gly Ala Cys
405 410 415
Arg Pro Ala Cys Thr Cys Ile Ser Met Thr Thr Ile Ser Arg Ala Thr
420 425 430
Trp Gly Pro Val Tyr Tyr Val Cys Asn Arg Met Asn Val Ser Ser Val
435 440 445
Leu Lys Pro Phe Leu Phe Thr Val Pro Ile Glu Asp Met Arg Glu Cys
450 455 460
Thr Leu Gly Arg Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Cys
465 470 475 480
Leu Ile Pro Val Pro Ile Ser Glu Lys Lys Arg Lys Leu Pro Asn Ile
485 490 495
Glu Ile Thr Pro Gln Arg Ser Lys Ala Met Leu Gln Lys Gln Cys Cys
500 505 510
Tyr Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile Asn Leu Arg
515 520 525
Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser Leu Gly Phe Leu
530 535 540
Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys Leu Leu Met
545 550 555 560
Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr Lys Ser Arg Lys Lys Gly
565 570 575
His Thr Lys Asn Arg Arg Lys Ala Lys Arg Lys Pro Gln Ile Tyr Leu
580 585 590
Phe Phe Leu Thr Val Cys Gly Phe His Leu Lys Lys Thr Ser Ala Lys
595 600 605
Trp Leu Lys Lys Ser Thr Lys Ser Arg Ser Asn Gly Met Glu Ala Cys
610 615 620
Gly Thr His Pro Thr Pro Arg Leu Ser Cys Leu Arg Val Arg Cys Gly
625 630 635 640
Gly Trp Leu Cys Gly Trp Thr Pro Arg Gly Arg Lys Ser Gly Val Met
645 650 655
Lys Cys Trp Asp Leu Cys Pro Val His Lys Lys Arg Gly Leu Phe Arg
660 665 670
Leu Asp Phe His Pro Arg Ser Ser Ser Gly Lys Gly Lys Asn Ser Pro
675 680 685
Cys Cys Gln Lys Lys Leu Arg Val Gln Asn Gln Gly His Leu Leu Met
690 695 700
Ile Leu Leu His Asn Asp Arg Val Phe Leu Val Lys Ile Gly Glu Lys
705 710 715 720
Leu Lys His Cys Phe Lys Ala Trp Gly Ser Arg Arg Asn Arg Arg Tyr
725 730 735
Arg Lys Ile Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala Phe Leu Ile
740 745 750
His Leu Arg Lys Val Asp Thr His His Leu Gln Val Val Thr Lys Thr
755 760 765
Val Thr Ala Thr Thr Ala Asp Gly Gln Arg Met Arg Arg Leu Lys Cys
770 775 780
Lys Ala Cys Arg Leu Arg Trp Ala Arg Pro Glu Pro Ala Ala Gln Ala
785 790 795 800
Pro Pro Lys Ser His Phe Pro Pro His Pro Ser Gly Pro Ser Arg Thr
805 810 815
Ser Ser Leu Gln Leu Arg Ser Leu Phe Phe Ser His Cys Leu Cys Ser
820 825 830
Gln Lys Lys Asp Pro Ala Gly Lys Leu Lys Lys Leu Leu Lys Lys Ser
835 840 845
Ser Gln Leu Arg Arg Ser Trp Arg Asn Val Ser Arg Ile Ser Thr Pro
850 855 860
Pro Pro Leu Ile Leu Trp Pro Gln Ala Ala Pro Val Ser Val Ile Thr
865 870 875 880
Met Lys Leu Trp Glu Lys His Phe Lys Gly Leu Asn Trp Asn Leu Val
885 890 895
Val Trp Ile Leu Asn Leu Lys Met Met Thr Tyr Met Glu Met His Tyr
900 905 910
Gly His Gln Ala Pro Gln Val Ala Met Leu Pro Lys Leu Leu Cys Arg
915 920 925
Gln Met Leu Pro Thr Leu Ser Thr Leu Gln Gln Arg His Pro Gln Gly
930 935 940
Pro Cys Pro Pro Pro Val Thr Pro Leu Arg Val Gln Ser Val Leu Leu
945 950 955 960
Leu Gly Val Pro Gln Thr Ala Arg Gly Pro Arg Arg Lys Val Leu Met
965 970 975
Val Leu Trp Leu Pro Ala Asn Gln Ser Leu Gln Lys Ser Gln Val Phe
980 985 990
Gln Trp Val Leu Arg Thr Glu Val Ala Pro Arg Cys Pro Arg Ser Ala
995 1000 1005
Val Asp Ile Ser Pro Gly Pro Thr Ser Pro Ser Leu Ala Ser Cys
1010 1015 1020
Ala Ser Val Ala Ile Gly Lys Leu Ala Leu Leu Gly Ala Ser Ala
1025 1030 1035
Pro Cys Gly Ala Ala Gly Ala Arg Glu Ala Gly Arg Phe Ala Val
1040 1045 1050
Leu Gly Thr Met Val Met Lys Leu Cys Phe Phe Tyr Leu Leu Tyr
1055 1060 1065
Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln His Leu Asn
1070 1075 1080
Arg Lys Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu Thr Met
1085 1090 1095
Met Met Ser Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile Pro
1100 1105 1110
Leu Pro Ser Pro Arg Gln His Leu Leu Pro Gln Tyr Pro Leu His
1115 1120 1125
Pro Pro Pro Pro Cys Leu Leu Leu Leu His His Arg His His Leu
1130 1135 1140
Ala Phe Leu Glu Met Ala Cys Ser Ser Gln His Thr His Ser Ile
1145 1150 1155
Lys Ile Trp Ile Ser Phe Ser His Glu Val Asp Pro Pro Gly Ser
1160 1165 1170
Val Trp Ile Leu Pro Cys Asp Leu Pro Arg Met Leu Pro Ile Ser
1175 1180 1185
Ser Pro Leu His Arg Pro Gln Met Pro Phe Trp Thr Cys Thr Phe
1190 1195 1200
Pro Ala Thr Thr Trp Gly Thr Trp Glu Thr Pro Ser Thr Trp Gly
1205 1210 1215
Trp Arg Thr Phe Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp Ser
1220 1225 1230
Arg Ser Phe Phe Thr Ser Ala His Pro Ser Arg Pro Cys Arg Met
1235 1240 1245
Arg Leu Tyr Gln Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu Thr
1250 1255 1260
Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala Arg
1265 1270 1275
Gly Gly Thr Thr Ile Gly Glu Val Thr Ser Cys Thr Asn Leu Ser
1280 1285 1290
Val Pro Met Met Leu Thr Ile Leu Ile Trp Lys Arg Val Phe Ile
1295 1300 1305
Leu Leu Leu Ser Asp Lys Lys Gly Ala Lys Lys Ile Thr Phe Leu
1310 1315 1320
Pro Ile Pro Pro His Leu Arg His Pro Leu Leu Leu Phe Glu Lys
1325 1330 1335
Lys Arg Pro Glu Trp Leu Ser Met Asp Leu Asp Gly Met Leu Thr
1340 1345 1350
Val Ile Gly Gln Gly Leu Val Gly Met Thr Pro Arg Asp Leu Gly
1355 1360 1365
Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg Pro Ile Gln Val
1370 1375 1380
Gln Thr Gly Gly Arg Leu Arg Arg Asn Leu Gln Arg Asn Leu Lys
1385 1390 1395
Val Leu Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe Ser
1400 1405 1410
Arg Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn Arg Glu Trp
1415 1420 1425
Glu Lys Arg Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr Lys Glu
1430 1435 1440
Tyr Phe Leu Lys Arg Ile Leu Ile Arg Lys Ala Met Thr Val Leu
1445 1450 1455
Ala Gly Asp Lys Lys Gly Leu Gly Arg Phe Met Arg Cys Val Gln
1460 1465 1470
Ser Glu Thr Lys Ala Val Ser Leu Gln Leu Pro Leu Gly Arg Asn
1475 1480 1485
Met Glu His Arg Leu Thr Met Asp Ser Ala Leu Ser Leu Thr Lys
1490 1495 1500
Arg Glu Gly Pro Glu Thr Leu Lys Lys Lys Tyr Leu Val Gln His
1505 1510 1515
Gln Met Lys Cys Leu Thr Ala Val Asp Cys Leu Gln Ala Phe Trp
1520 1525 1530
Asp Met Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1114
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 4B
<400> 1114
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Ile Gln Lys
20 25 30
Lys Lys Gln Lys Ser Asn Leu Asp Leu Gln His Gln Arg Arg Arg Lys
35 40 45
Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro Lys Ala Asn
50 55 60
Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn Leu Leu Asn
65 70 75 80
Leu Val Gln Leu Asn Pro His Ser Pro His His Arg Lys Asp Glu Glu
85 90 95
Asp His Gln Lys Arg His His His His Asn Gln Lys Lys Met Ser Val
100 105 110
Met Ala Lys Lys Ser Gln Gln Pro Leu Gly Gln Ala Phe Gly Ser Leu
115 120 125
Cys Gln Leu Val Ser Ala Asp Phe Ser Ala Pro Gln Val Thr Arg Leu
130 135 140
Arg Ser Leu Asn His Leu Leu Ile Asn Glu Gly Asn Asn His Trp Pro
145 150 155 160
Arg Val Glu Met Pro Thr Gly Trp Leu Leu Val Gly Tyr Asn Thr Arg
165 170 175
Asn Thr Ala Gln Asn Pro Arg Leu Gln Gln His Leu Lys His Trp Gln
180 185 190
Gln Cys Thr Arg Ala Arg Trp Cys Gln Glu Pro Cys Gln Thr Leu Thr
195 200 205
Phe Phe His Phe Phe Phe Phe Phe Lys Thr Val Ser Leu Cys Cys Pro
210 215 220
Gly Trp Ser Lys Gly Gln Pro Pro Pro Pro Gly Leu Lys Pro Ser Ser
225 230 235 240
Leu Ala Ser Gln Val Ala Arg Thr Thr Gly Val Tyr Gln His Val Trp
245 250 255
Leu Ile Cys Phe Val Phe Phe Val Cys Val Glu Thr Gly Phe Cys His
260 265 270
Val Ala Gln Val Gly Leu Glu Arg Leu Val Ser Leu Ser Gly Ile Thr
275 280 285
Asp Val Asn His Trp Ala Gln Pro Lys Pro Ser Pro Ser Lys Gly Thr
290 295 300
Gly Met Asn Arg Pro Ile Gly Leu Arg Val Gly Lys Gly Val Trp Ala
305 310 315 320
Arg Leu Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro Thr Thr Gly
325 330 335
Val Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp Pro Pro Arg
340 345 350
Asn Ile Leu Asn Ser Leu Pro Ser Ser Met Glu Ile Ala Val Leu Gln
355 360 365
Glu Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr
370 375 380
Asp Asn Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn Arg Asn Lys
385 390 395 400
Ser Arg Gln Met Glu Ser Leu Gly Met Lys Leu Gln Ser Pro Leu Trp
405 410 415
Asp Cys Ser Thr Thr Thr Gly Thr His His Gly Cys Leu Trp Glu Ile
420 425 430
Pro Ser Val Thr Leu Leu Ala Cys Arg Val Asn Ala Val Glu Glu Leu
435 440 445
His Ser Arg Arg Met Ser Val Arg Ile Val Lys Asn Trp Val Ser Cys
450 455 460
Cys Tyr Val Arg Leu Ser Ala Val Gly Leu Ser Thr Trp Ser Ala Leu
465 470 475 480
Asp Val Val Ile Asn Leu Lys Arg Leu Gln Lys Phe Ser Gln Lys Ser
485 490 495
Gln His His Cys Ala Leu Arg Lys Ile Glu Trp Ala Thr Lys Leu Ser
500 505 510
Leu Gly Gly Lys Ala Gly Pro Gln Ala Gln Glu Lys Ala Asn Ala Lys
515 520 525
Lys Met Pro Phe Gln Arg Trp Ile Phe Ser Asn Gln Leu Thr Val Gln
530 535 540
Met Leu Cys Leu Pro Ile Glu Ala Leu Thr Ala Leu Phe Thr Cys Arg
545 550 555 560
Thr Ala Ser Ile Ser Val Asn Ile Ser Thr Leu Met Ser Ile Leu Glu
565 570 575
Ala Pro Leu Phe Phe His Gly Asp Leu Cys Glu Glu Lys Lys Asn Gly
580 585 590
Arg Ile Ser Ser Gln Ala Pro Leu Arg Leu Trp Ser Trp Cys Gly Thr
595 600 605
Ser Gln Thr Tyr Phe Gly Ser Thr Ala Lys Lys Ser Pro Thr Ser Phe
610 615 620
Cys Cys Glu Trp Gly Gly Gln Ala His Arg Gln Arg Asn Thr Gly Met
625 630 635 640
Glu Ile Leu Leu Trp Ile Leu Leu Lys Met Glu Ile Gln Ile Phe Lys
645 650 655
Ile Cys Leu Gly Glu Met Gln Leu Cys Thr Tyr Thr Pro His Ile Cys
660 665 670
Arg His Thr Cys Arg Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys Ser
675 680 685
Cys Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly Arg Cys Pro Val Gln
690 695 700
Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu Arg Arg Trp Gly Pro
705 710 715 720
Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly Phe Gln Leu Leu Arg
725 730 735
Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro Arg Lys Gly Pro Phe
740 745 750
Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala Val Thr Val Met Ala
755 760 765
Gly Ser Val Pro Ser Ala Gln Ser Val Asp Ala Leu Glu Ser Pro Gly
770 775 780
Pro Leu Ala Leu Glu Gly Pro Ser Ser Pro Arg Asn Leu Leu Trp Arg
785 790 795 800
Glu Met Ser Ile Phe Leu Pro Gly Ile Phe Thr Ser Arg Ile Leu Asn
805 810 815
Leu Gln Val Leu Lys Lys Ile Leu Arg Ser Phe Met Lys Leu Tyr His
820 825 830
Ser Leu Val Met Cys Leu Arg Leu Arg Thr Lys Leu Glu Lys Ala Leu
835 840 845
Ser Ala Leu Phe Ile Trp Pro Gln His Ser Tyr Lys Gln Arg Pro Pro
850 855 860
Leu Gln Pro Val Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro Phe
865 870 875 880
Phe Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys Met
885 890 895
Leu Asn Gln Lys Cys Leu Ala Pro Phe Ile Thr His Pro Phe Ala Ser
900 905 910
Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln Ile Arg Leu Leu
915 920 925
Lys Pro Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe Ser Asn Gln Leu
930 935 940
Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu Lys Gln Gly Glu Arg
945 950 955 960
Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile Pro Asn Phe Phe Trp Ser
965 970 975
Leu Gly Ile Gly His Thr Gly Ala Trp Trp His Thr Gly Arg Arg Arg
980 985 990
Arg Glu Trp Gly Gly Ser Thr Val Ser Arg Ser Pro Leu Trp Ile Ser
995 1000 1005
Ser Met Ile Tyr Leu Arg Gly Met Ala Phe Ala Ser Asp Ser Ser
1010 1015 1020
Ile Arg Thr Thr Arg Val Ser Trp Cys Arg Arg Cys Gly Ala Lys
1025 1030 1035
Ser Ala Ala Ala Ser Ser Leu Lys Lys Lys Pro Arg Asp Ile Cys
1040 1045 1050
Arg Ile Ser Asp Ser Lys Lys Met Thr Gln Lys Arg Glu Ser Thr
1055 1060 1065
Leu Gly Asn Phe Trp Met Lys Leu Leu Gln Leu Pro Asp Lys Lys
1070 1075 1080
Lys Lys Ser Thr Glu Lys Thr Lys Ile Ile Lys Lys Met Lys Lys
1085 1090 1095
Arg Ile Met Val His Met Cys Ser Ser Leu Ala Leu Pro Thr Gly
1100 1105 1110
Leu Thr Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala Val Leu Ile
1115 1120 1125
Ser Ser Ser Thr Ser His Phe Leu Met Arg Ser Pro Val Leu Pro
1130 1135 1140
Ser Ser Arg Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met Trp
1145 1150 1155
Thr Trp Ser Ser Trp Leu Lys Trp Leu Lys Asn Trp Lys Arg Phe
1160 1165 1170
Lys Leu Lys Lys Lys Tyr Ile Leu Ala Met Thr Leu Thr Leu Asn
1175 1180 1185
Gly His Pro Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser Leu
1190 1195 1200
Lys Gly Ser Arg Thr Ser Cys Cys Pro Arg Ser His Pro Arg Leu
1205 1210 1215
Pro Arg Thr Lys Trp Pro Leu Gln Cys Leu Leu His Ser Leu Gly
1220 1225 1230
Thr Thr Gly Thr Leu Val Trp Glu Arg Gly Val Leu Gln Met Arg
1235 1240 1245
Ser Leu Glu Ala His Cys Pro Leu Gln Thr Phe His Leu His His
1250 1255 1260
Cys Arg Thr Gln Pro Ser Ser Cys Pro Pro Ala Trp Ile Leu Tyr
1265 1270 1275
Gln Gly Gln Trp Ser Gly Ala Val Val Gly Leu Arg Pro Val Ala
1280 1285 1290
His His Leu Pro Arg Pro Ile Gln Gly Leu His Cys Pro Gln Ala
1295 1300 1305
Pro His Gln Pro Ala Leu Ser Trp Gly Lys Trp Pro Val Gly Met
1310 1315 1320
Thr Gly Pro Ala Arg Cys Cys Arg Trp Pro Arg Arg Glu Leu Lys
1325 1330 1335
Lys Asn Leu Leu Leu Pro Cys Arg Cys Arg Arg Glu Tyr Arg Val
1340 1345 1350
Thr Met Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp Phe Ser Ala
1355 1360 1365
Pro Gln Val Leu Lys Lys Asn Arg Lys Gln Asn Lys Ile Ile Cys
1370 1375 1380
Lys Gly His Arg Ile Thr Ser Leu Ile Leu Ser Phe Gln Arg Val
1385 1390 1395
Lys Leu Lys Lys Lys Val Asn Ala Cys Ser Pro Ala Cys Thr Ser
1400 1405 1410
Lys Ala Trp Thr Pro Arg Lys Leu Val Gly Arg Ala Val Arg Arg
1415 1420 1425
Lys Gly Ile Ile Cys Ile Lys Asn Met Phe Leu Gln Arg Lys Gly
1430 1435 1440
Phe Leu Asn Leu Ser His Val Glu Lys Phe Val Pro Pro Ser Pro
1445 1450 1455
Pro Leu Ala Leu Gly Pro Arg Met Gln Leu Cys Thr Gln Leu Ala
1460 1465 1470
Arg Phe Phe Pro Ile Thr Pro Pro Val Trp His Ile Leu Gly Pro
1475 1480 1485
Gln Arg His Thr Pro Cys Gln Lys Lys Val Pro Ser Ala Ser Pro
1490 1495 1500
Trp Gly Leu Arg Pro Ser Pro Cys Leu Ser Trp Ser Ser Arg Ile
1505 1510 1515
Val Ala Pro Gly His Ala Leu Ser Cys Arg Thr Arg Arg Arg Trp
1520 1525 1530
Ser Ser Lys Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1115
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 1A
<400> 1115
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Thr Glu Ile Gln Leu Thr Met Asn
225 230 235 240
Asp Ser Lys His Lys Leu Glu Ser Pro Ala Leu Lys Gln Val Ser Pro
245 250 255
Ala Ser Pro Pro Thr Gln Gln Pro Gln Thr Pro Gln Asp Ser Arg Gln
260 265 270
Val Leu Ala Leu Ala Lys Lys Thr Leu Thr Asn Ala Ser Arg Ala Gly
275 280 285
Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly Met Ser Leu Gln Trp
290 295 300
Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg Cys Pro Ser Arg Ser Pro
305 310 315 320
Ala Thr Phe Leu Thr Ala Leu Asn Gly Trp His Arg Ser Gly Leu Arg
325 330 335
Ala Gln Met Pro Ser Ser Trp Ser Ser Ser Gly Arg Thr Leu Lys Leu
340 345 350
Ala Pro Leu Gln Val Thr Thr Thr Leu Lys Leu Ile Leu Val Met Leu
355 360 365
Glu Ile Val Thr Glu Arg Ser Leu Leu Tyr Ser Arg Met Cys Leu Val
370 375 380
Gln Ile Pro Thr His Thr Trp Glu Pro Asp Tyr Phe Val Ser Leu Pro
385 390 395 400
Met Met Phe Ser Trp Ala Thr Gln Ser Phe Pro Val Gly Ala Val Phe
405 410 415
Leu Thr Arg Pro Ala Ile Pro Cys Cys Ser Cys Thr Ser His Ser Asn
420 425 430
Pro Trp Ser Gln Ser Asn Gln Gln Leu Lys Trp Thr Pro His Ile Leu
435 440 445
Lys Ser Ala Ser Phe Asp Lys Lys Gly Phe Val Ile Leu Ser Arg Arg
450 455 460
Ser Lys Ile Glu Ala Ser Pro Ile Gly Ser Ile Ala Ser Ser Pro Gly
465 470 475 480
His Pro Leu Gly Pro Thr Leu Ala Ile Arg Phe Ile Ser Ala Pro Gln
485 490 495
Pro Ser Ser Ser Thr Val Thr Ala Ala Pro Ser Gly Gln Tyr Phe Ile
500 505 510
Ala Lys Lys Arg Ile Lys Leu Arg Arg Asn Asn Met Gly Gly Asn Arg
515 520 525
Ser Ile Cys Leu Thr Arg Lys Arg Lys Arg Glu Lys Arg Ser Gln Lys
530 535 540
Ser Arg Gln Asn His Leu Gln Leu Lys Ser Cys Arg Arg Lys Ile Ser
545 550 555 560
Asn Trp Ser Lys Leu Arg Ser Pro Trp Ile Phe Thr Lys Cys Glu Ile
565 570 575
Cys Val Lys Asn Thr Ala Ile Leu Ala Ile Thr Leu Ile Thr Pro Gln
580 585 590
Asp Pro His Leu Asp Pro Val Cys His Pro His Arg Arg Pro Gly Trp
595 600 605
Lys Gly His His Arg Val Val Phe Ser His His Pro Ser Gly Ser Thr
610 615 620
Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly Gly Arg Arg Glu Lys
625 630 635 640
Lys Gly Cys Arg Glu Gln Arg Lys Val Val Lys Asn Pro Ser Gln Pro
645 650 655
Val Pro Leu Arg Asn Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr Arg
660 665 670
Ser Cys Ser Ile Ser Leu Lys Lys Ser Leu Glu Lys Met Pro Leu Met
675 680 685
Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr Cys Arg Met Trp Trp Lys
690 695 700
Gly Lys Lys Arg Arg Lys Glu Ile Val Pro Met Ser Leu Ala Cys Ser
705 710 715 720
Ile Thr Val Ser Phe Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val
725 730 735
Ser Ser Ile Ser His Trp Arg Leu Pro Cys Lys Val Thr Glu Ser Ser
740 745 750
Ser Ser Phe Phe Tyr Thr Ser Asp Arg Thr Pro Leu Ser Ile Ser Arg
755 760 765
Pro Thr Ser Arg Ala Arg Gln Ser Cys Cys Leu Pro Gly Leu Thr His
770 775 780
Pro Ala His Gln Pro Leu Gly Ser Met Ser Thr Arg Arg Glu Met Pro
785 790 795 800
Ser Gln Ala Thr Pro Ser Pro Pro Gly Pro Trp Arg Ala Ala Leu Gly
805 810 815
Lys Glu Val Lys Arg Ser Gln Ser Lys Leu Arg Leu Arg Asn Thr Ser
820 825 830
Pro Gly Glu Lys Asn Asp Leu Gln Leu Phe Val Met Ser Asp Thr Thr
835 840 845
Tyr Lys Ile Tyr Trp Thr Val Ile Leu Leu Asn Pro Cys Gly Asn Leu
850 855 860
His Leu Lys Thr Thr Ser Leu Gln Arg Pro Pro Arg Ser Ile Leu Ser
865 870 875 880
Leu Asn Gly Ile Trp Glu Val Met Pro Arg Thr Leu Glu Gly Cys Ile
885 890 895
Ser Val Lys Asp His Arg Thr Ser Gln Asn His Ser Lys Cys Ile Thr
900 905 910
Glu Cys Val Arg Thr Ala Leu Asn Val Ser Lys Lys Arg Leu Pro Lys
915 920 925
Leu Met Lys Lys Lys Asp Ser Thr Ile Phe Ile Asn Lys Val Arg Gln
930 935 940
Asn Phe Lys Arg Asn Phe Lys Lys Lys Lys Pro Leu Thr Phe Ser Pro
945 950 955 960
Ser Arg Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys Met Met Met
965 970 975
Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg Arg Met Thr Met
980 985 990
Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr Cys Leu Thr Pro Arg
995 1000 1005
Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln Thr Ile Ser Gln
1010 1015 1020
Arg Arg Pro Ile Gln Thr Pro Pro Gly Thr Ser Leu Ala Ile Trp
1025 1030 1035
Gly Arg Thr Arg Leu Thr Leu Thr Gly Thr Arg Ser Ser Gly Thr
1040 1045 1050
Arg Ala Ser Pro Ser Ala Val Cys Leu Cys Cys Trp Thr Cys Pro
1055 1060 1065
Ser Arg Ser Phe Pro Ala Ala Ser Pro Ser Gly Leu Arg Ala Pro
1070 1075 1080
Val Gly Ala Gln Ala Pro Pro Glu Val Thr Leu Arg Ala Ser Cys
1085 1090 1095
Ala Ser Ser Ala Ser Lys Ala Cys Ala Gly Leu Trp Pro Trp Gly
1100 1105 1110
Ala Gln Val Arg Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys
1115 1120 1125
Val Pro Val Ala Glu Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly
1130 1135 1140
Ala Ala Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro Cys Arg Gln
1145 1150 1155
Leu Pro Ala Ser Ser Pro Thr Lys Cys Glu Ile Cys Val Lys Arg
1160 1165 1170
Arg Arg Arg Arg Lys Arg Ser Ser Gln Ser Arg Ser Pro Val Pro
1175 1180 1185
Lys Lys Arg Glu Arg Met Met Leu Pro Val Arg Ala Arg Thr Ala
1190 1195 1200
Arg Ser Ala Leu Pro Gln Gly Arg Ala Pro Leu Glu Gly Met Leu
1205 1210 1215
Leu Pro Arg Ala Leu Pro Ser Leu Leu Ser Arg Met Pro Ala Arg
1220 1225 1230
Arg Glu Ser Arg Phe Trp Leu Ala Leu Gln Ala Leu Gly Leu Arg
1235 1240 1245
Pro Pro His Leu Pro Ser Cys His Pro Leu Pro Gln Leu Leu Gly
1250 1255 1260
Pro Pro Pro Pro His Gln Ala Pro Met Thr Leu Lys Ala Leu Val
1265 1270 1275
Lys Thr Trp Thr Gln Phe Arg Asn Tyr Pro Arg Ala Asp Lys Lys
1280 1285 1290
Asn Val Arg Ser Thr Ala Phe Phe Leu Leu Asp Ile Ile Leu Gly
1295 1300 1305
Asp Cys Pro Arg Thr Met Ala Gly Pro Ser Ala Ser Leu His Pro
1310 1315 1320
Ala Ser Gly Arg Ala Ser Arg Lys Thr Trp Gln Arg Arg Leu Arg
1325 1330 1335
Ala Cys Arg Ala Gly Gly Pro Ala Gly Trp Ala Arg Gln Ala Tyr
1340 1345 1350
Pro Arg Leu Lys Thr Phe Gly Val Pro Leu Gly Ser Ile Leu Cys
1355 1360 1365
Leu Ala Gly Ser Leu Ser Thr Met Met Ile Ile Ser Thr Thr Arg
1370 1375 1380
Gln Glu Cys Gly Arg Arg Ala Ser Val Pro Cys Arg Pro Met Ile
1385 1390 1395
Gly Ser Ala Arg Pro Gly Pro Trp Arg Thr Ser Ala Met Pro Ser
1400 1405 1410
Ala Met Gly Val Ala Leu Pro Thr Ser Cys Glu Ser Gly Arg Ser
1415 1420 1425
Pro Pro Ala Thr Gly Gly Arg Met Pro Gly Ser Gln Ser Ile Met
1430 1435 1440
Met Ser Trp Met Pro Pro Leu Ala Pro Cys Ala Ala Cys Pro Cys
1445 1450 1455
Ser Pro Ala Pro Thr Leu Cys Pro Ala His Pro Ala Arg Ala Pro
1460 1465 1470
Thr Ala Val Pro Ala Phe Thr Pro Leu Ser Ala His Pro Val Pro
1475 1480 1485
Val Leu Ser Gly Cys His Leu Ala Val Arg Thr Ser Met Leu Thr
1490 1495 1500
Leu Leu Pro Met Glu Ala Lys Lys Ser Met Lys Arg Ser Asn Ala
1505 1510 1515
Lys Lys Met Glu Asp Met Ile Trp Glu Ser Arg Leu Pro Leu Arg
1520 1525 1530
Pro Gln Arg Gly Pro Arg Pro Leu His Arg Trp Leu Gln Gln Thr
1535 1540 1545
Thr Gly Cys Ser Gln Arg Arg Ile Val Phe Phe Leu Ala Pro Tyr
1550 1555 1560
Phe Pro Arg His Pro His Arg Ser Pro Pro Thr Ser Cys Pro Pro
1565 1570 1575
Leu Leu Glu Ala Phe Pro Leu Pro Arg Ala Ser Leu Arg Ala Thr
1580 1585 1590
Val Pro Arg His Ser Ser Val Leu Ala Thr Gly Leu His Leu His
1595 1600 1605
Arg Gln Ile Ser Leu Pro Leu Arg Gly Phe Leu Leu His Gln Pro
1610 1615 1620
Leu Pro Gly Gln His Leu Trp Leu Ser His Arg Leu Arg Leu Arg
1625 1630 1635
Leu Pro Arg Thr Gln Pro Ser Leu Pro Gly Pro Cys Ala Ser Leu
1640 1645 1650
Leu Ser Thr Leu Ser Gln Pro Pro Pro Gln Ala Pro Ser Gln Val
1655 1660 1665
Trp Thr Ala Ala Thr Leu Arg Cys Pro Ala Val Pro Ala Ala Ala
1670 1675 1680
Cys Pro Pro Ala Leu Arg Ser Met Pro Lys Ser Arg Asn Gln Val
1685 1690 1695
Leu Phe Arg Arg Asn Leu Thr Pro Ser Gln Leu Arg Thr Leu Ala
1700 1705 1710
Pro Pro Tyr Met Leu Leu Pro Gln Ser Leu Ser Gln Ser Leu Ser
1715 1720 1725
Arg Lys Gln Ile Pro Ser Gln Ser Met Leu Val Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1116
<211> 1744
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 2A
<400> 1116
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Arg Lys Met Gln Ser Leu Asn His
225 230 235 240
Pro Ser Arg Leu Thr Asn Gly Ser Pro Pro Leu His Leu Cys Gln Pro
245 250 255
Leu Arg Met Ser Arg Thr Pro Pro Arg Arg Val Cys Ala Ala Pro Pro
260 265 270
His Arg Leu Leu Gly Pro Ser Arg Trp Asn Pro Arg Arg Lys Thr Trp
275 280 285
Lys Met Arg Lys Lys Tyr Ala Gln Lys Pro Ser Gln Lys Asn His Leu
290 295 300
Tyr Gly Gly Lys Lys Arg Ser Lys Phe Ser Arg Ser His Leu Asp Phe
305 310 315 320
Ser Pro Tyr Trp Met Lys Lys Val Lys Val Leu Phe Lys Ala Asp Gln
325 330 335
Ser Glu Ser Ser Leu Ser Ser Gly Arg Cys Ser Leu Met Glu Gln Ile
340 345 350
Pro His Leu Lys Ser Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys
355 360 365
Asn Leu Trp Leu Pro Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly
370 375 380
Phe Gln Trp Gly Glu Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly
385 390 395 400
Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro Gln Ala
405 410 415
Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu Leu Val Gln Ser Arg
420 425 430
Asn Lys Lys Thr Lys Leu Trp Phe Ser Leu Ile Asn Ile His His Arg
435 440 445
Lys Asn Pro Leu Leu Pro Met Arg Trp Trp Cys Thr Arg Gly Gly Gly
450 455 460
Lys Arg Lys Lys Lys Met Cys Lys Val Ser Gly Gly Cys Thr Ala Cys
465 470 475 480
Val Glu Arg Cys Pro Trp Lys Gly Ile Cys Trp Lys Trp Pro Val Thr
485 490 495
Val Ala Ala Ile Arg Met Cys Ala Leu Ser His Pro Ser Phe Tyr Ile
500 505 510
Ser Ser Thr Val Cys Phe Leu Ser Lys His Cys Met Thr Ala Cys Thr
515 520 525
Arg Lys Arg Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile Gln
530 535 540
Glu Lys Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe Glu Ala
545 550 555 560
Cys Arg Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile Thr Leu Phe
565 570 575
Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn Val Leu Cys Val Arg
580 585 590
Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys Arg Lys Met Lys Arg
595 600 605
Asn Gln Val Ala Ser Pro Gln Ile Met Gln Arg Leu Phe Ile Lys Gly
610 615 620
Tyr Gln Asn Asn His Phe Thr Phe His Leu Gln Asn Phe Ala Phe Phe
625 630 635 640
Ser Ser Phe Gly Asn Asn Lys Tyr Ile Asn Ile Leu Thr Ile Leu Phe
645 650 655
His Val Arg Asn Ile Val Tyr Gly Ile Gln Val Met Leu Cys Ala Ser
660 665 670
Pro Gln Ile Met Gln Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg
675 680 685
Arg Met Gln Asn Leu Asp Asn Leu Gly Val Pro Trp Pro Leu Leu Pro
690 695 700
Gly Ile Pro Ser Leu Asn Ala Gln Trp Met Phe Leu Arg Ile Ala Ser
705 710 715 720
Pro Gln Ile Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr Ile Arg
725 730 735
Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser His Leu Ile Ala His
740 745 750
Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe His Pro Arg Leu Leu
755 760 765
Thr Arg Lys Lys Pro Gly Lys Leu Leu Leu Ala His Met Tyr Gly Phe
770 775 780
Ser Thr Tyr Gly Thr Gln Lys Gly Glu Cys Val Cys Leu Gln Cys Leu
785 790 795 800
Ser Gly Ser Ser Leu Phe Ile Leu Lys Gln Pro Leu Asp Leu Lys Ile
805 810 815
Ser Lys Thr Phe Met Gly His Arg Glu Gly Ser Glu Ser Asp Asn Leu
820 825 830
Gly Leu Leu Tyr Ser Phe Pro Pro Pro Tyr Pro Ile Ser Glu Gly Leu
835 840 845
Thr Met Thr Thr Gly Arg Asn Ile Asn Ser Asn Ser Leu Met Thr Asn
850 855 860
Cys Leu Phe Ser Pro Ile Phe Leu Cys His His Ala Ile Met His Arg
865 870 875 880
Lys Met Thr Ser Pro His Phe Arg Leu Phe Ser Ser Lys Ile Pro His
885 890 895
Pro Gln Val Pro Ser Val Val Ala Leu Cys Lys Phe Arg Ala Phe Ile
900 905 910
His Thr Pro Arg Ser Pro Gly Cys Ser Val Tyr Ala Asn Met Cys Trp
915 920 925
Pro Lys Phe Phe Leu Thr Phe Ser Gln Gln Trp Ser Ser Val Thr Ser
930 935 940
Leu Glu Trp Thr Ala Gln Glu Arg Gly Cys Ser Ser Trp Leu Met Lys
945 950 955 960
Gln Thr Trp Met Lys Ser Trp Ser Leu Arg Asp Pro Ser Tyr Arg Ser
965 970 975
Ile Leu Glu Tyr Val Ser Thr Arg Val Leu Trp Met Pro Thr Ser Thr
980 985 990
Val Leu Gln Ala His Pro Gln Val Pro Ala Leu Ala Pro Gln Ala Trp
995 1000 1005
Trp Pro Ala Arg Arg Gly Pro Leu Thr Ser Ala Pro Ser Ala Gln
1010 1015 1020
Gln Ser Leu Thr Arg Glu Lys Ile Ile Asn Pro Thr Ile Ser Cys
1025 1030 1035
Pro Phe Gln Ser Pro Thr Lys Arg Leu Ile Tyr Pro Pro Ser Thr
1040 1045 1050
Cys Ser Leu Pro Cys Arg Gly Phe Leu Pro Ser Arg Phe Pro Trp
1055 1060 1065
Gly Pro Pro Pro Leu Asn Ser Val Ile Val His Lys Ile Val Leu
1070 1075 1080
Val Phe Leu Lys Ser Leu Ser Ser Tyr Asn Cys Glu Arg Arg Ile
1085 1090 1095
Ser Gly Ile Gln Lys Arg Ala Ile Glu Phe Ala Val Leu Lys Leu
1100 1105 1110
Leu Asn Met Asp Leu Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr
1115 1120 1125
Ser Pro Leu Trp Lys Ile Thr Met Val Leu Thr Tyr Pro Asn Cys
1130 1135 1140
Val Val His Val Leu Met Phe Gly Ala Leu Arg Ala Thr Ala Pro
1145 1150 1155
Ala Thr Ala Ala Pro Gln Ala Gln Thr Pro His Trp Arg Ala Ala
1160 1165 1170
Thr Thr Ser Ser Met Ser Ser Ser Pro Arg Ala Glu Pro Thr Ser
1175 1180 1185
Ser Ser Ser Trp Ala Thr Cys Trp Pro Arg Cys Cys Ser Ser Ser
1190 1195 1200
Cys Tyr Trp Ser Leu Ser Ser Trp Pro Pro Ala Gly Ala Ala Glu
1205 1210 1215
Ala Thr Asn Thr Arg Thr Arg Ser Arg Glu Ser Gln Arg Gly Arg
1220 1225 1230
Met Leu Thr Trp Arg Ser Ser Leu Trp Leu Gln Gly Thr Arg Cys
1235 1240 1245
Phe Thr Gly Val Arg Thr Ser Ser Arg Tyr Lys Lys Arg Gly Val
1250 1255 1260
Ile Ala Trp Arg Arg Gln Ile Asn Arg Arg Lys Leu Gln Arg Lys
1265 1270 1275
Lys His Trp Asn Ser Ala Tyr Leu Gly Arg Thr Leu Leu Val Thr
1280 1285 1290
Cys Ile Leu Tyr His Arg Trp Ile Val Thr Ser Met Cys Gln Ser
1295 1300 1305
Gln Arg Trp Leu Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu Met
1310 1315 1320
Trp Thr Glu Leu Ser Leu Glu Pro Trp Ile Pro Tyr Leu His Gln
1325 1330 1335
Gln Lys Thr Gln Arg Thr Leu Glu Ser Ala Gly Leu Phe Pro Trp
1340 1345 1350
Leu His Thr Gln Cys Gln Glu Lys Lys Ser Arg Lys Leu Met Ser
1355 1360 1365
Ser Cys Thr His Pro Cys Thr Met Leu Leu Pro Gln Gly Cys His
1370 1375 1380
Pro Ala Trp Leu Ser Pro Ile Ser Ala Cys Pro Arg Leu Leu Pro
1385 1390 1395
Tyr Pro Phe His Val Leu Ala Leu Glu Val Thr Phe Pro Pro Gly
1400 1405 1410
Thr Ala Met Pro Gln Met Gln Leu Gln Ala Leu Ala Met Trp Glu
1415 1420 1425
Lys Gly Trp Asp Lys Pro Gly Thr Ser Leu Gln Cys Tyr Leu Asn
1430 1435 1440
Arg Arg Arg Asn Ser Arg Lys Gln Ser Gln Val Gln Leu Ala Ile
1445 1450 1455
Gln Val Leu Leu Val Asp Lys His Lys Tyr Phe Leu Phe Gly Gln
1460 1465 1470
Lys Lys Gly His Met Ile Phe Ser Leu Ala Asn Gly Leu Trp Phe
1475 1480 1485
Asn Leu Ile Phe Asn Ser Arg Lys Lys Leu Leu Glu Asp Met Lys
1490 1495 1500
Gln Asn Gly Phe Thr Gly Lys Gly Leu Thr His Pro Val Pro Leu
1505 1510 1515
Lys Arg Thr Leu Gln Asn Lys Arg Asn Lys Asn Ile Lys Arg Val
1520 1525 1530
Asn Gln Lys Lys Gly Asn Ile Lys Arg Lys Ser Ile Leu Leu His
1535 1540 1545
Leu Ile Val Leu Asn Ser Pro Glu Ser Asn Leu Ile Leu Ile Gln
1550 1555 1560
His Gly Gly Ile Phe Thr Phe Arg Phe Trp Val Glu Lys Leu Ser
1565 1570 1575
Trp Asn Ile Cys Lys Asn Leu Ser Leu Tyr Leu Asp Lys Phe Val
1580 1585 1590
Gln Arg Leu Leu Tyr Val Tyr Ile Ile Glu Thr Asn Val Phe Val
1595 1600 1605
Leu Asn Leu Phe His Val Pro Val Asn Gln Ile Phe Met Met Ala
1610 1615 1620
Phe Tyr Leu Lys Tyr Thr Glu Lys Ala Trp Val Met Glu Leu Glu
1625 1630 1635
Trp Leu Ile Gln Gln Gln Cys Tyr Gln Gly Ser Cys Gly Arg Ala
1640 1645 1650
Cys Ser Cys Gly Arg Gly Cys Gly Thr Pro Arg Gly Asp Trp Lys
1655 1660 1665
Arg His Pro Pro Arg Arg Ala Phe Trp Lys Pro Pro Ser Gln Gly
1670 1675 1680
Ile Ser Ser Cys Leu Met Thr Gly Cys Trp Leu Glu Lys Lys Ala
1685 1690 1695
Thr Trp Met Arg Arg Thr Arg Arg Lys Lys Arg Glu Asp His Cys
1700 1705 1710
Gly Leu Arg His Pro Ser Trp Pro Trp Thr Arg Cys Leu Arg Met
1715 1720 1725
Arg Pro Pro Arg Ser Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1730 1735 1740
Ser
<210> 1117
<211> 1749
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 3A
<400> 1117
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Gly Ala Ala Ala Ala Ser Cys Gln
225 230 235 240
Ser Pro Pro Ser Pro Arg Glu Thr Thr Pro Ser Ser Asp Ala Thr Arg
245 250 255
Arg Thr Arg Pro Ile Ala Ala Gln Ser Lys Lys Thr Met Thr Ala Ala
260 265 270
Gly Leu Thr Pro Met Ile Arg Lys Ile Gln Lys Arg Arg Arg Thr Ala
275 280 285
Asn Arg Cys Leu Arg Val Arg Cys Gly Gly Trp Leu Cys Gly Trp Thr
290 295 300
Pro Arg Gly Gln Asn Thr Arg Ser Thr Asn Leu Glu Lys Asn Pro Ser
305 310 315 320
Leu Lys Lys Gln Ser Gln Arg Arg Gly Lys Leu Ser Ser Leu Phe Phe
325 330 335
Ser His Cys Leu Cys Arg Asn Ser Arg Arg Ala Thr Pro Thr Ser Lys
340 345 350
Gly Ser Leu Arg Arg Lys Tyr Leu Arg Val Pro Ile Pro Pro His Leu
355 360 365
Arg His Pro Leu Leu Leu Met Asp Leu Asp Gly Met Leu Thr Val Ile
370 375 380
Gly Gln Gly Leu Val Gly Met Thr Pro Arg Asp Leu Gly Thr Val Ala
385 390 395 400
Gly Ala Thr Ala Gln Ile Gln Arg Pro Ile Gln Val Gln Thr Gly Gly
405 410 415
Arg Leu Thr Pro Pro Pro Leu Ile Leu Trp Pro Gln Ala Ala Pro Val
420 425 430
Asp Pro Pro Gly Ser Val Trp Ile Leu Pro Cys Lys Asn Lys Lys Arg
435 440 445
Arg Lys Leu Arg Pro Lys Arg Leu Asp Phe His Pro Arg Ser Ser Ser
450 455 460
Gly Val Ser Val Ile Thr Met Lys Leu Trp Glu Lys His Phe Lys Gly
465 470 475 480
Leu Asn Trp Asn Leu Val Val Trp Ile Leu Asn Leu Lys Met Met Asn
485 490 495
Ile Glu Ile Thr Pro Gln Arg Ser Lys Ala Arg Lys Ser Gly Val Met
500 505 510
Lys Cys Trp Asp Leu Cys Pro Ser Glu Lys Lys Arg Lys Leu Pro Leu
515 520 525
Pro Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser Arg His Arg Gly Ala
530 535 540
Ser Ser Ser Thr Ser Arg Asp Ser Arg Ser Phe Phe Thr Ser Ala His
545 550 555 560
Pro Ser Arg Pro Cys Arg Met Arg Leu Tyr Gln Phe Leu Ile His Leu
565 570 575
Arg Lys Val Asp Thr His His Leu Gln Val Val Thr Lys Thr Val Thr
580 585 590
Ala Thr Thr Ala Asp Gly Gln Arg Met Arg Arg Leu Lys Cys Lys Ala
595 600 605
Cys Arg Leu Arg Trp Ala Arg Pro Glu Pro Ala Ala Gln Ala Pro Pro
610 615 620
Lys Ser His Phe Pro Pro His Pro Ser Gly Pro Ser Arg Thr Ser Ser
625 630 635 640
Leu Gln Leu Arg Ser Ile Pro His Val Pro Lys Ala Thr Ala Ala His
645 650 655
Ser Val Thr Val Lys Leu Gln Lys Gly Lys Asn Ser Pro Cys Cys Gln
660 665 670
Lys Lys Leu Arg Val Gln Asn Gln Gly His Leu Leu Met Ile Leu Leu
675 680 685
His Asn Thr Tyr Met Glu Met His Tyr Gly His Gln Ala Pro Gln Val
690 695 700
Ala Met Leu Pro Lys Leu Leu Cys Arg Gln Met Leu Pro Thr Leu Ser
705 710 715 720
Thr Leu Gln Gln Arg His Pro Gln Gly Pro Cys Pro Pro Pro Val Thr
725 730 735
Pro Leu Arg Val Gln Ser Val Leu Leu Leu Gly Val Pro Gln Thr Ala
740 745 750
Ala Arg Gln Pro Ser Arg Pro Thr Gly Arg Thr Pro Thr Thr Arg Leu
755 760 765
Met Ala Pro Val Gly Ser Val Met Ser Cys Ser Leu Leu Thr Gln Pro
770 775 780
Ser Pro Ala Ser Ala Cys Thr Met Pro Pro Leu Leu His Pro Gln Trp
785 790 795 800
Ala Pro His Ser Ala Gly Leu Ser Pro Gly Ala Cys Arg Pro Ala Cys
805 810 815
Thr Cys Ile Ser Met Thr Thr Ile Ser Arg Ala Thr Trp Gln Val Ser
820 825 830
Val Tyr Ser Gly Asn Leu Leu Ser Phe Ser Arg Arg Gly Met Lys Ser
835 840 845
Ser Val Arg Leu Lys Asn Ser Arg Arg Asn Arg Arg Tyr Arg Lys Ile
850 855 860
Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala Val Ala Pro Arg Cys Pro
865 870 875 880
Arg Ser Ala Val Asp Ile Ser Pro Gly Pro Thr Ser Pro Ser Leu Ala
885 890 895
Ser Cys Ala Ser Val Ala Ile Gly Lys Leu Ala Leu Leu Gly Ala Ser
900 905 910
Ala Pro Cys Gly Ala Ala Gly Ala Arg Glu Ala Gly Arg Phe Ala Val
915 920 925
Leu Gly Thr Met Val Met Lys His Leu Asn Arg Lys Leu His Leu Thr
930 935 940
Arg Ser Cys Leu Ile Asp Leu Thr Met Met Met Ser Gln Lys Leu Trp
945 950 955 960
Lys Asn Gln Arg Lys Arg Ile Pro Leu Pro Ser Pro Arg Gln His Leu
965 970 975
Leu Pro Gln Tyr Pro Leu His Pro Pro Pro Pro Cys Leu Leu Leu Leu
980 985 990
His His Arg His His Leu Ala Phe Leu Glu Met Ala Cys Ser Ser Gln
995 1000 1005
His Thr His Ser Ile Lys Ile Trp Ile Ser Phe Ser His Glu Gln
1010 1015 1020
Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn Thr Met Gln Trp Asn
1025 1030 1035
Asn Lys Lys Met Ala Met Thr Val Ile Ala Gly Ala His His Cys
1040 1045 1050
Gln Tyr Lys Leu Thr Tyr Thr Lys Val Trp Lys Met Asn Trp Lys
1055 1060 1065
Lys Met Met Ile Gly Ser Gln His Leu Leu Phe Ser Pro Leu Asp
1070 1075 1080
Ser Ser Pro Leu Gln Leu Leu Leu His Pro His Gly Lys Arg Cys
1085 1090 1095
Asn Pro Cys Cys Arg Leu Thr Trp Met Ser Met Leu Gln Lys Gln
1100 1105 1110
Cys Cys Tyr Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile
1115 1120 1125
Asn Leu Arg Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser
1130 1135 1140
Leu Gly Phe Leu Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe
1145 1150 1155
Ile Cys Leu Leu Met Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr
1160 1165 1170
Lys Arg Glu Trp Glu Lys Arg Lys Gln Ile Leu Gly Gly Gly Gly
1175 1180 1185
Lys Tyr Lys Glu Tyr Phe Leu Lys Arg Ile Leu Ile Arg Lys Ala
1190 1195 1200
Met Thr Val Leu Ala Gly Asp Lys Lys Gly Leu Gly Arg Phe Met
1205 1210 1215
Arg Cys Val Gln Ser Glu Thr Lys Ala Val Ser Leu Gln Leu Pro
1220 1225 1230
Leu Gly Arg Gly Pro Val Tyr Tyr Val Cys Asn Arg Met Asn Val
1235 1240 1245
Ser Ser Val Leu Lys Pro Phe Leu Phe Thr Val Pro Ile Glu Asp
1250 1255 1260
Met Arg Glu Cys Thr Leu Gly Arg Asn Arg Met Asn Val Ser Ser
1265 1270 1275
Val Leu Lys Pro Cys Leu Ile Pro Val Pro Ile Asp Leu Pro Arg
1280 1285 1290
Met Leu Pro Ile Ser Ser Pro Leu His Arg Pro Gln Met Pro Phe
1295 1300 1305
Trp Thr Cys Thr Phe Pro Ala Thr Thr Trp Gly Thr Trp Glu Thr
1310 1315 1320
Pro Ser Thr Trp Gly Trp Arg Thr Phe Arg Gly Pro Arg Arg Lys
1325 1330 1335
Val Leu Met Val Leu Trp Leu Pro Ala Asn Gln Ser Leu Gln Lys
1340 1345 1350
Ser Gln Val Phe Gln Trp Val Leu Arg Thr Glu Asn Ile Arg Lys
1355 1360 1365
Leu Ile Trp Thr Lys Gln Arg Ser Phe Leu Ser Leu Phe Pro Lys
1370 1375 1380
Leu Arg Ala Thr Glu Gln Met Thr Asn Val Gly Cys Ala Phe Ser
1385 1390 1395
Gly Arg Ile Leu His Gln Pro Glu Met Ala Ala Met Arg Leu Met
1400 1405 1410
Pro Lys Phe Leu Asn Ser Thr Asn Ser Trp Trp Thr Cys Thr Asn
1415 1420 1425
Leu Ser Val Pro Met Met Leu Thr Ile Leu Ile Trp Lys Arg Val
1430 1435 1440
Phe Ile Leu Leu Leu Ser Asp Lys Lys Leu Leu Lys Lys Ser Ser
1445 1450 1455
Gln Leu Arg Arg Ser Trp Arg Asn Val Ser Arg Ile Ser His Gln
1460 1465 1470
Met Lys Cys Leu Thr Ala Val Asp Cys Leu Gln Ala Phe Trp Asp
1475 1480 1485
Met Asn Met Glu His Arg Leu Thr Met Asp Ser Ala Leu Ser Leu
1490 1495 1500
Thr Lys Arg Glu Gly Pro Glu Thr Cys Lys Lys Lys Leu Leu Leu
1505 1510 1515
Lys Leu Leu Thr Met Ser Leu Ser Asn Ile Leu Met Lys Phe Arg
1520 1525 1530
Leu Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln His Leu
1535 1540 1545
Lys Lys Thr Ser Ala Lys Gly Glu Lys Leu Lys His Cys Phe Lys
1550 1555 1560
Ala Trp Gly Arg Gly Pro Pro Leu His Thr Arg Ser Gln Lys Lys
1565 1570 1575
Asp Pro Ala Gly Lys Leu Lys Lys Leu Thr Thr Leu Ser Phe Val
1580 1585 1590
Leu Ile Glu Glu Arg Arg Asn Leu Gln Arg Asn Leu Lys Val Leu
1595 1600 1605
Trp Leu Lys Lys Ser Thr Lys Ser Arg Tyr Leu Phe Phe Leu Thr
1610 1615 1620
Val Cys Gly Phe Phe Glu Lys Lys Arg Pro Glu Trp Leu Ser Ser
1625 1630 1635
Arg Lys Lys Gly His Thr Lys Asn Arg Arg Lys Ala Lys Arg Lys
1640 1645 1650
Pro Gln Ile Val His Lys Lys Arg Gly Leu Phe Leu Lys Lys Lys
1655 1660 1665
Tyr Leu Val Gln Gly Ala Lys Lys Ile Thr Phe Leu Ser Asn Gly
1670 1675 1680
Met Glu Ala Cys Gly Thr His Pro Thr Pro Arg Leu Ser Asp Arg
1685 1690 1695
Val Phe Leu Val Lys Ile Thr Thr Thr Thr Ser Ser Pro Arg Arg
1700 1705 1710
Ser Pro Ala Leu Arg Ala Arg Gly Gly Thr Thr Ile Gly Glu Val
1715 1720 1725
Thr Ser Leu Cys Phe Phe Tyr Leu Leu Tyr Gly Tyr Pro Tyr Asp
1730 1735 1740
Val Pro Asp Tyr Ala Ser
1745
<210> 1118
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 4A
<400> 1118
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Ile Gln Lys Lys Lys Gln Lys Ser
225 230 235 240
Met Ala Lys Lys Ser Gln Gln Pro Leu Val Leu Lys Lys Asn Arg Lys
245 250 255
Gln Glu Trp Gly Gly Gln Ala His Arg Gln Arg Asn Asn Ala Lys Lys
260 265 270
Met Pro Phe Gln Glu Glu Lys Lys Asn Gly Arg Ile Ser Ser Ser Leu
275 280 285
Ile Leu Ser Phe Gln Arg Val Lys Asp Ser Lys Lys Met Thr Gln Lys
290 295 300
Met Cys Ser Ser Leu Ala Leu Pro Thr Gly Leu Thr Ser Leu Ile Leu
305 310 315 320
Pro Ser Ser Asp Leu Ala Val Leu Ile Ser Ser Ser Thr Ser His Phe
325 330 335
Leu Met Arg Ser Pro Val Leu Pro Ser Ser Arg Leu Thr Cys Ala Ser
340 345 350
Pro Gln Leu Pro Arg Met Trp Thr Trp Ser Ser Trp Leu Lys His Pro
355 360 365
Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser Leu Lys Gly Ser Arg
370 375 380
Thr Ser Cys Cys Pro Arg Ser His Pro Arg Leu Pro Arg Thr Lys Trp
385 390 395 400
Pro Leu Gln Cys Leu Leu His Ser Leu Gly Thr Thr Gly Thr Leu Val
405 410 415
Trp Glu Arg Gly Val Leu Gln Met Arg Ser Leu Glu Ala His Cys Pro
420 425 430
Leu Gln Thr Phe His Leu His His Cys Arg Thr Gln Pro Ser Ser Cys
435 440 445
Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp Ser Gly Ala Val Val
450 455 460
Gly Leu Arg Pro Val Ala His His Leu Pro Arg Pro Ile Gln Gly Leu
465 470 475 480
His Cys Pro Gln Ala Pro His Gln Pro Ala Leu Ser Trp Gly Lys Trp
485 490 495
Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys Arg Trp Pro Arg Arg
500 505 510
Ser Gln Lys Ser Gln His His Cys Ala Leu Arg Lys Ile Glu Trp Ala
515 520 525
Thr Lys Leu Ser Leu Gly Gly Lys Ala Gly Pro Gln Ala Gln Glu Lys
530 535 540
Ala Arg Pro Ser Pro Cys Leu Ser Trp Ser Ser Arg Ile Val Ala Pro
545 550 555 560
Gly His Ala Leu Ser Cys Arg Thr Arg Arg Arg Trp Ser Ser Lys Cys
565 570 575
Arg Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys Ser Cys Ser Pro Ser
580 585 590
Gly Phe Ser Ala Gly Arg Gly Arg Cys Pro Val Gln Gly Cys Leu Arg
595 600 605
Pro His Arg Val Gln Leu Leu Arg Arg Trp Gly Pro Gly Ser Pro Ala
610 615 620
Gly Gln Arg Leu Ser Lys Gly Phe Gln Leu Leu Arg Trp Trp Gly Pro
625 630 635 640
Gly Ser Pro Ala Pro Glu Pro Arg Lys Gly Pro Phe Pro Pro Pro Asp
645 650 655
Pro Pro Trp Pro Val Thr Ala Val Thr Val Met Ala Gly Ser Val Pro
660 665 670
Ser Ala Gln Ser Val Asp Ala Leu Glu Ser Pro Gly Pro Leu Ala Leu
675 680 685
Glu Gly Pro Ser Ser Pro Arg Asn Leu Leu Trp Arg Glu Met Ser Ile
690 695 700
Phe Leu Pro Gly Ile Phe Cys Gln Lys Lys Val Pro Ser Ala Ser Pro
705 710 715 720
Trp Gly Leu Val Pro Pro Ser Pro Pro Leu Ala Leu Gly Pro Arg Met
725 730 735
Gln Leu Cys Thr Gln Leu Ala Arg Phe Phe Pro Ile Thr Pro Pro Val
740 745 750
Trp His Ile Leu Gly Pro Gln Arg His Thr Pro Gln Val Val Leu Arg
755 760 765
Leu Gly Asn Leu Pro Pro Phe Phe Arg Gly Ser Glu Val Pro Phe Pro
770 775 780
Arg Pro Cys Arg Thr Lys Asn Glu Gly Asn Asn His Trp Pro Arg Val
785 790 795 800
Glu Met Pro Thr Gly Trp Leu Leu Val Gly Tyr Asn Thr Arg Asn Thr
805 810 815
Ala Gln Asn Pro Arg Leu Gln Gln His Leu Lys His Trp Gln Gln Cys
820 825 830
Thr Arg Ala Arg Trp Cys Gln Glu Pro Cys Gln Thr Leu Thr Phe Phe
835 840 845
His Phe Phe Phe Phe Phe Lys Thr Val Ser Leu Cys Cys Pro Gly Trp
850 855 860
Ser Lys Gly Gln Pro Pro Pro Pro Gly Leu Lys Pro Ser Ser Leu Ala
865 870 875 880
Ser Gln Val Ala Arg Thr Thr Gly Val Tyr Gln His Val Trp Leu Ile
885 890 895
Cys Phe Val Phe Phe Val Cys Val Glu Thr Gly Phe Cys His Val Ala
900 905 910
Gln Val Gly Leu Glu Arg Leu Val Ser Leu Ser Gly Ile Thr Asp Val
915 920 925
Asn His Trp Ala Gln Pro Lys Pro Ser Pro Ser Lys Gly Thr Gly Met
930 935 940
Asn Arg Pro Ile Gly Leu Arg Val Gly Lys Gly Val Trp Ala Arg Leu
945 950 955 960
Leu Lys Lys Lys Pro Arg Asp Ile Cys Arg Ile Ser Asn Arg Lys Thr
965 970 975
Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr Asp Arg Ala Ser Val
980 985 990
Ser Phe Trp Thr Leu Leu Pro Thr Thr Gly Val Arg Thr Arg Gly Ser
995 1000 1005
Pro Leu Arg Leu Thr Leu Trp Pro Pro Arg Cys Arg Cys Arg Arg
1010 1015 1020
Glu Tyr Arg Val Thr Met Asn Ile Leu Asn Ser Leu Pro Ser Ser
1025 1030 1035
Met Glu Ile Ala Val Leu Gln Glu Thr Ala Lys Lys Ser Pro Thr
1040 1045 1050
Ser Phe Cys Cys Asn Leu Asp Leu Gln His Gln Arg Arg Arg Lys
1055 1060 1065
Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro Lys Ala
1070 1075 1080
Asn Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn Leu
1085 1090 1095
Leu Asn Leu Val Gln Leu Asn Pro His Ser Pro His His Arg Lys
1100 1105 1110
Asp Glu Glu Asp His Gln Lys Arg His His His His Asn Gln Lys
1115 1120 1125
Lys Met Ser Val Pro Leu Phe Phe His Gly Asp Leu Cys Arg Glu
1130 1135 1140
Ser Thr Leu Gly Asn Phe Trp Met Lys Leu Leu Gln Leu Pro Gln
1145 1150 1155
Arg Pro Pro Leu Gln Pro Val Thr Gly Met Glu Ile Leu Leu Trp
1160 1165 1170
Ile Leu Leu Lys Met Glu Ile Gln Ile Phe Lys Ile Cys Leu Gly
1175 1180 1185
Glu Met Gln Leu Cys Thr Ser Arg Ile Leu Asn Leu Gln Val Leu
1190 1195 1200
Lys Lys Ile Leu Arg Ser Phe Met Lys Leu Tyr His Ser Leu Val
1205 1210 1215
Met Cys Leu Arg Leu Arg Thr Lys Leu Glu Lys Ala Leu Ser Ala
1220 1225 1230
Leu Phe Ile Trp Pro Gln His Ser Tyr Lys Ile Thr His Pro Phe
1235 1240 1245
Ala Ser Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln Ile
1250 1255 1260
Arg Leu Leu Lys Pro Asp Lys Lys Lys Lys Ser Thr Glu Lys Thr
1265 1270 1275
Lys Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp Phe Ser Ala Pro
1280 1285 1290
Gln Gly Gln Ala Phe Gly Ser Leu Cys Gln Leu Val Ser Ala Asp
1295 1300 1305
Phe Ser Ala Pro Gln Val Thr Arg Leu Arg Ser Leu Asn His Leu
1310 1315 1320
Leu Ile Trp Leu Lys Asn Trp Lys Arg Phe Lys Leu Lys Lys Lys
1325 1330 1335
Tyr Gln Ala Pro Leu Arg Leu Trp Ser Trp Cys Gly Thr Ser Gln
1340 1345 1350
Thr Tyr Phe Gly Ser Ile Ile Cys Ile Lys Asn Met Phe Leu Gln
1355 1360 1365
Arg Lys Gly Phe Leu Asn Leu Ser His Val Glu Lys Phe Glu Leu
1370 1375 1380
Lys Lys Asn Leu Leu Leu Pro Val Val Ile Asn Leu Lys Arg Leu
1385 1390 1395
Gln Lys Phe Met Leu Asn Gln Lys Cys Leu Ala Pro Phe Pro Ala
1400 1405 1410
Cys Thr Ser Lys Ala Trp Thr Pro Arg Lys Leu Val Gly Arg Ala
1415 1420 1425
Val Arg Arg Lys Gly Ile Leu Ala Met Thr Leu Thr Leu Asn Gly
1430 1435 1440
Ile Glu Ala Leu Thr Ala Leu Phe Thr Cys Arg Thr Ala Ser Ile
1445 1450 1455
Ser Val Asn Ile Ser Thr Leu Met Ser Ile Leu Glu Ala Ile Ile
1460 1465 1470
Lys Lys Met Lys Lys Arg Ile Met Val His Arg Trp Ile Phe Ser
1475 1480 1485
Asn Gln Leu Thr Val Gln Met Leu Cys Leu Pro Leu Leu Thr Pro
1490 1495 1500
Asp Thr Arg Trp Ile Phe Ser Asn Gln Leu Gln Thr Val Gln Met
1505 1510 1515
Leu Cys Leu Pro Pro Leu Lys Gln Gly Glu Arg Ile Ile Trp Pro
1520 1525 1530
Leu Gly Gly Phe Gln Ile Pro Asn Phe Phe Trp Ser Leu Gly Ile
1535 1540 1545
Gly His Thr Gly Ala Trp Trp His Thr Gly Arg Arg Arg Arg Glu
1550 1555 1560
Trp Gly Gly Ser Thr Val Ser Arg Ser Pro Leu Trp Ile Ser Ser
1565 1570 1575
Met Ile Tyr Leu Arg Gly Met Ala Phe Ala Ser Asp Ser Ser Ile
1580 1585 1590
Arg Thr Thr Arg Val Ser Trp Cys Arg Arg Cys Gly Ala Lys Ser
1595 1600 1605
Ala Ala Ala Ser Ser Ser Pro Leu Trp Asp Cys Ser Thr Thr Thr
1610 1615 1620
Gly Thr His His Gly Cys Leu Trp Glu Ile Pro Ser Val Thr Leu
1625 1630 1635
Leu Ala Asn Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn Arg
1640 1645 1650
Asn Lys Ser Arg Gln Met Glu Ser Leu Gly Met Lys Leu Gln Leu
1655 1660 1665
Lys Lys Lys Val Asn Ala Cys Ser Thr Tyr Thr Pro His Ile Cys
1670 1675 1680
Arg His Thr Cys Arg Val Asn Ala Val Glu Glu Leu His Ser Arg
1685 1690 1695
Arg Met Ser Val Arg Ile Val Lys Asn Trp Val Ser Cys Cys Tyr
1700 1705 1710
Val Arg Leu Ser Ala Val Gly Leu Ser Thr Trp Ser Ala Leu Asp
1715 1720 1725
Asn Lys Ile Ile Cys Lys Gly His Arg Ile Thr Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1119
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 1B
<400> 1119
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Thr Glu Ile Gln Leu Thr Met Asn
225 230 235 240
Asp Ser Lys His Lys Leu Glu Ser Pro Ala Leu Lys Gln Val Ser Pro
245 250 255
Ala Ser Pro Pro Thr Gln Gln Pro Gln Thr Pro Gln Asp Ser Arg Gln
260 265 270
Val Leu Ala Met Pro Ser Ser Trp Ser Ser Ser Gly Arg Thr Gln Arg
275 280 285
Lys Val Val Lys Asn Pro Ser Gln Pro Val Pro Leu Arg Asn Asp Gly
290 295 300
Ile Thr Asn Gly Asn Asp Ser Thr Arg Ser Cys Ser Ile Ser Leu Lys
305 310 315 320
Lys Ser Leu Glu Lys Met Pro Leu Met Met Lys Lys Lys Asp Ser Thr
325 330 335
Ile Phe Ile Val Pro Met Ser Leu Ala Cys Ser Ile Thr Val Ser Phe
340 345 350
Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val Ser Ser Ile Ser His
355 360 365
Trp Asn Lys Val Arg Gln Asn Phe Lys Arg Asn Ala Asp Lys Lys Asn
370 375 380
Val Arg Ser Gly Glu Lys Asn Asp Leu Gln Leu Phe Val Met Ser Asp
385 390 395 400
Thr Thr Tyr Lys Ile Tyr Trp Thr Val Ile Leu Leu Asn Pro Cys Gly
405 410 415
Asn Leu His Leu Lys Thr Thr Ser Leu Gly Asp Cys Pro Arg Thr Met
420 425 430
Ala Gly Pro Ser Ala Ser Leu His Pro Ala Ser Gly Arg Ala Ser Arg
435 440 445
Lys Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg Ala Gly Gly Pro Ala
450 455 460
Gly Trp Ala Arg Gln Ala Phe Asp Lys Lys Gly Phe Val Ile Leu Ser
465 470 475 480
Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys Val Pro Val Ala Glu
485 490 495
Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly Ala Ala Gly Thr Arg Cys
500 505 510
Arg Ala Ser Arg Ala Pro Cys Arg Gln Leu Pro Ala Ser Ser Pro Thr
515 520 525
Lys Cys Glu Ile Cys Val Lys Arg Arg Arg Arg Arg Lys Arg Ser Ser
530 535 540
Gln Ser Arg Ser Pro Val Pro Lys Lys Arg Glu Arg Met Met Leu Pro
545 550 555 560
Val Arg Ala Arg Thr Ala Arg Ser Ala Leu Pro Gln Gly Arg Ala Pro
565 570 575
Leu Glu Gly Met Leu Leu Pro Arg Ala Leu Pro Ser Leu Leu Ser Arg
580 585 590
Met Pro Ala Arg Arg Glu Ser Arg Phe Trp Leu Ala Leu Gln Ala Leu
595 600 605
Gly Leu Arg Pro Pro His Leu Pro Ser Cys His Pro Leu Pro Gln Leu
610 615 620
Leu Gly Pro Pro Pro Pro His Gln Ala Pro Thr Ala Phe Phe Leu Leu
625 630 635 640
Asp Ile Ile Leu Arg Leu Pro Cys Lys Val Thr Glu Ser Ser Asn Met
645 650 655
Gly Gly Asn Arg Ser Ile Cys Leu Thr Asn Ala Lys Lys Met Glu Asp
660 665 670
Met Ile Trp Glu Ser Thr Pro Leu Ser Ile Ser Arg Pro Thr Ser Arg
675 680 685
Ala Arg Gln Ser Cys Cys Leu Pro Gly Leu Thr His Pro Ala His Gln
690 695 700
Pro Leu Gly Ser Met Thr Leu Ala Ile Arg Phe Ile Ser Ala Pro Gln
705 710 715 720
Pro Ser Ser Ser Thr Val Thr Ala Ala Pro Ser Gly Gln Tyr Phe Lys
725 730 735
Gly Lys Lys Arg Arg Lys Glu Ile Phe Lys Lys Lys Lys Pro Leu Thr
740 745 750
Phe Ser Pro Ser Leu Ala Lys Lys Thr Leu Thr Asn Ser Ser Phe Phe
755 760 765
Tyr Thr Ser Asp Arg Glu Ala Lys Lys Ser Met Lys Arg Ser Met Thr
770 775 780
Leu Lys Ala Leu Val Lys Thr Trp Thr Gln Phe Arg Asn Tyr Pro Arg
785 790 795 800
Ala Ser Ser Pro Gly His Pro Leu Gly Pro Asn Gly Ile Trp Glu Val
805 810 815
Met Pro Arg Thr Leu Glu Gly Cys Ile Ser Val Lys Asp His Arg Thr
820 825 830
Ser Gln Asn His Ser Lys Cys Ile Thr Glu Cys Val Arg Thr Ala Leu
835 840 845
Asn Arg Arg Ser Lys Ile Glu Ala Ser Pro Ile Gly Ser Ile Ala Leu
850 855 860
Arg Ser Met Pro Lys Ser Arg Asn Gln Val Leu Phe Arg Arg Asn Leu
865 870 875 880
Thr Pro Ser Gln Leu Arg Thr Leu Ala Pro Pro Tyr Met Leu Leu Pro
885 890 895
Gln Ser Leu Ser Gln Ser Leu Ser Arg Lys Gln Ile Pro Ser Gln Ser
900 905 910
Met Leu Val Ala Ser Arg Ala Gly Gln Phe Pro Val Trp Arg Arg Thr
915 920 925
Ser Arg Gly Met Ser Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro
930 935 940
Leu Arg Cys Pro Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn
945 950 955 960
Gly Trp His Arg Ser Gly Leu Arg Ala Gln Arg Lys Arg Lys Arg Glu
965 970 975
Lys Arg Ser Gln Lys Ser Arg Gln Asn His Leu Gln Leu Lys Ser Cys
980 985 990
Arg Arg Lys Ile Ser Asn Trp Ser Lys Leu Arg Ser Pro Trp Ile Phe
995 1000 1005
Val Ser Lys Lys Arg Leu Pro Lys Leu Thr Lys Cys Glu Ile Cys
1010 1015 1020
Val Lys Asn Thr Ala Ile Leu Ala Ile Thr Leu Ile Thr Pro Gln
1025 1030 1035
Asp Pro His Leu Asp Pro Val Cys His Pro His Arg Arg Pro Gly
1040 1045 1050
Trp Lys Gly His His Arg Val Val Phe Ser His His Pro Ser Gly
1055 1060 1065
Ser Thr Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly Gly Arg
1070 1075 1080
Arg Glu Lys Lys Gly Cys Arg Glu Arg Ser Leu Leu Tyr Ser Arg
1085 1090 1095
Met Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro Asp Tyr
1100 1105 1110
Phe Val Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser Phe
1115 1120 1125
Pro Val Gly Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys
1130 1135 1140
Ser Cys Thr Ser His Ser Asn Pro Trp Ser Gln Ser Arg His Pro
1145 1150 1155
His Arg Ser Pro Pro Thr Ser Cys Pro Pro Leu Leu Glu Ala Phe
1160 1165 1170
Pro Leu Pro Arg Ala Ser Leu Arg Ala Thr Val Pro Arg His Ser
1175 1180 1185
Ser Val Leu Ala Thr Gly Leu His Leu His Arg Gln Ile Ser Leu
1190 1195 1200
Pro Leu Arg Gly Phe Leu Leu His Gln Pro Leu Pro Gly Gln His
1205 1210 1215
Leu Trp Leu Ser His Arg Leu Arg Leu Arg Leu Pro Arg Thr Gln
1220 1225 1230
Arg Pro Pro Arg Ser Ile Leu Ser Leu Arg Leu Pro Leu Arg Pro
1235 1240 1245
Gln Arg Gly Pro Arg Pro Leu His Arg Trp Leu Gln Gln Thr Thr
1250 1255 1260
Gly Cys Ser Gln Arg Arg Tyr Pro Arg Leu Lys Thr Phe Gly Val
1265 1270 1275
Pro Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser Leu Ser Thr Met
1280 1285 1290
Met Ile Ile Ser Thr Thr Arg Gln Glu Cys Gly Arg Arg Ala Ser
1295 1300 1305
Val Pro Cys Arg Pro Met Ile Gly Ser Ala Arg Pro Gly Pro Trp
1310 1315 1320
Arg Thr Ser Ala Met Pro Ser Ala Met Gly Val Ala Leu Pro Thr
1325 1330 1335
Ser Cys Glu Ser Gly Arg Ser Pro Pro Ala Thr Gly Gly Arg Met
1340 1345 1350
Pro Gly Ser Gln Ser Ile Met Met Ser Trp Met Pro Pro Leu Ala
1355 1360 1365
Pro Cys Ala Ala Cys Pro Cys Ser Pro Ala Pro Thr Leu Cys Pro
1370 1375 1380
Ala His Pro Ala Arg Ala Pro Thr Ala Val Pro Ala Phe Thr Pro
1385 1390 1395
Leu Ser Ala His Pro Val Pro Val Leu Ser Gly Cys His Leu Ala
1400 1405 1410
Val Arg Thr Ser Met Leu Thr Leu Leu Pro Met Leu Lys Leu Ala
1415 1420 1425
Pro Leu Gln Val Thr Thr Thr Leu Lys Leu Ile Leu Val Met Leu
1430 1435 1440
Glu Ile Val Thr Glu Ser Thr Arg Arg Glu Met Pro Ser Gln Ala
1445 1450 1455
Thr Pro Ser Pro Pro Gly Pro Trp Arg Ala Ala Leu Gly Lys Glu
1460 1465 1470
Val Lys Arg Ser Gln Ser Lys Leu Arg Leu Arg Asn Thr Ser Pro
1475 1480 1485
Ile Val Phe Phe Leu Ala Pro Tyr Phe Pro Arg Arg Met Thr Arg
1490 1495 1500
Arg Thr Met Thr Thr Thr Lys Met Met Met Met Arg Arg Thr Lys
1505 1510 1515
Arg Arg Arg Arg Lys Arg Arg Arg Met Thr Met Met Thr Arg Arg
1520 1525 1530
Thr Leu Leu Thr Lys Lys Thr Cys Leu Thr Pro Arg Thr Ser Ala
1535 1540 1545
Ala Thr Lys Ala Leu Pro Arg Gln Thr Ile Ser Gln Arg Arg Pro
1550 1555 1560
Ile Gln Thr Pro Pro Gly Thr Ser Leu Ala Ile Trp Gly Asn Gln
1565 1570 1575
Gln Leu Lys Trp Thr Pro His Ile Leu Lys Ser Ala Ser Arg Arg
1580 1585 1590
Ala Arg Pro Thr Ser Cys Ser Thr Cys Arg Met Trp Trp Ile Ala
1595 1600 1605
Lys Lys Arg Ile Lys Leu Arg Arg Asn Arg Thr Arg Leu Thr Leu
1610 1615 1620
Thr Gly Thr Arg Ser Ser Gly Thr Arg Ala Ser Pro Ser Ala Val
1625 1630 1635
Cys Leu Cys Cys Trp Thr Cys Pro Ser Arg Ser Phe Pro Ala Ala
1640 1645 1650
Ser Pro Ser Gly Leu Arg Ala Pro Val Gly Ala Gln Ala Pro Pro
1655 1660 1665
Glu Val Thr Leu Arg Ala Ser Cys Ala Ser Ser Ala Ser Lys Ala
1670 1675 1680
Cys Ala Gly Leu Trp Pro Trp Gly Ala Gln Val Arg Gln Pro Ser
1685 1690 1695
Leu Pro Gly Pro Cys Ala Ser Leu Leu Ser Thr Leu Ser Gln Pro
1700 1705 1710
Pro Pro Gln Ala Pro Ser Gln Val Trp Thr Ala Ala Thr Leu Arg
1715 1720 1725
Cys Pro Ala Val Pro Ala Ala Ala Cys Pro Pro Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1120
<211> 1744
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 2B
<400> 1120
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Arg Lys Met Gln Ser Leu Asn His
225 230 235 240
Pro Ser Arg Leu Thr Asn Met Ser Arg Thr Pro Pro Arg Arg Val Cys
245 250 255
Asn Pro Arg Arg Lys Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln Lys
260 265 270
Pro Ser Gln Lys Asn His Leu Tyr Asn Ser Arg Lys Lys Leu Leu Glu
275 280 285
Asp Met Lys Gln Asn Gly Phe Thr Gly His Arg Glu Gly Ser Glu Ser
290 295 300
Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro Ile Arg Met Cys Ala
305 310 315 320
Leu Ser His Pro Ser Phe Tyr Ile Ser Ser Thr Val Cys Phe Leu Ser
325 330 335
Lys His Cys Met Thr Ala Cys Thr Gln Lys Lys Gly His Met Ile Phe
340 345 350
Ser Arg Glu Lys Ile Ile Asn Pro Thr Ile Ser Cys Pro Phe Gln Ser
355 360 365
Pro Thr Lys Arg Leu Glu Leu Ser Leu Glu Pro Trp Ile Pro Tyr Leu
370 375 380
His Gln Gln Lys Thr Gln Gly Gly Lys Lys Arg Ser Lys Phe Pro Gly
385 390 395 400
Thr Ser Leu Gln Cys Tyr Leu Asn Arg Cys Ser Leu Met Glu Gln Ile
405 410 415
Pro His Leu Lys Ser Ala Ser Pro Gln Ile Met Gln Arg Thr Ser Ala
420 425 430
Asp Arg Phe Arg Met Lys Arg Arg Met Gln Asn Leu Asp Asn Leu Gly
435 440 445
Val Pro Trp Pro Leu Leu Pro Gly Pro Leu Glu Asn Thr Gln Ile Pro
450 455 460
Arg Thr Ser Pro Leu Trp Lys Ile Thr Met Val Leu Thr Tyr Pro Asn
465 470 475 480
Cys Val Val His Val Leu Met Phe Trp Leu Pro Met Arg Ser Leu Gly
485 490 495
Glu Pro Trp Arg Ala Gly Phe Gln Trp Gly Glu Ser Pro Trp Gln Val
500 505 510
Met Ala Ser Leu Thr Gly Pro Tyr Pro Ile Ser Glu Gly Leu Thr Met
515 520 525
Thr Thr Gly Arg Asn Ile Asn Ser Asn Ser Leu Met Thr Asn Cys Leu
530 535 540
Phe Ser Pro Ile Phe Leu Cys His His Ala Ile Met His Arg Lys Met
545 550 555 560
Thr Ser Pro His Phe Arg Leu Phe Ser Ser Lys Ile Pro His Pro Gln
565 570 575
Val Pro Ser Val Val Ala Leu Cys Lys Phe Arg Ala Thr Phe Leu Leu
580 585 590
Ala Leu Trp Glu Cys Ser Leu Pro Gln Ala Arg Leu Cys Leu Ile Val
595 600 605
Ser Arg Thr Leu Leu Leu Val Gln Ser Ala Ala Pro Pro His Arg Leu
610 615 620
Leu Gly Pro Ser Arg Trp Ser Arg Ser His Leu Asp Phe Ser Pro Tyr
625 630 635 640
Trp Met Lys Lys Val Lys Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile
645 650 655
Phe Val Leu Phe Lys Ala Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly
660 665 670
Arg Asn Lys Lys Thr Lys Leu Trp Phe Ser Leu Ile Asn Ile His His
675 680 685
Arg Lys Asn Pro Leu Leu Pro Met Arg Ile Pro Ser Leu Asn Ala Gln
690 695 700
Trp Met Phe Leu Arg Ile Leu Leu Leu Ala His Met Tyr Gly Phe Ser
705 710 715 720
Thr Tyr Gly Thr Gln Lys Gly Glu Cys Val Cys Leu Gln Cys Leu Ser
725 730 735
Gly Ser Ser Leu Phe Ile Leu Lys Gln Pro Leu Asp Leu Lys Ile Ser
740 745 750
Lys Thr Phe Met Leu Gln Ala His Pro Gln Val Pro Ala Leu Ala Pro
755 760 765
Gln Ala Trp Trp Pro Ala Arg Arg Gly Pro Leu Thr Ser Ala Pro Ser
770 775 780
Ala Gln Gln Ser Leu Thr Ala Ser Pro Gln Ile Met Gln Arg Met Ser
785 790 795 800
Ala Val Asn Phe Glu Thr Ile Ile Tyr Pro Pro Ser Thr Cys Ser Leu
805 810 815
Pro Cys Arg Gly Arg Thr Leu Glu Ser Ala Gly Leu Phe Pro Trp Leu
820 825 830
His Thr Gln Cys Thr His Pro Cys Thr Met Leu Leu Pro Gln Gly Trp
835 840 845
Trp Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys Lys Val
850 855 860
Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys Gly Ile
865 870 875 880
Cys Trp Lys Trp Pro Val Thr Val Ala Ala Gln Trp Ser Ser Val Thr
885 890 895
Ser Leu Glu Trp Thr Ala Gln Glu Arg Gly Cys Ser Ser Trp Leu Met
900 905 910
Lys Gln Thr Trp Met Lys Ser Trp Ser Leu Arg Asp Pro Ser Tyr Arg
915 920 925
Ser Ile Leu Glu Tyr Val Ser Thr Arg Val Leu Trp Met Pro Thr Ser
930 935 940
Thr Val Arg Arg Arg Asn Ser Arg Lys Gln Ser Gln Val Gln Leu Ala
945 950 955 960
Ile Gln Val Leu Leu Val Asp Lys His Lys Tyr Phe Leu Phe Gly Arg
965 970 975
Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser His Leu Ile Ala His
980 985 990
Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe His Pro Arg Leu Leu
995 1000 1005
Thr Arg Lys Lys Pro Gly Lys Phe Leu Pro Ser Arg Phe Pro Trp
1010 1015 1020
Gly Pro Pro Pro Leu Cys His Pro Ala Trp Leu Ser Pro Ile Ser
1025 1030 1035
Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe His Val Leu Ala Leu
1040 1045 1050
Glu Val Thr Phe Pro Pro Gly Thr Ala Met Pro Gln Met Gln Leu
1055 1060 1065
Gln Ala Leu Ala Met Trp Glu Lys Gly Trp Asp Lys Arg Lys Arg
1070 1075 1080
Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile Gln Glu Lys
1085 1090 1095
Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe Glu Ala Cys
1100 1105 1110
Arg Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile Thr Leu Phe
1115 1120 1125
Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn Val Leu Cys Val
1130 1135 1140
Arg Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys Arg Lys Met
1145 1150 1155
Lys Arg Asn Gln Val Ala Ser Pro Gln Ile Met Gln Arg Leu Phe
1160 1165 1170
Ile Lys Gly Tyr Gln Asn Asn His Phe Thr Phe His Leu Gln Asn
1175 1180 1185
Phe Ala Phe Phe Ser Ser Phe Gly Asn Asn Lys Tyr Ile Asn Ile
1190 1195 1200
Leu Thr Arg Arg Lys Lys Arg Glu Asp His Cys Gly Leu Leu Ile
1205 1210 1215
Leu Ile Gln His Gly Gly Ile Phe Thr Phe Arg Phe Trp Val Glu
1220 1225 1230
Lys Leu Ser Trp Asn Ile Cys Lys Asn Leu Ser Leu Tyr Leu Asp
1235 1240 1245
Lys Phe Val Gln Arg Leu Leu Tyr Val Tyr Ile Ile Glu Thr Asn
1250 1255 1260
Val Phe Val Leu Asn Leu Phe His Val Pro Val Asn Gln Ile Phe
1265 1270 1275
Met Met Ala Phe Tyr Leu Lys Tyr Thr Glu Lys Ala Trp Val Met
1280 1285 1290
Glu Leu Glu Trp Leu Ile Gln Gln Gln Cys Tyr Gln Gln Glu Lys
1295 1300 1305
Lys Ser Arg Lys Leu Met Ser Ser Cys Arg Ala Phe Ile His Thr
1310 1315 1320
Pro Arg Ser Pro Gly Cys Ser Val Tyr Ala Asn Met Cys Trp Ala
1325 1330 1335
Phe Trp Lys Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr
1340 1345 1350
Gly Cys Trp Gly Ser Pro Pro Leu His Leu Cys Gln Pro Leu Arg
1355 1360 1365
Arg Tyr Lys Lys Arg Gly Val Ile Ala Trp Arg Arg Arg Lys Trp
1370 1375 1380
Gln Ile Arg His Val Leu Lys Asn Leu Ile Leu Phe His Val Arg
1385 1390 1395
Asn Ile Val Tyr Gly Ile Gln Val Met Leu Cys Gly Lys Gly Leu
1400 1405 1410
Thr His Pro Val Pro Leu Lys Arg Thr Leu Gln Asn Lys Arg Asn
1415 1420 1425
Lys Asn Ile Lys Arg Val Asn Gln Lys Lys Gly Asn Ile Lys Arg
1430 1435 1440
Lys Ser Ile Leu Leu His Leu Ile Val Leu Asn Ser Pro Glu Ser
1445 1450 1455
Asn Pro Lys Phe Phe Leu Thr Phe Ser Gln Leu Glu Lys Lys Ala
1460 1465 1470
Thr Trp Met Arg Arg Thr Gly Ala Leu Arg Ala Thr Ala Pro Ala
1475 1480 1485
Thr Ala Ala Pro Gln Ala Gln Thr Pro His Trp Arg Ala Ala Thr
1490 1495 1500
Thr Ser Ser Met Ser Ser Ser Pro Arg Ala Glu Pro Thr Ser Ser
1505 1510 1515
Ser Ser Trp Ala Thr Cys Trp Pro Arg Cys Cys Ser Ser Ser Cys
1520 1525 1530
Tyr Trp Ser Leu Ser Ser Trp Pro Pro Ala Gly Ala Ala Glu Ala
1535 1540 1545
Thr Asn Thr Arg Thr Arg Ser Arg Glu Ser Gln Arg Gly Arg Met
1550 1555 1560
Leu Thr Trp Arg Ser Ser Leu Trp Leu Gln Gly Thr Arg Cys Phe
1565 1570 1575
Thr Gly Val Arg Thr Ser Ser Gly Ser Cys Gly Arg Ala Cys Ser
1580 1585 1590
Cys Gly Arg Gly Cys Gly Thr Pro Arg Gly Asp Trp Lys Arg His
1595 1600 1605
Pro Pro Arg Arg Asn Ser Val Ile Val His Lys Ile Val Leu Val
1610 1615 1620
Phe Leu Lys Ser Leu Ser Ser Tyr Asn Cys Glu Arg Arg Ile Ser
1625 1630 1635
Gly Ile Gln Lys Arg Ala Ile Glu Phe Ala Val Leu Lys Leu Leu
1640 1645 1650
Asn Met Asp Leu His Trp Asn Ser Ala Tyr Leu Gly Arg Thr Leu
1655 1660 1665
Leu Val Thr Cys Ile Leu Tyr His Arg Trp Ile Val Thr Ser Met
1670 1675 1680
Cys Gln Ser Gln Arg Trp Leu Thr Ser Thr Thr Ser Arg Ser Ser
1685 1690 1695
Ala Leu Met Trp Thr Arg Gln Ile Asn Arg Arg Lys Leu Gln Arg
1700 1705 1710
Lys Lys Arg His Pro Ser Trp Pro Trp Thr Arg Cys Leu Arg Met
1715 1720 1725
Arg Pro Pro Arg Ser Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1730 1735 1740
Ser
<210> 1121
<211> 1749
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 3B
<400> 1121
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Gly Ala Ala Ala Ala Ser Cys Gln
225 230 235 240
Ser Pro Pro Ser Pro Arg Glu Thr Thr Pro Ser Ser Asp Ala Thr Arg
245 250 255
Arg Thr Arg Pro Ile Ala Ala Gln Ser Lys Lys Thr Met Thr Ala Ala
260 265 270
Gly Leu Thr Pro Lys Asn Lys Lys Arg Arg Lys Leu Arg Pro Lys Met
275 280 285
Ile Arg Lys Ile Gln Lys Arg Arg Arg Thr Ala Asn Arg Arg Asn Ser
290 295 300
Arg Arg Ala Thr Pro Thr Ser Lys Gly Ser Leu Arg Arg Lys Tyr Leu
305 310 315 320
Arg Val Arg Gly Pro Pro Leu His Thr Arg Asn Ile Arg Lys Leu Ile
325 330 335
Trp Thr Lys Gln Arg Ser Phe Leu Ser Leu Phe Pro Lys Leu Arg Ala
340 345 350
Thr Glu Gln Met Thr Asn Val Gly Cys Ser Ile Pro His Val Pro Lys
355 360 365
Ala Thr Ala Ala His Ser Val Thr Val Lys Leu Gln Leu Pro Leu Thr
370 375 380
Phe Ser Thr Leu Leu Trp Asp Ser Arg His Thr Met Ser Leu Ser Asn
385 390 395 400
Ile Leu Met Lys Phe Arg Leu Gln Ser Ser Pro Phe Leu Ala Arg Ser
405 410 415
Trp Asn Thr Met Gln Trp Asn Asn Lys Lys Met Ala Met Thr Val Ile
420 425 430
Ala Gly Ala His His Cys Gln Tyr Lys Leu Thr Tyr Thr Lys Val Trp
435 440 445
Lys Met Asn Trp Lys Lys Met Met Ile Gly Ser Gln His Leu Leu Phe
450 455 460
Ser Pro Leu Asp Ser Ser Pro Leu Gln Leu Leu Leu His Pro His Gly
465 470 475 480
Lys Arg Cys Asn Pro Cys Cys Arg Leu Thr Trp Met Ser Gln Asn Thr
485 490 495
Arg Ser Thr Asn Leu Glu Lys Asn Pro Ser Leu Lys Lys Gln Ser Gln
500 505 510
Arg Arg Gly Lys Leu Ser Ala Phe Ser Gly Arg Ile Leu His Gln Pro
515 520 525
Glu Met Ala Ala Met Arg Leu Met Pro Lys Phe Leu Asn Ser Thr Asn
530 535 540
Ser Trp Trp Thr Leu Thr Thr Leu Ser Phe Val Leu Ile Glu Glu Ala
545 550 555 560
Arg Gln Pro Ser Arg Pro Thr Gly Arg Thr Pro Thr Thr Arg Leu Met
565 570 575
Ala Pro Val Gly Ser Val Met Ser Cys Ser Leu Leu Thr Gln Pro Ser
580 585 590
Pro Ala Ser Ala Cys Thr Met Pro Pro Leu Leu His Pro Gln Trp Ala
595 600 605
Pro His Ser Ala Gly Leu Ser Pro Gly Ala Cys Arg Pro Ala Cys Thr
610 615 620
Cys Ile Ser Met Thr Thr Ile Ser Arg Ala Thr Trp Gly Pro Val Tyr
625 630 635 640
Tyr Val Cys Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Phe Leu
645 650 655
Phe Thr Val Pro Ile Glu Asp Met Arg Glu Cys Thr Leu Gly Arg Asn
660 665 670
Arg Met Asn Val Ser Ser Val Leu Lys Pro Cys Leu Ile Pro Val Pro
675 680 685
Ile Ser Glu Lys Lys Arg Lys Leu Pro Asn Ile Glu Ile Thr Pro Gln
690 695 700
Arg Ser Lys Ala Met Leu Gln Lys Gln Cys Cys Tyr Asn Leu Val Ile
705 710 715 720
Lys His Pro Leu Ile Phe Arg Ile Asn Leu Arg Arg Gln Gly Lys Thr
725 730 735
Lys Asp Gly Val Val Gln Ser Leu Gly Phe Leu Asn Gln Gln Ile Ile
740 745 750
Leu Gln Lys Glu Phe Phe Ile Cys Leu Leu Met Phe Ile Lys Arg Trp
755 760 765
Lys Pro Ala Ala Thr Lys Ser Arg Lys Lys Gly His Thr Lys Asn Arg
770 775 780
Arg Lys Ala Lys Arg Lys Pro Gln Ile Tyr Leu Phe Phe Leu Thr Val
785 790 795 800
Cys Gly Phe His Leu Lys Lys Thr Ser Ala Lys Trp Leu Lys Lys Ser
805 810 815
Thr Lys Ser Arg Ser Asn Gly Met Glu Ala Cys Gly Thr His Pro Thr
820 825 830
Pro Arg Leu Ser Cys Leu Arg Val Arg Cys Gly Gly Trp Leu Cys Gly
835 840 845
Trp Thr Pro Arg Gly Arg Lys Ser Gly Val Met Lys Cys Trp Asp Leu
850 855 860
Cys Pro Val His Lys Lys Arg Gly Leu Phe Arg Leu Asp Phe His Pro
865 870 875 880
Arg Ser Ser Ser Gly Lys Gly Lys Asn Ser Pro Cys Cys Gln Lys Lys
885 890 895
Leu Arg Val Gln Asn Gln Gly His Leu Leu Met Ile Leu Leu His Asn
900 905 910
Asp Arg Val Phe Leu Val Lys Ile Gly Glu Lys Leu Lys His Cys Phe
915 920 925
Lys Ala Trp Gly Ser Arg Arg Asn Arg Arg Tyr Arg Lys Ile Tyr Gly
930 935 940
Glu Leu Lys Met Ser Leu Gln Ala Phe Leu Ile His Leu Arg Lys Val
945 950 955 960
Asp Thr His His Leu Gln Val Val Thr Lys Thr Val Thr Ala Thr Thr
965 970 975
Ala Asp Gly Gln Arg Met Arg Arg Leu Lys Cys Lys Ala Cys Arg Leu
980 985 990
Arg Trp Ala Arg Pro Glu Pro Ala Ala Gln Ala Pro Pro Lys Ser His
995 1000 1005
Phe Pro Pro His Pro Ser Gly Pro Ser Arg Thr Ser Ser Leu Gln
1010 1015 1020
Leu Arg Ser Leu Phe Phe Ser His Cys Leu Cys Ser Gln Lys Lys
1025 1030 1035
Asp Pro Ala Gly Lys Leu Lys Lys Leu Leu Lys Lys Ser Ser Gln
1040 1045 1050
Leu Arg Arg Ser Trp Arg Asn Val Ser Arg Ile Ser Thr Pro Pro
1055 1060 1065
Pro Leu Ile Leu Trp Pro Gln Ala Ala Pro Val Ser Val Ile Thr
1070 1075 1080
Met Lys Leu Trp Glu Lys His Phe Lys Gly Leu Asn Trp Asn Leu
1085 1090 1095
Val Val Trp Ile Leu Asn Leu Lys Met Met Thr Tyr Met Glu Met
1100 1105 1110
His Tyr Gly His Gln Ala Pro Gln Val Ala Met Leu Pro Lys Leu
1115 1120 1125
Leu Cys Arg Gln Met Leu Pro Thr Leu Ser Thr Leu Gln Gln Arg
1130 1135 1140
His Pro Gln Gly Pro Cys Pro Pro Pro Val Thr Pro Leu Arg Val
1145 1150 1155
Gln Ser Val Leu Leu Leu Gly Val Pro Gln Thr Ala Arg Gly Pro
1160 1165 1170
Arg Arg Lys Val Leu Met Val Leu Trp Leu Pro Ala Asn Gln Ser
1175 1180 1185
Leu Gln Lys Ser Gln Val Phe Gln Trp Val Leu Arg Thr Glu Val
1190 1195 1200
Ala Pro Arg Cys Pro Arg Ser Ala Val Asp Ile Ser Pro Gly Pro
1205 1210 1215
Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser Val Ala Ile Gly Lys
1220 1225 1230
Leu Ala Leu Leu Gly Ala Ser Ala Pro Cys Gly Ala Ala Gly Ala
1235 1240 1245
Arg Glu Ala Gly Arg Phe Ala Val Leu Gly Thr Met Val Met Lys
1250 1255 1260
Leu Cys Phe Phe Tyr Leu Leu Tyr Arg Leu Arg Ile Pro Ser Leu
1265 1270 1275
Arg Lys Tyr Arg Gln His Leu Asn Arg Lys Leu His Leu Thr Arg
1280 1285 1290
Ser Cys Leu Ile Asp Leu Thr Met Met Met Ser Gln Lys Leu Trp
1295 1300 1305
Lys Asn Gln Arg Lys Arg Ile Pro Leu Pro Ser Pro Arg Gln His
1310 1315 1320
Leu Leu Pro Gln Tyr Pro Leu His Pro Pro Pro Pro Cys Leu Leu
1325 1330 1335
Leu Leu His His Arg His His Leu Ala Phe Leu Glu Met Ala Cys
1340 1345 1350
Ser Ser Gln His Thr His Ser Ile Lys Ile Trp Ile Ser Phe Ser
1355 1360 1365
His Glu Val Asp Pro Pro Gly Ser Val Trp Ile Leu Pro Cys Asp
1370 1375 1380
Leu Pro Arg Met Leu Pro Ile Ser Ser Pro Leu His Arg Pro Gln
1385 1390 1395
Met Pro Phe Trp Thr Cys Thr Phe Pro Ala Thr Thr Trp Gly Thr
1400 1405 1410
Trp Glu Thr Pro Ser Thr Trp Gly Trp Arg Thr Phe Arg Gly Ala
1415 1420 1425
Ser Ser Ser Thr Ser Arg Asp Ser Arg Ser Phe Phe Thr Ser Ala
1430 1435 1440
His Pro Ser Arg Pro Cys Arg Met Arg Leu Tyr Gln Cys Lys Lys
1445 1450 1455
Lys Leu Leu Leu Lys Leu Leu Thr Thr Thr Thr Ser Ser Pro Arg
1460 1465 1470
Arg Ser Pro Ala Leu Arg Ala Arg Gly Gly Thr Thr Ile Gly Glu
1475 1480 1485
Val Thr Ser Cys Thr Asn Leu Ser Val Pro Met Met Leu Thr Ile
1490 1495 1500
Leu Ile Trp Lys Arg Val Phe Ile Leu Leu Leu Ser Asp Lys Lys
1505 1510 1515
Gly Ala Lys Lys Ile Thr Phe Leu Pro Ile Pro Pro His Leu Arg
1520 1525 1530
His Pro Leu Leu Leu Phe Glu Lys Lys Arg Pro Glu Trp Leu Ser
1535 1540 1545
Met Asp Leu Asp Gly Met Leu Thr Val Ile Gly Gln Gly Leu Val
1550 1555 1560
Gly Met Thr Pro Arg Asp Leu Gly Thr Val Ala Gly Ala Thr Ala
1565 1570 1575
Gln Ile Gln Arg Pro Ile Gln Val Gln Thr Gly Gly Arg Leu Arg
1580 1585 1590
Arg Asn Leu Gln Arg Asn Leu Lys Val Leu Gln Val Ser Val Tyr
1595 1600 1605
Ser Gly Asn Leu Leu Ser Phe Ser Arg Arg Gly Met Lys Ser Ser
1610 1615 1620
Val Arg Leu Lys Asn Arg Glu Trp Glu Lys Arg Lys Gln Ile Leu
1625 1630 1635
Gly Gly Gly Gly Lys Tyr Lys Glu Tyr Phe Leu Lys Arg Ile Leu
1640 1645 1650
Ile Arg Lys Ala Met Thr Val Leu Ala Gly Asp Lys Lys Gly Leu
1655 1660 1665
Gly Arg Phe Met Arg Cys Val Gln Ser Glu Thr Lys Ala Val Ser
1670 1675 1680
Leu Gln Leu Pro Leu Gly Arg Asn Met Glu His Arg Leu Thr Met
1685 1690 1695
Asp Ser Ala Leu Ser Leu Thr Lys Arg Glu Gly Pro Glu Thr Leu
1700 1705 1710
Lys Lys Lys Tyr Leu Val Gln His Gln Met Lys Cys Leu Thr Ala
1715 1720 1725
Val Asp Cys Leu Gln Ala Phe Trp Asp Met Gly Tyr Pro Tyr Asp
1730 1735 1740
Val Pro Asp Tyr Ala Ser
1745
<210> 1122
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 4B
<400> 1122
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Ile Gln Lys Lys Lys Gln Lys Ser
225 230 235 240
Asn Leu Asp Leu Gln His Gln Arg Arg Arg Lys Lys Lys Lys Asp Lys
245 250 255
Val Glu Ile Arg Asn Arg Ser Pro Lys Ala Asn Ser Thr Glu Cys Gln
260 265 270
Gly Glu His Ser Arg Glu Gln Asn Leu Leu Asn Leu Val Gln Leu Asn
275 280 285
Pro His Ser Pro His His Arg Lys Asp Glu Glu Asp His Gln Lys Arg
290 295 300
His His His His Asn Gln Lys Lys Met Ser Val Met Ala Lys Lys Ser
305 310 315 320
Gln Gln Pro Leu Gly Gln Ala Phe Gly Ser Leu Cys Gln Leu Val Ser
325 330 335
Ala Asp Phe Ser Ala Pro Gln Val Thr Arg Leu Arg Ser Leu Asn His
340 345 350
Leu Leu Ile Asn Glu Gly Asn Asn His Trp Pro Arg Val Glu Met Pro
355 360 365
Thr Gly Trp Leu Leu Val Gly Tyr Asn Thr Arg Asn Thr Ala Gln Asn
370 375 380
Pro Arg Leu Gln Gln His Leu Lys His Trp Gln Gln Cys Thr Arg Ala
385 390 395 400
Arg Trp Cys Gln Glu Pro Cys Gln Thr Leu Thr Phe Phe His Phe Phe
405 410 415
Phe Phe Phe Lys Thr Val Ser Leu Cys Cys Pro Gly Trp Ser Lys Gly
420 425 430
Gln Pro Pro Pro Pro Gly Leu Lys Pro Ser Ser Leu Ala Ser Gln Val
435 440 445
Ala Arg Thr Thr Gly Val Tyr Gln His Val Trp Leu Ile Cys Phe Val
450 455 460
Phe Phe Val Cys Val Glu Thr Gly Phe Cys His Val Ala Gln Val Gly
465 470 475 480
Leu Glu Arg Leu Val Ser Leu Ser Gly Ile Thr Asp Val Asn His Trp
485 490 495
Ala Gln Pro Lys Pro Ser Pro Ser Lys Gly Thr Gly Met Asn Arg Pro
500 505 510
Ile Gly Leu Arg Val Gly Lys Gly Val Trp Ala Arg Leu Arg Ala Ser
515 520 525
Val Ser Phe Trp Thr Leu Leu Pro Thr Thr Gly Val Arg Thr Arg Gly
530 535 540
Ser Pro Leu Arg Leu Thr Leu Trp Pro Pro Arg Asn Ile Leu Asn Ser
545 550 555 560
Leu Pro Ser Ser Met Glu Ile Ala Val Leu Gln Glu Asn Arg Lys Thr
565 570 575
Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr Asp Asn Leu His Leu
580 585 590
Cys Tyr Tyr His Ser Gln Ser Asn Arg Asn Lys Ser Arg Gln Met Glu
595 600 605
Ser Leu Gly Met Lys Leu Gln Ser Pro Leu Trp Asp Cys Ser Thr Thr
610 615 620
Thr Gly Thr His His Gly Cys Leu Trp Glu Ile Pro Ser Val Thr Leu
625 630 635 640
Leu Ala Cys Arg Val Asn Ala Val Glu Glu Leu His Ser Arg Arg Met
645 650 655
Ser Val Arg Ile Val Lys Asn Trp Val Ser Cys Cys Tyr Val Arg Leu
660 665 670
Ser Ala Val Gly Leu Ser Thr Trp Ser Ala Leu Asp Val Val Ile Asn
675 680 685
Leu Lys Arg Leu Gln Lys Phe Ser Gln Lys Ser Gln His His Cys Ala
690 695 700
Leu Arg Lys Ile Glu Trp Ala Thr Lys Leu Ser Leu Gly Gly Lys Ala
705 710 715 720
Gly Pro Gln Ala Gln Glu Lys Ala Asn Ala Lys Lys Met Pro Phe Gln
725 730 735
Arg Trp Ile Phe Ser Asn Gln Leu Thr Val Gln Met Leu Cys Leu Pro
740 745 750
Ile Glu Ala Leu Thr Ala Leu Phe Thr Cys Arg Thr Ala Ser Ile Ser
755 760 765
Val Asn Ile Ser Thr Leu Met Ser Ile Leu Glu Ala Pro Leu Phe Phe
770 775 780
His Gly Asp Leu Cys Glu Glu Lys Lys Asn Gly Arg Ile Ser Ser Gln
785 790 795 800
Ala Pro Leu Arg Leu Trp Ser Trp Cys Gly Thr Ser Gln Thr Tyr Phe
805 810 815
Gly Ser Thr Ala Lys Lys Ser Pro Thr Ser Phe Cys Cys Glu Trp Gly
820 825 830
Gly Gln Ala His Arg Gln Arg Asn Thr Gly Met Glu Ile Leu Leu Trp
835 840 845
Ile Leu Leu Lys Met Glu Ile Gln Ile Phe Lys Ile Cys Leu Gly Glu
850 855 860
Met Gln Leu Cys Thr Tyr Thr Pro His Ile Cys Arg His Thr Cys Arg
865 870 875 880
Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys Ser Cys Ser Pro Ser Gly
885 890 895
Phe Ser Ala Gly Arg Gly Arg Cys Pro Val Gln Gly Cys Leu Arg Pro
900 905 910
His Arg Val Gln Leu Leu Arg Arg Trp Gly Pro Gly Ser Pro Ala Gly
915 920 925
Gln Arg Leu Ser Lys Gly Phe Gln Leu Leu Arg Trp Trp Gly Pro Gly
930 935 940
Ser Pro Ala Pro Glu Pro Arg Lys Gly Pro Phe Pro Pro Pro Asp Pro
945 950 955 960
Pro Trp Pro Val Thr Ala Val Thr Val Met Ala Gly Ser Val Pro Ser
965 970 975
Ala Gln Ser Val Asp Ala Leu Glu Ser Pro Gly Pro Leu Ala Leu Glu
980 985 990
Gly Pro Ser Ser Pro Arg Asn Leu Leu Trp Arg Glu Met Ser Ile Phe
995 1000 1005
Leu Pro Gly Ile Phe Thr Ser Arg Ile Leu Asn Leu Gln Val Leu
1010 1015 1020
Lys Lys Ile Leu Arg Ser Phe Met Lys Leu Tyr His Ser Leu Val
1025 1030 1035
Met Cys Leu Arg Leu Arg Thr Lys Leu Glu Lys Ala Leu Ser Ala
1040 1045 1050
Leu Phe Ile Trp Pro Gln His Ser Tyr Lys Gln Arg Pro Pro Leu
1055 1060 1065
Gln Pro Val Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro Phe
1070 1075 1080
Phe Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys
1085 1090 1095
Met Leu Asn Gln Lys Cys Leu Ala Pro Phe Ile Thr His Pro Phe
1100 1105 1110
Ala Ser Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln Ile
1115 1120 1125
Arg Leu Leu Lys Pro Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe
1130 1135 1140
Ser Asn Gln Leu Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu
1145 1150 1155
Lys Gln Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile
1160 1165 1170
Pro Asn Phe Phe Trp Ser Leu Gly Ile Gly His Thr Gly Ala Trp
1175 1180 1185
Trp His Thr Gly Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr Val
1190 1195 1200
Ser Arg Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly
1205 1210 1215
Met Ala Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg Val Ser
1220 1225 1230
Trp Cys Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser Leu
1235 1240 1245
Lys Lys Lys Pro Arg Asp Ile Cys Arg Ile Ser Asp Ser Lys Lys
1250 1255 1260
Met Thr Gln Lys Arg Glu Ser Thr Leu Gly Asn Phe Trp Met Lys
1265 1270 1275
Leu Leu Gln Leu Pro Asp Lys Lys Lys Lys Ser Thr Glu Lys Thr
1280 1285 1290
Lys Ile Ile Lys Lys Met Lys Lys Arg Ile Met Val His Met Cys
1295 1300 1305
Ser Ser Leu Ala Leu Pro Thr Gly Leu Thr Ser Leu Ile Leu Pro
1310 1315 1320
Ser Ser Asp Leu Ala Val Leu Ile Ser Ser Ser Thr Ser His Phe
1325 1330 1335
Leu Met Arg Ser Pro Val Leu Pro Ser Ser Arg Leu Thr Cys Ala
1340 1345 1350
Ser Pro Gln Leu Pro Arg Met Trp Thr Trp Ser Ser Trp Leu Lys
1355 1360 1365
Trp Leu Lys Asn Trp Lys Arg Phe Lys Leu Lys Lys Lys Tyr Ile
1370 1375 1380
Leu Ala Met Thr Leu Thr Leu Asn Gly His Pro Arg Thr Ala Ser
1385 1390 1395
Ile Thr Leu Pro Thr Thr Ser Leu Lys Gly Ser Arg Thr Ser Cys
1400 1405 1410
Cys Pro Arg Ser His Pro Arg Leu Pro Arg Thr Lys Trp Pro Leu
1415 1420 1425
Gln Cys Leu Leu His Ser Leu Gly Thr Thr Gly Thr Leu Val Trp
1430 1435 1440
Glu Arg Gly Val Leu Gln Met Arg Ser Leu Glu Ala His Cys Pro
1445 1450 1455
Leu Gln Thr Phe His Leu His His Cys Arg Thr Gln Pro Ser Ser
1460 1465 1470
Cys Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp Ser Gly Ala
1475 1480 1485
Val Val Gly Leu Arg Pro Val Ala His His Leu Pro Arg Pro Ile
1490 1495 1500
Gln Gly Leu His Cys Pro Gln Ala Pro His Gln Pro Ala Leu Ser
1505 1510 1515
Trp Gly Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys
1520 1525 1530
Arg Trp Pro Arg Arg Glu Leu Lys Lys Asn Leu Leu Leu Pro Cys
1535 1540 1545
Arg Cys Arg Arg Glu Tyr Arg Val Thr Met Gly Gln Ala Phe Gly
1550 1555 1560
Ser Phe Ser Ala Asp Phe Ser Ala Pro Gln Val Leu Lys Lys Asn
1565 1570 1575
Arg Lys Gln Asn Lys Ile Ile Cys Lys Gly His Arg Ile Thr Ser
1580 1585 1590
Leu Ile Leu Ser Phe Gln Arg Val Lys Leu Lys Lys Lys Val Asn
1595 1600 1605
Ala Cys Ser Pro Ala Cys Thr Ser Lys Ala Trp Thr Pro Arg Lys
1610 1615 1620
Leu Val Gly Arg Ala Val Arg Arg Lys Gly Ile Ile Cys Ile Lys
1625 1630 1635
Asn Met Phe Leu Gln Arg Lys Gly Phe Leu Asn Leu Ser His Val
1640 1645 1650
Glu Lys Phe Val Pro Pro Ser Pro Pro Leu Ala Leu Gly Pro Arg
1655 1660 1665
Met Gln Leu Cys Thr Gln Leu Ala Arg Phe Phe Pro Ile Thr Pro
1670 1675 1680
Pro Val Trp His Ile Leu Gly Pro Gln Arg His Thr Pro Cys Gln
1685 1690 1695
Lys Lys Val Pro Ser Ala Ser Pro Trp Gly Leu Arg Pro Ser Pro
1700 1705 1710
Cys Leu Ser Trp Ser Ser Arg Ile Val Ala Pro Gly His Ala Leu
1715 1720 1725
Ser Cys Arg Thr Arg Arg Arg Trp Ser Ser Lys Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1123
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 1A
<400> 1123
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaacc gagatccagc tgaccatgaa cgacagcaag 120
cacaagctgg aaagccccgc tctgaaacag gtgtcaccag cctctccacc tactcagcag 180
cctcagacac ctcaggattc tagacaggtg ctggccctgg ccaagaaaac cctgacaaat 240
gcctccagag ccggacagtt tcctgtgtgg cggagaacaa gcagaggcat gagcctgcag 300
tggaagtccg gcaatgcctg cacacctctg agatgcccta gcagaagccc tgccacattc 360
ctgacagccc tgaatggctg gcacagatct ggcctgagag cccagatgcc tagctcttgg 420
tctagcagcg gcagaacact gaagctggcc cctctgcaag tgaccaccac tctgaagctg 480
atcctggtca tgctggaaat cgtgaccgag cgctccctgc tgtactccag aatgtgtctg 540
gtgcagatcc ccacacacac ctgggagccc gattacttcg tgtccctgcc tatgatgttc 600
agctgggcca cacagtcttt tcccgtgggc gccgtgtttc tgaccagacc tgccattcct 660
tgctgcagct gtaccagcca cagcaaccct tggagccaga gcaatcagca gctgaagtgg 720
acccctcaca tcctgaagtc cgccagcttc gacaagaaag gcttcgtgat cctgagccgg 780
cggagcaaga ttgaggcctc tcctatcggc tctatcgcca gctctcctgg acatcctctg 840
ggacctacac tggccatcag attcatcagc gcccctcagc ctagcagctc tacagtgaca 900
gctgccccta gcggccagta ctttatcgcc aagaagcgga tcaagctgcg gcggaacaat 960
atgggcggca acagatccat ctgcctgacc agaaagcgca agagagagaa gcggagccag 1020
aagtccaggc agaaccatct gcagctgaaa agctgcagac ggaagatcag caactggtcc 1080
aagctgagaa gcccctggat cttcaccaag tgcgagatct gcgtgaagaa caccgccatc 1140
ctggctatca ccctgatcac ccctcaggac cctcatctgg accctgtgtg tcaccctcat 1200
agaaggcctg gatggaaggg ccaccataga gtggtgttct ctcaccatcc tagcggcagc 1260
acaaagagcc actggcagca aagagaacgc ggaggcggca gacgcgagaa gaagggatgt 1320
agagaacagc ggaaggtggt caagaacccc tctcagcccg tgcctctgag aaacgatggc 1380
atcaccaacg gcaacgactc caccagaagc tgctccatca gcctgaagaa aagcctggaa 1440
aagatgcccc tgatgcggag agccagacct accagctgta gcacctgtag aatgtggtgg 1500
aagggcaaga aacggcggaa agaaatcgtg cctatgagcc tggcctgcag catcaccgtg 1560
tcttttgtgg gacagatcag caccctggtg ctggatgtgt ctagcatcag ccattggcgg 1620
ctgccctgta aagtgaccga gagcagctcc agcttcttct acaccagcga caggacccct 1680
ctgagcatca gcagaccaac cagcagagct agacagagct gttgtctgcc cggactgaca 1740
caccctgctc accaacctct gggcagcatg agcactagaa gagagatgcc aagccaggcc 1800
acaccttctc cacctggacc ttggagagcc gctctgggca aagaagtgaa gagatcccag 1860
agcaagctgc gcctgagaaa cacaagccct ggggagaaga acgatctcca gctgttcgtg 1920
atgagcgaca ccacctacaa gatctactgg acagtgatcc tgctgaaccc ctgcggcaac 1980
ctgcacctga aaacaacatc actgcagcgg ccacctcgga gcatcctgtc tctgaatgga 2040
atctgggaag tgatgccccg gacactggaa ggctgcatca gcgtgaagga tcacagaacc 2100
agccagaacc acagcaagtg catcaccgaa tgtgtgcgga ctgccctgaa cgtgtccaag 2160
aagagactgc ctaagctgat gaagaagaag gacagcacca tcttcatcaa caaagtgcgc 2220
cagaacttca agcgcaactt caagaagaag aaacccctca ctttcagccc cagcagacgg 2280
atgactcgga gaaccatgac aaccaccaaa atgatgatga tgcggcggac caagcggaga 2340
aggcgcaaaa ggcggagaat gaccatgatg accagacgga ccctgctgac aaagaaaacc 2400
tgtctgaccc ctagaaccag cgccgccaca aaagctctgc ctagacagac catcagccag 2460
cggaggccta ttcagacccc acctggaaca tctctggcca tctggggcag aacaagactg 2520
accctgacag gcaccagatc cagcggaaca agagcctctc cttccgccgt gtgcctgtgt 2580
tgttggacct gtccaagcag aagcttccca gccgcttctc ctagtggact gagagcacct 2640
gttggagccc aggctcctcc tgaagtgaca ctgagagcct cttgtgcctc tagcgcctct 2700
aaagcctgtg ctggactttg gccttgggga gcccaagttc gagttggagc tggaacaggc 2760
ggaggacctg cttgtgttcc tgtggctgaa gcttctacag gcgcatggac agctgaaggc 2820
gccgctggaa caagatgtag agcctctaga gccccttgcc gccaacttcc tgctagctcc 2880
cctaccaagt gtgaaatttg tgtgaagcgc agacggcgga gaaagagaag cagccagtct 2940
agaagccccg tgcctaaaaa gcgcgagagg atgatgctgc ctgtgcgggc cagaacagct 3000
agatctgcac ttcctcaggg cagagcacct ctggaaggga tgctgcttcc tagagcactg 3060
cctagcctgc tgagcagaat gcctgccaga agagagtccc ggttttggct ggctctgcag 3120
gcacttggac tcagacctcc acatctgcct agctgtcatc ctctgcctca actgttgggc 3180
cctccacctc ctcatcaggc cccaatgaca ctgaaggccc tggttaagac ctggacacag 3240
ttccgcaact accccagagc cgacaagaag aatgtccggt ctaccgcctt cttcctgctg 3300
gacatcatcc tgggcgattg cccaagaaca atggccggac cttctgcctc tctgcatcct 3360
gcatctggca gagcctccag aaagacctgg cagagaaggc tgagagcttg tagagcaggc 3420
ggacctgctg gatgggctag acaggcctat cctagactga aaaccttcgg cgtgcccctg 3480
ggctctattc tgtgtctggc cggcagcctg tccacaatga tgatcattag caccaccaga 3540
caagagtgcg gcaggcgggc ttctgtgcct tgtagaccta tgatcggaag cgccagacca 3600
ggaccttggc ggacatctgc tatgcctagt gccatgggag tcgccctgcc tacctcttgt 3660
gaaagcggaa gatctcctcc tgccaccggc ggaagaatgc caggatctca gtctatcatg 3720
atgagctgga tgcctccact ggctccatgt gccgcttgtc catgttctcc cgctcctaca 3780
ctgtgcccag cacatcctgc tagagcacca acagccgtgc ctgcctttac acctctgtct 3840
gctcatcctg tgccagtgct gtctggatgt cacctggccg tcagaacctc catgctgaca 3900
ctgctgccca tggaagccaa aaagagcatg aagcggtcca acgctaagaa aatggaagat 3960
atgatctggg agagccggct gccactgagg ccacaaagag gacctagacc tctgcacaga 4020
tggctgcagc agacaaccgg ctgtagccag aggcggatcg tgttctttct ggccccatac 4080
ttccctcggc accctcacag atctccacca acatcttgcc cacctctgct ggaagctttc 4140
ccactgccaa gagcttctct gagggccaca gtgccaagac atagctctgt tctcgccacc 4200
ggtctgcacc tccacagaca gatttctctg cccctgagag gattcctcct gcaccaacca 4260
ctgccaggac agcatctgtg gctgtctcac agactgaggc tgagactgcc caggacacag 4320
ccatctttgc ctggaccatg tgcaagcctg ctgtccacac tgtctcagcc accacctcag 4380
gctccatctc aagtgtggac tgccgctaca ctgagatgtc ctgctgttcc tgcagctgcc 4440
tgtcctcctg ctctgagatc catgcctaag agccggaacc aggtgctgtt cagacggaat 4500
ctgaccccaa gccagctgag aacactggcc ccaccttata tgctgctgcc ccagtctctg 4560
tcccagagcc tgagtagaaa gcagatccct agccagtcca tgctcgtggg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1124
<211> 4623
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 2A
<400> 1124
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaaga aagatgcaga gcctgaatca ccccagcaga 120
ctgaccaatg gctctcctcc actgcacctg tgccagcctc tgagaatgag cagaacccct 180
cctagaagag tgtgcgccgc tcctccacat agactgctgg gcccttccag atggaaccct 240
cggagaaaga cctggaagat gcggaagaag tacgcccaga agcctagcca gaagaaccac 300
ctgtacggcg gcaagaagcg ctctaagttc agcagaagcc acctggactt cagcccctac 360
tggatgaaga aagtgaaggt gctgttcaag gccgaccaga gcgagtctag cctgagcagc 420
ggaagatgca gcctgatgga acagatccct cacctgaagt ctcggcggaa gtggcagatc 480
agacacgtgc tgaagaacct gtggctgccc atgagaagcc tgggagaacc ttggagagcc 540
ggctttcagt ggggagagtc tccttggcaa gtgatggcct ctctgaccgg cagagccaca 600
tttctgctgg ccctttggga atgtagcctg cctcaggcaa gactgtgcct gatcgtgtct 660
agaaccctgc tgctggtgca gagccggaac aagaaaacaa agctgtggtt cagcctgatc 720
aacatccacc accggaagaa cccactgctg cctatgagat ggtggtgtac cagaggcggc 780
ggaaagcgga aaaagaaaat gtgcaaggtg tccggcggct gcaccgcctg tgttgagaga 840
tgtccttgga agggcatctg ctggaagtgg cctgtgacag tggccgccat tagaatgtgt 900
gccctgtctc accctagctt ctacatcagc agcaccgtgt gctttctgag caagcactgc 960
atgaccgcct gcaccagaaa gagaatgaag accggcgcca tccaagagaa gggcgctatt 1020
caagagaaag gggccatgac caagcggatc tgcgtggtca atttcgaggc ctgcagagag 1080
atggaaagcc tgagcgcccc tgagaagatc accctgtttg aagcccacat ggcccggtgc 1140
acctccatca atgtgctgtg tgtgcgggcc agcctgattg agaagctgat gaaagaaaag 1200
cgcaagatga agcggaacca ggtggcctct ccacagatca tgcagcggct gttcatcaag 1260
ggctaccaga acaaccactt caccttccat ctgcaaaact tcgccttctt cagctccttc 1320
ggcaacaaca agtacatcaa tatcctgacc atcctgttcc acgtgcggaa catcgtgtac 1380
ggcatccaag tgatgctgtg cgctagccct cagattatgc agagaaccag cgccgaccgg 1440
ttccggatga agagaagaat gcagaatctg gacaacctgg gcgtgccatg gcctctgttg 1500
cctggaatcc catctctgaa cgcccagtgg atgttcctga gaatcgcatc cccgcaaatc 1560
atgcagagga tgagcgccgt gaacttcgag acaatccggg ccagaaaccg gaacatgaag 1620
aaaaccatga gccacctgat cgcccatcag gccctgaaga tgagcggcct gagactgttt 1680
caccccagac tgctgacacg gaagaagccc ggaaaactgc tgctcgccca tatgtacggc 1740
ttcagcacct acggcaccca gaaaggcgag tgcgtttgtc tgcagtgtct gagcggcagc 1800
agcctgttca ttctgaagca gcccctggac ctgaagatca gcaagacctt catgggccac 1860
agagagggca gcgagtctga taatctgggc ctgctgtata gcttccctcc accttatcct 1920
atcagcgagg gcctgaccat gaccaccggc agaaacatca acagcaactc cctgatgacc 1980
aactgcctgt tcagccccat cttcctgtgc caccacgcca tcatgcacag aaagatgaca 2040
agccctcact tcaggctgtt cagcagcaag atcccacatc ctcaggtgcc atctgtggtg 2100
gccctgtgca agttccgggc cttcatccac acacctagaa gccctggctg cagcgtgtac 2160
gccaatatgt gctggcccaa gttcttcctg accttcagcc agcagtggtc cagcgtgaca 2220
tctctggaat ggacagccca agagagaggc tgcagcagct ggctgatgaa gcagacatgg 2280
atgaagtctt ggagcctgcg ggaccccagc tacagatcca tcctggaata cgtgtccacc 2340
agagtgctgt ggatgcctac ctctaccgtg ctgcaggctc atccacaagt tccagctctg 2400
gctcctcaag cctggtggcc tgctagaaga ggacctctga catctgcccc atccgctcag 2460
cagtccctga ccagagagaa gattatcaac cccaccatca gctgcccctt tcagagcccc 2520
accaagagac tgatctaccc tcctagcacc tgttctctgc cctgcagagg cttcctgcct 2580
agcagatttc cttggggccc acctcctctg aacagcgtga tcgtgcacaa gatcgtgctg 2640
gtgttcctga agtccctgtc cagctacaac tgcgagcgga gaatcagcgg catccagaag 2700
agagccatcg agttcgccgt gctgaaactg ctgaatatgg acctgcctct cgagaacaca 2760
cagatcccca gaacaagccc actgtggaag atcacaatgg tgctgacata ccccaactgc 2820
gtggtgcatg tgctgatgtt tggcgccctg agagccacag ctcctgctac agctgcacct 2880
caggctcaga cccctcattg gagagctgcc acaacaagca gcatgagcag cagccctaga 2940
gccgagccta catcttctag ctcttgggcc acctgttggc ccagatgctg ctccagctct 3000
tgttactggt cactgtctag ctggcctcca gctggcgccg ctgaagctac aaataccaga 3060
accagaagcc gcgagagcca gaggggtaga atgctgactt ggagaagctc cctgtggttg 3120
cagggcacca gatgttttac aggcgtgcgg accagctcca gatacaagaa aagaggcgtg 3180
atcgcctggc ggagacagat caatagacgg aagctgcaga gaaagaagca ctggaacagc 3240
gcctacctgg gcagaacact gctggtcacc tgtatcctgt atcaccggtg gatcgtgacc 3300
tccatgtgtc agtcccagag atggctgacc agcaccacaa gtagatctag cgccctgatg 3360
tggaccgagc tgagcctgga accatggatt ccctacctgc atcagcagaa aacccagcgg 3420
acactggaat ccgccggact gtttccttgg ctgcacaccc agtgccaaga gaagaaaagc 3480
agaaagctga tgtccagctg cacacacccc tgcacaatgc tgctgccaca gggatgtcat 3540
cctgcctggc tgagccctat ctctgcctgt ccaagactgc tgccatatcc ttttcacgtg 3600
ctggctctgg aagtgacctt tcctcctgga accgccatgc ctcagatgca gttgcaggct 3660
ctggctatgt gggagaaagg ctgggataag cctggcacca gcctgcagtg ctacctgaac 3720
agaagaagaa acagccggaa gcagagccag gtgcaactgg ccattcaggt gctgctcgtg 3780
gacaagcaca agtactttct gttcggccaa aagaaaggcc acatgatctt tagcctggcc 3840
aacggcctgt ggtttaacct gattttcaac tcccggaaga aactgctcga ggacatgaag 3900
caaaatggct tcaccggcaa aggcctgaca caccccgtgc ctctgaagcg gactctgcag 3960
aacaaaagaa acaagaatat caaacgcgtc aaccagaaga agggcaacat caagcggaag 4020
tccatcctgc tgcacctgat tgtgctgaat agccccgaga gcaacctgat cctgatccag 4080
catggcggca tcttcacctt tcggttctgg gtcgagaagc tgtcctggaa catctgcaag 4140
aacctgagcc tgtacctgga caagttcgtg cagagactgc tgtacgtgta catcatcgag 4200
acaaacgtgt tcgtgctgaa cctgtttcat gtgcccgtga accagatctt catgatggcc 4260
ttctacctga agtacaccga gaaggcctgg gtcatggaac tggaatggct gatccaacag 4320
cagtgctatc agggcagctg cggcagagct tgttcttgtg gaagaggctg tggcacccct 4380
agaggcgatt ggaagagaca tcctcctcgg agagccttct ggaagcctcc tagccagggc 4440
atctctagct gtctgatgac cggctgttgg ctcgagaaga aagctacctg gatgcggcgg 4500
acccgccgga agaagaggga agatcattgc ggactgagac accccagctg gccttggaca 4560
agatgtctga ggatgaggcc tccaagaagc ggctacccct acgatgtccc tgactatgcg 4620
tcc 4623
<210> 1125
<211> 4638
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 3A
<400> 1125
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgagga gctgctgctg cctcttgtca gtctcctcct 120
tctcctcggg aaaccacacc tagctccgac gccaccagac ggacaagacc tattgccgct 180
cagagcaaga aaaccatgac agccgccgga ctgaccccta tgatccggaa gatccagaag 240
cggcggagaa ccgccaaccg gtgtctgaga gttagatgtg gcggctggct gtgtggctgg 300
acacctagag gacagaacac cagaagcacc aacctggaaa agaaccccag cctgaagaag 360
cagagccagc ggagaggaaa gctgagcagc ctgttcttca gccactgcct gtgccggaac 420
agcagaaggg ccacacctac atctaagggc agcctgcggc ggaagtacct gagagtgcct 480
attcctccac acctgagaca ccctctgctg ctgatggacc tggacggaat gctgaccgtg 540
atcggacagg gactcgtggg catgacccct agagatctgg gaacagtggc tggcgccacc 600
gctcagattc agaggcctat tcaggtgcag accggcggca gacttacacc tcctcctctg 660
attctgtggc ctcaggccgc tcctgttgat cctcctggct ctgtgtggat tctgccctgc 720
aagaacaaga agcggagaaa gctgcggccc aagcggctgg actttcaccc tagatcttct 780
agcggcgtgt ccgtgatcac catgaagctg tgggagaagc acttcaaggg cctgaactgg 840
aacctggtcg tctggattct gaacctgaag atgatgaaca tcgagatcac ccctcagcgg 900
agcaaggcca gaaagtccgg cgtgatgaag tgctgggatc tgtgccccag cgagaagaag 960
aggaagctgc ctctgcctct gaccttcagc accctgctgt gggactctag acatagaggc 1020
gccagctcca gcaccagcag agactccaga agctttttca ccagcgctca ccccagcaga 1080
ccctgcagaa tgagactgta ccagttcctg atccacctga gaaaggtgga cacccaccat 1140
ctgcaggtcg tgaccaagac cgtgacagcc acaacagctg acggccagag aatgcggaga 1200
ctgaagtgca aggcctgccg gctgagatgg gctagacctg aacctgctgc tcaggcccct 1260
ccaaagagcc actttccacc tcatcctagc ggccctagca gaaccagttc tctgcagctg 1320
cggagcatcc ctcacgtgcc aaaagccaca gccgctcaca gcgtgacagt gaagctgcag 1380
aagggaaaga acagcccctg ctgccaaaag aaactgcggg tgcagaatca gggccatctg 1440
ctgatgatcc tgctgcacaa tacctacatg gaaatgcact acggccatca ggccccacag 1500
gtggccatgc tgcctaagct gctgtgcaga cagatgctgc ccactctgag cacactgcag 1560
caaagacacc cacagggccc ttgtcctcca cctgtgacac cactgagagt ccagtctgtc 1620
ctgctgctgg gagtgcctca gacagctgct agacagccta gcagacccac cggcagaacc 1680
cctaccacaa gactgatggc ccctgtcggc agcgtgatga gctgttctct gctgacccag 1740
ccttctccag ccagcgcctg tacaatgcct ccactgctgc atcctcagtg ggccccacat 1800
tctgctggat tgtctcccgg cgcttgcaga cctgcctgta cctgtatcag catgaccacc 1860
atctccagag ccacctggca ggtttccgtg tacagcggca atctgctgag cttctccaga 1920
cggggcatga agagtagcgt gcggctgaaa aacagccggc ggaacagacg gtacagaaag 1980
atctacggcg agctgaagat gtccctgcag gccgtggctc ctagatgtcc tagatctgcc 2040
gtggacatca gccccggacc tacctctcct agcctggcct cttgtgcctc tgtggccatt 2100
ggaaaactgg ccctgcttgg cgcttctgcc ccttgtggtg ctgctggcgc tagagaggct 2160
ggaagatttg ccgtgctggg caccatggtc atgaagcacc tgaaccgcaa gctgcatctg 2220
acccggtcct gcctgatcga tctgaccatg atgatgagcc agaagctctg gaagaaccag 2280
cggaagagaa tccctctgcc atctcctaga cagcatctgc tccctcagta ccctctgcac 2340
cctcctccac cttgtctgct gctgctccac cacagacacc acctggcctt tctggaaatg 2400
gcctgcagca gccagcacac ccactccatc aagatctgga tcagctttag ccacgagcag 2460
agcagcccat tcctggccag atcctggaac accatgcagt ggaacaacaa gaaaatggcc 2520
atgacagtga tcgctggcgc ccaccactgt cagtacaagc tgacctacac caaagtgtgg 2580
aagatgaatt ggaagaaaat gatgatcggc tcccagcacc tcctgttcag ccctctggat 2640
agctctccac tgcaactgct gcttcaccct cacggcaaga gatgcaaccc ttgctgcaga 2700
ctgacatgga tgtccatgct gcagaaacag tgctgctaca acctcgtgat caagcaccca 2760
ctgatcttca gaatcaacct gcggagacag ggcaagacca aggatggcgt tgtgcagagc 2820
ctgggcttcc tgaaccagca gatcatcctg cagaaagagt tcttcatctg cctgctcatg 2880
tttatcaagc ggtggaagcc tgccgccacc aagagagagt gggagaaacg caagcagatc 2940
ctcggcggag gcggcaagta caaagagtac ttcctgaagc gcatcctgat tcggaaggcc 3000
atgactgtgc tggccggcga caagaaaggc ctgggcagat tcatgagatg cgtgcagagc 3060
gagacaaagg ccgttagcct gcagctccca ctcggaagag gccctgtgta ctacgtgtgc 3120
aaccggatga acgtgtccag cgtgctgaag cccttcctgt tcaccgtgcc tatcgaggac 3180
atgagagagt gcacactggg ccgcaacaga atgaatgtgt cctctgtgct gaaaccctgt 3240
ctgatccctg tgccaatcga cctgcctcgg atgctgccaa tcagcagccc actgcacaga 3300
ccccagatgc cattctggac ctgcaccttt cctgccacaa catggggcac ctgggagaca 3360
ccttctacat ggggctggcg gacctttcgg ggccctagaa gaaaagtgct gatggtgctg 3420
tggctgcccg ccaaccagag tctgcagaaa agccaagtgt tccagtgggt cctgcggacc 3480
gagaacatcc ggaagctgat ctggaccaag cagcggagct tcctgtctct gttccccaag 3540
ctgagagcca ccgaacagat gaccaatgtg ggctgcgcct tcagcggccg gattctgcat 3600
caacctgaaa tggccgccat gcggctgatg cccaagttcc tgaatagcac caacagctgg 3660
tggacctgta ccaacctgag cgtgcccatg atgctgacca ttctgatttg gaagcgggtg 3720
ttcattctcc tgctgtccga caagaagctg ctgaagaagt ctagccagct gaggcggtct 3780
tggagaaacg tgtcccggat cagccaccag atgaagtgtc tgaccgccgt ggactgtctg 3840
caggccttct gggacatgaa catggaacac cggctgacca tggacagcgc cctgagcctg 3900
acaaagagag agggacccga gacttgcaag aagaagctcc tgctgaaact gctgacaatg 3960
agcctgagca acatcctgat gaagttccgg ctgcggctga gaatcccaag cctgaggaag 4020
tatcgccagc atctgaaaaa gaccagcgcc aagggcgaga agctgaagca ctgctttaag 4080
gcttggggca gaggcccacc tctgcacaca agaagccaga agaaagaccc tgccggcaag 4140
ctgaaaaaac tgaccacact gagcttcgtg ctgatcgagg aacggcggaa cctgcagcgg 4200
aatctgaaag tcctgtggct caagaaaagc accaagagcc ggtatctgtt cttcctgacc 4260
gtgtgcggct tcttcgagaa gaaacggcct gagtggctgt cctccagaaa gaagggacac 4320
acaaagaatc ggaggaaggc caagcggaag ccccagatcg tgcacaagaa gagaggcctg 4380
ttcctcaaaa agaaatacct ggtgcagggc gccaagaaga tcaccttcct gtccaacggc 4440
atggaagctt gcggcacaca ccccacacca agactgagcg acagagtgtt cctggtcaag 4500
atcaccacca ccacaagcag ccccagaaga agcccagcac tgagagctag aggcggcacc 4560
acaattggcg aagtgaccag cctgtgcttc ttctacctgc tgtacggcta cccctacgat 4620
gtccctgact atgcgtcc 4638
<210> 1126
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 4A
<400> 1126
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaatc cagaagaaga aacagaaatc catggccaag 120
aagtcccagc agcctctggt gctgaagaag aaccggaagc aagagtgggg aggacaggcc 180
cacagacaga gaaacaacgc caagaagatg cccttccaag aggaaaagaa gaacggccgg 240
atcagcagca gcctgatcct gagcttccag agagtgaagg acagcaagaa aatgacccag 300
aagatgtgca gctctctggc cctgcctaca ggcctgacat ctctgatcct gcctagcagc 360
gatctggccg tgctgatctc tagcagcacc agccactttc tgatgcggag ccctgtgctg 420
ccaagctcca gactgacatg tgcctctcca cagctgcccc ggatgtggac atggtctagc 480
tggctgaagc accccagaac cgctagcatc acactgccta ccacaagcct gaagggcagc 540
agaaccagct gctgcccaag atctcacccc agactgccta ggaccaagtg gcctctgcag 600
tgtctgctgc acagcctggg aacaacaggc acactcgttt gggaaagggg cgtgctgcag 660
atgagaagcc tcgaagccca ttgtcctctg cagaccttcc atctgcacca ctgcagaacc 720
cagccaagct cttgtcctcc tgcctggatt ctgtaccaag gccagtggag cggagccgtc 780
gttggactta gacccgtggc tcaccatctg cctagaccta tccagggcct gcactgtcct 840
caggctcctc atcaacctgc tctgagctgg ggaaagtggc ccgtgggaat gacaggacct 900
gccagatgct gtcggtggcc ccgcagatct cagaagtctc agcatcactg cgccctgcgg 960
aagatcgagt gggccacaaa actgtctctc ggcggaaaag ccggaccaca ggctcaagag 1020
aaggccagac cttctccttg cctgtcctgg tccagcagaa ttgtggcccc tggacacgcc 1080
ctgagctgtc ggactcgtag aagatggtcc tccaagtgca gaggcggccc tagcgccagc 1140
gatagatgtt gtagctgtag ccccagcggc ttcagcgccg gaagaggcag atgtcctgtg 1200
cagggatgtc tgaggccaca cagagttcag ctgctgagaa gatggggccc aggatctcct 1260
gctggccaga gactgtctaa gggcttccaa ctgctgcgtt ggtggggacc tggatctcca 1320
gctcctgagc ctagaaaggg cccatttcct ccacctgatc ctccatggcc tgtgaccgct 1380
gtgacagtga tggctggctc tgtgcctagc gcacagtctg tggatgccct ggaatctcct 1440
ggacctctgg ctctggaagg ccctagcagc cctagaaacc tgctgtggcg ggaaatgagc 1500
atctttctgc ccggcatctt ctgccaaaag aaggtgccat ctgccagccc ctggggactt 1560
gttcctcctt ctccaccact cgctctgggc cctagaatgc agctgtgtac ccagctcgcc 1620
agattcttcc ccatcacacc tccagtgtgg cacatcctgg gacctcagag acacacacct 1680
caggtggtcc tgagactggg caacctgcct ccattcttca gaggcagcga ggtgcccttt 1740
cctagacctt gccggaccaa gaacgagggc aacaatcact ggcccagagt ggaaatgcct 1800
accggctggc tgctcgtggg ctacaacacc agaaacacag cccagaatcc tcggctgcag 1860
cagcatctga aacactggca gcagtgcaca cgggccagat ggtgtcaaga gccttgtcag 1920
accctgacct tcttccactt cttcttcttt ttcaaaacgg tgtccctgtg ttgtcccggc 1980
tggtccaaag gacaacctcc acctcctggc ctgaagcctt ctagcctggc ttctcaggtg 2040
gccagaacca caggcgtgta ccagcacgtg tggctgatct gcttcgtgtt cttcgtgtgc 2100
gtggaaaccg gcttctgtca cgtggcacaa gtgggcctcg agagactggt ttctctgagc 2160
ggcatcaccg acgtgaacca ttgggcccag cctaagccat ctcctagcaa aggcaccggc 2220
atgaacagac ccatcggcct gagagttggc aaaggcgtgt gggccagact gctcaagaag 2280
aagcctagag acatctgtcg gatctccaac agaaagaccc ggaaggccgc cagagagaag 2340
caccgcaaaa cagatagagc cagcgtgtcc ttctggactc tgctgcctac aacaggcgtg 2400
cggacaagag gaagccctct gagactgact ctgtggcctc ctagatgcag atgcagacgc 2460
gagtacagag tgaccatgaa catcctgaac agcctgccaa gcagcatgga aatcgccgtg 2520
ctgcaagaaa ccgccaagaa aagccctacc agcttctgct gcaacctgga cctgcagcat 2580
cagcgcagac gcaaaaagaa gaaagacaag gtcgagatcc ggaatcggag ccccaaggcc 2640
aatagcacag agtgtcaggg cgagcacagc agagagcaga atctgctgaa tctggtgcag 2700
ctgaatcctc acagccctca ccaccggaag gacgaagagg accaccagaa gagacaccac 2760
caccacaatc aaaagaagat gagcgtccca ctgttcttcc acggcgacct gtgtagagag 2820
agcaccctgg gcaatttctg gatgaagctg ctccagctgc ctcagaggcc tccactgcaa 2880
ccagtgaccg gaatggaaat cctgctttgg attctgctga agatggaaat tcagatcttc 2940
aagatttgcc tgggcgagat gcagctctgc acctctcgga ttctgaacct gcaagtgctg 3000
aaaaagatcc tgcggagctt tatgaagctg taccacagcc tcgtgatgtg cctgcggctg 3060
aggaccaagc tggaaaaggc tctgagcgcc ctgttcatct ggcctcagca ctcctacaag 3120
atcacacacc cattcgccag ccagccactg ggacaagaga tgcccaacaa cacccagatc 3180
cggctgctga agcccgacaa gaagaagaaa agcaccgaaa agaccaaagg ccaggctttc 3240
ggcagcttct ccgccgattt ttcagcccct caaggacagg cttttggctc cctgtgtcag 3300
ctggtgtccg ccgactttag cgccccacaa gtgaccagac tgcggagcct gaaccatctg 3360
ctgatttggc tgaagaattg gaagcggttc aagctcaaaa agaaatatca ggcccctctg 3420
cggctgtggt cttggtgcgg aacaagccag acctacttcg gcagcatcat ctgtatcaag 3480
aatatgttcc tgcagcggaa gggtttcctg aacctgagcc acgtggaaaa gttcgagctt 3540
aagaagaatc ttctgctccc cgtcgtgatc aacctgaaga gactgcagaa attcatgctg 3600
aaccagaagt gcctggctcc atttcctgcc tgcaccagca aagcctggac acccagaaaa 3660
ctcgtgggca gagccgtgcg gagaaagggc attctggcca tgacactgac cctgaacgga 3720
atcgaggccc tgacagccct gtttacctgt agaaccgcct ccatcagcgt gaacatcagc 3780
accctgatga gcatcctgga agccatcatc aagaagatga agaaacggat catggtgcac 3840
cggtggatct tctccaatca gctgaccgtg cagatgctct gcctgcctct gctgacccct 3900
gacaccagat ggatctttag taatcagctg cagacagtgc aaatgctgtg tctgccacct 3960
ctgaagcagg gcgagagaat catttggcca ctcggcggct ttcagatccc caatttcttc 4020
tggtccctcg gcatcggaca cactggcgca tggtggcata ctggtagaag gcggagagag 4080
tggggcggct ctaccgtgtc tagaagccca ctgtggatca gctccatgat ctacctgaga 4140
ggcatggcct tcgccagcga cagctccatc agaaccacca gagtgtcctg gtgtcggaga 4200
tgtggcgcca agtctgccgc agcctcttct tctccactgt gggattgcag caccacaacc 4260
ggcacacacc acggatgcct gtgggagatc cctagcgtta ccctgctggc taacctgcac 4320
ctgtgctact accactctca gagcaacaga aacaagagcc gccagatgga atccctgggc 4380
atgaagctcc aacttaaaaa gaaagtgaac gcctgcagca cctacacacc ccacatctgc 4440
agacacacct gtcgcgtgaa cgccgtcgag gaactgcact ctagaaggat gtccgtgcgg 4500
atcgtgaaaa attgggtgtc ctgctgctac gtgcggctgt cagctgtggg actgtctact 4560
tggagcgctc tggacaacaa gatcatctgc aagggccaca gaatcaccgg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1127
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 1B
<400> 1127
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaacc gagatccaat tgaccatgaa cgacagcaag 120
cacaagctgg aaagccccgc tctgaaacag gtgtcaccag cctctccacc tactcagcag 180
cctcagacac ctcaggatag cagacaggtg ctggccatgc ctagcagctg gtctagctct 240
ggcagaaccc agcggaaggt ggtcaagaat cctagccagc ctgtgcctct gagaaacgac 300
ggcatcacca acggcaacga ctccaccaga agctgcagca tcagcctgaa gaaaagcctg 360
gaaaagatgc ccctcatgat gaagaagaag gacagcacca tcttcatcgt gcccatgagc 420
ctggcctgta gcatcaccgt gtctttcgtg ggccagatca gcacactggt gctggatgtg 480
tccagcatct cccactggaa caaagtgcgg cagaacttca agcggaacgc cgacaagaag 540
aacgttcgga gcggcgagaa gaacgacctg cagctgtttg tgatgagcga caccacctac 600
aagatctact ggaccgtgat cctgctgaac ccctgcggca atctgcacct gaaaaccacc 660
agcctgggcg actgtcctag aacaatggcc ggaccttctg cctctctgca ccctgcatct 720
ggcagagcct ctagaaagac ctggcagaga aggctgagag cctgtagagc tggtggacct 780
gctggatggg ccagacaggc cttcgataag aaaggctttg tgatcctgag cgtcggagcc 840
ggaacaggcg gaggacctgc ttgtgttcct gtggctgaag cttctacagg cgcttggaca 900
gctgaaggcg ccgctggaac aagatgtaga gcttctagag ccccttgcag acagctgcct 960
gccagctctc ctaccaagtg cgagatctgc gtgaagcgca gacggcggag aaagagaagc 1020
agccagtcta gaagccccgt gcctaagaaa cgcgagagaa tgatgctgcc cgtgcgggcc 1080
agaacagcta gatctgcact tcctcagggg agagcccctc ttgagggaat gctgcttcct 1140
agagcactgc ccagcctgct gtctagaatg ccagccagaa gagagagccg gttttggctg 1200
gctctgcagg cacttggact cagacctcca catctgccta gctgtcatcc tctgcctcaa 1260
ctgcttggcc ctccacctcc tcatcaggcc cctacagctt tcttcctgct ggacatcatt 1320
ctgcggctgc cctgcaaagt gaccgagtct agcaatatgg gcggcaacag atccatctgc 1380
ctgaccaacg ccaagaaaat ggaagatatg atctgggaga gcacgcccct gagcatcagc 1440
agacctacat ctagagccag gcagagctgt tgtctgcccg gactgacaca tcctgctcac 1500
cagccactgg gatctatgac cctggccatc agattcatca gcgctcctca gcctagctcc 1560
agcacagtga cagctgctcc tagcggccag tacttcaagg gcaagaagcg gcggaaagag 1620
atcttcaaga agaagaaacc cctgacattc agccccagcc tggccaaaaa gaccctgacc 1680
aatagcagct tcttctacac cagcgaccgc gaggccaaga aatctatgaa gcggagcatg 1740
accctgaagg ccctggtcaa gacctggaca cagttcagaa actaccccag agcctcctct 1800
cctggacacc ctctgggacc taatggcatc tgggaagtga tgcccagaac actggaaggc 1860
tgcatctccg tgaaggacca cagaacaagc cagaaccaca gcaagtgcat caccgagtgt 1920
gtgcggacag ccctgaacag aagaagcaag atcgaggcct ctcctatcgg ctctatcgcc 1980
ctgagatcca tgcctaagag cagaaaccag gtgctgttca gacggaatct gaccccaagc 2040
cagctgagaa ctctggcccc tccttatatg ctgctgcccc agtctctgag ccagagcctg 2100
agcagaaagc agatccctag ccagtccatg ctggtggcct ctagagcagg acagtttcct 2160
gtgtggcgga gaaccagcag aggaatgagc ctgcagtgga agtccggcaa tgcctgcaca 2220
cctctgagat gccctagcag aagccctgcc acattcctga cagctctgaa cggctggcac 2280
agatctggac tgagagccca gagaaagcgc aagcgcgaga agagaagcca gaagtccagg 2340
cagaaccatc tgcagctgaa gtcctgccgg cgcaagatct ccaactggtc caagctgaga 2400
agcccctgga tcttcgtgtc caagaagaga ctgcccaagc tgaccaagtg tgaaatctgt 2460
gtcaagaaca ccgccatcct ggctatcacc ctgatcaccc ctcaggaccc tcatctggac 2520
cctgtgtgtc accctcatag aaggcctgga tggaagggcc accacagagt ggtgttttct 2580
catcacccta gcggcagcac caagagccac tggcagcaaa gagaacgcgg aggcggcaga 2640
cgggaaaaga agggctgtag agagagatcc ctgctgtact ccagaatgtg cctggtgcag 2700
atccccacac acacctggga gcccgattac ttcgtgtctc tgcccatgat gttcagctgg 2760
gccacacagt cattccccgt gggagccgtg tttctgacca gacctgccat tccttgctgt 2820
agctgcacaa gccacagcaa cccttggagt cagagcagac acccacacag aagcccacct 2880
acctcttgtc ctccgctgct ggaagccttt ccactgccta gagcatccct gagagccacc 2940
gtgccaagac atagctctgt gctggcaacc ggactgcatc tgcacagaca gatttctctg 3000
cccctgagag gattcctgct gcatcaacca ctgccaggcc agcatctgtg gctgtctcat 3060
agactgcggc tgagactgcc aagaactcag cggcctccta gatccatcct gagccttaga 3120
ctgccactga ggccacagag aggacccaga cctctgcata gatggctgca gcagaccaca 3180
ggctgtagcc agagaagata ccccagactg aaaaccttcg gcgtgccact gggctccatt 3240
ctgtgtctgg ctggatctct gagcaccatg atgatcatta gcaccaccag acaagagtgt 3300
ggcaggcggg catctgtgcc ctgtagacct atgatcggaa gcgccagacc aggaccttgg 3360
agaacatctg ctatgcctag cgccatgggc gtcgcactgc ctacaagctg tgaatccgga 3420
agatctcctc ctgccaccgg cggaagaatg cctggaagcc agagcattat gatgagctgg 3480
atgcctcctc tggctccttg tgccgcttgt ccttgttctc ccgctcctac actgtgtccc 3540
gctcatcctg ctagagcacc tacagccgtg cctgccttta cacctctgtc tgcacatcct 3600
gtgcctgtgc tgtctggatg tcacctggcc gtcagaacct ccatgctgac actgctgcct 3660
atgctgaagc tggccccact gcaagtgacc accacactga agctgatcct ggtcatgctg 3720
gaaatcgtga ccgagagcac tcggagagag atgccttctc aggccacacc ttctccacct 3780
ggaccttggc gagccgctct gggcaaagaa gtgaagagat cccagagcaa gctgcgcctg 3840
agaaacacaa gccccatcgt gttctttctg gccccatact tccccagacg gatgaccaga 3900
cggaccatga caaccaccaa aatgatgatg atgcggcgga ccaagcggag aaggcgcaaa 3960
aggcggagaa tgacaatgat gacaaggcgg accctgctga caaagaaaac ctgtctgacc 4020
cctagaacca gcgccgctac caaagctctg ccaaggcaga caatctccca gcggaggcct 4080
attcagaccc ctcctggaac atctctggcc atctggggca accagcagct gaaatggacc 4140
cctcacatcc tgaagtccgc cagcagaagg gccagaccta ccagctgtag cacctgtaga 4200
atgtggtgga tcgccaaaaa gcggatcaag ctgcggcgga acagaaccag actgacactg 4260
acaggcacaa gaagcagcgg caccagagct tctccatccg ccgtttgcct gtgttgctgg 4320
acctgtcctt ccagaagctt cccagccgct tctccaagcg gattgagagc acctgttgga 4380
gcacaggccc ctccagaagt tacactgaga gctagctgtg cctccagcgc ctctaaggct 4440
tgtgctggac tttggccttg gggagcacaa gttcggcaac catctttgcc tggaccatgc 4500
gcttctctgc tgagcacact gtctcagcca cctccacagg ctccatctca agtgtggaca 4560
gccgcaacac tgagatgtcc tgctgttcca gctgctgcct gtcctcctgg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1128
<211> 4623
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 2B
<400> 1128
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaaga aagatgcaga gcctgaatca ccccagcaga 120
ctgaccaaca tgagcagaac acctccaaga cgcgtgtgca accctcggag aaagacctgg 180
aagatgcgga agaagtacgc ccagaagcct agccagaaga accacctgta caacagccgg 240
aagaaactgc tcgaggacat gaagcagaat ggcttcacag gccacagaga gggcagcgag 300
tctgataatc tgggcctgct gtactccttt cctcctatcc ggatgtgcgc cctgtctcac 360
cctagcttct acatcagcag caccgtgtgc tttctgagca agcactgcat gaccgcctgc 420
acacaaaaga aaggccacat gatcttcagc cgcgagaaga tcatcaaccc caccatcagc 480
tgcccctttc agagccccac aaagcggctg gaactgagcc tggaaccttg gattccctac 540
ctgcaccagc agaaaaccca aggcggcaag aagagaagca agttccctgg caccagcctg 600
cagtgctacc tgaacagatg cagcctgatg gaacagatcc ctcacctgaa gtccgcctct 660
ccacagatca tgcagagaac cagcgccgac cggttccgga tgaagcggag aatgcagaac 720
ctggacaatc tgggcgttcc atggccactg ctgcctggac ctctggaaaa cacacagatc 780
cccagaacaa gccctctgtg gaagatcaca atggtgctga cataccccaa ctgcgtggtg 840
cacgtgctga tgttctggct gcctatgaga tctctgggcg agccttggag agctggcttt 900
cagtggggag agtccccttg gcaagtgatg gctagcctga caggccccta tcctatcagc 960
gagggcctga ccatgaccac cggcagaaac atcaacagca actccctgat gaccaactgc 1020
ctgttcagcc ccatcttcct gtgccaccac gccatcatgc accggaagat gacaagccca 1080
cacttcagac tgttcagcag caagatccca catcctcagg tgccatctgt ggtggccctg 1140
tgcaagttca gagccacatt tctgctcgcc ctgtgggagt gtagtctgcc tcaagccaga 1200
ctgtgcctga tcgtgtctag aaccctgctg ctggttcagt ctgccgctcc tccacataga 1260
ctgctgggcc cttctagatg gtccagaagc cacctggact tcagccccta ctggatgaag 1320
aaagtgaagc tggccaacgg cctgtggttc aacctgatct tcgtgctgtt caaggccgac 1380
cagagcgagt ctagcctgtc tagcggccgg aacaagaaaa caaagctgtg gttctccctc 1440
atcaacatcc accaccgcaa gaatcctctg ctgcccatga gaatccccag cctgaatgcc 1500
cagtggatgt tcctgagaat cctgcttctg gcccatatgt acggcttcag cacctacggc 1560
acccagaaag gcgagtgcgt ttgtctgcag tgtctgagcg gcagcagcct gttcattctg 1620
aagcagcccc tggacctgaa gatctccaag accttcatgc tgcaagctca cccacaggtg 1680
ccagctcttg ctcctcaagc ttggtggcct gctagaagag gccctctgac atctgctcca 1740
tccgctcagc agtctctgac agctagccct cagattatgc agcggatgag cgccgtgaac 1800
ttcgagacaa tcatctaccc tccaagcacc tgtagcctgc cttgtagagg cagaacactg 1860
gaaagcgccg gactgtttcc ttggctgcac acccagtgta cacacccctg taccatgctg 1920
ctgccacaag gctggtggtg tacaagaggc ggcggaaagc ggaaaaagaa aatgtgcaag 1980
gtgtccggcg gctgcaccgc ctgtgttgag agatgtcctt ggaagggcat ctgctggaag 2040
tggccagtga cagtggctgc tcagtggtct agcgtgacct ctctggaatg gacagcccaa 2100
gagagaggct gcagcagctg gctgatgaag caaacatgga tgaagtcttg gtccctgcgg 2160
gaccccagct acagatccat cctggaatac gtgtccacca gagtgctgtg gatgcccaca 2220
agcaccgtgc ggagaagaaa cagcagaaag cagtctcagg tgcagctggc cattcaggtg 2280
ctgctcgtgg acaagcacaa gtactttctg ttcggcagag cccgcaaccg gaacatgaag 2340
aaaaccatga gccacctgat cgcccatcag gccctgaaga tgagcggcct gaggctgttt 2400
catcctcggc tgctgacaag aaagaagccc ggcaagttcc tgcctagcag atttccttgg 2460
ggccctcctc ctctgtgtca tcctgcttgg ctgagcccta tctccgcctg tccaagactg 2520
ctgccatatc cttttcacgt gctggccctg gaagtgacct ttccacctgg aacagccatg 2580
cctcagatgc aactgcaggc cctggccatg tgggagaaag gctgggataa gcggaagaga 2640
atgaagaccg gcgccatcca agagaagggc gctattcaag agaaaggggc catgaccaag 2700
cggatctgcg tggtcaattt cgaggcctgc agagagatgg aaagcctgag cgcccctgag 2760
aagattaccc tgtttgaagc ccatatggcc cggtgcacct ccatcaatgt gctgtgtgtc 2820
agagcctctc tgatcgagaa gctgatgaaa gaaaagcgca agatgaagcg caaccaggtg 2880
gcatccccac aaattatgca gaggctgttc attaagggct accagaacaa ccacttcacc 2940
ttccatctgc aaaacttcgc cttcttcagc agcttcggca acaacaagta catcaatatc 3000
ctgacgcggc gcaagaaaag agaggaccac tgcggactgc tgatcctgat ccagcacggc 3060
ggcatcttca cctttcggtt ctgggtcgaa aagctgagct ggaacatctg caagaacctg 3120
agcctgtacc tggataagtt cgtgcagcgg ctgctgtacg tgtacatcat cgagacaaac 3180
gtgttcgtgc tgaacctgtt ccacgtgcca gtgaaccaga tcttcatgat ggccttctac 3240
ctgaagtaca ccgagaaggc ctgggtcatg gaactggaat ggctgatcca acagcagtgt 3300
taccagcaag agaagaaaag ccggaaactg atgagcagct gccgggcctt catccacaca 3360
cctagaagcc ctggctgcag cgtgtacgcc aatatgtgct gggccttttg gaagcctcct 3420
agccagggca tcagctcttg tctgatgaca ggctgttggg gcagccctcc tctgcacctg 3480
tgtcagcctc tgaggcggta taagaaaagg ggcgtgatcg cctggcggcg gagaaagtgg 3540
cagatccggc atgtgctgaa aaacctgatc ctgtttcatg tgcggaacat cgtgtacggc 3600
atccaagtga tgctgtgcgg caagggactg acacaccctg tgcctctgaa acggaccctg 3660
cagaacaaga ggaacaagaa catcaagcgg gtcaaccaga agaagggcaa catcaagagg 3720
aagtccatcc tgctgcacct cattgtgctg aatagccccg agagcaaccc caagttcttc 3780
ctgaccttta gccagctcga gaagaaagct acctggatga gaagaacagg cgccctgaga 3840
gccacagctc ctgctacagc agctcctcag gctcagactc ctcattggag agccgccaca 3900
acaagcagca tgagcagcag ccctagagcc gagcctacat cttctagctc ttgggccacc 3960
tgttggccca gatgctgtag ctccagctgt tactggtccc tgagttcttg gcctcctgct 4020
ggcgccgctg aggctacaaa caccagaact agaagcagag agtcccagcg gggcagaatg 4080
ctgacttgga gaagtagtct gtggctgcag ggcaccagat gttttacagg cgtgcggaca 4140
agcagcggaa gctgtggcag agcttgtagc tgcggaagag gctgtggaac ccctagaggc 4200
gattggaaga gacaccctcc tcggaggaat agcgtgatcg tgcacaagat cgtgctggtg 4260
tttctgaagt ccctgtccag ctacaactgc gagagaagga tcagcggcat ccagaagaga 4320
gccatcgagt ttgccgtgct gaaactgctg aatatggacc tgcactggaa ctccgcctac 4380
ctgggcagaa ctctgctggt cacctgtatc ctgtatcacc ggtggatcgt gacctccatg 4440
tgccagtctc agagatggct gaccagcacc acaagcagat ccagcgctct gatgtggacc 4500
cggcagatca atcggaggaa gctgcagaga aagaagaggc acccaagctg gccttggacc 4560
agatgcctta gaatgaggcc tcctagaagc ggctacccct acgatgtccc tgactatgcg 4620
tcc 4623
<210> 1129
<211> 4638
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 3B
<400> 1129
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgagga gctgctgctg cctcttgtca gtctcctcct 120
tctcctcggg aaaccacacc tagctccgac gccaccagac ggacaagacc aattgccgct 180
cagagcaaga aaaccatgac agccgccgga ctgaccccta agaacaagaa gcggagaaag 240
ctgcggccca agatgatccg gaagatccag aagagaaggc ggaccgccaa ccggcggaat 300
agcagaaggg ctacccctac aagcaagggc agcctgagaa gaaagtacct gagagtgcgg 360
ggacctcctc tgcacacccg gaacatcaga aagctgatct ggaccaagca gcggagcttc 420
ctgtctctgt tccccaagct gagagccacc gagcagatga ccaatgtggg ctgctctatc 480
cctcacgtgc ccaaagccac agccgctcac tctgtgacag tgaaactgca gctgcccctg 540
accttcagca ccctgctgtg ggatagcaga cacaccatga gcctgagcaa catcctgatg 600
aagttccggc tgcagtctag cccattcctg gccagatcct ggaacaccat gcagtggaac 660
aacaagaaaa tggccatgac cgtgatcgct ggcgcccacc actgtcagta caagctgacc 720
tacaccaaag tgtggaagat gaactggaag aaaatgatga tcggcagcca gcatctgctg 780
ttcagccctc tggatagcag tcccctgcag ctcctgctgc accctcacgg caagagatgc 840
aacccttgct gcagactgac ctggatgagc cagaacacca gaagcaccaa cctggaaaag 900
aaccccagcc tgaagaagca gagccagcgg agaggaaagc tgagcgcctt tagcggcaga 960
atcctgcacc agccagaaat ggccgccatg agactgatgc ccaagttcct gaactccacc 1020
aacagctggt ggaccctgac cacactgagc ttcgtgctga tcgaggaagc cagacagccc 1080
agcagaccta ccggcagaac acctaccacc agactgatgg cccctgtggg cagcgtgatg 1140
agctgttctc tgctgaccca gccttctcca gccagcgcct gtacaatgcc tccactgctg 1200
catccacagt gggcccctca tagtgctgga ctttctccag gcgcttgcag acctgcctgc 1260
acctgtatca gcatgaccac catcagcagg gccacatggg gcccagtgta ctacgtgtgc 1320
aaccggatga acgtgtccag cgtgctgaag cccttcctgt tcaccgtgcc tatcgaggac 1380
atgagagagt gcaccctggg cagaaacaga atgaatgtgt cctctgtgct gaaaccctgt 1440
ctgatccctg tgccaatcag cgagaagaag aggaagctgc ccaacatcga gatcacccct 1500
cagcggtcta aggccatgct gcagaagcag tgctgctaca acctcgtgat caagcaccct 1560
ctgatcttca gaatcaacct gcggcggcag ggcaagacca aagatggcgt tgtgcagagc 1620
ctgggcttcc tcaaccagca gatcatcctg cagaaagagt tcttcatctg cctgctcatg 1680
ttcatcaagc ggtggaagcc tgccgccacc aagagcagaa agaagggcca caccaagaac 1740
agacggaagg ccaagagaaa gccccagatc tacctgttct tcctgaccgt gtgcggcttt 1800
cacctgaaaa agaccagcgc caagtggctg aagaagtcca ccaagtccag atccaacggc 1860
atggaagctt gcggcacaca ccccactcct agactgagct gcctgagagt tagatgcggc 1920
ggctggctgt gtggctggac acctagaggt agaaagtccg gcgtgatgaa gtgctgggat 1980
ctgtgccccg tgcacaagaa gagaggcctg ttcagactgg attttcaccc cagaagcagc 2040
tccggcaagg gaaagaacag cccctgctgc caaaagaaac tgcgggtgca gaaccagggc 2100
catctgctga tgattctgct gcacaatgac cgggtgttcc tcgtgaagat cggcgagaag 2160
ctgaagcact gtttcaaggc ctggggctcc agacggaacc ggcggtacag aaagatctac 2220
ggcgagctga agatgtccct gcaggccttc ctgatccacc tgagaaaggt ggacacccac 2280
cacctccagg tggtcaccaa aacagtgacc gccacaacag ccgacggcca gagaatgcgg 2340
agactgaagt gcaaggcctg ccggctgaga tgggccagac ctgaacctgc tgctcaggcc 2400
cctcctaaga gccactttcc acctcatcct agcggcccca gcagaacaag tagcctgcag 2460
ctgagaagcc tgttctttag ccactgcctg tgcagccaga agaaggaccc tgccggcaag 2520
ctgaaaaagc tgctgaagaa aagcagccag ctgcggagaa gctggcgcaa tgtgtccaga 2580
atcagcaccc ctcctccact gatcctgtgg cctcaagctg ctcctgtgtc cgtgatcacc 2640
atgaagctgt gggagaagca cttcaagggc ctgaattgga acctggtcgt gtggattctg 2700
aacctgaaga tgatgaccta catggaaatg cactacggcc atcaggcccc acaggtggca 2760
atgctgccta agctgctgtg cagacagatg ctgcccactc tgagcacact gcagcagaga 2820
catcctcagg gcccttgtcc tcctcctgtg acacctctga gagtccagtc tgtcctgctg 2880
ctgggagtgc ctcagacagc cagaggacct agaagaaagg tcctgatggt gctgtggctg 2940
cccgccaatc agtctctgca gaaaagccag gttttccagt gggtgctgcg gacagaggtg 3000
gcccctagat gtcctagatc tgccgtggac atcagccccg gacctacatc tcctagcctg 3060
gcctcttgtg cctctgtggc cattggaaag ctggcactgc ttggcgcctc tgctccttgt 3120
ggtgctgctg gcgctagaga ggccggaaga tttgctgtgc tgggcaccat ggtcatgaag 3180
ctttgtttct tctacctgct gtaccggctg cgcatcccaa gcctgaggaa gtacagacag 3240
cacctgaacc ggaagctgca cctgacaaga tcctgcctga tcgatctgac catgatgatg 3300
tcccagaagc tctggaagaa ccagcggaag agaatccctc tgccatctcc acggcaacat 3360
ctgctgccac agtaccctct gcacccacct ccaccttgtc tgctgttgct gcaccataga 3420
caccacctgg cctttctcga gatggcctgt agctctcagc acacccacag catcaagatc 3480
tggatcagct tcagccatga agtggaccct ccaggcagcg tgtggatact gccttgcgat 3540
ctgcctcgga tgctgccaat ctcttcaccc ctgcacagac cccagatgcc tttctggacc 3600
tgcacctttc ctgccacaac ctggggcaca tgggagacac cttctacatg gggctggcgg 3660
actttcagag gcgctagcag cagcacatcc cgggacagca gatccttctt cacctctgct 3720
caccctagca ggccctgcag aatgagactg taccagtgca agaagaagct cctcctgaaa 3780
ctgctgacca ccaccacaag cagccccaga agatcccctg ctctgagagc aagaggcggc 3840
accacaatcg gcgaagtgac cagctgtacc aacctgagcg tgcccatgat gctgaccatc 3900
ctgatttgga agcgggtgtt catcctcctg ctgagcgata agaagggcgc caagaagatc 3960
accttcctgc ctattcctcc acacctgaga caccctctgc tgctgttcga gaagaaacgg 4020
cctgagtggc tgagcatgga cctggacgga atgctgacag tgatcggcca gggactcgtg 4080
ggcatgaccc ctagagatct gggaacagtg gcaggcgcca ccgctcagat tcagcgacct 4140
atccaggtgc agactggcgg cagactcaga agaaacctgc agagaaacct gaaggtgctc 4200
caggtgtccg tgtacagcgg caacctgctg tcctttagca gacggggcat gaagtctagc 4260
gtgcggctga aaaaccgcga gtgggagaaa cggaagcaga ttctcggagg cggcggaaag 4320
tacaaagagt acttcctgaa gcgcatcctc atccggaagg ctatgacagt gctggccggc 4380
gacaagaaag gactgggcag attcatgaga tgcgtgcaga gcgagacaaa ggccgtgtct 4440
ctgcaactgc ctctgggaag aaacatggaa caccggttga ccatggacag cgccctgagc 4500
ctgacaaaga gagagggacc cgagacactc aaaaagaaat acctggtcca gcaccagatg 4560
aagtgtctga ccgccgtgga ttgtctgcag gctttttggg acatgggcta cccctacgat 4620
gtccctgact atgcgtcc 4638
<210> 1130
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 4B
<400> 1130
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaatc cagaagaaga agcagaagtc caacctggac 120
ctgcagcacc agcgcagacg caaaaagaag aaggacaagg tcgagatccg gaatcggagc 180
cccaaggcca atagcacaga gtgtcagggc gagcacagca gagagcagaa cctgctgaat 240
ctggtgcagc tgaaccctca cagccctcac cacagaaagg acgaagagga ccaccagaag 300
cggcaccacc accacaatca aaagaaaatg agcgtgatgg ccaagaagtc ccagcagcct 360
ctcggacagg cctttggctc tctgtgtcag ctggtgtccg ccgatttcag cgcccctcaa 420
gtgaccagac tgcggagcct gaaccatctg ctgatcaacg agggcaacaa ccactggcct 480
agagtggaaa tgcctaccgg ttggctgctc gtgggctaca acaccagaaa cacagcccag 540
aatcctcggc tgcagcagca cctgaaacac tggcagcagt gcaccagagc cagatggtgc 600
caagagcctt gtcagaccct gaccttcttc catttcttct tctttttcaa aacggtgtcc 660
ctgtgctgcc ccggctggtc taaaggacaa cctcctccac ctggcctgaa gccttctagc 720
ctggcttctc aggtggccag aaccacaggc gtgtaccagc acgtgtggct gatctgcttc 780
gtgttcttcg tgtgcgtgga aaccggcttc tgtcacgtgg cccaagtggg actcgagaga 840
ctggtgtctc tgagcggcat caccgacgtg aaccattggg cccagcctaa gccatctcct 900
agcaaaggca ccggcatgaa cagacccatc ggcctgagag ttggcaaagg cgtgtgggcc 960
agactgagag cctccgtgtc tttctggacc ctgctgccta caacaggcgt gcggacaaga 1020
ggaagccctc tgagactgac actgtggcct ccacggaaca tcctgaacag cctgcctagc 1080
agcatggaaa tcgccgtgct gcaagagaac cgcaagacca gaaaggccgc cagagagaag 1140
cacagaaaga ccgacaacct gcacctgtgc tactaccaca gccagagcaa ccggaacaag 1200
agccggcaga tggaaagcct gggcatgaag ctgcagagcc ctctgtggga ttgctccacc 1260
acaacaggca cacaccacgg ctgtctgtgg gagatcccta gcgttacact gctggcctgc 1320
agagtgaacg ccgtggaaga actgcacagc aggcggatgt ctgtgcggat cgtgaagaac 1380
tgggtgtcct gctgttacgt gcgcctgtct gctgtgggcc tgtctacttg gagcgccctg 1440
gacgtggtca tcaacctgaa gcggctgcag aagttcagcc agaagtctca gcaccactgc 1500
gccctgagaa agatcgagtg ggccacaaag ctgagcctcg gcggaaaagc tggaccccag 1560
gctcaagaga aggccaacgc caagaagatg cccttccagc ggtggatctt cagcaatcag 1620
ctgaccgtgc agatgctgtg cctgcctatt gaagccctga ctgccctgtt cacctgtcgg 1680
acagccagca tcagcgtgaa catcagcacc ctgatgagca tcctggaagc ccctctgttt 1740
tttcacggcg acctgtgcga ggaaaagaag aacggccgga tcagcagcca ggctcctctc 1800
agactttggt cttggtgcgg cacaagccag acctactttg gcagcaccgc caagaaaagc 1860
cccaccagct tttgctgcga gtggggagga caggctcacc ggcagagaaa taccggaatg 1920
gaaatcctgc tgtggattct gctcaagatg gaaattcaga tcttcaagat ttgcctgggc 1980
gagatgcagc tgtgcaccta cacaccccac atctgcagac acacctgtag aggcggacct 2040
agcgccagcg atagatgctg tagctgtagc cctagcggct tcagcgccgg aagaggcaga 2100
tgtccagttc agggatgtct gcggcctcac agagtgcagc tgctgagaag atggggccct 2160
ggatctcctg ctggccagag actgtctaag ggctttcagc tgctccgttg gtggggacca 2220
ggatctccag ctcctgagcc tagaaagggc ccatttccac cacctgatcc tccatggcct 2280
gtgaccgctg tgacagtgat ggctggctct gtgcctagcg ctcagtctgt ggatgctctg 2340
gaaagccctg gacctctggc actggaagga cctagcagcc ccagaaacct gctctggcgg 2400
gaaatgagca tcttcctgcc tggcatcttc acctctcgga ttctgaacct gcaagtgctg 2460
aagaagatcc tgcggagctt tatgaagctg taccactctc tggtcatgtg cctgcggctg 2520
cggaccaagc tggaaaaagc tctgagcgct ctgttcatct ggccccagca cagctacaag 2580
cagaggcctc ctctgcagcc tgtgcaggtc gtgctcagac tgggaaacct gcctccattc 2640
ttcagaggca gcgaggtgcc ctttcctaga ccttgccgga ccaagatgct gaaccagaag 2700
tgtctggccc ctttcatcac acacccattc gcctctcagc ccctgggaca agagatgccc 2760
aacaacaccc agatcagact gctgaagccc ctgctgaccc ctgacaccag atggatcttc 2820
tccaaccagc tgcagacagt ccagatgctc tgtctgccac ctctgaagca gggcgagaga 2880
atcatttggc ccctcggcgg ctttcagatc cccaacttct tttggagcct cggaatcggc 2940
cacactggcg cctggtggca tactggaagg cggagaagag aatggggcgg ctccaccgtg 3000
tctagaagcc cactgtggat cagctccatg atctacctga gaggcatggc cttcgccagc 3060
gacagctcca tcagaaccac cagagtgtcc tggtgcagaa gatgcggcgc caaatctgcc 3120
gctgcctcca gcctcaagaa gaaaccccgg gacatctgtc ggatcagcga ctctaagaag 3180
atgacccaga agcgcgagag caccctgggc aatttctgga tgaagctcct ccagctgcca 3240
gacaagaaga agaagtctac cgaaaagacc aagatcatca agaagatgaa gaaacggatc 3300
atggtccaca tgtgcagctc cctggctctg ccaacaggcc tgacatctct gatcctgcca 3360
agcagcgatc tggccgtgct gatctctagc tccaccagcc actttctgat gcggagccca 3420
gtgctgccta gctccagact gacttgtgcc tctccacagc tgcccagaat gtggacctgg 3480
tccagctggc tgaagtggct gaaaaactgg aagcggttca agcttaaaaa gaagtacatc 3540
ctggccatga cgctgaccct gaacgggcat ccaagaaccg cctctatcac cctgcctacc 3600
accagcctga agggctctag aaccagctgt tgccccagat ctcaccccag actgcctagg 3660
acaaagtggc ctctgcagtg cctgctgcac agcctgggaa caactggaac actcgtgtgg 3720
gaaaggggcg tgctgcagat gagaagtctg gaagctcact gccctctgca gaccttccac 3780
ctccaccact gtagaactca gcccagctct tgccctcctg catggattct gtaccaagga 3840
cagtggagcg gagccgtcgt gggacttaga cctgtggctc accatctgcc aagacctatt 3900
cagggcctgc actgcccaca ggctccacat caaccagctc tgtcttgggg caagtggccc 3960
gtgggaatga caggacctgc cagatgttgc cggtggccta gacgggaact caaaaagaat 4020
ctgctgctcc cctgccggtg cagacgcgag tatagagtga caatgggcca agccttcggc 4080
agctttagcg ccgactttag cgctccccag gtgttgaaga agaatcggaa gcagaacaag 4140
attatctgca agggccaccg catcacaagc ctgatcctga gctttcagcg cgtgaaactt 4200
aagaagaaag tcaacgcctg ctctcccgcc tgcacctcta aagcctggac tcccagaaag 4260
ctcgtgggga gagccgtcag aagaaagggc atcatctgta tcaagaatat gttcctgcag 4320
cggaagggtt tcctgaacct gagccacgtg gaaaagttcg tgcctccttc tcctcctctg 4380
gctctcggcc ctagaatgca gctctgtacc cagctggccc ggttcttccc tatcacacct 4440
cctgtgtggc acatcctggg acctcagagg cacacccctt gtcaaaagaa ggtgccctcc 4500
gctagcccat ggggccttag accatctcct tgcctgagct ggtcctccag aattgtggcc 4560
cctggacacg ccctgagctg tcggactaga agaagatggt ccagcaaggg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1131
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 1A
<400> 1131
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgaccg agatccagct gaccatgaac 720
gacagcaagc acaagctgga aagccccgct ctgaaacagg tgtcaccagc ctctccacct 780
actcagcagc ctcagacacc tcaggattct agacaggtgc tggccctggc caagaaaacc 840
ctgacaaatg cctccagagc cggacagttt cctgtgtggc ggagaacaag cagaggcatg 900
agcctgcagt ggaagtccgg caatgcctgc acacctctga gatgccctag cagaagccct 960
gccacattcc tgacagccct gaatggctgg cacagatctg gcctgagagc ccagatgcct 1020
agctcttggt ctagcagcgg cagaacactg aagctggccc ctctgcaagt gaccaccact 1080
ctgaagctga tcctggtcat gctggaaatc gtgaccgagc gctccctgct gtactccaga 1140
atgtgtctgg tgcagatccc cacacacacc tgggagcccg attacttcgt gtccctgcct 1200
atgatgttca gctgggccac acagtctttt cccgtgggcg ccgtgtttct gaccagacct 1260
gccattcctt gctgcagctg taccagccac agcaaccctt ggagccagag caatcagcag 1320
ctgaagtgga cccctcacat cctgaagtcc gccagcttcg acaagaaagg cttcgtgatc 1380
ctgagccggc ggagcaagat tgaggcctct cctatcggct ctatcgccag ctctcctgga 1440
catcctctgg gacctacact ggccatcaga ttcatcagcg cccctcagcc tagcagctct 1500
acagtgacag ctgcccctag cggccagtac tttatcgcca agaagcggat caagctgcgg 1560
cggaacaata tgggcggcaa cagatccatc tgcctgacca gaaagcgcaa gagagagaag 1620
cggagccaga agtccaggca gaaccatctg cagctgaaaa gctgcagacg gaagatcagc 1680
aactggtcca agctgagaag cccctggatc ttcaccaagt gcgagatctg cgtgaagaac 1740
accgccatcc tggctatcac cctgatcacc cctcaggacc ctcatctgga ccctgtgtgt 1800
caccctcata gaaggcctgg atggaagggc caccatagag tggtgttctc tcaccatcct 1860
agcggcagca caaagagcca ctggcagcaa agagaacgcg gaggcggcag acgcgagaag 1920
aagggatgta gagaacagcg gaaggtggtc aagaacccct ctcagcccgt gcctctgaga 1980
aacgatggca tcaccaacgg caacgactcc accagaagct gctccatcag cctgaagaaa 2040
agcctggaaa agatgcccct gatgcggaga gccagaccta ccagctgtag cacctgtaga 2100
atgtggtgga agggcaagaa acggcggaaa gaaatcgtgc ctatgagcct ggcctgcagc 2160
atcaccgtgt cttttgtggg acagatcagc accctggtgc tggatgtgtc tagcatcagc 2220
cattggcggc tgccctgtaa agtgaccgag agcagctcca gcttcttcta caccagcgac 2280
aggacccctc tgagcatcag cagaccaacc agcagagcta gacagagctg ttgtctgccc 2340
ggactgacac accctgctca ccaacctctg ggcagcatga gcactagaag agagatgcca 2400
agccaggcca caccttctcc acctggacct tggagagccg ctctgggcaa agaagtgaag 2460
agatcccaga gcaagctgcg cctgagaaac acaagccctg gggagaagaa cgatctccag 2520
ctgttcgtga tgagcgacac cacctacaag atctactgga cagtgatcct gctgaacccc 2580
tgcggcaacc tgcacctgaa aacaacatca ctgcagcggc cacctcggag catcctgtct 2640
ctgaatggaa tctgggaagt gatgccccgg acactggaag gctgcatcag cgtgaaggat 2700
cacagaacca gccagaacca cagcaagtgc atcaccgaat gtgtgcggac tgccctgaac 2760
gtgtccaaga agagactgcc taagctgatg aagaagaagg acagcaccat cttcatcaac 2820
aaagtgcgcc agaacttcaa gcgcaacttc aagaagaaga aacccctcac tttcagcccc 2880
agcagacgga tgactcggag aaccatgaca accaccaaaa tgatgatgat gcggcggacc 2940
aagcggagaa ggcgcaaaag gcggagaatg accatgatga ccagacggac cctgctgaca 3000
aagaaaacct gtctgacccc tagaaccagc gccgccacaa aagctctgcc tagacagacc 3060
atcagccagc ggaggcctat tcagacccca cctggaacat ctctggccat ctggggcaga 3120
acaagactga ccctgacagg caccagatcc agcggaacaa gagcctctcc ttccgccgtg 3180
tgcctgtgtt gttggacctg tccaagcaga agcttcccag ccgcttctcc tagtggactg 3240
agagcacctg ttggagccca ggctcctcct gaagtgacac tgagagcctc ttgtgcctct 3300
agcgcctcta aagcctgtgc tggactttgg ccttggggag cccaagttcg agttggagct 3360
ggaacaggcg gaggacctgc ttgtgttcct gtggctgaag cttctacagg cgcatggaca 3420
gctgaaggcg ccgctggaac aagatgtaga gcctctagag ccccttgccg ccaacttcct 3480
gctagctccc ctaccaagtg tgaaatttgt gtgaagcgca gacggcggag aaagagaagc 3540
agccagtcta gaagccccgt gcctaaaaag cgcgagagga tgatgctgcc tgtgcgggcc 3600
agaacagcta gatctgcact tcctcagggc agagcacctc tggaagggat gctgcttcct 3660
agagcactgc ctagcctgct gagcagaatg cctgccagaa gagagtcccg gttttggctg 3720
gctctgcagg cacttggact cagacctcca catctgccta gctgtcatcc tctgcctcaa 3780
ctgttgggcc ctccacctcc tcatcaggcc ccaatgacac tgaaggccct ggttaagacc 3840
tggacacagt tccgcaacta ccccagagcc gacaagaaga atgtccggtc taccgccttc 3900
ttcctgctgg acatcatcct gggcgattgc ccaagaacaa tggccggacc ttctgcctct 3960
ctgcatcctg catctggcag agcctccaga aagacctggc agagaaggct gagagcttgt 4020
agagcaggcg gacctgctgg atgggctaga caggcctatc ctagactgaa aaccttcggc 4080
gtgcccctgg gctctattct gtgtctggcc ggcagcctgt ccacaatgat gatcattagc 4140
accaccagac aagagtgcgg caggcgggct tctgtgcctt gtagacctat gatcggaagc 4200
gccagaccag gaccttggcg gacatctgct atgcctagtg ccatgggagt cgccctgcct 4260
acctcttgtg aaagcggaag atctcctcct gccaccggcg gaagaatgcc aggatctcag 4320
tctatcatga tgagctggat gcctccactg gctccatgtg ccgcttgtcc atgttctccc 4380
gctcctacac tgtgcccagc acatcctgct agagcaccaa cagccgtgcc tgcctttaca 4440
cctctgtctg ctcatcctgt gccagtgctg tctggatgtc acctggccgt cagaacctcc 4500
atgctgacac tgctgcccat ggaagccaaa aagagcatga agcggtccaa cgctaagaaa 4560
atggaagata tgatctggga gagccggctg ccactgaggc cacaaagagg acctagacct 4620
ctgcacagat ggctgcagca gacaaccggc tgtagccaga ggcggatcgt gttctttctg 4680
gccccatact tccctcggca ccctcacaga tctccaccaa catcttgccc acctctgctg 4740
gaagctttcc cactgccaag agcttctctg agggccacag tgccaagaca tagctctgtt 4800
ctcgccaccg gtctgcacct ccacagacag atttctctgc ccctgagagg attcctcctg 4860
caccaaccac tgccaggaca gcatctgtgg ctgtctcaca gactgaggct gagactgccc 4920
aggacacagc catctttgcc tggaccatgt gcaagcctgc tgtccacact gtctcagcca 4980
ccacctcagg ctccatctca agtgtggact gccgctacac tgagatgtcc tgctgttcct 5040
gcagctgcct gtcctcctgc tctgagatcc atgcctaaga gccggaacca ggtgctgttc 5100
agacggaatc tgaccccaag ccagctgaga acactggccc caccttatat gctgctgccc 5160
cagtctctgt cccagagcct gagtagaaag cagatcccta gccagtccat gctcgtgggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1132
<211> 5232
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 2A
<400> 1132
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgagaa agatgcagag cctgaatcac 720
cccagcagac tgaccaatgg ctctcctcca ctgcacctgt gccagcctct gagaatgagc 780
agaacccctc ctagaagagt gtgcgccgct cctccacata gactgctggg cccttccaga 840
tggaaccctc ggagaaagac ctggaagatg cggaagaagt acgcccagaa gcctagccag 900
aagaaccacc tgtacggcgg caagaagcgc tctaagttca gcagaagcca cctggacttc 960
agcccctact ggatgaagaa agtgaaggtg ctgttcaagg ccgaccagag cgagtctagc 1020
ctgagcagcg gaagatgcag cctgatggaa cagatccctc acctgaagtc tcggcggaag 1080
tggcagatca gacacgtgct gaagaacctg tggctgccca tgagaagcct gggagaacct 1140
tggagagccg gctttcagtg gggagagtct ccttggcaag tgatggcctc tctgaccggc 1200
agagccacat ttctgctggc cctttgggaa tgtagcctgc ctcaggcaag actgtgcctg 1260
atcgtgtcta gaaccctgct gctggtgcag agccggaaca agaaaacaaa gctgtggttc 1320
agcctgatca acatccacca ccggaagaac ccactgctgc ctatgagatg gtggtgtacc 1380
agaggcggcg gaaagcggaa aaagaaaatg tgcaaggtgt ccggcggctg caccgcctgt 1440
gttgagagat gtccttggaa gggcatctgc tggaagtggc ctgtgacagt ggccgccatt 1500
agaatgtgtg ccctgtctca ccctagcttc tacatcagca gcaccgtgtg ctttctgagc 1560
aagcactgca tgaccgcctg caccagaaag agaatgaaga ccggcgccat ccaagagaag 1620
ggcgctattc aagagaaagg ggccatgacc aagcggatct gcgtggtcaa tttcgaggcc 1680
tgcagagaga tggaaagcct gagcgcccct gagaagatca ccctgtttga agcccacatg 1740
gcccggtgca cctccatcaa tgtgctgtgt gtgcgggcca gcctgattga gaagctgatg 1800
aaagaaaagc gcaagatgaa gcggaaccag gtggcctctc cacagatcat gcagcggctg 1860
ttcatcaagg gctaccagaa caaccacttc accttccatc tgcaaaactt cgccttcttc 1920
agctccttcg gcaacaacaa gtacatcaat atcctgacca tcctgttcca cgtgcggaac 1980
atcgtgtacg gcatccaagt gatgctgtgc gctagccctc agattatgca gagaaccagc 2040
gccgaccggt tccggatgaa gagaagaatg cagaatctgg acaacctggg cgtgccatgg 2100
cctctgttgc ctggaatccc atctctgaac gcccagtgga tgttcctgag aatcgcatcc 2160
ccgcaaatca tgcagaggat gagcgccgtg aacttcgaga caatccgggc cagaaaccgg 2220
aacatgaaga aaaccatgag ccacctgatc gcccatcagg ccctgaagat gagcggcctg 2280
agactgtttc accccagact gctgacacgg aagaagcccg gaaaactgct gctcgcccat 2340
atgtacggct tcagcaccta cggcacccag aaaggcgagt gcgtttgtct gcagtgtctg 2400
agcggcagca gcctgttcat tctgaagcag cccctggacc tgaagatcag caagaccttc 2460
atgggccaca gagagggcag cgagtctgat aatctgggcc tgctgtatag cttccctcca 2520
ccttatccta tcagcgaggg cctgaccatg accaccggca gaaacatcaa cagcaactcc 2580
ctgatgacca actgcctgtt cagccccatc ttcctgtgcc accacgccat catgcacaga 2640
aagatgacaa gccctcactt caggctgttc agcagcaaga tcccacatcc tcaggtgcca 2700
tctgtggtgg ccctgtgcaa gttccgggcc ttcatccaca cacctagaag ccctggctgc 2760
agcgtgtacg ccaatatgtg ctggcccaag ttcttcctga ccttcagcca gcagtggtcc 2820
agcgtgacat ctctggaatg gacagcccaa gagagaggct gcagcagctg gctgatgaag 2880
cagacatgga tgaagtcttg gagcctgcgg gaccccagct acagatccat cctggaatac 2940
gtgtccacca gagtgctgtg gatgcctacc tctaccgtgc tgcaggctca tccacaagtt 3000
ccagctctgg ctcctcaagc ctggtggcct gctagaagag gacctctgac atctgcccca 3060
tccgctcagc agtccctgac cagagagaag attatcaacc ccaccatcag ctgccccttt 3120
cagagcccca ccaagagact gatctaccct cctagcacct gttctctgcc ctgcagaggc 3180
ttcctgccta gcagatttcc ttggggccca cctcctctga acagcgtgat cgtgcacaag 3240
atcgtgctgg tgttcctgaa gtccctgtcc agctacaact gcgagcggag aatcagcggc 3300
atccagaaga gagccatcga gttcgccgtg ctgaaactgc tgaatatgga cctgcctctc 3360
gagaacacac agatccccag aacaagccca ctgtggaaga tcacaatggt gctgacatac 3420
cccaactgcg tggtgcatgt gctgatgttt ggcgccctga gagccacagc tcctgctaca 3480
gctgcacctc aggctcagac ccctcattgg agagctgcca caacaagcag catgagcagc 3540
agccctagag ccgagcctac atcttctagc tcttgggcca cctgttggcc cagatgctgc 3600
tccagctctt gttactggtc actgtctagc tggcctccag ctggcgccgc tgaagctaca 3660
aataccagaa ccagaagccg cgagagccag aggggtagaa tgctgacttg gagaagctcc 3720
ctgtggttgc agggcaccag atgttttaca ggcgtgcgga ccagctccag atacaagaaa 3780
agaggcgtga tcgcctggcg gagacagatc aatagacgga agctgcagag aaagaagcac 3840
tggaacagcg cctacctggg cagaacactg ctggtcacct gtatcctgta tcaccggtgg 3900
atcgtgacct ccatgtgtca gtcccagaga tggctgacca gcaccacaag tagatctagc 3960
gccctgatgt ggaccgagct gagcctggaa ccatggattc cctacctgca tcagcagaaa 4020
acccagcgga cactggaatc cgccggactg tttccttggc tgcacaccca gtgccaagag 4080
aagaaaagca gaaagctgat gtccagctgc acacacccct gcacaatgct gctgccacag 4140
ggatgtcatc ctgcctggct gagccctatc tctgcctgtc caagactgct gccatatcct 4200
tttcacgtgc tggctctgga agtgaccttt cctcctggaa ccgccatgcc tcagatgcag 4260
ttgcaggctc tggctatgtg ggagaaaggc tgggataagc ctggcaccag cctgcagtgc 4320
tacctgaaca gaagaagaaa cagccggaag cagagccagg tgcaactggc cattcaggtg 4380
ctgctcgtgg acaagcacaa gtactttctg ttcggccaaa agaaaggcca catgatcttt 4440
agcctggcca acggcctgtg gtttaacctg attttcaact cccggaagaa actgctcgag 4500
gacatgaagc aaaatggctt caccggcaaa ggcctgacac accccgtgcc tctgaagcgg 4560
actctgcaga acaaaagaaa caagaatatc aaacgcgtca accagaagaa gggcaacatc 4620
aagcggaagt ccatcctgct gcacctgatt gtgctgaata gccccgagag caacctgatc 4680
ctgatccagc atggcggcat cttcaccttt cggttctggg tcgagaagct gtcctggaac 4740
atctgcaaga acctgagcct gtacctggac aagttcgtgc agagactgct gtacgtgtac 4800
atcatcgaga caaacgtgtt cgtgctgaac ctgtttcatg tgcccgtgaa ccagatcttc 4860
atgatggcct tctacctgaa gtacaccgag aaggcctggg tcatggaact ggaatggctg 4920
atccaacagc agtgctatca gggcagctgc ggcagagctt gttcttgtgg aagaggctgt 4980
ggcaccccta gaggcgattg gaagagacat cctcctcgga gagccttctg gaagcctcct 5040
agccagggca tctctagctg tctgatgacc ggctgttggc tcgagaagaa agctacctgg 5100
atgcggcgga cccgccggaa gaagagggaa gatcattgcg gactgagaca ccccagctgg 5160
ccttggacaa gatgtctgag gatgaggcct ccaagaagcg gctaccccta cgatgtccct 5220
gactatgcgt cc 5232
<210> 1133
<211> 5247
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 3A
<400> 1133
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgggag ctgctgctgc ctcttgtcag 720
tctcctcctt ctcctcggga aaccacacct agctccgacg ccaccagacg gacaagacct 780
attgccgctc agagcaagaa aaccatgaca gccgccggac tgacccctat gatccggaag 840
atccagaagc ggcggagaac cgccaaccgg tgtctgagag ttagatgtgg cggctggctg 900
tgtggctgga cacctagagg acagaacacc agaagcacca acctggaaaa gaaccccagc 960
ctgaagaagc agagccagcg gagaggaaag ctgagcagcc tgttcttcag ccactgcctg 1020
tgccggaaca gcagaagggc cacacctaca tctaagggca gcctgcggcg gaagtacctg 1080
agagtgccta ttcctccaca cctgagacac cctctgctgc tgatggacct ggacggaatg 1140
ctgaccgtga tcggacaggg actcgtgggc atgaccccta gagatctggg aacagtggct 1200
ggcgccaccg ctcagattca gaggcctatt caggtgcaga ccggcggcag acttacacct 1260
cctcctctga ttctgtggcc tcaggccgct cctgttgatc ctcctggctc tgtgtggatt 1320
ctgccctgca agaacaagaa gcggagaaag ctgcggccca agcggctgga ctttcaccct 1380
agatcttcta gcggcgtgtc cgtgatcacc atgaagctgt gggagaagca cttcaagggc 1440
ctgaactgga acctggtcgt ctggattctg aacctgaaga tgatgaacat cgagatcacc 1500
cctcagcgga gcaaggccag aaagtccggc gtgatgaagt gctgggatct gtgccccagc 1560
gagaagaaga ggaagctgcc tctgcctctg accttcagca ccctgctgtg ggactctaga 1620
catagaggcg ccagctccag caccagcaga gactccagaa gctttttcac cagcgctcac 1680
cccagcagac cctgcagaat gagactgtac cagttcctga tccacctgag aaaggtggac 1740
acccaccatc tgcaggtcgt gaccaagacc gtgacagcca caacagctga cggccagaga 1800
atgcggagac tgaagtgcaa ggcctgccgg ctgagatggg ctagacctga acctgctgct 1860
caggcccctc caaagagcca ctttccacct catcctagcg gccctagcag aaccagttct 1920
ctgcagctgc ggagcatccc tcacgtgcca aaagccacag ccgctcacag cgtgacagtg 1980
aagctgcaga agggaaagaa cagcccctgc tgccaaaaga aactgcgggt gcagaatcag 2040
ggccatctgc tgatgatcct gctgcacaat acctacatgg aaatgcacta cggccatcag 2100
gccccacagg tggccatgct gcctaagctg ctgtgcagac agatgctgcc cactctgagc 2160
acactgcagc aaagacaccc acagggccct tgtcctccac ctgtgacacc actgagagtc 2220
cagtctgtcc tgctgctggg agtgcctcag acagctgcta gacagcctag cagacccacc 2280
ggcagaaccc ctaccacaag actgatggcc cctgtcggca gcgtgatgag ctgttctctg 2340
ctgacccagc cttctccagc cagcgcctgt acaatgcctc cactgctgca tcctcagtgg 2400
gccccacatt ctgctggatt gtctcccggc gcttgcagac ctgcctgtac ctgtatcagc 2460
atgaccacca tctccagagc cacctggcag gtttccgtgt acagcggcaa tctgctgagc 2520
ttctccagac ggggcatgaa gagtagcgtg cggctgaaaa acagccggcg gaacagacgg 2580
tacagaaaga tctacggcga gctgaagatg tccctgcagg ccgtggctcc tagatgtcct 2640
agatctgccg tggacatcag ccccggacct acctctccta gcctggcctc ttgtgcctct 2700
gtggccattg gaaaactggc cctgcttggc gcttctgccc cttgtggtgc tgctggcgct 2760
agagaggctg gaagatttgc cgtgctgggc accatggtca tgaagcacct gaaccgcaag 2820
ctgcatctga cccggtcctg cctgatcgat ctgaccatga tgatgagcca gaagctctgg 2880
aagaaccagc ggaagagaat ccctctgcca tctcctagac agcatctgct ccctcagtac 2940
cctctgcacc ctcctccacc ttgtctgctg ctgctccacc acagacacca cctggccttt 3000
ctggaaatgg cctgcagcag ccagcacacc cactccatca agatctggat cagctttagc 3060
cacgagcaga gcagcccatt cctggccaga tcctggaaca ccatgcagtg gaacaacaag 3120
aaaatggcca tgacagtgat cgctggcgcc caccactgtc agtacaagct gacctacacc 3180
aaagtgtgga agatgaattg gaagaaaatg atgatcggct cccagcacct cctgttcagc 3240
cctctggata gctctccact gcaactgctg cttcaccctc acggcaagag atgcaaccct 3300
tgctgcagac tgacatggat gtccatgctg cagaaacagt gctgctacaa cctcgtgatc 3360
aagcacccac tgatcttcag aatcaacctg cggagacagg gcaagaccaa ggatggcgtt 3420
gtgcagagcc tgggcttcct gaaccagcag atcatcctgc agaaagagtt cttcatctgc 3480
ctgctcatgt ttatcaagcg gtggaagcct gccgccacca agagagagtg ggagaaacgc 3540
aagcagatcc tcggcggagg cggcaagtac aaagagtact tcctgaagcg catcctgatt 3600
cggaaggcca tgactgtgct ggccggcgac aagaaaggcc tgggcagatt catgagatgc 3660
gtgcagagcg agacaaaggc cgttagcctg cagctcccac tcggaagagg ccctgtgtac 3720
tacgtgtgca accggatgaa cgtgtccagc gtgctgaagc ccttcctgtt caccgtgcct 3780
atcgaggaca tgagagagtg cacactgggc cgcaacagaa tgaatgtgtc ctctgtgctg 3840
aaaccctgtc tgatccctgt gccaatcgac ctgcctcgga tgctgccaat cagcagccca 3900
ctgcacagac cccagatgcc attctggacc tgcacctttc ctgccacaac atggggcacc 3960
tgggagacac cttctacatg gggctggcgg acctttcggg gccctagaag aaaagtgctg 4020
atggtgctgt ggctgcccgc caaccagagt ctgcagaaaa gccaagtgtt ccagtgggtc 4080
ctgcggaccg agaacatccg gaagctgatc tggaccaagc agcggagctt cctgtctctg 4140
ttccccaagc tgagagccac cgaacagatg accaatgtgg gctgcgcctt cagcggccgg 4200
attctgcatc aacctgaaat ggccgccatg cggctgatgc ccaagttcct gaatagcacc 4260
aacagctggt ggacctgtac caacctgagc gtgcccatga tgctgaccat tctgatttgg 4320
aagcgggtgt tcattctcct gctgtccgac aagaagctgc tgaagaagtc tagccagctg 4380
aggcggtctt ggagaaacgt gtcccggatc agccaccaga tgaagtgtct gaccgccgtg 4440
gactgtctgc aggccttctg ggacatgaac atggaacacc ggctgaccat ggacagcgcc 4500
ctgagcctga caaagagaga gggacccgag acttgcaaga agaagctcct gctgaaactg 4560
ctgacaatga gcctgagcaa catcctgatg aagttccggc tgcggctgag aatcccaagc 4620
ctgaggaagt atcgccagca tctgaaaaag accagcgcca agggcgagaa gctgaagcac 4680
tgctttaagg cttggggcag aggcccacct ctgcacacaa gaagccagaa gaaagaccct 4740
gccggcaagc tgaaaaaact gaccacactg agcttcgtgc tgatcgagga acggcggaac 4800
ctgcagcgga atctgaaagt cctgtggctc aagaaaagca ccaagagccg gtatctgttc 4860
ttcctgaccg tgtgcggctt cttcgagaag aaacggcctg agtggctgtc ctccagaaag 4920
aagggacaca caaagaatcg gaggaaggcc aagcggaagc cccagatcgt gcacaagaag 4980
agaggcctgt tcctcaaaaa gaaatacctg gtgcagggcg ccaagaagat caccttcctg 5040
tccaacggca tggaagcttg cggcacacac cccacaccaa gactgagcga cagagtgttc 5100
ctggtcaaga tcaccaccac cacaagcagc cccagaagaa gcccagcact gagagctaga 5160
ggcggcacca caattggcga agtgaccagc ctgtgcttct tctacctgct gtacggctac 5220
ccctacgatg tccctgacta tgcgtcc 5247
<210> 1134
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 4A
<400> 1134
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgatcc agaagaagaa acagaaatcc 720
atggccaaga agtcccagca gcctctggtg ctgaagaaga accggaagca agagtgggga 780
ggacaggccc acagacagag aaacaacgcc aagaagatgc ccttccaaga ggaaaagaag 840
aacggccgga tcagcagcag cctgatcctg agcttccaga gagtgaagga cagcaagaaa 900
atgacccaga agatgtgcag ctctctggcc ctgcctacag gcctgacatc tctgatcctg 960
cctagcagcg atctggccgt gctgatctct agcagcacca gccactttct gatgcggagc 1020
cctgtgctgc caagctccag actgacatgt gcctctccac agctgccccg gatgtggaca 1080
tggtctagct ggctgaagca ccccagaacc gctagcatca cactgcctac cacaagcctg 1140
aagggcagca gaaccagctg ctgcccaaga tctcacccca gactgcctag gaccaagtgg 1200
cctctgcagt gtctgctgca cagcctggga acaacaggca cactcgtttg ggaaaggggc 1260
gtgctgcaga tgagaagcct cgaagcccat tgtcctctgc agaccttcca tctgcaccac 1320
tgcagaaccc agccaagctc ttgtcctcct gcctggattc tgtaccaagg ccagtggagc 1380
ggagccgtcg ttggacttag acccgtggct caccatctgc ctagacctat ccagggcctg 1440
cactgtcctc aggctcctca tcaacctgct ctgagctggg gaaagtggcc cgtgggaatg 1500
acaggacctg ccagatgctg tcggtggccc cgcagatctc agaagtctca gcatcactgc 1560
gccctgcgga agatcgagtg ggccacaaaa ctgtctctcg gcggaaaagc cggaccacag 1620
gctcaagaga aggccagacc ttctccttgc ctgtcctggt ccagcagaat tgtggcccct 1680
ggacacgccc tgagctgtcg gactcgtaga agatggtcct ccaagtgcag aggcggccct 1740
agcgccagcg atagatgttg tagctgtagc cccagcggct tcagcgccgg aagaggcaga 1800
tgtcctgtgc agggatgtct gaggccacac agagttcagc tgctgagaag atggggccca 1860
ggatctcctg ctggccagag actgtctaag ggcttccaac tgctgcgttg gtggggacct 1920
ggatctccag ctcctgagcc tagaaagggc ccatttcctc cacctgatcc tccatggcct 1980
gtgaccgctg tgacagtgat ggctggctct gtgcctagcg cacagtctgt ggatgccctg 2040
gaatctcctg gacctctggc tctggaaggc cctagcagcc ctagaaacct gctgtggcgg 2100
gaaatgagca tctttctgcc cggcatcttc tgccaaaaga aggtgccatc tgccagcccc 2160
tggggacttg ttcctccttc tccaccactc gctctgggcc ctagaatgca gctgtgtacc 2220
cagctcgcca gattcttccc catcacacct ccagtgtggc acatcctggg acctcagaga 2280
cacacacctc aggtggtcct gagactgggc aacctgcctc cattcttcag aggcagcgag 2340
gtgccctttc ctagaccttg ccggaccaag aacgagggca acaatcactg gcccagagtg 2400
gaaatgccta ccggctggct gctcgtgggc tacaacacca gaaacacagc ccagaatcct 2460
cggctgcagc agcatctgaa acactggcag cagtgcacac gggccagatg gtgtcaagag 2520
ccttgtcaga ccctgacctt cttccacttc ttcttctttt tcaaaacggt gtccctgtgt 2580
tgtcccggct ggtccaaagg acaacctcca cctcctggcc tgaagccttc tagcctggct 2640
tctcaggtgg ccagaaccac aggcgtgtac cagcacgtgt ggctgatctg cttcgtgttc 2700
ttcgtgtgcg tggaaaccgg cttctgtcac gtggcacaag tgggcctcga gagactggtt 2760
tctctgagcg gcatcaccga cgtgaaccat tgggcccagc ctaagccatc tcctagcaaa 2820
ggcaccggca tgaacagacc catcggcctg agagttggca aaggcgtgtg ggccagactg 2880
ctcaagaaga agcctagaga catctgtcgg atctccaaca gaaagacccg gaaggccgcc 2940
agagagaagc accgcaaaac agatagagcc agcgtgtcct tctggactct gctgcctaca 3000
acaggcgtgc ggacaagagg aagccctctg agactgactc tgtggcctcc tagatgcaga 3060
tgcagacgcg agtacagagt gaccatgaac atcctgaaca gcctgccaag cagcatggaa 3120
atcgccgtgc tgcaagaaac cgccaagaaa agccctacca gcttctgctg caacctggac 3180
ctgcagcatc agcgcagacg caaaaagaag aaagacaagg tcgagatccg gaatcggagc 3240
cccaaggcca atagcacaga gtgtcagggc gagcacagca gagagcagaa tctgctgaat 3300
ctggtgcagc tgaatcctca cagccctcac caccggaagg acgaagagga ccaccagaag 3360
agacaccacc accacaatca aaagaagatg agcgtcccac tgttcttcca cggcgacctg 3420
tgtagagaga gcaccctggg caatttctgg atgaagctgc tccagctgcc tcagaggcct 3480
ccactgcaac cagtgaccgg aatggaaatc ctgctttgga ttctgctgaa gatggaaatt 3540
cagatcttca agatttgcct gggcgagatg cagctctgca cctctcggat tctgaacctg 3600
caagtgctga aaaagatcct gcggagcttt atgaagctgt accacagcct cgtgatgtgc 3660
ctgcggctga ggaccaagct ggaaaaggct ctgagcgccc tgttcatctg gcctcagcac 3720
tcctacaaga tcacacaccc attcgccagc cagccactgg gacaagagat gcccaacaac 3780
acccagatcc ggctgctgaa gcccgacaag aagaagaaaa gcaccgaaaa gaccaaaggc 3840
caggctttcg gcagcttctc cgccgatttt tcagcccctc aaggacaggc ttttggctcc 3900
ctgtgtcagc tggtgtccgc cgactttagc gccccacaag tgaccagact gcggagcctg 3960
aaccatctgc tgatttggct gaagaattgg aagcggttca agctcaaaaa gaaatatcag 4020
gcccctctgc ggctgtggtc ttggtgcgga acaagccaga cctacttcgg cagcatcatc 4080
tgtatcaaga atatgttcct gcagcggaag ggtttcctga acctgagcca cgtggaaaag 4140
ttcgagctta agaagaatct tctgctcccc gtcgtgatca acctgaagag actgcagaaa 4200
ttcatgctga accagaagtg cctggctcca tttcctgcct gcaccagcaa agcctggaca 4260
cccagaaaac tcgtgggcag agccgtgcgg agaaagggca ttctggccat gacactgacc 4320
ctgaacggaa tcgaggccct gacagccctg tttacctgta gaaccgcctc catcagcgtg 4380
aacatcagca ccctgatgag catcctggaa gccatcatca agaagatgaa gaaacggatc 4440
atggtgcacc ggtggatctt ctccaatcag ctgaccgtgc agatgctctg cctgcctctg 4500
ctgacccctg acaccagatg gatctttagt aatcagctgc agacagtgca aatgctgtgt 4560
ctgccacctc tgaagcaggg cgagagaatc atttggccac tcggcggctt tcagatcccc 4620
aatttcttct ggtccctcgg catcggacac actggcgcat ggtggcatac tggtagaagg 4680
cggagagagt ggggcggctc taccgtgtct agaagcccac tgtggatcag ctccatgatc 4740
tacctgagag gcatggcctt cgccagcgac agctccatca gaaccaccag agtgtcctgg 4800
tgtcggagat gtggcgccaa gtctgccgca gcctcttctt ctccactgtg ggattgcagc 4860
accacaaccg gcacacacca cggatgcctg tgggagatcc ctagcgttac cctgctggct 4920
aacctgcacc tgtgctacta ccactctcag agcaacagaa acaagagccg ccagatggaa 4980
tccctgggca tgaagctcca acttaaaaag aaagtgaacg cctgcagcac ctacacaccc 5040
cacatctgca gacacacctg tcgcgtgaac gccgtcgagg aactgcactc tagaaggatg 5100
tccgtgcgga tcgtgaaaaa ttgggtgtcc tgctgctacg tgcggctgtc agctgtggga 5160
ctgtctactt ggagcgctct ggacaacaag atcatctgca agggccacag aatcaccggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1135
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 1B
<400> 1135
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgaccg agatccaatt gaccatgaac 720
gacagcaagc acaagctgga aagccccgct ctgaaacagg tgtcaccagc ctctccacct 780
actcagcagc ctcagacacc tcaggatagc agacaggtgc tggccatgcc tagcagctgg 840
tctagctctg gcagaaccca gcggaaggtg gtcaagaatc ctagccagcc tgtgcctctg 900
agaaacgacg gcatcaccaa cggcaacgac tccaccagaa gctgcagcat cagcctgaag 960
aaaagcctgg aaaagatgcc cctcatgatg aagaagaagg acagcaccat cttcatcgtg 1020
cccatgagcc tggcctgtag catcaccgtg tctttcgtgg gccagatcag cacactggtg 1080
ctggatgtgt ccagcatctc ccactggaac aaagtgcggc agaacttcaa gcggaacgcc 1140
gacaagaaga acgttcggag cggcgagaag aacgacctgc agctgtttgt gatgagcgac 1200
accacctaca agatctactg gaccgtgatc ctgctgaacc cctgcggcaa tctgcacctg 1260
aaaaccacca gcctgggcga ctgtcctaga acaatggccg gaccttctgc ctctctgcac 1320
cctgcatctg gcagagcctc tagaaagacc tggcagagaa ggctgagagc ctgtagagct 1380
ggtggacctg ctggatgggc cagacaggcc ttcgataaga aaggctttgt gatcctgagc 1440
gtcggagccg gaacaggcgg aggacctgct tgtgttcctg tggctgaagc ttctacaggc 1500
gcttggacag ctgaaggcgc cgctggaaca agatgtagag cttctagagc cccttgcaga 1560
cagctgcctg ccagctctcc taccaagtgc gagatctgcg tgaagcgcag acggcggaga 1620
aagagaagca gccagtctag aagccccgtg cctaagaaac gcgagagaat gatgctgccc 1680
gtgcgggcca gaacagctag atctgcactt cctcagggga gagcccctct tgagggaatg 1740
ctgcttccta gagcactgcc cagcctgctg tctagaatgc cagccagaag agagagccgg 1800
ttttggctgg ctctgcaggc acttggactc agacctccac atctgcctag ctgtcatcct 1860
ctgcctcaac tgcttggccc tccacctcct catcaggccc ctacagcttt cttcctgctg 1920
gacatcattc tgcggctgcc ctgcaaagtg accgagtcta gcaatatggg cggcaacaga 1980
tccatctgcc tgaccaacgc caagaaaatg gaagatatga tctgggagag cacgcccctg 2040
agcatcagca gacctacatc tagagccagg cagagctgtt gtctgcccgg actgacacat 2100
cctgctcacc agccactggg atctatgacc ctggccatca gattcatcag cgctcctcag 2160
cctagctcca gcacagtgac agctgctcct agcggccagt acttcaaggg caagaagcgg 2220
cggaaagaga tcttcaagaa gaagaaaccc ctgacattca gccccagcct ggccaaaaag 2280
accctgacca atagcagctt cttctacacc agcgaccgcg aggccaagaa atctatgaag 2340
cggagcatga ccctgaaggc cctggtcaag acctggacac agttcagaaa ctaccccaga 2400
gcctcctctc ctggacaccc tctgggacct aatggcatct gggaagtgat gcccagaaca 2460
ctggaaggct gcatctccgt gaaggaccac agaacaagcc agaaccacag caagtgcatc 2520
accgagtgtg tgcggacagc cctgaacaga agaagcaaga tcgaggcctc tcctatcggc 2580
tctatcgccc tgagatccat gcctaagagc agaaaccagg tgctgttcag acggaatctg 2640
accccaagcc agctgagaac tctggcccct ccttatatgc tgctgcccca gtctctgagc 2700
cagagcctga gcagaaagca gatccctagc cagtccatgc tggtggcctc tagagcagga 2760
cagtttcctg tgtggcggag aaccagcaga ggaatgagcc tgcagtggaa gtccggcaat 2820
gcctgcacac ctctgagatg ccctagcaga agccctgcca cattcctgac agctctgaac 2880
ggctggcaca gatctggact gagagcccag agaaagcgca agcgcgagaa gagaagccag 2940
aagtccaggc agaaccatct gcagctgaag tcctgccggc gcaagatctc caactggtcc 3000
aagctgagaa gcccctggat cttcgtgtcc aagaagagac tgcccaagct gaccaagtgt 3060
gaaatctgtg tcaagaacac cgccatcctg gctatcaccc tgatcacccc tcaggaccct 3120
catctggacc ctgtgtgtca ccctcataga aggcctggat ggaagggcca ccacagagtg 3180
gtgttttctc atcaccctag cggcagcacc aagagccact ggcagcaaag agaacgcgga 3240
ggcggcagac gggaaaagaa gggctgtaga gagagatccc tgctgtactc cagaatgtgc 3300
ctggtgcaga tccccacaca cacctgggag cccgattact tcgtgtctct gcccatgatg 3360
ttcagctggg ccacacagtc attccccgtg ggagccgtgt ttctgaccag acctgccatt 3420
ccttgctgta gctgcacaag ccacagcaac ccttggagtc agagcagaca cccacacaga 3480
agcccaccta cctcttgtcc tccgctgctg gaagcctttc cactgcctag agcatccctg 3540
agagccaccg tgccaagaca tagctctgtg ctggcaaccg gactgcatct gcacagacag 3600
atttctctgc ccctgagagg attcctgctg catcaaccac tgccaggcca gcatctgtgg 3660
ctgtctcata gactgcggct gagactgcca agaactcagc ggcctcctag atccatcctg 3720
agccttagac tgccactgag gccacagaga ggacccagac ctctgcatag atggctgcag 3780
cagaccacag gctgtagcca gagaagatac cccagactga aaaccttcgg cgtgccactg 3840
ggctccattc tgtgtctggc tggatctctg agcaccatga tgatcattag caccaccaga 3900
caagagtgtg gcaggcgggc atctgtgccc tgtagaccta tgatcggaag cgccagacca 3960
ggaccttgga gaacatctgc tatgcctagc gccatgggcg tcgcactgcc tacaagctgt 4020
gaatccggaa gatctcctcc tgccaccggc ggaagaatgc ctggaagcca gagcattatg 4080
atgagctgga tgcctcctct ggctccttgt gccgcttgtc cttgttctcc cgctcctaca 4140
ctgtgtcccg ctcatcctgc tagagcacct acagccgtgc ctgcctttac acctctgtct 4200
gcacatcctg tgcctgtgct gtctggatgt cacctggccg tcagaacctc catgctgaca 4260
ctgctgccta tgctgaagct ggccccactg caagtgacca ccacactgaa gctgatcctg 4320
gtcatgctgg aaatcgtgac cgagagcact cggagagaga tgccttctca ggccacacct 4380
tctccacctg gaccttggcg agccgctctg ggcaaagaag tgaagagatc ccagagcaag 4440
ctgcgcctga gaaacacaag ccccatcgtg ttctttctgg ccccatactt ccccagacgg 4500
atgaccagac ggaccatgac aaccaccaaa atgatgatga tgcggcggac caagcggaga 4560
aggcgcaaaa ggcggagaat gacaatgatg acaaggcgga ccctgctgac aaagaaaacc 4620
tgtctgaccc ctagaaccag cgccgctacc aaagctctgc caaggcagac aatctcccag 4680
cggaggccta ttcagacccc tcctggaaca tctctggcca tctggggcaa ccagcagctg 4740
aaatggaccc ctcacatcct gaagtccgcc agcagaaggg ccagacctac cagctgtagc 4800
acctgtagaa tgtggtggat cgccaaaaag cggatcaagc tgcggcggaa cagaaccaga 4860
ctgacactga caggcacaag aagcagcggc accagagctt ctccatccgc cgtttgcctg 4920
tgttgctgga cctgtccttc cagaagcttc ccagccgctt ctccaagcgg attgagagca 4980
cctgttggag cacaggcccc tccagaagtt acactgagag ctagctgtgc ctccagcgcc 5040
tctaaggctt gtgctggact ttggccttgg ggagcacaag ttcggcaacc atctttgcct 5100
ggaccatgcg cttctctgct gagcacactg tctcagccac ctccacaggc tccatctcaa 5160
gtgtggacag ccgcaacact gagatgtcct gctgttccag ctgctgcctg tcctcctggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1136
<211> 5232
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide encoding the hinv- and ha-extended poly-fsp
polypeptide 2b
<400> 1136
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgagaa agatgcagag cctgaatcac 720
cccagcagac tgaccaacat gagcagaaca cctccaagac gcgtgtgcaa ccctcggaga 780
aagacctgga agatgcggaa gaagtacgcc cagaagccta gccagaagaa ccacctgtac 840
aacagccgga agaaactgct cgaggacatg aagcagaatg gcttcacagg ccacagagag 900
ggcagcgagt ctgataatct gggcctgctg tactcctttc ctcctatccg gatgtgcgcc 960
ctgtctcacc ctagcttcta catcagcagc accgtgtgct ttctgagcaa gcactgcatg 1020
accgcctgca cacaaaagaa aggccacatg atcttcagcc gcgagaagat catcaacccc 1080
accatcagct gcccctttca gagccccaca aagcggctgg aactgagcct ggaaccttgg 1140
attccctacc tgcaccagca gaaaacccaa ggcggcaaga agagaagcaa gttccctggc 1200
accagcctgc agtgctacct gaacagatgc agcctgatgg aacagatccc tcacctgaag 1260
tccgcctctc cacagatcat gcagagaacc agcgccgacc ggttccggat gaagcggaga 1320
atgcagaacc tggacaatct gggcgttcca tggccactgc tgcctggacc tctggaaaac 1380
acacagatcc ccagaacaag ccctctgtgg aagatcacaa tggtgctgac ataccccaac 1440
tgcgtggtgc acgtgctgat gttctggctg cctatgagat ctctgggcga gccttggaga 1500
gctggctttc agtggggaga gtccccttgg caagtgatgg ctagcctgac aggcccctat 1560
cctatcagcg agggcctgac catgaccacc ggcagaaaca tcaacagcaa ctccctgatg 1620
accaactgcc tgttcagccc catcttcctg tgccaccacg ccatcatgca ccggaagatg 1680
acaagcccac acttcagact gttcagcagc aagatcccac atcctcaggt gccatctgtg 1740
gtggccctgt gcaagttcag agccacattt ctgctcgccc tgtgggagtg tagtctgcct 1800
caagccagac tgtgcctgat cgtgtctaga accctgctgc tggttcagtc tgccgctcct 1860
ccacatagac tgctgggccc ttctagatgg tccagaagcc acctggactt cagcccctac 1920
tggatgaaga aagtgaagct ggccaacggc ctgtggttca acctgatctt cgtgctgttc 1980
aaggccgacc agagcgagtc tagcctgtct agcggccgga acaagaaaac aaagctgtgg 2040
ttctccctca tcaacatcca ccaccgcaag aatcctctgc tgcccatgag aatccccagc 2100
ctgaatgccc agtggatgtt cctgagaatc ctgcttctgg cccatatgta cggcttcagc 2160
acctacggca cccagaaagg cgagtgcgtt tgtctgcagt gtctgagcgg cagcagcctg 2220
ttcattctga agcagcccct ggacctgaag atctccaaga ccttcatgct gcaagctcac 2280
ccacaggtgc cagctcttgc tcctcaagct tggtggcctg ctagaagagg ccctctgaca 2340
tctgctccat ccgctcagca gtctctgaca gctagccctc agattatgca gcggatgagc 2400
gccgtgaact tcgagacaat catctaccct ccaagcacct gtagcctgcc ttgtagaggc 2460
agaacactgg aaagcgccgg actgtttcct tggctgcaca cccagtgtac acacccctgt 2520
accatgctgc tgccacaagg ctggtggtgt acaagaggcg gcggaaagcg gaaaaagaaa 2580
atgtgcaagg tgtccggcgg ctgcaccgcc tgtgttgaga gatgtccttg gaagggcatc 2640
tgctggaagt ggccagtgac agtggctgct cagtggtcta gcgtgacctc tctggaatgg 2700
acagcccaag agagaggctg cagcagctgg ctgatgaagc aaacatggat gaagtcttgg 2760
tccctgcggg accccagcta cagatccatc ctggaatacg tgtccaccag agtgctgtgg 2820
atgcccacaa gcaccgtgcg gagaagaaac agcagaaagc agtctcaggt gcagctggcc 2880
attcaggtgc tgctcgtgga caagcacaag tactttctgt tcggcagagc ccgcaaccgg 2940
aacatgaaga aaaccatgag ccacctgatc gcccatcagg ccctgaagat gagcggcctg 3000
aggctgtttc atcctcggct gctgacaaga aagaagcccg gcaagttcct gcctagcaga 3060
tttccttggg gccctcctcc tctgtgtcat cctgcttggc tgagccctat ctccgcctgt 3120
ccaagactgc tgccatatcc ttttcacgtg ctggccctgg aagtgacctt tccacctgga 3180
acagccatgc ctcagatgca actgcaggcc ctggccatgt gggagaaagg ctgggataag 3240
cggaagagaa tgaagaccgg cgccatccaa gagaagggcg ctattcaaga gaaaggggcc 3300
atgaccaagc ggatctgcgt ggtcaatttc gaggcctgca gagagatgga aagcctgagc 3360
gcccctgaga agattaccct gtttgaagcc catatggccc ggtgcacctc catcaatgtg 3420
ctgtgtgtca gagcctctct gatcgagaag ctgatgaaag aaaagcgcaa gatgaagcgc 3480
aaccaggtgg catccccaca aattatgcag aggctgttca ttaagggcta ccagaacaac 3540
cacttcacct tccatctgca aaacttcgcc ttcttcagca gcttcggcaa caacaagtac 3600
atcaatatcc tgacgcggcg caagaaaaga gaggaccact gcggactgct gatcctgatc 3660
cagcacggcg gcatcttcac ctttcggttc tgggtcgaaa agctgagctg gaacatctgc 3720
aagaacctga gcctgtacct ggataagttc gtgcagcggc tgctgtacgt gtacatcatc 3780
gagacaaacg tgttcgtgct gaacctgttc cacgtgccag tgaaccagat cttcatgatg 3840
gccttctacc tgaagtacac cgagaaggcc tgggtcatgg aactggaatg gctgatccaa 3900
cagcagtgtt accagcaaga gaagaaaagc cggaaactga tgagcagctg ccgggccttc 3960
atccacacac ctagaagccc tggctgcagc gtgtacgcca atatgtgctg ggccttttgg 4020
aagcctccta gccagggcat cagctcttgt ctgatgacag gctgttgggg cagccctcct 4080
ctgcacctgt gtcagcctct gaggcggtat aagaaaaggg gcgtgatcgc ctggcggcgg 4140
agaaagtggc agatccggca tgtgctgaaa aacctgatcc tgtttcatgt gcggaacatc 4200
gtgtacggca tccaagtgat gctgtgcggc aagggactga cacaccctgt gcctctgaaa 4260
cggaccctgc agaacaagag gaacaagaac atcaagcggg tcaaccagaa gaagggcaac 4320
atcaagagga agtccatcct gctgcacctc attgtgctga atagccccga gagcaacccc 4380
aagttcttcc tgacctttag ccagctcgag aagaaagcta cctggatgag aagaacaggc 4440
gccctgagag ccacagctcc tgctacagca gctcctcagg ctcagactcc tcattggaga 4500
gccgccacaa caagcagcat gagcagcagc cctagagccg agcctacatc ttctagctct 4560
tgggccacct gttggcccag atgctgtagc tccagctgtt actggtccct gagttcttgg 4620
cctcctgctg gcgccgctga ggctacaaac accagaacta gaagcagaga gtcccagcgg 4680
ggcagaatgc tgacttggag aagtagtctg tggctgcagg gcaccagatg ttttacaggc 4740
gtgcggacaa gcagcggaag ctgtggcaga gcttgtagct gcggaagagg ctgtggaacc 4800
cctagaggcg attggaagag acaccctcct cggaggaata gcgtgatcgt gcacaagatc 4860
gtgctggtgt ttctgaagtc cctgtccagc tacaactgcg agagaaggat cagcggcatc 4920
cagaagagag ccatcgagtt tgccgtgctg aaactgctga atatggacct gcactggaac 4980
tccgcctacc tgggcagaac tctgctggtc acctgtatcc tgtatcaccg gtggatcgtg 5040
acctccatgt gccagtctca gagatggctg accagcacca caagcagatc cagcgctctg 5100
atgtggaccc ggcagatcaa tcggaggaag ctgcagagaa agaagaggca cccaagctgg 5160
ccttggacca gatgccttag aatgaggcct cctagaagcg gctaccccta cgatgtccct 5220
gactatgcgt cc 5232
<210> 1137
<211> 5247
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 3B
<400> 1137
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgggag ctgctgctgc ctcttgtcag 720
tctcctcctt ctcctcggga aaccacacct agctccgacg ccaccagacg gacaagacca 780
attgccgctc agagcaagaa aaccatgaca gccgccggac tgacccctaa gaacaagaag 840
cggagaaagc tgcggcccaa gatgatccgg aagatccaga agagaaggcg gaccgccaac 900
cggcggaata gcagaagggc tacccctaca agcaagggca gcctgagaag aaagtacctg 960
agagtgcggg gacctcctct gcacacccgg aacatcagaa agctgatctg gaccaagcag 1020
cggagcttcc tgtctctgtt ccccaagctg agagccaccg agcagatgac caatgtgggc 1080
tgctctatcc ctcacgtgcc caaagccaca gccgctcact ctgtgacagt gaaactgcag 1140
ctgcccctga ccttcagcac cctgctgtgg gatagcagac acaccatgag cctgagcaac 1200
atcctgatga agttccggct gcagtctagc ccattcctgg ccagatcctg gaacaccatg 1260
cagtggaaca acaagaaaat ggccatgacc gtgatcgctg gcgcccacca ctgtcagtac 1320
aagctgacct acaccaaagt gtggaagatg aactggaaga aaatgatgat cggcagccag 1380
catctgctgt tcagccctct ggatagcagt cccctgcagc tcctgctgca ccctcacggc 1440
aagagatgca acccttgctg cagactgacc tggatgagcc agaacaccag aagcaccaac 1500
ctggaaaaga accccagcct gaagaagcag agccagcgga gaggaaagct gagcgccttt 1560
agcggcagaa tcctgcacca gccagaaatg gccgccatga gactgatgcc caagttcctg 1620
aactccacca acagctggtg gaccctgacc acactgagct tcgtgctgat cgaggaagcc 1680
agacagccca gcagacctac cggcagaaca cctaccacca gactgatggc ccctgtgggc 1740
agcgtgatga gctgttctct gctgacccag ccttctccag ccagcgcctg tacaatgcct 1800
ccactgctgc atccacagtg ggcccctcat agtgctggac tttctccagg cgcttgcaga 1860
cctgcctgca cctgtatcag catgaccacc atcagcaggg ccacatgggg cccagtgtac 1920
tacgtgtgca accggatgaa cgtgtccagc gtgctgaagc ccttcctgtt caccgtgcct 1980
atcgaggaca tgagagagtg caccctgggc agaaacagaa tgaatgtgtc ctctgtgctg 2040
aaaccctgtc tgatccctgt gccaatcagc gagaagaaga ggaagctgcc caacatcgag 2100
atcacccctc agcggtctaa ggccatgctg cagaagcagt gctgctacaa cctcgtgatc 2160
aagcaccctc tgatcttcag aatcaacctg cggcggcagg gcaagaccaa agatggcgtt 2220
gtgcagagcc tgggcttcct caaccagcag atcatcctgc agaaagagtt cttcatctgc 2280
ctgctcatgt tcatcaagcg gtggaagcct gccgccacca agagcagaaa gaagggccac 2340
accaagaaca gacggaaggc caagagaaag ccccagatct acctgttctt cctgaccgtg 2400
tgcggctttc acctgaaaaa gaccagcgcc aagtggctga agaagtccac caagtccaga 2460
tccaacggca tggaagcttg cggcacacac cccactccta gactgagctg cctgagagtt 2520
agatgcggcg gctggctgtg tggctggaca cctagaggta gaaagtccgg cgtgatgaag 2580
tgctgggatc tgtgccccgt gcacaagaag agaggcctgt tcagactgga ttttcacccc 2640
agaagcagct ccggcaaggg aaagaacagc ccctgctgcc aaaagaaact gcgggtgcag 2700
aaccagggcc atctgctgat gattctgctg cacaatgacc gggtgttcct cgtgaagatc 2760
ggcgagaagc tgaagcactg tttcaaggcc tggggctcca gacggaaccg gcggtacaga 2820
aagatctacg gcgagctgaa gatgtccctg caggccttcc tgatccacct gagaaaggtg 2880
gacacccacc acctccaggt ggtcaccaaa acagtgaccg ccacaacagc cgacggccag 2940
agaatgcgga gactgaagtg caaggcctgc cggctgagat gggccagacc tgaacctgct 3000
gctcaggccc ctcctaagag ccactttcca cctcatccta gcggccccag cagaacaagt 3060
agcctgcagc tgagaagcct gttctttagc cactgcctgt gcagccagaa gaaggaccct 3120
gccggcaagc tgaaaaagct gctgaagaaa agcagccagc tgcggagaag ctggcgcaat 3180
gtgtccagaa tcagcacccc tcctccactg atcctgtggc ctcaagctgc tcctgtgtcc 3240
gtgatcacca tgaagctgtg ggagaagcac ttcaagggcc tgaattggaa cctggtcgtg 3300
tggattctga acctgaagat gatgacctac atggaaatgc actacggcca tcaggcccca 3360
caggtggcaa tgctgcctaa gctgctgtgc agacagatgc tgcccactct gagcacactg 3420
cagcagagac atcctcaggg cccttgtcct cctcctgtga cacctctgag agtccagtct 3480
gtcctgctgc tgggagtgcc tcagacagcc agaggaccta gaagaaaggt cctgatggtg 3540
ctgtggctgc ccgccaatca gtctctgcag aaaagccagg ttttccagtg ggtgctgcgg 3600
acagaggtgg cccctagatg tcctagatct gccgtggaca tcagccccgg acctacatct 3660
cctagcctgg cctcttgtgc ctctgtggcc attggaaagc tggcactgct tggcgcctct 3720
gctccttgtg gtgctgctgg cgctagagag gccggaagat ttgctgtgct gggcaccatg 3780
gtcatgaagc tttgtttctt ctacctgctg taccggctgc gcatcccaag cctgaggaag 3840
tacagacagc acctgaaccg gaagctgcac ctgacaagat cctgcctgat cgatctgacc 3900
atgatgatgt cccagaagct ctggaagaac cagcggaaga gaatccctct gccatctcca 3960
cggcaacatc tgctgccaca gtaccctctg cacccacctc caccttgtct gctgttgctg 4020
caccatagac accacctggc ctttctcgag atggcctgta gctctcagca cacccacagc 4080
atcaagatct ggatcagctt cagccatgaa gtggaccctc caggcagcgt gtggatactg 4140
ccttgcgatc tgcctcggat gctgccaatc tcttcacccc tgcacagacc ccagatgcct 4200
ttctggacct gcacctttcc tgccacaacc tggggcacat gggagacacc ttctacatgg 4260
ggctggcgga ctttcagagg cgctagcagc agcacatccc gggacagcag atccttcttc 4320
acctctgctc accctagcag gccctgcaga atgagactgt accagtgcaa gaagaagctc 4380
ctcctgaaac tgctgaccac caccacaagc agccccagaa gatcccctgc tctgagagca 4440
agaggcggca ccacaatcgg cgaagtgacc agctgtacca acctgagcgt gcccatgatg 4500
ctgaccatcc tgatttggaa gcgggtgttc atcctcctgc tgagcgataa gaagggcgcc 4560
aagaagatca ccttcctgcc tattcctcca cacctgagac accctctgct gctgttcgag 4620
aagaaacggc ctgagtggct gagcatggac ctggacggaa tgctgacagt gatcggccag 4680
ggactcgtgg gcatgacccc tagagatctg ggaacagtgg caggcgccac cgctcagatt 4740
cagcgaccta tccaggtgca gactggcggc agactcagaa gaaacctgca gagaaacctg 4800
aaggtgctcc aggtgtccgt gtacagcggc aacctgctgt cctttagcag acggggcatg 4860
aagtctagcg tgcggctgaa aaaccgcgag tgggagaaac ggaagcagat tctcggaggc 4920
ggcggaaagt acaaagagta cttcctgaag cgcatcctca tccggaaggc tatgacagtg 4980
ctggccggcg acaagaaagg actgggcaga ttcatgagat gcgtgcagag cgagacaaag 5040
gccgtgtctc tgcaactgcc tctgggaaga aacatggaac accggttgac catggacagc 5100
gccctgagcc tgacaaagag agagggaccc gagacactca aaaagaaata cctggtccag 5160
caccagatga agtgtctgac cgccgtggat tgtctgcagg ctttttggga catgggctac 5220
ccctacgatg tccctgacta tgcgtcc 5247
<210> 1138
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 4B
<400> 1138
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgatcc agaagaagaa gcagaagtcc 720
aacctggacc tgcagcacca gcgcagacgc aaaaagaaga aggacaaggt cgagatccgg 780
aatcggagcc ccaaggccaa tagcacagag tgtcagggcg agcacagcag agagcagaac 840
ctgctgaatc tggtgcagct gaaccctcac agccctcacc acagaaagga cgaagaggac 900
caccagaagc ggcaccacca ccacaatcaa aagaaaatga gcgtgatggc caagaagtcc 960
cagcagcctc tcggacaggc ctttggctct ctgtgtcagc tggtgtccgc cgatttcagc 1020
gcccctcaag tgaccagact gcggagcctg aaccatctgc tgatcaacga gggcaacaac 1080
cactggccta gagtggaaat gcctaccggt tggctgctcg tgggctacaa caccagaaac 1140
acagcccaga atcctcggct gcagcagcac ctgaaacact ggcagcagtg caccagagcc 1200
agatggtgcc aagagccttg tcagaccctg accttcttcc atttcttctt ctttttcaaa 1260
acggtgtccc tgtgctgccc cggctggtct aaaggacaac ctcctccacc tggcctgaag 1320
ccttctagcc tggcttctca ggtggccaga accacaggcg tgtaccagca cgtgtggctg 1380
atctgcttcg tgttcttcgt gtgcgtggaa accggcttct gtcacgtggc ccaagtggga 1440
ctcgagagac tggtgtctct gagcggcatc accgacgtga accattgggc ccagcctaag 1500
ccatctccta gcaaaggcac cggcatgaac agacccatcg gcctgagagt tggcaaaggc 1560
gtgtgggcca gactgagagc ctccgtgtct ttctggaccc tgctgcctac aacaggcgtg 1620
cggacaagag gaagccctct gagactgaca ctgtggcctc cacggaacat cctgaacagc 1680
ctgcctagca gcatggaaat cgccgtgctg caagagaacc gcaagaccag aaaggccgcc 1740
agagagaagc acagaaagac cgacaacctg cacctgtgct actaccacag ccagagcaac 1800
cggaacaaga gccggcagat ggaaagcctg ggcatgaagc tgcagagccc tctgtgggat 1860
tgctccacca caacaggcac acaccacggc tgtctgtggg agatccctag cgttacactg 1920
ctggcctgca gagtgaacgc cgtggaagaa ctgcacagca ggcggatgtc tgtgcggatc 1980
gtgaagaact gggtgtcctg ctgttacgtg cgcctgtctg ctgtgggcct gtctacttgg 2040
agcgccctgg acgtggtcat caacctgaag cggctgcaga agttcagcca gaagtctcag 2100
caccactgcg ccctgagaaa gatcgagtgg gccacaaagc tgagcctcgg cggaaaagct 2160
ggaccccagg ctcaagagaa ggccaacgcc aagaagatgc ccttccagcg gtggatcttc 2220
agcaatcagc tgaccgtgca gatgctgtgc ctgcctattg aagccctgac tgccctgttc 2280
acctgtcgga cagccagcat cagcgtgaac atcagcaccc tgatgagcat cctggaagcc 2340
cctctgtttt ttcacggcga cctgtgcgag gaaaagaaga acggccggat cagcagccag 2400
gctcctctca gactttggtc ttggtgcggc acaagccaga cctactttgg cagcaccgcc 2460
aagaaaagcc ccaccagctt ttgctgcgag tggggaggac aggctcaccg gcagagaaat 2520
accggaatgg aaatcctgct gtggattctg ctcaagatgg aaattcagat cttcaagatt 2580
tgcctgggcg agatgcagct gtgcacctac acaccccaca tctgcagaca cacctgtaga 2640
ggcggaccta gcgccagcga tagatgctgt agctgtagcc ctagcggctt cagcgccgga 2700
agaggcagat gtccagttca gggatgtctg cggcctcaca gagtgcagct gctgagaaga 2760
tggggccctg gatctcctgc tggccagaga ctgtctaagg gctttcagct gctccgttgg 2820
tggggaccag gatctccagc tcctgagcct agaaagggcc catttccacc acctgatcct 2880
ccatggcctg tgaccgctgt gacagtgatg gctggctctg tgcctagcgc tcagtctgtg 2940
gatgctctgg aaagccctgg acctctggca ctggaaggac ctagcagccc cagaaacctg 3000
ctctggcggg aaatgagcat cttcctgcct ggcatcttca cctctcggat tctgaacctg 3060
caagtgctga agaagatcct gcggagcttt atgaagctgt accactctct ggtcatgtgc 3120
ctgcggctgc ggaccaagct ggaaaaagct ctgagcgctc tgttcatctg gccccagcac 3180
agctacaagc agaggcctcc tctgcagcct gtgcaggtcg tgctcagact gggaaacctg 3240
cctccattct tcagaggcag cgaggtgccc tttcctagac cttgccggac caagatgctg 3300
aaccagaagt gtctggcccc tttcatcaca cacccattcg cctctcagcc cctgggacaa 3360
gagatgccca acaacaccca gatcagactg ctgaagcccc tgctgacccc tgacaccaga 3420
tggatcttct ccaaccagct gcagacagtc cagatgctct gtctgccacc tctgaagcag 3480
ggcgagagaa tcatttggcc cctcggcggc tttcagatcc ccaacttctt ttggagcctc 3540
ggaatcggcc acactggcgc ctggtggcat actggaaggc ggagaagaga atggggcggc 3600
tccaccgtgt ctagaagccc actgtggatc agctccatga tctacctgag aggcatggcc 3660
ttcgccagcg acagctccat cagaaccacc agagtgtcct ggtgcagaag atgcggcgcc 3720
aaatctgccg ctgcctccag cctcaagaag aaaccccggg acatctgtcg gatcagcgac 3780
tctaagaaga tgacccagaa gcgcgagagc accctgggca atttctggat gaagctcctc 3840
cagctgccag acaagaagaa gaagtctacc gaaaagacca agatcatcaa gaagatgaag 3900
aaacggatca tggtccacat gtgcagctcc ctggctctgc caacaggcct gacatctctg 3960
atcctgccaa gcagcgatct ggccgtgctg atctctagct ccaccagcca ctttctgatg 4020
cggagcccag tgctgcctag ctccagactg acttgtgcct ctccacagct gcccagaatg 4080
tggacctggt ccagctggct gaagtggctg aaaaactgga agcggttcaa gcttaaaaag 4140
aagtacatcc tggccatgac gctgaccctg aacgggcatc caagaaccgc ctctatcacc 4200
ctgcctacca ccagcctgaa gggctctaga accagctgtt gccccagatc tcaccccaga 4260
ctgcctagga caaagtggcc tctgcagtgc ctgctgcaca gcctgggaac aactggaaca 4320
ctcgtgtggg aaaggggcgt gctgcagatg agaagtctgg aagctcactg ccctctgcag 4380
accttccacc tccaccactg tagaactcag cccagctctt gccctcctgc atggattctg 4440
taccaaggac agtggagcgg agccgtcgtg ggacttagac ctgtggctca ccatctgcca 4500
agacctattc agggcctgca ctgcccacag gctccacatc aaccagctct gtcttggggc 4560
aagtggcccg tgggaatgac aggacctgcc agatgttgcc ggtggcctag acgggaactc 4620
aaaaagaatc tgctgctccc ctgccggtgc agacgcgagt atagagtgac aatgggccaa 4680
gccttcggca gctttagcgc cgactttagc gctccccagg tgttgaagaa gaatcggaag 4740
cagaacaaga ttatctgcaa gggccaccgc atcacaagcc tgatcctgag ctttcagcgc 4800
gtgaaactta agaagaaagt caacgcctgc tctcccgcct gcacctctaa agcctggact 4860
cccagaaagc tcgtggggag agccgtcaga agaaagggca tcatctgtat caagaatatg 4920
ttcctgcagc ggaagggttt cctgaacctg agccacgtgg aaaagttcgt gcctccttct 4980
cctcctctgg ctctcggccc tagaatgcag ctctgtaccc agctggcccg gttcttccct 5040
atcacacctc ctgtgtggca catcctggga cctcagaggc acaccccttg tcaaaagaag 5100
gtgccctccg ctagcccatg gggccttaga ccatctcctt gcctgagctg gtcctccaga 5160
attgtggccc ctggacacgc cctgagctgt cggactagaa gaagatggtc cagcaagggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1139
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 1A
<400> 1139
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaaccgag 120
atccagctga ccatgaacga cagcaagcac aagctggaaa gccccgctct gaaacaggtg 180
tcaccagcct ctccacctac tcagcagcct cagacacctc aggattctag acaggtgctg 240
gccctggcca agaaaaccct gacaaatgcc tccagagccg gacagtttcc tgtgtggcgg 300
agaacaagca gaggcatgag cctgcagtgg aagtccggca atgcctgcac acctctgaga 360
tgccctagca gaagccctgc cacattcctg acagccctga atggctggca cagatctggc 420
ctgagagccc agatgcctag ctcttggtct agcagcggca gaacactgaa gctggcccct 480
ctgcaagtga ccaccactct gaagctgatc ctggtcatgc tggaaatcgt gaccgagcgc 540
tccctgctgt actccagaat gtgtctggtg cagatcccca cacacacctg ggagcccgat 600
tacttcgtgt ccctgcctat gatgttcagc tgggccacac agtcttttcc cgtgggcgcc 660
gtgtttctga ccagacctgc cattccttgc tgcagctgta ccagccacag caacccttgg 720
agccagagca atcagcagct gaagtggacc cctcacatcc tgaagtccgc cagcttcgac 780
aagaaaggct tcgtgatcct gagccggcgg agcaagattg aggcctctcc tatcggctct 840
atcgccagct ctcctggaca tcctctggga cctacactgg ccatcagatt catcagcgcc 900
cctcagccta gcagctctac agtgacagct gcccctagcg gccagtactt tatcgccaag 960
aagcggatca agctgcggcg gaacaatatg ggcggcaaca gatccatctg cctgaccaga 1020
aagcgcaaga gagagaagcg gagccagaag tccaggcaga accatctgca gctgaaaagc 1080
tgcagacgga agatcagcaa ctggtccaag ctgagaagcc cctggatctt caccaagtgc 1140
gagatctgcg tgaagaacac cgccatcctg gctatcaccc tgatcacccc tcaggaccct 1200
catctggacc ctgtgtgtca ccctcataga aggcctggat ggaagggcca ccatagagtg 1260
gtgttctctc accatcctag cggcagcaca aagagccact ggcagcaaag agaacgcgga 1320
ggcggcagac gcgagaagaa gggatgtaga gaacagcgga aggtggtcaa gaacccctct 1380
cagcccgtgc ctctgagaaa cgatggcatc accaacggca acgactccac cagaagctgc 1440
tccatcagcc tgaagaaaag cctggaaaag atgcccctga tgcggagagc cagacctacc 1500
agctgtagca cctgtagaat gtggtggaag ggcaagaaac ggcggaaaga aatcgtgcct 1560
atgagcctgg cctgcagcat caccgtgtct tttgtgggac agatcagcac cctggtgctg 1620
gatgtgtcta gcatcagcca ttggcggctg ccctgtaaag tgaccgagag cagctccagc 1680
ttcttctaca ccagcgacag gacccctctg agcatcagca gaccaaccag cagagctaga 1740
cagagctgtt gtctgcccgg actgacacac cctgctcacc aacctctggg cagcatgagc 1800
actagaagag agatgccaag ccaggccaca ccttctccac ctggaccttg gagagccgct 1860
ctgggcaaag aagtgaagag atcccagagc aagctgcgcc tgagaaacac aagccctggg 1920
gagaagaacg atctccagct gttcgtgatg agcgacacca cctacaagat ctactggaca 1980
gtgatcctgc tgaacccctg cggcaacctg cacctgaaaa caacatcact gcagcggcca 2040
cctcggagca tcctgtctct gaatggaatc tgggaagtga tgccccggac actggaaggc 2100
tgcatcagcg tgaaggatca cagaaccagc cagaaccaca gcaagtgcat caccgaatgt 2160
gtgcggactg ccctgaacgt gtccaagaag agactgccta agctgatgaa gaagaaggac 2220
agcaccatct tcatcaacaa agtgcgccag aacttcaagc gcaacttcaa gaagaagaaa 2280
cccctcactt tcagccccag cagacggatg actcggagaa ccatgacaac caccaaaatg 2340
atgatgatgc ggcggaccaa gcggagaagg cgcaaaaggc ggagaatgac catgatgacc 2400
agacggaccc tgctgacaaa gaaaacctgt ctgaccccta gaaccagcgc cgccacaaaa 2460
gctctgccta gacagaccat cagccagcgg aggcctattc agaccccacc tggaacatct 2520
ctggccatct ggggcagaac aagactgacc ctgacaggca ccagatccag cggaacaaga 2580
gcctctcctt ccgccgtgtg cctgtgttgt tggacctgtc caagcagaag cttcccagcc 2640
gcttctccta gtggactgag agcacctgtt ggagcccagg ctcctcctga agtgacactg 2700
agagcctctt gtgcctctag cgcctctaaa gcctgtgctg gactttggcc ttggggagcc 2760
caagttcgag ttggagctgg aacaggcgga ggacctgctt gtgttcctgt ggctgaagct 2820
tctacaggcg catggacagc tgaaggcgcc gctggaacaa gatgtagagc ctctagagcc 2880
ccttgccgcc aacttcctgc tagctcccct accaagtgtg aaatttgtgt gaagcgcaga 2940
cggcggagaa agagaagcag ccagtctaga agccccgtgc ctaaaaagcg cgagaggatg 3000
atgctgcctg tgcgggccag aacagctaga tctgcacttc ctcagggcag agcacctctg 3060
gaagggatgc tgcttcctag agcactgcct agcctgctga gcagaatgcc tgccagaaga 3120
gagtcccggt tttggctggc tctgcaggca cttggactca gacctccaca tctgcctagc 3180
tgtcatcctc tgcctcaact gttgggccct ccacctcctc atcaggcccc aatgacactg 3240
aaggccctgg ttaagacctg gacacagttc cgcaactacc ccagagccga caagaagaat 3300
gtccggtcta ccgccttctt cctgctggac atcatcctgg gcgattgccc aagaacaatg 3360
gccggacctt ctgcctctct gcatcctgca tctggcagag cctccagaaa gacctggcag 3420
agaaggctga gagcttgtag agcaggcgga cctgctggat gggctagaca ggcctatcct 3480
agactgaaaa ccttcggcgt gcccctgggc tctattctgt gtctggccgg cagcctgtcc 3540
acaatgatga tcattagcac caccagacaa gagtgcggca ggcgggcttc tgtgccttgt 3600
agacctatga tcggaagcgc cagaccagga ccttggcgga catctgctat gcctagtgcc 3660
atgggagtcg ccctgcctac ctcttgtgaa agcggaagat ctcctcctgc caccggcgga 3720
agaatgccag gatctcagtc tatcatgatg agctggatgc ctccactggc tccatgtgcc 3780
gcttgtccat gttctcccgc tcctacactg tgcccagcac atcctgctag agcaccaaca 3840
gccgtgcctg cctttacacc tctgtctgct catcctgtgc cagtgctgtc tggatgtcac 3900
ctggccgtca gaacctccat gctgacactg ctgcccatgg aagccaaaaa gagcatgaag 3960
cggtccaacg ctaagaaaat ggaagatatg atctgggaga gccggctgcc actgaggcca 4020
caaagaggac ctagacctct gcacagatgg ctgcagcaga caaccggctg tagccagagg 4080
cggatcgtgt tctttctggc cccatacttc cctcggcacc ctcacagatc tccaccaaca 4140
tcttgcccac ctctgctgga agctttccca ctgccaagag cttctctgag ggccacagtg 4200
ccaagacata gctctgttct cgccaccggt ctgcacctcc acagacagat ttctctgccc 4260
ctgagaggat tcctcctgca ccaaccactg ccaggacagc atctgtggct gtctcacaga 4320
ctgaggctga gactgcccag gacacagcca tctttgcctg gaccatgtgc aagcctgctg 4380
tccacactgt ctcagccacc acctcaggct ccatctcaag tgtggactgc cgctacactg 4440
agatgtcctg ctgttcctgc agctgcctgt cctcctgctc tgagatccat gcctaagagc 4500
cggaaccagg tgctgttcag acggaatctg accccaagcc agctgagaac actggcccca 4560
ccttatatgc tgctgcccca gtctctgtcc cagagcctga gtagaaagca gatccctagc 4620
cagtccatgc tcgtgggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1140
<211> 4672
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 2A
<400> 1140
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaagaaag 120
atgcagagcc tgaatcaccc cagcagactg accaatggct ctcctccact gcacctgtgc 180
cagcctctga gaatgagcag aacccctcct agaagagtgt gcgccgctcc tccacataga 240
ctgctgggcc cttccagatg gaaccctcgg agaaagacct ggaagatgcg gaagaagtac 300
gcccagaagc ctagccagaa gaaccacctg tacggcggca agaagcgctc taagttcagc 360
agaagccacc tggacttcag cccctactgg atgaagaaag tgaaggtgct gttcaaggcc 420
gaccagagcg agtctagcct gagcagcgga agatgcagcc tgatggaaca gatccctcac 480
ctgaagtctc ggcggaagtg gcagatcaga cacgtgctga agaacctgtg gctgcccatg 540
agaagcctgg gagaaccttg gagagccggc tttcagtggg gagagtctcc ttggcaagtg 600
atggcctctc tgaccggcag agccacattt ctgctggccc tttgggaatg tagcctgcct 660
caggcaagac tgtgcctgat cgtgtctaga accctgctgc tggtgcagag ccggaacaag 720
aaaacaaagc tgtggttcag cctgatcaac atccaccacc ggaagaaccc actgctgcct 780
atgagatggt ggtgtaccag aggcggcgga aagcggaaaa agaaaatgtg caaggtgtcc 840
ggcggctgca ccgcctgtgt tgagagatgt ccttggaagg gcatctgctg gaagtggcct 900
gtgacagtgg ccgccattag aatgtgtgcc ctgtctcacc ctagcttcta catcagcagc 960
accgtgtgct ttctgagcaa gcactgcatg accgcctgca ccagaaagag aatgaagacc 1020
ggcgccatcc aagagaaggg cgctattcaa gagaaagggg ccatgaccaa gcggatctgc 1080
gtggtcaatt tcgaggcctg cagagagatg gaaagcctga gcgcccctga gaagatcacc 1140
ctgtttgaag cccacatggc ccggtgcacc tccatcaatg tgctgtgtgt gcgggccagc 1200
ctgattgaga agctgatgaa agaaaagcgc aagatgaagc ggaaccaggt ggcctctcca 1260
cagatcatgc agcggctgtt catcaagggc taccagaaca accacttcac cttccatctg 1320
caaaacttcg ccttcttcag ctccttcggc aacaacaagt acatcaatat cctgaccatc 1380
ctgttccacg tgcggaacat cgtgtacggc atccaagtga tgctgtgcgc tagccctcag 1440
attatgcaga gaaccagcgc cgaccggttc cggatgaaga gaagaatgca gaatctggac 1500
aacctgggcg tgccatggcc tctgttgcct ggaatcccat ctctgaacgc ccagtggatg 1560
ttcctgagaa tcgcatcccc gcaaatcatg cagaggatga gcgccgtgaa cttcgagaca 1620
atccgggcca gaaaccggaa catgaagaaa accatgagcc acctgatcgc ccatcaggcc 1680
ctgaagatga gcggcctgag actgtttcac cccagactgc tgacacggaa gaagcccgga 1740
aaactgctgc tcgcccatat gtacggcttc agcacctacg gcacccagaa aggcgagtgc 1800
gtttgtctgc agtgtctgag cggcagcagc ctgttcattc tgaagcagcc cctggacctg 1860
aagatcagca agaccttcat gggccacaga gagggcagcg agtctgataa tctgggcctg 1920
ctgtatagct tccctccacc ttatcctatc agcgagggcc tgaccatgac caccggcaga 1980
aacatcaaca gcaactccct gatgaccaac tgcctgttca gccccatctt cctgtgccac 2040
cacgccatca tgcacagaaa gatgacaagc cctcacttca ggctgttcag cagcaagatc 2100
ccacatcctc aggtgccatc tgtggtggcc ctgtgcaagt tccgggcctt catccacaca 2160
cctagaagcc ctggctgcag cgtgtacgcc aatatgtgct ggcccaagtt cttcctgacc 2220
ttcagccagc agtggtccag cgtgacatct ctggaatgga cagcccaaga gagaggctgc 2280
agcagctggc tgatgaagca gacatggatg aagtcttgga gcctgcggga ccccagctac 2340
agatccatcc tggaatacgt gtccaccaga gtgctgtgga tgcctacctc taccgtgctg 2400
caggctcatc cacaagttcc agctctggct cctcaagcct ggtggcctgc tagaagagga 2460
cctctgacat ctgccccatc cgctcagcag tccctgacca gagagaagat tatcaacccc 2520
accatcagct gcccctttca gagccccacc aagagactga tctaccctcc tagcacctgt 2580
tctctgccct gcagaggctt cctgcctagc agatttcctt ggggcccacc tcctctgaac 2640
agcgtgatcg tgcacaagat cgtgctggtg ttcctgaagt ccctgtccag ctacaactgc 2700
gagcggagaa tcagcggcat ccagaagaga gccatcgagt tcgccgtgct gaaactgctg 2760
aatatggacc tgcctctcga gaacacacag atccccagaa caagcccact gtggaagatc 2820
acaatggtgc tgacataccc caactgcgtg gtgcatgtgc tgatgtttgg cgccctgaga 2880
gccacagctc ctgctacagc tgcacctcag gctcagaccc ctcattggag agctgccaca 2940
acaagcagca tgagcagcag ccctagagcc gagcctacat cttctagctc ttgggccacc 3000
tgttggccca gatgctgctc cagctcttgt tactggtcac tgtctagctg gcctccagct 3060
ggcgccgctg aagctacaaa taccagaacc agaagccgcg agagccagag gggtagaatg 3120
ctgacttgga gaagctccct gtggttgcag ggcaccagat gttttacagg cgtgcggacc 3180
agctccagat acaagaaaag aggcgtgatc gcctggcgga gacagatcaa tagacggaag 3240
ctgcagagaa agaagcactg gaacagcgcc tacctgggca gaacactgct ggtcacctgt 3300
atcctgtatc accggtggat cgtgacctcc atgtgtcagt cccagagatg gctgaccagc 3360
accacaagta gatctagcgc cctgatgtgg accgagctga gcctggaacc atggattccc 3420
tacctgcatc agcagaaaac ccagcggaca ctggaatccg ccggactgtt tccttggctg 3480
cacacccagt gccaagagaa gaaaagcaga aagctgatgt ccagctgcac acacccctgc 3540
acaatgctgc tgccacaggg atgtcatcct gcctggctga gccctatctc tgcctgtcca 3600
agactgctgc catatccttt tcacgtgctg gctctggaag tgacctttcc tcctggaacc 3660
gccatgcctc agatgcagtt gcaggctctg gctatgtggg agaaaggctg ggataagcct 3720
ggcaccagcc tgcagtgcta cctgaacaga agaagaaaca gccggaagca gagccaggtg 3780
caactggcca ttcaggtgct gctcgtggac aagcacaagt actttctgtt cggccaaaag 3840
aaaggccaca tgatctttag cctggccaac ggcctgtggt ttaacctgat tttcaactcc 3900
cggaagaaac tgctcgagga catgaagcaa aatggcttca ccggcaaagg cctgacacac 3960
cccgtgcctc tgaagcggac tctgcagaac aaaagaaaca agaatatcaa acgcgtcaac 4020
cagaagaagg gcaacatcaa gcggaagtcc atcctgctgc acctgattgt gctgaatagc 4080
cccgagagca acctgatcct gatccagcat ggcggcatct tcacctttcg gttctgggtc 4140
gagaagctgt cctggaacat ctgcaagaac ctgagcctgt acctggacaa gttcgtgcag 4200
agactgctgt acgtgtacat catcgagaca aacgtgttcg tgctgaacct gtttcatgtg 4260
cccgtgaacc agatcttcat gatggccttc tacctgaagt acaccgagaa ggcctgggtc 4320
atggaactgg aatggctgat ccaacagcag tgctatcagg gcagctgcgg cagagcttgt 4380
tcttgtggaa gaggctgtgg cacccctaga ggcgattgga agagacatcc tcctcggaga 4440
gccttctgga agcctcctag ccagggcatc tctagctgtc tgatgaccgg ctgttggctc 4500
gagaagaaag ctacctggat gcggcggacc cgccggaaga agagggaaga tcattgcgga 4560
ctgagacacc ccagctggcc ttggacaaga tgtctgagga tgaggcctcc aagaagcggc 4620
tacccctacg atgtccctga ctatgcgtcc taaaggcgcg cctagcggcc gc 4672
<210> 1141
<211> 4687
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 3A
<400> 1141
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaggagct 120
gctgctgcct cttgtcagtc tcctccttct cctcgggaaa ccacacctag ctccgacgcc 180
accagacgga caagacctat tgccgctcag agcaagaaaa ccatgacagc cgccggactg 240
acccctatga tccggaagat ccagaagcgg cggagaaccg ccaaccggtg tctgagagtt 300
agatgtggcg gctggctgtg tggctggaca cctagaggac agaacaccag aagcaccaac 360
ctggaaaaga accccagcct gaagaagcag agccagcgga gaggaaagct gagcagcctg 420
ttcttcagcc actgcctgtg ccggaacagc agaagggcca cacctacatc taagggcagc 480
ctgcggcgga agtacctgag agtgcctatt cctccacacc tgagacaccc tctgctgctg 540
atggacctgg acggaatgct gaccgtgatc ggacagggac tcgtgggcat gacccctaga 600
gatctgggaa cagtggctgg cgccaccgct cagattcaga ggcctattca ggtgcagacc 660
ggcggcagac ttacacctcc tcctctgatt ctgtggcctc aggccgctcc tgttgatcct 720
cctggctctg tgtggattct gccctgcaag aacaagaagc ggagaaagct gcggcccaag 780
cggctggact ttcaccctag atcttctagc ggcgtgtccg tgatcaccat gaagctgtgg 840
gagaagcact tcaagggcct gaactggaac ctggtcgtct ggattctgaa cctgaagatg 900
atgaacatcg agatcacccc tcagcggagc aaggccagaa agtccggcgt gatgaagtgc 960
tgggatctgt gccccagcga gaagaagagg aagctgcctc tgcctctgac cttcagcacc 1020
ctgctgtggg actctagaca tagaggcgcc agctccagca ccagcagaga ctccagaagc 1080
tttttcacca gcgctcaccc cagcagaccc tgcagaatga gactgtacca gttcctgatc 1140
cacctgagaa aggtggacac ccaccatctg caggtcgtga ccaagaccgt gacagccaca 1200
acagctgacg gccagagaat gcggagactg aagtgcaagg cctgccggct gagatgggct 1260
agacctgaac ctgctgctca ggcccctcca aagagccact ttccacctca tcctagcggc 1320
cctagcagaa ccagttctct gcagctgcgg agcatccctc acgtgccaaa agccacagcc 1380
gctcacagcg tgacagtgaa gctgcagaag ggaaagaaca gcccctgctg ccaaaagaaa 1440
ctgcgggtgc agaatcaggg ccatctgctg atgatcctgc tgcacaatac ctacatggaa 1500
atgcactacg gccatcaggc cccacaggtg gccatgctgc ctaagctgct gtgcagacag 1560
atgctgccca ctctgagcac actgcagcaa agacacccac agggcccttg tcctccacct 1620
gtgacaccac tgagagtcca gtctgtcctg ctgctgggag tgcctcagac agctgctaga 1680
cagcctagca gacccaccgg cagaacccct accacaagac tgatggcccc tgtcggcagc 1740
gtgatgagct gttctctgct gacccagcct tctccagcca gcgcctgtac aatgcctcca 1800
ctgctgcatc ctcagtgggc cccacattct gctggattgt ctcccggcgc ttgcagacct 1860
gcctgtacct gtatcagcat gaccaccatc tccagagcca cctggcaggt ttccgtgtac 1920
agcggcaatc tgctgagctt ctccagacgg ggcatgaaga gtagcgtgcg gctgaaaaac 1980
agccggcgga acagacggta cagaaagatc tacggcgagc tgaagatgtc cctgcaggcc 2040
gtggctccta gatgtcctag atctgccgtg gacatcagcc ccggacctac ctctcctagc 2100
ctggcctctt gtgcctctgt ggccattgga aaactggccc tgcttggcgc ttctgcccct 2160
tgtggtgctg ctggcgctag agaggctgga agatttgccg tgctgggcac catggtcatg 2220
aagcacctga accgcaagct gcatctgacc cggtcctgcc tgatcgatct gaccatgatg 2280
atgagccaga agctctggaa gaaccagcgg aagagaatcc ctctgccatc tcctagacag 2340
catctgctcc ctcagtaccc tctgcaccct cctccacctt gtctgctgct gctccaccac 2400
agacaccacc tggcctttct ggaaatggcc tgcagcagcc agcacaccca ctccatcaag 2460
atctggatca gctttagcca cgagcagagc agcccattcc tggccagatc ctggaacacc 2520
atgcagtgga acaacaagaa aatggccatg acagtgatcg ctggcgccca ccactgtcag 2580
tacaagctga cctacaccaa agtgtggaag atgaattgga agaaaatgat gatcggctcc 2640
cagcacctcc tgttcagccc tctggatagc tctccactgc aactgctgct tcaccctcac 2700
ggcaagagat gcaacccttg ctgcagactg acatggatgt ccatgctgca gaaacagtgc 2760
tgctacaacc tcgtgatcaa gcacccactg atcttcagaa tcaacctgcg gagacagggc 2820
aagaccaagg atggcgttgt gcagagcctg ggcttcctga accagcagat catcctgcag 2880
aaagagttct tcatctgcct gctcatgttt atcaagcggt ggaagcctgc cgccaccaag 2940
agagagtggg agaaacgcaa gcagatcctc ggcggaggcg gcaagtacaa agagtacttc 3000
ctgaagcgca tcctgattcg gaaggccatg actgtgctgg ccggcgacaa gaaaggcctg 3060
ggcagattca tgagatgcgt gcagagcgag acaaaggccg ttagcctgca gctcccactc 3120
ggaagaggcc ctgtgtacta cgtgtgcaac cggatgaacg tgtccagcgt gctgaagccc 3180
ttcctgttca ccgtgcctat cgaggacatg agagagtgca cactgggccg caacagaatg 3240
aatgtgtcct ctgtgctgaa accctgtctg atccctgtgc caatcgacct gcctcggatg 3300
ctgccaatca gcagcccact gcacagaccc cagatgccat tctggacctg cacctttcct 3360
gccacaacat ggggcacctg ggagacacct tctacatggg gctggcggac ctttcggggc 3420
cctagaagaa aagtgctgat ggtgctgtgg ctgcccgcca accagagtct gcagaaaagc 3480
caagtgttcc agtgggtcct gcggaccgag aacatccgga agctgatctg gaccaagcag 3540
cggagcttcc tgtctctgtt ccccaagctg agagccaccg aacagatgac caatgtgggc 3600
tgcgccttca gcggccggat tctgcatcaa cctgaaatgg ccgccatgcg gctgatgccc 3660
aagttcctga atagcaccaa cagctggtgg acctgtacca acctgagcgt gcccatgatg 3720
ctgaccattc tgatttggaa gcgggtgttc attctcctgc tgtccgacaa gaagctgctg 3780
aagaagtcta gccagctgag gcggtcttgg agaaacgtgt cccggatcag ccaccagatg 3840
aagtgtctga ccgccgtgga ctgtctgcag gccttctggg acatgaacat ggaacaccgg 3900
ctgaccatgg acagcgccct gagcctgaca aagagagagg gacccgagac ttgcaagaag 3960
aagctcctgc tgaaactgct gacaatgagc ctgagcaaca tcctgatgaa gttccggctg 4020
cggctgagaa tcccaagcct gaggaagtat cgccagcatc tgaaaaagac cagcgccaag 4080
ggcgagaagc tgaagcactg ctttaaggct tggggcagag gcccacctct gcacacaaga 4140
agccagaaga aagaccctgc cggcaagctg aaaaaactga ccacactgag cttcgtgctg 4200
atcgaggaac ggcggaacct gcagcggaat ctgaaagtcc tgtggctcaa gaaaagcacc 4260
aagagccggt atctgttctt cctgaccgtg tgcggcttct tcgagaagaa acggcctgag 4320
tggctgtcct ccagaaagaa gggacacaca aagaatcgga ggaaggccaa gcggaagccc 4380
cagatcgtgc acaagaagag aggcctgttc ctcaaaaaga aatacctggt gcagggcgcc 4440
aagaagatca ccttcctgtc caacggcatg gaagcttgcg gcacacaccc cacaccaaga 4500
ctgagcgaca gagtgttcct ggtcaagatc accaccacca caagcagccc cagaagaagc 4560
ccagcactga gagctagagg cggcaccaca attggcgaag tgaccagcct gtgcttcttc 4620
tacctgctgt acggctaccc ctacgatgtc cctgactatg cgtcctaaag gcgcgcctag 4680
cggccgc 4687
<210> 1142
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 4A
<400> 1142
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaatccag 120
aagaagaaac agaaatccat ggccaagaag tcccagcagc ctctggtgct gaagaagaac 180
cggaagcaag agtggggagg acaggcccac agacagagaa acaacgccaa gaagatgccc 240
ttccaagagg aaaagaagaa cggccggatc agcagcagcc tgatcctgag cttccagaga 300
gtgaaggaca gcaagaaaat gacccagaag atgtgcagct ctctggccct gcctacaggc 360
ctgacatctc tgatcctgcc tagcagcgat ctggccgtgc tgatctctag cagcaccagc 420
cactttctga tgcggagccc tgtgctgcca agctccagac tgacatgtgc ctctccacag 480
ctgccccgga tgtggacatg gtctagctgg ctgaagcacc ccagaaccgc tagcatcaca 540
ctgcctacca caagcctgaa gggcagcaga accagctgct gcccaagatc tcaccccaga 600
ctgcctagga ccaagtggcc tctgcagtgt ctgctgcaca gcctgggaac aacaggcaca 660
ctcgtttggg aaaggggcgt gctgcagatg agaagcctcg aagcccattg tcctctgcag 720
accttccatc tgcaccactg cagaacccag ccaagctctt gtcctcctgc ctggattctg 780
taccaaggcc agtggagcgg agccgtcgtt ggacttagac ccgtggctca ccatctgcct 840
agacctatcc agggcctgca ctgtcctcag gctcctcatc aacctgctct gagctgggga 900
aagtggcccg tgggaatgac aggacctgcc agatgctgtc ggtggccccg cagatctcag 960
aagtctcagc atcactgcgc cctgcggaag atcgagtggg ccacaaaact gtctctcggc 1020
ggaaaagccg gaccacaggc tcaagagaag gccagacctt ctccttgcct gtcctggtcc 1080
agcagaattg tggcccctgg acacgccctg agctgtcgga ctcgtagaag atggtcctcc 1140
aagtgcagag gcggccctag cgccagcgat agatgttgta gctgtagccc cagcggcttc 1200
agcgccggaa gaggcagatg tcctgtgcag ggatgtctga ggccacacag agttcagctg 1260
ctgagaagat ggggcccagg atctcctgct ggccagagac tgtctaaggg cttccaactg 1320
ctgcgttggt ggggacctgg atctccagct cctgagccta gaaagggccc atttcctcca 1380
cctgatcctc catggcctgt gaccgctgtg acagtgatgg ctggctctgt gcctagcgca 1440
cagtctgtgg atgccctgga atctcctgga cctctggctc tggaaggccc tagcagccct 1500
agaaacctgc tgtggcggga aatgagcatc tttctgcccg gcatcttctg ccaaaagaag 1560
gtgccatctg ccagcccctg gggacttgtt cctccttctc caccactcgc tctgggccct 1620
agaatgcagc tgtgtaccca gctcgccaga ttcttcccca tcacacctcc agtgtggcac 1680
atcctgggac ctcagagaca cacacctcag gtggtcctga gactgggcaa cctgcctcca 1740
ttcttcagag gcagcgaggt gccctttcct agaccttgcc ggaccaagaa cgagggcaac 1800
aatcactggc ccagagtgga aatgcctacc ggctggctgc tcgtgggcta caacaccaga 1860
aacacagccc agaatcctcg gctgcagcag catctgaaac actggcagca gtgcacacgg 1920
gccagatggt gtcaagagcc ttgtcagacc ctgaccttct tccacttctt cttctttttc 1980
aaaacggtgt ccctgtgttg tcccggctgg tccaaaggac aacctccacc tcctggcctg 2040
aagccttcta gcctggcttc tcaggtggcc agaaccacag gcgtgtacca gcacgtgtgg 2100
ctgatctgct tcgtgttctt cgtgtgcgtg gaaaccggct tctgtcacgt ggcacaagtg 2160
ggcctcgaga gactggtttc tctgagcggc atcaccgacg tgaaccattg ggcccagcct 2220
aagccatctc ctagcaaagg caccggcatg aacagaccca tcggcctgag agttggcaaa 2280
ggcgtgtggg ccagactgct caagaagaag cctagagaca tctgtcggat ctccaacaga 2340
aagacccgga aggccgccag agagaagcac cgcaaaacag atagagccag cgtgtccttc 2400
tggactctgc tgcctacaac aggcgtgcgg acaagaggaa gccctctgag actgactctg 2460
tggcctccta gatgcagatg cagacgcgag tacagagtga ccatgaacat cctgaacagc 2520
ctgccaagca gcatggaaat cgccgtgctg caagaaaccg ccaagaaaag ccctaccagc 2580
ttctgctgca acctggacct gcagcatcag cgcagacgca aaaagaagaa agacaaggtc 2640
gagatccgga atcggagccc caaggccaat agcacagagt gtcagggcga gcacagcaga 2700
gagcagaatc tgctgaatct ggtgcagctg aatcctcaca gccctcacca ccggaaggac 2760
gaagaggacc accagaagag acaccaccac cacaatcaaa agaagatgag cgtcccactg 2820
ttcttccacg gcgacctgtg tagagagagc accctgggca atttctggat gaagctgctc 2880
cagctgcctc agaggcctcc actgcaacca gtgaccggaa tggaaatcct gctttggatt 2940
ctgctgaaga tggaaattca gatcttcaag atttgcctgg gcgagatgca gctctgcacc 3000
tctcggattc tgaacctgca agtgctgaaa aagatcctgc ggagctttat gaagctgtac 3060
cacagcctcg tgatgtgcct gcggctgagg accaagctgg aaaaggctct gagcgccctg 3120
ttcatctggc ctcagcactc ctacaagatc acacacccat tcgccagcca gccactggga 3180
caagagatgc ccaacaacac ccagatccgg ctgctgaagc ccgacaagaa gaagaaaagc 3240
accgaaaaga ccaaaggcca ggctttcggc agcttctccg ccgatttttc agcccctcaa 3300
ggacaggctt ttggctccct gtgtcagctg gtgtccgccg actttagcgc cccacaagtg 3360
accagactgc ggagcctgaa ccatctgctg atttggctga agaattggaa gcggttcaag 3420
ctcaaaaaga aatatcaggc ccctctgcgg ctgtggtctt ggtgcggaac aagccagacc 3480
tacttcggca gcatcatctg tatcaagaat atgttcctgc agcggaaggg tttcctgaac 3540
ctgagccacg tggaaaagtt cgagcttaag aagaatcttc tgctccccgt cgtgatcaac 3600
ctgaagagac tgcagaaatt catgctgaac cagaagtgcc tggctccatt tcctgcctgc 3660
accagcaaag cctggacacc cagaaaactc gtgggcagag ccgtgcggag aaagggcatt 3720
ctggccatga cactgaccct gaacggaatc gaggccctga cagccctgtt tacctgtaga 3780
accgcctcca tcagcgtgaa catcagcacc ctgatgagca tcctggaagc catcatcaag 3840
aagatgaaga aacggatcat ggtgcaccgg tggatcttct ccaatcagct gaccgtgcag 3900
atgctctgcc tgcctctgct gacccctgac accagatgga tctttagtaa tcagctgcag 3960
acagtgcaaa tgctgtgtct gccacctctg aagcagggcg agagaatcat ttggccactc 4020
ggcggctttc agatccccaa tttcttctgg tccctcggca tcggacacac tggcgcatgg 4080
tggcatactg gtagaaggcg gagagagtgg ggcggctcta ccgtgtctag aagcccactg 4140
tggatcagct ccatgatcta cctgagaggc atggccttcg ccagcgacag ctccatcaga 4200
accaccagag tgtcctggtg tcggagatgt ggcgccaagt ctgccgcagc ctcttcttct 4260
ccactgtggg attgcagcac cacaaccggc acacaccacg gatgcctgtg ggagatccct 4320
agcgttaccc tgctggctaa cctgcacctg tgctactacc actctcagag caacagaaac 4380
aagagccgcc agatggaatc cctgggcatg aagctccaac ttaaaaagaa agtgaacgcc 4440
tgcagcacct acacacccca catctgcaga cacacctgtc gcgtgaacgc cgtcgaggaa 4500
ctgcactcta gaaggatgtc cgtgcggatc gtgaaaaatt gggtgtcctg ctgctacgtg 4560
cggctgtcag ctgtgggact gtctacttgg agcgctctgg acaacaagat catctgcaag 4620
ggccacagaa tcaccggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1143
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 1B
<400> 1143
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaaccgag 120
atccaattga ccatgaacga cagcaagcac aagctggaaa gccccgctct gaaacaggtg 180
tcaccagcct ctccacctac tcagcagcct cagacacctc aggatagcag acaggtgctg 240
gccatgccta gcagctggtc tagctctggc agaacccagc ggaaggtggt caagaatcct 300
agccagcctg tgcctctgag aaacgacggc atcaccaacg gcaacgactc caccagaagc 360
tgcagcatca gcctgaagaa aagcctggaa aagatgcccc tcatgatgaa gaagaaggac 420
agcaccatct tcatcgtgcc catgagcctg gcctgtagca tcaccgtgtc tttcgtgggc 480
cagatcagca cactggtgct ggatgtgtcc agcatctccc actggaacaa agtgcggcag 540
aacttcaagc ggaacgccga caagaagaac gttcggagcg gcgagaagaa cgacctgcag 600
ctgtttgtga tgagcgacac cacctacaag atctactgga ccgtgatcct gctgaacccc 660
tgcggcaatc tgcacctgaa aaccaccagc ctgggcgact gtcctagaac aatggccgga 720
ccttctgcct ctctgcaccc tgcatctggc agagcctcta gaaagacctg gcagagaagg 780
ctgagagcct gtagagctgg tggacctgct ggatgggcca gacaggcctt cgataagaaa 840
ggctttgtga tcctgagcgt cggagccgga acaggcggag gacctgcttg tgttcctgtg 900
gctgaagctt ctacaggcgc ttggacagct gaaggcgccg ctggaacaag atgtagagct 960
tctagagccc cttgcagaca gctgcctgcc agctctccta ccaagtgcga gatctgcgtg 1020
aagcgcagac ggcggagaaa gagaagcagc cagtctagaa gccccgtgcc taagaaacgc 1080
gagagaatga tgctgcccgt gcgggccaga acagctagat ctgcacttcc tcaggggaga 1140
gcccctcttg agggaatgct gcttcctaga gcactgccca gcctgctgtc tagaatgcca 1200
gccagaagag agagccggtt ttggctggct ctgcaggcac ttggactcag acctccacat 1260
ctgcctagct gtcatcctct gcctcaactg cttggccctc cacctcctca tcaggcccct 1320
acagctttct tcctgctgga catcattctg cggctgccct gcaaagtgac cgagtctagc 1380
aatatgggcg gcaacagatc catctgcctg accaacgcca agaaaatgga agatatgatc 1440
tgggagagca cgcccctgag catcagcaga cctacatcta gagccaggca gagctgttgt 1500
ctgcccggac tgacacatcc tgctcaccag ccactgggat ctatgaccct ggccatcaga 1560
ttcatcagcg ctcctcagcc tagctccagc acagtgacag ctgctcctag cggccagtac 1620
ttcaagggca agaagcggcg gaaagagatc ttcaagaaga agaaacccct gacattcagc 1680
cccagcctgg ccaaaaagac cctgaccaat agcagcttct tctacaccag cgaccgcgag 1740
gccaagaaat ctatgaagcg gagcatgacc ctgaaggccc tggtcaagac ctggacacag 1800
ttcagaaact accccagagc ctcctctcct ggacaccctc tgggacctaa tggcatctgg 1860
gaagtgatgc ccagaacact ggaaggctgc atctccgtga aggaccacag aacaagccag 1920
aaccacagca agtgcatcac cgagtgtgtg cggacagccc tgaacagaag aagcaagatc 1980
gaggcctctc ctatcggctc tatcgccctg agatccatgc ctaagagcag aaaccaggtg 2040
ctgttcagac ggaatctgac cccaagccag ctgagaactc tggcccctcc ttatatgctg 2100
ctgccccagt ctctgagcca gagcctgagc agaaagcaga tccctagcca gtccatgctg 2160
gtggcctcta gagcaggaca gtttcctgtg tggcggagaa ccagcagagg aatgagcctg 2220
cagtggaagt ccggcaatgc ctgcacacct ctgagatgcc ctagcagaag ccctgccaca 2280
ttcctgacag ctctgaacgg ctggcacaga tctggactga gagcccagag aaagcgcaag 2340
cgcgagaaga gaagccagaa gtccaggcag aaccatctgc agctgaagtc ctgccggcgc 2400
aagatctcca actggtccaa gctgagaagc ccctggatct tcgtgtccaa gaagagactg 2460
cccaagctga ccaagtgtga aatctgtgtc aagaacaccg ccatcctggc tatcaccctg 2520
atcacccctc aggaccctca tctggaccct gtgtgtcacc ctcatagaag gcctggatgg 2580
aagggccacc acagagtggt gttttctcat caccctagcg gcagcaccaa gagccactgg 2640
cagcaaagag aacgcggagg cggcagacgg gaaaagaagg gctgtagaga gagatccctg 2700
ctgtactcca gaatgtgcct ggtgcagatc cccacacaca cctgggagcc cgattacttc 2760
gtgtctctgc ccatgatgtt cagctgggcc acacagtcat tccccgtggg agccgtgttt 2820
ctgaccagac ctgccattcc ttgctgtagc tgcacaagcc acagcaaccc ttggagtcag 2880
agcagacacc cacacagaag cccacctacc tcttgtcctc cgctgctgga agcctttcca 2940
ctgcctagag catccctgag agccaccgtg ccaagacata gctctgtgct ggcaaccgga 3000
ctgcatctgc acagacagat ttctctgccc ctgagaggat tcctgctgca tcaaccactg 3060
ccaggccagc atctgtggct gtctcataga ctgcggctga gactgccaag aactcagcgg 3120
cctcctagat ccatcctgag ccttagactg ccactgaggc cacagagagg acccagacct 3180
ctgcatagat ggctgcagca gaccacaggc tgtagccaga gaagataccc cagactgaaa 3240
accttcggcg tgccactggg ctccattctg tgtctggctg gatctctgag caccatgatg 3300
atcattagca ccaccagaca agagtgtggc aggcgggcat ctgtgccctg tagacctatg 3360
atcggaagcg ccagaccagg accttggaga acatctgcta tgcctagcgc catgggcgtc 3420
gcactgccta caagctgtga atccggaaga tctcctcctg ccaccggcgg aagaatgcct 3480
ggaagccaga gcattatgat gagctggatg cctcctctgg ctccttgtgc cgcttgtcct 3540
tgttctcccg ctcctacact gtgtcccgct catcctgcta gagcacctac agccgtgcct 3600
gcctttacac ctctgtctgc acatcctgtg cctgtgctgt ctggatgtca cctggccgtc 3660
agaacctcca tgctgacact gctgcctatg ctgaagctgg ccccactgca agtgaccacc 3720
acactgaagc tgatcctggt catgctggaa atcgtgaccg agagcactcg gagagagatg 3780
ccttctcagg ccacaccttc tccacctgga ccttggcgag ccgctctggg caaagaagtg 3840
aagagatccc agagcaagct gcgcctgaga aacacaagcc ccatcgtgtt ctttctggcc 3900
ccatacttcc ccagacggat gaccagacgg accatgacaa ccaccaaaat gatgatgatg 3960
cggcggacca agcggagaag gcgcaaaagg cggagaatga caatgatgac aaggcggacc 4020
ctgctgacaa agaaaacctg tctgacccct agaaccagcg ccgctaccaa agctctgcca 4080
aggcagacaa tctcccagcg gaggcctatt cagacccctc ctggaacatc tctggccatc 4140
tggggcaacc agcagctgaa atggacccct cacatcctga agtccgccag cagaagggcc 4200
agacctacca gctgtagcac ctgtagaatg tggtggatcg ccaaaaagcg gatcaagctg 4260
cggcggaaca gaaccagact gacactgaca ggcacaagaa gcagcggcac cagagcttct 4320
ccatccgccg tttgcctgtg ttgctggacc tgtccttcca gaagcttccc agccgcttct 4380
ccaagcggat tgagagcacc tgttggagca caggcccctc cagaagttac actgagagct 4440
agctgtgcct ccagcgcctc taaggcttgt gctggacttt ggccttgggg agcacaagtt 4500
cggcaaccat ctttgcctgg accatgcgct tctctgctga gcacactgtc tcagccacct 4560
ccacaggctc catctcaagt gtggacagcc gcaacactga gatgtcctgc tgttccagct 4620
gctgcctgtc ctcctggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1144
<211> 4672
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 2B
<400> 1144
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaagaaag 120
atgcagagcc tgaatcaccc cagcagactg accaacatga gcagaacacc tccaagacgc 180
gtgtgcaacc ctcggagaaa gacctggaag atgcggaaga agtacgccca gaagcctagc 240
cagaagaacc acctgtacaa cagccggaag aaactgctcg aggacatgaa gcagaatggc 300
ttcacaggcc acagagaggg cagcgagtct gataatctgg gcctgctgta ctcctttcct 360
cctatccgga tgtgcgccct gtctcaccct agcttctaca tcagcagcac cgtgtgcttt 420
ctgagcaagc actgcatgac cgcctgcaca caaaagaaag gccacatgat cttcagccgc 480
gagaagatca tcaaccccac catcagctgc ccctttcaga gccccacaaa gcggctggaa 540
ctgagcctgg aaccttggat tccctacctg caccagcaga aaacccaagg cggcaagaag 600
agaagcaagt tccctggcac cagcctgcag tgctacctga acagatgcag cctgatggaa 660
cagatccctc acctgaagtc cgcctctcca cagatcatgc agagaaccag cgccgaccgg 720
ttccggatga agcggagaat gcagaacctg gacaatctgg gcgttccatg gccactgctg 780
cctggacctc tggaaaacac acagatcccc agaacaagcc ctctgtggaa gatcacaatg 840
gtgctgacat accccaactg cgtggtgcac gtgctgatgt tctggctgcc tatgagatct 900
ctgggcgagc cttggagagc tggctttcag tggggagagt ccccttggca agtgatggct 960
agcctgacag gcccctatcc tatcagcgag ggcctgacca tgaccaccgg cagaaacatc 1020
aacagcaact ccctgatgac caactgcctg ttcagcccca tcttcctgtg ccaccacgcc 1080
atcatgcacc ggaagatgac aagcccacac ttcagactgt tcagcagcaa gatcccacat 1140
cctcaggtgc catctgtggt ggccctgtgc aagttcagag ccacatttct gctcgccctg 1200
tgggagtgta gtctgcctca agccagactg tgcctgatcg tgtctagaac cctgctgctg 1260
gttcagtctg ccgctcctcc acatagactg ctgggccctt ctagatggtc cagaagccac 1320
ctggacttca gcccctactg gatgaagaaa gtgaagctgg ccaacggcct gtggttcaac 1380
ctgatcttcg tgctgttcaa ggccgaccag agcgagtcta gcctgtctag cggccggaac 1440
aagaaaacaa agctgtggtt ctccctcatc aacatccacc accgcaagaa tcctctgctg 1500
cccatgagaa tccccagcct gaatgcccag tggatgttcc tgagaatcct gcttctggcc 1560
catatgtacg gcttcagcac ctacggcacc cagaaaggcg agtgcgtttg tctgcagtgt 1620
ctgagcggca gcagcctgtt cattctgaag cagcccctgg acctgaagat ctccaagacc 1680
ttcatgctgc aagctcaccc acaggtgcca gctcttgctc ctcaagcttg gtggcctgct 1740
agaagaggcc ctctgacatc tgctccatcc gctcagcagt ctctgacagc tagccctcag 1800
attatgcagc ggatgagcgc cgtgaacttc gagacaatca tctaccctcc aagcacctgt 1860
agcctgcctt gtagaggcag aacactggaa agcgccggac tgtttccttg gctgcacacc 1920
cagtgtacac acccctgtac catgctgctg ccacaaggct ggtggtgtac aagaggcggc 1980
ggaaagcgga aaaagaaaat gtgcaaggtg tccggcggct gcaccgcctg tgttgagaga 2040
tgtccttgga agggcatctg ctggaagtgg ccagtgacag tggctgctca gtggtctagc 2100
gtgacctctc tggaatggac agcccaagag agaggctgca gcagctggct gatgaagcaa 2160
acatggatga agtcttggtc cctgcgggac cccagctaca gatccatcct ggaatacgtg 2220
tccaccagag tgctgtggat gcccacaagc accgtgcgga gaagaaacag cagaaagcag 2280
tctcaggtgc agctggccat tcaggtgctg ctcgtggaca agcacaagta ctttctgttc 2340
ggcagagccc gcaaccggaa catgaagaaa accatgagcc acctgatcgc ccatcaggcc 2400
ctgaagatga gcggcctgag gctgtttcat cctcggctgc tgacaagaaa gaagcccggc 2460
aagttcctgc ctagcagatt tccttggggc cctcctcctc tgtgtcatcc tgcttggctg 2520
agccctatct ccgcctgtcc aagactgctg ccatatcctt ttcacgtgct ggccctggaa 2580
gtgacctttc cacctggaac agccatgcct cagatgcaac tgcaggccct ggccatgtgg 2640
gagaaaggct gggataagcg gaagagaatg aagaccggcg ccatccaaga gaagggcgct 2700
attcaagaga aaggggccat gaccaagcgg atctgcgtgg tcaatttcga ggcctgcaga 2760
gagatggaaa gcctgagcgc ccctgagaag attaccctgt ttgaagccca tatggcccgg 2820
tgcacctcca tcaatgtgct gtgtgtcaga gcctctctga tcgagaagct gatgaaagaa 2880
aagcgcaaga tgaagcgcaa ccaggtggca tccccacaaa ttatgcagag gctgttcatt 2940
aagggctacc agaacaacca cttcaccttc catctgcaaa acttcgcctt cttcagcagc 3000
ttcggcaaca acaagtacat caatatcctg acgcggcgca agaaaagaga ggaccactgc 3060
ggactgctga tcctgatcca gcacggcggc atcttcacct ttcggttctg ggtcgaaaag 3120
ctgagctgga acatctgcaa gaacctgagc ctgtacctgg ataagttcgt gcagcggctg 3180
ctgtacgtgt acatcatcga gacaaacgtg ttcgtgctga acctgttcca cgtgccagtg 3240
aaccagatct tcatgatggc cttctacctg aagtacaccg agaaggcctg ggtcatggaa 3300
ctggaatggc tgatccaaca gcagtgttac cagcaagaga agaaaagccg gaaactgatg 3360
agcagctgcc gggccttcat ccacacacct agaagccctg gctgcagcgt gtacgccaat 3420
atgtgctggg ccttttggaa gcctcctagc cagggcatca gctcttgtct gatgacaggc 3480
tgttggggca gccctcctct gcacctgtgt cagcctctga ggcggtataa gaaaaggggc 3540
gtgatcgcct ggcggcggag aaagtggcag atccggcatg tgctgaaaaa cctgatcctg 3600
tttcatgtgc ggaacatcgt gtacggcatc caagtgatgc tgtgcggcaa gggactgaca 3660
caccctgtgc ctctgaaacg gaccctgcag aacaagagga acaagaacat caagcgggtc 3720
aaccagaaga agggcaacat caagaggaag tccatcctgc tgcacctcat tgtgctgaat 3780
agccccgaga gcaaccccaa gttcttcctg acctttagcc agctcgagaa gaaagctacc 3840
tggatgagaa gaacaggcgc cctgagagcc acagctcctg ctacagcagc tcctcaggct 3900
cagactcctc attggagagc cgccacaaca agcagcatga gcagcagccc tagagccgag 3960
cctacatctt ctagctcttg ggccacctgt tggcccagat gctgtagctc cagctgttac 4020
tggtccctga gttcttggcc tcctgctggc gccgctgagg ctacaaacac cagaactaga 4080
agcagagagt cccagcgggg cagaatgctg acttggagaa gtagtctgtg gctgcagggc 4140
accagatgtt ttacaggcgt gcggacaagc agcggaagct gtggcagagc ttgtagctgc 4200
ggaagaggct gtggaacccc tagaggcgat tggaagagac accctcctcg gaggaatagc 4260
gtgatcgtgc acaagatcgt gctggtgttt ctgaagtccc tgtccagcta caactgcgag 4320
agaaggatca gcggcatcca gaagagagcc atcgagtttg ccgtgctgaa actgctgaat 4380
atggacctgc actggaactc cgcctacctg ggcagaactc tgctggtcac ctgtatcctg 4440
tatcaccggt ggatcgtgac ctccatgtgc cagtctcaga gatggctgac cagcaccaca 4500
agcagatcca gcgctctgat gtggacccgg cagatcaatc ggaggaagct gcagagaaag 4560
aagaggcacc caagctggcc ttggaccaga tgccttagaa tgaggcctcc tagaagcggc 4620
tacccctacg atgtccctga ctatgcgtcc taaaggcgcg cctagcggcc gc 4672
<210> 1145
<211> 4687
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 3B
<400> 1145
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaggagct 120
gctgctgcct cttgtcagtc tcctccttct cctcgggaaa ccacacctag ctccgacgcc 180
accagacgga caagaccaat tgccgctcag agcaagaaaa ccatgacagc cgccggactg 240
acccctaaga acaagaagcg gagaaagctg cggcccaaga tgatccggaa gatccagaag 300
agaaggcgga ccgccaaccg gcggaatagc agaagggcta cccctacaag caagggcagc 360
ctgagaagaa agtacctgag agtgcgggga cctcctctgc acacccggaa catcagaaag 420
ctgatctgga ccaagcagcg gagcttcctg tctctgttcc ccaagctgag agccaccgag 480
cagatgacca atgtgggctg ctctatccct cacgtgccca aagccacagc cgctcactct 540
gtgacagtga aactgcagct gcccctgacc ttcagcaccc tgctgtggga tagcagacac 600
accatgagcc tgagcaacat cctgatgaag ttccggctgc agtctagccc attcctggcc 660
agatcctgga acaccatgca gtggaacaac aagaaaatgg ccatgaccgt gatcgctggc 720
gcccaccact gtcagtacaa gctgacctac accaaagtgt ggaagatgaa ctggaagaaa 780
atgatgatcg gcagccagca tctgctgttc agccctctgg atagcagtcc cctgcagctc 840
ctgctgcacc ctcacggcaa gagatgcaac ccttgctgca gactgacctg gatgagccag 900
aacaccagaa gcaccaacct ggaaaagaac cccagcctga agaagcagag ccagcggaga 960
ggaaagctga gcgcctttag cggcagaatc ctgcaccagc cagaaatggc cgccatgaga 1020
ctgatgccca agttcctgaa ctccaccaac agctggtgga ccctgaccac actgagcttc 1080
gtgctgatcg aggaagccag acagcccagc agacctaccg gcagaacacc taccaccaga 1140
ctgatggccc ctgtgggcag cgtgatgagc tgttctctgc tgacccagcc ttctccagcc 1200
agcgcctgta caatgcctcc actgctgcat ccacagtggg cccctcatag tgctggactt 1260
tctccaggcg cttgcagacc tgcctgcacc tgtatcagca tgaccaccat cagcagggcc 1320
acatggggcc cagtgtacta cgtgtgcaac cggatgaacg tgtccagcgt gctgaagccc 1380
ttcctgttca ccgtgcctat cgaggacatg agagagtgca ccctgggcag aaacagaatg 1440
aatgtgtcct ctgtgctgaa accctgtctg atccctgtgc caatcagcga gaagaagagg 1500
aagctgccca acatcgagat cacccctcag cggtctaagg ccatgctgca gaagcagtgc 1560
tgctacaacc tcgtgatcaa gcaccctctg atcttcagaa tcaacctgcg gcggcagggc 1620
aagaccaaag atggcgttgt gcagagcctg ggcttcctca accagcagat catcctgcag 1680
aaagagttct tcatctgcct gctcatgttc atcaagcggt ggaagcctgc cgccaccaag 1740
agcagaaaga agggccacac caagaacaga cggaaggcca agagaaagcc ccagatctac 1800
ctgttcttcc tgaccgtgtg cggctttcac ctgaaaaaga ccagcgccaa gtggctgaag 1860
aagtccacca agtccagatc caacggcatg gaagcttgcg gcacacaccc cactcctaga 1920
ctgagctgcc tgagagttag atgcggcggc tggctgtgtg gctggacacc tagaggtaga 1980
aagtccggcg tgatgaagtg ctgggatctg tgccccgtgc acaagaagag aggcctgttc 2040
agactggatt ttcaccccag aagcagctcc ggcaagggaa agaacagccc ctgctgccaa 2100
aagaaactgc gggtgcagaa ccagggccat ctgctgatga ttctgctgca caatgaccgg 2160
gtgttcctcg tgaagatcgg cgagaagctg aagcactgtt tcaaggcctg gggctccaga 2220
cggaaccggc ggtacagaaa gatctacggc gagctgaaga tgtccctgca ggccttcctg 2280
atccacctga gaaaggtgga cacccaccac ctccaggtgg tcaccaaaac agtgaccgcc 2340
acaacagccg acggccagag aatgcggaga ctgaagtgca aggcctgccg gctgagatgg 2400
gccagacctg aacctgctgc tcaggcccct cctaagagcc actttccacc tcatcctagc 2460
ggccccagca gaacaagtag cctgcagctg agaagcctgt tctttagcca ctgcctgtgc 2520
agccagaaga aggaccctgc cggcaagctg aaaaagctgc tgaagaaaag cagccagctg 2580
cggagaagct ggcgcaatgt gtccagaatc agcacccctc ctccactgat cctgtggcct 2640
caagctgctc ctgtgtccgt gatcaccatg aagctgtggg agaagcactt caagggcctg 2700
aattggaacc tggtcgtgtg gattctgaac ctgaagatga tgacctacat ggaaatgcac 2760
tacggccatc aggccccaca ggtggcaatg ctgcctaagc tgctgtgcag acagatgctg 2820
cccactctga gcacactgca gcagagacat cctcagggcc cttgtcctcc tcctgtgaca 2880
cctctgagag tccagtctgt cctgctgctg ggagtgcctc agacagccag aggacctaga 2940
agaaaggtcc tgatggtgct gtggctgccc gccaatcagt ctctgcagaa aagccaggtt 3000
ttccagtggg tgctgcggac agaggtggcc cctagatgtc ctagatctgc cgtggacatc 3060
agccccggac ctacatctcc tagcctggcc tcttgtgcct ctgtggccat tggaaagctg 3120
gcactgcttg gcgcctctgc tccttgtggt gctgctggcg ctagagaggc cggaagattt 3180
gctgtgctgg gcaccatggt catgaagctt tgtttcttct acctgctgta ccggctgcgc 3240
atcccaagcc tgaggaagta cagacagcac ctgaaccgga agctgcacct gacaagatcc 3300
tgcctgatcg atctgaccat gatgatgtcc cagaagctct ggaagaacca gcggaagaga 3360
atccctctgc catctccacg gcaacatctg ctgccacagt accctctgca cccacctcca 3420
ccttgtctgc tgttgctgca ccatagacac cacctggcct ttctcgagat ggcctgtagc 3480
tctcagcaca cccacagcat caagatctgg atcagcttca gccatgaagt ggaccctcca 3540
ggcagcgtgt ggatactgcc ttgcgatctg cctcggatgc tgccaatctc ttcacccctg 3600
cacagacccc agatgccttt ctggacctgc acctttcctg ccacaacctg gggcacatgg 3660
gagacacctt ctacatgggg ctggcggact ttcagaggcg ctagcagcag cacatcccgg 3720
gacagcagat ccttcttcac ctctgctcac cctagcaggc cctgcagaat gagactgtac 3780
cagtgcaaga agaagctcct cctgaaactg ctgaccacca ccacaagcag ccccagaaga 3840
tcccctgctc tgagagcaag aggcggcacc acaatcggcg aagtgaccag ctgtaccaac 3900
ctgagcgtgc ccatgatgct gaccatcctg atttggaagc gggtgttcat cctcctgctg 3960
agcgataaga agggcgccaa gaagatcacc ttcctgccta ttcctccaca cctgagacac 4020
cctctgctgc tgttcgagaa gaaacggcct gagtggctga gcatggacct ggacggaatg 4080
ctgacagtga tcggccaggg actcgtgggc atgaccccta gagatctggg aacagtggca 4140
ggcgccaccg ctcagattca gcgacctatc caggtgcaga ctggcggcag actcagaaga 4200
aacctgcaga gaaacctgaa ggtgctccag gtgtccgtgt acagcggcaa cctgctgtcc 4260
tttagcagac ggggcatgaa gtctagcgtg cggctgaaaa accgcgagtg ggagaaacgg 4320
aagcagattc tcggaggcgg cggaaagtac aaagagtact tcctgaagcg catcctcatc 4380
cggaaggcta tgacagtgct ggccggcgac aagaaaggac tgggcagatt catgagatgc 4440
gtgcagagcg agacaaaggc cgtgtctctg caactgcctc tgggaagaaa catggaacac 4500
cggttgacca tggacagcgc cctgagcctg acaaagagag agggacccga gacactcaaa 4560
aagaaatacc tggtccagca ccagatgaag tgtctgaccg ccgtggattg tctgcaggct 4620
ttttgggaca tgggctaccc ctacgatgtc cctgactatg cgtcctaaag gcgcgcctag 4680
cggccgc 4687
<210> 1146
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 4B
<400> 1146
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaatccag 120
aagaagaagc agaagtccaa cctggacctg cagcaccagc gcagacgcaa aaagaagaag 180
gacaaggtcg agatccggaa tcggagcccc aaggccaata gcacagagtg tcagggcgag 240
cacagcagag agcagaacct gctgaatctg gtgcagctga accctcacag ccctcaccac 300
agaaaggacg aagaggacca ccagaagcgg caccaccacc acaatcaaaa gaaaatgagc 360
gtgatggcca agaagtccca gcagcctctc ggacaggcct ttggctctct gtgtcagctg 420
gtgtccgccg atttcagcgc ccctcaagtg accagactgc ggagcctgaa ccatctgctg 480
atcaacgagg gcaacaacca ctggcctaga gtggaaatgc ctaccggttg gctgctcgtg 540
ggctacaaca ccagaaacac agcccagaat cctcggctgc agcagcacct gaaacactgg 600
cagcagtgca ccagagccag atggtgccaa gagccttgtc agaccctgac cttcttccat 660
ttcttcttct ttttcaaaac ggtgtccctg tgctgccccg gctggtctaa aggacaacct 720
cctccacctg gcctgaagcc ttctagcctg gcttctcagg tggccagaac cacaggcgtg 780
taccagcacg tgtggctgat ctgcttcgtg ttcttcgtgt gcgtggaaac cggcttctgt 840
cacgtggccc aagtgggact cgagagactg gtgtctctga gcggcatcac cgacgtgaac 900
cattgggccc agcctaagcc atctcctagc aaaggcaccg gcatgaacag acccatcggc 960
ctgagagttg gcaaaggcgt gtgggccaga ctgagagcct ccgtgtcttt ctggaccctg 1020
ctgcctacaa caggcgtgcg gacaagagga agccctctga gactgacact gtggcctcca 1080
cggaacatcc tgaacagcct gcctagcagc atggaaatcg ccgtgctgca agagaaccgc 1140
aagaccagaa aggccgccag agagaagcac agaaagaccg acaacctgca cctgtgctac 1200
taccacagcc agagcaaccg gaacaagagc cggcagatgg aaagcctggg catgaagctg 1260
cagagccctc tgtgggattg ctccaccaca acaggcacac accacggctg tctgtgggag 1320
atccctagcg ttacactgct ggcctgcaga gtgaacgccg tggaagaact gcacagcagg 1380
cggatgtctg tgcggatcgt gaagaactgg gtgtcctgct gttacgtgcg cctgtctgct 1440
gtgggcctgt ctacttggag cgccctggac gtggtcatca acctgaagcg gctgcagaag 1500
ttcagccaga agtctcagca ccactgcgcc ctgagaaaga tcgagtgggc cacaaagctg 1560
agcctcggcg gaaaagctgg accccaggct caagagaagg ccaacgccaa gaagatgccc 1620
ttccagcggt ggatcttcag caatcagctg accgtgcaga tgctgtgcct gcctattgaa 1680
gccctgactg ccctgttcac ctgtcggaca gccagcatca gcgtgaacat cagcaccctg 1740
atgagcatcc tggaagcccc tctgtttttt cacggcgacc tgtgcgagga aaagaagaac 1800
ggccggatca gcagccaggc tcctctcaga ctttggtctt ggtgcggcac aagccagacc 1860
tactttggca gcaccgccaa gaaaagcccc accagctttt gctgcgagtg gggaggacag 1920
gctcaccggc agagaaatac cggaatggaa atcctgctgt ggattctgct caagatggaa 1980
attcagatct tcaagatttg cctgggcgag atgcagctgt gcacctacac accccacatc 2040
tgcagacaca cctgtagagg cggacctagc gccagcgata gatgctgtag ctgtagccct 2100
agcggcttca gcgccggaag aggcagatgt ccagttcagg gatgtctgcg gcctcacaga 2160
gtgcagctgc tgagaagatg gggccctgga tctcctgctg gccagagact gtctaagggc 2220
tttcagctgc tccgttggtg gggaccagga tctccagctc ctgagcctag aaagggccca 2280
tttccaccac ctgatcctcc atggcctgtg accgctgtga cagtgatggc tggctctgtg 2340
cctagcgctc agtctgtgga tgctctggaa agccctggac ctctggcact ggaaggacct 2400
agcagcccca gaaacctgct ctggcgggaa atgagcatct tcctgcctgg catcttcacc 2460
tctcggattc tgaacctgca agtgctgaag aagatcctgc ggagctttat gaagctgtac 2520
cactctctgg tcatgtgcct gcggctgcgg accaagctgg aaaaagctct gagcgctctg 2580
ttcatctggc cccagcacag ctacaagcag aggcctcctc tgcagcctgt gcaggtcgtg 2640
ctcagactgg gaaacctgcc tccattcttc agaggcagcg aggtgccctt tcctagacct 2700
tgccggacca agatgctgaa ccagaagtgt ctggcccctt tcatcacaca cccattcgcc 2760
tctcagcccc tgggacaaga gatgcccaac aacacccaga tcagactgct gaagcccctg 2820
ctgacccctg acaccagatg gatcttctcc aaccagctgc agacagtcca gatgctctgt 2880
ctgccacctc tgaagcaggg cgagagaatc atttggcccc tcggcggctt tcagatcccc 2940
aacttctttt ggagcctcgg aatcggccac actggcgcct ggtggcatac tggaaggcgg 3000
agaagagaat ggggcggctc caccgtgtct agaagcccac tgtggatcag ctccatgatc 3060
tacctgagag gcatggcctt cgccagcgac agctccatca gaaccaccag agtgtcctgg 3120
tgcagaagat gcggcgccaa atctgccgct gcctccagcc tcaagaagaa accccgggac 3180
atctgtcgga tcagcgactc taagaagatg acccagaagc gcgagagcac cctgggcaat 3240
ttctggatga agctcctcca gctgccagac aagaagaaga agtctaccga aaagaccaag 3300
atcatcaaga agatgaagaa acggatcatg gtccacatgt gcagctccct ggctctgcca 3360
acaggcctga catctctgat cctgccaagc agcgatctgg ccgtgctgat ctctagctcc 3420
accagccact ttctgatgcg gagcccagtg ctgcctagct ccagactgac ttgtgcctct 3480
ccacagctgc ccagaatgtg gacctggtcc agctggctga agtggctgaa aaactggaag 3540
cggttcaagc ttaaaaagaa gtacatcctg gccatgacgc tgaccctgaa cgggcatcca 3600
agaaccgcct ctatcaccct gcctaccacc agcctgaagg gctctagaac cagctgttgc 3660
cccagatctc accccagact gcctaggaca aagtggcctc tgcagtgcct gctgcacagc 3720
ctgggaacaa ctggaacact cgtgtgggaa aggggcgtgc tgcagatgag aagtctggaa 3780
gctcactgcc ctctgcagac cttccacctc caccactgta gaactcagcc cagctcttgc 3840
cctcctgcat ggattctgta ccaaggacag tggagcggag ccgtcgtggg acttagacct 3900
gtggctcacc atctgccaag acctattcag ggcctgcact gcccacaggc tccacatcaa 3960
ccagctctgt cttggggcaa gtggcccgtg ggaatgacag gacctgccag atgttgccgg 4020
tggcctagac gggaactcaa aaagaatctg ctgctcccct gccggtgcag acgcgagtat 4080
agagtgacaa tgggccaagc cttcggcagc tttagcgccg actttagcgc tccccaggtg 4140
ttgaagaaga atcggaagca gaacaagatt atctgcaagg gccaccgcat cacaagcctg 4200
atcctgagct ttcagcgcgt gaaacttaag aagaaagtca acgcctgctc tcccgcctgc 4260
acctctaaag cctggactcc cagaaagctc gtggggagag ccgtcagaag aaagggcatc 4320
atctgtatca agaatatgtt cctgcagcgg aagggtttcc tgaacctgag ccacgtggaa 4380
aagttcgtgc ctccttctcc tcctctggct ctcggcccta gaatgcagct ctgtacccag 4440
ctggcccggt tcttccctat cacacctcct gtgtggcaca tcctgggacc tcagaggcac 4500
accccttgtc aaaagaaggt gccctccgct agcccatggg gccttagacc atctccttgc 4560
ctgagctggt cctccagaat tgtggcccct ggacacgccc tgagctgtcg gactagaaga 4620
agatggtcca gcaagggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1147
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 1A
<400> 1147
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgaccgaga tccagctgac catgaacgac agcaagcaca agctggaaag ccccgctctg 780
aaacaggtgt caccagcctc tccacctact cagcagcctc agacacctca ggattctaga 840
caggtgctgg ccctggccaa gaaaaccctg acaaatgcct ccagagccgg acagtttcct 900
gtgtggcgga gaacaagcag aggcatgagc ctgcagtgga agtccggcaa tgcctgcaca 960
cctctgagat gccctagcag aagccctgcc acattcctga cagccctgaa tggctggcac 1020
agatctggcc tgagagccca gatgcctagc tcttggtcta gcagcggcag aacactgaag 1080
ctggcccctc tgcaagtgac caccactctg aagctgatcc tggtcatgct ggaaatcgtg 1140
accgagcgct ccctgctgta ctccagaatg tgtctggtgc agatccccac acacacctgg 1200
gagcccgatt acttcgtgtc cctgcctatg atgttcagct gggccacaca gtcttttccc 1260
gtgggcgccg tgtttctgac cagacctgcc attccttgct gcagctgtac cagccacagc 1320
aacccttgga gccagagcaa tcagcagctg aagtggaccc ctcacatcct gaagtccgcc 1380
agcttcgaca agaaaggctt cgtgatcctg agccggcgga gcaagattga ggcctctcct 1440
atcggctcta tcgccagctc tcctggacat cctctgggac ctacactggc catcagattc 1500
atcagcgccc ctcagcctag cagctctaca gtgacagctg cccctagcgg ccagtacttt 1560
atcgccaaga agcggatcaa gctgcggcgg aacaatatgg gcggcaacag atccatctgc 1620
ctgaccagaa agcgcaagag agagaagcgg agccagaagt ccaggcagaa ccatctgcag 1680
ctgaaaagct gcagacggaa gatcagcaac tggtccaagc tgagaagccc ctggatcttc 1740
accaagtgcg agatctgcgt gaagaacacc gccatcctgg ctatcaccct gatcacccct 1800
caggaccctc atctggaccc tgtgtgtcac cctcatagaa ggcctggatg gaagggccac 1860
catagagtgg tgttctctca ccatcctagc ggcagcacaa agagccactg gcagcaaaga 1920
gaacgcggag gcggcagacg cgagaagaag ggatgtagag aacagcggaa ggtggtcaag 1980
aacccctctc agcccgtgcc tctgagaaac gatggcatca ccaacggcaa cgactccacc 2040
agaagctgct ccatcagcct gaagaaaagc ctggaaaaga tgcccctgat gcggagagcc 2100
agacctacca gctgtagcac ctgtagaatg tggtggaagg gcaagaaacg gcggaaagaa 2160
atcgtgccta tgagcctggc ctgcagcatc accgtgtctt ttgtgggaca gatcagcacc 2220
ctggtgctgg atgtgtctag catcagccat tggcggctgc cctgtaaagt gaccgagagc 2280
agctccagct tcttctacac cagcgacagg acccctctga gcatcagcag accaaccagc 2340
agagctagac agagctgttg tctgcccgga ctgacacacc ctgctcacca acctctgggc 2400
agcatgagca ctagaagaga gatgccaagc caggccacac cttctccacc tggaccttgg 2460
agagccgctc tgggcaaaga agtgaagaga tcccagagca agctgcgcct gagaaacaca 2520
agccctgggg agaagaacga tctccagctg ttcgtgatga gcgacaccac ctacaagatc 2580
tactggacag tgatcctgct gaacccctgc ggcaacctgc acctgaaaac aacatcactg 2640
cagcggccac ctcggagcat cctgtctctg aatggaatct gggaagtgat gccccggaca 2700
ctggaaggct gcatcagcgt gaaggatcac agaaccagcc agaaccacag caagtgcatc 2760
accgaatgtg tgcggactgc cctgaacgtg tccaagaaga gactgcctaa gctgatgaag 2820
aagaaggaca gcaccatctt catcaacaaa gtgcgccaga acttcaagcg caacttcaag 2880
aagaagaaac ccctcacttt cagccccagc agacggatga ctcggagaac catgacaacc 2940
accaaaatga tgatgatgcg gcggaccaag cggagaaggc gcaaaaggcg gagaatgacc 3000
atgatgacca gacggaccct gctgacaaag aaaacctgtc tgacccctag aaccagcgcc 3060
gccacaaaag ctctgcctag acagaccatc agccagcgga ggcctattca gaccccacct 3120
ggaacatctc tggccatctg gggcagaaca agactgaccc tgacaggcac cagatccagc 3180
ggaacaagag cctctccttc cgccgtgtgc ctgtgttgtt ggacctgtcc aagcagaagc 3240
ttcccagccg cttctcctag tggactgaga gcacctgttg gagcccaggc tcctcctgaa 3300
gtgacactga gagcctcttg tgcctctagc gcctctaaag cctgtgctgg actttggcct 3360
tggggagccc aagttcgagt tggagctgga acaggcggag gacctgcttg tgttcctgtg 3420
gctgaagctt ctacaggcgc atggacagct gaaggcgccg ctggaacaag atgtagagcc 3480
tctagagccc cttgccgcca acttcctgct agctccccta ccaagtgtga aatttgtgtg 3540
aagcgcagac ggcggagaaa gagaagcagc cagtctagaa gccccgtgcc taaaaagcgc 3600
gagaggatga tgctgcctgt gcgggccaga acagctagat ctgcacttcc tcagggcaga 3660
gcacctctgg aagggatgct gcttcctaga gcactgccta gcctgctgag cagaatgcct 3720
gccagaagag agtcccggtt ttggctggct ctgcaggcac ttggactcag acctccacat 3780
ctgcctagct gtcatcctct gcctcaactg ttgggccctc cacctcctca tcaggcccca 3840
atgacactga aggccctggt taagacctgg acacagttcc gcaactaccc cagagccgac 3900
aagaagaatg tccggtctac cgccttcttc ctgctggaca tcatcctggg cgattgccca 3960
agaacaatgg ccggaccttc tgcctctctg catcctgcat ctggcagagc ctccagaaag 4020
acctggcaga gaaggctgag agcttgtaga gcaggcggac ctgctggatg ggctagacag 4080
gcctatccta gactgaaaac cttcggcgtg cccctgggct ctattctgtg tctggccggc 4140
agcctgtcca caatgatgat cattagcacc accagacaag agtgcggcag gcgggcttct 4200
gtgccttgta gacctatgat cggaagcgcc agaccaggac cttggcggac atctgctatg 4260
cctagtgcca tgggagtcgc cctgcctacc tcttgtgaaa gcggaagatc tcctcctgcc 4320
accggcggaa gaatgccagg atctcagtct atcatgatga gctggatgcc tccactggct 4380
ccatgtgccg cttgtccatg ttctcccgct cctacactgt gcccagcaca tcctgctaga 4440
gcaccaacag ccgtgcctgc ctttacacct ctgtctgctc atcctgtgcc agtgctgtct 4500
ggatgtcacc tggccgtcag aacctccatg ctgacactgc tgcccatgga agccaaaaag 4560
agcatgaagc ggtccaacgc taagaaaatg gaagatatga tctgggagag ccggctgcca 4620
ctgaggccac aaagaggacc tagacctctg cacagatggc tgcagcagac aaccggctgt 4680
agccagaggc ggatcgtgtt ctttctggcc ccatacttcc ctcggcaccc tcacagatct 4740
ccaccaacat cttgcccacc tctgctggaa gctttcccac tgccaagagc ttctctgagg 4800
gccacagtgc caagacatag ctctgttctc gccaccggtc tgcacctcca cagacagatt 4860
tctctgcccc tgagaggatt cctcctgcac caaccactgc caggacagca tctgtggctg 4920
tctcacagac tgaggctgag actgcccagg acacagccat ctttgcctgg accatgtgca 4980
agcctgctgt ccacactgtc tcagccacca cctcaggctc catctcaagt gtggactgcc 5040
gctacactga gatgtcctgc tgttcctgca gctgcctgtc ctcctgctct gagatccatg 5100
cctaagagcc ggaaccaggt gctgttcaga cggaatctga ccccaagcca gctgagaaca 5160
ctggccccac cttatatgct gctgccccag tctctgtccc agagcctgag tagaaagcag 5220
atccctagcc agtccatgct cgtgggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1148
<211> 5281
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 2A
<400> 1148
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgagaaaga tgcagagcct gaatcacccc agcagactga ccaatggctc tcctccactg 780
cacctgtgcc agcctctgag aatgagcaga acccctccta gaagagtgtg cgccgctcct 840
ccacatagac tgctgggccc ttccagatgg aaccctcgga gaaagacctg gaagatgcgg 900
aagaagtacg cccagaagcc tagccagaag aaccacctgt acggcggcaa gaagcgctct 960
aagttcagca gaagccacct ggacttcagc ccctactgga tgaagaaagt gaaggtgctg 1020
ttcaaggccg accagagcga gtctagcctg agcagcggaa gatgcagcct gatggaacag 1080
atccctcacc tgaagtctcg gcggaagtgg cagatcagac acgtgctgaa gaacctgtgg 1140
ctgcccatga gaagcctggg agaaccttgg agagccggct ttcagtgggg agagtctcct 1200
tggcaagtga tggcctctct gaccggcaga gccacatttc tgctggccct ttgggaatgt 1260
agcctgcctc aggcaagact gtgcctgatc gtgtctagaa ccctgctgct ggtgcagagc 1320
cggaacaaga aaacaaagct gtggttcagc ctgatcaaca tccaccaccg gaagaaccca 1380
ctgctgccta tgagatggtg gtgtaccaga ggcggcggaa agcggaaaaa gaaaatgtgc 1440
aaggtgtccg gcggctgcac cgcctgtgtt gagagatgtc cttggaaggg catctgctgg 1500
aagtggcctg tgacagtggc cgccattaga atgtgtgccc tgtctcaccc tagcttctac 1560
atcagcagca ccgtgtgctt tctgagcaag cactgcatga ccgcctgcac cagaaagaga 1620
atgaagaccg gcgccatcca agagaagggc gctattcaag agaaaggggc catgaccaag 1680
cggatctgcg tggtcaattt cgaggcctgc agagagatgg aaagcctgag cgcccctgag 1740
aagatcaccc tgtttgaagc ccacatggcc cggtgcacct ccatcaatgt gctgtgtgtg 1800
cgggccagcc tgattgagaa gctgatgaaa gaaaagcgca agatgaagcg gaaccaggtg 1860
gcctctccac agatcatgca gcggctgttc atcaagggct accagaacaa ccacttcacc 1920
ttccatctgc aaaacttcgc cttcttcagc tccttcggca acaacaagta catcaatatc 1980
ctgaccatcc tgttccacgt gcggaacatc gtgtacggca tccaagtgat gctgtgcgct 2040
agccctcaga ttatgcagag aaccagcgcc gaccggttcc ggatgaagag aagaatgcag 2100
aatctggaca acctgggcgt gccatggcct ctgttgcctg gaatcccatc tctgaacgcc 2160
cagtggatgt tcctgagaat cgcatccccg caaatcatgc agaggatgag cgccgtgaac 2220
ttcgagacaa tccgggccag aaaccggaac atgaagaaaa ccatgagcca cctgatcgcc 2280
catcaggccc tgaagatgag cggcctgaga ctgtttcacc ccagactgct gacacggaag 2340
aagcccggaa aactgctgct cgcccatatg tacggcttca gcacctacgg cacccagaaa 2400
ggcgagtgcg tttgtctgca gtgtctgagc ggcagcagcc tgttcattct gaagcagccc 2460
ctggacctga agatcagcaa gaccttcatg ggccacagag agggcagcga gtctgataat 2520
ctgggcctgc tgtatagctt ccctccacct tatcctatca gcgagggcct gaccatgacc 2580
accggcagaa acatcaacag caactccctg atgaccaact gcctgttcag ccccatcttc 2640
ctgtgccacc acgccatcat gcacagaaag atgacaagcc ctcacttcag gctgttcagc 2700
agcaagatcc cacatcctca ggtgccatct gtggtggccc tgtgcaagtt ccgggccttc 2760
atccacacac ctagaagccc tggctgcagc gtgtacgcca atatgtgctg gcccaagttc 2820
ttcctgacct tcagccagca gtggtccagc gtgacatctc tggaatggac agcccaagag 2880
agaggctgca gcagctggct gatgaagcag acatggatga agtcttggag cctgcgggac 2940
cccagctaca gatccatcct ggaatacgtg tccaccagag tgctgtggat gcctacctct 3000
accgtgctgc aggctcatcc acaagttcca gctctggctc ctcaagcctg gtggcctgct 3060
agaagaggac ctctgacatc tgccccatcc gctcagcagt ccctgaccag agagaagatt 3120
atcaacccca ccatcagctg cccctttcag agccccacca agagactgat ctaccctcct 3180
agcacctgtt ctctgccctg cagaggcttc ctgcctagca gatttccttg gggcccacct 3240
cctctgaaca gcgtgatcgt gcacaagatc gtgctggtgt tcctgaagtc cctgtccagc 3300
tacaactgcg agcggagaat cagcggcatc cagaagagag ccatcgagtt cgccgtgctg 3360
aaactgctga atatggacct gcctctcgag aacacacaga tccccagaac aagcccactg 3420
tggaagatca caatggtgct gacatacccc aactgcgtgg tgcatgtgct gatgtttggc 3480
gccctgagag ccacagctcc tgctacagct gcacctcagg ctcagacccc tcattggaga 3540
gctgccacaa caagcagcat gagcagcagc cctagagccg agcctacatc ttctagctct 3600
tgggccacct gttggcccag atgctgctcc agctcttgtt actggtcact gtctagctgg 3660
cctccagctg gcgccgctga agctacaaat accagaacca gaagccgcga gagccagagg 3720
ggtagaatgc tgacttggag aagctccctg tggttgcagg gcaccagatg ttttacaggc 3780
gtgcggacca gctccagata caagaaaaga ggcgtgatcg cctggcggag acagatcaat 3840
agacggaagc tgcagagaaa gaagcactgg aacagcgcct acctgggcag aacactgctg 3900
gtcacctgta tcctgtatca ccggtggatc gtgacctcca tgtgtcagtc ccagagatgg 3960
ctgaccagca ccacaagtag atctagcgcc ctgatgtgga ccgagctgag cctggaacca 4020
tggattccct acctgcatca gcagaaaacc cagcggacac tggaatccgc cggactgttt 4080
ccttggctgc acacccagtg ccaagagaag aaaagcagaa agctgatgtc cagctgcaca 4140
cacccctgca caatgctgct gccacaggga tgtcatcctg cctggctgag ccctatctct 4200
gcctgtccaa gactgctgcc atatcctttt cacgtgctgg ctctggaagt gacctttcct 4260
cctggaaccg ccatgcctca gatgcagttg caggctctgg ctatgtggga gaaaggctgg 4320
gataagcctg gcaccagcct gcagtgctac ctgaacagaa gaagaaacag ccggaagcag 4380
agccaggtgc aactggccat tcaggtgctg ctcgtggaca agcacaagta ctttctgttc 4440
ggccaaaaga aaggccacat gatctttagc ctggccaacg gcctgtggtt taacctgatt 4500
ttcaactccc ggaagaaact gctcgaggac atgaagcaaa atggcttcac cggcaaaggc 4560
ctgacacacc ccgtgcctct gaagcggact ctgcagaaca aaagaaacaa gaatatcaaa 4620
cgcgtcaacc agaagaaggg caacatcaag cggaagtcca tcctgctgca cctgattgtg 4680
ctgaatagcc ccgagagcaa cctgatcctg atccagcatg gcggcatctt cacctttcgg 4740
ttctgggtcg agaagctgtc ctggaacatc tgcaagaacc tgagcctgta cctggacaag 4800
ttcgtgcaga gactgctgta cgtgtacatc atcgagacaa acgtgttcgt gctgaacctg 4860
tttcatgtgc ccgtgaacca gatcttcatg atggccttct acctgaagta caccgagaag 4920
gcctgggtca tggaactgga atggctgatc caacagcagt gctatcaggg cagctgcggc 4980
agagcttgtt cttgtggaag aggctgtggc acccctagag gcgattggaa gagacatcct 5040
cctcggagag ccttctggaa gcctcctagc cagggcatct ctagctgtct gatgaccggc 5100
tgttggctcg agaagaaagc tacctggatg cggcggaccc gccggaagaa gagggaagat 5160
cattgcggac tgagacaccc cagctggcct tggacaagat gtctgaggat gaggcctcca 5220
agaagcggct acccctacga tgtccctgac tatgcgtcct aaaggcgcgc ctagcggccg 5280
c 5281
<210> 1149
<211> 5296
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 3A
<400> 1149
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgggagctg ctgctgcctc ttgtcagtct cctccttctc ctcgggaaac cacacctagc 780
tccgacgcca ccagacggac aagacctatt gccgctcaga gcaagaaaac catgacagcc 840
gccggactga cccctatgat ccggaagatc cagaagcggc ggagaaccgc caaccggtgt 900
ctgagagtta gatgtggcgg ctggctgtgt ggctggacac ctagaggaca gaacaccaga 960
agcaccaacc tggaaaagaa ccccagcctg aagaagcaga gccagcggag aggaaagctg 1020
agcagcctgt tcttcagcca ctgcctgtgc cggaacagca gaagggccac acctacatct 1080
aagggcagcc tgcggcggaa gtacctgaga gtgcctattc ctccacacct gagacaccct 1140
ctgctgctga tggacctgga cggaatgctg accgtgatcg gacagggact cgtgggcatg 1200
acccctagag atctgggaac agtggctggc gccaccgctc agattcagag gcctattcag 1260
gtgcagaccg gcggcagact tacacctcct cctctgattc tgtggcctca ggccgctcct 1320
gttgatcctc ctggctctgt gtggattctg ccctgcaaga acaagaagcg gagaaagctg 1380
cggcccaagc ggctggactt tcaccctaga tcttctagcg gcgtgtccgt gatcaccatg 1440
aagctgtggg agaagcactt caagggcctg aactggaacc tggtcgtctg gattctgaac 1500
ctgaagatga tgaacatcga gatcacccct cagcggagca aggccagaaa gtccggcgtg 1560
atgaagtgct gggatctgtg ccccagcgag aagaagagga agctgcctct gcctctgacc 1620
ttcagcaccc tgctgtggga ctctagacat agaggcgcca gctccagcac cagcagagac 1680
tccagaagct ttttcaccag cgctcacccc agcagaccct gcagaatgag actgtaccag 1740
ttcctgatcc acctgagaaa ggtggacacc caccatctgc aggtcgtgac caagaccgtg 1800
acagccacaa cagctgacgg ccagagaatg cggagactga agtgcaaggc ctgccggctg 1860
agatgggcta gacctgaacc tgctgctcag gcccctccaa agagccactt tccacctcat 1920
cctagcggcc ctagcagaac cagttctctg cagctgcgga gcatccctca cgtgccaaaa 1980
gccacagccg ctcacagcgt gacagtgaag ctgcagaagg gaaagaacag cccctgctgc 2040
caaaagaaac tgcgggtgca gaatcagggc catctgctga tgatcctgct gcacaatacc 2100
tacatggaaa tgcactacgg ccatcaggcc ccacaggtgg ccatgctgcc taagctgctg 2160
tgcagacaga tgctgcccac tctgagcaca ctgcagcaaa gacacccaca gggcccttgt 2220
cctccacctg tgacaccact gagagtccag tctgtcctgc tgctgggagt gcctcagaca 2280
gctgctagac agcctagcag acccaccggc agaaccccta ccacaagact gatggcccct 2340
gtcggcagcg tgatgagctg ttctctgctg acccagcctt ctccagccag cgcctgtaca 2400
atgcctccac tgctgcatcc tcagtgggcc ccacattctg ctggattgtc tcccggcgct 2460
tgcagacctg cctgtacctg tatcagcatg accaccatct ccagagccac ctggcaggtt 2520
tccgtgtaca gcggcaatct gctgagcttc tccagacggg gcatgaagag tagcgtgcgg 2580
ctgaaaaaca gccggcggaa cagacggtac agaaagatct acggcgagct gaagatgtcc 2640
ctgcaggccg tggctcctag atgtcctaga tctgccgtgg acatcagccc cggacctacc 2700
tctcctagcc tggcctcttg tgcctctgtg gccattggaa aactggccct gcttggcgct 2760
tctgcccctt gtggtgctgc tggcgctaga gaggctggaa gatttgccgt gctgggcacc 2820
atggtcatga agcacctgaa ccgcaagctg catctgaccc ggtcctgcct gatcgatctg 2880
accatgatga tgagccagaa gctctggaag aaccagcgga agagaatccc tctgccatct 2940
cctagacagc atctgctccc tcagtaccct ctgcaccctc ctccaccttg tctgctgctg 3000
ctccaccaca gacaccacct ggcctttctg gaaatggcct gcagcagcca gcacacccac 3060
tccatcaaga tctggatcag ctttagccac gagcagagca gcccattcct ggccagatcc 3120
tggaacacca tgcagtggaa caacaagaaa atggccatga cagtgatcgc tggcgcccac 3180
cactgtcagt acaagctgac ctacaccaaa gtgtggaaga tgaattggaa gaaaatgatg 3240
atcggctccc agcacctcct gttcagccct ctggatagct ctccactgca actgctgctt 3300
caccctcacg gcaagagatg caacccttgc tgcagactga catggatgtc catgctgcag 3360
aaacagtgct gctacaacct cgtgatcaag cacccactga tcttcagaat caacctgcgg 3420
agacagggca agaccaagga tggcgttgtg cagagcctgg gcttcctgaa ccagcagatc 3480
atcctgcaga aagagttctt catctgcctg ctcatgttta tcaagcggtg gaagcctgcc 3540
gccaccaaga gagagtggga gaaacgcaag cagatcctcg gcggaggcgg caagtacaaa 3600
gagtacttcc tgaagcgcat cctgattcgg aaggccatga ctgtgctggc cggcgacaag 3660
aaaggcctgg gcagattcat gagatgcgtg cagagcgaga caaaggccgt tagcctgcag 3720
ctcccactcg gaagaggccc tgtgtactac gtgtgcaacc ggatgaacgt gtccagcgtg 3780
ctgaagccct tcctgttcac cgtgcctatc gaggacatga gagagtgcac actgggccgc 3840
aacagaatga atgtgtcctc tgtgctgaaa ccctgtctga tccctgtgcc aatcgacctg 3900
cctcggatgc tgccaatcag cagcccactg cacagacccc agatgccatt ctggacctgc 3960
acctttcctg ccacaacatg gggcacctgg gagacacctt ctacatgggg ctggcggacc 4020
tttcggggcc ctagaagaaa agtgctgatg gtgctgtggc tgcccgccaa ccagagtctg 4080
cagaaaagcc aagtgttcca gtgggtcctg cggaccgaga acatccggaa gctgatctgg 4140
accaagcagc ggagcttcct gtctctgttc cccaagctga gagccaccga acagatgacc 4200
aatgtgggct gcgccttcag cggccggatt ctgcatcaac ctgaaatggc cgccatgcgg 4260
ctgatgccca agttcctgaa tagcaccaac agctggtgga cctgtaccaa cctgagcgtg 4320
cccatgatgc tgaccattct gatttggaag cgggtgttca ttctcctgct gtccgacaag 4380
aagctgctga agaagtctag ccagctgagg cggtcttgga gaaacgtgtc ccggatcagc 4440
caccagatga agtgtctgac cgccgtggac tgtctgcagg ccttctggga catgaacatg 4500
gaacaccggc tgaccatgga cagcgccctg agcctgacaa agagagaggg acccgagact 4560
tgcaagaaga agctcctgct gaaactgctg acaatgagcc tgagcaacat cctgatgaag 4620
ttccggctgc ggctgagaat cccaagcctg aggaagtatc gccagcatct gaaaaagacc 4680
agcgccaagg gcgagaagct gaagcactgc tttaaggctt ggggcagagg cccacctctg 4740
cacacaagaa gccagaagaa agaccctgcc ggcaagctga aaaaactgac cacactgagc 4800
ttcgtgctga tcgaggaacg gcggaacctg cagcggaatc tgaaagtcct gtggctcaag 4860
aaaagcacca agagccggta tctgttcttc ctgaccgtgt gcggcttctt cgagaagaaa 4920
cggcctgagt ggctgtcctc cagaaagaag ggacacacaa agaatcggag gaaggccaag 4980
cggaagcccc agatcgtgca caagaagaga ggcctgttcc tcaaaaagaa atacctggtg 5040
cagggcgcca agaagatcac cttcctgtcc aacggcatgg aagcttgcgg cacacacccc 5100
acaccaagac tgagcgacag agtgttcctg gtcaagatca ccaccaccac aagcagcccc 5160
agaagaagcc cagcactgag agctagaggc ggcaccacaa ttggcgaagt gaccagcctg 5220
tgcttcttct acctgctgta cggctacccc tacgatgtcc ctgactatgc gtcctaaagg 5280
cgcgcctagc ggccgc 5296
<210> 1150
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 4A
<400> 1150
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgatccaga agaagaaaca gaaatccatg gccaagaagt cccagcagcc tctggtgctg 780
aagaagaacc ggaagcaaga gtggggagga caggcccaca gacagagaaa caacgccaag 840
aagatgccct tccaagagga aaagaagaac ggccggatca gcagcagcct gatcctgagc 900
ttccagagag tgaaggacag caagaaaatg acccagaaga tgtgcagctc tctggccctg 960
cctacaggcc tgacatctct gatcctgcct agcagcgatc tggccgtgct gatctctagc 1020
agcaccagcc actttctgat gcggagccct gtgctgccaa gctccagact gacatgtgcc 1080
tctccacagc tgccccggat gtggacatgg tctagctggc tgaagcaccc cagaaccgct 1140
agcatcacac tgcctaccac aagcctgaag ggcagcagaa ccagctgctg cccaagatct 1200
caccccagac tgcctaggac caagtggcct ctgcagtgtc tgctgcacag cctgggaaca 1260
acaggcacac tcgtttggga aaggggcgtg ctgcagatga gaagcctcga agcccattgt 1320
cctctgcaga ccttccatct gcaccactgc agaacccagc caagctcttg tcctcctgcc 1380
tggattctgt accaaggcca gtggagcgga gccgtcgttg gacttagacc cgtggctcac 1440
catctgccta gacctatcca gggcctgcac tgtcctcagg ctcctcatca acctgctctg 1500
agctggggaa agtggcccgt gggaatgaca ggacctgcca gatgctgtcg gtggccccgc 1560
agatctcaga agtctcagca tcactgcgcc ctgcggaaga tcgagtgggc cacaaaactg 1620
tctctcggcg gaaaagccgg accacaggct caagagaagg ccagaccttc tccttgcctg 1680
tcctggtcca gcagaattgt ggcccctgga cacgccctga gctgtcggac tcgtagaaga 1740
tggtcctcca agtgcagagg cggccctagc gccagcgata gatgttgtag ctgtagcccc 1800
agcggcttca gcgccggaag aggcagatgt cctgtgcagg gatgtctgag gccacacaga 1860
gttcagctgc tgagaagatg gggcccagga tctcctgctg gccagagact gtctaagggc 1920
ttccaactgc tgcgttggtg gggacctgga tctccagctc ctgagcctag aaagggccca 1980
tttcctccac ctgatcctcc atggcctgtg accgctgtga cagtgatggc tggctctgtg 2040
cctagcgcac agtctgtgga tgccctggaa tctcctggac ctctggctct ggaaggccct 2100
agcagcccta gaaacctgct gtggcgggaa atgagcatct ttctgcccgg catcttctgc 2160
caaaagaagg tgccatctgc cagcccctgg ggacttgttc ctccttctcc accactcgct 2220
ctgggcccta gaatgcagct gtgtacccag ctcgccagat tcttccccat cacacctcca 2280
gtgtggcaca tcctgggacc tcagagacac acacctcagg tggtcctgag actgggcaac 2340
ctgcctccat tcttcagagg cagcgaggtg ccctttccta gaccttgccg gaccaagaac 2400
gagggcaaca atcactggcc cagagtggaa atgcctaccg gctggctgct cgtgggctac 2460
aacaccagaa acacagccca gaatcctcgg ctgcagcagc atctgaaaca ctggcagcag 2520
tgcacacggg ccagatggtg tcaagagcct tgtcagaccc tgaccttctt ccacttcttc 2580
ttctttttca aaacggtgtc cctgtgttgt cccggctggt ccaaaggaca acctccacct 2640
cctggcctga agccttctag cctggcttct caggtggcca gaaccacagg cgtgtaccag 2700
cacgtgtggc tgatctgctt cgtgttcttc gtgtgcgtgg aaaccggctt ctgtcacgtg 2760
gcacaagtgg gcctcgagag actggtttct ctgagcggca tcaccgacgt gaaccattgg 2820
gcccagccta agccatctcc tagcaaaggc accggcatga acagacccat cggcctgaga 2880
gttggcaaag gcgtgtgggc cagactgctc aagaagaagc ctagagacat ctgtcggatc 2940
tccaacagaa agacccggaa ggccgccaga gagaagcacc gcaaaacaga tagagccagc 3000
gtgtccttct ggactctgct gcctacaaca ggcgtgcgga caagaggaag ccctctgaga 3060
ctgactctgt ggcctcctag atgcagatgc agacgcgagt acagagtgac catgaacatc 3120
ctgaacagcc tgccaagcag catggaaatc gccgtgctgc aagaaaccgc caagaaaagc 3180
cctaccagct tctgctgcaa cctggacctg cagcatcagc gcagacgcaa aaagaagaaa 3240
gacaaggtcg agatccggaa tcggagcccc aaggccaata gcacagagtg tcagggcgag 3300
cacagcagag agcagaatct gctgaatctg gtgcagctga atcctcacag ccctcaccac 3360
cggaaggacg aagaggacca ccagaagaga caccaccacc acaatcaaaa gaagatgagc 3420
gtcccactgt tcttccacgg cgacctgtgt agagagagca ccctgggcaa tttctggatg 3480
aagctgctcc agctgcctca gaggcctcca ctgcaaccag tgaccggaat ggaaatcctg 3540
ctttggattc tgctgaagat ggaaattcag atcttcaaga tttgcctggg cgagatgcag 3600
ctctgcacct ctcggattct gaacctgcaa gtgctgaaaa agatcctgcg gagctttatg 3660
aagctgtacc acagcctcgt gatgtgcctg cggctgagga ccaagctgga aaaggctctg 3720
agcgccctgt tcatctggcc tcagcactcc tacaagatca cacacccatt cgccagccag 3780
ccactgggac aagagatgcc caacaacacc cagatccggc tgctgaagcc cgacaagaag 3840
aagaaaagca ccgaaaagac caaaggccag gctttcggca gcttctccgc cgatttttca 3900
gcccctcaag gacaggcttt tggctccctg tgtcagctgg tgtccgccga ctttagcgcc 3960
ccacaagtga ccagactgcg gagcctgaac catctgctga tttggctgaa gaattggaag 4020
cggttcaagc tcaaaaagaa atatcaggcc cctctgcggc tgtggtcttg gtgcggaaca 4080
agccagacct acttcggcag catcatctgt atcaagaata tgttcctgca gcggaagggt 4140
ttcctgaacc tgagccacgt ggaaaagttc gagcttaaga agaatcttct gctccccgtc 4200
gtgatcaacc tgaagagact gcagaaattc atgctgaacc agaagtgcct ggctccattt 4260
cctgcctgca ccagcaaagc ctggacaccc agaaaactcg tgggcagagc cgtgcggaga 4320
aagggcattc tggccatgac actgaccctg aacggaatcg aggccctgac agccctgttt 4380
acctgtagaa ccgcctccat cagcgtgaac atcagcaccc tgatgagcat cctggaagcc 4440
atcatcaaga agatgaagaa acggatcatg gtgcaccggt ggatcttctc caatcagctg 4500
accgtgcaga tgctctgcct gcctctgctg acccctgaca ccagatggat ctttagtaat 4560
cagctgcaga cagtgcaaat gctgtgtctg ccacctctga agcagggcga gagaatcatt 4620
tggccactcg gcggctttca gatccccaat ttcttctggt ccctcggcat cggacacact 4680
ggcgcatggt ggcatactgg tagaaggcgg agagagtggg gcggctctac cgtgtctaga 4740
agcccactgt ggatcagctc catgatctac ctgagaggca tggccttcgc cagcgacagc 4800
tccatcagaa ccaccagagt gtcctggtgt cggagatgtg gcgccaagtc tgccgcagcc 4860
tcttcttctc cactgtggga ttgcagcacc acaaccggca cacaccacgg atgcctgtgg 4920
gagatcccta gcgttaccct gctggctaac ctgcacctgt gctactacca ctctcagagc 4980
aacagaaaca agagccgcca gatggaatcc ctgggcatga agctccaact taaaaagaaa 5040
gtgaacgcct gcagcaccta cacaccccac atctgcagac acacctgtcg cgtgaacgcc 5100
gtcgaggaac tgcactctag aaggatgtcc gtgcggatcg tgaaaaattg ggtgtcctgc 5160
tgctacgtgc ggctgtcagc tgtgggactg tctacttgga gcgctctgga caacaagatc 5220
atctgcaagg gccacagaat caccggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1151
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 1B
<400> 1151
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgaccgaga tccaattgac catgaacgac agcaagcaca agctggaaag ccccgctctg 780
aaacaggtgt caccagcctc tccacctact cagcagcctc agacacctca ggatagcaga 840
caggtgctgg ccatgcctag cagctggtct agctctggca gaacccagcg gaaggtggtc 900
aagaatccta gccagcctgt gcctctgaga aacgacggca tcaccaacgg caacgactcc 960
accagaagct gcagcatcag cctgaagaaa agcctggaaa agatgcccct catgatgaag 1020
aagaaggaca gcaccatctt catcgtgccc atgagcctgg cctgtagcat caccgtgtct 1080
ttcgtgggcc agatcagcac actggtgctg gatgtgtcca gcatctccca ctggaacaaa 1140
gtgcggcaga acttcaagcg gaacgccgac aagaagaacg ttcggagcgg cgagaagaac 1200
gacctgcagc tgtttgtgat gagcgacacc acctacaaga tctactggac cgtgatcctg 1260
ctgaacccct gcggcaatct gcacctgaaa accaccagcc tgggcgactg tcctagaaca 1320
atggccggac cttctgcctc tctgcaccct gcatctggca gagcctctag aaagacctgg 1380
cagagaaggc tgagagcctg tagagctggt ggacctgctg gatgggccag acaggccttc 1440
gataagaaag gctttgtgat cctgagcgtc ggagccggaa caggcggagg acctgcttgt 1500
gttcctgtgg ctgaagcttc tacaggcgct tggacagctg aaggcgccgc tggaacaaga 1560
tgtagagctt ctagagcccc ttgcagacag ctgcctgcca gctctcctac caagtgcgag 1620
atctgcgtga agcgcagacg gcggagaaag agaagcagcc agtctagaag ccccgtgcct 1680
aagaaacgcg agagaatgat gctgcccgtg cgggccagaa cagctagatc tgcacttcct 1740
caggggagag cccctcttga gggaatgctg cttcctagag cactgcccag cctgctgtct 1800
agaatgccag ccagaagaga gagccggttt tggctggctc tgcaggcact tggactcaga 1860
cctccacatc tgcctagctg tcatcctctg cctcaactgc ttggccctcc acctcctcat 1920
caggccccta cagctttctt cctgctggac atcattctgc ggctgccctg caaagtgacc 1980
gagtctagca atatgggcgg caacagatcc atctgcctga ccaacgccaa gaaaatggaa 2040
gatatgatct gggagagcac gcccctgagc atcagcagac ctacatctag agccaggcag 2100
agctgttgtc tgcccggact gacacatcct gctcaccagc cactgggatc tatgaccctg 2160
gccatcagat tcatcagcgc tcctcagcct agctccagca cagtgacagc tgctcctagc 2220
ggccagtact tcaagggcaa gaagcggcgg aaagagatct tcaagaagaa gaaacccctg 2280
acattcagcc ccagcctggc caaaaagacc ctgaccaata gcagcttctt ctacaccagc 2340
gaccgcgagg ccaagaaatc tatgaagcgg agcatgaccc tgaaggccct ggtcaagacc 2400
tggacacagt tcagaaacta ccccagagcc tcctctcctg gacaccctct gggacctaat 2460
ggcatctggg aagtgatgcc cagaacactg gaaggctgca tctccgtgaa ggaccacaga 2520
acaagccaga accacagcaa gtgcatcacc gagtgtgtgc ggacagccct gaacagaaga 2580
agcaagatcg aggcctctcc tatcggctct atcgccctga gatccatgcc taagagcaga 2640
aaccaggtgc tgttcagacg gaatctgacc ccaagccagc tgagaactct ggcccctcct 2700
tatatgctgc tgccccagtc tctgagccag agcctgagca gaaagcagat ccctagccag 2760
tccatgctgg tggcctctag agcaggacag tttcctgtgt ggcggagaac cagcagagga 2820
atgagcctgc agtggaagtc cggcaatgcc tgcacacctc tgagatgccc tagcagaagc 2880
cctgccacat tcctgacagc tctgaacggc tggcacagat ctggactgag agcccagaga 2940
aagcgcaagc gcgagaagag aagccagaag tccaggcaga accatctgca gctgaagtcc 3000
tgccggcgca agatctccaa ctggtccaag ctgagaagcc cctggatctt cgtgtccaag 3060
aagagactgc ccaagctgac caagtgtgaa atctgtgtca agaacaccgc catcctggct 3120
atcaccctga tcacccctca ggaccctcat ctggaccctg tgtgtcaccc tcatagaagg 3180
cctggatgga agggccacca cagagtggtg ttttctcatc accctagcgg cagcaccaag 3240
agccactggc agcaaagaga acgcggaggc ggcagacggg aaaagaaggg ctgtagagag 3300
agatccctgc tgtactccag aatgtgcctg gtgcagatcc ccacacacac ctgggagccc 3360
gattacttcg tgtctctgcc catgatgttc agctgggcca cacagtcatt ccccgtggga 3420
gccgtgtttc tgaccagacc tgccattcct tgctgtagct gcacaagcca cagcaaccct 3480
tggagtcaga gcagacaccc acacagaagc ccacctacct cttgtcctcc gctgctggaa 3540
gcctttccac tgcctagagc atccctgaga gccaccgtgc caagacatag ctctgtgctg 3600
gcaaccggac tgcatctgca cagacagatt tctctgcccc tgagaggatt cctgctgcat 3660
caaccactgc caggccagca tctgtggctg tctcatagac tgcggctgag actgccaaga 3720
actcagcggc ctcctagatc catcctgagc cttagactgc cactgaggcc acagagagga 3780
cccagacctc tgcatagatg gctgcagcag accacaggct gtagccagag aagatacccc 3840
agactgaaaa ccttcggcgt gccactgggc tccattctgt gtctggctgg atctctgagc 3900
accatgatga tcattagcac caccagacaa gagtgtggca ggcgggcatc tgtgccctgt 3960
agacctatga tcggaagcgc cagaccagga ccttggagaa catctgctat gcctagcgcc 4020
atgggcgtcg cactgcctac aagctgtgaa tccggaagat ctcctcctgc caccggcgga 4080
agaatgcctg gaagccagag cattatgatg agctggatgc ctcctctggc tccttgtgcc 4140
gcttgtcctt gttctcccgc tcctacactg tgtcccgctc atcctgctag agcacctaca 4200
gccgtgcctg cctttacacc tctgtctgca catcctgtgc ctgtgctgtc tggatgtcac 4260
ctggccgtca gaacctccat gctgacactg ctgcctatgc tgaagctggc cccactgcaa 4320
gtgaccacca cactgaagct gatcctggtc atgctggaaa tcgtgaccga gagcactcgg 4380
agagagatgc cttctcaggc cacaccttct ccacctggac cttggcgagc cgctctgggc 4440
aaagaagtga agagatccca gagcaagctg cgcctgagaa acacaagccc catcgtgttc 4500
tttctggccc catacttccc cagacggatg accagacgga ccatgacaac caccaaaatg 4560
atgatgatgc ggcggaccaa gcggagaagg cgcaaaaggc ggagaatgac aatgatgaca 4620
aggcggaccc tgctgacaaa gaaaacctgt ctgaccccta gaaccagcgc cgctaccaaa 4680
gctctgccaa ggcagacaat ctcccagcgg aggcctattc agacccctcc tggaacatct 4740
ctggccatct ggggcaacca gcagctgaaa tggacccctc acatcctgaa gtccgccagc 4800
agaagggcca gacctaccag ctgtagcacc tgtagaatgt ggtggatcgc caaaaagcgg 4860
atcaagctgc ggcggaacag aaccagactg acactgacag gcacaagaag cagcggcacc 4920
agagcttctc catccgccgt ttgcctgtgt tgctggacct gtccttccag aagcttccca 4980
gccgcttctc caagcggatt gagagcacct gttggagcac aggcccctcc agaagttaca 5040
ctgagagcta gctgtgcctc cagcgcctct aaggcttgtg ctggactttg gccttgggga 5100
gcacaagttc ggcaaccatc tttgcctgga ccatgcgctt ctctgctgag cacactgtct 5160
cagccacctc cacaggctcc atctcaagtg tggacagccg caacactgag atgtcctgct 5220
gttccagctg ctgcctgtcc tcctggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1152
<211> 5281
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 2B
<400> 1152
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgagaaaga tgcagagcct gaatcacccc agcagactga ccaacatgag cagaacacct 780
ccaagacgcg tgtgcaaccc tcggagaaag acctggaaga tgcggaagaa gtacgcccag 840
aagcctagcc agaagaacca cctgtacaac agccggaaga aactgctcga ggacatgaag 900
cagaatggct tcacaggcca cagagagggc agcgagtctg ataatctggg cctgctgtac 960
tcctttcctc ctatccggat gtgcgccctg tctcacccta gcttctacat cagcagcacc 1020
gtgtgctttc tgagcaagca ctgcatgacc gcctgcacac aaaagaaagg ccacatgatc 1080
ttcagccgcg agaagatcat caaccccacc atcagctgcc cctttcagag ccccacaaag 1140
cggctggaac tgagcctgga accttggatt ccctacctgc accagcagaa aacccaaggc 1200
ggcaagaaga gaagcaagtt ccctggcacc agcctgcagt gctacctgaa cagatgcagc 1260
ctgatggaac agatccctca cctgaagtcc gcctctccac agatcatgca gagaaccagc 1320
gccgaccggt tccggatgaa gcggagaatg cagaacctgg acaatctggg cgttccatgg 1380
ccactgctgc ctggacctct ggaaaacaca cagatcccca gaacaagccc tctgtggaag 1440
atcacaatgg tgctgacata ccccaactgc gtggtgcacg tgctgatgtt ctggctgcct 1500
atgagatctc tgggcgagcc ttggagagct ggctttcagt ggggagagtc cccttggcaa 1560
gtgatggcta gcctgacagg cccctatcct atcagcgagg gcctgaccat gaccaccggc 1620
agaaacatca acagcaactc cctgatgacc aactgcctgt tcagccccat cttcctgtgc 1680
caccacgcca tcatgcaccg gaagatgaca agcccacact tcagactgtt cagcagcaag 1740
atcccacatc ctcaggtgcc atctgtggtg gccctgtgca agttcagagc cacatttctg 1800
ctcgccctgt gggagtgtag tctgcctcaa gccagactgt gcctgatcgt gtctagaacc 1860
ctgctgctgg ttcagtctgc cgctcctcca catagactgc tgggcccttc tagatggtcc 1920
agaagccacc tggacttcag cccctactgg atgaagaaag tgaagctggc caacggcctg 1980
tggttcaacc tgatcttcgt gctgttcaag gccgaccaga gcgagtctag cctgtctagc 2040
ggccggaaca agaaaacaaa gctgtggttc tccctcatca acatccacca ccgcaagaat 2100
cctctgctgc ccatgagaat ccccagcctg aatgcccagt ggatgttcct gagaatcctg 2160
cttctggccc atatgtacgg cttcagcacc tacggcaccc agaaaggcga gtgcgtttgt 2220
ctgcagtgtc tgagcggcag cagcctgttc attctgaagc agcccctgga cctgaagatc 2280
tccaagacct tcatgctgca agctcaccca caggtgccag ctcttgctcc tcaagcttgg 2340
tggcctgcta gaagaggccc tctgacatct gctccatccg ctcagcagtc tctgacagct 2400
agccctcaga ttatgcagcg gatgagcgcc gtgaacttcg agacaatcat ctaccctcca 2460
agcacctgta gcctgccttg tagaggcaga acactggaaa gcgccggact gtttccttgg 2520
ctgcacaccc agtgtacaca cccctgtacc atgctgctgc cacaaggctg gtggtgtaca 2580
agaggcggcg gaaagcggaa aaagaaaatg tgcaaggtgt ccggcggctg caccgcctgt 2640
gttgagagat gtccttggaa gggcatctgc tggaagtggc cagtgacagt ggctgctcag 2700
tggtctagcg tgacctctct ggaatggaca gcccaagaga gaggctgcag cagctggctg 2760
atgaagcaaa catggatgaa gtcttggtcc ctgcgggacc ccagctacag atccatcctg 2820
gaatacgtgt ccaccagagt gctgtggatg cccacaagca ccgtgcggag aagaaacagc 2880
agaaagcagt ctcaggtgca gctggccatt caggtgctgc tcgtggacaa gcacaagtac 2940
tttctgttcg gcagagcccg caaccggaac atgaagaaaa ccatgagcca cctgatcgcc 3000
catcaggccc tgaagatgag cggcctgagg ctgtttcatc ctcggctgct gacaagaaag 3060
aagcccggca agttcctgcc tagcagattt ccttggggcc ctcctcctct gtgtcatcct 3120
gcttggctga gccctatctc cgcctgtcca agactgctgc catatccttt tcacgtgctg 3180
gccctggaag tgacctttcc acctggaaca gccatgcctc agatgcaact gcaggccctg 3240
gccatgtggg agaaaggctg ggataagcgg aagagaatga agaccggcgc catccaagag 3300
aagggcgcta ttcaagagaa aggggccatg accaagcgga tctgcgtggt caatttcgag 3360
gcctgcagag agatggaaag cctgagcgcc cctgagaaga ttaccctgtt tgaagcccat 3420
atggcccggt gcacctccat caatgtgctg tgtgtcagag cctctctgat cgagaagctg 3480
atgaaagaaa agcgcaagat gaagcgcaac caggtggcat ccccacaaat tatgcagagg 3540
ctgttcatta agggctacca gaacaaccac ttcaccttcc atctgcaaaa cttcgccttc 3600
ttcagcagct tcggcaacaa caagtacatc aatatcctga cgcggcgcaa gaaaagagag 3660
gaccactgcg gactgctgat cctgatccag cacggcggca tcttcacctt tcggttctgg 3720
gtcgaaaagc tgagctggaa catctgcaag aacctgagcc tgtacctgga taagttcgtg 3780
cagcggctgc tgtacgtgta catcatcgag acaaacgtgt tcgtgctgaa cctgttccac 3840
gtgccagtga accagatctt catgatggcc ttctacctga agtacaccga gaaggcctgg 3900
gtcatggaac tggaatggct gatccaacag cagtgttacc agcaagagaa gaaaagccgg 3960
aaactgatga gcagctgccg ggccttcatc cacacaccta gaagccctgg ctgcagcgtg 4020
tacgccaata tgtgctgggc cttttggaag cctcctagcc agggcatcag ctcttgtctg 4080
atgacaggct gttggggcag ccctcctctg cacctgtgtc agcctctgag gcggtataag 4140
aaaaggggcg tgatcgcctg gcggcggaga aagtggcaga tccggcatgt gctgaaaaac 4200
ctgatcctgt ttcatgtgcg gaacatcgtg tacggcatcc aagtgatgct gtgcggcaag 4260
ggactgacac accctgtgcc tctgaaacgg accctgcaga acaagaggaa caagaacatc 4320
aagcgggtca accagaagaa gggcaacatc aagaggaagt ccatcctgct gcacctcatt 4380
gtgctgaata gccccgagag caaccccaag ttcttcctga cctttagcca gctcgagaag 4440
aaagctacct ggatgagaag aacaggcgcc ctgagagcca cagctcctgc tacagcagct 4500
cctcaggctc agactcctca ttggagagcc gccacaacaa gcagcatgag cagcagccct 4560
agagccgagc ctacatcttc tagctcttgg gccacctgtt ggcccagatg ctgtagctcc 4620
agctgttact ggtccctgag ttcttggcct cctgctggcg ccgctgaggc tacaaacacc 4680
agaactagaa gcagagagtc ccagcggggc agaatgctga cttggagaag tagtctgtgg 4740
ctgcagggca ccagatgttt tacaggcgtg cggacaagca gcggaagctg tggcagagct 4800
tgtagctgcg gaagaggctg tggaacccct agaggcgatt ggaagagaca ccctcctcgg 4860
aggaatagcg tgatcgtgca caagatcgtg ctggtgtttc tgaagtccct gtccagctac 4920
aactgcgaga gaaggatcag cggcatccag aagagagcca tcgagtttgc cgtgctgaaa 4980
ctgctgaata tggacctgca ctggaactcc gcctacctgg gcagaactct gctggtcacc 5040
tgtatcctgt atcaccggtg gatcgtgacc tccatgtgcc agtctcagag atggctgacc 5100
agcaccacaa gcagatccag cgctctgatg tggacccggc agatcaatcg gaggaagctg 5160
cagagaaaga agaggcaccc aagctggcct tggaccagat gccttagaat gaggcctcct 5220
agaagcggct acccctacga tgtccctgac tatgcgtcct aaaggcgcgc ctagcggccg 5280
c 5281
<210> 1153
<211> 5296
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 3B
<400> 1153
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgggagctg ctgctgcctc ttgtcagtct cctccttctc ctcgggaaac cacacctagc 780
tccgacgcca ccagacggac aagaccaatt gccgctcaga gcaagaaaac catgacagcc 840
gccggactga cccctaagaa caagaagcgg agaaagctgc ggcccaagat gatccggaag 900
atccagaaga gaaggcggac cgccaaccgg cggaatagca gaagggctac ccctacaagc 960
aagggcagcc tgagaagaaa gtacctgaga gtgcggggac ctcctctgca cacccggaac 1020
atcagaaagc tgatctggac caagcagcgg agcttcctgt ctctgttccc caagctgaga 1080
gccaccgagc agatgaccaa tgtgggctgc tctatccctc acgtgcccaa agccacagcc 1140
gctcactctg tgacagtgaa actgcagctg cccctgacct tcagcaccct gctgtgggat 1200
agcagacaca ccatgagcct gagcaacatc ctgatgaagt tccggctgca gtctagccca 1260
ttcctggcca gatcctggaa caccatgcag tggaacaaca agaaaatggc catgaccgtg 1320
atcgctggcg cccaccactg tcagtacaag ctgacctaca ccaaagtgtg gaagatgaac 1380
tggaagaaaa tgatgatcgg cagccagcat ctgctgttca gccctctgga tagcagtccc 1440
ctgcagctcc tgctgcaccc tcacggcaag agatgcaacc cttgctgcag actgacctgg 1500
atgagccaga acaccagaag caccaacctg gaaaagaacc ccagcctgaa gaagcagagc 1560
cagcggagag gaaagctgag cgcctttagc ggcagaatcc tgcaccagcc agaaatggcc 1620
gccatgagac tgatgcccaa gttcctgaac tccaccaaca gctggtggac cctgaccaca 1680
ctgagcttcg tgctgatcga ggaagccaga cagcccagca gacctaccgg cagaacacct 1740
accaccagac tgatggcccc tgtgggcagc gtgatgagct gttctctgct gacccagcct 1800
tctccagcca gcgcctgtac aatgcctcca ctgctgcatc cacagtgggc ccctcatagt 1860
gctggacttt ctccaggcgc ttgcagacct gcctgcacct gtatcagcat gaccaccatc 1920
agcagggcca catggggccc agtgtactac gtgtgcaacc ggatgaacgt gtccagcgtg 1980
ctgaagccct tcctgttcac cgtgcctatc gaggacatga gagagtgcac cctgggcaga 2040
aacagaatga atgtgtcctc tgtgctgaaa ccctgtctga tccctgtgcc aatcagcgag 2100
aagaagagga agctgcccaa catcgagatc acccctcagc ggtctaaggc catgctgcag 2160
aagcagtgct gctacaacct cgtgatcaag caccctctga tcttcagaat caacctgcgg 2220
cggcagggca agaccaaaga tggcgttgtg cagagcctgg gcttcctcaa ccagcagatc 2280
atcctgcaga aagagttctt catctgcctg ctcatgttca tcaagcggtg gaagcctgcc 2340
gccaccaaga gcagaaagaa gggccacacc aagaacagac ggaaggccaa gagaaagccc 2400
cagatctacc tgttcttcct gaccgtgtgc ggctttcacc tgaaaaagac cagcgccaag 2460
tggctgaaga agtccaccaa gtccagatcc aacggcatgg aagcttgcgg cacacacccc 2520
actcctagac tgagctgcct gagagttaga tgcggcggct ggctgtgtgg ctggacacct 2580
agaggtagaa agtccggcgt gatgaagtgc tgggatctgt gccccgtgca caagaagaga 2640
ggcctgttca gactggattt tcaccccaga agcagctccg gcaagggaaa gaacagcccc 2700
tgctgccaaa agaaactgcg ggtgcagaac cagggccatc tgctgatgat tctgctgcac 2760
aatgaccggg tgttcctcgt gaagatcggc gagaagctga agcactgttt caaggcctgg 2820
ggctccagac ggaaccggcg gtacagaaag atctacggcg agctgaagat gtccctgcag 2880
gccttcctga tccacctgag aaaggtggac acccaccacc tccaggtggt caccaaaaca 2940
gtgaccgcca caacagccga cggccagaga atgcggagac tgaagtgcaa ggcctgccgg 3000
ctgagatggg ccagacctga acctgctgct caggcccctc ctaagagcca ctttccacct 3060
catcctagcg gccccagcag aacaagtagc ctgcagctga gaagcctgtt ctttagccac 3120
tgcctgtgca gccagaagaa ggaccctgcc ggcaagctga aaaagctgct gaagaaaagc 3180
agccagctgc ggagaagctg gcgcaatgtg tccagaatca gcacccctcc tccactgatc 3240
ctgtggcctc aagctgctcc tgtgtccgtg atcaccatga agctgtggga gaagcacttc 3300
aagggcctga attggaacct ggtcgtgtgg attctgaacc tgaagatgat gacctacatg 3360
gaaatgcact acggccatca ggccccacag gtggcaatgc tgcctaagct gctgtgcaga 3420
cagatgctgc ccactctgag cacactgcag cagagacatc ctcagggccc ttgtcctcct 3480
cctgtgacac ctctgagagt ccagtctgtc ctgctgctgg gagtgcctca gacagccaga 3540
ggacctagaa gaaaggtcct gatggtgctg tggctgcccg ccaatcagtc tctgcagaaa 3600
agccaggttt tccagtgggt gctgcggaca gaggtggccc ctagatgtcc tagatctgcc 3660
gtggacatca gccccggacc tacatctcct agcctggcct cttgtgcctc tgtggccatt 3720
ggaaagctgg cactgcttgg cgcctctgct ccttgtggtg ctgctggcgc tagagaggcc 3780
ggaagatttg ctgtgctggg caccatggtc atgaagcttt gtttcttcta cctgctgtac 3840
cggctgcgca tcccaagcct gaggaagtac agacagcacc tgaaccggaa gctgcacctg 3900
acaagatcct gcctgatcga tctgaccatg atgatgtccc agaagctctg gaagaaccag 3960
cggaagagaa tccctctgcc atctccacgg caacatctgc tgccacagta ccctctgcac 4020
ccacctccac cttgtctgct gttgctgcac catagacacc acctggcctt tctcgagatg 4080
gcctgtagct ctcagcacac ccacagcatc aagatctgga tcagcttcag ccatgaagtg 4140
gaccctccag gcagcgtgtg gatactgcct tgcgatctgc ctcggatgct gccaatctct 4200
tcacccctgc acagacccca gatgcctttc tggacctgca cctttcctgc cacaacctgg 4260
ggcacatggg agacaccttc tacatggggc tggcggactt tcagaggcgc tagcagcagc 4320
acatcccggg acagcagatc cttcttcacc tctgctcacc ctagcaggcc ctgcagaatg 4380
agactgtacc agtgcaagaa gaagctcctc ctgaaactgc tgaccaccac cacaagcagc 4440
cccagaagat cccctgctct gagagcaaga ggcggcacca caatcggcga agtgaccagc 4500
tgtaccaacc tgagcgtgcc catgatgctg accatcctga tttggaagcg ggtgttcatc 4560
ctcctgctga gcgataagaa gggcgccaag aagatcacct tcctgcctat tcctccacac 4620
ctgagacacc ctctgctgct gttcgagaag aaacggcctg agtggctgag catggacctg 4680
gacggaatgc tgacagtgat cggccaggga ctcgtgggca tgacccctag agatctggga 4740
acagtggcag gcgccaccgc tcagattcag cgacctatcc aggtgcagac tggcggcaga 4800
ctcagaagaa acctgcagag aaacctgaag gtgctccagg tgtccgtgta cagcggcaac 4860
ctgctgtcct ttagcagacg gggcatgaag tctagcgtgc ggctgaaaaa ccgcgagtgg 4920
gagaaacgga agcagattct cggaggcggc ggaaagtaca aagagtactt cctgaagcgc 4980
atcctcatcc ggaaggctat gacagtgctg gccggcgaca agaaaggact gggcagattc 5040
atgagatgcg tgcagagcga gacaaaggcc gtgtctctgc aactgcctct gggaagaaac 5100
atggaacacc ggttgaccat ggacagcgcc ctgagcctga caaagagaga gggacccgag 5160
acactcaaaa agaaatacct ggtccagcac cagatgaagt gtctgaccgc cgtggattgt 5220
ctgcaggctt tttgggacat gggctacccc tacgatgtcc ctgactatgc gtcctaaagg 5280
cgcgcctagc ggccgc 5296
<210> 1154
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 4B
<400> 1154
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgatccaga agaagaagca gaagtccaac ctggacctgc agcaccagcg cagacgcaaa 780
aagaagaagg acaaggtcga gatccggaat cggagcccca aggccaatag cacagagtgt 840
cagggcgagc acagcagaga gcagaacctg ctgaatctgg tgcagctgaa ccctcacagc 900
cctcaccaca gaaaggacga agaggaccac cagaagcggc accaccacca caatcaaaag 960
aaaatgagcg tgatggccaa gaagtcccag cagcctctcg gacaggcctt tggctctctg 1020
tgtcagctgg tgtccgccga tttcagcgcc cctcaagtga ccagactgcg gagcctgaac 1080
catctgctga tcaacgaggg caacaaccac tggcctagag tggaaatgcc taccggttgg 1140
ctgctcgtgg gctacaacac cagaaacaca gcccagaatc ctcggctgca gcagcacctg 1200
aaacactggc agcagtgcac cagagccaga tggtgccaag agccttgtca gaccctgacc 1260
ttcttccatt tcttcttctt tttcaaaacg gtgtccctgt gctgccccgg ctggtctaaa 1320
ggacaacctc ctccacctgg cctgaagcct tctagcctgg cttctcaggt ggccagaacc 1380
acaggcgtgt accagcacgt gtggctgatc tgcttcgtgt tcttcgtgtg cgtggaaacc 1440
ggcttctgtc acgtggccca agtgggactc gagagactgg tgtctctgag cggcatcacc 1500
gacgtgaacc attgggccca gcctaagcca tctcctagca aaggcaccgg catgaacaga 1560
cccatcggcc tgagagttgg caaaggcgtg tgggccagac tgagagcctc cgtgtctttc 1620
tggaccctgc tgcctacaac aggcgtgcgg acaagaggaa gccctctgag actgacactg 1680
tggcctccac ggaacatcct gaacagcctg cctagcagca tggaaatcgc cgtgctgcaa 1740
gagaaccgca agaccagaaa ggccgccaga gagaagcaca gaaagaccga caacctgcac 1800
ctgtgctact accacagcca gagcaaccgg aacaagagcc ggcagatgga aagcctgggc 1860
atgaagctgc agagccctct gtgggattgc tccaccacaa caggcacaca ccacggctgt 1920
ctgtgggaga tccctagcgt tacactgctg gcctgcagag tgaacgccgt ggaagaactg 1980
cacagcaggc ggatgtctgt gcggatcgtg aagaactggg tgtcctgctg ttacgtgcgc 2040
ctgtctgctg tgggcctgtc tacttggagc gccctggacg tggtcatcaa cctgaagcgg 2100
ctgcagaagt tcagccagaa gtctcagcac cactgcgccc tgagaaagat cgagtgggcc 2160
acaaagctga gcctcggcgg aaaagctgga ccccaggctc aagagaaggc caacgccaag 2220
aagatgccct tccagcggtg gatcttcagc aatcagctga ccgtgcagat gctgtgcctg 2280
cctattgaag ccctgactgc cctgttcacc tgtcggacag ccagcatcag cgtgaacatc 2340
agcaccctga tgagcatcct ggaagcccct ctgttttttc acggcgacct gtgcgaggaa 2400
aagaagaacg gccggatcag cagccaggct cctctcagac tttggtcttg gtgcggcaca 2460
agccagacct actttggcag caccgccaag aaaagcccca ccagcttttg ctgcgagtgg 2520
ggaggacagg ctcaccggca gagaaatacc ggaatggaaa tcctgctgtg gattctgctc 2580
aagatggaaa ttcagatctt caagatttgc ctgggcgaga tgcagctgtg cacctacaca 2640
ccccacatct gcagacacac ctgtagaggc ggacctagcg ccagcgatag atgctgtagc 2700
tgtagcccta gcggcttcag cgccggaaga ggcagatgtc cagttcaggg atgtctgcgg 2760
cctcacagag tgcagctgct gagaagatgg ggccctggat ctcctgctgg ccagagactg 2820
tctaagggct ttcagctgct ccgttggtgg ggaccaggat ctccagctcc tgagcctaga 2880
aagggcccat ttccaccacc tgatcctcca tggcctgtga ccgctgtgac agtgatggct 2940
ggctctgtgc ctagcgctca gtctgtggat gctctggaaa gccctggacc tctggcactg 3000
gaaggaccta gcagccccag aaacctgctc tggcgggaaa tgagcatctt cctgcctggc 3060
atcttcacct ctcggattct gaacctgcaa gtgctgaaga agatcctgcg gagctttatg 3120
aagctgtacc actctctggt catgtgcctg cggctgcgga ccaagctgga aaaagctctg 3180
agcgctctgt tcatctggcc ccagcacagc tacaagcaga ggcctcctct gcagcctgtg 3240
caggtcgtgc tcagactggg aaacctgcct ccattcttca gaggcagcga ggtgcccttt 3300
cctagacctt gccggaccaa gatgctgaac cagaagtgtc tggccccttt catcacacac 3360
ccattcgcct ctcagcccct gggacaagag atgcccaaca acacccagat cagactgctg 3420
aagcccctgc tgacccctga caccagatgg atcttctcca accagctgca gacagtccag 3480
atgctctgtc tgccacctct gaagcagggc gagagaatca tttggcccct cggcggcttt 3540
cagatcccca acttcttttg gagcctcgga atcggccaca ctggcgcctg gtggcatact 3600
ggaaggcgga gaagagaatg gggcggctcc accgtgtcta gaagcccact gtggatcagc 3660
tccatgatct acctgagagg catggccttc gccagcgaca gctccatcag aaccaccaga 3720
gtgtcctggt gcagaagatg cggcgccaaa tctgccgctg cctccagcct caagaagaaa 3780
ccccgggaca tctgtcggat cagcgactct aagaagatga cccagaagcg cgagagcacc 3840
ctgggcaatt tctggatgaa gctcctccag ctgccagaca agaagaagaa gtctaccgaa 3900
aagaccaaga tcatcaagaa gatgaagaaa cggatcatgg tccacatgtg cagctccctg 3960
gctctgccaa caggcctgac atctctgatc ctgccaagca gcgatctggc cgtgctgatc 4020
tctagctcca ccagccactt tctgatgcgg agcccagtgc tgcctagctc cagactgact 4080
tgtgcctctc cacagctgcc cagaatgtgg acctggtcca gctggctgaa gtggctgaaa 4140
aactggaagc ggttcaagct taaaaagaag tacatcctgg ccatgacgct gaccctgaac 4200
gggcatccaa gaaccgcctc tatcaccctg cctaccacca gcctgaaggg ctctagaacc 4260
agctgttgcc ccagatctca ccccagactg cctaggacaa agtggcctct gcagtgcctg 4320
ctgcacagcc tgggaacaac tggaacactc gtgtgggaaa ggggcgtgct gcagatgaga 4380
agtctggaag ctcactgccc tctgcagacc ttccacctcc accactgtag aactcagccc 4440
agctcttgcc ctcctgcatg gattctgtac caaggacagt ggagcggagc cgtcgtggga 4500
cttagacctg tggctcacca tctgccaaga cctattcagg gcctgcactg cccacaggct 4560
ccacatcaac cagctctgtc ttggggcaag tggcccgtgg gaatgacagg acctgccaga 4620
tgttgccggt ggcctagacg ggaactcaaa aagaatctgc tgctcccctg ccggtgcaga 4680
cgcgagtata gagtgacaat gggccaagcc ttcggcagct ttagcgccga ctttagcgct 4740
ccccaggtgt tgaagaagaa tcggaagcag aacaagatta tctgcaaggg ccaccgcatc 4800
acaagcctga tcctgagctt tcagcgcgtg aaacttaaga agaaagtcaa cgcctgctct 4860
cccgcctgca cctctaaagc ctggactccc agaaagctcg tggggagagc cgtcagaaga 4920
aagggcatca tctgtatcaa gaatatgttc ctgcagcgga agggtttcct gaacctgagc 4980
cacgtggaaa agttcgtgcc tccttctcct cctctggctc tcggccctag aatgcagctc 5040
tgtacccagc tggcccggtt cttccctatc acacctcctg tgtggcacat cctgggacct 5100
cagaggcaca ccccttgtca aaagaaggtg ccctccgcta gcccatgggg ccttagacca 5160
tctccttgcc tgagctggtc ctccagaatt gtggcccctg gacacgccct gagctgtcgg 5220
actagaagaa gatggtccag caagggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1155
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 1C
<400> 1155
Ser Thr Arg Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly
1 5 10 15
Pro Trp Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys
20 25 30
Leu Arg Leu Arg Asn Thr Ser Pro Thr Glu Ile Gln Leu Thr Met Asn
35 40 45
Asp Ser Lys His Lys Leu Glu Ser Pro Ala Leu Lys Gln Val Ser Pro
50 55 60
Ala Ser Pro Pro Thr Gln Gln Pro Gln Thr Pro Gln Asp Ser Arg Gln
65 70 75 80
Val Leu Ala Ala Ser Ser Pro Gly His Pro Leu Gly Pro Gly Asp Cys
85 90 95
Pro Arg Thr Met Ala Gly Pro Ser Ala Ser Leu His Pro Ala Ser Gly
100 105 110
Arg Ala Ser Arg Lys Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg Ala
115 120 125
Gly Gly Pro Ala Gly Trp Ala Arg Gln Ala Met Thr Leu Lys Ala Leu
130 135 140
Val Lys Thr Trp Thr Gln Phe Arg Asn Tyr Pro Arg Val Gly Ala Gly
145 150 155 160
Thr Gly Gly Gly Pro Ala Cys Val Pro Val Ala Glu Ala Ser Thr Gly
165 170 175
Ala Trp Thr Ala Glu Gly Ala Ala Gly Thr Arg Cys Arg Ala Ser Arg
180 185 190
Ala Pro Cys Arg Gln Leu Pro Ala Ser Ser Pro Thr Lys Cys Glu Ile
195 200 205
Cys Val Lys Arg Arg Arg Arg Arg Lys Arg Ser Ser Gln Ser Arg Ser
210 215 220
Pro Val Pro Lys Lys Arg Glu Arg Met Met Leu Pro Val Arg Ala Arg
225 230 235 240
Thr Ala Arg Ser Ala Leu Pro Gln Gly Arg Ala Pro Leu Glu Gly Met
245 250 255
Leu Leu Pro Arg Ala Leu Pro Ser Leu Leu Ser Arg Met Pro Ala Arg
260 265 270
Arg Glu Ser Arg Phe Trp Leu Ala Leu Gln Ala Leu Gly Leu Arg Pro
275 280 285
Pro His Leu Pro Ser Cys His Pro Leu Pro Gln Leu Leu Gly Pro Pro
290 295 300
Pro Pro His Gln Ala Pro Phe Asp Lys Lys Gly Phe Val Ile Leu Ser
305 310 315 320
Lys Gly Lys Lys Arg Arg Lys Glu Ile Arg Arg Met Thr Arg Arg Thr
325 330 335
Met Thr Thr Thr Lys Met Met Met Met Arg Arg Thr Lys Arg Arg Arg
340 345 350
Arg Lys Arg Arg Arg Met Thr Met Met Thr Arg Arg Thr Leu Leu Thr
355 360 365
Lys Lys Thr Cys Leu Thr Pro Arg Thr Ser Ala Ala Thr Lys Ala Leu
370 375 380
Pro Arg Gln Thr Ile Ser Gln Arg Arg Pro Ile Gln Thr Pro Pro Gly
385 390 395 400
Thr Ser Leu Ala Ile Trp Gly Arg Leu Pro Leu Arg Pro Gln Arg Gly
405 410 415
Pro Arg Pro Leu His Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln
420 425 430
Arg Arg Ile Ala Lys Lys Arg Ile Lys Leu Arg Arg Asn Thr Leu Ala
435 440 445
Ile Arg Phe Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val Thr Ala
450 455 460
Ala Pro Ser Gly Gln Tyr Phe Ser Ser Phe Phe Tyr Thr Ser Asp Arg
465 470 475 480
Thr Lys Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile Thr
485 490 495
Leu Ile Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys His Pro His
500 505 510
Arg Arg Pro Gly Trp Lys Gly His His Arg Val Val Phe Ser His His
515 520 525
Pro Ser Gly Ser Thr Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly
530 535 540
Gly Arg Arg Glu Lys Lys Gly Cys Arg Glu Met Pro Ser Ser Trp Ser
545 550 555 560
Ser Ser Gly Arg Thr Ala Asp Lys Lys Asn Val Arg Ser Arg Thr Arg
565 570 575
Leu Thr Leu Thr Gly Thr Arg Ser Ser Gly Thr Arg Ala Ser Pro Ser
580 585 590
Ala Val Cys Leu Cys Cys Trp Thr Cys Pro Ser Arg Ser Phe Pro Ala
595 600 605
Ala Ser Pro Ser Gly Leu Arg Ala Pro Val Gly Ala Gln Ala Pro Pro
610 615 620
Glu Val Thr Leu Arg Ala Ser Cys Ala Ser Ser Ala Ser Lys Ala Cys
625 630 635 640
Ala Gly Leu Trp Pro Trp Gly Ala Gln Val Arg Asn Lys Val Arg Gln
645 650 655
Asn Phe Lys Arg Asn Leu Ala Lys Lys Thr Leu Thr Asn Ala Leu Arg
660 665 670
Ser Met Pro Lys Ser Arg Asn Gln Val Leu Phe Arg Arg Asn Leu Thr
675 680 685
Pro Ser Gln Leu Arg Thr Leu Ala Pro Pro Tyr Met Leu Leu Pro Gln
690 695 700
Ser Leu Ser Gln Ser Leu Ser Arg Lys Gln Ile Pro Ser Gln Ser Met
705 710 715 720
Leu Val Thr Ala Phe Phe Leu Leu Asp Ile Ile Leu Arg Ser Leu Leu
725 730 735
Tyr Ser Arg Met Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro
740 745 750
Asp Tyr Phe Val Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser
755 760 765
Phe Pro Val Gly Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys
770 775 780
Ser Cys Thr Ser His Ser Asn Pro Trp Ser Gln Ser Phe Lys Lys Lys
785 790 795 800
Lys Pro Leu Thr Phe Ser Pro Ser Val Pro Met Ser Leu Ala Cys Ser
805 810 815
Ile Thr Val Ser Phe Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val
820 825 830
Ser Ser Ile Ser His Trp Arg Lys Arg Lys Arg Glu Lys Arg Ser Gln
835 840 845
Lys Ser Arg Gln Asn His Leu Gln Leu Lys Ser Cys Arg Arg Lys Ile
850 855 860
Ser Asn Trp Ser Lys Leu Arg Ser Pro Trp Ile Phe Tyr Pro Arg Leu
865 870 875 880
Lys Thr Phe Gly Val Pro Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser
885 890 895
Leu Ser Thr Met Met Ile Ile Ser Thr Thr Arg Gln Glu Cys Gly Arg
900 905 910
Arg Ala Ser Val Pro Cys Arg Pro Met Ile Gly Ser Ala Arg Pro Gly
915 920 925
Pro Trp Arg Thr Ser Ala Met Pro Ser Ala Met Gly Val Ala Leu Pro
930 935 940
Thr Ser Cys Glu Ser Gly Arg Ser Pro Pro Ala Thr Gly Gly Arg Met
945 950 955 960
Pro Gly Ser Gln Ser Ile Met Met Ser Trp Met Pro Pro Leu Ala Pro
965 970 975
Cys Ala Ala Cys Pro Cys Ser Pro Ala Pro Thr Leu Cys Pro Ala His
980 985 990
Pro Ala Arg Ala Pro Thr Ala Val Pro Ala Phe Thr Pro Leu Ser Ala
995 1000 1005
His Pro Val Pro Val Leu Ser Gly Cys His Leu Ala Val Arg Thr
1010 1015 1020
Ser Met Leu Thr Leu Leu Pro Met Arg His Pro His Arg Ser Pro
1025 1030 1035
Pro Thr Ser Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu Pro Arg
1040 1045 1050
Ala Ser Leu Arg Ala Thr Val Pro Arg His Ser Ser Val Leu Ala
1055 1060 1065
Thr Gly Leu His Leu His Arg Gln Ile Ser Leu Pro Leu Arg Gly
1070 1075 1080
Phe Leu Leu His Gln Pro Leu Pro Gly Gln His Leu Trp Leu Ser
1085 1090 1095
His Arg Leu Arg Leu Arg Leu Pro Arg Thr Gly Glu Lys Asn Asp
1100 1105 1110
Leu Gln Leu Phe Val Met Ser Asp Thr Thr Tyr Lys Ile Tyr Trp
1115 1120 1125
Thr Val Ile Leu Leu Asn Pro Cys Gly Asn Leu His Leu Lys Thr
1130 1135 1140
Thr Ser Leu Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr Cys Arg
1145 1150 1155
Met Trp Trp Leu Lys Leu Ala Pro Leu Gln Val Thr Thr Thr Leu
1160 1165 1170
Lys Leu Ile Leu Val Met Leu Glu Ile Val Thr Glu Glu Ala Lys
1175 1180 1185
Lys Ser Met Lys Arg Ser Arg Arg Ser Lys Ile Glu Ala Ser Pro
1190 1195 1200
Ile Gly Ser Ile Met Lys Lys Lys Asp Ser Thr Ile Phe Ile Asn
1205 1210 1215
Gln Gln Leu Lys Trp Thr Pro His Ile Leu Lys Ser Ala Ser Val
1220 1225 1230
Ser Lys Lys Arg Leu Pro Lys Leu Asn Gly Ile Trp Glu Val Met
1235 1240 1245
Pro Arg Thr Leu Glu Gly Cys Ile Ser Val Lys Asp His Arg Thr
1250 1255 1260
Ser Gln Asn His Ser Lys Cys Ile Thr Glu Cys Val Arg Thr Ala
1265 1270 1275
Leu Asn Gln Arg Lys Val Val Lys Asn Pro Ser Gln Pro Val Pro
1280 1285 1290
Leu Arg Asn Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr Arg Ser
1295 1300 1305
Cys Ser Ile Ser Leu Lys Lys Ser Leu Glu Lys Met Pro Leu Met
1310 1315 1320
Asn Ala Lys Lys Met Glu Asp Met Ile Trp Glu Ser Asn Met Gly
1325 1330 1335
Gly Asn Arg Ser Ile Cys Leu Thr Arg Leu Pro Cys Lys Val Thr
1340 1345 1350
Glu Ser Ser Gln Arg Pro Pro Arg Ser Ile Leu Ser Leu Ala Ser
1355 1360 1365
Arg Ala Gly Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly Met
1370 1375 1380
Ser Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg Cys
1385 1390 1395
Pro Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn Gly Trp
1400 1405 1410
His Arg Ser Gly Leu Arg Ala Gln Gln Pro Ser Leu Pro Gly Pro
1415 1420 1425
Cys Ala Ser Leu Leu Ser Thr Leu Ser Gln Pro Pro Pro Gln Ala
1430 1435 1440
Pro Ser Gln Val Trp Thr Ala Ala Thr Leu Arg Cys Pro Ala Val
1445 1450 1455
Pro Ala Ala Ala Cys Pro Pro Ile Val Phe Phe Leu Ala Pro Tyr
1460 1465 1470
Phe Pro Thr Pro Leu Ser Ile Ser Arg Pro Thr Ser Arg Ala Arg
1475 1480 1485
Gln Ser Cys Cys Leu Pro Gly Leu Thr His Pro Ala His Gln Pro
1490 1495 1500
Leu Gly Ser Met
1505
<210> 1156
<211> 1501
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 2C
<400> 1156
Arg Gln Ile Asn Arg Arg Lys Leu Gln Arg Lys Lys Arg Arg Lys Lys
1 5 10 15
Arg Glu Asp His Cys Gly Leu Arg Ala Arg Asn Arg Asn Met Lys Lys
20 25 30
Thr Met Ser His Leu Ile Ala His Gln Ala Leu Lys Met Ser Gly Leu
35 40 45
Arg Leu Phe His Pro Arg Leu Leu Thr Arg Lys Lys Pro Gly Lys Asn
50 55 60
Pro Arg Arg Lys Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln Lys Pro
65 70 75 80
Ser Gln Lys Asn His Leu Tyr Gly Lys Gly Leu Thr His Pro Val Pro
85 90 95
Leu Lys Arg Thr Leu Gln Asn Lys Arg Asn Lys Asn Ile Lys Arg Val
100 105 110
Asn Gln Lys Lys Gly Asn Ile Lys Arg Lys Ser Ile Leu Leu His Leu
115 120 125
Ile Val Leu Asn Ser Pro Glu Ser Asn Leu Gln Ala His Pro Gln Val
130 135 140
Pro Ala Leu Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg Gly Pro Leu
145 150 155 160
Thr Ser Ala Pro Ser Ala Gln Gln Ser Leu Thr Phe Leu Pro Ser Arg
165 170 175
Phe Pro Trp Gly Pro Pro Pro Leu His Trp Asn Ser Ala Tyr Leu Gly
180 185 190
Arg Thr Leu Leu Val Thr Cys Ile Leu Tyr His Arg Trp Ile Val Thr
195 200 205
Ser Met Cys Gln Ser Gln Arg Trp Leu Thr Ser Thr Thr Ser Arg Ser
210 215 220
Ser Ala Leu Met Trp Thr Gln Trp Ser Ser Val Thr Ser Leu Glu Trp
225 230 235 240
Thr Ala Gln Glu Arg Gly Cys Ser Ser Trp Leu Met Lys Gln Thr Trp
245 250 255
Met Lys Ser Trp Ser Leu Arg Asp Pro Ser Tyr Arg Ser Ile Leu Glu
260 265 270
Tyr Val Ser Thr Arg Val Leu Trp Met Pro Thr Ser Thr Val Gly Ala
275 280 285
Leu Arg Ala Thr Ala Pro Ala Thr Ala Ala Pro Gln Ala Gln Thr Pro
290 295 300
His Trp Arg Ala Ala Thr Thr Ser Ser Met Ser Ser Ser Pro Arg Ala
305 310 315 320
Glu Pro Thr Ser Ser Ser Ser Trp Ala Thr Cys Trp Pro Arg Cys Cys
325 330 335
Ser Ser Ser Cys Tyr Trp Ser Leu Ser Ser Trp Pro Pro Ala Gly Ala
340 345 350
Ala Glu Ala Thr Asn Thr Arg Thr Arg Ser Arg Glu Ser Gln Arg Gly
355 360 365
Arg Met Leu Thr Trp Arg Ser Ser Leu Trp Leu Gln Gly Thr Arg Cys
370 375 380
Phe Thr Gly Val Arg Thr Ser Ser Arg His Pro Ser Trp Pro Trp Thr
385 390 395 400
Arg Cys Leu Arg Met Arg Pro Pro Arg Ser Asn Ser Arg Lys Lys Leu
405 410 415
Leu Glu Asp Met Lys Gln Asn Gly Phe Thr Arg Tyr Lys Lys Arg Gly
420 425 430
Val Ile Ala Trp Arg Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys
435 440 445
Ser Leu Pro Gln Ala Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu
450 455 460
Leu Val Gln Ser Arg Cys Ser Leu Met Glu Gln Ile Pro His Leu Lys
465 470 475 480
Ser Trp Trp Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys
485 490 495
Lys Val Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys
500 505 510
Gly Ile Cys Trp Lys Trp Pro Val Thr Val Ala Ala Leu Ile Leu Ile
515 520 525
Gln His Gly Gly Ile Phe Thr Phe Arg Phe Trp Val Glu Lys Leu Ser
530 535 540
Trp Asn Ile Cys Lys Asn Leu Ser Leu Tyr Leu Asp Lys Phe Val Gln
545 550 555 560
Arg Leu Leu Tyr Val Tyr Ile Ile Glu Thr Asn Val Phe Val Leu Asn
565 570 575
Leu Phe His Val Pro Val Asn Gln Ile Phe Met Met Ala Phe Tyr Leu
580 585 590
Lys Tyr Thr Glu Lys Ala Trp Val Met Glu Leu Glu Trp Leu Ile Gln
595 600 605
Gln Gln Cys Tyr Gln Leu Leu Leu Ala His Met Tyr Gly Phe Ser Thr
610 615 620
Tyr Gly Thr Gln Lys Gly Glu Cys Val Cys Leu Gln Cys Leu Ser Gly
625 630 635 640
Ser Ser Leu Phe Ile Leu Lys Gln Pro Leu Asp Leu Lys Ile Ser Lys
645 650 655
Thr Phe Met Ser Arg Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys
660 665 670
Lys Val Lys Ala Ser Pro Gln Ile Met Gln Arg Met Ser Ala Val Asn
675 680 685
Phe Glu Thr Ile Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys Asn
690 695 700
Leu Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr Ser Pro Leu Trp Lys
705 710 715 720
Ile Thr Met Val Leu Thr Tyr Pro Asn Cys Val Val His Val Leu Met
725 730 735
Phe Val Leu Phe Lys Ala Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly
740 745 750
Ile Tyr Pro Pro Ser Thr Cys Ser Leu Pro Cys Arg Gly Ile Arg Met
755 760 765
Cys Ala Leu Ser His Pro Ser Phe Tyr Ile Ser Ser Thr Val Cys Phe
770 775 780
Leu Ser Lys His Cys Met Thr Ala Cys Thr Arg Glu Lys Ile Ile Asn
785 790 795 800
Pro Thr Ile Ser Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Gly His
805 810 815
Arg Glu Gly Ser Glu Ser Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro
820 825 830
Pro Trp Leu Pro Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly Phe
835 840 845
Gln Trp Gly Glu Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly Asn
850 855 860
Ser Val Ile Val His Lys Ile Val Leu Val Phe Leu Lys Ser Leu Ser
865 870 875 880
Ser Tyr Asn Cys Glu Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile
885 890 895
Glu Phe Ala Val Leu Lys Leu Leu Asn Met Asp Leu Ala Ser Pro Gln
900 905 910
Ile Met Gln Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg Arg Met
915 920 925
Gln Asn Leu Asp Asn Leu Gly Val Pro Trp Pro Leu Leu Pro Gly Ala
930 935 940
Ala Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp Ile Leu Phe His
945 950 955 960
Val Arg Asn Ile Val Tyr Gly Ile Gln Val Met Leu Cys Arg Arg Arg
965 970 975
Asn Ser Arg Lys Gln Ser Gln Val Gln Leu Ala Ile Gln Val Leu Leu
980 985 990
Val Asp Lys His Lys Tyr Phe Leu Phe Gly Pro Tyr Pro Ile Ser Glu
995 1000 1005
Gly Leu Thr Met Thr Thr Gly Arg Asn Ile Asn Ser Asn Ser Leu
1010 1015 1020
Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu Cys His His Ala
1025 1030 1035
Ile Met His Arg Lys Met Thr Ser Pro His Phe Arg Leu Phe Ser
1040 1045 1050
Ser Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala Leu Cys
1055 1060 1065
Lys Phe Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile Phe Gln Lys
1070 1075 1080
Lys Gly His Met Ile Phe Ser Pro Lys Phe Phe Leu Thr Phe Ser
1085 1090 1095
Gln Arg Thr Leu Glu Ser Ala Gly Leu Phe Pro Trp Leu His Thr
1100 1105 1110
Gln Cys Arg Asn Lys Lys Thr Lys Leu Trp Phe Ser Leu Ile Asn
1115 1120 1125
Ile His His Arg Lys Asn Pro Leu Leu Pro Met Arg Met Ser Arg
1130 1135 1140
Thr Pro Pro Arg Arg Val Cys Gly Ser Pro Pro Leu His Leu Cys
1145 1150 1155
Gln Pro Leu Arg Gly Gly Lys Lys Arg Ser Lys Phe Ala Phe Trp
1160 1165 1170
Lys Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr Gly Cys
1175 1180 1185
Trp Gly Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly
1190 1195 1200
Thr Pro Arg Gly Asp Trp Lys Arg His Pro Pro Arg Arg Glu Leu
1205 1210 1215
Ser Leu Glu Pro Trp Ile Pro Tyr Leu His Gln Gln Lys Thr Gln
1220 1225 1230
Arg Lys Arg Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile
1235 1240 1245
Gln Glu Lys Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe
1250 1255 1260
Glu Ala Cys Arg Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile
1265 1270 1275
Thr Leu Phe Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn Val
1280 1285 1290
Leu Cys Val Arg Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys
1295 1300 1305
Arg Lys Met Lys Arg Asn Gln Val Ala Ser Pro Gln Ile Met Gln
1310 1315 1320
Arg Leu Phe Ile Lys Gly Tyr Gln Asn Asn His Phe Thr Phe His
1325 1330 1335
Leu Gln Asn Phe Ala Phe Phe Ser Ser Phe Gly Asn Asn Lys Tyr
1340 1345 1350
Ile Asn Ile Leu Thr Arg Ala Phe Ile His Thr Pro Arg Ser Pro
1355 1360 1365
Gly Cys Ser Val Tyr Ala Asn Met Cys Trp Arg Lys Met Gln Ser
1370 1375 1380
Leu Asn His Pro Ser Arg Leu Thr Asn Cys His Pro Ala Trp Leu
1385 1390 1395
Ser Pro Ile Ser Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe His
1400 1405 1410
Val Leu Ala Leu Glu Val Thr Phe Pro Pro Gly Thr Ala Met Pro
1415 1420 1425
Gln Met Gln Leu Gln Ala Leu Ala Met Trp Glu Lys Gly Trp Asp
1430 1435 1440
Lys Gln Glu Lys Lys Ser Arg Lys Leu Met Ser Ser Cys Leu Glu
1445 1450 1455
Lys Lys Ala Thr Trp Met Arg Arg Thr Pro Gly Thr Ser Leu Gln
1460 1465 1470
Cys Tyr Leu Asn Thr His Pro Cys Thr Met Leu Leu Pro Gln Gly
1475 1480 1485
Ile Pro Ser Leu Asn Ala Gln Trp Met Phe Leu Arg Ile
1490 1495 1500
<210> 1157
<211> 1506
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 3C
<400> 1157
Pro Ile Pro Pro His Leu Arg His Pro Leu Leu Leu Lys Asn Lys Lys
1 5 10 15
Arg Arg Lys Leu Arg Pro Lys Ser Arg Lys Lys Gly His Thr Lys Asn
20 25 30
Arg Arg Lys Ala Lys Arg Lys Pro Gln Ile Arg Asn Ser Arg Arg Ala
35 40 45
Thr Pro Thr Ser Lys Gly Ser Leu Arg Arg Lys Tyr Leu Arg Val Gly
50 55 60
Ala Ala Ala Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr Thr
65 70 75 80
Pro Ser Ser Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln Ser
85 90 95
Lys Lys Thr Met Thr Ala Ala Gly Leu Thr Pro Ser Gln Lys Lys Asp
100 105 110
Pro Ala Gly Lys Leu Lys Lys Gln Val Ser Val Tyr Ser Gly Asn Leu
115 120 125
Leu Ser Phe Ser Arg Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn
130 135 140
Cys Thr Asn Leu Ser Val Pro Met Met Leu Thr Ile Leu Ile Trp Lys
145 150 155 160
Arg Val Phe Ile Leu Leu Leu Ser Asp Lys Lys Ser Ile Pro His Val
165 170 175
Pro Lys Ala Thr Ala Ala His Ser Val Thr Val Lys Leu Gln Ser Arg
180 185 190
Arg Asn Arg Arg Tyr Arg Lys Ile Tyr Gly Glu Leu Lys Met Ser Leu
195 200 205
Gln Ala Ser Asn Gly Met Glu Ala Cys Gly Thr His Pro Thr Pro Arg
210 215 220
Leu Ser Val Ser Val Ile Thr Met Lys Leu Trp Glu Lys His Phe Lys
225 230 235 240
Gly Leu Asn Trp Asn Leu Val Val Trp Ile Leu Asn Leu Lys Met Met
245 250 255
Leu Lys Lys Lys Tyr Leu Val Gln Arg Glu Trp Glu Lys Arg Lys Gln
260 265 270
Ile Leu Gly Gly Gly Gly Lys Tyr Lys Glu Tyr Phe Leu Lys Arg Ile
275 280 285
Leu Ile Arg Lys Ala Met Thr Val Leu Ala Gly Asp Lys Lys Gly Leu
290 295 300
Gly Arg Phe Met Arg Cys Val Gln Ser Glu Thr Lys Ala Val Ser Leu
305 310 315 320
Gln Leu Pro Leu Gly Arg Met Asp Leu Asp Gly Met Leu Thr Val Ile
325 330 335
Gly Gln Gly Leu Val Gly Met Thr Pro Arg Asp Leu Gly Thr Val Ala
340 345 350
Gly Ala Thr Ala Gln Ile Gln Arg Pro Ile Gln Val Gln Thr Gly Gly
355 360 365
Arg Leu Arg Gly Pro Arg Arg Lys Val Leu Met Val Leu Trp Leu Pro
370 375 380
Ala Asn Gln Ser Leu Gln Lys Ser Gln Val Phe Gln Trp Val Leu Arg
385 390 395 400
Thr Glu Leu Pro Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser Arg His
405 410 415
Asp Leu Pro Arg Met Leu Pro Ile Ser Ser Pro Leu His Arg Pro Gln
420 425 430
Met Pro Phe Trp Thr Cys Thr Phe Pro Ala Thr Thr Trp Gly Thr Trp
435 440 445
Glu Thr Pro Ser Thr Trp Gly Trp Arg Thr Phe Ala Arg Gln Pro Ser
450 455 460
Arg Pro Thr Gly Arg Thr Pro Thr Thr Arg Leu Met Ala Pro Val Gly
465 470 475 480
Ser Val Met Ser Cys Ser Leu Leu Thr Gln Pro Ser Pro Ala Ser Ala
485 490 495
Cys Thr Met Pro Pro Leu Leu His Pro Gln Trp Ala Pro His Ser Ala
500 505 510
Gly Leu Ser Pro Gly Ala Cys Arg Pro Ala Cys Thr Cys Ile Ser Met
515 520 525
Thr Thr Ile Ser Arg Ala Thr Trp Arg Arg Asn Leu Gln Arg Asn Leu
530 535 540
Lys Val Leu Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln Gln
545 550 555 560
Asn Thr Arg Ser Thr Asn Leu Glu Lys Asn Pro Ser Leu Lys Lys Gln
565 570 575
Ser Gln Arg Arg Gly Lys Leu Ser Leu Thr Thr Leu Ser Phe Val Leu
580 585 590
Ile Glu Glu Leu Leu Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg
595 600 605
Asn Val Ser Arg Ile Ser Asn Ile Arg Lys Leu Ile Trp Thr Lys Gln
610 615 620
Arg Ser Phe Leu Ser Leu Phe Pro Lys Leu Arg Ala Thr Glu Gln Met
625 630 635 640
Thr Asn Val Gly Cys Arg Leu Asp Phe His Pro Arg Ser Ser Ser Gly
645 650 655
Asp Arg Val Phe Leu Val Lys Ile Gln Ser Ser Pro Phe Leu Ala Arg
660 665 670
Ser Trp Asn Thr Met Gln Trp Asn Asn Lys Lys Met Ala Met Thr Val
675 680 685
Ile Ala Gly Ala His His Cys Gln Tyr Lys Leu Thr Tyr Thr Lys Val
690 695 700
Trp Lys Met Asn Trp Lys Lys Met Met Ile Gly Ser Gln His Leu Leu
705 710 715 720
Phe Ser Pro Leu Asp Ser Ser Pro Leu Gln Leu Leu Leu His Pro His
725 730 735
Gly Lys Arg Cys Asn Pro Cys Cys Arg Leu Thr Trp Met Ser His Leu
740 745 750
Asn Arg Lys Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu Thr Met
755 760 765
Met Met Ser Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile Pro Leu
770 775 780
Pro Ser Pro Arg Gln His Leu Leu Pro Gln Tyr Pro Leu His Pro Pro
785 790 795 800
Pro Pro Cys Leu Leu Leu Leu His His Arg His His Leu Ala Phe Leu
805 810 815
Glu Met Ala Cys Ser Ser Gln His Thr His Ser Ile Lys Ile Trp Ile
820 825 830
Ser Phe Ser His Glu Thr Met Ser Leu Ser Asn Ile Leu Met Lys Phe
835 840 845
Arg Leu Thr Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg
850 855 860
Ala Arg Gly Gly Thr Thr Ile Gly Glu Val Thr Ser Ser Leu Phe Phe
865 870 875 880
Ser His Cys Leu Cys Val Ala Pro Arg Cys Pro Arg Ser Ala Val Asp
885 890 895
Ile Ser Pro Gly Pro Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser Val
900 905 910
Ala Ile Gly Lys Leu Ala Leu Leu Gly Ala Ser Ala Pro Cys Gly Ala
915 920 925
Ala Gly Ala Arg Glu Ala Gly Arg Phe Ala Val Leu Gly Thr Met Val
930 935 940
Met Lys Asn Met Glu His Arg Leu Thr Met Asp Ser Ala Leu Ser Leu
945 950 955 960
Thr Lys Arg Glu Gly Pro Glu Thr Gly Pro Val Tyr Tyr Val Cys Asn
965 970 975
Arg Met Asn Val Ser Ser Val Leu Lys Pro Phe Leu Phe Thr Val Pro
980 985 990
Ile Glu Asp Met Arg Glu Cys Thr Leu Gly Arg Asn Arg Met Asn Val
995 1000 1005
Ser Ser Val Leu Lys Pro Cys Leu Ile Pro Val Pro Ile Cys Lys
1010 1015 1020
Lys Lys Leu Leu Leu Lys Leu Leu Arg Gly Ala Ser Ser Ser Thr
1025 1030 1035
Ser Arg Asp Ser Arg Ser Phe Phe Thr Ser Ala His Pro Ser Arg
1040 1045 1050
Pro Cys Arg Met Arg Leu Tyr Gln Met Leu Gln Lys Gln Cys Cys
1055 1060 1065
Tyr Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile Asn Leu
1070 1075 1080
Arg Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser Leu Gly
1085 1090 1095
Phe Leu Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys
1100 1105 1110
Leu Leu Met Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr Lys Lys
1115 1120 1125
Gly Lys Asn Ser Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn
1130 1135 1140
Gln Gly His Leu Leu Met Ile Leu Leu His Asn Arg Gly Pro Pro
1145 1150 1155
Leu His Thr Arg Phe Glu Lys Lys Arg Pro Glu Trp Leu Ser Arg
1160 1165 1170
Lys Ser Gly Val Met Lys Cys Trp Asp Leu Cys Pro Ala Phe Ser
1175 1180 1185
Gly Arg Ile Leu His Gln Pro Glu Met Ala Ala Met Arg Leu Met
1190 1195 1200
Pro Lys Phe Leu Asn Ser Thr Asn Ser Trp Trp Thr Val His Lys
1205 1210 1215
Lys Arg Gly Leu Phe His Gln Met Lys Cys Leu Thr Ala Val Asp
1220 1225 1230
Cys Leu Gln Ala Phe Trp Asp Met Ser Glu Lys Lys Arg Lys Leu
1235 1240 1245
Pro Met Ile Arg Lys Ile Gln Lys Arg Arg Arg Thr Ala Asn Arg
1250 1255 1260
Asn Ile Glu Ile Thr Pro Gln Arg Ser Lys Ala His Leu Lys Lys
1265 1270 1275
Thr Ser Ala Lys Gly Ala Lys Lys Ile Thr Phe Leu Cys Leu Arg
1280 1285 1290
Val Arg Cys Gly Gly Trp Leu Cys Gly Trp Thr Pro Arg Gly Trp
1295 1300 1305
Leu Lys Lys Ser Thr Lys Ser Arg Leu Cys Phe Phe Tyr Leu Leu
1310 1315 1320
Tyr Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe Thr Pro Pro Pro
1325 1330 1335
Leu Ile Leu Trp Pro Gln Ala Ala Pro Gly Glu Lys Leu Lys His
1340 1345 1350
Cys Phe Lys Ala Trp Gly Val Asp Pro Pro Gly Ser Val Trp Ile
1355 1360 1365
Leu Pro Cys Phe Leu Ile His Leu Arg Lys Val Asp Thr His His
1370 1375 1380
Leu Gln Val Val Thr Lys Thr Val Thr Ala Thr Thr Ala Asp Gly
1385 1390 1395
Gln Arg Met Arg Arg Leu Lys Cys Lys Ala Cys Arg Leu Arg Trp
1400 1405 1410
Ala Arg Pro Glu Pro Ala Ala Gln Ala Pro Pro Lys Ser His Phe
1415 1420 1425
Pro Pro His Pro Ser Gly Pro Ser Arg Thr Ser Ser Leu Gln Leu
1430 1435 1440
Arg Thr Tyr Met Glu Met His Tyr Gly His Gln Ala Pro Gln Val
1445 1450 1455
Ala Met Leu Pro Lys Leu Leu Cys Arg Gln Met Leu Pro Thr Leu
1460 1465 1470
Ser Thr Leu Gln Gln Arg His Pro Gln Gly Pro Cys Pro Pro Pro
1475 1480 1485
Val Thr Pro Leu Arg Val Gln Ser Val Leu Leu Leu Gly Val Pro
1490 1495 1500
Gln Thr Ala
1505
<210> 1158
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 4C
<400> 1158
Asp Ser Lys Lys Met Thr Gln Lys Asn Arg Lys Thr Arg Lys Ala Ala
1 5 10 15
Arg Glu Lys His Arg Lys Thr Asp Asn Leu Asp Leu Gln His Gln Arg
20 25 30
Arg Arg Lys Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro
35 40 45
Lys Ala Asn Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn
50 55 60
Leu Leu Asn Leu Val Gln Leu Asn Pro His Ser Pro His His Arg Lys
65 70 75 80
Asp Glu Glu Asp His Gln Lys Arg His His His His Asn Gln Lys Lys
85 90 95
Met Ser Val Asn Glu Gly Asn Asn His Trp Pro Arg Val Glu Met Pro
100 105 110
Thr Gly Trp Leu Leu Val Gly Tyr Asn Thr Arg Asn Thr Ala Gln Asn
115 120 125
Pro Arg Leu Gln Gln His Leu Lys His Trp Gln Gln Cys Thr Arg Ala
130 135 140
Arg Trp Cys Gln Glu Pro Cys Gln Thr Leu Thr Phe Phe His Phe Phe
145 150 155 160
Phe Phe Phe Lys Thr Val Ser Leu Cys Cys Pro Gly Trp Ser Lys Gly
165 170 175
Gln Pro Pro Pro Pro Gly Leu Lys Pro Ser Ser Leu Ala Ser Gln Val
180 185 190
Ala Arg Thr Thr Gly Val Tyr Gln His Val Trp Leu Ile Cys Phe Val
195 200 205
Phe Phe Val Cys Val Glu Thr Gly Phe Cys His Val Ala Gln Val Gly
210 215 220
Leu Glu Arg Leu Val Ser Leu Ser Gly Ile Thr Asp Val Asn His Trp
225 230 235 240
Ala Gln Pro Lys Pro Ser Pro Ser Lys Gly Thr Gly Met Asn Arg Pro
245 250 255
Ile Gly Leu Arg Val Gly Lys Gly Val Trp Ala Arg Leu Trp Leu Lys
260 265 270
Asn Trp Lys Arg Phe Lys Leu Lys Lys Lys Tyr Thr Gly Met Glu Ile
275 280 285
Leu Leu Trp Ile Leu Leu Lys Met Glu Ile Gln Ile Phe Lys Ile Cys
290 295 300
Leu Gly Glu Met Gln Leu Cys Leu Lys Lys Lys Val Asn Ala Cys Ser
305 310 315 320
Asn Ala Lys Lys Met Pro Phe Gln Cys Arg Cys Arg Arg Glu Tyr Arg
325 330 335
Val Thr Met Ile Gln Lys Lys Lys Gln Lys Ser Pro Leu Phe Phe His
340 345 350
Gly Asp Leu Cys Arg Pro Ser Pro Cys Leu Ser Trp Ser Ser Arg Ile
355 360 365
Val Ala Pro Gly His Ala Leu Ser Cys Arg Thr Arg Arg Arg Trp Ser
370 375 380
Ser Lys Met Ala Lys Lys Ser Gln Gln Pro Leu Cys Arg Gly Gly Pro
385 390 395 400
Ser Ala Ser Asp Arg Cys Cys Ser Cys Ser Pro Ser Gly Phe Ser Ala
405 410 415
Gly Arg Gly Arg Cys Pro Val Gln Gly Cys Leu Arg Pro His Arg Val
420 425 430
Gln Leu Leu Arg Arg Trp Gly Pro Gly Ser Pro Ala Gly Gln Arg Leu
435 440 445
Ser Lys Gly Phe Gln Leu Leu Arg Trp Trp Gly Pro Gly Ser Pro Ala
450 455 460
Pro Glu Pro Arg Lys Gly Pro Phe Pro Pro Pro Asp Pro Pro Trp Pro
465 470 475 480
Val Thr Ala Val Thr Val Met Ala Gly Ser Val Pro Ser Ala Gln Ser
485 490 495
Val Asp Ala Leu Glu Ser Pro Gly Pro Leu Ala Leu Glu Gly Pro Ser
500 505 510
Ser Pro Arg Asn Leu Leu Trp Arg Glu Met Ser Ile Phe Leu Pro Gly
515 520 525
Ile Phe Asn Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn Arg Asn
530 535 540
Lys Ser Arg Gln Met Glu Ser Leu Gly Met Lys Leu Gln Ile Thr His
545 550 555 560
Pro Phe Ala Ser Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln
565 570 575
Ile Arg Leu Leu Lys Pro Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp
580 585 590
Phe Ser Ala Pro Gln Gln Ala Pro Leu Arg Leu Trp Ser Trp Cys Gly
595 600 605
Thr Ser Gln Thr Tyr Phe Gly Ser Ile Glu Ala Leu Thr Ala Leu Phe
610 615 620
Thr Cys Arg Thr Ala Ser Ile Ser Val Asn Ile Ser Thr Leu Met Ser
625 630 635 640
Ile Leu Glu Ala Ile Leu Ala Met Thr Leu Thr Leu Asn Gly Ser Pro
645 650 655
Leu Trp Asp Cys Ser Thr Thr Thr Gly Thr His His Gly Cys Leu Trp
660 665 670
Glu Ile Pro Ser Val Thr Leu Leu Ala Thr Ala Lys Lys Ser Pro Thr
675 680 685
Ser Phe Cys Cys Gln Arg Pro Pro Leu Gln Pro Val Glu Glu Lys Lys
690 695 700
Asn Gly Arg Ile Ser Ser Val Pro Pro Ser Pro Pro Leu Ala Leu Gly
705 710 715 720
Pro Arg Met Gln Leu Cys Thr Gln Leu Ala Arg Phe Phe Pro Ile Thr
725 730 735
Pro Pro Val Trp His Ile Leu Gly Pro Gln Arg His Thr Pro Leu Leu
740 745 750
Thr Pro Asp Thr Arg Trp Ile Phe Ser Asn Gln Leu Gln Thr Val Gln
755 760 765
Met Leu Cys Leu Pro Pro Leu Lys Gln Gly Glu Arg Ile Ile Trp Pro
770 775 780
Leu Gly Gly Phe Gln Ile Pro Asn Phe Phe Trp Ser Leu Gly Ile Gly
785 790 795 800
His Thr Gly Ala Trp Trp His Thr Gly Arg Arg Arg Arg Glu Trp Gly
805 810 815
Gly Ser Thr Val Ser Arg Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr
820 825 830
Leu Arg Gly Met Ala Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg
835 840 845
Val Ser Trp Cys Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser
850 855 860
Asp Lys Lys Lys Lys Ser Thr Glu Lys Thr Lys Asn Lys Ile Ile Cys
865 870 875 880
Lys Gly His Arg Ile Thr Gln Val Val Leu Arg Leu Gly Asn Leu Pro
885 890 895
Pro Phe Phe Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg Thr
900 905 910
Lys Cys Gln Lys Lys Val Pro Ser Ala Ser Pro Trp Gly Leu His Pro
915 920 925
Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser Leu Lys Gly Ser Arg
930 935 940
Thr Ser Cys Cys Pro Arg Ser His Pro Arg Leu Pro Arg Thr Lys Trp
945 950 955 960
Pro Leu Gln Cys Leu Leu His Ser Leu Gly Thr Thr Gly Thr Leu Val
965 970 975
Trp Glu Arg Gly Val Leu Gln Met Arg Ser Leu Glu Ala His Cys Pro
980 985 990
Leu Gln Thr Phe His Leu His His Cys Arg Thr Gln Pro Ser Ser Cys
995 1000 1005
Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp Ser Gly Ala Val
1010 1015 1020
Val Gly Leu Arg Pro Val Ala His His Leu Pro Arg Pro Ile Gln
1025 1030 1035
Gly Leu His Cys Pro Gln Ala Pro His Gln Pro Ala Leu Ser Trp
1040 1045 1050
Gly Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys Arg
1055 1060 1065
Trp Pro Arg Arg Met Cys Ser Ser Leu Ala Leu Pro Thr Gly Leu
1070 1075 1080
Thr Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala Val Leu Ile Ser
1085 1090 1095
Ser Ser Thr Ser His Phe Leu Met Arg Ser Pro Val Leu Pro Ser
1100 1105 1110
Ser Arg Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met Trp Thr
1115 1120 1125
Trp Ser Ser Trp Leu Lys Glu Trp Gly Gly Gln Ala His Arg Gln
1130 1135 1140
Arg Asn Cys Arg Val Asn Ala Val Glu Glu Leu His Ser Arg Arg
1145 1150 1155
Met Ser Val Arg Ile Val Lys Asn Trp Val Ser Cys Cys Tyr Val
1160 1165 1170
Arg Leu Ser Ala Val Gly Leu Ser Thr Trp Ser Ala Leu Asp Ser
1175 1180 1185
Leu Ile Leu Ser Phe Gln Arg Val Lys Thr Ser Arg Ile Leu Asn
1190 1195 1200
Leu Gln Val Leu Lys Lys Ile Leu Arg Ser Phe Met Lys Leu Tyr
1205 1210 1215
His Ser Leu Val Met Cys Leu Arg Leu Arg Thr Lys Leu Glu Lys
1220 1225 1230
Ala Leu Ser Ala Leu Phe Ile Trp Pro Gln His Ser Tyr Lys Gly
1235 1240 1245
Gln Ala Phe Gly Ser Leu Cys Gln Leu Val Ser Ala Asp Phe Ser
1250 1255 1260
Ala Pro Gln Val Thr Arg Leu Arg Ser Leu Asn His Leu Leu Ile
1265 1270 1275
Arg Trp Ile Phe Ser Asn Gln Leu Thr Val Gln Met Leu Cys Leu
1280 1285 1290
Pro Ile Ile Lys Lys Met Lys Lys Arg Ile Met Val His Val Leu
1295 1300 1305
Lys Lys Asn Arg Lys Gln Ile Ile Cys Ile Lys Asn Met Phe Leu
1310 1315 1320
Gln Arg Lys Gly Phe Leu Asn Leu Ser His Val Glu Lys Phe Arg
1325 1330 1335
Glu Ser Thr Leu Gly Asn Phe Trp Met Lys Leu Leu Gln Leu Pro
1340 1345 1350
Pro Ala Cys Thr Ser Lys Ala Trp Thr Pro Arg Lys Leu Val Gly
1355 1360 1365
Arg Ala Val Arg Arg Lys Gly Val Val Ile Asn Leu Lys Arg Leu
1370 1375 1380
Gln Lys Phe Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro Thr
1385 1390 1395
Thr Gly Val Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp
1400 1405 1410
Pro Pro Arg Ser Gln Lys Ser Gln His His Cys Ala Leu Arg Lys
1415 1420 1425
Ile Glu Trp Ala Thr Lys Leu Ser Leu Gly Gly Lys Ala Gly Pro
1430 1435 1440
Gln Ala Gln Glu Lys Ala Asn Ile Leu Asn Ser Leu Pro Ser Ser
1445 1450 1455
Met Glu Ile Ala Val Leu Gln Glu Met Leu Asn Gln Lys Cys Leu
1460 1465 1470
Ala Pro Phe Glu Leu Lys Lys Asn Leu Leu Leu Pro Thr Tyr Thr
1475 1480 1485
Pro His Ile Cys Arg His Thr Leu Lys Lys Lys Pro Arg Asp Ile
1490 1495 1500
Cys Arg Ile Ser
1505
<210> 1159
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 1D
<400> 1159
Ala Asp Lys Lys Asn Val Arg Ser Ala Ser Ser Pro Gly His Pro Leu
1 5 10 15
Gly Pro Arg Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys Met Met
20 25 30
Met Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg Arg Met Thr
35 40 45
Met Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr Cys Leu Thr Pro
50 55 60
Arg Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln Thr Ile Ser Gln
65 70 75 80
Arg Arg Pro Ile Gln Thr Pro Pro Gly Thr Ser Leu Ala Ile Trp Gly
85 90 95
Arg Arg Ser Lys Ile Glu Ala Ser Pro Ile Gly Ser Ile Thr Pro Leu
100 105 110
Ser Ile Ser Arg Pro Thr Ser Arg Ala Arg Gln Ser Cys Cys Leu Pro
115 120 125
Gly Leu Thr His Pro Ala His Gln Pro Leu Gly Ser Met Val Gly Ala
130 135 140
Gly Thr Gly Gly Gly Pro Ala Cys Val Pro Val Ala Glu Ala Ser Thr
145 150 155 160
Gly Ala Trp Thr Ala Glu Gly Ala Ala Gly Thr Arg Cys Arg Ala Ser
165 170 175
Arg Ala Pro Cys Arg Gln Leu Pro Ala Ser Ser Pro Thr Lys Cys Glu
180 185 190
Ile Cys Val Lys Arg Arg Arg Arg Arg Lys Arg Ser Ser Gln Ser Arg
195 200 205
Ser Pro Val Pro Lys Lys Arg Glu Arg Met Met Leu Pro Val Arg Ala
210 215 220
Arg Thr Ala Arg Ser Ala Leu Pro Gln Gly Arg Ala Pro Leu Glu Gly
225 230 235 240
Met Leu Leu Pro Arg Ala Leu Pro Ser Leu Leu Ser Arg Met Pro Ala
245 250 255
Arg Arg Glu Ser Arg Phe Trp Leu Ala Leu Gln Ala Leu Gly Leu Arg
260 265 270
Pro Pro His Leu Pro Ser Cys His Pro Leu Pro Gln Leu Leu Gly Pro
275 280 285
Pro Pro Pro His Gln Ala Pro Gly Glu Lys Asn Asp Leu Gln Leu Phe
290 295 300
Val Met Ser Asp Thr Thr Tyr Lys Ile Tyr Trp Thr Val Ile Leu Leu
305 310 315 320
Asn Pro Cys Gly Asn Leu His Leu Lys Thr Thr Ser Leu Asn Ala Lys
325 330 335
Lys Met Glu Asp Met Ile Trp Glu Ser Asn Gln Gln Leu Lys Trp Thr
340 345 350
Pro His Ile Leu Lys Ser Ala Ser Ile Ala Lys Lys Arg Ile Lys Leu
355 360 365
Arg Arg Asn Ser Thr Arg Arg Glu Met Pro Ser Gln Ala Thr Pro Ser
370 375 380
Pro Pro Gly Pro Trp Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser
385 390 395 400
Gln Ser Lys Leu Arg Leu Arg Asn Thr Ser Pro Phe Asp Lys Lys Gly
405 410 415
Phe Val Ile Leu Ser Asn Met Gly Gly Asn Arg Ser Ile Cys Leu Thr
420 425 430
Ile Val Phe Phe Leu Ala Pro Tyr Phe Pro Met Pro Ser Ser Trp Ser
435 440 445
Ser Ser Gly Arg Thr Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg
450 455 460
Pro Leu His Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg
465 470 475 480
Gly Asp Cys Pro Arg Thr Met Ala Gly Pro Ser Ala Ser Leu His Pro
485 490 495
Ala Ser Gly Arg Ala Ser Arg Lys Thr Trp Gln Arg Arg Leu Arg Ala
500 505 510
Cys Arg Ala Gly Gly Pro Ala Gly Trp Ala Arg Gln Ala Arg Lys Arg
515 520 525
Lys Arg Glu Lys Arg Ser Gln Lys Ser Arg Gln Asn His Leu Gln Leu
530 535 540
Lys Ser Cys Arg Arg Lys Ile Ser Asn Trp Ser Lys Leu Arg Ser Pro
545 550 555 560
Trp Ile Phe Glu Ala Lys Lys Ser Met Lys Arg Ser Gln Arg Pro Pro
565 570 575
Arg Ser Ile Leu Ser Leu Phe Lys Lys Lys Lys Pro Leu Thr Phe Ser
580 585 590
Pro Ser Val Ser Lys Lys Arg Leu Pro Lys Leu Lys Gly Lys Lys Arg
595 600 605
Arg Lys Glu Ile Gln Arg Lys Val Val Lys Asn Pro Ser Gln Pro Val
610 615 620
Pro Leu Arg Asn Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr Arg Ser
625 630 635 640
Cys Ser Ile Ser Leu Lys Lys Ser Leu Glu Lys Met Pro Leu Met Arg
645 650 655
Ser Leu Leu Tyr Ser Arg Met Cys Leu Val Gln Ile Pro Thr His Thr
660 665 670
Trp Glu Pro Asp Tyr Phe Val Ser Leu Pro Met Met Phe Ser Trp Ala
675 680 685
Thr Gln Ser Phe Pro Val Gly Ala Val Phe Leu Thr Arg Pro Ala Ile
690 695 700
Pro Cys Cys Ser Cys Thr Ser His Ser Asn Pro Trp Ser Gln Ser Thr
705 710 715 720
Leu Ala Ile Arg Phe Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val
725 730 735
Thr Ala Ala Pro Ser Gly Gln Tyr Phe Ala Leu Arg Ser Met Pro Lys
740 745 750
Ser Arg Asn Gln Val Leu Phe Arg Arg Asn Leu Thr Pro Ser Gln Leu
755 760 765
Arg Thr Leu Ala Pro Pro Tyr Met Leu Leu Pro Gln Ser Leu Ser Gln
770 775 780
Ser Leu Ser Arg Lys Gln Ile Pro Ser Gln Ser Met Leu Val Arg Thr
785 790 795 800
Arg Leu Thr Leu Thr Gly Thr Arg Ser Ser Gly Thr Arg Ala Ser Pro
805 810 815
Ser Ala Val Cys Leu Cys Cys Trp Thr Cys Pro Ser Arg Ser Phe Pro
820 825 830
Ala Ala Ser Pro Ser Gly Leu Arg Ala Pro Val Gly Ala Gln Ala Pro
835 840 845
Pro Glu Val Thr Leu Arg Ala Ser Cys Ala Ser Ser Ala Ser Lys Ala
850 855 860
Cys Ala Gly Leu Trp Pro Trp Gly Ala Gln Val Arg Met Lys Lys Lys
865 870 875 880
Asp Ser Thr Ile Phe Ile Tyr Pro Arg Leu Lys Thr Phe Gly Val Pro
885 890 895
Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser Leu Ser Thr Met Met Ile
900 905 910
Ile Ser Thr Thr Arg Gln Glu Cys Gly Arg Arg Ala Ser Val Pro Cys
915 920 925
Arg Pro Met Ile Gly Ser Ala Arg Pro Gly Pro Trp Arg Thr Ser Ala
930 935 940
Met Pro Ser Ala Met Gly Val Ala Leu Pro Thr Ser Cys Glu Ser Gly
945 950 955 960
Arg Ser Pro Pro Ala Thr Gly Gly Arg Met Pro Gly Ser Gln Ser Ile
965 970 975
Met Met Ser Trp Met Pro Pro Leu Ala Pro Cys Ala Ala Cys Pro Cys
980 985 990
Ser Pro Ala Pro Thr Leu Cys Pro Ala His Pro Ala Arg Ala Pro Thr
995 1000 1005
Ala Val Pro Ala Phe Thr Pro Leu Ser Ala His Pro Val Pro Val
1010 1015 1020
Leu Ser Gly Cys His Leu Ala Val Arg Thr Ser Met Leu Thr Leu
1025 1030 1035
Leu Pro Met Met Thr Leu Lys Ala Leu Val Lys Thr Trp Thr Gln
1040 1045 1050
Phe Arg Asn Tyr Pro Arg Arg His Pro His Arg Ser Pro Pro Thr
1055 1060 1065
Ser Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu Pro Arg Ala Ser
1070 1075 1080
Leu Arg Ala Thr Val Pro Arg His Ser Ser Val Leu Ala Thr Gly
1085 1090 1095
Leu His Leu His Arg Gln Ile Ser Leu Pro Leu Arg Gly Phe Leu
1100 1105 1110
Leu His Gln Pro Leu Pro Gly Gln His Leu Trp Leu Ser His Arg
1115 1120 1125
Leu Arg Leu Arg Leu Pro Arg Thr Thr Glu Ile Gln Leu Thr Met
1130 1135 1140
Asn Asp Ser Lys His Lys Leu Glu Ser Pro Ala Leu Lys Gln Val
1145 1150 1155
Ser Pro Ala Ser Pro Pro Thr Gln Gln Pro Gln Thr Pro Gln Asp
1160 1165 1170
Ser Arg Gln Val Leu Ala Val Pro Met Ser Leu Ala Cys Ser Ile
1175 1180 1185
Thr Val Ser Phe Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val
1190 1195 1200
Ser Ser Ile Ser His Trp Asn Gly Ile Trp Glu Val Met Pro Arg
1205 1210 1215
Thr Leu Glu Gly Cys Ile Ser Val Lys Asp His Arg Thr Ser Gln
1220 1225 1230
Asn His Ser Lys Cys Ile Thr Glu Cys Val Arg Thr Ala Leu Asn
1235 1240 1245
Thr Lys Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile
1250 1255 1260
Thr Leu Ile Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys His
1265 1270 1275
Pro His Arg Arg Pro Gly Trp Lys Gly His His Arg Val Val Phe
1280 1285 1290
Ser His His Pro Ser Gly Ser Thr Lys Ser His Trp Gln Gln Arg
1295 1300 1305
Glu Arg Gly Gly Gly Arg Arg Glu Lys Lys Gly Cys Arg Glu Ala
1310 1315 1320
Ser Arg Ala Gly Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly
1325 1330 1335
Met Ser Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg
1340 1345 1350
Cys Pro Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn Gly
1355 1360 1365
Trp His Arg Ser Gly Leu Arg Ala Gln Thr Ala Phe Phe Leu Leu
1370 1375 1380
Asp Ile Ile Leu Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr Cys
1385 1390 1395
Arg Met Trp Trp Arg Leu Pro Cys Lys Val Thr Glu Ser Ser Leu
1400 1405 1410
Ala Lys Lys Thr Leu Thr Asn Gln Pro Ser Leu Pro Gly Pro Cys
1415 1420 1425
Ala Ser Leu Leu Ser Thr Leu Ser Gln Pro Pro Pro Gln Ala Pro
1430 1435 1440
Ser Gln Val Trp Thr Ala Ala Thr Leu Arg Cys Pro Ala Val Pro
1445 1450 1455
Ala Ala Ala Cys Pro Pro Leu Lys Leu Ala Pro Leu Gln Val Thr
1460 1465 1470
Thr Thr Leu Lys Leu Ile Leu Val Met Leu Glu Ile Val Thr Glu
1475 1480 1485
Asn Lys Val Arg Gln Asn Phe Lys Arg Asn Ser Ser Phe Phe Tyr
1490 1495 1500
Thr Ser Asp Arg
1505
<210> 1160
<211> 1501
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 2D
<400> 1160
Arg Lys Met Gln Ser Leu Asn His Pro Ser Arg Leu Thr Asn Asn Pro
1 5 10 15
Arg Arg Lys Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln Lys Pro Ser
20 25 30
Gln Lys Asn His Leu Tyr Arg Gln Ile Asn Arg Arg Lys Leu Gln Arg
35 40 45
Lys Lys Ser Arg Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys Lys
50 55 60
Val Lys Arg Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser His Leu
65 70 75 80
Ile Ala His Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe His Pro
85 90 95
Arg Leu Leu Thr Arg Lys Lys Pro Gly Lys Gln Lys Lys Gly His Met
100 105 110
Ile Phe Ser Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys Asn Leu
115 120 125
Ile Pro Ser Leu Asn Ala Gln Trp Met Phe Leu Arg Ile Ala Ser Pro
130 135 140
Gln Ile Met Gln Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg Arg
145 150 155 160
Met Gln Asn Leu Asp Asn Leu Gly Val Pro Trp Pro Leu Leu Pro Gly
165 170 175
Leu Leu Leu Ala His Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys
180 185 190
Gly Glu Cys Val Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile
195 200 205
Leu Lys Gln Pro Leu Asp Leu Lys Ile Ser Lys Thr Phe Met Ala Ser
210 215 220
Pro Gln Ile Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr Ile Leu
225 230 235 240
Gln Ala His Pro Gln Val Pro Ala Leu Ala Pro Gln Ala Trp Trp Pro
245 250 255
Ala Arg Arg Gly Pro Leu Thr Ser Ala Pro Ser Ala Gln Gln Ser Leu
260 265 270
Thr Arg Thr Leu Glu Ser Ala Gly Leu Phe Pro Trp Leu His Thr Gln
275 280 285
Cys Arg Ala Phe Ile His Thr Pro Arg Ser Pro Gly Cys Ser Val Tyr
290 295 300
Ala Asn Met Cys Trp Arg Tyr Lys Lys Arg Gly Val Ile Ala Trp Arg
305 310 315 320
Ile Tyr Pro Pro Ser Thr Cys Ser Leu Pro Cys Arg Gly Leu Ile Leu
325 330 335
Ile Gln His Gly Gly Ile Phe Thr Phe Arg Phe Trp Val Glu Lys Leu
340 345 350
Ser Trp Asn Ile Cys Lys Asn Leu Ser Leu Tyr Leu Asp Lys Phe Val
355 360 365
Gln Arg Leu Leu Tyr Val Tyr Ile Ile Glu Thr Asn Val Phe Val Leu
370 375 380
Asn Leu Phe His Val Pro Val Asn Gln Ile Phe Met Met Ala Phe Tyr
385 390 395 400
Leu Lys Tyr Thr Glu Lys Ala Trp Val Met Glu Leu Glu Trp Leu Ile
405 410 415
Gln Gln Gln Cys Tyr Gln Arg Lys Arg Met Lys Thr Gly Ala Ile Gln
420 425 430
Glu Lys Gly Ala Ile Gln Glu Lys Gly Ala Met Thr Lys Arg Ile Cys
435 440 445
Val Val Asn Phe Glu Ala Cys Arg Glu Met Glu Ser Leu Ser Ala Pro
450 455 460
Glu Lys Ile Thr Leu Phe Glu Ala His Met Ala Arg Cys Thr Ser Ile
465 470 475 480
Asn Val Leu Cys Val Arg Ala Ser Leu Ile Glu Lys Leu Met Lys Glu
485 490 495
Lys Arg Lys Met Lys Arg Asn Gln Val Ala Ser Pro Gln Ile Met Gln
500 505 510
Arg Leu Phe Ile Lys Gly Tyr Gln Asn Asn His Phe Thr Phe His Leu
515 520 525
Gln Asn Phe Ala Phe Phe Ser Ser Phe Gly Asn Asn Lys Tyr Ile Asn
530 535 540
Ile Leu Thr Phe Leu Pro Ser Arg Phe Pro Trp Gly Pro Pro Pro Leu
545 550 555 560
Gly Ala Leu Arg Ala Thr Ala Pro Ala Thr Ala Ala Pro Gln Ala Gln
565 570 575
Thr Pro His Trp Arg Ala Ala Thr Thr Ser Ser Met Ser Ser Ser Pro
580 585 590
Arg Ala Glu Pro Thr Ser Ser Ser Ser Trp Ala Thr Cys Trp Pro Arg
595 600 605
Cys Cys Ser Ser Ser Cys Tyr Trp Ser Leu Ser Ser Trp Pro Pro Ala
610 615 620
Gly Ala Ala Glu Ala Thr Asn Thr Arg Thr Arg Ser Arg Glu Ser Gln
625 630 635 640
Arg Gly Arg Met Leu Thr Trp Arg Ser Ser Leu Trp Leu Gln Gly Thr
645 650 655
Arg Cys Phe Thr Gly Val Arg Thr Ser Ser Arg Cys Ser Leu Met Glu
660 665 670
Gln Ile Pro His Leu Lys Ser Asn Ser Arg Lys Lys Leu Leu Glu Asp
675 680 685
Met Lys Gln Asn Gly Phe Thr Arg Arg Arg Asn Ser Arg Lys Gln Ser
690 695 700
Gln Val Gln Leu Ala Ile Gln Val Leu Leu Val Asp Lys His Lys Tyr
705 710 715 720
Phe Leu Phe Gly Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys Ser
725 730 735
Leu Pro Gln Ala Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu Leu
740 745 750
Val Gln Ser Arg His Pro Ser Trp Pro Trp Thr Arg Cys Leu Arg Met
755 760 765
Arg Pro Pro Arg Ser His Trp Asn Ser Ala Tyr Leu Gly Arg Thr Leu
770 775 780
Leu Val Thr Cys Ile Leu Tyr His Arg Trp Ile Val Thr Ser Met Cys
785 790 795 800
Gln Ser Gln Arg Trp Leu Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu
805 810 815
Met Trp Thr Trp Trp Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys
820 825 830
Met Cys Lys Val Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro
835 840 845
Trp Lys Gly Ile Cys Trp Lys Trp Pro Val Thr Val Ala Ala Met Ser
850 855 860
Arg Thr Pro Pro Arg Arg Val Cys Gly His Arg Glu Gly Ser Glu Ser
865 870 875 880
Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro Val Leu Phe Lys Ala
885 890 895
Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly Asn Ser Val Ile Val His
900 905 910
Lys Ile Val Leu Val Phe Leu Lys Ser Leu Ser Ser Tyr Asn Cys Glu
915 920 925
Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile Glu Phe Ala Val Leu
930 935 940
Lys Leu Leu Asn Met Asp Leu Gly Lys Gly Leu Thr His Pro Val Pro
945 950 955 960
Leu Lys Arg Thr Leu Gln Asn Lys Arg Asn Lys Asn Ile Lys Arg Val
965 970 975
Asn Gln Lys Lys Gly Asn Ile Lys Arg Lys Ser Ile Leu Leu His Leu
980 985 990
Ile Val Leu Asn Ser Pro Glu Ser Asn Arg Glu Lys Ile Ile Asn Pro
995 1000 1005
Thr Ile Ser Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Gly Ser
1010 1015 1020
Pro Pro Leu His Leu Cys Gln Pro Leu Arg Pro Tyr Pro Ile Ser
1025 1030 1035
Glu Gly Leu Thr Met Thr Thr Gly Arg Asn Ile Asn Ser Asn Ser
1040 1045 1050
Leu Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu Cys His His
1055 1060 1065
Ala Ile Met His Arg Lys Met Thr Ser Pro His Phe Arg Leu Phe
1070 1075 1080
Ser Ser Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala Leu
1085 1090 1095
Cys Lys Phe Thr His Pro Cys Thr Met Leu Leu Pro Gln Gly Ala
1100 1105 1110
Phe Trp Lys Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr
1115 1120 1125
Gly Cys Trp Gln Trp Ser Ser Val Thr Ser Leu Glu Trp Thr Ala
1130 1135 1140
Gln Glu Arg Gly Cys Ser Ser Trp Leu Met Lys Gln Thr Trp Met
1145 1150 1155
Lys Ser Trp Ser Leu Arg Asp Pro Ser Tyr Arg Ser Ile Leu Glu
1160 1165 1170
Tyr Val Ser Thr Arg Val Leu Trp Met Pro Thr Ser Thr Val Pro
1175 1180 1185
Lys Phe Phe Leu Thr Phe Ser Gln Ile Arg Met Cys Ala Leu Ser
1190 1195 1200
His Pro Ser Phe Tyr Ile Ser Ser Thr Val Cys Phe Leu Ser Lys
1205 1210 1215
His Cys Met Thr Ala Cys Thr Pro Gly Thr Ser Leu Gln Cys Tyr
1220 1225 1230
Leu Asn Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile Phe Arg Asn
1235 1240 1245
Lys Lys Thr Lys Leu Trp Phe Ser Leu Ile Asn Ile His His Arg
1250 1255 1260
Lys Asn Pro Leu Leu Pro Met Arg Leu Glu Lys Lys Ala Thr Trp
1265 1270 1275
Met Arg Arg Thr Glu Leu Ser Leu Glu Pro Trp Ile Pro Tyr Leu
1280 1285 1290
His Gln Gln Lys Thr Gln Trp Leu Pro Met Arg Ser Leu Gly Glu
1295 1300 1305
Pro Trp Arg Ala Gly Phe Gln Trp Gly Glu Ser Pro Trp Gln Val
1310 1315 1320
Met Ala Ser Leu Thr Gly Arg Arg Lys Lys Arg Glu Asp His Cys
1325 1330 1335
Gly Leu Gln Glu Lys Lys Ser Arg Lys Leu Met Ser Ser Cys Ala
1340 1345 1350
Ala Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp Gly Ser Cys
1355 1360 1365
Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly Thr Pro Arg Gly
1370 1375 1380
Asp Trp Lys Arg His Pro Pro Arg Arg Ile Leu Phe His Val Arg
1385 1390 1395
Asn Ile Val Tyr Gly Ile Gln Val Met Leu Cys Cys His Pro Ala
1400 1405 1410
Trp Leu Ser Pro Ile Ser Ala Cys Pro Arg Leu Leu Pro Tyr Pro
1415 1420 1425
Phe His Val Leu Ala Leu Glu Val Thr Phe Pro Pro Gly Thr Ala
1430 1435 1440
Met Pro Gln Met Gln Leu Gln Ala Leu Ala Met Trp Glu Lys Gly
1445 1450 1455
Trp Asp Lys Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr Ser Pro
1460 1465 1470
Leu Trp Lys Ile Thr Met Val Leu Thr Tyr Pro Asn Cys Val Val
1475 1480 1485
His Val Leu Met Phe Gly Gly Lys Lys Arg Ser Lys Phe
1490 1495 1500
<210> 1161
<211> 1506
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 3D
<400> 1161
Gln Asn Thr Arg Ser Thr Asn Leu Glu Lys Asn Pro Ser Leu Lys Lys
1 5 10 15
Gln Ser Gln Arg Arg Gly Lys Leu Ser Ser Arg Lys Lys Gly His Thr
20 25 30
Lys Asn Arg Arg Lys Ala Lys Arg Lys Pro Gln Ile Ser Gln Lys Lys
35 40 45
Asp Pro Ala Gly Lys Leu Lys Lys His Leu Asn Arg Lys Leu His Leu
50 55 60
Thr Arg Ser Cys Leu Ile Asp Leu Thr Met Met Met Ser Gln Lys Leu
65 70 75 80
Trp Lys Asn Gln Arg Lys Arg Ile Pro Leu Pro Ser Pro Arg Gln His
85 90 95
Leu Leu Pro Gln Tyr Pro Leu His Pro Pro Pro Pro Cys Leu Leu Leu
100 105 110
Leu His His Arg His His Leu Ala Phe Leu Glu Met Ala Cys Ser Ser
115 120 125
Gln His Thr His Ser Ile Lys Ile Trp Ile Ser Phe Ser His Glu Asp
130 135 140
Leu Pro Arg Met Leu Pro Ile Ser Ser Pro Leu His Arg Pro Gln Met
145 150 155 160
Pro Phe Trp Thr Cys Thr Phe Pro Ala Thr Thr Trp Gly Thr Trp Glu
165 170 175
Thr Pro Ser Thr Trp Gly Trp Arg Thr Phe Gly Pro Val Tyr Tyr Val
180 185 190
Cys Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Phe Leu Phe Thr
195 200 205
Val Pro Ile Glu Asp Met Arg Glu Cys Thr Leu Gly Arg Asn Arg Met
210 215 220
Asn Val Ser Ser Val Leu Lys Pro Cys Leu Ile Pro Val Pro Ile Leu
225 230 235 240
Thr Thr Leu Ser Phe Val Leu Ile Glu Glu Ser Arg Arg Asn Arg Arg
245 250 255
Tyr Arg Lys Ile Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala Leu Pro
260 265 270
Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser Arg His Thr Thr Thr Thr
275 280 285
Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala Arg Gly Gly Thr Thr
290 295 300
Ile Gly Glu Val Thr Ser Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp
305 310 315 320
Ser Arg Ser Phe Phe Thr Ser Ala His Pro Ser Arg Pro Cys Arg Met
325 330 335
Arg Leu Tyr Gln Ser Asn Gly Met Glu Ala Cys Gly Thr His Pro Thr
340 345 350
Pro Arg Leu Ser Arg Gly Pro Pro Leu His Thr Arg Thr Met Ser Leu
355 360 365
Ser Asn Ile Leu Met Lys Phe Arg Leu Met Leu Gln Lys Gln Cys Cys
370 375 380
Tyr Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile Asn Leu Arg
385 390 395 400
Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser Leu Gly Phe Leu
405 410 415
Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys Leu Leu Met
420 425 430
Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr Lys Thr Pro Pro Pro Leu
435 440 445
Ile Leu Trp Pro Gln Ala Ala Pro Val His Lys Lys Arg Gly Leu Phe
450 455 460
Ser Leu Phe Phe Ser His Cys Leu Cys His Gln Met Lys Cys Leu Thr
465 470 475 480
Ala Val Asp Cys Leu Gln Ala Phe Trp Asp Met Met Ile Arg Lys Ile
485 490 495
Gln Lys Arg Arg Arg Thr Ala Asn Arg Leu Lys Lys Lys Tyr Leu Val
500 505 510
Gln Cys Thr Asn Leu Ser Val Pro Met Met Leu Thr Ile Leu Ile Trp
515 520 525
Lys Arg Val Phe Ile Leu Leu Leu Ser Asp Lys Lys Cys Leu Arg Val
530 535 540
Arg Cys Gly Gly Trp Leu Cys Gly Trp Thr Pro Arg Gly Lys Asn Lys
545 550 555 560
Lys Arg Arg Lys Leu Arg Pro Lys His Leu Lys Lys Thr Ser Ala Lys
565 570 575
Val Ser Val Ile Thr Met Lys Leu Trp Glu Lys His Phe Lys Gly Leu
580 585 590
Asn Trp Asn Leu Val Val Trp Ile Leu Asn Leu Lys Met Met Trp Leu
595 600 605
Lys Lys Ser Thr Lys Ser Arg Gln Ser Ser Pro Phe Leu Ala Arg Ser
610 615 620
Trp Asn Thr Met Gln Trp Asn Asn Lys Lys Met Ala Met Thr Val Ile
625 630 635 640
Ala Gly Ala His His Cys Gln Tyr Lys Leu Thr Tyr Thr Lys Val Trp
645 650 655
Lys Met Asn Trp Lys Lys Met Met Ile Gly Ser Gln His Leu Leu Phe
660 665 670
Ser Pro Leu Asp Ser Ser Pro Leu Gln Leu Leu Leu His Pro His Gly
675 680 685
Lys Arg Cys Asn Pro Cys Cys Arg Leu Thr Trp Met Ser Arg Glu Trp
690 695 700
Glu Lys Arg Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr Lys Glu Tyr
705 710 715 720
Phe Leu Lys Arg Ile Leu Ile Arg Lys Ala Met Thr Val Leu Ala Gly
725 730 735
Asp Lys Lys Gly Leu Gly Arg Phe Met Arg Cys Val Gln Ser Glu Thr
740 745 750
Lys Ala Val Ser Leu Gln Leu Pro Leu Gly Arg Arg Lys Ser Gly Val
755 760 765
Met Lys Cys Trp Asp Leu Cys Pro Arg Leu Asp Phe His Pro Arg Ser
770 775 780
Ser Ser Gly Gly Glu Lys Leu Lys His Cys Phe Lys Ala Trp Gly Leu
785 790 795 800
Cys Phe Phe Tyr Leu Leu Tyr Phe Glu Lys Lys Arg Pro Glu Trp Leu
805 810 815
Ser Val Asp Pro Pro Gly Ser Val Trp Ile Leu Pro Cys Met Asp Leu
820 825 830
Asp Gly Met Leu Thr Val Ile Gly Gln Gly Leu Val Gly Met Thr Pro
835 840 845
Arg Asp Leu Gly Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg Pro
850 855 860
Ile Gln Val Gln Thr Gly Gly Arg Leu Phe Leu Ile His Leu Arg Lys
865 870 875 880
Val Asp Thr His His Leu Gln Val Val Thr Lys Thr Val Thr Ala Thr
885 890 895
Thr Ala Asp Gly Gln Arg Met Arg Arg Leu Lys Cys Lys Ala Cys Arg
900 905 910
Leu Arg Trp Ala Arg Pro Glu Pro Ala Ala Gln Ala Pro Pro Lys Ser
915 920 925
His Phe Pro Pro His Pro Ser Gly Pro Ser Arg Thr Ser Ser Leu Gln
930 935 940
Leu Arg Pro Ile Pro Pro His Leu Arg His Pro Leu Leu Leu Lys Gly
945 950 955 960
Lys Asn Ser Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn Gln Gly
965 970 975
His Leu Leu Met Ile Leu Leu His Asn Ala Arg Gln Pro Ser Arg Pro
980 985 990
Thr Gly Arg Thr Pro Thr Thr Arg Leu Met Ala Pro Val Gly Ser Val
995 1000 1005
Met Ser Cys Ser Leu Leu Thr Gln Pro Ser Pro Ala Ser Ala Cys
1010 1015 1020
Thr Met Pro Pro Leu Leu His Pro Gln Trp Ala Pro His Ser Ala
1025 1030 1035
Gly Leu Ser Pro Gly Ala Cys Arg Pro Ala Cys Thr Cys Ile Ser
1040 1045 1050
Met Thr Thr Ile Ser Arg Ala Thr Trp Arg Leu Arg Ile Pro Ser
1055 1060 1065
Leu Arg Lys Tyr Arg Gln Asn Ile Glu Ile Thr Pro Gln Arg Ser
1070 1075 1080
Lys Ala Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe Ser
1085 1090 1095
Arg Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn Ser Ile Pro
1100 1105 1110
His Val Pro Lys Ala Thr Ala Ala His Ser Val Thr Val Lys Leu
1115 1120 1125
Gln Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe Asp Arg Val Phe
1130 1135 1140
Leu Val Lys Ile Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu Arg
1145 1150 1155
Gly Pro Arg Arg Lys Val Leu Met Val Leu Trp Leu Pro Ala Asn
1160 1165 1170
Gln Ser Leu Gln Lys Ser Gln Val Phe Gln Trp Val Leu Arg Thr
1175 1180 1185
Glu Thr Tyr Met Glu Met His Tyr Gly His Gln Ala Pro Gln Val
1190 1195 1200
Ala Met Leu Pro Lys Leu Leu Cys Arg Gln Met Leu Pro Thr Leu
1205 1210 1215
Ser Thr Leu Gln Gln Arg His Pro Gln Gly Pro Cys Pro Pro Pro
1220 1225 1230
Val Thr Pro Leu Arg Val Gln Ser Val Leu Leu Leu Gly Val Pro
1235 1240 1245
Gln Thr Ala Ala Phe Ser Gly Arg Ile Leu His Gln Pro Glu Met
1250 1255 1260
Ala Ala Met Arg Leu Met Pro Lys Phe Leu Asn Ser Thr Asn Ser
1265 1270 1275
Trp Trp Thr Val Ala Pro Arg Cys Pro Arg Ser Ala Val Asp Ile
1280 1285 1290
Ser Pro Gly Pro Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser Val
1295 1300 1305
Ala Ile Gly Lys Leu Ala Leu Leu Gly Ala Ser Ala Pro Cys Gly
1310 1315 1320
Ala Ala Gly Ala Arg Glu Ala Gly Arg Phe Ala Val Leu Gly Thr
1325 1330 1335
Met Val Met Lys Gly Ala Ala Ala Ala Ser Cys Gln Ser Pro Pro
1340 1345 1350
Ser Pro Arg Glu Thr Thr Pro Ser Ser Asp Ala Thr Arg Arg Thr
1355 1360 1365
Arg Pro Ile Ala Ala Gln Ser Lys Lys Thr Met Thr Ala Ala Gly
1370 1375 1380
Leu Thr Pro Arg Arg Asn Leu Gln Arg Asn Leu Lys Val Leu Gly
1385 1390 1395
Ala Lys Lys Ile Thr Phe Leu Arg Asn Ser Arg Arg Ala Thr Pro
1400 1405 1410
Thr Ser Lys Gly Ser Leu Arg Arg Lys Tyr Leu Arg Val Asn Ile
1415 1420 1425
Arg Lys Leu Ile Trp Thr Lys Gln Arg Ser Phe Leu Ser Leu Phe
1430 1435 1440
Pro Lys Leu Arg Ala Thr Glu Gln Met Thr Asn Val Gly Cys Leu
1445 1450 1455
Leu Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg Asn Val Ser
1460 1465 1470
Arg Ile Ser Asn Met Glu His Arg Leu Thr Met Asp Ser Ala Leu
1475 1480 1485
Ser Leu Thr Lys Arg Glu Gly Pro Glu Thr Ser Glu Lys Lys Arg
1490 1495 1500
Lys Leu Pro
1505
<210> 1162
<211> 1507
<212> PRT
<213> Artificial Sequence
<220>
<223> Assembled poly-FSP polypeptide 4D
<400> 1162
Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr Asp
1 5 10 15
Asp Lys Lys Lys Lys Ser Thr Glu Lys Thr Lys Asn Ala Lys Lys Met
20 25 30
Pro Phe Gln Gln Arg Pro Pro Leu Gln Pro Val Asn Leu Asp Leu Gln
35 40 45
His Gln Arg Arg Arg Lys Lys Lys Lys Asp Lys Val Glu Ile Arg Asn
50 55 60
Arg Ser Pro Lys Ala Asn Ser Thr Glu Cys Gln Gly Glu His Ser Arg
65 70 75 80
Glu Gln Asn Leu Leu Asn Leu Val Gln Leu Asn Pro His Ser Pro His
85 90 95
His Arg Lys Asp Glu Glu Asp His Gln Lys Arg His His His His Asn
100 105 110
Gln Lys Lys Met Ser Val Arg Ala Ser Val Ser Phe Trp Thr Leu Leu
115 120 125
Pro Thr Thr Gly Val Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu
130 135 140
Trp Pro Pro Arg Val Pro Pro Ser Pro Pro Leu Ala Leu Gly Pro Arg
145 150 155 160
Met Gln Leu Cys Thr Gln Leu Ala Arg Phe Phe Pro Ile Thr Pro Pro
165 170 175
Val Trp His Ile Leu Gly Pro Gln Arg His Thr Pro Gln Ala Pro Leu
180 185 190
Arg Leu Trp Ser Trp Cys Gly Thr Ser Gln Thr Tyr Phe Gly Ser Arg
195 200 205
Pro Ser Pro Cys Leu Ser Trp Ser Ser Arg Ile Val Ala Pro Gly His
210 215 220
Ala Leu Ser Cys Arg Thr Arg Arg Arg Trp Ser Ser Lys Arg Trp Ile
225 230 235 240
Phe Ser Asn Gln Leu Thr Val Gln Met Leu Cys Leu Pro Ile Thr His
245 250 255
Pro Phe Ala Ser Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln
260 265 270
Ile Arg Leu Leu Lys Pro Cys Arg Val Asn Ala Val Glu Glu Leu His
275 280 285
Ser Arg Arg Met Ser Val Arg Ile Val Lys Asn Trp Val Ser Cys Cys
290 295 300
Tyr Val Arg Leu Ser Ala Val Gly Leu Ser Thr Trp Ser Ala Leu Asp
305 310 315 320
Glu Glu Lys Lys Asn Gly Arg Ile Ser Ser Leu Lys Lys Lys Val Asn
325 330 335
Ala Cys Ser Ser Leu Ile Leu Ser Phe Gln Arg Val Lys Thr Gly Met
340 345 350
Glu Ile Leu Leu Trp Ile Leu Leu Lys Met Glu Ile Gln Ile Phe Lys
355 360 365
Ile Cys Leu Gly Glu Met Gln Leu Cys Gly Gln Ala Phe Gly Ser Phe
370 375 380
Ser Ala Asp Phe Ser Ala Pro Gln Ile Ile Lys Lys Met Lys Lys Arg
385 390 395 400
Ile Met Val His Glu Leu Lys Lys Asn Leu Leu Leu Pro Met Cys Ser
405 410 415
Ser Leu Ala Leu Pro Thr Gly Leu Thr Ser Leu Ile Leu Pro Ser Ser
420 425 430
Asp Leu Ala Val Leu Ile Ser Ser Ser Thr Ser His Phe Leu Met Arg
435 440 445
Ser Pro Val Leu Pro Ser Ser Arg Leu Thr Cys Ala Ser Pro Gln Leu
450 455 460
Pro Arg Met Trp Thr Trp Ser Ser Trp Leu Lys Asn Glu Gly Asn Asn
465 470 475 480
His Trp Pro Arg Val Glu Met Pro Thr Gly Trp Leu Leu Val Gly Tyr
485 490 495
Asn Thr Arg Asn Thr Ala Gln Asn Pro Arg Leu Gln Gln His Leu Lys
500 505 510
His Trp Gln Gln Cys Thr Arg Ala Arg Trp Cys Gln Glu Pro Cys Gln
515 520 525
Thr Leu Thr Phe Phe His Phe Phe Phe Phe Phe Lys Thr Val Ser Leu
530 535 540
Cys Cys Pro Gly Trp Ser Lys Gly Gln Pro Pro Pro Pro Gly Leu Lys
545 550 555 560
Pro Ser Ser Leu Ala Ser Gln Val Ala Arg Thr Thr Gly Val Tyr Gln
565 570 575
His Val Trp Leu Ile Cys Phe Val Phe Phe Val Cys Val Glu Thr Gly
580 585 590
Phe Cys His Val Ala Gln Val Gly Leu Glu Arg Leu Val Ser Leu Ser
595 600 605
Gly Ile Thr Asp Val Asn His Trp Ala Gln Pro Lys Pro Ser Pro Ser
610 615 620
Lys Gly Thr Gly Met Asn Arg Pro Ile Gly Leu Arg Val Gly Lys Gly
625 630 635 640
Val Trp Ala Arg Leu Ile Leu Ala Met Thr Leu Thr Leu Asn Gly Met
645 650 655
Ala Lys Lys Ser Gln Gln Pro Leu Gln Val Val Leu Arg Leu Gly Asn
660 665 670
Leu Pro Pro Phe Phe Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys
675 680 685
Arg Thr Lys Pro Ala Cys Thr Ser Lys Ala Trp Thr Pro Arg Lys Leu
690 695 700
Val Gly Arg Ala Val Arg Arg Lys Gly Ser Pro Leu Trp Asp Cys Ser
705 710 715 720
Thr Thr Thr Gly Thr His His Gly Cys Leu Trp Glu Ile Pro Ser Val
725 730 735
Thr Leu Leu Ala His Pro Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr
740 745 750
Ser Leu Lys Gly Ser Arg Thr Ser Cys Cys Pro Arg Ser His Pro Arg
755 760 765
Leu Pro Arg Thr Lys Trp Pro Leu Gln Cys Leu Leu His Ser Leu Gly
770 775 780
Thr Thr Gly Thr Leu Val Trp Glu Arg Gly Val Leu Gln Met Arg Ser
785 790 795 800
Leu Glu Ala His Cys Pro Leu Gln Thr Phe His Leu His His Cys Arg
805 810 815
Thr Gln Pro Ser Ser Cys Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln
820 825 830
Trp Ser Gly Ala Val Val Gly Leu Arg Pro Val Ala His His Leu Pro
835 840 845
Arg Pro Ile Gln Gly Leu His Cys Pro Gln Ala Pro His Gln Pro Ala
850 855 860
Leu Ser Trp Gly Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys
865 870 875 880
Cys Arg Trp Pro Arg Arg Cys Gln Lys Lys Val Pro Ser Ala Ser Pro
885 890 895
Trp Gly Leu Val Leu Lys Lys Asn Arg Lys Gln Met Leu Asn Gln Lys
900 905 910
Cys Leu Ala Pro Phe Arg Glu Ser Thr Leu Gly Asn Phe Trp Met Lys
915 920 925
Leu Leu Gln Leu Pro Val Val Ile Asn Leu Lys Arg Leu Gln Lys Phe
930 935 940
Asn Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn Arg Asn Lys Ser
945 950 955 960
Arg Gln Met Glu Ser Leu Gly Met Lys Leu Gln Ser Gln Lys Ser Gln
965 970 975
His His Cys Ala Leu Arg Lys Ile Glu Trp Ala Thr Lys Leu Ser Leu
980 985 990
Gly Gly Lys Ala Gly Pro Gln Ala Gln Glu Lys Ala Thr Ser Arg Ile
995 1000 1005
Leu Asn Leu Gln Val Leu Lys Lys Ile Leu Arg Ser Phe Met Lys
1010 1015 1020
Leu Tyr His Ser Leu Val Met Cys Leu Arg Leu Arg Thr Lys Leu
1025 1030 1035
Glu Lys Ala Leu Ser Ala Leu Phe Ile Trp Pro Gln His Ser Tyr
1040 1045 1050
Lys Pro Leu Phe Phe His Gly Asp Leu Cys Glu Trp Gly Gly Gln
1055 1060 1065
Ala His Arg Gln Arg Asn Trp Leu Lys Asn Trp Lys Arg Phe Lys
1070 1075 1080
Leu Lys Lys Lys Tyr Ile Gln Lys Lys Lys Gln Lys Ser Asn Lys
1085 1090 1095
Ile Ile Cys Lys Gly His Arg Ile Thr Ile Ile Cys Ile Lys Asn
1100 1105 1110
Met Phe Leu Gln Arg Lys Gly Phe Leu Asn Leu Ser His Val Glu
1115 1120 1125
Lys Phe Cys Arg Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys Ser
1130 1135 1140
Cys Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly Arg Cys Pro Val
1145 1150 1155
Gln Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu Arg Arg Trp
1160 1165 1170
Gly Pro Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly Phe Gln
1175 1180 1185
Leu Leu Arg Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro Arg
1190 1195 1200
Lys Gly Pro Phe Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala
1205 1210 1215
Val Thr Val Met Ala Gly Ser Val Pro Ser Ala Gln Ser Val Asp
1220 1225 1230
Ala Leu Glu Ser Pro Gly Pro Leu Ala Leu Glu Gly Pro Ser Ser
1235 1240 1245
Pro Arg Asn Leu Leu Trp Arg Glu Met Ser Ile Phe Leu Pro Gly
1250 1255 1260
Ile Phe Thr Ala Lys Lys Ser Pro Thr Ser Phe Cys Cys Asn Ile
1265 1270 1275
Leu Asn Ser Leu Pro Ser Ser Met Glu Ile Ala Val Leu Gln Glu
1280 1285 1290
Asp Ser Lys Lys Met Thr Gln Lys Gly Gln Ala Phe Gly Ser Leu
1295 1300 1305
Cys Gln Leu Val Ser Ala Asp Phe Ser Ala Pro Gln Val Thr Arg
1310 1315 1320
Leu Arg Ser Leu Asn His Leu Leu Ile Thr Tyr Thr Pro His Ile
1325 1330 1335
Cys Arg His Thr Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe Ser
1340 1345 1350
Asn Gln Leu Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu Lys
1355 1360 1365
Gln Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile Pro
1370 1375 1380
Asn Phe Phe Trp Ser Leu Gly Ile Gly His Thr Gly Ala Trp Trp
1385 1390 1395
His Thr Gly Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr Val Ser
1400 1405 1410
Arg Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly Met
1415 1420 1425
Ala Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg Val Ser Trp
1430 1435 1440
Cys Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser Ile Glu
1445 1450 1455
Ala Leu Thr Ala Leu Phe Thr Cys Arg Thr Ala Ser Ile Ser Val
1460 1465 1470
Asn Ile Ser Thr Leu Met Ser Ile Leu Glu Ala Leu Lys Lys Lys
1475 1480 1485
Pro Arg Asp Ile Cys Arg Ile Ser Cys Arg Cys Arg Arg Glu Tyr
1490 1495 1500
Arg Val Thr Met
1505
<210> 1163
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 1C
<400> 1163
agcaccagac gggaaatgcc ttctcaggcc acaccttctc cacctggacc ttggagagcc 60
gctctgggca aagaagtgaa gcggagccag agcaagctgc ggctgagaaa cacaagcccc 120
accgagatcc aattgaccat gaacgacagc aagcacaagc tggaaagccc cgctctgaaa 180
caggtgtccc ctgcctctcc acctacacag cagcctcaga caccccagga tagcagacag 240
gtgctggccg cttcttctcc tggacatcct cttggccctg gcgactgccc tagaacaatg 300
gctggacctt ctgcctctct gcacccagca tctggcagag ccagcagaaa gacctggcag 360
agaaggctga gagcctgtag agctggtgga cctgctggat gggctagaca ggccatgaca 420
ctgaaggccc tggtcaagac ctggacacag ttcagaaact accccagagt cggagccgga 480
acaggcggag gacctgcttg tgttcctgtg gccgaagctt ctactggcgc ctggacagct 540
gaaggcgctg ccggaacaag atgcagagct tctagagccc cttgcagaca gctgcctgcc 600
agctctccta ccaagtgcga gatctgcgtg aagagaaggc ggcggagaaa gcggagcagc 660
cagtctagat ctcccgtgcc taagaaacgc gagcggatga tgctgcctgt gcgggccaga 720
acagctagat ctgctctgcc acaaggcaga gcccctctgg aaggaatgct tctgcctaga 780
gcactgccca gcctgctgag cagaatgcca gccagaagag agagccggtt ttggctggca 840
ctgcaggctc tgggactcag acctcctcat ctgcctagct gtcaccctct gcctcaactg 900
cttggacctc ctccacctca tcaggcccct ttcgacaaga aaggcttcgt gatcctgagc 960
aagggcaaga agcgccggaa agaaatccgg cggatgacca gacggaccat gaccaccacc 1020
aaaatgatga tgatgcggcg gaccaagcgg cggaggcgaa aacgtagaag aatgaccatg 1080
atgacccgca gaaccctgct gaccaagaaa acctgtctga cccctagaac cagcgccgcc 1140
acaaaagctc tgcccagaca gacaatcagc cagcggaggc ctatccagac acctcctgga 1200
acaagcctgg ccatctgggg cagactgcct ctcagaccac agagaggacc tcggcctctg 1260
catagatggc tgcagcagac aacaggctgc tcccagagaa gaatcgccaa gaagcggatc 1320
aagctgaggc ggaacacact ggccatccgg tttatctctg cccctcagcc tagcagcagc 1380
accgttacag ctgctcctag cggccagtac ttcagcagct tcttctacac cagcgaccgg 1440
accaagtgtg aaatctgtgt caagaacacc gccatcctgg ctatcaccct gatcacccct 1500
caggaccctc acctggaccc tgtgtgtcac ccacatagaa ggcctggctg gaagggccac 1560
cacagagtgg tgtttagcca ccatccaagc ggctccacca agagccattg gcagcagaga 1620
gaaagaggcg gaggccgcag agaaaaaaag ggctgcagag agatgcccag cagctggtct 1680
agctctggca gaaccgccga caaaaagaac gtgcggagca gaaccagact gaccctgaca 1740
ggcacaagaa gcagcggcac aagagcctct ccaagcgccg tgtgtctgtg ctgttggaca 1800
tgcccctcca gaagcttccc tgccgcatct ccatctggac tgagagcacc tgttggagcc 1860
caggctcctc ctgaagtgac actgagagcc agctgtgcct ctagcgcctc taaagcctgt 1920
gctggacttt ggccttgggg agcccaagtg cggaacaaag tgcggcagaa cttcaagcgg 1980
aacctggcca aaaagaccct gactaacgcc ctgcggagta tgcccaagag cagaaaccag 2040
gtgctgttca gacggaatct gaccccaagc cagctgagaa ctctggcccc tccttacatg 2100
ctgctgcccc agtctctgtc tcagagcctg tccagaaagc agatccccag ccaatcaatg 2160
ctcgtgaccg ccttcttcct gctcgacatc atcctgagaa gcctgctgta ctcccggatg 2220
tgcctggtgc agatccctac acacacctgg gagcccgact acttcgtgtc cctgcctatg 2280
atgttcagct gggccactca gagctttcca gtgggagccg tgttcctgac cagacctgcc 2340
attccttgct gcagctgtac cagccacagc aacccttgga gccagtcctt caagaagaag 2400
aagcccctga cattcagccc cagcgtgcca atgtctctgg cctgtagcat caccgtgtcc 2460
ttcgtgggcc agatcagcac actggtgctg gacgtgtcct ccatctctca ctggcgcaag 2520
cgcaagagag agaagcggtc ccagaagtcc cggcagaacc atctgcagct gaagtcctgc 2580
agacggaaga tcagcaactg gtccaagctg agatccccgt ggatcttcta ccctcggctg 2640
aaaaccttcg gcgtgccact gggctctatc ctgtgtctgg caggctccct gagcacgatg 2700
atgatcatta gcaccaccag acaagagtgt ggcagacggg cctccgtgcc ttgtagacct 2760
atgatcggca gcgctagacc cggaccttgg cggacatctg ctatgccatc tgccatggga 2820
gtcgccctgc ctaccagctg tgaaagcgga agatctcctc ctgccaccgg cggaagaatg 2880
cctggatctc agtctatcat gatgagctgg atgcctccac tggctccctg tgccgcttgt 2940
ccttgttctc ctgctcctac actgtgccct gctcatcctg caagagcccc tacagccgtg 3000
cctgccttta cacctctgtc tgctcaccct gtgccagtgc tgtctggatg tcacctggcc 3060
gtgcgcacct ctatgctgac actgctgccc atgagacacc ctcacagaag cccacctaca 3120
agctgccctc cactgctgga agctttccca ctgccaaggg ccagcctgag agctaccgtg 3180
cctagacaca gctctgtgct ggccactgga ctgcatctgc atcggcagat tagcctgcct 3240
ctgaggggct tcctgctgca tcaacctctg cctggacaac acctgtggct gtcccacaga 3300
ctgaggctga gactgccaag aacaggcgag aagaacgacc tccagctgtt cgtgatgagc 3360
gacaccacat acaagatcta ctggacagtg atcctgctga acccctgcgg caacctgcac 3420
ctgaaaacca catctctgcg gagagccaga cctacctcct gcagcacatg cagaatgtgg 3480
tggctgaagc tggccccact gcaagtgacc acaacactga agctgatcct ggtcatgctg 3540
gaaatcgtga ccgaagaggc caagaaatcc atgaagagat cccggcggag caagatcgag 3600
gcctctccta tcggctccat catgaagaag aaagacagca ccatcttcat caaccagcag 3660
ctcaagtgga cccctcacat cctgaagtct gccagcgtgt ccaagaagag actgcccaag 3720
ctgaacggca tctgggaagt gatgccccgg acactggaag gctgcatcag cgtgaaggac 3780
caccggacaa gccagaacca cagcaagtgc atcaccgagt gtgtgcggac agccctgaac 3840
cagagaaagg tggtcaagaa ccccagccag ccagtgccac tgagaaacga cggcatcacc 3900
aacggcaacg actccaccag atcctgctcc atcagcctga agaaaagcct ggaaaagatg 3960
cccctgatga acgccaagaa aatggaagat atgatctggg agagcaacat gggcggcaac 4020
cggtccatct gcctgacaag actgccctgc aaagtgaccg agtccagcca aagaccacct 4080
cggagcattc tgtccctggc ctctagagcc ggacagtttc ccgtttggcg gagaaccagc 4140
agaggcatgt ccctgcagtg gaagtccggc aatgcctgca cacctctgag gtgccctagc 4200
agaagccctg ccacatttct gaccgcactg aacggctggc acagatctgg acttagggct 4260
cagcaaccta gcctgccagg accttgtgct agcctgctgt ctacactgag ccagcctcca 4320
ccacaggctc caagccaagt ttggacagcc gccacactga gatgtcccgc tgttcctgca 4380
gctgcttgcc ctcctatcgt gttctttctg gccccatact tccccacacc actgagcatc 4440
agcagaccca cctctcgggc cagacagtct tgttgtctcc ccggactgac acaccctgct 4500
caccagcctc ttggctctat g 4521
<210> 1164
<211> 4503
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 2C
<400> 1164
cggcagatca acagacggaa gctgcagaga aagaagcgcc ggaagaagag agaggaccac 60
tgcggactgc gggccagaaa ccggaacatg aagaaaacca tgagccacct gatcgcccat 120
caggccctga agatgtctgg cctgagactg tttcacccca gactgctgac acggaagaag 180
cctggcaaga accctcggag aaagacctgg aagatgcgga agaagtacgc ccagaagcct 240
agccagaaga accacctgta cggcaagggc ctgacacacc ctgtgcctct gaagagaacc 300
ctgcagaaca agcggaacaa gaacatcaag cgcgtgaacc agaagaaggg caacatcaag 360
agaaagagca tcctgctgca cctcatcgtg ctgaacagcc ccgagagcaa cctgcaggct 420
catcctcaag ttccagcact ggctcctcag gcttggtggc ctgctagaag aggccctctg 480
acaagcgctc catctgctca gcagagcctg accttcctgc ctagcagatt tccttggggc 540
cctcctccac tgcactggaa ctctgcctac ctgggcagaa cactgctcgt gacctgcatc 600
ctgtaccaca gatggatcgt gaccagcatg tgccagagcc agagatggct gaccagcacc 660
acctctagaa gcagcgccct gatgtggacc cagtggtcta gcgtgacaag cctggaatgg 720
acagcccaag agaggggctg tagcagctgg ctgatgaagc agacctggat gaagtcttgg 780
agcctgcggg accccagcta cagatccatc ctggaatacg tgtccaccag agtgctgtgg 840
atgcccacat ctacagtggg agccctgaga gccacagctc ctgcaacagc tgctccacag 900
gctcagaccc ctcattggag agccgccaca acaagcagca tgagcagcag ccctagagcc 960
gagcctacaa gctctagctc ttgggccacc tgttggccca gatgttgcag ctccagctgt 1020
tactggtccc tgtcctcttg gcctcctgct ggtgctgccg aggccacaaa taccaggacc 1080
agaagcagag agtcccagcg gggcagaatg ctgacttgga gaagcagcct gtggctgcag 1140
ggcaccagat gttttacagg cgtgcggacc tccagcagac acccttcttg gccttggacc 1200
agatgcctga gaatgcggcc tcctagaagc aacagccgga aaaagctgct cgaggacatg 1260
aagcaaaatg gcttcacccg gtacaagaaa cggggcgtga tagcctggcg gagagccact 1320
ttcctgctgg ccctttggga gtgcagtctg ccccaagcta gactgtgcct gatcgtgtct 1380
aggaccctgc tgctggtcca gagcagatgc agcctgatgg aacagatccc tcacctgaag 1440
tcctggtggt gtacaagagg cggcggaaag cggaagaaaa agatgtgcaa ggtgtccggc 1500
ggctgcaccg cctgtgttga aagatgtcct tggaagggca tctgctggaa gtggcctgtg 1560
acagtggccg ctctgatcct gattcagcac ggcggcatct tcaccttccg gttctgggtc 1620
gagaagctgt cctggaacat ctgcaagaat ctgtccctgt acctggacaa gttcgtgcag 1680
cggctgctgt acgtgtacat catcgagaca aacgtgttcg tcctgaacct gttccacgtg 1740
ccagtgaatc agatcttcat gatggccttc tacctgaagt acaccgagaa ggcctgggtc 1800
atggaactgg aatggctcat tcagcagcag tgctaccagt tgctgctggc tcatatgtac 1860
ggcttcagca cctacggcac ccagaaaggc gagtgcgtgt gtctgcagtg tctgagcggc 1920
agctccctgt tcatcctgaa gcagccactg gacctgaaga tcagcaagac cttcatgagc 1980
agatcccacc tggatttcag cccctattgg atgaagaaag tgaaggcctc tccacagatc 2040
atgcagcgga tgagcgccgt gaacttcgag acaatcaggc ggaagtggca gatccggcac 2100
gtgctgaaga acctgcctct ggaaaacaca cagatcccca ggacaagccc tctgtggaag 2160
atcacaatgg tgctgacata ccccaactgc gtggtgcatg tgctgatgtt cgtgctgttc 2220
aaggccgacc agagcgagtc tagcctgagc agcggaatct accctcctag cacctgtagc 2280
ctgccttgcc ggggcattag aatgtgcgcc ctgtctcacc ctagcttcta catcagcagc 2340
accgtgtgct ttctgagcaa gcactgcatg accgcctgca ccagagagaa gatcatcaac 2400
cccaccatca gctgcccctt tcagagcccc acaaagagac tgggccacag agagggcagc 2460
gagagcgata atctgggcct gctgtactcc tttcctcctt ggctgcccat gagatccctg 2520
ggcgaacctt ggagagctgg ctttcagtgg ggagagtccc cttggcaagt gatggctagc 2580
ctgaccggca acagcgtgat cgtgcacaag atcgtgctgg tgtttctgaa gtctctgagc 2640
agctacaact gcgagcggcg gatctctggc atccagaaga gagccatcga gttcgccgtc 2700
ctgaagctgc tgaacatgga cctggctagc cctcagatta tgcagagaac cagcgccgac 2760
cggttccgga tgaagcggag aatgcagaac ctggataacc tgggcgtgcc ctggccattg 2820
cttccaggtg ctgctcctcc acatagactg ctgggcccct ctagatggat tctgtttcat 2880
gtgcggaaca tcgtgtacgg catccaagtg atgctgtgcc ggcggagaaa cagcagaaag 2940
cagagtcagg tgcagctggc cattcaggtc ctgctcgtgg acaagcacaa gtactttctg 3000
ttcggcccct atcctatcag cgagggactg accatgacca ccggccggaa catcaacagc 3060
aactccctga tgaccaactg cctgttcagc cccatcttcc tgtgccacca cgccatcatg 3120
caccggaaga tgacaagccc acacttcaga ctgttctcca gcaagatccc acatcctcag 3180
gtgccaagtg tggtggccct gtgcaagttc ctggccaatg gcctgtggtt caacctgatc 3240
tttcagaaaa agggccacat gatctttagc cccaagttct tcctgacctt tagccagcgg 3300
accctggaat ccgccggact gtttccatgg ctgcacaccc agtgccggaa caaaaagacc 3360
aagctgtggt tttccctgat caacatccac caccgcaaga atcctctgct gcctatgaga 3420
atgagcagaa cacctcctcg gagagtgtgc ggatctccac ctctgcatct gtgccaacct 3480
ctgagaggcg gcaagaagag aagcaagttc gccttctgga agcctcctag ccagggcatc 3540
agctcttgtc tgatgacagg ctgttggggc tcctgtggca gagcttgttc ttgcggaaga 3600
ggctgcggta cacccagagg cgactggaaa agacacccac ctcgcagaga gctgagcctg 3660
gaaccatgga ttccttatct gcaccagcaa aagacccagc ggaagcggat gaagaccggc 3720
gccattcaag agaagggcgc tatccaagaa aaaggcgcaa tgaccaagcg gatctgcgtg 3780
gtcaatttcg aggcctgcag agagatggaa agcctgagcg cccctgagaa gattaccctg 3840
ttcgaagccc acatggcccg gtgcacctcc atcaatgtgc tgtgtgtccg ggccagcctg 3900
attgagaagc tgatgaaaga aaagcgcaag atgaagcgca accaggtggc atcccctcaa 3960
atcatgcaac ggctgttcat caagggctac cagaacaacc acttcacgtt ccacctccaa 4020
aactttgcct tcttcagctc cttcggcaac aacaagtata tcaacattct cacccgggcc 4080
ttcatccaca cacctagaag ccctggctgt tccgtgtacg ccaatatgtg ctggcggaag 4140
atgcagtccc tgaatcaccc cagcagactg accaactgtc accccgcttg gctgagcccc 4200
attagtgctt gtcctaggct gctgccctat ccttttcacg tgctggcact ggaagtgacc 4260
tttccacctg gcacagccat gcctcagatg caattgcagg cactggctat gtgggagaaa 4320
ggctgggaca agcaagagaa gaaatcccgc aagctgatgt cctcctgcct ggaaaaaaag 4380
gctacctgga tgcggagaac ccctggcaca agcctgcagt gttacctgaa cacacacccc 4440
tgcaccatgc tgctgcctca gggaatccca tctctgaacg cccagtggat gttcctgcgg 4500
atc 4503
<210> 1165
<211> 4518
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 3C
<400> 1165
cctattcctc cacacctgag acaccctctg ctgctgaaga acaagaagcg gagaaagctg 60
cggcccaaga gcagaaagaa gggccacacc aagaaccggc ggaaggccaa gagaaagccc 120
cagatcagaa acagccgcag agccacacct accagcaagg gcagcctgag aagaaagtac 180
ctgagagtgg gagccgccgc tgctagctgt caatctcctc catctcctag agagacaacc 240
cctagcagcg acgccaccag aagaaccaga cctatcgccg ctcagagcaa gaaaaccatg 300
acagccgccg gactgacccc tagccagaag aaagatcctg ccggcaagct gaagaaacag 360
gtgtccgtgt acagcggcaa cctgctgagc ttctctcgga gaggcatgaa gtctagcgtg 420
cgcctgaaga actgcaccaa cctgagcgtg cccatgatgc tgaccatcct gatctggaag 480
cgggtgttca tcctgctgct gtccgacaag aaatctatcc ctcacgtgcc caaggccacc 540
gccgctcatt ctgtgacagt gaagctgcag agccggcgga acagacggta cagaaagatc 600
tatggcgagc tgaagatgtc cctgcaggcc agcaatggca tggaagcctg tggcacacac 660
cccacaccta gactgtccgt gtccgtgatc accatgaagc tgtgggagaa gcacttcaag 720
ggcctgaact ggaacctggt cgtgtggatt ctgaacctga agatgatgct caagaagaag 780
tatctggtcc agcgcgagtg ggagaaacgg aagcagattc ttggcggcgg aggcaagtac 840
aaagagtact tcctgaagag aatcctcatc cgcaaggcca tgacagtgct ggccggcgat 900
aagaaaggcc tgggcagatt catgagatgc gtgcagagcg agacaaaggc cgtcagtctg 960
cagctgcctc tgggcagaat ggacctggat ggaatgctga ccgtgatcgg ccagggactc 1020
gtgggcatga cacctagaga tctgggaaca gtggctggcg ccaccgcaca gattcagagg 1080
cctattcagg tgcagacagg cggcagactg agaggcccta gaagaaaggt gctgatggtg 1140
ctgtggctgc ccgccaatca gagcctgcag aaaagccagg tgttccagtg ggtgctgaga 1200
accgagctgc ccctgacctt tagcaccctg ctgtgggaca gcagacacga cctgcctaga 1260
atgctgccca tcagcagccc tctgcacaga ccccagatgc ctttctggac ctgcaccttt 1320
cctgccacca catggggcac atgggagaca ccttctacat ggggctggcg gacctttgcc 1380
agacagcctt ctagacccac cggcagaacc cctaccacca gactgatggc tccagtgggc 1440
agcgtgatga gctgtagcct gctgacacag ccatctccag ccagcgcctg tacaatgcct 1500
ccactgctgc atcctcagtg ggcccctcat tctgctggac tttctccagg cgcttgcaga 1560
cctgcctgta cctgcatcag catgaccaca atcagcaggg ccacctggcg cagaaacctg 1620
cagagaaacc tgaaagtgct gcggctgaga atccccagcc tgcggaagta cagacagcag 1680
aacacccggt ccaccaacct cgagaagaac ccatctctga agaagcagag ccagaggcgg 1740
ggcaagctgt ctctgaccac actgagcttc gtgctgatcg aggaactgct gaaaaagagc 1800
agccagctgc ggagaagctg gcggaacgtg tccagaatca gcaacatccg gaagctgatt 1860
tggaccaagc agcggagctt cctgtctctg ttccccaagc tgagagccac cgagcagatg 1920
accaatgtgg gctgtagact ggattttcac cccagaagca gctccggcga cagagtgttc 1980
ctggtcaaga tccagagcag cccattcctg gccagatcct ggaataccat gcagtggaac 2040
aacaagaaaa tggccatgac tgtgatcgct ggcgcccacc actgtcagta caagctgacc 2100
tacaccaaag tgtggaagat gaattggaag aaaatgatga tcggcagcca gcacctcctg 2160
ttctccccac tggatagctc tccactccag ctgctgctgc acccacacgg caagagatgc 2220
aacccctgtt gtcggctgac atggatgagc cacctgaatc ggaagctgca cctcaccagg 2280
tcctgcctga tcgacctgac catgatgatg agccagaaac tgtggaagaa tcagcggaag 2340
cgcatccctc tgccttctcc aagacagcat ctgctgcctc agtatcctct gcaccctcct 2400
ccaccttgtc tgctgcttct ccaccataga caccacctgg cattcctcga gatggcctgt 2460
agctctcagc acacccacag catcaagatc tggatcagct tcagccacga gacaatgagc 2520
ctgtccaaca tcctgatgaa gttccggctg accaccacca caagcagccc cagaagaagc 2580
cctgctctgc gagctagagg cggcacaaca atcggcgaag tgaccagcag cctgttcttt 2640
agccactgcc tgtgcgtggc ccctagatgt cctagatctg ccgtggacat cagccccgga 2700
cctacatctc cttctctggc ctcttgtgcc tctgtggcca ttggaaagct ggcactgctt 2760
ggcgcctctg ctccttgtgg tgctgctggc gctagagagg ccggaagatt tgctgtgctg 2820
ggcaccatgg tcatgaagaa catggaacac agactgacca tggacagcgc cctgagcctg 2880
acaaagagag agggccctga aacaggcccc gtgtactacg tgtgcaaccg gatgaatgtg 2940
tccagcgtgc tgaagccttt cctgttcacc gtgcctatcg aggacatgag agagtgcacc 3000
ctgggacgca acagaatgaa tgtctcttcc gtgctgaaac cctgtctgat ccccgtgcca 3060
atctgcaaga agaaactgct gctcaagctg ctgaggggcg cctccagctc taccagcaga 3120
gatagcagaa gctttttcac cagcgctcac cccagcagac cctgcaggat gagactgtac 3180
cagatgctgc agaagcagtg ctgctacaac ctcgtgatca agcaccctct gatcttccgg 3240
atcaacctgc ggagacaggg caagaccaaa gacggcgttg tgcagagcct gggcttcctg 3300
aaccagcaga tcatcctcca gaaagagttc ttcatctgcc tgctgatgtt catcaagcgg 3360
tggaagccag ccgccaccaa gaagggcaag aacagcccct gctgccagaa aaaactgcgg 3420
gtgcagaacc agggccatct gctgatgatt ctgctgcaca acagaggccc acctctgcat 3480
accagattcg agaaaaagcg gcccgagtgg ctgagcagaa aatccggcgt gatgaagtgc 3540
tgggatctgt gccctgcctt cagcggcagg attctgcacc agccagaaat ggccgccatg 3600
agactgatgc ccaagttcct gaactccacc aacagctggt ggacagtgca caagaagaga 3660
ggcctgttcc accagatgaa gtgtctgacc gccgtggact gtctgcaggc cttctgggat 3720
atgagcgaga agaaacgcaa gctgcctatg attcgcaaaa tccagaagcg gcggagaacc 3780
gccaaccgga acatcgagat cacccctcag agaagcaaag cccacctgaa gaaaacctcc 3840
gccaagggcg ccaagaaaat caccttcctg tgcctgagag tcagatgcgg aggctggctg 3900
tgtggctgga caccaagagg atggctgaag aagtccacca agtccagact gtgcttcttc 3960
tacctgctgt actacctgtt tttcctgacc gtgtgcggct tcacccctcc accacttatt 4020
ctgtggcctc aggcagcccc tggcgagaag ctgaagcact gttttaaagc ctggggcgtc 4080
gaccctcctg gcagcgtttg gattctgccc tgcttcctga ttcacctgag aaaggtggac 4140
acccaccacc tccaggtggt caccaaaaca gtgaccgcca caacagccga cggccagagg 4200
atgagaaggc tgaagtgcaa ggcctgccgg ctgagatggg ctagacctga acctgcagct 4260
caggcccctc ctaagagcca ctttccacct catcctagcg gcccctccag aaccagctct 4320
ctgcaattga gaacctacat ggaaatgcac tacggccatc aggccccaca ggtggcaatg 4380
ctgcctaaac tgctgtgtcg gcagatgctc cccactctgt ctaccctgca gcagagacat 4440
cctcagggcc catgtcctcc tccagtgaca cctctgagag tgcagtctgt gctgctgctc 4500
ggagtgcctc aaacagct 4518
<210> 1166
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 4C
<400> 1166
gacagcaaga agatgaccca gaagaaccgc aagacccgga aggccgccag agagaagcac 60
agaaagaccg acaacctgga cctgcagcac cagcgcagac gcaaaaagaa gaaggacaag 120
gtcgagatcc ggaatcggag ccctaaggcc aatagcaccg agtgtcaggg cgagcacagc 180
agagagcaga acctgctgaa cctggtgcaa ttgaaccctc acagccctca ccaccggaag 240
gacgaggaag atcaccagaa gagacaccac caccacaatc aaaagaagat gtccgtcaac 300
gagggcaaca accactggcc tagagtggaa atgcctaccg gctggctgct cgtgggctac 360
aacaccagaa acacagccca gaatcctcgg ctgcagcagc acctgaaaca ctggcagcag 420
tgcaccagag ccagatggtg tcaagagccc tgtcagaccc tgaccttctt ccacttcttc 480
ttctttttca aaacggtgtc cctgtgctgc cccggctggt ctaaaggaca acctcctcca 540
cctggcctga agccttctag cctggcttct caggtggcca gaaccacagg cgtgtaccag 600
cacgtgtggc tgatctgctt cgtgtttttc gtgtgcgtgg aaaccggctt ctgtcacgtg 660
gcccaagtgg gactcgagag actcgttagc ctgagcggca tcaccgacgt gaaccattgg 720
gcccagccta agccatctcc tagcaaaggc accggcatga acagacccat cggcctgaga 780
gttggcaaag gcgtgtgggc tagactgtgg ctgaagaact ggaagcggtt caagctcaaa 840
aagaaataca caggcatgga aatcctgctg tggattctgc tgaagatgga aattcagatc 900
ttcaagattt gcctgggcga gatgcagctg tgcctcaaga agaaagtcaa cgcctgcagc 960
aacgccaaga aaatgccctt ccagtgccgg tgcagacgcg agtacagagt gaccatgatt 1020
cagaagaaga aacagaagtc cccgctgttc ttccacggcg acctgtgcag accttctcct 1080
tgcctgtctt ggagcagcag gatcgtggct cctggacacg ccctgagctg tcggactcgt 1140
agaagatggt ccagcaagat ggccaagaag tcccagcagc ctctgtgtag aggcggccct 1200
tctgccagcg atagatgctg tagctgtagc cccagcggct ttagcgctgg aagaggcaga 1260
tgtcctgtgc agggatgtct gaggccacac agagttcagc tgctgagaag atggggccct 1320
ggatctcctg ctggccagag actgtctaag ggcttccaac tgctgcgttg gtggggacca 1380
ggatctccag ctcctgagcc tagaaagggc ccatttccac cacctgatcc tccatggcct 1440
gtgaccgctg tgacagtgat ggctggctct gtgcctagcg ctcagtctgt ggatgctctg 1500
gaatcccctg gacctctggc tctcgaaggc cctagcagcc ctagaaacct gctctggcgg 1560
gaaatgagca tcttcctgcc tggcatcttc aacctgcacc tgtgctacta ccacagccag 1620
agcaaccgga acaagagccg gcagatggaa tccctgggca tgaagctgca gatcacacac 1680
ccattcgcca gccagccact gggccaagag atgcccaaca acacccagat cagactgctg 1740
aagcccggcc aggcctttgg cagcttttcc gccgattttt cagcccctca gcaggcccct 1800
ctgagactgt ggtcttggtg cggcacaagc cagacctact tcggctctat cgaagccctg 1860
acagccctgt tcacctgtag aaccgccagc atcagcgtga acatcagcac cctgatgagc 1920
atcctggaag ccatcctggc catgacactg accctgaatg gcagccctct gtgggactgc 1980
agcacaacaa caggcacaca ccacggctgc ctgtgggaga tcccttctgt taccctgctg 2040
gctaccgcca aaaagagccc taccagcttc tgctgtcagc ggcctcctct gcagccagtg 2100
gaagagaaga agaacggccg gatcagcagc gtgccacctt ctccacctct tgctctgggc 2160
cctagaatgc agctctgcac ccagctggcc cggttcttcc ctattacacc tcctgtgtgg 2220
cacatcctgg gacctcagag acacacccct ctgctgaccc ctgacaccag atggatcttc 2280
tccaaccagc tgcagaccgt gcagatgctg tgtctgcctc cactgaagca gggcgagaga 2340
atcatctggc ctctcggcgg ctttcagatc cccaacttct tttggagcct cggcatcgga 2400
cacactggcg cctggtggca tactggaagg cggagaagag aatggggcgg cagcaccgtg 2460
tctagaagcc cactgtggat cagctccatg atctacctga gaggcatggc cttcgcctcc 2520
gacagcagca tcagaaccac cagagtgtcc tggtgtcgga gatgtggcgc caaaagcgcc 2580
gcagccagca gcgacaagaa gaagaaaagc accgaaaaga ccaagaacaa gatcatctgc 2640
aagggccaca gaatcaccca ggtggtgctg agactgggca acctgcctcc attcttcaga 2700
ggcagcgagg tgccctttcc tagaccttgc cggaccaagt gccagaagaa ggttccaagc 2760
gcctctcctt ggggactgca cccaagaaca gcctccatca cactgcctac caccagcctg 2820
aagggcagca gaacaagctg ctgccccaga tctcacccca gactgcccag aacaaagtgg 2880
cctctgcagt gcctgctgca cagcctggga acaactggaa cactcgtgtg ggaaaggggc 2940
gtgctgcaga tgagaagtct ggaagctcac tgccctctgc agacattcca cctccaccac 3000
tgcagaaccc agcctagctc ttgtcctcca gcctggattc tgtaccaagg acagtggagc 3060
ggagccgtcg tgggacttag acctgtggct caccatctgc caagacctat ccaggggctg 3120
cactgtcctc aggctcctca tcaaccagct ctgtcctggg gaaagtggcc cgtgggaatg 3180
acaggacccg ccagatgttg ccggtggcct agaagaatgt gtagctctct ggccctgcca 3240
accggcctga catctctgat cctgcctagc agtgatctgg ccgtgctgat ctctagctcc 3300
accagccact ttctgatgcg gagcccagtg ctgccaagca gcagactgac atgtgcctct 3360
ccacagctgc ctcggatgtg gacatggtct agctggctga aagagtgggg aggacaggcc 3420
cacagacagc ggaactgtag agtgaacgcc gttgaggaac tgcacagcag gcggatgtct 3480
gtgcggatcg tgaagaattg ggtgtcctgc tgttacgtgc ggctgagtgc agtgggactg 3540
tctacttgga gcgccctgga ttccctgatc ctgtccttcc agagagtgaa aaccagccgg 3600
atactgaacc tccaggtgct gaagaagatc ctgcggagct ttatgaagct gtaccactct 3660
ctcgtgatgt gcctgcggct gcggaccaag ctggaaaaag ctctgagcgc tctgtttatc 3720
tggccccagc acagctacaa aggccaggca ttcggaagcc tgtgccagct ggtgtctgcc 3780
gatttcagcg cccctcaagt gaccagactg cggagcctga accatctgct gattcggtgg 3840
atctttagca atcagctgac agtccaaatg ctctgcctgc cgatcatcaa gaaaatgaag 3900
aaacggatca tggtgcacgt cttgaagaag aatcggaagc agattatctg tatcaagaat 3960
atgttcctgc agcggaaggg attcctgaac ctgagccacg tggaaaagtt cagagagagc 4020
accctgggca atttctggat gaagctcctg cagctgccac cagcttgcac ctctaaggcc 4080
tggacaccca gaaagcttgt ggggagagcc gtgcggagaa agggcgtcgt gatcaacctg 4140
aagagactgc agaaattccg ggctagcgtg tccttctgga ctctgctgcc tacaacaggc 4200
gtgcggacaa gaggctctcc actgagactg actctgtggc ctccaagaag ccagaaaagc 4260
cagcaccact gcgccctgag aaagatcgag tgggccacaa agctgtccct cggcggcaaa 4320
gcaggaccac aggctcaaga gaaggccaac atcctgaaca gcctgccttc ctctatggaa 4380
atcgccgtgc tgcaagaaat gctgaaccag aagtgtctgg cccctttcga gcttaagaag 4440
aacctcctgc tgccaaccta cacaccccac atctgtcggc acacccttaa aaagaagccc 4500
agagacatct gcagaatcag c 4521
<210> 1167
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 1D
<400> 1167
gccgacaaga aaaacgtgcg gagcgctagt tctcctggac atcctcttgg ccccagaaga 60
atgaccagac ggaccatgac caccaccaaa atgatgatga tgcggcggac caagcggcgg 120
agaagaaaaa gacgccggat gaccatgatg accagaagaa ccctgctgac caagaaaacc 180
tgtctgaccc ctagaaccag cgccgccaca aaagctctgc ccagacagac aatcagccag 240
cggaggccta tccagacacc tcctggaaca agcctggcca tctggggcag aagaagcaag 300
atcgaggcct ctcctatcgg cagcatcacc cctctgagca tcagcagacc taccagcaga 360
gccagacaga gctgttgcct gcctggactg acacaccctg ctcatcagcc tctgggctct 420
atggttggag ctggaacagg cggaggacct gcttgtgtgc ctgtggccga agcttctaca 480
ggcgcttgga cagctgaagg cgctgccggc acaagatgta gagccagcag agccccttgc 540
agacagctgc ctgcttctag ccctaccaag tgcgagatct gcgtgaagag aagaaggcgg 600
cgcaagcgga gcagccagtc tagatctccc gtgcctaaga aacgcgagcg gatgatgctc 660
cctgtgcggg ccagaacagc tagatctgct ctgccacaag gcagggctcc tctggaagga 720
atgcttctgc ctagagcact gcccagcctg ctgagcagaa tgcctgccag aagagagagc 780
agattctggc tggccctgca ggcccttgga ctcagacctc ctcatctgcc tagctgtcac 840
cctctgcctc aactgcttgg acctcctcca cctcatcagg cccctggcga gaaaaacgac 900
ctgcagctgt tcgtgatgag cgacaccacc tacaagatct actggaccgt gatcctgctg 960
aacccctgcg gcaacctgca cctgaaaacc accagcctga acgccaagaa aatggaagat 1020
atgatctggg agagcaacca gcagctgaag tggacccctc acatcctgaa gtccgcctct 1080
atcgccaaga agcggatcaa gctgcggcgg aacagcacca gacgggaaat gccttctcag 1140
gccacacctt ctccacctgg accttggaga gccgctctgg gcaaagaagt gaagcggagc 1200
cagagcaagc tgagactgag aaacacaagc cccttcgaca aaaagggctt tgtgatcctg 1260
agcaacatgg gcggcaaccg gtctatctgc ctgaccatcg tgttctttct ggccccttac 1320
ttccccatgc ctagcagctg gtctagcagc ggcagaacca gactgcctct gaggccacag 1380
agaggcccta gacctctgca tagatggctg cagcagacca ccggctgctc tcagagaaga 1440
ggcgactgcc caagaaccat ggccggacca tctgcttctc tgcaccctgc atctggcaga 1500
gcctccagaa agacctggca gagaaggctg agagcctgta gagcaggcgg acctgctgga 1560
tgggctagac aggccagaaa acgcaagaga gagaagcggt cccagaagtc cagacagaac 1620
catctgcagc tgaaaagctg cagacggaag atcagcaact ggtctaagct gcggagcccc 1680
tggatcttcg aggccaaaaa gagcatgaag agatcccagc ggcctcctcg gagcatcctg 1740
agcctgttca agaagaagaa gcccctgaca ttcagcccca gcgtgtccaa gaagaggctg 1800
cctaagctga agggcaagaa acgccggaaa gaaatccagc ggaaggtggt caagaacccc 1860
agccagcctg tgccactgag aaatgacggc atcaccaacg gcaacgacag cacccggtct 1920
tgcagcatca gcctgaagaa aagcctggaa aagatgcccc tgatgcggag cctgctgtac 1980
tccagaatgt gcctggtgca gatccccaca cacacctggg agcccgacta ctttgtgtcc 2040
ctgcctatga tgttcagctg ggccacacag agctttccag tgggcgccgt gtttctgacc 2100
agacctgcca ttccttgctg tagctgtacc agccactcca atccttggag ccagtccaca 2160
ctggccatcc ggtttatctc tgcccctcag ccaagcagca gcaccgttac agctgctcct 2220
agcggccagt attttgccct gcggagtatg cccaagagcc ggaaccaggt gctgtttcgg 2280
agaaatctga ccccaagcca gctgcggaca ctggcccctc catatatgct gctgcctcag 2340
tctctgtccc agagcctgtc tcggaagcag atcccatctc agtccatgct cgtgcggacc 2400
aggctgacac tgacaggcac tagaagctcc ggcaccagag cctctccatc tgccgtgtgt 2460
ctgtgctgct ggacatgccc cagcagaagc tttcctgccg cctctccaag cggactgaga 2520
gcacctgttg gagcacaggc tcctccagaa gtgacactga gagccagctg tgccagctcc 2580
gccagcaaag cttgtgcagg actttggcct tggggagccc aagtgcggat gaagaagaag 2640
gacagcacca tcttcatcta ccccaggctg aaaaccttcg gcgtgccact gggcagcatt 2700
ctgtgtctgg ctggaagcct gagcacgatg atgatcatta gcaccaccag acaagagtgc 2760
ggcagacggg ccagcgtgcc ctgtagacct atgatcggaa gcgccagacc tggaccatgg 2820
cggacaagtg ctatgccttc tgccatggga gtcgccctgc ctaccagctg tgaaagcgga 2880
agatctcctc ctgccaccgg cggaagaatg ccaggatctc agtctatcat gatgagctgg 2940
atgcctccac tggctccctg cgctgcttgt ccttgttctc ctgctcctac actgtgccct 3000
gctcaccctg ctagagcacc aacagccgtg cctgccttta cacccctgtc tgctcatcct 3060
gtgccagtgc tgtctggatg tcacctggct gtgcggacct ccatgcttac cttgctgcca 3120
atgatgaccc tgaaggccct ggtcaagaca tggacccagt tcagaaacta ccccagacgg 3180
caccctcaca gaagcccacc aacaagctgt cctccactgc tcgaggcctt tccactgcca 3240
agagccagcc tgagagctac cgtgcctaga cactctagcg tgctggccac aggactgcat 3300
ctgcataggc agattagcct gcctctgcgg ggcttcctgc tgcatcaacc actgccagga 3360
caacacctgt ggctgtccca cagactgaga ctgcggctgc ctagaacaac cgagatccag 3420
ctgaccatga acgactccaa gcacaagctg gaaagccccg ctctgaaaca ggtgtcccca 3480
gctagtcctc ctacacagca gcctcagaca ccccaggatt ctagacaggt gctggccgtg 3540
cctatgagcc tggcctgtag catcaccgtg tccttcgtgg gccagatctc taccctggtg 3600
ctggacgtgt cctccatcag ccactggaac ggcatctggg aagtgatgcc cagaacactg 3660
gaaggctgca tctccgtgaa ggaccaccgg acatcccaga accacagcaa gtgcatcacc 3720
gagtgtgtgc ggacagccct gaacaccaag tgtgaaattt gtgtgaagaa caccgccatc 3780
ctggctatca ccctgatcac cccacaggac cctcacctgg accctgtgtg tcatccccat 3840
agaaggcccg gctggaaggg acaccacaga gtggtgttta gccaccatcc ttccggcagc 3900
accaagtctc actggcagca gagagaaaga ggcggaggcc gcagagaaaa gaagggctgt 3960
agagaggcaa gcagagccgg ccagtttcct gtgtggcgga gaacatctag aggcatgtcc 4020
ctgcagtgga agtccggcaa tgcctgcaca cctctgagat gtcccagcag atctccagcc 4080
accttcctga ctgccctgaa cggctggcat agatctggac tgagggccca gaccgccttc 4140
tttctgctgg acatcatcct gcggagagcc cggcctacaa gctgcagcac atgtagaatg 4200
tggtggcggc tgccctgcaa agtgaccgaa agctccctgg ccaagaaaac cctgaccaat 4260
cagcctagct tgcccggacc ttgtgctagc ctgctgtcta cactgagcca gccaccacct 4320
caggctccta gccaagtttg gacagccgct acactgcggt gtcctgctgt gcctgctgct 4380
gcatgtccac ctctgaagct ggctccactg caagtgacca caacactgaa gctgatcctg 4440
gtcatgctgg aaatcgtgac cgagaacaaa gttcggcaga acttcaagcg gaactccagc 4500
ttcttctaca ccagcgacag a 4521
<210> 1168
<211> 4503
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 2D
<400> 1168
cggaagatgc agagcctgaa tcaccccagc agactgacca acaatcctcg gagaaagacc 60
tggaagatgc ggaagaagta cgcccagaag cctagccaga agaaccacct gtaccggcag 120
atcaaccggc gcaagctgca gagaaagaag tccagaagcc acctggactt cagcccctac 180
tggatgaaga aagtgaagcg ggccagaaac cggaacatga agaaaaccat gagccacctg 240
atcgcccatc aggccctgaa gatgtctggc ctgagactgt ttcaccccag actgctgacc 300
agaaagaagc ccggcaagca gaaaaagggc cacatgatct tcagccggcg gaagtggcag 360
atccggcacg tgctgaagaa tctgatcccc agcctgaacg cccagtggat gttcctgaga 420
atcgctagcc cacagatcat gcagagaacc agcgccgacc ggttccggat gaagcggaga 480
atgcagaacc tggacaatct gggcgtgccc tggcctctgt tgcctggatt gctgctggcc 540
catatgtacg gcttcagcac ctacggcacc cagaaaggcg agtgcgtgtg tctgcagtgt 600
ctgagcggca gcagcctgtt catcctgaag cagcccctgg acctgaagat ctccaagacc 660
ttcatggcca gccctcagat tatgcagcgg atgagcgccg tgaacttcga gacaatcctg 720
caggcccatc ctcaggtgcc agctcttgct cctcaagctt ggtggcccgc tagaagaggc 780
cctctgacat ctgctccaag cgcacagcag tccctgacac ggacactgga aagcgccgga 840
ctgtttcctt ggctgcacac ccagtgccgg gccttcattc acacacctag aagccctggc 900
tgcagcgtgt acgccaacat gtgctggcgg tacaagaaac ggggagtgat cgcctggcgg 960
atctaccctc ctagcacatg cagcctgcct tgcagaggcc tgatcctgat tcagcacggc 1020
ggcatcttca ccttccggtt ctgggtcgag aagctgagct ggaacatctg caagaacctg 1080
agcctgtacc tggataagtt cgtgcagcgg ctgctgtacg tgtacatcat cgagacaaac 1140
gtgttcgtgc tgaacctgtt ccacgtgcca gtgaaccaga tcttcatgat ggccttctac 1200
ctgaagtaca ccgagaaggc ctgggtcatg gaactggaat ggctgatcca gcagcagtgc 1260
taccagcgga agagaatgaa gaccggcgcc atccaagaga agggcgctat tcaagagaaa 1320
ggggccatga ccaagcggat ctgcgtggtc aatttcgagg cctgcagaga gatggaaagc 1380
ctgagcgccc ctgagaagat caccctgttt gaagcccaca tggcccggtg caccagcatc 1440
aatgtgctgt gtgtcagggc cagcctgatc gagaaactga tgaaagaaaa gcgcaagatg 1500
aagcgcaacc aggtggcatc ccctcaaatc atgcaacggc tgttcatcaa gggctaccag 1560
aacaaccact tcacgttcca cctccaaaac ttcgccttct tcagctcctt cggcaacaac 1620
aagtatatca acatcctgac ctttctgccc agcagattcc cttggggacc tcctccactg 1680
ggagccctta gagctacagc tcctgctaca gctgctcccc aggcacagac acctcattgg 1740
agagccgcca ccacaagcag catgagcagc tctccaagag ccgagcctac cagctctagc 1800
tcttgggcca cttgctggcc tagatgctgc agctccagct gctattggag cctgtctagc 1860
tggcctcctg ctggcgctgc cgaagccaca aataccagaa ccagaagccg cgagagccag 1920
cggggaagaa tgctgacttg gagaagctcc ctgtggctgc agggcaccag atgttttaca 1980
ggcgtgcgga ccagctccag gtgcagcctg atggaacaga tccctcacct gaagtctaac 2040
agccggaaga aactgctcga ggacatgaag cagaacggct tcaccagacg gcggaacagc 2100
agaaagcaga gccaagtgca gctggccatc caggtgctgc tggtggacaa gcacaagtac 2160
tttctgttcg gcagagccac atttctgctg gctctgtggg agtgtagcct gcctcaggct 2220
agactgtgcc tgatcgtgtc tagaaccctg ctgctcgtgc agtctagaca cccaagctgg 2280
ccttggacca gatgcctgag aatgcggcct ccacgcagcc actggaactc tgcctacctg 2340
gggagaacac tgctcgtgac ctgcatcctg taccacagat ggatcgtgac cagcatgtgc 2400
cagagccaga gatggctgac ctccaccacc tctagaagct ctgccctgat gtggacctgg 2460
tggtgtacaa gaggtggcgg caagcggaag aaaaagatgt gcaaggtgtc cggcggctgc 2520
accgcctgtg ttgaaagatg tccttggaag ggcatctgtt ggaagtggcc tgtgacagtg 2580
gccgccatga gcagaacacc tccaagacgc gtgtgcggcc acagagaggg cagcgagtct 2640
gataatctgg gcctgctgta ctcctttcca cctgtgctgt tcaaggccga ccagagcgaa 2700
agctctctga gcagcggcaa cagcgtgatc gtgcacaaga tcgtgctggt gttcctgaag 2760
tccctgagca gctacaactg cgagagaaga atcagcggca tccagaagag agccatcgag 2820
ttcgccgtcc tgaagctgct gaacatggac ctcggcaagg gactgacaca ccccgtgcct 2880
ctgaagagga ccctgcagaa caagcggaac aagaacatca agcgggtcaa ccagaagaag 2940
ggcaacatca agaggaagtc catcctgctg catctgattg tgctgaacag ccccgagagc 3000
aaccgggaaa agatcatcaa ccccaccatc agctgcccct ttcagagccc cacaaagaga 3060
ctgggaagcc ctcctctgca cctgtgtcag cctctgaggc cctatcctat cagcgagggc 3120
ctgaccatga ccaccggcag aaacatcaac agcaactccc tgatgaccaa ctgcctgttc 3180
agccccatct tcctgtgcca ccacgccatc atgcaccgga agatgacaag ccctcacttc 3240
agactgttct ccagcaagat cccacatcca caggtcccaa gtgtggtggc cctgtgcaag 3300
tttacacacc cctgcaccat gctgctgccc caaggcgctt tttggaagcc tcctagccag 3360
ggcatctcca gctgtctgat gacaggctgt tggcagtggt ccagcgtgac aagcctggaa 3420
tggacagccc aagagagagg ctgttcctcc tggctgatga agcaaacatg gatgaagtct 3480
tggtccctgc gggaccccag ctacagatcc atcctggaat acgtgtccac acgggtgctg 3540
tggatgccca cctctaccgt gcctaagttc tttctgacct tcagccagat ccggatgtgc 3600
gccctgtctc accctagctt ctacatcagc tccaccgtgt gctttctgag caagcactgc 3660
atgaccgcct gcacacctgg aaccagcctg cagtgttacc tgaacctggc caacggcctg 3720
tggttcaacc tgatcttccg gaacaaaaag accaagctgt ggttctccct gattaacatc 3780
caccaccgca agaacccact gctgcccatg cggctggaaa aaaaggccac ttggatgcgg 3840
cggaccgagc tgtctctgga accttggatt ccttacctgc atcagcagaa aacccagtgg 3900
ctccccatga gaagcctggg cgagccttgg cgagctggat ttcagtgggg agagtctccc 3960
tggcaagtga tggcctctct gacaggcaga cgcaagaaaa gagaggatca ctgcggactg 4020
caagagaaaa aaagccggaa gctgatgtcc agctgcgccg ctcctccaca tagactgctg 4080
ggacctagca gatggggaag ctgtgggaga gcctgttctt gtggcagagg ctgtggaacc 4140
cctagaggcg actggaagag acacccacct cggcggattc tgtttcacgt gcggaacatc 4200
gtgtacggaa tccaagtgat gctgtgctgt caccccgcct ggctgtctcc aatcagcgct 4260
tgtcctcgcc tgctgcctta tccattccac gttctggccc tggaagtgac attccctcca 4320
ggcactgcca tgcctcagat gcaattgcag gcactggcaa tgtgggagaa aggctgggac 4380
aagcctctgg aaaacacaca gatccccagg acaagcccac tgtggaagat cacaatggtg 4440
ctgacatacc ccaactgcgt ggtgcacgtc ctgatgttcg gcggcaagaa gcggagcaag 4500
ttc 4503
<210> 1169
<211> 4518
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 3D
<400> 1169
cagaacacca gaagcaccaa cctggaaaag aaccccagcc tgaagaagca gagccagcgg 60
agaggaaagc tgagcagcag aaagaagggc cacaccaaga accggcggaa ggccaagaga 120
aagccccaga tcagccagaa gaaggaccct gccggcaagc tgaagaaaca cctgaaccgg 180
aagctgcacc tgaccagatc ctgcctgatc gacctgacca tgatgatgag ccagaagctg 240
tggaagaacc agcgcaagag aatccctctg ccttctccac ggcagcatct gctgcctcag 300
tatccactgc atcctccacc tccatgcctg ctgctgctcc accacagaca ccatctggcc 360
tttctcgaga tggcctgcag cagccagcac acccacagca tcaagatctg gatcagcttc 420
agccacgagg acctgcctag aatgctgccc atcagcagcc ctctgcacag accccagatg 480
cctttctgga cctgcacctt tcctgccacc acatggggca catgggagac accttctaca 540
tggggctggc ggacattcgg ccctgtgtac tacgtgtgca accggatgaa cgtgtccagc 600
gtgctgaagc ctttcctgtt caccgtgcct atcgaggaca tgagagagtg caccctgggc 660
agaaacagaa tgaatgtgtc ctctgtgctg aaaccctgtc tgatccccgt gccaatcctg 720
accacactga gcttcgtgct gatcgaggaa agccggcgga acagacggta cagaaagatc 780
tacggggagc tgaagatgtc cctgcaggcc ctgcctctga cctttagcac actgctgtgg 840
gacagcagac acaccaccac cacaagcagc cccagaagat cccctgctct gagagctaga 900
ggcggcacca caatcggcga agtgacaagc agaggcgcca gcagctctac cagcagagac 960
agcagaagct ttttcaccag cgctcacccc agcagaccct gcagaatgag actgtaccag 1020
agcaacggca tggaagcctg cggcacacac cctacaccta gactgtctag aggccctcca 1080
ctgcacacca gaaccatgag cctgagcaac atcctgatga agttccggct gatgctgcag 1140
aagcagtgct gctacaacct cgtgatcaag caccctctga tcttccggat caacctgcgg 1200
agacagggca agaccaaaga cggcgttgtg cagagcctgg gcttcctgaa ccagcagatc 1260
atcctgcaga aagagttctt catctgcctg ctgatgttca tcaagcggtg gaagccagcc 1320
gccacaaaga cacctccacc actgattctg tggcctcagg ccgctcctgt gcacaagaag 1380
agaggcctgt tcagcctgtt cttctcccac tgcctgtgcc accagatgaa gtgcctgacc 1440
gccgtggatt gtctgcaggc cttctgggac atgatgattc gcaagatcca gaagcggcgg 1500
agaaccgcca accggctgaa aaagaaatac ctggtgcagt gtaccaacct gagcgtgccc 1560
atgatgctga ccatcctgat ctggaagcgg gtgttcatcc tcctgctgag cgacaagaag 1620
tgtctgagag tcagatgcgg cggatggctg tgtggctgga cacctagagg caagaacaag 1680
aagcggagaa agctgcggcc caagcacctg aagaaaacca gcgccaaggt gtccgtgatc 1740
accatgaagc tctgggagaa gcacttcaag ggcctgaact ggaacctggt cgtgtggatt 1800
ctgaacctga agatgatgtg gctcaagaag tccaccaaga gcagacagag cagcccattc 1860
ctggctcgga gctggaatac catgcaatgg aacaacaaga aaatggccat gaccgtgatc 1920
gctggcgccc accactgtca gtacaagctg acctacacca aagtgtggaa gatgaattgg 1980
aagaaaatga tgatcggctc ccagcacctc ctgtttagcc cactggattc aagcccactg 2040
cagttgctgc tgcaccctca cggcaagaga tgcaaccctt gctgcagact gacctggatg 2100
agcagagagt gggaaaagcg gaagcagatc ctcggcggag gcggcaagta caaagagtac 2160
ttcctgaagc ggattctcat ccggaaggct atgacagtgc tggccggcga taagaaaggc 2220
ctgggaagat tcatgagatg cgtgcagagc gagacaaagg ccgtgtctct gcagctgcct 2280
ctcggccgaa gaaagtccgg cgtgatgaag tgttgggatc tgtgccccag actggacttt 2340
caccccagat ctagctctgg cggcgagaag ctgaagcact gtttcaaagc ctggggcctg 2400
tgcttcttct acctgctgta cttcgagaag aaacggcccg agtggctgag cgttgaccct 2460
cctggatctg tctggattct gccctgcatg gacctggacg gaatgctgac agtgatcggc 2520
cagggactcg tgggcatgac ccctagagat ctgggaacag tggctggcgc caccgcacag 2580
attcagaggc ctatccaggt gcagacaggc ggcagactgt tcctgattca cctgagaaag 2640
gtggacaccc accatctgca ggtcgtgacc aagaccgtga cagccacaac agctgacggc 2700
cagaggatgc ggagactgaa gtgcaaggcc tgtcggctga gatgggccag acctgaacct 2760
gctgcacagg ctcctccaaa gagccacttt ccacctcatc ctagcggccc ctccagaacc 2820
tctagcctgc agctcagacc cattcctcca cacctgagac acccactgct gctgaaggga 2880
aagaacagcc cctgctgcca aaagaaactg cgggtgcaga accagggcca tctgctgatg 2940
atcctgctgc ataacgccag acagcccagc aggcctaccg gaagaacccc taccacaaga 3000
ctgatggccc ctgtgggcag cgtgatgtct tgtagcctgc tgacccagcc atctcctgcc 3060
agcgcatgta caatgccacc actcctgcat ccacagtggg ccccacatag tgctggactg 3120
tctccaggcg cttgcagacc tgcctgtacc tgcatcagca tgaccaccat ctccagagcc 3180
acatggcggc tgagaatccc aagcctgagg aagtaccggc agaacatcga gatcacccct 3240
cagcggtcta aggcccaggt ttccgtgtac agcggcaatc tgctgagctt ctccagacgg 3300
ggcatgaaga gtagcgtgcg gctgaagaac agcatccctc acgtgccaaa agccaccgcc 3360
gctcactctg tgacagtgaa gctgcagtac ctgtttttcc tgaccgtgtg cggcttcgac 3420
cgggtgttcc tggttaagat ctgcaagaag aagctgctcc tcaagctgct gagaggcccc 3480
agacggaaag tgctgatggt gctttggctg cccgccaacc agagtctgca gaaaagccag 3540
gtgttccagt gggtgctgcg gaccgaaacc tacatggaaa tgcactacgg ccatcaggcc 3600
cctcaggtgg ccatgctgcc taaactgctg tgtagacaga tgctccccac tctgtccaca 3660
ctccagcaga ggcatcctca gggaccttgt cctcctcctg tgacacctct gagagtgcag 3720
tctgtgctgc tcctgggagt gcctcagaca gccgctttta gcggccggat tctgcaccag 3780
ccagaaatgg ccgccatgag actgatgccc aagttcctga actccaccaa cagctggtgg 3840
acagtggccc ctagatgtcc tagaagcgcc gtggacatta gccccggacc tacatctcct 3900
agcctggcct cttgtgcctc tgtggccatt ggaaaactgg cactgctggg cgcatctgcc 3960
ccttgtggcg cagctggtgc tagagaggct ggaagatttg ccgtgctggg caccatggtt 4020
atgaagggtg ctgccgcagc ctcctgtcag tctcctccat ctccaagaga gacaacccct 4080
agcagcgacg ccaccagacg gacaagacct attgccgctc agagcaaaaa gaccatgact 4140
gccgccggac tgacccctcg gagaaacctg cagagaaatc tgaaggtcct gggcgccaag 4200
aagatcacct tcctgagaaa cagcagacgc gccacaccta cctctaaggg cagcctgaga 4260
agaaagtacc tgagagtgaa catccgcaag ctcatctgga ccaagcagcg gagcttcctg 4320
tctctgttcc ccaagctgag agccaccgag cagatgacca atgtgggatg cctgctcaag 4380
aaaagcagcc aattgcggcg gagctggcgc aatgtgtccc ggatcagcaa catggaacac 4440
aggctgacca tggacagcgc cctgagcctg acaaagagag agggccctga gacaagcgag 4500
aagaagagga agttgcct 4518
<210> 1170
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide 4D
<400> 1170
aacagaaaga ccagaaaggc cgccagagag aagcaccgca agaccgacga caagaagaag 60
aagtccaccg aaaagaccaa gaacgccaag aagatgccct tccagcagcg gcctcctctg 120
cagcctgtta acctggatct gcagcaccag cgcagacgca aaaagaagaa agacaaggtc 180
gaaatccgga atcggagccc taaggccaat agcaccgagt gtcagggcga gcacagcaga 240
gagcagaacc tgctgaatct ggtgcagctg aaccctcaca gccctcacca cagaaaggac 300
gaagaggacc accagaagcg gcaccaccac cacaatcaaa agaaaatgag cgtgcgggct 360
agcgtgtcct tctggacact tttgccaaca accggcgtgc ggacaagagg ctctccactg 420
agactgacac tgtggcctcc acgggttcca ccttctccac ctcttgctct gggccccaga 480
atgcagctgt gtacccagct cgcccggttc ttccctatca cacctcctgt gtggcacatc 540
ctgggacctc agagacacac acctcaggct cctctgaggc tgtggtcttg gtgcggcaca 600
agccagacct acttcggcag cagaccatct ccttgcctga gctggtccag cagaattgtg 660
gcccctggac acgccctgag ctgtcggact agaagaagat ggtctagcaa gcggtggatc 720
ttctccaacc agctgaccgt gcagatgctg tgcctgccaa tcacacaccc attcgcctct 780
cagcctctgg gacaagagat gcccaacaac acccagatcc ggctgctgaa gccctgcaga 840
gtgaacgccg tggaagaact gcacagcagg cggatgtctg tgcggatcgt gaagaactgg 900
gtgtcctgct gttacgtgcg gctgtctgct gtgggcctgt ctacttggag tgccctggac 960
gaggaaaaga agaacggccg gatcagcagc ctgaaaaaga aagtgaatgc ctgcagctcc 1020
ctgatcctga gcttccagcg cgtgaaaacc ggcatggaaa tcctgctgtg gattctgctg 1080
aagatggaaa ttcagatctt caagatttgc ctgggcgaga tgcagctctg cggccaggcc 1140
tttggaagct ttagcgccga tttcagcgcc cctcagatca ttaagaagat gaagaaacgg 1200
atcatggtgc acgagctgaa gaagaatctg ctgctgccta tgtgctccag cctggctctg 1260
ccaacaggcc tgacatctct gatcctgcct agcagcgatc tggccgtgct gatctctagc 1320
tccaccagcc actttctgat gcggagccct gtgctgccaa gcagcagact gacttgtgcc 1380
tctccacagc tgccccggat gtggacttgg tctagctggc tgaagaacga gggcaacaac 1440
cactggccta gagtggaaat gcctaccggc tggctgctcg tcggctacaa caccagaaac 1500
acagcccaga atcctcggct gcagcagcac ctgaaacact ggcagcagtg caccagagcc 1560
agatggtgtc aagagccctg tcagaccctg accttcttcc atttcttctt ctttttcaaa 1620
acggtgtccc tgtgttgccc cggctggtct aaaggacaac ctcctccacc tggcctgaag 1680
ccttctagcc tggcttctca ggtggccaga accacaggcg tgtaccagca cgtgtggctg 1740
atctgtttcg tgtttttcgt gtgtgtggaa accggcttct gtcacgtggc ccaagtggga 1800
ctcgagagac tggtgtctct gtccggcatc accgacgtga accattgggc ccagcctaag 1860
ccatctccta gcaaaggcac cggcatgaac agacccatcg gcctgagagt tggcaaaggc 1920
gtgtgggcca gactgatcct ggccatgaca ctgaccctga acggcatggc caagaagtcc 1980
cagcagcctc tgcaggtcgt gctgagactg ggaaacctgc ctccattctt cagaggcagc 2040
gaggtgccct ttcctagacc ttgtcggacc aagcctgcct gcacaagcaa ggcctggact 2100
cccagaaaac tcgtggggag agccgtgcgg agaaagggat ctccactctg ggattgctcc 2160
accacaacag gcacacacca cggatgcctg tgggagatcc catctgtgac cctgctggcc 2220
catcctagaa ccgcctctat caccctgcct accacaagcc tgaagggctc cagaaccagc 2280
tgctgcccta gatctcaccc cagactgcct aggaccaaat ggcccctgca gtgtctgctg 2340
cacagcctgg gaacaaccgg aacactcgtt tgggaaaggg gcgtcctgca gatgagatcc 2400
ctcgaagccc attgtccact gcagaccttc catctgcacc actgcaggac ccagcctagc 2460
tcttgtcctc ctgcctggat tctgtaccaa ggacagtgga gcggagccgt cgtgggactt 2520
agacctgtgg ctcaccatct gcctagacct atccagggcc tgcactgtcc acaggcacct 2580
catcaacctg ctctgagctg gggaaaatgg cccgtgggaa tgacaggccc tgccagatgt 2640
tgcagatggc ccagacggtg ccagaagaag gttccatcag cctctccatg gggcctcgtg 2700
ctcaaaaaga accggaaaca gatgctgaac cagaagtgtc tggccccttt tagagagagc 2760
accctgggca atttctggat gaagctgctc cagctgcctg tcgtgatcaa cctgaagaga 2820
ctgcagaagt tcaacctgca cctgtgctac taccacagcc agagcaacag aaacaagagc 2880
cgccagatgg aatccctggg catgaagttg cagtcccaga aatcccagca ccactgtgcc 2940
ctgcggaaga tcgagtgggc cacaaagttg tctctcggcg gaaaagccgg accacaggct 3000
caagagaagg ccacctctcg gattctgaac ctgcaagtgc tcaagaagat cctgcggagc 3060
tttatgaagc tgtaccactc tctggtcatg tgcctgcggc tgaggaccaa gctggaaaag 3120
gctctgagcg ccctgttcat ctggccccag cacagctaca agcccctgtt ctttcacggc 3180
gacctgtgcg agtggggagg ccaggctcat agacagcgga actggctgaa aaactggaag 3240
cggttcaagc ttaaaaagaa gtacatccag aagaagaagc agaagtctaa caagatcatc 3300
tgcaagggcc accgcatcac catcatctgt atcaagaata tgttcctgca gcgcaagggc 3360
ttcctgaacc tgagccacgt ggaaaagttc tgtagaggcg gccctagcgc cagcgataga 3420
tgctgttctt gtagccccag cggcttcagt gccggcagag gaagatgtcc tgttcagggc 3480
tgtctgaggc cccacagagt tcaactgctg agaagatggg gccctggctc tcctgctgga 3540
cagaggctgt ctaagggctt tcagctgctc cgttggtggg gaccaggatc tcctgctcct 3600
gagcctagaa agggcccatt tccaccacct gatcctccat ggcctgtgac cgctgtgaca 3660
gtgatggctg gatctgtgcc tagtgctcag tctgtggacg ccctggaatc tcctggacct 3720
ctggctctcg aaggacctag cagccctaga aacctgcttt ggagagagat gagcatcttt 3780
ctgcccggca tcttcaccgc caagaaaagc cccaccagct tttgctgcaa tatcctgaac 3840
agcctgccaa gctctatgga aatcgccgtg ctgcaagagg acagcaaaaa gatgacccag 3900
aagggccaag ccttcggctc cctgtgtcag cttgtgtccg ctgacttctc tgcccctcaa 3960
gtgacccggc tgcggagcct gaatcatctg ctgatcacct acacacccca catctgcaga 4020
cacaccctgc tgacccctga caccagatgg atctttagca atcagctgca gacagtccag 4080
atgctctgtc tgcctccact gaagcagggc gagagaatca tttggcccct cggcggcttt 4140
cagatcccca acttcttttg gagcctcggc atcggacaca ctggcgcctg gtggcatact 4200
ggaaggcgga gaagagaatg gggcggcagc accgtgtcta gaagccctct gtggatcagc 4260
tccatgatct acctgagagg catggccttc gccagcgaca gcagcatcag aaccaccaga 4320
gtgtcctggt gcagaagatg cggcgccaaa agcgctgccg ccagctctat tgaagctctg 4380
accgctctgt ttacctgccg gaccgccagc atcagcgtga acatcagcac cctgatgtcc 4440
atcctggaag cacttaagaa gaaacccaga gacatctgcc gcatcagctg ccggtgtaga 4500
cgcgagtaca gagtgactat g 4521
<210> 1171
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 1C
<400> 1171
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Ser Thr Arg
20 25 30
Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly Pro Trp Arg
35 40 45
Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys Leu Arg Leu
50 55 60
Arg Asn Thr Ser Pro Thr Glu Ile Gln Leu Thr Met Asn Asp Ser Lys
65 70 75 80
His Lys Leu Glu Ser Pro Ala Leu Lys Gln Val Ser Pro Ala Ser Pro
85 90 95
Pro Thr Gln Gln Pro Gln Thr Pro Gln Asp Ser Arg Gln Val Leu Ala
100 105 110
Ala Ser Ser Pro Gly His Pro Leu Gly Pro Gly Asp Cys Pro Arg Thr
115 120 125
Met Ala Gly Pro Ser Ala Ser Leu His Pro Ala Ser Gly Arg Ala Ser
130 135 140
Arg Lys Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg Ala Gly Gly Pro
145 150 155 160
Ala Gly Trp Ala Arg Gln Ala Met Thr Leu Lys Ala Leu Val Lys Thr
165 170 175
Trp Thr Gln Phe Arg Asn Tyr Pro Arg Val Gly Ala Gly Thr Gly Gly
180 185 190
Gly Pro Ala Cys Val Pro Val Ala Glu Ala Ser Thr Gly Ala Trp Thr
195 200 205
Ala Glu Gly Ala Ala Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro Cys
210 215 220
Arg Gln Leu Pro Ala Ser Ser Pro Thr Lys Cys Glu Ile Cys Val Lys
225 230 235 240
Arg Arg Arg Arg Arg Lys Arg Ser Ser Gln Ser Arg Ser Pro Val Pro
245 250 255
Lys Lys Arg Glu Arg Met Met Leu Pro Val Arg Ala Arg Thr Ala Arg
260 265 270
Ser Ala Leu Pro Gln Gly Arg Ala Pro Leu Glu Gly Met Leu Leu Pro
275 280 285
Arg Ala Leu Pro Ser Leu Leu Ser Arg Met Pro Ala Arg Arg Glu Ser
290 295 300
Arg Phe Trp Leu Ala Leu Gln Ala Leu Gly Leu Arg Pro Pro His Leu
305 310 315 320
Pro Ser Cys His Pro Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro His
325 330 335
Gln Ala Pro Phe Asp Lys Lys Gly Phe Val Ile Leu Ser Lys Gly Lys
340 345 350
Lys Arg Arg Lys Glu Ile Arg Arg Met Thr Arg Arg Thr Met Thr Thr
355 360 365
Thr Lys Met Met Met Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg
370 375 380
Arg Arg Met Thr Met Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr
385 390 395 400
Cys Leu Thr Pro Arg Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln
405 410 415
Thr Ile Ser Gln Arg Arg Pro Ile Gln Thr Pro Pro Gly Thr Ser Leu
420 425 430
Ala Ile Trp Gly Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro
435 440 445
Leu His Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg Ile
450 455 460
Ala Lys Lys Arg Ile Lys Leu Arg Arg Asn Thr Leu Ala Ile Arg Phe
465 470 475 480
Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val Thr Ala Ala Pro Ser
485 490 495
Gly Gln Tyr Phe Ser Ser Phe Phe Tyr Thr Ser Asp Arg Thr Lys Cys
500 505 510
Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile Thr Leu Ile Thr
515 520 525
Pro Gln Asp Pro His Leu Asp Pro Val Cys His Pro His Arg Arg Pro
530 535 540
Gly Trp Lys Gly His His Arg Val Val Phe Ser His His Pro Ser Gly
545 550 555 560
Ser Thr Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly Gly Arg Arg
565 570 575
Glu Lys Lys Gly Cys Arg Glu Met Pro Ser Ser Trp Ser Ser Ser Gly
580 585 590
Arg Thr Ala Asp Lys Lys Asn Val Arg Ser Arg Thr Arg Leu Thr Leu
595 600 605
Thr Gly Thr Arg Ser Ser Gly Thr Arg Ala Ser Pro Ser Ala Val Cys
610 615 620
Leu Cys Cys Trp Thr Cys Pro Ser Arg Ser Phe Pro Ala Ala Ser Pro
625 630 635 640
Ser Gly Leu Arg Ala Pro Val Gly Ala Gln Ala Pro Pro Glu Val Thr
645 650 655
Leu Arg Ala Ser Cys Ala Ser Ser Ala Ser Lys Ala Cys Ala Gly Leu
660 665 670
Trp Pro Trp Gly Ala Gln Val Arg Asn Lys Val Arg Gln Asn Phe Lys
675 680 685
Arg Asn Leu Ala Lys Lys Thr Leu Thr Asn Ala Leu Arg Ser Met Pro
690 695 700
Lys Ser Arg Asn Gln Val Leu Phe Arg Arg Asn Leu Thr Pro Ser Gln
705 710 715 720
Leu Arg Thr Leu Ala Pro Pro Tyr Met Leu Leu Pro Gln Ser Leu Ser
725 730 735
Gln Ser Leu Ser Arg Lys Gln Ile Pro Ser Gln Ser Met Leu Val Thr
740 745 750
Ala Phe Phe Leu Leu Asp Ile Ile Leu Arg Ser Leu Leu Tyr Ser Arg
755 760 765
Met Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro Asp Tyr Phe
770 775 780
Val Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser Phe Pro Val
785 790 795 800
Gly Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys Ser Cys Thr
805 810 815
Ser His Ser Asn Pro Trp Ser Gln Ser Phe Lys Lys Lys Lys Pro Leu
820 825 830
Thr Phe Ser Pro Ser Val Pro Met Ser Leu Ala Cys Ser Ile Thr Val
835 840 845
Ser Phe Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val Ser Ser Ile
850 855 860
Ser His Trp Arg Lys Arg Lys Arg Glu Lys Arg Ser Gln Lys Ser Arg
865 870 875 880
Gln Asn His Leu Gln Leu Lys Ser Cys Arg Arg Lys Ile Ser Asn Trp
885 890 895
Ser Lys Leu Arg Ser Pro Trp Ile Phe Tyr Pro Arg Leu Lys Thr Phe
900 905 910
Gly Val Pro Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser Leu Ser Thr
915 920 925
Met Met Ile Ile Ser Thr Thr Arg Gln Glu Cys Gly Arg Arg Ala Ser
930 935 940
Val Pro Cys Arg Pro Met Ile Gly Ser Ala Arg Pro Gly Pro Trp Arg
945 950 955 960
Thr Ser Ala Met Pro Ser Ala Met Gly Val Ala Leu Pro Thr Ser Cys
965 970 975
Glu Ser Gly Arg Ser Pro Pro Ala Thr Gly Gly Arg Met Pro Gly Ser
980 985 990
Gln Ser Ile Met Met Ser Trp Met Pro Pro Leu Ala Pro Cys Ala Ala
995 1000 1005
Cys Pro Cys Ser Pro Ala Pro Thr Leu Cys Pro Ala His Pro Ala
1010 1015 1020
Arg Ala Pro Thr Ala Val Pro Ala Phe Thr Pro Leu Ser Ala His
1025 1030 1035
Pro Val Pro Val Leu Ser Gly Cys His Leu Ala Val Arg Thr Ser
1040 1045 1050
Met Leu Thr Leu Leu Pro Met Arg His Pro His Arg Ser Pro Pro
1055 1060 1065
Thr Ser Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu Pro Arg Ala
1070 1075 1080
Ser Leu Arg Ala Thr Val Pro Arg His Ser Ser Val Leu Ala Thr
1085 1090 1095
Gly Leu His Leu His Arg Gln Ile Ser Leu Pro Leu Arg Gly Phe
1100 1105 1110
Leu Leu His Gln Pro Leu Pro Gly Gln His Leu Trp Leu Ser His
1115 1120 1125
Arg Leu Arg Leu Arg Leu Pro Arg Thr Gly Glu Lys Asn Asp Leu
1130 1135 1140
Gln Leu Phe Val Met Ser Asp Thr Thr Tyr Lys Ile Tyr Trp Thr
1145 1150 1155
Val Ile Leu Leu Asn Pro Cys Gly Asn Leu His Leu Lys Thr Thr
1160 1165 1170
Ser Leu Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr Cys Arg Met
1175 1180 1185
Trp Trp Leu Lys Leu Ala Pro Leu Gln Val Thr Thr Thr Leu Lys
1190 1195 1200
Leu Ile Leu Val Met Leu Glu Ile Val Thr Glu Glu Ala Lys Lys
1205 1210 1215
Ser Met Lys Arg Ser Arg Arg Ser Lys Ile Glu Ala Ser Pro Ile
1220 1225 1230
Gly Ser Ile Met Lys Lys Lys Asp Ser Thr Ile Phe Ile Asn Gln
1235 1240 1245
Gln Leu Lys Trp Thr Pro His Ile Leu Lys Ser Ala Ser Val Ser
1250 1255 1260
Lys Lys Arg Leu Pro Lys Leu Asn Gly Ile Trp Glu Val Met Pro
1265 1270 1275
Arg Thr Leu Glu Gly Cys Ile Ser Val Lys Asp His Arg Thr Ser
1280 1285 1290
Gln Asn His Ser Lys Cys Ile Thr Glu Cys Val Arg Thr Ala Leu
1295 1300 1305
Asn Gln Arg Lys Val Val Lys Asn Pro Ser Gln Pro Val Pro Leu
1310 1315 1320
Arg Asn Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr Arg Ser Cys
1325 1330 1335
Ser Ile Ser Leu Lys Lys Ser Leu Glu Lys Met Pro Leu Met Asn
1340 1345 1350
Ala Lys Lys Met Glu Asp Met Ile Trp Glu Ser Asn Met Gly Gly
1355 1360 1365
Asn Arg Ser Ile Cys Leu Thr Arg Leu Pro Cys Lys Val Thr Glu
1370 1375 1380
Ser Ser Gln Arg Pro Pro Arg Ser Ile Leu Ser Leu Ala Ser Arg
1385 1390 1395
Ala Gly Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly Met Ser
1400 1405 1410
Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg Cys Pro
1415 1420 1425
Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn Gly Trp His
1430 1435 1440
Arg Ser Gly Leu Arg Ala Gln Gln Pro Ser Leu Pro Gly Pro Cys
1445 1450 1455
Ala Ser Leu Leu Ser Thr Leu Ser Gln Pro Pro Pro Gln Ala Pro
1460 1465 1470
Ser Gln Val Trp Thr Ala Ala Thr Leu Arg Cys Pro Ala Val Pro
1475 1480 1485
Ala Ala Ala Cys Pro Pro Ile Val Phe Phe Leu Ala Pro Tyr Phe
1490 1495 1500
Pro Thr Pro Leu Ser Ile Ser Arg Pro Thr Ser Arg Ala Arg Gln
1505 1510 1515
Ser Cys Cys Leu Pro Gly Leu Thr His Pro Ala His Gln Pro Leu
1520 1525 1530
Gly Ser Met Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1172
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 2C
<400> 1172
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Arg Gln Ile
20 25 30
Asn Arg Arg Lys Leu Gln Arg Lys Lys Arg Arg Lys Lys Arg Glu Asp
35 40 45
His Cys Gly Leu Arg Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser
50 55 60
His Leu Ile Ala His Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe
65 70 75 80
His Pro Arg Leu Leu Thr Arg Lys Lys Pro Gly Lys Asn Pro Arg Arg
85 90 95
Lys Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln Lys Pro Ser Gln Lys
100 105 110
Asn His Leu Tyr Gly Lys Gly Leu Thr His Pro Val Pro Leu Lys Arg
115 120 125
Thr Leu Gln Asn Lys Arg Asn Lys Asn Ile Lys Arg Val Asn Gln Lys
130 135 140
Lys Gly Asn Ile Lys Arg Lys Ser Ile Leu Leu His Leu Ile Val Leu
145 150 155 160
Asn Ser Pro Glu Ser Asn Leu Gln Ala His Pro Gln Val Pro Ala Leu
165 170 175
Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg Gly Pro Leu Thr Ser Ala
180 185 190
Pro Ser Ala Gln Gln Ser Leu Thr Phe Leu Pro Ser Arg Phe Pro Trp
195 200 205
Gly Pro Pro Pro Leu His Trp Asn Ser Ala Tyr Leu Gly Arg Thr Leu
210 215 220
Leu Val Thr Cys Ile Leu Tyr His Arg Trp Ile Val Thr Ser Met Cys
225 230 235 240
Gln Ser Gln Arg Trp Leu Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu
245 250 255
Met Trp Thr Gln Trp Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln
260 265 270
Glu Arg Gly Cys Ser Ser Trp Leu Met Lys Gln Thr Trp Met Lys Ser
275 280 285
Trp Ser Leu Arg Asp Pro Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser
290 295 300
Thr Arg Val Leu Trp Met Pro Thr Ser Thr Val Gly Ala Leu Arg Ala
305 310 315 320
Thr Ala Pro Ala Thr Ala Ala Pro Gln Ala Gln Thr Pro His Trp Arg
325 330 335
Ala Ala Thr Thr Ser Ser Met Ser Ser Ser Pro Arg Ala Glu Pro Thr
340 345 350
Ser Ser Ser Ser Trp Ala Thr Cys Trp Pro Arg Cys Cys Ser Ser Ser
355 360 365
Cys Tyr Trp Ser Leu Ser Ser Trp Pro Pro Ala Gly Ala Ala Glu Ala
370 375 380
Thr Asn Thr Arg Thr Arg Ser Arg Glu Ser Gln Arg Gly Arg Met Leu
385 390 395 400
Thr Trp Arg Ser Ser Leu Trp Leu Gln Gly Thr Arg Cys Phe Thr Gly
405 410 415
Val Arg Thr Ser Ser Arg His Pro Ser Trp Pro Trp Thr Arg Cys Leu
420 425 430
Arg Met Arg Pro Pro Arg Ser Asn Ser Arg Lys Lys Leu Leu Glu Asp
435 440 445
Met Lys Gln Asn Gly Phe Thr Arg Tyr Lys Lys Arg Gly Val Ile Ala
450 455 460
Trp Arg Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro
465 470 475 480
Gln Ala Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu Leu Val Gln
485 490 495
Ser Arg Cys Ser Leu Met Glu Gln Ile Pro His Leu Lys Ser Trp Trp
500 505 510
Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys Lys Val Ser
515 520 525
Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys Gly Ile Cys
530 535 540
Trp Lys Trp Pro Val Thr Val Ala Ala Leu Ile Leu Ile Gln His Gly
545 550 555 560
Gly Ile Phe Thr Phe Arg Phe Trp Val Glu Lys Leu Ser Trp Asn Ile
565 570 575
Cys Lys Asn Leu Ser Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu Leu
580 585 590
Tyr Val Tyr Ile Ile Glu Thr Asn Val Phe Val Leu Asn Leu Phe His
595 600 605
Val Pro Val Asn Gln Ile Phe Met Met Ala Phe Tyr Leu Lys Tyr Thr
610 615 620
Glu Lys Ala Trp Val Met Glu Leu Glu Trp Leu Ile Gln Gln Gln Cys
625 630 635 640
Tyr Gln Leu Leu Leu Ala His Met Tyr Gly Phe Ser Thr Tyr Gly Thr
645 650 655
Gln Lys Gly Glu Cys Val Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu
660 665 670
Phe Ile Leu Lys Gln Pro Leu Asp Leu Lys Ile Ser Lys Thr Phe Met
675 680 685
Ser Arg Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys Lys Val Lys
690 695 700
Ala Ser Pro Gln Ile Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr
705 710 715 720
Ile Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys Asn Leu Pro Leu
725 730 735
Glu Asn Thr Gln Ile Pro Arg Thr Ser Pro Leu Trp Lys Ile Thr Met
740 745 750
Val Leu Thr Tyr Pro Asn Cys Val Val His Val Leu Met Phe Val Leu
755 760 765
Phe Lys Ala Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly Ile Tyr Pro
770 775 780
Pro Ser Thr Cys Ser Leu Pro Cys Arg Gly Ile Arg Met Cys Ala Leu
785 790 795 800
Ser His Pro Ser Phe Tyr Ile Ser Ser Thr Val Cys Phe Leu Ser Lys
805 810 815
His Cys Met Thr Ala Cys Thr Arg Glu Lys Ile Ile Asn Pro Thr Ile
820 825 830
Ser Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Gly His Arg Glu Gly
835 840 845
Ser Glu Ser Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro Trp Leu
850 855 860
Pro Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly Phe Gln Trp Gly
865 870 875 880
Glu Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly Asn Ser Val Ile
885 890 895
Val His Lys Ile Val Leu Val Phe Leu Lys Ser Leu Ser Ser Tyr Asn
900 905 910
Cys Glu Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile Glu Phe Ala
915 920 925
Val Leu Lys Leu Leu Asn Met Asp Leu Ala Ser Pro Gln Ile Met Gln
930 935 940
Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg Arg Met Gln Asn Leu
945 950 955 960
Asp Asn Leu Gly Val Pro Trp Pro Leu Leu Pro Gly Ala Ala Pro Pro
965 970 975
His Arg Leu Leu Gly Pro Ser Arg Trp Ile Leu Phe His Val Arg Asn
980 985 990
Ile Val Tyr Gly Ile Gln Val Met Leu Cys Arg Arg Arg Asn Ser Arg
995 1000 1005
Lys Gln Ser Gln Val Gln Leu Ala Ile Gln Val Leu Leu Val Asp
1010 1015 1020
Lys His Lys Tyr Phe Leu Phe Gly Pro Tyr Pro Ile Ser Glu Gly
1025 1030 1035
Leu Thr Met Thr Thr Gly Arg Asn Ile Asn Ser Asn Ser Leu Met
1040 1045 1050
Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu Cys His His Ala Ile
1055 1060 1065
Met His Arg Lys Met Thr Ser Pro His Phe Arg Leu Phe Ser Ser
1070 1075 1080
Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala Leu Cys Lys
1085 1090 1095
Phe Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile Phe Gln Lys Lys
1100 1105 1110
Gly His Met Ile Phe Ser Pro Lys Phe Phe Leu Thr Phe Ser Gln
1115 1120 1125
Arg Thr Leu Glu Ser Ala Gly Leu Phe Pro Trp Leu His Thr Gln
1130 1135 1140
Cys Arg Asn Lys Lys Thr Lys Leu Trp Phe Ser Leu Ile Asn Ile
1145 1150 1155
His His Arg Lys Asn Pro Leu Leu Pro Met Arg Met Ser Arg Thr
1160 1165 1170
Pro Pro Arg Arg Val Cys Gly Ser Pro Pro Leu His Leu Cys Gln
1175 1180 1185
Pro Leu Arg Gly Gly Lys Lys Arg Ser Lys Phe Ala Phe Trp Lys
1190 1195 1200
Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr Gly Cys Trp
1205 1210 1215
Gly Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly Thr
1220 1225 1230
Pro Arg Gly Asp Trp Lys Arg His Pro Pro Arg Arg Glu Leu Ser
1235 1240 1245
Leu Glu Pro Trp Ile Pro Tyr Leu His Gln Gln Lys Thr Gln Arg
1250 1255 1260
Lys Arg Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile Gln
1265 1270 1275
Glu Lys Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe Glu
1280 1285 1290
Ala Cys Arg Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile Thr
1295 1300 1305
Leu Phe Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn Val Leu
1310 1315 1320
Cys Val Arg Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys Arg
1325 1330 1335
Lys Met Lys Arg Asn Gln Val Ala Ser Pro Gln Ile Met Gln Arg
1340 1345 1350
Leu Phe Ile Lys Gly Tyr Gln Asn Asn His Phe Thr Phe His Leu
1355 1360 1365
Gln Asn Phe Ala Phe Phe Ser Ser Phe Gly Asn Asn Lys Tyr Ile
1370 1375 1380
Asn Ile Leu Thr Arg Ala Phe Ile His Thr Pro Arg Ser Pro Gly
1385 1390 1395
Cys Ser Val Tyr Ala Asn Met Cys Trp Arg Lys Met Gln Ser Leu
1400 1405 1410
Asn His Pro Ser Arg Leu Thr Asn Cys His Pro Ala Trp Leu Ser
1415 1420 1425
Pro Ile Ser Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe His Val
1430 1435 1440
Leu Ala Leu Glu Val Thr Phe Pro Pro Gly Thr Ala Met Pro Gln
1445 1450 1455
Met Gln Leu Gln Ala Leu Ala Met Trp Glu Lys Gly Trp Asp Lys
1460 1465 1470
Gln Glu Lys Lys Ser Arg Lys Leu Met Ser Ser Cys Leu Glu Lys
1475 1480 1485
Lys Ala Thr Trp Met Arg Arg Thr Pro Gly Thr Ser Leu Gln Cys
1490 1495 1500
Tyr Leu Asn Thr His Pro Cys Thr Met Leu Leu Pro Gln Gly Ile
1505 1510 1515
Pro Ser Leu Asn Ala Gln Trp Met Phe Leu Arg Ile Gly Tyr Pro
1520 1525 1530
Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540
<210> 1173
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 3C
<400> 1173
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Pro Ile Pro
20 25 30
Pro His Leu Arg His Pro Leu Leu Leu Lys Asn Lys Lys Arg Arg Lys
35 40 45
Leu Arg Pro Lys Ser Arg Lys Lys Gly His Thr Lys Asn Arg Arg Lys
50 55 60
Ala Lys Arg Lys Pro Gln Ile Arg Asn Ser Arg Arg Ala Thr Pro Thr
65 70 75 80
Ser Lys Gly Ser Leu Arg Arg Lys Tyr Leu Arg Val Gly Ala Ala Ala
85 90 95
Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr Thr Pro Ser Ser
100 105 110
Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln Ser Lys Lys Thr
115 120 125
Met Thr Ala Ala Gly Leu Thr Pro Ser Gln Lys Lys Asp Pro Ala Gly
130 135 140
Lys Leu Lys Lys Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe
145 150 155 160
Ser Arg Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn Cys Thr Asn
165 170 175
Leu Ser Val Pro Met Met Leu Thr Ile Leu Ile Trp Lys Arg Val Phe
180 185 190
Ile Leu Leu Leu Ser Asp Lys Lys Ser Ile Pro His Val Pro Lys Ala
195 200 205
Thr Ala Ala His Ser Val Thr Val Lys Leu Gln Ser Arg Arg Asn Arg
210 215 220
Arg Tyr Arg Lys Ile Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala Ser
225 230 235 240
Asn Gly Met Glu Ala Cys Gly Thr His Pro Thr Pro Arg Leu Ser Val
245 250 255
Ser Val Ile Thr Met Lys Leu Trp Glu Lys His Phe Lys Gly Leu Asn
260 265 270
Trp Asn Leu Val Val Trp Ile Leu Asn Leu Lys Met Met Leu Lys Lys
275 280 285
Lys Tyr Leu Val Gln Arg Glu Trp Glu Lys Arg Lys Gln Ile Leu Gly
290 295 300
Gly Gly Gly Lys Tyr Lys Glu Tyr Phe Leu Lys Arg Ile Leu Ile Arg
305 310 315 320
Lys Ala Met Thr Val Leu Ala Gly Asp Lys Lys Gly Leu Gly Arg Phe
325 330 335
Met Arg Cys Val Gln Ser Glu Thr Lys Ala Val Ser Leu Gln Leu Pro
340 345 350
Leu Gly Arg Met Asp Leu Asp Gly Met Leu Thr Val Ile Gly Gln Gly
355 360 365
Leu Val Gly Met Thr Pro Arg Asp Leu Gly Thr Val Ala Gly Ala Thr
370 375 380
Ala Gln Ile Gln Arg Pro Ile Gln Val Gln Thr Gly Gly Arg Leu Arg
385 390 395 400
Gly Pro Arg Arg Lys Val Leu Met Val Leu Trp Leu Pro Ala Asn Gln
405 410 415
Ser Leu Gln Lys Ser Gln Val Phe Gln Trp Val Leu Arg Thr Glu Leu
420 425 430
Pro Leu Thr Phe Ser Thr Leu Leu Trp Asp Ser Arg His Asp Leu Pro
435 440 445
Arg Met Leu Pro Ile Ser Ser Pro Leu His Arg Pro Gln Met Pro Phe
450 455 460
Trp Thr Cys Thr Phe Pro Ala Thr Thr Trp Gly Thr Trp Glu Thr Pro
465 470 475 480
Ser Thr Trp Gly Trp Arg Thr Phe Ala Arg Gln Pro Ser Arg Pro Thr
485 490 495
Gly Arg Thr Pro Thr Thr Arg Leu Met Ala Pro Val Gly Ser Val Met
500 505 510
Ser Cys Ser Leu Leu Thr Gln Pro Ser Pro Ala Ser Ala Cys Thr Met
515 520 525
Pro Pro Leu Leu His Pro Gln Trp Ala Pro His Ser Ala Gly Leu Ser
530 535 540
Pro Gly Ala Cys Arg Pro Ala Cys Thr Cys Ile Ser Met Thr Thr Ile
545 550 555 560
Ser Arg Ala Thr Trp Arg Arg Asn Leu Gln Arg Asn Leu Lys Val Leu
565 570 575
Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln Gln Asn Thr Arg
580 585 590
Ser Thr Asn Leu Glu Lys Asn Pro Ser Leu Lys Lys Gln Ser Gln Arg
595 600 605
Arg Gly Lys Leu Ser Leu Thr Thr Leu Ser Phe Val Leu Ile Glu Glu
610 615 620
Leu Leu Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg Asn Val Ser
625 630 635 640
Arg Ile Ser Asn Ile Arg Lys Leu Ile Trp Thr Lys Gln Arg Ser Phe
645 650 655
Leu Ser Leu Phe Pro Lys Leu Arg Ala Thr Glu Gln Met Thr Asn Val
660 665 670
Gly Cys Arg Leu Asp Phe His Pro Arg Ser Ser Ser Gly Asp Arg Val
675 680 685
Phe Leu Val Lys Ile Gln Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn
690 695 700
Thr Met Gln Trp Asn Asn Lys Lys Met Ala Met Thr Val Ile Ala Gly
705 710 715 720
Ala His His Cys Gln Tyr Lys Leu Thr Tyr Thr Lys Val Trp Lys Met
725 730 735
Asn Trp Lys Lys Met Met Ile Gly Ser Gln His Leu Leu Phe Ser Pro
740 745 750
Leu Asp Ser Ser Pro Leu Gln Leu Leu Leu His Pro His Gly Lys Arg
755 760 765
Cys Asn Pro Cys Cys Arg Leu Thr Trp Met Ser His Leu Asn Arg Lys
770 775 780
Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu Thr Met Met Met Ser
785 790 795 800
Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile Pro Leu Pro Ser Pro
805 810 815
Arg Gln His Leu Leu Pro Gln Tyr Pro Leu His Pro Pro Pro Pro Cys
820 825 830
Leu Leu Leu Leu His His Arg His His Leu Ala Phe Leu Glu Met Ala
835 840 845
Cys Ser Ser Gln His Thr His Ser Ile Lys Ile Trp Ile Ser Phe Ser
850 855 860
His Glu Thr Met Ser Leu Ser Asn Ile Leu Met Lys Phe Arg Leu Thr
865 870 875 880
Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala Arg Gly
885 890 895
Gly Thr Thr Ile Gly Glu Val Thr Ser Ser Leu Phe Phe Ser His Cys
900 905 910
Leu Cys Val Ala Pro Arg Cys Pro Arg Ser Ala Val Asp Ile Ser Pro
915 920 925
Gly Pro Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser Val Ala Ile Gly
930 935 940
Lys Leu Ala Leu Leu Gly Ala Ser Ala Pro Cys Gly Ala Ala Gly Ala
945 950 955 960
Arg Glu Ala Gly Arg Phe Ala Val Leu Gly Thr Met Val Met Lys Asn
965 970 975
Met Glu His Arg Leu Thr Met Asp Ser Ala Leu Ser Leu Thr Lys Arg
980 985 990
Glu Gly Pro Glu Thr Gly Pro Val Tyr Tyr Val Cys Asn Arg Met Asn
995 1000 1005
Val Ser Ser Val Leu Lys Pro Phe Leu Phe Thr Val Pro Ile Glu
1010 1015 1020
Asp Met Arg Glu Cys Thr Leu Gly Arg Asn Arg Met Asn Val Ser
1025 1030 1035
Ser Val Leu Lys Pro Cys Leu Ile Pro Val Pro Ile Cys Lys Lys
1040 1045 1050
Lys Leu Leu Leu Lys Leu Leu Arg Gly Ala Ser Ser Ser Thr Ser
1055 1060 1065
Arg Asp Ser Arg Ser Phe Phe Thr Ser Ala His Pro Ser Arg Pro
1070 1075 1080
Cys Arg Met Arg Leu Tyr Gln Met Leu Gln Lys Gln Cys Cys Tyr
1085 1090 1095
Asn Leu Val Ile Lys His Pro Leu Ile Phe Arg Ile Asn Leu Arg
1100 1105 1110
Arg Gln Gly Lys Thr Lys Asp Gly Val Val Gln Ser Leu Gly Phe
1115 1120 1125
Leu Asn Gln Gln Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys Leu
1130 1135 1140
Leu Met Phe Ile Lys Arg Trp Lys Pro Ala Ala Thr Lys Lys Gly
1145 1150 1155
Lys Asn Ser Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn Gln
1160 1165 1170
Gly His Leu Leu Met Ile Leu Leu His Asn Arg Gly Pro Pro Leu
1175 1180 1185
His Thr Arg Phe Glu Lys Lys Arg Pro Glu Trp Leu Ser Arg Lys
1190 1195 1200
Ser Gly Val Met Lys Cys Trp Asp Leu Cys Pro Ala Phe Ser Gly
1205 1210 1215
Arg Ile Leu His Gln Pro Glu Met Ala Ala Met Arg Leu Met Pro
1220 1225 1230
Lys Phe Leu Asn Ser Thr Asn Ser Trp Trp Thr Val His Lys Lys
1235 1240 1245
Arg Gly Leu Phe His Gln Met Lys Cys Leu Thr Ala Val Asp Cys
1250 1255 1260
Leu Gln Ala Phe Trp Asp Met Ser Glu Lys Lys Arg Lys Leu Pro
1265 1270 1275
Met Ile Arg Lys Ile Gln Lys Arg Arg Arg Thr Ala Asn Arg Asn
1280 1285 1290
Ile Glu Ile Thr Pro Gln Arg Ser Lys Ala His Leu Lys Lys Thr
1295 1300 1305
Ser Ala Lys Gly Ala Lys Lys Ile Thr Phe Leu Cys Leu Arg Val
1310 1315 1320
Arg Cys Gly Gly Trp Leu Cys Gly Trp Thr Pro Arg Gly Trp Leu
1325 1330 1335
Lys Lys Ser Thr Lys Ser Arg Leu Cys Phe Phe Tyr Leu Leu Tyr
1340 1345 1350
Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe Thr Pro Pro Pro Leu
1355 1360 1365
Ile Leu Trp Pro Gln Ala Ala Pro Gly Glu Lys Leu Lys His Cys
1370 1375 1380
Phe Lys Ala Trp Gly Val Asp Pro Pro Gly Ser Val Trp Ile Leu
1385 1390 1395
Pro Cys Phe Leu Ile His Leu Arg Lys Val Asp Thr His His Leu
1400 1405 1410
Gln Val Val Thr Lys Thr Val Thr Ala Thr Thr Ala Asp Gly Gln
1415 1420 1425
Arg Met Arg Arg Leu Lys Cys Lys Ala Cys Arg Leu Arg Trp Ala
1430 1435 1440
Arg Pro Glu Pro Ala Ala Gln Ala Pro Pro Lys Ser His Phe Pro
1445 1450 1455
Pro His Pro Ser Gly Pro Ser Arg Thr Ser Ser Leu Gln Leu Arg
1460 1465 1470
Thr Tyr Met Glu Met His Tyr Gly His Gln Ala Pro Gln Val Ala
1475 1480 1485
Met Leu Pro Lys Leu Leu Cys Arg Gln Met Leu Pro Thr Leu Ser
1490 1495 1500
Thr Leu Gln Gln Arg His Pro Gln Gly Pro Cys Pro Pro Pro Val
1505 1510 1515
Thr Pro Leu Arg Val Gln Ser Val Leu Leu Leu Gly Val Pro Gln
1520 1525 1530
Thr Ala Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1174
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 4C
<400> 1174
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Asp Ser Lys
20 25 30
Lys Met Thr Gln Lys Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys
35 40 45
His Arg Lys Thr Asp Asn Leu Asp Leu Gln His Gln Arg Arg Arg Lys
50 55 60
Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro Lys Ala Asn
65 70 75 80
Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn Leu Leu Asn
85 90 95
Leu Val Gln Leu Asn Pro His Ser Pro His His Arg Lys Asp Glu Glu
100 105 110
Asp His Gln Lys Arg His His His His Asn Gln Lys Lys Met Ser Val
115 120 125
Asn Glu Gly Asn Asn His Trp Pro Arg Val Glu Met Pro Thr Gly Trp
130 135 140
Leu Leu Val Gly Tyr Asn Thr Arg Asn Thr Ala Gln Asn Pro Arg Leu
145 150 155 160
Gln Gln His Leu Lys His Trp Gln Gln Cys Thr Arg Ala Arg Trp Cys
165 170 175
Gln Glu Pro Cys Gln Thr Leu Thr Phe Phe His Phe Phe Phe Phe Phe
180 185 190
Lys Thr Val Ser Leu Cys Cys Pro Gly Trp Ser Lys Gly Gln Pro Pro
195 200 205
Pro Pro Gly Leu Lys Pro Ser Ser Leu Ala Ser Gln Val Ala Arg Thr
210 215 220
Thr Gly Val Tyr Gln His Val Trp Leu Ile Cys Phe Val Phe Phe Val
225 230 235 240
Cys Val Glu Thr Gly Phe Cys His Val Ala Gln Val Gly Leu Glu Arg
245 250 255
Leu Val Ser Leu Ser Gly Ile Thr Asp Val Asn His Trp Ala Gln Pro
260 265 270
Lys Pro Ser Pro Ser Lys Gly Thr Gly Met Asn Arg Pro Ile Gly Leu
275 280 285
Arg Val Gly Lys Gly Val Trp Ala Arg Leu Trp Leu Lys Asn Trp Lys
290 295 300
Arg Phe Lys Leu Lys Lys Lys Tyr Thr Gly Met Glu Ile Leu Leu Trp
305 310 315 320
Ile Leu Leu Lys Met Glu Ile Gln Ile Phe Lys Ile Cys Leu Gly Glu
325 330 335
Met Gln Leu Cys Leu Lys Lys Lys Val Asn Ala Cys Ser Asn Ala Lys
340 345 350
Lys Met Pro Phe Gln Cys Arg Cys Arg Arg Glu Tyr Arg Val Thr Met
355 360 365
Ile Gln Lys Lys Lys Gln Lys Ser Pro Leu Phe Phe His Gly Asp Leu
370 375 380
Cys Arg Pro Ser Pro Cys Leu Ser Trp Ser Ser Arg Ile Val Ala Pro
385 390 395 400
Gly His Ala Leu Ser Cys Arg Thr Arg Arg Arg Trp Ser Ser Lys Met
405 410 415
Ala Lys Lys Ser Gln Gln Pro Leu Cys Arg Gly Gly Pro Ser Ala Ser
420 425 430
Asp Arg Cys Cys Ser Cys Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly
435 440 445
Arg Cys Pro Val Gln Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu
450 455 460
Arg Arg Trp Gly Pro Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly
465 470 475 480
Phe Gln Leu Leu Arg Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro
485 490 495
Arg Lys Gly Pro Phe Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala
500 505 510
Val Thr Val Met Ala Gly Ser Val Pro Ser Ala Gln Ser Val Asp Ala
515 520 525
Leu Glu Ser Pro Gly Pro Leu Ala Leu Glu Gly Pro Ser Ser Pro Arg
530 535 540
Asn Leu Leu Trp Arg Glu Met Ser Ile Phe Leu Pro Gly Ile Phe Asn
545 550 555 560
Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn Arg Asn Lys Ser Arg
565 570 575
Gln Met Glu Ser Leu Gly Met Lys Leu Gln Ile Thr His Pro Phe Ala
580 585 590
Ser Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln Ile Arg Leu
595 600 605
Leu Lys Pro Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp Phe Ser Ala
610 615 620
Pro Gln Gln Ala Pro Leu Arg Leu Trp Ser Trp Cys Gly Thr Ser Gln
625 630 635 640
Thr Tyr Phe Gly Ser Ile Glu Ala Leu Thr Ala Leu Phe Thr Cys Arg
645 650 655
Thr Ala Ser Ile Ser Val Asn Ile Ser Thr Leu Met Ser Ile Leu Glu
660 665 670
Ala Ile Leu Ala Met Thr Leu Thr Leu Asn Gly Ser Pro Leu Trp Asp
675 680 685
Cys Ser Thr Thr Thr Gly Thr His His Gly Cys Leu Trp Glu Ile Pro
690 695 700
Ser Val Thr Leu Leu Ala Thr Ala Lys Lys Ser Pro Thr Ser Phe Cys
705 710 715 720
Cys Gln Arg Pro Pro Leu Gln Pro Val Glu Glu Lys Lys Asn Gly Arg
725 730 735
Ile Ser Ser Val Pro Pro Ser Pro Pro Leu Ala Leu Gly Pro Arg Met
740 745 750
Gln Leu Cys Thr Gln Leu Ala Arg Phe Phe Pro Ile Thr Pro Pro Val
755 760 765
Trp His Ile Leu Gly Pro Gln Arg His Thr Pro Leu Leu Thr Pro Asp
770 775 780
Thr Arg Trp Ile Phe Ser Asn Gln Leu Gln Thr Val Gln Met Leu Cys
785 790 795 800
Leu Pro Pro Leu Lys Gln Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly
805 810 815
Phe Gln Ile Pro Asn Phe Phe Trp Ser Leu Gly Ile Gly His Thr Gly
820 825 830
Ala Trp Trp His Thr Gly Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr
835 840 845
Val Ser Arg Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly
850 855 860
Met Ala Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg Val Ser Trp
865 870 875 880
Cys Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser Asp Lys Lys
885 890 895
Lys Lys Ser Thr Glu Lys Thr Lys Asn Lys Ile Ile Cys Lys Gly His
900 905 910
Arg Ile Thr Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro Phe Phe
915 920 925
Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys Cys Gln
930 935 940
Lys Lys Val Pro Ser Ala Ser Pro Trp Gly Leu His Pro Arg Thr Ala
945 950 955 960
Ser Ile Thr Leu Pro Thr Thr Ser Leu Lys Gly Ser Arg Thr Ser Cys
965 970 975
Cys Pro Arg Ser His Pro Arg Leu Pro Arg Thr Lys Trp Pro Leu Gln
980 985 990
Cys Leu Leu His Ser Leu Gly Thr Thr Gly Thr Leu Val Trp Glu Arg
995 1000 1005
Gly Val Leu Gln Met Arg Ser Leu Glu Ala His Cys Pro Leu Gln
1010 1015 1020
Thr Phe His Leu His His Cys Arg Thr Gln Pro Ser Ser Cys Pro
1025 1030 1035
Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp Ser Gly Ala Val Val
1040 1045 1050
Gly Leu Arg Pro Val Ala His His Leu Pro Arg Pro Ile Gln Gly
1055 1060 1065
Leu His Cys Pro Gln Ala Pro His Gln Pro Ala Leu Ser Trp Gly
1070 1075 1080
Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys Arg Trp
1085 1090 1095
Pro Arg Arg Met Cys Ser Ser Leu Ala Leu Pro Thr Gly Leu Thr
1100 1105 1110
Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala Val Leu Ile Ser Ser
1115 1120 1125
Ser Thr Ser His Phe Leu Met Arg Ser Pro Val Leu Pro Ser Ser
1130 1135 1140
Arg Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met Trp Thr Trp
1145 1150 1155
Ser Ser Trp Leu Lys Glu Trp Gly Gly Gln Ala His Arg Gln Arg
1160 1165 1170
Asn Cys Arg Val Asn Ala Val Glu Glu Leu His Ser Arg Arg Met
1175 1180 1185
Ser Val Arg Ile Val Lys Asn Trp Val Ser Cys Cys Tyr Val Arg
1190 1195 1200
Leu Ser Ala Val Gly Leu Ser Thr Trp Ser Ala Leu Asp Ser Leu
1205 1210 1215
Ile Leu Ser Phe Gln Arg Val Lys Thr Ser Arg Ile Leu Asn Leu
1220 1225 1230
Gln Val Leu Lys Lys Ile Leu Arg Ser Phe Met Lys Leu Tyr His
1235 1240 1245
Ser Leu Val Met Cys Leu Arg Leu Arg Thr Lys Leu Glu Lys Ala
1250 1255 1260
Leu Ser Ala Leu Phe Ile Trp Pro Gln His Ser Tyr Lys Gly Gln
1265 1270 1275
Ala Phe Gly Ser Leu Cys Gln Leu Val Ser Ala Asp Phe Ser Ala
1280 1285 1290
Pro Gln Val Thr Arg Leu Arg Ser Leu Asn His Leu Leu Ile Arg
1295 1300 1305
Trp Ile Phe Ser Asn Gln Leu Thr Val Gln Met Leu Cys Leu Pro
1310 1315 1320
Ile Ile Lys Lys Met Lys Lys Arg Ile Met Val His Val Leu Lys
1325 1330 1335
Lys Asn Arg Lys Gln Ile Ile Cys Ile Lys Asn Met Phe Leu Gln
1340 1345 1350
Arg Lys Gly Phe Leu Asn Leu Ser His Val Glu Lys Phe Arg Glu
1355 1360 1365
Ser Thr Leu Gly Asn Phe Trp Met Lys Leu Leu Gln Leu Pro Pro
1370 1375 1380
Ala Cys Thr Ser Lys Ala Trp Thr Pro Arg Lys Leu Val Gly Arg
1385 1390 1395
Ala Val Arg Arg Lys Gly Val Val Ile Asn Leu Lys Arg Leu Gln
1400 1405 1410
Lys Phe Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro Thr Thr
1415 1420 1425
Gly Val Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp Pro
1430 1435 1440
Pro Arg Ser Gln Lys Ser Gln His His Cys Ala Leu Arg Lys Ile
1445 1450 1455
Glu Trp Ala Thr Lys Leu Ser Leu Gly Gly Lys Ala Gly Pro Gln
1460 1465 1470
Ala Gln Glu Lys Ala Asn Ile Leu Asn Ser Leu Pro Ser Ser Met
1475 1480 1485
Glu Ile Ala Val Leu Gln Glu Met Leu Asn Gln Lys Cys Leu Ala
1490 1495 1500
Pro Phe Glu Leu Lys Lys Asn Leu Leu Leu Pro Thr Tyr Thr Pro
1505 1510 1515
His Ile Cys Arg His Thr Leu Lys Lys Lys Pro Arg Asp Ile Cys
1520 1525 1530
Arg Ile Ser Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1175
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 1C
<400> 1175
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Ser Thr Arg Arg Glu Met Pro Ser
225 230 235 240
Gln Ala Thr Pro Ser Pro Pro Gly Pro Trp Arg Ala Ala Leu Gly Lys
245 250 255
Glu Val Lys Arg Ser Gln Ser Lys Leu Arg Leu Arg Asn Thr Ser Pro
260 265 270
Thr Glu Ile Gln Leu Thr Met Asn Asp Ser Lys His Lys Leu Glu Ser
275 280 285
Pro Ala Leu Lys Gln Val Ser Pro Ala Ser Pro Pro Thr Gln Gln Pro
290 295 300
Gln Thr Pro Gln Asp Ser Arg Gln Val Leu Ala Ala Ser Ser Pro Gly
305 310 315 320
His Pro Leu Gly Pro Gly Asp Cys Pro Arg Thr Met Ala Gly Pro Ser
325 330 335
Ala Ser Leu His Pro Ala Ser Gly Arg Ala Ser Arg Lys Thr Trp Gln
340 345 350
Arg Arg Leu Arg Ala Cys Arg Ala Gly Gly Pro Ala Gly Trp Ala Arg
355 360 365
Gln Ala Met Thr Leu Lys Ala Leu Val Lys Thr Trp Thr Gln Phe Arg
370 375 380
Asn Tyr Pro Arg Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys Val
385 390 395 400
Pro Val Ala Glu Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly Ala Ala
405 410 415
Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro Cys Arg Gln Leu Pro Ala
420 425 430
Ser Ser Pro Thr Lys Cys Glu Ile Cys Val Lys Arg Arg Arg Arg Arg
435 440 445
Lys Arg Ser Ser Gln Ser Arg Ser Pro Val Pro Lys Lys Arg Glu Arg
450 455 460
Met Met Leu Pro Val Arg Ala Arg Thr Ala Arg Ser Ala Leu Pro Gln
465 470 475 480
Gly Arg Ala Pro Leu Glu Gly Met Leu Leu Pro Arg Ala Leu Pro Ser
485 490 495
Leu Leu Ser Arg Met Pro Ala Arg Arg Glu Ser Arg Phe Trp Leu Ala
500 505 510
Leu Gln Ala Leu Gly Leu Arg Pro Pro His Leu Pro Ser Cys His Pro
515 520 525
Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro His Gln Ala Pro Phe Asp
530 535 540
Lys Lys Gly Phe Val Ile Leu Ser Lys Gly Lys Lys Arg Arg Lys Glu
545 550 555 560
Ile Arg Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys Met Met Met
565 570 575
Met Arg Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg Arg Met Thr Met
580 585 590
Met Thr Arg Arg Thr Leu Leu Thr Lys Lys Thr Cys Leu Thr Pro Arg
595 600 605
Thr Ser Ala Ala Thr Lys Ala Leu Pro Arg Gln Thr Ile Ser Gln Arg
610 615 620
Arg Pro Ile Gln Thr Pro Pro Gly Thr Ser Leu Ala Ile Trp Gly Arg
625 630 635 640
Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro Leu His Arg Trp Leu
645 650 655
Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg Ile Ala Lys Lys Arg Ile
660 665 670
Lys Leu Arg Arg Asn Thr Leu Ala Ile Arg Phe Ile Ser Ala Pro Gln
675 680 685
Pro Ser Ser Ser Thr Val Thr Ala Ala Pro Ser Gly Gln Tyr Phe Ser
690 695 700
Ser Phe Phe Tyr Thr Ser Asp Arg Thr Lys Cys Glu Ile Cys Val Lys
705 710 715 720
Asn Thr Ala Ile Leu Ala Ile Thr Leu Ile Thr Pro Gln Asp Pro His
725 730 735
Leu Asp Pro Val Cys His Pro His Arg Arg Pro Gly Trp Lys Gly His
740 745 750
His Arg Val Val Phe Ser His His Pro Ser Gly Ser Thr Lys Ser His
755 760 765
Trp Gln Gln Arg Glu Arg Gly Gly Gly Arg Arg Glu Lys Lys Gly Cys
770 775 780
Arg Glu Met Pro Ser Ser Trp Ser Ser Ser Gly Arg Thr Ala Asp Lys
785 790 795 800
Lys Asn Val Arg Ser Arg Thr Arg Leu Thr Leu Thr Gly Thr Arg Ser
805 810 815
Ser Gly Thr Arg Ala Ser Pro Ser Ala Val Cys Leu Cys Cys Trp Thr
820 825 830
Cys Pro Ser Arg Ser Phe Pro Ala Ala Ser Pro Ser Gly Leu Arg Ala
835 840 845
Pro Val Gly Ala Gln Ala Pro Pro Glu Val Thr Leu Arg Ala Ser Cys
850 855 860
Ala Ser Ser Ala Ser Lys Ala Cys Ala Gly Leu Trp Pro Trp Gly Ala
865 870 875 880
Gln Val Arg Asn Lys Val Arg Gln Asn Phe Lys Arg Asn Leu Ala Lys
885 890 895
Lys Thr Leu Thr Asn Ala Leu Arg Ser Met Pro Lys Ser Arg Asn Gln
900 905 910
Val Leu Phe Arg Arg Asn Leu Thr Pro Ser Gln Leu Arg Thr Leu Ala
915 920 925
Pro Pro Tyr Met Leu Leu Pro Gln Ser Leu Ser Gln Ser Leu Ser Arg
930 935 940
Lys Gln Ile Pro Ser Gln Ser Met Leu Val Thr Ala Phe Phe Leu Leu
945 950 955 960
Asp Ile Ile Leu Arg Ser Leu Leu Tyr Ser Arg Met Cys Leu Val Gln
965 970 975
Ile Pro Thr His Thr Trp Glu Pro Asp Tyr Phe Val Ser Leu Pro Met
980 985 990
Met Phe Ser Trp Ala Thr Gln Ser Phe Pro Val Gly Ala Val Phe Leu
995 1000 1005
Thr Arg Pro Ala Ile Pro Cys Cys Ser Cys Thr Ser His Ser Asn
1010 1015 1020
Pro Trp Ser Gln Ser Phe Lys Lys Lys Lys Pro Leu Thr Phe Ser
1025 1030 1035
Pro Ser Val Pro Met Ser Leu Ala Cys Ser Ile Thr Val Ser Phe
1040 1045 1050
Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val Ser Ser Ile Ser
1055 1060 1065
His Trp Arg Lys Arg Lys Arg Glu Lys Arg Ser Gln Lys Ser Arg
1070 1075 1080
Gln Asn His Leu Gln Leu Lys Ser Cys Arg Arg Lys Ile Ser Asn
1085 1090 1095
Trp Ser Lys Leu Arg Ser Pro Trp Ile Phe Tyr Pro Arg Leu Lys
1100 1105 1110
Thr Phe Gly Val Pro Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser
1115 1120 1125
Leu Ser Thr Met Met Ile Ile Ser Thr Thr Arg Gln Glu Cys Gly
1130 1135 1140
Arg Arg Ala Ser Val Pro Cys Arg Pro Met Ile Gly Ser Ala Arg
1145 1150 1155
Pro Gly Pro Trp Arg Thr Ser Ala Met Pro Ser Ala Met Gly Val
1160 1165 1170
Ala Leu Pro Thr Ser Cys Glu Ser Gly Arg Ser Pro Pro Ala Thr
1175 1180 1185
Gly Gly Arg Met Pro Gly Ser Gln Ser Ile Met Met Ser Trp Met
1190 1195 1200
Pro Pro Leu Ala Pro Cys Ala Ala Cys Pro Cys Ser Pro Ala Pro
1205 1210 1215
Thr Leu Cys Pro Ala His Pro Ala Arg Ala Pro Thr Ala Val Pro
1220 1225 1230
Ala Phe Thr Pro Leu Ser Ala His Pro Val Pro Val Leu Ser Gly
1235 1240 1245
Cys His Leu Ala Val Arg Thr Ser Met Leu Thr Leu Leu Pro Met
1250 1255 1260
Arg His Pro His Arg Ser Pro Pro Thr Ser Cys Pro Pro Leu Leu
1265 1270 1275
Glu Ala Phe Pro Leu Pro Arg Ala Ser Leu Arg Ala Thr Val Pro
1280 1285 1290
Arg His Ser Ser Val Leu Ala Thr Gly Leu His Leu His Arg Gln
1295 1300 1305
Ile Ser Leu Pro Leu Arg Gly Phe Leu Leu His Gln Pro Leu Pro
1310 1315 1320
Gly Gln His Leu Trp Leu Ser His Arg Leu Arg Leu Arg Leu Pro
1325 1330 1335
Arg Thr Gly Glu Lys Asn Asp Leu Gln Leu Phe Val Met Ser Asp
1340 1345 1350
Thr Thr Tyr Lys Ile Tyr Trp Thr Val Ile Leu Leu Asn Pro Cys
1355 1360 1365
Gly Asn Leu His Leu Lys Thr Thr Ser Leu Arg Arg Ala Arg Pro
1370 1375 1380
Thr Ser Cys Ser Thr Cys Arg Met Trp Trp Leu Lys Leu Ala Pro
1385 1390 1395
Leu Gln Val Thr Thr Thr Leu Lys Leu Ile Leu Val Met Leu Glu
1400 1405 1410
Ile Val Thr Glu Glu Ala Lys Lys Ser Met Lys Arg Ser Arg Arg
1415 1420 1425
Ser Lys Ile Glu Ala Ser Pro Ile Gly Ser Ile Met Lys Lys Lys
1430 1435 1440
Asp Ser Thr Ile Phe Ile Asn Gln Gln Leu Lys Trp Thr Pro His
1445 1450 1455
Ile Leu Lys Ser Ala Ser Val Ser Lys Lys Arg Leu Pro Lys Leu
1460 1465 1470
Asn Gly Ile Trp Glu Val Met Pro Arg Thr Leu Glu Gly Cys Ile
1475 1480 1485
Ser Val Lys Asp His Arg Thr Ser Gln Asn His Ser Lys Cys Ile
1490 1495 1500
Thr Glu Cys Val Arg Thr Ala Leu Asn Gln Arg Lys Val Val Lys
1505 1510 1515
Asn Pro Ser Gln Pro Val Pro Leu Arg Asn Asp Gly Ile Thr Asn
1520 1525 1530
Gly Asn Asp Ser Thr Arg Ser Cys Ser Ile Ser Leu Lys Lys Ser
1535 1540 1545
Leu Glu Lys Met Pro Leu Met Asn Ala Lys Lys Met Glu Asp Met
1550 1555 1560
Ile Trp Glu Ser Asn Met Gly Gly Asn Arg Ser Ile Cys Leu Thr
1565 1570 1575
Arg Leu Pro Cys Lys Val Thr Glu Ser Ser Gln Arg Pro Pro Arg
1580 1585 1590
Ser Ile Leu Ser Leu Ala Ser Arg Ala Gly Gln Phe Pro Val Trp
1595 1600 1605
Arg Arg Thr Ser Arg Gly Met Ser Leu Gln Trp Lys Ser Gly Asn
1610 1615 1620
Ala Cys Thr Pro Leu Arg Cys Pro Ser Arg Ser Pro Ala Thr Phe
1625 1630 1635
Leu Thr Ala Leu Asn Gly Trp His Arg Ser Gly Leu Arg Ala Gln
1640 1645 1650
Gln Pro Ser Leu Pro Gly Pro Cys Ala Ser Leu Leu Ser Thr Leu
1655 1660 1665
Ser Gln Pro Pro Pro Gln Ala Pro Ser Gln Val Trp Thr Ala Ala
1670 1675 1680
Thr Leu Arg Cys Pro Ala Val Pro Ala Ala Ala Cys Pro Pro Ile
1685 1690 1695
Val Phe Phe Leu Ala Pro Tyr Phe Pro Thr Pro Leu Ser Ile Ser
1700 1705 1710
Arg Pro Thr Ser Arg Ala Arg Gln Ser Cys Cys Leu Pro Gly Leu
1715 1720 1725
Thr His Pro Ala His Gln Pro Leu Gly Ser Met Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1176
<211> 1744
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 2C
<400> 1176
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Arg Gln Ile Asn Arg Arg Lys Leu
225 230 235 240
Gln Arg Lys Lys Arg Arg Lys Lys Arg Glu Asp His Cys Gly Leu Arg
245 250 255
Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser His Leu Ile Ala His
260 265 270
Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe His Pro Arg Leu Leu
275 280 285
Thr Arg Lys Lys Pro Gly Lys Asn Pro Arg Arg Lys Thr Trp Lys Met
290 295 300
Arg Lys Lys Tyr Ala Gln Lys Pro Ser Gln Lys Asn His Leu Tyr Gly
305 310 315 320
Lys Gly Leu Thr His Pro Val Pro Leu Lys Arg Thr Leu Gln Asn Lys
325 330 335
Arg Asn Lys Asn Ile Lys Arg Val Asn Gln Lys Lys Gly Asn Ile Lys
340 345 350
Arg Lys Ser Ile Leu Leu His Leu Ile Val Leu Asn Ser Pro Glu Ser
355 360 365
Asn Leu Gln Ala His Pro Gln Val Pro Ala Leu Ala Pro Gln Ala Trp
370 375 380
Trp Pro Ala Arg Arg Gly Pro Leu Thr Ser Ala Pro Ser Ala Gln Gln
385 390 395 400
Ser Leu Thr Phe Leu Pro Ser Arg Phe Pro Trp Gly Pro Pro Pro Leu
405 410 415
His Trp Asn Ser Ala Tyr Leu Gly Arg Thr Leu Leu Val Thr Cys Ile
420 425 430
Leu Tyr His Arg Trp Ile Val Thr Ser Met Cys Gln Ser Gln Arg Trp
435 440 445
Leu Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu Met Trp Thr Gln Trp
450 455 460
Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln Glu Arg Gly Cys Ser
465 470 475 480
Ser Trp Leu Met Lys Gln Thr Trp Met Lys Ser Trp Ser Leu Arg Asp
485 490 495
Pro Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser Thr Arg Val Leu Trp
500 505 510
Met Pro Thr Ser Thr Val Gly Ala Leu Arg Ala Thr Ala Pro Ala Thr
515 520 525
Ala Ala Pro Gln Ala Gln Thr Pro His Trp Arg Ala Ala Thr Thr Ser
530 535 540
Ser Met Ser Ser Ser Pro Arg Ala Glu Pro Thr Ser Ser Ser Ser Trp
545 550 555 560
Ala Thr Cys Trp Pro Arg Cys Cys Ser Ser Ser Cys Tyr Trp Ser Leu
565 570 575
Ser Ser Trp Pro Pro Ala Gly Ala Ala Glu Ala Thr Asn Thr Arg Thr
580 585 590
Arg Ser Arg Glu Ser Gln Arg Gly Arg Met Leu Thr Trp Arg Ser Ser
595 600 605
Leu Trp Leu Gln Gly Thr Arg Cys Phe Thr Gly Val Arg Thr Ser Ser
610 615 620
Arg His Pro Ser Trp Pro Trp Thr Arg Cys Leu Arg Met Arg Pro Pro
625 630 635 640
Arg Ser Asn Ser Arg Lys Lys Leu Leu Glu Asp Met Lys Gln Asn Gly
645 650 655
Phe Thr Arg Tyr Lys Lys Arg Gly Val Ile Ala Trp Arg Arg Ala Thr
660 665 670
Phe Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro Gln Ala Arg Leu Cys
675 680 685
Leu Ile Val Ser Arg Thr Leu Leu Leu Val Gln Ser Arg Cys Ser Leu
690 695 700
Met Glu Gln Ile Pro His Leu Lys Ser Trp Trp Cys Thr Arg Gly Gly
705 710 715 720
Gly Lys Arg Lys Lys Lys Met Cys Lys Val Ser Gly Gly Cys Thr Ala
725 730 735
Cys Val Glu Arg Cys Pro Trp Lys Gly Ile Cys Trp Lys Trp Pro Val
740 745 750
Thr Val Ala Ala Leu Ile Leu Ile Gln His Gly Gly Ile Phe Thr Phe
755 760 765
Arg Phe Trp Val Glu Lys Leu Ser Trp Asn Ile Cys Lys Asn Leu Ser
770 775 780
Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu Leu Tyr Val Tyr Ile Ile
785 790 795 800
Glu Thr Asn Val Phe Val Leu Asn Leu Phe His Val Pro Val Asn Gln
805 810 815
Ile Phe Met Met Ala Phe Tyr Leu Lys Tyr Thr Glu Lys Ala Trp Val
820 825 830
Met Glu Leu Glu Trp Leu Ile Gln Gln Gln Cys Tyr Gln Leu Leu Leu
835 840 845
Ala His Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys Gly Glu Cys
850 855 860
Val Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile Leu Lys Gln
865 870 875 880
Pro Leu Asp Leu Lys Ile Ser Lys Thr Phe Met Ser Arg Ser His Leu
885 890 895
Asp Phe Ser Pro Tyr Trp Met Lys Lys Val Lys Ala Ser Pro Gln Ile
900 905 910
Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr Ile Arg Arg Lys Trp
915 920 925
Gln Ile Arg His Val Leu Lys Asn Leu Pro Leu Glu Asn Thr Gln Ile
930 935 940
Pro Arg Thr Ser Pro Leu Trp Lys Ile Thr Met Val Leu Thr Tyr Pro
945 950 955 960
Asn Cys Val Val His Val Leu Met Phe Val Leu Phe Lys Ala Asp Gln
965 970 975
Ser Glu Ser Ser Leu Ser Ser Gly Ile Tyr Pro Pro Ser Thr Cys Ser
980 985 990
Leu Pro Cys Arg Gly Ile Arg Met Cys Ala Leu Ser His Pro Ser Phe
995 1000 1005
Tyr Ile Ser Ser Thr Val Cys Phe Leu Ser Lys His Cys Met Thr
1010 1015 1020
Ala Cys Thr Arg Glu Lys Ile Ile Asn Pro Thr Ile Ser Cys Pro
1025 1030 1035
Phe Gln Ser Pro Thr Lys Arg Leu Gly His Arg Glu Gly Ser Glu
1040 1045 1050
Ser Asp Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro Trp Leu Pro
1055 1060 1065
Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly Phe Gln Trp Gly
1070 1075 1080
Glu Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly Asn Ser Val
1085 1090 1095
Ile Val His Lys Ile Val Leu Val Phe Leu Lys Ser Leu Ser Ser
1100 1105 1110
Tyr Asn Cys Glu Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile
1115 1120 1125
Glu Phe Ala Val Leu Lys Leu Leu Asn Met Asp Leu Ala Ser Pro
1130 1135 1140
Gln Ile Met Gln Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg
1145 1150 1155
Arg Met Gln Asn Leu Asp Asn Leu Gly Val Pro Trp Pro Leu Leu
1160 1165 1170
Pro Gly Ala Ala Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp
1175 1180 1185
Ile Leu Phe His Val Arg Asn Ile Val Tyr Gly Ile Gln Val Met
1190 1195 1200
Leu Cys Arg Arg Arg Asn Ser Arg Lys Gln Ser Gln Val Gln Leu
1205 1210 1215
Ala Ile Gln Val Leu Leu Val Asp Lys His Lys Tyr Phe Leu Phe
1220 1225 1230
Gly Pro Tyr Pro Ile Ser Glu Gly Leu Thr Met Thr Thr Gly Arg
1235 1240 1245
Asn Ile Asn Ser Asn Ser Leu Met Thr Asn Cys Leu Phe Ser Pro
1250 1255 1260
Ile Phe Leu Cys His His Ala Ile Met His Arg Lys Met Thr Ser
1265 1270 1275
Pro His Phe Arg Leu Phe Ser Ser Lys Ile Pro His Pro Gln Val
1280 1285 1290
Pro Ser Val Val Ala Leu Cys Lys Phe Leu Ala Asn Gly Leu Trp
1295 1300 1305
Phe Asn Leu Ile Phe Gln Lys Lys Gly His Met Ile Phe Ser Pro
1310 1315 1320
Lys Phe Phe Leu Thr Phe Ser Gln Arg Thr Leu Glu Ser Ala Gly
1325 1330 1335
Leu Phe Pro Trp Leu His Thr Gln Cys Arg Asn Lys Lys Thr Lys
1340 1345 1350
Leu Trp Phe Ser Leu Ile Asn Ile His His Arg Lys Asn Pro Leu
1355 1360 1365
Leu Pro Met Arg Met Ser Arg Thr Pro Pro Arg Arg Val Cys Gly
1370 1375 1380
Ser Pro Pro Leu His Leu Cys Gln Pro Leu Arg Gly Gly Lys Lys
1385 1390 1395
Arg Ser Lys Phe Ala Phe Trp Lys Pro Pro Ser Gln Gly Ile Ser
1400 1405 1410
Ser Cys Leu Met Thr Gly Cys Trp Gly Ser Cys Gly Arg Ala Cys
1415 1420 1425
Ser Cys Gly Arg Gly Cys Gly Thr Pro Arg Gly Asp Trp Lys Arg
1430 1435 1440
His Pro Pro Arg Arg Glu Leu Ser Leu Glu Pro Trp Ile Pro Tyr
1445 1450 1455
Leu His Gln Gln Lys Thr Gln Arg Lys Arg Met Lys Thr Gly Ala
1460 1465 1470
Ile Gln Glu Lys Gly Ala Ile Gln Glu Lys Gly Ala Met Thr Lys
1475 1480 1485
Arg Ile Cys Val Val Asn Phe Glu Ala Cys Arg Glu Met Glu Ser
1490 1495 1500
Leu Ser Ala Pro Glu Lys Ile Thr Leu Phe Glu Ala His Met Ala
1505 1510 1515
Arg Cys Thr Ser Ile Asn Val Leu Cys Val Arg Ala Ser Leu Ile
1520 1525 1530
Glu Lys Leu Met Lys Glu Lys Arg Lys Met Lys Arg Asn Gln Val
1535 1540 1545
Ala Ser Pro Gln Ile Met Gln Arg Leu Phe Ile Lys Gly Tyr Gln
1550 1555 1560
Asn Asn His Phe Thr Phe His Leu Gln Asn Phe Ala Phe Phe Ser
1565 1570 1575
Ser Phe Gly Asn Asn Lys Tyr Ile Asn Ile Leu Thr Arg Ala Phe
1580 1585 1590
Ile His Thr Pro Arg Ser Pro Gly Cys Ser Val Tyr Ala Asn Met
1595 1600 1605
Cys Trp Arg Lys Met Gln Ser Leu Asn His Pro Ser Arg Leu Thr
1610 1615 1620
Asn Cys His Pro Ala Trp Leu Ser Pro Ile Ser Ala Cys Pro Arg
1625 1630 1635
Leu Leu Pro Tyr Pro Phe His Val Leu Ala Leu Glu Val Thr Phe
1640 1645 1650
Pro Pro Gly Thr Ala Met Pro Gln Met Gln Leu Gln Ala Leu Ala
1655 1660 1665
Met Trp Glu Lys Gly Trp Asp Lys Gln Glu Lys Lys Ser Arg Lys
1670 1675 1680
Leu Met Ser Ser Cys Leu Glu Lys Lys Ala Thr Trp Met Arg Arg
1685 1690 1695
Thr Pro Gly Thr Ser Leu Gln Cys Tyr Leu Asn Thr His Pro Cys
1700 1705 1710
Thr Met Leu Leu Pro Gln Gly Ile Pro Ser Leu Asn Ala Gln Trp
1715 1720 1725
Met Phe Leu Arg Ile Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1730 1735 1740
Ser
<210> 1177
<211> 1749
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 3C
<400> 1177
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Pro Ile Pro Pro His Leu Arg His
225 230 235 240
Pro Leu Leu Leu Lys Asn Lys Lys Arg Arg Lys Leu Arg Pro Lys Ser
245 250 255
Arg Lys Lys Gly His Thr Lys Asn Arg Arg Lys Ala Lys Arg Lys Pro
260 265 270
Gln Ile Arg Asn Ser Arg Arg Ala Thr Pro Thr Ser Lys Gly Ser Leu
275 280 285
Arg Arg Lys Tyr Leu Arg Val Gly Ala Ala Ala Ala Ser Cys Gln Ser
290 295 300
Pro Pro Ser Pro Arg Glu Thr Thr Pro Ser Ser Asp Ala Thr Arg Arg
305 310 315 320
Thr Arg Pro Ile Ala Ala Gln Ser Lys Lys Thr Met Thr Ala Ala Gly
325 330 335
Leu Thr Pro Ser Gln Lys Lys Asp Pro Ala Gly Lys Leu Lys Lys Gln
340 345 350
Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe Ser Arg Arg Gly Met
355 360 365
Lys Ser Ser Val Arg Leu Lys Asn Cys Thr Asn Leu Ser Val Pro Met
370 375 380
Met Leu Thr Ile Leu Ile Trp Lys Arg Val Phe Ile Leu Leu Leu Ser
385 390 395 400
Asp Lys Lys Ser Ile Pro His Val Pro Lys Ala Thr Ala Ala His Ser
405 410 415
Val Thr Val Lys Leu Gln Ser Arg Arg Asn Arg Arg Tyr Arg Lys Ile
420 425 430
Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala Ser Asn Gly Met Glu Ala
435 440 445
Cys Gly Thr His Pro Thr Pro Arg Leu Ser Val Ser Val Ile Thr Met
450 455 460
Lys Leu Trp Glu Lys His Phe Lys Gly Leu Asn Trp Asn Leu Val Val
465 470 475 480
Trp Ile Leu Asn Leu Lys Met Met Leu Lys Lys Lys Tyr Leu Val Gln
485 490 495
Arg Glu Trp Glu Lys Arg Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr
500 505 510
Lys Glu Tyr Phe Leu Lys Arg Ile Leu Ile Arg Lys Ala Met Thr Val
515 520 525
Leu Ala Gly Asp Lys Lys Gly Leu Gly Arg Phe Met Arg Cys Val Gln
530 535 540
Ser Glu Thr Lys Ala Val Ser Leu Gln Leu Pro Leu Gly Arg Met Asp
545 550 555 560
Leu Asp Gly Met Leu Thr Val Ile Gly Gln Gly Leu Val Gly Met Thr
565 570 575
Pro Arg Asp Leu Gly Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg
580 585 590
Pro Ile Gln Val Gln Thr Gly Gly Arg Leu Arg Gly Pro Arg Arg Lys
595 600 605
Val Leu Met Val Leu Trp Leu Pro Ala Asn Gln Ser Leu Gln Lys Ser
610 615 620
Gln Val Phe Gln Trp Val Leu Arg Thr Glu Leu Pro Leu Thr Phe Ser
625 630 635 640
Thr Leu Leu Trp Asp Ser Arg His Asp Leu Pro Arg Met Leu Pro Ile
645 650 655
Ser Ser Pro Leu His Arg Pro Gln Met Pro Phe Trp Thr Cys Thr Phe
660 665 670
Pro Ala Thr Thr Trp Gly Thr Trp Glu Thr Pro Ser Thr Trp Gly Trp
675 680 685
Arg Thr Phe Ala Arg Gln Pro Ser Arg Pro Thr Gly Arg Thr Pro Thr
690 695 700
Thr Arg Leu Met Ala Pro Val Gly Ser Val Met Ser Cys Ser Leu Leu
705 710 715 720
Thr Gln Pro Ser Pro Ala Ser Ala Cys Thr Met Pro Pro Leu Leu His
725 730 735
Pro Gln Trp Ala Pro His Ser Ala Gly Leu Ser Pro Gly Ala Cys Arg
740 745 750
Pro Ala Cys Thr Cys Ile Ser Met Thr Thr Ile Ser Arg Ala Thr Trp
755 760 765
Arg Arg Asn Leu Gln Arg Asn Leu Lys Val Leu Arg Leu Arg Ile Pro
770 775 780
Ser Leu Arg Lys Tyr Arg Gln Gln Asn Thr Arg Ser Thr Asn Leu Glu
785 790 795 800
Lys Asn Pro Ser Leu Lys Lys Gln Ser Gln Arg Arg Gly Lys Leu Ser
805 810 815
Leu Thr Thr Leu Ser Phe Val Leu Ile Glu Glu Leu Leu Lys Lys Ser
820 825 830
Ser Gln Leu Arg Arg Ser Trp Arg Asn Val Ser Arg Ile Ser Asn Ile
835 840 845
Arg Lys Leu Ile Trp Thr Lys Gln Arg Ser Phe Leu Ser Leu Phe Pro
850 855 860
Lys Leu Arg Ala Thr Glu Gln Met Thr Asn Val Gly Cys Arg Leu Asp
865 870 875 880
Phe His Pro Arg Ser Ser Ser Gly Asp Arg Val Phe Leu Val Lys Ile
885 890 895
Gln Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn Thr Met Gln Trp Asn
900 905 910
Asn Lys Lys Met Ala Met Thr Val Ile Ala Gly Ala His His Cys Gln
915 920 925
Tyr Lys Leu Thr Tyr Thr Lys Val Trp Lys Met Asn Trp Lys Lys Met
930 935 940
Met Ile Gly Ser Gln His Leu Leu Phe Ser Pro Leu Asp Ser Ser Pro
945 950 955 960
Leu Gln Leu Leu Leu His Pro His Gly Lys Arg Cys Asn Pro Cys Cys
965 970 975
Arg Leu Thr Trp Met Ser His Leu Asn Arg Lys Leu His Leu Thr Arg
980 985 990
Ser Cys Leu Ile Asp Leu Thr Met Met Met Ser Gln Lys Leu Trp Lys
995 1000 1005
Asn Gln Arg Lys Arg Ile Pro Leu Pro Ser Pro Arg Gln His Leu
1010 1015 1020
Leu Pro Gln Tyr Pro Leu His Pro Pro Pro Pro Cys Leu Leu Leu
1025 1030 1035
Leu His His Arg His His Leu Ala Phe Leu Glu Met Ala Cys Ser
1040 1045 1050
Ser Gln His Thr His Ser Ile Lys Ile Trp Ile Ser Phe Ser His
1055 1060 1065
Glu Thr Met Ser Leu Ser Asn Ile Leu Met Lys Phe Arg Leu Thr
1070 1075 1080
Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala Leu Arg Ala Arg
1085 1090 1095
Gly Gly Thr Thr Ile Gly Glu Val Thr Ser Ser Leu Phe Phe Ser
1100 1105 1110
His Cys Leu Cys Val Ala Pro Arg Cys Pro Arg Ser Ala Val Asp
1115 1120 1125
Ile Ser Pro Gly Pro Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser
1130 1135 1140
Val Ala Ile Gly Lys Leu Ala Leu Leu Gly Ala Ser Ala Pro Cys
1145 1150 1155
Gly Ala Ala Gly Ala Arg Glu Ala Gly Arg Phe Ala Val Leu Gly
1160 1165 1170
Thr Met Val Met Lys Asn Met Glu His Arg Leu Thr Met Asp Ser
1175 1180 1185
Ala Leu Ser Leu Thr Lys Arg Glu Gly Pro Glu Thr Gly Pro Val
1190 1195 1200
Tyr Tyr Val Cys Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro
1205 1210 1215
Phe Leu Phe Thr Val Pro Ile Glu Asp Met Arg Glu Cys Thr Leu
1220 1225 1230
Gly Arg Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro Cys Leu
1235 1240 1245
Ile Pro Val Pro Ile Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu
1250 1255 1260
Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp Ser Arg Ser Phe Phe
1265 1270 1275
Thr Ser Ala His Pro Ser Arg Pro Cys Arg Met Arg Leu Tyr Gln
1280 1285 1290
Met Leu Gln Lys Gln Cys Cys Tyr Asn Leu Val Ile Lys His Pro
1295 1300 1305
Leu Ile Phe Arg Ile Asn Leu Arg Arg Gln Gly Lys Thr Lys Asp
1310 1315 1320
Gly Val Val Gln Ser Leu Gly Phe Leu Asn Gln Gln Ile Ile Leu
1325 1330 1335
Gln Lys Glu Phe Phe Ile Cys Leu Leu Met Phe Ile Lys Arg Trp
1340 1345 1350
Lys Pro Ala Ala Thr Lys Lys Gly Lys Asn Ser Pro Cys Cys Gln
1355 1360 1365
Lys Lys Leu Arg Val Gln Asn Gln Gly His Leu Leu Met Ile Leu
1370 1375 1380
Leu His Asn Arg Gly Pro Pro Leu His Thr Arg Phe Glu Lys Lys
1385 1390 1395
Arg Pro Glu Trp Leu Ser Arg Lys Ser Gly Val Met Lys Cys Trp
1400 1405 1410
Asp Leu Cys Pro Ala Phe Ser Gly Arg Ile Leu His Gln Pro Glu
1415 1420 1425
Met Ala Ala Met Arg Leu Met Pro Lys Phe Leu Asn Ser Thr Asn
1430 1435 1440
Ser Trp Trp Thr Val His Lys Lys Arg Gly Leu Phe His Gln Met
1445 1450 1455
Lys Cys Leu Thr Ala Val Asp Cys Leu Gln Ala Phe Trp Asp Met
1460 1465 1470
Ser Glu Lys Lys Arg Lys Leu Pro Met Ile Arg Lys Ile Gln Lys
1475 1480 1485
Arg Arg Arg Thr Ala Asn Arg Asn Ile Glu Ile Thr Pro Gln Arg
1490 1495 1500
Ser Lys Ala His Leu Lys Lys Thr Ser Ala Lys Gly Ala Lys Lys
1505 1510 1515
Ile Thr Phe Leu Cys Leu Arg Val Arg Cys Gly Gly Trp Leu Cys
1520 1525 1530
Gly Trp Thr Pro Arg Gly Trp Leu Lys Lys Ser Thr Lys Ser Arg
1535 1540 1545
Leu Cys Phe Phe Tyr Leu Leu Tyr Tyr Leu Phe Phe Leu Thr Val
1550 1555 1560
Cys Gly Phe Thr Pro Pro Pro Leu Ile Leu Trp Pro Gln Ala Ala
1565 1570 1575
Pro Gly Glu Lys Leu Lys His Cys Phe Lys Ala Trp Gly Val Asp
1580 1585 1590
Pro Pro Gly Ser Val Trp Ile Leu Pro Cys Phe Leu Ile His Leu
1595 1600 1605
Arg Lys Val Asp Thr His His Leu Gln Val Val Thr Lys Thr Val
1610 1615 1620
Thr Ala Thr Thr Ala Asp Gly Gln Arg Met Arg Arg Leu Lys Cys
1625 1630 1635
Lys Ala Cys Arg Leu Arg Trp Ala Arg Pro Glu Pro Ala Ala Gln
1640 1645 1650
Ala Pro Pro Lys Ser His Phe Pro Pro His Pro Ser Gly Pro Ser
1655 1660 1665
Arg Thr Ser Ser Leu Gln Leu Arg Thr Tyr Met Glu Met His Tyr
1670 1675 1680
Gly His Gln Ala Pro Gln Val Ala Met Leu Pro Lys Leu Leu Cys
1685 1690 1695
Arg Gln Met Leu Pro Thr Leu Ser Thr Leu Gln Gln Arg His Pro
1700 1705 1710
Gln Gly Pro Cys Pro Pro Pro Val Thr Pro Leu Arg Val Gln Ser
1715 1720 1725
Val Leu Leu Leu Gly Val Pro Gln Thr Ala Gly Tyr Pro Tyr Asp
1730 1735 1740
Val Pro Asp Tyr Ala Ser
1745
<210> 1178
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 4C
<400> 1178
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Asp Ser Lys Lys Met Thr Gln Lys
225 230 235 240
Asn Arg Lys Thr Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr Asp
245 250 255
Asn Leu Asp Leu Gln His Gln Arg Arg Arg Lys Lys Lys Lys Asp Lys
260 265 270
Val Glu Ile Arg Asn Arg Ser Pro Lys Ala Asn Ser Thr Glu Cys Gln
275 280 285
Gly Glu His Ser Arg Glu Gln Asn Leu Leu Asn Leu Val Gln Leu Asn
290 295 300
Pro His Ser Pro His His Arg Lys Asp Glu Glu Asp His Gln Lys Arg
305 310 315 320
His His His His Asn Gln Lys Lys Met Ser Val Asn Glu Gly Asn Asn
325 330 335
His Trp Pro Arg Val Glu Met Pro Thr Gly Trp Leu Leu Val Gly Tyr
340 345 350
Asn Thr Arg Asn Thr Ala Gln Asn Pro Arg Leu Gln Gln His Leu Lys
355 360 365
His Trp Gln Gln Cys Thr Arg Ala Arg Trp Cys Gln Glu Pro Cys Gln
370 375 380
Thr Leu Thr Phe Phe His Phe Phe Phe Phe Phe Lys Thr Val Ser Leu
385 390 395 400
Cys Cys Pro Gly Trp Ser Lys Gly Gln Pro Pro Pro Pro Gly Leu Lys
405 410 415
Pro Ser Ser Leu Ala Ser Gln Val Ala Arg Thr Thr Gly Val Tyr Gln
420 425 430
His Val Trp Leu Ile Cys Phe Val Phe Phe Val Cys Val Glu Thr Gly
435 440 445
Phe Cys His Val Ala Gln Val Gly Leu Glu Arg Leu Val Ser Leu Ser
450 455 460
Gly Ile Thr Asp Val Asn His Trp Ala Gln Pro Lys Pro Ser Pro Ser
465 470 475 480
Lys Gly Thr Gly Met Asn Arg Pro Ile Gly Leu Arg Val Gly Lys Gly
485 490 495
Val Trp Ala Arg Leu Trp Leu Lys Asn Trp Lys Arg Phe Lys Leu Lys
500 505 510
Lys Lys Tyr Thr Gly Met Glu Ile Leu Leu Trp Ile Leu Leu Lys Met
515 520 525
Glu Ile Gln Ile Phe Lys Ile Cys Leu Gly Glu Met Gln Leu Cys Leu
530 535 540
Lys Lys Lys Val Asn Ala Cys Ser Asn Ala Lys Lys Met Pro Phe Gln
545 550 555 560
Cys Arg Cys Arg Arg Glu Tyr Arg Val Thr Met Ile Gln Lys Lys Lys
565 570 575
Gln Lys Ser Pro Leu Phe Phe His Gly Asp Leu Cys Arg Pro Ser Pro
580 585 590
Cys Leu Ser Trp Ser Ser Arg Ile Val Ala Pro Gly His Ala Leu Ser
595 600 605
Cys Arg Thr Arg Arg Arg Trp Ser Ser Lys Met Ala Lys Lys Ser Gln
610 615 620
Gln Pro Leu Cys Arg Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys Ser
625 630 635 640
Cys Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly Arg Cys Pro Val Gln
645 650 655
Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu Arg Arg Trp Gly Pro
660 665 670
Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly Phe Gln Leu Leu Arg
675 680 685
Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro Arg Lys Gly Pro Phe
690 695 700
Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala Val Thr Val Met Ala
705 710 715 720
Gly Ser Val Pro Ser Ala Gln Ser Val Asp Ala Leu Glu Ser Pro Gly
725 730 735
Pro Leu Ala Leu Glu Gly Pro Ser Ser Pro Arg Asn Leu Leu Trp Arg
740 745 750
Glu Met Ser Ile Phe Leu Pro Gly Ile Phe Asn Leu His Leu Cys Tyr
755 760 765
Tyr His Ser Gln Ser Asn Arg Asn Lys Ser Arg Gln Met Glu Ser Leu
770 775 780
Gly Met Lys Leu Gln Ile Thr His Pro Phe Ala Ser Gln Pro Leu Gly
785 790 795 800
Gln Glu Met Pro Asn Asn Thr Gln Ile Arg Leu Leu Lys Pro Gly Gln
805 810 815
Ala Phe Gly Ser Phe Ser Ala Asp Phe Ser Ala Pro Gln Gln Ala Pro
820 825 830
Leu Arg Leu Trp Ser Trp Cys Gly Thr Ser Gln Thr Tyr Phe Gly Ser
835 840 845
Ile Glu Ala Leu Thr Ala Leu Phe Thr Cys Arg Thr Ala Ser Ile Ser
850 855 860
Val Asn Ile Ser Thr Leu Met Ser Ile Leu Glu Ala Ile Leu Ala Met
865 870 875 880
Thr Leu Thr Leu Asn Gly Ser Pro Leu Trp Asp Cys Ser Thr Thr Thr
885 890 895
Gly Thr His His Gly Cys Leu Trp Glu Ile Pro Ser Val Thr Leu Leu
900 905 910
Ala Thr Ala Lys Lys Ser Pro Thr Ser Phe Cys Cys Gln Arg Pro Pro
915 920 925
Leu Gln Pro Val Glu Glu Lys Lys Asn Gly Arg Ile Ser Ser Val Pro
930 935 940
Pro Ser Pro Pro Leu Ala Leu Gly Pro Arg Met Gln Leu Cys Thr Gln
945 950 955 960
Leu Ala Arg Phe Phe Pro Ile Thr Pro Pro Val Trp His Ile Leu Gly
965 970 975
Pro Gln Arg His Thr Pro Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe
980 985 990
Ser Asn Gln Leu Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu Lys
995 1000 1005
Gln Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile Pro
1010 1015 1020
Asn Phe Phe Trp Ser Leu Gly Ile Gly His Thr Gly Ala Trp Trp
1025 1030 1035
His Thr Gly Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr Val Ser
1040 1045 1050
Arg Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly Met
1055 1060 1065
Ala Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg Val Ser Trp
1070 1075 1080
Cys Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser Asp Lys
1085 1090 1095
Lys Lys Lys Ser Thr Glu Lys Thr Lys Asn Lys Ile Ile Cys Lys
1100 1105 1110
Gly His Arg Ile Thr Gln Val Val Leu Arg Leu Gly Asn Leu Pro
1115 1120 1125
Pro Phe Phe Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg
1130 1135 1140
Thr Lys Cys Gln Lys Lys Val Pro Ser Ala Ser Pro Trp Gly Leu
1145 1150 1155
His Pro Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser Leu Lys
1160 1165 1170
Gly Ser Arg Thr Ser Cys Cys Pro Arg Ser His Pro Arg Leu Pro
1175 1180 1185
Arg Thr Lys Trp Pro Leu Gln Cys Leu Leu His Ser Leu Gly Thr
1190 1195 1200
Thr Gly Thr Leu Val Trp Glu Arg Gly Val Leu Gln Met Arg Ser
1205 1210 1215
Leu Glu Ala His Cys Pro Leu Gln Thr Phe His Leu His His Cys
1220 1225 1230
Arg Thr Gln Pro Ser Ser Cys Pro Pro Ala Trp Ile Leu Tyr Gln
1235 1240 1245
Gly Gln Trp Ser Gly Ala Val Val Gly Leu Arg Pro Val Ala His
1250 1255 1260
His Leu Pro Arg Pro Ile Gln Gly Leu His Cys Pro Gln Ala Pro
1265 1270 1275
His Gln Pro Ala Leu Ser Trp Gly Lys Trp Pro Val Gly Met Thr
1280 1285 1290
Gly Pro Ala Arg Cys Cys Arg Trp Pro Arg Arg Met Cys Ser Ser
1295 1300 1305
Leu Ala Leu Pro Thr Gly Leu Thr Ser Leu Ile Leu Pro Ser Ser
1310 1315 1320
Asp Leu Ala Val Leu Ile Ser Ser Ser Thr Ser His Phe Leu Met
1325 1330 1335
Arg Ser Pro Val Leu Pro Ser Ser Arg Leu Thr Cys Ala Ser Pro
1340 1345 1350
Gln Leu Pro Arg Met Trp Thr Trp Ser Ser Trp Leu Lys Glu Trp
1355 1360 1365
Gly Gly Gln Ala His Arg Gln Arg Asn Cys Arg Val Asn Ala Val
1370 1375 1380
Glu Glu Leu His Ser Arg Arg Met Ser Val Arg Ile Val Lys Asn
1385 1390 1395
Trp Val Ser Cys Cys Tyr Val Arg Leu Ser Ala Val Gly Leu Ser
1400 1405 1410
Thr Trp Ser Ala Leu Asp Ser Leu Ile Leu Ser Phe Gln Arg Val
1415 1420 1425
Lys Thr Ser Arg Ile Leu Asn Leu Gln Val Leu Lys Lys Ile Leu
1430 1435 1440
Arg Ser Phe Met Lys Leu Tyr His Ser Leu Val Met Cys Leu Arg
1445 1450 1455
Leu Arg Thr Lys Leu Glu Lys Ala Leu Ser Ala Leu Phe Ile Trp
1460 1465 1470
Pro Gln His Ser Tyr Lys Gly Gln Ala Phe Gly Ser Leu Cys Gln
1475 1480 1485
Leu Val Ser Ala Asp Phe Ser Ala Pro Gln Val Thr Arg Leu Arg
1490 1495 1500
Ser Leu Asn His Leu Leu Ile Arg Trp Ile Phe Ser Asn Gln Leu
1505 1510 1515
Thr Val Gln Met Leu Cys Leu Pro Ile Ile Lys Lys Met Lys Lys
1520 1525 1530
Arg Ile Met Val His Val Leu Lys Lys Asn Arg Lys Gln Ile Ile
1535 1540 1545
Cys Ile Lys Asn Met Phe Leu Gln Arg Lys Gly Phe Leu Asn Leu
1550 1555 1560
Ser His Val Glu Lys Phe Arg Glu Ser Thr Leu Gly Asn Phe Trp
1565 1570 1575
Met Lys Leu Leu Gln Leu Pro Pro Ala Cys Thr Ser Lys Ala Trp
1580 1585 1590
Thr Pro Arg Lys Leu Val Gly Arg Ala Val Arg Arg Lys Gly Val
1595 1600 1605
Val Ile Asn Leu Lys Arg Leu Gln Lys Phe Arg Ala Ser Val Ser
1610 1615 1620
Phe Trp Thr Leu Leu Pro Thr Thr Gly Val Arg Thr Arg Gly Ser
1625 1630 1635
Pro Leu Arg Leu Thr Leu Trp Pro Pro Arg Ser Gln Lys Ser Gln
1640 1645 1650
His His Cys Ala Leu Arg Lys Ile Glu Trp Ala Thr Lys Leu Ser
1655 1660 1665
Leu Gly Gly Lys Ala Gly Pro Gln Ala Gln Glu Lys Ala Asn Ile
1670 1675 1680
Leu Asn Ser Leu Pro Ser Ser Met Glu Ile Ala Val Leu Gln Glu
1685 1690 1695
Met Leu Asn Gln Lys Cys Leu Ala Pro Phe Glu Leu Lys Lys Asn
1700 1705 1710
Leu Leu Leu Pro Thr Tyr Thr Pro His Ile Cys Arg His Thr Leu
1715 1720 1725
Lys Lys Lys Pro Arg Asp Ile Cys Arg Ile Ser Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1179
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 1D
<400> 1179
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Ala Asp Lys
20 25 30
Lys Asn Val Arg Ser Ala Ser Ser Pro Gly His Pro Leu Gly Pro Arg
35 40 45
Arg Met Thr Arg Arg Thr Met Thr Thr Thr Lys Met Met Met Met Arg
50 55 60
Arg Thr Lys Arg Arg Arg Arg Lys Arg Arg Arg Met Thr Met Met Thr
65 70 75 80
Arg Arg Thr Leu Leu Thr Lys Lys Thr Cys Leu Thr Pro Arg Thr Ser
85 90 95
Ala Ala Thr Lys Ala Leu Pro Arg Gln Thr Ile Ser Gln Arg Arg Pro
100 105 110
Ile Gln Thr Pro Pro Gly Thr Ser Leu Ala Ile Trp Gly Arg Arg Ser
115 120 125
Lys Ile Glu Ala Ser Pro Ile Gly Ser Ile Thr Pro Leu Ser Ile Ser
130 135 140
Arg Pro Thr Ser Arg Ala Arg Gln Ser Cys Cys Leu Pro Gly Leu Thr
145 150 155 160
His Pro Ala His Gln Pro Leu Gly Ser Met Val Gly Ala Gly Thr Gly
165 170 175
Gly Gly Pro Ala Cys Val Pro Val Ala Glu Ala Ser Thr Gly Ala Trp
180 185 190
Thr Ala Glu Gly Ala Ala Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro
195 200 205
Cys Arg Gln Leu Pro Ala Ser Ser Pro Thr Lys Cys Glu Ile Cys Val
210 215 220
Lys Arg Arg Arg Arg Arg Lys Arg Ser Ser Gln Ser Arg Ser Pro Val
225 230 235 240
Pro Lys Lys Arg Glu Arg Met Met Leu Pro Val Arg Ala Arg Thr Ala
245 250 255
Arg Ser Ala Leu Pro Gln Gly Arg Ala Pro Leu Glu Gly Met Leu Leu
260 265 270
Pro Arg Ala Leu Pro Ser Leu Leu Ser Arg Met Pro Ala Arg Arg Glu
275 280 285
Ser Arg Phe Trp Leu Ala Leu Gln Ala Leu Gly Leu Arg Pro Pro His
290 295 300
Leu Pro Ser Cys His Pro Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro
305 310 315 320
His Gln Ala Pro Gly Glu Lys Asn Asp Leu Gln Leu Phe Val Met Ser
325 330 335
Asp Thr Thr Tyr Lys Ile Tyr Trp Thr Val Ile Leu Leu Asn Pro Cys
340 345 350
Gly Asn Leu His Leu Lys Thr Thr Ser Leu Asn Ala Lys Lys Met Glu
355 360 365
Asp Met Ile Trp Glu Ser Asn Gln Gln Leu Lys Trp Thr Pro His Ile
370 375 380
Leu Lys Ser Ala Ser Ile Ala Lys Lys Arg Ile Lys Leu Arg Arg Asn
385 390 395 400
Ser Thr Arg Arg Glu Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly
405 410 415
Pro Trp Arg Ala Ala Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys
420 425 430
Leu Arg Leu Arg Asn Thr Ser Pro Phe Asp Lys Lys Gly Phe Val Ile
435 440 445
Leu Ser Asn Met Gly Gly Asn Arg Ser Ile Cys Leu Thr Ile Val Phe
450 455 460
Phe Leu Ala Pro Tyr Phe Pro Met Pro Ser Ser Trp Ser Ser Ser Gly
465 470 475 480
Arg Thr Arg Leu Pro Leu Arg Pro Gln Arg Gly Pro Arg Pro Leu His
485 490 495
Arg Trp Leu Gln Gln Thr Thr Gly Cys Ser Gln Arg Arg Gly Asp Cys
500 505 510
Pro Arg Thr Met Ala Gly Pro Ser Ala Ser Leu His Pro Ala Ser Gly
515 520 525
Arg Ala Ser Arg Lys Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg Ala
530 535 540
Gly Gly Pro Ala Gly Trp Ala Arg Gln Ala Arg Lys Arg Lys Arg Glu
545 550 555 560
Lys Arg Ser Gln Lys Ser Arg Gln Asn His Leu Gln Leu Lys Ser Cys
565 570 575
Arg Arg Lys Ile Ser Asn Trp Ser Lys Leu Arg Ser Pro Trp Ile Phe
580 585 590
Glu Ala Lys Lys Ser Met Lys Arg Ser Gln Arg Pro Pro Arg Ser Ile
595 600 605
Leu Ser Leu Phe Lys Lys Lys Lys Pro Leu Thr Phe Ser Pro Ser Val
610 615 620
Ser Lys Lys Arg Leu Pro Lys Leu Lys Gly Lys Lys Arg Arg Lys Glu
625 630 635 640
Ile Gln Arg Lys Val Val Lys Asn Pro Ser Gln Pro Val Pro Leu Arg
645 650 655
Asn Asp Gly Ile Thr Asn Gly Asn Asp Ser Thr Arg Ser Cys Ser Ile
660 665 670
Ser Leu Lys Lys Ser Leu Glu Lys Met Pro Leu Met Arg Ser Leu Leu
675 680 685
Tyr Ser Arg Met Cys Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro
690 695 700
Asp Tyr Phe Val Ser Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser
705 710 715 720
Phe Pro Val Gly Ala Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys
725 730 735
Ser Cys Thr Ser His Ser Asn Pro Trp Ser Gln Ser Thr Leu Ala Ile
740 745 750
Arg Phe Ile Ser Ala Pro Gln Pro Ser Ser Ser Thr Val Thr Ala Ala
755 760 765
Pro Ser Gly Gln Tyr Phe Ala Leu Arg Ser Met Pro Lys Ser Arg Asn
770 775 780
Gln Val Leu Phe Arg Arg Asn Leu Thr Pro Ser Gln Leu Arg Thr Leu
785 790 795 800
Ala Pro Pro Tyr Met Leu Leu Pro Gln Ser Leu Ser Gln Ser Leu Ser
805 810 815
Arg Lys Gln Ile Pro Ser Gln Ser Met Leu Val Arg Thr Arg Leu Thr
820 825 830
Leu Thr Gly Thr Arg Ser Ser Gly Thr Arg Ala Ser Pro Ser Ala Val
835 840 845
Cys Leu Cys Cys Trp Thr Cys Pro Ser Arg Ser Phe Pro Ala Ala Ser
850 855 860
Pro Ser Gly Leu Arg Ala Pro Val Gly Ala Gln Ala Pro Pro Glu Val
865 870 875 880
Thr Leu Arg Ala Ser Cys Ala Ser Ser Ala Ser Lys Ala Cys Ala Gly
885 890 895
Leu Trp Pro Trp Gly Ala Gln Val Arg Met Lys Lys Lys Asp Ser Thr
900 905 910
Ile Phe Ile Tyr Pro Arg Leu Lys Thr Phe Gly Val Pro Leu Gly Ser
915 920 925
Ile Leu Cys Leu Ala Gly Ser Leu Ser Thr Met Met Ile Ile Ser Thr
930 935 940
Thr Arg Gln Glu Cys Gly Arg Arg Ala Ser Val Pro Cys Arg Pro Met
945 950 955 960
Ile Gly Ser Ala Arg Pro Gly Pro Trp Arg Thr Ser Ala Met Pro Ser
965 970 975
Ala Met Gly Val Ala Leu Pro Thr Ser Cys Glu Ser Gly Arg Ser Pro
980 985 990
Pro Ala Thr Gly Gly Arg Met Pro Gly Ser Gln Ser Ile Met Met Ser
995 1000 1005
Trp Met Pro Pro Leu Ala Pro Cys Ala Ala Cys Pro Cys Ser Pro
1010 1015 1020
Ala Pro Thr Leu Cys Pro Ala His Pro Ala Arg Ala Pro Thr Ala
1025 1030 1035
Val Pro Ala Phe Thr Pro Leu Ser Ala His Pro Val Pro Val Leu
1040 1045 1050
Ser Gly Cys His Leu Ala Val Arg Thr Ser Met Leu Thr Leu Leu
1055 1060 1065
Pro Met Met Thr Leu Lys Ala Leu Val Lys Thr Trp Thr Gln Phe
1070 1075 1080
Arg Asn Tyr Pro Arg Arg His Pro His Arg Ser Pro Pro Thr Ser
1085 1090 1095
Cys Pro Pro Leu Leu Glu Ala Phe Pro Leu Pro Arg Ala Ser Leu
1100 1105 1110
Arg Ala Thr Val Pro Arg His Ser Ser Val Leu Ala Thr Gly Leu
1115 1120 1125
His Leu His Arg Gln Ile Ser Leu Pro Leu Arg Gly Phe Leu Leu
1130 1135 1140
His Gln Pro Leu Pro Gly Gln His Leu Trp Leu Ser His Arg Leu
1145 1150 1155
Arg Leu Arg Leu Pro Arg Thr Thr Glu Ile Gln Leu Thr Met Asn
1160 1165 1170
Asp Ser Lys His Lys Leu Glu Ser Pro Ala Leu Lys Gln Val Ser
1175 1180 1185
Pro Ala Ser Pro Pro Thr Gln Gln Pro Gln Thr Pro Gln Asp Ser
1190 1195 1200
Arg Gln Val Leu Ala Val Pro Met Ser Leu Ala Cys Ser Ile Thr
1205 1210 1215
Val Ser Phe Val Gly Gln Ile Ser Thr Leu Val Leu Asp Val Ser
1220 1225 1230
Ser Ile Ser His Trp Asn Gly Ile Trp Glu Val Met Pro Arg Thr
1235 1240 1245
Leu Glu Gly Cys Ile Ser Val Lys Asp His Arg Thr Ser Gln Asn
1250 1255 1260
His Ser Lys Cys Ile Thr Glu Cys Val Arg Thr Ala Leu Asn Thr
1265 1270 1275
Lys Cys Glu Ile Cys Val Lys Asn Thr Ala Ile Leu Ala Ile Thr
1280 1285 1290
Leu Ile Thr Pro Gln Asp Pro His Leu Asp Pro Val Cys His Pro
1295 1300 1305
His Arg Arg Pro Gly Trp Lys Gly His His Arg Val Val Phe Ser
1310 1315 1320
His His Pro Ser Gly Ser Thr Lys Ser His Trp Gln Gln Arg Glu
1325 1330 1335
Arg Gly Gly Gly Arg Arg Glu Lys Lys Gly Cys Arg Glu Ala Ser
1340 1345 1350
Arg Ala Gly Gln Phe Pro Val Trp Arg Arg Thr Ser Arg Gly Met
1355 1360 1365
Ser Leu Gln Trp Lys Ser Gly Asn Ala Cys Thr Pro Leu Arg Cys
1370 1375 1380
Pro Ser Arg Ser Pro Ala Thr Phe Leu Thr Ala Leu Asn Gly Trp
1385 1390 1395
His Arg Ser Gly Leu Arg Ala Gln Thr Ala Phe Phe Leu Leu Asp
1400 1405 1410
Ile Ile Leu Arg Arg Ala Arg Pro Thr Ser Cys Ser Thr Cys Arg
1415 1420 1425
Met Trp Trp Arg Leu Pro Cys Lys Val Thr Glu Ser Ser Leu Ala
1430 1435 1440
Lys Lys Thr Leu Thr Asn Gln Pro Ser Leu Pro Gly Pro Cys Ala
1445 1450 1455
Ser Leu Leu Ser Thr Leu Ser Gln Pro Pro Pro Gln Ala Pro Ser
1460 1465 1470
Gln Val Trp Thr Ala Ala Thr Leu Arg Cys Pro Ala Val Pro Ala
1475 1480 1485
Ala Ala Cys Pro Pro Leu Lys Leu Ala Pro Leu Gln Val Thr Thr
1490 1495 1500
Thr Leu Lys Leu Ile Leu Val Met Leu Glu Ile Val Thr Glu Asn
1505 1510 1515
Lys Val Arg Gln Asn Phe Lys Arg Asn Ser Ser Phe Phe Tyr Thr
1520 1525 1530
Ser Asp Arg Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1180
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 2D
<400> 1180
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Arg Lys Met
20 25 30
Gln Ser Leu Asn His Pro Ser Arg Leu Thr Asn Asn Pro Arg Arg Lys
35 40 45
Thr Trp Lys Met Arg Lys Lys Tyr Ala Gln Lys Pro Ser Gln Lys Asn
50 55 60
His Leu Tyr Arg Gln Ile Asn Arg Arg Lys Leu Gln Arg Lys Lys Ser
65 70 75 80
Arg Ser His Leu Asp Phe Ser Pro Tyr Trp Met Lys Lys Val Lys Arg
85 90 95
Ala Arg Asn Arg Asn Met Lys Lys Thr Met Ser His Leu Ile Ala His
100 105 110
Gln Ala Leu Lys Met Ser Gly Leu Arg Leu Phe His Pro Arg Leu Leu
115 120 125
Thr Arg Lys Lys Pro Gly Lys Gln Lys Lys Gly His Met Ile Phe Ser
130 135 140
Arg Arg Lys Trp Gln Ile Arg His Val Leu Lys Asn Leu Ile Pro Ser
145 150 155 160
Leu Asn Ala Gln Trp Met Phe Leu Arg Ile Ala Ser Pro Gln Ile Met
165 170 175
Gln Arg Thr Ser Ala Asp Arg Phe Arg Met Lys Arg Arg Met Gln Asn
180 185 190
Leu Asp Asn Leu Gly Val Pro Trp Pro Leu Leu Pro Gly Leu Leu Leu
195 200 205
Ala His Met Tyr Gly Phe Ser Thr Tyr Gly Thr Gln Lys Gly Glu Cys
210 215 220
Val Cys Leu Gln Cys Leu Ser Gly Ser Ser Leu Phe Ile Leu Lys Gln
225 230 235 240
Pro Leu Asp Leu Lys Ile Ser Lys Thr Phe Met Ala Ser Pro Gln Ile
245 250 255
Met Gln Arg Met Ser Ala Val Asn Phe Glu Thr Ile Leu Gln Ala His
260 265 270
Pro Gln Val Pro Ala Leu Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg
275 280 285
Gly Pro Leu Thr Ser Ala Pro Ser Ala Gln Gln Ser Leu Thr Arg Thr
290 295 300
Leu Glu Ser Ala Gly Leu Phe Pro Trp Leu His Thr Gln Cys Arg Ala
305 310 315 320
Phe Ile His Thr Pro Arg Ser Pro Gly Cys Ser Val Tyr Ala Asn Met
325 330 335
Cys Trp Arg Tyr Lys Lys Arg Gly Val Ile Ala Trp Arg Ile Tyr Pro
340 345 350
Pro Ser Thr Cys Ser Leu Pro Cys Arg Gly Leu Ile Leu Ile Gln His
355 360 365
Gly Gly Ile Phe Thr Phe Arg Phe Trp Val Glu Lys Leu Ser Trp Asn
370 375 380
Ile Cys Lys Asn Leu Ser Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu
385 390 395 400
Leu Tyr Val Tyr Ile Ile Glu Thr Asn Val Phe Val Leu Asn Leu Phe
405 410 415
His Val Pro Val Asn Gln Ile Phe Met Met Ala Phe Tyr Leu Lys Tyr
420 425 430
Thr Glu Lys Ala Trp Val Met Glu Leu Glu Trp Leu Ile Gln Gln Gln
435 440 445
Cys Tyr Gln Arg Lys Arg Met Lys Thr Gly Ala Ile Gln Glu Lys Gly
450 455 460
Ala Ile Gln Glu Lys Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn
465 470 475 480
Phe Glu Ala Cys Arg Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile
485 490 495
Thr Leu Phe Glu Ala His Met Ala Arg Cys Thr Ser Ile Asn Val Leu
500 505 510
Cys Val Arg Ala Ser Leu Ile Glu Lys Leu Met Lys Glu Lys Arg Lys
515 520 525
Met Lys Arg Asn Gln Val Ala Ser Pro Gln Ile Met Gln Arg Leu Phe
530 535 540
Ile Lys Gly Tyr Gln Asn Asn His Phe Thr Phe His Leu Gln Asn Phe
545 550 555 560
Ala Phe Phe Ser Ser Phe Gly Asn Asn Lys Tyr Ile Asn Ile Leu Thr
565 570 575
Phe Leu Pro Ser Arg Phe Pro Trp Gly Pro Pro Pro Leu Gly Ala Leu
580 585 590
Arg Ala Thr Ala Pro Ala Thr Ala Ala Pro Gln Ala Gln Thr Pro His
595 600 605
Trp Arg Ala Ala Thr Thr Ser Ser Met Ser Ser Ser Pro Arg Ala Glu
610 615 620
Pro Thr Ser Ser Ser Ser Trp Ala Thr Cys Trp Pro Arg Cys Cys Ser
625 630 635 640
Ser Ser Cys Tyr Trp Ser Leu Ser Ser Trp Pro Pro Ala Gly Ala Ala
645 650 655
Glu Ala Thr Asn Thr Arg Thr Arg Ser Arg Glu Ser Gln Arg Gly Arg
660 665 670
Met Leu Thr Trp Arg Ser Ser Leu Trp Leu Gln Gly Thr Arg Cys Phe
675 680 685
Thr Gly Val Arg Thr Ser Ser Arg Cys Ser Leu Met Glu Gln Ile Pro
690 695 700
His Leu Lys Ser Asn Ser Arg Lys Lys Leu Leu Glu Asp Met Lys Gln
705 710 715 720
Asn Gly Phe Thr Arg Arg Arg Asn Ser Arg Lys Gln Ser Gln Val Gln
725 730 735
Leu Ala Ile Gln Val Leu Leu Val Asp Lys His Lys Tyr Phe Leu Phe
740 745 750
Gly Arg Ala Thr Phe Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro Gln
755 760 765
Ala Arg Leu Cys Leu Ile Val Ser Arg Thr Leu Leu Leu Val Gln Ser
770 775 780
Arg His Pro Ser Trp Pro Trp Thr Arg Cys Leu Arg Met Arg Pro Pro
785 790 795 800
Arg Ser His Trp Asn Ser Ala Tyr Leu Gly Arg Thr Leu Leu Val Thr
805 810 815
Cys Ile Leu Tyr His Arg Trp Ile Val Thr Ser Met Cys Gln Ser Gln
820 825 830
Arg Trp Leu Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu Met Trp Thr
835 840 845
Trp Trp Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys Lys
850 855 860
Val Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys Gly
865 870 875 880
Ile Cys Trp Lys Trp Pro Val Thr Val Ala Ala Met Ser Arg Thr Pro
885 890 895
Pro Arg Arg Val Cys Gly His Arg Glu Gly Ser Glu Ser Asp Asn Leu
900 905 910
Gly Leu Leu Tyr Ser Phe Pro Pro Val Leu Phe Lys Ala Asp Gln Ser
915 920 925
Glu Ser Ser Leu Ser Ser Gly Asn Ser Val Ile Val His Lys Ile Val
930 935 940
Leu Val Phe Leu Lys Ser Leu Ser Ser Tyr Asn Cys Glu Arg Arg Ile
945 950 955 960
Ser Gly Ile Gln Lys Arg Ala Ile Glu Phe Ala Val Leu Lys Leu Leu
965 970 975
Asn Met Asp Leu Gly Lys Gly Leu Thr His Pro Val Pro Leu Lys Arg
980 985 990
Thr Leu Gln Asn Lys Arg Asn Lys Asn Ile Lys Arg Val Asn Gln Lys
995 1000 1005
Lys Gly Asn Ile Lys Arg Lys Ser Ile Leu Leu His Leu Ile Val
1010 1015 1020
Leu Asn Ser Pro Glu Ser Asn Arg Glu Lys Ile Ile Asn Pro Thr
1025 1030 1035
Ile Ser Cys Pro Phe Gln Ser Pro Thr Lys Arg Leu Gly Ser Pro
1040 1045 1050
Pro Leu His Leu Cys Gln Pro Leu Arg Pro Tyr Pro Ile Ser Glu
1055 1060 1065
Gly Leu Thr Met Thr Thr Gly Arg Asn Ile Asn Ser Asn Ser Leu
1070 1075 1080
Met Thr Asn Cys Leu Phe Ser Pro Ile Phe Leu Cys His His Ala
1085 1090 1095
Ile Met His Arg Lys Met Thr Ser Pro His Phe Arg Leu Phe Ser
1100 1105 1110
Ser Lys Ile Pro His Pro Gln Val Pro Ser Val Val Ala Leu Cys
1115 1120 1125
Lys Phe Thr His Pro Cys Thr Met Leu Leu Pro Gln Gly Ala Phe
1130 1135 1140
Trp Lys Pro Pro Ser Gln Gly Ile Ser Ser Cys Leu Met Thr Gly
1145 1150 1155
Cys Trp Gln Trp Ser Ser Val Thr Ser Leu Glu Trp Thr Ala Gln
1160 1165 1170
Glu Arg Gly Cys Ser Ser Trp Leu Met Lys Gln Thr Trp Met Lys
1175 1180 1185
Ser Trp Ser Leu Arg Asp Pro Ser Tyr Arg Ser Ile Leu Glu Tyr
1190 1195 1200
Val Ser Thr Arg Val Leu Trp Met Pro Thr Ser Thr Val Pro Lys
1205 1210 1215
Phe Phe Leu Thr Phe Ser Gln Ile Arg Met Cys Ala Leu Ser His
1220 1225 1230
Pro Ser Phe Tyr Ile Ser Ser Thr Val Cys Phe Leu Ser Lys His
1235 1240 1245
Cys Met Thr Ala Cys Thr Pro Gly Thr Ser Leu Gln Cys Tyr Leu
1250 1255 1260
Asn Leu Ala Asn Gly Leu Trp Phe Asn Leu Ile Phe Arg Asn Lys
1265 1270 1275
Lys Thr Lys Leu Trp Phe Ser Leu Ile Asn Ile His His Arg Lys
1280 1285 1290
Asn Pro Leu Leu Pro Met Arg Leu Glu Lys Lys Ala Thr Trp Met
1295 1300 1305
Arg Arg Thr Glu Leu Ser Leu Glu Pro Trp Ile Pro Tyr Leu His
1310 1315 1320
Gln Gln Lys Thr Gln Trp Leu Pro Met Arg Ser Leu Gly Glu Pro
1325 1330 1335
Trp Arg Ala Gly Phe Gln Trp Gly Glu Ser Pro Trp Gln Val Met
1340 1345 1350
Ala Ser Leu Thr Gly Arg Arg Lys Lys Arg Glu Asp His Cys Gly
1355 1360 1365
Leu Gln Glu Lys Lys Ser Arg Lys Leu Met Ser Ser Cys Ala Ala
1370 1375 1380
Pro Pro His Arg Leu Leu Gly Pro Ser Arg Trp Gly Ser Cys Gly
1385 1390 1395
Arg Ala Cys Ser Cys Gly Arg Gly Cys Gly Thr Pro Arg Gly Asp
1400 1405 1410
Trp Lys Arg His Pro Pro Arg Arg Ile Leu Phe His Val Arg Asn
1415 1420 1425
Ile Val Tyr Gly Ile Gln Val Met Leu Cys Cys His Pro Ala Trp
1430 1435 1440
Leu Ser Pro Ile Ser Ala Cys Pro Arg Leu Leu Pro Tyr Pro Phe
1445 1450 1455
His Val Leu Ala Leu Glu Val Thr Phe Pro Pro Gly Thr Ala Met
1460 1465 1470
Pro Gln Met Gln Leu Gln Ala Leu Ala Met Trp Glu Lys Gly Trp
1475 1480 1485
Asp Lys Pro Leu Glu Asn Thr Gln Ile Pro Arg Thr Ser Pro Leu
1490 1495 1500
Trp Lys Ile Thr Met Val Leu Thr Tyr Pro Asn Cys Val Val His
1505 1510 1515
Val Leu Met Phe Gly Gly Lys Lys Arg Ser Lys Phe Gly Tyr Pro
1520 1525 1530
Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540
<210> 1181
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 3D
<400> 1181
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Gln Asn Thr
20 25 30
Arg Ser Thr Asn Leu Glu Lys Asn Pro Ser Leu Lys Lys Gln Ser Gln
35 40 45
Arg Arg Gly Lys Leu Ser Ser Arg Lys Lys Gly His Thr Lys Asn Arg
50 55 60
Arg Lys Ala Lys Arg Lys Pro Gln Ile Ser Gln Lys Lys Asp Pro Ala
65 70 75 80
Gly Lys Leu Lys Lys His Leu Asn Arg Lys Leu His Leu Thr Arg Ser
85 90 95
Cys Leu Ile Asp Leu Thr Met Met Met Ser Gln Lys Leu Trp Lys Asn
100 105 110
Gln Arg Lys Arg Ile Pro Leu Pro Ser Pro Arg Gln His Leu Leu Pro
115 120 125
Gln Tyr Pro Leu His Pro Pro Pro Pro Cys Leu Leu Leu Leu His His
130 135 140
Arg His His Leu Ala Phe Leu Glu Met Ala Cys Ser Ser Gln His Thr
145 150 155 160
His Ser Ile Lys Ile Trp Ile Ser Phe Ser His Glu Asp Leu Pro Arg
165 170 175
Met Leu Pro Ile Ser Ser Pro Leu His Arg Pro Gln Met Pro Phe Trp
180 185 190
Thr Cys Thr Phe Pro Ala Thr Thr Trp Gly Thr Trp Glu Thr Pro Ser
195 200 205
Thr Trp Gly Trp Arg Thr Phe Gly Pro Val Tyr Tyr Val Cys Asn Arg
210 215 220
Met Asn Val Ser Ser Val Leu Lys Pro Phe Leu Phe Thr Val Pro Ile
225 230 235 240
Glu Asp Met Arg Glu Cys Thr Leu Gly Arg Asn Arg Met Asn Val Ser
245 250 255
Ser Val Leu Lys Pro Cys Leu Ile Pro Val Pro Ile Leu Thr Thr Leu
260 265 270
Ser Phe Val Leu Ile Glu Glu Ser Arg Arg Asn Arg Arg Tyr Arg Lys
275 280 285
Ile Tyr Gly Glu Leu Lys Met Ser Leu Gln Ala Leu Pro Leu Thr Phe
290 295 300
Ser Thr Leu Leu Trp Asp Ser Arg His Thr Thr Thr Thr Ser Ser Pro
305 310 315 320
Arg Arg Ser Pro Ala Leu Arg Ala Arg Gly Gly Thr Thr Ile Gly Glu
325 330 335
Val Thr Ser Arg Gly Ala Ser Ser Ser Thr Ser Arg Asp Ser Arg Ser
340 345 350
Phe Phe Thr Ser Ala His Pro Ser Arg Pro Cys Arg Met Arg Leu Tyr
355 360 365
Gln Ser Asn Gly Met Glu Ala Cys Gly Thr His Pro Thr Pro Arg Leu
370 375 380
Ser Arg Gly Pro Pro Leu His Thr Arg Thr Met Ser Leu Ser Asn Ile
385 390 395 400
Leu Met Lys Phe Arg Leu Met Leu Gln Lys Gln Cys Cys Tyr Asn Leu
405 410 415
Val Ile Lys His Pro Leu Ile Phe Arg Ile Asn Leu Arg Arg Gln Gly
420 425 430
Lys Thr Lys Asp Gly Val Val Gln Ser Leu Gly Phe Leu Asn Gln Gln
435 440 445
Ile Ile Leu Gln Lys Glu Phe Phe Ile Cys Leu Leu Met Phe Ile Lys
450 455 460
Arg Trp Lys Pro Ala Ala Thr Lys Thr Pro Pro Pro Leu Ile Leu Trp
465 470 475 480
Pro Gln Ala Ala Pro Val His Lys Lys Arg Gly Leu Phe Ser Leu Phe
485 490 495
Phe Ser His Cys Leu Cys His Gln Met Lys Cys Leu Thr Ala Val Asp
500 505 510
Cys Leu Gln Ala Phe Trp Asp Met Met Ile Arg Lys Ile Gln Lys Arg
515 520 525
Arg Arg Thr Ala Asn Arg Leu Lys Lys Lys Tyr Leu Val Gln Cys Thr
530 535 540
Asn Leu Ser Val Pro Met Met Leu Thr Ile Leu Ile Trp Lys Arg Val
545 550 555 560
Phe Ile Leu Leu Leu Ser Asp Lys Lys Cys Leu Arg Val Arg Cys Gly
565 570 575
Gly Trp Leu Cys Gly Trp Thr Pro Arg Gly Lys Asn Lys Lys Arg Arg
580 585 590
Lys Leu Arg Pro Lys His Leu Lys Lys Thr Ser Ala Lys Val Ser Val
595 600 605
Ile Thr Met Lys Leu Trp Glu Lys His Phe Lys Gly Leu Asn Trp Asn
610 615 620
Leu Val Val Trp Ile Leu Asn Leu Lys Met Met Trp Leu Lys Lys Ser
625 630 635 640
Thr Lys Ser Arg Gln Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn Thr
645 650 655
Met Gln Trp Asn Asn Lys Lys Met Ala Met Thr Val Ile Ala Gly Ala
660 665 670
His His Cys Gln Tyr Lys Leu Thr Tyr Thr Lys Val Trp Lys Met Asn
675 680 685
Trp Lys Lys Met Met Ile Gly Ser Gln His Leu Leu Phe Ser Pro Leu
690 695 700
Asp Ser Ser Pro Leu Gln Leu Leu Leu His Pro His Gly Lys Arg Cys
705 710 715 720
Asn Pro Cys Cys Arg Leu Thr Trp Met Ser Arg Glu Trp Glu Lys Arg
725 730 735
Lys Gln Ile Leu Gly Gly Gly Gly Lys Tyr Lys Glu Tyr Phe Leu Lys
740 745 750
Arg Ile Leu Ile Arg Lys Ala Met Thr Val Leu Ala Gly Asp Lys Lys
755 760 765
Gly Leu Gly Arg Phe Met Arg Cys Val Gln Ser Glu Thr Lys Ala Val
770 775 780
Ser Leu Gln Leu Pro Leu Gly Arg Arg Lys Ser Gly Val Met Lys Cys
785 790 795 800
Trp Asp Leu Cys Pro Arg Leu Asp Phe His Pro Arg Ser Ser Ser Gly
805 810 815
Gly Glu Lys Leu Lys His Cys Phe Lys Ala Trp Gly Leu Cys Phe Phe
820 825 830
Tyr Leu Leu Tyr Phe Glu Lys Lys Arg Pro Glu Trp Leu Ser Val Asp
835 840 845
Pro Pro Gly Ser Val Trp Ile Leu Pro Cys Met Asp Leu Asp Gly Met
850 855 860
Leu Thr Val Ile Gly Gln Gly Leu Val Gly Met Thr Pro Arg Asp Leu
865 870 875 880
Gly Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg Pro Ile Gln Val
885 890 895
Gln Thr Gly Gly Arg Leu Phe Leu Ile His Leu Arg Lys Val Asp Thr
900 905 910
His His Leu Gln Val Val Thr Lys Thr Val Thr Ala Thr Thr Ala Asp
915 920 925
Gly Gln Arg Met Arg Arg Leu Lys Cys Lys Ala Cys Arg Leu Arg Trp
930 935 940
Ala Arg Pro Glu Pro Ala Ala Gln Ala Pro Pro Lys Ser His Phe Pro
945 950 955 960
Pro His Pro Ser Gly Pro Ser Arg Thr Ser Ser Leu Gln Leu Arg Pro
965 970 975
Ile Pro Pro His Leu Arg His Pro Leu Leu Leu Lys Gly Lys Asn Ser
980 985 990
Pro Cys Cys Gln Lys Lys Leu Arg Val Gln Asn Gln Gly His Leu Leu
995 1000 1005
Met Ile Leu Leu His Asn Ala Arg Gln Pro Ser Arg Pro Thr Gly
1010 1015 1020
Arg Thr Pro Thr Thr Arg Leu Met Ala Pro Val Gly Ser Val Met
1025 1030 1035
Ser Cys Ser Leu Leu Thr Gln Pro Ser Pro Ala Ser Ala Cys Thr
1040 1045 1050
Met Pro Pro Leu Leu His Pro Gln Trp Ala Pro His Ser Ala Gly
1055 1060 1065
Leu Ser Pro Gly Ala Cys Arg Pro Ala Cys Thr Cys Ile Ser Met
1070 1075 1080
Thr Thr Ile Ser Arg Ala Thr Trp Arg Leu Arg Ile Pro Ser Leu
1085 1090 1095
Arg Lys Tyr Arg Gln Asn Ile Glu Ile Thr Pro Gln Arg Ser Lys
1100 1105 1110
Ala Gln Val Ser Val Tyr Ser Gly Asn Leu Leu Ser Phe Ser Arg
1115 1120 1125
Arg Gly Met Lys Ser Ser Val Arg Leu Lys Asn Ser Ile Pro His
1130 1135 1140
Val Pro Lys Ala Thr Ala Ala His Ser Val Thr Val Lys Leu Gln
1145 1150 1155
Tyr Leu Phe Phe Leu Thr Val Cys Gly Phe Asp Arg Val Phe Leu
1160 1165 1170
Val Lys Ile Cys Lys Lys Lys Leu Leu Leu Lys Leu Leu Arg Gly
1175 1180 1185
Pro Arg Arg Lys Val Leu Met Val Leu Trp Leu Pro Ala Asn Gln
1190 1195 1200
Ser Leu Gln Lys Ser Gln Val Phe Gln Trp Val Leu Arg Thr Glu
1205 1210 1215
Thr Tyr Met Glu Met His Tyr Gly His Gln Ala Pro Gln Val Ala
1220 1225 1230
Met Leu Pro Lys Leu Leu Cys Arg Gln Met Leu Pro Thr Leu Ser
1235 1240 1245
Thr Leu Gln Gln Arg His Pro Gln Gly Pro Cys Pro Pro Pro Val
1250 1255 1260
Thr Pro Leu Arg Val Gln Ser Val Leu Leu Leu Gly Val Pro Gln
1265 1270 1275
Thr Ala Ala Phe Ser Gly Arg Ile Leu His Gln Pro Glu Met Ala
1280 1285 1290
Ala Met Arg Leu Met Pro Lys Phe Leu Asn Ser Thr Asn Ser Trp
1295 1300 1305
Trp Thr Val Ala Pro Arg Cys Pro Arg Ser Ala Val Asp Ile Ser
1310 1315 1320
Pro Gly Pro Thr Ser Pro Ser Leu Ala Ser Cys Ala Ser Val Ala
1325 1330 1335
Ile Gly Lys Leu Ala Leu Leu Gly Ala Ser Ala Pro Cys Gly Ala
1340 1345 1350
Ala Gly Ala Arg Glu Ala Gly Arg Phe Ala Val Leu Gly Thr Met
1355 1360 1365
Val Met Lys Gly Ala Ala Ala Ala Ser Cys Gln Ser Pro Pro Ser
1370 1375 1380
Pro Arg Glu Thr Thr Pro Ser Ser Asp Ala Thr Arg Arg Thr Arg
1385 1390 1395
Pro Ile Ala Ala Gln Ser Lys Lys Thr Met Thr Ala Ala Gly Leu
1400 1405 1410
Thr Pro Arg Arg Asn Leu Gln Arg Asn Leu Lys Val Leu Gly Ala
1415 1420 1425
Lys Lys Ile Thr Phe Leu Arg Asn Ser Arg Arg Ala Thr Pro Thr
1430 1435 1440
Ser Lys Gly Ser Leu Arg Arg Lys Tyr Leu Arg Val Asn Ile Arg
1445 1450 1455
Lys Leu Ile Trp Thr Lys Gln Arg Ser Phe Leu Ser Leu Phe Pro
1460 1465 1470
Lys Leu Arg Ala Thr Glu Gln Met Thr Asn Val Gly Cys Leu Leu
1475 1480 1485
Lys Lys Ser Ser Gln Leu Arg Arg Ser Trp Arg Asn Val Ser Arg
1490 1495 1500
Ile Ser Asn Met Glu His Arg Leu Thr Met Asp Ser Ala Leu Ser
1505 1510 1515
Leu Thr Lys Arg Glu Gly Pro Glu Thr Ser Glu Lys Lys Arg Lys
1520 1525 1530
Leu Pro Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1182
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> hTPA- and HA-extended poly-FSP polypeptide 4D
<400> 1182
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Asn Arg Lys
20 25 30
Thr Arg Lys Ala Ala Arg Glu Lys His Arg Lys Thr Asp Asp Lys Lys
35 40 45
Lys Lys Ser Thr Glu Lys Thr Lys Asn Ala Lys Lys Met Pro Phe Gln
50 55 60
Gln Arg Pro Pro Leu Gln Pro Val Asn Leu Asp Leu Gln His Gln Arg
65 70 75 80
Arg Arg Lys Lys Lys Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro
85 90 95
Lys Ala Asn Ser Thr Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn
100 105 110
Leu Leu Asn Leu Val Gln Leu Asn Pro His Ser Pro His His Arg Lys
115 120 125
Asp Glu Glu Asp His Gln Lys Arg His His His His Asn Gln Lys Lys
130 135 140
Met Ser Val Arg Ala Ser Val Ser Phe Trp Thr Leu Leu Pro Thr Thr
145 150 155 160
Gly Val Arg Thr Arg Gly Ser Pro Leu Arg Leu Thr Leu Trp Pro Pro
165 170 175
Arg Val Pro Pro Ser Pro Pro Leu Ala Leu Gly Pro Arg Met Gln Leu
180 185 190
Cys Thr Gln Leu Ala Arg Phe Phe Pro Ile Thr Pro Pro Val Trp His
195 200 205
Ile Leu Gly Pro Gln Arg His Thr Pro Gln Ala Pro Leu Arg Leu Trp
210 215 220
Ser Trp Cys Gly Thr Ser Gln Thr Tyr Phe Gly Ser Arg Pro Ser Pro
225 230 235 240
Cys Leu Ser Trp Ser Ser Arg Ile Val Ala Pro Gly His Ala Leu Ser
245 250 255
Cys Arg Thr Arg Arg Arg Trp Ser Ser Lys Arg Trp Ile Phe Ser Asn
260 265 270
Gln Leu Thr Val Gln Met Leu Cys Leu Pro Ile Thr His Pro Phe Ala
275 280 285
Ser Gln Pro Leu Gly Gln Glu Met Pro Asn Asn Thr Gln Ile Arg Leu
290 295 300
Leu Lys Pro Cys Arg Val Asn Ala Val Glu Glu Leu His Ser Arg Arg
305 310 315 320
Met Ser Val Arg Ile Val Lys Asn Trp Val Ser Cys Cys Tyr Val Arg
325 330 335
Leu Ser Ala Val Gly Leu Ser Thr Trp Ser Ala Leu Asp Glu Glu Lys
340 345 350
Lys Asn Gly Arg Ile Ser Ser Leu Lys Lys Lys Val Asn Ala Cys Ser
355 360 365
Ser Leu Ile Leu Ser Phe Gln Arg Val Lys Thr Gly Met Glu Ile Leu
370 375 380
Leu Trp Ile Leu Leu Lys Met Glu Ile Gln Ile Phe Lys Ile Cys Leu
385 390 395 400
Gly Glu Met Gln Leu Cys Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp
405 410 415
Phe Ser Ala Pro Gln Ile Ile Lys Lys Met Lys Lys Arg Ile Met Val
420 425 430
His Glu Leu Lys Lys Asn Leu Leu Leu Pro Met Cys Ser Ser Leu Ala
435 440 445
Leu Pro Thr Gly Leu Thr Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala
450 455 460
Val Leu Ile Ser Ser Ser Thr Ser His Phe Leu Met Arg Ser Pro Val
465 470 475 480
Leu Pro Ser Ser Arg Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met
485 490 495
Trp Thr Trp Ser Ser Trp Leu Lys Asn Glu Gly Asn Asn His Trp Pro
500 505 510
Arg Val Glu Met Pro Thr Gly Trp Leu Leu Val Gly Tyr Asn Thr Arg
515 520 525
Asn Thr Ala Gln Asn Pro Arg Leu Gln Gln His Leu Lys His Trp Gln
530 535 540
Gln Cys Thr Arg Ala Arg Trp Cys Gln Glu Pro Cys Gln Thr Leu Thr
545 550 555 560
Phe Phe His Phe Phe Phe Phe Phe Lys Thr Val Ser Leu Cys Cys Pro
565 570 575
Gly Trp Ser Lys Gly Gln Pro Pro Pro Pro Gly Leu Lys Pro Ser Ser
580 585 590
Leu Ala Ser Gln Val Ala Arg Thr Thr Gly Val Tyr Gln His Val Trp
595 600 605
Leu Ile Cys Phe Val Phe Phe Val Cys Val Glu Thr Gly Phe Cys His
610 615 620
Val Ala Gln Val Gly Leu Glu Arg Leu Val Ser Leu Ser Gly Ile Thr
625 630 635 640
Asp Val Asn His Trp Ala Gln Pro Lys Pro Ser Pro Ser Lys Gly Thr
645 650 655
Gly Met Asn Arg Pro Ile Gly Leu Arg Val Gly Lys Gly Val Trp Ala
660 665 670
Arg Leu Ile Leu Ala Met Thr Leu Thr Leu Asn Gly Met Ala Lys Lys
675 680 685
Ser Gln Gln Pro Leu Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro
690 695 700
Phe Phe Arg Gly Ser Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys
705 710 715 720
Pro Ala Cys Thr Ser Lys Ala Trp Thr Pro Arg Lys Leu Val Gly Arg
725 730 735
Ala Val Arg Arg Lys Gly Ser Pro Leu Trp Asp Cys Ser Thr Thr Thr
740 745 750
Gly Thr His His Gly Cys Leu Trp Glu Ile Pro Ser Val Thr Leu Leu
755 760 765
Ala His Pro Arg Thr Ala Ser Ile Thr Leu Pro Thr Thr Ser Leu Lys
770 775 780
Gly Ser Arg Thr Ser Cys Cys Pro Arg Ser His Pro Arg Leu Pro Arg
785 790 795 800
Thr Lys Trp Pro Leu Gln Cys Leu Leu His Ser Leu Gly Thr Thr Gly
805 810 815
Thr Leu Val Trp Glu Arg Gly Val Leu Gln Met Arg Ser Leu Glu Ala
820 825 830
His Cys Pro Leu Gln Thr Phe His Leu His His Cys Arg Thr Gln Pro
835 840 845
Ser Ser Cys Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp Ser Gly
850 855 860
Ala Val Val Gly Leu Arg Pro Val Ala His His Leu Pro Arg Pro Ile
865 870 875 880
Gln Gly Leu His Cys Pro Gln Ala Pro His Gln Pro Ala Leu Ser Trp
885 890 895
Gly Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys Arg Trp
900 905 910
Pro Arg Arg Cys Gln Lys Lys Val Pro Ser Ala Ser Pro Trp Gly Leu
915 920 925
Val Leu Lys Lys Asn Arg Lys Gln Met Leu Asn Gln Lys Cys Leu Ala
930 935 940
Pro Phe Arg Glu Ser Thr Leu Gly Asn Phe Trp Met Lys Leu Leu Gln
945 950 955 960
Leu Pro Val Val Ile Asn Leu Lys Arg Leu Gln Lys Phe Asn Leu His
965 970 975
Leu Cys Tyr Tyr His Ser Gln Ser Asn Arg Asn Lys Ser Arg Gln Met
980 985 990
Glu Ser Leu Gly Met Lys Leu Gln Ser Gln Lys Ser Gln His His Cys
995 1000 1005
Ala Leu Arg Lys Ile Glu Trp Ala Thr Lys Leu Ser Leu Gly Gly
1010 1015 1020
Lys Ala Gly Pro Gln Ala Gln Glu Lys Ala Thr Ser Arg Ile Leu
1025 1030 1035
Asn Leu Gln Val Leu Lys Lys Ile Leu Arg Ser Phe Met Lys Leu
1040 1045 1050
Tyr His Ser Leu Val Met Cys Leu Arg Leu Arg Thr Lys Leu Glu
1055 1060 1065
Lys Ala Leu Ser Ala Leu Phe Ile Trp Pro Gln His Ser Tyr Lys
1070 1075 1080
Pro Leu Phe Phe His Gly Asp Leu Cys Glu Trp Gly Gly Gln Ala
1085 1090 1095
His Arg Gln Arg Asn Trp Leu Lys Asn Trp Lys Arg Phe Lys Leu
1100 1105 1110
Lys Lys Lys Tyr Ile Gln Lys Lys Lys Gln Lys Ser Asn Lys Ile
1115 1120 1125
Ile Cys Lys Gly His Arg Ile Thr Ile Ile Cys Ile Lys Asn Met
1130 1135 1140
Phe Leu Gln Arg Lys Gly Phe Leu Asn Leu Ser His Val Glu Lys
1145 1150 1155
Phe Cys Arg Gly Gly Pro Ser Ala Ser Asp Arg Cys Cys Ser Cys
1160 1165 1170
Ser Pro Ser Gly Phe Ser Ala Gly Arg Gly Arg Cys Pro Val Gln
1175 1180 1185
Gly Cys Leu Arg Pro His Arg Val Gln Leu Leu Arg Arg Trp Gly
1190 1195 1200
Pro Gly Ser Pro Ala Gly Gln Arg Leu Ser Lys Gly Phe Gln Leu
1205 1210 1215
Leu Arg Trp Trp Gly Pro Gly Ser Pro Ala Pro Glu Pro Arg Lys
1220 1225 1230
Gly Pro Phe Pro Pro Pro Asp Pro Pro Trp Pro Val Thr Ala Val
1235 1240 1245
Thr Val Met Ala Gly Ser Val Pro Ser Ala Gln Ser Val Asp Ala
1250 1255 1260
Leu Glu Ser Pro Gly Pro Leu Ala Leu Glu Gly Pro Ser Ser Pro
1265 1270 1275
Arg Asn Leu Leu Trp Arg Glu Met Ser Ile Phe Leu Pro Gly Ile
1280 1285 1290
Phe Thr Ala Lys Lys Ser Pro Thr Ser Phe Cys Cys Asn Ile Leu
1295 1300 1305
Asn Ser Leu Pro Ser Ser Met Glu Ile Ala Val Leu Gln Glu Asp
1310 1315 1320
Ser Lys Lys Met Thr Gln Lys Gly Gln Ala Phe Gly Ser Leu Cys
1325 1330 1335
Gln Leu Val Ser Ala Asp Phe Ser Ala Pro Gln Val Thr Arg Leu
1340 1345 1350
Arg Ser Leu Asn His Leu Leu Ile Thr Tyr Thr Pro His Ile Cys
1355 1360 1365
Arg His Thr Leu Leu Thr Pro Asp Thr Arg Trp Ile Phe Ser Asn
1370 1375 1380
Gln Leu Gln Thr Val Gln Met Leu Cys Leu Pro Pro Leu Lys Gln
1385 1390 1395
Gly Glu Arg Ile Ile Trp Pro Leu Gly Gly Phe Gln Ile Pro Asn
1400 1405 1410
Phe Phe Trp Ser Leu Gly Ile Gly His Thr Gly Ala Trp Trp His
1415 1420 1425
Thr Gly Arg Arg Arg Arg Glu Trp Gly Gly Ser Thr Val Ser Arg
1430 1435 1440
Ser Pro Leu Trp Ile Ser Ser Met Ile Tyr Leu Arg Gly Met Ala
1445 1450 1455
Phe Ala Ser Asp Ser Ser Ile Arg Thr Thr Arg Val Ser Trp Cys
1460 1465 1470
Arg Arg Cys Gly Ala Lys Ser Ala Ala Ala Ser Ser Ile Glu Ala
1475 1480 1485
Leu Thr Ala Leu Phe Thr Cys Arg Thr Ala Ser Ile Ser Val Asn
1490 1495 1500
Ile Ser Thr Leu Met Ser Ile Leu Glu Ala Leu Lys Lys Lys Pro
1505 1510 1515
Arg Asp Ile Cys Arg Ile Ser Cys Arg Cys Arg Arg Glu Tyr Arg
1520 1525 1530
Val Thr Met Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1535 1540 1545
<210> 1183
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 1D
<400> 1183
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Ala Asp Lys Lys Asn Val Arg Ser
225 230 235 240
Ala Ser Ser Pro Gly His Pro Leu Gly Pro Arg Arg Met Thr Arg Arg
245 250 255
Thr Met Thr Thr Thr Lys Met Met Met Met Arg Arg Thr Lys Arg Arg
260 265 270
Arg Arg Lys Arg Arg Arg Met Thr Met Met Thr Arg Arg Thr Leu Leu
275 280 285
Thr Lys Lys Thr Cys Leu Thr Pro Arg Thr Ser Ala Ala Thr Lys Ala
290 295 300
Leu Pro Arg Gln Thr Ile Ser Gln Arg Arg Pro Ile Gln Thr Pro Pro
305 310 315 320
Gly Thr Ser Leu Ala Ile Trp Gly Arg Arg Ser Lys Ile Glu Ala Ser
325 330 335
Pro Ile Gly Ser Ile Thr Pro Leu Ser Ile Ser Arg Pro Thr Ser Arg
340 345 350
Ala Arg Gln Ser Cys Cys Leu Pro Gly Leu Thr His Pro Ala His Gln
355 360 365
Pro Leu Gly Ser Met Val Gly Ala Gly Thr Gly Gly Gly Pro Ala Cys
370 375 380
Val Pro Val Ala Glu Ala Ser Thr Gly Ala Trp Thr Ala Glu Gly Ala
385 390 395 400
Ala Gly Thr Arg Cys Arg Ala Ser Arg Ala Pro Cys Arg Gln Leu Pro
405 410 415
Ala Ser Ser Pro Thr Lys Cys Glu Ile Cys Val Lys Arg Arg Arg Arg
420 425 430
Arg Lys Arg Ser Ser Gln Ser Arg Ser Pro Val Pro Lys Lys Arg Glu
435 440 445
Arg Met Met Leu Pro Val Arg Ala Arg Thr Ala Arg Ser Ala Leu Pro
450 455 460
Gln Gly Arg Ala Pro Leu Glu Gly Met Leu Leu Pro Arg Ala Leu Pro
465 470 475 480
Ser Leu Leu Ser Arg Met Pro Ala Arg Arg Glu Ser Arg Phe Trp Leu
485 490 495
Ala Leu Gln Ala Leu Gly Leu Arg Pro Pro His Leu Pro Ser Cys His
500 505 510
Pro Leu Pro Gln Leu Leu Gly Pro Pro Pro Pro His Gln Ala Pro Gly
515 520 525
Glu Lys Asn Asp Leu Gln Leu Phe Val Met Ser Asp Thr Thr Tyr Lys
530 535 540
Ile Tyr Trp Thr Val Ile Leu Leu Asn Pro Cys Gly Asn Leu His Leu
545 550 555 560
Lys Thr Thr Ser Leu Asn Ala Lys Lys Met Glu Asp Met Ile Trp Glu
565 570 575
Ser Asn Gln Gln Leu Lys Trp Thr Pro His Ile Leu Lys Ser Ala Ser
580 585 590
Ile Ala Lys Lys Arg Ile Lys Leu Arg Arg Asn Ser Thr Arg Arg Glu
595 600 605
Met Pro Ser Gln Ala Thr Pro Ser Pro Pro Gly Pro Trp Arg Ala Ala
610 615 620
Leu Gly Lys Glu Val Lys Arg Ser Gln Ser Lys Leu Arg Leu Arg Asn
625 630 635 640
Thr Ser Pro Phe Asp Lys Lys Gly Phe Val Ile Leu Ser Asn Met Gly
645 650 655
Gly Asn Arg Ser Ile Cys Leu Thr Ile Val Phe Phe Leu Ala Pro Tyr
660 665 670
Phe Pro Met Pro Ser Ser Trp Ser Ser Ser Gly Arg Thr Arg Leu Pro
675 680 685
Leu Arg Pro Gln Arg Gly Pro Arg Pro Leu His Arg Trp Leu Gln Gln
690 695 700
Thr Thr Gly Cys Ser Gln Arg Arg Gly Asp Cys Pro Arg Thr Met Ala
705 710 715 720
Gly Pro Ser Ala Ser Leu His Pro Ala Ser Gly Arg Ala Ser Arg Lys
725 730 735
Thr Trp Gln Arg Arg Leu Arg Ala Cys Arg Ala Gly Gly Pro Ala Gly
740 745 750
Trp Ala Arg Gln Ala Arg Lys Arg Lys Arg Glu Lys Arg Ser Gln Lys
755 760 765
Ser Arg Gln Asn His Leu Gln Leu Lys Ser Cys Arg Arg Lys Ile Ser
770 775 780
Asn Trp Ser Lys Leu Arg Ser Pro Trp Ile Phe Glu Ala Lys Lys Ser
785 790 795 800
Met Lys Arg Ser Gln Arg Pro Pro Arg Ser Ile Leu Ser Leu Phe Lys
805 810 815
Lys Lys Lys Pro Leu Thr Phe Ser Pro Ser Val Ser Lys Lys Arg Leu
820 825 830
Pro Lys Leu Lys Gly Lys Lys Arg Arg Lys Glu Ile Gln Arg Lys Val
835 840 845
Val Lys Asn Pro Ser Gln Pro Val Pro Leu Arg Asn Asp Gly Ile Thr
850 855 860
Asn Gly Asn Asp Ser Thr Arg Ser Cys Ser Ile Ser Leu Lys Lys Ser
865 870 875 880
Leu Glu Lys Met Pro Leu Met Arg Ser Leu Leu Tyr Ser Arg Met Cys
885 890 895
Leu Val Gln Ile Pro Thr His Thr Trp Glu Pro Asp Tyr Phe Val Ser
900 905 910
Leu Pro Met Met Phe Ser Trp Ala Thr Gln Ser Phe Pro Val Gly Ala
915 920 925
Val Phe Leu Thr Arg Pro Ala Ile Pro Cys Cys Ser Cys Thr Ser His
930 935 940
Ser Asn Pro Trp Ser Gln Ser Thr Leu Ala Ile Arg Phe Ile Ser Ala
945 950 955 960
Pro Gln Pro Ser Ser Ser Thr Val Thr Ala Ala Pro Ser Gly Gln Tyr
965 970 975
Phe Ala Leu Arg Ser Met Pro Lys Ser Arg Asn Gln Val Leu Phe Arg
980 985 990
Arg Asn Leu Thr Pro Ser Gln Leu Arg Thr Leu Ala Pro Pro Tyr Met
995 1000 1005
Leu Leu Pro Gln Ser Leu Ser Gln Ser Leu Ser Arg Lys Gln Ile
1010 1015 1020
Pro Ser Gln Ser Met Leu Val Arg Thr Arg Leu Thr Leu Thr Gly
1025 1030 1035
Thr Arg Ser Ser Gly Thr Arg Ala Ser Pro Ser Ala Val Cys Leu
1040 1045 1050
Cys Cys Trp Thr Cys Pro Ser Arg Ser Phe Pro Ala Ala Ser Pro
1055 1060 1065
Ser Gly Leu Arg Ala Pro Val Gly Ala Gln Ala Pro Pro Glu Val
1070 1075 1080
Thr Leu Arg Ala Ser Cys Ala Ser Ser Ala Ser Lys Ala Cys Ala
1085 1090 1095
Gly Leu Trp Pro Trp Gly Ala Gln Val Arg Met Lys Lys Lys Asp
1100 1105 1110
Ser Thr Ile Phe Ile Tyr Pro Arg Leu Lys Thr Phe Gly Val Pro
1115 1120 1125
Leu Gly Ser Ile Leu Cys Leu Ala Gly Ser Leu Ser Thr Met Met
1130 1135 1140
Ile Ile Ser Thr Thr Arg Gln Glu Cys Gly Arg Arg Ala Ser Val
1145 1150 1155
Pro Cys Arg Pro Met Ile Gly Ser Ala Arg Pro Gly Pro Trp Arg
1160 1165 1170
Thr Ser Ala Met Pro Ser Ala Met Gly Val Ala Leu Pro Thr Ser
1175 1180 1185
Cys Glu Ser Gly Arg Ser Pro Pro Ala Thr Gly Gly Arg Met Pro
1190 1195 1200
Gly Ser Gln Ser Ile Met Met Ser Trp Met Pro Pro Leu Ala Pro
1205 1210 1215
Cys Ala Ala Cys Pro Cys Ser Pro Ala Pro Thr Leu Cys Pro Ala
1220 1225 1230
His Pro Ala Arg Ala Pro Thr Ala Val Pro Ala Phe Thr Pro Leu
1235 1240 1245
Ser Ala His Pro Val Pro Val Leu Ser Gly Cys His Leu Ala Val
1250 1255 1260
Arg Thr Ser Met Leu Thr Leu Leu Pro Met Met Thr Leu Lys Ala
1265 1270 1275
Leu Val Lys Thr Trp Thr Gln Phe Arg Asn Tyr Pro Arg Arg His
1280 1285 1290
Pro His Arg Ser Pro Pro Thr Ser Cys Pro Pro Leu Leu Glu Ala
1295 1300 1305
Phe Pro Leu Pro Arg Ala Ser Leu Arg Ala Thr Val Pro Arg His
1310 1315 1320
Ser Ser Val Leu Ala Thr Gly Leu His Leu His Arg Gln Ile Ser
1325 1330 1335
Leu Pro Leu Arg Gly Phe Leu Leu His Gln Pro Leu Pro Gly Gln
1340 1345 1350
His Leu Trp Leu Ser His Arg Leu Arg Leu Arg Leu Pro Arg Thr
1355 1360 1365
Thr Glu Ile Gln Leu Thr Met Asn Asp Ser Lys His Lys Leu Glu
1370 1375 1380
Ser Pro Ala Leu Lys Gln Val Ser Pro Ala Ser Pro Pro Thr Gln
1385 1390 1395
Gln Pro Gln Thr Pro Gln Asp Ser Arg Gln Val Leu Ala Val Pro
1400 1405 1410
Met Ser Leu Ala Cys Ser Ile Thr Val Ser Phe Val Gly Gln Ile
1415 1420 1425
Ser Thr Leu Val Leu Asp Val Ser Ser Ile Ser His Trp Asn Gly
1430 1435 1440
Ile Trp Glu Val Met Pro Arg Thr Leu Glu Gly Cys Ile Ser Val
1445 1450 1455
Lys Asp His Arg Thr Ser Gln Asn His Ser Lys Cys Ile Thr Glu
1460 1465 1470
Cys Val Arg Thr Ala Leu Asn Thr Lys Cys Glu Ile Cys Val Lys
1475 1480 1485
Asn Thr Ala Ile Leu Ala Ile Thr Leu Ile Thr Pro Gln Asp Pro
1490 1495 1500
His Leu Asp Pro Val Cys His Pro His Arg Arg Pro Gly Trp Lys
1505 1510 1515
Gly His His Arg Val Val Phe Ser His His Pro Ser Gly Ser Thr
1520 1525 1530
Lys Ser His Trp Gln Gln Arg Glu Arg Gly Gly Gly Arg Arg Glu
1535 1540 1545
Lys Lys Gly Cys Arg Glu Ala Ser Arg Ala Gly Gln Phe Pro Val
1550 1555 1560
Trp Arg Arg Thr Ser Arg Gly Met Ser Leu Gln Trp Lys Ser Gly
1565 1570 1575
Asn Ala Cys Thr Pro Leu Arg Cys Pro Ser Arg Ser Pro Ala Thr
1580 1585 1590
Phe Leu Thr Ala Leu Asn Gly Trp His Arg Ser Gly Leu Arg Ala
1595 1600 1605
Gln Thr Ala Phe Phe Leu Leu Asp Ile Ile Leu Arg Arg Ala Arg
1610 1615 1620
Pro Thr Ser Cys Ser Thr Cys Arg Met Trp Trp Arg Leu Pro Cys
1625 1630 1635
Lys Val Thr Glu Ser Ser Leu Ala Lys Lys Thr Leu Thr Asn Gln
1640 1645 1650
Pro Ser Leu Pro Gly Pro Cys Ala Ser Leu Leu Ser Thr Leu Ser
1655 1660 1665
Gln Pro Pro Pro Gln Ala Pro Ser Gln Val Trp Thr Ala Ala Thr
1670 1675 1680
Leu Arg Cys Pro Ala Val Pro Ala Ala Ala Cys Pro Pro Leu Lys
1685 1690 1695
Leu Ala Pro Leu Gln Val Thr Thr Thr Leu Lys Leu Ile Leu Val
1700 1705 1710
Met Leu Glu Ile Val Thr Glu Asn Lys Val Arg Gln Asn Phe Lys
1715 1720 1725
Arg Asn Ser Ser Phe Phe Tyr Thr Ser Asp Arg Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1184
<211> 1744
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 2D
<400> 1184
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Arg Lys Met Gln Ser Leu Asn His
225 230 235 240
Pro Ser Arg Leu Thr Asn Asn Pro Arg Arg Lys Thr Trp Lys Met Arg
245 250 255
Lys Lys Tyr Ala Gln Lys Pro Ser Gln Lys Asn His Leu Tyr Arg Gln
260 265 270
Ile Asn Arg Arg Lys Leu Gln Arg Lys Lys Ser Arg Ser His Leu Asp
275 280 285
Phe Ser Pro Tyr Trp Met Lys Lys Val Lys Arg Ala Arg Asn Arg Asn
290 295 300
Met Lys Lys Thr Met Ser His Leu Ile Ala His Gln Ala Leu Lys Met
305 310 315 320
Ser Gly Leu Arg Leu Phe His Pro Arg Leu Leu Thr Arg Lys Lys Pro
325 330 335
Gly Lys Gln Lys Lys Gly His Met Ile Phe Ser Arg Arg Lys Trp Gln
340 345 350
Ile Arg His Val Leu Lys Asn Leu Ile Pro Ser Leu Asn Ala Gln Trp
355 360 365
Met Phe Leu Arg Ile Ala Ser Pro Gln Ile Met Gln Arg Thr Ser Ala
370 375 380
Asp Arg Phe Arg Met Lys Arg Arg Met Gln Asn Leu Asp Asn Leu Gly
385 390 395 400
Val Pro Trp Pro Leu Leu Pro Gly Leu Leu Leu Ala His Met Tyr Gly
405 410 415
Phe Ser Thr Tyr Gly Thr Gln Lys Gly Glu Cys Val Cys Leu Gln Cys
420 425 430
Leu Ser Gly Ser Ser Leu Phe Ile Leu Lys Gln Pro Leu Asp Leu Lys
435 440 445
Ile Ser Lys Thr Phe Met Ala Ser Pro Gln Ile Met Gln Arg Met Ser
450 455 460
Ala Val Asn Phe Glu Thr Ile Leu Gln Ala His Pro Gln Val Pro Ala
465 470 475 480
Leu Ala Pro Gln Ala Trp Trp Pro Ala Arg Arg Gly Pro Leu Thr Ser
485 490 495
Ala Pro Ser Ala Gln Gln Ser Leu Thr Arg Thr Leu Glu Ser Ala Gly
500 505 510
Leu Phe Pro Trp Leu His Thr Gln Cys Arg Ala Phe Ile His Thr Pro
515 520 525
Arg Ser Pro Gly Cys Ser Val Tyr Ala Asn Met Cys Trp Arg Tyr Lys
530 535 540
Lys Arg Gly Val Ile Ala Trp Arg Ile Tyr Pro Pro Ser Thr Cys Ser
545 550 555 560
Leu Pro Cys Arg Gly Leu Ile Leu Ile Gln His Gly Gly Ile Phe Thr
565 570 575
Phe Arg Phe Trp Val Glu Lys Leu Ser Trp Asn Ile Cys Lys Asn Leu
580 585 590
Ser Leu Tyr Leu Asp Lys Phe Val Gln Arg Leu Leu Tyr Val Tyr Ile
595 600 605
Ile Glu Thr Asn Val Phe Val Leu Asn Leu Phe His Val Pro Val Asn
610 615 620
Gln Ile Phe Met Met Ala Phe Tyr Leu Lys Tyr Thr Glu Lys Ala Trp
625 630 635 640
Val Met Glu Leu Glu Trp Leu Ile Gln Gln Gln Cys Tyr Gln Arg Lys
645 650 655
Arg Met Lys Thr Gly Ala Ile Gln Glu Lys Gly Ala Ile Gln Glu Lys
660 665 670
Gly Ala Met Thr Lys Arg Ile Cys Val Val Asn Phe Glu Ala Cys Arg
675 680 685
Glu Met Glu Ser Leu Ser Ala Pro Glu Lys Ile Thr Leu Phe Glu Ala
690 695 700
His Met Ala Arg Cys Thr Ser Ile Asn Val Leu Cys Val Arg Ala Ser
705 710 715 720
Leu Ile Glu Lys Leu Met Lys Glu Lys Arg Lys Met Lys Arg Asn Gln
725 730 735
Val Ala Ser Pro Gln Ile Met Gln Arg Leu Phe Ile Lys Gly Tyr Gln
740 745 750
Asn Asn His Phe Thr Phe His Leu Gln Asn Phe Ala Phe Phe Ser Ser
755 760 765
Phe Gly Asn Asn Lys Tyr Ile Asn Ile Leu Thr Phe Leu Pro Ser Arg
770 775 780
Phe Pro Trp Gly Pro Pro Pro Leu Gly Ala Leu Arg Ala Thr Ala Pro
785 790 795 800
Ala Thr Ala Ala Pro Gln Ala Gln Thr Pro His Trp Arg Ala Ala Thr
805 810 815
Thr Ser Ser Met Ser Ser Ser Pro Arg Ala Glu Pro Thr Ser Ser Ser
820 825 830
Ser Trp Ala Thr Cys Trp Pro Arg Cys Cys Ser Ser Ser Cys Tyr Trp
835 840 845
Ser Leu Ser Ser Trp Pro Pro Ala Gly Ala Ala Glu Ala Thr Asn Thr
850 855 860
Arg Thr Arg Ser Arg Glu Ser Gln Arg Gly Arg Met Leu Thr Trp Arg
865 870 875 880
Ser Ser Leu Trp Leu Gln Gly Thr Arg Cys Phe Thr Gly Val Arg Thr
885 890 895
Ser Ser Arg Cys Ser Leu Met Glu Gln Ile Pro His Leu Lys Ser Asn
900 905 910
Ser Arg Lys Lys Leu Leu Glu Asp Met Lys Gln Asn Gly Phe Thr Arg
915 920 925
Arg Arg Asn Ser Arg Lys Gln Ser Gln Val Gln Leu Ala Ile Gln Val
930 935 940
Leu Leu Val Asp Lys His Lys Tyr Phe Leu Phe Gly Arg Ala Thr Phe
945 950 955 960
Leu Leu Ala Leu Trp Glu Cys Ser Leu Pro Gln Ala Arg Leu Cys Leu
965 970 975
Ile Val Ser Arg Thr Leu Leu Leu Val Gln Ser Arg His Pro Ser Trp
980 985 990
Pro Trp Thr Arg Cys Leu Arg Met Arg Pro Pro Arg Ser His Trp Asn
995 1000 1005
Ser Ala Tyr Leu Gly Arg Thr Leu Leu Val Thr Cys Ile Leu Tyr
1010 1015 1020
His Arg Trp Ile Val Thr Ser Met Cys Gln Ser Gln Arg Trp Leu
1025 1030 1035
Thr Ser Thr Thr Ser Arg Ser Ser Ala Leu Met Trp Thr Trp Trp
1040 1045 1050
Cys Thr Arg Gly Gly Gly Lys Arg Lys Lys Lys Met Cys Lys Val
1055 1060 1065
Ser Gly Gly Cys Thr Ala Cys Val Glu Arg Cys Pro Trp Lys Gly
1070 1075 1080
Ile Cys Trp Lys Trp Pro Val Thr Val Ala Ala Met Ser Arg Thr
1085 1090 1095
Pro Pro Arg Arg Val Cys Gly His Arg Glu Gly Ser Glu Ser Asp
1100 1105 1110
Asn Leu Gly Leu Leu Tyr Ser Phe Pro Pro Val Leu Phe Lys Ala
1115 1120 1125
Asp Gln Ser Glu Ser Ser Leu Ser Ser Gly Asn Ser Val Ile Val
1130 1135 1140
His Lys Ile Val Leu Val Phe Leu Lys Ser Leu Ser Ser Tyr Asn
1145 1150 1155
Cys Glu Arg Arg Ile Ser Gly Ile Gln Lys Arg Ala Ile Glu Phe
1160 1165 1170
Ala Val Leu Lys Leu Leu Asn Met Asp Leu Gly Lys Gly Leu Thr
1175 1180 1185
His Pro Val Pro Leu Lys Arg Thr Leu Gln Asn Lys Arg Asn Lys
1190 1195 1200
Asn Ile Lys Arg Val Asn Gln Lys Lys Gly Asn Ile Lys Arg Lys
1205 1210 1215
Ser Ile Leu Leu His Leu Ile Val Leu Asn Ser Pro Glu Ser Asn
1220 1225 1230
Arg Glu Lys Ile Ile Asn Pro Thr Ile Ser Cys Pro Phe Gln Ser
1235 1240 1245
Pro Thr Lys Arg Leu Gly Ser Pro Pro Leu His Leu Cys Gln Pro
1250 1255 1260
Leu Arg Pro Tyr Pro Ile Ser Glu Gly Leu Thr Met Thr Thr Gly
1265 1270 1275
Arg Asn Ile Asn Ser Asn Ser Leu Met Thr Asn Cys Leu Phe Ser
1280 1285 1290
Pro Ile Phe Leu Cys His His Ala Ile Met His Arg Lys Met Thr
1295 1300 1305
Ser Pro His Phe Arg Leu Phe Ser Ser Lys Ile Pro His Pro Gln
1310 1315 1320
Val Pro Ser Val Val Ala Leu Cys Lys Phe Thr His Pro Cys Thr
1325 1330 1335
Met Leu Leu Pro Gln Gly Ala Phe Trp Lys Pro Pro Ser Gln Gly
1340 1345 1350
Ile Ser Ser Cys Leu Met Thr Gly Cys Trp Gln Trp Ser Ser Val
1355 1360 1365
Thr Ser Leu Glu Trp Thr Ala Gln Glu Arg Gly Cys Ser Ser Trp
1370 1375 1380
Leu Met Lys Gln Thr Trp Met Lys Ser Trp Ser Leu Arg Asp Pro
1385 1390 1395
Ser Tyr Arg Ser Ile Leu Glu Tyr Val Ser Thr Arg Val Leu Trp
1400 1405 1410
Met Pro Thr Ser Thr Val Pro Lys Phe Phe Leu Thr Phe Ser Gln
1415 1420 1425
Ile Arg Met Cys Ala Leu Ser His Pro Ser Phe Tyr Ile Ser Ser
1430 1435 1440
Thr Val Cys Phe Leu Ser Lys His Cys Met Thr Ala Cys Thr Pro
1445 1450 1455
Gly Thr Ser Leu Gln Cys Tyr Leu Asn Leu Ala Asn Gly Leu Trp
1460 1465 1470
Phe Asn Leu Ile Phe Arg Asn Lys Lys Thr Lys Leu Trp Phe Ser
1475 1480 1485
Leu Ile Asn Ile His His Arg Lys Asn Pro Leu Leu Pro Met Arg
1490 1495 1500
Leu Glu Lys Lys Ala Thr Trp Met Arg Arg Thr Glu Leu Ser Leu
1505 1510 1515
Glu Pro Trp Ile Pro Tyr Leu His Gln Gln Lys Thr Gln Trp Leu
1520 1525 1530
Pro Met Arg Ser Leu Gly Glu Pro Trp Arg Ala Gly Phe Gln Trp
1535 1540 1545
Gly Glu Ser Pro Trp Gln Val Met Ala Ser Leu Thr Gly Arg Arg
1550 1555 1560
Lys Lys Arg Glu Asp His Cys Gly Leu Gln Glu Lys Lys Ser Arg
1565 1570 1575
Lys Leu Met Ser Ser Cys Ala Ala Pro Pro His Arg Leu Leu Gly
1580 1585 1590
Pro Ser Arg Trp Gly Ser Cys Gly Arg Ala Cys Ser Cys Gly Arg
1595 1600 1605
Gly Cys Gly Thr Pro Arg Gly Asp Trp Lys Arg His Pro Pro Arg
1610 1615 1620
Arg Ile Leu Phe His Val Arg Asn Ile Val Tyr Gly Ile Gln Val
1625 1630 1635
Met Leu Cys Cys His Pro Ala Trp Leu Ser Pro Ile Ser Ala Cys
1640 1645 1650
Pro Arg Leu Leu Pro Tyr Pro Phe His Val Leu Ala Leu Glu Val
1655 1660 1665
Thr Phe Pro Pro Gly Thr Ala Met Pro Gln Met Gln Leu Gln Ala
1670 1675 1680
Leu Ala Met Trp Glu Lys Gly Trp Asp Lys Pro Leu Glu Asn Thr
1685 1690 1695
Gln Ile Pro Arg Thr Ser Pro Leu Trp Lys Ile Thr Met Val Leu
1700 1705 1710
Thr Tyr Pro Asn Cys Val Val His Val Leu Met Phe Gly Gly Lys
1715 1720 1725
Lys Arg Ser Lys Phe Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1730 1735 1740
Ser
<210> 1185
<211> 1749
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 3D
<400> 1185
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Gln Asn Thr Arg Ser Thr Asn Leu
225 230 235 240
Glu Lys Asn Pro Ser Leu Lys Lys Gln Ser Gln Arg Arg Gly Lys Leu
245 250 255
Ser Ser Arg Lys Lys Gly His Thr Lys Asn Arg Arg Lys Ala Lys Arg
260 265 270
Lys Pro Gln Ile Ser Gln Lys Lys Asp Pro Ala Gly Lys Leu Lys Lys
275 280 285
His Leu Asn Arg Lys Leu His Leu Thr Arg Ser Cys Leu Ile Asp Leu
290 295 300
Thr Met Met Met Ser Gln Lys Leu Trp Lys Asn Gln Arg Lys Arg Ile
305 310 315 320
Pro Leu Pro Ser Pro Arg Gln His Leu Leu Pro Gln Tyr Pro Leu His
325 330 335
Pro Pro Pro Pro Cys Leu Leu Leu Leu His His Arg His His Leu Ala
340 345 350
Phe Leu Glu Met Ala Cys Ser Ser Gln His Thr His Ser Ile Lys Ile
355 360 365
Trp Ile Ser Phe Ser His Glu Asp Leu Pro Arg Met Leu Pro Ile Ser
370 375 380
Ser Pro Leu His Arg Pro Gln Met Pro Phe Trp Thr Cys Thr Phe Pro
385 390 395 400
Ala Thr Thr Trp Gly Thr Trp Glu Thr Pro Ser Thr Trp Gly Trp Arg
405 410 415
Thr Phe Gly Pro Val Tyr Tyr Val Cys Asn Arg Met Asn Val Ser Ser
420 425 430
Val Leu Lys Pro Phe Leu Phe Thr Val Pro Ile Glu Asp Met Arg Glu
435 440 445
Cys Thr Leu Gly Arg Asn Arg Met Asn Val Ser Ser Val Leu Lys Pro
450 455 460
Cys Leu Ile Pro Val Pro Ile Leu Thr Thr Leu Ser Phe Val Leu Ile
465 470 475 480
Glu Glu Ser Arg Arg Asn Arg Arg Tyr Arg Lys Ile Tyr Gly Glu Leu
485 490 495
Lys Met Ser Leu Gln Ala Leu Pro Leu Thr Phe Ser Thr Leu Leu Trp
500 505 510
Asp Ser Arg His Thr Thr Thr Thr Ser Ser Pro Arg Arg Ser Pro Ala
515 520 525
Leu Arg Ala Arg Gly Gly Thr Thr Ile Gly Glu Val Thr Ser Arg Gly
530 535 540
Ala Ser Ser Ser Thr Ser Arg Asp Ser Arg Ser Phe Phe Thr Ser Ala
545 550 555 560
His Pro Ser Arg Pro Cys Arg Met Arg Leu Tyr Gln Ser Asn Gly Met
565 570 575
Glu Ala Cys Gly Thr His Pro Thr Pro Arg Leu Ser Arg Gly Pro Pro
580 585 590
Leu His Thr Arg Thr Met Ser Leu Ser Asn Ile Leu Met Lys Phe Arg
595 600 605
Leu Met Leu Gln Lys Gln Cys Cys Tyr Asn Leu Val Ile Lys His Pro
610 615 620
Leu Ile Phe Arg Ile Asn Leu Arg Arg Gln Gly Lys Thr Lys Asp Gly
625 630 635 640
Val Val Gln Ser Leu Gly Phe Leu Asn Gln Gln Ile Ile Leu Gln Lys
645 650 655
Glu Phe Phe Ile Cys Leu Leu Met Phe Ile Lys Arg Trp Lys Pro Ala
660 665 670
Ala Thr Lys Thr Pro Pro Pro Leu Ile Leu Trp Pro Gln Ala Ala Pro
675 680 685
Val His Lys Lys Arg Gly Leu Phe Ser Leu Phe Phe Ser His Cys Leu
690 695 700
Cys His Gln Met Lys Cys Leu Thr Ala Val Asp Cys Leu Gln Ala Phe
705 710 715 720
Trp Asp Met Met Ile Arg Lys Ile Gln Lys Arg Arg Arg Thr Ala Asn
725 730 735
Arg Leu Lys Lys Lys Tyr Leu Val Gln Cys Thr Asn Leu Ser Val Pro
740 745 750
Met Met Leu Thr Ile Leu Ile Trp Lys Arg Val Phe Ile Leu Leu Leu
755 760 765
Ser Asp Lys Lys Cys Leu Arg Val Arg Cys Gly Gly Trp Leu Cys Gly
770 775 780
Trp Thr Pro Arg Gly Lys Asn Lys Lys Arg Arg Lys Leu Arg Pro Lys
785 790 795 800
His Leu Lys Lys Thr Ser Ala Lys Val Ser Val Ile Thr Met Lys Leu
805 810 815
Trp Glu Lys His Phe Lys Gly Leu Asn Trp Asn Leu Val Val Trp Ile
820 825 830
Leu Asn Leu Lys Met Met Trp Leu Lys Lys Ser Thr Lys Ser Arg Gln
835 840 845
Ser Ser Pro Phe Leu Ala Arg Ser Trp Asn Thr Met Gln Trp Asn Asn
850 855 860
Lys Lys Met Ala Met Thr Val Ile Ala Gly Ala His His Cys Gln Tyr
865 870 875 880
Lys Leu Thr Tyr Thr Lys Val Trp Lys Met Asn Trp Lys Lys Met Met
885 890 895
Ile Gly Ser Gln His Leu Leu Phe Ser Pro Leu Asp Ser Ser Pro Leu
900 905 910
Gln Leu Leu Leu His Pro His Gly Lys Arg Cys Asn Pro Cys Cys Arg
915 920 925
Leu Thr Trp Met Ser Arg Glu Trp Glu Lys Arg Lys Gln Ile Leu Gly
930 935 940
Gly Gly Gly Lys Tyr Lys Glu Tyr Phe Leu Lys Arg Ile Leu Ile Arg
945 950 955 960
Lys Ala Met Thr Val Leu Ala Gly Asp Lys Lys Gly Leu Gly Arg Phe
965 970 975
Met Arg Cys Val Gln Ser Glu Thr Lys Ala Val Ser Leu Gln Leu Pro
980 985 990
Leu Gly Arg Arg Lys Ser Gly Val Met Lys Cys Trp Asp Leu Cys Pro
995 1000 1005
Arg Leu Asp Phe His Pro Arg Ser Ser Ser Gly Gly Glu Lys Leu
1010 1015 1020
Lys His Cys Phe Lys Ala Trp Gly Leu Cys Phe Phe Tyr Leu Leu
1025 1030 1035
Tyr Phe Glu Lys Lys Arg Pro Glu Trp Leu Ser Val Asp Pro Pro
1040 1045 1050
Gly Ser Val Trp Ile Leu Pro Cys Met Asp Leu Asp Gly Met Leu
1055 1060 1065
Thr Val Ile Gly Gln Gly Leu Val Gly Met Thr Pro Arg Asp Leu
1070 1075 1080
Gly Thr Val Ala Gly Ala Thr Ala Gln Ile Gln Arg Pro Ile Gln
1085 1090 1095
Val Gln Thr Gly Gly Arg Leu Phe Leu Ile His Leu Arg Lys Val
1100 1105 1110
Asp Thr His His Leu Gln Val Val Thr Lys Thr Val Thr Ala Thr
1115 1120 1125
Thr Ala Asp Gly Gln Arg Met Arg Arg Leu Lys Cys Lys Ala Cys
1130 1135 1140
Arg Leu Arg Trp Ala Arg Pro Glu Pro Ala Ala Gln Ala Pro Pro
1145 1150 1155
Lys Ser His Phe Pro Pro His Pro Ser Gly Pro Ser Arg Thr Ser
1160 1165 1170
Ser Leu Gln Leu Arg Pro Ile Pro Pro His Leu Arg His Pro Leu
1175 1180 1185
Leu Leu Lys Gly Lys Asn Ser Pro Cys Cys Gln Lys Lys Leu Arg
1190 1195 1200
Val Gln Asn Gln Gly His Leu Leu Met Ile Leu Leu His Asn Ala
1205 1210 1215
Arg Gln Pro Ser Arg Pro Thr Gly Arg Thr Pro Thr Thr Arg Leu
1220 1225 1230
Met Ala Pro Val Gly Ser Val Met Ser Cys Ser Leu Leu Thr Gln
1235 1240 1245
Pro Ser Pro Ala Ser Ala Cys Thr Met Pro Pro Leu Leu His Pro
1250 1255 1260
Gln Trp Ala Pro His Ser Ala Gly Leu Ser Pro Gly Ala Cys Arg
1265 1270 1275
Pro Ala Cys Thr Cys Ile Ser Met Thr Thr Ile Ser Arg Ala Thr
1280 1285 1290
Trp Arg Leu Arg Ile Pro Ser Leu Arg Lys Tyr Arg Gln Asn Ile
1295 1300 1305
Glu Ile Thr Pro Gln Arg Ser Lys Ala Gln Val Ser Val Tyr Ser
1310 1315 1320
Gly Asn Leu Leu Ser Phe Ser Arg Arg Gly Met Lys Ser Ser Val
1325 1330 1335
Arg Leu Lys Asn Ser Ile Pro His Val Pro Lys Ala Thr Ala Ala
1340 1345 1350
His Ser Val Thr Val Lys Leu Gln Tyr Leu Phe Phe Leu Thr Val
1355 1360 1365
Cys Gly Phe Asp Arg Val Phe Leu Val Lys Ile Cys Lys Lys Lys
1370 1375 1380
Leu Leu Leu Lys Leu Leu Arg Gly Pro Arg Arg Lys Val Leu Met
1385 1390 1395
Val Leu Trp Leu Pro Ala Asn Gln Ser Leu Gln Lys Ser Gln Val
1400 1405 1410
Phe Gln Trp Val Leu Arg Thr Glu Thr Tyr Met Glu Met His Tyr
1415 1420 1425
Gly His Gln Ala Pro Gln Val Ala Met Leu Pro Lys Leu Leu Cys
1430 1435 1440
Arg Gln Met Leu Pro Thr Leu Ser Thr Leu Gln Gln Arg His Pro
1445 1450 1455
Gln Gly Pro Cys Pro Pro Pro Val Thr Pro Leu Arg Val Gln Ser
1460 1465 1470
Val Leu Leu Leu Gly Val Pro Gln Thr Ala Ala Phe Ser Gly Arg
1475 1480 1485
Ile Leu His Gln Pro Glu Met Ala Ala Met Arg Leu Met Pro Lys
1490 1495 1500
Phe Leu Asn Ser Thr Asn Ser Trp Trp Thr Val Ala Pro Arg Cys
1505 1510 1515
Pro Arg Ser Ala Val Asp Ile Ser Pro Gly Pro Thr Ser Pro Ser
1520 1525 1530
Leu Ala Ser Cys Ala Ser Val Ala Ile Gly Lys Leu Ala Leu Leu
1535 1540 1545
Gly Ala Ser Ala Pro Cys Gly Ala Ala Gly Ala Arg Glu Ala Gly
1550 1555 1560
Arg Phe Ala Val Leu Gly Thr Met Val Met Lys Gly Ala Ala Ala
1565 1570 1575
Ala Ser Cys Gln Ser Pro Pro Ser Pro Arg Glu Thr Thr Pro Ser
1580 1585 1590
Ser Asp Ala Thr Arg Arg Thr Arg Pro Ile Ala Ala Gln Ser Lys
1595 1600 1605
Lys Thr Met Thr Ala Ala Gly Leu Thr Pro Arg Arg Asn Leu Gln
1610 1615 1620
Arg Asn Leu Lys Val Leu Gly Ala Lys Lys Ile Thr Phe Leu Arg
1625 1630 1635
Asn Ser Arg Arg Ala Thr Pro Thr Ser Lys Gly Ser Leu Arg Arg
1640 1645 1650
Lys Tyr Leu Arg Val Asn Ile Arg Lys Leu Ile Trp Thr Lys Gln
1655 1660 1665
Arg Ser Phe Leu Ser Leu Phe Pro Lys Leu Arg Ala Thr Glu Gln
1670 1675 1680
Met Thr Asn Val Gly Cys Leu Leu Lys Lys Ser Ser Gln Leu Arg
1685 1690 1695
Arg Ser Trp Arg Asn Val Ser Arg Ile Ser Asn Met Glu His Arg
1700 1705 1710
Leu Thr Met Asp Ser Ala Leu Ser Leu Thr Lys Arg Glu Gly Pro
1715 1720 1725
Glu Thr Ser Glu Lys Lys Arg Lys Leu Pro Gly Tyr Pro Tyr Asp
1730 1735 1740
Val Pro Asp Tyr Ala Ser
1745
<210> 1186
<211> 1750
<212> PRT
<213> Artificial Sequence
<220>
<223> hINV- and HA-extended poly-FSP polypeptide 4D
<400> 1186
Met His Arg Arg Arg Ser Arg Ser Cys Arg Glu Asp Gln Lys Pro Val
1 5 10 15
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
20 25 30
Leu Gly Arg Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
35 40 45
Leu Tyr Thr Gly Phe Ser Ile Leu Val Thr Leu Leu Leu Ala Gly Gln
50 55 60
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
65 70 75 80
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
85 90 95
Leu Pro Lys Pro Pro Lys Pro Val Ser Lys Met Arg Met Ala Thr Pro
100 105 110
Leu Leu Met Gln Ala Leu Pro Met Gly Ala Leu Pro Gln Gly Pro Met
115 120 125
Gln Asn Ala Thr Lys Tyr Gly Asn Met Thr Glu Asp His Val Met His
130 135 140
Leu Leu Gln Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
145 150 155 160
Ser Phe Pro Glu Asn Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile
165 170 175
Asp Trp Lys Val Phe Glu Ser Trp Met His His Trp Leu Leu Phe Glu
180 185 190
Met Ser Arg His Ser Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys
195 200 205
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
210 215 220
Gln Asp Leu Gly Pro Val Pro Met Asn Arg Lys Thr Arg Lys Ala Ala
225 230 235 240
Arg Glu Lys His Arg Lys Thr Asp Asp Lys Lys Lys Lys Ser Thr Glu
245 250 255
Lys Thr Lys Asn Ala Lys Lys Met Pro Phe Gln Gln Arg Pro Pro Leu
260 265 270
Gln Pro Val Asn Leu Asp Leu Gln His Gln Arg Arg Arg Lys Lys Lys
275 280 285
Lys Asp Lys Val Glu Ile Arg Asn Arg Ser Pro Lys Ala Asn Ser Thr
290 295 300
Glu Cys Gln Gly Glu His Ser Arg Glu Gln Asn Leu Leu Asn Leu Val
305 310 315 320
Gln Leu Asn Pro His Ser Pro His His Arg Lys Asp Glu Glu Asp His
325 330 335
Gln Lys Arg His His His His Asn Gln Lys Lys Met Ser Val Arg Ala
340 345 350
Ser Val Ser Phe Trp Thr Leu Leu Pro Thr Thr Gly Val Arg Thr Arg
355 360 365
Gly Ser Pro Leu Arg Leu Thr Leu Trp Pro Pro Arg Val Pro Pro Ser
370 375 380
Pro Pro Leu Ala Leu Gly Pro Arg Met Gln Leu Cys Thr Gln Leu Ala
385 390 395 400
Arg Phe Phe Pro Ile Thr Pro Pro Val Trp His Ile Leu Gly Pro Gln
405 410 415
Arg His Thr Pro Gln Ala Pro Leu Arg Leu Trp Ser Trp Cys Gly Thr
420 425 430
Ser Gln Thr Tyr Phe Gly Ser Arg Pro Ser Pro Cys Leu Ser Trp Ser
435 440 445
Ser Arg Ile Val Ala Pro Gly His Ala Leu Ser Cys Arg Thr Arg Arg
450 455 460
Arg Trp Ser Ser Lys Arg Trp Ile Phe Ser Asn Gln Leu Thr Val Gln
465 470 475 480
Met Leu Cys Leu Pro Ile Thr His Pro Phe Ala Ser Gln Pro Leu Gly
485 490 495
Gln Glu Met Pro Asn Asn Thr Gln Ile Arg Leu Leu Lys Pro Cys Arg
500 505 510
Val Asn Ala Val Glu Glu Leu His Ser Arg Arg Met Ser Val Arg Ile
515 520 525
Val Lys Asn Trp Val Ser Cys Cys Tyr Val Arg Leu Ser Ala Val Gly
530 535 540
Leu Ser Thr Trp Ser Ala Leu Asp Glu Glu Lys Lys Asn Gly Arg Ile
545 550 555 560
Ser Ser Leu Lys Lys Lys Val Asn Ala Cys Ser Ser Leu Ile Leu Ser
565 570 575
Phe Gln Arg Val Lys Thr Gly Met Glu Ile Leu Leu Trp Ile Leu Leu
580 585 590
Lys Met Glu Ile Gln Ile Phe Lys Ile Cys Leu Gly Glu Met Gln Leu
595 600 605
Cys Gly Gln Ala Phe Gly Ser Phe Ser Ala Asp Phe Ser Ala Pro Gln
610 615 620
Ile Ile Lys Lys Met Lys Lys Arg Ile Met Val His Glu Leu Lys Lys
625 630 635 640
Asn Leu Leu Leu Pro Met Cys Ser Ser Leu Ala Leu Pro Thr Gly Leu
645 650 655
Thr Ser Leu Ile Leu Pro Ser Ser Asp Leu Ala Val Leu Ile Ser Ser
660 665 670
Ser Thr Ser His Phe Leu Met Arg Ser Pro Val Leu Pro Ser Ser Arg
675 680 685
Leu Thr Cys Ala Ser Pro Gln Leu Pro Arg Met Trp Thr Trp Ser Ser
690 695 700
Trp Leu Lys Asn Glu Gly Asn Asn His Trp Pro Arg Val Glu Met Pro
705 710 715 720
Thr Gly Trp Leu Leu Val Gly Tyr Asn Thr Arg Asn Thr Ala Gln Asn
725 730 735
Pro Arg Leu Gln Gln His Leu Lys His Trp Gln Gln Cys Thr Arg Ala
740 745 750
Arg Trp Cys Gln Glu Pro Cys Gln Thr Leu Thr Phe Phe His Phe Phe
755 760 765
Phe Phe Phe Lys Thr Val Ser Leu Cys Cys Pro Gly Trp Ser Lys Gly
770 775 780
Gln Pro Pro Pro Pro Gly Leu Lys Pro Ser Ser Leu Ala Ser Gln Val
785 790 795 800
Ala Arg Thr Thr Gly Val Tyr Gln His Val Trp Leu Ile Cys Phe Val
805 810 815
Phe Phe Val Cys Val Glu Thr Gly Phe Cys His Val Ala Gln Val Gly
820 825 830
Leu Glu Arg Leu Val Ser Leu Ser Gly Ile Thr Asp Val Asn His Trp
835 840 845
Ala Gln Pro Lys Pro Ser Pro Ser Lys Gly Thr Gly Met Asn Arg Pro
850 855 860
Ile Gly Leu Arg Val Gly Lys Gly Val Trp Ala Arg Leu Ile Leu Ala
865 870 875 880
Met Thr Leu Thr Leu Asn Gly Met Ala Lys Lys Ser Gln Gln Pro Leu
885 890 895
Gln Val Val Leu Arg Leu Gly Asn Leu Pro Pro Phe Phe Arg Gly Ser
900 905 910
Glu Val Pro Phe Pro Arg Pro Cys Arg Thr Lys Pro Ala Cys Thr Ser
915 920 925
Lys Ala Trp Thr Pro Arg Lys Leu Val Gly Arg Ala Val Arg Arg Lys
930 935 940
Gly Ser Pro Leu Trp Asp Cys Ser Thr Thr Thr Gly Thr His His Gly
945 950 955 960
Cys Leu Trp Glu Ile Pro Ser Val Thr Leu Leu Ala His Pro Arg Thr
965 970 975
Ala Ser Ile Thr Leu Pro Thr Thr Ser Leu Lys Gly Ser Arg Thr Ser
980 985 990
Cys Cys Pro Arg Ser His Pro Arg Leu Pro Arg Thr Lys Trp Pro Leu
995 1000 1005
Gln Cys Leu Leu His Ser Leu Gly Thr Thr Gly Thr Leu Val Trp
1010 1015 1020
Glu Arg Gly Val Leu Gln Met Arg Ser Leu Glu Ala His Cys Pro
1025 1030 1035
Leu Gln Thr Phe His Leu His His Cys Arg Thr Gln Pro Ser Ser
1040 1045 1050
Cys Pro Pro Ala Trp Ile Leu Tyr Gln Gly Gln Trp Ser Gly Ala
1055 1060 1065
Val Val Gly Leu Arg Pro Val Ala His His Leu Pro Arg Pro Ile
1070 1075 1080
Gln Gly Leu His Cys Pro Gln Ala Pro His Gln Pro Ala Leu Ser
1085 1090 1095
Trp Gly Lys Trp Pro Val Gly Met Thr Gly Pro Ala Arg Cys Cys
1100 1105 1110
Arg Trp Pro Arg Arg Cys Gln Lys Lys Val Pro Ser Ala Ser Pro
1115 1120 1125
Trp Gly Leu Val Leu Lys Lys Asn Arg Lys Gln Met Leu Asn Gln
1130 1135 1140
Lys Cys Leu Ala Pro Phe Arg Glu Ser Thr Leu Gly Asn Phe Trp
1145 1150 1155
Met Lys Leu Leu Gln Leu Pro Val Val Ile Asn Leu Lys Arg Leu
1160 1165 1170
Gln Lys Phe Asn Leu His Leu Cys Tyr Tyr His Ser Gln Ser Asn
1175 1180 1185
Arg Asn Lys Ser Arg Gln Met Glu Ser Leu Gly Met Lys Leu Gln
1190 1195 1200
Ser Gln Lys Ser Gln His His Cys Ala Leu Arg Lys Ile Glu Trp
1205 1210 1215
Ala Thr Lys Leu Ser Leu Gly Gly Lys Ala Gly Pro Gln Ala Gln
1220 1225 1230
Glu Lys Ala Thr Ser Arg Ile Leu Asn Leu Gln Val Leu Lys Lys
1235 1240 1245
Ile Leu Arg Ser Phe Met Lys Leu Tyr His Ser Leu Val Met Cys
1250 1255 1260
Leu Arg Leu Arg Thr Lys Leu Glu Lys Ala Leu Ser Ala Leu Phe
1265 1270 1275
Ile Trp Pro Gln His Ser Tyr Lys Pro Leu Phe Phe His Gly Asp
1280 1285 1290
Leu Cys Glu Trp Gly Gly Gln Ala His Arg Gln Arg Asn Trp Leu
1295 1300 1305
Lys Asn Trp Lys Arg Phe Lys Leu Lys Lys Lys Tyr Ile Gln Lys
1310 1315 1320
Lys Lys Gln Lys Ser Asn Lys Ile Ile Cys Lys Gly His Arg Ile
1325 1330 1335
Thr Ile Ile Cys Ile Lys Asn Met Phe Leu Gln Arg Lys Gly Phe
1340 1345 1350
Leu Asn Leu Ser His Val Glu Lys Phe Cys Arg Gly Gly Pro Ser
1355 1360 1365
Ala Ser Asp Arg Cys Cys Ser Cys Ser Pro Ser Gly Phe Ser Ala
1370 1375 1380
Gly Arg Gly Arg Cys Pro Val Gln Gly Cys Leu Arg Pro His Arg
1385 1390 1395
Val Gln Leu Leu Arg Arg Trp Gly Pro Gly Ser Pro Ala Gly Gln
1400 1405 1410
Arg Leu Ser Lys Gly Phe Gln Leu Leu Arg Trp Trp Gly Pro Gly
1415 1420 1425
Ser Pro Ala Pro Glu Pro Arg Lys Gly Pro Phe Pro Pro Pro Asp
1430 1435 1440
Pro Pro Trp Pro Val Thr Ala Val Thr Val Met Ala Gly Ser Val
1445 1450 1455
Pro Ser Ala Gln Ser Val Asp Ala Leu Glu Ser Pro Gly Pro Leu
1460 1465 1470
Ala Leu Glu Gly Pro Ser Ser Pro Arg Asn Leu Leu Trp Arg Glu
1475 1480 1485
Met Ser Ile Phe Leu Pro Gly Ile Phe Thr Ala Lys Lys Ser Pro
1490 1495 1500
Thr Ser Phe Cys Cys Asn Ile Leu Asn Ser Leu Pro Ser Ser Met
1505 1510 1515
Glu Ile Ala Val Leu Gln Glu Asp Ser Lys Lys Met Thr Gln Lys
1520 1525 1530
Gly Gln Ala Phe Gly Ser Leu Cys Gln Leu Val Ser Ala Asp Phe
1535 1540 1545
Ser Ala Pro Gln Val Thr Arg Leu Arg Ser Leu Asn His Leu Leu
1550 1555 1560
Ile Thr Tyr Thr Pro His Ile Cys Arg His Thr Leu Leu Thr Pro
1565 1570 1575
Asp Thr Arg Trp Ile Phe Ser Asn Gln Leu Gln Thr Val Gln Met
1580 1585 1590
Leu Cys Leu Pro Pro Leu Lys Gln Gly Glu Arg Ile Ile Trp Pro
1595 1600 1605
Leu Gly Gly Phe Gln Ile Pro Asn Phe Phe Trp Ser Leu Gly Ile
1610 1615 1620
Gly His Thr Gly Ala Trp Trp His Thr Gly Arg Arg Arg Arg Glu
1625 1630 1635
Trp Gly Gly Ser Thr Val Ser Arg Ser Pro Leu Trp Ile Ser Ser
1640 1645 1650
Met Ile Tyr Leu Arg Gly Met Ala Phe Ala Ser Asp Ser Ser Ile
1655 1660 1665
Arg Thr Thr Arg Val Ser Trp Cys Arg Arg Cys Gly Ala Lys Ser
1670 1675 1680
Ala Ala Ala Ser Ser Ile Glu Ala Leu Thr Ala Leu Phe Thr Cys
1685 1690 1695
Arg Thr Ala Ser Ile Ser Val Asn Ile Ser Thr Leu Met Ser Ile
1700 1705 1710
Leu Glu Ala Leu Lys Lys Lys Pro Arg Asp Ile Cys Arg Ile Ser
1715 1720 1725
Cys Arg Cys Arg Arg Glu Tyr Arg Val Thr Met Gly Tyr Pro Tyr
1730 1735 1740
Asp Val Pro Asp Tyr Ala Ser
1745 1750
<210> 1187
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 1C
<400> 1187
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaagc accagacggg aaatgccttc tcaggccaca 120
ccttctccac ctggaccttg gagagccgct ctgggcaaag aagtgaagcg gagccagagc 180
aagctgcggc tgagaaacac aagccccacc gagatccaat tgaccatgaa cgacagcaag 240
cacaagctgg aaagccccgc tctgaaacag gtgtcccctg cctctccacc tacacagcag 300
cctcagacac cccaggatag cagacaggtg ctggccgctt cttctcctgg acatcctctt 360
ggccctggcg actgccctag aacaatggct ggaccttctg cctctctgca cccagcatct 420
ggcagagcca gcagaaagac ctggcagaga aggctgagag cctgtagagc tggtggacct 480
gctggatggg ctagacaggc catgacactg aaggccctgg tcaagacctg gacacagttc 540
agaaactacc ccagagtcgg agccggaaca ggcggaggac ctgcttgtgt tcctgtggcc 600
gaagcttcta ctggcgcctg gacagctgaa ggcgctgccg gaacaagatg cagagcttct 660
agagcccctt gcagacagct gcctgccagc tctcctacca agtgcgagat ctgcgtgaag 720
agaaggcggc ggagaaagcg gagcagccag tctagatctc ccgtgcctaa gaaacgcgag 780
cggatgatgc tgcctgtgcg ggccagaaca gctagatctg ctctgccaca aggcagagcc 840
cctctggaag gaatgcttct gcctagagca ctgcccagcc tgctgagcag aatgccagcc 900
agaagagaga gccggttttg gctggcactg caggctctgg gactcagacc tcctcatctg 960
cctagctgtc accctctgcc tcaactgctt ggacctcctc cacctcatca ggcccctttc 1020
gacaagaaag gcttcgtgat cctgagcaag ggcaagaagc gccggaaaga aatccggcgg 1080
atgaccagac ggaccatgac caccaccaaa atgatgatga tgcggcggac caagcggcgg 1140
aggcgaaaac gtagaagaat gaccatgatg acccgcagaa ccctgctgac caagaaaacc 1200
tgtctgaccc ctagaaccag cgccgccaca aaagctctgc ccagacagac aatcagccag 1260
cggaggccta tccagacacc tcctggaaca agcctggcca tctggggcag actgcctctc 1320
agaccacaga gaggacctcg gcctctgcat agatggctgc agcagacaac aggctgctcc 1380
cagagaagaa tcgccaagaa gcggatcaag ctgaggcgga acacactggc catccggttt 1440
atctctgccc ctcagcctag cagcagcacc gttacagctg ctcctagcgg ccagtacttc 1500
agcagcttct tctacaccag cgaccggacc aagtgtgaaa tctgtgtcaa gaacaccgcc 1560
atcctggcta tcaccctgat cacccctcag gaccctcacc tggaccctgt gtgtcaccca 1620
catagaaggc ctggctggaa gggccaccac agagtggtgt ttagccacca tccaagcggc 1680
tccaccaaga gccattggca gcagagagaa agaggcggag gccgcagaga aaaaaagggc 1740
tgcagagaga tgcccagcag ctggtctagc tctggcagaa ccgccgacaa aaagaacgtg 1800
cggagcagaa ccagactgac cctgacaggc acaagaagca gcggcacaag agcctctcca 1860
agcgccgtgt gtctgtgctg ttggacatgc ccctccagaa gcttccctgc cgcatctcca 1920
tctggactga gagcacctgt tggagcccag gctcctcctg aagtgacact gagagccagc 1980
tgtgcctcta gcgcctctaa agcctgtgct ggactttggc cttggggagc ccaagtgcgg 2040
aacaaagtgc ggcagaactt caagcggaac ctggccaaaa agaccctgac taacgccctg 2100
cggagtatgc ccaagagcag aaaccaggtg ctgttcagac ggaatctgac cccaagccag 2160
ctgagaactc tggcccctcc ttacatgctg ctgccccagt ctctgtctca gagcctgtcc 2220
agaaagcaga tccccagcca atcaatgctc gtgaccgcct tcttcctgct cgacatcatc 2280
ctgagaagcc tgctgtactc ccggatgtgc ctggtgcaga tccctacaca cacctgggag 2340
cccgactact tcgtgtccct gcctatgatg ttcagctggg ccactcagag ctttccagtg 2400
ggagccgtgt tcctgaccag acctgccatt ccttgctgca gctgtaccag ccacagcaac 2460
ccttggagcc agtccttcaa gaagaagaag cccctgacat tcagccccag cgtgccaatg 2520
tctctggcct gtagcatcac cgtgtccttc gtgggccaga tcagcacact ggtgctggac 2580
gtgtcctcca tctctcactg gcgcaagcgc aagagagaga agcggtccca gaagtcccgg 2640
cagaaccatc tgcagctgaa gtcctgcaga cggaagatca gcaactggtc caagctgaga 2700
tccccgtgga tcttctaccc tcggctgaaa accttcggcg tgccactggg ctctatcctg 2760
tgtctggcag gctccctgag cacgatgatg atcattagca ccaccagaca agagtgtggc 2820
agacgggcct ccgtgccttg tagacctatg atcggcagcg ctagacccgg accttggcgg 2880
acatctgcta tgccatctgc catgggagtc gccctgccta ccagctgtga aagcggaaga 2940
tctcctcctg ccaccggcgg aagaatgcct ggatctcagt ctatcatgat gagctggatg 3000
cctccactgg ctccctgtgc cgcttgtcct tgttctcctg ctcctacact gtgccctgct 3060
catcctgcaa gagcccctac agccgtgcct gcctttacac ctctgtctgc tcaccctgtg 3120
ccagtgctgt ctggatgtca cctggccgtg cgcacctcta tgctgacact gctgcccatg 3180
agacaccctc acagaagccc acctacaagc tgccctccac tgctggaagc tttcccactg 3240
ccaagggcca gcctgagagc taccgtgcct agacacagct ctgtgctggc cactggactg 3300
catctgcatc ggcagattag cctgcctctg aggggcttcc tgctgcatca acctctgcct 3360
ggacaacacc tgtggctgtc ccacagactg aggctgagac tgccaagaac aggcgagaag 3420
aacgacctcc agctgttcgt gatgagcgac accacataca agatctactg gacagtgatc 3480
ctgctgaacc cctgcggcaa cctgcacctg aaaaccacat ctctgcggag agccagacct 3540
acctcctgca gcacatgcag aatgtggtgg ctgaagctgg ccccactgca agtgaccaca 3600
acactgaagc tgatcctggt catgctggaa atcgtgaccg aagaggccaa gaaatccatg 3660
aagagatccc ggcggagcaa gatcgaggcc tctcctatcg gctccatcat gaagaagaaa 3720
gacagcacca tcttcatcaa ccagcagctc aagtggaccc ctcacatcct gaagtctgcc 3780
agcgtgtcca agaagagact gcccaagctg aacggcatct gggaagtgat gccccggaca 3840
ctggaaggct gcatcagcgt gaaggaccac cggacaagcc agaaccacag caagtgcatc 3900
accgagtgtg tgcggacagc cctgaaccag agaaaggtgg tcaagaaccc cagccagcca 3960
gtgccactga gaaacgacgg catcaccaac ggcaacgact ccaccagatc ctgctccatc 4020
agcctgaaga aaagcctgga aaagatgccc ctgatgaacg ccaagaaaat ggaagatatg 4080
atctgggaga gcaacatggg cggcaaccgg tccatctgcc tgacaagact gccctgcaaa 4140
gtgaccgagt ccagccaaag accacctcgg agcattctgt ccctggcctc tagagccgga 4200
cagtttcccg tttggcggag aaccagcaga ggcatgtccc tgcagtggaa gtccggcaat 4260
gcctgcacac ctctgaggtg ccctagcaga agccctgcca catttctgac cgcactgaac 4320
ggctggcaca gatctggact tagggctcag caacctagcc tgccaggacc ttgtgctagc 4380
ctgctgtcta cactgagcca gcctccacca caggctccaa gccaagtttg gacagccgcc 4440
acactgagat gtcccgctgt tcctgcagct gcttgccctc ctatcgtgtt ctttctggcc 4500
ccatacttcc ccacaccact gagcatcagc agacccacct ctcgggccag acagtcttgt 4560
tgtctccccg gactgacaca ccctgctcac cagcctcttg gctctatggg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1188
<211> 4623
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 2C
<400> 1188
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgacgg cagatcaaca gacggaagct gcagagaaag 120
aagcgccgga agaagagaga ggaccactgc ggactgcggg ccagaaaccg gaacatgaag 180
aaaaccatga gccacctgat cgcccatcag gccctgaaga tgtctggcct gagactgttt 240
caccccagac tgctgacacg gaagaagcct ggcaagaacc ctcggagaaa gacctggaag 300
atgcggaaga agtacgccca gaagcctagc cagaagaacc acctgtacgg caagggcctg 360
acacaccctg tgcctctgaa gagaaccctg cagaacaagc ggaacaagaa catcaagcgc 420
gtgaaccaga agaagggcaa catcaagaga aagagcatcc tgctgcacct catcgtgctg 480
aacagccccg agagcaacct gcaggctcat cctcaagttc cagcactggc tcctcaggct 540
tggtggcctg ctagaagagg ccctctgaca agcgctccat ctgctcagca gagcctgacc 600
ttcctgccta gcagatttcc ttggggccct cctccactgc actggaactc tgcctacctg 660
ggcagaacac tgctcgtgac ctgcatcctg taccacagat ggatcgtgac cagcatgtgc 720
cagagccaga gatggctgac cagcaccacc tctagaagca gcgccctgat gtggacccag 780
tggtctagcg tgacaagcct ggaatggaca gcccaagaga ggggctgtag cagctggctg 840
atgaagcaga cctggatgaa gtcttggagc ctgcgggacc ccagctacag atccatcctg 900
gaatacgtgt ccaccagagt gctgtggatg cccacatcta cagtgggagc cctgagagcc 960
acagctcctg caacagctgc tccacaggct cagacccctc attggagagc cgccacaaca 1020
agcagcatga gcagcagccc tagagccgag cctacaagct ctagctcttg ggccacctgt 1080
tggcccagat gttgcagctc cagctgttac tggtccctgt cctcttggcc tcctgctggt 1140
gctgccgagg ccacaaatac caggaccaga agcagagagt cccagcgggg cagaatgctg 1200
acttggagaa gcagcctgtg gctgcagggc accagatgtt ttacaggcgt gcggacctcc 1260
agcagacacc cttcttggcc ttggaccaga tgcctgagaa tgcggcctcc tagaagcaac 1320
agccggaaaa agctgctcga ggacatgaag caaaatggct tcacccggta caagaaacgg 1380
ggcgtgatag cctggcggag agccactttc ctgctggccc tttgggagtg cagtctgccc 1440
caagctagac tgtgcctgat cgtgtctagg accctgctgc tggtccagag cagatgcagc 1500
ctgatggaac agatccctca cctgaagtcc tggtggtgta caagaggcgg cggaaagcgg 1560
aagaaaaaga tgtgcaaggt gtccggcggc tgcaccgcct gtgttgaaag atgtccttgg 1620
aagggcatct gctggaagtg gcctgtgaca gtggccgctc tgatcctgat tcagcacggc 1680
ggcatcttca ccttccggtt ctgggtcgag aagctgtcct ggaacatctg caagaatctg 1740
tccctgtacc tggacaagtt cgtgcagcgg ctgctgtacg tgtacatcat cgagacaaac 1800
gtgttcgtcc tgaacctgtt ccacgtgcca gtgaatcaga tcttcatgat ggccttctac 1860
ctgaagtaca ccgagaaggc ctgggtcatg gaactggaat ggctcattca gcagcagtgc 1920
taccagttgc tgctggctca tatgtacggc ttcagcacct acggcaccca gaaaggcgag 1980
tgcgtgtgtc tgcagtgtct gagcggcagc tccctgttca tcctgaagca gccactggac 2040
ctgaagatca gcaagacctt catgagcaga tcccacctgg atttcagccc ctattggatg 2100
aagaaagtga aggcctctcc acagatcatg cagcggatga gcgccgtgaa cttcgagaca 2160
atcaggcgga agtggcagat ccggcacgtg ctgaagaacc tgcctctgga aaacacacag 2220
atccccagga caagccctct gtggaagatc acaatggtgc tgacataccc caactgcgtg 2280
gtgcatgtgc tgatgttcgt gctgttcaag gccgaccaga gcgagtctag cctgagcagc 2340
ggaatctacc ctcctagcac ctgtagcctg ccttgccggg gcattagaat gtgcgccctg 2400
tctcacccta gcttctacat cagcagcacc gtgtgctttc tgagcaagca ctgcatgacc 2460
gcctgcacca gagagaagat catcaacccc accatcagct gcccctttca gagccccaca 2520
aagagactgg gccacagaga gggcagcgag agcgataatc tgggcctgct gtactccttt 2580
cctccttggc tgcccatgag atccctgggc gaaccttgga gagctggctt tcagtgggga 2640
gagtcccctt ggcaagtgat ggctagcctg accggcaaca gcgtgatcgt gcacaagatc 2700
gtgctggtgt ttctgaagtc tctgagcagc tacaactgcg agcggcggat ctctggcatc 2760
cagaagagag ccatcgagtt cgccgtcctg aagctgctga acatggacct ggctagccct 2820
cagattatgc agagaaccag cgccgaccgg ttccggatga agcggagaat gcagaacctg 2880
gataacctgg gcgtgccctg gccattgctt ccaggtgctg ctcctccaca tagactgctg 2940
ggcccctcta gatggattct gtttcatgtg cggaacatcg tgtacggcat ccaagtgatg 3000
ctgtgccggc ggagaaacag cagaaagcag agtcaggtgc agctggccat tcaggtcctg 3060
ctcgtggaca agcacaagta ctttctgttc ggcccctatc ctatcagcga gggactgacc 3120
atgaccaccg gccggaacat caacagcaac tccctgatga ccaactgcct gttcagcccc 3180
atcttcctgt gccaccacgc catcatgcac cggaagatga caagcccaca cttcagactg 3240
ttctccagca agatcccaca tcctcaggtg ccaagtgtgg tggccctgtg caagttcctg 3300
gccaatggcc tgtggttcaa cctgatcttt cagaaaaagg gccacatgat ctttagcccc 3360
aagttcttcc tgacctttag ccagcggacc ctggaatccg ccggactgtt tccatggctg 3420
cacacccagt gccggaacaa aaagaccaag ctgtggtttt ccctgatcaa catccaccac 3480
cgcaagaatc ctctgctgcc tatgagaatg agcagaacac ctcctcggag agtgtgcgga 3540
tctccacctc tgcatctgtg ccaacctctg agaggcggca agaagagaag caagttcgcc 3600
ttctggaagc ctcctagcca gggcatcagc tcttgtctga tgacaggctg ttggggctcc 3660
tgtggcagag cttgttcttg cggaagaggc tgcggtacac ccagaggcga ctggaaaaga 3720
cacccacctc gcagagagct gagcctggaa ccatggattc cttatctgca ccagcaaaag 3780
acccagcgga agcggatgaa gaccggcgcc attcaagaga agggcgctat ccaagaaaaa 3840
ggcgcaatga ccaagcggat ctgcgtggtc aatttcgagg cctgcagaga gatggaaagc 3900
ctgagcgccc ctgagaagat taccctgttc gaagcccaca tggcccggtg cacctccatc 3960
aatgtgctgt gtgtccgggc cagcctgatt gagaagctga tgaaagaaaa gcgcaagatg 4020
aagcgcaacc aggtggcatc ccctcaaatc atgcaacggc tgttcatcaa gggctaccag 4080
aacaaccact tcacgttcca cctccaaaac tttgccttct tcagctcctt cggcaacaac 4140
aagtatatca acattctcac ccgggccttc atccacacac ctagaagccc tggctgttcc 4200
gtgtacgcca atatgtgctg gcggaagatg cagtccctga atcaccccag cagactgacc 4260
aactgtcacc ccgcttggct gagccccatt agtgcttgtc ctaggctgct gccctatcct 4320
tttcacgtgc tggcactgga agtgaccttt ccacctggca cagccatgcc tcagatgcaa 4380
ttgcaggcac tggctatgtg ggagaaaggc tgggacaagc aagagaagaa atcccgcaag 4440
ctgatgtcct cctgcctgga aaaaaaggct acctggatgc ggagaacccc tggcacaagc 4500
ctgcagtgtt acctgaacac acacccctgc accatgctgc tgcctcaggg aatcccatct 4560
ctgaacgccc agtggatgtt cctgcggatc ggctacccct acgatgtccc tgactatgcg 4620
tcc 4623
<210> 1189
<211> 4638
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 3C
<400> 1189
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgacct attcctccac acctgagaca ccctctgctg 120
ctgaagaaca agaagcggag aaagctgcgg cccaagagca gaaagaaggg ccacaccaag 180
aaccggcgga aggccaagag aaagccccag atcagaaaca gccgcagagc cacacctacc 240
agcaagggca gcctgagaag aaagtacctg agagtgggag ccgccgctgc tagctgtcaa 300
tctcctccat ctcctagaga gacaacccct agcagcgacg ccaccagaag aaccagacct 360
atcgccgctc agagcaagaa aaccatgaca gccgccggac tgacccctag ccagaagaaa 420
gatcctgccg gcaagctgaa gaaacaggtg tccgtgtaca gcggcaacct gctgagcttc 480
tctcggagag gcatgaagtc tagcgtgcgc ctgaagaact gcaccaacct gagcgtgccc 540
atgatgctga ccatcctgat ctggaagcgg gtgttcatcc tgctgctgtc cgacaagaaa 600
tctatccctc acgtgcccaa ggccaccgcc gctcattctg tgacagtgaa gctgcagagc 660
cggcggaaca gacggtacag aaagatctat ggcgagctga agatgtccct gcaggccagc 720
aatggcatgg aagcctgtgg cacacacccc acacctagac tgtccgtgtc cgtgatcacc 780
atgaagctgt gggagaagca cttcaagggc ctgaactgga acctggtcgt gtggattctg 840
aacctgaaga tgatgctcaa gaagaagtat ctggtccagc gcgagtggga gaaacggaag 900
cagattcttg gcggcggagg caagtacaaa gagtacttcc tgaagagaat cctcatccgc 960
aaggccatga cagtgctggc cggcgataag aaaggcctgg gcagattcat gagatgcgtg 1020
cagagcgaga caaaggccgt cagtctgcag ctgcctctgg gcagaatgga cctggatgga 1080
atgctgaccg tgatcggcca gggactcgtg ggcatgacac ctagagatct gggaacagtg 1140
gctggcgcca ccgcacagat tcagaggcct attcaggtgc agacaggcgg cagactgaga 1200
ggccctagaa gaaaggtgct gatggtgctg tggctgcccg ccaatcagag cctgcagaaa 1260
agccaggtgt tccagtgggt gctgagaacc gagctgcccc tgacctttag caccctgctg 1320
tgggacagca gacacgacct gcctagaatg ctgcccatca gcagccctct gcacagaccc 1380
cagatgcctt tctggacctg cacctttcct gccaccacat ggggcacatg ggagacacct 1440
tctacatggg gctggcggac ctttgccaga cagccttcta gacccaccgg cagaacccct 1500
accaccagac tgatggctcc agtgggcagc gtgatgagct gtagcctgct gacacagcca 1560
tctccagcca gcgcctgtac aatgcctcca ctgctgcatc ctcagtgggc ccctcattct 1620
gctggacttt ctccaggcgc ttgcagacct gcctgtacct gcatcagcat gaccacaatc 1680
agcagggcca cctggcgcag aaacctgcag agaaacctga aagtgctgcg gctgagaatc 1740
cccagcctgc ggaagtacag acagcagaac acccggtcca ccaacctcga gaagaaccca 1800
tctctgaaga agcagagcca gaggcggggc aagctgtctc tgaccacact gagcttcgtg 1860
ctgatcgagg aactgctgaa aaagagcagc cagctgcgga gaagctggcg gaacgtgtcc 1920
agaatcagca acatccggaa gctgatttgg accaagcagc ggagcttcct gtctctgttc 1980
cccaagctga gagccaccga gcagatgacc aatgtgggct gtagactgga ttttcacccc 2040
agaagcagct ccggcgacag agtgttcctg gtcaagatcc agagcagccc attcctggcc 2100
agatcctgga ataccatgca gtggaacaac aagaaaatgg ccatgactgt gatcgctggc 2160
gcccaccact gtcagtacaa gctgacctac accaaagtgt ggaagatgaa ttggaagaaa 2220
atgatgatcg gcagccagca cctcctgttc tccccactgg atagctctcc actccagctg 2280
ctgctgcacc cacacggcaa gagatgcaac ccctgttgtc ggctgacatg gatgagccac 2340
ctgaatcgga agctgcacct caccaggtcc tgcctgatcg acctgaccat gatgatgagc 2400
cagaaactgt ggaagaatca gcggaagcgc atccctctgc cttctccaag acagcatctg 2460
ctgcctcagt atcctctgca ccctcctcca ccttgtctgc tgcttctcca ccatagacac 2520
cacctggcat tcctcgagat ggcctgtagc tctcagcaca cccacagcat caagatctgg 2580
atcagcttca gccacgagac aatgagcctg tccaacatcc tgatgaagtt ccggctgacc 2640
accaccacaa gcagccccag aagaagccct gctctgcgag ctagaggcgg cacaacaatc 2700
ggcgaagtga ccagcagcct gttctttagc cactgcctgt gcgtggcccc tagatgtcct 2760
agatctgccg tggacatcag ccccggacct acatctcctt ctctggcctc ttgtgcctct 2820
gtggccattg gaaagctggc actgcttggc gcctctgctc cttgtggtgc tgctggcgct 2880
agagaggccg gaagatttgc tgtgctgggc accatggtca tgaagaacat ggaacacaga 2940
ctgaccatgg acagcgccct gagcctgaca aagagagagg gccctgaaac aggccccgtg 3000
tactacgtgt gcaaccggat gaatgtgtcc agcgtgctga agcctttcct gttcaccgtg 3060
cctatcgagg acatgagaga gtgcaccctg ggacgcaaca gaatgaatgt ctcttccgtg 3120
ctgaaaccct gtctgatccc cgtgccaatc tgcaagaaga aactgctgct caagctgctg 3180
aggggcgcct ccagctctac cagcagagat agcagaagct ttttcaccag cgctcacccc 3240
agcagaccct gcaggatgag actgtaccag atgctgcaga agcagtgctg ctacaacctc 3300
gtgatcaagc accctctgat cttccggatc aacctgcgga gacagggcaa gaccaaagac 3360
ggcgttgtgc agagcctggg cttcctgaac cagcagatca tcctccagaa agagttcttc 3420
atctgcctgc tgatgttcat caagcggtgg aagccagccg ccaccaagaa gggcaagaac 3480
agcccctgct gccagaaaaa actgcgggtg cagaaccagg gccatctgct gatgattctg 3540
ctgcacaaca gaggcccacc tctgcatacc agattcgaga aaaagcggcc cgagtggctg 3600
agcagaaaat ccggcgtgat gaagtgctgg gatctgtgcc ctgccttcag cggcaggatt 3660
ctgcaccagc cagaaatggc cgccatgaga ctgatgccca agttcctgaa ctccaccaac 3720
agctggtgga cagtgcacaa gaagagaggc ctgttccacc agatgaagtg tctgaccgcc 3780
gtggactgtc tgcaggcctt ctgggatatg agcgagaaga aacgcaagct gcctatgatt 3840
cgcaaaatcc agaagcggcg gagaaccgcc aaccggaaca tcgagatcac ccctcagaga 3900
agcaaagccc acctgaagaa aacctccgcc aagggcgcca agaaaatcac cttcctgtgc 3960
ctgagagtca gatgcggagg ctggctgtgt ggctggacac caagaggatg gctgaagaag 4020
tccaccaagt ccagactgtg cttcttctac ctgctgtact acctgttttt cctgaccgtg 4080
tgcggcttca cccctccacc acttattctg tggcctcagg cagcccctgg cgagaagctg 4140
aagcactgtt ttaaagcctg gggcgtcgac cctcctggca gcgtttggat tctgccctgc 4200
ttcctgattc acctgagaaa ggtggacacc caccacctcc aggtggtcac caaaacagtg 4260
accgccacaa cagccgacgg ccagaggatg agaaggctga agtgcaaggc ctgccggctg 4320
agatgggcta gacctgaacc tgcagctcag gcccctccta agagccactt tccacctcat 4380
cctagcggcc cctccagaac cagctctctg caattgagaa cctacatgga aatgcactac 4440
ggccatcagg ccccacaggt ggcaatgctg cctaaactgc tgtgtcggca gatgctcccc 4500
actctgtcta ccctgcagca gagacatcct cagggcccat gtcctcctcc agtgacacct 4560
ctgagagtgc agtctgtgct gctgctcgga gtgcctcaaa cagctggcta cccctacgat 4620
gtccctgact atgcgtcc 4638
<210> 1190
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 4C
<400> 1190
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgagac agcaagaaga tgacccagaa gaaccgcaag 120
acccggaagg ccgccagaga gaagcacaga aagaccgaca acctggacct gcagcaccag 180
cgcagacgca aaaagaagaa ggacaaggtc gagatccgga atcggagccc taaggccaat 240
agcaccgagt gtcagggcga gcacagcaga gagcagaacc tgctgaacct ggtgcaattg 300
aaccctcaca gccctcacca ccggaaggac gaggaagatc accagaagag acaccaccac 360
cacaatcaaa agaagatgtc cgtcaacgag ggcaacaacc actggcctag agtggaaatg 420
cctaccggct ggctgctcgt gggctacaac accagaaaca cagcccagaa tcctcggctg 480
cagcagcacc tgaaacactg gcagcagtgc accagagcca gatggtgtca agagccctgt 540
cagaccctga ccttcttcca cttcttcttc tttttcaaaa cggtgtccct gtgctgcccc 600
ggctggtcta aaggacaacc tcctccacct ggcctgaagc cttctagcct ggcttctcag 660
gtggccagaa ccacaggcgt gtaccagcac gtgtggctga tctgcttcgt gtttttcgtg 720
tgcgtggaaa ccggcttctg tcacgtggcc caagtgggac tcgagagact cgttagcctg 780
agcggcatca ccgacgtgaa ccattgggcc cagcctaagc catctcctag caaaggcacc 840
ggcatgaaca gacccatcgg cctgagagtt ggcaaaggcg tgtgggctag actgtggctg 900
aagaactgga agcggttcaa gctcaaaaag aaatacacag gcatggaaat cctgctgtgg 960
attctgctga agatggaaat tcagatcttc aagatttgcc tgggcgagat gcagctgtgc 1020
ctcaagaaga aagtcaacgc ctgcagcaac gccaagaaaa tgcccttcca gtgccggtgc 1080
agacgcgagt acagagtgac catgattcag aagaagaaac agaagtcccc gctgttcttc 1140
cacggcgacc tgtgcagacc ttctccttgc ctgtcttgga gcagcaggat cgtggctcct 1200
ggacacgccc tgagctgtcg gactcgtaga agatggtcca gcaagatggc caagaagtcc 1260
cagcagcctc tgtgtagagg cggcccttct gccagcgata gatgctgtag ctgtagcccc 1320
agcggcttta gcgctggaag aggcagatgt cctgtgcagg gatgtctgag gccacacaga 1380
gttcagctgc tgagaagatg gggccctgga tctcctgctg gccagagact gtctaagggc 1440
ttccaactgc tgcgttggtg gggaccagga tctccagctc ctgagcctag aaagggccca 1500
tttccaccac ctgatcctcc atggcctgtg accgctgtga cagtgatggc tggctctgtg 1560
cctagcgctc agtctgtgga tgctctggaa tcccctggac ctctggctct cgaaggccct 1620
agcagcccta gaaacctgct ctggcgggaa atgagcatct tcctgcctgg catcttcaac 1680
ctgcacctgt gctactacca cagccagagc aaccggaaca agagccggca gatggaatcc 1740
ctgggcatga agctgcagat cacacaccca ttcgccagcc agccactggg ccaagagatg 1800
cccaacaaca cccagatcag actgctgaag cccggccagg cctttggcag cttttccgcc 1860
gatttttcag cccctcagca ggcccctctg agactgtggt cttggtgcgg cacaagccag 1920
acctacttcg gctctatcga agccctgaca gccctgttca cctgtagaac cgccagcatc 1980
agcgtgaaca tcagcaccct gatgagcatc ctggaagcca tcctggccat gacactgacc 2040
ctgaatggca gccctctgtg ggactgcagc acaacaacag gcacacacca cggctgcctg 2100
tgggagatcc cttctgttac cctgctggct accgccaaaa agagccctac cagcttctgc 2160
tgtcagcggc ctcctctgca gccagtggaa gagaagaaga acggccggat cagcagcgtg 2220
ccaccttctc cacctcttgc tctgggccct agaatgcagc tctgcaccca gctggcccgg 2280
ttcttcccta ttacacctcc tgtgtggcac atcctgggac ctcagagaca cacccctctg 2340
ctgacccctg acaccagatg gatcttctcc aaccagctgc agaccgtgca gatgctgtgt 2400
ctgcctccac tgaagcaggg cgagagaatc atctggcctc tcggcggctt tcagatcccc 2460
aacttctttt ggagcctcgg catcggacac actggcgcct ggtggcatac tggaaggcgg 2520
agaagagaat ggggcggcag caccgtgtct agaagcccac tgtggatcag ctccatgatc 2580
tacctgagag gcatggcctt cgcctccgac agcagcatca gaaccaccag agtgtcctgg 2640
tgtcggagat gtggcgccaa aagcgccgca gccagcagcg acaagaagaa gaaaagcacc 2700
gaaaagacca agaacaagat catctgcaag ggccacagaa tcacccaggt ggtgctgaga 2760
ctgggcaacc tgcctccatt cttcagaggc agcgaggtgc cctttcctag accttgccgg 2820
accaagtgcc agaagaaggt tccaagcgcc tctccttggg gactgcaccc aagaacagcc 2880
tccatcacac tgcctaccac cagcctgaag ggcagcagaa caagctgctg ccccagatct 2940
caccccagac tgcccagaac aaagtggcct ctgcagtgcc tgctgcacag cctgggaaca 3000
actggaacac tcgtgtggga aaggggcgtg ctgcagatga gaagtctgga agctcactgc 3060
cctctgcaga cattccacct ccaccactgc agaacccagc ctagctcttg tcctccagcc 3120
tggattctgt accaaggaca gtggagcgga gccgtcgtgg gacttagacc tgtggctcac 3180
catctgccaa gacctatcca ggggctgcac tgtcctcagg ctcctcatca accagctctg 3240
tcctggggaa agtggcccgt gggaatgaca ggacccgcca gatgttgccg gtggcctaga 3300
agaatgtgta gctctctggc cctgccaacc ggcctgacat ctctgatcct gcctagcagt 3360
gatctggccg tgctgatctc tagctccacc agccactttc tgatgcggag cccagtgctg 3420
ccaagcagca gactgacatg tgcctctcca cagctgcctc ggatgtggac atggtctagc 3480
tggctgaaag agtggggagg acaggcccac agacagcgga actgtagagt gaacgccgtt 3540
gaggaactgc acagcaggcg gatgtctgtg cggatcgtga agaattgggt gtcctgctgt 3600
tacgtgcggc tgagtgcagt gggactgtct acttggagcg ccctggattc cctgatcctg 3660
tccttccaga gagtgaaaac cagccggata ctgaacctcc aggtgctgaa gaagatcctg 3720
cggagcttta tgaagctgta ccactctctc gtgatgtgcc tgcggctgcg gaccaagctg 3780
gaaaaagctc tgagcgctct gtttatctgg ccccagcaca gctacaaagg ccaggcattc 3840
ggaagcctgt gccagctggt gtctgccgat ttcagcgccc ctcaagtgac cagactgcgg 3900
agcctgaacc atctgctgat tcggtggatc tttagcaatc agctgacagt ccaaatgctc 3960
tgcctgccga tcatcaagaa aatgaagaaa cggatcatgg tgcacgtctt gaagaagaat 4020
cggaagcaga ttatctgtat caagaatatg ttcctgcagc ggaagggatt cctgaacctg 4080
agccacgtgg aaaagttcag agagagcacc ctgggcaatt tctggatgaa gctcctgcag 4140
ctgccaccag cttgcacctc taaggcctgg acacccagaa agcttgtggg gagagccgtg 4200
cggagaaagg gcgtcgtgat caacctgaag agactgcaga aattccgggc tagcgtgtcc 4260
ttctggactc tgctgcctac aacaggcgtg cggacaagag gctctccact gagactgact 4320
ctgtggcctc caagaagcca gaaaagccag caccactgcg ccctgagaaa gatcgagtgg 4380
gccacaaagc tgtccctcgg cggcaaagca ggaccacagg ctcaagagaa ggccaacatc 4440
ctgaacagcc tgccttcctc tatggaaatc gccgtgctgc aagaaatgct gaaccagaag 4500
tgtctggccc ctttcgagct taagaagaac ctcctgctgc caacctacac accccacatc 4560
tgtcggcaca cccttaaaaa gaagcccaga gacatctgca gaatcagcgg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1191
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 1D
<400> 1191
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgagcc gacaagaaaa acgtgcggag cgctagttct 120
cctggacatc ctcttggccc cagaagaatg accagacgga ccatgaccac caccaaaatg 180
atgatgatgc ggcggaccaa gcggcggaga agaaaaagac gccggatgac catgatgacc 240
agaagaaccc tgctgaccaa gaaaacctgt ctgaccccta gaaccagcgc cgccacaaaa 300
gctctgccca gacagacaat cagccagcgg aggcctatcc agacacctcc tggaacaagc 360
ctggccatct ggggcagaag aagcaagatc gaggcctctc ctatcggcag catcacccct 420
ctgagcatca gcagacctac cagcagagcc agacagagct gttgcctgcc tggactgaca 480
caccctgctc atcagcctct gggctctatg gttggagctg gaacaggcgg aggacctgct 540
tgtgtgcctg tggccgaagc ttctacaggc gcttggacag ctgaaggcgc tgccggcaca 600
agatgtagag ccagcagagc cccttgcaga cagctgcctg cttctagccc taccaagtgc 660
gagatctgcg tgaagagaag aaggcggcgc aagcggagca gccagtctag atctcccgtg 720
cctaagaaac gcgagcggat gatgctccct gtgcgggcca gaacagctag atctgctctg 780
ccacaaggca gggctcctct ggaaggaatg cttctgccta gagcactgcc cagcctgctg 840
agcagaatgc ctgccagaag agagagcaga ttctggctgg ccctgcaggc ccttggactc 900
agacctcctc atctgcctag ctgtcaccct ctgcctcaac tgcttggacc tcctccacct 960
catcaggccc ctggcgagaa aaacgacctg cagctgttcg tgatgagcga caccacctac 1020
aagatctact ggaccgtgat cctgctgaac ccctgcggca acctgcacct gaaaaccacc 1080
agcctgaacg ccaagaaaat ggaagatatg atctgggaga gcaaccagca gctgaagtgg 1140
acccctcaca tcctgaagtc cgcctctatc gccaagaagc ggatcaagct gcggcggaac 1200
agcaccagac gggaaatgcc ttctcaggcc acaccttctc cacctggacc ttggagagcc 1260
gctctgggca aagaagtgaa gcggagccag agcaagctga gactgagaaa cacaagcccc 1320
ttcgacaaaa agggctttgt gatcctgagc aacatgggcg gcaaccggtc tatctgcctg 1380
accatcgtgt tctttctggc cccttacttc cccatgccta gcagctggtc tagcagcggc 1440
agaaccagac tgcctctgag gccacagaga ggccctagac ctctgcatag atggctgcag 1500
cagaccaccg gctgctctca gagaagaggc gactgcccaa gaaccatggc cggaccatct 1560
gcttctctgc accctgcatc tggcagagcc tccagaaaga cctggcagag aaggctgaga 1620
gcctgtagag caggcggacc tgctggatgg gctagacagg ccagaaaacg caagagagag 1680
aagcggtccc agaagtccag acagaaccat ctgcagctga aaagctgcag acggaagatc 1740
agcaactggt ctaagctgcg gagcccctgg atcttcgagg ccaaaaagag catgaagaga 1800
tcccagcggc ctcctcggag catcctgagc ctgttcaaga agaagaagcc cctgacattc 1860
agccccagcg tgtccaagaa gaggctgcct aagctgaagg gcaagaaacg ccggaaagaa 1920
atccagcgga aggtggtcaa gaaccccagc cagcctgtgc cactgagaaa tgacggcatc 1980
accaacggca acgacagcac ccggtcttgc agcatcagcc tgaagaaaag cctggaaaag 2040
atgcccctga tgcggagcct gctgtactcc agaatgtgcc tggtgcagat ccccacacac 2100
acctgggagc ccgactactt tgtgtccctg cctatgatgt tcagctgggc cacacagagc 2160
tttccagtgg gcgccgtgtt tctgaccaga cctgccattc cttgctgtag ctgtaccagc 2220
cactccaatc cttggagcca gtccacactg gccatccggt ttatctctgc ccctcagcca 2280
agcagcagca ccgttacagc tgctcctagc ggccagtatt ttgccctgcg gagtatgccc 2340
aagagccgga accaggtgct gtttcggaga aatctgaccc caagccagct gcggacactg 2400
gcccctccat atatgctgct gcctcagtct ctgtcccaga gcctgtctcg gaagcagatc 2460
ccatctcagt ccatgctcgt gcggaccagg ctgacactga caggcactag aagctccggc 2520
accagagcct ctccatctgc cgtgtgtctg tgctgctgga catgccccag cagaagcttt 2580
cctgccgcct ctccaagcgg actgagagca cctgttggag cacaggctcc tccagaagtg 2640
acactgagag ccagctgtgc cagctccgcc agcaaagctt gtgcaggact ttggccttgg 2700
ggagcccaag tgcggatgaa gaagaaggac agcaccatct tcatctaccc caggctgaaa 2760
accttcggcg tgccactggg cagcattctg tgtctggctg gaagcctgag cacgatgatg 2820
atcattagca ccaccagaca agagtgcggc agacgggcca gcgtgccctg tagacctatg 2880
atcggaagcg ccagacctgg accatggcgg acaagtgcta tgccttctgc catgggagtc 2940
gccctgccta ccagctgtga aagcggaaga tctcctcctg ccaccggcgg aagaatgcca 3000
ggatctcagt ctatcatgat gagctggatg cctccactgg ctccctgcgc tgcttgtcct 3060
tgttctcctg ctcctacact gtgccctgct caccctgcta gagcaccaac agccgtgcct 3120
gcctttacac ccctgtctgc tcatcctgtg ccagtgctgt ctggatgtca cctggctgtg 3180
cggacctcca tgcttacctt gctgccaatg atgaccctga aggccctggt caagacatgg 3240
acccagttca gaaactaccc cagacggcac cctcacagaa gcccaccaac aagctgtcct 3300
ccactgctcg aggcctttcc actgccaaga gccagcctga gagctaccgt gcctagacac 3360
tctagcgtgc tggccacagg actgcatctg cataggcaga ttagcctgcc tctgcggggc 3420
ttcctgctgc atcaaccact gccaggacaa cacctgtggc tgtcccacag actgagactg 3480
cggctgccta gaacaaccga gatccagctg accatgaacg actccaagca caagctggaa 3540
agccccgctc tgaaacaggt gtccccagct agtcctccta cacagcagcc tcagacaccc 3600
caggattcta gacaggtgct ggccgtgcct atgagcctgg cctgtagcat caccgtgtcc 3660
ttcgtgggcc agatctctac cctggtgctg gacgtgtcct ccatcagcca ctggaacggc 3720
atctgggaag tgatgcccag aacactggaa ggctgcatct ccgtgaagga ccaccggaca 3780
tcccagaacc acagcaagtg catcaccgag tgtgtgcgga cagccctgaa caccaagtgt 3840
gaaatttgtg tgaagaacac cgccatcctg gctatcaccc tgatcacccc acaggaccct 3900
cacctggacc ctgtgtgtca tccccataga aggcccggct ggaagggaca ccacagagtg 3960
gtgtttagcc accatccttc cggcagcacc aagtctcact ggcagcagag agaaagaggc 4020
ggaggccgca gagaaaagaa gggctgtaga gaggcaagca gagccggcca gtttcctgtg 4080
tggcggagaa catctagagg catgtccctg cagtggaagt ccggcaatgc ctgcacacct 4140
ctgagatgtc ccagcagatc tccagccacc ttcctgactg ccctgaacgg ctggcataga 4200
tctggactga gggcccagac cgccttcttt ctgctggaca tcatcctgcg gagagcccgg 4260
cctacaagct gcagcacatg tagaatgtgg tggcggctgc cctgcaaagt gaccgaaagc 4320
tccctggcca agaaaaccct gaccaatcag cctagcttgc ccggaccttg tgctagcctg 4380
ctgtctacac tgagccagcc accacctcag gctcctagcc aagtttggac agccgctaca 4440
ctgcggtgtc ctgctgtgcc tgctgctgca tgtccacctc tgaagctggc tccactgcaa 4500
gtgaccacaa cactgaagct gatcctggtc atgctggaaa tcgtgaccga gaacaaagtt 4560
cggcagaact tcaagcggaa ctccagcttc ttctacacca gcgacagagg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1192
<211> 4623
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 2D
<400> 1192
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgacgg aagatgcaga gcctgaatca ccccagcaga 120
ctgaccaaca atcctcggag aaagacctgg aagatgcgga agaagtacgc ccagaagcct 180
agccagaaga accacctgta ccggcagatc aaccggcgca agctgcagag aaagaagtcc 240
agaagccacc tggacttcag cccctactgg atgaagaaag tgaagcgggc cagaaaccgg 300
aacatgaaga aaaccatgag ccacctgatc gcccatcagg ccctgaagat gtctggcctg 360
agactgtttc accccagact gctgaccaga aagaagcccg gcaagcagaa aaagggccac 420
atgatcttca gccggcggaa gtggcagatc cggcacgtgc tgaagaatct gatccccagc 480
ctgaacgccc agtggatgtt cctgagaatc gctagcccac agatcatgca gagaaccagc 540
gccgaccggt tccggatgaa gcggagaatg cagaacctgg acaatctggg cgtgccctgg 600
cctctgttgc ctggattgct gctggcccat atgtacggct tcagcaccta cggcacccag 660
aaaggcgagt gcgtgtgtct gcagtgtctg agcggcagca gcctgttcat cctgaagcag 720
cccctggacc tgaagatctc caagaccttc atggccagcc ctcagattat gcagcggatg 780
agcgccgtga acttcgagac aatcctgcag gcccatcctc aggtgccagc tcttgctcct 840
caagcttggt ggcccgctag aagaggccct ctgacatctg ctccaagcgc acagcagtcc 900
ctgacacgga cactggaaag cgccggactg tttccttggc tgcacaccca gtgccgggcc 960
ttcattcaca cacctagaag ccctggctgc agcgtgtacg ccaacatgtg ctggcggtac 1020
aagaaacggg gagtgatcgc ctggcggatc taccctccta gcacatgcag cctgccttgc 1080
agaggcctga tcctgattca gcacggcggc atcttcacct tccggttctg ggtcgagaag 1140
ctgagctgga acatctgcaa gaacctgagc ctgtacctgg ataagttcgt gcagcggctg 1200
ctgtacgtgt acatcatcga gacaaacgtg ttcgtgctga acctgttcca cgtgccagtg 1260
aaccagatct tcatgatggc cttctacctg aagtacaccg agaaggcctg ggtcatggaa 1320
ctggaatggc tgatccagca gcagtgctac cagcggaaga gaatgaagac cggcgccatc 1380
caagagaagg gcgctattca agagaaaggg gccatgacca agcggatctg cgtggtcaat 1440
ttcgaggcct gcagagagat ggaaagcctg agcgcccctg agaagatcac cctgtttgaa 1500
gcccacatgg cccggtgcac cagcatcaat gtgctgtgtg tcagggccag cctgatcgag 1560
aaactgatga aagaaaagcg caagatgaag cgcaaccagg tggcatcccc tcaaatcatg 1620
caacggctgt tcatcaaggg ctaccagaac aaccacttca cgttccacct ccaaaacttc 1680
gccttcttca gctccttcgg caacaacaag tatatcaaca tcctgacctt tctgcccagc 1740
agattccctt ggggacctcc tccactggga gcccttagag ctacagctcc tgctacagct 1800
gctccccagg cacagacacc tcattggaga gccgccacca caagcagcat gagcagctct 1860
ccaagagccg agcctaccag ctctagctct tgggccactt gctggcctag atgctgcagc 1920
tccagctgct attggagcct gtctagctgg cctcctgctg gcgctgccga agccacaaat 1980
accagaacca gaagccgcga gagccagcgg ggaagaatgc tgacttggag aagctccctg 2040
tggctgcagg gcaccagatg ttttacaggc gtgcggacca gctccaggtg cagcctgatg 2100
gaacagatcc ctcacctgaa gtctaacagc cggaagaaac tgctcgagga catgaagcag 2160
aacggcttca ccagacggcg gaacagcaga aagcagagcc aagtgcagct ggccatccag 2220
gtgctgctgg tggacaagca caagtacttt ctgttcggca gagccacatt tctgctggct 2280
ctgtgggagt gtagcctgcc tcaggctaga ctgtgcctga tcgtgtctag aaccctgctg 2340
ctcgtgcagt ctagacaccc aagctggcct tggaccagat gcctgagaat gcggcctcca 2400
cgcagccact ggaactctgc ctacctgggg agaacactgc tcgtgacctg catcctgtac 2460
cacagatgga tcgtgaccag catgtgccag agccagagat ggctgacctc caccacctct 2520
agaagctctg ccctgatgtg gacctggtgg tgtacaagag gtggcggcaa gcggaagaaa 2580
aagatgtgca aggtgtccgg cggctgcacc gcctgtgttg aaagatgtcc ttggaagggc 2640
atctgttgga agtggcctgt gacagtggcc gccatgagca gaacacctcc aagacgcgtg 2700
tgcggccaca gagagggcag cgagtctgat aatctgggcc tgctgtactc ctttccacct 2760
gtgctgttca aggccgacca gagcgaaagc tctctgagca gcggcaacag cgtgatcgtg 2820
cacaagatcg tgctggtgtt cctgaagtcc ctgagcagct acaactgcga gagaagaatc 2880
agcggcatcc agaagagagc catcgagttc gccgtcctga agctgctgaa catggacctc 2940
ggcaagggac tgacacaccc cgtgcctctg aagaggaccc tgcagaacaa gcggaacaag 3000
aacatcaagc gggtcaacca gaagaagggc aacatcaaga ggaagtccat cctgctgcat 3060
ctgattgtgc tgaacagccc cgagagcaac cgggaaaaga tcatcaaccc caccatcagc 3120
tgcccctttc agagccccac aaagagactg ggaagccctc ctctgcacct gtgtcagcct 3180
ctgaggccct atcctatcag cgagggcctg accatgacca ccggcagaaa catcaacagc 3240
aactccctga tgaccaactg cctgttcagc cccatcttcc tgtgccacca cgccatcatg 3300
caccggaaga tgacaagccc tcacttcaga ctgttctcca gcaagatccc acatccacag 3360
gtcccaagtg tggtggccct gtgcaagttt acacacccct gcaccatgct gctgccccaa 3420
ggcgcttttt ggaagcctcc tagccagggc atctccagct gtctgatgac aggctgttgg 3480
cagtggtcca gcgtgacaag cctggaatgg acagcccaag agagaggctg ttcctcctgg 3540
ctgatgaagc aaacatggat gaagtcttgg tccctgcggg accccagcta cagatccatc 3600
ctggaatacg tgtccacacg ggtgctgtgg atgcccacct ctaccgtgcc taagttcttt 3660
ctgaccttca gccagatccg gatgtgcgcc ctgtctcacc ctagcttcta catcagctcc 3720
accgtgtgct ttctgagcaa gcactgcatg accgcctgca cacctggaac cagcctgcag 3780
tgttacctga acctggccaa cggcctgtgg ttcaacctga tcttccggaa caaaaagacc 3840
aagctgtggt tctccctgat taacatccac caccgcaaga acccactgct gcccatgcgg 3900
ctggaaaaaa aggccacttg gatgcggcgg accgagctgt ctctggaacc ttggattcct 3960
tacctgcatc agcagaaaac ccagtggctc cccatgagaa gcctgggcga gccttggcga 4020
gctggatttc agtggggaga gtctccctgg caagtgatgg cctctctgac aggcagacgc 4080
aagaaaagag aggatcactg cggactgcaa gagaaaaaaa gccggaagct gatgtccagc 4140
tgcgccgctc ctccacatag actgctggga cctagcagat ggggaagctg tgggagagcc 4200
tgttcttgtg gcagaggctg tggaacccct agaggcgact ggaagagaca cccacctcgg 4260
cggattctgt ttcacgtgcg gaacatcgtg tacggaatcc aagtgatgct gtgctgtcac 4320
cccgcctggc tgtctccaat cagcgcttgt cctcgcctgc tgccttatcc attccacgtt 4380
ctggccctgg aagtgacatt ccctccaggc actgccatgc ctcagatgca attgcaggca 4440
ctggcaatgt gggagaaagg ctgggacaag cctctggaaa acacacagat ccccaggaca 4500
agcccactgt ggaagatcac aatggtgctg acatacccca actgcgtggt gcacgtcctg 4560
atgttcggcg gcaagaagcg gagcaagttc ggctacccct acgatgtccc tgactatgcg 4620
tcc 4623
<210> 1193
<211> 4638
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 3D
<400> 1193
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgacag aacaccagaa gcaccaacct ggaaaagaac 120
cccagcctga agaagcagag ccagcggaga ggaaagctga gcagcagaaa gaagggccac 180
accaagaacc ggcggaaggc caagagaaag ccccagatca gccagaagaa ggaccctgcc 240
ggcaagctga agaaacacct gaaccggaag ctgcacctga ccagatcctg cctgatcgac 300
ctgaccatga tgatgagcca gaagctgtgg aagaaccagc gcaagagaat ccctctgcct 360
tctccacggc agcatctgct gcctcagtat ccactgcatc ctccacctcc atgcctgctg 420
ctgctccacc acagacacca tctggccttt ctcgagatgg cctgcagcag ccagcacacc 480
cacagcatca agatctggat cagcttcagc cacgaggacc tgcctagaat gctgcccatc 540
agcagccctc tgcacagacc ccagatgcct ttctggacct gcacctttcc tgccaccaca 600
tggggcacat gggagacacc ttctacatgg ggctggcgga cattcggccc tgtgtactac 660
gtgtgcaacc ggatgaacgt gtccagcgtg ctgaagcctt tcctgttcac cgtgcctatc 720
gaggacatga gagagtgcac cctgggcaga aacagaatga atgtgtcctc tgtgctgaaa 780
ccctgtctga tccccgtgcc aatcctgacc acactgagct tcgtgctgat cgaggaaagc 840
cggcggaaca gacggtacag aaagatctac ggggagctga agatgtccct gcaggccctg 900
cctctgacct ttagcacact gctgtgggac agcagacaca ccaccaccac aagcagcccc 960
agaagatccc ctgctctgag agctagaggc ggcaccacaa tcggcgaagt gacaagcaga 1020
ggcgccagca gctctaccag cagagacagc agaagctttt tcaccagcgc tcaccccagc 1080
agaccctgca gaatgagact gtaccagagc aacggcatgg aagcctgcgg cacacaccct 1140
acacctagac tgtctagagg ccctccactg cacaccagaa ccatgagcct gagcaacatc 1200
ctgatgaagt tccggctgat gctgcagaag cagtgctgct acaacctcgt gatcaagcac 1260
cctctgatct tccggatcaa cctgcggaga cagggcaaga ccaaagacgg cgttgtgcag 1320
agcctgggct tcctgaacca gcagatcatc ctgcagaaag agttcttcat ctgcctgctg 1380
atgttcatca agcggtggaa gccagccgcc acaaagacac ctccaccact gattctgtgg 1440
cctcaggccg ctcctgtgca caagaagaga ggcctgttca gcctgttctt ctcccactgc 1500
ctgtgccacc agatgaagtg cctgaccgcc gtggattgtc tgcaggcctt ctgggacatg 1560
atgattcgca agatccagaa gcggcggaga accgccaacc ggctgaaaaa gaaatacctg 1620
gtgcagtgta ccaacctgag cgtgcccatg atgctgacca tcctgatctg gaagcgggtg 1680
ttcatcctcc tgctgagcga caagaagtgt ctgagagtca gatgcggcgg atggctgtgt 1740
ggctggacac ctagaggcaa gaacaagaag cggagaaagc tgcggcccaa gcacctgaag 1800
aaaaccagcg ccaaggtgtc cgtgatcacc atgaagctct gggagaagca cttcaagggc 1860
ctgaactgga acctggtcgt gtggattctg aacctgaaga tgatgtggct caagaagtcc 1920
accaagagca gacagagcag cccattcctg gctcggagct ggaataccat gcaatggaac 1980
aacaagaaaa tggccatgac cgtgatcgct ggcgcccacc actgtcagta caagctgacc 2040
tacaccaaag tgtggaagat gaattggaag aaaatgatga tcggctccca gcacctcctg 2100
tttagcccac tggattcaag cccactgcag ttgctgctgc accctcacgg caagagatgc 2160
aacccttgct gcagactgac ctggatgagc agagagtggg aaaagcggaa gcagatcctc 2220
ggcggaggcg gcaagtacaa agagtacttc ctgaagcgga ttctcatccg gaaggctatg 2280
acagtgctgg ccggcgataa gaaaggcctg ggaagattca tgagatgcgt gcagagcgag 2340
acaaaggccg tgtctctgca gctgcctctc ggccgaagaa agtccggcgt gatgaagtgt 2400
tgggatctgt gccccagact ggactttcac cccagatcta gctctggcgg cgagaagctg 2460
aagcactgtt tcaaagcctg gggcctgtgc ttcttctacc tgctgtactt cgagaagaaa 2520
cggcccgagt ggctgagcgt tgaccctcct ggatctgtct ggattctgcc ctgcatggac 2580
ctggacggaa tgctgacagt gatcggccag ggactcgtgg gcatgacccc tagagatctg 2640
ggaacagtgg ctggcgccac cgcacagatt cagaggccta tccaggtgca gacaggcggc 2700
agactgttcc tgattcacct gagaaaggtg gacacccacc atctgcaggt cgtgaccaag 2760
accgtgacag ccacaacagc tgacggccag aggatgcgga gactgaagtg caaggcctgt 2820
cggctgagat gggccagacc tgaacctgct gcacaggctc ctccaaagag ccactttcca 2880
cctcatccta gcggcccctc cagaacctct agcctgcagc tcagacccat tcctccacac 2940
ctgagacacc cactgctgct gaagggaaag aacagcccct gctgccaaaa gaaactgcgg 3000
gtgcagaacc agggccatct gctgatgatc ctgctgcata acgccagaca gcccagcagg 3060
cctaccggaa gaacccctac cacaagactg atggcccctg tgggcagcgt gatgtcttgt 3120
agcctgctga cccagccatc tcctgccagc gcatgtacaa tgccaccact cctgcatcca 3180
cagtgggccc cacatagtgc tggactgtct ccaggcgctt gcagacctgc ctgtacctgc 3240
atcagcatga ccaccatctc cagagccaca tggcggctga gaatcccaag cctgaggaag 3300
taccggcaga acatcgagat cacccctcag cggtctaagg cccaggtttc cgtgtacagc 3360
ggcaatctgc tgagcttctc cagacggggc atgaagagta gcgtgcggct gaagaacagc 3420
atccctcacg tgccaaaagc caccgccgct cactctgtga cagtgaagct gcagtacctg 3480
tttttcctga ccgtgtgcgg cttcgaccgg gtgttcctgg ttaagatctg caagaagaag 3540
ctgctcctca agctgctgag aggccccaga cggaaagtgc tgatggtgct ttggctgccc 3600
gccaaccaga gtctgcagaa aagccaggtg ttccagtggg tgctgcggac cgaaacctac 3660
atggaaatgc actacggcca tcaggcccct caggtggcca tgctgcctaa actgctgtgt 3720
agacagatgc tccccactct gtccacactc cagcagaggc atcctcaggg accttgtcct 3780
cctcctgtga cacctctgag agtgcagtct gtgctgctcc tgggagtgcc tcagacagcc 3840
gcttttagcg gccggattct gcaccagcca gaaatggccg ccatgagact gatgcccaag 3900
ttcctgaact ccaccaacag ctggtggaca gtggccccta gatgtcctag aagcgccgtg 3960
gacattagcc ccggacctac atctcctagc ctggcctctt gtgcctctgt ggccattgga 4020
aaactggcac tgctgggcgc atctgcccct tgtggcgcag ctggtgctag agaggctgga 4080
agatttgccg tgctgggcac catggttatg aagggtgctg ccgcagcctc ctgtcagtct 4140
cctccatctc caagagagac aacccctagc agcgacgcca ccagacggac aagacctatt 4200
gccgctcaga gcaaaaagac catgactgcc gccggactga cccctcggag aaacctgcag 4260
agaaatctga aggtcctggg cgccaagaag atcaccttcc tgagaaacag cagacgcgcc 4320
acacctacct ctaagggcag cctgagaaga aagtacctga gagtgaacat ccgcaagctc 4380
atctggacca agcagcggag cttcctgtct ctgttcccca agctgagagc caccgagcag 4440
atgaccaatg tgggatgcct gctcaagaaa agcagccaat tgcggcggag ctggcgcaat 4500
gtgtcccgga tcagcaacat ggaacacagg ctgaccatgg acagcgccct gagcctgaca 4560
aagagagagg gccctgagac aagcgagaag aagaggaagt tgcctggcta cccctacgat 4620
gtccctgact atgcgtcc 4638
<210> 1194
<211> 4641
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hTPA- and HA-extended poly-FSP
polypeptide 4D
<400> 1194
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccagcc aggaaatcca tgcccgaaac agaaagacca gaaaggccgc cagagagaag 120
caccgcaaga ccgacgacaa gaagaagaag tccaccgaaa agaccaagaa cgccaagaag 180
atgcccttcc agcagcggcc tcctctgcag cctgttaacc tggatctgca gcaccagcgc 240
agacgcaaaa agaagaaaga caaggtcgaa atccggaatc ggagccctaa ggccaatagc 300
accgagtgtc agggcgagca cagcagagag cagaacctgc tgaatctggt gcagctgaac 360
cctcacagcc ctcaccacag aaaggacgaa gaggaccacc agaagcggca ccaccaccac 420
aatcaaaaga aaatgagcgt gcgggctagc gtgtccttct ggacactttt gccaacaacc 480
ggcgtgcgga caagaggctc tccactgaga ctgacactgt ggcctccacg ggttccacct 540
tctccacctc ttgctctggg ccccagaatg cagctgtgta cccagctcgc ccggttcttc 600
cctatcacac ctcctgtgtg gcacatcctg ggacctcaga gacacacacc tcaggctcct 660
ctgaggctgt ggtcttggtg cggcacaagc cagacctact tcggcagcag accatctcct 720
tgcctgagct ggtccagcag aattgtggcc cctggacacg ccctgagctg tcggactaga 780
agaagatggt ctagcaagcg gtggatcttc tccaaccagc tgaccgtgca gatgctgtgc 840
ctgccaatca cacacccatt cgcctctcag cctctgggac aagagatgcc caacaacacc 900
cagatccggc tgctgaagcc ctgcagagtg aacgccgtgg aagaactgca cagcaggcgg 960
atgtctgtgc ggatcgtgaa gaactgggtg tcctgctgtt acgtgcggct gtctgctgtg 1020
ggcctgtcta cttggagtgc cctggacgag gaaaagaaga acggccggat cagcagcctg 1080
aaaaagaaag tgaatgcctg cagctccctg atcctgagct tccagcgcgt gaaaaccggc 1140
atggaaatcc tgctgtggat tctgctgaag atggaaattc agatcttcaa gatttgcctg 1200
ggcgagatgc agctctgcgg ccaggccttt ggaagcttta gcgccgattt cagcgcccct 1260
cagatcatta agaagatgaa gaaacggatc atggtgcacg agctgaagaa gaatctgctg 1320
ctgcctatgt gctccagcct ggctctgcca acaggcctga catctctgat cctgcctagc 1380
agcgatctgg ccgtgctgat ctctagctcc accagccact ttctgatgcg gagccctgtg 1440
ctgccaagca gcagactgac ttgtgcctct ccacagctgc cccggatgtg gacttggtct 1500
agctggctga agaacgaggg caacaaccac tggcctagag tggaaatgcc taccggctgg 1560
ctgctcgtcg gctacaacac cagaaacaca gcccagaatc ctcggctgca gcagcacctg 1620
aaacactggc agcagtgcac cagagccaga tggtgtcaag agccctgtca gaccctgacc 1680
ttcttccatt tcttcttctt tttcaaaacg gtgtccctgt gttgccccgg ctggtctaaa 1740
ggacaacctc ctccacctgg cctgaagcct tctagcctgg cttctcaggt ggccagaacc 1800
acaggcgtgt accagcacgt gtggctgatc tgtttcgtgt ttttcgtgtg tgtggaaacc 1860
ggcttctgtc acgtggccca agtgggactc gagagactgg tgtctctgtc cggcatcacc 1920
gacgtgaacc attgggccca gcctaagcca tctcctagca aaggcaccgg catgaacaga 1980
cccatcggcc tgagagttgg caaaggcgtg tgggccagac tgatcctggc catgacactg 2040
accctgaacg gcatggccaa gaagtcccag cagcctctgc aggtcgtgct gagactggga 2100
aacctgcctc cattcttcag aggcagcgag gtgccctttc ctagaccttg tcggaccaag 2160
cctgcctgca caagcaaggc ctggactccc agaaaactcg tggggagagc cgtgcggaga 2220
aagggatctc cactctggga ttgctccacc acaacaggca cacaccacgg atgcctgtgg 2280
gagatcccat ctgtgaccct gctggcccat cctagaaccg cctctatcac cctgcctacc 2340
acaagcctga agggctccag aaccagctgc tgccctagat ctcaccccag actgcctagg 2400
accaaatggc ccctgcagtg tctgctgcac agcctgggaa caaccggaac actcgtttgg 2460
gaaaggggcg tcctgcagat gagatccctc gaagcccatt gtccactgca gaccttccat 2520
ctgcaccact gcaggaccca gcctagctct tgtcctcctg cctggattct gtaccaagga 2580
cagtggagcg gagccgtcgt gggacttaga cctgtggctc accatctgcc tagacctatc 2640
cagggcctgc actgtccaca ggcacctcat caacctgctc tgagctgggg aaaatggccc 2700
gtgggaatga caggccctgc cagatgttgc agatggccca gacggtgcca gaagaaggtt 2760
ccatcagcct ctccatgggg cctcgtgctc aaaaagaacc ggaaacagat gctgaaccag 2820
aagtgtctgg ccccttttag agagagcacc ctgggcaatt tctggatgaa gctgctccag 2880
ctgcctgtcg tgatcaacct gaagagactg cagaagttca acctgcacct gtgctactac 2940
cacagccaga gcaacagaaa caagagccgc cagatggaat ccctgggcat gaagttgcag 3000
tcccagaaat cccagcacca ctgtgccctg cggaagatcg agtgggccac aaagttgtct 3060
ctcggcggaa aagccggacc acaggctcaa gagaaggcca cctctcggat tctgaacctg 3120
caagtgctca agaagatcct gcggagcttt atgaagctgt accactctct ggtcatgtgc 3180
ctgcggctga ggaccaagct ggaaaaggct ctgagcgccc tgttcatctg gccccagcac 3240
agctacaagc ccctgttctt tcacggcgac ctgtgcgagt ggggaggcca ggctcataga 3300
cagcggaact ggctgaaaaa ctggaagcgg ttcaagctta aaaagaagta catccagaag 3360
aagaagcaga agtctaacaa gatcatctgc aagggccacc gcatcaccat catctgtatc 3420
aagaatatgt tcctgcagcg caagggcttc ctgaacctga gccacgtgga aaagttctgt 3480
agaggcggcc ctagcgccag cgatagatgc tgttcttgta gccccagcgg cttcagtgcc 3540
ggcagaggaa gatgtcctgt tcagggctgt ctgaggcccc acagagttca actgctgaga 3600
agatggggcc ctggctctcc tgctggacag aggctgtcta agggctttca gctgctccgt 3660
tggtggggac caggatctcc tgctcctgag cctagaaagg gcccatttcc accacctgat 3720
cctccatggc ctgtgaccgc tgtgacagtg atggctggat ctgtgcctag tgctcagtct 3780
gtggacgccc tggaatctcc tggacctctg gctctcgaag gacctagcag ccctagaaac 3840
ctgctttgga gagagatgag catctttctg cccggcatct tcaccgccaa gaaaagcccc 3900
accagctttt gctgcaatat cctgaacagc ctgccaagct ctatggaaat cgccgtgctg 3960
caagaggaca gcaaaaagat gacccagaag ggccaagcct tcggctccct gtgtcagctt 4020
gtgtccgctg acttctctgc ccctcaagtg acccggctgc ggagcctgaa tcatctgctg 4080
atcacctaca caccccacat ctgcagacac accctgctga cccctgacac cagatggatc 4140
tttagcaatc agctgcagac agtccagatg ctctgtctgc ctccactgaa gcagggcgag 4200
agaatcattt ggcccctcgg cggctttcag atccccaact tcttttggag cctcggcatc 4260
ggacacactg gcgcctggtg gcatactgga aggcggagaa gagaatgggg cggcagcacc 4320
gtgtctagaa gccctctgtg gatcagctcc atgatctacc tgagaggcat ggccttcgcc 4380
agcgacagca gcatcagaac caccagagtg tcctggtgca gaagatgcgg cgccaaaagc 4440
gctgccgcca gctctattga agctctgacc gctctgttta cctgccggac cgccagcatc 4500
agcgtgaaca tcagcaccct gatgtccatc ctggaagcac ttaagaagaa acccagagac 4560
atctgccgca tcagctgccg gtgtagacgc gagtacagag tgactatggg ctacccctac 4620
gatgtccctg actatgcgtc c 4641
<210> 1195
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 1C
<400> 1195
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgagca ccagacggga aatgccttct 720
caggccacac cttctccacc tggaccttgg agagccgctc tgggcaaaga agtgaagcgg 780
agccagagca agctgcggct gagaaacaca agccccaccg agatccaatt gaccatgaac 840
gacagcaagc acaagctgga aagccccgct ctgaaacagg tgtcccctgc ctctccacct 900
acacagcagc ctcagacacc ccaggatagc agacaggtgc tggccgcttc ttctcctgga 960
catcctcttg gccctggcga ctgccctaga acaatggctg gaccttctgc ctctctgcac 1020
ccagcatctg gcagagccag cagaaagacc tggcagagaa ggctgagagc ctgtagagct 1080
ggtggacctg ctggatgggc tagacaggcc atgacactga aggccctggt caagacctgg 1140
acacagttca gaaactaccc cagagtcgga gccggaacag gcggaggacc tgcttgtgtt 1200
cctgtggccg aagcttctac tggcgcctgg acagctgaag gcgctgccgg aacaagatgc 1260
agagcttcta gagccccttg cagacagctg cctgccagct ctcctaccaa gtgcgagatc 1320
tgcgtgaaga gaaggcggcg gagaaagcgg agcagccagt ctagatctcc cgtgcctaag 1380
aaacgcgagc ggatgatgct gcctgtgcgg gccagaacag ctagatctgc tctgccacaa 1440
ggcagagccc ctctggaagg aatgcttctg cctagagcac tgcccagcct gctgagcaga 1500
atgccagcca gaagagagag ccggttttgg ctggcactgc aggctctggg actcagacct 1560
cctcatctgc ctagctgtca ccctctgcct caactgcttg gacctcctcc acctcatcag 1620
gcccctttcg acaagaaagg cttcgtgatc ctgagcaagg gcaagaagcg ccggaaagaa 1680
atccggcgga tgaccagacg gaccatgacc accaccaaaa tgatgatgat gcggcggacc 1740
aagcggcgga ggcgaaaacg tagaagaatg accatgatga cccgcagaac cctgctgacc 1800
aagaaaacct gtctgacccc tagaaccagc gccgccacaa aagctctgcc cagacagaca 1860
atcagccagc ggaggcctat ccagacacct cctggaacaa gcctggccat ctggggcaga 1920
ctgcctctca gaccacagag aggacctcgg cctctgcata gatggctgca gcagacaaca 1980
ggctgctccc agagaagaat cgccaagaag cggatcaagc tgaggcggaa cacactggcc 2040
atccggttta tctctgcccc tcagcctagc agcagcaccg ttacagctgc tcctagcggc 2100
cagtacttca gcagcttctt ctacaccagc gaccggacca agtgtgaaat ctgtgtcaag 2160
aacaccgcca tcctggctat caccctgatc acccctcagg accctcacct ggaccctgtg 2220
tgtcacccac atagaaggcc tggctggaag ggccaccaca gagtggtgtt tagccaccat 2280
ccaagcggct ccaccaagag ccattggcag cagagagaaa gaggcggagg ccgcagagaa 2340
aaaaagggct gcagagagat gcccagcagc tggtctagct ctggcagaac cgccgacaaa 2400
aagaacgtgc ggagcagaac cagactgacc ctgacaggca caagaagcag cggcacaaga 2460
gcctctccaa gcgccgtgtg tctgtgctgt tggacatgcc cctccagaag cttccctgcc 2520
gcatctccat ctggactgag agcacctgtt ggagcccagg ctcctcctga agtgacactg 2580
agagccagct gtgcctctag cgcctctaaa gcctgtgctg gactttggcc ttggggagcc 2640
caagtgcgga acaaagtgcg gcagaacttc aagcggaacc tggccaaaaa gaccctgact 2700
aacgccctgc ggagtatgcc caagagcaga aaccaggtgc tgttcagacg gaatctgacc 2760
ccaagccagc tgagaactct ggcccctcct tacatgctgc tgccccagtc tctgtctcag 2820
agcctgtcca gaaagcagat ccccagccaa tcaatgctcg tgaccgcctt cttcctgctc 2880
gacatcatcc tgagaagcct gctgtactcc cggatgtgcc tggtgcagat ccctacacac 2940
acctgggagc ccgactactt cgtgtccctg cctatgatgt tcagctgggc cactcagagc 3000
tttccagtgg gagccgtgtt cctgaccaga cctgccattc cttgctgcag ctgtaccagc 3060
cacagcaacc cttggagcca gtccttcaag aagaagaagc ccctgacatt cagccccagc 3120
gtgccaatgt ctctggcctg tagcatcacc gtgtccttcg tgggccagat cagcacactg 3180
gtgctggacg tgtcctccat ctctcactgg cgcaagcgca agagagagaa gcggtcccag 3240
aagtcccggc agaaccatct gcagctgaag tcctgcagac ggaagatcag caactggtcc 3300
aagctgagat ccccgtggat cttctaccct cggctgaaaa ccttcggcgt gccactgggc 3360
tctatcctgt gtctggcagg ctccctgagc acgatgatga tcattagcac caccagacaa 3420
gagtgtggca gacgggcctc cgtgccttgt agacctatga tcggcagcgc tagacccgga 3480
ccttggcgga catctgctat gccatctgcc atgggagtcg ccctgcctac cagctgtgaa 3540
agcggaagat ctcctcctgc caccggcgga agaatgcctg gatctcagtc tatcatgatg 3600
agctggatgc ctccactggc tccctgtgcc gcttgtcctt gttctcctgc tcctacactg 3660
tgccctgctc atcctgcaag agcccctaca gccgtgcctg cctttacacc tctgtctgct 3720
caccctgtgc cagtgctgtc tggatgtcac ctggccgtgc gcacctctat gctgacactg 3780
ctgcccatga gacaccctca cagaagccca cctacaagct gccctccact gctggaagct 3840
ttcccactgc caagggccag cctgagagct accgtgccta gacacagctc tgtgctggcc 3900
actggactgc atctgcatcg gcagattagc ctgcctctga ggggcttcct gctgcatcaa 3960
cctctgcctg gacaacacct gtggctgtcc cacagactga ggctgagact gccaagaaca 4020
ggcgagaaga acgacctcca gctgttcgtg atgagcgaca ccacatacaa gatctactgg 4080
acagtgatcc tgctgaaccc ctgcggcaac ctgcacctga aaaccacatc tctgcggaga 4140
gccagaccta cctcctgcag cacatgcaga atgtggtggc tgaagctggc cccactgcaa 4200
gtgaccacaa cactgaagct gatcctggtc atgctggaaa tcgtgaccga agaggccaag 4260
aaatccatga agagatcccg gcggagcaag atcgaggcct ctcctatcgg ctccatcatg 4320
aagaagaaag acagcaccat cttcatcaac cagcagctca agtggacccc tcacatcctg 4380
aagtctgcca gcgtgtccaa gaagagactg cccaagctga acggcatctg ggaagtgatg 4440
ccccggacac tggaaggctg catcagcgtg aaggaccacc ggacaagcca gaaccacagc 4500
aagtgcatca ccgagtgtgt gcggacagcc ctgaaccaga gaaaggtggt caagaacccc 4560
agccagccag tgccactgag aaacgacggc atcaccaacg gcaacgactc caccagatcc 4620
tgctccatca gcctgaagaa aagcctggaa aagatgcccc tgatgaacgc caagaaaatg 4680
gaagatatga tctgggagag caacatgggc ggcaaccggt ccatctgcct gacaagactg 4740
ccctgcaaag tgaccgagtc cagccaaaga ccacctcgga gcattctgtc cctggcctct 4800
agagccggac agtttcccgt ttggcggaga accagcagag gcatgtccct gcagtggaag 4860
tccggcaatg cctgcacacc tctgaggtgc cctagcagaa gccctgccac atttctgacc 4920
gcactgaacg gctggcacag atctggactt agggctcagc aacctagcct gccaggacct 4980
tgtgctagcc tgctgtctac actgagccag cctccaccac aggctccaag ccaagtttgg 5040
acagccgcca cactgagatg tcccgctgtt cctgcagctg cttgccctcc tatcgtgttc 5100
tttctggccc catacttccc cacaccactg agcatcagca gacccacctc tcgggccaga 5160
cagtcttgtt gtctccccgg actgacacac cctgctcacc agcctcttgg ctctatgggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1196
<211> 5232
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV - and HA-extended poly-FSP
polypeptide 2C
<400> 1196
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgcggc agatcaacag acggaagctg 720
cagagaaaga agcgccggaa gaagagagag gaccactgcg gactgcgggc cagaaaccgg 780
aacatgaaga aaaccatgag ccacctgatc gcccatcagg ccctgaagat gtctggcctg 840
agactgtttc accccagact gctgacacgg aagaagcctg gcaagaaccc tcggagaaag 900
acctggaaga tgcggaagaa gtacgcccag aagcctagcc agaagaacca cctgtacggc 960
aagggcctga cacaccctgt gcctctgaag agaaccctgc agaacaagcg gaacaagaac 1020
atcaagcgcg tgaaccagaa gaagggcaac atcaagagaa agagcatcct gctgcacctc 1080
atcgtgctga acagccccga gagcaacctg caggctcatc ctcaagttcc agcactggct 1140
cctcaggctt ggtggcctgc tagaagaggc cctctgacaa gcgctccatc tgctcagcag 1200
agcctgacct tcctgcctag cagatttcct tggggccctc ctccactgca ctggaactct 1260
gcctacctgg gcagaacact gctcgtgacc tgcatcctgt accacagatg gatcgtgacc 1320
agcatgtgcc agagccagag atggctgacc agcaccacct ctagaagcag cgccctgatg 1380
tggacccagt ggtctagcgt gacaagcctg gaatggacag cccaagagag gggctgtagc 1440
agctggctga tgaagcagac ctggatgaag tcttggagcc tgcgggaccc cagctacaga 1500
tccatcctgg aatacgtgtc caccagagtg ctgtggatgc ccacatctac agtgggagcc 1560
ctgagagcca cagctcctgc aacagctgct ccacaggctc agacccctca ttggagagcc 1620
gccacaacaa gcagcatgag cagcagccct agagccgagc ctacaagctc tagctcttgg 1680
gccacctgtt ggcccagatg ttgcagctcc agctgttact ggtccctgtc ctcttggcct 1740
cctgctggtg ctgccgaggc cacaaatacc aggaccagaa gcagagagtc ccagcggggc 1800
agaatgctga cttggagaag cagcctgtgg ctgcagggca ccagatgttt tacaggcgtg 1860
cggacctcca gcagacaccc ttcttggcct tggaccagat gcctgagaat gcggcctcct 1920
agaagcaaca gccggaaaaa gctgctcgag gacatgaagc aaaatggctt cacccggtac 1980
aagaaacggg gcgtgatagc ctggcggaga gccactttcc tgctggccct ttgggagtgc 2040
agtctgcccc aagctagact gtgcctgatc gtgtctagga ccctgctgct ggtccagagc 2100
agatgcagcc tgatggaaca gatccctcac ctgaagtcct ggtggtgtac aagaggcggc 2160
ggaaagcgga agaaaaagat gtgcaaggtg tccggcggct gcaccgcctg tgttgaaaga 2220
tgtccttgga agggcatctg ctggaagtgg cctgtgacag tggccgctct gatcctgatt 2280
cagcacggcg gcatcttcac cttccggttc tgggtcgaga agctgtcctg gaacatctgc 2340
aagaatctgt ccctgtacct ggacaagttc gtgcagcggc tgctgtacgt gtacatcatc 2400
gagacaaacg tgttcgtcct gaacctgttc cacgtgccag tgaatcagat cttcatgatg 2460
gccttctacc tgaagtacac cgagaaggcc tgggtcatgg aactggaatg gctcattcag 2520
cagcagtgct accagttgct gctggctcat atgtacggct tcagcaccta cggcacccag 2580
aaaggcgagt gcgtgtgtct gcagtgtctg agcggcagct ccctgttcat cctgaagcag 2640
ccactggacc tgaagatcag caagaccttc atgagcagat cccacctgga tttcagcccc 2700
tattggatga agaaagtgaa ggcctctcca cagatcatgc agcggatgag cgccgtgaac 2760
ttcgagacaa tcaggcggaa gtggcagatc cggcacgtgc tgaagaacct gcctctggaa 2820
aacacacaga tccccaggac aagccctctg tggaagatca caatggtgct gacatacccc 2880
aactgcgtgg tgcatgtgct gatgttcgtg ctgttcaagg ccgaccagag cgagtctagc 2940
ctgagcagcg gaatctaccc tcctagcacc tgtagcctgc cttgccgggg cattagaatg 3000
tgcgccctgt ctcaccctag cttctacatc agcagcaccg tgtgctttct gagcaagcac 3060
tgcatgaccg cctgcaccag agagaagatc atcaacccca ccatcagctg cccctttcag 3120
agccccacaa agagactggg ccacagagag ggcagcgaga gcgataatct gggcctgctg 3180
tactcctttc ctccttggct gcccatgaga tccctgggcg aaccttggag agctggcttt 3240
cagtggggag agtccccttg gcaagtgatg gctagcctga ccggcaacag cgtgatcgtg 3300
cacaagatcg tgctggtgtt tctgaagtct ctgagcagct acaactgcga gcggcggatc 3360
tctggcatcc agaagagagc catcgagttc gccgtcctga agctgctgaa catggacctg 3420
gctagccctc agattatgca gagaaccagc gccgaccggt tccggatgaa gcggagaatg 3480
cagaacctgg ataacctggg cgtgccctgg ccattgcttc caggtgctgc tcctccacat 3540
agactgctgg gcccctctag atggattctg tttcatgtgc ggaacatcgt gtacggcatc 3600
caagtgatgc tgtgccggcg gagaaacagc agaaagcaga gtcaggtgca gctggccatt 3660
caggtcctgc tcgtggacaa gcacaagtac tttctgttcg gcccctatcc tatcagcgag 3720
ggactgacca tgaccaccgg ccggaacatc aacagcaact ccctgatgac caactgcctg 3780
ttcagcccca tcttcctgtg ccaccacgcc atcatgcacc ggaagatgac aagcccacac 3840
ttcagactgt tctccagcaa gatcccacat cctcaggtgc caagtgtggt ggccctgtgc 3900
aagttcctgg ccaatggcct gtggttcaac ctgatctttc agaaaaaggg ccacatgatc 3960
tttagcccca agttcttcct gacctttagc cagcggaccc tggaatccgc cggactgttt 4020
ccatggctgc acacccagtg ccggaacaaa aagaccaagc tgtggttttc cctgatcaac 4080
atccaccacc gcaagaatcc tctgctgcct atgagaatga gcagaacacc tcctcggaga 4140
gtgtgcggat ctccacctct gcatctgtgc caacctctga gaggcggcaa gaagagaagc 4200
aagttcgcct tctggaagcc tcctagccag ggcatcagct cttgtctgat gacaggctgt 4260
tggggctcct gtggcagagc ttgttcttgc ggaagaggct gcggtacacc cagaggcgac 4320
tggaaaagac acccacctcg cagagagctg agcctggaac catggattcc ttatctgcac 4380
cagcaaaaga cccagcggaa gcggatgaag accggcgcca ttcaagagaa gggcgctatc 4440
caagaaaaag gcgcaatgac caagcggatc tgcgtggtca atttcgaggc ctgcagagag 4500
atggaaagcc tgagcgcccc tgagaagatt accctgttcg aagcccacat ggcccggtgc 4560
acctccatca atgtgctgtg tgtccgggcc agcctgattg agaagctgat gaaagaaaag 4620
cgcaagatga agcgcaacca ggtggcatcc cctcaaatca tgcaacggct gttcatcaag 4680
ggctaccaga acaaccactt cacgttccac ctccaaaact ttgccttctt cagctccttc 4740
ggcaacaaca agtatatcaa cattctcacc cgggccttca tccacacacc tagaagccct 4800
ggctgttccg tgtacgccaa tatgtgctgg cggaagatgc agtccctgaa tcaccccagc 4860
agactgacca actgtcaccc cgcttggctg agccccatta gtgcttgtcc taggctgctg 4920
ccctatcctt ttcacgtgct ggcactggaa gtgacctttc cacctggcac agccatgcct 4980
cagatgcaat tgcaggcact ggctatgtgg gagaaaggct gggacaagca agagaagaaa 5040
tcccgcaagc tgatgtcctc ctgcctggaa aaaaaggcta cctggatgcg gagaacccct 5100
ggcacaagcc tgcagtgtta cctgaacaca cacccctgca ccatgctgct gcctcaggga 5160
atcccatctc tgaacgccca gtggatgttc ctgcggatcg gctaccccta cgatgtccct 5220
gactatgcgt cc 5232
<210> 1197
<211> 5247
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV - and HA-extended poly-FSP
polypeptide 3C
<400> 1197
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgccta ttcctccaca cctgagacac 720
cctctgctgc tgaagaacaa gaagcggaga aagctgcggc ccaagagcag aaagaagggc 780
cacaccaaga accggcggaa ggccaagaga aagccccaga tcagaaacag ccgcagagcc 840
acacctacca gcaagggcag cctgagaaga aagtacctga gagtgggagc cgccgctgct 900
agctgtcaat ctcctccatc tcctagagag acaaccccta gcagcgacgc caccagaaga 960
accagaccta tcgccgctca gagcaagaaa accatgacag ccgccggact gacccctagc 1020
cagaagaaag atcctgccgg caagctgaag aaacaggtgt ccgtgtacag cggcaacctg 1080
ctgagcttct ctcggagagg catgaagtct agcgtgcgcc tgaagaactg caccaacctg 1140
agcgtgccca tgatgctgac catcctgatc tggaagcggg tgttcatcct gctgctgtcc 1200
gacaagaaat ctatccctca cgtgcccaag gccaccgccg ctcattctgt gacagtgaag 1260
ctgcagagcc ggcggaacag acggtacaga aagatctatg gcgagctgaa gatgtccctg 1320
caggccagca atggcatgga agcctgtggc acacacccca cacctagact gtccgtgtcc 1380
gtgatcacca tgaagctgtg ggagaagcac ttcaagggcc tgaactggaa cctggtcgtg 1440
tggattctga acctgaagat gatgctcaag aagaagtatc tggtccagcg cgagtgggag 1500
aaacggaagc agattcttgg cggcggaggc aagtacaaag agtacttcct gaagagaatc 1560
ctcatccgca aggccatgac agtgctggcc ggcgataaga aaggcctggg cagattcatg 1620
agatgcgtgc agagcgagac aaaggccgtc agtctgcagc tgcctctggg cagaatggac 1680
ctggatggaa tgctgaccgt gatcggccag ggactcgtgg gcatgacacc tagagatctg 1740
ggaacagtgg ctggcgccac cgcacagatt cagaggccta ttcaggtgca gacaggcggc 1800
agactgagag gccctagaag aaaggtgctg atggtgctgt ggctgcccgc caatcagagc 1860
ctgcagaaaa gccaggtgtt ccagtgggtg ctgagaaccg agctgcccct gacctttagc 1920
accctgctgt gggacagcag acacgacctg cctagaatgc tgcccatcag cagccctctg 1980
cacagacccc agatgccttt ctggacctgc acctttcctg ccaccacatg gggcacatgg 2040
gagacacctt ctacatgggg ctggcggacc tttgccagac agccttctag acccaccggc 2100
agaaccccta ccaccagact gatggctcca gtgggcagcg tgatgagctg tagcctgctg 2160
acacagccat ctccagccag cgcctgtaca atgcctccac tgctgcatcc tcagtgggcc 2220
cctcattctg ctggactttc tccaggcgct tgcagacctg cctgtacctg catcagcatg 2280
accacaatca gcagggccac ctggcgcaga aacctgcaga gaaacctgaa agtgctgcgg 2340
ctgagaatcc ccagcctgcg gaagtacaga cagcagaaca cccggtccac caacctcgag 2400
aagaacccat ctctgaagaa gcagagccag aggcggggca agctgtctct gaccacactg 2460
agcttcgtgc tgatcgagga actgctgaaa aagagcagcc agctgcggag aagctggcgg 2520
aacgtgtcca gaatcagcaa catccggaag ctgatttgga ccaagcagcg gagcttcctg 2580
tctctgttcc ccaagctgag agccaccgag cagatgacca atgtgggctg tagactggat 2640
tttcacccca gaagcagctc cggcgacaga gtgttcctgg tcaagatcca gagcagccca 2700
ttcctggcca gatcctggaa taccatgcag tggaacaaca agaaaatggc catgactgtg 2760
atcgctggcg cccaccactg tcagtacaag ctgacctaca ccaaagtgtg gaagatgaat 2820
tggaagaaaa tgatgatcgg cagccagcac ctcctgttct ccccactgga tagctctcca 2880
ctccagctgc tgctgcaccc acacggcaag agatgcaacc cctgttgtcg gctgacatgg 2940
atgagccacc tgaatcggaa gctgcacctc accaggtcct gcctgatcga cctgaccatg 3000
atgatgagcc agaaactgtg gaagaatcag cggaagcgca tccctctgcc ttctccaaga 3060
cagcatctgc tgcctcagta tcctctgcac cctcctccac cttgtctgct gcttctccac 3120
catagacacc acctggcatt cctcgagatg gcctgtagct ctcagcacac ccacagcatc 3180
aagatctgga tcagcttcag ccacgagaca atgagcctgt ccaacatcct gatgaagttc 3240
cggctgacca ccaccacaag cagccccaga agaagccctg ctctgcgagc tagaggcggc 3300
acaacaatcg gcgaagtgac cagcagcctg ttctttagcc actgcctgtg cgtggcccct 3360
agatgtccta gatctgccgt ggacatcagc cccggaccta catctccttc tctggcctct 3420
tgtgcctctg tggccattgg aaagctggca ctgcttggcg cctctgctcc ttgtggtgct 3480
gctggcgcta gagaggccgg aagatttgct gtgctgggca ccatggtcat gaagaacatg 3540
gaacacagac tgaccatgga cagcgccctg agcctgacaa agagagaggg ccctgaaaca 3600
ggccccgtgt actacgtgtg caaccggatg aatgtgtcca gcgtgctgaa gcctttcctg 3660
ttcaccgtgc ctatcgagga catgagagag tgcaccctgg gacgcaacag aatgaatgtc 3720
tcttccgtgc tgaaaccctg tctgatcccc gtgccaatct gcaagaagaa actgctgctc 3780
aagctgctga ggggcgcctc cagctctacc agcagagata gcagaagctt tttcaccagc 3840
gctcacccca gcagaccctg caggatgaga ctgtaccaga tgctgcagaa gcagtgctgc 3900
tacaacctcg tgatcaagca ccctctgatc ttccggatca acctgcggag acagggcaag 3960
accaaagacg gcgttgtgca gagcctgggc ttcctgaacc agcagatcat cctccagaaa 4020
gagttcttca tctgcctgct gatgttcatc aagcggtgga agccagccgc caccaagaag 4080
ggcaagaaca gcccctgctg ccagaaaaaa ctgcgggtgc agaaccaggg ccatctgctg 4140
atgattctgc tgcacaacag aggcccacct ctgcatacca gattcgagaa aaagcggccc 4200
gagtggctga gcagaaaatc cggcgtgatg aagtgctggg atctgtgccc tgccttcagc 4260
ggcaggattc tgcaccagcc agaaatggcc gccatgagac tgatgcccaa gttcctgaac 4320
tccaccaaca gctggtggac agtgcacaag aagagaggcc tgttccacca gatgaagtgt 4380
ctgaccgccg tggactgtct gcaggccttc tgggatatga gcgagaagaa acgcaagctg 4440
cctatgattc gcaaaatcca gaagcggcgg agaaccgcca accggaacat cgagatcacc 4500
cctcagagaa gcaaagccca cctgaagaaa acctccgcca agggcgccaa gaaaatcacc 4560
ttcctgtgcc tgagagtcag atgcggaggc tggctgtgtg gctggacacc aagaggatgg 4620
ctgaagaagt ccaccaagtc cagactgtgc ttcttctacc tgctgtacta cctgtttttc 4680
ctgaccgtgt gcggcttcac ccctccacca cttattctgt ggcctcaggc agcccctggc 4740
gagaagctga agcactgttt taaagcctgg ggcgtcgacc ctcctggcag cgtttggatt 4800
ctgccctgct tcctgattca cctgagaaag gtggacaccc accacctcca ggtggtcacc 4860
aaaacagtga ccgccacaac agccgacggc cagaggatga gaaggctgaa gtgcaaggcc 4920
tgccggctga gatgggctag acctgaacct gcagctcagg cccctcctaa gagccacttt 4980
ccacctcatc ctagcggccc ctccagaacc agctctctgc aattgagaac ctacatggaa 5040
atgcactacg gccatcaggc cccacaggtg gcaatgctgc ctaaactgct gtgtcggcag 5100
atgctcccca ctctgtctac cctgcagcag agacatcctc agggcccatg tcctcctcca 5160
gtgacacctc tgagagtgca gtctgtgctg ctgctcggag tgcctcaaac agctggctac 5220
ccctacgatg tccctgacta tgcgtcc 5247
<210> 1198
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV - and HA-extended poly-FSP
polypeptide 4C
<400> 1198
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatggaca gcaagaagat gacccagaag 720
aaccgcaaga cccggaaggc cgccagagag aagcacagaa agaccgacaa cctggacctg 780
cagcaccagc gcagacgcaa aaagaagaag gacaaggtcg agatccggaa tcggagccct 840
aaggccaata gcaccgagtg tcagggcgag cacagcagag agcagaacct gctgaacctg 900
gtgcaattga accctcacag ccctcaccac cggaaggacg aggaagatca ccagaagaga 960
caccaccacc acaatcaaaa gaagatgtcc gtcaacgagg gcaacaacca ctggcctaga 1020
gtggaaatgc ctaccggctg gctgctcgtg ggctacaaca ccagaaacac agcccagaat 1080
cctcggctgc agcagcacct gaaacactgg cagcagtgca ccagagccag atggtgtcaa 1140
gagccctgtc agaccctgac cttcttccac ttcttcttct ttttcaaaac ggtgtccctg 1200
tgctgccccg gctggtctaa aggacaacct cctccacctg gcctgaagcc ttctagcctg 1260
gcttctcagg tggccagaac cacaggcgtg taccagcacg tgtggctgat ctgcttcgtg 1320
tttttcgtgt gcgtggaaac cggcttctgt cacgtggccc aagtgggact cgagagactc 1380
gttagcctga gcggcatcac cgacgtgaac cattgggccc agcctaagcc atctcctagc 1440
aaaggcaccg gcatgaacag acccatcggc ctgagagttg gcaaaggcgt gtgggctaga 1500
ctgtggctga agaactggaa gcggttcaag ctcaaaaaga aatacacagg catggaaatc 1560
ctgctgtgga ttctgctgaa gatggaaatt cagatcttca agatttgcct gggcgagatg 1620
cagctgtgcc tcaagaagaa agtcaacgcc tgcagcaacg ccaagaaaat gcccttccag 1680
tgccggtgca gacgcgagta cagagtgacc atgattcaga agaagaaaca gaagtccccg 1740
ctgttcttcc acggcgacct gtgcagacct tctccttgcc tgtcttggag cagcaggatc 1800
gtggctcctg gacacgccct gagctgtcgg actcgtagaa gatggtccag caagatggcc 1860
aagaagtccc agcagcctct gtgtagaggc ggcccttctg ccagcgatag atgctgtagc 1920
tgtagcccca gcggctttag cgctggaaga ggcagatgtc ctgtgcaggg atgtctgagg 1980
ccacacagag ttcagctgct gagaagatgg ggccctggat ctcctgctgg ccagagactg 2040
tctaagggct tccaactgct gcgttggtgg ggaccaggat ctccagctcc tgagcctaga 2100
aagggcccat ttccaccacc tgatcctcca tggcctgtga ccgctgtgac agtgatggct 2160
ggctctgtgc ctagcgctca gtctgtggat gctctggaat cccctggacc tctggctctc 2220
gaaggcccta gcagccctag aaacctgctc tggcgggaaa tgagcatctt cctgcctggc 2280
atcttcaacc tgcacctgtg ctactaccac agccagagca accggaacaa gagccggcag 2340
atggaatccc tgggcatgaa gctgcagatc acacacccat tcgccagcca gccactgggc 2400
caagagatgc ccaacaacac ccagatcaga ctgctgaagc ccggccaggc ctttggcagc 2460
ttttccgccg atttttcagc ccctcagcag gcccctctga gactgtggtc ttggtgcggc 2520
acaagccaga cctacttcgg ctctatcgaa gccctgacag ccctgttcac ctgtagaacc 2580
gccagcatca gcgtgaacat cagcaccctg atgagcatcc tggaagccat cctggccatg 2640
acactgaccc tgaatggcag ccctctgtgg gactgcagca caacaacagg cacacaccac 2700
ggctgcctgt gggagatccc ttctgttacc ctgctggcta ccgccaaaaa gagccctacc 2760
agcttctgct gtcagcggcc tcctctgcag ccagtggaag agaagaagaa cggccggatc 2820
agcagcgtgc caccttctcc acctcttgct ctgggcccta gaatgcagct ctgcacccag 2880
ctggcccggt tcttccctat tacacctcct gtgtggcaca tcctgggacc tcagagacac 2940
acccctctgc tgacccctga caccagatgg atcttctcca accagctgca gaccgtgcag 3000
atgctgtgtc tgcctccact gaagcagggc gagagaatca tctggcctct cggcggcttt 3060
cagatcccca acttcttttg gagcctcggc atcggacaca ctggcgcctg gtggcatact 3120
ggaaggcgga gaagagaatg gggcggcagc accgtgtcta gaagcccact gtggatcagc 3180
tccatgatct acctgagagg catggccttc gcctccgaca gcagcatcag aaccaccaga 3240
gtgtcctggt gtcggagatg tggcgccaaa agcgccgcag ccagcagcga caagaagaag 3300
aaaagcaccg aaaagaccaa gaacaagatc atctgcaagg gccacagaat cacccaggtg 3360
gtgctgagac tgggcaacct gcctccattc ttcagaggca gcgaggtgcc ctttcctaga 3420
ccttgccgga ccaagtgcca gaagaaggtt ccaagcgcct ctccttgggg actgcaccca 3480
agaacagcct ccatcacact gcctaccacc agcctgaagg gcagcagaac aagctgctgc 3540
cccagatctc accccagact gcccagaaca aagtggcctc tgcagtgcct gctgcacagc 3600
ctgggaacaa ctggaacact cgtgtgggaa aggggcgtgc tgcagatgag aagtctggaa 3660
gctcactgcc ctctgcagac attccacctc caccactgca gaacccagcc tagctcttgt 3720
cctccagcct ggattctgta ccaaggacag tggagcggag ccgtcgtggg acttagacct 3780
gtggctcacc atctgccaag acctatccag gggctgcact gtcctcaggc tcctcatcaa 3840
ccagctctgt cctggggaaa gtggcccgtg ggaatgacag gacccgccag atgttgccgg 3900
tggcctagaa gaatgtgtag ctctctggcc ctgccaaccg gcctgacatc tctgatcctg 3960
cctagcagtg atctggccgt gctgatctct agctccacca gccactttct gatgcggagc 4020
ccagtgctgc caagcagcag actgacatgt gcctctccac agctgcctcg gatgtggaca 4080
tggtctagct ggctgaaaga gtggggagga caggcccaca gacagcggaa ctgtagagtg 4140
aacgccgttg aggaactgca cagcaggcgg atgtctgtgc ggatcgtgaa gaattgggtg 4200
tcctgctgtt acgtgcggct gagtgcagtg ggactgtcta cttggagcgc cctggattcc 4260
ctgatcctgt ccttccagag agtgaaaacc agccggatac tgaacctcca ggtgctgaag 4320
aagatcctgc ggagctttat gaagctgtac cactctctcg tgatgtgcct gcggctgcgg 4380
accaagctgg aaaaagctct gagcgctctg tttatctggc cccagcacag ctacaaaggc 4440
caggcattcg gaagcctgtg ccagctggtg tctgccgatt tcagcgcccc tcaagtgacc 4500
agactgcgga gcctgaacca tctgctgatt cggtggatct ttagcaatca gctgacagtc 4560
caaatgctct gcctgccgat catcaagaaa atgaagaaac ggatcatggt gcacgtcttg 4620
aagaagaatc ggaagcagat tatctgtatc aagaatatgt tcctgcagcg gaagggattc 4680
ctgaacctga gccacgtgga aaagttcaga gagagcaccc tgggcaattt ctggatgaag 4740
ctcctgcagc tgccaccagc ttgcacctct aaggcctgga cacccagaaa gcttgtgggg 4800
agagccgtgc ggagaaaggg cgtcgtgatc aacctgaaga gactgcagaa attccgggct 4860
agcgtgtcct tctggactct gctgcctaca acaggcgtgc ggacaagagg ctctccactg 4920
agactgactc tgtggcctcc aagaagccag aaaagccagc accactgcgc cctgagaaag 4980
atcgagtggg ccacaaagct gtccctcggc ggcaaagcag gaccacaggc tcaagagaag 5040
gccaacatcc tgaacagcct gccttcctct atggaaatcg ccgtgctgca agaaatgctg 5100
aaccagaagt gtctggcccc tttcgagctt aagaagaacc tcctgctgcc aacctacaca 5160
ccccacatct gtcggcacac ccttaaaaag aagcccagag acatctgcag aatcagcggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1199
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV- and HA-extended poly-FSP
polypeptide 1D
<400> 1199
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatggccg acaagaaaaa cgtgcggagc 720
gctagttctc ctggacatcc tcttggcccc agaagaatga ccagacggac catgaccacc 780
accaaaatga tgatgatgcg gcggaccaag cggcggagaa gaaaaagacg ccggatgacc 840
atgatgacca gaagaaccct gctgaccaag aaaacctgtc tgacccctag aaccagcgcc 900
gccacaaaag ctctgcccag acagacaatc agccagcgga ggcctatcca gacacctcct 960
ggaacaagcc tggccatctg gggcagaaga agcaagatcg aggcctctcc tatcggcagc 1020
atcacccctc tgagcatcag cagacctacc agcagagcca gacagagctg ttgcctgcct 1080
ggactgacac accctgctca tcagcctctg ggctctatgg ttggagctgg aacaggcgga 1140
ggacctgctt gtgtgcctgt ggccgaagct tctacaggcg cttggacagc tgaaggcgct 1200
gccggcacaa gatgtagagc cagcagagcc ccttgcagac agctgcctgc ttctagccct 1260
accaagtgcg agatctgcgt gaagagaaga aggcggcgca agcggagcag ccagtctaga 1320
tctcccgtgc ctaagaaacg cgagcggatg atgctccctg tgcgggccag aacagctaga 1380
tctgctctgc cacaaggcag ggctcctctg gaaggaatgc ttctgcctag agcactgccc 1440
agcctgctga gcagaatgcc tgccagaaga gagagcagat tctggctggc cctgcaggcc 1500
cttggactca gacctcctca tctgcctagc tgtcaccctc tgcctcaact gcttggacct 1560
cctccacctc atcaggcccc tggcgagaaa aacgacctgc agctgttcgt gatgagcgac 1620
accacctaca agatctactg gaccgtgatc ctgctgaacc cctgcggcaa cctgcacctg 1680
aaaaccacca gcctgaacgc caagaaaatg gaagatatga tctgggagag caaccagcag 1740
ctgaagtgga cccctcacat cctgaagtcc gcctctatcg ccaagaagcg gatcaagctg 1800
cggcggaaca gcaccagacg ggaaatgcct tctcaggcca caccttctcc acctggacct 1860
tggagagccg ctctgggcaa agaagtgaag cggagccaga gcaagctgag actgagaaac 1920
acaagcccct tcgacaaaaa gggctttgtg atcctgagca acatgggcgg caaccggtct 1980
atctgcctga ccatcgtgtt ctttctggcc ccttacttcc ccatgcctag cagctggtct 2040
agcagcggca gaaccagact gcctctgagg ccacagagag gccctagacc tctgcataga 2100
tggctgcagc agaccaccgg ctgctctcag agaagaggcg actgcccaag aaccatggcc 2160
ggaccatctg cttctctgca ccctgcatct ggcagagcct ccagaaagac ctggcagaga 2220
aggctgagag cctgtagagc aggcggacct gctggatggg ctagacaggc cagaaaacgc 2280
aagagagaga agcggtccca gaagtccaga cagaaccatc tgcagctgaa aagctgcaga 2340
cggaagatca gcaactggtc taagctgcgg agcccctgga tcttcgaggc caaaaagagc 2400
atgaagagat cccagcggcc tcctcggagc atcctgagcc tgttcaagaa gaagaagccc 2460
ctgacattca gccccagcgt gtccaagaag aggctgccta agctgaaggg caagaaacgc 2520
cggaaagaaa tccagcggaa ggtggtcaag aaccccagcc agcctgtgcc actgagaaat 2580
gacggcatca ccaacggcaa cgacagcacc cggtcttgca gcatcagcct gaagaaaagc 2640
ctggaaaaga tgcccctgat gcggagcctg ctgtactcca gaatgtgcct ggtgcagatc 2700
cccacacaca cctgggagcc cgactacttt gtgtccctgc ctatgatgtt cagctgggcc 2760
acacagagct ttccagtggg cgccgtgttt ctgaccagac ctgccattcc ttgctgtagc 2820
tgtaccagcc actccaatcc ttggagccag tccacactgg ccatccggtt tatctctgcc 2880
cctcagccaa gcagcagcac cgttacagct gctcctagcg gccagtattt tgccctgcgg 2940
agtatgccca agagccggaa ccaggtgctg tttcggagaa atctgacccc aagccagctg 3000
cggacactgg cccctccata tatgctgctg cctcagtctc tgtcccagag cctgtctcgg 3060
aagcagatcc catctcagtc catgctcgtg cggaccaggc tgacactgac aggcactaga 3120
agctccggca ccagagcctc tccatctgcc gtgtgtctgt gctgctggac atgccccagc 3180
agaagctttc ctgccgcctc tccaagcgga ctgagagcac ctgttggagc acaggctcct 3240
ccagaagtga cactgagagc cagctgtgcc agctccgcca gcaaagcttg tgcaggactt 3300
tggccttggg gagcccaagt gcggatgaag aagaaggaca gcaccatctt catctacccc 3360
aggctgaaaa ccttcggcgt gccactgggc agcattctgt gtctggctgg aagcctgagc 3420
acgatgatga tcattagcac caccagacaa gagtgcggca gacgggccag cgtgccctgt 3480
agacctatga tcggaagcgc cagacctgga ccatggcgga caagtgctat gccttctgcc 3540
atgggagtcg ccctgcctac cagctgtgaa agcggaagat ctcctcctgc caccggcgga 3600
agaatgccag gatctcagtc tatcatgatg agctggatgc ctccactggc tccctgcgct 3660
gcttgtcctt gttctcctgc tcctacactg tgccctgctc accctgctag agcaccaaca 3720
gccgtgcctg cctttacacc cctgtctgct catcctgtgc cagtgctgtc tggatgtcac 3780
ctggctgtgc ggacctccat gcttaccttg ctgccaatga tgaccctgaa ggccctggtc 3840
aagacatgga cccagttcag aaactacccc agacggcacc ctcacagaag cccaccaaca 3900
agctgtcctc cactgctcga ggcctttcca ctgccaagag ccagcctgag agctaccgtg 3960
cctagacact ctagcgtgct ggccacagga ctgcatctgc ataggcagat tagcctgcct 4020
ctgcggggct tcctgctgca tcaaccactg ccaggacaac acctgtggct gtcccacaga 4080
ctgagactgc ggctgcctag aacaaccgag atccagctga ccatgaacga ctccaagcac 4140
aagctggaaa gccccgctct gaaacaggtg tccccagcta gtcctcctac acagcagcct 4200
cagacacccc aggattctag acaggtgctg gccgtgccta tgagcctggc ctgtagcatc 4260
accgtgtcct tcgtgggcca gatctctacc ctggtgctgg acgtgtcctc catcagccac 4320
tggaacggca tctgggaagt gatgcccaga acactggaag gctgcatctc cgtgaaggac 4380
caccggacat cccagaacca cagcaagtgc atcaccgagt gtgtgcggac agccctgaac 4440
accaagtgtg aaatttgtgt gaagaacacc gccatcctgg ctatcaccct gatcacccca 4500
caggaccctc acctggaccc tgtgtgtcat ccccatagaa ggcccggctg gaagggacac 4560
cacagagtgg tgtttagcca ccatccttcc ggcagcacca agtctcactg gcagcagaga 4620
gaaagaggcg gaggccgcag agaaaagaag ggctgtagag aggcaagcag agccggccag 4680
tttcctgtgt ggcggagaac atctagaggc atgtccctgc agtggaagtc cggcaatgcc 4740
tgcacacctc tgagatgtcc cagcagatct ccagccacct tcctgactgc cctgaacggc 4800
tggcatagat ctggactgag ggcccagacc gccttctttc tgctggacat catcctgcgg 4860
agagcccggc ctacaagctg cagcacatgt agaatgtggt ggcggctgcc ctgcaaagtg 4920
accgaaagct ccctggccaa gaaaaccctg accaatcagc ctagcttgcc cggaccttgt 4980
gctagcctgc tgtctacact gagccagcca ccacctcagg ctcctagcca agtttggaca 5040
gccgctacac tgcggtgtcc tgctgtgcct gctgctgcat gtccacctct gaagctggct 5100
ccactgcaag tgaccacaac actgaagctg atcctggtca tgctggaaat cgtgaccgag 5160
aacaaagttc ggcagaactt caagcggaac tccagcttct tctacaccag cgacagaggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1200
<211> 5232
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV - and HA-extended poly-FSP
polypeptide 2D
<400> 1200
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgcgga agatgcagag cctgaatcac 720
cccagcagac tgaccaacaa tcctcggaga aagacctgga agatgcggaa gaagtacgcc 780
cagaagccta gccagaagaa ccacctgtac cggcagatca accggcgcaa gctgcagaga 840
aagaagtcca gaagccacct ggacttcagc ccctactgga tgaagaaagt gaagcgggcc 900
agaaaccgga acatgaagaa aaccatgagc cacctgatcg cccatcaggc cctgaagatg 960
tctggcctga gactgtttca ccccagactg ctgaccagaa agaagcccgg caagcagaaa 1020
aagggccaca tgatcttcag ccggcggaag tggcagatcc ggcacgtgct gaagaatctg 1080
atccccagcc tgaacgccca gtggatgttc ctgagaatcg ctagcccaca gatcatgcag 1140
agaaccagcg ccgaccggtt ccggatgaag cggagaatgc agaacctgga caatctgggc 1200
gtgccctggc ctctgttgcc tggattgctg ctggcccata tgtacggctt cagcacctac 1260
ggcacccaga aaggcgagtg cgtgtgtctg cagtgtctga gcggcagcag cctgttcatc 1320
ctgaagcagc ccctggacct gaagatctcc aagaccttca tggccagccc tcagattatg 1380
cagcggatga gcgccgtgaa cttcgagaca atcctgcagg cccatcctca ggtgccagct 1440
cttgctcctc aagcttggtg gcccgctaga agaggccctc tgacatctgc tccaagcgca 1500
cagcagtccc tgacacggac actggaaagc gccggactgt ttccttggct gcacacccag 1560
tgccgggcct tcattcacac acctagaagc cctggctgca gcgtgtacgc caacatgtgc 1620
tggcggtaca agaaacgggg agtgatcgcc tggcggatct accctcctag cacatgcagc 1680
ctgccttgca gaggcctgat cctgattcag cacggcggca tcttcacctt ccggttctgg 1740
gtcgagaagc tgagctggaa catctgcaag aacctgagcc tgtacctgga taagttcgtg 1800
cagcggctgc tgtacgtgta catcatcgag acaaacgtgt tcgtgctgaa cctgttccac 1860
gtgccagtga accagatctt catgatggcc ttctacctga agtacaccga gaaggcctgg 1920
gtcatggaac tggaatggct gatccagcag cagtgctacc agcggaagag aatgaagacc 1980
ggcgccatcc aagagaaggg cgctattcaa gagaaagggg ccatgaccaa gcggatctgc 2040
gtggtcaatt tcgaggcctg cagagagatg gaaagcctga gcgcccctga gaagatcacc 2100
ctgtttgaag cccacatggc ccggtgcacc agcatcaatg tgctgtgtgt cagggccagc 2160
ctgatcgaga aactgatgaa agaaaagcgc aagatgaagc gcaaccaggt ggcatcccct 2220
caaatcatgc aacggctgtt catcaagggc taccagaaca accacttcac gttccacctc 2280
caaaacttcg ccttcttcag ctccttcggc aacaacaagt atatcaacat cctgaccttt 2340
ctgcccagca gattcccttg gggacctcct ccactgggag cccttagagc tacagctcct 2400
gctacagctg ctccccaggc acagacacct cattggagag ccgccaccac aagcagcatg 2460
agcagctctc caagagccga gcctaccagc tctagctctt gggccacttg ctggcctaga 2520
tgctgcagct ccagctgcta ttggagcctg tctagctggc ctcctgctgg cgctgccgaa 2580
gccacaaata ccagaaccag aagccgcgag agccagcggg gaagaatgct gacttggaga 2640
agctccctgt ggctgcaggg caccagatgt tttacaggcg tgcggaccag ctccaggtgc 2700
agcctgatgg aacagatccc tcacctgaag tctaacagcc ggaagaaact gctcgaggac 2760
atgaagcaga acggcttcac cagacggcgg aacagcagaa agcagagcca agtgcagctg 2820
gccatccagg tgctgctggt ggacaagcac aagtactttc tgttcggcag agccacattt 2880
ctgctggctc tgtgggagtg tagcctgcct caggctagac tgtgcctgat cgtgtctaga 2940
accctgctgc tcgtgcagtc tagacaccca agctggcctt ggaccagatg cctgagaatg 3000
cggcctccac gcagccactg gaactctgcc tacctgggga gaacactgct cgtgacctgc 3060
atcctgtacc acagatggat cgtgaccagc atgtgccaga gccagagatg gctgacctcc 3120
accacctcta gaagctctgc cctgatgtgg acctggtggt gtacaagagg tggcggcaag 3180
cggaagaaaa agatgtgcaa ggtgtccggc ggctgcaccg cctgtgttga aagatgtcct 3240
tggaagggca tctgttggaa gtggcctgtg acagtggccg ccatgagcag aacacctcca 3300
agacgcgtgt gcggccacag agagggcagc gagtctgata atctgggcct gctgtactcc 3360
tttccacctg tgctgttcaa ggccgaccag agcgaaagct ctctgagcag cggcaacagc 3420
gtgatcgtgc acaagatcgt gctggtgttc ctgaagtccc tgagcagcta caactgcgag 3480
agaagaatca gcggcatcca gaagagagcc atcgagttcg ccgtcctgaa gctgctgaac 3540
atggacctcg gcaagggact gacacacccc gtgcctctga agaggaccct gcagaacaag 3600
cggaacaaga acatcaagcg ggtcaaccag aagaagggca acatcaagag gaagtccatc 3660
ctgctgcatc tgattgtgct gaacagcccc gagagcaacc gggaaaagat catcaacccc 3720
accatcagct gcccctttca gagccccaca aagagactgg gaagccctcc tctgcacctg 3780
tgtcagcctc tgaggcccta tcctatcagc gagggcctga ccatgaccac cggcagaaac 3840
atcaacagca actccctgat gaccaactgc ctgttcagcc ccatcttcct gtgccaccac 3900
gccatcatgc accggaagat gacaagccct cacttcagac tgttctccag caagatccca 3960
catccacagg tcccaagtgt ggtggccctg tgcaagttta cacacccctg caccatgctg 4020
ctgccccaag gcgctttttg gaagcctcct agccagggca tctccagctg tctgatgaca 4080
ggctgttggc agtggtccag cgtgacaagc ctggaatgga cagcccaaga gagaggctgt 4140
tcctcctggc tgatgaagca aacatggatg aagtcttggt ccctgcggga ccccagctac 4200
agatccatcc tggaatacgt gtccacacgg gtgctgtgga tgcccacctc taccgtgcct 4260
aagttctttc tgaccttcag ccagatccgg atgtgcgccc tgtctcaccc tagcttctac 4320
atcagctcca ccgtgtgctt tctgagcaag cactgcatga ccgcctgcac acctggaacc 4380
agcctgcagt gttacctgaa cctggccaac ggcctgtggt tcaacctgat cttccggaac 4440
aaaaagacca agctgtggtt ctccctgatt aacatccacc accgcaagaa cccactgctg 4500
cccatgcggc tggaaaaaaa ggccacttgg atgcggcgga ccgagctgtc tctggaacct 4560
tggattcctt acctgcatca gcagaaaacc cagtggctcc ccatgagaag cctgggcgag 4620
ccttggcgag ctggatttca gtggggagag tctccctggc aagtgatggc ctctctgaca 4680
ggcagacgca agaaaagaga ggatcactgc ggactgcaag agaaaaaaag ccggaagctg 4740
atgtccagct gcgccgctcc tccacataga ctgctgggac ctagcagatg gggaagctgt 4800
gggagagcct gttcttgtgg cagaggctgt ggaaccccta gaggcgactg gaagagacac 4860
ccacctcggc ggattctgtt tcacgtgcgg aacatcgtgt acggaatcca agtgatgctg 4920
tgctgtcacc ccgcctggct gtctccaatc agcgcttgtc ctcgcctgct gccttatcca 4980
ttccacgttc tggccctgga agtgacattc cctccaggca ctgccatgcc tcagatgcaa 5040
ttgcaggcac tggcaatgtg ggagaaaggc tgggacaagc ctctggaaaa cacacagatc 5100
cccaggacaa gcccactgtg gaagatcaca atggtgctga cataccccaa ctgcgtggtg 5160
cacgtcctga tgttcggcgg caagaagcgg agcaagttcg gctaccccta cgatgtccct 5220
gactatgcgt cc 5232
<210> 1201
<211> 5247
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV - and HA-extended poly-FSP
polypeptide 3D
<400> 1201
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgcaga acaccagaag caccaacctg 720
gaaaagaacc ccagcctgaa gaagcagagc cagcggagag gaaagctgag cagcagaaag 780
aagggccaca ccaagaaccg gcggaaggcc aagagaaagc cccagatcag ccagaagaag 840
gaccctgccg gcaagctgaa gaaacacctg aaccggaagc tgcacctgac cagatcctgc 900
ctgatcgacc tgaccatgat gatgagccag aagctgtgga agaaccagcg caagagaatc 960
cctctgcctt ctccacggca gcatctgctg cctcagtatc cactgcatcc tccacctcca 1020
tgcctgctgc tgctccacca cagacaccat ctggcctttc tcgagatggc ctgcagcagc 1080
cagcacaccc acagcatcaa gatctggatc agcttcagcc acgaggacct gcctagaatg 1140
ctgcccatca gcagccctct gcacagaccc cagatgcctt tctggacctg cacctttcct 1200
gccaccacat ggggcacatg ggagacacct tctacatggg gctggcggac attcggccct 1260
gtgtactacg tgtgcaaccg gatgaacgtg tccagcgtgc tgaagccttt cctgttcacc 1320
gtgcctatcg aggacatgag agagtgcacc ctgggcagaa acagaatgaa tgtgtcctct 1380
gtgctgaaac cctgtctgat ccccgtgcca atcctgacca cactgagctt cgtgctgatc 1440
gaggaaagcc ggcggaacag acggtacaga aagatctacg gggagctgaa gatgtccctg 1500
caggccctgc ctctgacctt tagcacactg ctgtgggaca gcagacacac caccaccaca 1560
agcagcccca gaagatcccc tgctctgaga gctagaggcg gcaccacaat cggcgaagtg 1620
acaagcagag gcgccagcag ctctaccagc agagacagca gaagcttttt caccagcgct 1680
caccccagca gaccctgcag aatgagactg taccagagca acggcatgga agcctgcggc 1740
acacacccta cacctagact gtctagaggc cctccactgc acaccagaac catgagcctg 1800
agcaacatcc tgatgaagtt ccggctgatg ctgcagaagc agtgctgcta caacctcgtg 1860
atcaagcacc ctctgatctt ccggatcaac ctgcggagac agggcaagac caaagacggc 1920
gttgtgcaga gcctgggctt cctgaaccag cagatcatcc tgcagaaaga gttcttcatc 1980
tgcctgctga tgttcatcaa gcggtggaag ccagccgcca caaagacacc tccaccactg 2040
attctgtggc ctcaggccgc tcctgtgcac aagaagagag gcctgttcag cctgttcttc 2100
tcccactgcc tgtgccacca gatgaagtgc ctgaccgccg tggattgtct gcaggccttc 2160
tgggacatga tgattcgcaa gatccagaag cggcggagaa ccgccaaccg gctgaaaaag 2220
aaatacctgg tgcagtgtac caacctgagc gtgcccatga tgctgaccat cctgatctgg 2280
aagcgggtgt tcatcctcct gctgagcgac aagaagtgtc tgagagtcag atgcggcgga 2340
tggctgtgtg gctggacacc tagaggcaag aacaagaagc ggagaaagct gcggcccaag 2400
cacctgaaga aaaccagcgc caaggtgtcc gtgatcacca tgaagctctg ggagaagcac 2460
ttcaagggcc tgaactggaa cctggtcgtg tggattctga acctgaagat gatgtggctc 2520
aagaagtcca ccaagagcag acagagcagc ccattcctgg ctcggagctg gaataccatg 2580
caatggaaca acaagaaaat ggccatgacc gtgatcgctg gcgcccacca ctgtcagtac 2640
aagctgacct acaccaaagt gtggaagatg aattggaaga aaatgatgat cggctcccag 2700
cacctcctgt ttagcccact ggattcaagc ccactgcagt tgctgctgca ccctcacggc 2760
aagagatgca acccttgctg cagactgacc tggatgagca gagagtggga aaagcggaag 2820
cagatcctcg gcggaggcgg caagtacaaa gagtacttcc tgaagcggat tctcatccgg 2880
aaggctatga cagtgctggc cggcgataag aaaggcctgg gaagattcat gagatgcgtg 2940
cagagcgaga caaaggccgt gtctctgcag ctgcctctcg gccgaagaaa gtccggcgtg 3000
atgaagtgtt gggatctgtg ccccagactg gactttcacc ccagatctag ctctggcggc 3060
gagaagctga agcactgttt caaagcctgg ggcctgtgct tcttctacct gctgtacttc 3120
gagaagaaac ggcccgagtg gctgagcgtt gaccctcctg gatctgtctg gattctgccc 3180
tgcatggacc tggacggaat gctgacagtg atcggccagg gactcgtggg catgacccct 3240
agagatctgg gaacagtggc tggcgccacc gcacagattc agaggcctat ccaggtgcag 3300
acaggcggca gactgttcct gattcacctg agaaaggtgg acacccacca tctgcaggtc 3360
gtgaccaaga ccgtgacagc cacaacagct gacggccaga ggatgcggag actgaagtgc 3420
aaggcctgtc ggctgagatg ggccagacct gaacctgctg cacaggctcc tccaaagagc 3480
cactttccac ctcatcctag cggcccctcc agaacctcta gcctgcagct cagacccatt 3540
cctccacacc tgagacaccc actgctgctg aagggaaaga acagcccctg ctgccaaaag 3600
aaactgcggg tgcagaacca gggccatctg ctgatgatcc tgctgcataa cgccagacag 3660
cccagcaggc ctaccggaag aacccctacc acaagactga tggcccctgt gggcagcgtg 3720
atgtcttgta gcctgctgac ccagccatct cctgccagcg catgtacaat gccaccactc 3780
ctgcatccac agtgggcccc acatagtgct ggactgtctc caggcgcttg cagacctgcc 3840
tgtacctgca tcagcatgac caccatctcc agagccacat ggcggctgag aatcccaagc 3900
ctgaggaagt accggcagaa catcgagatc acccctcagc ggtctaaggc ccaggtttcc 3960
gtgtacagcg gcaatctgct gagcttctcc agacggggca tgaagagtag cgtgcggctg 4020
aagaacagca tccctcacgt gccaaaagcc accgccgctc actctgtgac agtgaagctg 4080
cagtacctgt ttttcctgac cgtgtgcggc ttcgaccggg tgttcctggt taagatctgc 4140
aagaagaagc tgctcctcaa gctgctgaga ggccccagac ggaaagtgct gatggtgctt 4200
tggctgcccg ccaaccagag tctgcagaaa agccaggtgt tccagtgggt gctgcggacc 4260
gaaacctaca tggaaatgca ctacggccat caggcccctc aggtggccat gctgcctaaa 4320
ctgctgtgta gacagatgct ccccactctg tccacactcc agcagaggca tcctcaggga 4380
ccttgtcctc ctcctgtgac acctctgaga gtgcagtctg tgctgctcct gggagtgcct 4440
cagacagccg cttttagcgg ccggattctg caccagccag aaatggccgc catgagactg 4500
atgcccaagt tcctgaactc caccaacagc tggtggacag tggcccctag atgtcctaga 4560
agcgccgtgg acattagccc cggacctaca tctcctagcc tggcctcttg tgcctctgtg 4620
gccattggaa aactggcact gctgggcgca tctgcccctt gtggcgcagc tggtgctaga 4680
gaggctggaa gatttgccgt gctgggcacc atggttatga agggtgctgc cgcagcctcc 4740
tgtcagtctc ctccatctcc aagagagaca acccctagca gcgacgccac cagacggaca 4800
agacctattg ccgctcagag caaaaagacc atgactgccg ccggactgac ccctcggaga 4860
aacctgcaga gaaatctgaa ggtcctgggc gccaagaaga tcaccttcct gagaaacagc 4920
agacgcgcca cacctacctc taagggcagc ctgagaagaa agtacctgag agtgaacatc 4980
cgcaagctca tctggaccaa gcagcggagc ttcctgtctc tgttccccaa gctgagagcc 5040
accgagcaga tgaccaatgt gggatgcctg ctcaagaaaa gcagccaatt gcggcggagc 5100
tggcgcaatg tgtcccggat cagcaacatg gaacacaggc tgaccatgga cagcgccctg 5160
agcctgacaa agagagaggg ccctgagaca agcgagaaga agaggaagtt gcctggctac 5220
ccctacgatg tccctgacta tgcgtcc 5247
<210> 1202
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide encoding the hINV - and HA-extended poly-FSP
polypeptide 4D
<400> 1202
atgcatcgac ggcgctcacg gagttgccgg gaagaccaaa agcctgtgat ggacgatcag 60
cgggacctta tttctaacaa tgaacaactt ccgatgcttg gtaggcggcc tggagcacca 120
gagtccaagt gttctagggg cgccctgtac actggtttct ccatcctcgt gacactgttg 180
ctggcgggac aggcaacaac tgcgtatttc ttgtatcagc agcaaggaag actggataag 240
cttacagtta catcccagaa tctccaactt gaaaacctca gaatgaagct tccgaagccc 300
ccaaagcccg tctccaaaat gaggatggcg acaccgctcc ttatgcaagc ccttcccatg 360
ggggctctgc cccaagggcc aatgcagaac gctacaaagt atggaaatat gacagaggat 420
catgtcatgc atttgcttca aaacgctgat ccccttaaag tttaccctcc tctgaagggg 480
agctttccag aaaatcttcg acatctcaag aacacgatgg aaacgattga ctggaaggtg 540
tttgagagct ggatgcacca ttggctcctg ttcgagatgt cccggcattc tctggagcaa 600
aagccgacgg acgcacctcc caaggaaagc ctggaattgg aggacccgag tagtgggctg 660
ggcgtcacaa agcaagacct gggacccgtg ccgatgaaca gaaagaccag aaaggccgcc 720
agagagaagc accgcaagac cgacgacaag aagaagaagt ccaccgaaaa gaccaagaac 780
gccaagaaga tgcccttcca gcagcggcct cctctgcagc ctgttaacct ggatctgcag 840
caccagcgca gacgcaaaaa gaagaaagac aaggtcgaaa tccggaatcg gagccctaag 900
gccaatagca ccgagtgtca gggcgagcac agcagagagc agaacctgct gaatctggtg 960
cagctgaacc ctcacagccc tcaccacaga aaggacgaag aggaccacca gaagcggcac 1020
caccaccaca atcaaaagaa aatgagcgtg cgggctagcg tgtccttctg gacacttttg 1080
ccaacaaccg gcgtgcggac aagaggctct ccactgagac tgacactgtg gcctccacgg 1140
gttccacctt ctccacctct tgctctgggc cccagaatgc agctgtgtac ccagctcgcc 1200
cggttcttcc ctatcacacc tcctgtgtgg cacatcctgg gacctcagag acacacacct 1260
caggctcctc tgaggctgtg gtcttggtgc ggcacaagcc agacctactt cggcagcaga 1320
ccatctcctt gcctgagctg gtccagcaga attgtggccc ctggacacgc cctgagctgt 1380
cggactagaa gaagatggtc tagcaagcgg tggatcttct ccaaccagct gaccgtgcag 1440
atgctgtgcc tgccaatcac acacccattc gcctctcagc ctctgggaca agagatgccc 1500
aacaacaccc agatccggct gctgaagccc tgcagagtga acgccgtgga agaactgcac 1560
agcaggcgga tgtctgtgcg gatcgtgaag aactgggtgt cctgctgtta cgtgcggctg 1620
tctgctgtgg gcctgtctac ttggagtgcc ctggacgagg aaaagaagaa cggccggatc 1680
agcagcctga aaaagaaagt gaatgcctgc agctccctga tcctgagctt ccagcgcgtg 1740
aaaaccggca tggaaatcct gctgtggatt ctgctgaaga tggaaattca gatcttcaag 1800
atttgcctgg gcgagatgca gctctgcggc caggcctttg gaagctttag cgccgatttc 1860
agcgcccctc agatcattaa gaagatgaag aaacggatca tggtgcacga gctgaagaag 1920
aatctgctgc tgcctatgtg ctccagcctg gctctgccaa caggcctgac atctctgatc 1980
ctgcctagca gcgatctggc cgtgctgatc tctagctcca ccagccactt tctgatgcgg 2040
agccctgtgc tgccaagcag cagactgact tgtgcctctc cacagctgcc ccggatgtgg 2100
acttggtcta gctggctgaa gaacgagggc aacaaccact ggcctagagt ggaaatgcct 2160
accggctggc tgctcgtcgg ctacaacacc agaaacacag cccagaatcc tcggctgcag 2220
cagcacctga aacactggca gcagtgcacc agagccagat ggtgtcaaga gccctgtcag 2280
accctgacct tcttccattt cttcttcttt ttcaaaacgg tgtccctgtg ttgccccggc 2340
tggtctaaag gacaacctcc tccacctggc ctgaagcctt ctagcctggc ttctcaggtg 2400
gccagaacca caggcgtgta ccagcacgtg tggctgatct gtttcgtgtt tttcgtgtgt 2460
gtggaaaccg gcttctgtca cgtggcccaa gtgggactcg agagactggt gtctctgtcc 2520
ggcatcaccg acgtgaacca ttgggcccag cctaagccat ctcctagcaa aggcaccggc 2580
atgaacagac ccatcggcct gagagttggc aaaggcgtgt gggccagact gatcctggcc 2640
atgacactga ccctgaacgg catggccaag aagtcccagc agcctctgca ggtcgtgctg 2700
agactgggaa acctgcctcc attcttcaga ggcagcgagg tgccctttcc tagaccttgt 2760
cggaccaagc ctgcctgcac aagcaaggcc tggactccca gaaaactcgt ggggagagcc 2820
gtgcggagaa agggatctcc actctgggat tgctccacca caacaggcac acaccacgga 2880
tgcctgtggg agatcccatc tgtgaccctg ctggcccatc ctagaaccgc ctctatcacc 2940
ctgcctacca caagcctgaa gggctccaga accagctgct gccctagatc tcaccccaga 3000
ctgcctagga ccaaatggcc cctgcagtgt ctgctgcaca gcctgggaac aaccggaaca 3060
ctcgtttggg aaaggggcgt cctgcagatg agatccctcg aagcccattg tccactgcag 3120
accttccatc tgcaccactg caggacccag cctagctctt gtcctcctgc ctggattctg 3180
taccaaggac agtggagcgg agccgtcgtg ggacttagac ctgtggctca ccatctgcct 3240
agacctatcc agggcctgca ctgtccacag gcacctcatc aacctgctct gagctgggga 3300
aaatggcccg tgggaatgac aggccctgcc agatgttgca gatggcccag acggtgccag 3360
aagaaggttc catcagcctc tccatggggc ctcgtgctca aaaagaaccg gaaacagatg 3420
ctgaaccaga agtgtctggc cccttttaga gagagcaccc tgggcaattt ctggatgaag 3480
ctgctccagc tgcctgtcgt gatcaacctg aagagactgc agaagttcaa cctgcacctg 3540
tgctactacc acagccagag caacagaaac aagagccgcc agatggaatc cctgggcatg 3600
aagttgcagt cccagaaatc ccagcaccac tgtgccctgc ggaagatcga gtgggccaca 3660
aagttgtctc tcggcggaaa agccggacca caggctcaag agaaggccac ctctcggatt 3720
ctgaacctgc aagtgctcaa gaagatcctg cggagcttta tgaagctgta ccactctctg 3780
gtcatgtgcc tgcggctgag gaccaagctg gaaaaggctc tgagcgccct gttcatctgg 3840
ccccagcaca gctacaagcc cctgttcttt cacggcgacc tgtgcgagtg gggaggccag 3900
gctcatagac agcggaactg gctgaaaaac tggaagcggt tcaagcttaa aaagaagtac 3960
atccagaaga agaagcagaa gtctaacaag atcatctgca agggccaccg catcaccatc 4020
atctgtatca agaatatgtt cctgcagcgc aagggcttcc tgaacctgag ccacgtggaa 4080
aagttctgta gaggcggccc tagcgccagc gatagatgct gttcttgtag ccccagcggc 4140
ttcagtgccg gcagaggaag atgtcctgtt cagggctgtc tgaggcccca cagagttcaa 4200
ctgctgagaa gatggggccc tggctctcct gctggacaga ggctgtctaa gggctttcag 4260
ctgctccgtt ggtggggacc aggatctcct gctcctgagc ctagaaaggg cccatttcca 4320
ccacctgatc ctccatggcc tgtgaccgct gtgacagtga tggctggatc tgtgcctagt 4380
gctcagtctg tggacgccct ggaatctcct ggacctctgg ctctcgaagg acctagcagc 4440
cctagaaacc tgctttggag agagatgagc atctttctgc ccggcatctt caccgccaag 4500
aaaagcccca ccagcttttg ctgcaatatc ctgaacagcc tgccaagctc tatggaaatc 4560
gccgtgctgc aagaggacag caaaaagatg acccagaagg gccaagcctt cggctccctg 4620
tgtcagcttg tgtccgctga cttctctgcc cctcaagtga cccggctgcg gagcctgaat 4680
catctgctga tcacctacac accccacatc tgcagacaca ccctgctgac ccctgacacc 4740
agatggatct ttagcaatca gctgcagaca gtccagatgc tctgtctgcc tccactgaag 4800
cagggcgaga gaatcatttg gcccctcggc ggctttcaga tccccaactt cttttggagc 4860
ctcggcatcg gacacactgg cgcctggtgg catactggaa ggcggagaag agaatggggc 4920
ggcagcaccg tgtctagaag ccctctgtgg atcagctcca tgatctacct gagaggcatg 4980
gccttcgcca gcgacagcag catcagaacc accagagtgt cctggtgcag aagatgcggc 5040
gccaaaagcg ctgccgccag ctctattgaa gctctgaccg ctctgtttac ctgccggacc 5100
gccagcatca gcgtgaacat cagcaccctg atgtccatcc tggaagcact taagaagaaa 5160
cccagagaca tctgccgcat cagctgccgg tgtagacgcg agtacagagt gactatgggc 5220
tacccctacg atgtccctga ctatgcgtcc 5250
<210> 1203
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 1C
<400> 1203
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaagcacc 120
agacgggaaa tgccttctca ggccacacct tctccacctg gaccttggag agccgctctg 180
ggcaaagaag tgaagcggag ccagagcaag ctgcggctga gaaacacaag ccccaccgag 240
atccaattga ccatgaacga cagcaagcac aagctggaaa gccccgctct gaaacaggtg 300
tcccctgcct ctccacctac acagcagcct cagacacccc aggatagcag acaggtgctg 360
gccgcttctt ctcctggaca tcctcttggc cctggcgact gccctagaac aatggctgga 420
ccttctgcct ctctgcaccc agcatctggc agagccagca gaaagacctg gcagagaagg 480
ctgagagcct gtagagctgg tggacctgct ggatgggcta gacaggccat gacactgaag 540
gccctggtca agacctggac acagttcaga aactacccca gagtcggagc cggaacaggc 600
ggaggacctg cttgtgttcc tgtggccgaa gcttctactg gcgcctggac agctgaaggc 660
gctgccggaa caagatgcag agcttctaga gccccttgca gacagctgcc tgccagctct 720
cctaccaagt gcgagatctg cgtgaagaga aggcggcgga gaaagcggag cagccagtct 780
agatctcccg tgcctaagaa acgcgagcgg atgatgctgc ctgtgcgggc cagaacagct 840
agatctgctc tgccacaagg cagagcccct ctggaaggaa tgcttctgcc tagagcactg 900
cccagcctgc tgagcagaat gccagccaga agagagagcc ggttttggct ggcactgcag 960
gctctgggac tcagacctcc tcatctgcct agctgtcacc ctctgcctca actgcttgga 1020
cctcctccac ctcatcaggc ccctttcgac aagaaaggct tcgtgatcct gagcaagggc 1080
aagaagcgcc ggaaagaaat ccggcggatg accagacgga ccatgaccac caccaaaatg 1140
atgatgatgc ggcggaccaa gcggcggagg cgaaaacgta gaagaatgac catgatgacc 1200
cgcagaaccc tgctgaccaa gaaaacctgt ctgaccccta gaaccagcgc cgccacaaaa 1260
gctctgccca gacagacaat cagccagcgg aggcctatcc agacacctcc tggaacaagc 1320
ctggccatct ggggcagact gcctctcaga ccacagagag gacctcggcc tctgcataga 1380
tggctgcagc agacaacagg ctgctcccag agaagaatcg ccaagaagcg gatcaagctg 1440
aggcggaaca cactggccat ccggtttatc tctgcccctc agcctagcag cagcaccgtt 1500
acagctgctc ctagcggcca gtacttcagc agcttcttct acaccagcga ccggaccaag 1560
tgtgaaatct gtgtcaagaa caccgccatc ctggctatca ccctgatcac ccctcaggac 1620
cctcacctgg accctgtgtg tcacccacat agaaggcctg gctggaaggg ccaccacaga 1680
gtggtgttta gccaccatcc aagcggctcc accaagagcc attggcagca gagagaaaga 1740
ggcggaggcc gcagagaaaa aaagggctgc agagagatgc ccagcagctg gtctagctct 1800
ggcagaaccg ccgacaaaaa gaacgtgcgg agcagaacca gactgaccct gacaggcaca 1860
agaagcagcg gcacaagagc ctctccaagc gccgtgtgtc tgtgctgttg gacatgcccc 1920
tccagaagct tccctgccgc atctccatct ggactgagag cacctgttgg agcccaggct 1980
cctcctgaag tgacactgag agccagctgt gcctctagcg cctctaaagc ctgtgctgga 2040
ctttggcctt ggggagccca agtgcggaac aaagtgcggc agaacttcaa gcggaacctg 2100
gccaaaaaga ccctgactaa cgccctgcgg agtatgccca agagcagaaa ccaggtgctg 2160
ttcagacgga atctgacccc aagccagctg agaactctgg cccctcctta catgctgctg 2220
ccccagtctc tgtctcagag cctgtccaga aagcagatcc ccagccaatc aatgctcgtg 2280
accgccttct tcctgctcga catcatcctg agaagcctgc tgtactcccg gatgtgcctg 2340
gtgcagatcc ctacacacac ctgggagccc gactacttcg tgtccctgcc tatgatgttc 2400
agctgggcca ctcagagctt tccagtggga gccgtgttcc tgaccagacc tgccattcct 2460
tgctgcagct gtaccagcca cagcaaccct tggagccagt ccttcaagaa gaagaagccc 2520
ctgacattca gccccagcgt gccaatgtct ctggcctgta gcatcaccgt gtccttcgtg 2580
ggccagatca gcacactggt gctggacgtg tcctccatct ctcactggcg caagcgcaag 2640
agagagaagc ggtcccagaa gtcccggcag aaccatctgc agctgaagtc ctgcagacgg 2700
aagatcagca actggtccaa gctgagatcc ccgtggatct tctaccctcg gctgaaaacc 2760
ttcggcgtgc cactgggctc tatcctgtgt ctggcaggct ccctgagcac gatgatgatc 2820
attagcacca ccagacaaga gtgtggcaga cgggcctccg tgccttgtag acctatgatc 2880
ggcagcgcta gacccggacc ttggcggaca tctgctatgc catctgccat gggagtcgcc 2940
ctgcctacca gctgtgaaag cggaagatct cctcctgcca ccggcggaag aatgcctgga 3000
tctcagtcta tcatgatgag ctggatgcct ccactggctc cctgtgccgc ttgtccttgt 3060
tctcctgctc ctacactgtg ccctgctcat cctgcaagag cccctacagc cgtgcctgcc 3120
tttacacctc tgtctgctca ccctgtgcca gtgctgtctg gatgtcacct ggccgtgcgc 3180
acctctatgc tgacactgct gcccatgaga caccctcaca gaagcccacc tacaagctgc 3240
cctccactgc tggaagcttt cccactgcca agggccagcc tgagagctac cgtgcctaga 3300
cacagctctg tgctggccac tggactgcat ctgcatcggc agattagcct gcctctgagg 3360
ggcttcctgc tgcatcaacc tctgcctgga caacacctgt ggctgtccca cagactgagg 3420
ctgagactgc caagaacagg cgagaagaac gacctccagc tgttcgtgat gagcgacacc 3480
acatacaaga tctactggac agtgatcctg ctgaacccct gcggcaacct gcacctgaaa 3540
accacatctc tgcggagagc cagacctacc tcctgcagca catgcagaat gtggtggctg 3600
aagctggccc cactgcaagt gaccacaaca ctgaagctga tcctggtcat gctggaaatc 3660
gtgaccgaag aggccaagaa atccatgaag agatcccggc ggagcaagat cgaggcctct 3720
cctatcggct ccatcatgaa gaagaaagac agcaccatct tcatcaacca gcagctcaag 3780
tggacccctc acatcctgaa gtctgccagc gtgtccaaga agagactgcc caagctgaac 3840
ggcatctggg aagtgatgcc ccggacactg gaaggctgca tcagcgtgaa ggaccaccgg 3900
acaagccaga accacagcaa gtgcatcacc gagtgtgtgc ggacagccct gaaccagaga 3960
aaggtggtca agaaccccag ccagccagtg ccactgagaa acgacggcat caccaacggc 4020
aacgactcca ccagatcctg ctccatcagc ctgaagaaaa gcctggaaaa gatgcccctg 4080
atgaacgcca agaaaatgga agatatgatc tgggagagca acatgggcgg caaccggtcc 4140
atctgcctga caagactgcc ctgcaaagtg accgagtcca gccaaagacc acctcggagc 4200
attctgtccc tggcctctag agccggacag tttcccgttt ggcggagaac cagcagaggc 4260
atgtccctgc agtggaagtc cggcaatgcc tgcacacctc tgaggtgccc tagcagaagc 4320
cctgccacat ttctgaccgc actgaacggc tggcacagat ctggacttag ggctcagcaa 4380
cctagcctgc caggaccttg tgctagcctg ctgtctacac tgagccagcc tccaccacag 4440
gctccaagcc aagtttggac agccgccaca ctgagatgtc ccgctgttcc tgcagctgct 4500
tgccctccta tcgtgttctt tctggcccca tacttcccca caccactgag catcagcaga 4560
cccacctctc gggccagaca gtcttgttgt ctccccggac tgacacaccc tgctcaccag 4620
cctcttggct ctatgggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1204
<211> 4672
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 2C
<400> 1204
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgacggcag 120
atcaacagac ggaagctgca gagaaagaag cgccggaaga agagagagga ccactgcgga 180
ctgcgggcca gaaaccggaa catgaagaaa accatgagcc acctgatcgc ccatcaggcc 240
ctgaagatgt ctggcctgag actgtttcac cccagactgc tgacacggaa gaagcctggc 300
aagaaccctc ggagaaagac ctggaagatg cggaagaagt acgcccagaa gcctagccag 360
aagaaccacc tgtacggcaa gggcctgaca caccctgtgc ctctgaagag aaccctgcag 420
aacaagcgga acaagaacat caagcgcgtg aaccagaaga agggcaacat caagagaaag 480
agcatcctgc tgcacctcat cgtgctgaac agccccgaga gcaacctgca ggctcatcct 540
caagttccag cactggctcc tcaggcttgg tggcctgcta gaagaggccc tctgacaagc 600
gctccatctg ctcagcagag cctgaccttc ctgcctagca gatttccttg gggccctcct 660
ccactgcact ggaactctgc ctacctgggc agaacactgc tcgtgacctg catcctgtac 720
cacagatgga tcgtgaccag catgtgccag agccagagat ggctgaccag caccacctct 780
agaagcagcg ccctgatgtg gacccagtgg tctagcgtga caagcctgga atggacagcc 840
caagagaggg gctgtagcag ctggctgatg aagcagacct ggatgaagtc ttggagcctg 900
cgggacccca gctacagatc catcctggaa tacgtgtcca ccagagtgct gtggatgccc 960
acatctacag tgggagccct gagagccaca gctcctgcaa cagctgctcc acaggctcag 1020
acccctcatt ggagagccgc cacaacaagc agcatgagca gcagccctag agccgagcct 1080
acaagctcta gctcttgggc cacctgttgg cccagatgtt gcagctccag ctgttactgg 1140
tccctgtcct cttggcctcc tgctggtgct gccgaggcca caaataccag gaccagaagc 1200
agagagtccc agcggggcag aatgctgact tggagaagca gcctgtggct gcagggcacc 1260
agatgtttta caggcgtgcg gacctccagc agacaccctt cttggccttg gaccagatgc 1320
ctgagaatgc ggcctcctag aagcaacagc cggaaaaagc tgctcgagga catgaagcaa 1380
aatggcttca cccggtacaa gaaacggggc gtgatagcct ggcggagagc cactttcctg 1440
ctggcccttt gggagtgcag tctgccccaa gctagactgt gcctgatcgt gtctaggacc 1500
ctgctgctgg tccagagcag atgcagcctg atggaacaga tccctcacct gaagtcctgg 1560
tggtgtacaa gaggcggcgg aaagcggaag aaaaagatgt gcaaggtgtc cggcggctgc 1620
accgcctgtg ttgaaagatg tccttggaag ggcatctgct ggaagtggcc tgtgacagtg 1680
gccgctctga tcctgattca gcacggcggc atcttcacct tccggttctg ggtcgagaag 1740
ctgtcctgga acatctgcaa gaatctgtcc ctgtacctgg acaagttcgt gcagcggctg 1800
ctgtacgtgt acatcatcga gacaaacgtg ttcgtcctga acctgttcca cgtgccagtg 1860
aatcagatct tcatgatggc cttctacctg aagtacaccg agaaggcctg ggtcatggaa 1920
ctggaatggc tcattcagca gcagtgctac cagttgctgc tggctcatat gtacggcttc 1980
agcacctacg gcacccagaa aggcgagtgc gtgtgtctgc agtgtctgag cggcagctcc 2040
ctgttcatcc tgaagcagcc actggacctg aagatcagca agaccttcat gagcagatcc 2100
cacctggatt tcagccccta ttggatgaag aaagtgaagg cctctccaca gatcatgcag 2160
cggatgagcg ccgtgaactt cgagacaatc aggcggaagt ggcagatccg gcacgtgctg 2220
aagaacctgc ctctggaaaa cacacagatc cccaggacaa gccctctgtg gaagatcaca 2280
atggtgctga cataccccaa ctgcgtggtg catgtgctga tgttcgtgct gttcaaggcc 2340
gaccagagcg agtctagcct gagcagcgga atctaccctc ctagcacctg tagcctgcct 2400
tgccggggca ttagaatgtg cgccctgtct caccctagct tctacatcag cagcaccgtg 2460
tgctttctga gcaagcactg catgaccgcc tgcaccagag agaagatcat caaccccacc 2520
atcagctgcc cctttcagag ccccacaaag agactgggcc acagagaggg cagcgagagc 2580
gataatctgg gcctgctgta ctcctttcct ccttggctgc ccatgagatc cctgggcgaa 2640
ccttggagag ctggctttca gtggggagag tccccttggc aagtgatggc tagcctgacc 2700
ggcaacagcg tgatcgtgca caagatcgtg ctggtgtttc tgaagtctct gagcagctac 2760
aactgcgagc ggcggatctc tggcatccag aagagagcca tcgagttcgc cgtcctgaag 2820
ctgctgaaca tggacctggc tagccctcag attatgcaga gaaccagcgc cgaccggttc 2880
cggatgaagc ggagaatgca gaacctggat aacctgggcg tgccctggcc attgcttcca 2940
ggtgctgctc ctccacatag actgctgggc ccctctagat ggattctgtt tcatgtgcgg 3000
aacatcgtgt acggcatcca agtgatgctg tgccggcgga gaaacagcag aaagcagagt 3060
caggtgcagc tggccattca ggtcctgctc gtggacaagc acaagtactt tctgttcggc 3120
ccctatccta tcagcgaggg actgaccatg accaccggcc ggaacatcaa cagcaactcc 3180
ctgatgacca actgcctgtt cagccccatc ttcctgtgcc accacgccat catgcaccgg 3240
aagatgacaa gcccacactt cagactgttc tccagcaaga tcccacatcc tcaggtgcca 3300
agtgtggtgg ccctgtgcaa gttcctggcc aatggcctgt ggttcaacct gatctttcag 3360
aaaaagggcc acatgatctt tagccccaag ttcttcctga cctttagcca gcggaccctg 3420
gaatccgccg gactgtttcc atggctgcac acccagtgcc ggaacaaaaa gaccaagctg 3480
tggttttccc tgatcaacat ccaccaccgc aagaatcctc tgctgcctat gagaatgagc 3540
agaacacctc ctcggagagt gtgcggatct ccacctctgc atctgtgcca acctctgaga 3600
ggcggcaaga agagaagcaa gttcgccttc tggaagcctc ctagccaggg catcagctct 3660
tgtctgatga caggctgttg gggctcctgt ggcagagctt gttcttgcgg aagaggctgc 3720
ggtacaccca gaggcgactg gaaaagacac ccacctcgca gagagctgag cctggaacca 3780
tggattcctt atctgcacca gcaaaagacc cagcggaagc ggatgaagac cggcgccatt 3840
caagagaagg gcgctatcca agaaaaaggc gcaatgacca agcggatctg cgtggtcaat 3900
ttcgaggcct gcagagagat ggaaagcctg agcgcccctg agaagattac cctgttcgaa 3960
gcccacatgg cccggtgcac ctccatcaat gtgctgtgtg tccgggccag cctgattgag 4020
aagctgatga aagaaaagcg caagatgaag cgcaaccagg tggcatcccc tcaaatcatg 4080
caacggctgt tcatcaaggg ctaccagaac aaccacttca cgttccacct ccaaaacttt 4140
gccttcttca gctccttcgg caacaacaag tatatcaaca ttctcacccg ggccttcatc 4200
cacacaccta gaagccctgg ctgttccgtg tacgccaata tgtgctggcg gaagatgcag 4260
tccctgaatc accccagcag actgaccaac tgtcaccccg cttggctgag ccccattagt 4320
gcttgtccta ggctgctgcc ctatcctttt cacgtgctgg cactggaagt gacctttcca 4380
cctggcacag ccatgcctca gatgcaattg caggcactgg ctatgtggga gaaaggctgg 4440
gacaagcaag agaagaaatc ccgcaagctg atgtcctcct gcctggaaaa aaaggctacc 4500
tggatgcgga gaacccctgg cacaagcctg cagtgttacc tgaacacaca cccctgcacc 4560
atgctgctgc ctcagggaat cccatctctg aacgcccagt ggatgttcct gcggatcggc 4620
tacccctacg atgtccctga ctatgcgtcc taaaggcgcg cctagcggcc gc 4672
<210> 1205
<211> 4687
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 3C
<400> 1205
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgacctatt 120
cctccacacc tgagacaccc tctgctgctg aagaacaaga agcggagaaa gctgcggccc 180
aagagcagaa agaagggcca caccaagaac cggcggaagg ccaagagaaa gccccagatc 240
agaaacagcc gcagagccac acctaccagc aagggcagcc tgagaagaaa gtacctgaga 300
gtgggagccg ccgctgctag ctgtcaatct cctccatctc ctagagagac aacccctagc 360
agcgacgcca ccagaagaac cagacctatc gccgctcaga gcaagaaaac catgacagcc 420
gccggactga cccctagcca gaagaaagat cctgccggca agctgaagaa acaggtgtcc 480
gtgtacagcg gcaacctgct gagcttctct cggagaggca tgaagtctag cgtgcgcctg 540
aagaactgca ccaacctgag cgtgcccatg atgctgacca tcctgatctg gaagcgggtg 600
ttcatcctgc tgctgtccga caagaaatct atccctcacg tgcccaaggc caccgccgct 660
cattctgtga cagtgaagct gcagagccgg cggaacagac ggtacagaaa gatctatggc 720
gagctgaaga tgtccctgca ggccagcaat ggcatggaag cctgtggcac acaccccaca 780
cctagactgt ccgtgtccgt gatcaccatg aagctgtggg agaagcactt caagggcctg 840
aactggaacc tggtcgtgtg gattctgaac ctgaagatga tgctcaagaa gaagtatctg 900
gtccagcgcg agtgggagaa acggaagcag attcttggcg gcggaggcaa gtacaaagag 960
tacttcctga agagaatcct catccgcaag gccatgacag tgctggccgg cgataagaaa 1020
ggcctgggca gattcatgag atgcgtgcag agcgagacaa aggccgtcag tctgcagctg 1080
cctctgggca gaatggacct ggatggaatg ctgaccgtga tcggccaggg actcgtgggc 1140
atgacaccta gagatctggg aacagtggct ggcgccaccg cacagattca gaggcctatt 1200
caggtgcaga caggcggcag actgagaggc cctagaagaa aggtgctgat ggtgctgtgg 1260
ctgcccgcca atcagagcct gcagaaaagc caggtgttcc agtgggtgct gagaaccgag 1320
ctgcccctga cctttagcac cctgctgtgg gacagcagac acgacctgcc tagaatgctg 1380
cccatcagca gccctctgca cagaccccag atgcctttct ggacctgcac ctttcctgcc 1440
accacatggg gcacatggga gacaccttct acatggggct ggcggacctt tgccagacag 1500
ccttctagac ccaccggcag aacccctacc accagactga tggctccagt gggcagcgtg 1560
atgagctgta gcctgctgac acagccatct ccagccagcg cctgtacaat gcctccactg 1620
ctgcatcctc agtgggcccc tcattctgct ggactttctc caggcgcttg cagacctgcc 1680
tgtacctgca tcagcatgac cacaatcagc agggccacct ggcgcagaaa cctgcagaga 1740
aacctgaaag tgctgcggct gagaatcccc agcctgcgga agtacagaca gcagaacacc 1800
cggtccacca acctcgagaa gaacccatct ctgaagaagc agagccagag gcggggcaag 1860
ctgtctctga ccacactgag cttcgtgctg atcgaggaac tgctgaaaaa gagcagccag 1920
ctgcggagaa gctggcggaa cgtgtccaga atcagcaaca tccggaagct gatttggacc 1980
aagcagcgga gcttcctgtc tctgttcccc aagctgagag ccaccgagca gatgaccaat 2040
gtgggctgta gactggattt tcaccccaga agcagctccg gcgacagagt gttcctggtc 2100
aagatccaga gcagcccatt cctggccaga tcctggaata ccatgcagtg gaacaacaag 2160
aaaatggcca tgactgtgat cgctggcgcc caccactgtc agtacaagct gacctacacc 2220
aaagtgtgga agatgaattg gaagaaaatg atgatcggca gccagcacct cctgttctcc 2280
ccactggata gctctccact ccagctgctg ctgcacccac acggcaagag atgcaacccc 2340
tgttgtcggc tgacatggat gagccacctg aatcggaagc tgcacctcac caggtcctgc 2400
ctgatcgacc tgaccatgat gatgagccag aaactgtgga agaatcagcg gaagcgcatc 2460
cctctgcctt ctccaagaca gcatctgctg cctcagtatc ctctgcaccc tcctccacct 2520
tgtctgctgc ttctccacca tagacaccac ctggcattcc tcgagatggc ctgtagctct 2580
cagcacaccc acagcatcaa gatctggatc agcttcagcc acgagacaat gagcctgtcc 2640
aacatcctga tgaagttccg gctgaccacc accacaagca gccccagaag aagccctgct 2700
ctgcgagcta gaggcggcac aacaatcggc gaagtgacca gcagcctgtt ctttagccac 2760
tgcctgtgcg tggcccctag atgtcctaga tctgccgtgg acatcagccc cggacctaca 2820
tctccttctc tggcctcttg tgcctctgtg gccattggaa agctggcact gcttggcgcc 2880
tctgctcctt gtggtgctgc tggcgctaga gaggccggaa gatttgctgt gctgggcacc 2940
atggtcatga agaacatgga acacagactg accatggaca gcgccctgag cctgacaaag 3000
agagagggcc ctgaaacagg ccccgtgtac tacgtgtgca accggatgaa tgtgtccagc 3060
gtgctgaagc ctttcctgtt caccgtgcct atcgaggaca tgagagagtg caccctggga 3120
cgcaacagaa tgaatgtctc ttccgtgctg aaaccctgtc tgatccccgt gccaatctgc 3180
aagaagaaac tgctgctcaa gctgctgagg ggcgcctcca gctctaccag cagagatagc 3240
agaagctttt tcaccagcgc tcaccccagc agaccctgca ggatgagact gtaccagatg 3300
ctgcagaagc agtgctgcta caacctcgtg atcaagcacc ctctgatctt ccggatcaac 3360
ctgcggagac agggcaagac caaagacggc gttgtgcaga gcctgggctt cctgaaccag 3420
cagatcatcc tccagaaaga gttcttcatc tgcctgctga tgttcatcaa gcggtggaag 3480
ccagccgcca ccaagaaggg caagaacagc ccctgctgcc agaaaaaact gcgggtgcag 3540
aaccagggcc atctgctgat gattctgctg cacaacagag gcccacctct gcataccaga 3600
ttcgagaaaa agcggcccga gtggctgagc agaaaatccg gcgtgatgaa gtgctgggat 3660
ctgtgccctg ccttcagcgg caggattctg caccagccag aaatggccgc catgagactg 3720
atgcccaagt tcctgaactc caccaacagc tggtggacag tgcacaagaa gagaggcctg 3780
ttccaccaga tgaagtgtct gaccgccgtg gactgtctgc aggccttctg ggatatgagc 3840
gagaagaaac gcaagctgcc tatgattcgc aaaatccaga agcggcggag aaccgccaac 3900
cggaacatcg agatcacccc tcagagaagc aaagcccacc tgaagaaaac ctccgccaag 3960
ggcgccaaga aaatcacctt cctgtgcctg agagtcagat gcggaggctg gctgtgtggc 4020
tggacaccaa gaggatggct gaagaagtcc accaagtcca gactgtgctt cttctacctg 4080
ctgtactacc tgtttttcct gaccgtgtgc ggcttcaccc ctccaccact tattctgtgg 4140
cctcaggcag cccctggcga gaagctgaag cactgtttta aagcctgggg cgtcgaccct 4200
cctggcagcg tttggattct gccctgcttc ctgattcacc tgagaaaggt ggacacccac 4260
cacctccagg tggtcaccaa aacagtgacc gccacaacag ccgacggcca gaggatgaga 4320
aggctgaagt gcaaggcctg ccggctgaga tgggctagac ctgaacctgc agctcaggcc 4380
cctcctaaga gccactttcc acctcatcct agcggcccct ccagaaccag ctctctgcaa 4440
ttgagaacct acatggaaat gcactacggc catcaggccc cacaggtggc aatgctgcct 4500
aaactgctgt gtcggcagat gctccccact ctgtctaccc tgcagcagag acatcctcag 4560
ggcccatgtc ctcctccagt gacacctctg agagtgcagt ctgtgctgct gctcggagtg 4620
cctcaaacag ctggctaccc ctacgatgtc cctgactatg cgtcctaaag gcgcgcctag 4680
cggccgc 4687
<210> 1206
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 4C
<400> 1206
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgagacagc 120
aagaagatga cccagaagaa ccgcaagacc cggaaggccg ccagagagaa gcacagaaag 180
accgacaacc tggacctgca gcaccagcgc agacgcaaaa agaagaagga caaggtcgag 240
atccggaatc ggagccctaa ggccaatagc accgagtgtc agggcgagca cagcagagag 300
cagaacctgc tgaacctggt gcaattgaac cctcacagcc ctcaccaccg gaaggacgag 360
gaagatcacc agaagagaca ccaccaccac aatcaaaaga agatgtccgt caacgagggc 420
aacaaccact ggcctagagt ggaaatgcct accggctggc tgctcgtggg ctacaacacc 480
agaaacacag cccagaatcc tcggctgcag cagcacctga aacactggca gcagtgcacc 540
agagccagat ggtgtcaaga gccctgtcag accctgacct tcttccactt cttcttcttt 600
ttcaaaacgg tgtccctgtg ctgccccggc tggtctaaag gacaacctcc tccacctggc 660
ctgaagcctt ctagcctggc ttctcaggtg gccagaacca caggcgtgta ccagcacgtg 720
tggctgatct gcttcgtgtt tttcgtgtgc gtggaaaccg gcttctgtca cgtggcccaa 780
gtgggactcg agagactcgt tagcctgagc ggcatcaccg acgtgaacca ttgggcccag 840
cctaagccat ctcctagcaa aggcaccggc atgaacagac ccatcggcct gagagttggc 900
aaaggcgtgt gggctagact gtggctgaag aactggaagc ggttcaagct caaaaagaaa 960
tacacaggca tggaaatcct gctgtggatt ctgctgaaga tggaaattca gatcttcaag 1020
atttgcctgg gcgagatgca gctgtgcctc aagaagaaag tcaacgcctg cagcaacgcc 1080
aagaaaatgc ccttccagtg ccggtgcaga cgcgagtaca gagtgaccat gattcagaag 1140
aagaaacaga agtccccgct gttcttccac ggcgacctgt gcagaccttc tccttgcctg 1200
tcttggagca gcaggatcgt ggctcctgga cacgccctga gctgtcggac tcgtagaaga 1260
tggtccagca agatggccaa gaagtcccag cagcctctgt gtagaggcgg cccttctgcc 1320
agcgatagat gctgtagctg tagccccagc ggctttagcg ctggaagagg cagatgtcct 1380
gtgcagggat gtctgaggcc acacagagtt cagctgctga gaagatgggg ccctggatct 1440
cctgctggcc agagactgtc taagggcttc caactgctgc gttggtgggg accaggatct 1500
ccagctcctg agcctagaaa gggcccattt ccaccacctg atcctccatg gcctgtgacc 1560
gctgtgacag tgatggctgg ctctgtgcct agcgctcagt ctgtggatgc tctggaatcc 1620
cctggacctc tggctctcga aggccctagc agccctagaa acctgctctg gcgggaaatg 1680
agcatcttcc tgcctggcat cttcaacctg cacctgtgct actaccacag ccagagcaac 1740
cggaacaaga gccggcagat ggaatccctg ggcatgaagc tgcagatcac acacccattc 1800
gccagccagc cactgggcca agagatgccc aacaacaccc agatcagact gctgaagccc 1860
ggccaggcct ttggcagctt ttccgccgat ttttcagccc ctcagcaggc ccctctgaga 1920
ctgtggtctt ggtgcggcac aagccagacc tacttcggct ctatcgaagc cctgacagcc 1980
ctgttcacct gtagaaccgc cagcatcagc gtgaacatca gcaccctgat gagcatcctg 2040
gaagccatcc tggccatgac actgaccctg aatggcagcc ctctgtggga ctgcagcaca 2100
acaacaggca cacaccacgg ctgcctgtgg gagatccctt ctgttaccct gctggctacc 2160
gccaaaaaga gccctaccag cttctgctgt cagcggcctc ctctgcagcc agtggaagag 2220
aagaagaacg gccggatcag cagcgtgcca ccttctccac ctcttgctct gggccctaga 2280
atgcagctct gcacccagct ggcccggttc ttccctatta cacctcctgt gtggcacatc 2340
ctgggacctc agagacacac ccctctgctg acccctgaca ccagatggat cttctccaac 2400
cagctgcaga ccgtgcagat gctgtgtctg cctccactga agcagggcga gagaatcatc 2460
tggcctctcg gcggctttca gatccccaac ttcttttgga gcctcggcat cggacacact 2520
ggcgcctggt ggcatactgg aaggcggaga agagaatggg gcggcagcac cgtgtctaga 2580
agcccactgt ggatcagctc catgatctac ctgagaggca tggccttcgc ctccgacagc 2640
agcatcagaa ccaccagagt gtcctggtgt cggagatgtg gcgccaaaag cgccgcagcc 2700
agcagcgaca agaagaagaa aagcaccgaa aagaccaaga acaagatcat ctgcaagggc 2760
cacagaatca cccaggtggt gctgagactg ggcaacctgc ctccattctt cagaggcagc 2820
gaggtgccct ttcctagacc ttgccggacc aagtgccaga agaaggttcc aagcgcctct 2880
ccttggggac tgcacccaag aacagcctcc atcacactgc ctaccaccag cctgaagggc 2940
agcagaacaa gctgctgccc cagatctcac cccagactgc ccagaacaaa gtggcctctg 3000
cagtgcctgc tgcacagcct gggaacaact ggaacactcg tgtgggaaag gggcgtgctg 3060
cagatgagaa gtctggaagc tcactgccct ctgcagacat tccacctcca ccactgcaga 3120
acccagccta gctcttgtcc tccagcctgg attctgtacc aaggacagtg gagcggagcc 3180
gtcgtgggac ttagacctgt ggctcaccat ctgccaagac ctatccaggg gctgcactgt 3240
cctcaggctc ctcatcaacc agctctgtcc tggggaaagt ggcccgtggg aatgacagga 3300
cccgccagat gttgccggtg gcctagaaga atgtgtagct ctctggccct gccaaccggc 3360
ctgacatctc tgatcctgcc tagcagtgat ctggccgtgc tgatctctag ctccaccagc 3420
cactttctga tgcggagccc agtgctgcca agcagcagac tgacatgtgc ctctccacag 3480
ctgcctcgga tgtggacatg gtctagctgg ctgaaagagt ggggaggaca ggcccacaga 3540
cagcggaact gtagagtgaa cgccgttgag gaactgcaca gcaggcggat gtctgtgcgg 3600
atcgtgaaga attgggtgtc ctgctgttac gtgcggctga gtgcagtggg actgtctact 3660
tggagcgccc tggattccct gatcctgtcc ttccagagag tgaaaaccag ccggatactg 3720
aacctccagg tgctgaagaa gatcctgcgg agctttatga agctgtacca ctctctcgtg 3780
atgtgcctgc ggctgcggac caagctggaa aaagctctga gcgctctgtt tatctggccc 3840
cagcacagct acaaaggcca ggcattcgga agcctgtgcc agctggtgtc tgccgatttc 3900
agcgcccctc aagtgaccag actgcggagc ctgaaccatc tgctgattcg gtggatcttt 3960
agcaatcagc tgacagtcca aatgctctgc ctgccgatca tcaagaaaat gaagaaacgg 4020
atcatggtgc acgtcttgaa gaagaatcgg aagcagatta tctgtatcaa gaatatgttc 4080
ctgcagcgga agggattcct gaacctgagc cacgtggaaa agttcagaga gagcaccctg 4140
ggcaatttct ggatgaagct cctgcagctg ccaccagctt gcacctctaa ggcctggaca 4200
cccagaaagc ttgtggggag agccgtgcgg agaaagggcg tcgtgatcaa cctgaagaga 4260
ctgcagaaat tccgggctag cgtgtccttc tggactctgc tgcctacaac aggcgtgcgg 4320
acaagaggct ctccactgag actgactctg tggcctccaa gaagccagaa aagccagcac 4380
cactgcgccc tgagaaagat cgagtgggcc acaaagctgt ccctcggcgg caaagcagga 4440
ccacaggctc aagagaaggc caacatcctg aacagcctgc cttcctctat ggaaatcgcc 4500
gtgctgcaag aaatgctgaa ccagaagtgt ctggcccctt tcgagcttaa gaagaacctc 4560
ctgctgccaa cctacacacc ccacatctgt cggcacaccc ttaaaaagaa gcccagagac 4620
atctgcagaa tcagcggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1207
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 1D
<400> 1207
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgagccgac 120
aagaaaaacg tgcggagcgc tagttctcct ggacatcctc ttggccccag aagaatgacc 180
agacggacca tgaccaccac caaaatgatg atgatgcggc ggaccaagcg gcggagaaga 240
aaaagacgcc ggatgaccat gatgaccaga agaaccctgc tgaccaagaa aacctgtctg 300
acccctagaa ccagcgccgc cacaaaagct ctgcccagac agacaatcag ccagcggagg 360
cctatccaga cacctcctgg aacaagcctg gccatctggg gcagaagaag caagatcgag 420
gcctctccta tcggcagcat cacccctctg agcatcagca gacctaccag cagagccaga 480
cagagctgtt gcctgcctgg actgacacac cctgctcatc agcctctggg ctctatggtt 540
ggagctggaa caggcggagg acctgcttgt gtgcctgtgg ccgaagcttc tacaggcgct 600
tggacagctg aaggcgctgc cggcacaaga tgtagagcca gcagagcccc ttgcagacag 660
ctgcctgctt ctagccctac caagtgcgag atctgcgtga agagaagaag gcggcgcaag 720
cggagcagcc agtctagatc tcccgtgcct aagaaacgcg agcggatgat gctccctgtg 780
cgggccagaa cagctagatc tgctctgcca caaggcaggg ctcctctgga aggaatgctt 840
ctgcctagag cactgcccag cctgctgagc agaatgcctg ccagaagaga gagcagattc 900
tggctggccc tgcaggccct tggactcaga cctcctcatc tgcctagctg tcaccctctg 960
cctcaactgc ttggacctcc tccacctcat caggcccctg gcgagaaaaa cgacctgcag 1020
ctgttcgtga tgagcgacac cacctacaag atctactgga ccgtgatcct gctgaacccc 1080
tgcggcaacc tgcacctgaa aaccaccagc ctgaacgcca agaaaatgga agatatgatc 1140
tgggagagca accagcagct gaagtggacc cctcacatcc tgaagtccgc ctctatcgcc 1200
aagaagcgga tcaagctgcg gcggaacagc accagacggg aaatgccttc tcaggccaca 1260
ccttctccac ctggaccttg gagagccgct ctgggcaaag aagtgaagcg gagccagagc 1320
aagctgagac tgagaaacac aagccccttc gacaaaaagg gctttgtgat cctgagcaac 1380
atgggcggca accggtctat ctgcctgacc atcgtgttct ttctggcccc ttacttcccc 1440
atgcctagca gctggtctag cagcggcaga accagactgc ctctgaggcc acagagaggc 1500
cctagacctc tgcatagatg gctgcagcag accaccggct gctctcagag aagaggcgac 1560
tgcccaagaa ccatggccgg accatctgct tctctgcacc ctgcatctgg cagagcctcc 1620
agaaagacct ggcagagaag gctgagagcc tgtagagcag gcggacctgc tggatgggct 1680
agacaggcca gaaaacgcaa gagagagaag cggtcccaga agtccagaca gaaccatctg 1740
cagctgaaaa gctgcagacg gaagatcagc aactggtcta agctgcggag cccctggatc 1800
ttcgaggcca aaaagagcat gaagagatcc cagcggcctc ctcggagcat cctgagcctg 1860
ttcaagaaga agaagcccct gacattcagc cccagcgtgt ccaagaagag gctgcctaag 1920
ctgaagggca agaaacgccg gaaagaaatc cagcggaagg tggtcaagaa ccccagccag 1980
cctgtgccac tgagaaatga cggcatcacc aacggcaacg acagcacccg gtcttgcagc 2040
atcagcctga agaaaagcct ggaaaagatg cccctgatgc ggagcctgct gtactccaga 2100
atgtgcctgg tgcagatccc cacacacacc tgggagcccg actactttgt gtccctgcct 2160
atgatgttca gctgggccac acagagcttt ccagtgggcg ccgtgtttct gaccagacct 2220
gccattcctt gctgtagctg taccagccac tccaatcctt ggagccagtc cacactggcc 2280
atccggttta tctctgcccc tcagccaagc agcagcaccg ttacagctgc tcctagcggc 2340
cagtattttg ccctgcggag tatgcccaag agccggaacc aggtgctgtt tcggagaaat 2400
ctgaccccaa gccagctgcg gacactggcc cctccatata tgctgctgcc tcagtctctg 2460
tcccagagcc tgtctcggaa gcagatccca tctcagtcca tgctcgtgcg gaccaggctg 2520
acactgacag gcactagaag ctccggcacc agagcctctc catctgccgt gtgtctgtgc 2580
tgctggacat gccccagcag aagctttcct gccgcctctc caagcggact gagagcacct 2640
gttggagcac aggctcctcc agaagtgaca ctgagagcca gctgtgccag ctccgccagc 2700
aaagcttgtg caggactttg gccttgggga gcccaagtgc ggatgaagaa gaaggacagc 2760
accatcttca tctaccccag gctgaaaacc ttcggcgtgc cactgggcag cattctgtgt 2820
ctggctggaa gcctgagcac gatgatgatc attagcacca ccagacaaga gtgcggcaga 2880
cgggccagcg tgccctgtag acctatgatc ggaagcgcca gacctggacc atggcggaca 2940
agtgctatgc cttctgccat gggagtcgcc ctgcctacca gctgtgaaag cggaagatct 3000
cctcctgcca ccggcggaag aatgccagga tctcagtcta tcatgatgag ctggatgcct 3060
ccactggctc cctgcgctgc ttgtccttgt tctcctgctc ctacactgtg ccctgctcac 3120
cctgctagag caccaacagc cgtgcctgcc tttacacccc tgtctgctca tcctgtgcca 3180
gtgctgtctg gatgtcacct ggctgtgcgg acctccatgc ttaccttgct gccaatgatg 3240
accctgaagg ccctggtcaa gacatggacc cagttcagaa actaccccag acggcaccct 3300
cacagaagcc caccaacaag ctgtcctcca ctgctcgagg cctttccact gccaagagcc 3360
agcctgagag ctaccgtgcc tagacactct agcgtgctgg ccacaggact gcatctgcat 3420
aggcagatta gcctgcctct gcggggcttc ctgctgcatc aaccactgcc aggacaacac 3480
ctgtggctgt cccacagact gagactgcgg ctgcctagaa caaccgagat ccagctgacc 3540
atgaacgact ccaagcacaa gctggaaagc cccgctctga aacaggtgtc cccagctagt 3600
cctcctacac agcagcctca gacaccccag gattctagac aggtgctggc cgtgcctatg 3660
agcctggcct gtagcatcac cgtgtccttc gtgggccaga tctctaccct ggtgctggac 3720
gtgtcctcca tcagccactg gaacggcatc tgggaagtga tgcccagaac actggaaggc 3780
tgcatctccg tgaaggacca ccggacatcc cagaaccaca gcaagtgcat caccgagtgt 3840
gtgcggacag ccctgaacac caagtgtgaa atttgtgtga agaacaccgc catcctggct 3900
atcaccctga tcaccccaca ggaccctcac ctggaccctg tgtgtcatcc ccatagaagg 3960
cccggctgga agggacacca cagagtggtg tttagccacc atccttccgg cagcaccaag 4020
tctcactggc agcagagaga aagaggcgga ggccgcagag aaaagaaggg ctgtagagag 4080
gcaagcagag ccggccagtt tcctgtgtgg cggagaacat ctagaggcat gtccctgcag 4140
tggaagtccg gcaatgcctg cacacctctg agatgtccca gcagatctcc agccaccttc 4200
ctgactgccc tgaacggctg gcatagatct ggactgaggg cccagaccgc cttctttctg 4260
ctggacatca tcctgcggag agcccggcct acaagctgca gcacatgtag aatgtggtgg 4320
cggctgccct gcaaagtgac cgaaagctcc ctggccaaga aaaccctgac caatcagcct 4380
agcttgcccg gaccttgtgc tagcctgctg tctacactga gccagccacc acctcaggct 4440
cctagccaag tttggacagc cgctacactg cggtgtcctg ctgtgcctgc tgctgcatgt 4500
ccacctctga agctggctcc actgcaagtg accacaacac tgaagctgat cctggtcatg 4560
ctggaaatcg tgaccgagaa caaagttcgg cagaacttca agcggaactc cagcttcttc 4620
tacaccagcg acagaggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1208
<211> 4672
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 2D
<400> 1208
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgacggaag 120
atgcagagcc tgaatcaccc cagcagactg accaacaatc ctcggagaaa gacctggaag 180
atgcggaaga agtacgccca gaagcctagc cagaagaacc acctgtaccg gcagatcaac 240
cggcgcaagc tgcagagaaa gaagtccaga agccacctgg acttcagccc ctactggatg 300
aagaaagtga agcgggccag aaaccggaac atgaagaaaa ccatgagcca cctgatcgcc 360
catcaggccc tgaagatgtc tggcctgaga ctgtttcacc ccagactgct gaccagaaag 420
aagcccggca agcagaaaaa gggccacatg atcttcagcc ggcggaagtg gcagatccgg 480
cacgtgctga agaatctgat ccccagcctg aacgcccagt ggatgttcct gagaatcgct 540
agcccacaga tcatgcagag aaccagcgcc gaccggttcc ggatgaagcg gagaatgcag 600
aacctggaca atctgggcgt gccctggcct ctgttgcctg gattgctgct ggcccatatg 660
tacggcttca gcacctacgg cacccagaaa ggcgagtgcg tgtgtctgca gtgtctgagc 720
ggcagcagcc tgttcatcct gaagcagccc ctggacctga agatctccaa gaccttcatg 780
gccagccctc agattatgca gcggatgagc gccgtgaact tcgagacaat cctgcaggcc 840
catcctcagg tgccagctct tgctcctcaa gcttggtggc ccgctagaag aggccctctg 900
acatctgctc caagcgcaca gcagtccctg acacggacac tggaaagcgc cggactgttt 960
ccttggctgc acacccagtg ccgggccttc attcacacac ctagaagccc tggctgcagc 1020
gtgtacgcca acatgtgctg gcggtacaag aaacggggag tgatcgcctg gcggatctac 1080
cctcctagca catgcagcct gccttgcaga ggcctgatcc tgattcagca cggcggcatc 1140
ttcaccttcc ggttctgggt cgagaagctg agctggaaca tctgcaagaa cctgagcctg 1200
tacctggata agttcgtgca gcggctgctg tacgtgtaca tcatcgagac aaacgtgttc 1260
gtgctgaacc tgttccacgt gccagtgaac cagatcttca tgatggcctt ctacctgaag 1320
tacaccgaga aggcctgggt catggaactg gaatggctga tccagcagca gtgctaccag 1380
cggaagagaa tgaagaccgg cgccatccaa gagaagggcg ctattcaaga gaaaggggcc 1440
atgaccaagc ggatctgcgt ggtcaatttc gaggcctgca gagagatgga aagcctgagc 1500
gcccctgaga agatcaccct gtttgaagcc cacatggccc ggtgcaccag catcaatgtg 1560
ctgtgtgtca gggccagcct gatcgagaaa ctgatgaaag aaaagcgcaa gatgaagcgc 1620
aaccaggtgg catcccctca aatcatgcaa cggctgttca tcaagggcta ccagaacaac 1680
cacttcacgt tccacctcca aaacttcgcc ttcttcagct ccttcggcaa caacaagtat 1740
atcaacatcc tgacctttct gcccagcaga ttcccttggg gacctcctcc actgggagcc 1800
cttagagcta cagctcctgc tacagctgct ccccaggcac agacacctca ttggagagcc 1860
gccaccacaa gcagcatgag cagctctcca agagccgagc ctaccagctc tagctcttgg 1920
gccacttgct ggcctagatg ctgcagctcc agctgctatt ggagcctgtc tagctggcct 1980
cctgctggcg ctgccgaagc cacaaatacc agaaccagaa gccgcgagag ccagcgggga 2040
agaatgctga cttggagaag ctccctgtgg ctgcagggca ccagatgttt tacaggcgtg 2100
cggaccagct ccaggtgcag cctgatggaa cagatccctc acctgaagtc taacagccgg 2160
aagaaactgc tcgaggacat gaagcagaac ggcttcacca gacggcggaa cagcagaaag 2220
cagagccaag tgcagctggc catccaggtg ctgctggtgg acaagcacaa gtactttctg 2280
ttcggcagag ccacatttct gctggctctg tgggagtgta gcctgcctca ggctagactg 2340
tgcctgatcg tgtctagaac cctgctgctc gtgcagtcta gacacccaag ctggccttgg 2400
accagatgcc tgagaatgcg gcctccacgc agccactgga actctgccta cctggggaga 2460
acactgctcg tgacctgcat cctgtaccac agatggatcg tgaccagcat gtgccagagc 2520
cagagatggc tgacctccac cacctctaga agctctgccc tgatgtggac ctggtggtgt 2580
acaagaggtg gcggcaagcg gaagaaaaag atgtgcaagg tgtccggcgg ctgcaccgcc 2640
tgtgttgaaa gatgtccttg gaagggcatc tgttggaagt ggcctgtgac agtggccgcc 2700
atgagcagaa cacctccaag acgcgtgtgc ggccacagag agggcagcga gtctgataat 2760
ctgggcctgc tgtactcctt tccacctgtg ctgttcaagg ccgaccagag cgaaagctct 2820
ctgagcagcg gcaacagcgt gatcgtgcac aagatcgtgc tggtgttcct gaagtccctg 2880
agcagctaca actgcgagag aagaatcagc ggcatccaga agagagccat cgagttcgcc 2940
gtcctgaagc tgctgaacat ggacctcggc aagggactga cacaccccgt gcctctgaag 3000
aggaccctgc agaacaagcg gaacaagaac atcaagcggg tcaaccagaa gaagggcaac 3060
atcaagagga agtccatcct gctgcatctg attgtgctga acagccccga gagcaaccgg 3120
gaaaagatca tcaaccccac catcagctgc ccctttcaga gccccacaaa gagactggga 3180
agccctcctc tgcacctgtg tcagcctctg aggccctatc ctatcagcga gggcctgacc 3240
atgaccaccg gcagaaacat caacagcaac tccctgatga ccaactgcct gttcagcccc 3300
atcttcctgt gccaccacgc catcatgcac cggaagatga caagccctca cttcagactg 3360
ttctccagca agatcccaca tccacaggtc ccaagtgtgg tggccctgtg caagtttaca 3420
cacccctgca ccatgctgct gccccaaggc gctttttgga agcctcctag ccagggcatc 3480
tccagctgtc tgatgacagg ctgttggcag tggtccagcg tgacaagcct ggaatggaca 3540
gcccaagaga gaggctgttc ctcctggctg atgaagcaaa catggatgaa gtcttggtcc 3600
ctgcgggacc ccagctacag atccatcctg gaatacgtgt ccacacgggt gctgtggatg 3660
cccacctcta ccgtgcctaa gttctttctg accttcagcc agatccggat gtgcgccctg 3720
tctcacccta gcttctacat cagctccacc gtgtgctttc tgagcaagca ctgcatgacc 3780
gcctgcacac ctggaaccag cctgcagtgt tacctgaacc tggccaacgg cctgtggttc 3840
aacctgatct tccggaacaa aaagaccaag ctgtggttct ccctgattaa catccaccac 3900
cgcaagaacc cactgctgcc catgcggctg gaaaaaaagg ccacttggat gcggcggacc 3960
gagctgtctc tggaaccttg gattccttac ctgcatcagc agaaaaccca gtggctcccc 4020
atgagaagcc tgggcgagcc ttggcgagct ggatttcagt ggggagagtc tccctggcaa 4080
gtgatggcct ctctgacagg cagacgcaag aaaagagagg atcactgcgg actgcaagag 4140
aaaaaaagcc ggaagctgat gtccagctgc gccgctcctc cacatagact gctgggacct 4200
agcagatggg gaagctgtgg gagagcctgt tcttgtggca gaggctgtgg aacccctaga 4260
ggcgactgga agagacaccc acctcggcgg attctgtttc acgtgcggaa catcgtgtac 4320
ggaatccaag tgatgctgtg ctgtcacccc gcctggctgt ctccaatcag cgcttgtcct 4380
cgcctgctgc cttatccatt ccacgttctg gccctggaag tgacattccc tccaggcact 4440
gccatgcctc agatgcaatt gcaggcactg gcaatgtggg agaaaggctg ggacaagcct 4500
ctggaaaaca cacagatccc caggacaagc ccactgtgga agatcacaat ggtgctgaca 4560
taccccaact gcgtggtgca cgtcctgatg ttcggcggca agaagcggag caagttcggc 4620
tacccctacg atgtccctga ctatgcgtcc taaaggcgcg cctagcggcc gc 4672
<210> 1209
<211> 4687
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 3D
<400> 1209
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgacagaac 120
accagaagca ccaacctgga aaagaacccc agcctgaaga agcagagcca gcggagagga 180
aagctgagca gcagaaagaa gggccacacc aagaaccggc ggaaggccaa gagaaagccc 240
cagatcagcc agaagaagga ccctgccggc aagctgaaga aacacctgaa ccggaagctg 300
cacctgacca gatcctgcct gatcgacctg accatgatga tgagccagaa gctgtggaag 360
aaccagcgca agagaatccc tctgccttct ccacggcagc atctgctgcc tcagtatcca 420
ctgcatcctc cacctccatg cctgctgctg ctccaccaca gacaccatct ggcctttctc 480
gagatggcct gcagcagcca gcacacccac agcatcaaga tctggatcag cttcagccac 540
gaggacctgc ctagaatgct gcccatcagc agccctctgc acagacccca gatgcctttc 600
tggacctgca cctttcctgc caccacatgg ggcacatggg agacaccttc tacatggggc 660
tggcggacat tcggccctgt gtactacgtg tgcaaccgga tgaacgtgtc cagcgtgctg 720
aagcctttcc tgttcaccgt gcctatcgag gacatgagag agtgcaccct gggcagaaac 780
agaatgaatg tgtcctctgt gctgaaaccc tgtctgatcc ccgtgccaat cctgaccaca 840
ctgagcttcg tgctgatcga ggaaagccgg cggaacagac ggtacagaaa gatctacggg 900
gagctgaaga tgtccctgca ggccctgcct ctgaccttta gcacactgct gtgggacagc 960
agacacacca ccaccacaag cagccccaga agatcccctg ctctgagagc tagaggcggc 1020
accacaatcg gcgaagtgac aagcagaggc gccagcagct ctaccagcag agacagcaga 1080
agctttttca ccagcgctca ccccagcaga ccctgcagaa tgagactgta ccagagcaac 1140
ggcatggaag cctgcggcac acaccctaca cctagactgt ctagaggccc tccactgcac 1200
accagaacca tgagcctgag caacatcctg atgaagttcc ggctgatgct gcagaagcag 1260
tgctgctaca acctcgtgat caagcaccct ctgatcttcc ggatcaacct gcggagacag 1320
ggcaagacca aagacggcgt tgtgcagagc ctgggcttcc tgaaccagca gatcatcctg 1380
cagaaagagt tcttcatctg cctgctgatg ttcatcaagc ggtggaagcc agccgccaca 1440
aagacacctc caccactgat tctgtggcct caggccgctc ctgtgcacaa gaagagaggc 1500
ctgttcagcc tgttcttctc ccactgcctg tgccaccaga tgaagtgcct gaccgccgtg 1560
gattgtctgc aggccttctg ggacatgatg attcgcaaga tccagaagcg gcggagaacc 1620
gccaaccggc tgaaaaagaa atacctggtg cagtgtacca acctgagcgt gcccatgatg 1680
ctgaccatcc tgatctggaa gcgggtgttc atcctcctgc tgagcgacaa gaagtgtctg 1740
agagtcagat gcggcggatg gctgtgtggc tggacaccta gaggcaagaa caagaagcgg 1800
agaaagctgc ggcccaagca cctgaagaaa accagcgcca aggtgtccgt gatcaccatg 1860
aagctctggg agaagcactt caagggcctg aactggaacc tggtcgtgtg gattctgaac 1920
ctgaagatga tgtggctcaa gaagtccacc aagagcagac agagcagccc attcctggct 1980
cggagctgga ataccatgca atggaacaac aagaaaatgg ccatgaccgt gatcgctggc 2040
gcccaccact gtcagtacaa gctgacctac accaaagtgt ggaagatgaa ttggaagaaa 2100
atgatgatcg gctcccagca cctcctgttt agcccactgg attcaagccc actgcagttg 2160
ctgctgcacc ctcacggcaa gagatgcaac ccttgctgca gactgacctg gatgagcaga 2220
gagtgggaaa agcggaagca gatcctcggc ggaggcggca agtacaaaga gtacttcctg 2280
aagcggattc tcatccggaa ggctatgaca gtgctggccg gcgataagaa aggcctggga 2340
agattcatga gatgcgtgca gagcgagaca aaggccgtgt ctctgcagct gcctctcggc 2400
cgaagaaagt ccggcgtgat gaagtgttgg gatctgtgcc ccagactgga ctttcacccc 2460
agatctagct ctggcggcga gaagctgaag cactgtttca aagcctgggg cctgtgcttc 2520
ttctacctgc tgtacttcga gaagaaacgg cccgagtggc tgagcgttga ccctcctgga 2580
tctgtctgga ttctgccctg catggacctg gacggaatgc tgacagtgat cggccaggga 2640
ctcgtgggca tgacccctag agatctggga acagtggctg gcgccaccgc acagattcag 2700
aggcctatcc aggtgcagac aggcggcaga ctgttcctga ttcacctgag aaaggtggac 2760
acccaccatc tgcaggtcgt gaccaagacc gtgacagcca caacagctga cggccagagg 2820
atgcggagac tgaagtgcaa ggcctgtcgg ctgagatggg ccagacctga acctgctgca 2880
caggctcctc caaagagcca ctttccacct catcctagcg gcccctccag aacctctagc 2940
ctgcagctca gacccattcc tccacacctg agacacccac tgctgctgaa gggaaagaac 3000
agcccctgct gccaaaagaa actgcgggtg cagaaccagg gccatctgct gatgatcctg 3060
ctgcataacg ccagacagcc cagcaggcct accggaagaa cccctaccac aagactgatg 3120
gcccctgtgg gcagcgtgat gtcttgtagc ctgctgaccc agccatctcc tgccagcgca 3180
tgtacaatgc caccactcct gcatccacag tgggccccac atagtgctgg actgtctcca 3240
ggcgcttgca gacctgcctg tacctgcatc agcatgacca ccatctccag agccacatgg 3300
cggctgagaa tcccaagcct gaggaagtac cggcagaaca tcgagatcac ccctcagcgg 3360
tctaaggccc aggtttccgt gtacagcggc aatctgctga gcttctccag acggggcatg 3420
aagagtagcg tgcggctgaa gaacagcatc cctcacgtgc caaaagccac cgccgctcac 3480
tctgtgacag tgaagctgca gtacctgttt ttcctgaccg tgtgcggctt cgaccgggtg 3540
ttcctggtta agatctgcaa gaagaagctg ctcctcaagc tgctgagagg ccccagacgg 3600
aaagtgctga tggtgctttg gctgcccgcc aaccagagtc tgcagaaaag ccaggtgttc 3660
cagtgggtgc tgcggaccga aacctacatg gaaatgcact acggccatca ggcccctcag 3720
gtggccatgc tgcctaaact gctgtgtaga cagatgctcc ccactctgtc cacactccag 3780
cagaggcatc ctcagggacc ttgtcctcct cctgtgacac ctctgagagt gcagtctgtg 3840
ctgctcctgg gagtgcctca gacagccgct tttagcggcc ggattctgca ccagccagaa 3900
atggccgcca tgagactgat gcccaagttc ctgaactcca ccaacagctg gtggacagtg 3960
gcccctagat gtcctagaag cgccgtggac attagccccg gacctacatc tcctagcctg 4020
gcctcttgtg cctctgtggc cattggaaaa ctggcactgc tgggcgcatc tgccccttgt 4080
ggcgcagctg gtgctagaga ggctggaaga tttgccgtgc tgggcaccat ggttatgaag 4140
ggtgctgccg cagcctcctg tcagtctcct ccatctccaa gagagacaac ccctagcagc 4200
gacgccacca gacggacaag acctattgcc gctcagagca aaaagaccat gactgccgcc 4260
ggactgaccc ctcggagaaa cctgcagaga aatctgaagg tcctgggcgc caagaagatc 4320
accttcctga gaaacagcag acgcgccaca cctacctcta agggcagcct gagaagaaag 4380
tacctgagag tgaacatccg caagctcatc tggaccaagc agcggagctt cctgtctctg 4440
ttccccaagc tgagagccac cgagcagatg accaatgtgg gatgcctgct caagaaaagc 4500
agccaattgc ggcggagctg gcgcaatgtg tcccggatca gcaacatgga acacaggctg 4560
accatggaca gcgccctgag cctgacaaag agagagggcc ctgagacaag cgagaagaag 4620
aggaagttgc ctggctaccc ctacgatgtc cctgactatg cgtcctaaag gcgcgcctag 4680
cggccgc 4687
<210> 1210
<211> 4690
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hTPA 4D
<400> 1210
gaattcggat cccgcgactt cgccgccatg gatgcaatga agagagggct ctgctgtgtg 60
ctgctgctgt gtggagcagt cttcgtttcg cccagccagg aaatccatgc ccgaaacaga 120
aagaccagaa aggccgccag agagaagcac cgcaagaccg acgacaagaa gaagaagtcc 180
accgaaaaga ccaagaacgc caagaagatg cccttccagc agcggcctcc tctgcagcct 240
gttaacctgg atctgcagca ccagcgcaga cgcaaaaaga agaaagacaa ggtcgaaatc 300
cggaatcgga gccctaaggc caatagcacc gagtgtcagg gcgagcacag cagagagcag 360
aacctgctga atctggtgca gctgaaccct cacagccctc accacagaaa ggacgaagag 420
gaccaccaga agcggcacca ccaccacaat caaaagaaaa tgagcgtgcg ggctagcgtg 480
tccttctgga cacttttgcc aacaaccggc gtgcggacaa gaggctctcc actgagactg 540
acactgtggc ctccacgggt tccaccttct ccacctcttg ctctgggccc cagaatgcag 600
ctgtgtaccc agctcgcccg gttcttccct atcacacctc ctgtgtggca catcctggga 660
cctcagagac acacacctca ggctcctctg aggctgtggt cttggtgcgg cacaagccag 720
acctacttcg gcagcagacc atctccttgc ctgagctggt ccagcagaat tgtggcccct 780
ggacacgccc tgagctgtcg gactagaaga agatggtcta gcaagcggtg gatcttctcc 840
aaccagctga ccgtgcagat gctgtgcctg ccaatcacac acccattcgc ctctcagcct 900
ctgggacaag agatgcccaa caacacccag atccggctgc tgaagccctg cagagtgaac 960
gccgtggaag aactgcacag caggcggatg tctgtgcgga tcgtgaagaa ctgggtgtcc 1020
tgctgttacg tgcggctgtc tgctgtgggc ctgtctactt ggagtgccct ggacgaggaa 1080
aagaagaacg gccggatcag cagcctgaaa aagaaagtga atgcctgcag ctccctgatc 1140
ctgagcttcc agcgcgtgaa aaccggcatg gaaatcctgc tgtggattct gctgaagatg 1200
gaaattcaga tcttcaagat ttgcctgggc gagatgcagc tctgcggcca ggcctttgga 1260
agctttagcg ccgatttcag cgcccctcag atcattaaga agatgaagaa acggatcatg 1320
gtgcacgagc tgaagaagaa tctgctgctg cctatgtgct ccagcctggc tctgccaaca 1380
ggcctgacat ctctgatcct gcctagcagc gatctggccg tgctgatctc tagctccacc 1440
agccactttc tgatgcggag ccctgtgctg ccaagcagca gactgacttg tgcctctcca 1500
cagctgcccc ggatgtggac ttggtctagc tggctgaaga acgagggcaa caaccactgg 1560
cctagagtgg aaatgcctac cggctggctg ctcgtcggct acaacaccag aaacacagcc 1620
cagaatcctc ggctgcagca gcacctgaaa cactggcagc agtgcaccag agccagatgg 1680
tgtcaagagc cctgtcagac cctgaccttc ttccatttct tcttcttttt caaaacggtg 1740
tccctgtgtt gccccggctg gtctaaagga caacctcctc cacctggcct gaagccttct 1800
agcctggctt ctcaggtggc cagaaccaca ggcgtgtacc agcacgtgtg gctgatctgt 1860
ttcgtgtttt tcgtgtgtgt ggaaaccggc ttctgtcacg tggcccaagt gggactcgag 1920
agactggtgt ctctgtccgg catcaccgac gtgaaccatt gggcccagcc taagccatct 1980
cctagcaaag gcaccggcat gaacagaccc atcggcctga gagttggcaa aggcgtgtgg 2040
gccagactga tcctggccat gacactgacc ctgaacggca tggccaagaa gtcccagcag 2100
cctctgcagg tcgtgctgag actgggaaac ctgcctccat tcttcagagg cagcgaggtg 2160
ccctttccta gaccttgtcg gaccaagcct gcctgcacaa gcaaggcctg gactcccaga 2220
aaactcgtgg ggagagccgt gcggagaaag ggatctccac tctgggattg ctccaccaca 2280
acaggcacac accacggatg cctgtgggag atcccatctg tgaccctgct ggcccatcct 2340
agaaccgcct ctatcaccct gcctaccaca agcctgaagg gctccagaac cagctgctgc 2400
cctagatctc accccagact gcctaggacc aaatggcccc tgcagtgtct gctgcacagc 2460
ctgggaacaa ccggaacact cgtttgggaa aggggcgtcc tgcagatgag atccctcgaa 2520
gcccattgtc cactgcagac cttccatctg caccactgca ggacccagcc tagctcttgt 2580
cctcctgcct ggattctgta ccaaggacag tggagcggag ccgtcgtggg acttagacct 2640
gtggctcacc atctgcctag acctatccag ggcctgcact gtccacaggc acctcatcaa 2700
cctgctctga gctggggaaa atggcccgtg ggaatgacag gccctgccag atgttgcaga 2760
tggcccagac ggtgccagaa gaaggttcca tcagcctctc catggggcct cgtgctcaaa 2820
aagaaccgga aacagatgct gaaccagaag tgtctggccc cttttagaga gagcaccctg 2880
ggcaatttct ggatgaagct gctccagctg cctgtcgtga tcaacctgaa gagactgcag 2940
aagttcaacc tgcacctgtg ctactaccac agccagagca acagaaacaa gagccgccag 3000
atggaatccc tgggcatgaa gttgcagtcc cagaaatccc agcaccactg tgccctgcgg 3060
aagatcgagt gggccacaaa gttgtctctc ggcggaaaag ccggaccaca ggctcaagag 3120
aaggccacct ctcggattct gaacctgcaa gtgctcaaga agatcctgcg gagctttatg 3180
aagctgtacc actctctggt catgtgcctg cggctgagga ccaagctgga aaaggctctg 3240
agcgccctgt tcatctggcc ccagcacagc tacaagcccc tgttctttca cggcgacctg 3300
tgcgagtggg gaggccaggc tcatagacag cggaactggc tgaaaaactg gaagcggttc 3360
aagcttaaaa agaagtacat ccagaagaag aagcagaagt ctaacaagat catctgcaag 3420
ggccaccgca tcaccatcat ctgtatcaag aatatgttcc tgcagcgcaa gggcttcctg 3480
aacctgagcc acgtggaaaa gttctgtaga ggcggcccta gcgccagcga tagatgctgt 3540
tcttgtagcc ccagcggctt cagtgccggc agaggaagat gtcctgttca gggctgtctg 3600
aggccccaca gagttcaact gctgagaaga tggggccctg gctctcctgc tggacagagg 3660
ctgtctaagg gctttcagct gctccgttgg tggggaccag gatctcctgc tcctgagcct 3720
agaaagggcc catttccacc acctgatcct ccatggcctg tgaccgctgt gacagtgatg 3780
gctggatctg tgcctagtgc tcagtctgtg gacgccctgg aatctcctgg acctctggct 3840
ctcgaaggac ctagcagccc tagaaacctg ctttggagag agatgagcat ctttctgccc 3900
ggcatcttca ccgccaagaa aagccccacc agcttttgct gcaatatcct gaacagcctg 3960
ccaagctcta tggaaatcgc cgtgctgcaa gaggacagca aaaagatgac ccagaagggc 4020
caagccttcg gctccctgtg tcagcttgtg tccgctgact tctctgcccc tcaagtgacc 4080
cggctgcgga gcctgaatca tctgctgatc acctacacac cccacatctg cagacacacc 4140
ctgctgaccc ctgacaccag atggatcttt agcaatcagc tgcagacagt ccagatgctc 4200
tgtctgcctc cactgaagca gggcgagaga atcatttggc ccctcggcgg ctttcagatc 4260
cccaacttct tttggagcct cggcatcgga cacactggcg cctggtggca tactggaagg 4320
cggagaagag aatggggcgg cagcaccgtg tctagaagcc ctctgtggat cagctccatg 4380
atctacctga gaggcatggc cttcgccagc gacagcagca tcagaaccac cagagtgtcc 4440
tggtgcagaa gatgcggcgc caaaagcgct gccgccagct ctattgaagc tctgaccgct 4500
ctgtttacct gccggaccgc cagcatcagc gtgaacatca gcaccctgat gtccatcctg 4560
gaagcactta agaagaaacc cagagacatc tgccgcatca gctgccggtg tagacgcgag 4620
tacagagtga ctatgggcta cccctacgat gtccctgact atgcgtccta aaggcgcgcc 4680
tagcggccgc 4690
<210> 1211
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 1C
<400> 1211
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgagcacca gacgggaaat gccttctcag gccacacctt ctccacctgg accttggaga 780
gccgctctgg gcaaagaagt gaagcggagc cagagcaagc tgcggctgag aaacacaagc 840
cccaccgaga tccaattgac catgaacgac agcaagcaca agctggaaag ccccgctctg 900
aaacaggtgt cccctgcctc tccacctaca cagcagcctc agacacccca ggatagcaga 960
caggtgctgg ccgcttcttc tcctggacat cctcttggcc ctggcgactg ccctagaaca 1020
atggctggac cttctgcctc tctgcaccca gcatctggca gagccagcag aaagacctgg 1080
cagagaaggc tgagagcctg tagagctggt ggacctgctg gatgggctag acaggccatg 1140
acactgaagg ccctggtcaa gacctggaca cagttcagaa actaccccag agtcggagcc 1200
ggaacaggcg gaggacctgc ttgtgttcct gtggccgaag cttctactgg cgcctggaca 1260
gctgaaggcg ctgccggaac aagatgcaga gcttctagag ccccttgcag acagctgcct 1320
gccagctctc ctaccaagtg cgagatctgc gtgaagagaa ggcggcggag aaagcggagc 1380
agccagtcta gatctcccgt gcctaagaaa cgcgagcgga tgatgctgcc tgtgcgggcc 1440
agaacagcta gatctgctct gccacaaggc agagcccctc tggaaggaat gcttctgcct 1500
agagcactgc ccagcctgct gagcagaatg ccagccagaa gagagagccg gttttggctg 1560
gcactgcagg ctctgggact cagacctcct catctgccta gctgtcaccc tctgcctcaa 1620
ctgcttggac ctcctccacc tcatcaggcc cctttcgaca agaaaggctt cgtgatcctg 1680
agcaagggca agaagcgccg gaaagaaatc cggcggatga ccagacggac catgaccacc 1740
accaaaatga tgatgatgcg gcggaccaag cggcggaggc gaaaacgtag aagaatgacc 1800
atgatgaccc gcagaaccct gctgaccaag aaaacctgtc tgacccctag aaccagcgcc 1860
gccacaaaag ctctgcccag acagacaatc agccagcgga ggcctatcca gacacctcct 1920
ggaacaagcc tggccatctg gggcagactg cctctcagac cacagagagg acctcggcct 1980
ctgcatagat ggctgcagca gacaacaggc tgctcccaga gaagaatcgc caagaagcgg 2040
atcaagctga ggcggaacac actggccatc cggtttatct ctgcccctca gcctagcagc 2100
agcaccgtta cagctgctcc tagcggccag tacttcagca gcttcttcta caccagcgac 2160
cggaccaagt gtgaaatctg tgtcaagaac accgccatcc tggctatcac cctgatcacc 2220
cctcaggacc ctcacctgga ccctgtgtgt cacccacata gaaggcctgg ctggaagggc 2280
caccacagag tggtgtttag ccaccatcca agcggctcca ccaagagcca ttggcagcag 2340
agagaaagag gcggaggccg cagagaaaaa aagggctgca gagagatgcc cagcagctgg 2400
tctagctctg gcagaaccgc cgacaaaaag aacgtgcgga gcagaaccag actgaccctg 2460
acaggcacaa gaagcagcgg cacaagagcc tctccaagcg ccgtgtgtct gtgctgttgg 2520
acatgcccct ccagaagctt ccctgccgca tctccatctg gactgagagc acctgttgga 2580
gcccaggctc ctcctgaagt gacactgaga gccagctgtg cctctagcgc ctctaaagcc 2640
tgtgctggac tttggccttg gggagcccaa gtgcggaaca aagtgcggca gaacttcaag 2700
cggaacctgg ccaaaaagac cctgactaac gccctgcgga gtatgcccaa gagcagaaac 2760
caggtgctgt tcagacggaa tctgacccca agccagctga gaactctggc ccctccttac 2820
atgctgctgc cccagtctct gtctcagagc ctgtccagaa agcagatccc cagccaatca 2880
atgctcgtga ccgccttctt cctgctcgac atcatcctga gaagcctgct gtactcccgg 2940
atgtgcctgg tgcagatccc tacacacacc tgggagcccg actacttcgt gtccctgcct 3000
atgatgttca gctgggccac tcagagcttt ccagtgggag ccgtgttcct gaccagacct 3060
gccattcctt gctgcagctg taccagccac agcaaccctt ggagccagtc cttcaagaag 3120
aagaagcccc tgacattcag ccccagcgtg ccaatgtctc tggcctgtag catcaccgtg 3180
tccttcgtgg gccagatcag cacactggtg ctggacgtgt cctccatctc tcactggcgc 3240
aagcgcaaga gagagaagcg gtcccagaag tcccggcaga accatctgca gctgaagtcc 3300
tgcagacgga agatcagcaa ctggtccaag ctgagatccc cgtggatctt ctaccctcgg 3360
ctgaaaacct tcggcgtgcc actgggctct atcctgtgtc tggcaggctc cctgagcacg 3420
atgatgatca ttagcaccac cagacaagag tgtggcagac gggcctccgt gccttgtaga 3480
cctatgatcg gcagcgctag acccggacct tggcggacat ctgctatgcc atctgccatg 3540
ggagtcgccc tgcctaccag ctgtgaaagc ggaagatctc ctcctgccac cggcggaaga 3600
atgcctggat ctcagtctat catgatgagc tggatgcctc cactggctcc ctgtgccgct 3660
tgtccttgtt ctcctgctcc tacactgtgc cctgctcatc ctgcaagagc ccctacagcc 3720
gtgcctgcct ttacacctct gtctgctcac cctgtgccag tgctgtctgg atgtcacctg 3780
gccgtgcgca cctctatgct gacactgctg cccatgagac accctcacag aagcccacct 3840
acaagctgcc ctccactgct ggaagctttc ccactgccaa gggccagcct gagagctacc 3900
gtgcctagac acagctctgt gctggccact ggactgcatc tgcatcggca gattagcctg 3960
cctctgaggg gcttcctgct gcatcaacct ctgcctggac aacacctgtg gctgtcccac 4020
agactgaggc tgagactgcc aagaacaggc gagaagaacg acctccagct gttcgtgatg 4080
agcgacacca catacaagat ctactggaca gtgatcctgc tgaacccctg cggcaacctg 4140
cacctgaaaa ccacatctct gcggagagcc agacctacct cctgcagcac atgcagaatg 4200
tggtggctga agctggcccc actgcaagtg accacaacac tgaagctgat cctggtcatg 4260
ctggaaatcg tgaccgaaga ggccaagaaa tccatgaaga gatcccggcg gagcaagatc 4320
gaggcctctc ctatcggctc catcatgaag aagaaagaca gcaccatctt catcaaccag 4380
cagctcaagt ggacccctca catcctgaag tctgccagcg tgtccaagaa gagactgccc 4440
aagctgaacg gcatctggga agtgatgccc cggacactgg aaggctgcat cagcgtgaag 4500
gaccaccgga caagccagaa ccacagcaag tgcatcaccg agtgtgtgcg gacagccctg 4560
aaccagagaa aggtggtcaa gaaccccagc cagccagtgc cactgagaaa cgacggcatc 4620
accaacggca acgactccac cagatcctgc tccatcagcc tgaagaaaag cctggaaaag 4680
atgcccctga tgaacgccaa gaaaatggaa gatatgatct gggagagcaa catgggcggc 4740
aaccggtcca tctgcctgac aagactgccc tgcaaagtga ccgagtccag ccaaagacca 4800
cctcggagca ttctgtccct ggcctctaga gccggacagt ttcccgtttg gcggagaacc 4860
agcagaggca tgtccctgca gtggaagtcc ggcaatgcct gcacacctct gaggtgccct 4920
agcagaagcc ctgccacatt tctgaccgca ctgaacggct ggcacagatc tggacttagg 4980
gctcagcaac ctagcctgcc aggaccttgt gctagcctgc tgtctacact gagccagcct 5040
ccaccacagg ctccaagcca agtttggaca gccgccacac tgagatgtcc cgctgttcct 5100
gcagctgctt gccctcctat cgtgttcttt ctggccccat acttccccac accactgagc 5160
atcagcagac ccacctctcg ggccagacag tcttgttgtc tccccggact gacacaccct 5220
gctcaccagc ctcttggctc tatgggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1212
<211> 5281
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 2C
<400> 1212
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgcggcaga tcaacagacg gaagctgcag agaaagaagc gccggaagaa gagagaggac 780
cactgcggac tgcgggccag aaaccggaac atgaagaaaa ccatgagcca cctgatcgcc 840
catcaggccc tgaagatgtc tggcctgaga ctgtttcacc ccagactgct gacacggaag 900
aagcctggca agaaccctcg gagaaagacc tggaagatgc ggaagaagta cgcccagaag 960
cctagccaga agaaccacct gtacggcaag ggcctgacac accctgtgcc tctgaagaga 1020
accctgcaga acaagcggaa caagaacatc aagcgcgtga accagaagaa gggcaacatc 1080
aagagaaaga gcatcctgct gcacctcatc gtgctgaaca gccccgagag caacctgcag 1140
gctcatcctc aagttccagc actggctcct caggcttggt ggcctgctag aagaggccct 1200
ctgacaagcg ctccatctgc tcagcagagc ctgaccttcc tgcctagcag atttccttgg 1260
ggccctcctc cactgcactg gaactctgcc tacctgggca gaacactgct cgtgacctgc 1320
atcctgtacc acagatggat cgtgaccagc atgtgccaga gccagagatg gctgaccagc 1380
accacctcta gaagcagcgc cctgatgtgg acccagtggt ctagcgtgac aagcctggaa 1440
tggacagccc aagagagggg ctgtagcagc tggctgatga agcagacctg gatgaagtct 1500
tggagcctgc gggaccccag ctacagatcc atcctggaat acgtgtccac cagagtgctg 1560
tggatgccca catctacagt gggagccctg agagccacag ctcctgcaac agctgctcca 1620
caggctcaga cccctcattg gagagccgcc acaacaagca gcatgagcag cagccctaga 1680
gccgagccta caagctctag ctcttgggcc acctgttggc ccagatgttg cagctccagc 1740
tgttactggt ccctgtcctc ttggcctcct gctggtgctg ccgaggccac aaataccagg 1800
accagaagca gagagtccca gcggggcaga atgctgactt ggagaagcag cctgtggctg 1860
cagggcacca gatgttttac aggcgtgcgg acctccagca gacacccttc ttggccttgg 1920
accagatgcc tgagaatgcg gcctcctaga agcaacagcc ggaaaaagct gctcgaggac 1980
atgaagcaaa atggcttcac ccggtacaag aaacggggcg tgatagcctg gcggagagcc 2040
actttcctgc tggccctttg ggagtgcagt ctgccccaag ctagactgtg cctgatcgtg 2100
tctaggaccc tgctgctggt ccagagcaga tgcagcctga tggaacagat ccctcacctg 2160
aagtcctggt ggtgtacaag aggcggcgga aagcggaaga aaaagatgtg caaggtgtcc 2220
ggcggctgca ccgcctgtgt tgaaagatgt ccttggaagg gcatctgctg gaagtggcct 2280
gtgacagtgg ccgctctgat cctgattcag cacggcggca tcttcacctt ccggttctgg 2340
gtcgagaagc tgtcctggaa catctgcaag aatctgtccc tgtacctgga caagttcgtg 2400
cagcggctgc tgtacgtgta catcatcgag acaaacgtgt tcgtcctgaa cctgttccac 2460
gtgccagtga atcagatctt catgatggcc ttctacctga agtacaccga gaaggcctgg 2520
gtcatggaac tggaatggct cattcagcag cagtgctacc agttgctgct ggctcatatg 2580
tacggcttca gcacctacgg cacccagaaa ggcgagtgcg tgtgtctgca gtgtctgagc 2640
ggcagctccc tgttcatcct gaagcagcca ctggacctga agatcagcaa gaccttcatg 2700
agcagatccc acctggattt cagcccctat tggatgaaga aagtgaaggc ctctccacag 2760
atcatgcagc ggatgagcgc cgtgaacttc gagacaatca ggcggaagtg gcagatccgg 2820
cacgtgctga agaacctgcc tctggaaaac acacagatcc ccaggacaag ccctctgtgg 2880
aagatcacaa tggtgctgac ataccccaac tgcgtggtgc atgtgctgat gttcgtgctg 2940
ttcaaggccg accagagcga gtctagcctg agcagcggaa tctaccctcc tagcacctgt 3000
agcctgcctt gccggggcat tagaatgtgc gccctgtctc accctagctt ctacatcagc 3060
agcaccgtgt gctttctgag caagcactgc atgaccgcct gcaccagaga gaagatcatc 3120
aaccccacca tcagctgccc ctttcagagc cccacaaaga gactgggcca cagagagggc 3180
agcgagagcg ataatctggg cctgctgtac tcctttcctc cttggctgcc catgagatcc 3240
ctgggcgaac cttggagagc tggctttcag tggggagagt ccccttggca agtgatggct 3300
agcctgaccg gcaacagcgt gatcgtgcac aagatcgtgc tggtgtttct gaagtctctg 3360
agcagctaca actgcgagcg gcggatctct ggcatccaga agagagccat cgagttcgcc 3420
gtcctgaagc tgctgaacat ggacctggct agccctcaga ttatgcagag aaccagcgcc 3480
gaccggttcc ggatgaagcg gagaatgcag aacctggata acctgggcgt gccctggcca 3540
ttgcttccag gtgctgctcc tccacataga ctgctgggcc cctctagatg gattctgttt 3600
catgtgcgga acatcgtgta cggcatccaa gtgatgctgt gccggcggag aaacagcaga 3660
aagcagagtc aggtgcagct ggccattcag gtcctgctcg tggacaagca caagtacttt 3720
ctgttcggcc cctatcctat cagcgaggga ctgaccatga ccaccggccg gaacatcaac 3780
agcaactccc tgatgaccaa ctgcctgttc agccccatct tcctgtgcca ccacgccatc 3840
atgcaccgga agatgacaag cccacacttc agactgttct ccagcaagat cccacatcct 3900
caggtgccaa gtgtggtggc cctgtgcaag ttcctggcca atggcctgtg gttcaacctg 3960
atctttcaga aaaagggcca catgatcttt agccccaagt tcttcctgac ctttagccag 4020
cggaccctgg aatccgccgg actgtttcca tggctgcaca cccagtgccg gaacaaaaag 4080
accaagctgt ggttttccct gatcaacatc caccaccgca agaatcctct gctgcctatg 4140
agaatgagca gaacacctcc tcggagagtg tgcggatctc cacctctgca tctgtgccaa 4200
cctctgagag gcggcaagaa gagaagcaag ttcgccttct ggaagcctcc tagccagggc 4260
atcagctctt gtctgatgac aggctgttgg ggctcctgtg gcagagcttg ttcttgcgga 4320
agaggctgcg gtacacccag aggcgactgg aaaagacacc cacctcgcag agagctgagc 4380
ctggaaccat ggattcctta tctgcaccag caaaagaccc agcggaagcg gatgaagacc 4440
ggcgccattc aagagaaggg cgctatccaa gaaaaaggcg caatgaccaa gcggatctgc 4500
gtggtcaatt tcgaggcctg cagagagatg gaaagcctga gcgcccctga gaagattacc 4560
ctgttcgaag cccacatggc ccggtgcacc tccatcaatg tgctgtgtgt ccgggccagc 4620
ctgattgaga agctgatgaa agaaaagcgc aagatgaagc gcaaccaggt ggcatcccct 4680
caaatcatgc aacggctgtt catcaagggc taccagaaca accacttcac gttccacctc 4740
caaaactttg ccttcttcag ctccttcggc aacaacaagt atatcaacat tctcacccgg 4800
gccttcatcc acacacctag aagccctggc tgttccgtgt acgccaatat gtgctggcgg 4860
aagatgcagt ccctgaatca ccccagcaga ctgaccaact gtcaccccgc ttggctgagc 4920
cccattagtg cttgtcctag gctgctgccc tatccttttc acgtgctggc actggaagtg 4980
acctttccac ctggcacagc catgcctcag atgcaattgc aggcactggc tatgtgggag 5040
aaaggctggg acaagcaaga gaagaaatcc cgcaagctga tgtcctcctg cctggaaaaa 5100
aaggctacct ggatgcggag aacccctggc acaagcctgc agtgttacct gaacacacac 5160
ccctgcacca tgctgctgcc tcagggaatc ccatctctga acgcccagtg gatgttcctg 5220
cggatcggct acccctacga tgtccctgac tatgcgtcct aaaggcgcgc ctagcggccg 5280
c 5281
<210> 1213
<211> 5296
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 3C
<400> 1213
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgcctattc ctccacacct gagacaccct ctgctgctga agaacaagaa gcggagaaag 780
ctgcggccca agagcagaaa gaagggccac accaagaacc ggcggaaggc caagagaaag 840
ccccagatca gaaacagccg cagagccaca cctaccagca agggcagcct gagaagaaag 900
tacctgagag tgggagccgc cgctgctagc tgtcaatctc ctccatctcc tagagagaca 960
acccctagca gcgacgccac cagaagaacc agacctatcg ccgctcagag caagaaaacc 1020
atgacagccg ccggactgac ccctagccag aagaaagatc ctgccggcaa gctgaagaaa 1080
caggtgtccg tgtacagcgg caacctgctg agcttctctc ggagaggcat gaagtctagc 1140
gtgcgcctga agaactgcac caacctgagc gtgcccatga tgctgaccat cctgatctgg 1200
aagcgggtgt tcatcctgct gctgtccgac aagaaatcta tccctcacgt gcccaaggcc 1260
accgccgctc attctgtgac agtgaagctg cagagccggc ggaacagacg gtacagaaag 1320
atctatggcg agctgaagat gtccctgcag gccagcaatg gcatggaagc ctgtggcaca 1380
caccccacac ctagactgtc cgtgtccgtg atcaccatga agctgtggga gaagcacttc 1440
aagggcctga actggaacct ggtcgtgtgg attctgaacc tgaagatgat gctcaagaag 1500
aagtatctgg tccagcgcga gtgggagaaa cggaagcaga ttcttggcgg cggaggcaag 1560
tacaaagagt acttcctgaa gagaatcctc atccgcaagg ccatgacagt gctggccggc 1620
gataagaaag gcctgggcag attcatgaga tgcgtgcaga gcgagacaaa ggccgtcagt 1680
ctgcagctgc ctctgggcag aatggacctg gatggaatgc tgaccgtgat cggccaggga 1740
ctcgtgggca tgacacctag agatctggga acagtggctg gcgccaccgc acagattcag 1800
aggcctattc aggtgcagac aggcggcaga ctgagaggcc ctagaagaaa ggtgctgatg 1860
gtgctgtggc tgcccgccaa tcagagcctg cagaaaagcc aggtgttcca gtgggtgctg 1920
agaaccgagc tgcccctgac ctttagcacc ctgctgtggg acagcagaca cgacctgcct 1980
agaatgctgc ccatcagcag ccctctgcac agaccccaga tgcctttctg gacctgcacc 2040
tttcctgcca ccacatgggg cacatgggag acaccttcta catggggctg gcggaccttt 2100
gccagacagc cttctagacc caccggcaga acccctacca ccagactgat ggctccagtg 2160
ggcagcgtga tgagctgtag cctgctgaca cagccatctc cagccagcgc ctgtacaatg 2220
cctccactgc tgcatcctca gtgggcccct cattctgctg gactttctcc aggcgcttgc 2280
agacctgcct gtacctgcat cagcatgacc acaatcagca gggccacctg gcgcagaaac 2340
ctgcagagaa acctgaaagt gctgcggctg agaatcccca gcctgcggaa gtacagacag 2400
cagaacaccc ggtccaccaa cctcgagaag aacccatctc tgaagaagca gagccagagg 2460
cggggcaagc tgtctctgac cacactgagc ttcgtgctga tcgaggaact gctgaaaaag 2520
agcagccagc tgcggagaag ctggcggaac gtgtccagaa tcagcaacat ccggaagctg 2580
atttggacca agcagcggag cttcctgtct ctgttcccca agctgagagc caccgagcag 2640
atgaccaatg tgggctgtag actggatttt caccccagaa gcagctccgg cgacagagtg 2700
ttcctggtca agatccagag cagcccattc ctggccagat cctggaatac catgcagtgg 2760
aacaacaaga aaatggccat gactgtgatc gctggcgccc accactgtca gtacaagctg 2820
acctacacca aagtgtggaa gatgaattgg aagaaaatga tgatcggcag ccagcacctc 2880
ctgttctccc cactggatag ctctccactc cagctgctgc tgcacccaca cggcaagaga 2940
tgcaacccct gttgtcggct gacatggatg agccacctga atcggaagct gcacctcacc 3000
aggtcctgcc tgatcgacct gaccatgatg atgagccaga aactgtggaa gaatcagcgg 3060
aagcgcatcc ctctgccttc tccaagacag catctgctgc ctcagtatcc tctgcaccct 3120
cctccacctt gtctgctgct tctccaccat agacaccacc tggcattcct cgagatggcc 3180
tgtagctctc agcacaccca cagcatcaag atctggatca gcttcagcca cgagacaatg 3240
agcctgtcca acatcctgat gaagttccgg ctgaccacca ccacaagcag ccccagaaga 3300
agccctgctc tgcgagctag aggcggcaca acaatcggcg aagtgaccag cagcctgttc 3360
tttagccact gcctgtgcgt ggcccctaga tgtcctagat ctgccgtgga catcagcccc 3420
ggacctacat ctccttctct ggcctcttgt gcctctgtgg ccattggaaa gctggcactg 3480
cttggcgcct ctgctccttg tggtgctgct ggcgctagag aggccggaag atttgctgtg 3540
ctgggcacca tggtcatgaa gaacatggaa cacagactga ccatggacag cgccctgagc 3600
ctgacaaaga gagagggccc tgaaacaggc cccgtgtact acgtgtgcaa ccggatgaat 3660
gtgtccagcg tgctgaagcc tttcctgttc accgtgccta tcgaggacat gagagagtgc 3720
accctgggac gcaacagaat gaatgtctct tccgtgctga aaccctgtct gatccccgtg 3780
ccaatctgca agaagaaact gctgctcaag ctgctgaggg gcgcctccag ctctaccagc 3840
agagatagca gaagcttttt caccagcgct caccccagca gaccctgcag gatgagactg 3900
taccagatgc tgcagaagca gtgctgctac aacctcgtga tcaagcaccc tctgatcttc 3960
cggatcaacc tgcggagaca gggcaagacc aaagacggcg ttgtgcagag cctgggcttc 4020
ctgaaccagc agatcatcct ccagaaagag ttcttcatct gcctgctgat gttcatcaag 4080
cggtggaagc cagccgccac caagaagggc aagaacagcc cctgctgcca gaaaaaactg 4140
cgggtgcaga accagggcca tctgctgatg attctgctgc acaacagagg cccacctctg 4200
cataccagat tcgagaaaaa gcggcccgag tggctgagca gaaaatccgg cgtgatgaag 4260
tgctgggatc tgtgccctgc cttcagcggc aggattctgc accagccaga aatggccgcc 4320
atgagactga tgcccaagtt cctgaactcc accaacagct ggtggacagt gcacaagaag 4380
agaggcctgt tccaccagat gaagtgtctg accgccgtgg actgtctgca ggccttctgg 4440
gatatgagcg agaagaaacg caagctgcct atgattcgca aaatccagaa gcggcggaga 4500
accgccaacc ggaacatcga gatcacccct cagagaagca aagcccacct gaagaaaacc 4560
tccgccaagg gcgccaagaa aatcaccttc ctgtgcctga gagtcagatg cggaggctgg 4620
ctgtgtggct ggacaccaag aggatggctg aagaagtcca ccaagtccag actgtgcttc 4680
ttctacctgc tgtactacct gtttttcctg accgtgtgcg gcttcacccc tccaccactt 4740
attctgtggc ctcaggcagc ccctggcgag aagctgaagc actgttttaa agcctggggc 4800
gtcgaccctc ctggcagcgt ttggattctg ccctgcttcc tgattcacct gagaaaggtg 4860
gacacccacc acctccaggt ggtcaccaaa acagtgaccg ccacaacagc cgacggccag 4920
aggatgagaa ggctgaagtg caaggcctgc cggctgagat gggctagacc tgaacctgca 4980
gctcaggccc ctcctaagag ccactttcca cctcatccta gcggcccctc cagaaccagc 5040
tctctgcaat tgagaaccta catggaaatg cactacggcc atcaggcccc acaggtggca 5100
atgctgccta aactgctgtg tcggcagatg ctccccactc tgtctaccct gcagcagaga 5160
catcctcagg gcccatgtcc tcctccagtg acacctctga gagtgcagtc tgtgctgctg 5220
ctcggagtgc ctcaaacagc tggctacccc tacgatgtcc ctgactatgc gtcctaaagg 5280
cgcgcctagc ggccgc 5296
<210> 1214
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 4C
<220>
<221> Cloning cassette hINV 4C
<222> (1)..(5299)
<400> 1214
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atggacagca agaagatgac ccagaagaac cgcaagaccc ggaaggccgc cagagagaag 780
cacagaaaga ccgacaacct ggacctgcag caccagcgca gacgcaaaaa gaagaaggac 840
aaggtcgaga tccggaatcg gagccctaag gccaatagca ccgagtgtca gggcgagcac 900
agcagagagc agaacctgct gaacctggtg caattgaacc ctcacagccc tcaccaccgg 960
aaggacgagg aagatcacca gaagagacac caccaccaca atcaaaagaa gatgtccgtc 1020
aacgagggca acaaccactg gcctagagtg gaaatgccta ccggctggct gctcgtgggc 1080
tacaacacca gaaacacagc ccagaatcct cggctgcagc agcacctgaa acactggcag 1140
cagtgcacca gagccagatg gtgtcaagag ccctgtcaga ccctgacctt cttccacttc 1200
ttcttctttt tcaaaacggt gtccctgtgc tgccccggct ggtctaaagg acaacctcct 1260
ccacctggcc tgaagccttc tagcctggct tctcaggtgg ccagaaccac aggcgtgtac 1320
cagcacgtgt ggctgatctg cttcgtgttt ttcgtgtgcg tggaaaccgg cttctgtcac 1380
gtggcccaag tgggactcga gagactcgtt agcctgagcg gcatcaccga cgtgaaccat 1440
tgggcccagc ctaagccatc tcctagcaaa ggcaccggca tgaacagacc catcggcctg 1500
agagttggca aaggcgtgtg ggctagactg tggctgaaga actggaagcg gttcaagctc 1560
aaaaagaaat acacaggcat ggaaatcctg ctgtggattc tgctgaagat ggaaattcag 1620
atcttcaaga tttgcctggg cgagatgcag ctgtgcctca agaagaaagt caacgcctgc 1680
agcaacgcca agaaaatgcc cttccagtgc cggtgcagac gcgagtacag agtgaccatg 1740
attcagaaga agaaacagaa gtccccgctg ttcttccacg gcgacctgtg cagaccttct 1800
ccttgcctgt cttggagcag caggatcgtg gctcctggac acgccctgag ctgtcggact 1860
cgtagaagat ggtccagcaa gatggccaag aagtcccagc agcctctgtg tagaggcggc 1920
ccttctgcca gcgatagatg ctgtagctgt agccccagcg gctttagcgc tggaagaggc 1980
agatgtcctg tgcagggatg tctgaggcca cacagagttc agctgctgag aagatggggc 2040
cctggatctc ctgctggcca gagactgtct aagggcttcc aactgctgcg ttggtgggga 2100
ccaggatctc cagctcctga gcctagaaag ggcccatttc caccacctga tcctccatgg 2160
cctgtgaccg ctgtgacagt gatggctggc tctgtgccta gcgctcagtc tgtggatgct 2220
ctggaatccc ctggacctct ggctctcgaa ggccctagca gccctagaaa cctgctctgg 2280
cgggaaatga gcatcttcct gcctggcatc ttcaacctgc acctgtgcta ctaccacagc 2340
cagagcaacc ggaacaagag ccggcagatg gaatccctgg gcatgaagct gcagatcaca 2400
cacccattcg ccagccagcc actgggccaa gagatgccca acaacaccca gatcagactg 2460
ctgaagcccg gccaggcctt tggcagcttt tccgccgatt tttcagcccc tcagcaggcc 2520
cctctgagac tgtggtcttg gtgcggcaca agccagacct acttcggctc tatcgaagcc 2580
ctgacagccc tgttcacctg tagaaccgcc agcatcagcg tgaacatcag caccctgatg 2640
agcatcctgg aagccatcct ggccatgaca ctgaccctga atggcagccc tctgtgggac 2700
tgcagcacaa caacaggcac acaccacggc tgcctgtggg agatcccttc tgttaccctg 2760
ctggctaccg ccaaaaagag ccctaccagc ttctgctgtc agcggcctcc tctgcagcca 2820
gtggaagaga agaagaacgg ccggatcagc agcgtgccac cttctccacc tcttgctctg 2880
ggccctagaa tgcagctctg cacccagctg gcccggttct tccctattac acctcctgtg 2940
tggcacatcc tgggacctca gagacacacc cctctgctga cccctgacac cagatggatc 3000
ttctccaacc agctgcagac cgtgcagatg ctgtgtctgc ctccactgaa gcagggcgag 3060
agaatcatct ggcctctcgg cggctttcag atccccaact tcttttggag cctcggcatc 3120
ggacacactg gcgcctggtg gcatactgga aggcggagaa gagaatgggg cggcagcacc 3180
gtgtctagaa gcccactgtg gatcagctcc atgatctacc tgagaggcat ggccttcgcc 3240
tccgacagca gcatcagaac caccagagtg tcctggtgtc ggagatgtgg cgccaaaagc 3300
gccgcagcca gcagcgacaa gaagaagaaa agcaccgaaa agaccaagaa caagatcatc 3360
tgcaagggcc acagaatcac ccaggtggtg ctgagactgg gcaacctgcc tccattcttc 3420
agaggcagcg aggtgccctt tcctagacct tgccggacca agtgccagaa gaaggttcca 3480
agcgcctctc cttggggact gcacccaaga acagcctcca tcacactgcc taccaccagc 3540
ctgaagggca gcagaacaag ctgctgcccc agatctcacc ccagactgcc cagaacaaag 3600
tggcctctgc agtgcctgct gcacagcctg ggaacaactg gaacactcgt gtgggaaagg 3660
ggcgtgctgc agatgagaag tctggaagct cactgccctc tgcagacatt ccacctccac 3720
cactgcagaa cccagcctag ctcttgtcct ccagcctgga ttctgtacca aggacagtgg 3780
agcggagccg tcgtgggact tagacctgtg gctcaccatc tgccaagacc tatccagggg 3840
ctgcactgtc ctcaggctcc tcatcaacca gctctgtcct ggggaaagtg gcccgtggga 3900
atgacaggac ccgccagatg ttgccggtgg cctagaagaa tgtgtagctc tctggccctg 3960
ccaaccggcc tgacatctct gatcctgcct agcagtgatc tggccgtgct gatctctagc 4020
tccaccagcc actttctgat gcggagccca gtgctgccaa gcagcagact gacatgtgcc 4080
tctccacagc tgcctcggat gtggacatgg tctagctggc tgaaagagtg gggaggacag 4140
gcccacagac agcggaactg tagagtgaac gccgttgagg aactgcacag caggcggatg 4200
tctgtgcgga tcgtgaagaa ttgggtgtcc tgctgttacg tgcggctgag tgcagtggga 4260
ctgtctactt ggagcgccct ggattccctg atcctgtcct tccagagagt gaaaaccagc 4320
cggatactga acctccaggt gctgaagaag atcctgcgga gctttatgaa gctgtaccac 4380
tctctcgtga tgtgcctgcg gctgcggacc aagctggaaa aagctctgag cgctctgttt 4440
atctggcccc agcacagcta caaaggccag gcattcggaa gcctgtgcca gctggtgtct 4500
gccgatttca gcgcccctca agtgaccaga ctgcggagcc tgaaccatct gctgattcgg 4560
tggatcttta gcaatcagct gacagtccaa atgctctgcc tgccgatcat caagaaaatg 4620
aagaaacgga tcatggtgca cgtcttgaag aagaatcgga agcagattat ctgtatcaag 4680
aatatgttcc tgcagcggaa gggattcctg aacctgagcc acgtggaaaa gttcagagag 4740
agcaccctgg gcaatttctg gatgaagctc ctgcagctgc caccagcttg cacctctaag 4800
gcctggacac ccagaaagct tgtggggaga gccgtgcgga gaaagggcgt cgtgatcaac 4860
ctgaagagac tgcagaaatt ccgggctagc gtgtccttct ggactctgct gcctacaaca 4920
ggcgtgcgga caagaggctc tccactgaga ctgactctgt ggcctccaag aagccagaaa 4980
agccagcacc actgcgccct gagaaagatc gagtgggcca caaagctgtc cctcggcggc 5040
aaagcaggac cacaggctca agagaaggcc aacatcctga acagcctgcc ttcctctatg 5100
gaaatcgccg tgctgcaaga aatgctgaac cagaagtgtc tggccccttt cgagcttaag 5160
aagaacctcc tgctgccaac ctacacaccc cacatctgtc ggcacaccct taaaaagaag 5220
cccagagaca tctgcagaat cagcggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1215
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 1D
<400> 1215
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atggccgaca agaaaaacgt gcggagcgct agttctcctg gacatcctct tggccccaga 780
agaatgacca gacggaccat gaccaccacc aaaatgatga tgatgcggcg gaccaagcgg 840
cggagaagaa aaagacgccg gatgaccatg atgaccagaa gaaccctgct gaccaagaaa 900
acctgtctga cccctagaac cagcgccgcc acaaaagctc tgcccagaca gacaatcagc 960
cagcggaggc ctatccagac acctcctgga acaagcctgg ccatctgggg cagaagaagc 1020
aagatcgagg cctctcctat cggcagcatc acccctctga gcatcagcag acctaccagc 1080
agagccagac agagctgttg cctgcctgga ctgacacacc ctgctcatca gcctctgggc 1140
tctatggttg gagctggaac aggcggagga cctgcttgtg tgcctgtggc cgaagcttct 1200
acaggcgctt ggacagctga aggcgctgcc ggcacaagat gtagagccag cagagcccct 1260
tgcagacagc tgcctgcttc tagccctacc aagtgcgaga tctgcgtgaa gagaagaagg 1320
cggcgcaagc ggagcagcca gtctagatct cccgtgccta agaaacgcga gcggatgatg 1380
ctccctgtgc gggccagaac agctagatct gctctgccac aaggcagggc tcctctggaa 1440
ggaatgcttc tgcctagagc actgcccagc ctgctgagca gaatgcctgc cagaagagag 1500
agcagattct ggctggccct gcaggccctt ggactcagac ctcctcatct gcctagctgt 1560
caccctctgc ctcaactgct tggacctcct ccacctcatc aggcccctgg cgagaaaaac 1620
gacctgcagc tgttcgtgat gagcgacacc acctacaaga tctactggac cgtgatcctg 1680
ctgaacccct gcggcaacct gcacctgaaa accaccagcc tgaacgccaa gaaaatggaa 1740
gatatgatct gggagagcaa ccagcagctg aagtggaccc ctcacatcct gaagtccgcc 1800
tctatcgcca agaagcggat caagctgcgg cggaacagca ccagacggga aatgccttct 1860
caggccacac cttctccacc tggaccttgg agagccgctc tgggcaaaga agtgaagcgg 1920
agccagagca agctgagact gagaaacaca agccccttcg acaaaaaggg ctttgtgatc 1980
ctgagcaaca tgggcggcaa ccggtctatc tgcctgacca tcgtgttctt tctggcccct 2040
tacttcccca tgcctagcag ctggtctagc agcggcagaa ccagactgcc tctgaggcca 2100
cagagaggcc ctagacctct gcatagatgg ctgcagcaga ccaccggctg ctctcagaga 2160
agaggcgact gcccaagaac catggccgga ccatctgctt ctctgcaccc tgcatctggc 2220
agagcctcca gaaagacctg gcagagaagg ctgagagcct gtagagcagg cggacctgct 2280
ggatgggcta gacaggccag aaaacgcaag agagagaagc ggtcccagaa gtccagacag 2340
aaccatctgc agctgaaaag ctgcagacgg aagatcagca actggtctaa gctgcggagc 2400
ccctggatct tcgaggccaa aaagagcatg aagagatccc agcggcctcc tcggagcatc 2460
ctgagcctgt tcaagaagaa gaagcccctg acattcagcc ccagcgtgtc caagaagagg 2520
ctgcctaagc tgaagggcaa gaaacgccgg aaagaaatcc agcggaaggt ggtcaagaac 2580
cccagccagc ctgtgccact gagaaatgac ggcatcacca acggcaacga cagcacccgg 2640
tcttgcagca tcagcctgaa gaaaagcctg gaaaagatgc ccctgatgcg gagcctgctg 2700
tactccagaa tgtgcctggt gcagatcccc acacacacct gggagcccga ctactttgtg 2760
tccctgccta tgatgttcag ctgggccaca cagagctttc cagtgggcgc cgtgtttctg 2820
accagacctg ccattccttg ctgtagctgt accagccact ccaatccttg gagccagtcc 2880
acactggcca tccggtttat ctctgcccct cagccaagca gcagcaccgt tacagctgct 2940
cctagcggcc agtattttgc cctgcggagt atgcccaaga gccggaacca ggtgctgttt 3000
cggagaaatc tgaccccaag ccagctgcgg acactggccc ctccatatat gctgctgcct 3060
cagtctctgt cccagagcct gtctcggaag cagatcccat ctcagtccat gctcgtgcgg 3120
accaggctga cactgacagg cactagaagc tccggcacca gagcctctcc atctgccgtg 3180
tgtctgtgct gctggacatg ccccagcaga agctttcctg ccgcctctcc aagcggactg 3240
agagcacctg ttggagcaca ggctcctcca gaagtgacac tgagagccag ctgtgccagc 3300
tccgccagca aagcttgtgc aggactttgg ccttggggag cccaagtgcg gatgaagaag 3360
aaggacagca ccatcttcat ctaccccagg ctgaaaacct tcggcgtgcc actgggcagc 3420
attctgtgtc tggctggaag cctgagcacg atgatgatca ttagcaccac cagacaagag 3480
tgcggcagac gggccagcgt gccctgtaga cctatgatcg gaagcgccag acctggacca 3540
tggcggacaa gtgctatgcc ttctgccatg ggagtcgccc tgcctaccag ctgtgaaagc 3600
ggaagatctc ctcctgccac cggcggaaga atgccaggat ctcagtctat catgatgagc 3660
tggatgcctc cactggctcc ctgcgctgct tgtccttgtt ctcctgctcc tacactgtgc 3720
cctgctcacc ctgctagagc accaacagcc gtgcctgcct ttacacccct gtctgctcat 3780
cctgtgccag tgctgtctgg atgtcacctg gctgtgcgga cctccatgct taccttgctg 3840
ccaatgatga ccctgaaggc cctggtcaag acatggaccc agttcagaaa ctaccccaga 3900
cggcaccctc acagaagccc accaacaagc tgtcctccac tgctcgaggc ctttccactg 3960
ccaagagcca gcctgagagc taccgtgcct agacactcta gcgtgctggc cacaggactg 4020
catctgcata ggcagattag cctgcctctg cggggcttcc tgctgcatca accactgcca 4080
ggacaacacc tgtggctgtc ccacagactg agactgcggc tgcctagaac aaccgagatc 4140
cagctgacca tgaacgactc caagcacaag ctggaaagcc ccgctctgaa acaggtgtcc 4200
ccagctagtc ctcctacaca gcagcctcag acaccccagg attctagaca ggtgctggcc 4260
gtgcctatga gcctggcctg tagcatcacc gtgtccttcg tgggccagat ctctaccctg 4320
gtgctggacg tgtcctccat cagccactgg aacggcatct gggaagtgat gcccagaaca 4380
ctggaaggct gcatctccgt gaaggaccac cggacatccc agaaccacag caagtgcatc 4440
accgagtgtg tgcggacagc cctgaacacc aagtgtgaaa tttgtgtgaa gaacaccgcc 4500
atcctggcta tcaccctgat caccccacag gaccctcacc tggaccctgt gtgtcatccc 4560
catagaaggc ccggctggaa gggacaccac agagtggtgt ttagccacca tccttccggc 4620
agcaccaagt ctcactggca gcagagagaa agaggcggag gccgcagaga aaagaagggc 4680
tgtagagagg caagcagagc cggccagttt cctgtgtggc ggagaacatc tagaggcatg 4740
tccctgcagt ggaagtccgg caatgcctgc acacctctga gatgtcccag cagatctcca 4800
gccaccttcc tgactgccct gaacggctgg catagatctg gactgagggc ccagaccgcc 4860
ttctttctgc tggacatcat cctgcggaga gcccggccta caagctgcag cacatgtaga 4920
atgtggtggc ggctgccctg caaagtgacc gaaagctccc tggccaagaa aaccctgacc 4980
aatcagccta gcttgcccgg accttgtgct agcctgctgt ctacactgag ccagccacca 5040
cctcaggctc ctagccaagt ttggacagcc gctacactgc ggtgtcctgc tgtgcctgct 5100
gctgcatgtc cacctctgaa gctggctcca ctgcaagtga ccacaacact gaagctgatc 5160
ctggtcatgc tggaaatcgt gaccgagaac aaagttcggc agaacttcaa gcggaactcc 5220
agcttcttct acaccagcga cagaggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1216
<211> 5281
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 2D
<400> 1216
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgcggaaga tgcagagcct gaatcacccc agcagactga ccaacaatcc tcggagaaag 780
acctggaaga tgcggaagaa gtacgcccag aagcctagcc agaagaacca cctgtaccgg 840
cagatcaacc ggcgcaagct gcagagaaag aagtccagaa gccacctgga cttcagcccc 900
tactggatga agaaagtgaa gcgggccaga aaccggaaca tgaagaaaac catgagccac 960
ctgatcgccc atcaggccct gaagatgtct ggcctgagac tgtttcaccc cagactgctg 1020
accagaaaga agcccggcaa gcagaaaaag ggccacatga tcttcagccg gcggaagtgg 1080
cagatccggc acgtgctgaa gaatctgatc cccagcctga acgcccagtg gatgttcctg 1140
agaatcgcta gcccacagat catgcagaga accagcgccg accggttccg gatgaagcgg 1200
agaatgcaga acctggacaa tctgggcgtg ccctggcctc tgttgcctgg attgctgctg 1260
gcccatatgt acggcttcag cacctacggc acccagaaag gcgagtgcgt gtgtctgcag 1320
tgtctgagcg gcagcagcct gttcatcctg aagcagcccc tggacctgaa gatctccaag 1380
accttcatgg ccagccctca gattatgcag cggatgagcg ccgtgaactt cgagacaatc 1440
ctgcaggccc atcctcaggt gccagctctt gctcctcaag cttggtggcc cgctagaaga 1500
ggccctctga catctgctcc aagcgcacag cagtccctga cacggacact ggaaagcgcc 1560
ggactgtttc cttggctgca cacccagtgc cgggccttca ttcacacacc tagaagccct 1620
ggctgcagcg tgtacgccaa catgtgctgg cggtacaaga aacggggagt gatcgcctgg 1680
cggatctacc ctcctagcac atgcagcctg ccttgcagag gcctgatcct gattcagcac 1740
ggcggcatct tcaccttccg gttctgggtc gagaagctga gctggaacat ctgcaagaac 1800
ctgagcctgt acctggataa gttcgtgcag cggctgctgt acgtgtacat catcgagaca 1860
aacgtgttcg tgctgaacct gttccacgtg ccagtgaacc agatcttcat gatggccttc 1920
tacctgaagt acaccgagaa ggcctgggtc atggaactgg aatggctgat ccagcagcag 1980
tgctaccagc ggaagagaat gaagaccggc gccatccaag agaagggcgc tattcaagag 2040
aaaggggcca tgaccaagcg gatctgcgtg gtcaatttcg aggcctgcag agagatggaa 2100
agcctgagcg cccctgagaa gatcaccctg tttgaagccc acatggcccg gtgcaccagc 2160
atcaatgtgc tgtgtgtcag ggccagcctg atcgagaaac tgatgaaaga aaagcgcaag 2220
atgaagcgca accaggtggc atcccctcaa atcatgcaac ggctgttcat caagggctac 2280
cagaacaacc acttcacgtt ccacctccaa aacttcgcct tcttcagctc cttcggcaac 2340
aacaagtata tcaacatcct gacctttctg cccagcagat tcccttgggg acctcctcca 2400
ctgggagccc ttagagctac agctcctgct acagctgctc cccaggcaca gacacctcat 2460
tggagagccg ccaccacaag cagcatgagc agctctccaa gagccgagcc taccagctct 2520
agctcttggg ccacttgctg gcctagatgc tgcagctcca gctgctattg gagcctgtct 2580
agctggcctc ctgctggcgc tgccgaagcc acaaatacca gaaccagaag ccgcgagagc 2640
cagcggggaa gaatgctgac ttggagaagc tccctgtggc tgcagggcac cagatgtttt 2700
acaggcgtgc ggaccagctc caggtgcagc ctgatggaac agatccctca cctgaagtct 2760
aacagccgga agaaactgct cgaggacatg aagcagaacg gcttcaccag acggcggaac 2820
agcagaaagc agagccaagt gcagctggcc atccaggtgc tgctggtgga caagcacaag 2880
tactttctgt tcggcagagc cacatttctg ctggctctgt gggagtgtag cctgcctcag 2940
gctagactgt gcctgatcgt gtctagaacc ctgctgctcg tgcagtctag acacccaagc 3000
tggccttgga ccagatgcct gagaatgcgg cctccacgca gccactggaa ctctgcctac 3060
ctggggagaa cactgctcgt gacctgcatc ctgtaccaca gatggatcgt gaccagcatg 3120
tgccagagcc agagatggct gacctccacc acctctagaa gctctgccct gatgtggacc 3180
tggtggtgta caagaggtgg cggcaagcgg aagaaaaaga tgtgcaaggt gtccggcggc 3240
tgcaccgcct gtgttgaaag atgtccttgg aagggcatct gttggaagtg gcctgtgaca 3300
gtggccgcca tgagcagaac acctccaaga cgcgtgtgcg gccacagaga gggcagcgag 3360
tctgataatc tgggcctgct gtactccttt ccacctgtgc tgttcaaggc cgaccagagc 3420
gaaagctctc tgagcagcgg caacagcgtg atcgtgcaca agatcgtgct ggtgttcctg 3480
aagtccctga gcagctacaa ctgcgagaga agaatcagcg gcatccagaa gagagccatc 3540
gagttcgccg tcctgaagct gctgaacatg gacctcggca agggactgac acaccccgtg 3600
cctctgaaga ggaccctgca gaacaagcgg aacaagaaca tcaagcgggt caaccagaag 3660
aagggcaaca tcaagaggaa gtccatcctg ctgcatctga ttgtgctgaa cagccccgag 3720
agcaaccggg aaaagatcat caaccccacc atcagctgcc cctttcagag ccccacaaag 3780
agactgggaa gccctcctct gcacctgtgt cagcctctga ggccctatcc tatcagcgag 3840
ggcctgacca tgaccaccgg cagaaacatc aacagcaact ccctgatgac caactgcctg 3900
ttcagcccca tcttcctgtg ccaccacgcc atcatgcacc ggaagatgac aagccctcac 3960
ttcagactgt tctccagcaa gatcccacat ccacaggtcc caagtgtggt ggccctgtgc 4020
aagtttacac acccctgcac catgctgctg ccccaaggcg ctttttggaa gcctcctagc 4080
cagggcatct ccagctgtct gatgacaggc tgttggcagt ggtccagcgt gacaagcctg 4140
gaatggacag cccaagagag aggctgttcc tcctggctga tgaagcaaac atggatgaag 4200
tcttggtccc tgcgggaccc cagctacaga tccatcctgg aatacgtgtc cacacgggtg 4260
ctgtggatgc ccacctctac cgtgcctaag ttctttctga ccttcagcca gatccggatg 4320
tgcgccctgt ctcaccctag cttctacatc agctccaccg tgtgctttct gagcaagcac 4380
tgcatgaccg cctgcacacc tggaaccagc ctgcagtgtt acctgaacct ggccaacggc 4440
ctgtggttca acctgatctt ccggaacaaa aagaccaagc tgtggttctc cctgattaac 4500
atccaccacc gcaagaaccc actgctgccc atgcggctgg aaaaaaaggc cacttggatg 4560
cggcggaccg agctgtctct ggaaccttgg attccttacc tgcatcagca gaaaacccag 4620
tggctcccca tgagaagcct gggcgagcct tggcgagctg gatttcagtg gggagagtct 4680
ccctggcaag tgatggcctc tctgacaggc agacgcaaga aaagagagga tcactgcgga 4740
ctgcaagaga aaaaaagccg gaagctgatg tccagctgcg ccgctcctcc acatagactg 4800
ctgggaccta gcagatgggg aagctgtggg agagcctgtt cttgtggcag aggctgtgga 4860
acccctagag gcgactggaa gagacaccca cctcggcgga ttctgtttca cgtgcggaac 4920
atcgtgtacg gaatccaagt gatgctgtgc tgtcaccccg cctggctgtc tccaatcagc 4980
gcttgtcctc gcctgctgcc ttatccattc cacgttctgg ccctggaagt gacattccct 5040
ccaggcactg ccatgcctca gatgcaattg caggcactgg caatgtggga gaaaggctgg 5100
gacaagcctc tggaaaacac acagatcccc aggacaagcc cactgtggaa gatcacaatg 5160
gtgctgacat accccaactg cgtggtgcac gtcctgatgt tcggcggcaa gaagcggagc 5220
aagttcggct acccctacga tgtccctgac tatgcgtcct aaaggcgcgc ctagcggccg 5280
c 5281
<210> 1217
<211> 5296
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 3D
<400> 1217
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgcagaaca ccagaagcac caacctggaa aagaacccca gcctgaagaa gcagagccag 780
cggagaggaa agctgagcag cagaaagaag ggccacacca agaaccggcg gaaggccaag 840
agaaagcccc agatcagcca gaagaaggac cctgccggca agctgaagaa acacctgaac 900
cggaagctgc acctgaccag atcctgcctg atcgacctga ccatgatgat gagccagaag 960
ctgtggaaga accagcgcaa gagaatccct ctgccttctc cacggcagca tctgctgcct 1020
cagtatccac tgcatcctcc acctccatgc ctgctgctgc tccaccacag acaccatctg 1080
gcctttctcg agatggcctg cagcagccag cacacccaca gcatcaagat ctggatcagc 1140
ttcagccacg aggacctgcc tagaatgctg cccatcagca gccctctgca cagaccccag 1200
atgcctttct ggacctgcac ctttcctgcc accacatggg gcacatggga gacaccttct 1260
acatggggct ggcggacatt cggccctgtg tactacgtgt gcaaccggat gaacgtgtcc 1320
agcgtgctga agcctttcct gttcaccgtg cctatcgagg acatgagaga gtgcaccctg 1380
ggcagaaaca gaatgaatgt gtcctctgtg ctgaaaccct gtctgatccc cgtgccaatc 1440
ctgaccacac tgagcttcgt gctgatcgag gaaagccggc ggaacagacg gtacagaaag 1500
atctacgggg agctgaagat gtccctgcag gccctgcctc tgacctttag cacactgctg 1560
tgggacagca gacacaccac caccacaagc agccccagaa gatcccctgc tctgagagct 1620
agaggcggca ccacaatcgg cgaagtgaca agcagaggcg ccagcagctc taccagcaga 1680
gacagcagaa gctttttcac cagcgctcac cccagcagac cctgcagaat gagactgtac 1740
cagagcaacg gcatggaagc ctgcggcaca caccctacac ctagactgtc tagaggccct 1800
ccactgcaca ccagaaccat gagcctgagc aacatcctga tgaagttccg gctgatgctg 1860
cagaagcagt gctgctacaa cctcgtgatc aagcaccctc tgatcttccg gatcaacctg 1920
cggagacagg gcaagaccaa agacggcgtt gtgcagagcc tgggcttcct gaaccagcag 1980
atcatcctgc agaaagagtt cttcatctgc ctgctgatgt tcatcaagcg gtggaagcca 2040
gccgccacaa agacacctcc accactgatt ctgtggcctc aggccgctcc tgtgcacaag 2100
aagagaggcc tgttcagcct gttcttctcc cactgcctgt gccaccagat gaagtgcctg 2160
accgccgtgg attgtctgca ggccttctgg gacatgatga ttcgcaagat ccagaagcgg 2220
cggagaaccg ccaaccggct gaaaaagaaa tacctggtgc agtgtaccaa cctgagcgtg 2280
cccatgatgc tgaccatcct gatctggaag cgggtgttca tcctcctgct gagcgacaag 2340
aagtgtctga gagtcagatg cggcggatgg ctgtgtggct ggacacctag aggcaagaac 2400
aagaagcgga gaaagctgcg gcccaagcac ctgaagaaaa ccagcgccaa ggtgtccgtg 2460
atcaccatga agctctggga gaagcacttc aagggcctga actggaacct ggtcgtgtgg 2520
attctgaacc tgaagatgat gtggctcaag aagtccacca agagcagaca gagcagccca 2580
ttcctggctc ggagctggaa taccatgcaa tggaacaaca agaaaatggc catgaccgtg 2640
atcgctggcg cccaccactg tcagtacaag ctgacctaca ccaaagtgtg gaagatgaat 2700
tggaagaaaa tgatgatcgg ctcccagcac ctcctgttta gcccactgga ttcaagccca 2760
ctgcagttgc tgctgcaccc tcacggcaag agatgcaacc cttgctgcag actgacctgg 2820
atgagcagag agtgggaaaa gcggaagcag atcctcggcg gaggcggcaa gtacaaagag 2880
tacttcctga agcggattct catccggaag gctatgacag tgctggccgg cgataagaaa 2940
ggcctgggaa gattcatgag atgcgtgcag agcgagacaa aggccgtgtc tctgcagctg 3000
cctctcggcc gaagaaagtc cggcgtgatg aagtgttggg atctgtgccc cagactggac 3060
tttcacccca gatctagctc tggcggcgag aagctgaagc actgtttcaa agcctggggc 3120
ctgtgcttct tctacctgct gtacttcgag aagaaacggc ccgagtggct gagcgttgac 3180
cctcctggat ctgtctggat tctgccctgc atggacctgg acggaatgct gacagtgatc 3240
ggccagggac tcgtgggcat gacccctaga gatctgggaa cagtggctgg cgccaccgca 3300
cagattcaga ggcctatcca ggtgcagaca ggcggcagac tgttcctgat tcacctgaga 3360
aaggtggaca cccaccatct gcaggtcgtg accaagaccg tgacagccac aacagctgac 3420
ggccagagga tgcggagact gaagtgcaag gcctgtcggc tgagatgggc cagacctgaa 3480
cctgctgcac aggctcctcc aaagagccac tttccacctc atcctagcgg cccctccaga 3540
acctctagcc tgcagctcag acccattcct ccacacctga gacacccact gctgctgaag 3600
ggaaagaaca gcccctgctg ccaaaagaaa ctgcgggtgc agaaccaggg ccatctgctg 3660
atgatcctgc tgcataacgc cagacagccc agcaggccta ccggaagaac ccctaccaca 3720
agactgatgg cccctgtggg cagcgtgatg tcttgtagcc tgctgaccca gccatctcct 3780
gccagcgcat gtacaatgcc accactcctg catccacagt gggccccaca tagtgctgga 3840
ctgtctccag gcgcttgcag acctgcctgt acctgcatca gcatgaccac catctccaga 3900
gccacatggc ggctgagaat cccaagcctg aggaagtacc ggcagaacat cgagatcacc 3960
cctcagcggt ctaaggccca ggtttccgtg tacagcggca atctgctgag cttctccaga 4020
cggggcatga agagtagcgt gcggctgaag aacagcatcc ctcacgtgcc aaaagccacc 4080
gccgctcact ctgtgacagt gaagctgcag tacctgtttt tcctgaccgt gtgcggcttc 4140
gaccgggtgt tcctggttaa gatctgcaag aagaagctgc tcctcaagct gctgagaggc 4200
cccagacgga aagtgctgat ggtgctttgg ctgcccgcca accagagtct gcagaaaagc 4260
caggtgttcc agtgggtgct gcggaccgaa acctacatgg aaatgcacta cggccatcag 4320
gcccctcagg tggccatgct gcctaaactg ctgtgtagac agatgctccc cactctgtcc 4380
acactccagc agaggcatcc tcagggacct tgtcctcctc ctgtgacacc tctgagagtg 4440
cagtctgtgc tgctcctggg agtgcctcag acagccgctt ttagcggccg gattctgcac 4500
cagccagaaa tggccgccat gagactgatg cccaagttcc tgaactccac caacagctgg 4560
tggacagtgg cccctagatg tcctagaagc gccgtggaca ttagccccgg acctacatct 4620
cctagcctgg cctcttgtgc ctctgtggcc attggaaaac tggcactgct gggcgcatct 4680
gccccttgtg gcgcagctgg tgctagagag gctggaagat ttgccgtgct gggcaccatg 4740
gttatgaagg gtgctgccgc agcctcctgt cagtctcctc catctccaag agagacaacc 4800
cctagcagcg acgccaccag acggacaaga cctattgccg ctcagagcaa aaagaccatg 4860
actgccgccg gactgacccc tcggagaaac ctgcagagaa atctgaaggt cctgggcgcc 4920
aagaagatca ccttcctgag aaacagcaga cgcgccacac ctacctctaa gggcagcctg 4980
agaagaaagt acctgagagt gaacatccgc aagctcatct ggaccaagca gcggagcttc 5040
ctgtctctgt tccccaagct gagagccacc gagcagatga ccaatgtggg atgcctgctc 5100
aagaaaagca gccaattgcg gcggagctgg cgcaatgtgt cccggatcag caacatggaa 5160
cacaggctga ccatggacag cgccctgagc ctgacaaaga gagagggccc tgagacaagc 5220
gagaagaaga ggaagttgcc tggctacccc tacgatgtcc ctgactatgc gtcctaaagg 5280
cgcgcctagc ggccgc 5296
<210> 1218
<211> 5299
<212> DNA
<213> Artificial Sequence
<220>
<223> Cloning cassette hINV 4D
<400> 1218
gaattcggat cccgcgactt cgccgccatg catcgacggc gctcacggag ttgccgggaa 60
gaccaaaagc ctgtgatgga cgatcagcgg gaccttattt ctaacaatga acaacttccg 120
atgcttggta ggcggcctgg agcaccagag tccaagtgtt ctaggggcgc cctgtacact 180
ggtttctcca tcctcgtgac actgttgctg gcgggacagg caacaactgc gtatttcttg 240
tatcagcagc aaggaagact ggataagctt acagttacat cccagaatct ccaacttgaa 300
aacctcagaa tgaagcttcc gaagccccca aagcccgtct ccaaaatgag gatggcgaca 360
ccgctcctta tgcaagccct tcccatgggg gctctgcccc aagggccaat gcagaacgct 420
acaaagtatg gaaatatgac agaggatcat gtcatgcatt tgcttcaaaa cgctgatccc 480
cttaaagttt accctcctct gaaggggagc tttccagaaa atcttcgaca tctcaagaac 540
acgatggaaa cgattgactg gaaggtgttt gagagctgga tgcaccattg gctcctgttc 600
gagatgtccc ggcattctct ggagcaaaag ccgacggacg cacctcccaa ggaaagcctg 660
gaattggagg acccgagtag tgggctgggc gtcacaaagc aagacctggg acccgtgccg 720
atgaacagaa agaccagaaa ggccgccaga gagaagcacc gcaagaccga cgacaagaag 780
aagaagtcca ccgaaaagac caagaacgcc aagaagatgc ccttccagca gcggcctcct 840
ctgcagcctg ttaacctgga tctgcagcac cagcgcagac gcaaaaagaa gaaagacaag 900
gtcgaaatcc ggaatcggag ccctaaggcc aatagcaccg agtgtcaggg cgagcacagc 960
agagagcaga acctgctgaa tctggtgcag ctgaaccctc acagccctca ccacagaaag 1020
gacgaagagg accaccagaa gcggcaccac caccacaatc aaaagaaaat gagcgtgcgg 1080
gctagcgtgt ccttctggac acttttgcca acaaccggcg tgcggacaag aggctctcca 1140
ctgagactga cactgtggcc tccacgggtt ccaccttctc cacctcttgc tctgggcccc 1200
agaatgcagc tgtgtaccca gctcgcccgg ttcttcccta tcacacctcc tgtgtggcac 1260
atcctgggac ctcagagaca cacacctcag gctcctctga ggctgtggtc ttggtgcggc 1320
acaagccaga cctacttcgg cagcagacca tctccttgcc tgagctggtc cagcagaatt 1380
gtggcccctg gacacgccct gagctgtcgg actagaagaa gatggtctag caagcggtgg 1440
atcttctcca accagctgac cgtgcagatg ctgtgcctgc caatcacaca cccattcgcc 1500
tctcagcctc tgggacaaga gatgcccaac aacacccaga tccggctgct gaagccctgc 1560
agagtgaacg ccgtggaaga actgcacagc aggcggatgt ctgtgcggat cgtgaagaac 1620
tgggtgtcct gctgttacgt gcggctgtct gctgtgggcc tgtctacttg gagtgccctg 1680
gacgaggaaa agaagaacgg ccggatcagc agcctgaaaa agaaagtgaa tgcctgcagc 1740
tccctgatcc tgagcttcca gcgcgtgaaa accggcatgg aaatcctgct gtggattctg 1800
ctgaagatgg aaattcagat cttcaagatt tgcctgggcg agatgcagct ctgcggccag 1860
gcctttggaa gctttagcgc cgatttcagc gcccctcaga tcattaagaa gatgaagaaa 1920
cggatcatgg tgcacgagct gaagaagaat ctgctgctgc ctatgtgctc cagcctggct 1980
ctgccaacag gcctgacatc tctgatcctg cctagcagcg atctggccgt gctgatctct 2040
agctccacca gccactttct gatgcggagc cctgtgctgc caagcagcag actgacttgt 2100
gcctctccac agctgccccg gatgtggact tggtctagct ggctgaagaa cgagggcaac 2160
aaccactggc ctagagtgga aatgcctacc ggctggctgc tcgtcggcta caacaccaga 2220
aacacagccc agaatcctcg gctgcagcag cacctgaaac actggcagca gtgcaccaga 2280
gccagatggt gtcaagagcc ctgtcagacc ctgaccttct tccatttctt cttctttttc 2340
aaaacggtgt ccctgtgttg ccccggctgg tctaaaggac aacctcctcc acctggcctg 2400
aagccttcta gcctggcttc tcaggtggcc agaaccacag gcgtgtacca gcacgtgtgg 2460
ctgatctgtt tcgtgttttt cgtgtgtgtg gaaaccggct tctgtcacgt ggcccaagtg 2520
ggactcgaga gactggtgtc tctgtccggc atcaccgacg tgaaccattg ggcccagcct 2580
aagccatctc ctagcaaagg caccggcatg aacagaccca tcggcctgag agttggcaaa 2640
ggcgtgtggg ccagactgat cctggccatg acactgaccc tgaacggcat ggccaagaag 2700
tcccagcagc ctctgcaggt cgtgctgaga ctgggaaacc tgcctccatt cttcagaggc 2760
agcgaggtgc cctttcctag accttgtcgg accaagcctg cctgcacaag caaggcctgg 2820
actcccagaa aactcgtggg gagagccgtg cggagaaagg gatctccact ctgggattgc 2880
tccaccacaa caggcacaca ccacggatgc ctgtgggaga tcccatctgt gaccctgctg 2940
gcccatccta gaaccgcctc tatcaccctg cctaccacaa gcctgaaggg ctccagaacc 3000
agctgctgcc ctagatctca ccccagactg cctaggacca aatggcccct gcagtgtctg 3060
ctgcacagcc tgggaacaac cggaacactc gtttgggaaa ggggcgtcct gcagatgaga 3120
tccctcgaag cccattgtcc actgcagacc ttccatctgc accactgcag gacccagcct 3180
agctcttgtc ctcctgcctg gattctgtac caaggacagt ggagcggagc cgtcgtggga 3240
cttagacctg tggctcacca tctgcctaga cctatccagg gcctgcactg tccacaggca 3300
cctcatcaac ctgctctgag ctggggaaaa tggcccgtgg gaatgacagg ccctgccaga 3360
tgttgcagat ggcccagacg gtgccagaag aaggttccat cagcctctcc atggggcctc 3420
gtgctcaaaa agaaccggaa acagatgctg aaccagaagt gtctggcccc ttttagagag 3480
agcaccctgg gcaatttctg gatgaagctg ctccagctgc ctgtcgtgat caacctgaag 3540
agactgcaga agttcaacct gcacctgtgc tactaccaca gccagagcaa cagaaacaag 3600
agccgccaga tggaatccct gggcatgaag ttgcagtccc agaaatccca gcaccactgt 3660
gccctgcgga agatcgagtg ggccacaaag ttgtctctcg gcggaaaagc cggaccacag 3720
gctcaagaga aggccacctc tcggattctg aacctgcaag tgctcaagaa gatcctgcgg 3780
agctttatga agctgtacca ctctctggtc atgtgcctgc ggctgaggac caagctggaa 3840
aaggctctga gcgccctgtt catctggccc cagcacagct acaagcccct gttctttcac 3900
ggcgacctgt gcgagtgggg aggccaggct catagacagc ggaactggct gaaaaactgg 3960
aagcggttca agcttaaaaa gaagtacatc cagaagaaga agcagaagtc taacaagatc 4020
atctgcaagg gccaccgcat caccatcatc tgtatcaaga atatgttcct gcagcgcaag 4080
ggcttcctga acctgagcca cgtggaaaag ttctgtagag gcggccctag cgccagcgat 4140
agatgctgtt cttgtagccc cagcggcttc agtgccggca gaggaagatg tcctgttcag 4200
ggctgtctga ggccccacag agttcaactg ctgagaagat ggggccctgg ctctcctgct 4260
ggacagaggc tgtctaaggg ctttcagctg ctccgttggt ggggaccagg atctcctgct 4320
cctgagccta gaaagggccc atttccacca cctgatcctc catggcctgt gaccgctgtg 4380
acagtgatgg ctggatctgt gcctagtgct cagtctgtgg acgccctgga atctcctgga 4440
cctctggctc tcgaaggacc tagcagccct agaaacctgc tttggagaga gatgagcatc 4500
tttctgcccg gcatcttcac cgccaagaaa agccccacca gcttttgctg caatatcctg 4560
aacagcctgc caagctctat ggaaatcgcc gtgctgcaag aggacagcaa aaagatgacc 4620
cagaagggcc aagccttcgg ctccctgtgt cagcttgtgt ccgctgactt ctctgcccct 4680
caagtgaccc ggctgcggag cctgaatcat ctgctgatca cctacacacc ccacatctgc 4740
agacacaccc tgctgacccc tgacaccaga tggatcttta gcaatcagct gcagacagtc 4800
cagatgctct gtctgcctcc actgaagcag ggcgagagaa tcatttggcc cctcggcggc 4860
tttcagatcc ccaacttctt ttggagcctc ggcatcggac acactggcgc ctggtggcat 4920
actggaaggc ggagaagaga atggggcggc agcaccgtgt ctagaagccc tctgtggatc 4980
agctccatga tctacctgag aggcatggcc ttcgccagcg acagcagcat cagaaccacc 5040
agagtgtcct ggtgcagaag atgcggcgcc aaaagcgctg ccgccagctc tattgaagct 5100
ctgaccgctc tgtttacctg ccggaccgcc agcatcagcg tgaacatcag caccctgatg 5160
tccatcctgg aagcacttaa gaagaaaccc agagacatct gccgcatcag ctgccggtgt 5220
agacgcgagt acagagtgac tatgggctac ccctacgatg tccctgacta tgcgtcctaa 5280
aggcgcgcct agcggccgc 5299
<210> 1219
<211> 37184
<212> DNA
<213> Great Ape Adenovirus
<400> 1219
catcatcaat aatatacctt attttggatt gaggccaata tgataatgag gtgggcgggg 60
cgaggcgggg cgggtgacgt aggacgcgcg agtagggttg ggaggtgtgg cggaagtgtg 120
gcatttgcaa gtgggaggag ctgacatgca atcttccgtc gcggaaaatg tgacgttttt 180
gatgagcgcc gcctacctcc ggaagtgcca attttcgcgc gcttttcacc ggatatcgta 240
gtaattttgg gcgggaccat gtaagatttg gccattttcg cgcgaaaagt gaaacgggga 300
agtgaaaact gaataatagg gcgttagtca tagcgcgtaa tatttaccga gggccgaggg 360
actttgaccg attacgtgga ggactcgccc aggtgttttt tacgtgaatt tccgcgttcc 420
gggtcaaagt ctccgttttt attgtcgccg tcatctgacg cggagggtat ttaaacccgc 480
tgcgctccta aagaggccac tcttgagtgc cagcgagaag agttttctcc tccgctccgt 540
ttcggcgatc gaaaaatgag acatttagcc tgcactccgg gtcttttgtc cggccgggcg 600
gcgtccgagc ttttggacgc tttgctcaat gaggttctga gcgatgattt tccgtctact 660
acccacttta gcccacctac tcttcacgaa ctgtacgatc tggatgtact ggtggatgtg 720
aacgatccca acgaggaggc ggtttctacg ttttttcccg agtctgcgct tttggctgcc 780
caggagggat ttgacctaca cactccgccg ctgcctattt tagagtctcc gctgccggag 840
cccagtggta taccttatat gcctgaactg cttcccgaag tggtagacct gacctgccac 900
gagccgggct ttccgcccag cgacgatgag ggtgagcctt ttgctttaga ctatgctgag 960
atacctgggc tcggttgcag gtcttgtgca tatcatcaga gggttaccgg agaccccgag 1020
gttaagtgtt cgctgtgcta tatgaggctg acctcttcct ttatctacag taagtttttt 1080
tgtgtaggtg ggctttttgg gtaggtgggt tttgtggcag gacaggtgta aatgttgctt 1140
gtgttttttg tacctgcagg tccggtgtcc gagccagacc cggagcccga ccgcgatccc 1200
gagccggatc ccgagcctcc tcgcaggcca aggaaattac cttccatttt gtgcaagcct 1260
aagacacctg tgaggaccag cgaggcggac agcactgact ctggcacttc tacctctcct 1320
cctgaaattc acccagtggt tcctctgggt atacatagac ctgttgctgt tagagtttgc 1380
gggcgacgcc ctgcagtaga gtgcattgag gacttgctta acgatcccga gggacctttg 1440
gacttgagca ttaaacgccc taggcaataa accccaccta agtaataaac cccacctaag 1500
taataaactt taccgccctt ggttattgag atgacgccca atgtttgctt ttgaatgact 1560
tcatgtgtat aataaaagtg agtgtggtca taggtctctt gtttgtctgg gcggggttta 1620
agggtatata agtttctcgg ggctaaactt ggttacactt gaccccaatg gaggcgtggg 1680
ggtgcttgga ggagtttgcg gacgtgcgcc gtttgctgga cgagagctct agcaatacct 1740
atagtatttg gaggtatctg tggggctcta ctcaggccaa gttggtcttc agaattaagc 1800
aggattacaa gtgcgatttt gaagagcttt ttagttcctg tggtgagctt ttgcaatcct 1860
tgaatctggg ccaccaggct atcttccagg aaaaggttct ctcgactttg gatttttcca 1920
ctcccgggcg caccgccgct tgtgtggctt ttgtgtcttt tgtgcaagat aaatggagcg 1980
gggagaccca cctgagtcac ggctacgtgc tggatttcat ggcgatggct ctttggaggg 2040
cttacaacaa atggaagatt cagaaggaac tgtacggttc cgccctacgt cgtccacttc 2100
tgcagcggca ggggctgatg tttcccgacc atcgccagca tcagaatctg gaagacgagc 2160
gagcggagaa gatcagcttg agagccggcc tggaccctcc tcaggaggaa tgaatctccc 2220
gcaggtggtt gagctgtttc ccgaactgag acgggtcctg actatcaggg aggatggtca 2280
gtttgtgaag aagctgaaga gggatcgggg tgagggagat gatgaggcgg ctagcaattt 2340
agcttttagt ctgataactc gccaccgacc ggaatgtatt acctatcagc agattaagga 2400
gagttgtgcc aacgagctgg atcttttggg tcagaagtat agcatagaac agcttaccac 2460
ttactggctt cagcccgggg atgattggga agaggcgatt agggtgtatg caaaggtggc 2520
cctgcggccc gattgcaagt ataagattac taagttggtt aatattagaa actgctgcta 2580
tatttctgga aacggggccg aagtggagat agatactgag gacagggtgg ctattaggtg 2640
ttgcatgata aacatgtggc ccgggatact ggggatggat ggggtgatat ttatgaatgt 2700
gaggttcacg ggccccaact ttaatggtac ggtgttcatg ggcaacacca acttgctcct 2760
gcatggtgcg agtttctatg ggtttaacaa cacctgtata gaggcctgga ccgatgtaaa 2820
ggttcgaggt tgttcctttt atagctgttg gaaggcggtg gtgtgtcgcc ctaaaagcag 2880
gggttctgtg aagaaatgct tgtttgaaag gtgcacccta ggtatccttt ctgagggcaa 2940
ctccagggtg cgccataatg tggcttcgaa ctgcggttgc ttcatgcaag tgaagggggt 3000
gagcgttatc aagcataact cggtctgtgg aaactgcgag gatcgcgcct ctcagatgct 3060
gacctgcttt gatggcaact gtcacctgtt gaagaccatt catataagca gtcaccccag 3120
aaaggcctgg cccgtgtttg agcataacat tctgacccgc tgttccttgc atctgggggt 3180
caggaggggt atgttcctgc cttaccagtg taactttagc cacactaaaa tcctgctgga 3240
acccgagtgc atgactaagg tcagcctgaa tggtgtgttt gatgtgagtc tgaagatttg 3300
gaaggtgctg aggtatgatg agaccaggac caggtgccga ccctgcgagt gcggcggcaa 3360
gcacatgaga aatcagcctg tgatgttgga tgtgaccgag gagcttaggc ctgaccatct 3420
ggtgctggcc tgcaccaggg ccgagtttgg gtctagcgat gaggataccg attgaggtgg 3480
gtaaggtggg cgtggctagc agggtgggcg tgtataaatt gggggtctaa ggggtctctc 3540
tgtttgtctt gcaacagccg ccgccatgag cgacaccggc aacagctttg atggaagcat 3600
ctttagtccc tatctgacag tgcgcatgcc tcactgggcc ggagtgcgtc agaatgtgat 3660
gggttccaac gtggatggac gtcccgttct gccttcaaat tcgtctacta tggcctacgc 3720
gaccgtggga ggaactccgc tggacgccgc gacctccgcc gccgcctccg ccgccgccgc 3780
gaccgcgcgc agcatggcta cggaccttta cagctctttg gtggcgagca gcgcggcctc 3840
tcgcgcgtct gctcgggatg agaaactgac tgctctgctg cttaaactgg aagacttgac 3900
ccgggagctg ggtcaactga cccagcaggt ttccagcttg cgtgagagca gccttgcctc 3960
cccctaatgg cccataatat aaataaaagc cagtctgttt ggattaagca agtgtatgtt 4020
ctttatttaa ctctccgcgc gcggtaagcc cgggaccagc ggtctcggtc gtttagggtg 4080
cggtggattt tttccaacac gtggtacagg tggctctgga tgtttagata catgggcatg 4140
agtccatccc tggggtggag gtagcaccac tgcagagctt cgtgctcggg ggtggtgttg 4200
tatatgatcc agtcgtagca ggagcgctgg gcgtggtgct gaaaaatgtc cttaagcaag 4260
aggcttatag ctagggggag gcccttggtg taagtgttta caaatctgct tagctgggag 4320
gggtgcatcc ggggggatat gatgtgcatc ttggactgga tttttaggtt ggctatgttc 4380
ccgcccagat cccttctggg attcatgttg tgcaggacca ccagcacggt atatccagtg 4440
cacttgggaa atttatcgtg gagcttagac gggaatgcat ggaagaactt ggagacgccc 4500
ttgtggcctc ccagattttc catacattcg tccatgatga tggcaatggg cccgtgggaa 4560
gctgcctgag caaaaacgtt tctggcatcg ctcacatcgt agttatgttc cagggtgagg 4620
tcatcatagg acatctttac gaatcggggg cgaagggtcc cggactgggg gatgatggta 4680
ccctcgggcc ccggggcgta gttcccctca cagatctgca tctcccaggc tttcatttca 4740
gagggaggga tcatatccac ctgcggggcg atgaaaaaga cagtttctgg cgcaggggag 4800
attaactggg atgagagcag gtttctgagc agctgtgact ttccacagcc ggtgggccca 4860
tatatcacgc ctatcaccgg ctgcagctgg tagttaagag agctgcagct gccgtcctcc 4920
cggagcaggg gggccacctc gttgagcata tccctgacgt ggatgttctc cctgaccagt 4980
tccgccagaa ggcgctcgcc gcccagcgaa agcagctctt gcaaggaagc aaaatttttc 5040
agcggtttca ggccatcggc cgtgggcatg tttttcagcg tctgggtcag cagctccagc 5100
ctgtcccaga gctcggtgat gtgctctacg gcatctcgat ccagcagatc tcctcgtttc 5160
gcgggttggg gcggctttcg ctgtagggca ccagccgatg ggcgtccagc ggggccagag 5220
tcatgtcctt ccatgggcgc agggtcctcg tcagggtggt ctgggtcacg gtgaaggggt 5280
gcgctccggg ttgggcactg gccagggtgc gcttgaggct ggttctgctg gtgctgaatc 5340
gctgccgctc ttcgccctgc gcgtcggcca ggtagcattt gaccatggtc tcgtagtcga 5400
gaccctcggc ggcgtgcccc ttggcgcgga gctttccctt ggaggtggcg ccgcacgagg 5460
ggcactgcag gctcttcagg gcgtagagct tgggagcgag aaacacggac tctggggagt 5520
aggcgtccgc gccgcaggcc gagcagaccg tctcgcattc caccagccaa gtgagttccg 5580
ggcggtcagg gtcaaaaacc aggttgcccc catgcttttt gatgcgtttc ttaccttggc 5640
tctccatgag gcggtgtccc ttctcggtga cgaagaggct gtccgtgtcc ccgtagaccg 5700
acttcagggg cctgtcttcc agcggagtgc ctctgtcctc ctcgtagaga aactctgacc 5760
actctgagac gaaggcccgc gtccaggcca ggacgaagga ggccacgtgg gaggggtagc 5820
ggtcgttgtc cactagcggg tccaccttct ccagggtgtg caggcacatg tccccctcct 5880
ccgcgtccag aaaagtgatt ggcttgtagg tgtaggacac gtgaccgggg gttcccaacg 5940
ggggggtata aaagggggtg ggtgcccttt catcttcact ctcttccgca tcgctgtctg 6000
cgagagccag ctgctggggt aagtattccc tctcgaaggc gggcatgacc tcagcgctca 6060
ggttgtcagt ttctaaaaat gaggaggatt tgatgttcac ctgtccggag gtgatacctt 6120
tgagggtacc tgggtccatc tggtcagaaa acactatttt tttgttatca agcttggtgg 6180
cgaatgaccc gtagagggcg ttggagagca gcttggcgat ggagcgcagg gtctggtttt 6240
tgtcgcggtc ggctcgctcc ttggccgcga tgttgagttg cacgtactcg cgggccacgc 6300
acttccactc ggggaacacg gtggtgcgct cgtctgggat caggcgcacc ctccagccgc 6360
ggttgtgcag ggtgaccatg tcgacgctgg tggcgacctc accgcgcaga cgctcgttgg 6420
tccagcagag gcggccgccc ttgcgcgagc agaagggggg tagggggtcc agctggtcct 6480
cgtttggggg gtccgcgtcg atggtaaaga ccccggggag caggcgcggg tcaaagtagt 6540
cgatcttgca agcttgcatg tccagagccc gctgccattc gcgggcggcg agcgcgcgct 6600
cgtaggggtt gaggggcggg ccccagggca tggggtgggt gagcgcggag gcgtacatgc 6660
cgcagatgtc atacacgtac aggggttccc tgaggatacc gaggtaggtg gggtagcagc 6720
gccccccgcg gatgctggcg cgcacgtagt catagagctc gtgggagggg gccagcatgt 6780
tgggcccgag gttggtgcgc tgggggcgct cggcgcggaa gacgatctgc ctgaagatgg 6840
cgtgggagtt ggaggagatg gtgggccgct ggaagacgtt gaagcttgct tcttgcaagc 6900
ccacggagtc cctgacgaag gaggcgtagg actcgcgcag cttgtgcacc agctcggcgg 6960
tgacctggac gtcgagcgca cagtagtcga gggtctcgcg gatgatgtca tacctatcct 7020
cccccttctt tttccacagc tcgcggttga ggacgaactc ttcgcggtct ttccagtact 7080
cttggagggg aaacccgtcc gtgtccgaac ggtaagagcc tagcatgtag aactggttga 7140
cggcctggta ggggcagcag cccttctcca cgggcagcgc gtaggcctgc gccgccttgc 7200
ggagggaggt gtgggtgagg gcgaaagtgt ccctgaccat gactttgagg tattgatgtc 7260
tgaagtctgt gtcatcgcag ccgccctgtt cccacagggt gtagtccgtg cgctttttgg 7320
agcgcgggtt gggcagggag aaggtgaggt cattgaagag gatcttcccc gctcgaggca 7380
tgaagtttct ggtgatgcga aagggccctg ggaccgagga gcggttgttg atgacctggg 7440
cggccaggac gatctcgtca aagccgttta tgttgtgtcc cacgatgtag agctccagga 7500
agcggggctg gcccttgatg gaggggagct ttttaagttc ctcgtaggta agctcctcgg 7560
gcgattccag gccgtgctcc tccagggccc agtcttgcaa gtgagggttg gccgccagga 7620
aggatcgcca gaggtcgcgg gccatgaggg tctgcaggcg gtcgcggaag gttctgaact 7680
gccgccccac ggccattttt tcgggggtga tgcagtagaa ggtgaggggg tctttctccc 7740
aggggtccca tctgagctct cgggcgaggt cgcgcgcggc agcgaccaga gcctcgtcgc 7800
cccccagttt catgaccagc atgaagggca cgagttgctt gccaaaggct cccatccaag 7860
tgtaggtttc tacatcgtag gtgacaaaga ggcgctccgt gcgaggatga gagccgattg 7920
ggaagaactg gatctcccgc caccagttgg aggattggct gttgatgtgg tgaaagtaga 7980
agtcccgtct gcgggccgag cactcgtgct ggcttttgta aaagcgaccg cagtactggc 8040
agcgctgcac gggttgtata tcttgcacga ggtgaacctg gcgacctctg acgaggaagc 8100
gcagcgggaa tctaagtccc ccgcctgggg tcccgtgtgg ctggtggtct tttactttgg 8160
ttgtctggcc gccagcatct gtctcctgga gggcgatggt ggaacagacc accacgccgc 8220
gagagccgca ggtccagatc tcggcgctcg gcgggcggag tttgatgacg acatcgcgca 8280
cattggagct gtccatggtc tccagctccc gcggcggcag gtcagccggg agttcctgga 8340
ggttcacctc gcagagacgg gtcaaggcgc ggacagtgtt gagatggtat ctgatttcaa 8400
ggggcatgtt ggaggcggag tcgatggctt gcaggaggcc gcagccccgg ggggccacga 8460
tggttccccg cggggcgcga ggggaggcgg aagctggggg tgtgttcaga agcggtgacg 8520
cgggcgggcc cccggaggta gggggggttc cggccccaca ggcatgggcg gcaggggcac 8580
gtcttcgccg cgcgcgggca ggggctggtg ctggctccga agagcgcttg cgtgcgcgac 8640
gacgcgacgg ttggtgtcct gtatctggcg cctctgagtg aagaccacgg gtcccgtgac 8700
cttgaacctg aaagagagtt cgacagaatc aatctcggca tcgttgacag cggcctggcg 8760
caggatctcc tgcacgtcgc ccgagttgtc ctggtaggcg atttctgcca tgaactgctc 8820
gatctcttcc tcctggagat ctcctcgtcc ggcgcgctcc acggtggccg ccaggtcgtt 8880
ggagatgcga cccatgagct gcgagaaggc gttgagtccg ccctcgttcc agacccggct 8940
gtagaccacg cccccctcgg cgtcgcgggc gcgcatgacc acctgggcca ggttgagctc 9000
cacgtgtcgc gtgaagacgg cgtagttgcg caggcgctgg aaaaggtagt tcagggtggt 9060
ggcggtgtgc tcggcgacga agaagtacat gacccagcgc cgcaacgtgg attcattgat 9120
gtcccccaag gcctccaggc gctccatggc ctcgtagaag tccacggcga agttgaaaaa 9180
ctgggagttg cgagcggaca cggtcaactc ctcctccaga agacggatga gctcggcgac 9240
agtgtcgcgc acctcgcgct cgaaggccac ggggggcgct tcttcctctt ccacctcttc 9300
ttccatgatt gcttcttctt cttcctcagc cgggacggga gggggcggcg gcgggggagg 9360
ggcgcggcgg cggcggcggc gcaccgggag gcggtcgatg aagcgctcga tcatctcccc 9420
ccgcatgcgg cgcatggtct cggtgacggc gcggccgttc tcccgggggc gcagctcgaa 9480
gacgccgcct ctcatttcgc cgcggggcgg gcggccgtga ggtagcgaga cggcgctgac 9540
tatgcatctt aacaattgct gtgtaggtac gccgccaagg gacctgattg agtccagatc 9600
caccggatcc gaaaaccttt ggaggaaagc gtctatccag tcgcagtcgc aaggtaggct 9660
gagcaccgtg gcgggcgggg gcgggtcggg agagttcctg gcggagatgc tgctgatgat 9720
gtaattaaag taggcggtct tgagaaggcg gatggtggac aggagcacca tgtctttggg 9780
tccggcctgt tggatgcgga ggcggtcggc catgccccag gcctcgttct gacaccggcg 9840
caggtctttg tagtaatctt gcatgagtct ttccaccggc acttcttctc cttcctcttc 9900
ttcatctcgc cggtggtttc tcgcgccgcc catgcgcgtg accccaaagc ccctgagcgg 9960
ctgcagcagg gccaggtcgg cgaccacgcg ctcggccaag atggcctgct gtacctgagt 10020
gagggtcctc tcgaagtcat ccatgtccac gaagcggtgg taggcacccg tgttgatggt 10080
gtaggtgcag ttggccatga cggaccagtt gacggtctgg tgtcccggct gcgagagctc 10140
cgtgtaccgc aggcgcgaga aggcgcggga atcgaacacg tagtcgttgc aagtccgcac 10200
cagatactgg tagcccacca ggaagtgcgg cggaggttgg cgatagaggg gccagcgctg 10260
ggtggcgggg gcgccgggcg ccaggtcttc cagcatgagg cggtggtatc cgtagatgta 10320
cctggacatc caggtgatgc ctgcggcggt ggtggtggcg cgcgcgtagt cgcggacccg 10380
gttccagatg tttcgcaggg gcgagaagtg ttccatggtc ggcacgctct ggccggtgag 10440
gcgcgcgcag tcgttgacgc tctatacaca cacaaaaacg aaagcgttta cagggctttc 10500
gttctgtagc ctggaggaaa gtaaatgggt tgggttgcgg tgtgccccgg ttcgagacca 10560
agctgagctc agccggctga agccgcagct aacgtggtat tggcagtccc gtctcgaccc 10620
aggccctgta tcctccagga tacggtcgag agcccttttg ctttcttggc caagcgcccg 10680
tggcgcgatc tgggatagat ggtcgcgatg agaggacaaa agcggctcgc ttccgtagtc 10740
tggagaaaca atcgccaggg ttgcgttgcg gcgtaccccg gttcgagccc ctatggcggc 10800
ttggatcggc cggaaccgcg gctaacgtgg gctgtggcag ccccgtcctc aggaccccgc 10860
cagccgactt ctccagttac gggagcgagc cccttttgtt tttttatttt ttagatgcat 10920
cccgtgctgc ggcagatgcg cccctcgccc cggcccgatc agcagcagca acagcaggca 10980
tgcagacccc cctctcctct ccccgccccg gtcaccacgg ccgcggcggc cgtgtccggt 11040
gcggggggcg cgctggagtc agatgagcca ccgcggcggc gacctaggca gtatctggac 11100
ttggaagagg gcgagggact ggcgcggctg ggggcgagct ctccagagcg ccacccgcgg 11160
gtgcagttga aaagggacgc gcgtgaggcg tacctgccgc ggcaaaacct gtttcgcgac 11220
cgcgggggcg aggagcccga ggagatgcgg gactgcaggt tccaagcggg gcgcgagctg 11280
cgccgcggct tggacagaca gcgcctgctg cgcgaggagg actttgagcc cgacacgcag 11340
acgggcatca gccccgcgcg cgcgcacgtg gccgcggccg acctggtgac cgcctacgag 11400
cagacggtga accaggagcg caacttccaa aaaagcttca acaaccacgt gcgcacgctg 11460
gtggcgcgcg aggaggtgac cctgggtctc atgcatctgt gggacctggt ggaggcgatc 11520
gtgcagaacc ccagcagcaa gcccctgacc gcgcagctgt tcctggtggt gcagcacagc 11580
agggacaacg aggccttcag ggaggcgctg ctgaacatca ccgagccgga ggggcgctgg 11640
ctcctggacc tgataaacat cctgcagagc atagtggtgc aggagcgcag cctgagcctg 11700
gccgagaagg tggcggccat taactattct atgctgagcc tgggcaagtt ctacgctcgc 11760
aagatctaca agacccccta cgtgcccata gacaaggagg tgaagataga cagcttctac 11820
atgcgcatgg cgctgaaggt gctaaccctg agcgacgacc tgggagtgta ccgcaacgag 11880
cgcatccaca aggccgtgag cgccagccgg cggcgcgagc tgagcgaccg cgaactgatg 11940
cacagtctgc agcgcgcgct gaccggcgcg ggcgagggcg acagggaggt cgagtcctac 12000
tttgacatgg gggccgacct gcactggcag ccgagccgcc gcgccctgga agcggcgggg 12060
gcgtacggcg gccccctggc ggccgatgac gaggaagagg aggactatga gctagaggag 12120
ggcgagtacc tggaggactg acctggctgg tggtgttttg gtatagatgc aagatccgaa 12180
cgtggcggac ccggcggtcc gggcggcgct gcagagccag ccgtccggca ttaactcctc 12240
tgacgactgg gccgcggcca tgggtcgcat catggccctg accgcgcgca accccgaggc 12300
cttcaggcag cagcctcagg ctaaccggct ggcggccatc ttggaagcgg tagtgcccgc 12360
gcgctccaac cccacccacg agaaggtgct ggccatagtc aacgcgctgg cggagagcag 12420
ggccatccgg gcagacgagg ccggactggt gtacgatgcg ctgctgcagc gggtggcgcg 12480
gtacaacagc ggcaacgtgc agaccaacct ggaccgcctg gtgacggacg tgcgcgaggc 12540
cgtggcgcag cgcgagcgct tgcatcagga cggcaacctg ggctcgctgg tggcgctaaa 12600
cgccttcctt agcacccagc cggccaacgt accgcggggg caggaggact acaccaactt 12660
cttgagcgcg ctgcggctga tggtgaccga ggtccctcag agcgaggtgt accagtcggg 12720
gcccgactac ttcttccaga ccagcagaca gggcttgcaa accgtgaacc tgagccaggc 12780
tttcaagaac ctgcgggggc tgtggggagt gaaggcgccc accggcgacc gggctacggt 12840
gtccagcctg ctaaccccca actcgcgcct gctgctgctg ctgatcgcgc ccttcacgga 12900
cagcgggagc gtctcgcggg agacctatct gggccacctg ctgacgctgt accgcgaggc 12960
catcgggcag gcgcaggtgg acgagcacac cttccaggag atcaccagcg tgagccacgc 13020
gctggggcag gaggacacgg gcagcctgca ggcgaccctg aactacctgc tgaccaacag 13080
gcggcagaag attcccacgc tgcacagcct gacccaggag gaggagcgca tcttgcgcta 13140
cgtgcagcag agcgtgagcc tgaacctgat gcgcgacggc gtgacgccca gcgtggcgct 13200
ggacatgacc gcgcgcaaca tggaaccggg catgtacgct tcccagcggc cgttcatcaa 13260
ccgcctgatg gactacttgc atcgggcggc ggccgtgaac cccgagtact tcaccaatgc 13320
cattctgaat ccccactgga tgccccctcc gggtttctac aacggggact tcgaggtgcc 13380
tgaggtcaac gatgggttcc tctgggatga catggatgac agtgtgttct cccccaaccc 13440
gctgcgcgcc gcgtctctgc gattgaagga gggctctgac agggaaggac caaggagtct 13500
ggcctcctcc ctggctctgg gggcggtggg cgccacgggc gcggcggcgc ggggcagcag 13560
ccccttcccc agcctggcgg actctctgaa tagcgggcgg gtgagcaggc cccgcttgct 13620
aggcgaggag gagtatctga acaactccct gctgcagccc gtgagggaca aaaacgctca 13680
gcggcagcag tttcccaaca atgggataga gagcctggtg gacaagatgt ccagatggaa 13740
gacgtatgcg caggagtaca aggagtggga ggaccgccag ccgcggcccc tgccgccccc 13800
tagacagcgc tggcagcggc gcgcgtccaa ccgccgctgg aggcaggggc ccgaggacga 13860
tgatgactct gcagatgaca gcagcgtgtt ggacctgggc gggagcggga accccttttc 13920
gcacctgcgc ccacgcctgg gcaagatgtt ttaaaagaga aaaataaaaa ctcaccaagg 13980
ccatggcgac gagcgttggt tttttgttcc cttccttagt atgcggcgcg cggcgatgtt 14040
cgaggagggg cctcccccct cttacgagag cgcgatggga atttctcctg cggcgcccct 14100
gcagcctccc tacgtgcctc ctcggtacct gcaacctaca ggggggagaa atagcatctg 14160
ttactctgag ctgcagcccc tgtacgatac caccagactg tacctggtgg acaacaagtc 14220
cgcggacgtg gcctccctga actaccagaa cgaccacagc gattttttga ccacggtgat 14280
ccaaaacaac gacttcaccc caaccgaggc cagtacccag accataaacc tggacaacag 14340
gtcgaactgg ggcggcgacc tgaagactat cctgcacacc aatatgccca acgtgaacga 14400
gttcatgttc accaactctt ttaaggcgcg ggtgatggtg gcgcgcgagc agggggaggc 14460
gaagtacgag tgggtggact tcacgctgcc cgagggcaac tactcagaga ccatgactct 14520
cgacctgatg aacaatgcga tcgtggaaca ctatctgaaa gtgggcaggc agaacggggt 14580
gaaggagagc gatatcgggg tcaagtttga caccagaaac ttccgtctgg gctgggaccc 14640
tgtgaccggg ctggtcatgc cgggggtcta caccaacgag gcctttcatc ccgatatagt 14700
gctcctgccc ggctgtgggg tggacttcac ccagagccgg ctgagcaacc tgctgggcgt 14760
tcgcaagcgg caacctttcc aggagggttt caagatcacc tatgaggatc tggagggggg 14820
caacattccc gcgctccttg atctggacgc ctacgaggag agcttgaaac ccgaggagag 14880
cgctggcgac agcggcgaga gtggcgagga gcaagccggc ggcggcggca gcgcgtcggt 14940
agaaaacgaa agtactcccg cagtggcggc ggacgctgcg gaggtcgagc cggaggccat 15000
gcagcaggac gcagaggagg gcgcgcagga ggacatgaac aatggggaga tcaggggcga 15060
cactttcgcc acccggggcg aagaaaaaga ggcagaggcg gcggcggcga cggcggaagc 15120
cgaaaccgag gcagaggcag agcccgagac cgaagttatg gaagacatga atgatggaga 15180
acgtaggggt gacacgtttg ccacccgggg cgaagagaag gcggcggagg cagaagccgc 15240
ggctgaggag gcggctgcgg ctgcggccaa ggctgaggct gcggctgagg ctaaggtcga 15300
agccgatgtt gcggttgagg ctcaggctga ggaggaggcg gcggctgaag cagttaagga 15360
aaaggcccag gcagagcagg aagagaaaaa acctgtcatt caacctctaa aagaagatag 15420
caaaaagcgc agttacaacg tcattgaggg cagcaccttt acccaatacc gcagctggta 15480
cctggcttac aactacggcg acccggtcaa gggggtgcgc tcgtggaccc tgctctgcac 15540
gccggacgtc acctgcggct ccgagcagat gtactggtcg ctgccaaaca tgatgcaaga 15600
cccggtgacc ttccgttcca cgcggcaggt tagcaacttt ccggtggtgg gcgccgaact 15660
gctgccagta cactccaaga gtttttacaa cgagcaggcc gtctactccc agctgatccg 15720
ccaggccacc tctctgaccc acgtgttcaa tcgctttccc gagaaccaga ttttggcgcg 15780
cccgccggcc cccaccatca ccaccgtcag tgaaaacgtt cctgccctca cagatcacgg 15840
gacgctaccg ctgcgcaaca gcatctcagg agtccagcga gtgaccatta ctgacgccag 15900
acgccggacc tgcccctacg tttacaaggc cttgggcata gtctcgccgc gcgtcctctc 15960
cagtcgcact ttttaaaaca catccaccca cacgctccaa aatcatgtcc gtactcatct 16020
cgcccagcaa caacaccggc tgggggctgc gcgcacccag caagatgttt ggaggggcaa 16080
ggaagcgctc cgaccagcac cccgtgcgcg tgcgcggcca ctaccgcgcg ccctggggtg 16140
cgcacaagcg cgggcgcaca gggcgcacca ctgtggatga tgtcattgac tccgtagtgg 16200
agcaggcgcg ccactacaca cccggcgcgc cgaccgcctc cgccgtgtcc accgtggacc 16260
aggcgatcga aagcgtggta cagggggcgc ggcactatgc caaccttaaa agtcgccgcc 16320
gccgcgtggc gcgccgccat cgccggagac cccgggctac tgccgccgcg cgccttacca 16380
aggctctgct caagcgcgcc aggcgaactg gccaccgggc cgccatgagg gccgcacggc 16440
gggctgccgc tgccgcgagc gccgtggccc cgcgggcacg aaggcgcgcg gccgctgccg 16500
ccgccgccgc catttccagc ttggcctcga cgcggcgcgg taacatatac tgggtgcgcg 16560
actcggtgag cggcacacgt gtgcccgtgc gctttcgccc cccacggaat tagcacaaga 16620
caacatacac actgagtctc ctgctgttgt gtatcccagc ggcgaccgtc agcagcggcg 16680
acatgtccaa gcgcaaaatt aaagaagaga tgctccaggt catcgcgccg gagatctatg 16740
ggcccccgaa gaaggaggag gaggattaca agccccgcaa gctaaagcgg gtcaaaaaga 16800
aaaagaaaga tgatgacgtt gacgaggcgg tggagtttgt ccgccgcatg gcgcccaggc 16860
gccctgtgca gtggaagggt cggcgcgtgc agcgagtcct gcgccccggc accgcggtgg 16920
tctttacgcc cggcgagcgt tccacgcgca ctttcaagcg ggtgtacgat gaggtgtacg 16980
gcgacgagga tctgttggag caggccaacc atcgatttgg ggagtttgca tatgggaaac 17040
ggcctcgcga gagtctaaaa gaggacctgc tggcgctacc gctggacgag ggcaatccca 17100
ccccgagtct gaagccggtg accctgcaac aggtgctgcc tttgagcgcg cccagcgagc 17160
agaagcgagg gttaaagcgc gagggcgggg acctggcacc caccgtgcag ttgatggtgc 17220
ccaagcggca gaagctggag gacgtgctgg agaaaatgaa agtagagccc gggatccagc 17280
ccgagatcaa ggtccgccct atcaagcagg tggcgcccgg cgtgggagtc cagaccgtgg 17340
acgttaggat tcccacggag gagatggaaa cccaaaccgc cactccctct tcggcagcaa 17400
gcgccaccac cggcgccgct tcggtagagg tgcagacgga cccctggcta cccgccgcca 17460
ctatcgccgt cgccgccgcc ccccgttcgc gcggacgcaa gagaaattat ccagcggcca 17520
gcgcgcttat gccccagtat gcgctgcatc catccatcgc gcccaccccc ggctaccgcg 17580
ggtactcgta ccgcccgcgc agatcagccg gcactcgcgg ccgccgccgc cgtgcgacca 17640
caaccagccg ccgccgtcgc cgccgccgcc agccagtgct gacccccgtg tctgtaagga 17700
aggtggctcg ctcggggagc acgctggtgg tgcccagagc gcgctaccac cccagcatcg 17760
tttaaagccg gtctctgtat ggttcttgca gatatggccc tcacttgtcg ccttcgcttc 17820
ccggtgccgg gataccgagg aagaactcac cgccgcaggg gcatggcggg cagcggtctc 17880
cgcggcggcc gtcgccatcg ccggcgcgca aagagcaggc gcatgcgcgg cggtgtgttg 17940
cccctgctgg tcccgctact cgccgcggcg atcggcgccg tgcccgggat cgcctccgtg 18000
gccctgcagg cgtcccagaa acattgactc ttgcaacctt gcaagcttgc atttttggag 18060
gaaaaaataa aaaagtctag actctcacgc tcgcttggtc ctgtgactat tttgtagaaa 18120
aaagatggaa gacatcaact ttgcgtcgct ggccccgcgt cacggctcgc gcccgttcat 18180
gggagactgg acagatatcg gcaccagcaa tatgagcggt ggcgccttca gctggggcag 18240
tctgtggagc ggccttaaaa attttggttc caccattaag aactatggca acaaagcgtg 18300
gaacagcagc acgggtcaga tgctgagaga caagttgaaa gagcagaact tccaggagaa 18360
ggtggcgcag ggcctggcct ctggcatcag cggggtggtg gacatagcta accaggccgt 18420
gcagaaaaag ataaacagtc atctggaccc ccgccctcag gtggaggaaa cgcctccagc 18480
catggagacg gtgtctcccg agggcaaagg cgaaaagcgc ccgcggcccg acagggaaga 18540
gaccctggtg tcacacaccg aggagccgcc ctcttacgag gaggcagtca aggccggcct 18600
gcccaccact cgccccatag ctcccatggc caccggtgtg gtgggtcaca ggcaacacac 18660
ccccgcaaca ctagatctgc ccccgccgtc cgagccgact cgccagccaa aggcggtgac 18720
ggtgtccgct ccctccactt ccgccgccaa cagagtgcct ctgcgccgcg ctgcgagcgg 18780
cccccgggcc tcgcgagtca gcggcaactg gcagagcaca ctgaacagca tcgtgggcct 18840
gggagtgagg agtgtgaagc gccgccgttg ctactgaatg agcaagctag ctaacgtgtt 18900
gtatgtgtgt atgcgtccta tgtcgccgcc agaggagctg ttgagccgcc ggcgccgtct 18960
gcactccagc gaatttcaag atggcgaccc catcgatgat gcctcagtgg tcgtacatgc 19020
acatctcggg ccaggacgct tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg 19080
ccacagacac ctacttcaac atgagtaaca agttcaggaa ccccactgtg gcgcccaccc 19140
acgatgtgac cacggaccgg tcgcagcgcc tgacgctgcg gttcatcccc gtggatcggg 19200
aggacaccgc ttactcttac aaggcgcggt tcacgctggc cgtgggcgac aaccgcgtgc 19260
tggacatggc ctccacttac tttgacatcc ggggggtgct ggacaggggc cccactttta 19320
agccctactc gggcactgcc tacaaccccc tggcccccaa gggcgccccc aattcttgtg 19380
agtgggaaca agaggaaaat caggtggtcg ctgcagatga tgaacttgaa gatgaagaag 19440
cgcaagcaca agaggaagcc cctgtgaaaa aaattcatgt atatgctcag gcgcctcttt 19500
ctggcgaaaa gatttccaag gatggtatcc aaataggtac tgaagtcgta ggagatacat 19560
ctaaggacac ttttgcagat aaaacattcc aacccgaacc tcagataggc gagtctcagt 19620
ggaacgaggc tgatgccaca gcagcaggag gtagagtttt gaaaaagact acccctatga 19680
gaccttgcta tggatcctat gccaggccta ccaatgccaa cgggggtcaa ggaattatgg 19740
ttgccaatga acaaggagtg ttggagtcta aagtagaaat gcaatttttc tctaacacca 19800
caacccttaa tgcgcgggat ggaaccggca atcccgaacc aaaggtggtg ttgtacagcg 19860
aagatgtcca cttggaatct cccgatactc atctgtctta caagcccaaa aaggatgatg 19920
ttaatgccaa aatcatgttg ggtcagcaag ccatgcccaa cagacccaac ctcattggat 19980
ttagagataa tttcattggg cttatgtttt acaacagcac cggtaacatg ggagtgctgg 20040
cgggtcaggc ctctcagttg aatgctgtgg tggacttgca ggatagaaac acagaactgt 20100
catatcagct tctgcttgat tcaattgggg atagaaccag atacttctcc atgtggaacc 20160
aggcagtgga tagctatgat ccagatgtca gaattattga aaaccatggg actgaggatg 20220
aactgcccaa ctactgcttc cctttgggcg gcataggagt tactgatact tatcaaggga 20280
taaaaaatac caatggcaat ggtcagtgga ccaaagatga tcagttcgcg gaccgcaacg 20340
aaataggggt gggaaacaac ttcgccatgg agatcaacat ccaggccaac ctttggagaa 20400
acttcctcta tgcaaacgtg gggctctacc tgccagacaa gctcaagtac aaccccacca 20460
acgtggacat ctctgacaac cccaacacct atgactacat gaacaagcgg gtggtggccc 20520
ctggcctggt ggactgcttt gtcaatgtgg gagccaggtg gtccctggac tacatggaca 20580
acgtcaaccc cttcaaccac caccgcaatg cgggtctgcg ctaccgctcc atgatcctgg 20640
gcaacgggcg ctatgtgccc tttcacatcc aggtacccca gaagttcttt gccatcaaga 20700
acctcctgct cctgcccggc tcctacacct acgagtggaa cttcaggaag gatgtgaaca 20760
tggtcctaca gagctctctg ggcaatgacc ttagggtgga tggggccagc atcaagtttg 20820
acagcatcac cctctatgct acatttttcc ccatggccca caacaccgcc tccacgcttg 20880
aggccatgct gagaaacgac accaacgacc agtcctttaa tgactacctc tctggggcca 20940
acatgctcta cccaatccca gccaaggcca ccaacgtgcc catctccatc ccctctcgca 21000
actgggccgc ctttagaggc tgggccttta cccgccttaa gaccaaggag accccctccc 21060
tgggctcggg ttttgatccc tactttgttt actcgggatc catcccctac ctggatggca 21120
ccttctacct caaccacact ttcaagaaga tatccatcat gtatgactcc tccgtcagct 21180
ggccgggcaa cgaccgcttg ctcaccccca atgagttcga ggtcaagcgc gccgtggacg 21240
gcgagggcta caacgtggcc cagtgcaaca tgaccaagga ctggttcctg gtgcagatgc 21300
tggccaacta caacataggc taccagggct tttacatccc agagagctac aaggacagga 21360
tgtactcctt cttcagaaat ttccaaccca tgagccgaca ggtggtggac gagaccaatt 21420
acaaggacta tcaagccatt ggcatcaccc accagcacaa caactcgggt ttcgtgggct 21480
acctggcgcc caccatgcgc gagggtcagg cctaccccgc caacttcccc taccccttga 21540
taggcaagac cgcggtcgac agcgtcaccc agaaaaagtt cctctgcgac cgcaccctct 21600
ggcgcatccc cttctctagc aacttcatgt ccatgggtgc gctcacggac ctgggccaaa 21660
acctgcttta tgccaactct gcccatgcgc tggacatgac ttttgaggtg gaccccatgg 21720
acgagcccac ccttctctat attgtgtttg aagtgttcga cgtggtcaga gtgcaccagc 21780
cgcaccgcgg tgtcatcgag accgtgtacc tgcgtacgcc cttctcagcc ggcaacgcca 21840
ccacctaagg agacagcgcc gccgccgcct gcatgacggg ttccaccgag caagagctca 21900
gggccattgc cagagacctg ggatgcggac cctatttttt gggcacctat gacaaacgct 21960
tcccgggctt tatctcccga gacaagctcg cctgcgccat tgtcaacacg gccgcgcgcg 22020
agaccggggg cgtgcactgg ctggcctttg gctgggaccc gcgctccaaa acttgctacc 22080
tctttgaccc ctttggcttc tccgatcagc gcctcaggca gatttatgag tttgagtacg 22140
aggggctgct gcgccgcagc gcgctcgcct cctcgcccga ccgctgcatc acccttgaga 22200
agtccaccga aaccgtgcag gggccccact cggccgcctg cggtctcttc tgttgcatgt 22260
ttttgcacgc ctttgtgcac tggcctcaga gtcccatgga ttgcaacccc accatgaact 22320
tgctaaaggg agtgcccaac gccatgctcc agagccccca ggtccagccc accctgcgcc 22380
gcaaccagga acagctttac cgcttcctgg agcgccactc cccctacttc cgcagccaca 22440
gcgcgcgcat ccggggggcc acctcttttt gccacttgca agaaaacatg caagacggaa 22500
aatgatgtac agcatgcttt taataaatgt aaagactgtg cactttaatt atacacgggc 22560
tctttctggt tatttattca acaccgccgt cgccatttag aaatcgaaag ggttctgccg 22620
tgcgtcgccg tgcgccacgg gcagagacac gttgcgatac tggaagcggc tcgcccactt 22680
gaactcgggc accaccatgc ggggcagtgg ttcctcgggg aagttctcgc tccacagggt 22740
gcgggtcagc tgcagcgcgc tcaggaggtc gggagccgag atcttgaagt cgcagttggg 22800
gccggaaccc tgcgcgcgcg agttgcggta cacggggttg cagcactgga acaccagcag 22860
ggccggatta ttcacgctgg ccagcaggct ctcgtcgctg atcatgtcgc tgtccagatc 22920
ctccgcgttg ctcagggcga atggggtcat cttgcagacc tgcctgccca ggaaaggcgg 22980
gagcccaggc ttgccgttgc agtcgcagcg caggggcatt agcaggtgcc cacggcccga 23040
ctgcgcctgc gggtacaacg cgcgcatgaa ggcttcgatc tgcctaaaag ccacctgggt 23100
cttggctccc tccgaaaaga acatcccaca ggacttgctg gagaactggt tcgcgggaca 23160
gctggcatcg tgcaggcagc agcgcgcgtc agtgttggca atctgcacca cgttgcgacc 23220
ccaccggttt ttcactatct tggccttgga agcctgctcc tttagcgcgc gctggccgtt 23280
ctcgctggtc acatccatct ctatcacctg ttccttgttg atcatgtttg tcccgtgcag 23340
acactttagg tcgccctccg tctgggtgca gcggtgctcc cacagcgcgc aaccggtggg 23400
ctcccaattc ttgtgggtca cccccgcgta ggcctgcagg taggcctgca ggaagcgccc 23460
catcatggtc ataaaggtct tctggctcgt aaaggtcagc tgcaggccgc gatgctcttc 23520
gttcagccag gtcttgcaga tggcggccag cgcctcggtc tgctcgggca gcatcttaaa 23580
atttgtcttc aggtcgttat ccacgtggta cttgtccatc atggcacgcg ccgcctccat 23640
gcccttctcc caggcggaca ccatgggcag gcttaggggg tttatcactt ccagcggcga 23700
ggacaccgta ctttcgattt cttcttcctc cccctcttcc cggcgcgcgc ccccgctgtt 23760
gcgcgctctt accgcctgca ccaaggggtc gtcttcaggc aagcgccgca ccgagcgctt 23820
gccgcccttg acctgcttga tcagtaccgg cgggttgctg aagcccacca tggtcagcgc 23880
cgcctgctct tcttcgtctt cgctgtctac cactatttct ggggaggggc ttctccgctc 23940
tgcggcaaag gcggcggatc gcttcttttt tttcttggga gccgccgcga tggagtccgc 24000
cacggcgacc gaggtcgagg gcgtggggct gggggtgcgc ggtaccaggg cctcgtcgcc 24060
ctcggactct tcctctgact ccaggcggcg gcggagtcgc ttctttgggg gcgcgcgcgt 24120
cagcggcggc ggagacgggg acggggacgg ggacgggacg ccctccacag ggggtggtct 24180
tcgcgcagac ccgcggccgc gctcgggggt cttctcgcgc tggtcttggt cccgactggc 24240
cattgtatcc tcctcctcct aggcagagag acataaggag tctatcatgc aagtcgagaa 24300
ggaggagagc ttaaccaccc cctcagagac cgccgatgcg cccgccgtcg ccgtcgcccc 24360
cgctaccgcc gacgcgcccg ccacaccgag cgacaccccc acggaccccc ccgccgacgc 24420
acccctgttc gaggaagcgg ccgtggagca ggacccgggc tttgtctcgg cagaggagga 24480
tttgcaagag gaggagaata aggaggagaa gccctcagtg ccaaaagatc ataaagagca 24540
agacgagcac gacgcagacg cacaccaggg tgaagtcggg cggggggacg gagggcatgg 24600
cggcgccgac tacctagacg aaggaaacga cgtgctcttg aagcacctgc atcgtcagtg 24660
cgccatcgtc tgcgacgctc tgcaggagcg cagcgaggtg cccctcagcg tggcggaggt 24720
cagccgcgcc tacgagctca gcctcttttc cccccgggtg cccccccgcc gccgcgaaaa 24780
cggcacatgc gagcccaacc cgcgcctcaa cttctacccc gcctttgtgg tgcccgaggt 24840
cctggccacc tatcacatct tctttcaaaa ttgcaagatc cccatctcgt gccgcgccaa 24900
ccgtagccgc gccgataaga tgctggccct gcgccagggc gaccacatac ctgatatcgc 24960
cgctttggaa gatgtgccaa agatcttcga gggtctgggg cgcaacgaga agcgggcagc 25020
aaactctctg caacaggaaa acagcgaaaa tgagagtcac actggagcgc tggtggagct 25080
ggagggcgac aacgcccgcc tggcggtgct caagcgcagc atcgaggtca cccactttgc 25140
ctaccccgcg ctcaacctgc cccccaaagt catgaacgcg gtcatggacg ggctgatcat 25200
gcgccgcggc cggcccctcg ctccagatgc aaacttgcat gaggagaccg aggacggtca 25260
gcccgtggtc agcgacgagc agctgacgcg ctggctggag agcgcggacc ccgccgaact 25320
ggaggagcgg cgcaagatga tgatggccgc ggtgctggtc accgtagagc tggagtgtct 25380
gcagcgcttc ttcggtgacc ccgagatgca gagaaaggtc gaggagaccc tacactacac 25440
cttccgccag ggctacgtgc gccaggcttg caagatctcc aacgtggagc tcagcaacct 25500
ggtgtcctac ctgggcatct tgcatgaaaa ccgccttggg cagagcgtgc tacactccac 25560
cctgcgcggg gaggcgcgcc gcgactacgt gcgcgactgc gtttacctct tcctctgcta 25620
cacctggcag acggccatgg gggtctggca gcagtgcctg gaggagcgca acctcaagga 25680
gctggagaag cttctgcagc gcgcgctcaa agacctctgg acgggcttca acgagcgctc 25740
ggtggccgcc gcgctagccg acctcatctt ccccgagcgc ctgctcaaaa ccctccagca 25800
ggggctgccc gacttcacca gccaaagcat gttgcaaaat tttaggaact ttatcctgga 25860
gcgttctggc atcctacccg ccacctgctg cgccctgccc agcgactttg tccccctcgt 25920
gtaccgcgag tgccccccgc cgctgtgggg ccactgctac ctgttccaac tggccaacta 25980
cctgtcctac cacgcggacc tcatggagga ctccagcggc gaggggctca tggagtgcca 26040
ctgccgctgc aacctctgca cgccccaccg ctccctggtc tgcaacaccc aactgctcag 26100
cgagagtcag attatcggta ccttcgagct acagggtccg tcctcctcag acgagaagtc 26160
cgcggctccg gggctaaaac tcactccggg gctgtggact tccgcctacc tgcgcaaatt 26220
tgtacctgaa gactaccacg cccacgaaat caggttttac gaggaccaat cccgcccgcc 26280
caaggcggag ctgaccgcct gcgtcatcac ccagggcgag atcctaggcc aattgcaagc 26340
catccaaaaa gcccgccaag agtttttgct gaagaggggt cggggggtgt atctggaccc 26400
ccagtcgggt gaggagctca acccggttcc cccgctgcca ccgccgcggg accttgcttc 26460
ccaggataag catcgccatg gctcccagaa agaagcagca gcggccgccg ctgccgccgc 26520
cccacatgct ggaggaagag gaggaatact gggacagtca ggcagaggag gtttcggacg 26580
aggaggagcc ggagacggag atggaagagt gggaggagga cagcttagac gaggaggctt 26640
ccgaagccga agaggcaggc gcaacaccgt caccctcggc cgcagccccc tcgcaggcgc 26700
ccccgaagtc cgctcccagc atcagcagca acagcagcgc tataacctcc gctcctccac 26760
cgccgcgacc cacggccgac cgcagaccca accgtagatg ggacaccacc ggaaccgggg 26820
ccggtaagtc ctccgggaga ggcaagcaag cgcagcgcca aggctaccgc tcgtggcgcg 26880
ctcacaagaa cgccatagtc gcttgcttgc aagactgcgg ggggaacatc tccttcgccc 26940
gccgcttcct gctcttccac cacggtgtgg ccttcccccg taacgtcctg cattactacc 27000
gtcatctcta cagcccctac tgcggcggca gtgagccaga ggcggccagc ggcggcggcg 27060
cccgtttcgg tgcctaggaa gacccagggc aagacttcag ccaagaaact cgcggcgacc 27120
gcggcgaacg cggtcgcggg ggccctgcgc ctgacggtga acgaacccct gtcgacccgc 27180
gaactgagga accgaatctt ccccactctc tatgccatct tccagcagag cagagggcag 27240
gatcaggaac tgaaagtaaa aaacaggtct ctgcgctccc tcacccgcag ctgtctgtat 27300
cacaagagcg aagaccagct tcggcgcacg ctggaggacg ctgaggcact cttcagcaaa 27360
tactgcgcgc tcactcttaa ggactagctc cgcgcccttc tcgaatttag gcgggaacgc 27420
ctacgtcatc gcagcgccgc cgtcatgagc aaggacattc ccacgccata catgtggagc 27480
tatcagccgc agatgggact cgcggcgggc gcctcccaag actactccac ccgcatgaac 27540
tggctcagtg ccggcccaca catgatctca caggttaatg acatccgcac ccatcgaaac 27600
caaatattgg tgaagcaggc ggcaattacc accacgcccc gcaataatcc caaccccagg 27660
gagtggcccg cgtccctggt gtatcaggaa attcccggcc ccaccaccgt actacttccg 27720
cgtgattccc aggccgaagt ccaaatgact aactcagggg cacagctcgc gggcggctgt 27780
cgtcacaggg tgcggcctcc tcgccagggt ataactcacc tggagatccg aggcagaggt 27840
attcagctca acgacgagtc ggtgagctcc tcgctcggtc tcagacctga cgggaccttc 27900
cagatagccg gagccggccg atcttccttc acgccccgcc aggcgtacct gactctgcag 27960
agctcgtcct cggcgccgcg ctcgggcggc atcgggactc tccagttcgt gcaggagttt 28020
gtgccctcgg tctacttcaa ccccttctcg ggctctcccg gtcgctaccc ggaccagttt 28080
atcccgaact ttgacgccgc gagggactcg gtggacggct acgactgaat gtcgggtgga 28140
cccggtgcag agcaacttcg cctgaagcac cttgaccact gccgccgccc tcagtgcttt 28200
gcccgctgtc agaccggtga gttccagtac ttttccctgc ccgactcgca cccggacggc 28260
ccggcgcacg gggtgcgctt tttcatcccg agtcaggtcc gctctaccct aatcagggag 28320
ttcaccgccc gtcccctact ggcggagttg gaaaaggggc cttctatcct aaccattgcc 28380
tgcatttgct ctaaccctgg attacaccaa gatctttgct gtcatttgtg tgctgagtat 28440
aataaaggct gagatcagaa tctactcggg ctcctgtcgc catcctgtca acgccaccgt 28500
ccaagcccgg cccgatcagc ccgaggtgaa cctcacctgt ggtctgcacc ggcgcctgag 28560
gaaataccta gcttggtact acaacagcac tccctttgtg gtttacaaca gctttgacca 28620
ggacggggtc tcactgaggg ataacctctc gaacctgagc tactccatca ggaagaacaa 28680
caccctcgag ctacttcctc cttacctgcc cgggacttac cagtgtgtca ccggcccctg 28740
cacccacacc cacctgttga tcgtaaacga ctctcttccg agaacagacc tcaataactc 28800
ctctccgcag ttccccagaa caggaggtga gctcaggaaa ccccgggtaa agaagggtgg 28860
acaagagtta acacttgtgg ggtttctggt atatgtgacg ctggtggtgg ctcttttgat 28920
taaggctttt ccttccatgt ctgaactatc cctcttcttt tatgaacaac tcgactagtg 28980
ctaacgggac cctacccaac gaatcgggat tgaatatcgg taaccaggtt gcagtttcac 29040
ttttgattac cttcatagtc ctcttcctgc tagtgctgtc gcttctgtgc ctgcggatcg 29100
ggggctgctg catccacgtt tatatctggt gctggctgtt tagaaggttc ggagaccacc 29160
gcaggtagaa taatgctgct taccctcttt gtcctggcgc tggctgccag ctgccaagcc 29220
ttttccgagg ctgacttcat agagccccag tgcaatatca cttataaatc tgaacgtgcc 29280
atctgtacta ttctaatcaa atgtgttact caacacgata aggtgactgt taaatacaaa 29340
gatcaattaa aaaaagacgc actttacagc agctggcaac caggagatga tcaaaaatac 29400
aatgtaaccg tcttccaggg caaactctcc aaaacttaca attacaattt cccatttgag 29460
cagatgtgtg actttgtcat gtacatggaa aagcagtaca agctgtggcc tccaactccc 29520
cagggctgtg tggaaaatcc aggctctttc tgtatgatct ctctctgtgt aactgtgctg 29580
gcactaatac tcacgcttct gtatctcaga tttaaatcaa ggcaaagctt cattgatgaa 29640
aagaaaatgc cataatcgct caacgcttga ttgctaacac cgggttttta tccgcagaat 29700
gattggaatc accctactaa tcacctccct ccttgcgatt gcccatgggt tggaacgaat 29760
cgaagtccct gtgggggcca atgttaccct ggtggggcct gtcggcaatg ctacattaat 29820
gtgggaaaaa tatactaaaa atcaatgggt ttcttactgc actaacaaaa acagccacaa 29880
gcccagagcc atctgcgatg ggcaaaatct aaccttgatt gatgttcaat tgctggatgc 29940
gggctactat tatgggcagc tgggtacaat gattaattac tggagacccc acagagatta 30000
catgcttcac gtagtaaagg gtcccattag cagcccaacc accacctcta ccacacccac 30060
taccaccact actcccacca ccagcactgc cgcccagcct cctcatagca gaacaaccac 30120
ttttatcaat tccaagtccc actcccccca cattgccggc gggccctccg cctcagactc 30180
cgagaccacc gagatctgct tctgcaaatg ctctgacgcc attgcccagg atttggaaga 30240
tcacgaggaa gatgagcatg actacgcaga tgcatgccag gcatcagagg cagaagcgct 30300
accggtggcc ctaaaacagt atgcagactc ccacaccacc cccaaccttc ctccaccttc 30360
ccagaagcca agtttcctgg gggaaaatga aactctgcct ctttccatac tagctctgac 30420
atctgttgct attttggccg ctctgctggt gcttctatgc tctatatgct acctgatctg 30480
ctgcagaaag aaaaaatctc acggccatgc tcaccagccc ctcatgcact tcccttaccc 30540
tccagagctg ggcgaccaca aactttaagt ctgcagtagc tatctgccca tcccttgtca 30600
gtcgacagcg atgagcccca ctaatctaac agcctctgga cttacaacat tgtctcttaa 30660
tgagaccacc gctcctcaag acctgtacga tggtgtctcc gcgctggtta accagtggga 30720
tcacctgggc atatggtggc tcctcatagg agcagtgacc ctgtgcctaa tcctggtctg 30780
gatcatctgc tgcatcaaaa gcagaagacc caggcggcgg cccatctaca ggcccttcgt 30840
catcacacct gaagataatg atgatgatga caccacctcc aggctgcaga gcctaaagca 30900
gctactcttc tcttttacag catggtaaat tgaatcatgc cccgcatttt catctacttg 30960
cttctccttc cactttttct gggctcctct acattggcca ctgtgtccca catcgaggta 31020
gactgcctca cgcccttcac agtctacctg cttttcggct ttgtcatctg cacctttgtc 31080
tgcagcgtta tcactgtagt gatctgcttc atacagtgca tcgactacat ctgtgtgcgg 31140
gtggcctact ttagacacca cccccagtat cgcaacaggg acatagcggc tctcctaaga 31200
cttgtttaaa tcatggccaa attacctgtg attggtcttc tgattatctg ctgcgtccta 31260
gccgcgattg ggactcaacc taataccacc accagcgctc ccagaaagag acatgtatcc 31320
tgcagcttca agcgtccctg gaatataccc caatgcttta ctgatgaacc tgaaatctct 31380
ttggcttggt acttcagcgt caccgccctt ctcatcttct gcagtacggt tattgctctt 31440
gccatctacc cttcccttaa cctgggctgg aatgctgtca actctatgga atatcccacc 31500
ttcccagaac cagacctgcc agacctggtt gttctaaacg cgtttcctcc tcctccagtt 31560
caaaatcagt ttcgccctcc gtcccctacg cccactgagg tcagctactt taatctaaca 31620
ggcggagatg actgaaaacc tagacctaga aatggacggt ctctgcagcg agcaacgcac 31680
actagagagg cgccggcaaa aagcagagct cgagcgtctt aaacaagagc tccaagacgc 31740
cgtggccata caccagtgca aaaaagggct cttctgtctg gtaaaacagg ccacgctcac 31800
ctatgaaaaa acaggtgaca cccaccgcct aggatacaag ctgcccacac agcgccaaaa 31860
gtttgccctt atgataggtg aacaacccat caccgtcacc cagcactccg tggagacaga 31920
aggctgcatt catgctccct gcaggggcgc tgactgcctc tacaccttga tcaaaaccct 31980
ctgcggtctc agagacctta tccctttcaa ttgatcataa ctgtaatcaa taaaaaatca 32040
cttacttgaa atctgatagc aagactctgt ccaatttttt cagcaacact tccttcccct 32100
cctcccaact ctggtactct aggcgcctcc tagctgcaaa cttcctccac agtctgaagg 32160
gaatgtcaga ttcctcctcc tgtccctccg cacccacgat cttcatgttg ttacagatga 32220
aacgcgcgag atcgtctgac gagaccttca accccgtgta cccctacgat accgagatcg 32280
ctccgacttc tgtccctttc cttacccctc cctttgtatc atccgcagga atgcaagaaa 32340
atccagctgg ggtgctgtcc ctgcacctgt cagagcccct taccacccac aatggggccc 32400
tgactctaaa aatggggggc ggcctgaccc tggacaagga agggaatctc acttcccaaa 32460
acatcaccag tgtcgatccc cctctcaaaa aaagcaagaa caacatcagc cttcagaccg 32520
ccgcacccct cgccgtcagc tccggggccc taaccctttt tgccactccc cccctagcgg 32580
tcagtggcga caaccttact gtgcagtctc aggcccctct tactttggaa gactcaaaac 32640
taactctggc caccaaagga cccctaactg tgtccgaagg caaacttgtc ctagaaacag 32700
agcctcccct gcatgcaagt gacagcagta gcctgggcct tagcgtcacg gccccactta 32760
gcattaacaa tgacagccta ggactagaca tgcaagcgcc catcagctct cgagatggaa 32820
aactggctct aacagtggcg gcccccctaa ctgtggccga gggtatcaat gctttggcag 32880
tagccacagg taatggtatt ggactaaatg aaaccaacac acacctgcag gcaaaactgg 32940
tcgcgcccct aggctttgat accaacggca acattaagct aagcgtcgca ggaggcatga 33000
ggctaaacaa taacacactg atactagatg taaactaccc atttgaggct caaggccaac 33060
tgagcctaag agtgggctcg ggcccactat atgtagattc tagtagtcat aacctaacca 33120
ttagatgcct taggggattg tatgtaacat cttctaacaa ccaaaacggt ctagaggcca 33180
acattaaact aacaaaaggc cttgtgtatg acggaaatgc catagcagtt aatgttggca 33240
aagggctgga atacagccct actggcacaa cagaaaaacc tatacagact aaaataggtc 33300
taggcatgga gtatgacact gagggagcca tgatgacaaa actaggctct ggactaagct 33360
ttgacaattc aggagccatt gtggtgggaa acaaaaatga tgacaggctt actttgtgga 33420
ccacaccgga cccatcgccc aactgtcaga tttactctga aaaagatgct aaactaacct 33480
tggtactgac taaatgtggc agtcaggttg taggcacagt atctattgcc gctcttaaag 33540
gtagccttgt gccaatcact agtgcaatca gtgtggttca gatataccta aggtttgatg 33600
aaaatggggt gctgatgagt aactcttcac ttaatggcga atactggaat tttagaaacg 33660
gagactcaac taatggcaca ccatatacaa acgcagtggg ttttatgcct aatctactgg 33720
cctatcctaa aggtcaaact acaactgcaa aaagtaacat tgtcagccag gtctacatga 33780
acggggacga tactaaaccc atgacattta caatcaactt caatggcctt agtgaaacag 33840
gggatacccc tgtcagtaaa tattccatga cattctcatg gaggtggcca aatggaagct 33900
acatagggca caattttgta acaaactcct ttactttctc ctacatcgcc caagaataaa 33960
gaaagcacag agatgcttgt ttttgatttc aaaattgtgt gcttttattt attttcaagc 34020
ttacagtatt tccagtagtc attagaatag agcttaatta aactgcatga gaacccttcc 34080
acatagctta aattatcacc agtgcaaatg gaaaaaaatc aacatacctt tttatccaga 34140
tatcaaagaa ctctagtggt cagttttccc ccaccctccc agctcacaga atacacagtc 34200
ctttcccccc ggctggcttt aaacaacact atctcattgg taacagacat atttttaggt 34260
gtaataatcc acacggtctc ttggcgggcc aaacgctggt ctgtgatgtt aataaactcc 34320
ccaggcagct ctttcaagtt cacgtcgctg tccaactgct gaagcgctcg cggctccgac 34380
tgcgcctcta gcggaggcaa cggcagcacc cgatccttga tctataaagg agtagagtca 34440
taatccccca taagaatagg gcggtgatgc agcaacaagg cgcgcagcaa ctcctgccgc 34500
cgcctctccg tacgacagga atgcaacggg gtggtggtct cctccgcgat aatccgcacc 34560
gctcgcagca tcagcatcct cgtcctccgg gcacagcagc gcatcctgat ctcactgaga 34620
tcggcgcagt aagtgcagca caacaccaag atgttattta agatcccaca gtgcaaagca 34680
ctgtacccaa agctcatggc gggaaggaca gcccccacgt gaccatcgta ccagatcctc 34740
aggtaaatca aatgacgacc tctcataaac acgctggaca tatacatcac ctccttgggc 34800
atgagctgat tcaccacctc tcgataccac aggcatcgct gattaattaa agacccctcg 34860
agcaccatcc tgaaccagga agccagcacc tgaccccccg ccaggcactg cagggacccc 34920
ggtgaatcgc agtggcagtg aagactccag cgctcgtagc cgtgaaccat agagctggtc 34980
attatatcca cattggcaca acacagacac actttcatac actttttcat gattagcagc 35040
tcctctctag tcaagaccat atcccaagga atcacccact cttgaatcaa ggtaaatccc 35100
acacagcagg gcaggcctct cacataactc acgttatgca tagtgagcgt gtcgcaatct 35160
ggaaataccg gatgatcttc catcaccgaa gcccgggtct ccgtctcaaa gggaggtaaa 35220
cggtccctcg tgtagggaca gtggcgggat aatcgagatc gtgttgaacg tagagtcatg 35280
ccaaagggaa cagcggacgt actcatattt cctccagcag aaccaagtgc gcgcgtggca 35340
gctatccctg cgtcttctgt ctcgccgcct gccccgctcg gtgtagtagt tgtaatacag 35400
ccactccctc agaccgtcaa ggcgctccct ggcgtccgga tctataacaa caccgtcctg 35460
cagcgccgcc ctgatgacat ccaccaccgt agagtatgcc aagcccagcc acgaaatgca 35520
ctcactttga cagcgagaga taggaggagc gggaagagat ggaagaacca tgatagtaaa 35580
agaactttta ttccaatcga tcctctacaa tgtcaaagtg tagatctatc agatggcact 35640
ggtctcctcc gctgagtcga tcaaaaataa cagctaaacc acaaacaaca cgattggtca 35700
aatgctgcac aagggcttgc agcataaaat cgcctcgaaa gtccaccgca agcataacat 35760
caaagccacc gcccctatca tgatctatga taaaaacccc acagctatcc accagaccca 35820
tatagttttc atctctccat cgtgaaaaaa tatttacaag ctcctccttt aaatcacctc 35880
caaccaattc aaaaagttga gccagaccgc cctccacctt cattttcagc atgcgcatca 35940
tgattgcaaa aattcaggct cctcagacac ctgtataaga ttgagaagcg gaacgttaac 36000
atcaatgttt cgctcgcgaa gatcgcgcct cagtgcaagc atgatataat cccacaggtc 36060
ggagcggatc agcgaggaca tctccccgcc aggaaccaac tcaacggagc ctatgctgat 36120
tataatacgc atattcgggg ctatgctaac cagcacggcc cccaaatagg cgtactgcat 36180
aggcggcgac aaaaagtgaa cagtttgggt taaaaaatca ggcaaacact cgcgcaaaaa 36240
agcaagaaca tcataaccat gctcatgcaa atagatgcaa gtaagctcag gaacgaccac 36300
agaaaaatgc acaatttttc tctcaaacat gactgcgagc cctgcaaaaa ataaaaaaga 36360
aacattacac aagagtagcc tgtcttacaa tgggatagac tactctaacc aacataagac 36420
gggccacgac atcgcccgcg tggccataaa aaaaattatc cgtgtgatta aaaagaagca 36480
cagatagctg gccagtcata tccggagtca tcacgtgcga acccgtgtag acccccgggt 36540
tggacacatc ggccaaacaa agaaagcggc caatgtatcc cggaggaatg ataacactaa 36600
gacgaagata caacagaata accccatggg ggggaataac aaagttagta ggtgaataaa 36660
aacgataaac acccgaaact ccctcctgcg taggcaaaat agcgccctcc ccttccaaaa 36720
caacatacag cgcttccaca gcagccatga caaaagactc aaaacactca aaagactcag 36780
tcttaccagg aaaataaaag cactctcaca gcaccagcac taatcagagt gtgaagaggg 36840
ccaagtgccg aacgagtata tataggaatt aaaaatgacg taaatgtgta aaggtcaaaa 36900
aacgcccaga aaaatacaca gaccaacgcc cgaaacgaaa acccgcgaaa aaatacccag 36960
aagttcctca acaaccgcca cttccgcttt cccacgatac gtcacttcct caaaaatagc 37020
aaactacatt tcccacatgt acaaaaccaa aacccctccc cttgtcaccg cccacaactt 37080
acataatcac aaacgtcaaa gcctacgtca cccgccccgc ctcgccccgc ccacctcatt 37140
atcatattgg cctcaatcca aaataaggta tattattgat gatg 37184
Claims (27)
- 다음의 단계 (i) 및 (ii)를 포함하는, 유전성 및 산발성 미세-부수체 불안정성(micro-satellite instability: MSI) 암을 포함하는 암을 지니거나, 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료를 위한 범용 MSI 암 백신 펩타이드 수집물(CVP)을 생산하기 위한 프레임-쉬프트 펩타이드의 수집물(CFSP)을 선택하는 방법:
(i) 각각이 프레임-쉬프트 돌연변이(FSM)를 포함하는 핵산의 수집물 (CFSM)을 선택하는 단계로서, 각각의 FSM은 각각의 상이한 환자의 적어도 M개의 암 샘플(CS) 중 하나 이상에 존재하며, 여기서 환자의 암은 MSI 표현형을 지닌 암 세포를 포함하고;
여기서 선택된 FSM의 적어도 50%는 기준 (a), (b), (c) 및 (d)를 충족하는 단계:
(a) FSM은 6개 이상의 뉴클레오타이드의 길이를 지닌 암호화 유전자(coding gene)의 모노뉴클레오타이드 반복체(MNR) 속에 존재함;
(b) FSM은 1개의 뉴클레오타이드의 결실에 해당함;
(c) FSM을 포함한 DNA 서열분석 판독물(DNA sequencing read)의 수는, 매치된 정상 샘플(matched normal sample)과 비교하여 종양 샘플 속에서 유의적으로 더 높음(0.05 이하의 FDR-교정된 피셔 시험(Fisher test) p-값);
(d) FSM은, 매치된 정상 샘플 속에 25% 미만의 대립유전자 빈도로 존재함,
(ii) X개의 상이한 프레임-쉬프트 펩타이드(FSP)를 선택하는 단계로서, 여기서 각각의 선택된 FSP가, FSM이 없는 상응하는 야생형(wt) 핵산의 번역 생성물과 비교하여 상이한 첫 번째 아미노산을 암호화하는 코돈(codon)으로부터 시작되는, 적어도 4개의 아미노산 길이의 CFSM의 FSM을 포함하는 핵산의 단백질-암호화 분절의 완전한 번역 생성물인 단계,
여기서 X는 적어도 20개 또는 적어도 35개이고 M은 적어도 5개이다. - 제1항에 있어서, 선택된 FSP의 적어도 50%가 다음의 기준 (a) 내지 (c) 중 하나 이상을 충족하는 방법:
(a) FSP는 FSM에 의해 암호화되고, 여기서 FSM은 M개의 상이한 CS의 수집물의 부분인 특정 암 유형의 CS 서브세트(subset)에 대해 관찰된 암 유형-특이적인 빈도(CF)로 관찰되고, 상기 CF는 CS 내에 존재하는 암 유형 중 적어도 하나에 대해 적어도 5%임;
(b) FSP를 암호화하는 FSM을 지닌 유전자의 평균 mRNA 발현 수준은, CS 전체에 걸쳐 각각의 단백질-암호화 유전자의 평균 mRNA 발현 값을 설명하는 분포의 상위 80번째 백분위수 이내임; 및
(c) FSP를 생성하는 FSM은 암이 없는 대상체의 집단(cohort) 내의 정상 조직 내에서 2% 미만으로 관찰됨. - 제1항에 있어서, 하기 특징 중 적어도 하나를 갖는, 방법:
(i) CS가 MSI 종양; 결장직장 암, 위암, 및 자궁내막 암 중 하나 이상; 또는 결장직장 암, 위암 및 자궁내막 암을 가진 환자로부터 유래됨;
(ii) M이 적어도 10, 적어도 30, 적어도 50, 적어도 100, 적어도 200, 또는 적어도 300임; 및
(iii) X가 적어도 35, 적어도 50, 적어도 100, 또는 적어도 200임. - 다음의 단계를 포함하는, CVP에 포함된 펩타이드의 아미노산 서열 또는 CVP에 포함된 펩타이드를 암호화하는 핵산 서열을 결정하는 방법:
(a) 제1항 내지 제3항 중 어느 한 항에 따라 선택된 CFSP로부터 적어도 Y개의 FSP 또는 이의 적어도 8개의 아미노산 길이의 단편을 선택하는 단계;
(b) 다음의 기준:
(i) FSP는 길이가 4 내지 9개 아미노산임,
(ii) FSP가, 동일한 FSM에 의해 암호화되는 둘 이상의 FSP 내에 존재하는 8개 이상의 아미노산 길이의 하나 이상의 동일한 연속된 스트레치(stretch)를 함유함, 및
(iii) FSP가 야생형(wt) 사람 단백질 내에 또한 존재하는 8개 이상의 아미노산 길이의 하나 이상의 연속된 스트레치를 함유함
중 하나 이상을 충족하는 FSP 중 하나 이상 또는 모두의 아미노산 서열을 변형시키는 단계로서,
여기서 (i)에 따른 FSP의 아미노산 서열은 FSP의 바로 상부(immediately upstream)에 존재하는 야생형(wt) 아미노산 서열의 1 내지 4개의 아미노산을 FSP의 N-말단에 첨가함으로써 변형되고 여기서 변형된 FSP(mFSP)는 길이가 적어도 8개 아미노산이고; (ii)에 따른 FSP의 아미노산 서열은, 가장 긴 FSP를 제외한 모두에서 이러한 연속된 스트레치를 제거함으로써 변형되며, 단 연속된 스트레치의 제거 후 4개 미만의 아미노산 길이를 지닌 FSP는 CVP로부터 배제되고; (iii)에 따른 FSP의 아미노산 서열은 이러한 스트레치를 제거함으로써 변형되고; 연속된 스트레치의 제거 후 4개 미만의 아미노산의 길이를 지닌 변형된 FSP는 CVP로부터 배제되는, 단계;
여기서 CVP의 아미노산 서열은, 단계 (a)에서 선택되거나 단계 (b)에서 변형된 FSP 또는 이의 단편의 아미노산 서열을 포함하고;
여기서 Y는 적어도 20, 또는 적어도 35이다. - 제4항에 있어서, 단계 (a)에서 CVP의 FSP는 CFSP로부터 연이어 선택되고, 각각의 선택 단계에서, 역치 값(threshold value; TV) 미만인 최대 수의 암 샘플에서 역치 값에 이르도록 총 FSP 아미노산 길이의 누적량(CAFSPL)을 증가시키는 새로운 FSP가 CFSP로부터 선택되고, 임의로, CAFSPL이 여전히 역치 값 미만인 최대 수의 암 샘플에 대한 CAFSPL이 둘 이상의 FSP에 의해 증가할 경우, 최고 점수를 지닌 FSP가 선택되는 방법.
- 제4항에 있어서, 하기 특징 중 적어도 하나를 갖는, 방법:
(i) 각각의 암 샘플에 대한 CAFSPL이, CVP의 이미 일부분인 FSP의 아미노산 길이 및 상응하는 FSM이 상기 암 샘플 속에 존재하는 CFSP로부터의 새로운 FSP의 아미노산 길이를 합함으로써 결정됨;
(ii) 역치 값(threshold value; TV)이 특정 암 유형에 속하는 CS로부터의 샘플의 각각의 서브세트에 대해 별도로 정의됨;
(iii) 점수는, 임의로 CF가 5% 미만인 암 유형으로부터의 CS 내 FSM을 계수함이 없이, FSP의 아미노산 길이와, FSP를 생성하는 FSM이 CS 내에서 관찰되는 전체적인 빈도 사이의 곱(product)으로서 정의됨;
(iv) 암 샘플의 서브세트는 종양 유형으로부터의 모든 암 샘플을 포함하고 여기서 FSM는 5% 이상의 CF로 존재함;
(v) 5% 미만의 전체적인 빈도로 FSM에 의해 생성된 FSP는 선택으로부터 배제됨;
(vi) CVP로의 혼입이 CAFSPL이 여전히 TV 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지 또는 CVP 내에 존재하는 모든 FSP의 누적 길이가 V개 아미노산의 최대 값에 도달할 때까지 새로운 FSP 또는 변형된 FSP의 첨가가 진행됨; 및
(vii) 동일한 FSM으로부터 유래된 FSP는 개개의 FSP의 점수의 합으로서 계산된 합해진(combined) 점수를 지닌 하나의 FSP로서 취급됨. - 제5항에 있어서, CVP 내 혼입이 CAFSPL이 여전히 TV 미만인 임의의 암 샘플의 CAFSPL을 증가시키는 추가의 FSP가 이용가능하지 않을 때까지, 새로운 FSP의 첨가가 진행되거나; 또는
동일한 FSM으로부터 유래된 FSP가 개개의 FSP의 점수의 합으로서 계산된 합해진 점수를 지닌 하나의 FSP로서 취급되는 방법. - 제6항에 있어서,
(a) TV가 적어도 400개 아미노산, 적어도 600개 아미노산, 또는 적어도 800개 아미노산이거나;
(b) TV가:
(i) 결장직장 암 및 위암의 경우 적어도 400개 아미노산, 적어도 600개 아미노산, 또는 적어도 800개 아미노산이고;
(ii) 자궁내막 암의 경우 적어도 200개 아미노산, 적어도 300개 아미노산, 또는 적어도 400개 아미노산인 방법. - 제4항에 있어서, 하기 특징 중 적어도 하나를 갖는, 방법:
(i) CVP가 CFSP로부터 선택된 각각의 FSP의 적어도 4개의 아미노산을 포함함;
(ii) CVP의 일부인 모든 펩타이드의 누적 아미노산 길이 V가 적어도 280개 아미노산, 또는 적어도 6000개 아미노산이 되도록 Y가 선택됨;
(iii) Y가 적어도 35, 적어도 50, 적어도 100, 또는 적어도 200임; 및
(iv) CVP가, 서열 번호 1 내지 1087의 그룹으로부터 선택되거나 또는 서열 번호 1 내지 209의 그룹으로부터 선택되는 FSP 또는 mFSP를 포함함. - (i) 제4항에 따른 방법에서 결정된 아미노산 또는 핵산 서열 정보를 수득하는 단계; 및
(ii) 하나 이상의 폴리펩타이드 중의 CVP의 아미노산 서열 또는 이러한 서열을 지닌 핵산의 수집물을 합성하고 임의로 핵산의 수집물을 하나 이상의 발현 카세트 또는 발현 벡터의 수집물 내로 삽입시키는 단계를 포함하는, CVP 또는 CVP를 암호화하는 핵산의 수집물을 생산하는 방법. - 서열 번호 1 내지 209에 따른 209개의 프레임-쉬프트 펩타이드(FSP) 및 변형된 FSP(mFSP)를 포함하는, 암 백신 펩타이드 수집물(CVP).
- 제11항에 있어서, CVP가 서열 번호 1088 내지 1091(레이아웃 A), 서열 번호 1092 내지 1095(레이아웃 B), 서열 번호 1155 내지 1158(레이아웃 C) 또는 서열 번호 1159 내지 1162(레이아웃 D)에 따른 아미노산 서열을 가지는 4개의 폴리펩타이드로 이루어지거나 이를 포함하는 CVP.
- 제11항에 있어서, CVP의 하나 이상의 펩타이드가 CVP의 면역원성을 향상시키는 다음의 성분 중 하나 이상에 연결되거나, 또는 펩타이드 결합에 의해 연결되는, CVP: 불변 쇄 서열 또는 이의 단편; 조직형 플라스미노겐 활성인자; PEST 서열; 사이클린 파괴 박스; 유비퀴틴화 신호; 수모일화 신호(SUMOylation signal); 인터루킨, 인터루킨 2, 인터루킨 12, 또는 인터루킨 15; 체크포인트 단백질(checkpoint protein) 특이적인 리간드, 항-PD1 항체 또는 이의 PD1-결합 단편, 항-CTLA4 항체 또는 이의 항-CTLA4-결합 단편, 항-LAG3 항체 또는 항-LAG3-결합 단편, 항-TIM3 항체 또는 이의 항-TIM3-결합 단편.
- 제11항 내지 제13항 중 어느 한 항에 따른 CVP를 암호화하는 핵산의 수집물.
- 제14항의 핵산의 수집물의 모두 또는 부분을 각각 포함하는 하나 이상의 발현 벡터의 수집물로서, 여기서 발현 벡터의 수집물의 전체가 제14항의 핵산의 수집물 모두를 포함하는 수집물.
- 제15항에 있어서, 발현 벡터 중 적어도 하나가 발현 벡터의 면역원성을 향상시키는 하나 이상의 성분을 포함하는 발현 벡터의 수집물.
- 제15항에 있어서, 발현 벡터 중 적어도 하나가 CVP의 면역원성을 향상시키는 성분을 암호화하는 하나 이상의 핵산을 포함하는 발현 벡터의 수집물: 불변 쇄 서열 또는 이의 단편; 조직형 플라스미노겐 활성인자; PEST 서열; 사이클린 파괴 박스; 유비퀴틴화 신호; 수모일화 신호(SUMOylation signal); 인터루킨, 인터루킨 2, 인터루킨 12, 또는 인터루킨 15; 체크포인트 단백질 특이적인 리간드, 항-PD1 항체 또는 이의 PD1-결합 단편, 항-CTLA4 항체 또는 이의 항-CTLA4-결합 단편, 항-LAG3 항체 또는 항-LAG3-결합 단편, 항-TIM3 항체 또는 이의 항-TIM3-결합 단편.
- 제15항에 있어서, 각각의 발현 벡터가 플라스미드; 코스미드; RNA; 보조제(adjuvant)와 함께 제형화된 RNA; 리포좀 입자 중에 제형화된 RNA; 자가-증폭하는 RNA(SAM); 보조제와 함께 제형화된 SAM; 리포좀 입자 중에 제형화된 SAM; 바이러스 벡터; 알파바이러스 벡터, 베네주엘라 말 뇌염(VEE) 바이러스 벡터, 신드비스(SIN) 바이러스 벡터, 셈리키 포레스트 바이러스(semliki forest virus: SFV) 바이러스 벡터, 복제가능하거나 불가능한 아데노바이러스 벡터, 침팬지 또는 난쟁이 침팬지 또는 고릴라로부터 유래된 복제가능하거나 불가능한 아데노바이러스 벡터, 폭스바이러스 벡터, 박시니아 바이러스 벡터 또는 변형된 박시니아 안카라(modified vaccinia ankara: MVA) 벡터, 시미안 또는 사람 사이토메갈로바이러스(CMV) 벡터, 림프구 맥락수막염 바이러스(Lymphocyte choriomeningitis virus: LCMV) 벡터, 레트로바이러스 또는 렌티바이러스 벡터로 이루어진 그룹으로부터 선택되는 발현 벡터의 수집물.
- 제11항 내지 제13항 중 어느 한 항에 따른 CVP를 포함하거나, 상기 CVP를 암호화하는 핵산의 수집물을 포함하거나, 또는 상기 핵산의 수집물의 모두 또는 부분을 포함하는 발현 벡터의 수집물로서, 발현 벡터의 수집물의 전체가 상기 핵산의 수집물 모두를 포함하는 발현 벡터의 수집물을 포함하는,
MSI 표현형을 지닌 암 세포를 포함하는 암을 지니거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료에 사용하기 위한 약제학적 조성물. - 제19항에 있어서, 상기 예방이 미스매치 복구 시스템(MMR), 예를 들면, MLH-1, MSH-2, MSH-6, PMS2 및 TACSTD1/EPCAM에 관여하는 유전자에 배선 돌연변이(germline mutation)를 지닌 환자를 포함하는, 임상 가이드라인에 따른 MSI 암으로 진행될 위험이 있는 것으로 알려진 환자를 위한 것이며, 여기서 치료가 가장 최근의 임상 가이드라인에 따른 MSI 상태의 진단 후 임의의 조직 내에서 발생하는, 모든 단계(I 내지 IV)에서의 암을 지닌 환자를 위한 것이며 여기서 이러한 조성물의 용도는 자발적으로 또는 약리학적으로 유도될 수 있는 MSI 상태를 지닌 암의 치료를 위해 의도되고 여기서 암이 결장직장암, 위암, 자궁내막암, 소장암, 간담즙성 관 암, 간암, 신경내분비암, 자궁경부암, 난소암, 자궁육종, 뇌암 및 피부 암으로 이루어진 그룹으로부터 선택되는, 약제학적 조성물.
- (i) 제14항의 핵산의 수집물, (ii) 상기 핵산의 수집물의 모두 또는 부분을 포함하는 발현 벡터의 수집물로서, 발현 벡터의 수집물의 전체가 상기 핵산의 수집물 모두를 포함하는 발현 벡터의 수집물, 또는 (i) 및 (ii) 둘 모두를 포함하는, MSI 표현형을 지닌 암 세포를 포함하는 암을 지니거나 이러한 암으로 진행될 위험이 있는 환자의 예방 또는 치료에 사용하기 위한, 약제학적 조성물로서, 여기서 핵산의 수집물 또는 발현 벡터의 수집물이 이종 프라임-부스트 백신접종 계획(heterologous prime-boost vaccination scheme)으로 투여되는, 약제학적 조성물.
- 제21항에 있어서, 프라임은 아데노바이러스 벡터, 그리고 하나 이상의 부스트는 폭스바이러스 벡터 또는 MVA 벡터를 사용하는 것이며, 여기서 예방이 미스매치 복구 시스템(MMR), 예를 들면, MLH-1, MSH-2, MSH-6, PMS2 및 TACSTD1/EPCAM에 관여하는 유전자에 배선 돌연변이를 지닌 환자를 포함하는, 임상 가이드라인에 따른 MSI 암으로 진행될 위험이 있는 것으로 알려진 환자를 위한 것이며 여기서 치료가 가장 최근의 임상 가이드라인에 따른 MSI 상태의 진단 후 임의의 조직 내에서 발생하는, 모든 단계(I 내지 IV)에서의 암을 지닌 환자를 위한 것이며 여기서 이러한 조성물의 용도는 자발적으로 또는 약리학적으로 유도될 수 있는 MSI 상태를 지닌 암의 치료를 위해 의도되고 여기서 암이 결장직장암, 위암, 자궁내막암, 소장암, 간담즙성 관 암, 간암, 신경내분비암, 자궁경부암, 난소암, 자궁육종, 뇌암 및 피부 암으로 이루어진 그룹으로부터 선택되는, 약제학적 조성물.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17181026 | 2017-07-12 | ||
EP17181026.0 | 2017-07-12 | ||
PCT/EP2018/069032 WO2019012082A1 (en) | 2017-07-12 | 2018-07-12 | UNIVERSAL VACCINE BASED ON SHARED TUMOR NEO-ANTIGENS FOR THE PREVENTION AND TREATMENT OF MICRO-SATELLITE INSTABILITY CANCER (MSI) |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200029443A KR20200029443A (ko) | 2020-03-18 |
KR102709778B1 true KR102709778B1 (ko) | 2024-09-26 |
Family
ID=59366234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207000642A KR102709778B1 (ko) | 2017-07-12 | 2018-07-12 | 미세부수체 불안정성(msi) 암의 예방 및 치료를 위한 공유된 종양 신생항원을 기반으로 한 범용 백신 |
Country Status (19)
Country | Link |
---|---|
US (1) | US11578109B2 (ko) |
EP (1) | EP3652606B1 (ko) |
JP (1) | JP7274223B2 (ko) |
KR (1) | KR102709778B1 (ko) |
CN (1) | CN111328420B (ko) |
AU (1) | AU2018298849B2 (ko) |
BR (1) | BR112020000590A2 (ko) |
CA (1) | CA3069047A1 (ko) |
DK (1) | DK3652606T5 (ko) |
ES (1) | ES2940087T3 (ko) |
FI (1) | FI3652606T3 (ko) |
HU (1) | HUE061840T2 (ko) |
IL (1) | IL271966B1 (ko) |
MX (1) | MX2020000413A (ko) |
NZ (1) | NZ759940A (ko) |
PL (1) | PL3652606T3 (ko) |
PT (1) | PT3652606T (ko) |
SG (1) | SG11202000250PA (ko) |
WO (1) | WO2019012082A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3106564A1 (en) | 2018-07-26 | 2020-01-30 | Frame Pharmaceuticals B.V. | Cancer vaccines for breast cancer |
WO2020022902A1 (en) | 2018-07-26 | 2020-01-30 | Frame Pharmaceuticals B.V. | Cancer vaccines for colorectal cancer |
CA3106562A1 (en) | 2018-07-26 | 2020-01-30 | Frame Pharmaceuticals B.V. | Off-the-shelf cancer vaccines |
US20210252123A1 (en) | 2018-07-26 | 2021-08-19 | Frame Pharmaceuticals B.V. | ARID1A, CDKN2A, KMT2B, KMT2D, TP53 and PTEN VACCINES FOR CANCER |
WO2020022901A1 (en) | 2018-07-26 | 2020-01-30 | Frame Pharmaceuticals B.V. | Cancer vaccines for uterine cancer |
US20210213116A1 (en) | 2018-07-26 | 2021-07-15 | Frame Pharmaceuticals B.V. | Cancer vaccines for kidney cancer |
TWI852977B (zh) * | 2019-01-10 | 2024-08-21 | 美商健生生物科技公司 | 前列腺新抗原及其用途 |
IL293051A (en) | 2019-11-18 | 2022-07-01 | Janssen Biotech Inc | calr and jak2 mutant-based vaccines and their uses |
WO2021228999A1 (en) * | 2020-05-12 | 2021-11-18 | Institut Curie | Neoantigenic epitopes associated with sf3b1 mutations |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016187508A2 (en) | 2015-05-20 | 2016-11-24 | The Broad Institute Inc. | Shared neoantigens |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5922315A (en) | 1997-01-24 | 1999-07-13 | Genetic Therapy, Inc. | Adenoviruses having altered hexon proteins |
WO2003087162A2 (en) * | 2002-04-18 | 2003-10-23 | Mtm Laboratories Ag | Neopeptides and methods useful for detection and treatment of cancer |
WO2004092338A2 (en) * | 2003-04-11 | 2004-10-28 | Diadexus, Inc. | Compositions, splice variants and methods relating to cancer specific genes and proteins |
CN1824325A (zh) * | 2005-12-16 | 2006-08-30 | 武汉大学 | 人乳头病毒dna嵌合疫苗及制备方法和应用 |
JP5339292B2 (ja) * | 2006-10-17 | 2013-11-13 | オンコセラピー・サイエンス株式会社 | Mphosph1またはdepdc1ポリペプチドを発現する癌に対するペプチドワクチン |
TW201102081A (en) * | 2009-05-11 | 2011-01-16 | Oncotherapy Science Inc | TTK peptides and vaccines including the same |
RU2569187C2 (ru) | 2009-05-29 | 2015-11-20 | МорфоСис АГ | Коллекция и способы ее применения |
CA2795534A1 (en) * | 2010-04-09 | 2011-10-13 | Yusuke Nakamura | Cdca5 peptides and vaccines including the same |
US20140038900A1 (en) * | 2011-03-24 | 2014-02-06 | Institut National De La Sante Et De La Recherche Medicale (Inserm) | Dominant negative hsp110 mutant and its use in prognosing and treating cancers |
AU2012296090B2 (en) * | 2011-08-12 | 2015-05-14 | Oncotherapy Science, Inc. | MPHOSPH1 peptides and vaccines including the same |
JP5890769B2 (ja) * | 2012-12-13 | 2016-03-22 | ループレヒト−カルルス・ウニヴェルジテート・ハイデルベルクRuprecht−Karls−Universitaet Heidelberg | がんの予防及び治療のためのmsi特異的なフレームシフトペプチド(fsp) |
US9205140B2 (en) * | 2012-12-13 | 2015-12-08 | Ruprecht-Karls-Universität | MSI-specific frameshift peptides (FSP) for prevention and treatment of cancer |
BR112015013737B1 (pt) * | 2012-12-13 | 2021-07-27 | Ruprecht-Karls-Universitãt Heidelberg | Peptídeos com alteração do quadro de leitura msiespecífico (fsp) para a prevenção e tratamento do câncer |
WO2014099979A2 (en) * | 2012-12-17 | 2014-06-26 | Virginia Tech Intellectual Properties, Inc. | Methods and compositions for identifying global microsatellite instability and for characterizing informative microsatellite loci |
US11098367B2 (en) * | 2014-01-27 | 2021-08-24 | Yale University | Methods of identifying patients responsive to immunotherapeutic strategies |
CN106350578A (zh) * | 2015-07-13 | 2017-01-25 | 中国人民解放军第二军医大学 | Ny-eso-1在微卫星不稳定性肠癌的诊断和治疗中的应用 |
US20190008938A1 (en) | 2015-07-30 | 2019-01-10 | Modernatx, Inc. | Concatemeric peptide epitope rnas |
-
2018
- 2018-07-12 KR KR1020207000642A patent/KR102709778B1/ko active IP Right Grant
- 2018-07-12 FI FIEP18742985.7T patent/FI3652606T3/fi active
- 2018-07-12 AU AU2018298849A patent/AU2018298849B2/en active Active
- 2018-07-12 PL PL18742985.7T patent/PL3652606T3/pl unknown
- 2018-07-12 EP EP18742985.7A patent/EP3652606B1/en active Active
- 2018-07-12 HU HUE18742985A patent/HUE061840T2/hu unknown
- 2018-07-12 DK DK18742985.7T patent/DK3652606T5/da active
- 2018-07-12 MX MX2020000413A patent/MX2020000413A/es unknown
- 2018-07-12 SG SG11202000250PA patent/SG11202000250PA/en unknown
- 2018-07-12 IL IL271966A patent/IL271966B1/en unknown
- 2018-07-12 ES ES18742985T patent/ES2940087T3/es active Active
- 2018-07-12 US US16/626,458 patent/US11578109B2/en active Active
- 2018-07-12 WO PCT/EP2018/069032 patent/WO2019012082A1/en unknown
- 2018-07-12 NZ NZ759940A patent/NZ759940A/en unknown
- 2018-07-12 BR BR112020000590-8A patent/BR112020000590A2/pt unknown
- 2018-07-12 CA CA3069047A patent/CA3069047A1/en active Pending
- 2018-07-12 PT PT187429857T patent/PT3652606T/pt unknown
- 2018-07-12 JP JP2020501311A patent/JP7274223B2/ja active Active
- 2018-07-12 CN CN201880046801.8A patent/CN111328420B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016187508A2 (en) | 2015-05-20 | 2016-11-24 | The Broad Institute Inc. | Shared neoantigens |
Non-Patent Citations (3)
Title |
---|
S M Woerner 외, Systematic identification of genes with coding microsatellites mutated in DNA mismatch repair-deficient cancer cells, Inter J Cancer, 2001.07.01., Vol.93, No.1. |
Shen Luhui 외, Abstract 469: Progress towards developing a universal, prophylactic cancer vaccine, Cancer Res, 2013.04.15., Vol.73. |
Yvette Schwitalle 외, Immunogenic peptides generated by frameshift mutations in DNA mismatch repair-deficient cancer cells, Cacner Immun., 2004.11.25., Vol.4. |
Also Published As
Publication number | Publication date |
---|---|
PL3652606T3 (pl) | 2023-04-24 |
CA3069047A1 (en) | 2019-01-17 |
ES2940087T3 (es) | 2023-05-03 |
US20200222519A1 (en) | 2020-07-16 |
DK3652606T5 (da) | 2024-08-26 |
HUE061840T2 (hu) | 2023-08-28 |
NZ759940A (en) | 2023-07-28 |
CN111328420A (zh) | 2020-06-23 |
JP2020532288A (ja) | 2020-11-12 |
RU2019144505A3 (ko) | 2021-08-12 |
AU2018298849B2 (en) | 2022-07-14 |
BR112020000590A2 (pt) | 2020-07-14 |
SG11202000250PA (en) | 2020-02-27 |
JP7274223B2 (ja) | 2023-05-16 |
IL271966B1 (en) | 2024-09-01 |
EP3652606B1 (en) | 2023-01-11 |
CN111328420B (zh) | 2023-07-25 |
PT3652606T (pt) | 2023-03-16 |
IL271966A (en) | 2020-02-27 |
EP3652606A1 (en) | 2020-05-20 |
MX2020000413A (es) | 2020-09-28 |
US11578109B2 (en) | 2023-02-14 |
WO2019012082A1 (en) | 2019-01-17 |
DK3652606T3 (da) | 2023-03-13 |
RU2019144505A (ru) | 2021-08-12 |
FI3652606T3 (fi) | 2023-03-16 |
AU2018298849A1 (en) | 2020-01-02 |
WO2019012082A9 (en) | 2019-05-02 |
KR20200029443A (ko) | 2020-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102709778B1 (ko) | 미세부수체 불안정성(msi) 암의 예방 및 치료를 위한 공유된 종양 신생항원을 기반으로 한 범용 백신 | |
AU2020203837B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2023251441A1 (en) | RNA containing composition for treatment of tumor diseases | |
AU2020204520B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2020202369B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2019253901B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency of plants | |
AU2023214237A1 (en) | Modified polynucleotides for the production of biologics and proteins associated with human disease | |
KR102719587B1 (ko) | 아데노-관련 바이러스 생산을 위한 포유동물 세포 | |
KR102630357B1 (ko) | 단백질 발현이 어려운 다중-부위 ssi 세포 | |
AU2020227049A1 (en) | Fast diagnosis and personalized treatments for acne | |
JP2003088388A (ja) | 新規な全長cDNA | |
KR20150129847A (ko) | 융합 단백질 및 이들의 방법 | |
JP2003135075A (ja) | 新規な全長cDNA | |
WO2000058473A2 (en) | Nucleic acids including open reading frames encoding polypeptides; 'orfx' | |
AU2017289886A1 (en) | Engineered parasites for delivering protein to the central nervous system (CNS) | |
TW202321448A (zh) | 利用重組環狀rna改善蛋白質轉譯的組合物及方法 | |
KR20220054401A (ko) | 감염의 숙주 rna 바이오마커의 신속한 조기-검출 및 인간의 covid-19 코로나바이러스 감염의 조기 식별을 위한 시스템, 방법 및 조성물 | |
JP2003304888A (ja) | 化合物の毒性予測のための方法 | |
AU2016295122A1 (en) | Genetic testing for predicting resistance of pseudomonas species against antimicrobial agents | |
AU2017336160A1 (en) | Screening methods using olfactory receptors and novel compounds identified using the same | |
KR101978399B1 (ko) | 자궁내막증에 대한 진단 마커로서의 돌연변이 유전자 및 이의 용도 | |
JP2003235573A (ja) | 糖尿病性腎症マーカーおよびその利用 | |
KR20110069283A (ko) | Thermococcus sp. NA1 으로부터의 유용한 유전자들 | |
RU2792843C2 (ru) | Универсальная вакцина на основе общих опухолевых неоантигенов для предупреждения и лечения форм рака с микросателлитной нестабильностью (msi) | |
JP2002017375A (ja) | 全長cDNA合成用プライマー、およびその用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |